联系电话:020-28187900

不断发展中的自然语言处理技术,会在未来消灭“笔”和“键盘”吗?

发表时间:2014-07-21 阅读: 6065

目前,Siri 和 Google Now 的语音识别技术虽然还不完善,但在未来却很可能威胁到文字的地位。我们手写或者打字,在当下已经成为了无比繁重的劳动,不断的输入各种文字信息,在网页上搜索各种关键词,让我们的手腕发酸,手指发颤。

在 iOS 操作系统上运行的数字设备,现在已经可以识别语音信息,未来还会出现“无人驾驶汽车”,语音激活的房门,灯光和电梯,很明显未来是一个“说”的时代,而非“写”的时代。在“我们如何与周遭环境进行互动?”这个课题之下,所隐藏的技术就是自然语言处理。这项技术能够让计算机识别我们的话语,并且还能辨认出我们的用语习惯。除了 Siri 和 Google Now 之外,你也许还在 Xbox One 和 Samsung UE65HU8500 (一款高清电视) 上面体验过这项技术。

自然语言处理技术的瓶颈是什么?

但是至今,语音识别技术只是针对少部分的短语和词汇进行识别。如果对象是我们平日里的对话,这项技术还远没有胜任辨识的工作。在 Rovi 的全球战略部门担任董事的查理斯·多斯(Charles Dawes)表示:“现在的技术还是依靠结构化的菜单系统,在这个系统中,有指定的语音来替代常规情况下人们愿意输入的字词。这样才能方便系统识别。但是这样一来,并不能满足人们的根本性需要。人们不得不在面对一款机器时,思考如何跟它对话,这样一来,说出来的话就是僵硬的,而不是自然而然的了。”

一旦涉及到语音识别,其关键就是对内容的解读,并且要对一般性的短语和词汇进行纵深性的解读。举个例子,一个电视观众说道:“本城市在今晚的比赛是几点的?”那么语音识别技术就必须能够结合说出这句话的情境是怎样的,即这位电视观众是想看足球。是否识别出来,取决于对用户长期以来搜索信息的偏好,使用数码设备的种种习惯,甚至了解他们是支持诺维奇城足球俱乐部,还是支持曼城足球俱乐部?同时,这项技术还得去适应突发性的转变。如果还是那名观众,突然又说道“今晚有什么好看的恐怖片?”的时候,系统必须能够跳出刚才涉及足球的语境。

制造语音转换文本软件的公司 Nuance Communications 的英国,中东区域销售经理乔森·怀特莫(Jonathan Whitmore)表示:“人际交流中最自然的方式就是对话。这给了人与各种数码设备(从手机到电视)之间互动的可能。声音对于每个人来说,都是独一无二的,这也能成为确定个人身份的安全方式。还有,对着手机说话,当然比打字要轻松许多。”但是,开发一个具有自然语言处理技术的网站和 app ,要求它们必须是反应灵敏,有求必应的,这就是非常复杂困难的一件事。怀特莫对此说道:“这牵扯语义学,语言学。对话内容,人群搜索信息方式,以及不同数据之间关系构建等诸多难题。”

自然语言处理技术所应用的领域是什么?

在电视上所应用的自然语言识别系统,至今依赖于其内置的话筒。但是大多数人现在已转向 app 应用了。多斯先生相信,智能手机和平板电脑的广泛普及,让用户有机会在他们的“第二块屏幕”上,搜索电视节目,和获得推荐的电视节目。除此之外,我们能看到还有很多地方都应用着自然语言处理技术。Barclays Wealth 用它来辨认账户所有人,airline JetBlue 正在使用智能语音广告技术,并且 Ford 正在为司机们开发自然语言识别技术,使得他们能够控制车内的电子设备,比如手机,音响,温度调节器,导航以及交通状况播报。

一个由声音主宰的未来也许在远方等着我们,但是就目前而言,我们还在埋头忙乱的敲打键盘。Nuance 公司目前就希望利用它的 Dragon 数字听写软件,桌面语言识别软件改变这一现状。比如超赞的 Dragon Dictation 4 以及免费的 Dragon Recordr App。后者这款产品现在能让前者转录声音,这对于移动工作者来说,无疑是个福利。

自然语言处理技术能够消灭犯罪吗?

看起来是很有可能的。由多名美国语言学家参与创建的 Fonetic 公司,就是通过分析一段对话,辨识出来是否存在虚假交易金融欺诈等恶性事件。Fonetic 已经花了 5 年时间,创建了涉及 79 种语言的金融业专业词汇组。Fonetic US 的 CEO 西蒙·理查德兹(Simon Richards) 表示:“金融欺诈很有可能是金融编程上做手脚,也有可能是诸如内幕交易的市场性行为。这些都是非常难以侦查出来的违法犯罪行为。而现在这项技术能在人工智能的架构下,将零散的一段语言,比如平日里的一通电话,进行分析。更关键是将谈话内容归纳到某个类别之下。软件能够辨别什么是符合情理的,什么是比较奇怪的。这样就能有效的遏制和侦查出来金融领域的违法犯罪行为。”

在未来,是不是一切都要使用自然语言处理技术?

短期来看不太可能。自然语言处理技术现在已经用在 Siri 和 Google Now 上,同时也会应用在微软的 Cortana 上,但它同时还是一个非常前沿的技术。智能手机的开发还不是围绕它来进行。语音涉及了一系列人工智能方面的技术应用,来去了解人们说话的动机,和当时的语境。这是非常具有挑战的环节。但如果一旦突破瓶颈,真正具有完善的自然语言处理技术的智能手机和平板电脑,将催生出一代人,他们将再也受不了家里面那些“蠢笨”的电子科技产品了。

参考资料:TechRadar


相关新闻 【更多】

唯众网络