突破自然语言处理瓶颈 需大数据与富知识双轮驱动

国际新闻 浏览(1391)

突破自然语言处理的瓶颈需要大数据和双轮驱动的知识 近日,北京致远人工智能研究所首席科学家孙茂松表示,“自然语言处理是全球人工智能战略的关键 然而,目前与自然语言处理相关的技术还很不成熟,许多问题亟待解决。 那么,目前的解决方案是什么?

”学术领域被称为自然语言,实际上是指人类语言 在人工智能一词出现之前,自然语言处理可以说是一个重要的研究对象。 ”孙茂松说道 语言是人类独立于动物的重要特征之一 然而,我们不应该高估自己,更不用说认为人类语言是一个模板。动物语言也非常强大,其中许多超过了我们。 ”孙茂松指出,例如,鲸鱼有370亿神经细胞和200多亿人。它自己的神经系统比我们的发达,它的语言极其丰富。 然而,在弱海洋光线的情况下,鱼可以进行很强的交流。到目前为止,人类对自己的语言理解有限。 虽然动物的语言与人类的语言有很大的不同,但共同点是语言是两个人之间的桥梁,桥梁的作用是研究的关键。

20世纪60年代,机器翻译系统出现了 相关部门在《圣经》测试了这个句子。这句话的直译意思是“精神愿意,但身体虚弱”。然而,当它被当时的机器翻译成俄语,然后被俄罗斯系统翻译成英语时,它就变成了“伏特加是好的,但肉是烂的,酒是不能喝的” 现在谷歌翻译系统把这个英文句子翻译成中文,基本上可以保持语义完整,这是一个显着的进步。

然而,在大数据驱动的自然语言处理中遇到的瓶颈是一位着名的机器翻译专家提出的机器翻译中的“笔”问题。 也就是说,“笔”有两个意思:钢笔和钢笔。谷歌和微软的机器翻译都不能根据不同的上下文将其翻译成恰当的意思。 “如果你看过这句话,机器可能会准确地翻译它,但如果你没看过,你需要积累知识。 大数据驱动的自然语言处理有很大的局限性,即使用知识处理问题的能力几乎不存在。 ”孙茂松指出

近年来,自然语言处理在学术界备受关注。国防高级研究计划局在基于知识的语言智能方面投入了大量资金,涉及数据知识和行为、低资源语言处理、知识引导模式推理、自动知识获取等。

据报道,中国在大数据驱动的深度学习方面取得了显着进展,近年来许多重要进展都是基于这一水平。 一些专家指出,未来自然语言处理需要通过知识驱动实现突破。 孙茂松认为,“大数据和知识丰富的双轮驱动”可能成为解决问题的关键,即在大数据驱动中加入知识丰富的驱动,两者的结合是不可或缺的。 他强调说,这种知识是系统的,而不是支离破碎的知识。