在人工智能时代,中文和英文,谁能成为母语?

2020-09-15 17:30   来源: 互联网

人工智能是目前最流行的技术,各国都在投入资金和人力进行研究,错过人工智能的人就失去了未来。


语言在人工智能中起着非常重要的作用,它是人类与人工智能相互作用的工具,只有准确地理解语言,才能做出准确的反应,表现出很高的智商。今天,我想谈谈中文和英语是否是优秀的人工智能语言,以及未来的前景。


I. 语音识别


虽然我不想承认,但英语语音识别确实比中文更准确和高效。


英语由 26 个字母组成,逻辑结构简单,发音以字母为基础,语音符号与语音符号的区别比较明显,只要不是很快,人工智能就能很容易准确地识别每个字母,再加上较少的同音词,所以英语语音识别的效率要比汉语好得多。


汉语发音要复杂得多。汉语拼音有 23 个辅音,6 个元音,18 个多元音,16 个整体识别音节。整个方案中有 63 个发音元素。此外,汉语有四个声调,加上多种方言,如果发音不正确,就会对人工智能识别产生很大影响。


人工智能进行汉语识别时,首先需要进行语音识别,然后根据单词进行汉字判断,识别效率低于英语,识别错误率也高于英语。


语音识别,英语胜利


二。字符识别


在汉字识别方面,我们最终可以扬起眉毛和呼气,汉字识别的效率和准确性要优于英语。


汉语中有几个特点可以提高人工智能识别的效率:


1. 汉字信息密度高,信息量大,中文文章总比英文短,加起来,中文信息密度比英语高 37.5%。


2. 汉字作为一个单位,可以灵活排列,可以垂直和垂直排列,而英语是一个线性文本,只能是水平、垂直、交错排列的识别效率都会直线下降!


3. 汉字的独立表意能力强。例如,"他去吃早餐",你可以读一个单词来理解另一个单词的意思。和英语 "Hewenttotove 早餐",即使你看到 "有" 这个词,你仍然不知道它意味着什么。只有当你到了 "早餐" 的时候,你才知道已经在吃了,我们去了,整个句子都去吃了。英语表达更多地依赖于 "短语",甚至整个句子。如果你不读完整句话,你通常不知道这句话的意思。这使得人工智能识别变得困难,因为人工智能跳转识别能力很差。


汉字识别,中国胜利


三。同音词


人工智能在汉语中发展的最大障碍是同音现象!例如,他的姓张、张、张?如果是英语口语,也可以加上张弓,或者设立一个早期章节。很难准确地计算出汉语中有多少同音词和同音词。同音词也是英语使用者攻击汉语表达的最大借口。


虽然英语中有同音词,如正确的更正、书写、见面、肉、洞、全、梨、梨、双花、面粉等,但英语同音词的数量比汉语同音词少得多。英语通过增加单词来减少同音词的现象。


人工智能现在不能准确地处理复音词,错误是不可避免的。为了人工智能的准确性,人类只能通过语言改革来消除复音词吗?这个项目太大了,人类很难适应这么大的改革!


同音词,英语赢


四。多义词


多义在每一种成熟的语言中都是不可避免的。世界上有这么多东西,情感是复杂的。如果每个词只表达一个准确的意思,那么数百万个单词就无法关闭。无论在汉语还是英语中,一个词不仅能表达一个意思,通常还有很多意义,有时差别很大!


例如,"关闭" 的意思是很多:关闭,关闭


目前,人工智能通过语境识别词义的能力仍然相对较弱,在多义词方面,常常会出错,这也是人工智能发展的难点。


多义词,汉语和英语是一样的。


V. 整段识别


让人工智能翻译一个短句,一个句子,其实意义不大,实用价值不高,只有整段文字识别,才有实用价值。让我们来看看人工智能对中英文的识别能力吧!


原文如下:


"Things that trend in these two countries are insanely different. For example: knowledge-basedcontent is extremely popular in China, and less so in the U.S. Also, this was wild to me: thosecreators that did the most dance videos in China are users born in the 60s (!!), whereas in theUS, it seems that it's mostly teenagers who are creating the dances," she wrote.


这两个国家的趋势非常不同,"她写道," 例如,知识内容在中国非常流行,但在美国则略差一些。" 而且,这对我来说太疯狂了:中国最受欢迎的舞蹈视频是后 60 代(!)。在美国,年轻人似乎最喜欢制作舞蹈录影带。


Ai 将原文译成中文如下:


这两个国家的趋势是非常不同的。例如,基于知识的内容在中国非常流行,但在美国却很少。此外,这对我来说很疯狂:中国最大的舞蹈视频制作人是她 20 世纪 60 年代出生的用户,而在美国,大多数年轻人似乎都在写舞蹈。她写道。


这是一种严重的扭曲:" 在中国制作最多舞蹈视频的创作者是她的用户,她出生于 20 世纪 60 年代(!)。


这句话的英文原文是:"thosecreatorsthatdidthemostdancevideosinChinaareusersborninthe60s". 这是一个英文长句,词序比较复杂,还混有杂乱的介词,造成人工智能大脑紊乱,无法准确识别!


这一英语识别错误非常典型,暴露出英语语法和语序过于复杂的弊端。如果要翻译更复杂的英语长句,人工智能将无能为力!这也是每个语音字符的弱点!

Ai 将原文译成英文如下:


";Thetrendsinthesetwocountriesarequitedifferent.Forexample,智力竞赛 -- 在中国,但在美国。还有,thisiscrazytome:China‘sfavoritedancevideoisborninthe60s(!),ButintheUnitedStates,itseemsthatyoungpeopleliketoshootdancevideosthemost,"展示"。


中文翻译是非常准确的,原文和原文在表意意义上没有什么差别,这完全恢复了原文的意思!可以看出,在对整段和整篇文章的认识上,汉语比英语更有优势!


汉语由汉字组成,长句少,语法简单,语序简单,句子结构比线性英语简单得多,这更有利于人工智能识别。


人工智能的未来是谁?


在人工智能领域,英语比口语好,汉语比书面语好,每个人都有自己的长处,谁能成为人工智能的母语还为时尚早。然而,在更复杂的内容表达上,人工智能对汉语的认识领先于英语,因此我对中文的未来更加乐观。


责任编辑:萤莹香草钟
分享到:
0
【慎重声明】凡本站未注明来源为"联播新闻网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!

未经许可任何人不得复制和镜像,如有发现追究法律责任 粤ICP备2020138440号