首页 > 技术 > AI/人工智能

中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字

人阅读 2023-07-26 10:56:05

【中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字】lot物联网小编为你整理了的相关内容,希望能为你解答。

中文语言文字污染是让人工智能ai变成垃圾,而且情况继续永久不可逆的恶化。

先说ai本质,计算机没有智能,不懂语言、逻辑,计算机只能计算,与预设值(阈值)比较。

举个简单梨子,要推理销售额y与销量x关系,只需要计算两组数据的aX bY c=0的系数,计算方差,协方差判断是否线性关系,不行再取log,指数等。

文字也是数值,每个字有编码,正常语句能计算出一个值。

但目前的中文网络内容已经被污染荼毒,都不是正常的表达方式,非正常就算了,但是每个平台,每个人都用不同的词法。

梳理一下,我碰到的有

1,同音替换,民~闵……

2,相似替换,日~曰……

3,加部首,主~宔

4,剪部首,并夕夕

5,拆字,月半……

6,合字,壕……

7,出口转内销,皮坡……

8,不知所谓,钱~米……

……

在英文世界,最麻烦的是转义字符,转义和本字会搞死人,但毕竟是定数的,可以穷举的。但中文这些既不可数,也无终结。

好好打字不好么,挺好,打得出,发不出。更好的是,有一群职业盲流等着讹你。

以上内容为【中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字】的相关内容,更多相关内容关注lot物联网。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com