中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字
人阅读 2023-07-26 10:56:05
【中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字】lot物联网小编为你整理了的相关内容,希望能为你解答。
中文语言文字污染是让人工智能ai变成垃圾,而且情况继续永久不可逆的恶化。
先说ai本质,计算机没有智能,不懂语言、逻辑,计算机只能计算,与预设值(阈值)比较。
举个简单梨子,要推理销售额y与销量x关系,只需要计算两组数据的aX bY c=0的系数,计算方差,协方差判断是否线性关系,不行再取log,指数等。
文字也是数值,每个字有编码,正常语句能计算出一个值。
但目前的中文网络内容已经被污染荼毒,都不是正常的表达方式,非正常就算了,但是每个平台,每个人都用不同的词法。
梳理一下,我碰到的有
1,同音替换,民~闵……
2,相似替换,日~曰……
3,加部首,主~宔
4,剪部首,并夕夕
5,拆字,月半……
6,合字,壕……
7,出口转内销,皮坡……
8,不知所谓,钱~米……
……
在英文世界,最麻烦的是转义字符,转义和本字会搞死人,但毕竟是定数的,可以穷举的。但中文这些既不可数,也无终结。
好好打字不好么,挺好,打得出,发不出。更好的是,有一群职业盲流等着讹你。
以上内容为【中文语言文字污染是让AI变成垃圾,而且情况继续不可逆的恶化 | ai拆字】的相关内容,更多相关内容关注lot物联网。