ChatGPT与中国专制统治
中国劳工论坛的原文链接:https://chinaworker.info/zh-hans/2023/03/19/34429/
中国劳工论坛的telegram链接:https://t.me/chinaworkerISA
中国劳工论坛的Twitter链接:https://twitter.com/OctRevolution17
如果有兴趣订阅《社会主义者》杂志,可发电邮至:chinaworker.isa@gmail.com
中国的AI技术到底是先进还是落后?
李甬/大胡 中国劳工论坛
自去年11月底,美国公司OpenAI的人工智能实验室发布了全新的聊天机器人模型ChatGPT后,凭籍其自然得近乎完美的语言能力(尤其是英语)、对话的内容的逻辑性、理论能力、讯息检索、综合、以及文本生成能力迅速成为网络关注的焦点。
自从ChatGPT上线后,国内信息科技公司及研究机构急忙跟进。据彭博社报道,中国已有数个“微信版ChatGPT”公众号、小程序,将ChatGPT接入自己的应用程式。2月20日复旦大学自然语言实验室就推出了一款聊天机器人 MOSS,但在一天内就崩溃下线。3月16日,百度也发布了聊天AI“文心一言”。但根据公众反映,“文心一言”跟ChatGPT的差距非常巨大,虽然可以进行一些逻辑推算的对话,但没有回答追问的能力。对其他语言的理解(特别是英语)更是非常不足,即使对于中文也偶然出现理解错误,口答风马牛不相及的情况。百度没有信心对文心一言进行现场演示,而是选择了播放预先录制的视频。百度首席执行官李彦宏主持的一小时演讲却变成了一场公关灾难,在接下来的几个小时内,百度的股票在香港下跌了10%。
这显示了中国资本家和中共政权即使在过去多年,豪掷千金投资人工智能科技,特别是在人脸识别,讯息自动过滤等能直接应用于政权对人民监控的领域上更是得到重点资助。特别是在现时冷战的格局下,科技、芯片、AI都成为了中美角力的主要战场之一,中共自然不甘落后。
但在整体讯息技术和人工智能领域而然,与世界先进水平仍存在非常大的鸿沟。根据清华大学科技情报大数据挖掘与服务系统平台AMiner《2022年人工智能最具影响力的学者》名单中,21个人工智能领域的首10位学者,中国只占约11%,其余绝大部分出自美国。美国在AI领域的基础性技术更先进,如神经网络和深度学习,得益于这些基础美国才能构建起大型AI语言工程。而中国政府的研究则集中在应用技术上,这使得中国讯息技术只能对别人的创新进行应用性跟进,但严重缺乏创新能力。就像在国内被广泛流传和认同的一句说话所说:中国的技术发展能很快的从1走到100,但就是从来没有从0走到1。
而两个新兴的冷战阵营之间研究方向的差异更是决定了中国“无法从0走到1”。相对而言,欧美世界的科研团队对于研究方向有着更高的自由度。而在中国,各个研究团队往往都必须要依照国家政策所主导的方向,而这些政策肯定不会指向一个可行性、应用性和收益回报完全未知的创新方向,而只会指向已有一定研究成果和基础,以及应用性高度明确领域。而中国的学术人员和团队如果不跟从这些方向,就无法获得足够的资金和技术支持。这是有限的“资产阶级民主”和中共的“资产阶级专制”间差异所造成的必然结果。因此中共的政策方向往往是滞后性的。
以ChatGPT技术为例,当中一个关键点是,它是在开放源码的模式下开发的,在这种模式下,科技创新被自由分享,不受资本主义知识产权制度的保护,以更多合作的方式去发展。这种方法在资本主义下无法得到充分的利用,因为它最终挑战了大型垄断企业的利润。这一点从微软与OpenAI(制造ChatGPT的公司)签订的独家财务协议中体现了出来,这份协议使得微软可以控制其未来的使用。在ChatGPT发布之前,没有人能想到它能带来如此变革性的效果和应用需求,因此中共自然不能把这作为一个研究方向。只能直到ChatGPT发布上线,才急忙跟进这个课题。因此从科研制度上就注定了中共自上而下的模式在科技角力的战场上处于下风。
此外,中国的言论监控和审查自然也对科研,尤其是对话AI的发展造成了极大的限制。在ChatGPT上线后不久,就有大量中国民众翻墙使用,并提出各种被中共视为禁忌的政治性问题,或单纯是想方设法的嘲讽羞辱习近平。中共对内可以通过杀鸡儆猴威吓中国民众,令他们自我审查,知道哪些是禁忌话题不敢讨论从而钳制言论自由。实在不行还可以把所有相关话题从网络上全面清洗了事。这语言AI却“不吃这一套”,要让AI进行自然而合乎逻辑且有意义的语言交流,与让它要自我审查同时只能给出有利于政权的对话内容,两者本身就是一个互相矛盾的指标。对科研人员而言这也是一个吃力不讨好的任务,产品稍有失言就会引火烧身。
在政治因素以外,中文讯息的有限本身也是中国开发聊天AI一大瓶颈。现时所有的聊天AI都非常依赖对网络公开讯息的抓取、自我学习和训练。而根据Internet World Stats的报告,截至2020年3月,全球互联网内容中英语内容所占的比例高达59.3%,而汉语内容则只占1.3%,排名第10。尽管就用户数量而言,汉语使用者占19.4%,仅次于英语。但由于“网络长城”的存在,他们与世界互联网的接入度不高,这也限制了有意义的汉语讯息的产生。
因此,尽管中国政府已经在科技领域花费了数千亿人民币,而且看上去还将继续挥金如土,但在先天和后天方面都存在巨大的缺陷。而这些缺陷涉及中共政权和中国资本主义的专制性质。不仅是中国,美国的资本主义体系也存在着深刻的危机,但中国资本主义的官僚主义和专制主义枷锁意味着中共政权即使一直全力追赶,也只不过是为了不被美国抛离。在全球范围内,无论是所谓的自由市场资本主义还是专制国家资本主义,目前的经济体系都是对技术创新潜力的巨大束缚。这是一个政治问题。只有通过国际社会主义革命,扫除资本主义和令人窒息的国家镇压,人类的全部创造潜力才能得以释放。