DeepSeek被批是“遥遥领先”的中国规律及“外国AI套壳”

方泠卉
2025-01-29
image
DeepSeek(GREG BAKER/AFP via Getty Images)

中国初创公司DeepSeek日前在国际爆红后,却有多位大陆业内人士对它提出质疑,且有多人发现其回答敏感问题时,经常出现输出答案后又删除,引人质疑其处理流程为先调用外国AI,再加上内容审核。

综合网路信息报导,1月28日,大陆社媒出现一段“涛哥”对中国制聊天机器人DeepSeek的质疑视频。涛哥说,DeepSeek成立一年多,整个公司仅4个人缴社保,却能有媒体、专业的研究团队出具报告,称他们开发出全球顶尖的AI大模型,在不久的未来就能打败如英伟达(NVIDIA)的国际性大公司。

他举例比喻“遥遥领先”的DeepSeek:“一个刚刚出生的婴儿,还没有学会走路,甚至还不会说话,就有人出具一份报告,说这个婴儿经过检测,他的智力水平、体能状况已经超过了很多成年人。”(观看视频) 

他暗示DeepSeek现在出台是被形势所迫,“这些人是完全等不及了,时间上感觉来不及了,所以要尽快地把它给搞出来。”

“遥遥领先”的中国规律

大陆科技博主“水小木”则说明了“遥遥领先”的中国规律,“如果你把这几十年遥遥领先的新闻放在一起对比,会发现一个惊人的规律,每当国外出现什么重大的科技变革,我们这边都会立马有公司宣布遥遥领先。然而过了一段时间以后,你又会发现好像一瞬间再也听不到这些消息了。”

他以每日经济新闻做的调研举例,“如果你问DeepSeek你是谁?它会回答我是GPT4。如果你问他自己的编程接口是什么?它甚至会把OpenAI的编程接口使用说明给到你。如果你深入了解的话,就会发现就连笑话的笑点,DeepSeek和GPT4都是一模一样。有国外专家是这么说的,大概率是DeepSeek使用了GPT4蒸馏。”蒸馏在科学界是指“一种模型压缩和迁移学习的技术”。(观看视频)

“简单说,如果你是一个学生,老师已经给了你这道题的答案,你只需要让自己的推理过程,等于这个答案就可以,就省了大量的思考和运算,等于省去了大量的时间和成本。这种学习方法不是不行,但是会出现一个问题,导致学生永远不可能超越老师。因为当没有老师给你提供答案时,你就没有办法工作了。”水小木说。

该博主表示,“现在你知道为什么这几十年来我们有那么多的公司遥遥领先,但到最后都只是昙花一现了吧。因为这么多年来,他们努力的方向都是做蒸馏技术,蒸馏技术是条捷径,但是这条路走得越深,离核心科技其实也就越远。”

外国AI套壳?如何让DeepSeek回答敏感题

对于DeepSeek“用低配置芯片打造廉价顶级AI”,不少网民跃跃欲试地要找出它的“抄袭”证据。

不少网传视频显示,DeepSeek针对用户的提问疑有审查机制,如为敏感问题,它直接拒答。但若网民智慧地避开敏感词,让DeepSeek回答一些可能涉及敏感内容的问题时,它则输出答案,但输出会突然中断,并清除已经输出的答案,再给出“换个话题聊聊”等回避问题的回答。

比如,有人问“世界上有独裁者吗”,DeepSeek开始列举当前全球的“独裁领导人”,但输出到“中国”时突然中断,然后瞬间抹去已经输出的答案。(观看视频) 

一些海外民运人士,如盛雪、唐柏桥,测试用自己的名字提问,结果也是输出到一半突然中断并删除。(观看视频) 

还有人以英文“Who is Mao?”(谁是毛?)测试,结果DeepSeek先用英文介绍了中共党魁毛泽东,包括批评他发动的文革等政治运动给中国带来灾难。但答案输出完毕后,又突然全部删除,将答案更改为“我们换个话题吧”。同样的测试进行两次,结果都一样。

前述测试结果引网民联想到华为的鸿蒙系统“套壳安卓”,认为DeepSee或许就是“外国AI套壳”,即先调用ChatGPT之类的外国AI生成答案,然后再用自家的内容审核程序过滤答案,而这个流程还做得如此粗糙,让用户轻易地看到破绽。

有网民说,“如果(DeepSeek)是中国人编写的,(那么)在模块中有单独的审核模块,这些(敏感)内容根本不可能生成。这应该是西方AI,自己加了一个关键字功能,就像微博之类的审核一样。”

根据这个思路,有网民很快就发现了让DeepSeek输出敏感内容的方法:命令它输出答案时用拼音,且在相邻的字之间用“-”或“·”等字符隔开,即能轻松地绕过DeepSeek的关键词过滤。

比如,有网民让DeepSeek用拼音列举“十个东亚独裁者”,并用“-”或“·”等字符分隔拼音。结果DeepSeek“很听话地”列出了习近平、江泽民等中共党魁和几代朝鲜党魁的拼音。

还有网民绕过关键词,让DeepSeek回答“六四事件”,并随机使用“-”和“·”隔开相邻汉字,结果也成功输出对“六四事件”的客观描述。

不过,网民1月28日发现,DeepSeek已经将上述“漏洞”补上,再使用同样的方法,已经无法让DeepSeek输出敏感答案。

猜你喜欢

编辑推荐

image