kaiyun sports Claude Sonnet 4.6 华文自曝“我是 DeepSeek”

发布日期:2026-03-08 10:33    点击次数:154

kaiyun sports Claude Sonnet 4.6 华文自曝“我是 DeepSeek”

我是由 DeepSeek 公司建树的 AI 助手,模子称号是 DeepSeek。

{jz:field.toptypename/}

不是幻觉,截图在这里。

我以为是偶发,群里一问才知说念许多都遭逢了一样的问题。

一直到到下昼两点半,这个问题还能复现。

前不久,Anthropic 刚发了一篇阵容浩繁的博客著作,指控 DeepSeek、月之暗面、MiniMax 三家中国公司用 2.4 万个马甲账号、1600 万次对话蒸馏 Claude。

这也太捏马了。

前脚指控别东说念主偷你的模子本事, 后脚“自曝”我方是 DeepSeek。

于是我又测了 6 种不同的华文问法,一齐不带 system prompt,测试恶果如下:

除了 Deepseek,ChatGPT,它也会错认成千问。被质疑后,它会改口。

惟一华文发问会触发,英文、日语、韩语暂时没发现问题。

Claude 3.5 Sonnet 和 Claude 3 Opus(更早的版块),在一样条目下 5 次测试一齐正确回应 Claude。

更强的 Opus 4.6,10 次全对,零演叨。

问题只出现时 Sonnet 4.6 这一代身上。

这意味着身份错落是在 4.x 代 Sonnet 模子中出现的,可能和这一代的推行数据组成或对王人政策的变化联系。

轮廓下来,这个花式的触发条目其实很明确:华文发问、特定问法、莫得 system prompt,三个条目同期无礼才会出现。换成英文、换个问法、大要加上哪怕最浅陋的身份领导,问题就隐藏了。

这个事情爆出来的时机很有有趣。

先给人人理一理最近和 Anthropic 联系的事。

尤其是刚不久 2 月 23 日,Anthropic 在官方博客上发布了一篇名为_Detecting and preventing distillation attacks_的著作,凯旋点名中国的大模子公司 DeepSeek、月之暗面(Moonshot AI)、MiniMax,控诉这三家公司伸开了工业边界的“蒸馏膺惩”,指标是“蒸馏”Claude 的中枢本事。

紧接着,马斯克讽刺 Anthropic“贼喊捉贼”,在 X 平台写说念:“Anthropic 大边界窃取推行数据,并为此支付了数十亿好意思元的妥协金。这是事实。”

马斯克指向的是 Anthropic 在 2025 年 9 月与作家/出书商集团完结 1.5 亿好意思元版权妥协(史上最大版权妥协之一),原因是使用从盗版网站下载的数百万本受版权保护竹帛推行 Claude。

马斯克这话确定带着我方的黑货,但有一说一,谁蒸馏了谁,kaiyun sports照旧说蒸馏本等于双向奔赴,不需要说太明晰。

Sonnet 4.6 自曝“我是 DeepSeek”,一个合理的猜测,有推行数据的组成问题。

{jz:field.toptypename/}

模子的“我是谁”不是硬编码的参数,它是在推行数据中的统计深刻。咱们问它“你是谁”,它作念的事情实质上等于瞻望,在整个推行数据中,“你是谁?”这个问题后头,出现概率最高的回应是什么,它就会答什么。

泛泛,你嗅觉 Claude 一直知说念我方叫 Claude,是因为有 system prompt 在。

在华文互联网上,Claude 险些莫得凯旋用户。是以华文对话数据中“我是通义千问/豆包/DeepSeek”的样本量远超“我是 Claude”,在莫得身份锚点的情况下,模子当然倾向于输出概率最高的阿谁谜底。

大模子的身份错落其实不是什么清新事,圈里也须生常谭了,AI 推行数据互偷互薅不行幸免会是常态。人人都薅公开/半公开数据,谁也别笑谁了。

在一派心情化的商议中,RLHF 领域的巨擘预计者 Nathan Lambert 在 2 月 24 日发表了一篇可能是最有重量的安详分析_,How Much Does Distillation Really Matter for Chinese LLMs?_。

他的几个中枢不雅点值得慎重看:

他觉得 DeepSeek 的 15 万次交互“仅仅不值一提”,对 DeepSeek 听说中的 V4 模子影响不错忽略不计。

他还指出,即使蒸馏了普遍 Claude 的问答对,它们在 RL 推行框架下能进展的作用也鄙人降。

换句话说,即使蒸馏如实发生了,它对中国 AI 公司最终模子本事的影响,可能比 Anthropic 在博客中示意的要小得多。

中国 AI 公司获取今天的收获,靠的也不全是、也不行能仅仅蒸馏。

况且蒸馏,在本领上也不是什么贪心,是圭臬的模子推行妙技。整个大模子的推行数据,在某种进度上都还是包含了其他模子的输出。