推广 热搜： 边框产量方形 pc材料工序投资税收分类 2022 低周疲劳冬季

DeepSeek V3称自己是ChatGPT？大模型圈热议的bug与训练成本揭秘

日期：2024-12-30 来源：网络整理作者：二手钢材网浏览：244 评论：0

核心提示：不过在网友们纷纷测试之际，有个bug也成了热议的焦点——于是乎，有人就开始怀疑了：它不会是在ChatGPT的输出基础上训练的吧？V3并非是第一个出现“报错家门”的大模型。而比起用没用ChatGPT数据，或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

然而，随着网友们纷纷测试，一个bug却成为了热议的焦点——

只是少了一个问号，V3 实际上是自称的。

_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

即使让它讲一个笑话也会产生相同的结果：

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT__被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

此外，V3此次走红的一大亮点是培训费用仅为557.6万美元。

于是乎，有人开始怀疑：它不是根据的输出来训练的吧？

真巧，我也发了一个状态，好像是在讽刺……

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_

不过，V3并不是第一个被报错家的大型车型。

比如他曾说自己是百度的文心一言……

_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

那么这是怎么回事呢？为什么V3报错门？

首先需要强调的是，从目前网友们的整体讨论来看，V3不太可能是针对输出进行训练的。

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT__被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

我之所以这么说，就像网友Riley总结的那样——因为互联网的影子无处不在。

即使V3故意使用输出进行训练，也没有关系。

几乎所有后来的大牌车型都见过它。

例如，对话数据集并不新鲜，许多人都尝试过调整它和其他数据源。但即便如此，也没有出现V3级别的大型车型。

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_

然后，Riley拿出了V3报告中的一些证据：

而且如果用数据的话，一些关于V3质量的问题是无法解释的。

比如在 Pile 测试中（基础模型压缩 Pile 的效果），V3 的得分几乎和 Llama 3.1 405B 一样，这与是否接收数据无关。

此外，报告指出，95% 的 GPU 时间用于预训练基本模型。即使是和数据相关的，这部分也会发生在后期（最后5%）。

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT_

与其使用无用的数据，或许我们更应该关注为什么大模型频繁出现“报错门”的问题。

对于这个问题，有人给出了尖锐的评论：

因为人工智能公司获取数据的互联网上充斥着人工智能垃圾。

毕竟，欧盟的一份报告预测，到2026年，90%的在线内容可能由人工智能生成。

这种“AI污染”将导致“通过训练数据完全过滤AI输出”变得困难。

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT__被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

AI Now 首席科学家 Heidy 表示：

尽管存在风险，但开发人员还是被从现有人工智能模型中“提炼”知识所节省的成本所吸引。

意外训练的模型或 GPT-4 输出也不一定会表现出类似于定制消息的输出。

那么现在针对网友热议的问题，量子比特已经进行了一波实测，而V3还没有解决这个bug。

仍然缺少一个问号，所以答案会有所不同：

被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT__被认为国产AI之光的DeepSeek V3出糗：居然自称是ChatGPT

标签： ChatGPT 大模型报错家门预训练 post-training

打赏

更多>同类资讯

0 条相关评论

• OpenAI推出Tasks测试版功能，ChatGPT迈向成熟个	• ChatGPT两年震撼世界：技术、应用、法规、伦理
• 工程师开发ChatGPT控制自动瞄准步枪炮塔，展示	• 苹果Siri大更新将至：iOS 19.4将于2026年推出更
• 从ChatGPT到O3：AI模型发展阶段解析与应用挑战	• OpenAI ChatGPT及Sora视频生成模型服务中断，部
• OpenAI圣诞节后遭遇大规模宕机，ChatGPT和Sora	• OpenAI 2024年人工智能发布会：ChatGPT新模型与
• OpenAI直播第11天：ChatGPT深度集成Mac应用，编	• OpenAI推出新版ChatGPT Search，旨在补齐实时信

• 滤芯PD/PDP130+2901300106阿托拉斯滤	• 滤芯PD130+2901200405滤芯DD25+阿托拉斯滤
• 不锈钢过滤器不锈钢压缩空气过滤器	• 304L不锈钢过滤器 316L不锈钢过滤器
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器
• JDG800给料机配件无极调速器摆线减速机	• GLD800/7.5给料机锰钢甲带柔性甲带片穿条
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器

DeepSeek V3称自己是ChatGPT？大模型圈热议的bug与训练成本揭秘

推荐资讯

推荐图文资讯

一艘一万吨的货船一般造价是多少钱？(组图)

英特尔与高通口水战：高通处理器能否挑战英

钢板重量怎么算？钢板理论重量计算公式是什

日照钢铁收购营口中板，中国制造业更是雄居

联发科 Helio G81-Ultra 处理器性能分析：4

有哪些钢材会被用来制造剑呢？这些钢材的优

资讯点击排行

热门标签

推荐视频

最新加入公司