DeepSeek震撼科技界:国产AI之光,139人团队如何挑战OpenAI与Anthropic

   日期:2025-01-13     来源:网络整理    作者:二手钢材网    浏览:167    评论:0    
核心提示:这家AI创业企业以其独特的团队构成和卓越的技术成就,成为了业界关注的焦点。然而,DeepSeek凭借一系列吸睛的标签,如“未寻求外部融资”、“创始人囤卡富翁”、“团队成员均为清北等名校毕业生”等,成功在AI创业圈中崭露头角。DeepSeek的创始人梁文锋对硅谷的惊叹并不感到意外。

从公开信息来看,团队规模虽小,但实力却不容小觑。其创始人梁文峰领导的团队只有139名工程师和研究人员,而1200名研究人员中有500多人。

然而,凭借着“不寻求外部融资”、“创始人是囤卡大亨”、“团队成员均为清北等名牌大学毕业生”等一系列醒目的标签,它已经成功在AI创业圈崭露头角。

AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业

2024年12月,发布最新V3开源模型。该模型在评测中表现出色,不仅超越阿里巴巴自研Qwen2.5-72B、meta自研Llama 3.1-405B等顶级开源模型,甚至可以与GPT等顶级闭源模型相媲美-4o 和 3.5-。

值得注意的是,V3大模型自发布以来就完全开源,其训练成本远低于同类模型。数据显示,GPT-4的训练成本高达6300万美元,而-V3的成本还不到其十分之一。

此外,V3模型的训练是在2000块 H800 GPU上完成的,远低于硅谷各大厂商常用的数十万块高性能GPU。这一成果打破了国内大型模型上的算力芯片瓶颈,为创业团队提供了新的解决方案:即使算力有限,也可以通过高性能数据和更好的算法来训练大型模型。

一位创始团队成员发帖称赞:-V3的性能比最强模型还要高,而且资源消耗只有十分之一。 “未来可能不需要超大规模的GPU集群。”

元科学家田元东感叹:“FP8预训练,MoE,在非常有限的预算下强大的性能,从CoT中提取出来进行引导......哇!这真是伟大的工作!”

AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业

对于硅谷的敬畏,创始人梁文峰并不感到意外。他认为,这是因为作为一家中国企业,正在以创新贡献者的身份加入全球人工智能技术竞争。他指出,中国需要逐步成为技术的贡献者,而不是总是依赖西方的创新。

梁文峰还强调,中国的人工智能发展需要建立自己的技术生态系统,就像西方主导的技术界创造了几代人的摩尔定律和定律一样。他认为,很多国产芯片无法发展,是因为缺乏配套的技术社区和前沿技术的参与。

公开资料显示,母公司环方量化是一家以量化基金起家的公司。其用人风格与环方量化类似,注重本土人才。在AI产品正式上线之前,其已在内部对产品进行了长期孵化,并招募文科人才提供相关知识来源。这段独特的历程使其在人工智能领域独树一帜,成为中国人工智能技术创新的引领者。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2