从公开信息来看,团队规模虽小,但实力却不容小觑。其创始人梁文峰领导的团队只有139名工程师和研究人员,而1200名研究人员中有500多人。
然而,凭借着“不寻求外部融资”、“创始人是囤卡大亨”、“团队成员均为清北等名牌大学毕业生”等一系列醒目的标签,它已经成功在AI创业圈崭露头角。

2024年12月,发布最新V3开源模型。该模型在评测中表现出色,不仅超越阿里巴巴自研Qwen2.5-72B、meta自研Llama 3.1-405B等顶级开源模型,甚至可以与GPT等顶级闭源模型相媲美-4o 和 3.5-。
值得注意的是,V3大模型自发布以来就完全开源,其训练成本远低于同类模型。数据显示,GPT-4的训练成本高达6300万美元,而-V3的成本还不到其十分之一。
此外,V3模型的训练是在2000块 H800 GPU上完成的,远低于硅谷各大厂商常用的数十万块高性能GPU。这一成果打破了国内大型模型上的算力芯片瓶颈,为创业团队提供了新的解决方案:即使算力有限,也可以通过高性能数据和更好的算法来训练大型模型。
一位创始团队成员发帖称赞:-V3的性能比最强模型还要高,而且资源消耗只有十分之一。 “未来可能不需要超大规模的GPU集群。”
元科学家田元东感叹:“FP8预训练,MoE,在非常有限的预算下强大的性能,从CoT中提取出来进行引导......哇!这真是伟大的工作!”

对于硅谷的敬畏,创始人梁文峰并不感到意外。他认为,这是因为作为一家中国企业,正在以创新贡献者的身份加入全球人工智能技术竞争。他指出,中国需要逐步成为技术的贡献者,而不是总是依赖西方的创新。
梁文峰还强调,中国的人工智能发展需要建立自己的技术生态系统,就像西方主导的技术界创造了几代人的摩尔定律和定律一样。他认为,很多国产芯片无法发展,是因为缺乏配套的技术社区和前沿技术的参与。
公开资料显示,母公司环方量化是一家以量化基金起家的公司。其用人风格与环方量化类似,注重本土人才。在AI产品正式上线之前,其已在内部对产品进行了长期孵化,并招募文科人才提供相关知识来源。这段独特的历程使其在人工智能领域独树一帜,成为中国人工智能技术创新的引领者。


