联合创始人兼CEO夏利学对澎湃新闻表示,“算力成本每降低90%,就会有更多新的可能性出现。不管是实验性的试错,还是开发更强大的通用大模型,现在都卡在了算力成本上。动辄几十亿的算力成本太高了,我们负担不起。小公司有很多好的想法,互联网时代几个人凑合一个月就能做出一个手机APP,现在维护半年的算力资源要几千万,成本太高了。”

联合创始人兼首席执行官夏利学。

成立于2023年的无问新琼,入驻上海市徐汇区摩苏空间。9月2日,其宣布完成近5亿元A轮融资。成立一年半以来,无问新琼累计融资近10亿元。一线国资、市场化龙头机构、上海等地券商直投等纷纷入股无问新琼,多方联手破解大模型算力瓶颈。
夏利学表示,“能源公司决定每度电的价格,模型公司决定每一枚代币能解决多少问题,而无问新穷则优化提供每度电多少代币的能力。只有全行业共同努力,才能实现降低算力成本的完整链条。”
十余年学术积累,产业投入
无问新琼本轮融资联合领投方为社保基金中关村自主创新专项基金(君联资本管理)、启明创投、洪泰基金,跟投方包括联想资本、小米、软通高科等战略投资者,国开科创、上海人工智能产业投资基金(临港科投管理)、旭辉科投等国有基金,以及顺为资本、达晨资本、德同资本、尚实资本、森若宇坤、申万宏源、正经资本等金融机构。所募资金将用于加强技术人才引进和技术研发、推动产品商业化发展、盘活异构集群计算资源等,充当AI模型算力的“超级放大器”。
算力与单颗芯片的算力、单颗芯片在场景中的算力效率、芯片数量等相关。其中,单颗芯片的算力性能取决于芯片公司的发展,而单颗芯片在场景中的算力效率则涉及软硬件的协同。最终目标是将所有异构芯片整合成一个大系统。因此,一个大模型的实际可用算力不仅取决于芯片的理论算力,还取决于通过优化系数实现的算力利用效率,以及通过集群规模实现的整体算力规模。
“在GPT-4之后,算法能力发展进入了一个比较缓慢甚至停滞的阶段。这背后的逻辑是,支撑算法所需要的算力遇到了瓶颈,目前还没有人能够实现更大规模提升单一模型算力的大系统,需要研发和构建支撑模型能力迈向下一代的算力体系。”夏立学说,相较于全球模型层、芯片层“相对集中”的格局,我国的模型和芯片更加“百花齐放”。大量异构芯片也形成了“生态孤岛”,不同硬件生态相互封闭、互不兼容,给算力使用者带来技术挑战,造成算力资源的浪费。“A加速卡的开发商无法快速将自己的工作迁移到B开发商的卡上,也没办法通过多种异构算力形成大系统来快速完成大模型的训练或推理。”他表示,“生态孤岛”成为构建AI(AI原生)基础设施的难点,也是当前大模型行业面临“算力荒”的重要原因。

吴文新琼的发起人是清华大学电子工程系教授、系主任王宇,他牵头的NICS-EFC实验室早在2008年就投入了面向智能场景的软硬件联合优化技术路线,提出了“算法创新-编译映射-硬件架构”联合优化的设计范式。夏礼学是王宇的博士生,毕业后的五年间,在阿里云从事云计算技术和产品研发工作。另一位联合创始人兼CTO闫圣恩是中科院博士、美国北卡罗来纳州立大学访问学者,曾任商汤科技数据与计算平台部执行研究总监,负责商汤万卡集群建设,现为清华大学电子工程系副研究员;联合创始人兼首席科学家戴国浩也毕业于清华大学电子工程系NICS-EFC实验室。他目前是上海交通大学终身副教授、清源研究院人工智能设计自动化创新实验室负责人,凭借十余年的学术积累,逐渐走向产业,希望为大模型时代的人工智能提供设施,联合优化软硬件,打通算力供需,利用多方异构算力,让全国异构算力发挥出最大潜能。
“我们结合了各自在行业中的经验,我们的商业模式并不是单纯的卖软件服务,而是把技术叠加到我们目前管理的各个集群上。”夏利学说,一般大模型的算力要求比较稳定,而文胜图片、文胜视频等模型对动态算力的要求比较高。对于大模型研发公司、大模型应用开发公司,无问新穷就像淘宝一样,用平台接口让大家可以方便、快捷地使用算力,满足个性化的算力需求。
让计算能力随处可用
今年7月,无问新琼推出了千卡规模异构芯片混合训练平台,千卡异构混合训练集群最高算力利用率可达97.6%。 “我们比其他标杆解决方案平均高出30%左右,也就是说在同样的多芯片机房条件/集群条件下,无问新琼能将总训练时间压缩30%。”夏礼学表示,无问新琼-AI大模型开发与服务云平台集成了大模型异构千卡混合训练能力,具备万卡级可扩展性,支持6块异构芯片的大模型混合训练。自平台上线以来,基米AI、猎聘、圣数科技、智谱AI等众多大模型行业头部客户均在-AI异构云平台上稳定使用异构算力,并享受无问新穷提供的大模型开发工具链服务。
“所有大模型应用都要落地,而落地需要综合考虑性价比、成本、适用性。很多大模型就卡在成本和适用性上。很多人有很好的想法,甚至可能了解一些人工智能模型,但如果给他们一台的裸机,他们也不会用。另外,就算有研发能力,大模型动辄上亿美金,所以要考虑成本影响。”夏立学说,目前裸机算力过剩,这些算力只具备机器和网络存储价值,不能开箱即用,只有极少数非常大的公司有能力自己搭建裸机算力。
“任何芯片都很难大规模使用,在行业竞争可以容忍的时限内,预训练一个仅7B规模的模型就需要耗费大卡的算力,而这个过程的调优工作极其复杂;不同机器之间通信效率存在差异,进一步增加了优化难度;另外,在不改变任务计算周期的情况下,如何与模型结合、深度优化等等,这些都是挑战。”他表示,无问新穷创办的初衷是将算力服务变成水、电、气,开发者只要打开水龙头或阀门,随时都可以使用,无问新穷想用多少就用多少,让算力的使用更加灵活、稳定、简单,降低模型实现的门槛。 “云服务公司的典型模式是大客户带领小客户,大客户提供经验给云服务公司,云服务公司再把这些经验复制给小客户。我们也会跟大合作伙伴有深入的技术交流,但我们真正服务的是那些专注于模式应用的公司。这些公司不再需要自己建立一个百人团队去维护算力集群。”

目前,国产算力仍不足,国产芯片也未得到充分应用。夏利学认为,正是因为缺少中间的软件层,导致国产芯片公司无法直接接触客户,产品落后国外2-3代。“我们希望通过我们的平台把所有芯片整合起来,芯片厂商把好用的算力提供给我们,我们帮他们卖出去。开发者用的时候不需要识别用哪张卡,就像你打开水龙头,不需要知道水是从哪个水库来的,随便用就可以,这样会带动国产芯片生态的建立。”既然可以用上低成本的国产芯片,这也给客户带来了性价比高的算力。
“大模型未来一定能够解决各行各业的智能任务,只是需要更快的迭代、更低的试错成本、更多的用户反馈,而这些的背后,计算效率非常重要。”夏利学表示,吴文新琼将不断扩大算力规模,降低算力成本,推动大模型技术的演进和应用的落地,让大模型产业更加快速地爆发。



