7月4日消息,为解决人工智能(AI)芯片的算力问题,中国AI企业正在推行“多芯片混合”策略,以提高AI算力,同时进一步避免供应链安全问题。
多芯片混合计算方式具有诸多优势,包括使用多种不同类型的 GPU 进行并行训练,共同提高大型语言模型(LLM)的训练速度。由于可以同时处理更多数据,并且内存可以得到更好的利用,中国制造商可以减少对更昂贵的 ()芯片的依赖,从而降低成本。
自2022年10月以来,受美国不断升级的限制政策影响,中国从国外获取高性能AI芯片的渠道受到极大限制,因此灰色渠道仍然存在,但供应量仍然比较有限。同样,中国虽然也有一些AI芯片,但性能和产能也比较有限。
据传,中国公司已经开始开发“多芯片混合”技术,将不同的芯片组合成一个训练集群,包括百度和阿里巴巴都在研究这一解决方案。例如,百度在2024年财报电话会议上宣布,它可以将来自不同供应商的GPU组合起来,用于AI训练。另一家大型中国科技公司阿里巴巴自2021年以来一直在研究“一云多芯片”解决方案。但也存在许多挑战,比如需要像这样的高速架构来确保不同的加速器能够高效通信。不过,阿里云已经开始转向使用基于高性能以太网的网络。


