2024年,随着大模型的逐步深入应用和多模态模型的快速发展,企业对算力的需求将不断增加,对算力的依赖将显着增加。
从模型需求来看,根据模型下载量统计,模型需求呈现两级分化趋势。百亿级以上的强悍密集型,10B以下的小型号比较受欢迎。对此,致远研究院副院长兼总工程师林永华表示:“从全球车型发展来看,车型尺寸正在呈现分化趋势。”

从算力来看,仍呈现出“需求大、能耗高、效率低”的发展趋势。以2020年发布的GPT-3与最新发布的-405B对比为例,虽然模型尺寸仅增加了2.3倍,但所需的计算能力却增加了116倍。算法的创新使得算力的需求一直处于高速增长的状态。同时,算法结构的创新也带来了MoE、模型量化、定制算子等更加复杂的计算需求。
随着技术的不断更新迭代,多模多模技术的发展也为客户提供了更广阔的选择空间和更高的应用开发灵活性。 《百花齐放》的多样性也带来了挑战:由于硬件架构、指令集、算子库独立实现等方面的差异,算力的多样化导致整个生态系统碎片化,难以形成统一的生态体系。协同作用强。

从目前的发展来看,目前的生态现状提高了大模型应用的技术门槛。技术能力薄弱的传统企业用户不仅在多种芯片、型号之间难以选择,而且即使部署成功,也存在软件框架过多、可用性差等问题,给后期开发和使用带来更大困难。浪潮信息高级副总裁刘军表示,所有的问题都可以归结为一点——如何构建可持续的底层AI生态,让多元算力更加通用和普惠,让系统更加高效、基础模型更加强大。高效的。便于使用。
12月25日,浪潮信息与致远研究院达成战略合作协议,共同宣布致远开源大模型通用算子库正式接入浪潮信息远脑启智EPAI企业大模型开发平台,面向大模型应用开发场景。提供强大的多算力系统支持,帮助企业实现更快、更广、更高效的多算力适配和使用,大幅降低企业开发大型模型应用的算力门槛,共同推动多算力的发展算力系统生态系统。

开源显然是目前构建生态系统的最佳方式。刘军表示,开源是创新活力的源泉。互联网时代,开源打破了以往的技术垄断,让更多的人参与到开源社区,贡献代码、贡献思想,共谋发展。在当今的AI时代,开源将会发挥更大、更积极的推动作用。
具体来说,要以应用为导向、以系统为中心,以开源开放、多元模式激发创新活力,以系统创新全局优化拓宽创新路径,以协同共生加速创新。开放、共赢的生态系统。实现人工智能创新与人工智能应用协同发展,激发人工智能创新活力,开源是核心和源泉。”刘军强调。
是致远研究院于2024年6月推出的针对多种算力的开源大模型通用算子库。基于生态开源、开放,面向多种算力,遵循统一的中间语言和统一的操作界面。并采用统一开源算子库实现路径,以大模型需求为导向,为多样化算力提供开源、统一、高效的算子层生态接入解决方案。截至12月,已提供超过130个大型模型算子,是算子数量最多、覆盖范围最大的开源算子库。

远脑启智EPAI(AI)是浪潮信息为实现大规模企业AI模型而打造的高效、易用、安全的端到端开发平台。支持主流开源和闭源大模型应用的快速开发,可实现大规模应用。模型应用跨计算平台无缝迁移,降低多模态适配和试错成本。
此次致远研究院携手浪潮信息,将算子库与远脑启智EPAI内置的核心计算框架深度融合。其核心意义在于保证大模型应用开发能够使用高性能、跨硬件、多框架兼容。该算子集平滑地跨越各种硬件架构,满足多种开发框架的需求。
“浪潮信息与致远研究院可以生态互补。致远研究院是AI领域的新兴研发机构,非常注重原始创新,开源了很多基础模型、算子库、OS(操作系统) )、数据集等重要研究成果”,刘军进一步指出,“浪潮信息致力于为客户提供软硬件协同的全栈AI基础设施解决方案。富有的双方的合作一方面将加速人工智能相关基础研究在产业端的落地应用,另一方面通过基础研究成果不断修正和优化。产业端的应用效果。”

据了解,接入算子库后,企业可以依托元脑启智EPAI大模型开发平台,使用针对大模型应用开发场景优化的先进算子集,高效构建、优化和执行复杂的行业应用算法。在实时性要求严格的复杂训练任务和推理场景中,能够获得稳定高效的计算性能。
此外,企业无需关心多个异构加速卡之间的软硬件差异,可以真正实现大模型应用跨计算平台的无缝开发和迁移。开源开放的生态系统在人工智能大模型的应用中发挥着关键作用,可以有效降低大模型实现的试错成本、创新成本和应用成本。 (本文首发于钛媒体APP,作者|张申宇,编辑|盖宏达)


