华为轮值董事长徐直军:立足中国,打造长期可持续的算力解决方案

   日期:2024-09-21     来源:网络整理    作者:二手钢材网    浏览:218    评论:0    
核心提示:每个企业都要思考适合自己的获取AI算力的方式,而不仅仅是建设自己的AI算力。第二、不是每个企业都要训练自己的基础大模型。每个企业都应聚焦自身核心业务,自行训练基础大模型会影响AI尽快赋能核心业务。第三、不是所有的应用都要追求“大”模型。

华为预训练模型_建模分析华为的阶段战略_

他表示,智能化必然是一个长期的过程,而算力是智能化的关键基础。算力依赖于半导体技术,但我们必须面对一个现实,那就是美国在AI芯片领域对中国的制裁在很长一段时间内都不会解除,中国的半导体制造技术会因为美国的制裁而长期落后,这意味着我们能够制造的芯片的进步会受到制约。这是我们打造算力解决方案必须面对的挑战。

立足中国,基于实际可用芯片制程的算力才是长久之计。华为战略的核心是充分把握AI变革机遇,基于实际可用芯片制程,计算、存储、网络技术协同创新,打造计算架构,构建“超级节点+集群”体系算力解决方案,持续满足长期算力需求。

他提到,大模型的技术突破大大加速了智能化的进程。一段时间以来,各行各业几乎无时无刻不在提到大模型,纷纷建设AI算力、训练大模型,这对于华为等算力提供商无疑是一大利好。但从长远发展来看,第一,并不是每家企业都需要建设大规模的AI算力。AI服务器特别是AI算力集群不同于一般的x86服务器,对电源、散热等数据中心机房环境有极高的要求。随着大模型越来越大,AI算力也将走向更大规模,变化速度快。AI服务器快速升级换代,数据中心机房面临要么浪费要么无法满足需求的困境。每家企业都要思考如何获取适合自己的AI算力,而不是只顾自己建设AI算力。

_华为预训练模型_建模分析华为的阶段战略

第二,并不是每家公司都需要训练自己的基础大模型。训练基础大模型的关键是数据,准备足够多的优质数据是一个很大的挑战。基础大模型的预训练数据量已经达到10万亿量级,对于企业来说,这不仅意味着高昂的成本,能否获取足够多的数据也是一个挑战。基础大模型的参数数量不断增加,模型迭代优化难度大,通常需要数月到数年的时间才能完成模型迭代训练。每家公司都应该专注于自己的核心业务,自己训练好基础大模型,将影响AI能否尽快赋能核心业务。

第三,并不是所有应用都需要追求“大”模型。从华为盘古在业界的实践来看,十亿级参数的模型可以满足科学计算、预测决策等业务场景的需求,比如降雨预测、药物分子优化、工艺参数预测等。在PC、手机等端侧设备上,十亿级参数的模型也得到了广泛的应用。百亿级参数的模型可以满足NLP、CV、多模态等大量特定领域场景的需求,比如知识问答、代码生成、代理助手、安全测试等。NLP、多模态的复杂任务,用千亿级参数的模型就可以完成。

_建模分析华为的阶段战略_华为预训练模型

“所以我们认为企业需要的是根据自己不同的业务场景需求,选择最合适的模型,通过多种模型的组合来解决问题、创造价值。”

_建模分析华为的阶段战略_华为预训练模型

海量资讯、精准解读,尽在新浪财经APP

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2