谷歌停止对华为服务支持,Mate 20用户遭遇导航问题

   日期:2024-12-16     来源:网络整理    作者:二手钢材网    浏览:155    评论:0    
核心提示:从哥大到华为,我一直钟爱着数学2024年3月,部门转型成为AI数据部,承载着为华为ICT服务领域大模型源源不断地提供“弹药”——高质量高价值的领域数据的职责。不大的作战室中挤满了“网友”,大家来不及互相介绍,打了个招呼就立刻拖来白板开始分析模型问题和后续动作。

来源 |新生社区、蓝血研究 ()

提交 | (微信)

全球合作伙伴招募|(微信)

2019年5月20日初夏的一个平凡的一天,在大洋彼岸的加州,我熟练地打开谷歌地图,准备导航到洛杉矶的唐人街,屏幕上突然弹出一行小文字我手里的Mate 20手机的提示:“抱歉,您的服务暂时无法使用。”

“喂,今天有什么事吗?”我一次又一次地尝试。尽管信号已满,但我还是一次又一次收到相同的提示。

“但是我可以正常使用吗?”朋友把手机递给了我,我更加疑惑了,于是我用朋友手机上的 浏览器进行搜索,然后我看到了令我震惊的消息——“谷歌宣布从今天开始我们将停止提供为华为手机提供服务。”

接下来一段时间,制裁新闻如雪片般堆积在国内外热搜榜上。我逐渐了解到,是华为的力量、中国的力量导致了技术封锁。这让身在异国他乡的我感慨万千。

01

从哥伦比亚到华为,我一直热爱数学

2022年5月,我正式拿到了哥伦比亚大学的毕业证书,我长达七年的留学旅程也结束了。毕业之际,这款现象级产品的出现就像投下了一颗深水炸弹,彻底改变了行业格局。从深度学习到大型模型,模型的数据和参数的量变最终引发了质变,点燃了前所未有的智能火花。我眼睛一亮,激动万分,更加坚定了走上人工智能之路的决心。

我从小就痴迷于数学。那些数字和符号就像跳跃的生命体,吸引着我去探索它们背后的奥秘。本科时,我选择了统计学和管理经济学双专业。在各个行业的实习过程中,我不断发现自己与数据的契合点,享受着洞察复杂数据奥秘的“顿悟”时刻……我似乎生来就是和数据打交道的。后来继续研究数据科学-人工智能领域,从数据转向AI,并与摩根大通、联合利华的AI研究部门合作,进行CV(计算机视觉)目标检测算法的创新应用,这促使我加入华为,为从事数据算法工作打下了坚实的基础。

英雄归来mod_2017年华为ict技能大赛_

所有的伏笔都变成了一个精彩故事的序幕。华为服务与软件研发管理部向我抛出了橄榄枝——“AI数据工程师”,这么专业又合适的职位!我欣喜若狂,踏上了回国之路,来到了南京研究院。

毕业照(左二为作者)

加入公司后,我从维护大模型应用和开发智能问答功能开始,一步步积累了大模型应用框架的基础知识。两个月后,我的导师蔡波提出:“我们需要研究如何利用我们的大模型和知识库来构建我们自己的智能助手。”我毫不犹豫地接受了这个新的挑战。

“两周可以吗?”

“一定有用!”

接下来的两周,我没日没夜地看论文、写代码,终于成功搭建了知识库和RAG( )问答应用框架,并上线,实现了我的第一个大型模型应用。 。在接下来几个月的算法优化探索中,我反复思考RAG框架中的每一个关键环节。从路由和重写,到融合回忆和重排,再到生成和记忆,每当遇到问题和瓶颈时,我都会通过学习和探索不断寻找解决方案。就这样,我们不成熟的智能助手逐渐成长为组件可插拔的成熟(流水线),并成功落地为产品,应用于数字化配送运营领域,为配送运营相关知识提供及时的知识搜索和问答。一线工程师。服务,大大提高了知识转移的速度和交付效率。

在这个项目中,我不仅获得了实现完整的大模型技术的宝贵经验,也深刻认识到了大模型时代高质量数据的重要性。无论是检索召回还是模型微调,数据几乎决定了算法性能的上限。

02

数据质量好吗?让一白来处理吧

2024年3月,该部门转型为AI数据部,负责为华为在ICT服务领域的大模式持续提供“弹药”——高质量、高价值的领域数据。大模型的基于领域的训练主要分为两个阶段,连续领域预训练和专用SFT(监督微调)。持续预训练的目的是让模型更深入地学习领域特有的知识和经验,而SFT的目的是针对典型领域应用场景激活通用模型无法激发的专用对齐能力,并完成协调服务工程师和合作伙伴工程师在下游任务上的日常工作。为了保证模型不“中断”,项目组决定每周提供一批数据,并根据模型反馈不断迭代优化,实现数据飞轮。

领导来找我:“你既有算法背景,也有数据背景,也做过微调和数据质量提升,你能尝试一下接管SFT数据的整体交付吗?”

英雄归来mod__2017年华为ict技能大赛

那一刻,我不禁激动起来。处理数据是我喜欢并且擅长的事情。现在不挑战的话,我随时都会挑战!我欣然接受了这个任务,成为了专门的SFT数据质量检查和数据交付的负责人(负责人)。刚上任,遇到的第一个任务就是提供ICT领域增强的SFT指挥数据,利用领域数据帮助模型提升领域能力,混合通用数据保证大模型的问答能力在域中不会丢失。

接下来的几天,我皱着眉头,盯着浩瀚的数据集,一个人不停地头脑风暴:开源通用数据太多了,如何选择? ICT服务领域虽然有大量数据,但并没有按照大模型的对齐范式进行积累。因此,从LLM的角度来看,这是远远不够的。该如何弥补呢?哪些数据可以使用,哪些数据不能使用?如何控制数据质量? ……还有很多问题等待我解答。

为了掌握专用SFT数据的数据构建目标全景,我从下载的开源数据开始,因为开源SFT数据集有更好的对齐范式,我可以借鉴。于是,我展开了一个又一个文件来查看数据样本,并通过数据处理脚本来组织和归档可用的数据信息。在看了三十、四十个数据集和上百个数据文件后,我从数千万个通用的微调数据中逐渐摸索出数据构建方法和系统设计,大致掌握了如何设计一套针对专业领域的SFT。数据目标全景,我处理的每一个数据集都有我笔记的痕迹。

为了定义数据质量,我阅读了与 SFT 质量相关的论文以及行业领导者对数据质量的定义。博采众长,充分吸收整合业界数据质量维度定义,并针对领域数据增加具体规范,形成了包括安全、安全在内的6大维度、57条细则的有效、完整的A级质量评价体系。

为了验证数据效果,我参考了行业的评估指标,并与模型训练和服务工程师的种子用户实时沟通,获取服务工程师的使用反馈。我从使用该模型的工程师的输出特征中推断数据偏差或问题,并探索每种功能。相应数据的格式特征和质量要求。

“领域模型的服务工具和API调用还存在一些问题,数据集中是否混入了一些噪音?”

“现在模型提取故障经验信息的能力似乎忘记得比较严重了,是不是应该增加数据比例?”

被各种新的问题和想法包围着,各种乱七八糟的想法时常出现在我的脑海里。看论文、和同事讨论、向专家请教学习已经成为我的常态。在学习的同时,我理解并整理了手头的数据,构建了能力,探索了数据交付过程,并一一攻克。

在4月到6月每周交付数据的紧张节奏中,我不断鞭策自己深入思考,最终梳理出了高效、高质量数据交付的整体流程框架,包括数据规划、采购、数据采集等9大环节。收集、优化和混合。 ,11 个必要步骤为高质量 SFT 数据铺平了道路。同时,我还编写了《SFT服务领域数据接入规范》和《服务领域AI数据质量评估规范》,并向周边领域推广。在数据进入SFT数据池之前我做了标准化的格式和质量控制。从那时起,我交付了高质量的数据,没问题!

在此期间,我也处理了大量运维等服务场景中下游任务的微调数据,但无论多少我都不会懈怠。我仍然坚持理解每一个数据,坚持发现和解决细节问题,一步步做数据集。变得更好。面对培训团队的提问,我从一开始的不确定,到了解数据的细节,并能流利地回答问题。我渐渐感受到大家对我的信任。我知道,我已经开始掌握控制这头巨兽的方法了。

“一白,这个领域能力在当前的训练集中有多少数据?”

“训练数据集中该能力共有42000个项目,其中子能力项目分别为20000个和22000个。”

“一白,这个数据的来源是什么,原始查询是如何构造的?”

英雄归来mod__2017年华为ict技能大赛

“数据来自某个场景,原始查询是应用系统导出的历史对话。”

“一白,模型在领域评估中表现不佳,是不是训练数据的客观问题分布有问题?”

“客观题选择时考虑到了多样性和平衡性,每个选项的比例相差不大。表现不好可能是数据太少导致欠拟合,部分数据可以弥补。”

……

诸如此类的对话无数。后来经常听到训练组说“数据质量好吗?让一白检查一下”。在有些自豪的同时,我也感受到了这些信任背后的责任。

03

更好地解决关键问题

部门架构变动后的第一个“大考验”来了,我们正式进入“630”战役。这是AI服务产品部成立后,首次发布正式的领域模型产品。这也是我们模型训练团队和服务工程师第一次为种子用户做种子。首次线下联合运营。

我们630需要实现两个关键目标:服务领域模型数据通信能力认证评价提升20%,下游10多个领域任务能力保持不下降。其中,SFT数据在第二个目标中起着至关重要的作用。

6月中旬,训练团队发现模型效果与目标相差甚远,多个特征相继亮起红灯。存在无法达到产品承诺目标的风险,他们需要更多的数据支持和更快的迭代。因此,建议从每周迭代改为每日迭代。此时,日常的远程电话通讯变得困难,高昂的通讯费用无法满足及时传递信息的需求。眼看着时间一分一秒地过去,我们和训练组商量后达成了默契,并没有停下来。 ,我们去东莞聚焦重点吧!

出差那天,我带着刚回家一周、还没熟悉的小猫去宠物店寄养。看着这么小而柔软的一个人,独自蜷缩在小隔间里,我感到难过。 “我们很快就把事情办完,我送你回家!”我暗暗答应。

“留守”小猫

英雄归来mod_2017年华为ict技能大赛_

“易白,你落地了吗?等你来了我们再商量。”一下飞机,我就收到了模型领域增强专家彬凡哥的消息,我马不停蹄地赶往东莞松山湖作战室。狭小的作战室里挤满了“网友”。大家都没有时间互相介绍。打完招呼后,他们立即拉起白板,开始分析模型问题和后续行动。

接下来的场景每天都相似。作战室里,数据团队和训练团队并肩作战,对屏幕上的领域工具调用、经验知识提取、业务手册阅读理解等16个特征目标一一分析分析。逐步剥离模型推理输出的字符并寻找潜在的数据缺口。每天晚上11点,作战室里都能听到噼里啪啦的键盘声,预训练数据团队也在不断地研究问题。直到凌晨两点,大家仍然聚集在一起解决问题。

研究期间(右为作者)

6月17日,负责模型领域增强的吴辰伟博士在研究组发布了最新评测截图,“基于14版本预训练和30.1版本SFT数据的模型平均改进率数据通信领域达到21.7%。”

平静的话语激起了波澜,大家立即发来了一系列点赞和祝贺的表情包。就连一向冷静的张浩哲医生,也发出了两个感叹号。

达到了目标!就连熬了一周、每天迭代一个版本数据的预训练数据组也放下了紧绷的神经,作战室里的气氛顿时轻松了许多。

接下来剩下的目标就是保持在游戏领域执行任务的能力不下降。 “这取决于SFT!”

SFT数据集的版本1到2每天都在不断迭代。我和负责数据合成的吴思杰博士在东莞面临着高强度的投递任务。 Wubo已部署6个LLM(大型语言模型)实例全面运行,每天生成数千条定向补偿数据,源源不断地提供新的投放弹药;南京的朋友们也远程加入,反馈不足之处。对特征数据进行紧急寻源分析,从数据来源到数据分布,持续向一线传递准确信息,帮助诊断数据集中的可疑偏差。每次得到准确的结论,我都会在电话里大喊:“太好了,我需要这个信息!”

6月18日,我们在两个小时内紧急对两名重要数据修复算子进行了修复,修复了18万条问题数据。

6月19日,我们紧急启动多轮对话自动数据合成技术,密切监测风险特征。

6月20日,我们连续发布了三个版本的数据集。临近午夜,我发布了最后一个补丁数据集,并打电话给刚刚离开的吴波,让他回来并开始使用新数据进行训练。

6月21日凌晨一点,团队的李静博士和孙志杰正在屏幕前等待最终的模型结果出来。当天,模型的领域能力和下游任务能力终于全面达标。其中,领域工具调用的复杂特征,模型较基线提升了300%,可以转入测试!

2017年华为ict技能大赛__英雄归来mod

PANGU-S数据现场研究综述合影(右为作者)

6月30日,研究项目正式结束。回到南京我做的第一件事就是去接我的小猫。短短半个月的时间,在模型生长的同时,我家两公斤重的小家伙已经长到了三公斤,生长势头强劲。我又抱住了它,摸了摸它毛茸茸的小脑袋,心里暖暖的。

“我们都表现得很好。”

04

路虽险,但路就在脚下

西藏冰川徒步

在短短3个多月的时间里,我交付了18个版本的服务域特定SFT数据集,总计超过200万条。在此期间,我逐渐加深了对领域增强和大型模型的工程师对齐的理解,在领域AI数据集构建和数据交付方面积累了很多宝贵的经验,并获得了“战场英雄”和“团队卓越”的荣誉。

虽然数据质量还没有达到100%完美,模型效果也远没有业内专家那么自信,但我们尝试定义一个数据质量体系,并依托该体系构建和应用数据质量检验技术,最终实现了业务。数据集质量和模型性能的明显改进。

《黑神话:悟空》背后的游戏科学创始人冯骥表示:“踏上学习之旅比到达灵山更重要。”在寻找大模型的路上,我是一个充满热爱和追求的“学习团队”的一员。 ”,因缘与爱,成为了数据的“有缘人”。面对无数的技术问题,我常常感到压力很大,但每当我想到我们所做的不仅仅是解决一个问题,而且是在探索未知的边界时,这种信念就让我充满动力。尽管困难重重,但路上总有人在前行,尽管前方荆棘丛生、高山重重。我坚信“敢问路在哪里,路就在你脚下”。每一次挑战都是成长的机会,我愿意脚踏实地,一步一个脚印。

▼▼▼

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2