汤森路透实验室成立:打造AI技术创新应用基地,引领大数据时代

   日期:2025-01-01     来源:网络整理    作者:二手钢材网    浏览:362    评论:0    
核心提示:来到大数据时代,汤森路透在推出Elektron平台的同时,还推出了桌面金融信息产品Eikon。这是一款专为新一代金融人士设计的旗舰产品,客户不仅可以方便地获取实时数据、新闻、分析,开展在线交流和交易,还可以通过它采用“自然语言”的人性化交互进行数据处理和分析。赋能汤森路透生成式AI技术全员普惠

打造人工智能技术创新应用“基地”

毫无疑问,人工智能已经成为当今的热门技术。但早在20世纪90年代,已经拥有海量数据的汤森路透就敏锐地感觉到,要进一步释放数据的潜力,关键在于计算能力和算法,即高性能计算和机器学习(ML) 、深度学习、人工智能(AI)技术的综合应用。汤森路透自然率先推出了业界首个利用自然语言处理(NLP)技术进行更高效、更自然的法律研究平台,开启了自己的AI技术应用之路。

在大数据时代,汤森路透在推出平台的同时,还推出了桌面金融信息产品Eikon。这是专为新一代金融专业人士设计的旗舰产品。客户不仅可以轻松获取实时数据、新闻、分析,进行在线交流和交易,还可以使用“自然语言”人性化交互进行数据处理。和分析。当客户提出“比较A银行和B银行2012年和2013年的利润”时,系统会很快给出答案,而这些答案不再是海量的信息和数据,而是非常有针对性的对照表。 ,以及两家银行的具体收入对比。该产品推出后不久,就被全球超过40万名专业人士使用。

看到人工智能技术广阔的应用前景,汤森路透决定建设人工智能技术创新与应用“基地”,并于2015年9月正式成立汤森路透实验室。该实验室的主要宗旨是创新与合作:创新是为了利用汤森路透数据进行研究和实验,为客户提供更专业、更完整的解决方案;合作是指加强与各行业专家和企业的联合创新,进一步拓展人工智能等新技术的应用场景。

6周开发企业级大型语言模型应用平台Open Arena

赋能汤森路透的生成式人工智能技术,让所有员工受益

对于汤森路透来说,人工智能技术的创新应用意义重大。以此为例。如今,它已被汤森路透实验室嵌入生成式人工智能技术,可以自动生成丰富、详细、专有的法律内容数据库。法律专业人士可以在几秒钟内获得有关特定法律问题的信息。答案并可以帮助撰写合同、准备纳税申报表或监管备案。换句话说,在内容检索和文本生成方面,生成式人工智能为汤森路透服务客户带来了新的生产力。

尽管如此,汤森路透在推动生成式人工智能技术的包容性和提高全公司员工的生产力方面仍然感到不足。尤其是每次研发团队或开源社区推出新的大语言模型(LLM)时,如果这些前沿成果不能被公司员工快速准确地掌握,仍然可能会错失新的数据处理或分析策略带来的机会。 ,或者在生成专业解决方案和优化客户服务质量方面遇到瓶颈。因此,如果对生成式AI技术的掌握和应用滞后,无疑将成为汤森路透进一步提高公司生产力和竞争力的一大障碍。

此外,这也与汤森路透致力于提高每个团队、每个业务领域的员工对生成式人工智能技术的认识和理解背道而驰。越来越多的员工希望公司能够在网络研讨会、培训材料和小组讨论中开发相关的学习工具。

为了鼓励整个组织的探索和创新,让人工智能解决方案可供技术和非技术团队使用,在亚马逊云技术的支持下,采用了人脸和深度学习容器(DLC)等服务,汤森路透实验室开发了自己的企业级大型语言模型应用平台Open Arena仅用了6周时间。

在平台开发过程中,汤森路透实验室通过Face技术在互联网上实现了整个架构模型的部署和增强,并利用Face推理工具包和加速库来加速推理过程,高效应对复杂和资源匮乏的场景。密集作业。型号要求。这些技术和工具的应用确保了多个大型语言模型(LLM)可以快速、无缝地部署。支持接入的模型,AI开源的模型、meta开源的Llama 2模型,以及大家熟知的图模型、亚马逊云技术自研的Titan模型,大大增强了Open Arena的灵活性模型集成。

为了提供无缝体验,Open Arena使用安全的API网关,通过API进行管理,确保数据可以进行精细的预处理和后处理,并连接托管在S3上的前端和后端存储服务,部署在S3上 存储服务上的前端充当静态站点,然后使用汤森路透的单点登录机制来保证身份验证的安全性。在访问层面,平台提供非编程访问方式。员工可以基于网络实现自助服务,轻松探索和体验最新的大语言模型(LLM)及相关套件,帮助员工快速使用生成式AI技术。安全创新。这对于没有编程背景的同事来说极其友好。

作为NoSQL数据库服务,Open Arena还可以有效地存储和管理各种数据,包括用户查询、响应、响应时间和用户信息。为了简化开发和部署流程,汤森路透实验室还采用并执行持续集成和持续交付(CI/CD)。此外,还提供自定义仪表板和全面的日志记录功能,以帮助监控基础设施并确保其以最佳状态运行。

值得一提的是,Open Arena的开发目的是为了从多个数据集合中快速获得答案。应用场景包括快速响应客户需求、快速提取专业信息、文档要点总结和验证等。因此,对于基于内容的用例(需要特定语料库答案的经验),Open Arena 结合提供检索增强生成(RAG)技术,能够查询特定语料库并获取最相关的内容。在此过程中,文档被分割成块。为了获得最佳匹配块,Open Arena 使用基于双编码器和交叉编码器模型的检索/重新排序方法。然后,将检索到的最佳匹配作为输入。与查询一起传递到大型语言模型 (LLM),以高效生成专业的解决方案。

此外,使用生成式人工智能技术的风险之一是数据泄露。双方的此次合作采用了安全定制的方式,以确保Open Arena用于微调大语言模型(LLM)的所有数据均保持加密状态。为了降低使用门槛,Open Arena还采用了交互友好的界面,并为每个用户的探索体验设计了预设的激活图块。如下图所示,这些图块用作满足员工特定要求的预设交互。

通讯新闻例子__新闻通讯社的产生与发展

打开Arena产品界面

例如,“开源大型语言模型(LLM)”功能提供了类似聊天的交互通道。

新闻通讯社的产生与发展_通讯新闻例子_

开放竞技场聊天互动频道

“询问文档”功能允许员工上传文档并提出与大语言模型 (LLM) 内容相关的具体问题。 “经验摘要”功能允许员工将大量文本提炼成简洁的摘要,如下图所示。

通讯新闻例子_新闻通讯社的产生与发展_

开放竞技场“经验总结”功能互动

这些功能的交互设计简化了员工对生成式人工智能技术的探索,激发创造力,促进创新用例的发现。

目前,在不到一个月的时间里,Open Arena每月为汤森路透全球业务超过1000名内部员工提供服务,与每位员工的互动时间平均为5分钟,有效促进了内部自主研发和探索。开源社区大语言模型(LLM)的应用结合汤森路透积累的海量数据资源,服务客户的产品创新和商业决策。

汤森路透实验室研究工程总监 Ray 表示:“由 和 Face 提供支持的 Open Arena 帮助我们快速向同事展示尖端的法学硕士和生成式人工智能工具,从而帮助推动整个企业的创新。”

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2