AI 大模型技术落地一年多,多模态情感识别挑战赛结果揭晓

   日期:2024-08-02     来源:网络整理    作者:二手钢材网    浏览:181    评论:0    
核心提示:arc06以及北邮和北理工(BUPT-BIT)三个研究团队的多模态AI大模型分获前三名。比赛设置了SEMI(半监督学习)、NOISE(噪声鲁棒性)、OV(开放式词汇情绪识别)三个赛道,共吸引了来自知名高校、科技企业等近百支参赛队伍。

封面新闻记者 欧阳宏宇

AI大模型技术全面落地一年多了,人工智能在感知人类情绪方面发展到什么程度了?

近日,在2024年人工智能国际联合大会上,第二届多模态情绪识别挑战赛(MER24)落下帷幕,在参赛队伍最多、难度最高、竞争最激烈的SEMI(半监督学习)项目中,Soul Al、B​​ZL arc06,以及北京邮电大学、北京理工大学三支科研团队的多模态AI大模型分别斩获前三名。

据介绍,本次大赛主要利用文本、音视频等多模态数据检验AI情绪识别能力,旨在推动相关技术在真实人机交互场景中的应用。NOISE(噪声鲁棒性)和OV(开放词汇情绪识别)三个赛道吸引了来自知名高校、科技公司等近百支参赛队伍参赛。

第二届多模态情感识别挑战赛落幕 Soul北邮北理工等团队入围_第二届多模态情感识别挑战赛落幕 Soul北邮北理工等团队入围_

多模态情绪识别一直是人工智能领域一个活跃的研究课题,其主要目标是融合多种模态来识别人类的情绪状态,让AI“读懂”人、实现富有情感的人机交互成为热点问题,成为学术界和科技界关注的焦点。

以SEMI赛道为例,参赛队伍需要利用少量有标签和大量无标签的视频数据训练自己的模型,并在无标签数据集上评估模型的性能和泛化能力,关键是通过改进半监督学习技术来提升模型的情绪识别性能,比如预测情绪类别的准确率。

作为AI行业新晋热门,AI多模态情绪识别主要体现在对情绪的理解和传达能力,获奖团队技术负责人透露,该技术基于目前平台自研大模型的部分模块,包括提出的微调模型,用于适配视频的情绪识别;利用自学习策略,通过循环标注未标注数据、在训练模型间迭代来提高模型的泛化性能;瞄准模型不同模态间融合的竞争效果,应用于多模态情绪识别领域,提高模型情绪识别准确率等。

“尤其在社交领域,多模态情绪识别技术更是其中重要的一环。”大赛评委会相关负责人表示,社交的本质是情绪的流动,只有能够识别情绪,AI才能更好地理解人性、情绪与感受,实现理想的人机交互。“在社交场景落地的探索上,AIGC有望进一步利用多模态情绪识别技术能力,让AI辅助社交,提升关系建立的质量与效率。构建人机交互的新场景,让用户以更有温度、沉浸感、更有趣的方式与AI互动。”

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2