聋人也能享受音乐节,AI 手语翻译员或成未来新趋势

   日期:2024-07-03     来源:网络整理    作者:二手钢材网    浏览:215    评论:0    
核心提示:这是典型从健听人的逻辑出发考虑问题。其实,这也应该是整个互联网的目标——让手语成为数字世界的通用语言。一个微妙的感受是,无障碍产品似乎很难做得「性感」。打个共鸣的响指吧,让更多人的需求被满足,更多人的能力被增强,让我们得到更多,失去更少。

听障人士虽然听不到或听不清楚音乐,但却能通过手语翻译员极具感染力的手势、表情、肢体语言,感受到音乐的节奏和热烈的氛围。

这或许是听力正常的人们意想不到的手语场景。事实上,线上线下手语翻译的需求场所仍很多,但人多于岗位。

英国女子莎莉·乔克于2002年开了一家手语翻译公司,经过20年的经营,公司规模已颇具规模,预约手语翻译的时间也压缩到30分钟,但她依然不满足。

听障人士能否立即获得手语翻译,就像在视频网站上打开字幕一样?

她的回答是:让人工智能参与进来。

从线上到线下,听障人士应多使用“母语”

2022 年,莎莉乔克开设了一家新的创业公司——,该公司专注于开发生成式 AI 手语翻译软件,将书面文本实时翻译成美国手语和英国手语。

今年5月,其获得200万英镑的种子轮融资,其中50万来自英国政府。

他们瞄准的一个线下场景是火车站和机场等交通枢纽。

美国辛辛那提/北肯塔基国际机场与加拿大航空合作,在屏幕上采用美国手语来提供迎宾、安全、出发、到达等信息。

人工智能是如何工作的?基于大量手语数据集,通过生成对抗网络 (GAN) 和深度学习技术,创建一个逼真的虚拟手语翻译器,尽可能准确地进行翻译。

这些虚拟角色均以真实的手语翻译员为原型,每次商业使用后真人都会获得一定比例的利润。

考虑到机场的目的地、出发时间、站台号码等经常变化,通过结合交通数据,手语翻译可以实时更新。

与此同时,我们也没有忽视线上需求,还为网站和视频流提供手语翻译。

尽管.com和.com等网站都有隐藏式字幕,但听障人士往往更喜欢手语而不是字幕,因为手语具有独立于其他语言的语法结构和表达形式,这将使他们的在线体验更好。

你可能注意到了,当我们谈论手语时,我们会使用美国手语和英国手语这两个术语。就像世界上的口语和书面语并非互相理解一样,手语也是包罗万象的。

据联合国统计,全球约有7000万人以手语作为主要交流方式,全球使用的不同类型的手语有300多种。仅在美国,就有50万人使用美国手语。

所以,我们目前所做的其实非常有限,只覆盖了一小部分使用美国手语和英国手语的人群,垂直场景也有限。在过去的两年里,每天大约有 5,000 个英国手语交通公告被创建。

希望未来他们的服务能够更加普及,拓展到教育等场景,同时也更加个性化,支持用户定制虚拟手语翻译的外观。

当地的环境、土壤决定了当地的AI,国内各大厂商也有类似的手语产品。

AI手语主播已亮相腾讯王者荣耀直播间、华为开发者大会。

面向2022年冬奥会,中央电视台新闻联播与百度智能云栖灵联合打造的AI手语主播上线,天津理工大学聋人人工智能学院参与手语语料标注。

在AI手语主播的背后,百度智能云栖灵的AI手语平台也能满足医院、车站、银行等不同场景的快速手语翻译需求,与英雄所见略同。

更顺畅的出行、更沉浸的观看体验、更加无障碍的服务……

如果说手语翻译的进步空间比海洋更深,那么至少听障人士获取公共信息的方式正在被AI改变,看得见的浪潮正在不断涌现。

手语多邻国

听障人士也需要“听”音乐吗?听障人士只看文字就够了吗?这是典型的基于听力正常人逻辑的思维方式。

其实,我们应该问相反的问题:音乐节如何让听障人士感受到融入?互联网如何让听障人士拥有更愉快的上网体验?

所以,并不是在拥挤的车站多了一个屏幕,而是这个屏幕本来就应该存在。

越来越多的公司和个人正在利用科技的力量让手语更加普及。

一个较简单的想法是让听力正常的人学习手语。

这是一款让用户边玩边学手语的 App,采用 AI 手语模型,由罗彻斯特大学、罗彻斯特理工学院和佐治亚理工学院联合开发,可在 和 iOS 上使用,主要用户群体是听力障碍儿童的听力正常家长。

吸取教训,背单词始于“放弃”,终于放弃。不要播放枯燥的手语视频,而是用小游戏来提升学习手语的兴趣和信心,这和 疯狂催你打卡有点类似。

打破障碍是什么意思__打破产品种类界限

另一家想要成为手语界“”的美国公司是SLAIT。他们也提供沉浸式互动课程和测试。如果你答对了,AI导师会给你实时反馈,并提供适量的情感值。

不过,教授手语只是SLAIT的退而求其次的选择,他们最初想做的其实是一款可以进行实时视频聊天和翻译的AI手语工具。

但好厨子不能无米之炊。SLAIT 是一个小团队,没有足够的数据或资金。教授个别手语单词比直接翻译手语句子要简单,但同样有价值。

手语翻译的艰苦工作就留给了财大气粗的巨头们。

2023年8月,联想巴西开发了基于AI的实时聊天翻译应用程序,用于翻译葡萄牙手语,并计划未来覆盖全球更多手语。

当听力受损的人在设备的摄像头前打手势时,算法会立即将其翻译成葡萄牙语文本并传输给另一端的接收者。

应该有更多这样的工具,可以补充手语教学服务,让听障人士能够采取更积极主动的立场,更有可能成为对话的发起者。

更加注重产品化,已启动2023年AI手语识别大赛。

这次比赛的主题很有意思——基于从听障人士自拍照中获取的300多万个手指拼写字符,参赛者构建了一个利用智能摄像头快速跟踪手指、手掌和人脸的手指拼写模型。

手指拼写是一种使用手指不同形状和位置来表示字母的手语形式,对于许多残疾人来说,这种拼写比在智能手机的虚拟键盘上打字要快得多。

因此,提升手语识别水平、建立手指拼写模型的目的是为了让听障人士能够直接用自己更熟练的手语来使用手机上的搜索、地图、短信等功能,而不必打字说话。

更进一步的是,这还将有助于开发手语转语音的应用程序,打破听障人士无法通过语音召唤数字助理的僵局。

也就是说,很多语音优先的产品从一开始就没有考虑到不擅长说话的用户,是时候堵上漏洞了。

无障碍研究首席产品经理萨姆·塞帕(Sam Sepah)在接受《福布斯》采访时提到,他们的目标是让手语成为使用产品时的通用语言选项。

其实这也应该是整个互联网的目标——让手语成为数字世界的通用语言。

作为一款语言学习软件,为每个人提供了平等的教育机会。而AI手语产品则让人们感觉到不必要的限制正在被解除,每个人都可以分享自己所拥有的东西。

人工智能越强大,我们越需要珍惜人性

5月份,GPT-4o发布时,一段演示视频很感人,GPT-4o充当眼睛,让视障人士能够“看到”周围的环境。

视障人士从AI口中得知,白金汉宫上空旗帜飘扬,河里鸭子悠闲地玩耍,出租车即将抵达,他嘴角也随着AI欢快的语气扬了起来。

俗话说,科技打开了新世界的大门。我们是否可以反过来理解,残障人士原本就生活在一个并非为他们设计的世界里?

据世界卫生组织统计,全球有 4.3 亿人需要康复治疗来解决致残性听力损失问题。手语翻译人员不足。在美国,听力障碍用户与美国手语翻译人员的比例约为 50:1。

所以就目前而言,AI手语还只是起到补充、锦上添花的作用,还没有到“抢饭碗”的地步。

打破产品种类界限__打破障碍是什么意思

上述提到的AI手语产品,基本都是小规模、垂直化、扎根于特定地域,填补了现实生活中翻译人员无法触及的空白。

上个月,我还看到了一款很酷的AI手语产品。

罗格斯大学、卡内基梅隆大学等高校的研究人员将公开手语视频处理成包含8种手语的数据集,并训练出首个多语言手语生成模型。

覆盖多种手语,还能通过文字提示生成手语,那岂不是很方便?不过研究人员表示,外界不要过分夸大他们的研究成果,演示视频并非模型的直接输出,实际制作起来还是很麻烦的。

与此同时,听障专家也站出来表示,这些视频中的手语翻译质量参差不齐,有的翻译一半听不懂,有的完全听不懂,而且缺乏面部表情。该项目有潜力,但需要改进。

最重要的是让听障用户参与进来,表达自己的意见,共同努力完善产品,因为“没有我们的参与,就没有关于我们的决定”。

一个微妙的感觉是,让平易近人的产品变得“性感”似乎很难。

它们往往不像大型模型、AI硬件的发布那样让人兴奋,总是告诉你它们有什么功能、为谁服务,并希望它们未来能做得更好,而不会贪多嚼不烂。

并且在风险投资家眼中,它们也是小众的,有未知的潜力,也未必有投资回报。

但“AI教母”李飞飞曾说过,AI是为了帮助人类的,AI越强大,我们越要珍惜人性。

没有人应该担心错过航班,每个人都应该能够与产品互动,每个人都应该能够享受音乐节。

那些曾经看不见、听不见的事物,也应该被科技的光芒照亮,让我们一起弹指一挥,产生共鸣,让更多人的需求得到满足,让更多人的能力得到提升,让我们多一份收获,少一份损失。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2