研究人员推手语转文字 AI 翻译器,帮助听障人士正常交流

人工智能 新闻
巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究人员开发了一种将手语翻译成文本的新工具,以给予听觉障碍者更多包容性和可及性。

5 月 25 日消息,巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究人员开发了一种将手语翻译成文本的新工具,以给予听觉障碍者更多包容性和可及性。该工具利用人工智能技术,包括自我注意机制和更快的吞吐量,以更准确地理解手语者的姿势并产生准确的文字转写。

▲ 图源 Arxiv

该工具基于 How2Sign 数据集,这是一个公开可用的大规模、多模态和多视图数据集,包括 80 小时的美国手语教学视频和相应的英语文字记录。该数据集由 BSC 和 UPC 发布,用于训练模型,以便将手语转换为文本。研究人员使用膨胀式三维网络(I3D)对数据进行预处理,这是一种视频提取方法,可以对视频进行三维过滤,直接从视频中获取时空信息。并使用了一个转化器式的机器学习模型,与 ChatGPT 等其他人工智能工具背后的模型类似。

▲ 图源论文《Sign Language Translation from Instructional Videos》

该研究的主要作者 Laia Tarrés 表示:“我们开发的新工具是以前发布的名为 How2Sign 的出版物的延伸,在那里,训练模型所需的数据被公布。利用这些已经可用的数据,我们开发了一个新的开源软件,能够学习视频和文本之间的映射。”

研究人员发现,他们的模型能够产生有意义的翻译,但仍存在改进的空间。该工具尚处于实验阶段,研究人员将继续努力,以创建一个能够与无听力损失者使用的技术相媲美的工具。

Laia Tarrés 同时表示:“这个自动手语翻译的开放工具是对关注无障碍环境的科学界的宝贵贡献,它的发表代表了向为所有人创造更具包容性和无障碍的技术迈出的重要一步。”

责任编辑:庞桂玉 来源: IT之家
相关推荐

2023-06-14 15:53:53

人工智能深度学习医疗健康

2020-11-19 15:21:26

人工智能

2023-02-16 20:24:07

OpenAI谷歌ChatGPT

2022-05-30 15:31:24

自动驾驶人工智能信号灯

2021-01-04 05:46:00

AI人工智能深度学习

2022-03-23 15:26:00

AI机器人研究

2021-02-02 09:32:06

黑客攻击l安全

2021-05-12 11:06:26

攻击AirTag破解

2021-05-28 18:35:29

NVIDIA

2024-03-28 08:00:00

人工智能多模态语言模型

2017-03-27 16:09:58

2023-09-21 08:23:07

2014-08-25 11:06:42

2021-08-31 05:56:43

处理器芯片神经网络

2021-03-02 09:42:25

跟踪器密码管理器密码

2013-10-23 11:49:51

浏览器安全微软谷歌

2015-03-10 11:12:42

2021-04-08 20:14:41

SQL流程设计
点赞
收藏

51CTO技术栈公众号