当前位置:首页 > 未分类 > 正文

为了他们能听清,腾讯免费开放一项技术

admin 发布:2024-10-17 06:03 40


01

用腾讯会议开会,能够听得非常的真切清晰。

这是因为,它嵌入了新一代实时音频技术——腾讯天籁技术。

不料,这项技术背后的团队,在“不务正业”的路上越走越远:

听障人士即便安装了人工耳蜗,依然面临“听不清”的困扰。

于是,团队成员想——

为什么不把腾讯天籁技术用在人工耳蜗上呢?

经历九九八十一难之后,事儿成了。

9月27日,腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会,宣布发起“天籁行动”。

未来,腾讯将免费开放腾讯天籁AI音频技术,让更多公益开发者、设备厂商、NGO及行业共享这项技术,一起帮助听障人群解决“听不清”难题。

02

从听不见到听见的距离,可能只是一副人工耳蜗。

人工耳蜗是一种电子装置,可将声音转为电子信号,通过刺激听神经来恢复或重建聋人的听觉功能。

qq技术_qq技术_qq技术

但听得见,并不意味着听得清。

两年前,顺德女孩晓婷装上了人工耳蜗。

外界看来,听见声音已经改变了这个女孩的命运——

她在央视舞台上翩翩起舞,她变得自信、勇敢,未来开始充满无限可能。

来给晓婷拍纪录片的导演,想要知道听障人士的听觉体验,所以,他做了一个实验。

现场三个女性、四个男性分别说句话,让晓婷选出“最好听的声音”。

一圈下来,晓婷摇摇头。她说,只能听出男生的声音是粗的,女生的声音是细的——其它好像没有不同。

导演沉默了。

业内常用“就像走进雾气弥漫的澡堂”——这样一个糟糕的视觉效果,来比喻听障人士的听觉体验。

(戴上耳机体验效果更佳)

听障人士不仅难以辨别各种声音,而且,他们还不能屏蔽噪音。

这是因为,人工耳蜗绕过了外耳和中耳,直接刺激内耳,使得人的生理降噪能力无法派上用场,降噪能力有限。

比如菜市场里,各种声音此起彼伏。当一个听觉正常的人,到一个菜摊前买菜时,他能够自动屏蔽喧闹的背景音,听清楚菜摊老板的话。但听障人士不可以。

因此,降噪问题是人工耳蜗生产厂家所面临的技术困境之一。

而降噪,恰恰是腾讯的优势。

03

让腾讯会议用户“听得清”的AI降噪技术,能否也让听障人士“听得清”呢?

只有想不到,没有做不到。

今年初,腾讯找到了国内最大的人工耳蜗厂商之一——诺尔康,一起讨论解决方案。

目标很清晰——

第一,解决降噪问题。

第二,针对不同场景,降噪的对象和幅度不同,因此,需要实现场景识别和自动切换。

围绕这两个问题,腾讯提供了数套AI解决方案。

诺尔康的任务则是,将这些技术装在诺尔康的产品上,交给听障人士试用,给出测试效果。

有了问题就接着改。

在腾讯多媒体实验室高级总监商世东的印象里,半年时间里,中间反反复复、来来回回做了很多优化工作,至少迭代了有七八个版本。

当时还有另一个问题产生——人工耳蜗个儿太小,没有足够的空间运行这套AI降噪技术。

于是,大家想到了手机,并确定了“手机伴侣+人工耳蜗”的解决方案。

用上天籁AI音频技术的人工耳蜗,效果怎么样呢?

据诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,语音识别性能大幅提升,对于改善听障人群听觉体验有着积极效果。

——平均识别率达到96.28%,其中带噪语音识别率为93.38%,环境噪音中声音识别率达到94.24%。

——在手机App中植入天籁技术,手机双麦阵列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5。

晓婷也试用了这套技术。

晓婷妈妈说,以前要在晓婷耳朵边说话,她才能听到,现在,家人站在客厅跟卧室里的晓婷说话,她也能听见。

qq技术_qq技术_qq技术

04

歌手周深作为公益大使,呼吁全社会关注听障人士身心康复,构建信息无障碍环境。

qq技术_qq技术_qq技术

腾讯开放AI音频技术,是一次公益行为,没有商业诉求。

中国有2780万听障人士,其中550万适合做人工耳蜗手术,真正装上耳蜗的不足5%。

“我们希望,将来这个技术能被越来越多的人工耳蜗厂商所使用,能够提升他们的人工耳蜗在实际使用过程当中带给听障儿童的体验。”商世东说。

“天籁计划”是“科技公益互助计划”的首个落地场景。

(“科技公益互助计划”由腾讯公益慈善基金会于今年99公益日正式推出,旨在凝聚社会各界科研和技术志愿者,共同探索公益慈善的数字化创新,推动实现社会的可持续发展。)

qq技术_qq技术_qq技术

0


暂无评论,欢迎抢沙发
欢迎评论