谷歌想用AI帮言语障碍者“说话” ,数据集是最大挑战

  • 时间:
  • 浏览:1
  • 来源:大发uu快3_uu快3是真的吗_大发uu快3是真的吗

7月12日下午消息,近几年AI领域对于残障人士的关注不多,企业和技术专家致力于通过AI赋能信息无障碍。日前在“Google Solve with AI”活动上,Google AI产品经理介绍了Google AI在针对听障和言语障碍患者人群推出的应用新进展和覆盖情况。

据Sagar Savla介绍,目前全球有4.66亿人患耳聋或听力障碍,這個 数字在2055年将会会增加至9亿。听力受损使得亲戚亲戚朋友没办法 与付进 的世界沟通交流,这是人类社会中一项严峻的挑战。

而语音识别(speech recognition)功能Live Transcribe的再次出现,可是我为听障人群解决现实那些的难题。该功能还可不都可以实时自动转录对话,让亲戚亲戚朋友参与到原本无法参与的对话中。

目前,Live Transcribe线程池池运行运行支持超过70种语言,通过在手机屏幕上把现实生活中的语音转录为文本,帮助耳聋和听障人士与他人沟通。

此外,言语障碍患者也是另有一两个 较大的群体。Google AI产品经理Julie Cattiau在接受新浪科技采访时提到,Google今年启动的Euphonia项目,正在通过招募志愿者,积累更大的残障人士语言数据库,希望最终帮助所有的言语障碍患者进行交流。

据悉,该功能通过为言语障碍患者建立语音识别模型,和还可不都可以识别所以沟通辦法 (如手势,眨眼等)的基于计算机视觉的模型,让机器去理解我知道你话的辦法 ,用AI语音技术帮那些患者“说话沟通”。

在活动现场,Julie Cattiau通过一段视频,展示了通过该功能,还可不都可以相对准确地读取出有语言障碍人士的表达。

不过,要让AI甩掉言语障碍患者的表达,也处在一定的挑战。Julie Cattiau在采访中表示,现在一般的语言识别将会有一定量的数据了,有所以人在使用這個 平台。否则在Euphonia這個 项目中,我我觉得没办法 不多人参与,所以有语言障碍的人很少愿意来参与。目前,正在通过招募所以言语障碍患者志愿者,让亲戚亲戚朋友朗读所以词汇,积累表达,原本就能建立所以数据。

“那些数据实际上没办法 没办法 多,我我觉得亲戚亲戚朋友儿在语音识别方面取得了很大的进展,但依然处在原本的挑战”,Julie Cattiau坦言。

语音识别对于患有所以健康情况的人来说是一项至关重要的技术,但所以产品即使在最理想情况下也表现平平。

据了解,通过和那些非营利组织的企业企业合作,Euphonia项目团队需要记录更多患者的声音,否则将那些声音来训练人工智能,从而创建还可不都可以识别那些语音的算法和频谱图。

目前,将会没办法 人派发到足够大的数据集,语音识别技术将会不适用于有语言障碍的人士,而这将是Euphonia着手研究的次责。