6月12日下午,讯飞输入法在北京举办媒体见面会,正式宣布启动“AI方言发音人招募”公益计划,推动方言留存与传承。目前,讯飞输入法可识别的方言语种有22种,其中粤语、四川话、东北话等方言的识别率超过90%,本月底还将新增苏州话识别功能。
AI技术让输入法更聪明 月底新增苏州话识别
在中国最难的方言排行榜里,苏州话向来榜上有名。“嗯里吗里”(形容做事不爽快)“花好稻好”(形容样样都好)“一刮两响”(形容干脆)……这些都是苏州话中的词汇。江苏电视台公共频道曾报道称,根据一项社会调查结果,6-20岁的苏州本土人士中,能熟练使用苏州话的仅占比2.2%,使用率全国垫底。报道指出,除了普通话普及的影响,苏州话难懂也是造成青少年使用率低的原因。
对人来说都颇有难度,对机器输入就更是如此。而今,讯飞输入法却向苏州话发起挑战。据介绍,为了克服口音的难题,研发团队使用卷积神经网络(Convolutional Neural Networks,简称CNN)等人工智能技术训练输入法,从而有针对性地提升方言语种的识别能力。科大讯飞2017年推出的“方言保护计划”积累了大量的方言数据,为输入法提供了得天独厚的深度学习素材。
科大讯飞消费者BG业务总经理、输入法产品总监翟吉博介绍讯飞输入法的方言识别功能。图自科大讯飞。
自2014年首推相关功能至今,方言识别已成为讯飞输入法的独特标签。科大讯飞官方数据显示,讯飞输入法目前对粤语、四川话、东北话、河南话、天津话等方言的识别率均超过90%,对云南话、陕西话、甘肃话、武汉话、河北话等方言的识别率则超过80%。
在媒体见面会上,科大讯飞启动了“AI方言发音人招募”公益计划。科大讯飞多语种高级研究员祖漪清介绍,随着社会文化的融合发展,主流语言愈发强势,弱势语言却不断衰落甚至濒临消亡。利用人工智能技术保护濒危语言,是一项迫在眉睫的工作。“语言是人类的共同财产,每种语言背后的文化都令人向往。我们做方言识别,几乎没有商业化目的,主要还是出于对人类共同财产的保护和珍爱。” 祖漪清说。
科大讯飞启动“AI 方言发音人招募”。图自科大讯飞。
据了解,“AI方言发音人招募”一方面将与地方政府、广播电视台等机构开展深度合作,寻找发音人;另一方面将在线上发布“方言保护”APP及“我AI说方言”微信小程序,让每一个普通用户也有机会为自己的家乡话代言。
语音识别率提升至98% 一分钟可识别400字
讯飞输入法市场品牌负责人李强军在会上宣布了一个最新数据:截至目前,讯飞输入法用户规模突破6亿,语音输入月覆盖率达50%。
科大讯飞消费者BG业务总经理、输入法产品总监翟吉博介绍,近一年来,讯飞输入法在输入效率和智能化方面取得了长足的进步。他自豪地说,讯飞输入法目前能够做到通用语音识别率98%,比2016年的识别率提升了1%。
尽管只是1%的提升,在技术上并不容易,需要通过多方面的改进来实现。翟吉博说,识别准确率的提升需要克服三个难点,一是使用场景多样化,二是用户习惯,三是中国汉字和文化的特殊性。
“张阿姨说她儿子今年要参加高考。”“王先生说他儿子毕业后就去美国了。”讯飞输入法可结合语境分辨同音字词,现场演示中,前一句的“她”和后一句的“他”均正确显示。
例如,中文里同音不同义的词非常丰富,这对机器而言存在理解难度。所以,讯飞输入法新增多同音词候选功能,在机器不能准确理解语义时,用户可人工选择,使输入更加高效。
目前,讯飞输入法最快可实现一分钟识别400字,还支持多语种实时语音翻译、超长语音输入、耳语输入、文字扫描等功能。翟吉博在会上一一演示了这些功能。他介绍,6月底,讯飞输入法将上线新的卷积神经网络语音引擎,有效优化中英混合语音输入、粤语等重点方言识别、标点判断的准确率,提升用户的语音输入体验。
科大讯飞消费者BG业务总经理、输入法产品总监翟吉博现场演示文字扫描功能。图自科大讯飞。