奇趣闻 > 数码科技 > \

一个招聘引发的“风暴”:天猫精灵真的要做方言保护了!

原标题:一个招聘引发的“风暴”:天猫精灵真的要做方言保护了!

网商君

当得知自己被任命为“方言保护专项小组”数据库产品的负责人时,聂再清愣住了。这个先后任职于微软亚洲研究院、阿里人工智能实验室的科学家,第一次感受到“茫然”。

他有很多的问题想问,但他的主管,实验室总经理陈丽娟只是兴奋的看着一屋子下属:“这件事情值得做,我们必须做!”

一切的起因来自于一则招聘广告,阿里正在为智能音箱天猫精灵招聘一名“声音模特”,要求很简单:会说四川话,声音好听,开出的价格则高达700元一小时。

这则招聘截图,从四川高校的微信群开始,迅速扩散到了微博上,在不到24小时的时间内两度冲上热搜榜。四川人开始激烈而兴奋的撺掇身边的朋友“发财的机会来了!”外地网友则略带“娇嗔”的在天猫精灵的官方微博下面留言:为什么江西话不能有姓名?

四面八方的意见汇总到陈丽娟的面前:方言的语音优化投入巨大,到底是只做四川话,浅尝辄止成为一个“营销事件”;还是从善如流,真正去做方言保护?一家商业公司做这样的投入值得吗?

意见很多,都有道理。她用最快的速度做出了决策,先不去想困难,问自己这件事值不值得做,只要值得就“使命必达”。一天后,“方言保护专项小组”成立了。

正在马来西亚,对当地濒危华语进行田野调查的暨南大学教授郭熙接到了邀请,阿里希望请他担任专项小组的第一个顾问。此前,他曾建言用科技手段进行方言保护工作,希望阿里能用一千万台智能音箱终端作为方言采集的工具,帮助进行方言保护工作。但他没想到这件事真的能成。

“我第一个反应就是,他们可能不知道这个事情的难度,所以才这么快的下了决定。”郭熙说,对方言的字音调查、听音、记音都需要语言学的专业背景,且要经过一定的培训,“我问他们,你们团队有语言学背景的人才吗?你们打算怎么做?数据这么多,怎么做筛选?”意料之中的,他没有得到回答,但他还是接受了这个邀请,“我想看看,人工智能也许真的有可能做到,这对语言学是革命。”

来自学者的疑问没有打消陈丽娟的热情,“我们一直在做语音交互,但从未以文化的角度来看这件事。它曾经对我只是一项技术,有了方言的加入,它可以成为一种生活。”

方言保护专项小组具体要做什么,除了陈丽娟,其他人都是“被通知”到的。她起草了一份小组工作计划,第一项就是要建立以手机App及智能音箱为终端、以语音交互为采样方法的全国动态方言数据信息网,并设立动态方言库。设立“语保KPI”,针对濒危语种进行动态采集。

此外,还有“在全国范围内逐步开展对方言的语音识别、语音合成工作”“ 开展学术合作,探索对方言资源的保护性开发”等5条计划,每一项都非常难,每一条都可能要花数十年的时间。

这称得上是个雄心勃勃的计划,没人有把握,但都充满信心。“先把四川话做好,很快会公布进一步的消息”AI labs客户体验总经理王万林说,开弓没有回头箭,“既然要做,就要坚持做下去。”

显示全文

相关文章