搜狗超越微软成CoQA新纪录保持者,阅读理解能力可媲美人类
原标题:搜狗超越微软成CoQA新纪录保持者,阅读理解能力可媲美人类
2019年1月3日,搜狗搜索人工智能研究团队在对话型机器阅读理解挑战赛CoQA(Conversational Question Answering Challenge)中全面刷新所有评价指标成绩,以总成绩82.8%夺得第一。
CoQA是面向建立对话式问答系统的大型数据集,挑战赛的目标是衡量机器对文本的理解能力,以及机器面向对话中出现的彼此相关的问题的回答能力的高低。与业界所熟知的机器阅读理解评测SQuAD相比,该挑战赛集中的问题不再是单轮的一问一答的形式,而是扩展到多轮的对话交互;SQuAD 中约一半都是what型,该挑战赛问题种类更多;SQuAD中没有共识推断,该挑战赛几乎每组对话都需要进行上下文理解推断;SQuAD中所有答案均可从原文本中提取,该挑战赛中这一比例仅为66.8%。2018年8月,CoQA挑战赛正式启动,吸引了众多国内外知名研究机构和高校,其中包括微软、艾伦研究院(AI2)、斯坦福大学、清华大学COAI实验室、北京大学、复旦大学、北京邮电大学、中国科技大学等。
图1:CoQA挑战赛最新成绩榜单(截至2019年1月3日)
1月3日,搜狗研究团队凭借BERT + Answer Verification(单一模型),全面刷新CoQA所有评价指标,以总成绩82.8%进一步缩小机器与人类在该数据上的平均水平差距。据悉,搜狗的算法模型能综合考虑答案抽取和证据对答案的支撑作用,同时融入对话历史的问题和答案信息,极大提升了对当前问题的理解和回答的准确性。
图2:CoQA阅读素材
图3:CoQA问题与答案
让机器掌握阅读理解能力究竟意义何在?搜狗一直坚持探索以语言为核心的人工智能战略,相信搜索的未来是问答,而机器阅读理解是现今问答技术发展的核心之一。在AI技术的实用化方面,搜索走向问答将会在一些专业领域产生颠覆性的效果,如医疗、法律领域。
目前,搜狗已经将相关技术应用于产品及业务中。在医疗领域,搜狗明医智能自诊分诊功能,首创引入了基于人工智能技术的智能诊断助手,模拟医生与病人对话的模式与用户进行病情沟通。在法律领域,搜狗大律师的问答机器人具备逻辑分析和推理能力,在递进式问询过程中,挖掘判决书中的结构化数据,帮助用户理清已发生的事实,并在充分、准确理解用户法律诉求的基础上,给出可能的判决结果、法律建议或相似案例。
此次AI技术的突破,为搜狗更多AI技术的实用化奠定技术基础,也意味着搜狗在人工智能赛道上将继续保持其固有领先优势。
相关文章
-
瑞幸北京裁撤80家店,今年要关掉近五分之一
-
早报:天猫双 11 再破新纪录;三星 Galaxy S10 曝光
-
谁是新零售领跑者?这份2018新网商大奖入围榜单告诉你
-
导航App在让城市交通变得更拥堵
-
一个月卖出64万笔,专救傅明、翟天临
-
Phala(PHA)里评分是用来干什么的?如何选择Phala(PHA)硬件?
-
联合调查组进驻权健集团核查;微博回应成都研发部门被裁
-
如何申请icloud账号
-
Snapchat:我一个社交平台,竟然被你当相机玩?
-
全球零售业最高奖项为何颁给阿里?
-
电商经营登记意见昨日公布,微商“裸奔”时代结束
-
小罐茶:左手天堂,右手地狱
-
焦点分析|把直播放进微信后,腾讯想通过带货和朋友圈广告赚钱
-
智能物联 链接未来 2018中国(广州)物联网产业论坛圆满落幕
-
江浙沪+皖,长三角9城市地铁实现“一卡通”
-
iPhone销量不佳实锤!苹果最新财报公布:中国市场遭重创
-
禁跳转、防广告,Safari装插件后真的太香了。
-
苹果手机怎么弄字幕(苹果手机隐藏式字幕怎么用)
-
携程回应「大数据杀熟」并致歉;特斯拉全球价格将涨3%;蚂蚁金服:无上市时间表
-
马化腾终于回应“腾讯没有梦想”:数据不能任意打通
-
ofo总部被退款用户占领 兵临城下戴威该如何应对?
-
微信:对发布“违法违禁品”售卖信息的帐号进行阶梯式处罚
-
中国移动如何发短信实名认证
-
京东零售首席科学家胡鲁辉:人工智能与大数据的融合之道丨CCF-GAIR2019
-
苹果手机有锁和无锁的区别
-
视频行业如何发展?这份财务报表指出了三个趋势
-
第一次写小说,经常卡文
-
微信视频号开启内测:这就是张小龙说的短内容
-
涉嫌贪腐 铁打的杨伟东失守“太子”之位