1. 无忧资讯 /
  2. 全球 /
  3. 智能机器人高考“首秀” 最大弱点暴露 /

智能机器人高考“首秀” 最大弱点暴露

在6月7日高考第一天里,有一位特殊的“考生”开始了它的高考“首秀”。它就是人工智能机器人“AI-MATHS”。AI-MATHS挑战全国二卷数学卷,用时10分钟,成绩为100分,但同时也暴露其答题时的一个弱点,“看不懂题。”

综合媒体6月8日报道,在成都高新区天府新谷园区,在断网断题库的环境下,AI-MATHS用时22分钟完成了北京卷文科数学高考题,成绩为105分(总分150分)。之后,AI-MATHS挑战全国二卷数学卷,用时10分钟,成绩为100分(总分150分),这个成绩接近于此前研究人员为它设定的110分的目标。

参与阅卷的数学老师称,AI-MATHS要考好数学,还得先学好语文(图源:Reuters/VCG)

AI-MATHS的具体成绩是:

北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;

全国卷二选择题55分、填空题20分,解答题25,全卷100分。

在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。

由于高考数学成绩尚未出炉,人们还无法判断AI-MATHS和人类考生相比到底处在什么水平。不过,阅卷老师现场评估认为,这相当于中等成绩水平的高中毕业生。

作为“家长”——成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉指出了“自家孩子”在答题时的一个弱点,“看不懂题。”研发高考机器人最大的难点在于,要让系统准确理解人类语言。

林辉称,“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”

高考数学机器人为何会读不懂题目?对于这个问题,林辉解释,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的情况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”

实际上,为了“AI-MATHS”迅速克服这解题的弱点,准星云学科研团队此前对“AI-MATHS”已进行了500套试卷、12,000道题目的魔鬼式训练。

网友评论

网友评论仅供其表达个人看法,并不表明 51.CA 立场。
x
x