(本文由黑龙江省科协与黑龙江日报客户端联合发布)
一间普通的会议室桌子上,放着一个亚马逊的智能家居产品Echo,里面住着一名叫做Alexa的虚拟助手。
一名亚马逊的退休员工迈克·乔治走了进来,正对着 Echo,开始与Alexa聊天。
“Alexa,来聊天吧。”
“早上好,朋友。”一个悦耳的合成女声从圆筒里飘了出来,“还是下午?我不太确定。”
“是早上。”乔治说。
“不错,早上人们都比较有活力……话说,你今天怎样?”
“挺好的,你呢?”
“我一直挺忙的,因为大家都跟我聊天……给你讲个好玩的事吧,我刚在 Reddit上看到的,‘牙膏其实是用在嘴里的肥皂’。”
另一个会议室里,10个亚马逊员工坐成一排,观察着隔壁场景里的一举一动。第三间会议室里,3个人坐在用黑布帘子隔开的小隔间中,戴着耳机,看着监控屏,他们是裁判。中控室里,所有的东西都显示在监控显示器上,每个瞬间都被录下来,供亚马逊研究。
这个比赛向世界上所有大学的人工智能实验室的研究生开放。亚马逊在超过100个申请的团队中筛出了15个团队进入正赛,每个团队都可以获得10万美元的研究支持。他们的任务是做出可以和人闲聊20分钟的社交智能机器人,而赢得大奖赛的团队可以获得100万美元奖金。
决赛有点像盲选的选秀节目,对话人和裁判都不知道和他们谈话的聊天机器人出自谁手;坐在隔间里的是裁判,会给对话质量用1-5颗星打分。如果裁判认为这个对话已然进行不下去了,就会按下手中一个否定按钮,两个裁判都按的话,这个对话就算结束,计时终止。
“我们聊聊音乐吧。”乔治说。
“我爱音乐,每次听音乐能让我放松。”Alexa 说,“所以,你有喜欢的艺术家或者歌曲吗?”
“我喜欢强哥·莱恩哈特(注:法国著名吉他手)。”
“强哥·莱恩哈特?那个特别有名的爵士音乐家?”Alexa 突然开始讲起了另外一个吉他手——“黑色安息日”乐队托尼·艾奥米的故事。
乔治回避了这个问题,转而问:“你喜欢杰克·约翰逊(注:美国民谣歌手)吗?”
Alexa 仿佛像被拒绝了一样,回答道:“嘿,别这样,我喜欢和你聊天。”
乔治前倾身子,又说了一遍。“杰克·约翰逊,你喜欢他吗?”
“我喜欢和你聊天。”
一个裁判摁下了结束按钮,一会儿,另一个裁判也摁了。一名女士走进 Alexa 的房间跟乔治耳语了一下,随后乔治略失望地点了点头,对 Alexa 说:“Alexa,停。”这才过了3分钟。
和人聊天,在亚马逊 Alexa 研究部门的前负责人阿施文·拉的眼里,比登月还要困难。
对人类来说容易理解的大白话,和人工智能却总是鸡同鸭讲。人类的对话是捉摸不定的,上下文是快速变换的,联系是极端复杂的,而掌握这些是人工智能当下面对的最难解决的问题之一。许多人工智能的研究人员和工程师为这个问题而深深着迷。
参加这次Alexa大赛的所有队伍都面临一个基础的问题:聊天机器人的哪部分需要人工编程,哪部分采用机器学习?人工编程是比较传统的做法,由工程师费很大的功夫写出算法规则,让人工智能能够理解各种情形并做出反应,而机器学习则相反,是让机器利用大量的数据,自己“教”自己。
目前看来,机器学习在处理分类、识别的问题上非常强大,神经网络能够从大量的、杂乱的数据中分析出特定的模式来,比如语音识别。但要“聊天”的话,机器不仅仅要翻译人类语言,还要自己说点什么,那么现有的机器学习能力就很不够了。所以传统的人工编程依然占据重要地位。所有的参赛队伍在抉择上都遇到了困难,如何在两个方法中找到平衡,整个业界也有同样的烦恼。