人机大战 IBM超级电脑Watson大放光芒

服务器
沃森是一台超级电脑,它是专门为了参加《危险边缘》而设计。沃森是由25个IBM科学家花了4年时间研制出来的。其内存达到15Tb(1T=1240G),有2880个处理器,每秒运算速度达到80T次浮点运算。沃森由两个部分组成,每个部分有五个柜子,每个柜子里有10个IMB生产的POWER7服务器。
2月14日,情人们很欢乐,极客们更欢乐,因为在这一天IBM的超级智能电脑“沃森”第一次参加美国王牌问答节目《危险边缘》(Jeopardy!)。人机大战真实上演。而这场激战之下暗流汹涌,可能隐藏着改变人类未来的巨大力量。

  对阵 人类大战超级智能机

  《危险边缘》是什么?它是美国最流行的知识问答节目之一,题目涵盖了时事、历史、艺术、流行文化、哲学、体育、科学、生活常识等等,而且节奏极快。

  沃森是一台超级电脑,它是专门为了参加《危险边缘》而设计。沃森是由25个IBM科学家花了4年时间研制出来的。其内存达到15Tb(1T=1240G),有2880个处理器,每秒运算速度达到80T次浮点运算。沃森由两个部分组成,每个部分有五个柜子,每个柜子里有10个IMB生产的POWER7服务器。这一系统的平行运算能力对于沃森快速回答问题至关重要。这台超级计算机有10个冰箱那么大,大约要80千瓦的电能和20吨的冷却液。这么一个东西,是如何塞进《危险边缘》的赛场中的呢?答案是,它并不在现场出现,而是被安置在旁边的一个大屋子里。在赛场上,放着一台电脑屏幕。屏幕上面显示着一个地球动画形象,有一些代表信息的光点环绕着它运动。当沃森疾速处理信息的时候,这些光点会增多,相当于“选手在出汗”。

  沃森确实很强,他要面对的人类选手也不弱。在2月14日,沃森面对两个《危险边缘》人气最高的选手:肯(Ken Jennings)曾经在2004-2005年赛季中连续赢了74场,创造了《危险边缘》节目的纪录,赢了超过250万美元;布拉特(Brad Rutter)则创造了《危险边缘》节目最高的个人奖金纪录,奖金数达到325万美元。

  法宝 迅速找到语言关联

  作为一台计算机,沃森在《危险边缘》中要面临巨大的考验,如果计算机有感情,它是会发抖的!在《危险边缘》中,提问都是使用自然语言,而且问句的句法往往很奇怪,里面甚至有双关、反讽以及谜语等形式。计算机能够理解自然语言已经很难了,更何况还回答问题!

  在2月14日的比赛之前,沃森和曾经参加过《危险边缘》节目的人类选手进行了100多次模拟赛,并且在1月13日和肯、布拉特进行了比较正式的模拟赛。

  在模拟比赛中,第一道题是“肯恩斯挖掘了这座《约书亚书》上记载的城市的遗址,发现它的墙被重修了17次。”要求选手回答这座城叫什么名字。沃森在1秒之内就找到了答案:“什么是杰里科”(按照《危险边缘》节目的规则在题目中说“这个某某某”,回答要说“什么是某某某”)。不过,沃森并不能听见声音,但它的摄像头可以看到提示板上的文字,并将其转化成文本。然后,它分析句子,找到关键性的名词、动词。借助强大的计算能力,它可以迅速评估2亿页书的信息,找到最有可能和题目相关联的词汇,如果这个词汇的关联度超过50%,沃森就做出“按钮答题”的决定。在上述题目中,这个关联度最大的词是“杰里科”。

  缺点 理解还是有点机械

  沃森在自然语言的赛场上和人类竞争面临很多意想不到的困难。比如,沃森曾经面对这样一道题目:“这个被信赖的朋友是第一种非奶制的‘奶末’。”答案是“咖啡伴侣”(它多为是植物制的“奶精”,并非奶制品)。如果人类做这道题,那么很快会想到“朋友”对应“伴侣”,从而脱口而出“咖啡伴侣”,但沃森需要在数据库里寻找“朋友、非奶制、奶末”这几个字的关联,结果关联最多的是“牛奶”。

  不过,通过改进,沃森在理解题目和迅速作答的能力上有了巨大的提高。在2月14日的比赛中,沃森开始时一路领先,但后面逐渐被人类反超,最终打成平手。有些题目明显暴露了计算机的缺陷。比如一道题“他的受害者包括伯比奇、疯眼汉穆迪和斯内普,如果你说出他的名字,会更容易抓住他。”布拉特立刻给出了答案:“谁是伏地魔”。就读于北大中文系应用语言学专业、专攻中文信息处理的顾森表示,虽然沃森的数据库里肯定有全套的“哈利·波特”,但是作品中并未直接写出“伏地魔杀了斯内普”字样,需要阅读理解才能知道。这并非机器的长项。

  另一道题是“1904年体操运动员埃瑟赢得了1904年的双杠金牌,他有一个解剖学的奇特之处”。沃森回答说“腿”,结果被扣分,因为正确答案应当是“缺了一条腿”。这也说明了沃森对自然语言理解的不足。

  未来 不止于娱乐用途

  不过与人类选手相比,沃森的优势十分明显,在第二天的比赛中,它一路高歌猛进,取得了压倒性的优势。最终,它更是以巨大的优势赢得了比赛。

  IBM表示,该公司并不想进军娱乐业,所以“沃森”的意义绝不止于在一个电视节目上出风头。在IBM网站上写着:沃森理解人类语言方面的能力,快速处理信息以回答复杂问题的能力,对于让计算机帮助人类处理生意和日常生活的问题具有巨大的潜力。沃森能够让人们可以快速找到复杂问题的特殊答案。这种技术可以被用在医疗以准确地诊断病症,完善在线自助界面、帮助游人和市民寻找关于城市的信息、完善电话客服等方面上。美国《PC》杂志评论说,就医疗方面来说,如果拥有一个类似“沃森”的系统,能够对你的整个病史、家族病史、预算以及所拥有的每一种选择进行分析,便可选择出更为理想的药物。沃森这样的系统能够回答《危险边缘》变态的问题,可能也能看透你复杂的健康状态。

责任编辑:常疆 来源: 51CTO.com
相关推荐

2015-07-31 11:26:26

spark云计算大数据

2011-02-17 09:50:02

IBM超级电脑人机大战

2012-01-13 09:53:09

JavaSUNUbuntu

2013-03-21 11:48:55

eLTE华为

2011-01-14 10:55:59

人机大战IBM

2011-02-24 17:12:48

IBMwatson

2013-09-22 16:50:43

百度校园校园助手开发者

2009-09-23 10:23:49

2013-01-14 09:50:37

IBM超级计算机Watson

2021-08-11 11:17:42

人工智能奥运会机器人

2009-11-13 09:30:47

袁萌Linux桌面Linux

2011-01-26 09:48:04

IBM沃森

2011-02-16 09:06:51

SUSE LinuxIBMWatson

2011-03-29 09:35:20

IBM小型机Power7

2009-04-30 10:22:13

IBM沃森人机大战

2015-12-23 15:54:07

锐捷

2019-08-26 09:47:03

内部威胁防护威胁防护BCS 2019

2013-11-18 10:03:04

IBM服务云Watson

2022-12-10 23:41:10

AI应用设计领域

2011-07-11 09:30:07

IBMWatsonPower服务器
点赞
收藏

51CTO技术栈公众号