IBM Watson——一台更加灵巧的机器

原创
服务器
要说起最近IT业界发生的新鲜事,那么在美国最流行智力问答节目《危险边缘(Jeopardy)》中,基于IBM Power750的“沃森” (Watson)以大比分战胜有史以来该节目最厉害的两位人类高手肯·詹宁斯和布拉德·鲁特,可谓是人机大战历史上“里程碑”般的的事件。如何让计算机做到在3秒钟内理解人类的语言,并从上百万本书的海量内容中寻找出正确答案?新春之际, 参与Watson项目的研究的IBM中国研究院资深经理潘越,与IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒给出了答案。

(51CTO记者北京报道) 要说起最近IT业界发生的新鲜事,那么在美国***智力问答节目《危险边缘(Jeopardy)》中,基于IBM Power750的“沃森” (Watson)以大比分战胜有史以来该节目最厉害的两位人类高手肯·詹宁斯和布拉德·鲁特,可谓是人机大战历史上“里程碑”般的的事件。如何让计算机做到在3秒钟内理解人类的语言,并从上百万本书的海量内容中寻找出正确答案?新春之际,参与Watson项目的研究的IBM中国研究院资深经理潘越,与IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒给出了答案。

Watson的智慧

“Watson”的命名来自于IBM 创始人 Thomas J. Watson (老Watson),项目则启动于4年前一个来自酒吧的想法“如果让计算机参加Jeopardy并与人类进行智力竞赛,会取胜么?” 潘越说。一个由来自美国、中国、日本、以色列的25位IBM 科学家共同组成了国际化的团队,其挑战目标是成为一个能够与人类回答问题的能力相匹敌的计算系统,要求具有足够的速度、精确度和置信度,并且使用自然语言回答问题。这包括IBM中国研究院的6位研究员,主要负责用结构化的信息来帮助Watson提高回答问题的正确性。

 [[20364]]498)this.width=498;" height=450>
IBM中国研究院资深经理潘越

 对于Watson如何解答问题,潘越表示,作为一个机器的参赛者,Watson能够取胜取决于四个方面的指标:一、对回答问题的覆盖率;Watson内部有1百万本书的知识量,这大约是2亿页的内容,可以覆盖;二、正确率,Watson能够对回答判断可能的正确率;三、信心,与正确率相关,这决定了Watson会不会按照此答案去强大;四、速度,Jeopardy抢答的规则是每次上一轮答对题的那个人在选择题目之后,所有的选手都可以看到题板,Watson则通过同时传来的一条文本进行思考和解答,通常主持人念题目大概需要三到五秒的时间,人会利用这时间去思考,Watson也是利用这几秒钟的时间去思考,等主持人话音一落就开始抢答。

由于计算机与人脑在思维方式上的区别,对于问题的思考速度需求也显得尤为关键,潘越说,仅在三至五秒中,Watson首先是对这个问题进行深度分析,比如对语法的分析、数量词使用,从而确定答案的类型是什么,是一个人,更具体的说是一个总统?还是一个地名。
第二步,Watson会把分析里得到的这些关键词放在一个特殊搜索引擎中搜索,不仅仅要找到它所在的文本,而且要找到它所在的段落,从而将一个段落或者几句话提炼出来。
第三步,根据要求的答案类型,在段落中把具体答案选择出来,这还不算结束,因为这并不肯定是正确的,所以还要为答案找新的证据,所以又要去重复这三个步骤,再进一步做分析。
拿到这些证据后,通过一个思维模型为这些答案评估打分,之后Watson会根据得分高的答案,判断它的正确率后执行抢答按钮再向外输出答案。

如果对问题的语句就有多重理解,对于人类来讲,可能会选择其中一个,但是对于Watson来说,则会把这几种理解都保存,有些相关语有很多解释,Watson则会将每一种解释都保留,而每一种理解可能要找出10个答案,这也就涉及到成千上百个证据,再经过评估与计算模型的演算,才能生成最接近于正确的答案。潘越认为这就是正是Watson与搜索引擎的根本区别,基本上搜索引擎之列举与关键词被访问***的网页,而Watson则需要理解语句的正确含义并找到最接近于正确的答案,这也就决定了Watson需要超高速度的计算处理能力。

#p#
Watson与Power

历史上众多人机大战中都能看到IBM的影子,正是凭借1997年的“深蓝”,IBM的计算机们***次在人际大战中战胜了世界象棋冠军卡斯帕罗夫,这台重达1.4吨由IBM RS/6000 SP系统每秒可以思考2亿步棋局,并熟读棋谱。 而Watson以77147分完胜人类选手(肯·詹宁斯24000分,布拉德·鲁特21600分)则依靠的是基于IBM Power7技术的工作负载优化系统与刚才提到的Watson的“方法论”DeepQA技术。

 [[20365]]498)this.width=498;" height=450>
IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒

 Watson是由10台IBM Power 750服务器组成的计算集群,运行在Suse-LINUX操作系统,内存为15TB。 这台可以为工作负载优化的系统每个节点都装有四块频率为 3.55GHz的POWER 7芯片,每芯片均为8核4线程,总计包含了2880个Power 处理器内核,浮点计算速度高达80TeraFlops。采用UEMA-AS架构,有着良好的横向扩展能力。

目前市售的Power 750服务器已经在全球广泛地应用于处理复杂的分析和交易两种不同的工作负载,交易处理可以被想象成针对固定数据而采取的行动,这类工作负载主要靠缓存子系统,重点在于定位正确的信息。在缓存、内存和存储中,潜伏时间是最重要的;而分析工作负载更多地侧重数据之间的变换,在分析过程中,数据会迅速地在系统中移动。因此在分析系统中,带宽是最重要的。POWER7对于两种不同的工作负载来说都是***的运行平台。


从目前展示出的测试指标来看,IBM Power服务器在交易处理方面的性能一直处于行业领先,因此Watson最令人兴奋的地方还在于它非常清楚地展现了Power 服务器的商业智能性――虽然分析处理还是相对新的工作负载,但已经迅速变成许多机构和企业的关键业务。在《危险边缘》中,每个问题都需要Watson从海量信息中进行全面筛选,在这一点上,与其他任何商业性的智能信息搜索指令都是相通的,而Watson与网络搜索引擎不差异在于,后者是根据受欢迎度和页面排名来展现和答案可能相关的资源,而非提供答案本身,用户仍然需要分析这些建议,并自己决定哪个是***答案。

同时运行IBM POWER 7优化工作负载集群上的几千个处理器,并与此同时确保大容量内存的技术是最近才出现的。Watson正是利用高通量处理器更好地管理海量数据的实例,其迅速分析并处理海量信息、帮助客户更加准确地调用数据的能力,对中国的各行各业都有着广阔的应用前景,尤其是应用在需要分析并筛选海量数据、根据答案的可信度进行排列从而帮助决策的实际工作情景中,如准确高效地辅助医疗诊断,为游客、市民提供道路信息并帮助城市智慧地管理交通、帮助企业分析客户行为与需求等等。

IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒表示:“作为世界上***家百年IT企业,IBM一直是全球IT技术的***,并推动人类不断攀越新的高峰。从‘深蓝’国际象棋大战的胜利,到‘Watson’在问答(也称为‘Q&A’)科学领域取得的突破性创新成就,都以强大的Power 服务器作为支撑平台――‘深蓝’的成功得益于Power2大规模的并行计算能力,而‘Watson’则充分体现了POWER7海量计算与实时分析工作负载优化系统的特性。IBM服务器这些里程碑式的研究成果再次让人们看到:计算机在帮助人类更好的生活与工作、建设 ‘智慧的地球’方面,所蕴藏的无限潜力和不可估量的重要意义!”

#p#
Watson:一台更加灵巧的机器

从1997年与***大师的象棋大战的“深蓝”开始,计算机用高超计算速度开始步入到以往只属于人类的竞技世界当中,那时的“人机大战”仍可看作是芯片工业日益进步所带来的结果,因为,总的来数计算机采用的是穷举法来计算国际象棋在8乘8的格子空间内的“战争”,而至今人机大战仍不涉及中国围棋的19乘19的黑白天地,很大的原因就是因为产生的比之国际象棋增加的若干数量级的计算量是迄今为止的计算系统无法迄及的。

相比之下,一个体重不过100公斤,吃粗茶淡饭即可下棋的围棋国手比起重达数吨需要几十千瓦电力支持的计算机,至少要“绿色”很多。而这些人类头脑虽无法每秒计算上亿步棋局,但能更擅长的就是“智慧”。潘越表示,比起过去与人类智慧竞争的计算机,Watson***的进步在于能够树立若干证据并作出评估,潘越笑称,Watson知道自己不知道,有时候尽管知道答案,但是不去抢答,这就是由信心指数来控制的结果,也更接近于人类。

商业社会的驱动力最终仍是商业,在与最棒的智力问答选手较量的同时,对于Watson商业化也在紧锣密鼓的研究,***可能落地的是有着完整规则与答案的医疗、法律、保险等相关领域的呼叫中心,“Watson”系统可7×24小时的值守,并帮助解答问题。好消息是,这一切仍可能基于开放式架构的Linux系统,硬件平台则可采用Power或开放式的IA架构。

而对于工作负载优化的Power7系统,美国赖斯大学已经应用在提高基因组测序、蛋白质折叠与药物建模的数据并行处理上;加拿大的海关经济公司GHY国际,也使用Power7来管理日益扩大的国际贸易服务及咨询业务,并降低通关时间与成本。而国内的Watson应用也在通过天工计划——IBM 的ISV扶植项目来落地中国,韩忠恒希望,在IBM百年华诞的2011年,有更多的中国企业分享象沃森一样计算能力的系统――Power 服务器。

看来,Watson——这台更加灵巧的机器正在接近我们并帮助改变我们的生活。


【责任编辑:常疆 TEL:(010)68476606】

 

责任编辑:常疆 来源: 51CTO.com
相关推荐

2013-07-08 15:16:25

2021-05-08 17:05:39

计算机程序操作系统

2009-09-22 18:26:14

运行多个JBoss

2018-09-27 10:47:45

机房计算机DNS

2014-03-25 21:22:36

IBM论坛Watson云计算

2016-11-28 14:45:00

IBM

2010-11-22 09:29:31

宕机检测分布式

2011-07-11 09:30:07

IBMWatsonPower服务器

2011-05-16 10:58:06

MySQL服务器

2022-11-02 07:27:06

Java版本管理

2017-05-31 10:27:25

戴尔教育云

2021-06-27 17:41:41

云服务器云主机服务器

2011-02-24 17:19:40

IBMwatson

2011-02-16 09:06:51

SUSE LinuxIBMWatson

2011-01-04 16:35:52

机器语言

2010-08-31 10:13:25

DB2安装Linux

2020-06-29 12:36:04

RPA应用UiPath

2019-07-24 08:56:13

机器狗人工智能系统

2013-03-07 09:12:41

巨型电脑云计算

2012-03-16 17:00:09

点赞
收藏

51CTO技术栈公众号