【CSDN报道2011年,美国一档非常著名的电视问答节目“危险边缘”上,IBM的Watson系统战胜了同场竞技的参赛者。对于人类看似简单的问题,但要让计算机理解,并找到答案就是一个非常复杂的问题,Watson取得了突破。图:潘越 潘越表示:“Watson和前一代的自动问答系统表面上看似一样,都是看到一个问题、一个回答,或者是一个病人的病例,然后给出诊断。但是,背后的处理方法完全不同。前一代的系统是将很多领域的知识或者是专家的知识,通过IT人员变成计算机能够理解的规则,计算机的规则去处理这个问题,给出答案。这样的过程要花费很长的时间。因为前面的工作基本上都是人工的,像一个医学的知识库,可能要用上百个人连续工作来建立。 Watson的不同之处在于它的自然语言处理能力使得它可以直接读医学文献和各种各样的医疗文档,大大压缩了知识获取的时间。不仅是获得这些知识,医学还需要花很多年积累经验,Watson除了知识获取的能力,还具备学习的能力,它可以从医生看病的活动记录中学到相应的经验。这些经验可以提高Watson回答问题的准确度和自信度,这是跟专家系统的区别。” 针对大数据在医疗领域的服务一直是个热门话题,对此潘越给出了自己的看法,他表示:“医疗领域的数据有几种类型,比较完整的是医学影像的数据,像X光、CT等等。比如说如何通过医学影像的自动分析来确定病变的位置,现在有很多放射治疗要对癌细胞的位置进行辐射,范围越小,接受的辐射量就越小,对病人本身的损害就越小,利用大数据的分析方法可以确定这个范围。这个技术现在刚刚产生。第二类数据是电子病例、电子降档案。这类数据的获取还是非常多的,有些技术是基于病人的相似度,比较两个患者的病例,如果相似的话,可以找到一群相似的病人,然后分析有效的治疗手段是什么。目前,IBM已经把它变成了产品。第三个领域是跟基因组学、蛋白组学新的治疗技术相关。这些技术已经发展到了应用的边缘。” 更多提问: 提问:大数据在医疗行业的应用成本会不会很高? 潘越:现在Watson的成本肯定要高很多,Watson参加“危险边缘”的系统回答一个问题电费可能就要十几块钱。当然,不只是电费的问题,它的背后还需要人力进行研发。但好处是建成这样一个系统之后就可以大规模地使用它。 提问:人工智能领域最大的困难是什么?计算机模仿人的思维方式,下一步可能会出现的突破是什么? 潘越:严格来讲,Watson并不是模仿人的思维方式,因为Watson有不同的分支,它可以在结果和行为表现上跟人一样,但内部过程跟人不一样。另外有一个分支是侧重在认知科学,就是神经网络,是希望系统的构造跟人的构造比较接近。这个领域的一些研究很活跃,神经网络现在可能又重新兴起,有很多大规模的突破。现在很多电路设计可以把神经网络的结构用立体的集成电路的方法去实现。很多人都预期这个方面会有很大的突破。这种仿真结构可以用来模仿人和动物的大脑,现在的模仿级别到了猫的大脑的神经元阶段,猫的大脑大概是人的大脑的神经元各数的二十分之一。(文/包研 责编/仲浩)
|