【CSDN现场报道第五届中国云计算大会于2013年6月5-7日在北京国家会议中心拉开帷幕。本次大会以国际视野,洞悉全球云计算发展趋势,并从应用出发,探讨云计算与大数据、云计算与移动互联网、云安全及云计算行业应用等焦点话题。大会还特别设立了云计算服务展示区域,交流国际云计算最新研究成果,展示国内云计算试点城市发展成就,分享云计算发展经验,促进全球云计算创新合作。
中国电子学会云计算专家委员会候任主任委员、中国科学院院士 怀进鹏
在第五届云计算大会第二天的演讲上,中国电子学会云计算专家委员会候任主任委员、中国科学院院士怀进鹏发表了名为《大数据及大数据的科学与技术问题》的主题演讲,怀进鹏首先指出了IT发展理念――多快好省。而在过去的二十年里,计算速度和存储容量由于微电子的发展,CPU的性能提高了3500倍,但内存和硬盘的价格却下降了45000倍和360万倍。由于带宽等成本的不断降低,并超过摩尔定律时,数据的处理也从本地走入了网络。而这几年出现的热点技术中,云计算无疑很符合这个定律。
随后怀进鹏剖析了大数据的4个V,他指出大数据不只是海量的数据,拥有了海量数据后,并且有能力进行处理和分析,挖掘出数据的价值才可以获取数据的价值,从中获取真知。除此之外大数据还会给我们带来一些二次价值,从理念上改变我们的数据的认识,我们更需要获得的是一种趋势,一种预测。
以下为现场实录:
非常高兴有机会和各位嘉宾一起分享我对大数据这方面的理解和认识。也许有些内容太技术或者理论化,我旧能简单一些。
云计算形成的先决条件
大数据已经成为非常热闹的一件事情,我这次主要跟各位交流当前互联网大数据以及对未来问题的一些思考。
信息技术从应用来看有一个信息流,从获取、传输到计算存储,到最后的使用。在过去的发展过程当中,摩尔定律催生了微电子的快速发展,实际上是通过预测来进一步推动技术的变革。还有一个是吉尔德定律,讲的是主干网带宽每六个月增加1倍,每比特的费用将趋于零。
在计算和存储方面,在过去二十年里,计算速度和存储容量由于微电子的发展,CPU的性能提高了3500倍,但内存和硬盘的价格却下降了4.5万倍和360万倍。在这样的带宽逐渐变得越来越廉价的时候,通讯的带宽远远超过摩尔定律的时候,单机就进入了网络计算,离线就进入了在线时代。这是一个非常非常大的变化。
云能给我们带来什么,为什么要使用云
为什么要有云,为什么会有这样的大数据?当我们上网获取信息资源变得越来越低成本的时候,现在通讯带宽发展进一步超越摩尔定律的时候,就使得互联网的应用进入了第二次价值挖掘。单机进入网络、离线进入在线,使得终端方面的维护和系统的维护开始进入了新的时代。我们不需要知道服务方在哪里,只需要关注我们需要获取的服务和相应的资源。
由于互联网的应用,特别是web2.0,不仅从过去技术单向交流的方式开始进入了双向交流的时代,也进一步加速了互联网的发展和新能力的创造。
计算模式的演变
过去互联网模式走过三个典型的时代,主机时代到网络计算时代再到现在的云计算。我们全当把它叫做虚拟的网络计算环境,我们是从封闭可控的平台进入了开放和没有集中控制的网络环境。到最终未来的发展当中,在宽带不断发展、微电子的价格不断下降,而资源获取能力增强的时候,就出现了计算模式的新变化。我的理解这是一种计算模式由于带宽和成本的不断变化所导致的新的一种计算模式的变化。
- 如果说过去我们理解在八十年代出现了第一次计算机变革,那是由于PC时代造成的,也就是软件第一次成为商品,开始通过购买copyright作为看不见的商品在市场上流行。
- 到九十年代出现互联网有效规模的应用,就成为信息获取和信息交换的平台。
- 第三次的时候,是不是这种计算模式正在推动我们进入新的前所未有的从量的积累到质的变化的时代,我们都在拭目以待。
对于任何一个IT领域的技术和产品,时间的开放窗口并不长,比如像PC、手机和互联网,一旦形成技术的标准或一定规模的成熟,对于追随者就再也没有机会了,或者只能处于它的旁观者。
这几年出现了很多非常热,也非常有效的方式:
1. 先谈云计算,它对我们在如此高速的互联网发展过程中,对提升高端计算的利用率和应用性、提升低端计算的事务处理能力和服务的能力,都会有重要变化。也许这种计算模式会进一步加深我们对这方面的理解。
2. 第二类,也是由于交互行为的技术支持,社会网络或者社交网络也有了很大的变化,大家都很清楚,像Facebook、人人网,以及现在的上网规模,都在不断变化。
3. 这里面还有另一类,就是我们生产控制系统、嵌入式系统、传感器所传递的系统,给我们带来了很多新的更重要的一类应用模式。当然,科学计算永远是大数据产生的基础。
但是,不论是从商业、工业,还是科学计算以及现在我们说的社会计算,给我们带来了新的问题,就是互联网二次价值的开发和新的挑战会在哪里?云计算作为一种计算模式,正在引领我们实实在在地发挥着作用,云计算背后要处理在现实应用当中或者是实际需求中的问题,人们提出大数据也是其中一个选择。
何为大数据,它给我们带来了什么?
1. 大数据的4个V
对大数据有很多说法,从外显特征来看,简单叫做4V或者5V,从规模和变化频度以及种类和价值密度的角度。维基百科也对大数据给出了外在的定义,它的数据是很大的,但现有的方法是处理不了的。对于大数据,不能简单看它就叫做一个数据,更重要的是它代表了数据从量到质的变化过程中,我们如何面对。所以它已经不是过去我们说的大批量数据、海量数据到大数据,不是简单的从量的规模考虑,而是发生了规模的质的变化以后,给我们带来了新的问题。