个人专栏
  • 高红冰
当前位置>>论坛成员>>研究观点
大数据升维信息社会
发表时间:2015-05-27 16:22:54 作者: 高红冰

5月16日,为传播信息社会理念、增进信息社会共识,迎接第十个“世界信息社会日”到来,由信息社会50人论坛主办,希捷科技(Seagate Technology)协办组织的“2015信息社会发展论坛”在北京中国大饭店召开。来自中央部委、地方政府、科研院所、高校与企业的代表400余人参加会议,围绕“互联网+与创新驱动”主题展开了深入讨论与交流。信息社会50人论坛成员、阿里巴巴副总裁、阿里研究院院长高红冰出席会议,并做题为“互联网升维信息社会”的主题演讲。

以下根据现场演讲整理:

对未来的思考和洞见是我们去描绘刻划未来信息社会很重要的一个方面。站在现在思考未来很困难,因为你的身体在现在的土壤上。把自己放在未来的土壤上思考是很挑战的事情,但是我们要尝试画未来的像,尽量把未来社会描绘出来。

“信息社会”在今天概念已经在升级,我们要从数据的角度升级对信息社会的思考,未来是一个数据的社会,是一个以数据为基础的新智能社会。

从IT到DT的时代变迁

如果在十八世纪的时候是农业社会,大家看到整个规模或者说范围是农业为主的东西,十九世纪制造业起步,1950年GDP大部分是制造业,我想到2030年以信息为主的产业比例会变得最大,农业和工业的比例会下降。全球经济从农业经济到工业经济再到信息经济演变的驱动力来自于技术的突破,技术在改变生产力和生产关系。信息要素全面升级,尤其是云计算正在变成基础设施,数据在变成整个经济社会的核心资源。

blob.png

从计算机出现到电子管、晶体管、集成电路,到今天网络连接数据的产生,新智能驱动的信息社会正在到来。被网络连接起来的各种智能终端,全方位记录经济和社会,包括人的行为数据。这个网络系统不断的去学习和使用人的行为数据,产生一个全方位的社会智能系统,一个新的智能信息时代到来。在不远的将来,《奇点临近》这本书的结论“2045年机器智能会超过人类智能”将是我们看到未来的状态。

人类正从IT时代走向DT时代。IT时代是以自我控制、自我管理为主,而DT时代,它是以服务大众、激发生产力为主的技术。这两者之间看起来似乎是一种技术的差异,但实际上是思想观念层面的差异。

blob.png

IT是信息技术,DT是数据技术。IT的技术在中国的第一阶段是怎样用计算能力、用系统武装,让每一个这样的机构或经济的主体变得强大,这是一个IT时代的特质。到DT时代特征更多呈现出一种平台+个人的方式,怎么样创建一种生态化平台去让别人去成功,你自己才能成功,这可能会变成DT时代核心思想。所以在过去大型机PC甚至到互联网早期时代更多是基于信息技术的推动,但是由于网络的出现,大量智能终端的连接所产生大量新的经济和生产要素(数据),云计算、数据会成为新的、核心的社会经济发展引擎,变成第二次工业革命的一个核心动力。

我们看到过去的IT时代主要是用数据库这样技术来管理结构化数据,企业的业务流程也是结构化的,而组织结构更是层次化组织,总起来说过去面对的是个结构化世界;在大数据到来的时候,数据源变得丰富多彩,机器和传感器数据,社交数据,移动数据,电邮数据等大量的非结构化数据成为主导,也是数据的产生会变得无边界,而消费者为核心的灵活动态流程会替代掉传统结构化的业务流程;同时组织形式也变成大规模的协同分工模式。总起来看,数据升维成为今天进入信息社会的基本动作。

blob.png

中国大数据产业及生态分析

数据的产生一定会在云、端、网这三个视角产生,大量的数据产生应该是基于端的产生。现在智能终端大量普及,未来可能会有80-90%数据基于这里产生,数据记录会基于每一个人手中或者每一个物件所记录下来,这些数据将重新刻画和描绘世界。

blob.png

关于数据的定义很多的书在谈到三V:体量、速度、种类,我们认为了除了3V之外,价值以及在线化是需要增加的定义的一部分。今天的数据如果不是用网络去连接、记录、打通价值就不能得到更大呈现。

2014年全球互联网用户有30亿,Facebook有22亿注册用户,月活跃用户超过13亿人口。我们在2014年全球智能手机出货量突破13亿,连网设备超过300亿个终端设备,在这样用户智能终端和联网设备的背后就是在聚合大量的数据记录。由这些数据连接人体、连接环境、连接物体、连接思想,构成了今天的非常生动的数据社会的景象,这种数据连接起来才能流动共享,真正实现数据的社会经济价值。

blob.png

IDC在《数字宇宙研究报告》里提到:2013年数字宇宙中只有不到20%的数据与云相关,到2020年这一比例将翻倍至40%。中国为领导的新兴市场将于2017年超越成熟市场,中国的数据量将会从2014年的909EB发展到2020年的8060EB,占比增长至18%。2014年的Gartner 技术曲线显示大数据已经从炒作高峰进入到5-10年的稳定发展期,2017年大数据市场将达到534亿美元,年均增速达到58%,是同期IT产业增速的7倍。整个大数据产业处在蓬勃发展的时期。

我们看到传统的数据管理技术只是冰山一角,即结构化数据;今天大量的互联网WEB页面、邮件、社交媒体和更多的由个人在互联网上产生的数据是半结构化或者非结构化数据,这些数据在整个数据总量占比超过85%,但传统的数据管理和基础设施技术已经无法满足这种需求了。

在上世纪的40年代50年代是数据与应用的紧耦合阶段,到了60年代开始出现数据库,70年代关系数据库出现,结构化数据管理问题得到比较好的解决,上世纪90年代数据分析变成关注的重点,到了2008年以后由于互联网的快速发展才带领人类社会进入一个大数据的时代,以互联网公司和开源技术为基础的大数据管理技术开始引领数据管理技术的趋势。今天互联网的连接和移动互联网的广泛普及,带来了一个巨大的发展:移动互联网在最近的一年左右时间里面远远超过过去三年的发展。阿里巴巴在一季度公布的业绩报告里面提到,在移动端的零售占比已经超过50%;Facebook已经超过90%;微博、高德地图各种各样的社交或者媒体的应用移动端的使用都远远的超过70-80%甚至90%以上,今天互联网实际上已经基本上可以叫做移动互联网。在移动互联网这样背景下,数据的产生速度远远超过PC,当然传统的数据管理的技术跟今天正在去创新发展的大数据的技术,形成一个鲜明的对比,新的数据技术,在驱动整个数据的产业的发展。

在数据的发展中一个大数据的生态系统正在构建:数据的生产者、数据的提供者、数据的服务商,同时也正在看到即将出现的第三方的数据交易市场,还有各种各样围绕数据服务的解决方案公司,数据的资产定价或者评估的公司都开始出现,围绕着大数据的生态系统正在逐渐形成,但目前还处在初步发展阶段。

blob.png

阿里巴巴的数据化之路

在以买家卖家为核心的阿里巴巴生态系统中不管是卖家买家还是服务商,在他们的交易过程当中,已经积累了大量的数据,再有支付平台、社交营销等各种各样服务体系共同构成了数据产生的生态系统。

blob.png

阿里的数据化发展历程经历了几个阶段。一个是完全原始数据采集和分散阶段,到各个业务部门自己做部门的数据分析,再进一步进入到一个集团公司层面的数据中心,再到今天更多的是要变成一种数据的能力,怎么样用原始的数据不断的去生成产生新的数据应用,然后由这些业务化所沉淀下来的数据形成产品,然后形成数据的服务能力,之后给到卖家买家和服务商。

举例来说,阿里巴巴基于阿里巴巴的电商交易数据和蚂蚁金服的互联网金融数据推出的芝麻信用,并与公共机构以及合作伙伴建立数据合作,与传统征信数据不同,芝麻信用数据涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等等。 

blob.png

菜鸟物流数据平台以阿里巴巴集团、各大物流公司、以及相关政府部门的海量数据为基础,为各大物流公司提供一系列“数据化”智能物流解决方案,为商家提供基于全国物流运输的多仓调拨、智能分仓等供应链管理能力。去年双十一期间,菜鸟物流数据平台体现了强大的能力,以90%的预测准确率保障了2.78亿物流订单能够在10天内全部完成发货。

blob.png

政府数据开放与大数据治理

在大数据的政府治理层面上,各个国家和政府都有自己的战略。从2009年美国总统奥巴马签署了《开放透明政府备忘录》到八国集团提出数据开放五大原则,包括开放数据为默认、为改善治理发布数据、为激励创新发布数据、注重质量和数量、让所有人可用。

美国政府数据开放的道路上走的很快。2012年2月份纽约市通过开放数据法案,这是美国第一次将政府数据大规模开放纳入立法,涉及到除了安全和隐私之外,其他的几乎所有的信息都必须对公众进行开放。

在政府的治理层面上面面临各种各样的挑战,但是我们也看到大数据其实对政府的治理带来了全新的价值,无论是对宏观经济的决策能力、产业聚集能力、协同治理能力、社会管理能力、公众服务能力、快速响应能力的提升,大数据都可以在有很大层面上帮助政府治理。

blob.png

阿里巴巴商业生态体系的数据如何助力政府治理?我们认为形成一个大数据的服务能力,去支持政府是最重要的。我们做了一些尝试,比如我们建立了阿里的经济云图,去尝试用大数据方式进行打假,开放一部分数据进行大数据竞赛,用数据对在线大淘宝上药品进行全程追踪,包括帮助贵州去建立“云上贵州”等。

blob.png

阿里经济云图将阿里的数据面向区域政府和研究部门开放,以开放平台的方式,希望能够利用我们的微观数据让区域政府领导了解当地的电商发展水平,帮助政府进行经济决策分析。

blob.png

blob.png

我们看到中国大数据的发展面临四个层面的问题挑战:开放与安全、人才和文化、政策标准、法规。今天处在一个悖论当中,如果没有法律法规来支持,产业发展会受到抑制,如果以今天对数据的了解制定法规无疑是在制约着发展。所以必须要把立法的视角放到未来进行立法,才能够保护、促进数据产业的发展,使得未来数据产业能够在中国土地上得到更大的成长。