谁是大玩家
财新记者:大数据这一概念为何会在现在爆发?
何宝宏:任何技术都不是平白无故出来的。2000年以前,大家都致力于研究传统的数据库,对结构化数据进行处理;2000年以后,以谷歌、亚马逊这几家互联网巨头为代表,开始对非结构化的数据进行处理,并运用数据挖掘的成果去推荐自身产品或投放广告等。
直到2011年、2012年,经过了十年的实践、研究,互联网巨头们终于通过不断的技术创新,找到了一种廉价的、高效的处理各类不规则数据的方法,并从这种数据处理、应用中获益不菲。在有利可图的情况下,况且这笔利润可能还不小,其他行业自然意欲将互联网企业的做法搬到自己所处的行业中,这样,大数据这一概念就被包装出来了,也就是近两年的事情。
财新记者:当前,依托大数据,可否有成功的盈利模式?
何宝宏:现在,大数据应用得最成功的还是一些互联网企业。百度可以通过分析用户语义,了解用户习惯、爱好,以便推送广告,阿里巴巴也能利用数据挖掘进行精准的产品营销,这种根据用户浏览、搜索等行为分析用户需求继而推送广告或产品,是当前最典型的大数据应用模式。
实际上,等大数据真正发展起来,可能会出现超乎想象的应用,就像谷歌通过分析人们搜索的关键词竟然可以对流行病进行预测那样,很多创新性的应用将随之出现,发展空间之大我们目前还难以预料。
财新记者:大数据现在最主要的应用在互联网领域,具体案例如何?可否供其他行业借鉴?
何宝宏:以淘宝为例,这个电子商务平台拥有的商品超过10亿种,交易总额已经突破万亿,每天约有30亿次网页浏览、数千万笔商品交易。如此多的商品数据、用户数据、交易数据、社交数据等,经过分析、挖掘,最终形成的应用流向了交易的全过程,包括用户潜在的购买需求预测、针对性地推送产品、商品满意度调查、商家信誉等,甚至还流向了支付、保险、物流等环节,衍生出极具想象力的应用。
在互联网企业应用大数据的过程中,一些通用的数据分析方法、数据开发工具可以给其他行业一些参考,但具体要分析哪些数据,挖掘出什么价值,创造出何种新应用,却不能照搬互联网的那套模式,应该按照不同行业、企业的具体要求去做。
现在,不少企业已经认同了“数据是一种资产”的理念,只是不懂得如何清点清楚这笔资产。它们看到了互联网企业基于大数据获得的巨大收益,也在想着如何盘活自身的大数据,只是还没有寻找到合适的应用,仍在结合自身业务寻找大数据的盈利模式。
财新记者:在您看来,未来在大数据这个产业链上,谁会是主要的玩家?它的发展趋势如何?
何宝宏:大数据是从互联网延展开去的,各行各业都将涌入大数据。现在看来,两类企业在大数据领域占据优势,一类是互联网企业,譬如国内的百度、阿里巴巴,既掌握着大数据技术,自身又能够捕捉用户数据、拥有庞大的数据源,必然能做大数据;一类则是专门做大数据分析的公司,它们可能规模不大,自身也没有数据,但是掌握着大数据的相关工具和技术,可以帮一些不具备大数据能力的企业做分析,譬如在钢铁、能源行业。