致胜大数据时代的50种思维方法(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-29 05:12:16

点击下载

作者:杨倩

出版社:红旗出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

致胜大数据时代的50种思维方法

致胜大数据时代的50种思维方法试读:

前言

什么是大数据

最早提出“大数据”时代来临的是全球知名的咨询公司麦肯锡。麦肯锡公司称:“数据已经渗透到每一个行业和业务领域,成为重要的组成部分之一。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

2008年9月,《自然》杂志推出了封面专栏——“大数据”,内容讲述了数据在生物、物理、工程、数学及社会经济等多方面学科所占据的位置和角色的重要性。

如今,“大数据”这个词汇俨然成了工商界和金融界的新宠。在哈佛大学担任社会学教授的加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程。无论学术界、商界还是政府,所有领域都将开始这种进程。”

说到这里,还是有人对“大数据”不明所以:到底什么是大数据?“大数据”是从英语“Big Data”一词翻译而来的。“大数据”这一概念在近几年逐渐被人们所熟知,并为全球各大企业所重视。简单来说,“大数据”是一种巨量资料库,可以在合理时间内达到撷取、管理、处理并整理为帮助公司、企业经营和决策的资讯信息。

随着云时代的悄然到来,“大数据”渐渐得到了越来越多的企业关注。后来,业界将“大数据”概括成四个V,即大量化(Volume)、多样化(Variety)、快速化(Velocity)和价值化(Value)。

大数据不仅是量大而已“大数据”的量到底有多大?根据2012年3月的一份调查结果显示:在短短的一天之内,互联网产生的资料内容可以刻满1.68亿张DVD;发出的社区帖子高达200万个,相当于《时代》杂志770年的文字数量;发出的邮件高达2940亿封,相当于美国两年的纸质信件数量;卖出的手机为37.8万台,高于全世界每天出生的婴儿数量37.1万……

截止到2012年,数据量已经从TB级别跃升到PB、EB乃至ZB级别。(1024GB=1TB,1024TB=1PB,1024PB=1EB,1024EB=1ZB)。国际数据公司(IDC)经过详细的调查研究,得出一个结论:2008年,全球产生的数据量为0.49ZB;2009年的数据量为0.8ZB;2010年的数据量为1.2ZB;2011年的数据量更是持续增长,竟高达1.82ZB。这个数据量,相当于全世界的每个人产生200GB以上的数据。可见,大数据的信息量有多大。

IBM公司称,截止到2013年10月,全世界所获得的数据中,有90%都是过去两年内产生的。预计到2020年时,全世界所产生的数据规模将达到今天的44倍。

当然了,“大数据”不仅是量大而已,它还具有多样化、快速化、价值化等优势。

多样化:数据的类型繁多。这种特质也让数据被分为两部分——结构化数据和非结构化数据。相对于以往那些以文本为主的结构化数据,非结构化数据越来越多,包括日志、图片、音频、视频、地理位置信息等。

快速化:处理的速度快。这是大数据区分于传统数据挖掘的最明显的特征。根据IDC的一份名为“数字宇宙”的报告,预计到2020年,全世界的数据使用量将高达35.2ZB。在如此浩瀚的数据面前,处理数据的效率快慢决定了企业生命的长短。

价值化:价值密度低。价值密度的高低与数据总量的大小成反比。

我们来举个例子:一部时长为一小时的视频,在持续不间断的监控中,有用的数据仅仅有那么一两秒而已。因此,如何通过强大的计算方式迅速地完成数据的价值“精纯度”,已成为目前“大数据”背景下需要解决的难题。

大数据——潜藏的金库

随着技术的革新,我们已经踏进大数据时代,而数据背后潜藏着巨大的商业机会,值得我们去挖掘。

根据技术研究机构IDC的研究结果可知,近年来,大量的新数据无孔不入,它们以每年50%的速度在增长。或者说,它们每两年就要翻一番,完全超出人们的预料。

事实上,我们生活的方方面面,都会因大数据的存在而发生变化。如消费习惯、兴趣爱好、人际关系,以及整个互联网的走向与潮流等,都将成为IT行业所关注的重点。当然了,这一切的获取和分析都与大数据息息相关。

我们不能说数据的圈子越来越大,而是全新的圈子越来越多。比如,全世界有数不清的数字传感器依附在汽车、工业设备、电表和板条箱上,它们能准确地掌握方位、温度、湿度、运动、振动,以及大气中的化学变化。

从一方面来说,大众媒体基础上的大数据挖掘和分析,将衍生出令人意想不到的应用;从另一方面来说,基于数据分析的营销和咨询服务也正在崛起。这些专注于数据挖掘和数据服务的公司,将成为IT行业乃至互联网服务业中的新兴力量。

以往,只有像谷歌、微软这样的全球化公司能做关于大数据的深挖和分析。但现在,大数据偏向平民化,让越来越多的IT公司有机会进入这个领域。也因此,大数据领域有了不同的数据分析和服务,促使人们不断地创新商业模式。比如在一分钟内,用户就会在Facebook(脸谱网)上发布近70万条信息;在一分钟内,用户会在Flicker(雅虎旗下图片分享网站)上传3125张照片;在一分钟内,用户就会在YouTube(世界上最大的视频网站)上点击200万次观赏……

铁一般的事实告诉互联网从业人员,这些庞大数字意味着一种全新的致富手段。可以说,它的价值不可估量。

虽然在目前来说,大数据在中国还处于初级阶段,但是它的商业价值已经告诉人们——凡是掌握大数据的公司,就相当于站在“金库的门口”。基于数据交易产生的经济效益和创新商业模式的诞生,能帮助企业进行内部数据挖掘,以便更准确地找到潜在客户,从而降低营销成本,提高企业的销售利润。

百分点信息科技的联合创始人苏萌曾说过:“未来,数据可能成为最大的交易商品。但数据量大并不能算是大数据,大数据的特征是数据量大、数据种类多、非标准化数据的价值最大化。因此,大数据的价值是通过数据共享、交叉复用后获取的最大的数据价值。”在他看来,未来,大数据将会如基础设施一样,有数据提供方、管理者、监管者,数据的交叉复用将大数据变成一大产业。

据一项统计结果显示:截止到2012年10月,大数据所形成的市场规模在51亿美元左右。到了2017年,此数据预计会上涨到530亿美元。

由此,可见“大数据”的价值所在。

改变思维模式,用数据说话

近几年,“大数据”变成了香饽饽,成为各大企业、公司、媒体甚至是学者都津津乐道的东西。他们有着不同的见解和理论,唯一相同的观点就是——大数据时代对人类有着至关重要的影响,甚至即将成为改变未来社会的重要力量。

然而,大数据究竟改变了什么呢?在人们的脑中,这个问题仍然是一个乱糟糟的毛线团,想要找到毛线的一头,却又不知道从哪里入手。

在“第五届中国云计算大会”的第二天,中国电子学会云计算专家委员会候任主任委员、中国科学院院士怀进鹏发表了一篇演讲,题为《大数据及大数据的科学与技术问题》。在演讲中,他表示:“大数据的发展可能会改变经济和社会生活,可能会改变科学研究的途径,甚而改变人类的思维方式。”

我们可以来举一个简单的例子:苹果公司创始人史蒂夫·乔布斯在罹患癌症后,不惜花费巨额抽取了全身的DNA信息。这样一来,医生就可以根据他全身的DNA信息来判断癌细胞的变化,从而对症下药。然而,对于普通的患者来说,是拿不出巨额钱款来做这种抽取检测的。换句话说,医生只能从普通患者身上提取很小的一部分DNA信息。两者的治疗效果有多大差异,可想而知。

对此,或许你还有疑问,大数据真的能获得最全面的信息,能够找到信息的源头和结果吗?

我们再来举个简单的例子:如果你上淘宝,登录支付宝账户,点开电子对账单,你是不是能够看到自己一年的消费曲线图?是不是能够看到每个月的支出和收入?是不是能够看到自己的钱花到哪里去了?是不是比拿笔记账清晰和准确得多?根据网络购物的数据中,你还会发现:哪个城市的男人比女人购买的东西还要多;哪个城市的人用支付宝缴纳水电费的频率最高;什么星座的男性或女性在某年的消费额最高;在一年里,在父母或亲友身上花费了多少;节假日时,什么东西最畅销……

这样庞大的数据分析,在过去单一的小数据时代根本无法做到,甚至想都想不到。大数据专家维克托·迈尔-舍恩伯格在《大数据时代》中是这样解释的:云计算在获取海量数据的同时,也带来了数据的混杂性,这会给传统的数据分析带来一些困扰。在以往,我们习惯于由数据得出具体结果。而在大数据时代,我们应当关注的是数据之间的相关关系,而不是数据之间的因果关系。

数据之间的相关关系可以帮助我们捕捉现在的线索和预测未来。如A和B的情况经常一起发生,那么只要注意到B情况发生,就能预测A的情况是怎么样的。这种“A和B”的关系在零售行业和IT行业中已被广泛运用。7-11便利店通过分析零售终端的数据,得出了这样的一个相关关系——温度低于15摄氏度,暖宝宝的销售量便增加5%。于是,只要温度低于这一度数,7-11便利店内的暖宝宝就会上架;豆瓣电台会推荐一些你可能会喜欢的音乐;当你在当当网买某本书后,系统就会提醒你——购买这本书的人中,有30%也购买了另外一本书……

这些结论或预测,都是基于大数据分析而来的。当然了,大数据也为我们带来了另一种生活方式,那就是还有更多的事物都可以数据化。通过对关键词的分析和搜索,我们可以看到购物的习惯被数据化、人际关系被数据化、社会热点和考试重点的走向也被数据化。这些数据可以导出商业潜能,更能导出社会走向。

阿里巴巴创始人马云敏锐地捕捉到大数据的巨大潜能。在2012年,他提出大数据战略,通过资源共享与数据互通创造商业价值。在每年一度的“双十一”销售热潮中,阿里巴巴以云计算为基础的数据服务,对数以亿万计的消费者需求信息进行详细地捕捉,并帮助电商随时调整销售决策。

的确,大数据的出现,不仅改变了人们的思维方式,还让更多的企业和社会决策有足够的力量和依据——以数据说话。

第一章 大数据是一场革命

1 定律思维

大数据中潜伏着很多潜在的规律,只有找到这些规律,大数据才有价值。建设新数据时代和平台的必要手段,就是通过积累数据,预测提升服务和管理水平来实现。

此前,在大数据中,有两个较为突出的定律:一秒定律或秒级定律和摩尔定律。

什么叫一秒定律或秒级定律呢?指的是对处理速度有要求,一般要在秒级时间给出准确的分析结果。如果时间过长,就会失去原有的“一秒定律或秒级定律”的价值。也正是这个速度要求,才区分出大数据挖掘技术和传统的数据挖掘技术的不同。

那什么叫摩尔定律呢?指的是简单地评估出半导体技术进展的经验法则,其重要的意义是对于长期来说的,IC制程技术是以一直线的方式向前推展,使得IC产品能持续降低成本,增加功能和提升性能。

1998年,台湾积体电路制造公司董事长张忠谋曾说过:摩尔定律在过去30年是非常有效的,在未来10~15年也依然适用。但很快,就有新的研究结果推翻了他的言论。研究发现,摩尔定律的时代将会结束。由于研究和实验室的成本需求非常高昂,而有财力投资在创建和维护芯片工厂的企业少之又少。再加上,制程越来越接近半导体的物理极限,将很难再缩小化。

大数据时代正在聚集改变的能量,其定律也在发生着一定的变化。社科院世界经济与政治研究所副所长何帆在一次讲座中,曾说过这样的话:大数据时代,人们更要重视统计学。比如说,随着大数据时代的来临,人们开始重视大数据,要重视统计学。可当数据变得足够强大后,人们突然发现,社会上的一切现象都是有一定的统计规律的。它无法像物理学可以准确地描述出前后的因果关系,而只是一个统计的规律。关于这点,有人就玩笑似的说过:只要统计学学好了,再去学别的都战无不胜,因为社会上的一切现象都有一个统计规律。与此同时,有人就觉得疑问:为什么要强调统计学呢?那是因为人们在认知能力中,统计思维算是最差劲的。要知道,人的大脑中有一些功能比较优良,甚至超过人们自身的想象,比如人们的语言能力。著名的语言学家乔姆斯基就曾经说过:“语言不是你学来的,而是你天生就会的。要是从一出生,开始学语言的话,那是根本学不会的。事实上,一个人在出生的时候,大脑中就已经预装了一套操作系统,那就是语言的操作系统。因此可以说,语言是人们天生就会的。再比如,人们察言观色的能力,也是天生就会的,但有一些是人们不会或不愿意学的。”诺贝尔经济学的美国心理学家丹尼尔·卡尼曼写过一本书,书名是《思考,快与慢》。在这本书中,有这样的言论,大致意思是说:人有很多思维都是靠直觉的快思维,这是人们经过数百年、千年慢慢演化而来的,最终被留下和被记忆的直接感受,就是所谓的第六感觉。举个例子:当一个人在深夜行走时,会敏锐地察觉到周边的变化。一旦感受到危险或不安的情绪时,就会立即逃跑,甚至大喊大叫。而与此同时,人的大脑之中还有另外一套操作系统,是用来做逻辑推理以及进行统计分析的,只是这个系统不怎么完善。于是,人们天生就缺乏逻辑推理能力和统计思维能力。所以,在大数据飞速发展的今天,人们应该锻炼自己的逻辑推理能力和统计思维能力!为什么大数据变成了一个最热门的词汇?能够让大数据变成一个热门词汇,主要的原因有两个。第一个原因是,由于IT革命后,人们有了处理数据的多方面能力,有对计算机数据的处理能力、对计算机的存储能力以及对计算机的计算的能力,等等。再加上,人类储存信息量的增长速度要比世界经济增长的速度快四倍(这仅仅是在金融危机爆发之前的世界经济增长的速度)。而计算机数据处理能力的增长速度,要比世界经济增长的速度快九倍。第二个原因是,社会上的一切现象以及企业的发展,能够被数据化的东西越来越多。在最早时,仅仅是数字可以被数据化,于是就有了阿拉伯的计数,后来又出现了二进位,再后来人们发现文字也可以处理成数据,于是又发现图像也可以处理成数据。比如,有人要去旅行,但是不知道要去的地方的具体位置和周边的信息,那就可以利用搜索引擎搜索;当人们在与微信中的朋友聊天,用微博分享一天的见闻……就已经被数据化了。因此,这就是为什么现在要谈大数据时代,那是因为大数据能够处理和分析的东西太多了,多到人们无可预计。

社科院世界经济与政治研究所副所长何帆说:“当你能够被数据化的东西越来越多,当你能够拿到的数据越来越多时,就跟原来不一样了。原来的统计学得有一个抽样,因为你不可能拿到整体,因为整体太多了,而且无法去计算。而现在,当存储能力无限扩大,处理数据的计算能力不断进步,致使现在我们所处理的往往不是一个样本数据,而是一个整体的数据。”

不仅如此,何帆还总结出了大数据的三个规律:第一个规律是知其然而不必知其所以然,外行打败内行;第二个规律是彻底的价格歧视,商家比你更了解你自己;第三个规律是打破专家的信息优势,病人给医生解惑。

关于第一个规律,他先举了一个葡萄酒的案例——如何品葡萄酒。在以往,靠品酒方面的专家拿起葡萄酒时,会先闻一闻,准确说出酒的什么味道、富有什么样的香味。接着,品酒专家会看是不是挂杯。最后,他会准确地说出:葡萄酒的产地,大约是什么年份的。但是,当品酒师在品新酒的时候,由于葡萄酒真正的品质还没有形成,因此,他的鉴定是不那么准确的。此外,当一个品酒师的声誉越来越高的时候,由于要顾及自己声誉和名望,所以在大多情况下,他不敢做大胆的推测和判断。在普林斯顿大学,有一位经济学家很喜欢收藏葡萄酒。有一天,他想试试自己能不能预测出某年某地的葡萄酒品质如何,于是,他就去查找大量的数据,经过分析和研究后得出一个秘诀——葡萄酒的品质与冬天的降雨量、收获季节的降雨量、生长期的平均气温、土壤的成分等因素有关。1989年,葡萄酒的新酒刚刚下来,他就大胆预测:今年的葡萄酒是世纪佳酿。在1990年,他又大胆地预测出:今年的葡萄酒比1989年的好。要知道,一般的品酒师都不敢如此判断,但他却如此大胆,因而着实为自己带来了一些非议。不过事实证明,他说的完全正确!

有句话叫:要知其然,还要知其所以然。但是在大数据时代,人们可以知其然,却不一定非要知其所以然。如果你去问普林斯顿大学的教授:为什么说这个酒好?这个酒到底有什么香味?酒回甘是什么?他未必会说得很清楚。但是他能够知其然,所以才能够大胆地做判断。这是为什么呢?这或许是人们以往的认知里,执意去要寻找一些线性的、双边的直接因果关系,而忽略了其他方面的东西。而人们忽略的方面,恰恰又是最需要的。事实告诉人们:万物之间的联系比人们想象中的要复杂得多,它可能是非线性的,也可能是多元化的。所以说,出问题的不是大数据,而是人们原来的认知模式。那么,在这个时候,人们怎么办呢?最佳的办法,就是退而求其次,要先去寻找相关关系,再去找是否有因果关系。

第二个规律,是彻底的价格歧视。商家比你更了解你自己,他也有着自己的见解。比如说,一个机构是专门做信用卡的刷卡记录的,当他们积累了大量的数据后,经过分析和处理,就会找到很多规律。再比如,一个人的离婚与否,和信用卡上的还款记录以及驾驶车辆出车祸的概率有一定关系。这还真是个奇怪的规律。在大数据时代,比较有名的规律就是:尿布和啤酒的销售量有一定的关系。啤酒和尿布怎么会联系在一起?市场调查人员经过一番调查后才发现:原来当有新生儿出世后,买尿布的这个任务就给新爸爸了。尽管新生的宝贝出世以后,爸爸亲手照顾孩子的机会并不多,但他也有一种自豪感。在去买尿布的时候,为了庆祝,他会顺手去买啤酒。如果店家在尿布货架的旁边直接摆上啤酒,啤酒的销量就会提高;专门卖母婴用品的部门会搜集一些顾客的信息,然后分析研究得出一些结论。比如,一位女性大约在什么时间段会怀孕,她可能会买更多的母婴用品以及一些营养品,甚至会购买一些没有香味的洗发剂,最后预测出潜在的客户到底在哪里。

可以说,在大数据时代,一切预测和分析都动摇了人们以往的方法论。原来经济学里说过,商家不能搞价格歧视。这不是从道义上来说,而是因为,在过去,商家很难对不同的顾客进行价格歧视,所以要制定统一的价格。不过,这是过去的规律,在大数据的时代,这个规律被彻底颠覆。在大数据的时代,商家可以针对每一个个体的消费者定价,因为他比消费者更了解消费者自身的行为。比如说,某天你会收到一条信息,说是你的车很久没去做保养了,希望你能够重视这件事,并快去店里给爱车做保养并消费;在你准备去旅行,搜索旅行资料时,一些旅行社就会给你打电话,给你推荐适合你的旅行方案。此时,你肯定会感到疑问:他们怎么知道这些事?或者,他们怎么会这么了解你的状态?其实,这都是大数据在帮他们的忙。能够合理运用大数据的商家,都是一个合格的“偷心”者,会抓住你的喜好,然后偷走你的“心”。

第三个规律,就是打破专家的信息优势,病人给医生解惑。在这个规律中,社科院世界经济与政治研究所副所长何帆说:“我们接着再讲一个案例,电视连续剧《豪斯医生》的医学顾问是纽约时报的一位专栏作家。他是倡导寻证医学的一个代表人物,寻证医学就是根据证据来治病。过去看病时,要先研究病理学,再研究治疗办法,而且有很多是一代一代口传下来的。老师告诉我们说,维生素B12口服的效果不好,必须打针。为什么?不知道,反正是当年,老师的老师就是这么告诉老师的。所以,你的老师也这么告诉你,你就这么再告诉你的学生。但是后来发现,这里头有很多问题。”

的确,这也是医患之间的纠纷如此之多的原因之一。实际上,医院的误诊比例是比较高的。在美国,有一份研究称:美国医院误诊比例是1/3,有20%的人由于误诊死亡。为什么医院的误诊概率会如此之高?那是因为:过一些医生在治疗中完全靠经验,有很多想法和判断都是主观的。确实,医学并不是一门科学,而是一个个复杂的生命体,医生没办法精确到把每一位病人治好。后来,医生也开始另辟蹊径,通过数据找出规律。很快,在19世纪,就有一位医生发现这样的一个规律:如果医生先去了停尸房,再回来给产妇接生的话,那产妇的死亡率就会增高。而医生在清洁手以后再接生的话,产妇的死亡率就会下降。在那个时代,人们还不知道细菌和病菌的危害,只知道在手术前后都要洗手。当然,也没有哪个病理学能够告诉医生“洗手跟降低死亡率有很大的关系”。慢慢地,病人的死亡率大幅度下降。而这,就是寻找依据的思路,减少医生的自主权利,让一切变得有规律起来。

由于互联网的存在,再加上大数据的帮助,有时,病人对病情的掌握程度比医生还要高。在美国曾有这样的一个报道:有个病人被推到病房里头后,一群医生对他会诊,经过一番研究后,医生们都说不出个所以然来。最后,当主治医生问这个病人“你认为自己得的是什么病”的时候,病人立即回答:我这个病就是IPEX!对此,医生很是疑问,就问病人是怎么知道的。病人说很简单,“我只是将自己的症状在搜索引擎中一搜,就知道了”。

相信有不少人听到这个结果时,啼笑皆非。医生都不知道的病情和结果,病人竟能准确地说出来。可见,大数据有强大的传播和分析能力。在以往,医生能够治病,是因为他有着专业的知识、专业的见解以及实践性。而现在,除了实践性以外,病人也会知道很多信息。当遇到一些庸医时,你完全可以拿着自己打印出来的资料跟他说:“你的诊断错了,根据我的症状看,应该是这个病,而不是你所说的那个病。”这完全颠覆了原来信息不对称的情况。所以,大数据时代的第三个规律就是打败、打破了专家的信息优势。

最后,何帆还说:“对于大数据,很多企业都认为,拥有大量的数据才是获得价值的根本。然而,事实并非如此,拥有大数据思维,远比大量的数据更有价值,这才是大数据的王牌定律。”

2 集合思维

如果把毫不相干或紧密相连的数据组合到一个集合中,就能更有效地处理这些相关的数据。这些数据可以清晰地告诉我们:每一个客户的消费观念、倾向、爱好、需求等,哪些可以归为一类,哪些可以归为另一类。

大数据的集合是数据数量上的增加,能够实现从量变到质变的过程。举个简单的例子,这里有一张照片,照片里的每个人都在骑马。每一分钟,每一秒都要拍一张照片。随着处理速度越来越快,照片从一分钟一张,到一秒一张,再到一秒十张,就产生了电影。当照片的数量增长实现质变的时候,这一张张照片就变成了一部完整的电影。

在美国,有一家创新企业叫Decide.com,就是充分运用了大数据的集合功能,在全球的各大网站上搜集数以十亿计的数据,从而预测产品和产品的价格趋势。告诉消费者在什么时间段做购买决策,什么时间该购置什么产品,什么时间购买产品是最实惠的。此外,还帮助一些生产厂家提高生产率,降低交易成本,等等。

除了这家企业外,美国的跨国科技企业谷歌公司(Google公司)也顺应时代,走进了大数据的潮流中。其实,谷歌公司的高管们一直不愿意让公司的任何一款产品与大数据有什么联系,而且,禁止公司的员工在对外交流中提到大数据。但是《大数据》作者维克托-舍恩伯格在评价谷歌公司时指出,谷歌公司很清楚自己的位置和处境。实际上,它就是一个大数据公司,因为他们理解大数据的核心所在。如果他们没有看到这些数据的价值,绝对不会迈入这个充满竞争和玄妙的市场。

维克托这话不无道理。早在十多年前,Google公司就已经开始了数据搜集之旅,并利用数据来构建产品。比如,Google搜索,广告,翻译,音乐,趋势以及更多的其他产品,都无法离开海量的大数据。当Google取景车载着全景摄像头满世界跑的时候,Google公司就已搜集到了世界绝大部分城市的街景图;当Google三维红外线照相机不停运作的时候,Google公司已经完成了数千万图书的扫描。

此外,Google还搜集了一些意想不到的数据。比如,用户在进行搜索时打错的字,Google将这些错误的输入存储起来,然后将其和最后正确的输入进行联系,用于开发Google自动更正系统和Google翻译。同样,海量的数据不是关键,重要的是Google公司拥有多项世界领先的大数据技术,如Colossus分布式存储,Big Table列式存储,Caffeine索引系统,Big Query数据分析服务和Cloud SQL(云SQL)。借助强大的技术以及先进的计算模型,Google公司能以一种高效而可靠的方式,充分运用大数据和展示成果。

随着大数据的运用广泛,Facebook在互联网大数据搜集方面也后来者居上。如今,每天有500TB以上的数据上传到Facebook。Facebook上已经存储着近十亿用户分享的个人信息,例如,年龄、性别、所在地、兴趣,等等。同时,这些用户还在Facebook的Timeline(个人生活时间轴)页面记录个人生活故事。在通过个人的基础信息和时间线获取了大量的数据后,Facebook就如同一个用户亲密的朋友,清楚地记得用户的过去和现在,并预测着用户的未来。为了处理这些海量的信息,公司配置了最大的分布式处理系统,单个集群中的数据存储容量就超过了100PB。之后,Facebook通过复杂的数据分析来帮助商家接触潜在目标顾客,从而实现投放广告的准确有效。用户留下的数据越多,Facebook就越了解用户,投放的广告就越发精准。Facebook收入的未来在于其对复杂数据的分析,而不是靠输送大量广告来吸引用户的眼球。

在大数据新兴的模式下,尽管有一些零售商的利润会受到一些影响或打击,但从较好的商业本质来说,消费者可以更理性地购物,更有效地管理资金。

我们再来举一个例子:SWIFT(环球同业银行金融电讯协会)是全球最大的支付平台。在这个平台上,每一笔交易都可以进行大数据分析。研究人员可以预测出一个经济体的健康性和增长性。比如,这个公司现在为全球性客户所能提供的经济指数。

此外,大数据的基本结构还分为三个层次,反映出观察数据库的不同角度。

第一层是物理数据层:是数据库最里面的一层,是物理存贮设备上实际存储的数据的集合。这些数据是最原始数据,也是供用户加工的对象。物理数据层由内部模式描述的指令操作处理的位串、字符和字组合而成。

第二层是概念数据层:是数据库置于中间的一层,也是数据库的整体逻辑的部分。这层数据层指出了数据与数据之间的逻辑定义和联系,是存贮资料的整合点。此时要注意的是,这层数据层所涉及的是数据库所有对象的逻辑关系,而不是其物理情况。

第三层是逻辑数据层:是体验用户能够看到和使用的数据库,也是能够证明用户使用过的证明和踪迹。

总之,小数据,大集合就是按照某种数据集中起来并存放二级存储器中的一种方式。这种数据集合还有着一定的特点,比如尽量不出现重复的情况。

3 创新思维

从目前看,全世界的数据总量正持续增长。过去三年内所产生的数据量已超过去的总和。随着互联网、物联网等IT行业的蓬勃发展,新数据源如泉水般涌现,GPS、传感器等数据持续并大量产生。而由于数据获取成本、存储成本和处理成本比较低,也推动了数据总量的膨胀。

2011年6月,美国麦肯锡公司全球研究院在题为《大数据:下一个创新、竞争和生产力的前沿》的研究报告中指出——大数据时代已经到来。的确,大数据的到来势不可挡,它迅速抓紧了时代的前沿和趋势。2012年3月,美国政府宣布“大数据的研究和发展计划”,将大数据视为增强国家竞争力的秘密武器之一。

其实,不仅仅是美国,包括我国在内的一切其他国家,也都把大数据放置在国家战略层面上,并一致认为:一个国家未来的竞争力将体现在拥有数据的规模及运用数据的能力上。

这一创新思维,已为人们在信息技术领域好好上了一课。更有甚者,将大数据比喻为推动人类社会发展的“新石油”。这一比喻可谓贴切至极。

作为继云计算和物联网后又一次具有颠覆性的技术革命,大数据深受人们的推崇,并被广泛使用。此外,就连当今世界科技创新、国家安全战略以及新军事变革也青睐起大数据来,将其作为极为重要的知识增长点。据国外的媒体爆料:截至2012年年底,全球互联网总数据存储量高达160亿TB,并正以59%以上的年增长率高速增长。有评论指出,每天遍布世界各个角落的传感器、移动设备和在线交易等产生的海量数据昭示世人:人类已加速步入“大数据时代”。

在军事领域,大数据更是充分发挥出独有的能力。在海量的数据库面前,随便打开一座,里面都是有价值的数据。再通过分析发现规律,便能够获取高价值的信息,从而做出重要决策,把握时局。这也是大数据的军事价值。

比如,美国的“海豹”突击队击毙本·拉登事件,于刹那间吸引了全球人的眼光。不过,外军经过深入研究后指出,能够发现本·拉登并将其击毙,靠的是几千名数据分析员和长达十对海量信息的分析。因此,有人说是“数据抓住了本·拉登”。

无独有偶。在美俄达成有关叙利亚化武换和平协议的时候,美国情报机构列出了叙利亚数十项化武生产和储藏地点清单。可以说,能够发现和锁定目标,是基于美卫星数据情报和分析员长时间的分析。专家告诫:驾驭未来战争,绝不能忽视没有硝烟的大数据战场。

看来,数据的创新思维,已经影响到人类生活和生存的方方面面。现在,我们来详细地归纳一下大数据创新思维对人类经济社会发展影响巨大的几个主要方面。

首先,大数据的创新思维可以推动并实现巨大的经济效益。

据麦肯锡公司全球研究院通过研究得出结论:大数据给美国的医疗服务业带来的经济价值高达3000亿美元;大数据使美国零售业净利润增长60%;大数据降低了制造业的产品开发和组装成本,并让其成功下降50%。有专家称,大数据所衍生和产生信息技术的应用需求,将推动整个网络信息技术的发展。到了2016年,预计全球大数据会在一定的程度上拉动信息技术,金额支出将高达2320亿美元。

其次,大数据的创新思维可以增强社会管理水平。

在政府和公共服务领域,大数据的出现有效地推动了政务工作的开展,提高了政府部门的决策水平、服务效率和社会管理水平,并产生了不可估量的社会财富。在大数据的影响和帮助下,欧洲等地的多个城市运用大数据分析,采集到准确的交通流量数据,从而能够及时提醒驾驶者哪条是最佳的出行路线,以此改善交通拥堵的状况。

最后,大数据所具备的创新思维还可以推动和提高安全保障能力。在国防、反恐、安全等领域,大数据应用也起着至关重要的作用。比如,大数据会将各部门搜集到的信息进行自行分类、整理和分析,有效解决情报、监视和侦察系统不足等问题。

因此,人们可以了解到,大数据的创新思维不仅是认识和改造世界的有力工具,还是能掌握事物的发展规律,准确预测未来的好帮手。

4 转型思维

早在1996年,美国联邦政府就声称信息是重要的国家资源,并认为自己是美国最大的单个信息生成、搜集、使用和发布方。

以美国人口普查局为例。它作为美国人口、经济和政府方面重要统计数据的主要来源,目前拥有2560TB(太字节)的数据,如果把这些数据全部打印出来,用四个门的文件柜来装,需要5000万个才能装下。美国国家安全局对全美的电话进行监控,每六小时产生的数据量,就相当于美国国会图书馆(世界上馆藏量最大的图书馆)所有印刷体藏书的信息总量。此外,美国财政部、美国卫生部和美国劳工部也都是数据密集型的行政管理部门。而这,只是美国联邦政府数百个机构当中的几个例子。

为承担这些数据的存储和维护工作,1998年,美国联邦政府共拥有432所数据中心,而到了2010年,数据中心的总数跃升到2094所,翻了几番。1996年,美国联邦政府的年度信息技术预算是180亿美元,十多年来不断上升,到2010年,已经高达784亿美元。据报道,这些投资中的一半以上都用在了购买存储数据的硬件设备上。在大数据转型思维的冲击和配合下,政府不仅仅成为最大的受益者,也成为占有者之一,在诸多方面起到了至关重要的作用,如基础设施方面、大数据产业方面、人才培养上以及完善相关标准和立法方面等。

在我国,政府在资源配置方面起着调配的作用,能够集中力量办大事,并影响和带动大数据加速发展。不过,由于政府在大数据方面的能力以及对大数据的熟悉程度较弱,所以要想真正运用好大数据,要面临的问题也不止一两个。其中,就包括一些转型方面。

比如,大数据推动管理的现代化转型。将大数据的手段及其方式方法引入管理领域,是实现管理现代化的有效路径之一,也是大数据时代必然迈出的一步。

伴随着经济发展的迅速增长,广东省地方税收纳税登记户也增加了不少。在1994年,登记的用户仅有60多万户,税收也只有184亿元。而到了2011年,登记的用户超过285万户,地税收入也增加了不少,增加到4248亿元。此外,地税系统干部人数的增长速度并不像纳税用户和收入的增加速度那么快,只是增加了20%左右。目前,广东省税收管理员系统的数据总量已达到53TB,承载了覆盖税源管理、税收执法、涉税提醒服务等的一百多项业务。与此同时,如何在海量的信息中及时获取有用的信息,并精确分析结果,就成为摆在管理者面前的一道难题。

不过,在大数据时代,有难题也会一一被解开。为了应对这个难题,广东省通过率先建设省级地税集中征管信息系统,使全省都拥有了同一套程序、一套服务器和一个网络。下面,我们就以广东省地税系统为例子,从几大方面来揭示大数据推动公共管理从传统向现代转型的趋势。

第一个方面就是:从粗放化向精细化转型。通过建立省级数据应用大集中征管信息系统,广东地税摆脱了以往人工操作的粗放型管理模式,真正实现了税款自动入库、自动划解和实时监控,实现了税款的稳定增长以及快速增长。再通过对海量信息的详细分析和研究,广东省对每一个商家或是企业都实现了精细化转型。比如说,在房地产方面,由于建筑行业的人员流动性大,操作的环节复杂,且没有规范性,就形成了一个比较难管的问题。但自从有了这个征管系统以后,大数据就能够实时获取房地产开发项目明细信息,其中包括土地使用权信息、房产销售进度、销售明细建筑工程进度以及各阶段的税款缴纳情况等,实现了项目从产生到消亡的全过程监控。

第二个方面就是:从单兵作战型向协作共享型转型。在以往,不同政府部门拥有着不同的信息系统,但很多数据由于相互独立,所以彼此之间没有共享的信息,这些信息单独拿出去,就没有了任何用处。而大数据应用的出现,就扫除了这个盲点,使其实现了数据信息的共享,从而最大限度地发挥了数据的功效。如今,工商、税务等系统每天都会进行信息实时交换,推动了地税机关在办证服务上的创新,从原来的限时办证,实现了目前的即时办证;从原来填写一百多项登记信息,实现了目前只填写八项必要信息内容,甚至实现了享受免填服务。不仅如此,广东省地税借助大数据平台,积极推进第三方涉税信息共享,还明确了二十多个部门共享信息,真正做到了为每个部门提供便利,为社会经济的发展也提供了更快捷、更便利的服务。

第三个方面就是:从柜台式向自助式全天候转型。根据纳税人的不同类别、涉税业务的不同、办理时段不同等信息,广东地税借助大数据平台,形成了自助式全天候的一种转型。比如,增添了很多服务格局——网上办税、纳税热线、服务大厅、短信服务、自助办税等多种渠道并存的大服务格局。通过自助办税终端系统,为纳税人节时省力,不仅不受地方区域的限制,也可以不受时间的限制,自行完成代开小额发票、打印缴款凭证、清缴税费、申报缴纳车船税等业务。

第四个方面就是:从被动响应型向主动预见型转型。为了能够更好地服务纳税人,广东省地税通过税收大数据平台,还推出了一项特别的服务,那就是全省集中统一的短信服务。这项服务会为六百多万的纳税人提供短信订阅服务,有针对性地对目标群体提供了多项短信服务,如逾期未申报短信提醒、未到期未申报短信提醒,还有发票开具短信提醒等。借助于大数据平台,广东省地税实现了对受众精确式的短信服务,避免了轰炸式、盲目性的短信服务,从而提升了服务质量。据统计称:截止到2011年,短信服务量超过1800万条;到了2012年,短信服务量已经超过5000万条。

第五个方面就是:从纸质文书向电子政务转型。现如今,广东省地税互联网电子税务局已基本建成,纳税人只需要短短的五分钟,就能轻松办税,而且还实现了网上缴纳,足不出户。此外,广东省还率先推行网络开具发票,一方面为纳税人提供了方便,节省了时间。一方面使税务机关能在第一时间掌握每张发票的信息,与企业纳税申报数据比对分析,及时总结出没有缴纳、少缴纳的税款情况。这一行动推广以后,还意外地打击了假发票泛滥的情况,也避免了一些人用假发票报销的现象。也因此,这一措施被国家税务总局誉为“税收管理史上的颠覆性举措”。

第六个方面就是:从风险隐蔽型向风险防范型转型。依托大数据平台,广东省地税建立了惩防体系信息管理系统,对地税干部的税收执法和行政管理实行了全程分析和监控,有效监督和杜绝了一些知法犯法和影响国家荣誉的风险出现。监控预警信息从最初每月收到近7000个,到2012年每月收到不足500个,下降了92%。可以说,自从大数据监控平台出现后,全系统违法违纪发案率大幅度降低,不足5‰,也没有什么重大的违纪案件出现,这就是最大的成功!

当然了,这简单的六个方面不足以全面体现出大数据所影响到的转型思维,但却为互联网以及政府方面竖起了一个指向牌,用最大的能力帮助社会前进。此外,由于转型思维的复制性和推广性,相信在不远的未来,转型思维所赋予的前景更具有升值空间。

5 战略思维

未来,大数据相关的技术和能力将成为一个国家至关重要的核心战略资源。作为当今最具影响力的社会思想家之一的阿尔文·托夫勒在1980年出版的《第三次浪潮》中,曾说过这样一句话:如果说IBM的主机拉开了信息化革命的大幕,那么大数据才是第三次浪潮的华彩乐章。

很快,事实验证了他的话。虽然大数据时代姗姗来迟,但来得却比托夫勒想象的更为迅速和猛烈。维克托·迈尔-舍恩伯格(《大数据时代》的作者)曾说过,大数据是一场“革命”,会让各行各业有着天翻地覆的改变,甚至改变人们的思维方式。当然,其最关键的是,大数据的出现会让人们放弃对原本事物因果关系的追求,随即转变思维关注相关关系。也因此,大数据颠覆了千百年来人们的思维模式,对人们的认知方式和交流方式提出了新一轮的挑战。至此,人们只需要明白“这些是什么”,而不须明白“这是为什么”。

进入21世纪以来,一些崭新的互联网的应用如雨后春笋,纷纷冒了出来。如微博、社交网站、视频通信、医疗影像、地理信息、传感器、无线电射频识别阅读器、导航终端等非传统IT设备和移动设备,等等。它们的出现,都将产生巨大的数据库,从而形成“数据大爆炸”的现象。国际数据公司(IDC)的预测表明,到了2020年,全球的数据产生的量会增长44倍,达到35.2ZB。换一句话说就是,全世界约需要376亿个1TB硬盘来存储数据信息。

当然了,大数据之所以被称为大数据,并不仅仅是因为其数据量大,而是指为了更经济地从高频率获取的、大容量的、不同结构和类型的数据中获取价值而设计的新一代的技术和架构。

鉴于大数据具有的潜在的巨大价值和对世界的影响,有些国家未雨绸缪,将其视作战略资源,并提升为国家战略。

2012年3月,美国总统奥巴马政府宣布推出一项发展计划——“大数据的研究和发展计划”。这项计划涉及的部门很广,有美国国家科学基金、美国能源部、美国国防部高级研究计划局、美国国家卫生研究院、美国国防部、美国地质勘探局等联邦政府部门。此外,美国政府承诺,将投资2亿多美元,大力推动和改善与大数据相关的资料和信息,以期从这些收集到的信息中获得有用的知识和洞察未来的能力。

美国奥巴马政府宣布投资大数据领域,表明了大数据正式提升到战略层面,带动了其他国家对大数据在经济社会等领域的重视。各国一致认为:未来国家层面的竞争力,将部分体现在对大数据的运用及规模上。

2013年2月,法国政府发布了一项关于《数字化路线图》的技术措施,列出了五项将会大力支持的战略性高新技术,“大数据”位列其中。在这项措施中,法国政府将以软件制造商、工程师、新兴企业、信息系统设计师等为目标,开展一系列投资计划,旨在通过创新型和科学性的解决方案,将大数据运用到实际生活中。

2012年9月,日本总务省也发布了一项行动计划,提出“通过大数据和开放数据开创新市场”,以复苏日本为目的推进“活跃在ICT领域的日本”ICT综合战。以上信息表明,日本政府在新一轮IT振兴计划中,将会把大数据发展作为国家层面战略。

由此可见,各国能够将大数据视作战略资源,也是看到了大数据的潜在及内在价值。大数据的价值主要体现在三个方面。

第一个方面,是能够实现巨大的商业价值。在商业领域,大数据能够通过对顾客群体的分门别类,实现对每个群体量体裁衣般的独特行动,通过虚拟空间来挖掘顾客群体的新需求,通过分析顾客群体的行为特征,进行商业模式化、产品化和服务的创新等举措。别小看这些小小的分析,它将会产生巨大的商业价值。

最早因为利用大数据而受益的企业就是沃尔玛,它通过对顾客群体的购物行为等非结构化数据进行分析,成为一个最了解顾客购物习惯和需求的零售商。在美国,流传着这样的一个故事:有一天,一位父亲跑到沃尔玛商场,怒气冲冲地质问他们为什么将带有婴儿用品优惠券的广告邮件,发送给他正在念高中的女儿?然而,事实告诉这位父亲——女儿真的怀孕了。可是,这样隐私的事情,父亲都不会知道,而一个零售商会如此清楚?原来,这名女孩用搜索引擎搜寻商品的关键词,再加上在社交网站所显露的轨迹,才使得沃尔玛捕捉到了她的怀孕信息。看来,在大数据时代,商家可以比父亲更了解自己的女儿。

第二个方面是能够增强社会管理水平。在政府和公共服务领域的应用,大数据可以有效地推动政务的开展工作,提高政府部门的服务效率、决策水平和社会管理水平,从而产生不可估量的价值。2009年,Google公司通过分析美国人搜索最多的关键词,以及2003-2008年间,美国疾控中心季节性流感传播时期的5000万数据,成功预测出当年甲型H1N1流感的暴发和传播源头。要知道,这个结果远远要早于疾控中心官方。可见,大数据的效率有多快,有多高。

第三个方面是能够提高安全保障能力。在反恐、安全和国防等各个领域,大数据对各部门搜集到的各类信息进行自动化分类、整理和分析,能够弥补情报、监视和侦察系统不足等问题,从而提高国家安全保障能力。

为了提升中国在第三次工业革命中的发展速度,为进入下一个经济周期做好准备,我们的每一个企业、科研团队和政府,都有责任通过一些计划,有目的地搜集、处理、分析、索引数据。IBM(国际商业机器公司)设立了“智慧地球”项目,现在,中国也有一些行业(如通信运营商、金融银行企业单位、政府交通部门)在制订类似的行业计划,通过信息化改造实现海量数据的搜集和处理。这些数据在未来可能产生现在所想象不到的价值,也需要现在的企业家、政府部门做好准备。

总之,无论是以智能电网为基础的能源物联网,还是以3D打印为基础的数字化制造,大数据都是以第三次工业革命的“新石油”这一重要战略资源的形态存在。可以想象,未来云计算、物联网和大数据将成为基础设施,移动互联网和3D打印技术将成为共性平台,数据分析和机器人等人工智能控制将成为服务手段,那么数据、知识和价值的按需分配、多次挖掘将成为新经济形态的不竭动力。

第二章 应对传统模式的大数据思维

6 扩散思维

随着大数据涉及的范围越来越广,企业已经不甘于停留在与传统分析结合的第一阶段,而是想要运用大数据的扩散性,形成一种锐化的见解。简单来说就是,某些企业的营销人员不单单想要获得一般性的统计数据——消费群体的家庭住址、年龄阶段、性别比例,而是想要更进一步了解到消费群体购买行为中所包含的各类元素,即使消费者仅仅是在路上漫步时发生的或在洗手间无聊时发生的信息元素。

针对此类情况的分析,社会媒体已经开始使用新型的网络工具了。如某天你在登录Facebook的时候,会在一两秒内收到网站新数据库的工具图片介绍,还会附上链接。上面会有在某某城市,有和你喜欢做一样事情的人;你刚刚访问过的网页,你的朋友也访问过……诸如此类的,就是这些社会媒体网站正在挖掘哪怕只有一丝关联性和扩散性的、精准而复杂的大数据。

为了更好地分析大数据之间的关联性和扩散性,Facebook使用了HBase。HBase是Apache(世界使用排名第一的Web服务器软件)的另外一款产品,使用了独特定义的一组表格。我们来举个例子:如果表格的关键词是一个人,表列中的关键属性就可能有关于这个人的兴趣爱好或居住地等,HBase可以像Hadoop(一个分布式系统基础架构,由Apache基金会所开发)一样执行大数据处理产品的能力,以更迅速、更精细的方式来分析数据之间的连接。

除了这些,大数据在扩散性上面还具有其他优势,如网购、社会经济、民生、交通,等等。汽车方便了人们的出行的同时,也增加了城市的拥挤程度。以北京的交通为例子。北京有一个交通智能化分析平台,其数据通过分析源自路网摄像头、传感器、轨道交通、旅游、地面公交、出租车、客运等行业方方面面的数据,得出了这样的一个结果:高速ETC数据每天50万条;4万辆的浮动车每天会产生近2000万条记录;出租车运营为数据为每天100万条;交通卡刷卡的记录为每天1900万条;手机定位数据为每天1800万条……此外,还计算出了北京的人均上班平均用时为52分钟,全国平均人均上班用时39分钟。这些海量的数据,在体量和产生速度上都对存储和处理能力提出了非常高的要求。

当然了,这些交通网络的形成并不是凭借人类的想象,而是通过精准的数据测算出来的。这个过程就是如今最实用的大数据分析。在实际应用中,大数据有多种形式,还会衍生和扩散各类数据。如果仅仅是依靠传统的方法解决交通,如限行、限流,也只是治标不治本。不过,如果转变一下思维,稍微变动一下城市设计,或是采取不同的城市规划,甚至是安装略有不同的交通信号灯,都能为交通提供一些便利。

我们以美国的大城市为例:美国第一大人口城市纽约,有着800万城区人口,人均每天开车42公里。不同于北京的交通拥堵,纽约虽然拥挤人口密集,但并没有影响人们的出行。在纽约最繁华的曼哈顿区,有近70%的居民会选择公交出行,再加上纽约的公交系统十分密集,使得交通路线四通八达,因而,整个城市的运转效能得到了最大的发挥。

大数据的扩散思维不仅着重于大局,还方便了人们的出行生活。当你打车想要去某地时,你不必为了不熟悉路线而慌张,也不必担心出租司机绕路,只需要悠然自得地掏出手机,搜索一下两地的距离,最佳路线会在几秒之内呈现在你眼前。

的确,能够在最短的时间内到达自己想要的地点,还不任人宰割,这不仅是每个乘客的急迫需求,也是手机搜索服务不变的追求。

眼下,我们最真实的资讯获取以及扩散模式就是:每天上下班,利用等公交、地铁的空闲,用手机浏览各种信息,看到一些有趣的信息就会分享到微信朋友圈或微博等社交平台,以供大家浏览和点赞。周末或假期,人们不停地玩手机或电脑,从互联网中搜寻好的去处、好的美食,再约几个好友相聚,谈天说地……

这些,都依赖于大数据的精准分析和扩散性功能。

7 颠覆思维

在大数据时代,创新和转变思维就意味着进步,意味着发展。而传统的、守旧的思维已经不适用于这个时代。因此,转变思维是大数据时代的必然趋势。

云来创始人谌鹏飞曾说过:颠覆,不再来自同一行业的竞争对手,颠覆者的商业模式甚至完全不同于传统公司;颠覆者也不再遵循传统的颠覆路径。

网络上流传着这样一句话——移动说,搞了这么多年,今年才发现,腾讯才是我们的竞争对手。

中国联通和中国移动风光了这么多年,再加上政府的支持作后盾,到最后怎么都没想到——腾讯马化腾在很短的时间内,就打败了两个商业巨头,站在了胜利的讲台上!一个小小的微信软件运用,给了电话和短信致命性的一击!举个例子:有人说,国内最大的免费安全平台360互联网安全中心能够颠覆传统杀毒软件市场,成为No.1,靠的是两个字:免费!这话不无道理。在竞争激烈的互联网时代,在利益你争我夺的今天,谁有如此大的狠心,先咬自己一口呢?360做到了!它将用户的使用门槛降到了无门槛。就这一点,一下子就推广了360免费杀毒软件。其实,早在2008年7月,360团队就推出了360免费杀毒的测试版,但由于没有从用户需求角度出发,该产品有明显的弊端,如360杀毒太“重”、太卡、太笨,更不符合中国用户的使用习惯。因此,360团队失败得一塌糊涂。有人嘲笑它:免费有什么用?都没人用!有人讽刺:瞧瞧,360号称的免费杀毒,就是这德行,说是放卫星,却放了哑炮。或许是对360的懈怠和不放在眼里,也给了360整装出发的机会。接着,360开始反思,总结经验。要知道,在互联网时代,哪里有什么一时的输赢,只有一次次地站起来。抱着这样的信念,360脚踏实地,一步步前进。在这个过程中,360团队付出的努力和艰辛,只有那些也曾一点点完善过软件的人,才能真切地体会到:凡是用户提的问题,360的员工一定会追根溯源,找到问题的根本原因,再从用户的角度出发,找出最恰当的解决方案;凡是负面的信息,即使是竞争对手的枪稿,也要认真读,以期从中找到可以完善的地方;凡是竞争对手的产品一推出,360就会立即学习,并汲取对方的优点。2009年11月,360免费杀毒正式版推出。就在竞争对手丝毫没有把360放在眼里,认为这个白痴又给业界带来笑话的时候,他们没想到,360的到来就是一记重磅炸弹,让整个互联网沸腾起来。2010年年初,在腾讯抄袭360安全卫士推出QQ医生时,网络上有不少人惊呼:这对360是一个巨大威胁!可360团队却不这样认为,他们认为是腾讯给了他们一个学习的机会,能够从中了解并学习到,腾讯是怎样定义用户体验、如何俘获用户的。

或许是这种不同于常人的思维模式,才有这样的颠覆思维吧。由此,我们也知道了:在随时都有异军突起的今天,任何看似与你不相关的行业都有可能打败你。他们能够运用新型科学技术,开发出价值高于传统类型的新产品。在这些转变思维的人眼中,传统的模式即将退到时代的帷幕之后。

只有这种转变性思维,才能让更多的不可能变成可能,才能提高人们的生活品质。一旦人们改变了原有的生活方式,那些固守陈规的企业一定会遭遇前所未有的劫难!

在早些年,国美电器最鼎盛的时候,就有人预言它今后的路会越来越难走。果然,随着京东商城的到来,国美电器只剩下一地悲伤。因为,它醒得太晚,没有转变思维。而德国宝马在未来会逐渐关闭实体店,在网络上直销最新款的汽车。德国宝马曾这样强调过:现在已经是直销时代了!不管人们喜不喜欢,接不接受,都无法阻挡网络直销时代已经来临的事实!

跨界的从来不是专业的!诸多残酷的现实告诉我们:如果还停留在过去,不懂得转变,那只能被大数据时代淘汰!

8 量变思维

到了现在,大数据已经成为一种商业资本,甚至是一项非常重要的经济投入,因为它可以创造出令人咂舌的经济效益。的确,信息社会所带来的好处是十分显著的。比如,每个人口袋里都揣有一部手机,每天都会浏览各种各样的新闻;每个人的办公桌上都放有一台电脑,只为更便捷、更高效地工作;在每间办公室内,都会拥有一个大型局域网,里面包含了人们的各种信息。

一开始,信息本身的用处没有像现在这样引人注目。半个世纪以来,随着计算机技术全面融入社会生活中,信息爆炸已经积累到了一个引发变革的程度。整个世界充斥着比以往更多的信息数据量,无论是从科学研究方面,还是到医疗保险行业,无论是从银行业,还是到互联网行业,各个不同的领域都在讲述着一个相同的事实,那就是——数据量正在以爆炸式的形态增长着。

由此,信息总量的变化导致了信息形态的变化,也就是量变引发了质变。就连物理学和生物学都证明:当人们改变规模时,事物的状态也会发生改变。大数据也一样,量变导致质变。

比如,计算机数据处理能力的增长速度非常快,快得令人咂舌。这个速度比世界经济的增长速度还要快九倍;人类存储信息量的增长也迅速增长,比世界经济的增长快四倍;曾经,欧洲的信息存储量用了50年才增长了一倍,如今每三年就能增长一倍。

2000年,斯隆数字巡天项目启动时,位于新墨西哥州的望远镜收集到的数据比以往天文学收集的数据还要多很多,且花费的时间很短。在2000年,数字存储的信息仅占全球信息量的25%,其余的75%信息都存储在胶片、磁带、报纸等媒介上。

到了2007年,数字数据已经占到全球数据量的93%,只有7%是存储在报纸、书籍、图片等媒介上的模拟数据。到了2010年,信息档案已经高达1.4×2的42次方字节。到了2013年,世界上存储的数据信息量达到1.2ZB,其中非数字信息仅占2%。这么大的数据信息,如果刻在光盘的话,可以堆成五个相同大小的堆,且每一堆都可以伸到月球。早在公元前3世纪,埃及的托勒密二世曾费尽工夫收集了当时所有的书写作品,所以亚历山大图书馆完全可以代表世界上所有的知识量。但当数据的洪流席卷全球后,每个地球人都可以获得大量数据信息,都相当于当时亚历山大图书馆存储的数据总量的320倍之多。

瞧,世界变化就是这样快,快到出人意料和难以置信。历史学家伊丽莎白·爱森斯坦发现,1453-1503年间,大约有800万本书籍被印刷,比1200年君士坦丁堡建立以来,整个欧洲所有的手抄书还要多很多。换句话说,就是欧洲的信息存储量曾经用了50年才增长一倍,而现在约三年就能增长一倍。

在金融领域,信息量也出奇的大。比如,美国股市每天的成交量高达70亿股,这在以往是根本无法实现的;Facebook每天更新的照片量超过1000万张,每天,人们会在网站上点击“喜欢”按钮或写评论约30亿次,这就为Facebook公司挖掘用户喜好提供了大量的数据线索;谷歌公司每天要处理超过24拍字节的数据。这意味着,其每天的数据处理量是美国国家图书馆纸质出版物所含数据量的几千倍;谷歌的子公司YouTube也开始受益,每个月都会有8亿访客,平均每秒就会有一段长度在一小时以上的视频上传;Twitter的信息量几乎每年翻一番,截至2012年,每天都会发布超过四亿条的微博。Google公司的人工智能专家彼特·诺维格曾把这种增长与图画进行分析和对比,举出了一个意味深长的例子:他先要人们想象来自法国拉斯科洞穴壁画上的标志性的马——这些画可以追溯到17000年前的旧石器时代。接着,再想象一张马的照片或毕加索的画。当然了,这些画和洞穴上的壁画并没有什么明显的区别。但事实上,毕加索看到洞穴壁画时曾开玩笑说:从那以后,我们就再也没有创造出什么东西了。同样的道理,人们不能只把过去的信息当成唯一的标准,而是要不停地创新和相信创新。我们回想一下,壁画上的那匹马在当时肯定花费了很长的时间,但在现在,一张照片就可以解决了,并且能够以动态的形式来播放不同形态的马,如一秒播放24幅。而这就是一种改变,就是一种由量变导致的质变。接下来,我们再以纳米技术为例:纳米技术的原理是当事物升级到分子级别的时候,其物理性质就会发生改变。只要你明白这些性质后,便可以运用相同的原料做以往无法做的。比如,铜原本是用来导电的物质,当它到达纳米级别的时候,就无法在磁场中导电;银离子是具有抗菌性的,当它以分子的形式存在时,原有的抗菌性质就会消失不见。同样的道理,当人们增加所利用的数据量时,就可以做一些原本在小数据量基础上无法完成的事。

无论怎样,从量变到质变这一技术创新,都将成为行业转型和模式创新的引擎,同时为未来创造更大的可能性和想象空间。

9 优劣思维

事物都是一分为二的,有优势,也有劣势,大数据也是如此。

我们先来看看它的优势:大数据时代的到来,为在企业运营中打破传统思维,打破时空局限,提供多种创新思路,为时代进步提供了新的途径——它可以在海量的、零散的数据中,找到潜藏的、有价值的信息,从而让营销变得更智能、更精准、更高效。

以阿里巴巴集团为例。它打造的线上淘宝数据魔方,可以通过对产品的热销、消费者搜索关键、消费者的人流量等进行数据构建,形成一个个总结数据库。而阿里巴巴入股新浪微博,则是为了获取更多社交平台没有的数据。这样一来的话,社交平台与电商平台的数据库就完全对接了。对接之后,微博用户的海量数据就能用来预测用户需求的趋势,然后通过原有的数据库验证数据的有效性,从而产生贯穿用户行为全链条的数据。当海量的用户需求被详细捕捉并在生产、供应链、库存、物流等环节反映出来的时候,阿里巴巴集团就能够把握整个商业社会律动的脉搏。加上长期积累的海量用户数据管理系统,阿里巴巴集团深度挖掘内在的运营规律和用户的行为特点,推出了开放的电商云工作平台“聚石塔”计划——将复杂的数据和应用集合在一起,利用整个“阿里”的各方资源优势,如阿里云、淘宝网、天猫、支付宝平台等,通过资源共享与数据互通来创造商业价值和财富。

下面,我们再来看看大数据的劣势。

首先,大数据存在隐私泄露的情况。对于每个人来说,总会有一些是乐于与他人分享的,但也有一些是不愿意与他人分享的。但大数据体系本身,是不会考虑个体或群体是不是乐于分享的,而是自动自发地吸纳所有的数据。

随着互联网和移动设备越来越普及,有关大数据与隐私的问题也备受关注。毫无疑问,未来可以获得的个人数据量越多,信息量就越大。有关专家指出:可供分析的数据越多,信息就越“阳光化”,越不能保持“匿名”的状态。由此,就非常容易出现个人隐私暴露问题,甚至是个人隐私完全暴露的状态。

其次,大数据只能发现过去,不能左右未来。

在大数据时代,每一个Byte(字节)中都藏有一定量的数据信息。对这些隐藏的信息加以归纳整理,提炼出有价值的信息,正是“大数据”的意义和目的所在。但问题也因此而纷沓而来,如“数据的真实可靠性”“垃圾数据”“缺乏创新和不了解消费者需求”等。

以手机为例,最显而易见的就是摩托罗拉和诺基亚。最初,摩托罗拉V3系列大获成功,号称销售达一亿部,傲视群雄。但只在V3机型上做文章,缺乏创新,只会让消费者厌倦;2007-2010年,诺基亚的业绩如日中天,说塞班系统“一统天下”一点儿也不为过。无论数据上还是场面上,它都占据了有利的条件。但问题是,消费者对自己的需求并不明确,只有当产品出来后,才会惊叹,然后把旧产品扔在一边。因而不久之后,塞班就被IOS和安卓这些“新势力”攻城略地,打得溃不成军。

如今,摩托罗拉和诺基亚已经败下阵来,分别被谷歌和微软收购。除此之外,大数据还有很多的优势会在其他章节一一解读,但劣势也在一点点凸显。我们明确的一点是:大数据所制造和存在的价值值得被认同,但绝不是夸大。

10 冲击思维

大数据对人类的生活或工作有什么冲击?尽管人们对此各持己见,但它对经济建设、社会发展、文化生活、网络科学等领域有着至关的重要作用。就好比去年2013年火爆播出的亲子电视节目《爸爸去哪儿》,着实让电视行业和大众生活为之震了一震。没想到,一个电视节目能够引起民众的亲子热潮,还体现了大数据的冲击力。试想,如果没有大数据的存在,我们又怎么会知道,在世界的其他角落,有那么多喜欢观看这个节目的人,有那么多与自己志同道合的亲子教育模式。

大数据除了在电视节目方面对民众有了一定的冲击,还在互联网、手机等方面也存在一定的冲击性。阿里巴巴创始人马云耗时十多年建立了支付宝。支付宝表面上看起来牢不可破,且为人们带来了很多便利性。可在大数据飞速发展的今天,任何事情都有可能发生。就在2014年春节,腾讯发起了微信红包。无疑,这对支付宝的统治地位形成了冲击。有了第一次冲击,就会有第二次冲击,第三次冲击……就连马云都在焦虑如何面对这种情况,互联网圈子里其他人能不焦虑吗?面临着互联网的一次次冲击,微软也无奈宣布向手机和平板电脑厂商免费提供视窗操作系统,以此来抵抗谷歌的安卓操作系统。

事实上,互联网已经淘汰了很多行业。它不仅仅是一个创造价值的领导,也是一个毁灭性极强的领导。传统的商业模式在他面前,不堪一击。在互联网的冲击之下,传统的企业停滞不前,甚至再无利益可言。

就好比当下最火热的节目《爸爸去哪儿》《中国好声音》《中国梦之声》等,从表面上看,的确吸引了诸多眼球,可是这些东西也有一个弊端:那就是年轻人大多通过网上观看,而不是守在电视机前。由此,电视机使用的频率会降低。的确,现在的手机跟电视、电脑毫无差别。无论你在公交、地铁,还是在马桶上,都能观看节目。有了如此方便的渠道,又怎么会跟随老人们或一些居家人守着一个电视台呢。在不远的将来,也许会出现这样一种模式:一档好节目,可以直接跟互联网视频平台合作。这样一来,其观众很快会有上亿,节目的制作人也可以直接分享广告收入。一旦这种趋势形成,电视台的意义又在哪里呢?

再说一个被互联网冲击的领域——手机。小米手机的出现,对传统的手机厂商形成巨大的冲击。其实,小米的模式特别简单,就是互联网硬件免费的概念。小米手机之所以会卖得很便宜,性价比又相对较高,是因为它不再把卖硬件看成一个孤立的生意。在以往,用手机看节目或玩游戏,可能会产生付费。但小米手机没有这些,所以它一问世,就对靠卖硬件赚利润的手机模式产生很大的冲击。

微信对手机,也是一个巨大的冲击。但凡安装微信的手机用户,绝不会频繁地发信息或打打电话,因为都不如微信方便。尤其对于一些年轻的客户群来说。他们只需要轻点手指,就能够视频通话、语音聊天,还可以几位好友群聊,而且费用低廉。

可与此同时,有人禁不住问:依靠大数据的力量,真的能一次次给生活带来冲击吗?真能够认识世界和改变世界吗?在以往,人们总是会对自己的能力进行反思,随即提出质疑。在这世界上,总有些人宣称自己说的话很可靠,甚至认为自己说的话就是真理,但一次次的事实又告诉人们:你错了!或者说,你对得不完全。大数据也是这样,它不一定能改变世界,但却能帮助人们更清晰地认识世界,更灵活地运用数据,给生活和社会带来便利,能够给我们枯燥无味的生活带来冲击力!

现在,我们来总结一下大数据的冲击力体现在哪些具体方面:

第一个方面,大数据正在以无限的增长方式突破有限的增长。传统经济社会发展方式是有限的,物质财富和自然资产是有限的。比如,煤仅供开采160年,石油仅供开采40年……

第二个方面,大数据正在以效益递增突破。在传统的社会中,所依靠的发展方式是成本高,但效益是比较低的,而在大数据时代,投入的成本较低,回报的却是高效益、节奏快的。

第三个方面,大数据是和谐共赢的,它突破了对立和矛盾的发展。在传统的发展观念中,人们有着这样的心理和模式——你有我就没有,你多我就少。这样一来,富者越富、穷者越穷。从某种程度上,这不利于和谐发展和供应。而现在,大数据时代的发展是和谐的、合作共赢的。因为大数据所包含的东西可以复制、递增,甚至是共享。

所以说,今天的我们,必须得承认一个事实,传统的PC(个人电脑)互联网已经成为过去完成时,甚至今天以手机为核心的移动互联网也未必能代表未来。在这样的新互联时代,怎样才能把新来的用户群成功地转移到新的竞争战场?更重要的是,怎样才能在新的战场上理解新的游戏规则,甚至建立游戏规则?

具体而言,你是不是还像以前那样,认为搞互联网免费就是疯子,是傻子?你是不是还像以前那样,搞出八大亮点、十大功能,然后重金投入软文、广告,进行地毯式轰炸?你是不是还像以前一样,跟顾客一手交钱一手交货,就再也不想与顾客打交道了?你是不是还像以前一样,做出来一款产品说不上哪儿好,也说不上哪儿不好,然后差不多就供货了。

如此等等,还有很多,问题是,你是不是感觉哪儿出了问题,但是好像又看不出来哪里有问题?是啊,按照传统的经验来判断,哪里都没有错,但是你可能没感觉到,这个时代在发生变化。

这个时代是互联网的时代,你需要互联网思维,当然不是那种越来越“玄”的互联网思维,而是一种回归常识的互联网思维。

第三章 新数据时代的新思维

11 幂律思维

可以说,幂律是大数据所遵循的基本定理,这项研究成果给了人们一个能够预测未来的依据。那么,什么是幂律?它指的是几何平均定值,如有一万个连线的大节点有十个,有一千个连线的中节点有一百个,一百个连线的小节点有一千个……在对数坐标上画出来会得到一条斜向下的直线。幂律是控制人们生活节奏的根本

在《致命争吵的统计数字》一书中,有一个显著的偏差值,可以表示冲突的等级数。一些战争的伤亡人数超过百万,另一些战争的死伤人数只有几十个。根据这种显著的差异,便可以将造成少量死亡人数定义为零级,伤亡人数为十人的战争是一级,伤亡人数为百人的是二级,数千人的丧生定义为三级。

如果战争是随机发生的,那么按照常理推算,每次战争的死亡人数应该是相差无几的,但是研究数据结果并非如此。在1820-1949年,共发生了282次战争中,有188次是三级以下的小型战争。通过数据观察,就可以知道伤亡人数与战争数量之间的关系遵循着一个简单的数学规律,也就是“越少就越大”。这是什么意思呢?

19世纪的经济学家维弗雷多·帕累托发现了这样一种现象:大多数人都是贫穷的,只有少数人积累了大部分财富,富人的出现并不令人吃惊。令人吃惊的是,富人的富有程度远远超过财富随机分配的一般水平。

研究的数据表明,战争和财富能够符合幂律的分布,小事件与个别大事件是完全可以共存的。在大数据“肆意传播”的世界中,如果没有数据分析的力量,谷歌和雅虎不会吸引数以百万的点击率,比尔·盖茨也不可能聚集如此之多的财富,战争也更加不应该造成那么多人的伤亡。然而,真实的世界是非常残酷的。幂律分布的本质就是能预测出这些,告诉人们总有严重偏离平均值的异常值。也就是说,一旦幂律出现,就会有异常值出现。幂律和爆发点的相伴相生

在日常生活中,人们会参加会议、看电影、约会、吃饭、睡觉等,总之,会做很多事情。所以,人们无法一直待在电脑前查收邮件。但只要有时间,人们就会查收邮件,在短时间内发送回复或写邮件。而这就形成了数据模型中的一个爆发点。基于这样的生活节奏,人类活动中出现爆发点就不那么稀奇了。一旦幂律出现,爆发点的出现也就会随之出现了。短时间的活跃和长时间的耽搁相互交替,形成一个精确的规律,这个规律往往会被人们所忽视,但又是人类行为所共同遵循的。

无论是邮件还是网页搜索,人类的行为都遵循着幂律的法则,我们研究了图书馆中学生们借阅图书的数据,以及人们打电话所产生的相应数据,结果完全在我们的意料之中,幂律的法则与人类行为相伴相生,更与爆发点相伴相生。

不论我们观察哪种人类活动,都会有相同的“爆发”理论出现:长时间休息之后,就一定会出现短时间的密集活动,所有的一切都证明,爆发,无处不在。爆发改变了一切

牛顿的万有引力定律之所以有极大的影响力,主要是能够对行星、火箭以及卫星的运行轨迹起到预测的作用。研究人员曾预测过新闻的生命周期为36分钟,而事实上,大部分新闻的生命周期要比36分钟长很多,甚至高达36小时。因此,解释幂律法则正确的结果是这样的:在浏览中意的网站时,人们绝不会每小时点击一次,而是在一个时间点上一个劲地点击,过了数小时或数天后,或许还会浏览这个网站,累计的时间一定会超过36分钟,从而保证我们看到最新的讯息。

总之,幂律思维不仅能在技术上体现出来,还能够在现象上体现出来。这一方向,将随着时间的发展和大数据的海量信息,具有越来越重大的意义。

12 效率思维

随着科技的进步,人们的频繁行为已经使数据以惊人的速度产生着。毋庸置疑,这些庞大而繁杂的数据在制造垃圾的同时,也在孕育着商机。大数据的精准和效率

2013年6月,搜狐集团董事局主席兼CEO张朝阳在搜狐视频自制内容“梦工厂”战略发布会上,对搜狐大数据方向的业务发展做了新的表态。他认为,从目前来说,《纸牌屋》在大数据支持下取得成功的模式还不适用于中国。《纸牌屋》靠的是大数据分析,而中国远远未达到这种精细的程度。

同时,张朝阳还指出:数据分析在广告模式上有着迅速的发展。比如,搭建好的搜狐的云存储平台,能够让用户明显看到和感觉到,其在图片存储和加载等方面有所提升。此后,搜狐视频还会将大数据着重应用于广告业,提供更精准的广告,从而更大程度上提高广告的效率。

据有关人士透露,搜狐基于云计算的大数据平台将旗下数据资产全面“打散”整合,并通过由浏览器、搜索、门户、游戏、无线等业务带来巨量的数据资产。接着再了解和分析中国互联网用户的习惯和喜好,帮助用户实现精准投放的目标和目的。大数据能掌控电视剧收视率

电子科技大学教授周涛曾在金沙剧场举办了一期讲座,是关于大数据时代的。周教授在讲解大数据时代时,多次以当下的热门话题举例,并通过对大数据解读,得出结论——利用大数据不仅可以掌控电视剧的收视率,还能获得人们的行踪等。

周涛教授这样说道:“在大数据时代,我们强调的先进工艺技术,不再是轧钢技术、化工品的冶炼等,而是在于我们有更强的分析能力,用更聪明的头脑从同样的数据中挖掘出更多的东西。”

关于大数据,周涛教授还解读到,数据的分析能力和数据的储备将成为未来新型国家最重要的核心战略。此外,对于大数据1.0,他举了这样一个例子。Netflix是美国的一家大型的网络租赁VCD和DVD的公司,其数据库记录着数十亿次网络用户点播以及评价。后来,美国的Netflix公司决定投资1.2亿美元,改编拍摄《纸牌屋》,但是由于该公司为租赁公司的背景,没有拍过任何一部电视剧,所以在开拍最初,受到了多方面的质疑。不过,这部电视剧在自第一季开拍起,就获得了美国史上电视剧单集收入最高的好成绩。

周教授对于这件事的看法是:“Netflix在拍摄这部电视剧时,没有按照以往依赖导演经验的套路拍摄,而是分析了大量下载点播的记录,搭配起最好的导演班底、演员班底,同时找到了最好的题材。”

此外,在《纸牌屋》播放的过程中,Netflix公司对网民评价进行实时监控,随时关注观众的意见和建议,以便于随时改变剧情。比如,在韩剧《来自星星的你》热播时,有观众抱怨男主角的衣服过于单调,剧组知道后,立即按照观众的意愿,调整男主角的着装,时不时加上一些配饰。而这,就是把数据采集传输和挖掘分析结合在一起的结果。大数据还能追女朋友

通过大数据技术,如微信、微博状态等社交网,就可以轻易知道一个人的行踪,她喜欢什么、爱吃什么,喜欢什么颜色,是安静的性格还是活泼的性格,最爱去的地方以及将要去的地方等,虽然这在一定的程度上暴露了一些隐私,但也确实是追女友的必备功课。

周涛教授曾讲过周围人受惠的地方——他的一位同事被安排相亲,或许是出于本职工作的敏感性和探索性。在与女孩见面之前,他通过女孩留的手机号和姓名,在网上顺利找到了她发布过的大量文章、工作轨迹等,还做了很细致的调研。这样就更加了解对方,见面后不至于冷场。如果互有好感的话,还可以投其所好,寻求更好的发展。

13 邮件思维

大数据邮件思维是什么?是在用户默许的情况下,通过电子邮件的方式向用户传递有价值信息的一种营销手段。营销手段是利用邮件与用户、客户进行商业交流的一种直销方式。在网络营销领域,邮件也广泛应用于其中。一说起电子邮件营销,最让人头疼的就是那些垃圾信息。人们最容易联想到垃圾邮件和广告邮件。事实上,处理垃圾邮件已经变成白领们的困扰,因为在垃圾邮件中也夹杂着有价值的信息。如果不小心清理的话,那查找价值邮件就有些苦难了;而且清理的话,还要占用宝贵的时间……会员才是邮件营销的核心

最早的邮件营销案例出现在1994年,从诞生到现在,邮件营销已经有20年的历史。在当时,美国的一对律师夫妇向客户发送绿卡邮件,取得了非常不错的效果。与传统的纸质邮件相比,邮件营销更高效、更快捷。于是,邮件营销很快就形成一个新的行业。

除了高效和快捷,邮件营销还有着其他特点,如可以一次性发给很多人,也就是现在人们常说的群发;可以设置时间,在规定的时间点发送,而不必趴在电脑桌前等时间;具有针对性,针对不一样的客户,不一样的性别,可以改变称谓或内容,可以看到用户有没有阅读。大数据时代的邮件营销

曾经,邮件营销最注重的是数据信息的收集和整合,各行各业都希望用“短平快”的方式,直接购买邮件地址,不断地给用户或客户发送营销邮件,从而明确目标群,获得订单。但这种营销的效果越来越不明显。

大数据时代的到来,直接影响着人们的工作、生活和思维方式。作为站在时代前沿的IT行业的人才,应该尝试新的一些东西,从而创新。由于多年来在邮件营销领域的经验和积累,webpower获得了海量的用户数据信息。通过对这些数据的分析和整理,webpower将为客户带来昂贵的价值。不过,像送达率、点击率这些基本的数据,只是做了浅度的分析。而在大数据技术的支持和帮助下,webpower可以针对用户点击的内容进行深入分析和挖掘,为其制定个性化的邮件策略。此外,webpower还可以对用户使用邮箱的历史数据,设定为触发式邮件。在必要的时候,可以启用短信、微信等参与进来,提醒用户哪些是有价值的营销邮件。

正是基于如此先进的分析技术,webpower才获得了诸多用户的青睐。在这些用户中,也衍生出了新客户。这些新客户,有来自世界各地的企业,有知名的公司,还有成功的电商。前不久,在江苏无锡举行了一场由厦门赢时代公司主办的2013GOMX全球网络营销大会。作为综合性的年度网络营销大会,主办方邀请了来自国内外约200名嘉宾和2500多位广告代表。此次活动中,设置了多个分会场。如整合营销、社会化营销、搜索营销、数据分析和数据库营销等,淋漓尽致地解读了网络营销全产业链条以及专家们的实战经验。

作为网络营销中最早、最广泛应用的手段之一,邮件营销以低成本、高效率和富有针对性等特点得到了人们的认可。不过,也有人认为,邮件营销的价值已经被开发得差不多了,几乎没有什么再开发的必要了。但实际上,邮件营销的潜力还没有完全被开发和挖掘出来。

随着网络营销的深入挖掘,用户们逐渐开始重视基于数据价值挖掘的邮件。Focussend的市场总监rebecca这样说道:“基于数据价值挖掘的邮件营销是未来的趋势,通过对用户的行为进行分析,以此实现对邮件持续的优化,以达到提升邮件营销的效果。目前,基于精准的数据的邮件营销可以通过与企业CRM系统、数据库系统结合,来实时获得用户信息,建立个性化的邮件营销。”

不管怎样,邮件营销与网络营销、数据库营销以及新媒体等的结合越来越紧密。如何提升邮件营销给企业带来更大的价值,是IT行业急需探索的问题。

14 定位思维

亚马逊公司的总裁杰夫·贝索斯曾这样说过:“如果我的网站上有一百万个顾客,那我就应该有一百万个商店。”

现如今,网站零售在挖掘顾客喜好时运用了两种方式。第一种方式是从消费者的购买行为上来判断他们之间相同的地方。比如,当你在网上买电子产品时,网站就会跳出对话框或在网页下端提醒你——购买这款电子产品的人也购买了其他哪些电子产品。就是这样,网站零售商找到了“人以群分”的结合点。第二种方式是从商品上入手,网络零售商通过判断商品之间的关联性推荐给消费者。比如,你想要买一件裤装,网站就会推荐一款T恤或衬衫,从而找到“物以类聚”的结合点。

其实,这类的推荐引擎已经很常见,但大数据还能做得更多。比如,当你登录购物网站,浏览了几款商品后,即使你最后没有下单购买,不被计入交易记录,但你的浏览行为已经折射出了自己的喜好。再比如说,你在购物网站上浏览一款产品,大数据从你浏览停留的时间,就可以分析你潜在的购买意愿。

在不远的未来,大数据会挖掘得更深度,更贴心。比如,当你想买一套护肤品或一双皮鞋时,还没等你列出精准的关键词进行搜索,网络就自动推荐给你适合的那一款。是不是觉得很神奇?网站怎么知道你想要什么,还这么贴心呢?也许是你之前曾搜索过类似的关键词或浏览过,再或者,你刚在微博上讨论起这个品牌的产品。

而在传统的销售行业中,会按照年龄、收入、性别、婚否等把消费群体进行分类,从而得出一个“细分市场”。在这种分类里,只有标签化的消费群体,没有个人化或个性化的东西。打个比方:你每月的工资在5万元以上,那肯定就是所有销售行业的目标客户之一,也就意味着你的消费观念是比较高端的,用什么东西都是最好的,买什么东西都是最贵的,用什么服务都是最贴心的。但事实真的是这样吗?未必!也许你的收入很高,但对物质消费方面的需求很低,就算是买商品,都是平价的、舒适的。

下面,我们来看一个关于抛开传统思维、定位准确的事例——余额宝增长的秘密:定位草根。2013年夏天,随着余额宝的火爆,杭州显得特别火热。阿里巴巴小微金融服务集团一位高管向记者表示:“我们这几个月接待了好几拨基金公司的高管。”从6月13日上线以来,“余额宝”的发展一直处于快速膨胀之中。到了6月底,用户已经高达250万户;到了8月中旬,“余额宝”的储蓄金额已经超过200亿元;到了年底,“余额宝”的储蓄金额更是超过500亿元。

无论对什么行业来说,这样的成绩都令人为之惊叹。也因此,有很多企业纷纷来到杭州与阿里巴巴集团洽谈合作事宜。尽管在此前,在这些洽谈者中,有些人还对在淘宝上开店的前景感到堪忧。可就在人们“堪忧”、犹豫的时候,阿里巴巴集团“入主”天弘基金,以支付宝为平台的一系列互联网金融产品完美诠释了“肥水不流外人田”。余额宝定位草根

一位基金公司高管认为:“余额宝的成功,实际上是与互联网开放、服务草根文化密不可分的。”阿里巴巴小微金融服务集团理财部总监祖国明表示:“事实上,很多银行对在互联网时代可能占80%的草根用户,服务是很不到位的。”

一位银行业人士表示:“银行‘嫌贫爱富’从一定程度上说也无可厚非。小微金融是脏活累活,大企业做一单比小微企业做上百单都赚得多,银行做小微金融是投入产出比效率很低的业务。”

有些银行明确规定过:银行卡里的金额低于银行规定的一定量金额数时,将会向账户收取管理费;此外,银行理财的购买起点也以万计算。而普通用户并没有足够的可支配收入去购买理财产品。但与此同时,银行家们不要忽略了这样一个事实——即便普通用户没有足够的资金,也不代表他们没有理财的意愿和想法。换句话说,如果将普通用户集合起来,积少成多,那总金额也会是笔不小的数目。

与总资产规模超过百万亿的银行相比,总规模在3万亿左右的公募基金行业,一直渴望和试图挖掘普通用户。但在余额宝没有出现之前,很难找到突破口。

一位互联网金融业内人士表示:“首先,阿里对互联网的理解相对传统金融机构更深,并且天弘基金这样的中小基金公司创新动力也比较足;其次,阿里的用户基数巨大,沉淀资金量很高。”

余额宝的成功,最重要的就是定位准确。余额宝将目标群定位于“月光族”“白领”,还掀起1元起卖的“草根理财盛宴”,且随时随地可存可取,非常方便,还免去了排队、填单、等号、网上开户等烦琐手续。可以说,只要会上网的人,就会使用余额宝。

一位接近监管层的人士表示:“互联网时代,多点几下鼠标,客户可能就没了。传统基金公司尽管有些产品申购金额较低,但烦琐的开户流程阻碍了潜在客户的开户意愿。”而支付宝用户购买余额宝产品,不需要填表、打钩等,只需要在支付宝账户里,点击“转入”就可以了,方便快捷。

天弘基金副总经理,增利宝余额宝项目组组长周晓明此前曾表示:“小公司走老路,干是找死,不干是等死。穷则思变,中小公司一定要创新。”

2013年10月9日,天弘基金的股东之一内蒙君正,就天弘基金增资扩股和全面业务合作方面发布公告:内蒙古君正能源化工股份有限公司及天弘基金其他股东与浙江阿里巴巴电子商务有限公司达成框架协议。按照协议,阿里巴巴集团将以约11.8亿元出资持有增资后的天弘基金51%的股份。即便如此,在收购天弘基金之后,阿里巴巴的基金业务发展也依然面临着挑战。“在阿里收购天弘之后,天弘可能借助阿里的平台成为中国最大的基金公司。”前述基金公司高管认为,“但公募基金行业最终仍需要靠投研实力、产品业绩说话。”

济安金信公司副总经理、基金评价中心总经理王群航这样认为:阿里巴巴集团入股天弘基金以后,形成最大的基金公司注册资本金,且是第一个非金融机构的大股东。但其“会不会涉嫌利益输送,是不是能够公平对待所有的基金公司、基金、持有人”,也成为一个待解的疑问。

不管怎么样,在现代社会中,每个人的需求和情绪都是独一无二的,每个人的个性都是独特的,他们需要自己做决定——自己需要什么,不需要什么,而不是呆板地等着别人告诉他“你需要的是这个”“这个适合你”……

此外,在传统的销售行业中,我们往往只是依靠传统的市场调研和市场分析方法,但是这些远远不能定位每个消费者,包括其行为习惯、需求。而这一点,大数据时代就可以轻易做到,还能节省不少人力和时间。销售行业可以通过用户数据路径的全程记录和分析,来定位、区分人群,并找到彼此之间相关的东西。同时,还会借助每个消费群的大数据,发动每一位员工监测或参与管理潜在的消费者群体,建立和实现一对一的对话交流。

15 逆向思维

股神巴菲特有这样的一句名言:别人贪婪时我恐惧,别人恐惧时我贪婪。说实话,这是逆人性的,因为大多数人买股票都是追涨杀跌,所以他们都成不了巴菲特。换句话理解,就是人们需要有一种逆向思维,这也是对创新的另一种理解。苹果的口号是“非同凡‘想’”。的确,只有不同于寻常人的思维和理念,机会才会更大一些。

一些创业者,刚进入互联网的时候,就会先看看主流是什么,什么最受欢迎,什么会以最快的速度盈利,等等。其实,你越是这样想,就越分不到一杯羹。先不说盈利,就说你在品牌、资金或是资源等方面,都跟那些大公司拼不起。所以,小公司必须看到大公司看不到、做到大公司还没做到的推特(Twitter)的兴起就是一种逆向思维的创新。与传统博客不一样,推特对字数有一定的限制。比如,大部分博客都是任由博主来写,写多长都可以。但推特不行!它只允许你写在140字左右,这就意味着你的话必须精简。而脸谱网(Facebook)又与推特不一样,博客、推特上的人可以是认识的,也可以是不认识的,但脸谱网之间的用户都是相互认识的,且是双向的。也由此,局限了脸谱网的发展。

如果丧失了一个市场机会,那么其他公司就会学习其优秀的一面,并完善有弊端的一面。不论你踩着别人往上爬,还是别人踩着你往上爬,这都说明了一个逆向思维的问题。一些有背景的大公司在面对一些突如其来的竞争时,会盲目投入更多的资金、资源,试图力挽狂澜,不过在大多情况下都是失败的。IBM公司曾经是世界上最大的计算机公司,也曾是世界上经济效益最好的计算机公司。1985年,IBM公司的通用大型机毛利率高达85%,中小型机毛利率高达50%,占世界通用大中型计算机市场的70%。然而,命运女神在眷顾了IBM后,又让天平稍微倾斜了一下。到了20世纪80年代后期开始,计算机开始向小型化的个人电脑发展。到了1993年,IBM公司连续亏损,亏损的金额高达168亿美元。这时,IBM公司开始慌神,并且醒悟:自己已经不是电脑业的象征主导者了!如果再恪守旧的发展思路不变,那样只会被淘汰,被击败。为了集中精力进行硬件开发,IBM公司就把个人电脑的操作系统授权给了微软公司。没想到,随着IBM个人电脑兼容机的大规模普及,微软和英特尔占据了个人电脑产业系统的核心位置,而IBM硬件则逐渐被边缘化了。为了争夺在计算机的主导地位,IBM公司毅然与苹果结成了联盟,并很快推出PowerPC芯片,目的是撼动英特尔对个人电脑业的控制。接着,IBM重点开发OS/2操作系统,抢夺微软视窗系统在台式机上的市场。令人遗憾的是,情况并没有得到多大改善,随着康柏和其他电脑制造商加入微软联盟,IBM公司彻底被打败了。到了90年代中期,IBM公司的新任董事长郭士纳做出决定:不再以OS/2操作系统和微软视窗系统在台式电脑上竞争,而是向软件和服务转型。最后的结果,还是失败了。10年以后,苹果公司运用逆向思维,另辟蹊径,用一种全新的方式建立了新的产业形态,撼动了微软和英特尔的领导地位。比如,有一家叫AMD的公司一直在跟英特尔竞争,却一直不能超越英特尔。这是为什么呢?因为AMD公司一直被英特尔的游戏规则牵着鼻子走,只比谁计算能力更强。而在另外一家小共公司ARM却运用逆向思维:你要牵着别人的鼻子走,我偏偏不跟你走。其实,ARM公司不比谁的计算能力更强,所以他也不往这个圈子硬挤,而是比功耗低,做低端市场,还专做不起眼的手持设备。没想到,这毫不起眼的小装备,一举获得成功。如今,就连苹果、三星、华为做自己的芯片,靠的都是ARM公司的授权。

逆向思维运用得好,就会将缺点变成优点,把不可能变成可能。

纵观这些企业之间的竞争和案例,无不告诉我们这样一个道理:当你面对强手的时候,千万不要被对方牵着鼻子走,而是寻找到自己的节奏,迈出适合自己的步伐,脚踏实地,并懂得“想他人所想不到,做他人所做不到”。如果一味盲目跟随,那也只能落个跟班的小名声。所以说,在竞争如此激烈的大数据时代,要想有所成就,必须要逆向思维,能进行逆向操作,这样才能寻找到一种全新的模式来竞争。

第四章 大数据能量的积累与爆发

16 关联思维

目前,大数据成为各行各业人士口中出现频率最高的热词之一。有人认为,大数据的到来,加上云计算的成熟,让人们从高频率、巨量信息、不同结构和不同类型的数据中获得有价值的信息。

这些有价值的信息里,还透露出一个信息,就是大数据的关联性。举个最简单的例子,你的好友购买了一件连衣裙,把链接发给你,你就会看到这款连衣裙的网页中有其他同类产品。再比如,你在网站上搜寻一款东西,网站会立即给你推荐,其他人所选的是哪一款。

从数据中寻找出一定的相关关系,通过这种关系,大数据会做出预测,从而告诉大众结果。这就是大数据方法论的核心思想。

麻省理工学院气象学家洛伦兹曾向人们介绍过一种现象——“蝴蝶效应”。大致讲的是:一只南美洲亚马孙河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,两周后,美国得克萨斯州掀起了一场龙卷风。从表面上看来,似乎这之间毫无关系,但结果告诉我们,即使是微小的事情也极有可能与千里之外的一件事情发生关联,并带来改变。

而在大数据时代,任何事情都可能会发生。这些事情从表面看风马牛不相及,但其内在往往具有一定的关联性,并与我们的生活息息相关。在以往,大多的寻人启事都石沉大海,但在互联网时代,寻人帖子一经在大型网站上发出,会很快引起四面八方的注意,每个人都会提供自己知道的线索。将这些线索分析,整合,就能够得到这个人最后出现在什么地方、某人曾经在哪里遇到过,以及这个人为什么走失等;另外,你也很难想到,互联网上的微博评论会与某家公司的股票价格有着一定的关联性。在脸谱网首次公开募股当天,在推特上的情感逐渐转向负面的时候,脸谱网的股价也于开盘25分钟后下跌。当推特上的情感转向正面的时候,脸谱网股价在8分钟后又迅速反弹。当股市接近收盘、推特上的情感转向负面的时候,脸谱网的股价又开始下跌。这两者之间究竟因为什么联系在一起,并互相影响着?这,似乎并没有太多人探究,不过,忽略这种相关性,不得不说是一种损失。

对于关联性的一些例子,我们能举出很多。它让我们不得不相信,大数据之间的关联性,已经不能够被人们所阻挡。比如,前面提到的那个家喻户晓的啤酒与尿布的案例。如果单独一个产品,或许没有任何惊喜,但两个产品一旦联系起来,那发生的化学反应就值得人们注意了。这就好像,过生日一定要有蛋糕,有蛋糕的话就一定要有浪漫的氛围和温馨的东西。那么,很自然的,当人们都选择与爱人一起过生日时,鲜花、戒指、饰品等产品就有了销路。而当人们都选择与亲人一起过生日时,鲜花、服饰、贴心小礼物、给父亲的剃须刀、给母亲的丝巾等商品就会热卖。

这一切的一切,都是关联思维在起作用。似乎,这些东西不被关联在一起,单一的东西过于另类和枯燥了。

除了一些生活中的小细节,还有更为精准的数据预测。一家公司正在从社会化媒体上抓取各种数据,通过寻找影响票房成绩的相关因素预测票房。该公司针对电影选取30个参数,对演员选取50个参数,内容包括:在什么地方成长,在什么地方学习,成绩如何,什么时候毕业,曾扮演过的角色,曾参演电影的收视率和票房怎么样,以及各种绯闻,等等。就是根据这些数据和参数,2012年下半年,电影《1942》上映前夕,在外界对这部电影一片赞誉和看好,纷纷预测票房将突破7亿元时,这家公司预测出电影《1942》的票房是3.8亿元,会亏本。在当时,制片方认为这家公司是在“黑”他们。但事实告诉人们:这不是在“黑”,而是在陈述事实。最后,《1942》的票房真的只有3.6亿元。

在整件事情的过程中,人们只知道那家公司运用了奇怪的预算方式以及各种数据,却忽略了,一切事物都是有关联性的。比如,观众对题材的喜爱程度,对演员的喜爱程度,对演员演技的评价,对导演的信任度,对宣传的买账与否,以及有多少人愿意花几十元钱去电影院观看。还包括在同一时期,有没有与其竞争的影片,有没有比其更新颖的剧情以及热点,等等。

这些,都至关重要。而大多数人只知道“是什么”,不知道“为什么”。进入大数据时代,海量的数据汹涌而来,互联网信息的更新速度之快和环境变迁的速度之快,远快于人们思考和验证的速度。与此同时,关联性也越来越突出。当然了,相关关系不能准确地告诉我们什么事情会发生,但它会提醒我们,有些事情正在发生。在许多情况下,这种提醒已经足够强大。如果我们知道什么时候是买机票的最佳时机,就不用费劲去查询价格的波动规律。如果我们知道什么地方要下雨或是晴天,就会提前决定带伞及准备好出行衣物。

这些,都是关联性的作用带来的。

17 双刃思维

2013年,前不久,为了推广手机“生活圈”功能,淘宝网公布了一组“奇葩”数据:国内最爱吃鸭脖子的生活圈是杭州市的日晖新村,这里的用户全年用于买鸭脖子的费用有6万多元;最“重口味”的生活是镇江市的花山湾生活圈,这里的用户一年买了5000多个榴莲;在一年内,暨南大学的“生活圈”购买了一万多箱方便面,支付金额近150万元;温州龙湾区×路附近,全年花费在情趣内衣方面的费用大约是人均2.5万元;2013年,浙江义乌×二区全年花费在文胸的费用超过290万元,是全中国在这一年消费量最大的生活圈;宁波海曙区×家园中的用户,每个人均在淘宝网的年消费金额在2.8万元以上,是目前2013年国内在淘宝上消费“最土豪”的小区;另外,2013年,杭州×新村全年用于购买金条的金额在960万以上,是中国金条消费量最大的生活圈。……

为什么说这是一组“奇葩”数据呢?是因为手机淘宝可以借助于地理位置和收货地址等数据,鉴定某地区生活圈的消费特征。而这,正是大数据的“努力结果”。在以往被看作“核心秘密”的数据,如今却为了迎合消费群体的“八卦”心理开放功能。但与此同时,这个结果是真实的吗?有不少人对其质疑,甚至觉得所披露的数据还不够劲爆。下面的这些数据或许会让人在八卦的同时,感到一丝担忧。的确,如果你生活在被调查研究的小区,本小区的生活圈被爆爱吃鸭脖子或爱买金条,而你却恰恰不爱吃鸭脖子或买金条,那你是不是觉得很不自在?再或者说,如果碰到相熟的人调侃:你们小区怎么买了那么多情趣内衣,是不是你也作贡献了?那被问的人,该如何回答?

可以说,即便淘宝网的做法没有违反什么规定,也会让人觉得被侵犯隐私权了。针对一个群体的生活信息披露,就相当于把这个群体中的所有人都放在众人的面前,成为供众人观赏和分析,甚至是调侃的对象。在这个过程中,没有人会管你是不是果真如其披露的那样,也没有人在乎你是不是愿意。

淘宝网到底有没有权力公开这些数据?公开这些数据,会不会涉及个人隐私问题?很显然,这些都是不能忽视的问题。更何况,这些数据得出的结论也是可疑的。举个例子:如果一座大厦花费391万元购买安全套,按照每只价格3元计算,这就意味着大厦全年消费安全套共计130多万只。如果这座大厦有1000人,那人均消费1300只,如果有2000人,人均650只……这不科学!

针对这个疑问,有媒体进行了实地调查,结果发现这座大厦为商住两用楼,住户仅180户。由此,我们可以肯定,该大厦所产生巨额安全套交易量与住户的“性福生活”没有一丁点儿关系。也许是有商家的仓库设在这所大厦里。除了安全套的事情之外,其他的数据也可以以此类推,从而推翻先前的调查结果。

不可否认的是,数据库中的资料是巨大而详细的。只要企业有需要,大数据就可以精确无误地统计出各种消费数据。小到你网购了些什么,消费了多少金额,大到一个地区网购交易量和消费特征。

或许,这就是“大数据时代”具备的独特魅力。它不须通过问卷调查,更不需要人工的脑力计算,却可以还原社会原本的轨迹。正如《大数据时代》的作者维克托·迈尔·舍恩伯所揭示的那样,在“大数据”面前,最重要的不再是精确度和因果关系,而是探索事物之间的相关性,发现其潜在的巨大价值。

由于淘宝网公布的数据延续了传统的思维逻辑,再加上里面有迎合营销需要的结论,结果漏洞百出,闹出了不小的笑话。与此同时,这个案例也暴露出“大数据时代”的隐患:只要你在网络上活动,无论你在做些什么,都会被“记录在案”,甚至不知在什么地方,又以哪种形式被人揪出来。更可悲的是,你想不想出来的主动权不是由自己说了算,而是由网络运营商来决定。

由此看来,“大数据”是一把双刃剑,人们在享受大数据带来的机遇时,也不得不面临一个残酷的问题,以及可能爆发的大数据危机。

作为全世界共同的财富,大数据时代将是一个守护者和监督者,将以自身的“法器”,守护着这片土地,为人类创造出一个共同美好的世界!

18 价值思维

进入2012年后,无论是IT行业,经济学家,还是媒体,“嘴里”都是“大数据”这个词,似乎不讨论“大数据”,就已经落伍了。“大数据”真的那么具有吸引力吗?

事实上,大数据就是资源,就是空气,就是水,就像石油或煤炭一样,其价值不言而喻。网络用户每点击一次鼠标,每一次刷卡消费,都已经参与了数据的生成。可以说,每一个用户都是数字的生产者和消费者。

在大数据时代,凭借如此精细的监测手段,完全可以知道一个人或一辆车的行踪,从而产生精细化的数据,用以描述各种物体、社会和整个环境的行为。有了这些数据,大大减少了社会的复杂度。

在商业领域,一家美国的公司已经利用大数据,在亚马逊的云平台上处理跟天气相关的信息,从而帮助农业种植者保障自己的收益。我国搭建的中小企业信息平台,汇集了几千万家中小企业。通过对企业数据信息的深度挖掘和分析,能够对经济运行的状况进行准确的预警,从而做出正确的应对决策。

在金融领域方面,大数据分析早已成为一种流派,连大数据分析师都已经成为在美国华尔街基金股票分析和高频数据交易等领域最抢手的人才;在中国,阿里巴巴集团旗下的金融业务,也开始用大数据来发放“信用贷款”。

在行业中,甚至有人预言:谁拥有对数据的发掘能力,谁就能占领下一个十年全球经济发展的制高点。由此,大数据的价值可见一斑。

曾有人看到EMC(易安信)的一则广告——When Cloud Meets Big Data(当云计算遇到大数据),当时觉得很新奇。但此后的日子里,大数据已经成为国内IT行业口口相传的热门词汇,尤其是最近,Splunk成功上市的消息,释放了大数据在资本市场的潜力。

令各个行业兴奋的是,大数据时代带来了比以往机会更大的发展空间。这包括以下几个方面:

第一个方面,是技术创新的新空间。

2012年,北京拓尔思(TRS)信息技术股份有限公司围绕云计算、大数据、移动互联网和社会化计算开展了新产品的研发,随后相继推出了支持移动应用、TRS大数据管理系统V7.0和社会化计算新功能。与此同时,还在多媒体内容的深度挖掘和分析、大数据的可视化展现,日志挖掘分析等技术领域进行研发和创新。对结构化数据、非结构化数据和Hadoop/NoSQL等的认识理解和技术水平的提高,将跃升到全新的层面。

第二个方面是商业模式的创新。

从目前来说,拓尔思的主要收入还是来自软件产品的销售和技术服务。但是以TRS SMAS舆情分析云服务为代表的在线服务模式已经初见成效。大数据+云计算的新模式将大大降低用户的初始门槛和使用成本,大大扩宽用户的范围,优化服务的效果和体验,让大数据应用走出成本高、投资大、资源封闭的信息孤岛,让智慧常伴众多普通用户的左右,从而创造最大的价值。

第三个方面是信息资产的经营。

拓尔思信息技术股份有限公司的主营业务一直是软件产品的销售和服务,大数据时代给人们带来了新的机遇。此后,拓尔思成立了专门从事数据处理和经营的部门,汇聚了一批从事数据采集、处理和挖掘分析的专业人士。信息资产的经营极大地扩展了拓尔思的业务,比如,以往拓尔思以TRS数据中心为依托,承担了为用户提供专业数据分析和咨询报告的很多服务。相信在不远的未来,拓尔思在信息资产方面会有更多的机会和空间。

第四个方面是客户关系管理。

客户管理应用的主要目的是按照客户的属性,从各个角度挖掘和分析客户,以此来获得新的客户或提高客户的忠诚度、降低客户流失率、提高客户消费等。

有不少商家将飞信作为初级CRM(客户关系管理)工具来使用。比如,将客户们都添加到一个群里,接着在群里发布新产品的消息、促销产品通知,完成售前售后服务等。或者是,按照客户的行业进行分类,针对不同的客户采取不同的促销活动和服务方式,提供具有针对性的服务,再将提供线上支付的通道打通,形成闭环,打造一个实用的客户关系管理系统。

第五个方面是个性化精准推荐。

在运营商内部,根据不同的用户推荐各类不同的业务或应用是非常常见的。比如,IPTV视频节目推送和应用商店软件推荐等,通过关联算法、文本摘要、情感分析等算法进行计算分析后,可以将计算分析结果延伸、应用到商用化服务上。接着,再利用数据挖掘技术帮助客户进行精准营销,其未来的盈利可以来自客户增值部分的分成。

以“垃圾信息”为例子。其实,在“垃圾信息”中并不都是“垃圾”。那为什么会称之为“垃圾”呢?那是因为收到的人不需要,所以会将它当作垃圾处理掉了。而通过用户行为数据进行分析后,可以有针对性地给需要的人发送需要的信息,这样“垃圾短信”就成了有价值的信息。在麦当劳里,人们可以在手机上下载优惠券,去餐厅就餐时,出示优惠券就可以享受优惠。接着,运营商和麦当劳就会搜集相关的消费信息,比如,经常买哪款食物,喜欢的口味,去哪家店消费,消费次数的多少等,从而将优惠券精确地发送给用户。总之,大数据可以成就IT企业,也可以成就其他领域,因为其价值是不可估量的!

第五章 大数据引导的商业变革

19 知识思维

“核心竞争力”这一理念,是由美国学者普拉哈德和哈默提出的。他们把其定义为:组织中的积累性学识,特别是关于如何协调不同的生产技能和有机结合多种技术流派的学识。

巴顿认为:核心能力能够使企业具有一定的特色和竞争优势。而构成核心能力的要素是员工拥有的技术技能、企业的技术体系、管理体系和在企业中占主导能力的价值观念,这些都能反映各行各业或国家的基本素质和发展前景。大数据的核心是思想,不是技术

毋容置疑,大数据时代的核心是思想而不是技术。阿里巴巴的创始人马云就曾说过这么一句话:“在大家还没搞清楚PC时代的时候,移动互联网就来了;而在大家还没搞清楚移动互联网的时候,大数据时代又来了。”

随着国内移动数据服务平台Talking Data宣布已获得来自北极光创投的千万美元投资,大数据迅速地掀起了一股热潮。伴着这股大数据概念的汹涌潮流,2013年11月28日,Z-Club第120期“大数据与大商业”活动专场在京举行。

海银资本合伙人王煜全曾经这样说过,早在15年以前,他就推出过一款和大数据相关的产品,但当时的推广十分困难。对此,王煜全认为主要的原因是,主要领导对大数据的重视程度直接影响执行力度。他这样说道:“即便大数据目前在中国很热,但更多的仍是业内人士的宣传,真正需要用大数据的群体并没得到普及。”

为此,他还以电影《点球成金》为例子,分析了大数据在得到充分运用后所能发挥的作用。利用大数据来管理一支棒球队并不是没有可能的,电影《点球成金》就是球队根据数据来决定是不是雇佣或裁掉球员。虽然是在大数据的帮助下,球队才一路过关斩将赢得了最后的胜利,但是,教练员却对这样的方式不敢苟同!

王煜全还说:“大数据需要一定的时间做积累,初期的评判表现并没有传统数据的评判表现好。也正因如此,很多人没有熬过痛苦期,就给大数据判了‘死刑’。”说到大数据,不得不提的是“端到端”

端到端是一个面向大数据的解决方案。英特尔的理念是在这个解决方案里实现数据价值的挖掘。所谓“端到端”,前端视频采集、分析、存储,及后端数据中心处理等。2013年3月4日,媒体报道了这样的一则新闻:长春市一辆丰田轿车被盗,车里还有两个月大的婴儿。案发第二天,失窃车辆才被发现,但婴儿已经被残忍的凶手杀害了。

这则消息真是令人感到遗憾和伤心。当时,许多人都在质疑人们又不得不反思:街道两旁已装有数千个安防摄像设备,但是为什么没能帮助警务人员及时发现被盗车辆的踪迹,最终酿成惨案?

试想一下,如果当地拥有一个端到端的计算机架构,使不同摄像设备的关键信息被快速分析和整合。在前端,人们只需要把目标车辆的特征通过智能前端进行过滤,然后从所有的监控点中抽取相应的元数据,快速导入大数据系统进行检索和分析,就有可能在短时间内发现被盗车辆,从而阻止犯罪行为的发生。而这样做,还能节约存储产生的系统成本。

比尔·盖茨说过,在这个快速变化的商业世界中,企业必须具备与对手竞争的反应速度。要是有这样的速度,就需要有一种平稳和有效运行的能力,还需要有一种对紧急情况和机遇做出快速反应的能力,为公司提供有价值信息的能力,从而做出正确的决策。

总而言之,知识经济才是提高核心竞争力的有效途径。

首先,知识经济时代可以识别企业核心知识,并提高企业的创新能力。什么阶段什么层次的知识是核心知识,这都关系到企业今后的业务主流。

通过知识管理,我们不仅可以将知识实现可编码化,并易于储存,还可以很容易地识别出核心知识,从而引导企业管理者的决策。如果没有大量企业专有知识和信息管理的综合运用,那企业很难实现创新,也很难与其他企业竞争。

其次,信息化建设可以使知识管理更有效地进行,提高企业的核心竞争力。知识管理是对企业拥有的“知识经济”进行有效的管理,也是对企业管理进行变革和创新。

在信息技术普及应用的经济时代,如果知识管理没有借助技术平台协助的话,那就无法完整地发挥出知识的力量。因此,信息化能力本身也是企业的一个核心竞争力。

20 变革思维

随着互联网影响的逐渐深入,大数据也开始发散其能量,并与云计算一起被誉为“信息产业的第三次高峰”,与无线网络革命和智能化生产一起被誉为“引领未来繁荣的三大技术变革”。

大数据的价值不言而喻,但也有着两面性。一方面,大数据催生了一批新型科技公司,吸纳科技人才就业,并为企业发展转型提供了新机遇;另外一方面,大数据给个人、企业乃至国家带来了一些危机,如隐私、重构信息安全、竞争力差距拉大以及数据产权争端等问题。大数据时代“照亮”个性化

现如今,大数据改变了人们的生活,塑造出了不同的个性化思维。比如,人们白天在电脑前浏览网页或下个订单,第二天就能收到自己想要的东西;晚上出门消费,不再是给现金,而是刷卡;看电影也不再苦苦排队,而是提前团购或预订……由此,人们的行为举止都会被记录下来,从而产生数据。

再比如,气候公司会根据各个城市的气温高低、降雨量、土壤的状况和往年的农作物产量等情况,预测出第二年农场的产量,甚至还向农户出售个性化保险;在中国,阿里巴巴集团根据在淘宝网上中小企业的交易状况,筛选出财务健康和讲究诚信的企业,为其发放无须担保的贷款。

2013年8月,当《中国产经新闻》的记者采访电子科技大学互联网科学中心主任周涛时,周涛这样说道:“由于大数据已具备了每次工业革命中最重要的因素,新能源是计算,新材料是数据,同时还有先进的工业技术,也就是更聪明的头脑。”此外,他还认为:“我们在历史上第一次有机会把不同类型、来自不同地方的数据围绕着一个东西形成了一个完整的描述。”

再举个例子:我们得到了一个人的短信和通话数据、他微博的内容数据、医保和社保的数据,还有城市交通数据、签到数据、社交关系数据等。通过这些数据,我们就能对这个人形成深刻的认识,从而为其打造出完全个性化的服务。

而这,就是变革思维。通过大数据分析,企业不仅可以针对用户进行个性化的服务,还可以针对商品、地点进行个性化的服务。电子科技大学互联网科学中心主任周涛说:“这个个性化不是孤立的个性化,而是和第一次、第二次工业革命相结合,在规模化和自动化之下的个性化。大数据让‘自动地、成规模地为成千上万的人提供完全量身定制的服务’成为了可能。”

此外,周涛还说:“大数据商业模式的另外一个特点就是外化。我们可以把很多跨领域关联的数据通过合法的手段积聚起来,通过对这些数据的分析为众多行业和企业服务、提供决策指导方案,这就是典型的数据外化。”

在现今社会,有很多人都将其誉为个性化的时代,但如果没有技术做支撑,那个性化只能是“天方夜谭”。换句话说,只有清除掉技术上的障碍,个性化才能够得以实施,才能变为现实。

下面,就来说一下百度大数据关于技术方面的事例。百度大数据开放平台

百度大数据开放了三层平台,分别是云、数据工厂和百度大脑。开放“云”,是为了能够解决数据存储和计算瓶颈等技术问题;开放“数据工厂”,是为了能够把数据关联起来,挖掘其巨大的价值;开放“百度大脑”,是为了建立在百度深度学习和大规模机器学习的基础上。此外,“百度大脑”已经相当于2~3岁孩子的智力水平。

随着移动设备的普及,人们只要打开手机、打开电脑,就会产生源源不断的数据。无论是在某个PC网站上购物、搜索某条新闻,或在手机玩某一个游戏,都会产生和留下数据。

未来产生数据的设备,除了电脑和手机外还有其他设备。如可穿戴设备、智能电脑和电视、移动传感器、车载电子设备、手机定位器等。这些设备的产生和出现,会让大数据变得更丰富、更庞大。

在设备方面,百度公司开始尝试投资,如智能手环、智能手机等产品。百度公司还选择与第三方公司合作,其目的就是把百度的技术植入到这些硬件产品中,从而获得更多的数据。

百度公司CEO李彦宏把这一策略称为“baidu inside”计划,与PC时代的“wintel inside”有着相像的地方。但它们之间不同的是,“baidu inside”是免费的,而“wintel inside”不是免费的,并且价格昂贵。百度高级副总裁王劲这样说道:“现在这个时代,是一个数据大爆炸的年代,每个人,每个机构都要适应这一变化。”

此外,百度大数据引擎还推出了一些服务,比如,百度与央视做的“百度迁徙活动”,基于百度地图LBS开放平台,根据每天高达70亿次的定位信息资料,就可以知道春节期间人们行为的轨迹。当然了,百度大脑与语音识别技术相结合也有一些应用,比如可以将大量的婴儿声音上传到大数据中心提取特征。这样一来,父母们就可以跟网络上孩子的哭声做比对,指导孩子为什么哭,是饿了,还是撒娇等。百度工业革命

在不远的未来,百度公司要把百度大数据引擎开放给更多的企业,让他们在互联网的助力下,飞得更高更远。

百度高级副总裁王劲举了这样的一个例子,大致意思是说:随着可穿戴设备越来越多,大数据将能为人们提供更多的便利。比如,可穿戴设备可以24小时监控一个人的身体状况,包括睡眠质量的好坏、运动的频率和身体素质、血压、心跳,检测汗液等。此外,这些信息还会立即上传到大数据中心。如果把这些数据与医院的大数据连接起来的话,那这些数据的价值和医疗的便利性可想而知。

除此之外,百度大数据中心还具备很好的计算能力,可以从几百万心脏病患者的数据中找到病的共性,并提前两天由医院给相关人群发出警告,告诉这一类人:如果你再任由自己“怎样怎样”下去,就有可能得心脏病。要知道,预防病症的代价与治疗的代价相比要低很多很多。如果能够降低治疗成本,将其转换成预防的成本,那不仅会提高人们对疾病预防的能力,也能改变医患之间的关系。真是一举两得。

百度总裁李彦宏认为:“未来,数据会无处不在,无论做什么事情都离不开大数据。百度开放自己的大数据核心能力,将更好地帮助传统行业挖掘数据价值,加快传统行业转型升级,进而发挥出对整体社会经济的革命性影响。”此外,李彦宏还表示:海量数据的存储、关联和分析,不仅是大数据时代的关键,更是一次挑战,一次机遇。迄今为止,互联网的发展已有20年之久。在这20年中,最先受到冲击的是媒体——零售业——旅游。现在,金融业也受到了或大或小的冲击。在未来,相信会有更多行业被卷入到大数据风波中,且被卷入的速度越来越快。

21 生产思维

人类的行为是否可以被预测?

著名的科幻小说《三体》中有这样的剧情:整个宇宙中有许多人类还没了解到的文明,直到有一位地球人与三体人有了通信联系。接着,三体文明开始了解地球文明,并试图用“心理崩溃”的方式控制科学家,实现阻止地球文明进步的野心。

如果在当时的三体文明中有巴拉巴西,那就不用大费周折,就能预测地球人的行为举止了。在艾伯特-拉斯洛·巴拉巴西的新书《爆发:大数据时代预见未来的新思维》中,回答了“人类的行为是否可以被预测”这一问题。这位美国物理学院的院士这样说道:“在人类漫长的历史中,人类的行为并不是随机的,并不是泊松分布的,而是存在一定规则的。通过对大数据的分析,可以看到人类的行为规则是基于优先级排布的问题。每个人都有自己的任务列表,而如何按照优先级排列顺序则产生了不同的影响。”

换句话说就是,当你有紧急的事情,需要联系一个人时,你会用什么方式来找到对方?一个短信,一个电话,还是一条微博或一条微信语音?在艾伯特-拉斯洛·巴拉巴西的眼里,想要预测对方的行为,最好以快捷的方式判断什么是快速的、有效率的联系方式,从而挑选出可能性最高的那一种方式。如何运用“私人定制”思维

我们来用阿里巴巴集团的故事为事例,说明一下“定制化”思维如何预测。首先,要说明的是阿里巴巴不只是在与腾讯拼移动。2014年4月前不久,阿里巴巴包下了九阳、美的、苏泊尔等十个品牌的12条生产线,专门为天猫提供小家电。接着,再通过阿里巴巴掌握的数据和分析结果,去指导品牌生产线的研发、设计、生产和定价等。这种模式就是所谓的C2B模式,是用户需求衍生出的生产模式。在这种生产模式中,消费者还可以根据自身的需求定制产品,甚至参与到产品设计、生产和定价等环节中。这一系列都彰显出消费者的个性化。早在2013年年底,天猫商城就已经启动了数据共享计划,将获得的行业数据分享给厂商,里面包含了价格分布、流量、成交量、关键属性和消费者评价,从而挖掘出卖点、主流价格段分布、消费者需求和增值卖点,指导厂家的研发、设计和生产。阿里巴巴集团认为,可以将这种模式复制给更多的厂商,然后承包生产线,引入更多的厂商。可以说,这是一种让用户不知不觉参与的C2B模式,也可以总结“大数据定制”。这种模式不仅可以帮助厂商满足用户的需求,还可以帮助厂家减少库存,提升销售量。此外,这种模式还不需要兴师动众地组织团购,投票和调研等,节省了不少人力、物力资源。

关于“定制化生产”,最令人熟悉的就是DELL公司了。它通过直销网站实现了用户先定制方案,再组织生产。而在手机行业,也逐渐出现了“定制化生产”,比如,青橙手机、百分之百手机等,购买者不仅可以选择手机的内在配置和手机外壳的颜色等,还可以选择手机预装的应用。

像这种模块化定制、群体调研定制和预售模式,都可以降低个性化的成本,还可以满足一些群体的个性化需求。总之,就是节省生产资源、降低库存压力和提高产销比。

当然了,要做到大数据“定制化”还得具备几个条件:

首先,要有海量的数据;

其次,这些数据能够挖掘出对生产商家有价值的信息;

再次,具备挖掘这样的数据的技术能力;

最后,要有能力整合生产、流通和销售这些关键环节。

在不久的将来,这种基于大数据的C2B模式将会从小家电扩展到其他行业中,如服装、家居或其他行业里。

22 自动化思维

关于信息安全,大数据作出的最大贡献就是通过自动化分析处理与深度挖掘,将亡羊补牢式的处理,转向还没有发生前的自动化评估预测和应急措施。

对安全厂商来说,大数据不仅意味着大量的日志和黑客攻击更加隐蔽,也意味着安全技术水平的有效提升。

在IT企业中,曾发生过这样令人不可思议的事件:

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载