数据的本质:无人不是分析师(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-01 07:16:50

点击下载

作者:车品觉

出版社:北京联合出版公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数据的本质:无人不是分析师

数据的本质:无人不是分析师试读:

版权信息COPYRIGHT INFORMATION书名:数据的本质:无人不是分析师作者:车品觉排版:KK出版社:北京联合出版公司出版时间:2017-09-01ISBN:9787559609946本书由天津湛庐图书有限公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —推荐序一大数据的下半场,如何创新数据生态杜 平 研究员国家战略性新兴产业专家委员会秘书长国家信息中心原常务副主任兼国家电子政务外网管理中心主任

品觉让我为他的新作《数据的本质》写序,我虽然感到有些勉为其难,但还是很高兴地接受了邀请。

我与品觉从只闻其名(包括其声望)到见其真人,从只在不同会议上听他演讲或只听我讲,到坐下来互讲(典型的场景就是一起喝茶聊天),我感到我们对一些理念及判断事情的大逻辑都在不断积累更多共识。这也是我之所以愿意写下这篇小文的基本动机。当然,能够先睹其书为快,也是动力之一。

初看书稿的直觉感受就是,品觉围绕“数据的本质”这一主线融合了故事化和平实的语言风格,值得愿意了解大数据或从事大数据工作的读者读下去。在进一步品读之后,进而沉淀下来一些碎片化思考,同时也启发了我的一些联想。

其一,无论是企业行为或是政府决策,还是个人文化和心智修为,判断世间千人万物,甚至是力图洞察时空转换之宏大宇宙的变化等,都可以也应该嵌入数据化思考。当然,这不是要所有人都去搞大数据,建议连这一点都想不通的人不要去凑大数据的热闹。数据化思考正是我们在IT时代或DT(数字科技)时代需要坚持的一个基本理念。正如书中所言:“当我们将宇宙这个大宝库悟到极致时,真正的大道至简,也就离我们不远了。”

其二,人们研究并开发利用的绝大部分数据是无用甚至是有害的,这个过程是一个既枯燥也不确定其使用价值和价值的持续性过程。但是,是否可以找到一些好的办法和简单的规律(即所谓的捷径或窍门),使数据活起来、用起来呢?否则,我们发展大数据有何意义?通过《数据的本质》这本书以及品觉的首部个人专著《决战大数据》,我们似乎增强了许多信心。至少从方法论的角度思考,品觉在书中提到的《孙子兵法》和李小龙的武功心法都值得借鉴。再具体一点,就是书中对有意布局数字经济的企业提出的8条建议也值得思考。虽然我自己认为,乍一看这8条建议时印象并不深刻,企业也无法马上就能够做到融会贯通,但我相信,结合品觉介绍的诸多案例来思考这8条建议,再结合企业家自身的实际情况,定会形成自己独到的心得。我想,这也正是品觉写下《数据的本质》这本书的初衷吧。

其三,从事大数据工作的各类人才或者有志于布局大数据的企业家和投资人在进行数据化思考时,还有一个基本原则,即需要时刻想到、意识到“关联”二字。关联既包括找出数据与数据之间的关联性,也包括处理好数据从自动生成到传输存储,再到加工挖掘再到流通交易,再回到对源数据生成及其采集流程的有针对性地再造。这一循环各环节缺一不可,同时,这一过程中需要相应地建立起人与人之间的信任基础以及互利互惠的长效可持续机制。否则,就算我们手中拥有再多、潜在利用价值再大的数据,也难以实现其实际效用。同时,与这种关联相关的也是最重要的前提条件是,要学会感恩。品觉很幸运地碰到了一些高僧大德或前领导、前合作者(也就是他在书中明确提到的数据之王们),他们在品觉决战大数据、觉悟大数据的过程中给了他难得的真诚帮助和支持。我认为,这也是大数据应用的魅力所在。

由于多年来我主要是看文件和写文件,所以认认真真看完的好书并不多,临时想引经据典以示学问水平,但也自觉有些虚伪,还是本色表演,说点所思所想作为序吧。推荐序二大数据的无限可能谢 炳正大集团资深副董事长正大制药集团董事长

与品觉相识一段时间,多少次听他讲对互联网、大数据应用的感悟和展望,一幅幅未来社会的崭新图景不断闪现在眼前。品觉在大数据领域的大胆畅想和勇敢尝试,在这个领域深度探索这么多年,积累了“一览众山小”的丰富阅历和资本,还怀有这么高的热情,这种不服输、赌一把的性格让我非常钦佩。

当今社会,移动设备应用、电子邮件、社交媒体、数字化商务等,每分每秒都传递着海量的数据和信息,大数据连接着你我、关联着万物。大数据应用带来的颠覆性革命重塑着一个又一个传统产业的业态,这种重塑的速度在加快,延伸的范围在扩展,传统企业的当家人一觉醒来就会忽然发现一种新的打法,深感措手不及,反应慢的还没有理出个子丑寅卯,恐怕就已经被打得七零八落。这种变革不时在我们身边发生,尤其是基于数据的创新正在使人类社会各个领域的发展产生不同以往的飞跃,这种飞跃已经远超前人的想象。

今天我们也在全面布局互联网和大数据的应用,《数据的本质》这本书凝聚了品觉十几年来丰富的大数据实战经验,字里行间蕴含的智慧引人深思。看完这本书对我的启发非常大,作为运营数据的先行者,品觉正以自己多年的实践和思考引领读者一探大数据应用的无限可能。

世界信息技术领先的美国在大数据应用方面已经创造了很多经典范例。它一方面凭借对数据的有效收集、处理和分析,实现了有效的社会治理和管控;另一方面则以数据为基础推进了各个领域的商业创新,塑造了互联网时代新的产业形态。

中国互联网、移动终端的用户规模已经位居全球第一,拥有丰富的数据资源、客户资源和应用市场优势。大数据部分关键技术研发实现了突破,涌现出一批互联网创新企业和创新应用,大数据产业进入蓬勃发展时期。

大数据的应用推动了知识经济和网络经济的发展,中国经济由粗放向精细、从“制造”向“创造”的转型升级,离不开对大数据的挖掘和应用。更多数据资源的共享和应用,极大地促进了创新资源的自由流动。对于现代企业来说,洞察数据背后的本质,挖掘数据的潜在商业价值,对于企业提升自身的核心竞争力,进行战略布局和业务创新,都具有重要的意义。

正大集团当初进入制药行业、能源化工产业,都是基于对社会需求的感知,涉足相关领域后也一直关注前沿技术,把产品的研发作为重要的立足根本。目前尽管正大集团已经在行业内占有一席之地,但当我们看到随互联网应用而崛起的大数据带来的惊天变化时,仍然感到巨大的震撼和压力。

目前,全球已进入第四次产业革命时代。虽然各国对产业革命的理解和实施有所不同,但背后的推手和发展方向完全一致,即全力推动大数据发展。美国提出的“工业4.0”在优势的互联网产业上延伸,通过大数据分析等工具,推动数字化技术,重塑制造业。德国版的“工业4.0”则重点是将信息技术融入传统产业,增强生产过程中的大数据智能应用,主要体现在智能工厂、智能生产和智能物流等方面。

当今中国在某些科技领域与国际先进水平还存在一定差距,但令我们自豪的是,在互联网应用领域,各种灵活的创新已不输世界先进国家。比如品觉曾负责的支付宝、淘宝以及他最终负责的整个阿里集团的大数据工作,开发了很多创新应用,赢得了很好的用户体验。机缘巧合,当我们尝试推进医药健康领域的“互联网+”业务时,有幸结识了品觉,接触到汇集品觉大数据应用实践经验和智慧的著作《数据的本质》。作为大数据应用实践的身体力行者和资深的数据分析师,品觉十几年的探索过程值得每一位读者像对待大数据一样,好好去挖掘、体会和借鉴。对于有志于依托大数据推进变革的企业家而言,《数据的本质》这本书中蕴涵的价值更是不言而喻。

财富蕴藏在细节中。品觉带领他的团队对大数据应用的深度挖掘、务实操作、不断探索和思考,给我们提供了另外一笔巨大的智慧财富。我相信,每一位读过此书的读者都会从中受益。推荐序三学习如何学习的能力杨 强香港科技大学计算机系主任

如果说这个时代是大数据时代,那么大数据和我们的工作、生活又有什么关系呢?

长久以来,大数据被媒体和企业渲染成无所不能的神奇武器。有人说,大数据可以用来做预测和发现新商机,造就企业竞争的新机会。但是,从媒体和电视上看到的大数据经常离我们很远。而我们忽略了一个事实:大数据其实和我们每个人的工作和发展,以及人生的重要决策都息息相关。

多年前,全球数据大概以每天100GB的速度增长,而现在已经远远超过这个水平了。随着数据的增长,我们每个人的决策能力不是增强了,而是大大减弱了。这是因为,我们做决策是有成本的,数据的增加反而使得我们决策差异化的能力变弱了。而这种能力是随着对大数据的认知和处理能力而变的。如果把大数据看成是一个棱镜的话,那么我们每个人就是在这个棱镜上的一束光。这束光可以通过大数据产生一个光谱,从而显示人和人之间的不同,也就是差异化。人和人之间的差异化,在品觉的这本书里被分析得非常深刻。品觉把数据带来的这种新能力比喻成一个武功高手。在和别人比拼时,需要经过四个过程:观察、判断、决策和行动。这四个过程的每一步,不管是在企业,还是在个人发展方面,都对应着大数据的四个关键方面。

可以说,品觉这本《数据的本质》为我们带来了一种观察和应用大数据的全新视角与观点。这个观点告诉我们,数据能够提供一种“学习如何学习的能力”。而这个能力可以用来判断环境的改变、了解行动的过程。在万物互联的今天,这种新观点可以让我们找到合适的切入点,并且能够设计生生不息的数据场景,能够产生新的知识点,并利用人工智能自动化的知识增强能力,提高企业和个人的价值。

品觉这本书中一个贯穿始终的观点是,一个人或者一家企业如果要成长,都需要保持一种开放的心态,经常去考问自己和换位思考。一个好的方法是,把自己当作一件产品去思考,然后从大数据价值的角度,考虑自己如何在市场上获得竞争力和差异化。所以,品觉的这本书既可以当作数据分析师和企业大数据化的范本,又可以当作个人成长中管理知识的座右铭。在这个大数据类图书满天飞的时代,这样的观点和角度真的是为我们带来了一股春风。推荐序四自醒自觉,不被数据牵着走陈煜波清华大学经济管理学院副院长互联网发展与治理研究中心主任

作为相识多年的老友,每次和品觉聊天,无论是聊电商、数据、公益,还是聊《周易》、人生,总感觉一切都颇如他的名字“品觉”。读品觉这本《数据的本质》,就像和他喝茶聊天,字里行间不经意地便会冒出一个个思想的火花,值得细细品味。品觉是一位思行合一的思想者,这本书凝聚了他多年来的大数据实践和思考,既分享了大数据商业决策的心得,也体现了一位资深数据分析师世事洞察的人生智慧。

大数据对商业的影响正逐渐从数据化运营向运营数据转变。作为这个领域的先行者,品觉和我们分享了如何通过数据应用闭环系统,从数据驱动的决策入手,到基于大数据展开组织生态、商业模型的战略布局和创新,从而树立企业的核心竞争力。十年磨一剑,这个闭环系统是他基于自己这些年的心路历程,践行思考出的大数据背后的术道势。

大数据的价值不仅体现在知识的积累,还体现在它帮我们学会如何思考。在大数据与人工智能时代,知识越来越成为一种廉价的大宗商品。随着数据的积累,如何通过数据洞察其背后的本质,而不是盲目地被数据牵着鼻子走,从而形成独立、有批判性的分析思考能力,在大数据时代比任何时候都显得更加重要。品觉所特有的逆向思维恰恰是这种思考能力中最为关键的一种。无论是他发现的信息不对称背后资讯传播的规律,还是从竞争对手、小偷或产品的角度思考问题,或者是大智若愚般的人生态度,都将帮助我们更好地自醒自觉。引 言我们为什么要认识数据的本质一场以大数据为核心的智能盛宴

时下仿佛大家都在谈人工智能,就像当年人人都在谈大数据一样。大数据时代源自应用所产生的巨量数据,比如微信、淘宝。但是,随后大数据反过来成为应用创新的核心,这个循环无疑为我们带来了一种全新的创新型态,那就是:用数据做好产品,用好产品拿到更多数据。

在不同场合上,阿里巴巴的马云、百度的李彦宏及腾讯的马化腾分别谈过自己对人工智能的看法和观点。这种对话有点儿像金庸小说中的华山论剑。到底是气宗(大数据)还是剑宗(人工智能)更有战略意义?我认为,两者是相辅相成的。经历了互联网最近20年的发展,我们已经积累了足够多的数据去驱动一场“智能盛宴”,以大数据为核心的人工智能渐露端倪。

2010年,“数据科学家”这个称谓的发明者帕蒂尔(D.J.Patil)和杰夫·哈默巴赫(Jeff Hammerbacher)认为,一切应该以产品为中心,从数据获取、数据清洗、搭建和管理数据设施、原型开发、产品设计等方面,去实践数据的价值。我在阿里就经历了从“数据产品”到“数据作为产品”的阶段,后者其实才是大数据的真正产物,也是人工智能的源泉。谁掌握“完美信息”,谁就将拥有整个世界

刚开始进入数据行业时,我一直秉承着这样一个理念:在“假设数据都是可获取的”基础上,思考问题。随着整个社会数据化程度的进一步加深,以及人与物之间的高度互联,以前很多信息的盲点被快速解开。由不同领域积累下的数据形成的“完美信息”渐露端倪,这其实是一个数据从量变到质变的过程。这一“完美信息”具有无限潜能,足以让人工智能所向披靡,催生各种智能场景,并让其如潮涌至。智能时代,秉承“假设数据都是可获取的”这一思维方式,才可让你比别人更胜一筹,从而做到心中有数。

现实中,我们从数据收集、整合、判断,以至行动、再到反馈的过程并不完美,而形成数据闭环系统的阻力往往是人为因素居多。谷歌无人驾驶汽车项目的伟大之处正是给了我们重要的启发,让我们意识到自动化及智能化所需要的数据闭环系统是如何做到了既封闭又开放,其中的里应外合正是未来的发展趋势。我在阿里就经历了4个不同阶段:数据驱动决策、数据驱动流程、数据驱动产品、数据驱动业务。在此过程中,你会发现,数据驱动的目标越模糊、数据越零散、人的互动环节越多,智能项目开展起来就越吃力。从数据战略到数据治理,别让数据成为累赘

如前所述,数据资源的积累是发展数字经济的前提。企业在向往智能时代所带来的机遇的同时,更要为企业的未来目标制定数据战略。企业不仅要关注自己现在有什么数据,更要了解未来会欠缺什么。然后,再去探讨欠缺的部分有多少可以靠自己补充,有多少需要求助他人、与他人合作以实现补充。有人把数据比喻为电能,这个比喻很生动,但与电能不一样的是,数据是可以被重复使用的。所以从战略意义上来说,第二使用权的合规性变得非常微妙。

大数据背后的逻辑是数据积累越多越好,在过去两三年,很多企业都相信有了大量数据资源后,就能对企业的业务产生更大价值。但人们往往很快就会发现,除了技术能力之外,如何妥当地管理、利用这些资源并非易事:安全合规是一方面,降低数据使用的阻力及风险也是困难重重。所以我一直倡议,数据治理不是数据部门的工作,而是公司总体的战略。这意味着,“本性纯善”的大数据也容易变成一个累赘。数据是一种信仰,“善”用才是本质

2016年,一场围棋大战让人类引以为傲的智力顶配瞬间被AlphaGo践踏得体无完肤。而在我看来,这场大战其实不过是一帮人赢了另一帮人,而且大部分人仅注意到了智“能”,而忽略了它与智“慧”的差别:“能”是能力的表现,而“慧”是心除杂念,将智能用在具有普世价值的地方。同样的科技能力是被善用还是被滥用只有一线之差。

几千年来,人类习惯了生存在信息稀缺的年代,大数据与人工智能则为人们带来了曙光,同时也引发了担忧。暂且撇开我们会不会被机器人侵略这个问题,人类真的已经充分利用了自己的潜能了吗?数据是一种信仰,我们应该善用这个宝藏,为人类创造更美好的世界。

我们过去常说:“数据不仅是企业与企业之争,更是国家与国家之争。”但是在不远的未来,数据驱动的算法将会影响人类生活的方方面面,若想在社会中获得竞争力,我们无可避免地必须成为自己的分析师。

经历了这大半人生,作为数据分析师,我希望借助《数据的本质》这本书,在我人到中年时,交出一份人生中期职业报告,把自己的所见、所学汇总在书中,这样,既作自娱亦可作他乐。

最后,感谢大家多年来的支持!大数据的下半场,企业与个人如何让数据从看到用?作者车品觉深度视频访谈为您揭晓,瞬间扫码观看。第一部分数据主义,未来一切都将数据化

雁过留声,踏雪留痕。

如今,人类已经不可逆转地步入了“量遍天下”的大数据时代。在万物皆互联、无处不计算的环境下,数据量每年呈50%的速度增长。一直以来,我周围的朋友问我最多的一个问题就是:“大数据的本质是什么?数据体量的背后隐藏着什么样的诱惑?”我认为,最好的比喻莫过于拼图:如果你玩过一个1 000块以上的拼图,应该不难体会,开始的5%拼起来最为吃力,拼了25%后,你就渐入佳境了。而其中每一块拼图对完美信息(perfect information)的贡献都是不一样的。几千年以来,起码在大数据未出现之前,我们都活在信息极度稀缺的年代,甚至把自然规律诉诸于命运与鬼神,思考方式也被压抑。计算机除了具有强大的计算能力和存储能力之外,更是加速了全民数字化的步伐;互联网技术的快速发展为信息的连接与互通造就了条件;各种智能终端(包括智能手机)的普及让大数据、人工智能的应用成为相互加强的闭环系统。我把这个闭环系统称为数字经济引擎。如今,我们正在数据化这个世界,在这个过程中,各领域中的数据拼图组成的“数字天书”也将呼之欲出。

未来人人都是分析师

商业基础正因众多终端带来的全域大数据而发生着改变。

当下不认真对待数据,之后想要用好数据的时候,就会被死死卡住。

数据的价值,必须来自场景。

移动大数据的核心重在实时(real time)、适时或最佳时机(right time)以及全时(all the time)。

最大的数据来自最小的设备。

开启“上帝视角”是未来趋势。五年前,我们还在为移动化兴奋不已,而今天已开始面对全三域大数据,面对四面八方的传感器,大数据已经完全不是移动化这么简单了。智能手机是一个超级终端传感器,但未来还有智能电视、智能家居、物联网汽车……我们将实现与所有东西的连接和互动。随着无处不在的终端开始收集越来越多的数据,将来有一天,无论你去哪儿,都会留下“脚印”。我们收集到的数据会越来越全,这虽然令人兴奋,但从伦理道德的角度看,却可能很危险。全域大数据时代

我们应该清楚地认识到,商业基础正因众多终端带来的全域大数据而发生着改变。它带来的变革不限于数据本身,还有思考社会和商业模式将如何被改变的全新角度。在全域大数据的大潮之下,每家公司都要重新思考,当互联网的场景从单一的桌面转移到多源、多终端时,不仅会带来丰富的空间维度,还会增加更多从前匪夷所思的新场景所产生的数据。

这么多零散的数据和维度叠加在一起,下一难题就变成了如何保证有效地存储、更新、辨识和连接这些数据,并灵活地使用它们。这么多数据的作用是什么?从古至今,每当人们遇到困难时,都会从自己或他人的经验中寻找解决办法。无论成败,积累的经验会成为衡量下一个同类决策的基础。这种决策过程循环往复,我们的预测能力越来越接近现实,而数据就像是我们的瞄准镜。

以前,我们知道的信息不全,但在未来,我们会因为拥有全域大数据而变得更见多识广。举个例子,你每天开车去公司的途中到了某个路口时会习惯性认定左拐是最快捷的选择。偶然有一天你发现,很多同事都会在同一个路口右拐。好奇心让你询问了几位同事,才发现原来右拐更便捷。这个例子暴露出,我们过去获取信息的意愿、方法或条件并不充分。

在移动互联网时代,预期之外的大数据不断出现,人们对周边环境的感知能力伴随传感器数据,发挥了极大作用。而这些促进今天的人工智能进入发展的新纪元。

在我看来,开启“上帝视角”是未来趋势,这无疑是激动人心的。这些数据都可以沉淀,复杂的数据环境给我们带来了巨大挑战,但同时也为我们带来了前所未有的机遇。在机会面前,我们还不够明智,做起事来仍然各自为政。每家公司、每个人都想独自画出数据链上的全景图。我就曾见过同一家公司内的各事业部,都在做自己的软件开发工具包(SDK)以收集数据,他们没有分工,也没有标准化的讨论,所得数据之乱可想而知。

我们还忽略了数据的一体性。当下不认真对待数据,之后想要用好数据的时候,就会被死死卡住。的确,当公司规模生态还很小时,我们会觉得数据的质量问题不值得注意;但一旦我们想精准地应用数据时,就会发现曾经的“差一点儿”已成了云泥之别。在线的数据,才是数据

我们应该清楚地认识到,商业的基础正因移动互联网的普及而改变。比如,美国一家初创公司Appsee提供的移动产品分析中,有些功能就很有意思。例如使用“use recording”(不同于收集)记录下用户使用App时的行为,包括点击、滑动、放大、摇一摇等各种动作,从而可以了解用户的兴趣、意向和需要。

移动化带来的变革当然不限于数据分析,但这无疑是最为敏感的。你是否已经用全新的角度去思考无线业务做得好不好?在移动化大潮之下,每家公司都要从上到下重新思考。不过,当数据从传统PC端转移到移动终端时,我们往往会遇到两大误区。

第一个误区是把智能手机当作一个新增的媒体渠道,相当于另一个屏幕,这是完全不够的。手机作为功能设备产生的行为数据,不仅有时间维度,还有空间维度和社交维度,这么多维度叠加在一起,分析的层面和方式也远远多于传统网页。

第二个误区是用同样的方式考评PC端和移动终端。在PC端,我们更关注流量转换的指标,而移动终端更在乎的是参与度,例如用户在一个App的停留时间、是否愿意接收提示、版本更新等。手指信息如点击、滑动、放大、摇一摇等,在无线时代均会成为关键。

与大数据的4V(量大、多样、速度、价值)相比,移动大数据的核心重在实时(real time)、适时或最佳时机(right time)以及全时(all the time)。任何一个完整的高效服务都离不开这3T。

以零售业为例,实时是实时数据的获取和推送能力。未来我们将通过智能手机或智能穿戴设备,赢得越来越多接触用户的机会。这些机会将为我们提供大量的时空信息,把每一刻感知到的用户数据延续,就是全时。

有了这种感知能力之后,你如何知道何时是推荐服务的最佳时机呢?这时就必须要有全时的数据收集,才会知道用户的需求规律以及营销的关键点并做到有效触达。只有在具备3T的能力下,你才能明确在什么地方、什么时间点,给什么样的用户、什么样的特别优惠。你已经熟知用户过去的消费习惯,甚至行路习惯,所以才会知道第二天下午一点半推荐一杯半价咖啡将是非常有效的促销方式。

最大的数据来自最小的设备。手机会变得越来越智能,它可以“感受”,可以处理文字、图像,可以通过网络连接你身边的一切。这是最完美的集中,这不是一种创新,而是“一群”创新。

未来,没有谁会比你的智能手机更了解你,它甚至会了解你的情绪,而无须自然语言。智能手机将成为你的数据收集者,也会成为你的数据守门员。智能手机能判断可以将哪些数据分享给哪些商家;而商家自己都不用建立数据库,它的数据存储在每个人的云空间,只要被授权就可以拿出来用。这将会是用户、数据和商家之间的一种全新关系。用数据获取更多数据

很多人同时拥有智能手机、个人PC、平板电脑等多个数码设备。比如,某个人拥有两部智能手机、一台iPad、三张信用卡,而且每天都登录你的网站。在这种情况下,你能否知道这是同一个用户?你有没有这种识别能力呢?通过信用卡,银行虽然可以识别静态个人的身份,但缺乏辨别当用户使用电脑、智能手机或平板电脑等更多元的网上浏览设备时的身份的能力。

有谁能够识别这三种设备和三张信用卡背后的用户是一个人?企业有多大的能力去识别一个“碎片化了的个人”,将是一个巨大的考验,也会是一个巨大的机会。

在识别过程中,分辨用户其实并非难事。比如,企业可以查看用户电脑里的cookies,以此获取用户的E-mail地址、网购时的收货地址,甚至私人手机号码、亲密联系人、信用卡与身份证信息,等等。以上这些信息都可以作为鉴别“碎片化了的个人”的依据。

需要注意的是,这些属性有些是唯一的,有些却不是,但它们依然有很大的参考价值。比如,你经常会将手机或电脑借给别人吗?当然不会。那么信用卡呢?想必应该更不会外借了吧!

了解了身份识别的方式之后,我们就可以把散落于网站内外的行为数据串联起来。不同的网站,收集到的数据是不同的,数据的价值也千差万别。如果某个网站连接了你三台设备和三张信用卡,那么这个网站收集到的内外数据就很容易将你识别出来。所以,是否知道用户是谁,决定了企业数据收集行为的意义大小。

现在,大数据的价值吸引了很多企业和组织的兴趣,因此它们非常重视数据的收集与存储。但是,在现实操作过程中,问题仍然层出不穷。大量的碎片化数据是噪声,让事实串联本身变得非常困难。而值得思考的另一方面是:当我们把这些枯燥的数据串联起来时,就一定能代表事实吗?

假设早上你从家步行至地铁,忽然想起明天是太太的生日。途中路经了一家首饰店,你在外面看了一下,便被其中一个橱窗里的一副耳环吸引了。你走进店里,看了多个款式,但不是价格太贵,就是不知道太太会不会喜欢。结果,因为赶时间上班的关系,你没能买上心仪的礼物。坐地铁去公司的途中,你还是不甘心,于是用手机淘宝又搜了一下,期望可以找到早上看到的心仪款式。可惜,你真的不知道该如何形容那副耳环是什么样子,于是你不得不重新花时间利用关键词搜索一下碰碰运气。结果,你如大海捞针一般毫无收获!

从首饰店的角度来看,肯定也想了解这些信息:每天都有什么人在店外经过?进店的顾客是熟客还是新客户?他们有什么喜好?他们是受什么的吸引进店的?他们有没有明确的需要,在店内看过什么,又买了什么?店员如何知道要不要推荐什么给这位顾客?即使顾客没有当场购物,有没有可能在其他渠道重新唤起他的需求?这些一直以来都是零售业梦寐以求想要解决的问题!

以上情况随着智能手机的普及、各类传感器包括RFID(射频识别技术)的使用,以及人脸识别和视频分析的进步作为支持,大量线上线下的消费者活动行为被大量收集和打通。零售商和消费者开始从应用中感知到当人(消费者)、货(商品)、场(渠道)这三种数据的高度连接所产生的“完美信息”及洞察力,而这意味着更贴心的服务和更多商机。最近有人就把这场革新叫作“新零售”。其实这样的情况又何止是在零售业有出现,社会正达到一个新的临界点,虚拟与现实的边界进一步被拉近。如今,互联网虚拟世界的线上数据正在反哺线下场景,线下场景也在不断弥补线上的不足。这个循环正是用数据去取得更多数据的典型。

数据的价值,必须来自场景。很多看似无关紧要的东西都在场景里,而在无线移动终端的世界里,这个场景又平添了很多其他东西,这都需要我们仔细甄别。要学会用数据去获得更多数据。

为了能够使用更多大数据所驱动的服务,作为普通消费者,你是愿意分享个人数据,还是会担心个人隐私泄露而避免分享?作为一家公司,把数据分享出去到底意味着损失还是获益,这笔账容易计算吗?我相信,类似这样的问题未来将会困扰每一个被“数字化”的企业和个人。

这到底是人类自己编织的甜蜜烦恼之网,还是一个噩梦的开始?且让时间来验证吧。

未来人人都是分析师

在信息爆炸时代,拥有大量信息可能是灾难而不一定是好事,也不等于你有能力使用它。

一切数据收集活动的出发点都来自业务需要或者可以应对未来的业务发展。

从业务过程中收集信息、分类信息、整合信息,必须要成为日常思维的一部分,这是成为数据驱动型公司的必要条件。

数据开发的速度是营运大数据的必然瓶颈。

一切皆可量化,表面上看似不存在的数据,其实也是有迹可循的。

当我们学会量化以后,就是一个个从无到有的过程,很多重要的东西就这么“无中生有”了。这也是在新时代的特质下,企业想要实现“弯道超车”的一个难得的快捷方式。设这样一个场景:一个惬意的早上,你一觉醒来。吃着早假餐,打开计算机,你突然想查一些信息,但是却毫无头绪,因为信息太庞杂、太碎片化。苦恼之际,你猛然想起自己无意间养成的一个习惯,每当看到一些感兴趣的信息时,无论文章也好,照片也罢,你都没有让它变成过眼烟云,而是花了点时间保存了起来。这时,你的计算机人工智能扫描了你的信息库,通过你平时保存的信息,分析出你可能感兴趣的章节。你打开一看,发现正是你想看的。顿时你心情大好,开始了新的一天……

你很惊讶。为什么计算机可以找到这些信息?因为计算机的计算是人脑无法比拟的。为什么计算机能够帮你寻找目标信息?因为你早已在无意中习惯性地保存了庞大的信息,建立了属于自己的信息库。这个有点科幻意味的场景是不是很熟悉呢?作为数据界的“老谋”,我敢肯定地告诉你,这一天必定很快会到来。养兵千日,用兵一时

大数据时代衍生的变化,体现在信息的产生及获取变得更为快捷,沟通(包括发布、传播、互动)从单点到互联,信息变得更网状、无序和碎片化。然而,获取速度又快数量又多的信息,很容易被错误地解读为唾手可得,而且成本越来越廉价。如果你目前有这种想法,那你可能已经在不知不觉间被卷进了“数据越多越有用”的误区。在信息爆炸时代,拥有大量信息可能是灾难而不一定是好事,也不等于你有能力用好它。近日,畅销书《大数据时代》的作者维克托·迈尔(1)—舍恩伯格(Viktor Mayer-Schönberger)在一次演讲上也强调了数据相关性的重要性。简单地说就是,收集、存储和管理数据的综合成本不菲,是每个企业必须面对的问题。

根据业务战略而制定的大数据战略变得尤为重要,我们首先需要重新去审视或者辨识有用信息,并判断哪些数据可以放弃。一切数据收集活动的出发点都来自业务需要或者可以应对未来的业务发展。例如,阿里的电商数据战略就离不开“人、货、场”的组合。接下来,就是以短期问题作为出发点,并以中长期的发展趋势为准来决定资源的优先分配顺序。

从业务过程中收集信息、分类信息、整合信息,必须要成为日常思维的一部分,这是成为数据驱动型公司的必要条件。例如,在产品设计环节中除了加入PRD(Product requirement document,产品需求文档)之外,还要加入DRD(data requirement document,数据需求文档),以重点描述数据相关的需求及变更。以此类推,在业务的各环节中都要考虑数据的收集、汇总及使用,并评估所收集的数据与主体业务之间的相关性。但目前大部分企业依旧秉持“取之所用,无用则弃”的传统信息理念,而不会同时考虑长远数据战略所需的积累。仅仅服务于当前,为短期目的所收集的数据肯定会偏于狭溢,大数据更需要为未来业务方向做好储备。换句话说,数据战略的目的就尤如“养兵千日,用兵一时”。

明确了业务的长中短期目标及实现这些目标将会面临的障碍之后,还得理解数据能力对这些目标有何贡献。作为战略部署,我们还需用系统思维去发现周边生态的数据与主体业务之间的关联。举个例子,要真正了解淘宝的商品交易细节,除了买家的需求外,物流、支付、竞争对手、卖方营运等数据,都是整体必不可少的一部分。有了大方向之后,从数据战略到数据落地策略,大致可分为4个步骤:

确定业务目标与信息缺口之间的关系,明确数据收集的方向。

寻找相关信息的同时,评估零散信息整合的难度及数据源的质量。如果数据来自外部,应优先考虑以元数据较完整的信息来源。

关注各种数据资源的使用情况及其在场景中的反馈结果,同时尽可能地记录下数据从产生到应用的过程。这个过程是一个从“计划经济”到“市场经济”的落实点,数据必须被运用起来才有其价值,以点带面式的经营数据更显稳健。

最后回到第一步,识别信息源与业务目标的关系,优化信息收集、存储、整合的过程。

随着智能物件、人工智能场景的普及,信息产生的形式和速度也变得难以预测。我们需要有更加便捷、成本更低的方法寻找及收集多源异构的零散信息,并把它们缝合起来。所以一直以来我都在致力于建立大数据的技术平台,促进以上各个环节都能够更自动化地完成。从我在阿里管理大数据的第一天开始,我就感受到,数据开发的速度是营运大数据的必然瓶颈。不要小看这个缝合的技术,它是细节上的魔鬼,做好它方能称得上真正做好了大数据营运。系统之美

在轰轰烈烈的大数据时代,学会系统思考(又称系统动力学,System Dynamics),有利于摆脱线性局限、小数据时代的思维方式,转变为人工智能与大数据亦步亦趋的思维方式,这两者截然不同。为什么?我还是那句老话:“以偏概全怎么能和以全概偏相比?”

什么是系统?系统是一组相互关联的主题,一定时间内,以特定的行为模式相互影响,而且具有自适应、自我组织及自我演进的能力。当系统受外力触发时,不同的系统可能会产生不同的结果。一个完整的系统必定由三个点组成:要素(主体)、连接点和目标。当主体与连接点及其功能产生了相对固定的关系时,我们便认为这个系统形成了。

以淘宝为例。简单来说,这个生态系统(目前流行的叫法是“平台”)由卖家、买家、物流商、平台管理方组成。他们之间互相连接,目的是为了匹配需求方与供应方,然后顺利地把货物从卖家送给买家。情况稳定时,各方相安无事,平台管理方可以坐享其成。当然这不是系统的真相,在这个系统中,买家与卖家的连接来自交易,更重要的是交易后买家给卖家的评价。根源是平台为了减少买卖双方之间的投诉及纠纷,让评价好的卖家得到更多曝光机会。

在这个加强版的反馈机制中,平台让买家优先看到的都是诚信得分较高的卖家。没有足够生意流量的卖家知道,快速得到大量交易和好评,是争取曝光机会的重要因素。“诚信”卖家变得奇货可居,而“好评”有价,最终促始一个黑色产业——专业刷评师出现,“江湖”(系统)从此不再太平。平台与刷评师之间展开了一场博弈,系统中出现了一个旋涡,真假评价之争让平台管理方左右为难。正因如此,卖家更一度围攻平台方,不能删除被怀疑的假评。

以上故事在互联网时代未来临之前,曾经也发生过。只是在互联网时代特别是大数据时代,数据更有利于还原真相。大资料也自然成为发现真相的利器。不过我认为更值得反思的,是如何使用大数据分析去防患于未然。而此时,系统思维就更为重要了。

过去,我们习惯在简单的线性关系中寻找规律,因为我们假设没有数据以及数据稀缺是常态,只能局限于逻辑推敲。这就像蚂蚁拼命在二维空间中苦思为什么无路可走时,却不知道我们其实身处的是三维世界。

大数据的存在,就是让我们把复杂系统变得可描述、可量化、可溯源。随着科技的发展,物联网、人工智能技术的进一步完善,我们越来越不缺少数据,但大家还未意识到万物互联之后的世界,系统思维的重要性。量化一切,数据化一切

如果你是阿里的分析师,在月度经营报告之后,你会好奇地跑去问老板:“我做的这份报告,什么地方是您比较感兴趣的?哪些地方又是我需要多花点力气再精益求精的呢?”世上如果有一位老板会耐心地回答你的问题,那么恭喜你。而大部分情况是,如果老板完全知道自己需要什么的话,也就不需要你了!

一次,我去丽江参加一个零售集团的闭门会议。因为是临时决定去的,所以我并没有做太多准备。结果,主办方忽然通知让我给大家做一个演讲!我灵机一动,用上了“无中生有”的伎俩,并量化了早上的会议,目标是了解集团CEO关注什么。我快速将其他人演讲的内容记录下来,同时记录了在其他人演讲期间CEO的几个动作信号:点头、写笔记和发问。大家可能已经明白,我是在量化领导对每一个主题演讲的专注度。当然,如果领导从头到尾都在玩手机的话,说明他对内容根本不感兴趣。领导的一举一动,无疑都间接地反映了他对什么内容比较关注或者有想法,什么内容是被他当垃圾扔掉的。经过早上“无中生有”的量化过程,下午我便择优而上,把领导关注的内容用上面所提到的三个信号的频次配合当下的关键词做了一个简单分析。结果当然不出所料,我演讲后,那个领导兴奋地对我说:“你怎么比我的手下还要懂我?”

在阿里工作期间,我偶然看到了一本叫《数据化决策》(How to Measure Anything)的书。但我比较喜欢它的英文书名,因为比较平实。这本书的主题是:一切皆可量化,表面上看似不存在的数据,其实也是有迹可循的。量化是对被量化的事物的一种映射,就像照X光片。关键是,我们要明白量化后的数据是为了解决什么问题,以及在量化的过程中如何降低噪声,增加稳定性。

互联网技术的发展加快了信息数字化的进程,我们对量化的态度,也必须与时俱进。过去,我们假设数据很难获取,所以喜欢用经验预设简单维度,这种局面随着大数据时代而被快速打开。一些看似毫无关联的事情,却是过去分析时的盲点所在。要改变传统观念,将思维方式从经验驱动转变为数据驱动。

当我们学会量化以后,就是一个个从无到有的过程,很多重要的东西就这么“无中生有”了。这也是在新时代的特质下,企业想要实现“弯道超车”的一个难得的快捷方式。记住,要学会无中生有的量化,要有足够的观察、足够的理解及数据收集。我在阿里时,毫不夸张地说,正是运用这种方法,我基本都能在CEO及高管想要看什么数据之前,提前预估到他们可能会看这些数据,并且早早做好功课。我告诉手下,要把月度报告也当成一个产品去量化,不断从反馈中改善。这也正是我在上面提到的在丽江的例子中所做的。

说了那么多,最后总结一下基本的量化法。表面上好像不存在的数据,其实也有迹可循,可以量化的。关键是我们要明白量化后的数据是为了解决什么问题。量化是对被量化事物的一种映射。如果X是我们关心的事情,我们就应该做到以下几点:

澄清什么是X。例如,你想量化“开心”,但究竟什么是“开心”?“开心”跟“快乐”是否一样?你需要不断用问题去澄清X!

如何量化X?如果我们认为开心的表现是笑,那我们可以量化“微笑”吗?面部情感识别的技术,微软已经有较成熟的软件了。

量化之后能够增加我们对X的了解或者减少不确定性吗?我们能否找到量化后的“开心”指数,并在应用中确认其价值?否则只能回到第一步,重新澄清什么是X。

以上方法虽然简单,却非常有效。优秀的业务分析人员必须学会这个方法。学会量化,“无中生有”的力量是很大的,并有着“此时无声胜有声”的作用。大数据的下半场,企业与个人如何让数据从看到用?扫码下载“湛庐阅读”APP,“扫一扫”本书封底条形码,听作者车品觉讲述数据的本质。

未来人人都是分析师

大数据能力的根源来自连接,而连接的基础是数据的流通和标准化。

所有的数据流通必须建立在一个永恒不变的道理上:互惠互利,否则你无法做到对数据进行适时的修正。

大数据是自利、利他的成品。

作为企业,要实现数据打通,需要有一个非常清晰的、自上而下的数据资源战略方向,也需要具备良好的、自下而上的协同能力,这两者相辅相成。

实现从0到1的过程中,首先必须找到个体与机构之间的平衡点。

当利益高于双方之间的竞争时,数据共享会变得理所当然。

数据是虚的,解决方案才是实在的,没有场景做目标的大数据如同一盘散沙,但太实相的大数据又不够灵活。

数据应用有三个阶段:第一个阶段用数据,第二个阶段养数据,第三个阶段从看数据到用数据。

数据分析的工作最终必须落在产品上。

从数据的收集到使用,我们要学会与生态中的各种角色竞合,因为没有人能单枪匹马地完成整张数据大图。拜访一些公司时,我发现,大家所讲的数据来源其实就只有在几个,很少能看到“养好数据”的例子。也就是说,大数据产业目前面临的挑战,并不是没有好的算法,也不是没有好的数据工程师,而是数据来源比较单一。互惠互利,数据流通之匙

在数据科学成为炙手可热的话题的两年后,我发现我被企业管理层问得最多的问题是:如何确保有足够多的数据来发展人工智能?需要储备什么样的人才?我认为,大家都忽略了大数据能力的根源来自连接,而连接的基础是数据的流通和标准化。老实讲,“不在此山中”的企业可能还对由此带来的痛苦没多大感觉。

比如,有些CEO问我,如何打通企业各部门之间的数据,进而防止阳奉阴违的事情继续发生?以阿里为例,数据打通绝对不是马云一声令下就可以解决的问题。从2014年开始,阿里管理层数次要求各业务部门(包括支付宝)无条件地将数据互通,然而换来的终究也只是表面的打通而已。手下人的阳奉阴违也是花招不少。比如,我有数据,但是我不告诉你有什么;就算你知道我有数据,但我不能保证提供给你的是有质量的数据。因为没有业务关联,对方很难长期、义务地配合你,所以就更不会把新增的业务数据和盘托出了。

在这个人工智能蓬勃发展的时代,数据的增量比存量多。多变的业务场景也意味着需要敏捷的数据更新(包括结构)。在你使用数据时,数据本身可能早就出现了定义上的变化,Data broken(数据断裂)指的就是数据已经不能反映当前现实。因此,以这些断裂数据为基础的任何人工智能算法,都会相应地产生偏差。这种事情表明了什么?所有的数据流通必须建立在一个永恒不变的道理上:互惠互利,否则你无法做到对数据进行适时的修正。虽然说高层掌握着权力,但要发挥出整体的数据战略,只靠从上而下的命令是不可能的,还必须依靠从下而上的共建共创。只有这样,才能实现合力而成的多源异构大数据。所以我一直强调:大数据是自利、利他的成品。

我举个例子。公交车的摄像头在行驶过程中录下的数据能否共享给其他企业?该公交车公司当然不乐意,摄像头录下来的数据就是我的资产,凭什么无条件地交出来?但如果此时一家地铁公司说,若你愿意分享这个数据,我会在地铁内为市民提供公交车换乘信息的大屏幕作为交换呢?又或者,政府主动提供客流量数据,作为其他公交车公司主动提供数据的相应回报呢?答案应该就明朗多了。当实现互惠互利时,技术问题也就水到渠成了。

在阿里时,我是怎么处理部门间数据互通这件事情的呢?很简单,首先是找出大家有意愿共用的部分,我称其为企业内的公共数据,然后安排资源把这一部分先建设起来。选择公共数据也有一定的技巧,简单归类就是:各部门已经在高频率但低效率的单线流通的数据,被野蛮重复复制到各部门的相同数据,大家都有意愿首先标准化的数据。当这些带有公共性质的核心数据建立起来之后,大家就能更容易地感受到数据高质量流通的意义及好处。要保证这些数据的质量和新鲜度也相对变得容易了。

之后,我采取的是共创共赢策略。我将我们部门所有的、我认为很有可能成为公共数据的数据,全部都放在大家眼前。如果其他部门有人要使用的话,这些数据可谓招之即来。当然,前提是这些资源都是我先开发完的。当他们所有人都开始使用这些数据时,我就可以输出技术及标准,去帮助其他部门完成更大范围的数据打通。

上面两个例子说明的就是打通大数据,不管是一家企业还是一个城市,都非常需要找到利益驱动的本源,然后找出数据流通的共性,这可以是因为新的发展机会、改善各单元的效率,也可以是降低风险等。总而言之,互惠互利才是大数据流通的永恒关键。

机构越大,人事越复杂,数据打通的开展就越困难,这也就解释了为什么政府部门的大数据进步得这么慢。政府机构对构建大数据系统具有集中性这一得天独厚的优势,但却没有积极性,更谈不上什么互惠互利了。作为企业,要实现数据打通,需要有一个非常清晰的、自上而下的数据资源战略方向,也需要具备良好的、自下而上的协同能力,这两者相辅相成。如果你一味地想通过权力来强迫他人将数据白白地拱手让给你,那就对不住啦,只能画虎不成反类犬了。寻找共同的痛点

任何零散的数据一旦连接形成大数据,便会威力无穷。以医疗数据为例,如果我们把人类生物学的复杂性比作一部动画电影,那么在100年前,我们对这种复杂性的了解大约相当于电影画面的一个像素。可是,若看完整部电影,我们便很容易知道它说的到底是怎样一个故事。医疗大数据,是了解整部电影的最佳窗口。可以说,当各种医疗数据成功实现了联防,癌症便不会再如今时今日般让人恐惧。

在庞大的市场及科研潜力面前,埃里克·夏德特(Eric Schadt)这位试图让医疗数据共享成为现实的先驱者,颠覆传统创立了自己的基因数据公司Sema4。Sema4是一个致力于创建千万级基因技术库的基因数据平台。虽然这件事情非常伟大及意义非凡,但其面临的困难也十分巨大。连夏德特本人也无奈地承认:“尽管已经投入数十亿美元,用于对现有数据网络进行现代化改造和提供安全保障,但数据泄漏事件仍然时有发生。”若不彻底根治这一问题,支撑项目的信任基础将变得脆弱无比。

然而,患者的医疗数据属于个人拥有,还是由医生与患者共同创造的呢?任何大数据的形成必须经历两个过程,即开放与规范,两者为递进关系,前者是深度连接的前提,而后者则涉及数据的可用性。实现从0到1的过程中,首先必须找到个体与机构之间的平衡点。人们愿意将自己的基因数据分享出来吗?凭什么?企业集结了这些大数据之后,又如何对个体产生价值呢?若不能达到互利,又如何让更多人自愿贡献出自己的基因数据呢?

下一步要解决的问题,是如何鼓励已拥有大量数据的医疗机构共享数据,让它们走出自己的数据孤岛。从我过去在阿里的经验来看,唯一的方法就是:找出几方共同的痛点,当利益高于双方之间的竞争时,数据共享会变得理所当然。

接下来便是规范化。我们辛苦收集到的数据,该以什么方法加工,进而成为解决问题的原材料?数据界大致分为两派,一派坚持原始数据,即尽可能保持数据的原貌(裸数据);另一派则喜欢把收集到的数据规范化和格式化,根据使用的场景进行预处理。其实,数据是虚的,解决方案才是实在的,没有场景做目标的大数据如同一盘散沙,但太实相的大数据又不够灵活。所以,无论金融大数据还是医疗大数据,都会经历从无到有、从有到高度连接、从高度连接到实时流通,最后经过工程化把数据提炼成随时可用的“业务石油”。到那时,毋庸置疑,它会产生无限商机以及无与伦比的回报率。让天下没有难用的大数据

在阿里上市前夕,我完成了第一部著作《决战大数据》。之后,在准备离开阿里时,又心生了为该书写增订版的念头。洋洋洒洒,新(2)增了8万余字,希望能为自己在阿里的经历做个总结。当然,我的数据生涯还未结束,从阿里到红杉资本,我更希望能够真正说明数据行业生态。借用阿里的一句格言:“昨日的成功是今天的起点。”

回顾我在阿里的6年时光,从经历来说,我先负责支付宝,继而负责淘宝,最终负责整个阿里集团的数据工作,并创立了跨业务群的数据委员会。实际上,这个过程同样也是我对数据应用的理解历程:第一个阶段用数据,第二个阶段养数据,第三个阶段从看数据到用数据。在加入支付宝之前,业界都认可我是一个比较懂得用数据去设计、改良、迭代产品的首席产品官。这个背景也影响了我日后的很多决策。产品需不断迭代

加入支付宝后,我面对的第一件事就是着手组建支付宝数据分析师团队。2010年的支付宝,大部分业务团队对数据团队都不太满意,而且高层对数据能产生的价值也没有太多认识。同时,由于当时数据负责人调职,导致支付宝的数据分析和数据技术部门被分开管理。

面对数据分析和技术团队的目标不一致,业务部门对为什么要使用数据以及如何善用数据充满疑问,甚至有人认为数据分析仅是门面功夫。但我坚持数据分析产品化路线,相信数据分析的工作最终必须落地在产品上。

从解放集中式的数据分析师团队到“人人都是分析师”的泛化过程中,我们的业务部门自己就可以便捷地使用工具解决问题。经过一年多的努力,有一天CEO走到我办公室对我说:“你知道吗?你们做的产品让我觉得很爽,我很喜欢这个产品。”看到同事和老板对产品的支持,让我肯定自己在支付宝走的这条路是正确的。如果让我总结这其中的精髓,我的秘诀是:数据分析也要讲究用户体验。

数据产品设计的切入点必须要问“目标问题是什么”“什么样的数据才能解决这个问题”。只有得到用户的信任,我们才能够做出更多的好产品。产品需要不断迭代,而非一劳永逸。这就是我们做产品的理念。不懂商业就别谈数据

我在支付宝期间,几乎每个月度报告都会让管理层讨论三四个小时。一份数据报告居然会成为管理层的讨论焦点,每次都会有很多高层管理者关注我讲了什么,这时我就知道我肯定成功了。当然,同时我也会提醒数据分析师们,千万别以为仅靠一份报告就可以解决所有事情,一定要让业务部门知道这份报告是大家一起探索得出的结论,这是我管理团队的一个基本理念。

这样的月度经营报告同时也是数据分析师团队每个月的绝佳演练机会,在我的团队里,一直有这样一个口号:不懂商业就别谈数据。

这段难忘的经历,让我骄傲的不是我自己的成就,而是每次在公司外听到别人说支付宝的数据分析师团队是国内最强的数据团队时,我都会由衷地为他们感到骄傲和自豪。在阿里的6年,我最难忘的就是和兄弟们一起并肩作战,让天下没有难用的大数据。数据生态圈须竞合并存

这段时间我四处飞来飞去,身边人都觉得我比以前在阿里的时候还要忙。过去在杭州时,总感觉自己看得不够多,如今终于有时间出来走走,看看各种数据公司,看看许多公司到底如何使用数据,这正是我想要做的。

在阿里,要数据有数据,要人有人,要钱有钱,什么资源都不缺,反而让我感觉少了些拼搏精神,多了点“大公司病”。事实上,通常没有数据的人,都更期待有数据可用;通常资源不足的公司,会更懂得怎样用好自己的资源。

很多人说,中国互联网BAT这“三座大山”让数据力量难以释放,但我相信这种现象会随着技术的不断进步而改变。我也看到很多年轻人在尝试挑战,不少从大公司出来的年轻人正在创业,在五花八门的领域中挖掘数据价值,这让我备感欣喜。

乐观地说,从他们身上,我已看到中国大数据生态圈的雏形。我认为,这些特征也体现了“双创”的重要理念。但记住,不要跟红顶白,而是要从解决问题着眼,并最终落地在商业价值上。例如,有时你以为自己在做产品,其实只是一个小功能而已;但如果是产品,却又不一定有商业空间。

去过美国旧金山湾区的朋友都知道,许多当地创新公司的创始人大多来自谷歌、Facebook等,这些龙头公司其实也是产业创新的源泉。从数据的开放程度看,谷歌、Facebook、Twitter等公司的数据是大家的创业资本,这些土壤为大数据产业链注入了活力。尽管这些数据还需要经过很多加工和处理才可以被我们使用,但毕竟这些数据都相对容易获取。

此外,对比中美两国的数据环境,中国有一个数据金矿,就是政府的数据开放。政府到底能否适度释放更多有用数据,让这个产业成长得更好呢?这个问题举足轻重,非常关键。数据产业的另一关键是开源的小区、公司之间的合作与竞争关系并存。从数据的收集到使用,我们要学会与生态中的各种角色竞合,因为没有人能单枪匹马地完成整张数据大图。懂得这个道理的公司才会是未来的数据之王。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载