玩转电商系统:深入剖析智慧电商平台(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-14 16:33:59

点击下载

作者:韩军

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

玩转电商系统:深入剖析智慧电商平台

玩转电商系统:深入剖析智慧电商平台试读:

前言

本人从事电商行业10多年,回想当初从零开始打造1号店网站系统、供应链系统,感触颇多,很想把其中的经验、感受跟大家来做分享。尤其是最近两年,我在跟电商同行们的交流过程中发现,大家遇到的问题都是差不多的,解决的方法却有所差别,效果也相差甚远。大家共同的苦恼是,缺乏可借鉴的案例和适合中国国情的电商系统指导书籍。笔者决定把这几年的经验积累进行整理,把当初构思电商系统的理念,以及经过实践检验的电商架构思想做个总结,汇集成册,供电商从业者们参考。也借此机会,以书会友,跟同行们碰撞出智慧的火花,岂不乐哉。

于是,开始着手编写《玩转电商系统》这本书,仅就图书的整体框架,编写小组就提出过4个方案,修改了10余次,最终确定:以一个电商企业的成长轨迹为主线,以大量1号店、京东、天猫的案例为辅助来进行阐述,以便读者对电商系统有理性和感性的认识。这也是本书有别于一般同类书籍的特色之一。

本书的编写过程充满了欢乐和艰辛,编写小组经历了无数的“夜总会”(即夜里总是开会的戏称),为一个观点争论到面红耳赤,为一个章节的完成击掌狂欢。想到这是一本对千万电商从业者有指导意义的书时,我们油然而生一种使命感。本书的写作过程充分体现了电商人的激情,以及互联网文化中追求极致的精神。

在回顾1号店电商系统建设过程中,我有几点特别深的感悟:

第一点,技术与业务的融合。我经常说自己是“技术的业务派,业务的技术派”,只有做到技术与业务的高度融合,技术才能引领业务,创造价值。在电商企业里,如果技术团队的定位是去完成业务部门提出的需求,那么对公司的价值是不大的。技术团队的定位应该是“技术引领业务”,首先技术人员要成为业务专家,通过系统性的思考,规划出跟企业管理思想具有高度一致性的电商系统。同时,系统必须具备柔性,因为电商的模式是多样化的。只有这样,系统才能成为业绩增长的基石,成为企业的核心竞争力,为企业创造强大的技术壁垒。

第二点,倡导“开放、共享、追求极致”的团队文化。人才是我们最大的财富,所以要建设以人为本的团队文化,创造出沟通顺畅、敢于挑战、喜欢创新的团队氛围。在团队文化建设方面,主要倡导的是互联网文化、极客精神,我的总结是“开放、共享、追求极致”。我们有的工程师,为了开发一个高效的算法,通宵熬夜,结果虽然只提升了短短的10毫秒,但这就是追求极致的精神。试想当放在一个亿万级别调用量的场景下,提升10毫秒,结果的差别将是质的变化。

这本书的完成,需要感谢许多人,没有你们的支持和帮助,就没有那么多的精彩故事。

首先要感谢,1号店两位创始人于刚、刘峻岭,我们共同经历了色彩绚丽的6年创业之路,拥有许多美好和难忘的经历,这些都将成为我人生旅途中最宝贵的财富。

其次要感谢,这本书的编写小组:黄哲铿、王芸芸、邰恩智、周冲、姜沈励、黄申,你们的智慧和努力,已经融入了每一页书的字里行间,相信你们跟我一起享受这整个过程。

最后要感谢,所有对本书的编写提供帮助的朋友们:蔡欣、陈红飞、陈寿江、陈艺博、陈颖、董恒、方飞、顾复、郭占星、韩路、何红旗、胡毅、黄崇杰、江军、江烈、李琦、李卫雨、刘晶、吕华、聂磊、聂巍、潘谦、裴华、彭冬明、沙燕霖、施燕、孙梦霞、田占昌、王东方、王庆友、王怡、谢晟、闫军华、杨平、余迁、张高峰、张珺、张炜华、张益刚、张志浩、周冲、邰恩智、闵军、刘临平、张俊华、张津、宋中华、凌云、潘徐珏、彭啸、赵瑜。

感谢电子工业出版社博文视点团队,感谢博文视点计算机专业图书事业部的整体运筹,特别感谢策划编辑董英、责任编辑李云静。这个身处传统行业的出版团队采用互联网思维作为行事规则,令我感动。没有他们的努力,本书也无法顺利面世。韩军2014年金秋于上海第1章引言1.1电商的本质是什么

电子商务,指的是利用互联网技术,通过网站或客户端工具,把买卖双方联系在一起,最终完成交易活动的整个过程。

电子商务的模式,可以分为B2B(商家对商家之间的交易)、B2C(商家对个人)、C2C(个人对个人)、C2B(个人对商家)等。然而在非面对面的互联网交易时代,对用户的行为识别比对用户身份的识别更加重要。在这里的C,可以代表消费者(Consumer),即商品的最终使用者;也可以代表顾客(Customer),在这里可以泛指生产厂家、经销商或者最终消费者,他们可能将购买的商品或服务用于加工、生产或者再销售等用途。考虑一个例子,平安集团通过1号店购买电脑。在这笔交易中,虽然买家是一个公司,但其行为可以界定为是消费性的,这等同于个人的购买行为。这个例子说明了为什么用户的行为比其身份更容易反映出交易的实质。

不难发现,商业的实质包含两个方面:商品和服务。从这两个方面出发,生产或采购优质的商品,以合理的价格提供给顾客,提供良好的售前、售中、售后服务,确保顾客在消费的整个生命周期里,能够得到放心、满意的消费体验。

随着Internet技术的出现与广泛应用,人类社会发展发生了重大变化,从过去的工业经济时代进入了电子商务时代。

工业经济时代的特点是,生产力不足和商品短缺,在这种时代背景下,企业以“产品”生产为导向,产品的成本和质量是企业最重要的竞争手段,于是企业基于“劳动分工”原理建立自己的生产线,并追求大规模和标准化产品生产,以期取得市场竞争中的成本优势和利润最大化。

进入电子商务时代,是社会生产能力与商品过剩的时代,顾客存在极大的商品选择空间和余地,而且表现出“个性化”需求特征,长尾现象明显。在这种时代背景下,企业只能以“顾客”为导向,按多品种小批量组织生产。产品的持续创新是企业最重要的竞争手段,“顾客满意度”则是企业发展的最重要指标。企业能否快速响应顾客的个性化需求变化,决定了企业在激烈竞争的市场中能否生存和发展。

在电子商务时代,企业要实现对顾客个性化需求的快速响应,对企业内部资源进行有效的组织和计划是必要的。但仅靠自己企业的资源依然难以参与市场竞争,这就需要企业必须把经营过程中的各方如供应商、制造工厂、分销网络、顾客等纳入一个紧密的供应链中,这样才能有效地安排企业的产、供、销活动,满足企业利用全社会一切资源快速、高效地进行生产经营的需求,以期进一步提高效率和在市场上获得竞争优势。因此,过去单一企业间的竞争已转变为企业供应链间的竞争,供应链管理已成为企业管理最重要的内容。1.2电商系统的组成

电商系统体现的是电商企业的管理思想,系统必须具备灵活性,以适应电商企业多种多样的业务模式。电商系统是非常复杂的,下面我们从多个维度对电商系统的组成进行分析。

从顾客的角度出发,关注的是顾客体验,比如:网站的打开速度是否快、购物过程是否顺畅、页面布局是否简洁明了、类目划分是否合理、搜索商品是否得到想要的结果等。

关注顾客体验,就必须关注CPO(call per order,每个订单的电话联系次数),它是反映顾客服务水平的综合指标。有些电商公司,如1号店成立了跨部门的CPO项目,目的是通过降低CPO,来提升顾客体验。

搜索在顾客的购物过程中,起到非常重要的作用,就像一根流量的“指挥棒”,一般电商网站60%的订单来源于搜索,后面会对电商搜索进行深入探讨。

从商家的角度出发,关注的是运营效率、信息的透明性和及时性。商家系统,能够帮助商家降低在电商平台的运营成本,通过分析报表,发现运营中的问题,调整运营策略。通过商家系统,商家能够及时了解到电商平台的促销活动、政策调整、顾客反馈等。

从电商企业的内部运营来看,关注的是公平性、运营效率、防呆等。比如,各类目线的运营人员,通过优化类目属性、商品标题、文描、评论等信息,提升品类在搜索引擎上的排序,各类目线之间形成一种良性和公平的竞争。

供应链体系在电商企业运营中起着重要作用,供应链管理讲求的是一个平衡之术。优化是无止境的,但要在成本可容忍的情况下,将用户体验最大化,达到成本和体验上的平衡。这个理念,体现在SEM、波次、拆单、配送各个环节,后面我们会介绍WMS、TMS系统,以及创新型供应链优化项目:多地多仓等。

对电商企业来说,如何减少误操作或操作不当,也是降低运营成本和提升工作效率很关键的一点。电商系统需要有“多维度、立体式的防呆体系”。一个简单的价格设置,需要能按百分比和绝对值来设置阈值,防止业务人员粗心大意填错。一旦填入的价格有异常,要能够触发一个审核流程,由更高级别的管理人员进行确认。就算一个异常价格,在后台被误审核通过,在前台也还有最后一道防线进行拦截,及时提醒运营人员来处理。对技术开发管理来说,需要一套开发工作平台,基于大数据驱动,对开发各项工作进行管理,从“需求—开发—测试—上线”软件全生命周期管理,融合了项目敏捷和产品敏捷两种管理模式;通过透明化的方式,提升沟通和管理效率;通过依赖管理,把大中型软件团队遇到的资源依赖和冲突问题有效地解决。

通过上面的介绍,相信大家对电商系统有了大致印象,接下来我们继续探讨电商系统如何规划。1.3电商系统如何规划

如何规划一套适合企业的电商系统?电商平台应该包含哪些子系统?购买套件还是自主研发?自主研发的话,又该选择什么技术体系?Java or .NET or PHP?……这些问题,是每一个电商操盘人必须思考和解决的问题。下面回顾一下当初韩军是如何思考和解决这些问题的:“当时我们的起点非常高,1号店的系统未来一定是巨大型电商系统,所以我们在技术选型的时候,决定选择Java,而不是.Net、PHP。理由很简单,Java最适合构建超大型电商系统,从开发框架到数据库,都有丰富的开源解决方案。虽然Java程序员也比一般程序员贵20%以上,起步的时候开发效率会比较低,属于‘先慢后快’的开发语言。”

电商系统体现的是电商企业的管理思想,是技术跟管理思想高度融合的产物。同时,电商系统必须具备足够的灵活性,以适应电商不同的业务模式。电商企业发展到一定的规模,必须有一体化的电商系统解决方案,因为电商行业的业务变化是非常快的,业务模式是多种多样的,只有一体化的电商系统才具备足够的灵活性。所以像1号店、京东等电商企业,发展到一定规模后都选择自建一体化的电商系统。而苏宁电商、沃尔玛中国等一些企业,选择了拼凑几家供应链系统、网站接单系统来搭建自己的电商系统,于是就出现了系统跟不上业务变化的现象,这是很值得各位电商从业者关注和思考的问题。

我们将整个电商系统分解为以下几个层次来建设。

●基础平台层。采用“云”的思想,建立分布式存储、分布式缓存平台、分布式数据访问层、基于Hadoop的公用大数据平台等。这些平台都实现了服务化、虚拟化,配合自动化运行维护系统,可以动态管理服务器资源。

●应用层。大型电商企业的业务系统应采用面向服务的架构(SOA),将所有的核心业务都沉淀出来,形成一系列的业务服务,包括针对商品、用户及交易、库存、促销等环节的服务。这样既保证了核心业务的稳定,又给业务模式创新、多渠道扩展等提供了足够的灵活性,还在保证核心业务隔离的前提下,给开放平台提供了最稳定强大的业务支撑。

●开放平台。作为一个大电商平台,只有将自己的能力开放,才能创造更大的价值。需要研发专门的开放平台支撑系统,能够支持从各个层次开放系统。这样,既能以SaaS的模式,将整个解决方案开放给客户,比如客服系统、仓储配送系统等;也可以将业务服务以OpenAPI的方式开放,供客户整合自己的系统,或者开放给第三方服务商开发电商解决方案;还可以将基础架构如存储空间开放给客户。大型电商平台的目标是支持整个电商生态系统。

●监控治理平台。这是整个平台稳定运行的保障。通过一个整合的监控平台,可以全方位立体监控系统的运行状况,包括每个层次的系统运行指标、业务表现等,也可以对系统异常做出快速响应。

这是从大的层面来谈电商系统架构,应该从四个方面来搭建,强调的是要建立一套电商业务体系的闭环,电商系统的架构需要具备前瞻性、灵活性。电商系统的规划要有超前意识,稍领先于业务的发展,实现电商系统的提前布局,比如:1号店的PIS(Product Intelligence System,即商品智能系统)是在2010年开始搭建的,真正被全面使用是在2013年。第2章初始阶段2.1玩转电商,系统先行

电商系统反映了企业的经营理念和商业模式的思考,系统是电商企业的核心竞争力。在电商企业的起步阶段,面临的第一个问题就是:如何快速建设一套电商系统,让商业模式得以落地和验证。下面通过1号店的例子来看一下当时我们是怎么做的。

2007年的一个冬天,天空飘着雪,在上海张江高科技园区的某栋办公楼里,正在举行网站设计讨论会。“我觉得分站模式,太超前了,中国网民还不能适应这种浏览体验,amazon.com也没有采用分站模式。”席间的一位同事说道。“分站模式的好处是,网站能够提供更好的服务给顾客,未来的电子商务一定是区域化的,我们应该尝试分站模式。”1号店的第一位员工,CTO韩军,直言不讳地提出自己的观点。

他们所争论的“分站模式”,最终被使用在1号店的网站设计中,他们开创了中国电子商务“分站模式”的先河。这一先进理念,被众多的同行网站“学习”,成为B2C行业标准,京东直到2014年6月才支持这个模式,由此可见商业模式和系统架构的前瞻性思考,能让电商企业少走弯路。

正是有了前瞻性的系统规划,使得1号店的系统,能够支持业务每年以300%的增长,飞速发展,成为行业“黑马”。

在电商系统的规划中,“多商家”的设计理念也是非常重要的,因为平台必须具备柔性,能够适应不同的商业模式。“北京是一个商家,上海是一个商家,未来我们引入卖家在我们的平台上开设自己的店铺,每一个卖家都是商家,所以我们的系统必须是支持多商家的。”1号店CTO韩军对于多商家模式的思考,是非常清晰的。电商的发展趋势是本地化和区域化,为顾客提供基于地域、基于顾客需求、基于使用场景的商品和服务。

许多企业的第一版电商系统,都是为了快速验证一个商业模式,在短短几个月的时间里开发完成的,比如:淘宝是在2003年非典时期开发和上线的。

1号店,在2008年春节之后,技术团队开始系统研发,7月11日,网站上线了。分为网站前台、运营后台、WMS(仓库管理系统),3个子系统。前两个是自主研发的,而仓库管理系统则使用了第三方的解决方案。许多人都不敢相信,这样一套集众多创新模式、先进设计理念于一身的电商平台,仅在十来个开发人员、3个月的时间内就完成了方案设计、程序开发。架构简单到只需要两台应用服务器、一台数据库服务器,即可完成应用的部署。2.2从0到1,系统升级

电商系统上线后,面临的问题是:如何进行市场推广?如何让更多的顾客知道你的网站,并且来你的网站购物?可以选择的广告投放渠道很多,有传统的媒体:报纸、杂志、邮购目录、电视、广播等,也有新媒体:楼宇多媒体、地铁、互联网媒体等。广告投放渠道的选择非常关键,通过1号店的案例我们来了解其中的奥秘。

其实在2008年的时候,1号店的两位创始人于刚、刘峻岭,提出来要做一个“网上超市”时,当时周围的人都不怎么看好。要知道那时做电子商务的人就已经多得数不胜数,怎么才能把习惯在自家门口超市买东西的人们吸引到网上,而且经常来逛逛网站呢?发传单?对!当时,两位创始人发现有的公司通过目录营销比较成功,而当时的一个国际会议的材料也说电子商务的未来是线上和线下目录的结合。于是,他们决定进行一次尝试,花了3个多月的时间做了300页非常精致的目录,第一次便印了10万份,每本成本十几块钱,这样100多万元就“烧”出去了。曾经有段时间,1号店人遍布在上海的各大小区发放精美的商品目录。经过“打鸡血”似的线下营销,完成了目录发放后,大家非常焦急地等待,期望订单像雪片一样飞过来。然而,晚上大家开始数订单的时候,才发现一共只有20个订单,并且绝大多数是员工自己下的单。有了这次经历之后,大家意识到,线下目录也许并不适合。因为它承载的信息过于固态,比如库存信息和价格信息是无法改变的。假设目录的更新周期是一个月,则这一个月里所有商品的信息都改不了,没库存的还在上面,价格变动也体现不出来。正因为有了线下目录的尝试,大家更坚定了要用系统化的方式来整体提升运营效率的决心,这才有了后来1号店引以为豪的多套智能系统,如自动化营销系统、智能商品智能系统等。

从这个案例中我们知道,在线零售业的顾客是在线上完成交易整体过程,受众是互联网人群,主要的市场营销渠道应该在线上而不是在线下。况且中国消费者的习惯跟国外消费者也不一样,同样的线下目录营销方式,在国外效果很好,在国内则效果一般,营销需要考虑消费者的习惯和国情等因素。

当电商企业逐渐摸索出适合自己的商业模式后,企业开始进入快速成长期,这个时候系统将面临上线以来的第一个大挑战——系统负载能力。

以1号店为例,在2009年,为了让更多顾客享受到1号店的实惠和快捷,1号店推出了“每日一款”,即每天推出一款深度折扣的商品吸引顾客。这个功能从需求分析、开发、组货、设计、市场推广方案,到最后上线,只用了一天不到的时间。功能成功上线,但活动进行期间,人气爆棚,系统一度几近瘫痪。这次活动后不久,另外一件事情发生了,这件事就是两位创始人在2009年7月11日的1号店周年庆时,上了沪上著名的高端访谈互动节目《波士堂》。在当期的《波士堂》电视广告播出期间,1号店用超过10倍的系统流量增长赢来了自己最好的生日礼物。但是,随之而来的是系统的瞬间崩溃。情急之下,CTO韩军亲自重启了系统服务器,随后系统才逐步恢复正常。

经历了初期的系统不稳定之后,技术团队意识到是时候为爆发式的业务打造一个具备足够柔性的系统架构了,以便为打造巨大型电商系统做充分准备。第3章成长阶段3.1打造业界一流的顾客体验

这是一个顾客体验为王的时代,电商企业之间的竞争实际上是顾客体验上的竞争,谁能够为顾客提供更好的商品和服务,谁就将赢得顾客青睐,最终取得商业上的成功。京东商城就以“客户体验第一”作为企业的核心价值,通过加大自建物流来整体提升顾客体验。1号店早在2010年就提出“打造业界一流的顾客体验”的运营理念。3.1.1 体验一日客服

很多电子商务企业容易犯下的一个错误是只注重销量,而轻视了服务,认为只要把商品成功销售出去了,用户成功付款就万事大吉了,至于后面的订单配送、顾客服务、退换货服务都是不重要的事。事实上成功引导用户购买并支付只是电子商务营销的开始。如果我们从顾客生命周期的角度来设计商业战略,电子商务企业完全可以将利润置后,先通过有价格优势的“钩子商品”来吸引新顾客,然后再通过服务和老顾客的二次购买获取更多的利润。这个过程有两个关键时刻影响顾客的感知,一个是顾客在网站上购买过程中的体验和感受,另一个则是顾客在收货及使用过程中的感受。这两个关键时刻共同组成了顾客对电子商务网站品牌的感性认知,并影响到顾客对网站品牌的忠诚度。

电商网站对于前台购物流程体验往往是比较透明的,各电商企业之间容易互相学习借鉴,但对于运营服务、顾客服务的体验优化则更像是修炼内功,需要投入更多,也更容易被忽视。而客服部门作为顾客沟通的窗口,承担着顾客服务的主要工作。

客服给人的印象是个很难的职业,既要能解决顾客的各种问题和要求,也要能倾听顾客的各种抱怨和投诉。有时候面对近乎无理取闹的指责,客服也得笑脸相迎。你有没有想过有朝一日也去体验一下客服这个岗位,知道顾客的困惑在哪里,又有哪些抱怨呢?对于一个服务体验至上的公司来说,让管理层和骨干人员去体验客服,倾听顾客的声音,对于公司顾客体验的提升是一个非常有效的方式。

下面就要介绍一下什么是“一日客服”。一日客服是针对公司管理层、业务骨干的一个客服体验活动,公司会定期组织管理层和员工到客服部门做一天的客服工作,比如处理在线投诉,或者在客服一线做电话接线。每位体验者首先会接受半小时的客服培训,然后在一位资深客服陪同下电话接线。体验者通过处理顾客的来电,了解并处理顾客的问题,同时从公司层面反思顾客的问题和投诉的原因,找出网站存在的顾客体验上的问题,或者流程上存在的缺陷。以1号店为例,1号店把客服当作一个公司和顾客沟通的窗口,创始人于刚董事长和刘俊岭总裁一直保持着定期体验一日客服的习惯,管理层和商品部门、技术部门也会参与其中,找出了很多售前、售后,包括公司内部处理流程的优化点,对公司客服体验的提高起到了至关重要的作用。例如有一次于刚董事长在体验一日客服的时候,顾客咨询的一个很专业的产品问题,需要找到对口产品采购负责人来回答,于刚发现客服还需要通过一份Excel通信录寻找对口产品采购的联系方式,而这种方式维护起来不够及时,查找也十分不便,浪费了很多时间在找到正确的联系人上。于是他推动了技术部门、产品部门、信息化部门联合改进了内部联系人系统,大大提升了处理顾客类似问题的效率。

客服部有两个重要的职能:一是针对顾客的,需要解决顾客的咨询和投诉,并在客服和顾客接触的短短几分钟时间内,让顾客对公司建立好的印象,也就是推行关键时刻(MOT,Moment Of Truth)管理。二是针对公司的,需要正确、及时地传递顾客的声音,并且监督各个运营部门的服务质量,推进服务流程的优化。可以看出客服部门在顾客和公司内部部门之间的桥梁作用。体验一日客服正是为了让这个桥梁更加通畅和高效,让内部各部门可以直接倾听顾客的声音,并且了解顾客的问题和投诉,从而更好地改进产品和流程。

从客服系统的层面看,为了更好地支持客服的理念和工作,系统分为三个层次:一是面向顾客提供自助式客服,例如提供催单、自助退换货、发票处理、订单取消、修改订单、智能机器人客服等功能;第二个层次是面向呼叫中心平台的建设,例如电话投诉管理、在线投诉管理、电话呼叫管理系统、发票系统、异常订单处理系统、仲裁系统等;第三个层次是面向公司内部提升沟通效率和用户体验的传递,例如工单系统、订单SLA监控、联系人机制、消息触达系统等。3.1.2 CPO是反映顾客服务水平的综合指标

CPO(call per order,每个订单的电话联系次数)是衡量一个电子商务网站流程是否合理、用户帮助是否完善、顾客服务是否到位的一个很重要的综合指标。它的计算公式是:CPO=电话呼入总量÷有效订单数。CPO越低说明网站的顾客服务越是贯彻到了网站的点滴之中,最好的服务是让用户不再需要服务。

CPO的降低对于顾客体验的提升是非常有帮助的,对降低公司的运营成本影响也是巨大的。毕竟往往顾客打电话咨询或投诉客服是无奈之举;而如果能有效降低这些电话的拨入,客服的精力也可以大大释放,同时电话费用、坐席费用、补偿费用的节省可以大幅降低公司的运营成本。

为了推进CPO的有效降低,需要从CPO数据中剖析问题,优化内部流程及系统操作,提升顾客体验,并从流程优化及数据分析中了解顾客行为,提供更好的自助服务,并引导顾客使用,降低运营成本。在实际操作中,比如1号店在系统平台方面实施了CPO项目,为CPO的降低提供系统平台的支持。首先对CPO进行了责任类型归类,针对每一通顾客来电记录其责任所属部门,以及每通来电的原因分类。然后通过系统对一段时间的CPO责任数据的分析,可以找到对CPO影响最大的几类问题,对这几类影响最大的问题进行深入分析,找出几个最有效的改进点,并推进改进点落实。最后是针对这些CPO问题,推进系统平台级的改进,通过系统对用户信息透明、对内进行流程优化,从而大大减少这些CPO问题的发生频率。当TOP问题(指发生频率最高的同一类问题)不再是最严重问题的时候,再重新审视最新占比高的CPO问题,重新分析改进点,从而形成一个有效的降低CPO的长效机制。下面介绍一些对提升CPO非常有效的子业务系统。3.1.3 订单异常监控系统

在CPO占比中,最大的一类就是订单配送时效延迟。为了对订单运营过程中涉及的各个环节进行有效的监管,一般在运营部成立异常订单监督的小组,对订单在仓库的环节、订单在出分拣中心的环节、订单配送环节、调拨订单环节、采购订单环节、聚单订单、退货订单等订单正向、逆向的流转时效进行监督。

首先需要制定每个环节的SLA(Service-Level Agreement)标准,比如定义几点截单必须几点之前出库,这个SLA标准是通过仓库各个环节的标准流程推算出来的时间;然后系统对订单流转环节的监控节点进行监控,比如监控仓库的出库时间,如果超过SLA的规定,则认为订单在这个节点时效异常;最后系统会自动将异常订单报表以邮件的形式预警到相关的部门负责人。如果明确订单已经无法按承诺给顾客的时间送达,则系统会将最新的订单进展和预测时间信息推送给顾客,尽量将订单信息及时、透明地反馈给顾客。3.1.4 顾客自助服务系统

订单修改、发票处理等问题也是CPO占比高的类型,这类问题适合让顾客自助处理,这更加快捷方便。顾客自助服务系统,将订单修改、申请发票、催单、查询配送进度等功能提供给顾客自助处理。为了将这种服务更方便地提供给顾客,系统平台提供了多渠道自助服务,通过在Web端、移动APP、微信等渠道都可以使用顾客自助服务,让顾客可以随时随地、无障碍地使用客服。每种渠道的自助服务都可以借助其自身渠道的优势,比如移动APP方式,可以利用手机移动便捷的优势,而且能够很方便地拍照,从而让顾客可以用照片的形式反馈问题,或者用照片取证。微信方式的优势是消息转递,适合顾客和客服之间直接像好友一样在线交流,并且也支持用图片、声音等方式提供更多的投诉、咨询信息,让顾客的投诉和咨询方式更加多元化。通过顾客自助服务项目的实施,顾客服务有了更多的选择方式,也更加方便,这可以大大减少顾客通过拨打客服电话的方式来处理问题。3.2搜索

我们在开篇的时候提到,搜索是一根指挥棒,是提升顾客转化率的关键所在。下面我们通过故事的方式,通过一位对搜索充满好奇的主人翁Sean一起来探个究竟。

随着公司生意的不断增长,商品数量和访问流量都出现了爆发式的上升。高层和技术团队的领导们都开始意识到一个新功能的重要性:那就是搜索。这项艰巨的任务就落到了1号店的技术骨干Sean的身上。之前,Sean是主攻数据库等工程的,对搜索引擎一窍不通。特别是百度之类的搜索引擎,让他觉得非常神奇:只要输入几个简单的关键词,想要什么信息都能获得。这究竟是什么原理呢?通过几个月的学习、摸索和实践,Sean终于有了不少收获。

从理论上,Sean认为搜索引擎是信息“爆炸”和互联网大数据时代的必然产物,其主要工作原理(见图3-1)包括如下三个基本流程。(1)在互联网中发现、搜集信息和数据。通常,这个步骤是通过爬虫(Crawler/Spider)抓取网页来实现的。每个独立的搜索引擎都有自己的网页抓取程序爬虫。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接之间的关联,抓取更多网页。被抓取的网页被称为网页快照。由于互联网中超链接的应用很普遍,因此从理论上来说,从一定范围的网页出发,就能搜集到绝大多数的网页。(2)对收集到的信息进行提取和组织建立索引库。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。根据应用场景的不同,其他可能的处理还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。(3)由检索器根据用户输入的查询关键字,提供检索服务。接受到关键词后,系统在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。通常,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要及其他信息。图3-1 通用搜索技术架构图

那么,搜索引擎和数据库的异同点具体有哪些呢?先看看相同点吧,主要如下所示。

●擅长存储海量的数据。现代计算的硬件处理能力日新月异,即使是一台普通的笔记本电脑,也能通过SQL数据库或者搜索引擎存放上万甚至上亿的数据记录。

●支持关键词的查询。无论是数据库还是搜索引擎,都允许用户输入需要查询的内容,并且返回相应的结果,完成较为实时的查询。

当然,两者有很多不同的地方,主要如下所示。

●存放数据的格式不同。我们这里说的数据库是指目前最为流行的关系型数据库,存储的通常是格式化的关系型数据,例如年龄、性别、身高等。而对搜索而言,需要处理的数据往往更加多元化,除了文本,还有图像、视频和音频等,都可以纳入这个大的范畴。

●查询的语言不同。数据库需要精通一种叫作SQL的专业语言,需要一定的技术背景才能理解。所以,数据库的直接用户大多数时候都是专业的程序员。而终端用户通常通过友好的界面来和数据库打交道,程序员的代码替他们完成了复杂的中间翻译工作。而搜索引擎通常采用布尔表达式(Boolean Expression),这种表达式对于非技术人员而言也是比较容易理解的,因此程序员无须做太多的工作,就能将终端用户的输入转变为引擎能看得懂的语言。

●查询的实时性要求不同。如前所述,数据库的查询通常是给专业人士,或者是专业系统使用的,并且查询大规模的数据,因此响应速度并不需要太高。对于数据分析员而言,等几分钟甚至更长时间都是可以接受的。因此,数据库的任务通常也是离线运行的。而搜索不同,使用者不可能等待过久。特别是互联网时代,用户就是普通的“冲浪者”,“爽快”的体验至关重要。因此,搜索引擎的结果处理必须是秒级,通常不能超过3秒。坐在电脑前等待几分钟只是为了知道明天上海的天气情况,这是无法想象的,也是无法接受的。

●索引类型不同。这个和上述第3点是相关的。数据库完成的任务是通过精确的ID,查找关联的关系数据。例如输入学生的学号,查找他的身高、体重和学分。这种顺序和存储的数据格式“学号身高体重学分”是一致的,被我们称为“正向索引”。而搜索却不同,其主要任务是通过关键词,反向查找哪些文章出现了这些词语。例如输入“中国互联网”,查找哪些文章是讨论这个话题的。那么数据库的正向索引是没办法及时返回结果的。因此,必须使用一种被我们称为“倒排索引”(或者“逆向索引”)的结构。图3-2中基本就是一个哈希表(Hash)的结构。哈希的键值是关键词,其后的链接表是包含该关键词的文档集合。从这个结构可以看出,搜索使得在建立索引的时候,将文档关键词的关系通过倒排索引,转变为关键词文档集合的关系。这样在线查询的时候,就能大大提升效率。

●数据更新的实时性不同。通过上述第3点和第4点,我们了解到相比数据库,搜索引擎的查询实时性要求更高。正因为正逆向的关系转换,势必导致搜索在更新索引的开销要高于数据库。目前很多开源和商业的搜索引擎在此方面做了不少优化,使得搜索索引的增量修改不再是“瓶颈”。但是,和传统的成熟数据库相比还是有些差距。图3-2 哈希表(Hash)结构图

其实,通常我们所说的推荐系统,主要是个性化推荐系统。就是根据顾客的兴趣特点和购买行为,向顾客推荐其感兴趣的信息和商品。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,一般有3个重要的模块:顾客建模模块、推荐对象建模模块、推荐算法模块。推荐系统把顾客模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到顾客可能感兴趣的推荐对象,然后推荐给顾客。

从某种程度上来说,搜索和推荐引擎就是天生一对的“孪生兄弟”。之所以是兄弟,是因为它们都是人们查找信息的工具。这一点就决定了这两者所需处理的数据,以及返回给用户的信息往往都是同质的。但是它们也有很明显的不同点,具体如下所示。

●传统的搜索利用的是集体行为,而推荐则是挖掘个人行为。所谓集体行为,就是在命中关键词后,搜索会看看大部分用户关心什么信息,最后将此类信息返回给用户。而推荐直接看当前用户的历史行为,猜测他/她最关心的是什么信息。

●搜索要输入明确的关键词,而推荐往往没有明确的查询条件。搜索引擎越来越为我们所熟悉,在查询框里输入若干关键词是必不可少的。而推荐只要有这个用户之前的历史行为数据,包括查询、浏览、购买等,根据算法分析就有大致的推测,查询关键词并不是必需的。

举个更形象的例子,当用户输入关键词“中国互联网”时,那么搜索引擎会返回时下关于互联网在中国发展的各种热门话题,包括电商、安全、金融等。而推荐引擎则会根据这个用户之前的喜好,猜测他/她更偏爱互联网金融,可能在其还没有下达任何查询指令的时候,就已经推荐给他/她更多金融相关的文章。

从实践角度来说,首先要离线建立索引,正如之前介绍的那样,倒排索引是搜索引擎的核心数据结构。因为存在正向到逆向的关系转变,所以需要比较大的时间和空间开销,一般都是离线完成的。

然而,随着大数据时代的来临,即使是离线处理我们也觉得太慢了,很多时候无法满足应用的需求。因此,这里我们提出了分布式建立索引的概念:就是通过很多普通配置的硬件,同时进行索引建立的工作。最后,进行索引的合并操作。这样处理的好处如下。

●非常良好的扩展性:数据增加的时候,无须增加单台机器的硬件。而是通过水平扩展,增加配置普通的机器来解决。

●大幅提升的索引速度:由于水平扩展的引入,理论上索引的速度可以随着硬件的加入,成倍地提升。

说到这里,我们不得不提一下大名鼎鼎的Hadoop。这是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。可充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System,HDFS)。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS的上一层是MapReduce引擎,用于大规模数据集的并行运算。概念“Map(映射)”、“Reduce(规约)”及其主要思想都是从函数式编程语言里借来的;还有从矢量编程语言里借来的特性。

基于Hadoop的分布式特性,搜索索引的建立可以非常容易地实现横向扩展。

同时,Hadoop适合大数据离线处理的特性,和建立索引本身就是离线操作这一点天然贴合。我们可以利用Hadoop的平台和MapReduce的机制,来实现分布式建立搜索的索引。

之前,我们就提到过,对于搜索而言,倒排索引的建立是比较耗费时间的,因此数据更新的实时性上相比数据库而言有所不及。但是,这并不意味着索引就不能做(准)实时性的更新操作。

实时索引是为了更及时地将数据改动反映到索引,进而对最终用户可见,通过增量更新,我们期望能把数据的延迟减少到最低程度(视应用不同而定)。

为了让改动对最终用户可见,系统需要:

●获得数据源改动通知。

●重建相关部分索引。

●分发这些索引到查询服务器。

●更新搜索结果缓存(如果有)。

和全量索引相比,它们的不同点如下所示。1.触发的时机

全量索引一般是基于时间触发的(定时任务或者循环任务),而实时索引是基于事件触发的,它的触发条件包括:

●数据库中的数据发生了变化,即获得了数据改动通知。

●与应用逻辑相关的触发条件,如电商中的促销开始或促销到期等。2.索引构建的粒度

全量索引是把所有的数据索引全部更新,而实时索引只需要更新变化的部分。

在线实时查询

通常,索引建立后,实时查询是非常直接的处理方式(这里暂不考虑一些相关性的算法,这个需要太多的专业知识)。但是,当索引大小和访问次数的规模都达到一定的程度后,单台的硬件机器就很难及时处理,同样面临着性能的问题。那么,我们的解决方法是什么呢?这里引入一个新的概念:分布式查询。

分布式查询是将原来的单个索引文件划分成n个切片(Shard)。搜索时,并行地搜索这n个切片,每个切片返回当前Shard的topK命中结果;然后将n个切片的局部topK进行归并排序,得到全局的topK排序结果。

分布式查询上线后,搜索集群将有

●更好的可扩展性,在用户访问次数和索引大小两个维度都具有水平扩展能力;

●更高的稳定性,容许部分失败,调用成功率显著提高;

●更灵活的全量更新策略,可针对不同类型的数据;

●更灵活的排序算法,可以针对不同类目做定制化的排序;

●更好的可维护性和通用性,支持不同类型的搜索。

但是Sean是一位技术达人,凭他多年的经验,他很清楚:虽然电子商务中的搜索和之前介绍的普通搜索引擎本质上并无太大区别,但是却有着自身鲜明的特点。

●一般情况下无须数据采集。前面的章节提到,通过爬虫收集互联网上的信息是搜索引擎重要的第一步。谷歌、百度都要收集很多网页,包括各种新闻、音乐和地图等。不过,电子商务网站有自己的商品信息,无须爬取额外的信息。例如小明女友这样的实体商铺,早已保证了数万商品的信息是齐全的,只需要导入电脑系统即可。从这个角度来说,电商的搜索系统要比通用搜索引擎来得更简化一些。当然,像一淘这种商品综合性搜索网站则有所不同,它们也是通过爬虫获取其他各个电商的产品信息而建立起来的。

●相关性远远不够。在普通的搜索引擎里,往往只需返回少数几个(甚至一个)相关的结果就足够了。例如,输入“上海明天的天气预报”,看头一条就知道是晴天还是下雨;输入“怎样去人民广场”,人们只会看最好的一两条线路。然而,对于电子商务系统却不一样。输入“牛奶”后,人们不会因为排在最前面的两个是牛奶,就立即加入购物车并结账。他们还会从价格、口味、规格等多方因素考虑,最后决定是否购买。所以,除了搜索结果的相关性以外,电商网站还需要考虑得更多的是如何通过商品排序和界面交互,不断地提升购买成交的概率,也就是行业通常说的“转化率”。从这个角度来说,电子商务的搜索引擎要比普通搜索引擎更为复杂一些。设计排序的因素非常之多,人工干预往往耗时耗力,效果也不一定明显。因此,很多大公司都开始考虑采用机器学习(这是另一博大精深的学科,本文不在这里展开)的方法来解决。

●其他的领域特征。电子商务有着自己独特的领域,比如家用电器、日常百货、图书音像等。这些都有自己的商业规则和领域知识,充分利用好它们也是电子商务搜索成功的秘诀。

这里我们来快速看一下吧(见图3-3):从1号店的首页,我们就能发现两个搜索入口:一个是顶端带关键词输入框的关键词搜索,还有一个是左侧的类目搜索。图3-3 类目搜索

在输入框中输入关键词的时候,系统会有些相关的自动提示,如图3-4所示。这些都是根据大量顾客行为挖掘出来的。图3-4 相关的自动提示

在输入框中提交某个关键词后,或者在左侧类目中打开某个类目后,我们就能看到大致如图3-5所示的搜索结果页面。基本上分为类目筛选、导购属性、排序选项和商品陈列几个大模块。这些都是为了方便顾客进一步精确自己的需求,并最终选择自己喜爱的商品。图3-5 搜索结果界面

当然,1号店作为近几年的电商新贵,其在搜索方面的努力不仅仅局限在传统的关键词匹配上,而是有不少创新的亮点。(1)流百类的“相似款”功能。顾客在逛实体店买服饰箱包的时候,常常会问营业员:“这个款类似的还有吗?我想多比较一下。”在网上购物时,这个确实非常困难。因为用户对款式的需求很难用关键词来描述。

1号店在这个电商领域进行大胆的尝试和创新,首推基于图像识别技术的“相似商品”。当顾客将鼠标停留在感兴趣的商品上后(见图3-6),可以选择查看相似的款式(见图3-7),增加选择,解决上述问题,提升顾客体验。图3-6 可选择查看相似款式图3-7 显示同款商品(2)1号店的促销类型繁多,紧跟时令,顾客在得到实惠的同时也经常叹息错过了更好的优惠。促销搜索(见图3-8、图3-9)绝对是1号店自己的特色。顾客在参加促销的时候,能够更方便地选择自己需要的产品。其使用量、销售额和转化率在持续地增长。图3-8 满减促销图3-9 抵扣促销(3)组合装在列表页的选择。1号店的一个强势品类就是快消品。而快消品的购买往往是在搜索列表页完成的,无须进入详情页,1号店在这个上面做足了文章:直接允许顾客在搜索结果列表里,选择1件、6件、24件等不同的组合,并比较单价,选择最适合自己的规格,如图3-10所示。图3-10 可直接选择1件、6件、24件3.3构建信息安全屏障3.3.1 账户安全

当我们在互联网中享受聊天、购物、看视频、刷微博、听音乐的快乐时,经常需要一个个的虚拟账号。众所周知,在2011年CSDN泄漏了600万用户的用户名和密码,之后人人、天涯等大量用户名和密码被泄漏,造成了互联网最大的账号安全危机。受此影响,各大电商网站的账户安全体系都面临着严峻的挑战。

在CSDN等网站出现大面积的用户名和密码泄漏之后,许多电商企业立即进行了一系列的措施,为每一位顾客进行安全保驾护航。在这个过程中,采取多维度、多方位的方式定位账户是否存在异常。其中,需要批量处理所有在CSDN等网站泄漏的用户,对泄漏账户进行冻结,确保每一个被泄漏的账户不被恶意利用。与此同时,为了防止有人利用登录软件大批量登录不同用户账户,必须升级验证码系统,做到“云验证码”。当然,需要做数据分析,来确保账号的每一个订单是安全的。为的就是让每一位用户不仅能买到称心的东西,还让每一位用户可以无忧无虑地进行购物。3.3.2 反爬虫

随着电子商务的不断升温,各类网络爬虫开始横行于网络。它们的目的是抓取各大电商网站的商品信息,而且采取的是同时开启成百上千个爬虫。这对电商网站造成的冲击无异于一次小规模的网络攻击。我们一起来看下面的例子,了解如何应对这些爬虫。

每隔一段时间,公司就会有以下声音(不管是白天还是深夜),让我们的监控同学和开发同学头疼不止。于是,在一个夜里有了以下一段对白。

监控:“机器负载高了,CPU冲高了,赶紧拨打开发人员的电话看看什么情况。”

嘟嘟……嘟嘟……

开发:“XX,什么事情啊?这么晚了。”

监控:“你所负责的域名访问量冲高,机器压力很大啊,查看一下是怎么回事吧!”

开发:“这么晚了,怎么还这么多人访问,我查查看!”

……

在无数次开发、监控焦头烂额之后,安全团队偶然听说了这件事,决定帮开发和监控同学一下,让他们每晚有个美梦。从这之后,安全团队开始对访问日志进行分析,发现大量访问来源于其他电商、比价等网站,它们高速、大量地对我们的系统进行恶意抓取商品信息,造成服务器压力间歇性冲高。在了解了这个情况之后,我们开始对技术方案进行分析、改进,防爬虫系统上线后,监控和开发同事都可以好好地休息了,用户在访问我们的每一个页面时更流畅、更快速了。3.3.3 网盟反作弊

网盟,是非常重要的网站营销渠道,而且通过这个渠道到达电商网站的顾客,转化率都比较高。不过,这里面也会混杂一些作弊行为。作弊和反作弊在网盟的运营中是永恒的话题。下面我们一起来看一下,1号店的网盟反作弊系统是如何建设的。

1号店作为一家快速成长的电商企业,在线广告投放是我们市场推广的重要渠道之一。广告作弊与反作弊一直都是互联网广告行业中的热点话题。随着技术的发展,作弊方式更加便捷,作弊成本更加低廉,各种刷流量、刷广告自动化软件,使得整个互联网的广告环境更加混乱。如何识别虚假点击、流量劫持等各种作弊行为,如何确保我们有限的广告预算不被浪费,如何保证我们的广告只展示给想要看我们广告的用户,一直都是我们面临的严峻挑战。

1号店网盟反作弊系统以Hadoop作为海量广告点击日志的存储和计算平台。对广告的点击URL、浏览器指纹,访问来源、访问IP、地域分布、转化率等各种元数据进行动态检测,通过对比正常广告数据流识别异常流量和垃圾流量,最后根据我们的反作弊策略筛选出作弊流量。另外,配合网络监控平台,对近年来比较热门的流量劫持行为进行监控,如浏览器劫持、HTTP劫持、DNS劫持等,并且动态完善我们的反作弊策略。

时代在变革,技术在发展,在作弊与反作弊的动态博弈中,我们的反作弊思路是通过各种策略增加广告作弊的成本。一旦作弊收益低于其作弊成本,自然也就没有广告商愿意作弊了。3.3.4 防作弊系统

随着业务的飞速发展,电商的各种促销活动变得丰富多彩起来。更好的商品、更多的优惠给广大顾客带来惊喜的同时,在某些阴暗角落中揣摩不良心思的一小撮无良之徒却动足了脑筋,思忖着怎么可以把这些天上掉下来的“馅饼”装进自己的口袋。

无利不起早,他们的手段也层出不穷:大量小号,大宗批发,大范围抵用券领取,恶意库存锁定。这些破坏游戏规则的行为不仅仅伤害了电商的利益,让电商的大量资源白白浪费,而且还蚕食着本应属于正常顾客的利益:有限的资源被一小撮人占据,更多本应享受到各种活动带来回馈的顾客却因为不公平的竞争而失去机会。防作弊系统,解决的就是识别和惩罚这些非正常顾客。

对于异常订单来说,尽管作为一个个孤立的订单,它们毫无特殊,和普通顾客的订单并无二致。但是防作弊系统能够通过大量历史数据的对比、关联,整理出关于顾客行为的清晰脉络。比如,1号店的防作弊系统:鹰眼,就能够识别出这些蛛丝马迹,即使几个顾客购买一模一样的商品,也很容易知道谁在批发,谁是“娄阿鼠”。

病毒在药物影响下会慢慢变异、具有抗药性,同样批发、恶意交易行为一样会在防作弊系统的打压下挣扎、变化。一个固化的系统在将来会越来越难抵御“进化”中的批发行为,所以在设计之初,防作弊系统必须以灵活变化作为自己的特色。规则引擎、规则管理系统的引入,不仅让防作弊系统可以伴随着敌人的强大而更加强大,而且把业务人员的智慧也纳入战斗中来。前线的业务人员对“黄牛”们的举动了如指掌,一有变化,他们也是先知先觉,因为他们的介入,防作弊系统变得愈发强大起来。

同恶意订单的战斗是一场艰苦卓绝的拉锯战,相信防作弊系统在这个战场上能够持续为正常顾客的利益保驾护航。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载