人工智能产品经理:从零开始玩转AI产品(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-09 12:11:39

点击下载

作者:贾亦赫

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

人工智能产品经理:从零开始玩转AI产品

人工智能产品经理:从零开始玩转AI产品试读:

前言

笔者接触过很多互联网产品经理,谈起人工智能时,他们几乎都对人工智能非常感兴趣。同时,他们也提到在试图了解人工智能时,感到无所适从,不知从哪儿着手开始学习。我们先来看一些名词:云、大数据、机器学习、深度学习、神经网络、监督学习、无监督学习、强化学习、迁移学习、CNN、DNN、RNN、GNN、NLP、STR、Python、TensorFlow、Caffe、Theano、Torch等。这些名词广泛出现在人工智能领域。有人还提出要学好人工智能需要良好的数学基础,如高等数学、数理统计、线性代数、离散数学等知识。知识结构的复杂性会加重互联网产品经理在学习人工智能时的迷茫和恐慌感。

近年来,企业在招聘人工智能产品经理时也面临着同样一个问题。笔者查看了智联、拉勾、猎聘等多个招聘网站中企业招聘人工智能产品经理的岗位要求,发现不同公司在招聘人工智能产品经理时的标准都不一样。有些企业要求人工智能产品经理熟练使用Python,掌握TensorFlow,对CNN、RNN有深入理解,偏重于技术;有些企业要求人工智能产品经理对行业有深入理解,有良好的沟通能力,而不需要对技术有过多了解,这类岗位则偏重于售前、培训。正是因为企业对于人工智能产品经理没有准确的定位,所以互联网产品经理也会感到无所适从,不知从哪儿着手开始学习。

人工智能的技术体系涉及面广,知识庞杂,如果不能从更高维度看待人工智能产品,很容易陷入具体的技术细节中,而学习技术细节往往需要人们具备一定的技术背景、数学知识。目前市面上有关的人工智能的书籍普遍是专业性很强的书籍,这些书籍主要是针对工程师的,偏重于技术细节的实操。还有就是一些人工智能科普类的书籍,是写给有兴趣了解人工智能的读者的,这类书籍往往为了保证读者群体的广泛可读性,很少涉及人工智能产品的技术部分。

笔者本科阶段学习的是计算机知识,研究生阶段学习的是互联网管理知识,多年来一直从事互联网产品经理的工作。一个偶然的机会,笔者接触到人工智能项目,并一直负责人工智能产品规划与产品线管理的工作,经过不断学习和总结,笔者根据自己学习的模式和方法总结出一套在人工智能时代适合产品经理的学习和工作体系。了解到很多人在面对人工智能时存在困扰,笔者萌发了一个想法——将自己的学习经历和经验总结分享出来,希望能对有意从事人工智能相关行业的读者起到一点借鉴作用。

笔者写这本书的初衷是帮助那些没有编程经验的读者快速了解人工智能产品,掌握人工智能技术。本书从人工智能产品的理解和实践角度出发,为读者呈现了人工智能产品化的过程,目的是让读者快速入门。

本书站在一个高维度看待人工智能产品,既概括性地描述了人工智能产品的市场前景、人工智能的技术体系,又详细描述了从无到有构建一个人工智能产品的过程,将通俗易懂的语言与专业知识相结合。笔者的目的就是能够让凡是受过本科教育的人,都能轻松地阅读。如果本书能够帮助读者建立起人工智能的概念体系,掌握构建人工智能产品的知识体系,就足够了。

本书适用范围如下。①想从互联网产品经理转型成为人工智能产品经理的读者。针对这一类读者,本书介绍了人工智能技术入门的基础知识、人工智能产品基础知识、人工智能产品构建方法、人工智能技术体系、人工智能产品实践。②想了解人工智能的商业用途和价值的读者。针对这一类读者,本书详细描述了人工智能产品及商业化特性。③想简单快速入门人工智能项目实践的读者。针对这一类读者,本书提供了人工智能项目所需要的基础技术与简单项目实践案例。④对人工智能产品感兴趣的普通读者。针对这一类读者,本书通过通俗易懂的方式介绍了人工智能技术入门知识。⑤人工智能领域的工程师或专家。针对这一类读者,本书中有许多关于人工智能产品化的新颖看法和经典观点。

由于笔者才疏学浅,而书中所提及的技术与业务均为笔者本人的知识与经验总结,难免有不足之处,望请读者谅解。笔者真心希望能够为读者在学习人工智能产品经理知识的道路上提供一些帮助。贾亦赫2019年12月【读者服务】

微信扫码回复:(37401)

● 获取博文视点学院20元付费内容抵扣券

● 获取免费增值资源

● 获取精选书单推荐

● 加入读者交流群,与更多读者互动第1章 人工智能概述

↘ 1.1 什么是人工智能

↘ 1.2 人工智能的学科基础

↘ 1.3 人工智能的分类

↘ 1.4 人工智能的研究领域

↘ 1.5 人工智能的商业模式

↘ 1.6 人工智能的盈利模式

↘ 1.7 本章小结1.1 什么是人工智能

人工智能是指由机器或软件所展现的智能。在学术研究领域,人工智能是指研究如何创建计算机和计算机软件具有的智能行为。在1956年的达沃斯会议,“人工智能”这个名词首次被正式使用。也正因如此,1956年被称为人工智能元年。

提到人工智能就不得不介绍艾伦·图灵(简称图灵)。图灵是英国数学家、计算机科学家和密码学家,他还被称为人工智能之父。2015年7月在中国上映的电影《模仿游戏》就改编自《艾伦·图灵传》。该影片聚焦于图灵的传奇人生,讲述了图灵运用优秀的数学天赋帮助盟军破译德国密码系统,从而扭转二战战局的故事。

1950年,图灵发表了一篇名为《计算机器与智能》(Computing Machinery and Intelligence)的论文,提出了著名的图灵测试。图灵测试介绍了一种关于可操作智能的定义。

图灵测试设计了如下一个场景:“一个人类的提问者,同时测试一个人和一台机器。提问者与被测试的人和被测试的机器是相互隔离的,提问者同时向被测试人和机器提问,经过一系列的问答测试之后,提问者不能分辨出谁是机器谁是人,那么就认为这台机器是具有智能的。”

除图灵测试外,还有视觉图灵测试。视觉图灵测试是由唐纳德·吉曼(Donald Geman)等人于2014年提出的。图灵测试针对文字语言,视觉图灵测试则针对图像,即根据一张给定的图像,提问者针对该图像随机提出问题,系统只需要回答Yes或No。如果系统回答完毕后,提问者无法识别回答者是人工智能系统还是人,则该系统被认定为通过了视觉图灵测试。目前,计算机视觉系统主要用于任务精度的测试,任务包括对象检测(object detection)、图像分割(segmentation)、定位(localization),如图1-1所示。图1-1

视觉图灵测试可对计算机视觉的认知能力进行评估,视觉图灵测试不仅可以测试人工智能能否识别出图像中的某个物体,还可以测试人工智能对图像中物体之间关联关系的理解。但是目前,人工智能对图像中物体之间关联关系的理解能力还相对初级,而人类本身就具有对图像中物体之间关联关系的理解能力,所以人工智能的视觉图灵测试的结果与人类预期的结果有一定的差距。

图1-2所示为一张北京街景图,提问者可针对图像中指定的区域提出一系列问题,计算机视觉系统通过Yes或No来回答。图像中有一些内容被方框标注,方框中的内容是视觉图灵测试区域,提问者根据每个方框提出不同的问题,计算机对这些问题进行回答,如果回答正确则认为其拥有智能。图1-2

对于人工智能是否拥有真正的智能,一些专家认为即使其通过了图灵测试,也不一定拥有真正的智能。最著名的就是“中文屋实验”(Chinese Room)。该实验由美国哲学家约翰·希尔(John Searle)于1980年在《行为与大脑科学》杂志上发表的《智力、头脑与规划》中提出。希尔是美国伯克利大学的教授,也是著名的哲学家。希尔认为不管计算机看起来多么智能,但计算机不拥有真正的智能和理解能力。他描述的“中文屋实验”就是这样一个场景:“一个人独自在一个封闭的房间,这个人对中文一窍不通,他所在的封闭房间中有海量的中英文词典。如果从门缝塞进来一个中文纸条,虽然这个人不了解中文,但他通过查词典、看资料,通过处理文字后,可以给出一个中文的回复,从而蒙骗了屋外的人,让他们误认为屋内的人是一个精通中文的人。”

希尔通过“中文屋实验”得出以下结论:一台计算机看起来是理解了信息,但其实它并没有真正理解。也正因如此,希尔断定图灵测试也是不充分的。在过去的20多年里,“中文屋实验”作为被学术界广泛讨论的人工智能哲学论证,引起了很大反响。1.2 人工智能的学科基础

人工智能属于综合性学科,由多个基础学科复合构成,主要包括哲学、数学、经济学、神经科学、认知心理学、计算机工程学、语言学等。如果要对人工智能原理进行深入的研究,则这些学科知识都需要涉猎。笔者认为作为人工智能产品经理,至少要对数学、神经科学及认知心理学有所了解,知道这些学科在哪些方面影响了人工智能。

1.数学

数学在三个方面影响了人工智能的发展,如下所示。(1)逻辑学。逻辑学是研究得出正确结论的规则是什么的。1847年乔治·布尔(George Boole)提出命题逻辑(布尔逻辑),这标志着逻辑学的诞生。后续又有学者提出了一阶逻辑、指称理论、对象和关系等,揭示了逻辑中的对象与对象进行关联的方法,促进了逻辑学的长足发展。(2)计算。计算是研究什么内容是可被计算的。最早提出可计算问题的是图灵,他试图精确地描述哪些函数是可被计算的,也就是研究计算的能力。借助计算机的相关理论与计算能力,可以让计算机利用数字来认识和分析世界,并做出判断与决策。人工智能中的大部分算法都是数学理论在计算机学科的应用。(3)概率。概率是研究如何根据不确定信息进行推断的。在概率论的发展过程中,值得指出的是贝叶斯提出的贝叶斯规则,其是不确定性推理的现代方法的基础。概率为人工智能提供随机性计算,为预测提供基础。概率中的统计则可实现数据的处理与分析,让结果更好地满足要求。

2.神经科学

神经科学是研究大脑如何处理信息的。人脑的神经系统把行为、认知、脑机制三者有机地结合起来。科学家也试图通过神经科学全面揭示人和动物在感知、语言、信息推理、决策等方面的一些细节内容。由于脑科学是神经科学中的主要研究内容之一,且大脑在合理决策时起着重要作用,因此脑科学的研究会极大地推进人工神经元网络的研究与实践,进而推动人工智能的发展。

神经元是大脑神经系统的基本单位,神经元包括树突、轴突、细胞核、细胞体,以及长长的髓鞘。在轴突的末端是神经末梢,每个树突都可以接受外部的刺激或者其他神经元的刺激,并将兴奋传入细胞体,神经元的轴突可以将信号从细胞体传输到另一个神经元或其他组织。

如果我们把计算机和人脑做一个比较,在一定年龄后人脑神经元的数量基本是固定的,约为1 000亿个。按照摩尔定律,计算机中的处理单元的数量每5年增加10倍。仅就处理单元这一项来看,64位的CPU中有10亿个晶体管。据预测,2020年,单个CPU的计算能力就可以达到一个人脑的计算能力;2050年,单个CPU的计算能力可以超过地球上所有人的计算能力之和。

3.认知心理学

认知心理学是一门研究认知及行为背后的心智处理的新心理科学。其目标是研究大脑如何对外部信息进行接收处理,具体研究内容包括注意机制、语言运用、记忆、感知、问题求解、创造力、思考等内容。学习人工智能需要了解一些与认知心理学相关的知识。其中,记忆主要包括研究过程记忆、语义记忆、情景记忆等内容。感知主要研究人类的物理感知及其认知的过程。感知除了包括视觉、嗅觉、听觉、味觉、触觉等外,还包括认知过程。

另外,还需要研究语言。语言即传递信息的声音,是人们交流思想的媒介。研究语言可以帮助人工智能了解语言的习得和获取的过程,以及对信息的元认知。元认知是研究关于认知的认知、关于思考的思考、关于认识的认识。

通过对认知心理学和认知科学的学习,可以了解人工智能产品设计中的底层逻辑知识,了解人工智能产品是如何实现感知、语言交互及判断的。1.3 人工智能的分类

人工智能的分类方式有两种,其中一种分类方式是按照人工智能的智能化程度进行分类,包括弱人工智能、强人工智能和超人工智能。

弱人工智能(Artificial Narrow Intelligence)是无意识的计算智能或者擅长某一方面的人工智能。目前人们所能接触到的人工智能产品都属于弱人工智能产品,如苹果公司的Siri、谷歌的AlphaGo等。因为是Siri只具备语音识别功能和自然语言回答的能力,AlphaGo也只是围棋领域的世界冠军。

强人工智能(Artificial General Intelligence)即机器对任何问题都具有智能处理的能力。强人工智能也是人工智能的主要研究目标,希望机器能够像人类一样进行思考、计划、解决问题、理解复杂理念,能够快速学习并从经验中学习和总结等。也正因如此,创造强人工智能要比创造弱人工智能难得多。

超人工智能(Artificial Super Intelligence)是假定有一个智能体,拥有远远超过最聪明和最有天赋的人类大脑的智能。

对于强人工智能、超人工智能,以现有的科技水平还远远实现不了,但科幻小说家和影片导演已经凭借天马行空的想象力,为我们展示了未来世界超人工智能的能力。

另一种分类方式是通过“类人”和“合理”两个维度来区分人工智能在行动、思考方面的能力,将类人、合理、行动、思考进行组合后可以得出如图1-3所示的四个分类。用坐标系将人工智能区分为像人一样思考的人工智能、可以合理思考的人工智能、像人一样行动的人工智能、可以合理行动的人工智能。如果一台机器能够像人一样思考或像人一样行动,就可以认为其具备智能。同样,如果一台机器能够进行合理思考或合理行动,也可以认为其具备智能。图1-3

需要注意的是,关于“合理思考”及“合理行动”的科学概念被提出的时间晚于“像人一样思考”和“像人一样行动”概念。也就是说,科学家早期将人工智能定义为能够像人一样的智能机器,随着科学的发展,智能的概念也越来越具体,认为能够合理地完成任务同样也是智能的表现。目前,人工智能的前沿领域都在针对上述四个目标进行深入研究,以使计算机更加智慧、聪明、有用。

综上所述不管采用哪种人工智能的分类方式,一个系统或机器要拥有智能,都需要对以下四个能力完成突破。(1)能通过设备获得信息:通过视觉、听觉、触觉等各种输入设备接收文字、图像、声音等外界信息。(2)能对信息进行处理:通过信息处理过程,将数据抽象为知识,并对事物的规律进行分析、判断、推理、决策。(3)能对自身进行迭代优化:通过训练、学习,不断丰富自己的知识、技能,优化自身的学习能力。(4)能对外部刺激进行反应:拥有刺激灵活性,对外部不同刺激进行不同反应,提高自身的适应能力。1.4 人工智能的研究领域

人工智能的研究领域很广泛,目前主要包括五大方面:搜索、推理、规划、学习和应用,如图1-4所示。

搜索也被称为问题求解;推理是根据知识进行推导;规划是根据规则确定实现路径;学习是根据数据进行学习、归纳和总结;应用与前四类不同,其覆盖的领域很广泛,我们可以把它概括为人工智能在沟通、感知、动作三个方面中实际场景的应用。本书总结了当前人工智能较为热门的一些领域。

问题求解:问题求解是人工智能最大的成就之一,人工智能第一个发展高潮就是研究形式对策方面的博弈问题、模式识别。例如,1997年在国际象棋领域击败了卡斯帕罗夫的深蓝,2017年在围棋领域击败了柯洁的AlphaGo,它们都属于问题求解范畴。正是人工智能在问题求解上取得的重大成就,才让世人对人工智能有了深入了解。图1-4

自然语言处理:自然语言处理(Natural Language Processing,NLP),是研究如何让计算机“听懂”人类的语言,并理解语言中表达的具体意义的。在NLP的研究中,一般会用到计算机理解技术和自然语言生成技术。目前,NLP的研究主要集中在手写文字识别、语义理解、机器翻译、口语理解等方面,如果产品中涉及语言文字的处理,则需要对NLP有深入的了解。

专家系统:专家系统本质上是一个拥有智能的计算机程序,它可以运用知识和推理能力解决原本只有专家才能解决的复杂问题。一般来讲,一个专家系统应该由知识库、推理机、解释器、知识库维护、知识获取、信息输入和人机交互界面等组成,如图1-5所示。

在专业领域接触到的一些计算机辅助类的人工智能软硬件基本上都可以归纳到专家系统中。例如,医疗软件通过对CT影像的分析和推理,检查患者是否患有某种疾病;气象软件通过对气象数据的分析来预测某个区域是否会形成台风。

人工神经网络(Artificial Neural Network,ANN):科学家对人工神经网络的研究很早。例如,20世纪40年代,科学家就开始尝试利用多个简单的单元来模拟人类的大脑神经结构和功能,后续又出现了多层神经网络。人工神经网络在机器学习、专家系统、机器人等多个方面取得了显著成就。目前,人工神经网络的研究已经成为人工智能领域一个极其重要的领域。神经网络和专家系统的区别在于,专家系统侧重于人类处理知识的功能性模拟,人工神经网络侧重于对人脑神经元结构的模拟。图1-5

机器人:机器人是在一定条件下模拟人类操作完成的行动或功能的机器。目前,机器人已经被广泛应用于工业、农业、医疗、家庭等领域。机器人通过感知环境和思维能力,从外部环境获取资源和信息,并对这些信息进行处理。目前,在很多家庭中也已经出现了机器人的身影,如扫地机器人、智能家教机器人等。

机器学习:机器学习主要研究如何让机器通过学习来改善、提高其工作能力,这些能力包括了计算能力、逻辑能力、行为能力。总的来说,机器学习的目标是让计算机模拟出人类的学习能力,并不断提高解决问题的能力。机器学习在人工智能领域的应用极其广泛。机器学习的方法主要包括统计、分类、回归、聚类、计算等。1.5 人工智能的商业模式

随着人工智能技术的不断发展,人工智能产品也层出不穷,从深蓝到AlphaGo,从专家系统到智能家居,人工智能在很多商业场景、生活场景中都得到了不同程度的应用。在人工智能技术发展和应用的过程中,人工智能产品也从实验室走向了产业落地。智能手机、智能手表、智能手环、智能音箱已经完全进入了人们的生活中,指纹识别、人脸识别、画面增强等实用性技术,也成了人工智能产品中必不可少的技术。随着商业化场景的逐渐丰富,人工智能的商业化模式也将逐渐形成。目前,人工智能商业化模式主要包括5类,分别是基础硬件模式、技术驱动模式、垂直行业模式、深挖应用模式和建设生态模式。

1.基础硬件模式

近年来人工智之所以能有长足发展,主要得益于三方面的发展,即数据、算法、算力。其中,算力的发展主要表现在芯片上。人工智能的快速发展很大程度上得益于多年来芯片技术的发展与积累,也正是因为芯片技术已经发展到了可以支撑机器学习、深度学习所需要的处理能力和速度,我们才能享受到人工智能产品带来的便利,也正是由于芯片在人工智能产业链中的重要地位,很多企业会选择以芯片研发等基础硬件建设模式切入人工智能市场。芯片研发对于企业硬件技术、制造工艺的要求都非常高,所以从事芯片研发的企业仍属少数。

传统的x86架构以CPU系统为核心,GPU主要应用在处理图像渲染上。由于GPU的加速能力远超CPU,随着人工智能和深度学习的成熟,GPU找到了新的用武之地,加之GPU计算时间短、功耗低,因此GPU已经逐渐成了人工智能的算力核心。

英伟达公司在GPU芯片界中占有重要的地位。在GTC 2017大会上,英伟达公司发布了Volta架构的GPU,在Volta架构中强调了对深度学习的支持,还增加了专为深度学习设计的张量计算核心(Tensor Core)模块,其关键参数在数据中心的训练方面较之前有很大提升。

GPU相比CPU拥有了更强大的算力,所以在机器学习的训练阶段,GPU是目前的最优选择。由于GPU在推理和神经网络运算中仍存在一些缺陷,为了更好地获取推理能力,谷歌公司提出并研发了TPU芯片,如图1-6所示。谷歌公司在ISCA 2017上发表了一篇名为《张量处理单元的数据中心性能分析》(In-Datacenter Performance Analysis of a Tensor Processing Unit)的论文,论文中公开了TPU的设计细节,引发了极大的关注。TPU针对机器学习进行了专门的优化,在AlphaGo身上,谷歌公司就使用了该芯片。图1-6

从2016年开始,人工智能芯片越来越受到传统企业的重视,很多软件和互联网公司都纷纷进入该行业,除谷歌、英伟达外,苹果、微软、Facebook、英特尔、高通、AMD、阿里巴巴等公司也都开始自主研发人工智能芯片或垂直领域的行业人工智能芯片。

一般来讲,从基础芯片研发切入人工智能行业的公司,其应在芯片领域具备技术优势,如英伟达公司是世界最大的GPU生产厂商。除生产通用性的GPU、CPU、TPU产品外,更多的公司则根据自身在某一行业中的积累,选择了生产在该行业领域中运用的人工智能芯片产品。例如,针对无人驾驶技术所使用的处理芯片、针对汽车制造行业所使用的多轴转向机械臂使用的芯片等。这些芯片与行业场景深度融合,为该行业场景提供专用的芯片。人工智能芯片的分类如图1-7所示。图1-7

2.技术驱动模式

一些技术实力较好的软件公司,凭借其在软件行业积累的良好经验,也正在逐步构建人工智能领域的优势,如微软、Facebook、IBM等公司。这类公司在软件时代就有着较强的技术实力,在算法和通用技术方面都有着强大技术优势,他们利用这种技术优势,将某一个行业作为切入口,逐步建立该行业的应用平台。以技术驱动型的公司通过建立应用平台形成技术积累、输出、分享模式,进而发展平台用户数量,以占领更多的市场。例如,IBM的Watson平台、亚马逊的AWS平台、微软的Azure平台等。

3.垂直行业模式

垂直行业模式适合在细分垂直领域有优势的企业,如在电商领域占优势的阿里巴巴、在出行领域占优势的滴滴出行、在政务领域占优势的开普云等。这类公司一般利用其在某个行业占有的领先优势,积累的海量行业数据,并以数据为基础,开展垂直领域的人工智能技术和算法的研究,提出针对该行业的整体解决方案。针对垂直行业深入研究,一般有以下两个方向。(1)通过积累大数据形成产品。企业通过在垂直领域深耕细作,逐渐建立其自身在行业中的领先优势,通过不断积累,形成该行业大数据,并利用数据优势针对行业内的具体场景率先推出独角兽级的人工智能应用。此类人工智能应用一旦出现,往往会形成新一轮的用户和数据积累,从而成为该行业的人工智能引领者。例如,滴滴出行通过打车业务占领市场,并逐步扩大应用场景,推出专车、快车、顺风车等业务,通过人工智能技术优化推荐,逐渐成为行业领头羊。(2)通过产品应用形成行业解决方案。企业通过领先优势积累该行业的大量数据后,再依靠人工智能的技术手段结合行业特征,抽象出行业应用平台、行业通用技术、行业解决方案,从而扩大在该行业的市场份额。例如,百度公司通过其在地图方面的优势,并结合自身的人工智能技术优势,推出了针对无人驾驶的平台。

4.深挖应用模式

深挖应用模式不再针对具体的技术本身,而是着重于实际应用在具体场景中的应用深入。通过这种“单点突破”的方式,可以快速地形成市场效应。例如,通过对应用场景的深度挖掘,并对该市场进行合理管理,可以在场景中迅速扩大市场。也正因如此,应用深挖应用模式的一般是创业型企业和传统行业企业。

因为创业型企业技术和资源有限,所以投入硬件或深度技术领域的投资与回报严重不成正比,而通过市场反馈寻找合适的场景,并在场景中运用人工智能技术就会相对容易。如果创业型企业自身拥有细分市场数据或具体场景内的数据,则可以针对场景构建人工智能应用,通过该应用形成市场效应,从而积累用户和数据。例如,如果企业自身没有行业数据,可通过借助与第三方公司合作模式,将人工智能与传统商业模式进行结合。

今日头条是典型的将应用价值点与人工智能相结合的企业。今日头条基于数据挖掘的推荐引擎,为用户推荐个性化的信息,其在资讯推荐领域的优秀算法,使其成为移动互联网领域成长飞快的企业之一。

5.建设生态模式

建设人工智能生态,是人工智能重要的一种商业模式,这种模式也是大部分企业的目标。在人工智能产业链中,企业不管拥有硬件研发能力还是拥有技术能力,不管拥有垂直行业领先还是通过深挖应用形成市场积累,都属于单一化模式。但如果能够通过技术、市场相结合,形成人工智能生态圈,不仅可以在单一竞争中形成自己的优势,也可以通过生态体系中的资源优势形成产业壁垒。

构建人工智能生态,要从发展人工智能的支柱要素说起。建立完善的人工智能生态,需要企业针对数据、算法、算力都有长期发展的战略高度,并且有与之匹配的技术实力。数据的本质是描述事物的特征,也是对事物观察的行为过程和结果的记录;算法是用来解决问题的具体方法;算力是指运算能力。如果一个企业要建立完善的人工智能生态,应该已经或正在通过互联网进行大数据的高速积累,已经或正在对算法底层进行研究,并针对硬件进行优化和改造。当然,构建生态的过程相对较长,涉及的领域较多,截至2019年,人工智能生态结构方面比较成功的公司有谷歌、亚马逊、微软、阿里巴巴、百度等。1.6 人工智能的盈利模式

随着人工智能技术的不断发展,人工智能技术如何落地形成产品、人工智能产品如何市场化生产、人工智能产品市场如何实现盈利成了企业最关心的问题。目前,人工智能的盈利点来自三个方面:通过专利技术的授权、转让或置换实现盈利;通过输出人工智能技术实现盈利;通过销售产品实现盈利。

1.通过专利技术的授权、转让或置换实现盈利

随着经济的发展,中国已成为全球消费品生产、消费和贸易大国,中国的人工智能产品也越来越多,而支撑人工智能产品的基础是中国在人工智能技术方面的不断创新。

全球人工智能领域的专利数量自2011年开始逐渐呈现爆发式增长,每年的复合增长率达到30%以上。中国在AI方面的专利技术布局程度已经位居世界第一。正因为专利技术在人工智能产品中的重要性,在人工智能市场上,通过技术创新申请专利,并将专利技术转让已经成了一种非常重要的盈利模式。

对比一下中国和美国在人工智能领域的六个企业——腾讯、百度、阿里巴巴、IBM、微软、谷歌可知,这些企业都非常注重整体的专利布局。而且,通过比较这些企业申请的专利可知,美国企业热衷于机器学习、语音识别、语言合成处理等领域,中国企业则倾向于支付、交互技术、视频图像信息处理、智能搜索等领域。另外,六家企业都比较感兴趣的领域有无人驾驶、数据文本聚类、指纹识别等。

IBM专利布局比较全面,其中算法优化、自然语言处理、自主驾驶领域布局优势明显;微软的专利布局主要在机器学习、神经网络、音视频识别等领域;谷歌主要是在无人驾驶、语音识别、自然语言处理领域有较多专利;腾讯主要在即时通信、数据处理、支付平台、数据交易等人工智能领域展开布局;百度比较热衷在搜索业务、无人驾驶、语音识别、图像识别等领域布局;阿里巴巴则在支付平台、信息交互、广告投放等领域布局明显。

企业在申请人工智能相关专利技术时,应充分体现出理论层次性、技术创新性、工程复杂性。在撰写时应注意以下几个方面:①建议突出其成果专利的创新能力;②建议突出技术细节,并描述技术深度;③建议合理运用应用场景结合技术创新。

2.通过输出人工智能技术实现盈利

除通过专利技术的授权、转让或置换实现盈利外,拥有人工智能技术的公司也可以通过对外提供技术服务实现盈利。目前人工智能的技术服务体系包括了基础级技术服务、技术级技术服务和行业级技术服务三个层面。

基础级技术服务是指企业通过提供框架平台或算法平台来提供的技术服务。例如,百度AI开放平台,阿里云ET大脑、腾讯AI平台、讯飞开放平台等。

提供基础级技术的公司通过推出这些平台接口,吸引更多的用户,从而进一步活跃其产品的应用,并逐渐打造起一个开发者生态,并通过生态的活跃,提供其产品在行业中的应用,如图1-8所示。阿里云ET大脑提供了多项人工智能技术服务,包括ET行业大脑、人工智能解决方案、人工智能接口、算法平台、ET大脑生态等内容。图1-8

上述公司在人工智能基础技术领域内有一定的优势,因此这类公司会在具体的技术领域进行拓展延伸。当然,如果这类公司仅仅提供技术,则会有竞争力弱的困扰,所以这些仅提供技术的公司往往通过“人工智能+行业”的模式形成具体的解决方案从而实现持续的盈利。

如果人工智能类的公司既拥有技术,同时又拥有大量的数据积累,则可以通过提供人工智能产品应用实现盈利。例如,格灵深瞳将人工智能和视频监控进行结合,开发了威目视图,实现了图像识别、人车定位识别;旷视科技的Face++平台,已经是我国领先的人脸识别的服务平台。

3.通过销售产品实现盈利

人工智能专利技术的转让及人工智能技术服务的输出,一般都是面向企业的,而人工智能产品则是面向大众的,易形成影响力。随着人工智能的发展,人工智能的产品类型也越来越多,如人工智能机器人、智能音箱、实时翻译工具、电子商务推荐助手、医疗影像检查、智能手环、游戏等。

人工智能产品销售方向有两个:一是面向企业,即2B;二是面向个人,即2C。2B方向的产品主要以提高生产力为目标,为企业降本增效,如智能分拣机器人、智能服务员、智能客服等。2C方向的产品主要是作为人体的延伸进行辅助判断及辅助操作,如智能音箱、智能推荐系统等。天猫精灵是阿里巴巴人工智能实验室于2017年7月5日发布的人工智能产品。天猫精灵内置智能语音助手AliGenie,能听懂普通话语音指令,并实现智能家居控制、语音购物、手机充值、音乐播放等功能。2018年5月27日,阿里巴巴公布了天猫精灵的销量,销售总量超过了300万台,业绩非常优秀。1.7 本章小结

本章笔者以产品经理的视角介绍了人工智能研究领域、人工智能商业模式和盈利模式。这些内容将为大家理解人工智能产品和构建人工智能产品奠定基础。第2章 人工智能产品

↘ 2.1 人工智能产品的发展阶段

↘ 2.2 人工智能产品的发展史

↘ 2.3 人工智能产品的认知误区

↘ 2.4 人工智能产品和互联网产品的区别

↘ 2.5 典型人工智能产品

↘ 2.6 本章小结

产品是指能够供给市场,被人们使用和消费,并能满足人们某种需求的东西,它包括有形的物品、无形的服务、组织和观念及其组合。人工智能产品可理解为像人一样能够进行最优化的思考或行动并且具有用户使用价值的产品。从客户(购买方)或用户(使用方)的角度可以理解为,人工智能产品是可以辅助或替代自身进行思考或行为的产品,并且这些思考与行为对自身产生了实际的价值。

站在市场的角度单纯看待人工智能技术并无意义,只有让人工智能技术实现市场化落地,通过具体的产品形式满足人们日常生产生活中对不同场景的需求,人工智能技术才真正产生价值,而这也正是人工智能产品经理所关注的内容。2.1 人工智能产品的发展阶段

人工智能产品并不是一蹴而就的,而是需要先经过概念提出阶段,然后完善业务与技术逻辑,最后通过场景落地,进行市场产品化运作。总体来讲,人工智能产品从模型到落地可分为如下三个阶段。

技术实验阶段:在技术实验阶段,人工智能技术所需要的数据、算法、算力资源相对集中,一般集中在政府、大学研究机构或大型公司的实验室里。技术实验过程中的工作主要是针对人工智能的基础算法模型进行训练和研究。

企业应用阶段:当实验技术研究相对成型,并表现出一定的实际应用价值后,科技企业往往会针对某项技术进行精细钻研,以期望在市场竞争中获得技术先手。而对于一些相对较小的企业,则会利用这些科技企业提供的资源或平台促进自身的发展。这一阶段往往集中在分布式计算、分布式应用、场景化基础技术提供等方面。

市场应用阶段:市场应用阶段是各类型的企业通过将基础平台与基础场景技术资料相结合,进行市场化的产品研发。市场应用标志着人工智能算法与企业作业场景、个人消费场景的融合,并将算法在这些场景中进行稳定的输出,这一步也是人工智能技术普及的关键一步。2.2 人工智能产品的发展史

人工智能产品的发展是伴随人工智能理论及技术的发展而成长的。人工智能理论从诞生到现在,经历过寒冬,也经历过辉煌。从1958年第一个人工智能程序Logical Service诞生后,就相继出现了各种人工智能专家系统,但这些系统并没有完全市场化。直到20世纪80年代中期,人工智能产品才有了质的飞跃,其根本原因是20世纪80年代中期,科学家发明了决策树,出现了机器学习。

同样是在19世纪80年代中期,科学家还发明了多层人工神经网络。多层人工神经网络是在原来的两层神经网络中增加了多个隐藏层。原来的神经网络只有两层,即输入层和输出层,如图2-1所示。输入一个N维向量i=[i,i,…,i],其中每一个分量对应一个权值W;输jj+1nj入的数据,经过乘积运算后直接输出结果,这种两层的神经网络主要用于感知机,即直接根据输入进行反馈,而多层人工神经网络意味着在输入层和输出层之间存在多个隐藏层,这标志着人工神经网络可以处理更加复杂的问题,突破了单层感知机的局限性。图2-1

20世纪80年代后,人工智能的发展进入了低谷期,直到1993年人工智能才又取得了突破性进展,其中代表性的人工智能产品如下。

IBM研发的深蓝如图2-2所示,有32个微处理器,每秒可以计算2亿步,且输入了200多年来200多万局优秀棋手的对局。1997年,深蓝以3.5∶2.5的总比分战胜了国际象棋冠军卡斯帕罗夫,成为世界上第一台赢得国际象棋比赛的人工智能产品。图2-2

2005年,斯坦福大学的机器人车辆Stanley在机器人挑战大赛中获得了冠军,如图2-3所示。机器人挑战大赛是由美国国防部在2003年发起的,是为了鼓励企业或个人在无人驾驶等人工智能上的创新。该挑战大赛要求参赛机器人通过自动驾驶系统在142英里(1英里≈1.61千米)的道路上完成比赛,总耗时不得超过10小时,难度相当大。2005年的比赛,共计注册了195支队伍,最终完成比赛的只有5支队伍。斯坦福大学的机器人Stanley第一个完成了任务,用时为6小时53分58秒。图2-3

2006年,Geoffrey Hinton联合他的学生在Science杂志上发表了名为《深度学习》(Deep Learning)的论文,使深度学习这个词引起了极大的关注。同样也是由于这篇论文的发表,人工智能又成了科技界的焦点。

2011年,IBM公司的Watson在智力问答比赛Jeopardy中战胜了两位前智力问答冠军,获得了100万美元的大奖。

2011年,谷歌公司启动了一个项目——谷歌大脑(Google Brain),如图2-4所示。该项目是“Google X实验室”的一个主要研究项目,其将16 000台计算机连接成一个计算机处理器群,组成全球为数不多的大型中枢网络系统,能自主学习,致力于模仿人类大脑。例如,谷歌大脑通过对1 000万张图像的学习,可以成功地识别一只猫。图2-4

2012年,苹果公司推出了Siri,如图2-5所示。Siri是语音控制的智能个人助理和知识导航软件,用户可以利用Siri读短信、询问天气、询问路程规划、用语音设置闹钟等。Siri可以支持自然语言输入,并且可以调用其他应用系统,如天气预报、日程安排、搜索资料等。另外,Siri还能够不断学习新的声音和语调,提供对话式的聊天。2017年,苹果公司在WWDC开发者大会上,为Siri增加了实时翻译功能,支持英语、法语、德语等,而且Siri的智能化还在不断提升,如支持上下文的预测功能,用户甚至还可以用Siri作为Apple TV的遥控器。图2-5

2012年,微软公司的首席研究官瑞克拉·希德到中国天津出席研讨会时,演示了一款实时口译系统——“英中双语通用翻译器”(Real Time English to Chinese Universal Transport)。这个翻译器可以将演讲者讲的英语自动翻译成中文,并且将中文通过语音合成的方式发出声音来。这款翻译器引起轰动的原因不仅仅是其翻译准确,更是因为翻译播放的语音还保持了演讲者口音和腔调的特点,就像演讲者本人在使用中文演讲一样。

2014年4月,微软公司正式推出Cortana,其是一款运行在Windows Phone上的个人助理软件。2014年6月,微软公司又推出了聊天机器人小冰,如图2-6所示,人们可以和小冰用自然语言进行自由交谈。图2-6

2014年8月,一款名为“尤金·古斯特曼”(Eugene Goostman)的聊天机器人问世,如图2-7所示。在纪念图灵逝世60周年的一个比赛上,有33%的裁判认为“尤金·古斯特曼”是人类,因此主办单位按照图灵测试的规则,宣布“尤金·古斯特曼”已经通过了图灵测试。这也是人工智能产品第一次通过图灵测试。图2-7

2014年8月,IBM公司发表了类似于人脑的TrueNorth芯片,这是一款神经形态的COMS芯片,由4 096个硬件核心组成,每个硬件核心可以仿真256个可编程的硅神经元,总计刚好超过百万个神经元。图2-8所示为集成了16块TrueNorth芯片的电路板。图2-8

2015年2月,谷歌公司在Nature杂志上发表了“Deep Q Network”(DQN),这款神经网络通过深度强化学习可以达到人类水平的操控。运用DQN在20世纪七八十年代的一款老式的视频游戏机上对49个视频游戏软件进行了测试,测试的结果为59.18%,达到或者超过了人类的水平。图2-9展示了DQN的逻辑架构。图2-9

2015年12月,谷歌DeepMind开发的一款计算机围棋程序AlphaGo打败了欧洲围棋冠军樊麾,成绩是5战5胜。这是计算机围棋软件第一次击败人类的职业围棋手。不过这个消息一直到2016年1月27日才在Nature杂志上发表,据称是为了与描述该算法的论文保持同步。

2016年3月,举世闻名的围棋人机世纪大战在韩国首尔举行,由AlphaGo对战韩国九段职业棋手李世石,结果AlphaGo以5战4胜的成绩赢得了比赛。2017年,世界围棋等级分排名第一的柯洁对战AlphaGo,这场“世纪大战”不仅有与柯洁的个人赛,更有混合战,由5位棋手联合对战AlphaGo。针对这次比赛,柯洁曾表示:“300年前人类发明了蒸汽机,超越了当时人类想象。如今谷歌DeepMind发明的AlphaGo也超出了所有棋手的想象,在与它对决时感觉就像在对话未来,感受非同凡响。”最终这场比赛还是人类告负,比赛结束后AlphaGo在世界围棋等级分排名中稳居第一。

2019年1月25日,DeepMind公司研发的AlphaStar以总比分2∶0的战绩战胜了两位《星际争霸2》的人类职业选手。这是自2017年AlphaGo在围棋上战胜人类之后再次刷新人类对于AI的认知的人机大战。《星际争霸2》是一款即时战略游戏。虽然围棋中可能出现的局面总数是一个天文数字,但具体到每一回合中,比赛的双方只需要选择在棋盘的某一处落一颗棋子即可。相比之下,现代的竞技类电子游戏的行动空间就复杂得多。《星际争霸2》是在一个充满迷雾的地图中采集不同资源,根据资源情况建造不同类型建筑,并生成不同类型的兵种与对手对抗。比赛时,需要考虑平衡多个信息,如收集资源情况、资源消耗情况、自身的发展模式、兵种配合,并实时侦察对手的资源情况、资源消耗、对手的兵种,而且还要注意对手的侦察、偷袭,可以说《星际争霸2》模拟了一整套人类战场的状态。另外,在战争发生时,双方还要根据战场状况实时调整各个兵种的站位、消耗,以及后续的兵种补给。也正是《星际争霸2》的战场空间宏大、动作空间连续、变化形式无穷,以及视野受限等诸多因素,使《星际争霸2》成为AI界难以攻克的游戏之一,如图2-10所示。图2-10

与AlphaStar对战的是世界排名第68位的TLO和排名第19位的MaNa,虽然这两位也属于世界一流选手,但在与AlphaStar对战中,他们分别以0∶5和1∶5落败。DeepMind公司研发的AlphaStar与AlphaGo一样采用了强化学习,让AI模仿人类玩游戏的方式操作。AlphaStar把游戏看作长序列建模学习任务,在进行强化学习时,它的模型设计也以长序列建模为核心。模型从游戏接口接收的数据是单位列表和这些单位的属性,经过神经网络计算后输出为游戏中的执行指令。AlphaStar的神经网络的基础是Transformer网络,并且结合了一个深度LSTM网络核心、一个带有指针网络的自动回归策略头,以及一个中心化的评分基准。这样的网络架构是DeepMind公司对复杂序列建模任务的最新思考结果,他们相信这样的先进模型会在其他需要长序列建模、有很大行动空间的机器学习任务中拥有优秀的表现,如天气预测、气候建模、语言理解等。2.3 人工智能产品的认知误区

人们对人工智能产品的认知存在以下误区。

误区一:人工智能产品就是能够像人一样工作。很多人对人工智能的理解,都是来自著名的图灵测试:“所谓人工智是让一个人,提出一些书面问题,如果判断不出来是人还是机器,则认为是人工智能。”如果要通过图灵测试,涉及几个关键技术的突破,即自然语言处理(Natural Language Processing)、知识表示(Knowledge Representation)、自动推理(Automated Resoning)、机器学习(Machine Learning)。当然,以上仅是满足图灵测试的基本要求,如果要完全通过图灵测试,还要加上计算机视觉(Computer Vision)和机器人学(Robotics)等内容。

但是,人工智能的研究者普遍没有朝着图灵测试的目标前进。原因很简单,如同人类一直想像鸟儿一样在天空飞翔,但人们不可能把自己改造成一只小鸟从而骗过其他鸟儿,或者造出一个飞行器骗过其他鸟儿,而是制造出了飞机,从而帮助人类飞上天空。

因此,在进行人工智能产品研发的过程中,应将重点放在如何通过人工智能技术解决具体场景中的问题上,并将人工智能技术产业化、产品化,从而使人类从某些体力型、重复型、技能型的工作中解放出来,使人类从事更多创造性工作,这才是人工智能技术应用的目标。

误区二:人工智能产品是全面的人工智能。传统认识中,认为人工智能可以做任何事——机器人可以帮人们扫地、煮咖啡、去菜市场买菜,甚至能帮人们处理解决大部分工作。但事实上,目前的人工智能产品大多是帮人们解决现实场景中、限定范围内的具体问题,如帮人们翻译文章、做海量数据的分类等。即使是十分复杂的游戏——围棋,它也是在一个已知边界的环境下(纵横各19条线,将棋盘分成361个交叉点)进行智力对决。

目前的人工智能技术还不能处理超复杂的、模糊的、开放性的场景和信息,因此在使用人工智能技术进行产业化、产品化的过程中应该针对限定边界下的业务,通过人工智能完成数据和逻辑的处理。这也是我们认为目前的人工智能是弱人工智能,而非强人工智能的原因。

产品经理在设计产品的时候,不要考虑其是否属于强人工智能或者弱人工智能,而是要考虑人工智能产品是否实用,考虑产品适用的行业、岗位、场景、行为特征、执行方式和指标。2.4 人工智能产品和互联网产品的区别2.4.1 互联网时代的产品特性

互联网是20世纪重要的发明之一。通过互联网可以把各种数据联系到一起,形成了一张大的信息网,使信息不再是一个孤立的节点。互联网的出现让人们体验到了信息的快速传输、数据的海量共享,但是随着接入互联网的信息越来越多,大量冗余的信息充斥着人们的眼球。这些冗余信息严重干扰人们对有价值信息的精准分析和正确选择,消费者几乎每天面对的都是海量的信息与数据,也面对着数十万个应用可供选择,这就是互联网时代的“信息过载”问题。这也是互联网产品经理最头疼的事情:如何能够让自己的App或系统突破用户视野的信息洪流,让产品抓住更多用户的眼睛,让产品在一个用户那里占据更多的时长。

为了更好地突破信息洪流,强化互联网产品的信息传递效率,产品经理归纳和总结出很多产品设计理念、交互设计模型及产品设计过程中的方法论。例如,“以用户为中心的产品设计”理论的基本思想就是将用户时刻放在所有问题的首位。以用户为中心的产品设计,如图2-11所示,突出了人、行为、情景、技术四者的关系,并通过这种关系形成了产品设计体系。在产品开发的最初阶段,制定产品的策略就应当以满足用户的需求作为基本动机和最终目的;在后续的设计和开发阶段,对用户的研究和理解应当作为各种决策的依据;在产品生命周期的各个阶段,修订、优化、改造也都应该来源于用户。图2-11

另外,有些公司或学者也总结出了传统的互联网产品从0到1的过程方法论。例如,产品过程包括产品规划、资料收集与分析、方案构思、方案细化、实现、测试、上线、优化迭代等阶段。这几个阶段中都有大量的管理细节、技术细节。例如,如何在研究、决策、设计、实现、销售、购买、使用的过程中运用剧本引导法等。

以用户为中心的方法论和从0到1过程方法论的基本出发点都是如何“实现”产品的,互联网产品究竟是什么,互联网产品是用来做什么的?

笔者认为,互联网产品的核心是用来提高信息之间传递的效率。产品经理做的每一项工作,如需求调研、做用户分析、画原型、设计交互,其实都是围绕着如何提高信息传递的效率展开的。如果某个产品针对某个行业、某个场景、某个业务、某个行为,可以提高信息之间传递的效率,那么该产品必定是一个成功的产品。

在没有QQ、微信之前,人们的信息传递主要通过面对面沟通、电话等方式,QQ、微信出现后人们不必非要面对面进行沟通,人们也不必非要拨号实现实时沟通,QQ、微信将沟通的信息传递效率大大提升,人们只要在线,就可以实时获得对方信息。

在没有电子商务之前,人们的交易主要依靠是否拥有线下的商品信息资源,依靠低买高卖赚取利润。因此,掌握更多信息的人可以赚钱,他们利用这种信息不对称来赚取利润,而这种利用信息不对称来赚取利润是人们几千年来的习惯。电子商务出现后,生产方、渠道、消费者完全通过一个平台实现信息互通,将各个中间环节打通,让人们足不出户就可以采购到原产地商品。

在没有Uber、滴滴出行之前,出租车和打车人之间的信息是不对称的,出租车司机不知道哪儿有客人,而乘客也不知道哪儿有车,两者之间通过路边的一次偶遇才能实现一次交易,这种依靠偶遇完成交易的过程,信息传递的效率是极其低下的。Uber、滴滴出行将出租车与乘客之间的信息进行了连接,提升了信息传递效率。

产品经理们也在寻找各种工作和生活场景,并利用互联网的特性在这些场景中尝试打破原有的信息不对称现象。不过,随着互联网的发展,各种场景的市场也已经基本成为红海,因此各类型的产品满足的场景也从通用型场景变为了细分领域的场景。例如,为了分析互联网用户在使用网站或App时的行为及心理,市场上出现了很多网站数据分析系统或用户行为分析系统。图2-12所示为一套典型的网站数据分析系统,通过该系统可以分析访问网站的用户的基本信息、行为数据等内容。此类产品用于通用型网站的功能点分析是足够的,但如果用于特定领域则可能出现贴合程度不高的情况,如政务领域。一般政务网站的业务线包括办事、互动、查询等特殊需求,通用型产品虽然可以满足一般性需求,但是针对政务服务过程中具体的办事过程的分析能力是不高的。图2-12

针对政务网站的信息传递效率进行分析,如果能够抓住“政府需求”和“公众诉求”的重点进行产品设计,则信息传递效率会进一步提高。为了让行为数据更快速地提供给政府,功能和界面应该更贴合政府场景,图2-13所示为一款针对政府提供的行为分析系统。图2-132.4.2 人工智能时代的产品特性

本书讲到,互联网时代的产品以消除信息不对称、提高信息传递效率为核心目标,而人工智能产品则是从生产力的角度来考虑产品规划和设计。

初中课本就讲到过:“人类的社会发展,其实是生产力的不断发展。”“生产力是指具有一定生产经验及劳动技能的劳动者和他们所使用的生产资料结合起来,从而在物质资料生产过程中所发生的力量,也就是人类在生产过程中征服和改造自然界,并获得适合自己需求的物质资料的能力。”

对个人端消费级产品而言,人工智能的意义在于将人类本身的感官和技能进行了技术形态的延伸。消费级产品的人工智能应用点一般集中在三个方面:一是信息采集;二是协助判断;三是协助处理。

人工智能产品是通过信息采集获取大量的数据,然后通过对数据

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载