中国创投地图2(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-29 19:23:36

点击下载

作者:郑灵辉,阮聿泓

出版社:机械工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

中国创投地图2

中国创投地图2试读:

版权信息书名:中国创投地图2作者:郑灵辉,阮聿泓排版:skip出版社:机械工业出版社出版时间:2019-01-01ISBN:9787111615552本书由北京华章图文信息有限公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —推荐序一创投事业的人性之美吴世春梅花创投创始合伙人

创业如做人,知行合一者是高人。

投资即投人,知行合一者是首选。

我创业五年,后来转做天使投资,数年间看项目无数,投资理念也在这个过程中不断得到修正和强化,在我看来,这也是对知行合一的一种践行。

早期投资有很多打法,有的押赛道,有的搏风口,有的拼资源,有的赌政策,有的看团队。我属于这其中的第五种。赛道常挪移,风口会转向,资源不靠谱,政策难揣摩,只有团队(确切地说,是创始人)才拥有创业的主动权;只有怀揣强大的认知力和心力,方有可能在九死一生的创业险滩上遇山开路,遇水搭桥;只有充满创新精神和执行力的创业团队,才能为这个时代贡献最大规模的经济增量,为民众展现工作与生活的各种可能性,提供充满想象力的商品与服务新形态。

有趣的是,近些年,看重团队的投资人越来越多,“投资即投人”几乎成了一句烂大街的俗语,让人听到耳朵起老茧。

即便是投人,也有多种衡量办法。有的用心理学,有的凭第一印象,有的看面相,有的重性别,有的设年龄门槛。我的投人方法论的源头比较庞杂,既有国内的先哲论述,也有国外的科学理论(它们都有不少可取之处),而我投的项目在发展道路上所取得的优秀成绩,都反向验证了我的这些方法论的先验性和实用价值。

很多创业者常从法与理的灰色地带中,或利用人性的七宗罪寻觅创业机会,其中也不乏做大做强了的,但我对此不以为然。王阳明熟读孔孟经典,从《孟子》“人之所不学而能者,其良能也;所不虑而知者,其良知也”一句中悟出“致良知”的道理。在我看来,这是精准把握住了创业的命脉与方向。创始人自己的臆想未必是放之四海而皆准的所谓“痛点”与“爆点”,只有“去私欲,明天理”,做有益于用户与社会的项目,才能够得到资本与政策的支持和宽容,走得更远。

工业时代的人们天然喜好精确与规划,很多成长性企业创始人延续了工业时代的量化思维,计算市场容量和投入产出比。在信息时代,这些项目常常由于缺乏想象力和成长空间,不死不活地耗着,或者无疾而终。不确定性和不可预测性是信息时代的常态,这种常态要求创业者对未来而非经验抱有敬畏,弱化擅长计划的能力,强化认知学习的强度,摒弃依赖规划的惯性,培育应对变化的信心。

创投事业是一个磨炼心性和实战技能的修罗场,每一项投资决策对于创始人来说未必都是福音,对于投资者来说也常常变成不堪回首的记忆。明知道前面是九死一生,投资人仍愿意怀揣善意给创业者注入信任,创业者也愿意排除万难不轻言放弃,这正是创投事业的人性之美。

中国的财经类书籍,教人如何在二级市场炒股的多,教人如何在一级市场生存的少,“中国创投地图”系列属于后者。在我看来,“中国创投地图”系列的书名里还可以加入“生存”二字,例如《中国创投生存地图2》。我衷心希望市面上多一些像“中国创投地图”系列这样的书,为创业者提供创业之初的方向选择与创业过程中的实战之道。

吴世春 梅花创投创始合伙人,新势能基金创始合伙人,国内知名天使投资人,入行以来已投资近200个项目,明星项目有大掌门、趣店、小牛电动、唱吧、蜜芽宝贝、有书、花点时间等。推荐序二新空间×新连接×新认知,击碎创业的天花板毛大庆优客工场创始人兼董事长

进入现代社会以来,人们的工作场景大致经历了三次变迁。

最早也是最传统的一种工作状态是:企业主寻觅一个地方作为固定办公场所,员工们在每个工作日从城市的四面八方赶来,在一个固定的工位上待够八个小时,再回到自己住的地方。时至今日,这种工作模式的弊端已经显露无遗——大城市潮汐式拥堵的交通给员工造成的痛苦自不必说,标准化隔断式工位将每个员工都物化为生产线上的机器,上下级办公空间大小与装修的差异也成为职场阶层割裂的标识之一。

随着远程办公手段的成熟,一些跨国企业开始尝试远程办公,员工可以申请在家上班,一边工作,一边照顾家人。然而这种模式与面对面沟通产生的效率相距甚远,所以未能推广开来,但它激发了人们对于工作空间的全新思考:雇主与雇员的关系,是否一定需要通过物理空间捆绑在一起?

云存储、大数据、物联网、移动互联网的联袂助力,使得移动办公与共享办公成为可能。伴随着互联网成长起来的新一代创业者,理所当然地成了新型办公形态的先行者与受益人。他们骨子里潜藏着互联网时代培育出的平等、分享和协作的基因,与共享办公场景所呈现出的理念不谋而合,这种模式也因此爆发出巨大的生命力和市场潜力。

创业维艰,创业者会面临软硬件缺失的种种困境,而最大的困境,可能是在看不清前进方向时内心的无望与徘徊。我打造优客工场,不但希望通过空间的力量突破创业者在运营层面遇到的瓶颈,更希望通过连接无数创业者,以及他们在优客工场生态里的自连接,击碎他们内心的无助与退缩。

我跑过70多场马拉松,最让我刻骨铭心的一个场景,不是我在跑到终点后听到的欢呼声,而是我参加韩国首尔马拉松时听到的一句话。在那次比赛里,我走走停停,花了五个多小时艰难完成比赛。赛后,一个女跑者过来对我说:“祝贺你,打破了人生的天花板。”听完这句话,我不禁泪流满面。在这场马拉松之前,我因为滑雪意外摔伤腿部,膝盖韧带多处撕裂,自以为从此告别了跑步生涯。但经过大半年的康复训练,我鼓足勇气再次站在了马拉松的跑道上。创业和人生一样,处处都是天花板,最要紧的是不折腾、不纠结、不回头、不犹豫,咬牙走下去。

这是我第二次给“中国创投地图”系列作序。在《中国创投地图2》这本创投圈的小书里,我不但看到了创业者、投资人与行业专家的身影,还看到了来自人工智能、区块链、教育、医疗等行业的最新观点。

我衷心希望,不同立场与领域的观点在健一会平台上的碰撞,能产生认知的新连接,帮助创业者们找到更为明晰的创业方向,也帮助投资人精准导航到更为靠谱的创业项目。

毛大庆 优客工场创始人兼董事长、共享际创始人兼董事长、鸿坤集团高级合伙人、万科集团外部合伙人。推荐序三开启创投行业新征程贾红波红京咨询董事长

中国特色社会主义进入新时代,站在新的历史起点,如何更好地推动我国创投行业迈向新的历史征程?带着这样的思考和憧憬,怀着无比喜悦的心情,我和读者们一起与《中国创投地图2》见面了。《中国创投地图2》阐述了创投在中国经济发展中的重要作用,对推动创投行业持续健康发展具有积极意义。

创投行业发展进入新的历史时期。党中央、国务院始终高度重视促进创投行业的健康发展。2005年11月,国家发展和改革委员会与科学技术部等十个部委及单位联合发布《创业投资企业管理暂行办法》,为创投行业提供了特别法律保护和政策扶持措施,开启了我国创投行业的时代大幕。2016年9月,《国务院关于促进创业投资持续健康发展的若干意见》正式出台,为创投行业指明了发展方向。党的十九大报告提出,“激发和保护企业家精神,鼓励更多社会主体投身创新创业”和“深化投融资体制改革,发挥投资对优化供给结构的关键性作用”,这标志着我国创投行业发展进入新的历史时期。

创投行业是构建现代金融体系的重要参与者。创业投资者具有较强的风险管理能力,可以通过多样化的投资组合来分散风险,通过专业化管理提高投资效率,降低信息不对称,从而促进金融资源的有效配置,有助于解决以间接融资、债务性融资为主的金融体系效率低、成本高、资源错配等问题,有利于构建以直接融资、股权性融资为主的现代金融体系,能够有效打通金融服务实体经济和科技创新的“最后一公里”。

创投行业是新经济、新业态、新技术、新模式的培育者。对于“四新”经济企业和处在“蹒跚”阶段的众多中小企业而言,由于初期阶段投入大、成本高、不确定性强、风险高,故而难以适应传统的间接融资方式。创投行业凭借市场化的资本形成机制、风险分担收益共享机制和创业投资家的独到眼光,成为支持“四新”经济中小企业发展的有效方式,成为其逐步成长、做大做强的重要力量。比如,一大批优秀的成长型、创新型企业都是得到创投资金支持而成长起来的,如美国的苹果、Facebook和中国的阿里巴巴等。

创投行业是并购重组、产业与资本整合发展的推动者。创投行业的职责是促进“产业资本”与“金融资本”的有效对接,通过整合上下游产业链,淘汰落后产业产能,培育新经济新动能,推动产业融合发展、纵深发展,促进产业结构调整与优化升级。据统计,我国上市公司公告的并购案例中,大部分都有创投行业的参与甚至主导,创投行业在其中发挥了积极作用。并购重组已成为创投退出的一种重要模式。

创投行业是财富保值增值的重要贡献者。创投行业提供了一种专业化的金融服务,有助于促进“储蓄转化为投资”,形成“集合投资优势”“规模投资效应”,更好地实现财富保值增值,从而使参与者共同分享经济增长成果。创投行业已成为最大的风口行业之一,是未来五至十年财富保值增值的一个非常重要的领域,很多高净值投资者都积极投身到创投行业中,行业前景非常广阔。

与此同时我们也要清醒地认识到,当前我国创投行业发展仍面临法律法规不健全、政策环境不完善、监管理念不适应、退出渠道不畅等问题,也还存在投资估值虚高、“泡沫化”、非法集资风险隐患等乱象。因此,站在新的历史起点上,我国创投行业需要注意以下几个方面。

一忌跟风,做到抱团发展与专业精进的有机统一。创业投资既不同于传统金融资本,也不同于传统的产业资本,而是一种“融资+融智”的模式,越来越依靠技术、资本、人才、管理等多种要素的综合潜能,特别需要抱团发展。同时创业投资者也要保持专业上的一份清醒和冷静,走专业化发展的路子,真正做到抱团发展与专业精进的有机统一。

二忌短视,做到短期利益与长期利益的有机统一。创投行业“不只投钱,也投力投智”,需要加大“募投管退”的全程管理力度,不但要投好,还要协助管好、养好,更要做到“到位但不越位”。创投行业要注重给被投企业深度赋能,主动注入资金技术、管理经验和资本运作,特别是注入核心技术和竞争优势要素,既要当好“发现价值者”,更要做好“创造价值者”,努力实现短期利益与长期利益的有机统一。

三忌浮躁,做到经济效益和社会效益的有机统一。“大家好才是真的好。”无数的例子证明,创投不是吃青春饭、赚快钱的工作,本质上应是一项“马拉松”。创投行业要有利于科技进步和效率提升,有利于社会和国家发展,有利于民生改善和财富增长,才能达到多方形成的“利益共同体”的价值最大化,实现创投自身利益与整体利益、经济效益与社会效益的有机统一。

四忌过度自信,做到两点论和重点论的有机统一。创投行业很容易犯“情人眼里出西施”的错误,陷入“甜柠檬”心理陷阱。对创投行业既要全面、客观、理性地分析,不放过任何一条信息,又要分清主次、抓住重点。当前,创投行业要在全面分析国内外发展趋势的基础上,重点关注“技术创新”而非“模式创新”,关注实体产业“硬实力”而非虚拟投资“软影响”,尤其要聚焦关键核心技术领域和“卡脖子”的地方,切实做到两点论和重点论的有机统一。

站在新时代、展望新征程,我衷心祝愿并始终坚信我国创投行业必将拥抱“扬帆起航,长风破浪”的美好明天!

贾红波 红京咨询董事长。曾任中国证券监督管理委员会(证监会)办公厅秘书处处长,中国证券投资基金业协会秘书长,组建中国天使投资联席会并任首任荣誉秘书长。主编有《私募证券FOF:大资管时代下的基金中基金》一书。推荐序四我们走在一个独角兽狂奔的时代许晖溪山天使会创始人

我们进入了一个前所未有的时代,穿行于两个平行的世界之间,一个是互联网的比特世界,另一个是现实的物理世界。在互联网世界,时间和空间都发生了改变,数字化产品以光速传播,软件产品的边际成本趋向于零,硬件产品遵循摩尔定律,计算能力、存储能力呈指数级增长……商业模式也因此改变,开源、免费、共享、连接成为主流,速度为王,一旦形成网络效应,便会出现“赢家通吃”的局面。

我们又同时身处百年不遇的中国复兴的历史浪潮中,中国从短缺走向过剩,从追赶走向超越,从跟随走向创新,创新和创业的浪潮将成为中国真正的主升大浪。

我们非常幸运地身处这两股大潮中,企业的成长和扩张速度也大大提高,五年铸就百亿美元,十年铸就千亿美元。我们身边一个个大大小小的独角兽飞奔而过,可谓是“到中流击水,浪遏飞舟”。

产业信息化、客户用户化、产品服务化、服务智能化,比特世界正在逐步覆盖和重塑物理世界。

组织的形态也在发生改变,无边界的超级合作组织更多地涌现,连接越来越多的自由职业者、数字游民以及创新创业者、企投家。

我们处在一个澎湃的创新创业时代,一个正在全面走向创新创业的国度。相信未来十年,一定是创新创业的黄金十年,会诞生出一大批深刻改变和影响人类生活方式、推动社会进步的独角兽和企投家。

注意,中国,独角兽成群出没!

许晖 溪山天使会创始人,天使投资人,中国互联网第一代创业者,曾参与创办MyWeb中国、旌旗席殊电子商务公司、HiPiHi3D虚拟世界。推荐序五技术和资本,创业的两把双刃剑许嘉荣九万资本创始人

创新是这个世界上最美好的事物之一,它对接的是未来,一群人利用自己的专业知识与技能,带着热忱,在未知的环境里一步步拉近与目标的距离。所以创业者多半是年轻人,也只有他们,才有可能在生命最美好的阶段投入到一项前途未卜的事业中,不计后果,输得起。

风险投资的伟大之处在于,它愿意为这些年轻人的智慧和愿景买单。风险投资在中国属于舶来品,与互联网技术引发的第一波创业浪潮同时进入中国。硅谷和中国的创业项目有一点不太一样:硅谷的项目更注重创新,模仿类产品毫无市场,也得不到投资人的垂青,但在中国,尤其是早期阶段,大部分创业项目都在有意无意地模仿美国的同类企业,BAT无不如此。通过模仿,BAT为本土民众提供了在搜索、电商、社交等领域的全新互联网体验。在随后的一波波创业浪潮中,模仿现象依然常见:团购火时出现“百团大战”;直播热时冒出无数家直播平台;单车旺时各家公司争芳斗艳,自然界的七彩颜色几乎全被借用。模仿不打紧,关键是在模仿后有无创新。在完成了对技术和资本的原始积累之后,优秀企业会基于本土民众的独有需求与体验,开始更接地气的本地化改造与创新,而摆着高傲姿态拒绝改变的企业,包括国外巨头,皆无一例外地败下阵来,一同失败的,还有那些一味模仿忘了创新的跟风者。

技术是把双刃剑。军用技术民用化曾经是风险投资诞生的主要动因,技术创业也是诸多创业项目里比重最大的一项。但技术也会变成黑洞,从人工智能、大数据、虚拟现实/增强现实(Virtue Reality/Augmented Reality,VR/AR),再到如今的区块链,大量创业者与投资人无视技术的演变周期和成熟规律,在尚未找到真正可以实现商业化和产业化的应用场景时便匆匆下注,最后导致资金链断裂,草草收场。技术主导型创业项目的最大风险在于,技术迭代速度越来越快,如果创业者无法预判技术发展的正确方向,即便是商业巨头,即便找到了匹配的应用场景,也会很快被新技术无情地抛弃。这种迭代和资金投入没有必然关联,但是它给初创企业提供了弯道超车的机会。

资本也是把双刃剑。投资机构背负退出压力,要在一定周期内把钱投完。如果这笔钱数额较大,经常会出现单笔投资金额与项目所需金额不匹配的现象。初创项目的发展方向有较多变数,时刻处于调整之中。有些调整属于创始人的认知或策略的调整,并不需要大体量资本的推动,在这种情况下,大笔资金的进入反而有可能害了初创项目。创始人会拿着这笔钱开始进行团队或市场的盲目无序扩张,而不是继续打磨真正符合用户需求的产品。巨额资金的进入甚至有可能抬高早期项目估值,从而使得项目退出更加困难。

当下正处于中国互联网的第四波创业浪潮,创投江湖风云变幻。在技术端,人工智能技术越来越成熟,产业化运用的场景越来越多,区块链技术成为搅局者,吸引很多定力不足的古典投资人投身到首次币发行(Initial Coin Offering,ICO)大潮中;在资本端,投资机构募资难成为常态,投资人做项目决策越来越谨慎;在产业端,抗周期性强的教育、医疗和养老成为许多投资机构的新欢。然而万变不离其宗,如何运用好技术与资本,依旧是考验创业者智慧的两道关卡。

许嘉荣 中国第一批全职天使投资人,曾投资过的项目有小米、车库咖啡、 中文在线、拉手网、易趣、易宝支付、妈妈说、长城会等,在国内创投圈有丰富的资源。引言三生万物郑灵辉健一会<巢山资本>创始人兼CEO

在观察中国创投生态时,我发现“三”是一个神奇的数字。

创业团队组合,三人结构通常会发挥出超级稳定的效果。早期项目里最常见的是技术类创业,很多技术人员决定创业时,甚至没有一个完整团队。技术人员的优势在于做前沿研究,但如何将先进的技术与理论转化为商业产品或商业模式,他们未必懂,或者也未必在乎,这时候创始团队里通常就需要配置一位懂市场的合伙人。这位合伙人的拿手绝活是设计商业模式,帮助技术人员将研究出的东西变成挣钱的、用户需要的和能够快速扩张的东西。他们共同打磨的产品不但能挣钱,还得能持续挣钱,这时就需要配置一位投资人。投资人操心的不仅仅是挣钱,而且是长期挣大钱。三个角色组合在一起,常常会给企业带来“1+1+1>3”的价值。《中国创投地图2》基于人工智能在当下创投格局中所产生的强大原动力、颠覆力和渗透力,把人工智能放在开篇位置,作为创投行业谱系之首展开论述。人工智能领域也有对“三”这个数字的妙用。

人工智能领域创业,对创始团队至少有三项要求。首先要有懂人工智能算法的科学家,算法的生命周期较短,平均每六个月更新一次,这就对科学家的学习能力提出了比较高的要求。人工智能属于底层技术,要想产生商业价值,还需要与具体行业相结合,这就需要科学家与行业专家配合。除了算法技术背景与行业知识背景,创始团队还需要找到与自身优势相匹配的具体应用场景,方有可能构建生态,完成商业模式的嫁接。平台与算法、专业知识背景、数据及应用场景,便构成了人工智能体系的三大价值点。

从《中国创投地图》到《中国创投地图2》,书中呈现的投资热点在不停轮转。比如2017年火过一阵的直播与硬件等热点就被2018年的小程序与区块链所取代,但我们在组稿时始终保持一个原则,即书稿要均衡呈现来自行业专家、创业者和投资人三方的声音。只有综合听取这三方的独立见解,才有可能大概率消除我们对某一行业现象的认知盲区,从而帮助我们做出尽可能理性的创投决策。

老子在《道德经》里说:“道生一,一生二,二生三,三生万物。”创投之道,便蕴藏在这神奇的“三生万物”之中。第1章人工智能1.0 这次,狼真的来了

夏翌(元一九鼎创始合伙人)

我们已经投资了很多区块链相关项目,但是作为一个计算机科班出身的投资人,人工智能(AI)才是我心中的真爱。真正能改变世界的是人工智能,其他任何科学技术对人类社会的影响都不会比它大。这轮人工智能发展正在带来一场范式革命

1956年,在达特茅斯学院举办的一次会议上,计算机专家麦卡锡提出“人工智能”一词,这件事被视为人工智能的起点。从那时起,人类对人工智能的态度一直处于怀疑与恐惧之中。2016年,AlphaGo与李世石的对决以及波士顿动力机器狗的出现,更是让人工智能得到公众的广泛关注。

这轮人工智能的发展是一场“改造世界的范式革命”。范式革命带来的变化在于:人类过去依靠知识以指令性方式改造世界,而在未来,人类很可能会不再具备掌握知识的能力,转而以一种描述性的方式改造世界。

这种变化可以用“当代人工智能之父”杨立昆(Yann LeCun)的一段话解释:“世界上的大部分知识将由机器提取出来,并且将常驻于机器中。”

过去,人类改造世界的流程是:首先依靠观察和实验提取知识,然后总结规律,而后制定规则、制造工具,最终改变世界。

现在人类要做的就是:提出需求,并提供海量数据训练机器,让机器总结规律,然后根据这些规律制定规则,最后人类和机器共同按照这种规则驱动工具、改造世界。

未来,机器可以形成一个闭环,即自动获取数据、生产数据—总结规律—制定规则—生产工具—改造世界。人类只需要提出诉求或者结果,把过程交给机器来执行,让机器解决人类的需求。现在已经有越来越多的机器可以自动获取数据、生产数据,甚至可以自行提出需求。

一个正在发生的事实是:机器总结出的规律,有些能被人类理解,有些却不能被理解。从更长远的角度看,人类不再需要理解事物运行的内在规律,只需要掌握获取规律的方法论。投人工智能的依据:这次,狼真的来了

20世纪90年代以前的人工智能研究被称为“符号智能”,科学家们用机器做推理,逻辑简洁清晰。20世纪90年代以后个人计算机(PC)开始普及,人工智能发展为“计算智能”,人们开始用机器尝试归纳、模糊逻辑,甚至希望计算机具备某种直觉能力。

在不同的时期,人工智能的主流思想、理论框架、计算框架和典型应用都不同。

目前人工智能的主流思想是深度增强学习,其中深度学习可以理解为“从纷繁芜杂的世界中提炼出特征的有效方法”,增强学习则是相当于在一张白纸上创造出一条路径并借此完成某项任务。AlphaGo就是深度增强学习的一个成功代表。目前主流的理论框架是生物科学、控制论以及数学的理论框架。计算框架则是“人工智能芯片+云计算”,很快还会加入雾计算。典型应用是智能机械。未来两三年智能机械可能是一个热点,人脸识别、智能驾驶都包含在其中,这也是相关公司估值奇高的原因。

人工智能的发展如同狼来了的故事,一次又一次触动着人类的神经,只是这一次,狼可能真要来了。

第一,早期人工智能研究发现了一个悖论:人类觉得很难的问题,机器觉得很简单;人类觉得很简单的问题,机器觉得很难。这被称为“莫拉维克悖论”。大家认为,机器和人类大脑处在完全不同的两条路径上。但是现在,机器开始表现出人脑所具备的一些特点,比如直觉,而且机器正在展现出远超人类能力的趋势,AlphaGo先后击败李世石和柯洁就是一个例子。

第二,人工智能开始展现出不依赖于领域知识(Domain Knowledge)的通用性。借助于增强学习的理论框架,机器可以“在白纸上作画”。

第三,人工智能开始体现出高度类似人脑的工作机制,这意味着目前人工智能在朝着正确的方向发展。

以卷积神经网络(Convolutional Neural Network,CNN)为核心的深度学习框架、移动互联网产生的数据爆炸以及摩尔定律(集成电路上可容纳的元器件的数目,每隔18~24个月便会增加一倍,性能也将提升一倍)和云计算所催生出来的海量计算能力,是人工智能发展水平如此惊人的技术推手。

人类与人工智能正处在不平等的竞争之中。

第一,人工智能获取知识的速度比人类快。在AlphaGo与李世石的比赛中,李世石赢得第四局后,AlphaGo在一夜之间又和自己下了100万局。

第二,人工智能传播知识的速度比人类快。在使用中文这样的高效编码时,人类个体之间传输信息的速度大约为500bps,而4G LTE的传输速率是500Mbps,是人类的100万倍。并且电脑通信速度的增加符合摩尔定律,每18个月翻倍,而人类基本保持不变。

第三,机器一旦掌握某种知识或能力,就可以随时运用,而人类的能力会受到记忆、心情等因素的影响,不能随时调用。投资人判断人工智能项目的角度:推手和产业链

机器学习框架、数据、算力是人工智能的三大推手,也是投资人在人工智能领域投资的思考角度。

第一,能够发明新的机器学习框架,或者能够把深度学习(DL)和增强学习(RL)结合到一起组成团队,这绝对值得关注,因为他们极有可能取得石破天惊的成果。

第二,目前的人工智能实际上是“数据智能”,拥有海量数据和能够生产数据的项目值得关注。

第三,拥有一定算力的项目同样值得关注。

从产业链角度看,我们可以将人工智能的产业链划分为三层,分别是基础架构层、技术提供层和应用层。

基础架构层是巨头的天下。加拿大一家初创公司在英伟达图形处理器(GPU)上做的驱动比英伟达自己做的驱动都好,最后被英伟达收购了。所以类似项目最后都是并购退出,这既考验投资人的能力,也要看运气。

技术提供层会集中于企业级应用服务(To B)业务。大家都知道To B业务不好做,在业务上很难具备超越竞争对手的能力,更多的还是要看销售情况。所以在技术提供层的项目更适合风险投资(Venture Capital,VC),可以验证销售情况,之后再按照正常的To B业务进行投资。

应用层要进行“行业优选”。所有行业都会被人工智能改变,但不同的行业被人工智能改变的速度和时间点不同,投资人必须做出判断,判断方法如下。

第一,数据越完备的行业越容易被取代。

第二,结果反馈越迅速的行业越容易被取代,因为结果反馈越迅速越容易训练模型。

第三,行业的付费意愿要足够强。

第四,涉及安全的行业被人工智能替代的速度会慢一些,比如煤矿、化工行业。

第五,群众的心理接受门槛要低。某些事情交给人工智能去做,群众会不放心。这一点与政府监管和社会融资意愿都有很大关系。智能交通就是一个典型的例子,现在投资纯无人驾驶项目是有风险的,这类项目不仅非常贵,而且在监管、法律和群众接受心理等层面都面临问题,尤其是无人驾驶造成的交通事故,可能很难界定责任。假设未来有一个乘客乘坐了优步(Uber)的无人驾驶出租车,遭遇了交通事故,责任归谁呢?优步、拥有优步所有权的金融租赁公司、汽车生产商、车内运行软件制造商、车载雷达制造商、导航服务提供商、这辆车的科研人员等,都有可能为这起事故负责,打官司的话也会遭遇很多麻烦。所以在我看来,某些行业里,人工智能可以用来做辅助,但不能做决策,交通和医疗行业就是典型。

使用以上标准来观察,目前互联网、零售、广告是第一波被人工智能取代的行业。零售电商的仓储物流、智能导购和客服都采用了人工智能技术。我在淘宝上搜一个产品,相关的广告会在全网各处如影随形。

金融和安防领域也是应用人工智能的典型,它们数据完备、反馈迅速、付费意愿强烈、民众接受门槛低,而且和医疗行业相比,它们所受的监管并不严。

智能制造是我们比较关注的领域,由于它和制造业相关,随着政策的变化,会有越来越多的政府部门关注并支持智能制造行业。

夏翌 元一九鼎创始合伙人。14岁入读中国科技大学少年班,曾在硅谷多家企业从事研发工作,盛大资本金融行业负责人、涟漪投资创始人。2017年与九鼎投资共同成立元一九鼎。1.1 计算机视觉发展仍有巨大空间,视频理解难于图片理解

梅涛(微软亚洲研究院资深研究员)

我在微软待了十余年,一直在做计算机视觉和多媒体分析。人工智能这个领域里有很多“钉子”,我们只不过是不时地换把锤子敲一敲“钉子”,把“钉子”稍微往木板里敲一点。要想把一颗颗“钉子”完全敲进木板里,过程还是很漫长的。

大家现在都在谈人工智能。人工智能领域很广,它包括机器学习,机器学习又包括深度学习,不能把“人工智能”和“深度学习”这两个概念混淆在一起。计算机视觉是人工智能的一个应用领域,它就相当于把相机连上电脑,电脑可以将相机所看到的东西一一描述出来。

我也看过一些相关领域的商业计划(BP),一些创始人说他们这个算法有多么了不起,这就很可笑。按照学界观点,绝大部分算法的领先周期只有6个月。真正的高手,最多花6个月就可以复现乃至超越别人的算法。很多人说计算机视觉到2018年就可以达到大学生的认知水平,我觉得这种说法非常不靠谱。保守一点说,现在计算机视觉在某些视觉认知的任务上可以接近3~5岁儿童的能力,这种说法会客观一些。

机器视觉是否能够超过人眼视觉?肯定不能这么说,因为比较的维度不一样。假如现在有一张图片,同时请一台机器和一个人对其进行标注,那一定是人类标注得比机器好,而且更为精细;如果拿出1000张图片请机器和人来标注,要求一秒钟内完成,那一定是机器做得比人好。视觉理解的五层境界

图像的最小单位是像素。对于计算机视觉来说,最难的是判断每个像素属于哪个类别,即语义分割。这需要大量人工标注,没有哪家企业愿意花钱雇人做这件事。

如果觉得语义分割过于精细,可以不去关心每个像素处于哪个位置,只需要识别图像中的物体究竟是人还是马,人和马的位置在哪里,即物体检测。

还有一种情况是机器不去关心图像中马和人所处的位置,只是去识别图像中有什么物体,即图像分类。

第四种情况是,给机器一张图,机器不但要解读出图中有哪些物体,或者有哪些词,还要把这些词连成一句话。一种情况有点像看图说话:我给机器一张图,让机器说出一段文字,这段文字是自然语言,且不能有任何语法错误。另一种情况是看图回答问题。我给机器一张图,它要回答:图中有多少个人?图中出现的马分别是什么颜色的?

第五种情况是讲故事,这也是我们微软之前在做的一个技术。大家现在喜欢出去旅游,旅途中拍了很多照片,回来分享到博客上。现在机器可以自动帮你写一些博客文章,通过识别图片,把图中的内容以文字的形式表述出来。视觉理解在“微软小冰”中的应用

微软有一个名叫小冰的聊天机器人,会自动给用户视频添加评论。小冰的视频自动评论功能上线第一个月,它的粉丝就涨了60%,而且1/3的用户不知道小冰是机器人,因为微软在训练小冰时,让它永远非常乐观地去评价用户发布的内容。假如夸一个用户长得好看,它不会只是泛泛地夸用户美,而是会具体指出你是眉毛好看还是身材比较好,所以大家都很喜欢它。

小冰现在还会写诗,虽然还有很多地方需要不断改进,但这个功能推出后很受用户欢迎。微软没让小冰写古体诗,而是选择了现代诗,按照今天的流行语,叫“freestyle”。小冰通过识别图片内容,来判断图片中的意境是明亮的还是阴暗的,是喜悦的还是悲伤的。在确定图片的基本情绪后,小冰会自动生成诗句。用计算机视觉设计封面

微软曾经用人工智能来设计封面。人类在设计封面时,通常会考虑文字应该放在封面的什么位置,该用什么样的字体和颜色,而微软设计的机器视觉模型结合了心理学、广告学和颜色方面的理论。比如说一张以人物为主体的封面,主标题通常会放在人物视线所指的方向,因为视线代表着读者关注的焦点。食品类杂志封面很少用蓝色或鲜红色,这两种颜色都比较容易影响食欲。快餐店为了保证翻台率,当然不希望客人长时间待在店里,所以很多快餐店喜欢用橘红色作为主色调,因为橘红色容易让人焦虑。

机器视觉模型的工作模式是:当它拿到封面图片后,会自动分析图片主体在哪里,然后做色彩分析,判断其有几种主色调,每种主色调与什么颜色对应会比较和谐。机器甚至还可以给文字加特效,比如加一幅半透明的背景图等。机器识别在内容管理上的应用

平台上用户上传的内容多了之后,需要对内容进行管理,内容管理最典型的做法是打标签。在真实世界里,标签无穷无尽,仅是人类所认识的花就有25万种,鸟至少有1万种,所以要想精细地给用户上传的内容打好标签非常难。

微软给不同物体所打标签的精细度也不一样,比如对于鸟和狗这两种类别的标签就做得很细,因为美国人和中国人都喜欢这些小动物。在识别车辆的时候,我们做了一个实验,从一个二手车网站上把所有车型照片全部下载下来让机器识别,识别率高达99%。而我们对于飞机、食物和医疗相关的标签打得还不够完整,尤其是在医疗方面,因为没有特别优质的大数据来支持。

在视频领域,微软的机器可以识别出1000种以上的物体和500种以上的动作,用户在搜索视频时就可以通过这些标签找到相关视频。识别人体动作有什么用处呢?现在有很多健身App,假如嵌入机器识别功能,就可以判断出用户的动作做得是否标准、规范,并为其打分。

有了视频和图像,用户总要进行消费,也就是编辑或改动。我们为图片做了各种滤镜,做图片的滤镜不新鲜,国内很多公司也在做这个事情。微软研究院计算机视觉组做的一个研究很酷,叫风格转换(Style Transfer),机器可以分析任何一张图片的风格,并将这种风格应用到另外一张图片中去,如图1-1所示。图 1-1

机器还可以对视频中的内容进行分割与重新组合,比如将视频A中的人物抽取出来,放到视频B的场景里去。当然,视频的分割比较费时间,因为机器需要对动态画面进行计算与处理。

梅涛 微软亚洲研究院资深研究员,国际模式识别学会会士,美国计算机协会杰出科学家,中国科技大学和中山大学兼职教授和博士生导师。主要研究兴趣为多媒体分析、计算机视觉和机器学习,研究成果十余次被成功转化到微软的产品和服务中。1.2 人工智能的双重驱动力

谢忆楠(旷视科技品牌与市场副总裁)

在美国,很多人工智能项目都以大学为主导,用于科研,不需要考虑赚钱的问题。而中国的人工智能项目存在于各种产业公司内,压力大,而且公司做完算法后还要赚钱。在美国很少能看到拥有四五百人的中型人工智能企业,公司规模达到一百人左右的时候,要么就维持一个小而美的研究,要么就等待被并购,进入一个大体系里。

下面我结合中美之间的差异性讲讲视觉识别的商业化。老公睡着了,老婆就能让手机解锁吗

iPhone X的人脸解锁功能引起了热议,网上流传着两个段子,第一个是老公睡着之后,手机被老婆解锁了;第二个是老婆卸妆后,发现手机打不开了。

这里有一项测试,如图1-2所示,让机器识别一些网红脸,看看算法能够给出什么样的结果。

通过测试结果可以看出,即便受试者化了浓妆,机器也可以识别出来,甚至连男扮女装都能识别出来。如果让人类去做这种识别,成功率会是多少?人脸识别对于机器来说就是一道算术题,化妆是障眼法,没有改变原有的面部结构,所以在1∶1的场景里,机器比人的判断力高一些。人类做出的判断由自己的数据库决定,比如面对一个非常熟悉的人,他变换发型之后仍能被我们认出。人类依靠的数据库由我们的生活圈决定,生活圈越大,认识的人就越多,生活圈越小,认识的人就越少。图 1-2

这里还有另一项测试,如图1-3所示,我们找了一些电影中经过特效变化的面孔给机器识别,机器同样能够判断出这些面孔分别对应哪位演员。

因此人脸识别程序已经能够识别电影特效级别的面孔。什么样的面孔不能被识别呢?毁容之后的面孔不能被识别,面部关键部分或结构有变化,机器可能就识别不了了。

所以刚刚说的老婆卸妆之后手机打不开的问题,现在机器已经解决了。至于老公睡觉时手机被老婆解锁这件事,也是无法实现的。图 1-3人脸解锁体验更好,安全问题仍然存在

大家都很关心人工智能的商业落地,目前人脸解锁技术已经真正实现了落地。判断两张图片是不是同一个人很简单,但是不同的场景下会有不同的命题,这些命题能不能解决,决定了这项技术能不能在相关行业里应用,这是人脸识别商业化的关键。

人脸解锁的体验略胜于指纹、虹膜。这里可以做一个对比。(1)首次注册时,人脸和虹膜的速度快,拍一张照片即可,相比之下指纹比较慢,需要多次采集。(2)指纹解锁需要手指配合,虹膜解锁需要对准眼部,这两种解锁方式都慢于人脸解锁,而且人脸解锁是非接触式的。面对同一种手机解锁方式,人们拿起手机一秒内成功了,这是正常速度,也是极限,如果解锁需要两秒甚至更长时间,大家就可能放弃这种方式了,这就是商业化对技术的要求。(3)指纹解锁和虹膜解锁的抗干扰能力比较弱,比如手上沾上一些水或者油渍就不能被识别了,带上隐形眼镜虹膜解锁就不好用了,而人脸解锁的抗干扰能力更强一些。

人脸识别也需要与“黑产”(黑色产业)进行斗争。黑客们总会有新方法攻击你的手机,之前就有某款手机的人脸识别功能会被照片破解的新闻。目前在“黑产”市场,破解手机人脸识别功能的价格大概是800元一次,批量破解50元一次。研究人脸识别的厂商需要了解黑客的攻击方式,强化自身的技术,从而进行防卫。一台门禁机反映出的问题

在人脸识别技术走向商业化的过程中,“技术-场景”双轮驱动才是关键,技术单独发展并不十分有效。现在为什么强调算法?因为大家在找投资的时候,要向投资人解释这项技术为什么值钱。天使轮、A轮、B轮投资的投资人可能都要有这样一个标准。

旷视是一家研究人脸识别的公司,曾给公司内部做了一款可以刷脸的门禁机,后来这款机器被做成了商业产品。投放到市场之后旷视发现,制约人脸识别技术落地的并非是机器识别的准确率与速度,而是不同小区的环境。小区大门朝东的,早晨人脸逆光面对机器,识别不了;小区门口路灯昏暗的,到了夜晚机器就识别不了。于是我们需要改算调优,对逆光改算法,对亮度改算法,不断解决这些问题。所以当人脸识别技术真正走向商业化落地的时候,要解决的问题远比你向投资人介绍的算法复杂得多。

在一个真正的商业化场景里,门禁机的机身可能是一个非常小的集成商做的,算法是科学家做的。集成商不懂算法,科学家不会去解决使用中遇到的零散问题。所以想要实现人脸识别的商业化落地,公司必须有能够与算法专家和集成商对接的人才,这类人才需要特别强大,甚至需要专门培养。现在比拼算法专家数量不是一件难事,真正具有挑战性的是面对商业化落地,产品如何实现集成。人工智能走向商业化,不只是一个算法问题

警匪片里通常只有一两个坏人,而现实生活中警方要面对多少坏人?一个大型城市的固定人口加上流动人口,总数大概是1000万~2000万人,从中抓一个罪犯,需要多少数据?这就是商业化人工智能和算法级人工智能的具体差别。

旷视的人脸识别程序现在已经能够帮助警方识别嫌疑人,这里有两个典型的例子:两个嫌疑人,其中一个潜逃了五年,觉得没人会认出他,结果被机器识别出来了;另一个逃了七年,以前很瘦,这七年间变胖了,还是被机器识别出来了。处理一个打架斗殴事件,如果单纯依靠警方排查寻找嫌疑人,需要多少人力和时间?但是通过人脸识别,三秒钟就找到了嫌疑人,五分钟后巡警就能完成抓捕。警察要抓嫌犯,不是说从几万人里把这个人认出来就万事大吉了,而是要明确在哪儿能抓住他,他会在什么时间、什么地点出现,警方需要的是一份情报信息。一秒钟识别,一秒钟定位,告诉警方这个人在哪儿,这是算法的真正落地。

真正的商业化并不是解决一个算法问题,而是解决场景和需求问题,找最合适的发力点。

此外,人工智能走向商业化,除了把算法做好之外,还要解决如何跟硬件结合的问题,如何通过警用摄像头实现算法功能的问题。现在国内的警用摄像头有5000万个左右,其中80%的摄像头只能看到人的身体,看不清人脸。因此,在像素级受限的情况下能不能识别,也是人脸识别商业化过程中需要面对的问题。技术和场景是人工智能的双重驱动力

人工智能的核心驱动力到底是什么?

目前大家关注的范围主要包括产业环境、技术、数据、场景、人才、商业模式、行业这几个方面,大家喜欢看团队里有多少博士,商业模式有多完美,行业渗透能力强不强,大数据上有没有优势。

其实真正的驱动力就两个:一个是技术,另一个是场景,如图1-4所示。图 1-4

公司的技术到底能不能适应这个行业,对这个场景的了解有多深,这些问题的答案就涉及人工智能真正商业化的一些问题。

如图1-5所示,技术、商业、数据的化学反应可以将场景细分。为什么现在人工智能领域出现很多细分公司?因为数据在每一个行业里是一定量,不同的知识解决不同行业的问题,场景需要技术落地,而技术会细分场景,不会有某项技术可以适应全部场景。想把所有场景划分出来,谷歌级别的公司也很难做到。图 1-5

在中国的人工智能领域,投入多少成本能将技术做出来是一个未知数,技术研发成功之后能够得到多少回报也是一个未知数,这是一个尴尬的场景。

人工智能公司在一级市场估值非常高,但是公司敢拿这份财报去二级市场上市吗?我相信大部分公司都不敢,因为一定会倒挂。所以场景细分之后我们发现只有在公司可以做很多东西的情况下,才能真正赚钱。如果只做一个软件开发工具包(Software Development Kit,SDK)级别的生意,那么公司在每一个行业里的议价能力都会非常弱。

旷视的小区门禁系统现在能解决在逆光下识别人脸的问题,解决的关键在于旷视已经在100多个小区安装了人脸识别门禁机,这么多场景下的数据可以帮助优化算法。但如果没有这些数据,旷视怎么解决这些问题?场景得到细分,技术也能得到相应的优化,所以场景一定要不断扩大。这就是双轮驱动的具体用意。

旷视最早选了一个非常小的技术点作为开始,做了一个用人脸控制东西的小游戏,包装了一个“运动颈椎”的概念,后来做了一些娱乐级的刷脸实践。网络上比较好玩的测年龄、颜值、夫妻相的App,包括女生用的美图秀秀,底层坐标技术都是旷视的,而其他厂商会用这些技术开发很多创意。

三年前,阿里巴巴表示要跟旷视合作,解决几个金融上的问题:一是支付问题,二是远程开户。“刷脸”能够解决这两个商业场景中的刚需——远程合规问题。互联网金融公司没有线下营业网点,需要通过一种技术解决合规性问题。

从驱动力的角度来看这件事,技术是人脸识别技术,场景则是要解决远程开户的合规性,与此同时还需要证明远程开户是符合客户本人意愿的操作,这就涉及活体验证。场景对技术提出了要求:把人脸识别技术集中到柜台和手机App里,而且要保证识别速度快。所以必须不断地找场景,通过满足场景提出的要求,让技术一直持续有效地领先下去。

旷视经常会接到来自全国各地、各行各业的电话,希望旷视帮助它们设计具有代表性和针对性的算法程序。德青源曾找过旷视,他们有一个国家级养殖中心,里面有10万个鸡圈,德青源想通过在鸡圈里放置摄像头的方式来统计鸡的数量。经过思考,旷视认为这个场景对于自身的技术来说落地难度非常大。通过这件事旷视也收获了一次历练,明确了基于金融级别的人脸识别到底该做什么样的事情。

做人脸识别要有针对性地解决不同场景中的问题,如果不明白这个场景对技术的要求,就无法实现技术的快速进步。而且人脸识别不能只识别中国人,还要能识别外国人。VIVO曾在印度发布了一款带有人脸识别功能的手机,大部分印度男性都会留很浓密的胡须,而且他们的肤色偏棕黑,识别中国人和识别印度人对技术的要求肯定不一样,旷视用了三个月时间解决了印度人脸识别的问题。“AI+医疗”

人工智能在医疗领域的发展前景有待观察。现在“AI+医疗”能解决什么问题?机器可以根据一张扫描片判断病人患了何种病,这种判断基于医生们积累的经验,也就意味着机器要录入很多标准化的东西。病人拿一张片子去给十家医院的大夫看,可能会得到五个以上的结果。以前我的膝盖受伤了,到医院拍了一个磁共振成像(Magnetic Resonance Imaging,MRI,简称“核磁共振”),去了三家医院,得到了三个结果。把同样一张片子给机器,机器会选择哪个结果?医学需要考虑很多综合性因素,因为每个人的生理状态都不一样,故而同一种疾病的病因可能是不一样的,所以有“会诊”这种形式,请很多老专家推断可能的病因。从这点来看,医学本身不具备这种大规模的标准化数据录入的可能。人脸识别技术的新发展

最近几年人脸识别技术实现了哪些突破?首先,人脸检测最初需要在一张脸上测五个点,那时同一张人脸一旦更换发型或者配饰,机器就识别不了了。现在在一张人脸上要识别三万多个点,不管被识别人怎样化妆,不管处于何种商业场景中,不管面对什么样的自然环境,机器都可以完成识别。

其次,很多人觉得人脸识别不太靠谱,这是因为人类本身非常擅长人脸识别,用自己的视觉系统去质疑这项技术,不相信机器能够超越人类完成海量的人脸识别工作。为什么大家很少质疑指纹?因为我们都不会识别指纹,所以会认为机器能做得更好。其实机器和人看到的世界是两个世界,指纹识别的准确率和人脸识别的准确率几乎一样。

另外,现在的人工智能已经可以实现多角度识别,甚至“阴阳脸”(脸部光照不均)都可以识别。

在技术的发展过程中,一定要找到商业场景中可能会出现的一切场景。人脸识别技术并不是科学家坐在办公室里就可以想出来的,科学家如果想让人工智能实现商业化,需要让自己变得“糙”一点,要想到普通人经常遇到的场景。

谢忆楠 旷视科技(Face++)品牌与市场副总裁。拥有13年市场与品牌传播经验,曾在中央电视台、易观国际、奇虎360等多家媒体与互联网企业负责市场品牌项目。1.3 人工智能中的3D行为识别及其商业化

熊效李(皓图智能科技创始人兼CEO)

我于1997~2000年在微软工作,后来去硅谷创业,开办了一家做压缩芯片的公司,2008年这家公司被收购。回国后我又创办了一家VR公司,于2013年被收购。2014年我创办了皓图智能科技,研究“3D行为识别”。

从1997年到2008年,我一直在视频领域工作,2004年开始进入3D领域,那时电脑芯片开始加入图形处理器(Graphics Processing Unit,GPU),我是交互式网络电视(IPTV)芯片负责GPU的设计师。所以在3D行业里,我们有13年的经验积累,而从创办VR公司到现在,在行为视频领域,我们有近十年的经验积累。视频领域的两个派别:2D派与3D派

人类在视频领域能够发展到何种地步?这个问题的答案有很大的想象空间。人眼能够判断物体的前后关系,但不具备精确测量距离的能力,只能靠叠加关系来了解整个三维空间。现在视觉领域里有两个派别,一个派别使用2D信息,比如2D人脸识别,另一个派别使用3D信息,比如3D行为识别。

人类希望用立体视觉观察世界。只有X轴和Y轴组成坐标系的空间,即二维空间,包含的信息量很少,所以人们需要的是对三维空间的观察和理解。用2D摄像头拍摄三维空间所呈现出的画面,其实是一种变形空间,我们的世界是三维世界,只有对三维世界进行三维采集、三维分割,才能观察到并理解真实的空间,进而解决真实的空间中存在的问题。因此,我对使用2D信息的派别持悲观态度。举个例子,一个人经过正在拍摄的摄像头时可能在低头,也可能在做其他动作,有时这个人被摄像头拍摄到的角度很特殊,面部只露出一部分,在这种情况下摄像头很难利用2D信息进行人脸识别。3D行为识别:一种与众不同的识别方法

皓图的技术为什么叫“3D行为识别”?在判定一个人的行为时,皓图没有使用常规方法,而是通过加入3D技术,使用了一种全三维的方法,这种方法也可以被称为数学空间、几何空间方法。到目前为止,公司80%的精力都放在从数学层面上描述这个世界。

3D行为识别的研发具有一定难度。以前皓图做线下消费行为识别的项目时就觉得非常难,因为动态识别需要对人的动作进行跟踪,而跟踪是一件很不容易的事情,凭借单个摄像头进行跟踪并不现实。在把整个三维空间全部矢量化后,这项工作就变得简单一些了。首先把空间和人矢量化,某人进入一个场景后,设备会对他进行轨迹跟踪,然后对他全身的骨骼动作进行精确的分析和判断,他的手指做了什么运动,碰到了哪些地方,所有轨迹设备都可以进行跟踪和识别。这项技术不属于机器学习的范畴,而属于几何计算的范畴。

目前皓图的3D识别技术每秒需要处理3.4G数据,虽然数据量很大,但海量数据也带来了更多信息。面对一个面积一万平方米、能容纳十万人的场景,皓图的算法依然能够完成行为识别。现在,皓图在技术上已经可以做到在任意复杂的环境里面100%跟踪并识别任意多人,可以记录每个人进出监控区域的时间,并重现其运动轨迹。不管这些人是抬头还是低头,即便只能看到半个耳朵或一只手,皓图同样可以实现对这些人的识别与跟踪。体积很小的物体也可以被精确跟踪,动态轨迹可以精确到厘米。

皓图智能目前主要针对两类行为进行识别,一类是异常行为的识别,另一类是日常状态的识别。异常行为目前皓图只能识别出三种:倒地、撞墙、打架。可能很多人觉得识别“倒地”这个动作很简单,很多公司都可以做出来。其实到目前为止,几乎没有哪家公司检测倒地行为可以实现100%的准确率,能够达到40%的准确率就很不错了。但皓图检测的准确率是100%,因为皓图依靠的是对每个人骨骼特征和轨迹的分析和判断,并且掌握了地面的平面方程,因此可以做到精确计算。当某人倒地时,他身上每一个肢体部位的速度都能被皓图完全掌握。可能有些人会对100%的准确率持怀疑态度,实际上这个准确率不需要测试,因为这就是数学的特点,在几何空间内,数据完全可以被计算出来。3D行为识别的落地

目前皓图的技术已经落地,主要场景在监狱和派出所。在一个可以容纳12人的监舍里,安装四台设备,警察就能够完全掌握监舍内所有犯人的行为轨迹,完成异常行为的识别和提示,比如犯人在卫生间里停留的时间超过一个标准,机器会自动报警。

我对人工智能的发展持悲观态度。人工智能需要和一些垂直领域进行联合,比如在语音识别领域,除了识别讲话内容,机器能否把讲话者的微表情或是肢体动作识别出来?能否把微表情或是动作同样转换为文字?这种技术的研发可能需要十年甚至更长时间,研发难度非常大。

熊效李 皓图智能科技创始人兼CEO,电子科技大学特聘教授,国家“千人计划”专家。毕业于美国伯克利大学,曾在美国Microsoft、WISchip/Micronas等多家跨国公司担任高级管理职位。1.4 人工智能投资,这样搞更靠谱

范维肖(翊翎资本合伙人)

我们基金的名字叫翊翎资本,从2016年2月开始,翊翎资本着手在人工智能领域进行布局。以下是我个人在人工智能领域投资过程中的一些心得。算法、数据、算力:人工智能的“三驾马车”

追根溯源,数据是人工智能的基础。

早期,人类经历了对数据的采集、清洗、标记、存储、计算,经历了大数据的代际更替。通过数据,人类能知晓过去发生了什么,还能知晓发生的原因。

借助于人工智能对数据的增力作用,人类又能知晓未来会发生什么,还能对未来做自动优化。

从最早的“基础+激活”到“分析+人工决策”,未来的自动决策、自动控制将是个更重要的过程。统观整个人工智能发展史,现在是非常重要的时间点,我们要清醒地识别出一个发展的边界,判断其属于过去还是未来,同时也应该在这个边界线的附近寻找更多机会。

人工智能有三个支撑基础:算法、数据和算力。其中,算法是核心。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载