图森互联:另辟蹊径,用智能驾驶实现图像识别商业化

[摘要]侯晓迪和郝佳男曾是人大附中同学,高中时两人同班。本科毕业后,侯晓迪去了加州理工读PhD,研究方向是计算与神经系统,郝佳男则去了南洋理工大学 攻读博士学位,研究并行和分布式运算。从本科后半段到PhD期间,他们一直都在思考如何将所学技术做成有用的产品,也一直在考虑创业机会。
侯晓迪和郝佳男曾是人大附中同学,高中时两人同班。本科毕业后,侯晓迪去了加州理工读PhD,研究方向是计算与神经系统,郝佳男则去了南洋理工大学 攻读博士学位,研究并行和分布式运算。从本科后半段到PhD期间,他们一直都在思考如何将所学技术做成有用的产品,也一直在考虑创业机会。

  

\

 

  2014年,还在香港科技大学读机器学习与计算机视觉PhD的王乃岩去美国访问,在那里认识了侯晓迪。经过一段时间的交流,两人在创业想法上达成了一致,于是王乃岩决定和他们一起创业。

  而陈默的加入则是在去年初。作为一位连续创业者,陈默曾独立创立运营过三家公司,后成功出售并退出。多年的商务合作和投资经验,让他在互联网领域积累了广泛的资源。

  2015年8月,图森互联正式成立。陈默任CEO,负责公司的战略、资金等事务。侯晓迪任CTO,带领北美研究院团队,王乃岩任首席科学家,带领国内算法团队,郝佳男任工程VP,带领工程部门。

  从去年成立至今,图森一直在探索图像识别技术的商业化方向。得益于新浪5000万A轮融资及相关资源的进入,他们首先从新浪微博的广告开始做起。

  图像识别+广告

  图森所做的事情是用图片识别技术,为用户浏览过的图片打上关键词标签,让广告主找到最适合产品定位的投放广告位,达到最佳的品牌传播效果。比如 在汽车广告方面,图森可以通过后端的图像识别,为用户之前浏览过的汽车图片加上特定标签,从而帮助汽车广告商进行更精准的定位。

  除了精细化广告定位,图森还用图像识别技术为新浪微博的广告投放物料做审核。以前,平台上每天50万张素材都是人工审核,现在这一任务可以由机器执行,大大提高了审核效率。

  图像识别+企业级应用

  图森广告业务目前每年2000万营收。不过,由于广告市场更多的是由资源而非技术驱动,因此图森决定探索更多可以让算法落地的领域。图森CEO陈默在调研时表示,公司定位是做计算机视觉和机器学习领域的算法研究和企业端服务。

  算法研究方面,图森一直围绕最前沿的技术进行探索,同时也会做一些可演示的Demo,作为其技术实力的一种展示。此外,他们还会把一些容易商业化的技术拿出来,根据第三方企业的产品需求去做定制。

  识车神器就是其中一例。这个专门为新浪汽车频道研发的技术,近日也在图森官网开放了大众试玩入口。只要用户上传汽车图片,系统即可识别2016年3月前发布的主流乘用车品牌和车型。目前,该识别系统已覆盖国内市面上2000多种车型,识别准确率达到95%以上。

  

\

 

  据图森首席科学家王乃岩介绍,在车型识别方面,从数据的收集、整理,到预处理和清洗,图森都有一套完整的自动化算法,不仅把数据采集和标定做到了基本没有人工干预,而且还实现了在一两天之内采集到百万级别数据量的高效成果。

  除了车型识别,图森也在人脸识别、汽车自动驾驶、SLAM 3D地图、数据平台等方面做出了一些2B的技术,用来开放给不同的企业需求方。

  人脸识别方面,图森已经在一些国际比赛中拿到了很高的分数,但是由于进入市场较晚,因此不会作为主攻方向,目前主要是将人脸识别技术应用于驾驶员监控系统(DMS)中。

  自动驾驶领域,图森会做一些车辆、行人、车道线、自行车、三轮车识别,以及道路分割、可行驶区域、车辆轨迹预测、自身定位等技术,打包提供给想做自动驾驶的汽车厂商。

  SLAM技术方面,图森会用摄像头做一些3D绘图,四维地图等,提供给腾讯、高德等相关企业产品。

  数据平台方面,图森也会做一些数据采集标定方案,包括数据的采集、加工、标定、降噪等处理过程,提供给国外企业客户。

  图像识别+智能驾驶

  图像识别技术目前的需求主要集中在人脸识别、安防和交通三大领域。

  人脸识别方面,国内几家计算机视觉公司已有布局;安防领域市场相对封闭,而且已经有海康威视、大华等上市公司占领市场;而智能驾驶领域,目前各大公司尚在尝试,整个市场还处在探索阶段,于是图森选择了智能驾驶作为其未来商业化的主要方向。

  在智能驾驶领域,图森选择了两个方向进行布局。一方面,图森看重国内车企对于研究无人驾驶的技术需求,通过和车企合作,在比较好的实验场景中, 不断磨练和提升自己的算法。另一方面,图森也希望把的一些无人驾驶技术直接做成硬件级别的产品,形成一套完整的ADAS(高级辅助驾驶系统)解决方案,从 而实现商业化落地。

  在无人驾驶技术研发方面,图森已经正式宣布和北奔研究院、北京理工大学合作,联合研发军用重型汽车的自动驾驶技术。北奔主要提供整车平台以及相 关试验资源,北理工为自动驾驶车辆的研发提供运动控制技术,图森负责计算机视觉和深度学习算法部分,提供以摄像头为主、配合毫米波雷达和视觉芯片的、经济 型自动驾驶解决方案。

  这种方案一方面降低了自动驾驶技术的应用门槛,另一方面能够实现数据采集和高精地图标定的快速部署,在自动驾驶领域建立算法和数据的双重优势。

  而在ADAS硬件方面,图森选择从“两客一危”、室内公交等运营车辆入手。通过将4路摄像头连接车内计算机,在碰撞之前,对周边行人和车辆进行识别以及运行轨迹的测算,从而为司机提供碰撞预警。该产品将在4个月后投入市场,目标客户是公交公司以及运营车企等。

  

\

 

  商业化落地

  当前,随着人工智能越来越火,国内几家图像识别公司已然成为明星公司,不仅在各类活动、论坛、会议上频繁亮相,也经常被各路媒体报道和提及,甚至合伙人的流动也成为业内八卦热点。

  然而,光鲜背后,各家公司商业化落地情况并不乐观,大多都还处于探索和规划阶段,要么通过和大公司合作,提供一些定制化需求来实现营收。

  安防领域已有上市公司占领市场,图片审核、服装电商、金融等领域的需求尚未形成,各家公司很难说已经找到明确的市场需求来落地自己的技术,而图森选择的智能驾驶领域,除了国内大公司纷纷试水,国外公司也早有研究和布局。

  在美股上市的以色列公司Mobileye已经做了近20年的ADAS系统,目前全球市场占有率已达70%。与谷歌等大公司的方向不 同,Mobileye通过强大算法,仅用单摄像头就实现了ADAS主要功能,大大降低了设备成本,因此受到各大车企青睐。2015年,Mobileye营 收2.4亿美元,比2011年翻了12倍多,净利润6800万美金,公司财务状况良好。

  今年3月,成立不到3年的自动驾驶初创公司Cruise Automation被通用以超过10亿美元的价格收购。该公司的第一款产品就是安装在普通汽车上的自动驾驶套件,可以在高速公路上接管汽车行驶,其组件 包括毫米波雷达、立体摄像头(双目)、GPS 以及惯性传感器,而非谷歌所采用的价格高昂的激光测距雷达系统。目前,该公司也开始研发全栈式无人驾驶技术,成为谷歌竞争对手之一。

  虽然这一方向前景未知,但至少可以证明,高昂的激光雷达并非无人车标配,用毫米波雷达、立体摄像头等也可以实现一定程度的自动驾驶,低成本和易量产反而更容易实现商业化落地。

  对图森来说,无人驾驶技术的商业化现在看来还很远,能够短期落地的就是针对运营车辆的ADAS硬件产品,但这一细分市场未来落地情况如何,现在 还不好说。不过陈默也表示,今年9月15日以后,图森将开始针对其第三方服务向B端企业进行收费。可见,在图像识别的商业化上,图森至少已经有了明确两条 路径。

  

\

 

  近期,爱分析对图森互联CEO陈默、首席科学家王乃岩、工程总监郝佳男进行了调研访谈,现将部分内容摘录如下。

  Q:目前团队规模和构成如何?

  陈:北美和国内团队加起来一共70人左右,北美研究院有20个人在做核心算法,国内算法部门10人,硬件部门10人,工程部门10人,工程部门主要负责科研成果的产品化,比如系统对接,数据输入输出等。

  Q:最开始是怎么考虑国内和北美团队两边协作的?

  陈:计算机视觉这个领域很新,生源也比较少。在这一领域北美又领先国内平均水平。而且我们联合创始人侯晓迪博士也在UCLA带过一个研究院,之 后出来创业就是为了把积累的技术商业化,他本身在美国各个大学有良好的关系,也是这个领域论文被引用最多的作者,所以就由他带队,创建了北美研究院团队, 帮助我们吸引更多的PhD毕业生加入我们的团队。

  Q:车型识别的技术实现过程是怎样的?

  王:先从数据准备开始,也就是你要识别什么样的车,每一类车对应什么样的图片,然后就是训练数据,把数据放到神经网模里面去训练。同时在标准程度上做一些改进,比如有些车很相似,就需要在原有基础上增加一些约束和限制,来辨识相似的图片。

  Q:图片识别目前的难点在哪?

  王:最难的地方还是数据的收集。这部分我们利用了在做互联广告时的技术架构,因此能够比较快地拿到这些数据。

  Q:数据是从哪获取的?如何实现快速获取?

  郝:来源主要是互联网的公开数据。从技术上讲,大家都是利用爬虫获取公开数据,但是关键在于能否在极短时间完成有效的下载、解析、清洗、标注。 对于每个环节,我们都有很深的技术积累,人工干预的部分很少。比如对于解析,我们可以做到半自动地从未知结构的网站获取结构化的数据。

  Q:车型识别技术能否直接迁移到其他领域?

  王:对模型来说没有问题,主要还是数据方面,会有不同的采集方式。

  Q:和车企合作研发无人驾驶技术是出于什么考虑?

  郝:国内车企确实有这方面的需求。一方面国外技术比较封闭,没办法给到国内的车企,另一方面他们也想做无人驾驶,所以就有一些合作机会。但其实 无人驾驶技术离真正实现,或者说离大家都买得起,还有很长的时间。在这段时间,我们更多的还是去磨练算法,并且跟车企合作,他们能够提供一些比较好的实验 场景,反过来也可以帮助提升我们的算法。

  Q:针对运营车辆的ADAS产品需求如何?

  陈:这一块需求还是很大的。我国每年运营车辆造成10万人死亡,近百万人受伤,不仅给运营车企造成巨大损失,也给社会安全也带来了巨大隐患。政府和相关监管部门以及运营车企都对车辆安全存在很大需求。

  Q:产品自己生产吗?计划以什么形式收费?

  陈:摄像头从外部采购,芯片用英伟达的,其他部分找代工生产,销售可以找代理,我们就提供技术。

  收费方面,按每台车收取月服务费,我们负责做软硬件升级,软件系统需要经常更新,硬件大概两三年升级一次。

  Q:国外在这一领域有类似形式吗?

  陈:国外主要还是以卖硬件为主。

  Q:目前这一块投入人力有多少?

  陈:独立立项投入20个人。

  Q:在智能驾驶领域如何与现有玩家竞争?

  郝:目前这一领域的玩家主要是谷歌、百度等大公司,以及基于Mobileye技术的车企。

  谷歌采用的激光雷达,虽然点云数据处理难度较低,但设备价格高昂,大概 7 万美金左右。而且这种雷达目前基本都是手工制作,很难进行工业化生产,想要大幅度降价并不容易。因此,谷歌无人车的最终落地也很困难。

  Mobileye十几年来一直采用的是传统算法,而对于近两年才得以突破的深度学习技术,大家都处在同一水平,至少没有隔代差距。 Mobileye的产品思路是供给芯片,但是完成支持深度学习的芯片,并把芯片做到量产还要花费多年时间。我们则选择更多从算法优化层面来做优化,使得深 度学习算法可以在已经发布的SoC(系统芯片)上运行。

  我们的目标是可商业化、低成本的自动驾驶解决方案,通过摄像头、惯性制导、GPS、毫米波雷达等廉价传感器,配合深度学习算法完成感知、决策和控制。




免责声明:

本站系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系, 来信: liujun@soft6.com 我们将在收到邮件后第一时间删除内容!

[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权。