中国科学院深圳先进技术研究院院长范建平,院长助理、发展部部长毕亚蕾,楚晶无限科技董事长鲁帆、CEO肖洪波,硬件副总裁常清普等出席揭牌仪式。
什么是嵌入式人工智能?简单来说,以往的人工智能方式是通过云服务器实现大规模计算,也就是业内常说的“后端”计算。这种方式对网络的要求很高,也有一定的延迟,难以适应安防、反恐等实时性要求高的应用。嵌入式人工智能其实就是在终端进行本地计算,也就是“前端”计算,不需要联网就能实现环境感知、人机交互、决策控制等。
楚晶无限科技与中科院深圳先进技术研究院共建嵌入式人工智能与机器视觉联合实验室,一方面将致力于嵌入式深度学习的研究与应用,让深度学习不局限于云端和后台服务器,而能直接运行在前端设备,具有延迟短、响应快、保护隐私等独特优势;另一方面推动在安防监控、智能家居、智慧商业等领域的创新突破与应用落地,探索更多有价值的应用场景,让人工智能更深、更广、更紧密地融入人们的生活。

肖洪波 楚境无限科技(北京)有限公司联合创始人、CEO
触景无限科技(北京)有限公司联合创始人兼CEO肖洪波表示,触景无限此前与国外一些世界级的科研院所有过合作,但语言沟通有些困难。这次与中科院深圳先进技术研究院多媒体中心的合作就顺利多了。“深度学习可以分为两部分,一部分在机器上,一部分在前端。前端有很多实时性的要求,比如无人机避障的功能,在服务器上是没法处理的,服务器可能需要传输,很多网络不能连通,就算连通了,可能也要几秒的时间,前端没有时间死机,所以很多前景需要在前端处理,市场需求很强,这也是我们想建联合实验室的原因。”肖洪波说。
“应用场景中的计算最终都会落实到设备上,这次战略合作将是中科院深圳先进研究院与人工智能企业实施产学研合作的一次新尝试。希望双方能够充分发挥各自的技术和产业化优势,优势互补、相互促进,开展长期友好合作。”中科院深圳先进研究院院长范建平说。
楚境无限科技联合创始人、董事长陆帆在致辞中表示,自联合实验室筹备以来,双方一直保持着良好的合作关系。楚境无限作为嵌入式人工智能与机器视觉领域的实践者和探索者,希望将芯片、算法、传感器等连接成一个软硬件一体化的系统解决方案,实现资源共享、优势互补。此次合作将大大缩短产学研合作的整个旅程,促进人工智能应用的普及和生态系统的构建。
嵌入式视觉解决方案需求巨大
目前,机器人、增强现实(AR)、安防等领域对嵌入式机器视觉的需求巨大。比如安防市场目前面临在传统IP摄像头上增加智能功能的需求,这也需要嵌入式视觉解决方案。早在2010年,Touch Scene Infinity就已经开始进入AR领域,主营嵌入式机器视觉。到2013年,Touch Scene Infinity已经为手机提供了嵌入式解决方案。目前,Touch Scene Infinity在机器视觉领域已经申请了包括软件著作权在内的多项专利。“你可以把我们看作是一个提供行业中间件产品的中间件公司,我们所有的积累都集中在底层芯片级别的优化上,包括不同传感器的集成。比如我们最近推出的视觉卡就集成了不同的传感器,通过这些传感器采集的数据,我们可以做很底层的驱动开发和算法综合。”肖洪波说。
目前业界已经达成共识,人工智能的发展需要大量数据来“喂养”。因此,楚晶无限和先进研究院的目标一致。先进研究院希望通过业界的数据来完善算法,而楚晶无限也能把先进研究院的算法快速产业化,并引入我们的前端芯片技术。“我们希望这是一个长期的战略合作,未来十年,能把这个研究院打造成世界嵌入式人工智能领域非常先进的研究院。”肖洪波说。
陆帆,楚静无限科技(北京)有限公司联合创始人、董事长
触景无限科技(北京)有限公司联合创始人、董事长陆帆认为,随着人工智能技术的发展,整个科技行业将会发生结构性的变化。“以前我们办公司的时候,一个公司从头到尾都要做,从原材料到设计,再到做成产品、卖出去,但现在人工智能产品越来越复杂,涉及到软件、硬件、算法,还有数据从哪里来,然后优化算法,所以环节非常多。”陆帆认为,人工智能行业的发展依赖于生态圈的发展,必须有大量的公司参与其中,才能输出自己最强的选择。人工智能的生态圈才刚刚开始,先进院强在算法,触景无限强在产业化能力,所以这次合作有助于建立AI生态圈。据介绍,两家公司第一阶段的合作主要与人脸识别有关,未来希望在机器视觉的基础上做更多合作,包括整合一些更先进的嵌入式芯片技术。
为什么选择 Nvidia Tegra K1?
众所周知,在AI芯片方面,GPU比传统CPU更适合做AI计算,Nvidia的股价也因为AI这个概念不断上涨。GPU原本是为图像渲染而设计的,更适合做游戏渲染,从3D到2D,而图像处理则是反过来,从2D到3D,所以其实有更合适的GPU和预算单位来做这个处理。
因此,触景生技与先进技术研究院推出的嵌入式GPU是一个切入点。在机器识别方面,GPU并行计算更适合图像处理、芯片处理等,此外还有降噪、视觉优化、动态调节等。肖洪波说,触景生技此前对目前市面上的人工智能芯片的功耗、处理能力、成本等11个参数进行了调研,经过比较,最终选择了AMD的GPU和Intel-Movidius芯片。
嵌入式视觉卡将带来新的市场热点
(触景无限视觉卡V203是基于Intel-Movidius芯片,采用双目立体视觉技术开发,可实现无人机自动避障等)
据介绍,Touch Scene Wireless的可视卡目前有七款产品,一共两代。第一代主要针对安防行业,第二代针对安防和无人机。“我们其实针对不同的行业定制了不同的模块,比如我们其中一款叫20201的产品就是专门针对安防的。”肖洪波说,第三代产品还在规划中,功耗会更低。据介绍,Touch Scene Wireless的可视卡目前主要针对中小型安防客户,像海康威视这样的大客户一般都喜欢自己做。
例如,基于NVIDIA、Intel嵌入式芯片自主研发的Vision Card系列模块,不仅拥有出色的硬件能力(体积小如一枚硬币、功耗低至2W等),还拥有强大的算法优化和移植能力——Vision Card上运行的基于深度学习的人脸识别算法,速度可达每帧100ms(检测+识别)(分辨率1080p),在1:1人文比对情况下,识别率大于99%,在1:50000(人脸库大小有5万人脸)情况下,识别率大于90%。
其实,像视卡这样的产品是针对前端安防摄像头设计的,实现本地实时人脸、图像识别,不需要后端服务器。以前用摄像头拍完才能回溯,对于防盗、反恐等时效性要求高的应用来说,速度太慢了。另外,公安经常需要移动作业,如果网络不太好,后端服务器的支持也会不到位。特别是一些重要场合的安防,还需要提前屏蔽有犯罪前科、黑名单的人,防止犯罪。“目前新疆所有的酒店、路口都在用我们的产品,因为出事后再去查我酒店住的是谁,已经来不及了。相反,当你进酒店的时候,已经进行过人脸识别,看看你是否在黑名单上。这是我们对新疆安防的贡献。”
肖洪波具体介绍了触景无限推出的视觉卡业务。他表示,嵌入式视觉人工智能这个市场才刚刚起步,同时也有很多技术挑战需要攻克。“我们自己开发了很多图像识别算法,后来做手机上的AR,也做了很多底层芯片的算法加速。”肖洪波说,不同的传感器、芯片需要集成在一起,底层还需要做一些并行处理,开发难度其实很高。能耗也要考虑,它的优化要从最底层的芯片结构开始考虑。“虽然我们自己不做芯片,但是做这个模块,其实我们对市面上芯片的能力非常熟悉。”肖洪波说。
携手英特尔共建AI生态
人工智能将对各行各业产生重大影响。陆帆表示,以智能空调为例,摄像头和机器视觉可以判断一个空间内的人数,此时算法可以调节空调的风速,保持人体舒适度和耗电量的平衡。
以安防为例,人脸识别处理可能更重要。“对于安防行业,我们需要人脸识别,可能会采用中科院的算法。我们也会自己研发很多算法,比如双目避障算法、无人机3D定位算法。”肖洪波说,人工智能会给传统制造业带来很多升级。比如苹果最近发布HomePod,布局智能家居。这款音箱不仅能发出声音,还能判断所处的环境。今年,触景无限联合合作伙伴英特尔启动点眼计划,希望提供世界级的产品专家和算法专家,帮助传统家电厂商升级。“我们的计划是招募五个不同行业的合伙人,免费帮助他们提供产品解决方案。”
由于人工智能行业的发展涉及到整个生态系统的建立,未来人工智能行业会有分工,各家公司会专注于自己最擅长的事情。肖洪波说,Touch Scene Infinity最擅长的是提供全球功耗最低、性能最强的人工智能和机器视觉模组。“我们很快会推出下一代产品,可能功耗再降低10倍,这样我们的客户就不用再降低模组的功耗了。”肖洪波说,算法API会随模组一起提供给客户。“如果我们的客户出货量比较大,我们也可以为客户提供定制化的软硬件一体化解决方案。”
“人工智能和以前的智能最大的区别就是人工智能有深度学习,可以通过大数据来学习,总结规律。所以数据就变得非常重要。”肖洪波说,人工智能需要大量的数据来“喂养”,才能成长起来。在中国,各行各业都有着海量的大数据,可以支撑各种“人工智能”应用的发展。“十几亿人的数据,在全世界都是独一无二的。所以我们会把全世界最好的数据,加上算法,产生出来。如果政府重视我们的人工智能产业,完全有可能跑在世界的前面。”
如何评价一家融资4.1亿美元的算法公司?
对于人工智能行业,无论是投资界还是业内人士,最先看的就是算法。那么如何判断不同算法公司的水平?哪家算法运行得更好,哪家的人脸识别更准确?算法需要用不同行业的数据来喂养。那么对于人工智能应用来说,拥有大量数据的互联网公司是否最有潜力?
“互联网公司确实有数据,但数据其实是不一样的。比如图像数据,互联网公司不一定有图像数据,比如BAT可能没有很多图像数据,阿里巴巴可能有一些图像数据,但百度在场景上可能没有很多数据。”肖洪波说,目前楚景无限在与客户合作中,通过图像传感器可以获取很多数据。除了与中科院先进研究院合作外,还与国外很多研究机构合作,比如伊利诺伊大学先进媒体研究中心、英特尔等权威机构和科技巨头,加强在安防监控、无人机、智能家居、零售分析、增强现实等领域的战略布局。通过与这些算法公司的合作,将产生更多有价值的人工智能产品。
那么,如何评价最近一家算法公司4.1亿美元融资?“虽然很难判断投资界如何评价算法公司,但至少可以确定算法已经成为人工智能行业的核心。”陆帆说。肖洪波认为,目前人工智能公司的高估值,和时间窗口有关。“我以前是做图像算法的,记得我做图像搜索的算法花了很长时间,现在通过深度学习,一个月做出来的效果可能比我们几个博士花了两三年做出来的效果还要好。”大家都会觉得机会很难得,所以愿意去投这个事。
对于算法公司来说,目前主要的商业模式是专利授权。楚静无限的商业模式是按照模块数量收费。陆帆认为,不同的产品形态要采取不同的商业模式。比如做背景识别的,一般都是按照调用次数收费。“我们跟一些算法团队聊过,他们看到我们的硬件很兴奋。因为他们有好的算法,但没有好的硬件载体。因为这些需要很多芯片级的优化和传感器融合。”肖洪波举了一个例子,比如双目视觉技术,主要用于无人机、机器人的避障、定位,必须用全局成像传感器来驱动硬件。
如果继续缩小的话,未来可视卡是否会被集成到手机中呢?
此外,在智能家居领域,嵌入式人工智能将应用到智能门铃、智能空调等,精准识别陌生人及潜在危险行为并报警,通过识别室内人的身份和行为来管理家用电器的工作模式,为人们营造舒适的生活环境;在智能商业领域,人脸识别、物体识别技术可以帮助服务人员即时判断顾客身份、消费习惯,还能统计客流轨迹、对商品的关注度等,为提升服务质量和效率提供可靠而丰富的资源。比如近期备受关注的无人超市,就是嵌入式人工智能的应用场景之一。
“去年有个嵌入式视觉峰会,我们还在讨论要不要在嵌入式上做深度学习。今年5月我们再去参加的时候,大家讨论的已经不是这个了,而是在嵌入式上怎么做深度学习,可见这个市场需求有多大。当然现在真正做出来的产品还是很少。”肖洪波说,楚景无限几年前就开始做嵌入式机器语言,经过几年的技术积累,现在能直接用的只有楚景无限的嵌入式视觉卡模块。据《国际电子商情》了解,楚景无限的视觉卡已经做得很小了,技术上完全可以放进手机里,一旦进入手机里,量会非常大。
“现在盛传iPhone 8会加入AR技术,我们为此开发了嵌入式解决方案,可以配合手机实现感知和手势识别。”陆帆介绍,在第四届网易未来技术峰会“AR的未来”专题论坛上,Touch Scene Infinity宣布携手HoloKit,通过开放的参考设计支持全平台(iOS、Android)智能设备增强3D空间感知。此次合作将为AR游戏、手机平板等厂商提供媲美微软HolLens的开放硬件平台。当然,陆帆也表示,如果手机厂商大力推广AR解决方案,手机厂商自己做算法有天然的优势,因此Touch Scene Infinity更倾向于提供嵌入式解决方案。