当前位置:主页 > 抓码王 > 正文

计算机视觉的未来:Trax和朗镜科技专家问答

2019-09-06   来源:本站原创    点击量:

  计算机视觉是一个跨学科的科学领域,能够帮助计算机进行类似人眼的看见、识别和处理图片,它正在快速改变零售业。让我们跟随Trax(

  问:我们知道,计算机视觉的灵感来自人类视觉大脑皮层。我们现在是否已经处在机器物体探测或分类能力与人类视觉相当甚至更强的阶段了?

  Ziv:当然。实际上,在一些任务的处理上,我们通过计算机已经实现了超人类的视觉能力。例如,著名的ImageNet 挑战,你在系统中输入成千上万个物品类别,如“集装箱货船”、“螨虫”、“蘑菇”或“樱桃”,而计算机需要将图片归类到相应类别下。我们现在看到,这个挑战中,参与者的准确率最佳成绩有了大幅提升,从2012年的约74%提高到2017年的95%。

  蓝文:计算机视觉技术源于1980年左右的神经网络技术,但是直到最近三到五年才真正实现了大规模商业化落地。现在是计算机视觉的最好时代,这不仅仅表现在大规模资金的进入,也表现在专注于计算机视觉的创新公司不断地涌现,这些公司出现在不同的领域,并通过计算机视觉技术深刻地改造着原有领域的商业模式。Trax 正是最近几年出现的,利用计算机视觉技术改造零售领域的高成长公司。

  问:人眼受制于一些与身俱来的偏见,这往往源自我们祖先过去的“模型建立”思维模式。机器能够被训练为百分百正确的吗?

  Dolev:计算机视觉系统绝不是百分百正确的。类似于迷惑人类大脑的视错觉现象,计算机视觉系统也可能被“对抗性图片”迷惑。这些图形或图片利用计算机视觉算法的弱点,能够让其将熊猫认作长臂猿或将猫认作牛油果酱。实际上,一个来自MIT的学生团队在2017年发表了一项研究,展示了他们如何让系统错误地将一张3D打印的乌龟的照片认作一把步枪!

  恶意攻击者有可能利用这一点制造伤害,如操纵人脸识别工具使其认出错误的人,或袭击无人驾驶汽车的计算机视觉系统。比如,高速公路边上的一个小块区域就可能会让自动驾驶汽车认为它看到了一个停止的路标。

  Ziv:在深度学习技术之前,很多应用都遇到瓶颈,进步很慢,每年只有大概0.3%的精确性提升。但随着深度学习的进步,计算机视觉的发展经历了一个巨大的飞跃,催生了一系列跨行业的应用。

  随着很多主流制造商和科技巨头的入场,自动驾驶行业已经热闹非凡。根据自动化等级,自动驾驶汽车可分为五个阶段:从第一级的需要人类驾驶员大量参与到第五级的完全自动驾驶汽车。今天大多数的自动驾驶汽车都属于第四等级,可以自动驾驶,不过只能在事先绘制好地图的特定路线中行驶。

  Yair:国防产业据说还将继续是这类技术的最主要用户。如今国家在作战环境使用载有传感器和摄像头的无人机是很常见的,它们能帮助制定更安全的战略部署并保护士兵。

  一个更不为人知但影响力巨大的计算机视觉应用是在农作物分析和监测领域。利用装有摄像头的无人机,农场主可以得到农田的图片,监测作物的健康状况、虫害情况以及其他有可能影响收成的因素。

  Dolev:但我们最关心的还是零售!我们用计算机视觉捕捉货架图片并分析每件商品。Trax帮助实现货架数字化,从而减少销售代表的审核时间,还能将图像转化为数据,997997开奖中心藏宝图如今的新型药物价格一般都很高,,提供给品类管理、顾客营销和空间规划团队,从而减少缺货,改善分销,并从竞争对手手中抢占市场份额。

  Yair:深度学习已经将计算机视觉的一些应用商品化。用智能手机识别物品已经不再是大公司的专利了。每个人都可以使用开源代码和公共数据包,并且轻松地训练一个系统。这能使物品识别具备相当程度的精准度。

  谷歌、Facebook、微软和亚马逊等大玩家很快就能够为主流应用提供即开即用的计算机视觉解决方案。但是如果你想开发一些新的或专业应用或将应用能力提升一个等级,那么你就需要更加专业的技能。

  Ziv:让我们以零售行业为例。虽然如今先进的图像识别算法能够以很高的精度识别图片中的物体,但在零售场景中,这一过程会更加的复杂。

  这里的情况并不常见——拥挤的环境,不断变化的SKU,近乎同样及相似的商品。因此,自动化图片识别平台必须满足一些特定的标准,这样才能确保高精准度——能够分辨外观几乎相同的商品,在光线较差的环境中能够克服模糊和反光包装的问题,能够识别产品生命周期中的不同变化,例如新的包装设计。

  蓝文:与4G网络相比,5G提供了更高的带宽,更低的时延、更小的功耗,以及更高的安全性等特性。而计算机视觉领域的AI创新应用,大部分都需要传输高质量的图像,或者音视频的流媒体信息,对于带宽和时延的要求很高,这恰恰是5G网络能够解决的问题。另外IoT以及边缘计算的兴起,也让大规模部署低廉探测器成为一种可能。比如Trax Retail Watch的解决方案就是通过在商店货架上安装摄像头,用以拍摄高清质量的图片进行货架商品的识别,使得实时监控超市货架成为了现实。

  Dolev:让我们很兴奋的一个应用是“门店地图”。它使用图像识别为实体门店绘制地图,并将其数字化为2D地图形态。手机App可以利用AR定位将顾客带到目标货架位置,基于顾客所在位置推送相应促销信息,提醒他们哪些商品缺货。用手机扫描商品就能查看其信息和营养成分,虚拟助手还能帮助消费者添加和追踪购物清单。

  了解计算机视觉如何从学术研究进化为寻找跨行业的应用,欢迎添加ID:TraxRetailChina,下载我们的电子书《计算机视觉的过去、现在和未来》。

  Trax是业界领先的专注于零售业计算机视觉解决方案与数据分析的新锐公司,最近入选 Red Herring 全球100强名单,在德勤高科技高成长500强榜单中排名第25位增长最快的公司。Trax实现了店内更严谨的零售运营管理,通过Trax店内执行工具,市场评估服务和大数据科学,为客户提供基于竞争的深度洞察,从而在零售的各个节点增加收入机会。Trax为全球50多个国家的众多顶级品牌和零售商提供门店执行服务,并帮助其增加货架上的收入。返回搜狐,查看更多


Copyright 2017-2023 http://www.FAFARIA.COM All Rights Reserved.