如何构建成功的计算机视觉应用程序

推特
推特
LinkedIn
分享
Facebook
fb-share-icon

从原型到生产的导航计算机视觉项目

电脑愿景在几个行业中迅速获得牵引,因为图像数据的可用性增长,而人工智能(AI)对全球的公司变得越来越达到最重要的。计算机视觉或CV,是一种机器学习的形式(ML),帮助计算机看到和解释类似于人眼的图像。通过对图像和对象进行分类,然后可以根据用例对所看到并提供增强的预测,客户体验和安全性的计算机对。

谈到AI时有许多计算机视觉应用,其使用期望随着时间的指数增加。简历卫生保健例如,预计到2025年底,CV的销售额将从2019年的约4亿美元增长到13亿美元,而30%的零售商将在未来12个月内采用最新的CV技术。预计到2025年,CV市场整体价值将达到182.4亿美元,占全球人工智能市场的很大一部分(到2026年将达到令人印象深刻的680亿美元)。

尽管计算机视觉项目的快速增长,但许多公司仍然努力找到信心部署它主要是由于缺乏高质量的数据和对建筑自动AI管道的有限了解。解锁业务价值将需要克服这些挑战,并以可扩展的方式这样做。

什么是成功的计算机视觉应用程序?

许多组织已经在他们的计算机视觉应用程序上取得了成功,释放了商业价值。这些案例研究强调了不同行业的成功:

电子商务

Shotzr为营销专业人员提供包含超过7000万图像的营销专业人士的图像数据库。他们向我们寻找了高质量的培训数据,以帮助为营销人员创造更个性化的和本地化的搜索体验。利用图像分类CV,Shotzr使用各种人群来标记具有相关类别的众多图像,例如时尚,自然和生活方式。然后将这些图像馈入其平台的搜索算法,提高了推荐和搜索体验。订婚增加了20%,因为营销人员能够找到更多相关的图像和内容。

零售

机器人是人工智能中一个令人兴奋的领域,它依赖于简历。在零售,公司正在将机器人放在他们的商店地板上,以跟踪库存并确定哪些物品是低库存或备用货物。鉴于股票商品每年全球收入造成4.48亿美元,对主要零售商的巨大成本节省巨大。

机器人除了使用光学字符识别(使用图像转录扫描条形码并输出产品名称和价格),还使用图像注释的物体检测来识别产品是否缺货。

农业

约翰迪尔通过应用计算机视觉算法来识别农场上的杂草来塑造农药。利用像素级图像分割,训练AI以区分图像的哪个部分是作物,并且哪个部分是杂草。这样,农民可以使用无人机仅在杂草上喷洒杀虫剂,导致农药成本降低90%。

汽车

这里是一家公司通过利用视频,图像和文本数据创建许多行业的准确地图。他们的路线标志检测算法具有ML辅助视频对象跟踪,其平台可以使用具有在商业标牌上的边界框的光学字符识别算法识别业务。这里使用卫星图像上的像素级语义细分,以向人行人入口,地板数等涂布建筑物。

该公司还使用视频注释来跟踪汽车、车辆和行人。我们的工具提供了更高级的机器辅助,模型能够跟踪每个对象的运动,使人类对该对象的注释更易于管理。

这些例子展示了CV的权力,以便在重要产业中解锁公司的批评成本节约,同时也强调培训数据的成功价值。

如何接近计算机视觉项目

电脑视觉项目

接近的关键计算机视觉项目正在构建可扩展,自动模型管道。以下步骤将使用自动驾驶汽车示例来指导您完成此过程。

1.业务问题

定义一个明确的业务问题,将为您的组织提供价值。认识到参与执行解决方案的关键利益相关者,并获得对项目的签字和理解。务必评估努力的优先事项,您组织愿意制作的投资水平。

在开发自动驾驶汽车的情况下,业务价值可能是更大的收入或渴望获得竞争优势。

2.数据

准备培训数据涉及许多步骤,包括收集,清洁,分割,注释,处理和分析。您还希望有适当的数据治理过程来监视安全问题。(请参阅下一节关于训练数据的重要性的更多内容。)

在我们的自动驾驶汽车示例中,从汽车收集来自摄像机,激光雷达和雷达的同步传感器数据,并移植到中央存储单元。汽车制造商还可以选择利用来自开源的相关传感器数据或废弃货架数据集.可以使用各种方法对数据进行注释;例如,点云视频对象跟踪是一种CV注释技术,可以在3D空间中跟踪对象(也许有助于了解汽车如何与其他物品交互)。

3.模型构建

模型构建阶段需要使用准备好的数据和超参数训练算法,优化特征提取,分析输出,并进行再训练,直到模型达到所需的精度阈值。您可以使用冠军-挑战者模型进行测试,在此您有一个初始模型作为要击败的模型。你呈现另一个模型,即挑战者,并在两者上运行A/B测试;哪个表现得更好,哪个就会成为冠军模型。在您得到您想要的模型之前,您可能必须遍历这个过程数百次或数千次。

对于自动驾驶汽车,您可能需要训练一到五个不同的模型,这些模型需要不同的数据收集或注释流程,并将它们融合在一起,以创建最终的模型。在测试模型时,通过迭代增加复杂性(例如,温度、天际线上发生的事情或与驾驶相关的其他因素)。自动驾驶汽车还需要在真实环境中进行现场测试,以确保车辆在不同条件下的性能。

4.部署

一旦您有了一个冠军模型,请评估您的解决方案是否解决了您在开始时定义的业务问题,以及它是否能够提供预期的业务价值。如果不是,就重新进行调整。如果您的模型已经准备好了,那么将其与您现有的业务流程集成,并进行部署。使用工具在部署后继续度量模型的性能。

部署可能意味着很多东西。随着自动驾驶汽车,有一个物理成分,最有可能是一种需要在车辆上的可穿戴技术。

5.积极学习和调整

在您的模型部署之后,您还没有完成。现在您已经进入了模型维护模式,这需要持续的更新和监视。使用一个循环方法提供地面真实和成功监测,意图减轻模型漂移。此外,继续检查模型预测中的偏差,并在需要时向模型提供反馈。

随着道路状况在全球发展,需要更新,以便在自动驾驶汽车中持续到AI。

培训数据:计算机视觉项目的核心

同样准确的标题可以说培训数据是核心全部机器学习项目。如果没有高质量的训练数据,人工智能模型将难以做出准确、高可信度的预测,从而很好地服务于终端用户。在构建人工智能时,这是你获得成功所必须具备的要素。那么关于你的数据,你应该考虑些什么呢?以下问题将帮助您创建有效的数据管理策略:

目标和项目优先事项

您的质量目标是什么?

您如何计划培训和调整您的模型?

您的数据要求是什么?

数据收集

你需要多少数据?

你在哪里采购您的数据?

你的数据是否足够多样化以避免过度拟合?

你将如何移动你的数据?

您将如何保留在部署后收集它?

数据标签

什么形式数据标签你需要?

什么标签工具最适合您的需求?

谁在标记您的数据?您需要特定的技能,语言吗?

数据流水线和缩放

您如何计划使用AI数据管道自动执行?

你会加入人在回路吗?

您将如何使用持续培训提供您的模型?

虽然这些问题绝不是详尽无遗的,但他们将帮助您探索准备高质量培训数据和建筑和维护成功模型的所需途径。

优化未来

建立高效,高性能的CV型号是优化数据和模型管道的问题,避免常见错误。您需要通过构建连续学习循环来解决数据漂移和陈旧型号的问题,以继续培训和挑战您的冠军模型。您将希望通过设置可重复的自动工作流程来设计模型来扩展。您还想创建一个全面的数据治理框架,以促进高质量的培训数据准备。这些行动将共同帮助您推出试点阶段并进入部署,生产和超越。

我们如何提供帮助

在Appen,我们拥有超过20年的专业知识,包括收集和注释必要的数据,以构建计算机愿景的深度学习系统和神经网络。这种高质量的图像注释数据适用于计算机视觉项目特定的培训需求。

了解有关我们的方式注释能力可以支持广泛的计算机视觉工具,包括对象跟踪,像素级语义分割和图像转录。

使用世界级培训数据部署AI的网站