人工智能+物联网:工业AI平台
数据分析,异常检测,失效预测等功能,是属于工业AI平台能力的一部分。人工智能落地是未来几年很有潜力的一个方向。构建一个数据为导向的工业AI平台,提供预先训练的数据模型和结合领域知识,为客户提供数据洞察,指导采取有效行动,在失效预测、异常检测、动态学习创建业务规则等为客户创造价值。
眼下,一方面传统企业已经积累了大量的数据,联网设备的数量逐年增加,IoT的普及会产生大量的数据,积累越来越多的数据,尤其是工厂设备运行的大量数据。很多工作是针对这些设备运行数据来进行的,所以需求是实际存在的。同时技术层面AI技术的成熟,和与之配套的工程能力的发展,也为了AI落地提供更大的想象空间和应用场景。人工智能的加入,能够帮助企业从物联网提供的海量数据中提取有意义的见解。
物联网设备、传感器和芯片带来的大量信息在一定程度上提高了对工厂的自动化水平。物联网将“智能”应用于设备中,客户越来越依赖于智能的设备,同时提供实时更新的数据,并致力于提高工业设备的安全性。
虽然有很多IT企业已对外宣称他们搭建了物联网平台并提供相关咨询服务,但是顾客对物联网所带来的好处以及他们如何处理生成的数据仍感到迷茫。
还有一个问题,物联网设备产生的数据量太大了,目前的方法处理能力不足。想要进一步理解这些数据,并利用它们实现商业目标仍是一项亟待解决的任务。人类无法处理、查看和理解如此多的数据,甚至计算机软件也无法做到,但人工智能和机器学习技术的应用使其成为了可能。
如何将人工智能运用于物联网?
人工智能可用于管理多个相互关联的物联网实体。最关键的是,它的处理能力和学习能力对于分析物联网传输设备产生的大量数据至关重要。企业可以通过利用在人工智能技术下聚合起来的实践子集——机器学习来实现这一目标。
如果将物联网比作是数据的“供应商”,那么机器学习就可以称为数据的“挖掘者”。为了使物联网提供的数据发挥的作用最大,需要对其进行改进。物联网传感器产生了无数的数据,“挖掘者”的任务则是识别出这些数据之间的关联性,从中提取出有意义的见解,并且将它们存储起来以供进一步研究分析。
利用传统的方法进行数据分析时,系统需要获取过去的数据,专家会在数据处理过程中进行解释并给出相关报告。物联网和机器学习更多的是用于预测。从期望的结果出发,在各个符合标准的输入变量之间找到交互关系。当一种机器学习算法了解其最终目标时,它会“学习”物联网数据。这些过程对于获得理想的结果至关重要。
机器学习应用于物联网数据的另一个优点是能够对算法进行自动改进。随着数据量的增加,智能系统的预测精确率会逐步提高。通过这种方式,企业可以在没有实际“思考”的情况下做出更加合理的决策。智能系统可以解决诸多方面的问题,小至机器安全或降低功率,大到增加个性化商品和服务的供应。可以帮助降低成本,可以通过将人工智能应用于物联网帮助创造良好的用户体验,可以在企业中利用人工智能帮助开创新的生产流程模式。
物联网在工业中的广泛应用带来了大量的数据。利用人工智能算法对已收集到的数据进行处理,企业所有者可以发现项目中存在的潜在风险,防患于未然的同时适当对其它案例做出调整。系统可以逐渐学会如何识别对机器操作有影响的外部因素和内部因素。通过对优化资源和提高工业安全性,整个生产过程得以简化。
预测性维护是人工智能应用于工业物联网中最大的切入点。预测性维护和透视维修意味着由机器学习算法驱动的系统可以预测工厂车间的维护需求。最重要的是,人工智能可以帮助创建具有自我修复和自校准能力的物联网设备,如传感器、电感器或发射器。人工智能用于工业物联网最大优势在于降低了维护成本和减少了停机时间。
结合人工智能和机器学习技术是一次巨大的飞跃。现阶段的AI技术已经可以切实的解决部分客户的问题,AI在这些特定问题下,确实可以提供以前传统方法无法完成的效果。
尽管将人工智能应用于物联网中,其安全性问题仍存在较大争议,需要我们继续去关注,但这些具有颠覆性意义的技术组合已经初试成功。通过提前设想应对措施,企业可以更容易的实现设定目标。但也是这样,智能系统分析、预测及自适应能力也要求的越来越高。
机器学习定位是提供一个解决问题的有力武器,所以要思考建立怎样的产品——使用机器学习解决实际问题,如何在现实环境中落地,并为客户带来价值。
怎样的产品研发团队才能够实现这样的一个工业AI平台?什么样的演进过程才能够完成这样的一个产品?在这个过程中,可以从如下的方面去考虑、分析、开展工作。
一、 工业AI平台的定位
这部分是为了AI最终落地所做的必要步骤。
从用户角度来讲,数据打通,流程梳理,场景细化等才是核心。对于客户,有核心业务,支撑公司生命线的业务才是核心,AI对于他们是一个尝试,是一个有着很大潜在价值的新尝试。很多时候还是用于提升已有核心业务的竞争力。
二、 工业AI平台的落地
落地过程中,机器学习模型需要什么的数据?要想对这个业务场景建模,需要对接哪几个上游系统?
公司算法工程师怎么定义这个问题、决定了客户宝贵的人力和时间的投入。
一旦方案确定后的再修改,如何最小化双方的损失,最大化收益,这些都需要深耕行业的功夫。要与行业里面的大学等科研机构建立合作,缩小公司在这方面的差距。
三、 工业AI平台的领域知识和模型
在实际落地中,领域知识是特别特别宝贵。从单个项目而言,落地过程中由于标注数据的缺乏,甚至生数据本身的缺乏,都会严重影响项目最终的落地。数据一直是客户的核心资产,尤其现在客户意识到数据本身潜在的巨大价值。出于数据安全,或投入成本的考量,落地过程中会控制自己人力投入。
为了最终落地,创建特定的领域知识很重要。从建模的角度来说,领域知识有利于特征工程的创建。可以支持在有限数据的情况下,做出一定的效果,增强客户的信心,同时促进了客户的配合力度。
模型效果好不好,极大倚重数据的质量和数量,特别是标注数据的质量。现阶段落地还是以监督学习为主,标注数据凝结了领域专家的知识,标注数据的稀缺是很致命的,必须解决标注数据稀缺的问题。
大量数据给到算法工程师建立模型,产品中的一些核心模块采用了AI、机器学习的技术。模型准不准,和用户的标注质量息息相关。落地主要的问题就是,很多时候,模型调了半天,远不如增加标注数据提升效果来的明显。模型效果不好,很多时候排查的原因是数据标注的问题,标注的结果是我们模型学习的答案,所以标注数据质量如何,直接影响模型效果。
在国内,AI的标注员背负着部分模型指标的压力,这种方式有一定合理性。这个标注的事情能否让用户来做?现实中落地,客户出于数据安全考量,或客户背靠的业务场景需要很多的业务知识,一般的数据标注公司无法处理,都需要客户的专业的业务人员来标注。所以结合实际解决方案,给出最佳的标注方式,也是至关重要的。
对于具有突破性潜质的技术持续关注。清楚模型能做什么很重要,清楚模型处理不了的情况,同样重要。新的技术,在实验室环境是可以跑一个很好的结果。但这些模型具体在实际的业务场景表现如何,应该一步步试验验证,要有一个基本了解。
当然最理想的情况,当然是将公司建设为特定领域的资深服务方,开发一套来之即战的产品。
四、 工业AI平台的完善
AI领域,随着机器学习相关技术的成熟,核心竞争力必然会从模型算法倾向到数据。领域知识,最后必然体现在产品化上。客户可以购买平台的相关产品和服务。
平台的架构,除了对外提供产品服务外,平台要能够逐步完善自身,随着平台采集的数据越来越多,可以不断地增量学习,提供越来越好的产品和服务。
五、 人员能力和团队建设
对于产品化,机器学习算法工程师是不可或缺的。要求算法工程师懂场景,产品,用户行为,或者要求产品经理懂得机器学习。构建的技术门槛很高。
算法工程师最重要的一部分工作内容就是抽象出要解决的问题。而问题的抽象决定了客户的问题实际上是机器学习解决,还是经典的算法就可以解决,甚至本身就是一个纯工程性的流程类的项目。
很多时候,客户不清楚实际问题的根源,更很难判断哪些是AI、机器学习可以处理的问题,哪些是管理流程类问题。
当然一般大型企业是有专业的BA(Business Analyst)来处理的。但现阶段对于AI落地有经验的BA还是很稀缺的,这个时候,机器学习工程师是需要协助甲方的BA,业务方,乙方的项目技术负责人、项目经理来梳理出问题。
公司机器学习的工程师,也要求一定的业务敏感性,以及对新技术可能对已有问题有哪些影响,要有一个敏锐的嗅觉。将技术和实际场景结合,是一个机器学习工程师必要的能力。