machinemetrics博客

使用机器数据开始驾驶决策。

准备授权你的车间?

了解更多
类别:
    戴夫威斯兰
    戴夫威斯兰 数据收集/ 1月28日,2021年MachinImetrics./ 1月28日,2021年制造数据/ 1月28日,2021年数据清洁/ 1月28日,2021年数据可视化/ 1月28日,2021年

    事实或虚构:你的数据告诉你哪个故事?

    公元前3万年,我们的祖先在岩壁上描绘他们的日常生活,到了公元前700年,我们有了第一个印刷的故事——吉尔伽美什。快进到2021年,我们已经和人工智能合作创作了五年多的故事。但当当今的主流是精确的商业智能时,企业希望确保他们的人工智能和机器学习系统不会在艺术上随意妄为,编造一个荒诞的故事。

    尤其如此,目前AI和ML-LED决策是迄今为止最高的采用水平,甚至最不愿意的高管即使是从以数据为中心的战略方法中获得的巨大益处。由于信托在AI和ML的承诺中构建,准确性至关重要。这个问题仍然是许多人的最重要的:“我们如何判断我们的数据是否告诉我们整个故事 - 以及基于事实的一个?我们需要知道什么可以信任我们的模型?“

    吱吱作响的清洁数据

    当机器学习系统提供不准确的预测时,我们可以查看一个罪魁祸首 - 数据。禁止黑天鹅事件,数据是任何预测系统的开始,中间和结束。它可能是简单地没有足够的数据来可靠地训练系统或基于其预测,在这种情况下,更多的数据点可以解决问题。通常,这样的东西将被捕获在模型上的早期阶段,并且几乎在部署之前几乎肯定地占据,至少必须防止疯狂地不准确的预测。然而,较可能的罪魁祸首是启动数据不够“干净”。清洁足够相对。一些项目的数据要求类似于“我的运动鞋是足够干净的去超市?”其他,特别是在关键系统和涉及生命,安全和福祉的人中,更像是“无尘,吐过闪耀,游行光泽,你可以检查你的牙齿”在如何清洁数据需要做的情况下可靠地(和道德上)执行任务。

    那么,是什么让数据肮脏?短篇小说是不准确或歪曲的信息。

    破碎的标签,破碎的模型

    这可能是不正确的标记数据,错误字段中具有错误信息的数据或以不正确的格式,例如,2015年12月27日而不是12/27/15或2015年2月27日。虽然第一个选项可能只是抛出错误或被忽略,但互换最后两个日期格式可能会导致准确性严重影响。And dates aren’t all that invalid formatting can affect—times, SKUs, text where numbers should be, numbers where text should be, and all the specialty data streams that come out of shop floor equipment like overrides, alarms, loads, speeds, feeds, etc. The point is that without a reliable and consistent structure, data can become messy and lead to inaccurate insights.

    使用MachinineMetrics,公司能够利用我们的自动数据变换引擎标准化和格式化各种数据类型,以便于分析。它可以处理自定义传感器值,机器状态,模式,报警,覆盖,负载,速度,馈送,PMC参数,诊断等。

    你能相信你的来源吗?

    重要的是要考虑所使用的任何数据源的准确性和准确性,特别是如果这些来源是人类的。人类不是最准确的生物。我们绕过并忘记并融合了数字。我们懒得或疲倦或饥饿或分心。通过使用人类数据来源的性质,数据将以某种方式脏污。以下是看耐受性的重要性。例如,机器运算符可能是添加关于他们使用的设备状态的数据。当提供有关停机时间的信息时,列出的原因可能是准确的,而时间更像是估计。这导致了一种较低的预测系统,因为它输出的响应也比估计更接近,而不是如果提供真正准确的数据。

    这是另一个需要考虑实际公差的场景。间隔几秒还是半小时?在机器数据源的情况下,对于某些用例,您甚至可以考虑纳秒或更小的时间。无论项目认为什么公差是合理的,重要的是要加强这种公差,并确保输入到系统的任何数据都在这些参数的准确性范围内。

    MachinineMetrics高频数据适配器在1KHz捕获机器数据(与标准1Hz-So 1000x更快地相比)所以您永远不会错过击败,无论您的应用程序呼叫哪种准确性。

    这也是公司应该寻找偏见潜力的地方。遗漏的谎言仍然导致童话预测。您的数据源是否主要收集到足以显示整个画面,或者由于使用的收集方法而易于偏见?For example, if you’re trying to figure out the average salary for a production line worker, but all respondents were men, you’re likely going to have a skewed figure vs. if you surveyed both men and women to get a clearer and more accurate picture. Actively seeking potential oversights like this can lead to cleaner data and more accurate predictions.

    背景和复杂性

    系统越复杂,房间越多,数据和逻辑中的不准确性,不一致,风险和一般故障,当您尝试将其转换为可用于分析的东西时,它就会提高其数据和逻辑。您尝试收集数据的过程有多少步骤?您是否拥有行业知识,帮助您为原始数据提供上下文?例如,在成功生产中,在几分钟内倍数倍数的机器不太可能是真正的生产运行,而是指示测试,以确保最初导致停机时间完全解决,重新校准的问题。准备恢复真实的生产。然而,在数据集中留下这些数字,因为它们被输入可能导致严重的不准确性,这可能难以捕捉到未训练的眼睛。

    这并不意味着您的数据科学团队必须成为您行业中的一切的最终专家。然而,它的意思是,具有专家的渠道可以添加上下文至关重要。例如,通过MachinimeMetrics,机器操作员配备了在车间的平板电脑设备,在其机械上。它们可以快速且轻松地将人类的背景添加到数值数据中,以便在分析阶段提高精度。如果没有这种上下文频道,它可以成为一个猜测游戏,以确定应该在锅中抛出哪个数字,应该被丢弃。

    无损转变

    When you transform one thing into another thing, there’s basically always some degree of loss, however minute—whether that’s transforming ore into steel, cotton into textiles, or data into a format for analysis, it’s important to determine how much loss is acceptable and how much is preventable. Starting with clean, accurate data is a vital first step in a clean and accurate analysis. Beyond that stage, it is necessary to consider which tools you’ll use and for what applications, the likelihood of any loss of fidelity, and to what degree this is acceptable (or irrelevant). This leads directly back into understanding what it is you’re trying to do with your data and with your models—what problems you’re trying to solve—and the level of accuracy required to effectively solve them.

    在MachineMetrics,我们确保您的数据为您提供整个真理,只有。我们是了解解决您最紧迫的问题的深度,广度和数据类型的行业专家 - 无论是那种机器停机,优化输出,还是使用数据LED方法的其他选项。我们使用简单,可消化的格式来分享和分析,即使是实时的诚信和保真度。Machinimetrics通过纯粹的语言和工具实现了通过Quot-At-True的过程将商店地板数据与真实决策集成了实际决策的任务,使工具甚至是非技术人士可以轻松地安装它们,以便提供服务在不到一周的时间内让我们的客户带到了ROI。要查看什么类型的问题,MachineMetrics可以为您的业务回答或预订演示,在这里随时接触我们。

    使用机器数据开始驾驶决策。

    准备授权你的车间?

    了解更多

    评论

    发表评论

    订阅我们的邮件列表