machinemetrics博客

使用机器数据开始驾驶决策。

准备好授权你的车间?

学到更多
类别:
    娄张
    娄张 MachinImetrics.2021年3月8日数据科学2021年3月8日SOTI2021年3月8日

    行业状况:2021年3月更新

    介绍

    As our daily utilization updates gain steam and receive more attention, we feel it’s important as data stewards to clarify our assumptions, any sources of bias we may have, and our margins of error in order for organizations to make the most informed decisions from our numbers.

    与任何数据集一样,我们的数据包含偏差,因此我们将误差幅度附加到报告的任何指标上。作为数据从业者,对这些偏见的来源、我们对数据的假设以及我们如何在我们的方法中解决这些问题保持透明是很重要的。这允许您,作为用户,对我们的声明的真实性和我们的数据对您的组织的价值做出您自己的判断。

    类似于传统的轮询方法

    如果我们从传统民调的角度来看我们的数据集(就像你在电视上看到的谁在总统初选中领先一样),我们可以把我们的每台机器都看作是我们进行“民调”或调查的“人”。在这个调查中,我们要问的问题很简单:“在过去的7天里,您的平均利用率是多少?”我们通过云连接的Edge设备每秒钟对美国各地的数千台“人”(机器)进行抽样,一旦所有“答案”都被“输入”,我们就会报告前一天的数据。

    机器示例3月2021年3月我们样本的“人”(机器)所在的地方。

    与任何没有捕获整个人口的民意调查一样,我们的样本也有偏倚的倾向。正如我们在之前的文章中提到的,某些形式的偏见并不适用于我们的方法——即情感驱动的偏见,如感知偏差、确认偏差和恶意报告。机器每秒钟都会通过软件自动进行轮询——它们不能“说谎”或说假话,因为当它们被绑定在MachineMetrics上时,它们没有机会这样做。技术故障也是名义上的,因为利用率是我们从机器中轮询的最基本指标,任何异常都通过算法检测并迅速根除。然而,即使剔除人为因素,其他形式的偏见仍然存在。

    高生产力的样本

    首先,我们的示例可能代表了制造业的高生产率样本。这是因为采用行业4.0技术的人是更加前瞻性思维的商店,因此可能已经有流程来简化运营和增加吞吐量。我们并不完全肯定产品致力于我们的样本比“平均”离散制造,但我们不相信整体趋势应该受到这一点(即,从日常到日期的变化百分比应该相似高生产率样本与平均生产率样本)。这是因为假期,经济冲击等宏观级别因素,以及徒步旅行/离岸外包应该相对平等地影响高和低生产率的商店。这很重要,因为我们报告的整体利用水平略高,我们仍然可以看到非常明确的趋势,如假期,冠状病毒的影响,以及消费者整体的消费者需求的影响。

    此外,我们不会在美国占据美国机器使用的完美人口普查,因为它需要附加到所有300万+机床(300万个数字来自制造技术协会,这估计了这一点有320万个运营数控机床,原价超过50千万美元)。

    虽然我们确实渴望有一天能达到300万,但现在我们只能满足于这个总数的一小部分。我们没有透露确切的样本规模,因为我们对每台机器收取标准价格,这将揭示我们的年度经常性收入,这是我们规模的大多数初创公司不愿透露的数字,因为它在估值中扮演着关键角色。

    误差

    但是,我们确实包括误差的余量作为最佳实践,这通常是一个样本大小尝试在任何地方获得。错误的余量考虑了样本尺寸作为总人口大小的比例,以及对调查肯定地回应的受访者的百分比。在我们的情况下,对调查没有“肯定的”响应 - 我们可以理解100%的利用率意味着“每个人说是”和0%的意思是“每个人都说不”,但这是怀疑。因此,我们只需在计算中使用50%的肯定反应比例,这使得最大化的调查准确性最具保守措施的误差幅度最大化。您可以放心,我们报告的利润是赋予我们样本大小的最坏情况的情况。

    margin-of-error-finite-populations有限群体的错误公式的边缘。资料来源:Chegg作业帮助

    误差幅度越大,用户对调查结果的信心就越小。我们目前的误差范围在+-1.6%到+-1.8%之间。也就是说,我们有95%的信心,对于美国的全部300万台机床,实际利用率是我们报告的1.6%到1.8%。我们上一次报告的利用率数据是2021年3月6日的29.41%,这意味着我们认为,机床整体的实际利用率很可能在27.60%到31.21%之间。这意味着在错误边缘内发生的比较,就像在误差范围内的两种候选之间一样,应该用一粒盐来考虑,并谨慎接近。我认为我们在2016年选举周期中首次学到了这首第一手。

    例如,如果利用率从29.0%的变化到29.4%,则仍然在我们的错误边缘内,并且应该被认为是一个比事实更有趣。然而,如果这种变化持续许多日复日,利用率在一周内的跨度范围内的29%到31%,我们有95%的信心,这反映了人口级变化。In another embodiment, if it’s the Friday before July 4th and utilization changes from 29% to 25% on a day-to-day basis, it is also more than just a curiosity that this happened, but rather that it is reflecting the reality on shop floors across the United States (that people take off the Friday before July 4th to start the weekend early).

    +-1.6%至1.8%的数字本身也很重要。这是您应该为自己设置的缓冲,如果您正在根据行业规范对自己工厂的利用率进行基准测试。

    业界最新情况

    2021年3月利用率移动平均值

    从我们澄清错误的错误的精神,我们希望如下陈述利用:

    我们有95%的信心,通过昨天的每周滚动平均利用率为27.60%和31.21%,有一个点估计29.41%

    这反映了美联储的经济数据,表明该国的工厂需求因需求减少而飙升。我们认为这是过去四年3月6日利用率,这是一个非常令人难以置信的洞察力。

    这也代表了自2018年10月(41个月高)以来尚未超越的局部最大值。这条在1月份从58.7跳跃后几乎完美地与ISM的制造业的制造业指数达到了48个月高度的60.8点。由于制造业严重劳动力短缺的轶事报告,这些数据是证实的,因为工厂所有者在从亚马逊等人的竞争增加时争取工人。随着新的球员们来雇用熟练工人,店铺管理人员筹集了高达30%的工资,以竞争人才。

    我们通过参考Wall Street Journal中的播客来结束,这为我们的数据中看到了一些人类环境,为我们在数据中看到了什么:就业机会增加的地方

    总之,生意很好,几乎是太好了。请继续关注进一步的更新!

    使用机器数据开始驾驶决策。

    准备好授权你的车间?

    学到更多

    评论

    留下你的评论

    订阅我们的邮件列表