准备授权你的车间?
了解更多由于调查,收集和报告此数据的时间,这显然具有其缺点 - 主职位“信息延迟”。结果是,市场运动与此数据的发布一致;由于需要等待公开的数据,股市往下下降,通常在月底或季度跳跃。
最近,通过开发有效代理,曾经有一种爆炸解决这些信息延迟并接收关键指标的实时更新。这些代理直接测量图像,文本和靠近我们试图测量实际指标的源头的图像,文本和传感指标。通常,数据本身比应用于它们的算法更有价值,这些算法通常在此目前商品化,并且可以用API调用。它是让原始数据本身,这是难以的一部分。一些例子是:
在MachinineMetrics,我们处于独特的位置,因为我们已经从数千台机床中获得了一系列的大型专有数据。我们直接捕获,匿名,汇总和总结有关利用的信息,从控制机器的控制有〜1s延迟;这是从工厂地板到我们服务器的信息所需的时间。
然而,了解如何以及在哪些上下文中的信息是有用的,这使我们与竞争对手相比。在这篇文章中,我们通过一些简单的统计技术结合域知识,提出了利基经济指标的有效月份预测因子。
探索性数据分析
我们首先需要检查我们的数据是什么样子的。从我们的数据库中,我们可以提取过去几年客户的利用模式。我们收集连接到的每台机器的正常运行时间/停机时间,并可以随时间推移利用这些信息梳理出趋势,确保我们的数据不会偏离现实太远。
让我们首先看一下随着时间的推移的日历情节,看看它是否通过了我们对制造业了解的一些“常识”测试。
从这个图中,我们可以清楚地看到数据证实了大部分行业知识人员假设制造。例如,
在一周中分组,我们可以看到另一个利用的看法,周末利用远低于平的利用率。
这里有一个有趣的是,这里的周末外,周一似乎有最低的利用率......
自相关的问题
应该指出的是,我们需要处理的问题自相关。在低频经济指标中,与联邦储备报告的那些,数据经常显示此属性。
虽然它可能听起来很复杂,但自相关只是意味着时间序列内的观察彼此相关。知道一个观察提供了有关其他观察的信息。在没有过于技术的情况下,这使得任何类型的预测或相关系数无效地无效,因此许多预测只能在数据中被包裹到数据中是一般的向上或向下趋势。例如,年度经济数据通常是自相关的。2018年的GDP将大量取决于GDP在2017年的地方。它非常不太可能偏离去年的地方。
为了减轻自相关,我们可以采用变化率时间序列。通过去除趋势分量,这种“不相关”观察该时间序列中的观察。以GDP为例,是一个例子,变化率GDP的增长与前一年发生的事情的关系要小得多 — 如果你在2017年有一个向上的年份,你不一定会在2018年或2019年有一个向上的年份。但2018年和2019年的绝对数字将接近2017年。
经济时序杂散相关问题
即使在核算自相关时,也仍然存在杂散的相关性。我们要避免的一件事正在与完全无关的东西与我们的利用数字相关联。通过低频数据(每月或年度),这尤其普遍。例如:
领域知识
我们还可以通过一些具体的域名知识来缓解一些问题。
在美国,跟踪两种类型的制造 - 耐用的制造和不耐用的制造。
耐用的制造主要适用于利用机床的离散制造商,该制造商是MachinineMetrics的客户群。
这为我们指明了正确的方向 — 以耐用制造业为中心的指标。但我们应该看哪一类具体的指标?
选择正确的指标
有许多与制造有关的指标,但一个特定的公制标准伸出。产能利用率。
能力利用衡量实际实现的潜在经济产出的比例。MachinineMetrics测量实际上实现的潜在工厂输出的比例,如机器的利用率所测量的。应该遵循的是,由于MachineMetrics的权力下降,这两者应该是高度相关的,尽管可能存在滞后因素。
能力利用,由美联储正式定义,是:
输出索引(季节性调整)除以容量索引。The Federal Reserve Board’s capacity indexes attempt to capture the concept of sustainable maximum output — the greatest level of output a plant can maintain within the framework of a realistic work schedule, after factoring in normal downtime and assuming sufficient availability of inputs to operate the capital in place.
关于“可持续最大输出”的最重要的网桥。这不是100%;它需要减少现实的工作时间表,以及正常计划的停机时间。由于MachinineMetrics始终安装在机器上,因此它不是对美联储措施的直接推论。因此,我们需要进行一些调整,我们将在下一节中涵盖。
探索数据分析II
首先,让我们来看看我们的原始利用数据看起来像什么。
现在,让我们采取改变率。
接下来,让我们使用相关图来比较耐用的容量利用措施对我们差异的内部利用数据。相关图显示了一对时间序列中的相关性程度。蓝色和更大的较暗,相关的越多,红色和更大的更暗,两个系列的反向相关。
嗯......没有看起来像是有任何强有力的相关措施,甚至似乎很多消极的相关性。这不会通过嗅探测试。让我们试着落后经济指标。这将使将当月的MobineMetics利用率与下一个月的容量利用进行比较。
哇,看起来更好。我们现在可以看到几种措施,我们与该系列具有重要关系。顶部系列似乎是Caputlg331s,这是主要金属货物的能力利用率。让我们互相举行两个。
仅仅绘制变化率可能不行。这是因为MachineMetrics的利用率比报告的容量利用率低约3倍,因此任何变化都会在我们的数据中放大。相反,我们应该绘制比例变化率图,将它们放在同一水平上。
啊,看起来非常好。那么这是什么意思?
解释和警告
我们表明,在有限的样本量下,我们能够相当准确地预测生产初级金属产品的机器的产能利用率的月前变化。客户利用率的1%比例变化预示着该cap util指标的~1%比例变化。在现实世界中,这意味着客户利用率的10%相对变化(22.2%到24.2%)预示着这一特定cap util指标的四分之一相对变化(68.5%到68.6%)。
主要金属商品是换成条形馈线等的原料金属条等。它有意义的是,如果工厂(我们的客户)耗费它们(通过利用率较少),生产者(我们的客户的供应商)会产生更少的人。
换句话说,机器商店的利用率下降意味着它们从初级金属商品生产商中消耗更少的输出,其降低的输出反映在较低的容量利用(Caputlg331s)中反映。
虽然有几个重要的考虑因素:
我们没有表明我们在这里有一个防弹指示,但我们将继续跟踪我们的相关性,因为这个类别似乎是一个很好的覆盖范围。
准备授权你的车间?
了解更多
评论