首頁 » 我们可以看到两个数据

我们可以看到两个数据

人类参与
在原始数据中,最明显的模式实际上是由质量较差的 我们可以看到两个数  列引起的:两个几乎完全相同的列随后会产生高相关性;或者列中有太多常量值或缺失值,等等。此外,我们可能会有一些具有明显关系的列,例如,因为它们测量的是同一个东西,但单位不同。这些模式的示例如图 6 和图 7 所示。

无论原因是什么

我们第一次可视化基于原始数据计算的统 手机号码数据 计数据时,结果可能会令人失望。这就是为什么仪表板处于 递归循环,如图5工作流程所示。

其工作原理是,我们可以迭代地删除由于某种原因不感兴趣的列。我们成为人机交互,并根据仪表板显示的内容迭代地选择应该保留哪些数据列,不应该保留哪些数据列。经过几次迭代后,我们将看到大量有趣的图表。我们现在需要做的就是坐下来,放松,让工作流 找到你的利基市场 程带我们进行单变量和多变量分析,并提取重要信息。

图 这两个可视化图

(堆叠直方图和条件箱线图)显示了数字列(DepTime)和 列的 WhatsApp 号码 高度相  分类列(delay_class)分布之间的关系。 子集如何呈现不同的分布。如果我们使用两个分类值“延迟”和“无延迟”对数据进行分区,我们可以使用方差分析检验来确认这一点。

返回頂端