|
Post by account_disabled on Apr 24, 2024 4:35:19 GMT -5
这种方法得出的图看起来像此可视化数据。立即出现一个问题即该图像中没有中心趋势或缺乏中心趋势的度量。如果一个以上的页面对具有与由旧指纹和测量的相同差异则绘图软件将简单地将第二个红点精确地放在第一个红点上。依此类推得出第三十分之一甚至数千个相同的数据点。解决此问题的一种方法是根据点代表多少页对对点进行不同的着色。因此如果我们使用与在同一点上绘制点的次数相对应的光波长选择颜色会发生什么情况。 此策略为我们提供了一个带有红色的图长波长表明大多数数据点向下穿过橙黄 墨西哥电话号码 色绿色蓝色而紫罗兰色真正洋红色仅代表一个或两个值线性数据可视化多么令人失望几乎没有完全改变。但是如果仔细观察您会在洋红色海中看到一些蓝点最重要的是最左下角的点是红色代表所有实例中数量最多。这里发生的是红点代表的计数比所有其他计数高得多以至于它与代表最低数字的大多数其他颜色最终未使用。解决方案是分配颜色以使大多数颜色最终用于编码较低的计数并随着计数的增加逐渐分配较少的颜色。 或用数学术语根据对数标度而不是线性标度分配颜色。如果这样做的话我们最终会得到以下对数数据可视化。现在正逐渐普及。数据范围很广数据也存在中心趋势。显而易见的一件事是尽管从理论上讲用测量的差异可以达到最大值但实际上很少会超过最大值的四分之三。相反使用指纹差异许多页面可以达到图形右侧所有红色和橙色点的见证者的最大可能差异。请记住那些红色和橙色点代表了很多因为颜色标度是对数的。我们必须最小心的地方是事情的最底层。这表示值该值指示非常相似的页面对。
|
|