色块图

色块图的简介

色块图,由小色块有序紧凑的组成的图表。色块图的最大好处是,2 维画布上的空间利用率非常高。理论上小色块的大小是可以等于硬件像素的大小。想象一下,如果用每个像素直接编码数值,一块200px*200px的小屏幕,也可以最多编码40000子项!

所以色块图特别适合用于直接对数据量较大的、相对原始的数据进行分析。比如:生物基因科学领域,色块图常被用于微阵列数据分析。

另外,关于颜色的用法有两点需要强调一下:

  1. 如果是应对展示用的场景,数据量不大、颜色分类数量小于或等于7个,可以采用分类的颜色映射。
  2. 如果应对分析相关的需求,为了更有效率的使用色块图,我们建议使用连续(渐变)的颜色映射数值。由于人眼对颜色的分辨力有限,所以用于编码的颜色不宜过多,我们推荐的颜色的数量在 3~11 个之间。

英文:Heatmap

色块图的构成

图表类型色块图
适合的数据两个分类字段,一个连续字段
功能对比两个分类字段对应的数值大小
展示两个分类字段对应的数值分布
数据与图形的映射两个分类数据字段分别映射到横轴和纵轴,一个数值或分类字段映射到颜色。
适合的数据条数超过30条数据,不超过区域所含屏幕像素个数的数据量

色块图的应用场景

适合的场景

例子1: 适合应用到数据展示

下图是模拟的杭州地铁票价图。

说明:

  • 站名映射到了xy轴,以确定位置
  • 票价映射到颜色
  • 票价数据是模拟的,仅表示大概情况

例子2: 适合应用到简单的数据分析

2015年,全年股指的波动情况。

说明:

  • 将某月星期几映射到x轴,第几个星期映射到y
  • 股指映射到颜色,从绿到黄到红,表示股指从低到高
  • 月份进行分面

例子3: 适合应用到聚类分析

下图是用于基因芯片的聚类分析的分群色块图

说明:(令x轴基因片段为A组,y轴基因片段为B组)

  • 将A组基因名,映射到x轴,将B组基因名,映射到y
  • 将A组基因表达程度映射为红色,B组程度基因表达映射为绿色,基因的表达程度映射为亮度和饱和度
  • 通过算法将相似度高的基因分组,将关系画成树图

色块图与其他图表的对比

色块图和热力图

  • 数据类型上看:热力图是用两个连续字段确定数值点的位置,色块图是用两个分类字段确定数值点的位置。
  • 功能上看:热力图主要用于展示数据的分布情况,色块图在观察数据分布以外,还能进行列对比行对比

标签