桑基图

桑基图的简介

桑基图 (Sankey Diagram),是一种特定类型的流图,用于描述一组值到另一组值的流向。上图为1869年,查尔斯米纳德(Charles Minard)绘制的1812年拿破仑征俄图(Map of Napolean's Russian Campaign of 1812),这是一个在地图上覆盖桑基图的流程图。1898年爱尔兰人Matthew Henry Phineas Riall Sankey 在土木工程师学会会报纪要的一篇关于蒸汽机能源效率的文章中首次推出了第一个能量流动图,此后便以其名字命名为 Sankey 图,中文音译为桑基图。

图中延伸的分支的宽度对应数据流量的大小。桑基图的特点如下:

  • 起始流量和结束流量相同,所有主支宽度的总和与所有分出去的分支宽度总和相等,保持能量的平衡;
  • 在内部,不同的线条代表了不同的流量分流情况,它的宽度成比例地显示此分支占有的流量;
  • 节点不同的宽度代表了特定状态下的流量大小。

桑基图通常应用于能源、材料成分、金融等数据的可视化分析。

英文名:Sankey Diagram

桑基图的构成

图表类型桑基图
适合的数据节点数据集(可选),边数据集
功能观察节点关系
数据与图形的映射权重映射到节点和边的宽度
适合的数据条数10 条以上

桑基图的应用场景

适合的场景

数据的流向 桑基图即桑基能量分流图,也叫桑基能量平衡图。

例子1:下图为 2009 年美国能源产出的分布以及能源的用途和损耗图。从图中可以明显看出主要的能源浪费发生于发电和交通。

例子2:下图显示了 2050 年英国能源生产和消费的可能情景:左边节点表示能源供应方,右边节点表示能源需求方,中间节点是相关 的生产形式,并显示能量在消耗(或丢失!)之前如何转换和传输数据来源:d3

不适合的场景

  • 边的起始流量和结束流量不同:桑基图需要保持能量守恒,不能在中间过程创造出流量,流失(损耗)的流量应流向表示损耗的节点,所以每条边的宽度是保持不变的,需要改变边的宽度的数据推荐使用和弦图

桑基图图与其他图表的对比

桑基图和和弦图

  • 桑基图可以描述多级关系,按照层级给节点分类;和弦图不分层级,表示节点间的相互关联
  • 桑基图的边的权重保持不变;和弦图的边可以使用不同的初始权重和结束权重,宽度会有所变化

桑基图的扩展阅读

标签