词云
词云的简介
词云,又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。 词云的作用:
- 快速感知最突出的文字
- 快速定位按字母顺序排列的文字中相对突出的部分
词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果
英文名:Word Cloud
词云的构成
图表类型 | 词云 |
---|---|
适合的数据 | 两个代表坐标的连续数据字段(自动计算)、一个代表文字内容的分类数据字段、多个代表文字样式的分类数据字段如颜色、大小、旋转角度等(可选) |
功能 | 对比文字的重要程度 |
数据与图形的映射 | 两个连续数据字段映射到横轴和纵轴的位置、代表文字内容的分类数据字段映射到文字图形、多个代表文字样式的分类数据字段分别映射到文字图形的样式 |
适合的数据条数 | 超过 30 条数据 |
词云的应用场景
适合的场景
例子1: 对比大量文本 下图是根据某段时间内使用 G2 类库的网站对 G2 类库的请求量数据绘制的词云,从图中可以一眼看出访问量最大的网站。
site | pv |
---|---|
localhost | 27,50 |
g2.alipay.com | 2339 |
... | ... |
说明:
- 文本的坐标由词云布局工具自动计算
- 文本颜色和旋转角度由词云布局工具随机生成
- site 字段通过文字处理后映射到文本形状
- pv 映射到文本大小。
例子2: 使用图片做边界限制 结合图片可以绘制出特定形状的词云
不适合的场景
例子1:数据区分度不大 当数据的区分度不大时使用词云起不到突出的效果
例子2: 数据太少 数据太少时很难布局出好看的词云,推荐使用柱状图
词云与其他图表的对比
词云和柱状图
- 词云适合大量数据,柱状图适合少量数据
- 词云展示文字更为直观,柱状图需要借助坐标轴和刻度表示文字的分类和数据
- 词云可以映射更多分类字段在在文字样式上,柱状图只能映射一个分类字段在颜色上