词云图(word cloud graph),理学-统计学-描述统计-数据及数据类型,运用文字大小和词组位置表示词频及其重要性,呈现文本主旨,展示文本关键信息的图形。又称文字云图。在词云图出现之前,传统纸质地图已使用不同大小、或粗细的文字表示城镇的相对面积或重要性。在英文出版物里,2009年3月24日,美国有线电视新闻网(CNN)为当晚的安德森·库珀360°(Anderson Cooper 360°)节目制作了一个当时世界上最大的词云图,文字云内容来源于当天美国总统B.H.奥巴马(Barack Hussein Obama)对新闻界发布的声明。词云图的绘制方法如下:①对已有文本提取词组。②统计词组频数,依据频数大小对词组进行排序。③选择文字的字体字号和图形外框,依据频数高的词组位于中心且文字大的原则绘制词云图。一个纯文本文件可以看作一种特殊类型的数据,例如,阅读一篇文章、浏览网络文献等,看到的就是文本文件。如果关心一篇文章中哪些词出现得多,网络文献中的热词是什么,就可以使用词频进行分析。词云图通过提取文本中词组,运用文字大小和词组位置表示词频及其重要性。