Excel数据之美:科学图表与商业图表的绘制(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-30 20:14:45

点击下载

作者:张杰

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

Excel数据之美:科学图表与商业图表的绘制

Excel数据之美:科学图表与商业图表的绘制试读:

前言

本书主要介绍基于Excel 2016的科学图表和商业图表的绘制方法,首次引入R ggplot2、Python Seaborn、Tableau、D3.js、Matlab 2015、Origin等绘图软件的图表风格与配色方案,在无须编程的情况下,就能实现这些软件的图表风格;同时对比并总结了《华尔街日报》、《商业周刊》、《经济学人》等经典商业杂志的图表风格。在详细地介绍了基于Excel 2016的散点图、柱形图、面积图、雷达图等基本图表的绘制的同时,增加介绍了Excel 2016新增的图表、Excel加载项Map Power(地图绘制功能)和E2D3等的使用方法。特别需要说明的是,作者独立开发了一款与本书配套使用的Excel插件EasyCharts,可以实现颜色拾取、数据拾取、图像截取、图表风格美化、新型图表绘制、数据分析与可视化等功能。本书定位

目前市面上关于Excel图表制作类的书籍主要是介绍商业图表的绘制,而并没有介绍科学图表绘制的图书,如最为经典的商业图表制作类书籍:刘万祥老师的《Excel图表之道:如何制作专业有效的商务图表》、《用地图说话:在商业分析与演示中运用Excel数据地图》。科学图表的绘制相对商业图表来说,更加科学、严谨、规范。本书侧重介绍Excel科学图表的绘制,使其能应用于不同学科的数据可视化,同时也适用于商业图表的绘制。

目前市面上的Excel绘图教程都是基于2003、2007或2010版Excel进行介绍的,其中刘万祥老师的《Excel图表之道》和《用地图说话》是基于2003版Excel。而最新发布的Excel 2016添加了很多实用的绘图功能,如三维地图、箱形图、直方图和树状图,使得一些需要通过复杂操作才能绘制出的图表轻易就能够实现。本书基于Excel 2016介绍科学图表和商业图表的绘制方法、Excel 2016的绘图新功能等,值得一提的是,“三维地图”功能基本可以实现《用地图说话:在商业分析与演示中运用Excel数据地图》中的实例。

在实际的科学图表绘制中,工科学生一般使用Matlab、Origin和Sigmaplot,理科学生更多使用Python、R、D3.js,而Matlab、Python、R、D3.js等绘图软件需要编程才能实现绘图,学习门槛相对来说较高;Excel作为常用的Office软件,其绘图能力往往被低估,而其学习门槛相对较低、对图表元素的控制更加容易。本书总结了现有常用绘图软件的配色主题与绘图风格,介绍用Excel绘制科学图表和商业图表的方法,实现不同绘图软件的绘图风格,包括R ggplot2、Python Seaborn、Tableau、D3.js、Matlab等软件。读者对象

本书适合各类需要用到图表的高校学生和职场人士阅读,以及希望掌握Excel 2016图表制作的初学者阅读。从软件掌握程度而言,本书需要读者对Excel图表具有初级以上的掌握程度。阅读指南

全书内容共8章,第1章是后面7章的基础,后面7章都是独立章节,可以根据实际需求有选择性地学习。

第1章 分析并对比科学图表与商业图表的特点与区别,介绍专业图表制作的基本配色、要素与步骤;

第2章 介绍散点图系列,重点讲解散点图、曲线图和气泡图的绘制方法;

第3章 介绍柱形图系列,重点讲解二维柱形的绘制方法,包括柱形图和条形图;

第4章 介绍面积图系列,重点讲解二维面积图的绘制方法;

第5章 介绍雷达图系列,重点讲解雷达图、极坐标图、圆环图和饼形图的绘制方法;

第6章 介绍高级图表系列,包括Excel 2016新添加的箱形图、树状图、瀑布图等;

第7章 介绍地图图表系列,重点讲解加载项Map Power热度、气泡和分色填档地图的绘制;

第8章 介绍Excel加载项,重点介绍为本书专门开发的Excel插件EasyCharts的使用方法。应用范围

本书的图表制作方法综合参考Tableau、R ggplot2、Python Seaborn、D3.js、Matlab等绘图软件和多种商业杂志的绘图风格,所以本书介绍的绘图方法和配色方案既适用于科学图表,也适用于商业图表和多种商业杂志的绘图风格。适用版本

本书中的所有内容,均在Excel 2016版本中完成,大部分图表亦适用于Excel 2013,但箱形图、直方图、树状图等新图表功能只适用于Excel 2016版本。范例文件

本书配备有大量精彩的Excel范例源文件。其中包含了非常具体的操作说明,读者可以直接修改使用。

本书的一大特色就是配套开发的EasyCharts插件,插件与案例请登录http://easychart.github.io下载与学习。与我联系

因本人知识与能力所限,书中纰漏之处在所难免,欢迎及恳请读者朋友们给予批评与指正。如果您有使用Excel绘制的新型科学或商业图表,可以发邮件到我的个人邮箱,我们共同学习;如果您有关于Excel科学或商业图表绘制的问题,可以加群交流(QQ群:537263008)。另外,更多关于Excel图表绘制的教程请关注我的博客、专栏和微博平台。知乎专栏:https://zhuanlan.zhihu.com/EasyChartsE-mail邮箱:easycharts@qq.com致谢

一路风雨兼程!从2015年2月寒假开始,在实验室边学习研究,边利用闲余时间绘制图表,开始基于Excel 2013版本撰写本书,当时主要讲解科学论文图表的绘制。随着Excel 2016的发布,我又进一步学习Excel 2016的新功能。到2016年2月,在潘淳(网名:儒道佛,PPT动画大师)的引领下,开始学习C#并编写Excel插件——EasyCharts。2016年4月与电子工业出版社签订约稿合同后,学习并添加商业图表的绘制方法。这一路走来,我也是边学习、边总结,边写作。2016年5月,书稿撰写完毕,插件EasyCharts 1.0发行,我的Excel绘图学习也暂时告一段落。

一路贵人相助!很感谢江南大学纺织技术研究室给我提供的学习环境;很感谢潘淳师父的耐心指导;很感谢杨建敏学长的帮助与建议,尤其是热力地图章节;很感谢电子工业出版社的石倩老师对书稿的肯定与建议。今天亦是杨绛先生去世的日子,很喜欢钱钟书与杨绛先生这对伉俪,最后以先生的一句话与诸位共勉吧:你的问题主要在于读书不多而想得太多。作者2016年5月25日第1章Excel图表制作基础篇1.1 什么是科学图表与商业图表

国内有两本关于Excel绘图指导的经典书籍:刘万祥的《Excel图表之道:如何制作专业有效的商务图表》和《用地图说话:在商业分析与演示中运用Excel数据地图》。这两本书确实不错,绘图效果很好,但是其主要介绍商业图表的制作。其中很多图表参考了《华尔街日报》、《商业周刊》、《经济学人》等经典杂志的图表,如图1-1-1所示。图1-1-1 不同杂志的经典图表案例

科学图表与商业图表有一定的差别,其中科学图表以科学论文图表最为常见。优秀的科学论文图表可以参考Science和Nature等顶级期刊,如图1-1-2所示。所谓一图抵千言(A picture is worth a thousand words)。图表是科学论文中不可缺少的表达方式,图表设计是否精确和合理直接影响论文的质量。图表是期刊评审过程中仅次于摘要的关键一环,正确而美观的图表能促进审稿人和读者对论文内容的快速理解。图1-1-2 不同杂志的经典图表案例

商业图表与科学图表的对比如图1-1-3和图1-1-4所示。图1-1-3 同一数据不同绘制风格的曲线图图1-1-4 同一数据的不同绘制风格的柱形图

图1-1-3(a)和图1-1-4(a)是商业图表的表现形式,其图表基本元素的设定较为自由,因为商业图表可以彩印,数据系列的区分主要体现在颜色上,(图1-1-3(a)折线图来源于《华尔街日报》;图1-1-4(a)柱形图来源于《商业周刊》)。

图1-1-3(b)和图1-1-4(b)是彩色科学论文图表的表现形式,其图表基本元素的设定较为规矩和简单,数据系列的区分一般体现在颜色或者数据标签上。

图1-1-3(c)和图1-1-4(c)是黑白颜色的科学论文图表。国内大部分的期刊是没有彩印的,所以其往往要求投稿论文图表为黑白颜色。因此,数据系列的区分主要体现在数据标签上。当数据系列数目不多时,也可以使用颜色区分。

商业图表主要特点有:专业的外观、简洁的类型、明确的观点和完美的细节。相对于商业图表,科学论文图表首先要规范,符合期刊的投稿要求,然后在规范的基础上使图表变得美观和专业。在当前贯彻科技论文规范化、标准化的同时,图表的设计也应规范化、标准化。因此,科学论文图表的制作原则主要是规范、简洁、美观和专业:

②简洁:科学论文图表的关键在于简单明了地表达数据信息。如果图表的信息过于繁杂,会使读者难以理解图表所要表达的主要信息。Robert A. Day在How to write and publish a scientific pape书中指出,Combined or not,each graph should be as simple as possible(不论组合与否,每张图应该尽可能地简洁)。如果一张论文图表包含的数据信息太多,反而会使读者难以理解图表所要表达的数据信息。

③美观:良好的审美能力是做好图表的重要条件。审美是指论文图表要简单且具有美感。图表的配色、构图和比例等对于图表的审美尤为重要。

④专业:图表类型的选择是做好图表的关键条件。专业就是指图表要能准确而且全面地反映数据的相关信息。当你的审美达到了可以使图表美观的时候,要想让你的图表表达更加清晰和专业,图表类型的选择就尤为重要。

总而言之,不论是商业图表还是科学图表,它们的共有原则是简洁、美观和专业。最大区别在于科学论文图表的规范化与标准化。商业图表可以为了达到清晰而美观表达,调整图表中的所有元素,包括坐标轴、图表标题、数据标签等。1.2 为什么选择Excel绘制图表

大家似乎都觉得在专业图表的制作过程中,软件的选择极为重要。“知乎”上有一个关于科学论文图表制作软件的帖子(2015.09.19)。当有人问用哪款软件能在画出漂亮的专业图表时,网友们给出了各种各样的答案(http://www.zhihu.com/question/21664179)。现将原问题和呼声较高的答案摘抄如下:

题主:经常看到别人在论文中画出各种绚烂的插图,我想知道这些图都是用一些什么样的软件画出来的。用什么样的软件比较合适呢?具体答案可以拓展到更为广远的制图领域。

高手1(赞同3403票):Python的绘图模块matplotlib:Python plotting。画出来的图真的是高端大气上档次,低调奢华有内涵,适用于从2D到3D,从标量到矢量的各种绘图。能够保存成从eps、pdf到svg、png、jpg的多种格式。并且Matplotlib的绘图函数基本与Matlab的绘图函数名字差不多,迁移的学习成本比较低,而且开源免费。

在Python的面积图中,精致的曲线、半透明的配色,都显出你那高贵冷艳的格调;最重要的是只需一行代码就能搞定。从此以后再也不用忍受Matlab以及GNUPlot中那糟糕的配色了。想画3D数据?没有问题(不过用Mayavi可能更方便一些)。

还有,Matplotlib还支持Latex公式的插入。如果再搭配上Python作为运行终端,简直就是神器啊!心动不如行动,还等什么!

高手2(赞同816票):我喜欢用Mathematica画图,默认出图漂亮,自定义性能好,支持常见各种类型的图表,能导出丰富的格式,动态交互和制作动画也很强大,还有一点:Mathematica的语法和数学上的习惯更接近,函数或方程作图只需输入表达式和范围即可,Matlab和Python中一般需要先手动离散化。

Matlab的可视化也很强大,不过被吐槽较多的一点是线条有锯齿(这个和取的点多少无关,其实也能消掉)(http://tieba.baidu.com/p/2087817806),三维绘图色调不好看,当然如果有耐心也可以画出漂亮的图形。

Python的matplotlib库我也用过,风格是模仿Matlab的,就默认绘图来说比Matlab好看(起码没锯齿),好处楼上已经有人说过了,但是并非没有缺点,使用Matplotlib需要一点编程和Python基础,对于编程基础不好的同学来说入门会比其他软件慢一点;Matplotlib的二维绘图效果很好,但是三维绘图目前还比较差,各种绘图细节方面的可选项不算很丰富,不支持隐函数绘图(形如f(x,y,z)=0这种),性能也不好(如3D的Scatter,大概1万个点就开始卡了,Mathematica和Matlab10万个点都不算卡),三维的用Mayavi这个库可能更好。

普通函数绘图只需输入表达式及取值范围,真正的一行代码。Mathematica不仅支持Latex,还能直接写二维的公式及把公式导出为Latex。

高手3(赞同2100票):大家都理解错了嘛。楼主问的是论文里怎么才能画出精美的插图。顶在最前面的Python、Matlab等软件虽然能准确画各种常见图,但是从美术角度来看不及格好吗!最让人吐槽的就是这俩的配色!看看直方图那丑陋的配色!函数图难看的等高线!一点都不精美!要比高端大气上档次,本页所有答案完全不是R的ggplot2包的对手。以前我也用Matlab,自从遇到ggplot2之后就彻底成为“脑残粉”了!

ggplot2是R的一个包,画图风格相当文艺小清新。看论文看到用ggplot2画图都是一种享受。极为擅长于数据可视化。可惜ggplot2功能没有Python或者Matlab全面,画不出稀奇古怪的电路图,不支持三维立体图像。不过作为一个统计绘图软件,那些功能也不算很重要啦。

ggplot2有一个最大的特点是引入了图层的概念,各位用过Photoshop应该能理解吧?你可以随心所欲地将各种基本的图叠加起来显示在一张图上,构造出各种各样新奇的图片。先来一个最基础的散点图,这是不调颜色软件包默认的配色。灰色的背景,黑色的小点点。拟合曲线和置信域看着就很舒服。来看看直方图,和傻大黑粗的Matlab相比精致秀气多啦!还有精致的半透明效果!折线图画得美到极致了。ggplot2能把密密麻麻的散点图画得极具美感,彻底治愈密集恐惧症!

总的来说,在科学图表的制作方面,Python、Matlab、Mathematica或R是比较主流的软件。大家只看到关于这四款软件的文字描述,无法从视觉上体会到它们的差异。图1-2-1是基于相同的数据,分别应用Python、Matlab和R软件绘制的散点图。图1-2-1 不同软件绘制的散点图

图1-2-1(a)就是在Python语言Matplotlib中使用半透明的配色,显示出高手1所说的那种高贵冷艳的风格。Python为了进一步提升绘图能力,还开发了prettyplotlib和seaborn两个绘图包。seaborn的绘图风格和R语言的ggplot2很类似。

图1-2-1(b)是使用Matlab 2013a经调整和修饰展现的散点图,而Matlab 2014b推出了全新的Matlab图形系统。被大家“吐槽”的线条、锯齿和丑陋的默认颜色也得到了改进,全新的默认颜色、字体和样式使图表更加美观。抗锯齿字体和线条使图形看起来更平滑。

图1-2-1(c)是使用R语言ggplot2包绘制的散点图,灰色背景和白色网格线的搭配给人清新亮丽的感觉。但如高手3所说,R语言并不能很好地展示三维立体图,这也是它最大的缺陷。

不管这三款软件的绘图效果到底如何,其共有的特点就是它们都需要编程才能实现画图功能。对于大部分没有编程基础的学生来说,这是一个很大的绘图障碍。但请你不要担忧,有一款平凡的软件可以完美呈现这些图表的效果,但又不需要编程基础,它就是众所周知的Excel。

使用Excel 2016模仿图1-2-1绘制的散点图,如图1-2-2所示。读者可以对比一下,Excel的绘图效果是不是几乎与这三款软件展示的效果一样。在绘制二维图像方面,我觉得Excel是当之无愧的屠龙宝刀,它不仅能绘制出各种软件所展示的图像效果,也能通过自己控制所有的图表元素。图1-2-2 Excel模仿不同软件的散点图

其实,在数据可视化领域有许多优秀的图表工具,包括Excel、Python、Matlab、Mathematica、R、Tableau、D3.js等。在本书中,Excel绘制图表的方法与配色都会借鉴这几款软件。Python、R、Tableau和D3.js的图表风格和配色效果各有各的特点,值得深入学习并应用到Excel图表的制作中。

Tableau是桌面系统中最简单的商业智能工具软件之一,Tableau没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。我个人觉得,这是一款功能超级好用、效果超级美观的图表绘制软件。可惜是一款商业软件,需要付费才能使用。另外,它主要应用于商业数据的分析与图表制作。

D3.js是最流行的可视化库之一。D3.js通过使用HTML、SVG和CSS,帮助你给数据带来活力,重视Web标准为你提供现代浏览器的全部功能。D3.js是一款专业级的数据可视化操作编程库,基于数据操作文档JavaScript库。所以它也需要编程才能实现,而且编程比Matlab、R和Python更麻烦。

使用D3.js的d3.layout.cloud.js绘制数据可视化软件的标签云(Tag Cloud),如图1-2-3所示。不知道你认识或熟悉的数据可视化软件有几款。但是这些并不重要,你只要会使用Excel就足以解决一维和二维数据的可视化需求。图1-2-3 数据可视化软件的标签云1.3 图表的基本配色

不论是商业图表还是科学图表,图表的配色都极其关键。图表配色主要有彩色和黑白两种配色方案。刘万祥老师曾提出:普通图表与专业图表的差别,很大程度就体现在颜色运用上。

对于商业图表,专业的图表制作人员可以根据色轮,实现单色、类似色、互补色等配色方案。而普通大众,则可以参考《华尔街日报》(The Wall Street Journal)、商业周刊(Business Week),以及《经济学人》(The Economist)等商业经典杂志的图表配色。现在出版的Excel绘图类书籍也都会以这些杂志的图表为案例或模板,讲解商业图表的绘制。

对于科学图表,大部分国内的期刊一般要求论文图表是黑白配色;国外大部分的期刊允许图表是彩色的。科学论文图表基本是按照Author Guidelines的要求来制作,最大的区别在于色彩的运用,优秀的图表配色能够给人一种赏心悦目的感觉,更能激起读者对文章内容的兴趣。1.3.1 Excel的默认配色

Excel 2013以上版本引入了“颜色主题”的概念。通过“页面布局”→“主题”→“颜色”,可以看到很多种颜色主题,如图1-3-1(a)所示。我们可以通过“颜色主题”全局改变Excel中字体、单元格、图表等对象的配色,该功能类似于某些软件中的换肤功能。

如图1-3-1(b)所示,选择“自定义颜色”,就会弹出“新建主题颜色”对话框,可以自定义颜色主题。需要时可通过颜色面板快速调用。图1-3-1 Excel 2016的默认配色方案

Excel 2016绘图默认配色就是如图1-3-1(a)所示的“自定义1”颜色主题,如图1-3-1(c)中淡蓝色方框所示。其实,在图1-3-1(c)的颜色主题中,有许多衍生的颜色主题,包括彩色和单色两种类型供选择。利用图1-3-1(c)的颜色主题绘制的散点聚类图,如图1-3-4所示。1.3.2 Excel的颜色修改

在Excel中选择“开始”选项卡中“字体”组中的“”按钮,我们可以看到Excel的颜色模板及其修改入口,如图1-3-2(a)所示。颜色模板部分包括“主题颜色”、“标准色”和“最近使用的颜色”,“主题颜色”就是通过颜色主题类型来控制和改变的。选择底部的“其他颜色”,可以弹出如图1-3-2(b)所示的“标准”颜色选项卡和如图1-3-2(c)所示的“自定义”颜色选项卡(“颜色”对话框)。图1-3-2 Excel的颜色修改

在“标准”选项卡中,我们可以选择很多预设的颜色,但是一般很少使用。在“自定义”选项卡中,我们可以通过输入特定的RGB值来精确指定颜色,这里就是我们用来突破默认颜色的地方(说明:计算机一般通过一组代表红、绿、蓝三原色比重的RGB颜色代码来确定一个唯一的颜色,RGB的取值范围都是属于[0,255])。任何颜色都可以通过RGB调配出来,所以我们只要得到一种颜色的RGB数值,就可以把这种颜色还原出来。1.3.3 Excel专业图表的配色突破

R语言中的ggplot2绘图精美的一个重要原因就是它清新亮丽的灰色背景配上赏心悦目的数据系列颜色。它的配色确实让很多软件都汗颜,所以Python语言在Matplotlib包的基础上设计了prettyplotlib和seaborn包,专门用来仿制ggplot2的绘图风格。Matlab也不甘落后,在Matlab 2014版上对绘图配色方面做了很大的改进。

图1-3-3显示了R语言ggplot2包、Tableau软件、Python语言seaborn包、D3.js中的部分常用配色方案。赏心悦目的配色方案远远不止这些,但是我们只要掌握并熟练运用1到2种完美的配色方案,就已经能满足平常的图表绘制需求了。在这里跟大家推荐两本关于ggplot2的经典书籍:ggplot2 Elegant Graphics for Data Analysis和R.Graphics.Cookbook。图1-3-3 常用数据可视化软件中部分配色方案的RGB值1. R语言ggplot2包的官网:http://docs.ggplot2.org/curren/;http://

www.cookbook-r.com/Graphs/Colors_(ggplot2)/2. Tableau软件的官网:http://www.tableau.com/learn/gallery3. Python语言seaborn包的官网:http://web.stanford.edu/~

mwaskom/software/seaborn/tutorial/color_palettes.html4. D3.js的官网:http://d3js.org/

使用Excel默认颜色绘制的系列图表如图1-3-4所示。根据1.3.1节介绍的Excel颜色修改方法,利用R ggplot2 Ste1、Set2和Tableau 10 Medium配色方案对图1-3-4的颜色进行修改调整后的效果,分别如图1-3-5、1-3-6和1-3-7所示。通过对比发现,ggplot2和Tableau的颜色方案确实不错!图1-3-4 Excel 2016默认配色主题图1-3-5 R语言ggplot2 Set1配色主题图1-3-6 R语言ggplot2 Se3配色主题图1-3-7 Tableau软件Tableau 10 Medium配色主题1.3.4 Excel图表的颜色拾取

从优秀绘图软件上的成功图表案例借鉴其配色方案和思路,是一种非常保险和方便的办法。因为它们的颜色是经过专业人士精心设计的,尤其是商业图表的模仿与绘制。本书配套开发的Excel插件“图表”中自带“颜色拾取”功能,如图1-3-8所示,拾取《商业周刊》上图表的颜色。“颜色拾取”功能的使用非常简单。单击“颜色拾取”按钮运行程序后,将鼠标定位在图表的某个颜色上,软件就会返回那个颜色的RGB值。按下鼠标右键锁定颜色,可以使用鼠标复制单元格中的RGB值。图1-3-8 运用“颜色拾取”功能取色实例

使用颜色拾取方法从经典商业杂志的图表上拾取颜色方案,包括《华尔街日报》(The Wall Street Journal)、《商业周刊》(Business Week)及《经济学人》(The Economist)等,如图1-3-9所示。背景颜色是指绘图区和图表区的背景填充颜色。对相同的数据使用Excel仿制的不同杂志风格的柱形图,如图1-3-10所示。图1-3-9 经典商业杂志部分配色方案的RGB值图1-3-10 Excel仿制的不同杂志风格的柱形图●《 华尔街日报》的配色方案从色彩学的角度来说属于互补色,有

较强的对比效果。除了主色调,还有作为陪衬的浅色,RGB值

分别为:浅红(250,190,175)、浅绿(170,213,155)、

浅蓝(216,223,241)。●《 商业周刊》的配色方案风格②使用白色背景,大量使用鲜艳的

颜色,整张图表具有很强的视觉冲击力;配色方案风格①使用淡

蓝色或灰色背景,使用强烈的补色,可以让读者轻易区分不同的

数据系列。●《 经济学人》的图表基本只用一个色系,或者做一些深浅明暗的

变化;当数据系列增多时,会增加深绿色、深棕色等颜色。1.4 图表的基本要素

对于Excel的使用,我个人首先推荐使用Excel 2007以上的版本。Microsoft Excel 2003和WPS Excel的绘图功能太差,不推荐使用。本书讲解的Excel绘图操作都是在Excel 2016中完成。要在Excel中创建一个图表,先要将数据设定好布局,接着选中需要作图的数据区域,然后选择“插入”选项卡中的“图表”组中需要的图表类型,就可以生成基本的图表构造。1.4.1 科学图表的基本元素

Excel图表提供了众多的图表元素,也就是图表中可以调整设置的最小部件,为我们作图提供了相当的灵活性。图1-4-1显示了常见的图表元素,下面以科学论文图表的要求讲解图表的基本元素:

① 图表区(Chart Area):整个图表对象所在的区域,它就像是一个容器,承载了所有的图表元素及你添加到它里面的其他对象。

② 网格线(Grid Line):包括主要和次要的水平、垂直网格线4种类型,分别对应y轴和x轴的刻度线。在折线和直方图中,一般使用水平网格线作为数值比较大小的参考线。

③ 绘图区(Plot Area):包含数据系列图形的区域。绘图区的背景颜色是可以改变的,在Python中绘图区的背景颜色为RGB(234,234,242);在Matlab中绘图区的背景颜色为RGB(255,255,255);在R中绘图区的背景颜色为RGB(229,229,229)。这也是这三款绘图软件的不同之处。

④ 轴标题(Axis Label):对于含有横轴、纵轴的统计图,两轴应有相应的轴标,同时注明单位。字体有时也会有要求,例如字体要求为8号Times New Roman。

⑤ 坐标轴(Number axis):数轴刻度应等距或具有一定规律性(如对数尺度),并标明数值。横轴刻度自左至右,纵轴刻度自下而上,数值一律由小到大。

⑥ 图表标题(Chart Title):标题一般位于表的下方。Figure()可简写为“Fig.”,按照图在文章中出现的顺序用阿拉伯数字依次排列(如Fig.1,Fig.2……)。对于复合图,往往多个图共用一个标题,但每个图都必须明确标明小写字母(a,b,c等),在正文中叙述时可表明为“Figure.1(a)”。

⑦ 数据标记(Data Marker):根据数据源绘制的图形,用来形象化地反映数据,是图表的核心。有时,如果数据类型较多时,需要使用不同的数据标记进行区分。

⑧ 图例(Legend):图中用不同线条、标志或颜色代表不同数据时,应该用图例说明,图例应该清晰易分辨。图1-4-1 图表的基本元素

另外还有三个比较重要的图表元素,主要是与数据分析有关。

⑨ 误差线(Error Bars):根据指定的误差量显示误差范围。通常用于统计或实验数据,显示潜在的误差或相对于系列中每个数据标志的不确定程度。

⑩ 趋势线(Trend Line):对于时间序列的图表,选择“趋势线”的选项,可以根据源数据按回归分析方法绘制一条预测线,同时可以显示R系数、R2系数和p值等。

⑪ 涨/跌柱线(Increase/Drop Line):涨/跌柱线只在拥有至少两个系列的二维折线图中可用。在股价图中,涨/跌柱线(有时也称为烛柱图)把每天的开盘价格和收盘价格连接起来。如果收盘价格高于开盘价格,那么柱线将是浅色的。否则,该柱线将是深色的。

其实,你只要改变Excel的图表元素,就可以创造出很多不同形式的图表,所以这也是Excel区别于其他可视化编程软件的优势。通过修改图表元素,可以创造符合各种场合的图表。

在相同的R ggplot2风格的绘图区背景,使用不同的数据系列格式,可以得到不同效果的散点图,如图1-4-2所示。图1-4-2 不同格式的数据系列的散点图● 图1-4-2(a)一般用于展示单数据系列;● 图1-4-2(b)一般用于展示黑白风格的多数据系列图表,主要通

过数据标记的类型区分数据系列。Excel中数据标记类型主要有

菱形◇、圆形〇、方形□、三角形△、十字形+等;● 图1-4-2(c)和1-4-2(d)一般用于展示彩色风格的多数据系列

图表,可以通过数据标记的类型或颜色区分数据系列。Excel图

表的颜色尤为重要,可以参考图表1-3-1的配色主题方案;● 图1-4-2(e)和1-4-2(f)很少用于科学论文图表中散点图的数

据展示,但是在商业图表中使用较多。Excel可以为数据点添加X

值、Y值、系列名称及自定义数据标签。

在相同的数据系列格式,使用Excel仿制不同绘图软件风格的绘图区背景,可以得到不同效果的散点图,如图1-4-3所示。图1-4-3 不同格式的绘图区背景设计的散点图● 图1-4-3(a)是R ggplot2风格的散点图,使用R ggplot2 Set3的

颜色主题,绘图区背景填充颜色为RGB(229,229,229)的灰

色,以及白色的网格线[主要网格线的颜色为RGB(255,

255,255),次要网格线的颜色为RGB(242,242,242)];● 图1-4-3(b)是Python Seaborn风格的散点图,绘图区背景填充

颜色为RGB(234,234,242)的灰色,以及RGB(255,255,

255)的白色的主要网格线(无次要网格线);● 图1-4-3(c)是Matlab 2013风格的散点图,绘图区背景填充颜色

为RGB(255,255,255)的白色,以及灰色RGB(239,239,

239)的主要和次要网格线。● 图1-4-3(d)是使用不同灰色的网格线,主要网格线为0.75磅的

RGB为(191,191,191)的灰色实线,次要网格线为0.75磅的

RGB为(217,217,217)的灰色实线,绘图区背景填充颜色为

RGB(255,255,255)的白色;● 图1-4-3(e)使用RGB(239,239,239)的灰色“长画线”类

型的主要和次要网格线,线条宽度为0.75磅,绘图区背景填充颜

色为RGB(255,255,255)的白色;● 图1-4-3(f)删除主要和次要网格线,绘图区背景填充颜色为

RGB(255,255,255)的白色,适合在图表尺寸较小的情况下

演示数据。所以这种图表风格经常被用于科学论文图表中。1.4.2 科学图表的规范元素

虽然不同的杂志或期刊对图表的要求有所不同,但是总的图表规范元素一般包括①坐标轴(Number Axis);②轴标题(Axis Label)(包括单位);③图表标题(Chart Title)、⑧图例(Legend);⑦数据标签(Data Label)等,这些图表的元素在科学图表中必不可少。使用R ggplot2绘制的图表基本能满足杂志或期刊的图表规定和要求。

在Science和Nature等科学杂志或期刊中,科学论文图表的模式一般如图1-4-4所示。两者最大的区别就是有无绘图区的边框,图1-4-4(a)为无边框,图1-4-4(b)为有边框。图1-4-4 科学论文图表的常见风格1.4.3 商业图表的基本元素

相对于科学论文图表固定的格式,其实《华尔街日报》、《商业周刊》、《经济学人》等商业杂志或期刊也形成了相对稳定的格式,如图1-4-5所示。图1-4-5 商业图表范例(图表来源:华尔街日报)

① 主标题:标题区非常突出,往往占到整个图表面积的1/3甚至1/2。特别是主标题往往使用大号字体和强烈对比效果,可以让读者首先捕捉到图表要表达的信息。

② 副标题:副标题区往往会提供较为详细的信息,使用比主标题小一半的字号。

③ 绘图区:绘图区为数据的可视化区域,绘图区的风格可以参考专业的商业图表绘制,主要体现在配色方案的选择上。

④ 脚注区:脚注区一般使用Sources(数据来源)表明图表数据的来源。

⑤ 图例区:图例区位于副标题与绘图区之间,主要用于数据系列的标注与区分。但是有时候会在绘图区中直接标注于数据系列上。

其实,商业图表与科学图表不仅在图表元素布局上有所区别,在字体的选择上也有不同。常用字体类型的特点与选择如图1-4-6所示。Excel自带的字体类型可以分为衬线字体(Serif)、无衬线字体(Sans serif)和修饰性字体(Ornamental)三种。其中,无衬线字体和衬线字体的主要区别是:衬线字体在字的笔画开始及结束的地方有额外的钩写笔画,而且笔画细线会因笔画方向的不同而有所不同;无衬线字体没有类似额外的钩写笔画,且笔画粗细大致相同。通过对比发现,衬线字体比无衬线字体更易读,更适合篇幅较长的文字描述;而无衬线字体更加醒目,更适合应用在文字描述较少的地方。图1-4-6 常用字体类型的特点与选择

所以,科学图表更喜欢使用衬线字体:数字和字母一般选用Times New Roman字体,汉字一般选用宋体。商业图表更喜欢使用无衬线字体:数字和字母一般选用Arial或Tahoma字体,汉字一般选用黑体或微软雅黑。1.5 图表绘制的基本步骤

在Python、Tableau、Matlab、Origin、D3.js等众多绘图软件中,R ggplot2无疑是一维和二维数据方面绘图效果最完美的软件,只是由于需要编程导致学习门槛较高。R ggplot2的绘图既可以直接适用于商业图表,又可以适用于科学图表。所以,本书将使用Microsoft Excel 2016作为绘图软件,以R语言ggplot2包的绘图风格为科学图表制作的重点讲解类型,同时会展示模仿Rython Seabron、Matlab等其他数据可视化软件的绘图效果,另外,会在章节中穿插商业图表与科学图表的对比展示。

本节通过如图1-5-1的散点图,讲解Excel模仿R ggplot2图表的基本步骤。图1-5-1为使用R语言ggplot2包自动生成的单数据系列散点图,下面将使用Excel 2016完成对图1-5-1的仿制。图1-5-1 ggplot2包自动生成的散点图

第一步:生成默认数据图表

打开Excel 2016,以A2:B337单元格区域为数据源作散点图(原始数据可参考本书相关案例文件,第A列为x坐标轴数据,第B例为y坐标轴数据)。得到默认样式的图表,进行一些简单的格式化:删除图表标题等。此时得到的图表如图1-5-2(a)所示。图1-5-2 Excel散点图仿制过程

第二步:对坐标轴进行调整(1)双击y坐标轴数值,将“线条”设置为“无线条”选项,设定“坐标轴选项”的边界为0~3500,主要单位为1000,次要单位为500。(2)选中y坐标轴数值,将字体设定为9号“Times New Roman”(不同的期刊有不同的字体要求)。(3)单击“添加图表元素”中的“轴标题”或图表右上角的

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载