数据可视化分析:Tableau原理与实践(全彩)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.1 Prep Builder基础操作

Desktop胜在可视化和业务决策,而Prep Builder却帮助我们节约时间和提高效率。2019年之前,Prep Builder还是本地化的数据整理工具,如今借助Tableau Data Management服务器组件,Prep Builder的流程也可以在服务器端自动化运行并设置计划,进一步提高了中大型企业的处理效率。

打开Prep Builder中自带的超市流程案例,如图3-1所示,Prep Builder主界面由数据连接、流程面板和数据预览面板多个功能区组成。

图3-1 Prep Builder软件的主要功能区域

其中,上方的“流程面板”是Prep Builder的关键,流程是由节点前后连接组成的。节点分为不同的类型,用不同的图标表示,如图3-2所示,代表本地数据源,代表数据整理和清理,代表并集,代表连接(Join),代表聚合,代表转置,则代表输出。

图3-2 Prep Builder中各种图标的功能

数据整理通常是多步骤操作,多个节点组成先后相续的流程。根据分析的需要,可以在每个节点的前、后、双节点中间增加节点,非常方便,如图3-3所示。

图3-3 Prep Builder在任意环节快速添加节点

选择任意一个节点,默认打开下面的配置窗格,配置窗格随着类型的不同而不同,在“连接”节点可以设置连接字段,在“聚合”节点可以设置聚合字段。如图3-4所示,Prep Builder 2019版本新推出的“数据预览窗格”和“列表窗格”,有助于查看数据结果和针对标题进行二次清理。

图3-4 Prep Builder多种数据窗格

总结多年使用Prep Builder的经验后,笔者有如下几条建议。

● 主流程保持在一条水平线上,特别是在多次连接时,以避免混乱;

● 数据清理环节,特别是字段筛选、数据筛选、字段重命名、更改数据类型等,应尽可能优先处理,有助于减少重复操作,提高数据处理性能;

● 任意节点都可以用鼠标右击更改节点颜色(见图3-2),通过节点的颜色辨别数据并集、数据连接的字段来源;

● 节点名称应该清晰,将特别的节点整理说明添加到“说明”中,有助于数据模型的重复使用;

● 如果数据整理需要自动化运行,则推荐使用Tableau Data Management。

本章主要介绍如何使用Prep Builder完成数据清理和整理,数据转置和聚合,第4章将介绍并集、连接和混合及新推出的高级功能。