“伟大始于渺小,……”
- 数据解释器
数据解释器:tableau通过数据解释器自动对数据源的附加表、子表、分层页眉、无关的页眉和页脚,或者空白行和列进行检测,移除无关信息并优化准备用于分析的数据源。通常,在设置数据源之后,如果 tableau 检测到数据源存在如上问题,则会提示使用数据解释器。
完成与数据源的连接后,需要对来自不同数据源、多个数据表的数据进行融合、连接等操作,同时还要选择适合的数据载入方式,本节记录的内容主要包括:数据联接、数据合并、数据加载。
数据联接
数据联接方式分为四种,分别是内联接、左联接、右联接和完全外部联接,且如果两张表的关键字匹配不到的数据,会在对应的数据网格中显示为NULL。

- 内连接--生成的新表仅保留两张数据表中具有相同关键字段的行。
- 左连接--生成的新表包含左侧表中所有值以及右侧表中相对应的匹配值。
- 右连接--生成的新表包含右侧表中所有值以及左侧表中相对应的匹配值。
- 完全外部联接--生成的新表将包含两个表中的所有值。
数据合并
数据合并分为自动合并与手动合并。当需要将有多张数据结构一致的表格整合汇总在一起时,则可以使用数据合并。对于数据联接和数据合并的简单理解,数据联接是横向扩展数据表的字段,纵向的数据行数不会变得更多,而数据合并正好相反,它是纵向增加数据行数,横向的数据表字段不会变得更多。
---要进行数据合并操作,每个表必须具有相同的字段数,并且相关字段必须具有匹配的字段名称和数据类型。
“实时连接”:直接从数据源实时查询获取数据信息,tableau不对源数据进行存储。
“数据提取”:将数据源的数据保存到本地计算机,大幅缩短tableau查询载入源数据的时间。
- “实时”和 “数据提取”的选择
“数据提取”:
1、不便于实时连接数据源,如数据是通过本地服务器获取,但又需要在别的电脑进行分析时,可以通过”数据提取“将所需分析的数据保存到本地电脑。
2、分析的数据量较大,需要提高数据载入效率,降低源数据库的访问压力时,可以通过数据提取将数据转移到本地计算机。
“实时连接”:
1、 源数据的保密性要求较高,处于安全考虑不希望保存到本地时,可以采取实时连接的方式。
2、要实时更新源数据信息,并且对实时性的要求较高,可以选择实时连接的方式。
Tableau的数据类型主要有文本值、日期值、日期和时间值、数字值、布尔值、地理值六类。
维度、度量、连续、离散的释义
1、维度呈现为标题、度量呈现为连续轴
2、离散字段创建标题、连续字段创建连续轴
3、辨别视图中的字段是度量还是维度的依据在于该字段是否已聚合
4、维度和度量是可以相互转化的
5、离散字段和连续字段也是可以相互转化的
6、维度/度量和离散/连续不是必然对应的
eg:邮政编码是由一串数字组成,tableau会将其划入到“度量”,但实际上,邮政编码通过是作为分类信息来处理,如统计同一邮政编码客户的相关数据,而不是对邮政编码进行求和、求平均数、求最大最小值等计算。
eg:产品的“价格”字段是数字型,tableau也会将其划入到“度量”,可以对产品价格进行求和、求平均等计算,但如果希望统计各个价格或某价格区间的产品销量,作为“度量”字段的“价格”显然不能满足分析需要,这时就需要将“价格”字段从“度量”转换为“维度”。
“集”是根据某些条件定义数据子集的自定义字段,可以理解为维度字段的部分成员。
常量集
常量集属于静态集,其成员是固定的,不会根据数据变化而变化。常量集可以基于单个维度或多个维度创建。
计算集
计算集可基于计算条件建立,创建后会根据数据动态变化。计算集只能基于单个维度进行创建。
- 集的合并
集与集之间可以进行合并(两个集要进行合并,必须具有相同的维度),从而对集内的成员进一步比较和筛选。集的合并分为三种情况,分别是并集、交集、差集
参数是实现控制与交互最常见、最方便的方法。
简单的说,参数是可在集、计算字段、筛选器中替换常量值的动态值,通过参数,能够实现快速、简便的交互。
参数依据:
1、分析
对需要使用参数的集、计算字段、筛选器等对象进行分析,确定动态值。
2、创建
根据要引入的动态值类型创建参数。
3、使用
将参数应用在目标对象中,即把创建的参数与集、计算字段、筛选器等对象进行关联。
计算字段是使用函数和运算符构造公式,对数据源字段(包括维度、度量、参数等)进行重新定义的字段。它是原始数据源中没有,由使用者创建出来的新字段。
由于Tableau无法像Excel一样操作单元格,因此不能直接按照Excel的使用方法,即通过单元格创建公式来达到计算目标,而是要通过创建表计算,选择相应的计算规则、计算方式、计算顺序,让tableau知晓我们想让它如何去计算,从而实现我们的计算目标。
计算类型
“计算类型”提供了具体计算方式,包括差异、百分比差异、百分比、合计百分比、排序、百分位、汇总、移动计算。日常使用的绝大多数分析指标都可以通过这些计算类型进行实现。
eg:销售增长率可以通过“百分比差异”计算得出
eg:销售额同比增量可以通过“差异”计算得出
eg:销售额排名可以通过“排序”计算得出
计算依据
“计算依据”定义了tableau在执行表计算时的计算顺序,主要分为两类,一类是封装好的计算顺序和规则,如表(横穿)、区(向下)、单元格等,一类是自定义计算顺序和规则,即“特定维度”。
