Tableau Server 服务器增量提取详解

Tableau Server 增量提取完整指南:从 Desktop 端创建自定义 SQL 连接、设置增量字段和标记符、发布数据源,到编辑刷新计划的全流程。推荐每日增量刷新 + 每月全量刷新结合使用。

注意,如果自定义SQL中包含多个架构,此时需要多个连接。

一、在Desktop中设置增量刷新并发布数据源

1、创建自定义SQL连接

连接数据源,双击数据表或者自定义SQL。

Tableau Desktop 中创建自定义SQL连接数据源的界面截图
图:在 Tableau Desktop 中通过自定义SQL连接数据库,为增量提取准备数据源

2、设置增量刷新及标记符

默认实时连接,改为数据提取,并同步编辑设置增量字段。

增量字段,必须是连续字段,可以是日期、日期时间、整数格式。

增量刷新不会更改历史数据,过往数据如果在数据库中有变动,增量不会刷新;因此推荐增量刷新和全量刷新结合使用——比如每天增量,每月月末全量覆盖。

Tableau Desktop 中设置增量刷新字段和标记符的配置界面
图:在数据提取编辑器中设置增量字段——选择连续的日期或整数字段作为增量标识列

关于“日期时间”方面的限制,特别是非常精准的时间,可以参考官方说明,如下:

注意:数据引擎是 Tableau 创建数据提取所使用的基础机制,存储时间值时最多精确到 3 位小数。如果为“使用列标识新行”指定日期时间或时间戳列,并且数据库使用比 Tableau 更高的精度,则在增量刷新后最终会出现重复行。举例来说,如果数据库有两个行,其中一个行的日期时间值为 2015-03-13 17:30:56.502352,另一个行的日期时间值为 2015-03-13 17:30:56.502852,则 Tableau 在存储这两个行时都将使用日期时间值 2015-03-13 17:30:56.502,从而会创建重复行。

3、切换到工作表中,发布数据源

切换到工作表后,Tableau会按照数据提取的设置,将数据库数据提取到本地;之后发布到服务器。

推荐每日增量刷新+每月全量刷新结合。

超大量的本地提取毫无意义,只会耗用本地空间和时间,因此超大数据量场景推荐阅读:
Tableau Desktop 中发布数据源到服务器的操作界面
图:完成增量提取配置后,将数据源发布至 Tableau Server,后续可在浏览器中管理刷新计划

个人推荐,在发布数据源之前,适当对字段做文件夹分组、增加逻辑字段,从而提高其他人员使用该数据源的一致性。

Tableau Desktop 中对数据字段进行文件夹分组和逻辑字段管理的界面
图:发布前对字段进行分组整理并添加计算字段,提升数据源的一致性和可用性

4、成功发布,可以编辑刷新计划

发布成功后,可以在浏览器中编辑刷新计划。推荐同步创建一个测试用的仪表板,验证数据行数和关键度量值。

Tableau Server 浏览器端编辑数据提取刷新计划的界面
图:发布后在 Server 端编辑刷新计划,可设置每日增量刷新与每月全量刷新结合的调度策略

📖 相关阅读: Tableau 数据提取与刷新:增量、全量与子范围刷新详解

📖 超大数据量场景: Tableau Server “空提取”技巧

No comments yet