借助 Tableau 10.2 轻松应对地理空间分析

Kent Marten
日期三月 6, 2017

Kent Marten 是 Tableau 的地图和空间分析高级产品经理。此文于 2017 年 2 月 24 日首次发表在 Tableau 的博客

您的业务是否受地理因素影响?位置是否是您的分析重点?几乎每个在数据中寻找见解的人都会在某个时点对上述这些问题给出肯定的答案。

你们中的很大一部分人每天都需要处理空间数据。Tableau 10.2 为你们以及其他地图发烧友提供了空间数据本机连接器。此功能将大大简化任何空间数据的处理,同时提高自定义多边形的处理效果。

该空间文件连接器让每个人都可以连接到 ESRI Shapefile、KML、MapInfo 表以及 GeoJSON 文件。这些是最常见的空间文件格式,您可以在全球各地的开放数据门户找到可以下载的相应数据。以下是我最喜欢的一些示例:

美国数据门户:

  • Data.gov:美国开放数据的完整目录
  • Census.gov:人口普查边界
  • Open Data Philly:城市数据门户范例,展示了许多大城市当前的发展情况

国家数据门户:

全球数据门户:

  • GADM:几乎涵盖全球所有国家/地区的行政边界目录
  • HDX (人道主义数据交换平台):使人道主义数据便于查找和使用

但这项功能并不仅限于连接开放数据。许多组织都有 GIS 分析师或完整的 GIS 部门,这些组织已经有了此类数据。自定义地理信息的处理再简单不过,而且您可以轻松利用现有的空间数据。

空间文件入门指南

您可以通过三个简单步骤开始创建地图:

  1. 从开始页面连接到空间文件
  2. 跳转到工作表
  3. 将“Geometry”(几何)字段以及要用作聚合依据的维度拖至“详细信息”功能区或直接拖至画布

Tableau 10.2 空间文件支持

我在上述示例中连接的 Shapefile 来自费城。此文件包含各人口普查区的人口统计学特征属性。在此文件中,我选择自己感兴趣的属性,然后直接进行拖放。这就是一个可视化,它显示了这个城市有多少人拼车上班。

Tableau 10.2 空间文件支持

当然,并非所有空间文件都会包含您感兴趣的属性。想用地图来表示私有数据的人尤其需要将自己的数据与空间文件合并。借助 Tableau 现有的跨数据源联接功能,这项操作也十分简单。

以下示例在地图上显示了多伦多市的选区数据。连接到选区 Shapefile 后,我添加了与投票结果电子表格的连接。在很多情况下,Tableau 将自动为用户设置联接。在本例中,我的联接是这样的:

Tableau 10.2 空间文件支持

现在,您可以跳转到工作表并构建可视化。我将“Geometry”(几何)、“Area_Name”(区域名称)和“Eligible Voters”(合格选民)放到画布上,创建了这张地图:

的确就是这么简单。

集成您的数据

现在,假设我们想进行延伸,增加一些趣味。为此,我们来探索一个自定义地理分层结构,它包含来自多个源的数据。在本示例中,我们探索巴西圣保罗的平均月收入。数据来自 Instituto Brasileiro de Geografia e Estatística (IBGE)。

我们从一个数据表着手,其中包含人口统计变量以及与行政地理区域关联的代码。在本示例中,我们处理两种地理区域:人口普查范围和区。接下来,我们将添加与这些地理数据集的连接,将二者联接到最初的表。该联接最后是这个样子:

Tableau 10.2 空间文件支持

在您的工作表中,您需要设置一个参数和多个计算字段。此参数将是该可视化的交互控件,而这些计算字段将包含可视化中“Geometry”(几何)与“Detail”(详细信息)的交换逻辑。我以如下方式配置此参数:

Tableau 10.2 空间文件支持

现在,两个计算字段使用相同的模式,根据该参数的值来选择正确的字段。我使用此表达式来选择要使用的“Geometry”(几何):

Tableau 10.2 空间文件支持

添加自定义地理分层结构

接下来只需要打开参数控件,将计算字段和平均收入拖放到可视化中。现在,您可以按照区或者更细的人口普查范围来探索圣保罗的数据。

Tableau 10.2 空间文件支持

您有没有发现,我并没有花时间讨论每个多边形的坐标系统或顶点计数?那是因为,根据我们的设计,此功能可以自动处理投影方式不同的数据(这是一项很复杂的工作),并且可以应用于详尽的大型多边形数据集。

借助该空间文件连接器,您无需再像过去那样在使用自定义多边形之前对数据进行预处理。现在,您可以像连接文本文件一样连接到空间数据,利用 Tableau 中的各种绝妙功能(跨数据源联接、参数等等),轻松构建美观的地图。

您可以下载下方的可视化,了解其构建方式。

如果您对空间文件的处理已经非常熟悉,请相信,这个功能还只是开始。我们知道它存在一些缺陷,比如第一版的空间文件支持无法兼容具有多个图层的线性几何体或 KML 文件。这是个很好的机会,您可以告诉我们哪项功能对于您的工作而言最重要,以及您希望如何使用空间数据。我建议您在创意论坛为自己需要的功能投上一票。