使用“数据解释”更快获取见解

发布者Scott Teal日期September 17, 2019

将数据分析转变为吸引人的故事无疑会让人兴奋不已,但有时您可能会在探索和理解数据阶段就止步不前,更别说获取有趣的见解了。

假设您发现了一个让您非常满意的数据集,所有的列和行都是您梦寐以求的 - 非常整洁并且结构清晰。如何发现有趣的故事?您可能会采取以下探索方式:

  1. 创建条形图,依次查看每个变量的数据分布(单变量分析)
  2. 创建散点图,查看变量之间的关系(双变量分析)。如果幸运的话,您可能会发现强相关性。
  3. 查找模式、趋势或异常值。棒极了!您发现了有趣的疑似异常值!但导致该异常值的原因是什么?

认识“数据解释”

“数据解释”是 Tableau 2019.3 中的一项新功能,它由 AI 驱动,可以辅助数据探索,帮助您在“知其然”后,更快地“知其所以然”。该功能可以针对所选标记提出统计数据解释,并推荐可视化来供您展开进一步的探索。


示例:住宅价格为什么那么高?

我们来看一个关于住宅价格的示例,了解您可以如何使用“数据解释”。我将尝试创建一个关于西雅图住宅市场的故事,因此我从 kaggle.com 下载了关于金县 (King County) 住宅销售价格的数据集。它提供每个住宅的一系列信息,其中包含:

  • id:住宅的标记
  • date:住宅的出售日期
  • price:价格是预测目标
  • bedrooms:卧室/住宅数量
  • bathrooms:浴室/住宅数量
  • sqft_living:住宅的建筑面积
  • sqft_loft:住宅和院落的建筑面积
  • floors:住宅的总楼层数
  • waterfront:具有水景的住宅
  • view:已被查看过
  • condition:住宅状况
  • grade:整体等级(基于金县等级系统)
  • sqft_above:除地下室以外的住宅建筑面积
  • sqft_basement:地下室建筑面积
  • yr_built:住宅修建年份
  • yr_renovated:住宅翻新年份
  • zipcode:住宅所在地的邮政编码
  • lat:住宅所在地的纬度坐标
  • long:住宅所在地的经度坐标
  • sqft_living15:客厅面积(2015 年)
  • sqft_lot15:住宅和院落面积(2015 年)

数据的格式是 csv,因此我在 Tableau Desktop 公众版中将它作为文本文件打开。我应确保“日期”字段转换为“日期和时间”数据类型,并将所有类别字段更改为“维度”。

接下来,我希望基于邮政编码查看哪些地区的住宅售价最高。为此,我双击“zipcode”,将图表类型更改为“地图”,将“price”拖动到“颜色”,并将“价格聚合”更改为“平均值”。创建的地图显示,邮政编码为 98039 的住宅售价最高,平均值为 216 万美元。

但是,导致此区域住宅售价最高的原因是什么?是因为它们是水景房,还是因为此区域的住宅一般比较大?“数据解释”可以在这里发挥作用。点击邮政编码 98039,工具提示中将出现电灯泡图标。点击该图标,即可看到“数据解释”功能的实际运用 - 使用 AI 针对此区域的较高房价提供可能的解释。在此示例中,具有邮政编码 98039 的住宅与具有其他邮政编码的住宅相比,一般具有更多的卧室、更高的等级、更多的浴室和更多的景观,这些可能是导致平均房价较高的原因。

免费试用!“数据解释”现已在 Tableau Desktop 2019.3 和 Web 编辑中推出。下载 Tableau Desktop 2019.3,创建您的下一个数据故事。

除了“数据解释”外,Tableau 2019.3 还推出了更多功能,包括参数操作改进和意大利语产品语言。Tableau 社区的成员使用 #(待定)在 Twitter 上分享他们最喜欢的功能。加入对话 - 使用 #(待定)分享您最喜欢的功能!