運用 Explain Data 加速獲得見解

Posted by Scott TealSeptember 17, 2019

將您的資料分析轉化為絕佳的故事可能會讓人振奮,不過,有時您可能在探索和瞭解資料時就會陷入困境,導致您無法獲得有趣的見解。

假設您已經找到了最豐富的資料集,其中您可以想到的所有欄和列都非常明確且結構完整。您如何發現有趣的故事?您的探索方式可能是:

  1. 建立長條圖以逐一查看每個變數的資料分佈情形 (單變數分析)
  2. 製作散點圖以查看變數之間的關係 (雙變數分析)。您可能很幸運,發現變數之間有很強的相關性。
  3. 尋找模式、趨勢或異常值。太完美了!您發現了一個似乎很有趣的異常值!不過是什麼原因造成的?

歡迎使用 Explain Data

Explain Data 是 Tableau 2019.3 的全新 AI 驅動功能,有助於資料探索、協助您從「現象」更快釐清「原因」。這個功能會針對選取的標記提出統計上的解釋,並且提供可供進行進一步探索的視覺化內容。


範例:為什麼房價這麼貴?

讓我們看看如何在查看房價的範例中使用 Explain Data。我嘗試建立關於西雅圖房屋市場的故事,所以我從 kaggle.com 下載了一個關於金郡房屋銷售價格的資料集,其中含有每間房子的許多資訊,包括:

  • id:房子的標記
  • date:房子售出的日期
  • price:價格是預測目標
  • bedrooms:臥室/房子數量
  • bathrooms:浴室/房子數量
  • sqft_living:住家坪數
  • sqft_loft:車位坪數
  • floors:房屋總樓層 (層)
  • waterfront:有海濱景色的房屋
  • view:已觀看
  • condition:住家的條件
  • grade:金郡評分系統的整體評分
  • sqft_above:地下室除外的房子坪數
  • sqft_basement:地下室坪數
  • yr_built:房屋完工的年度
  • yr_renovated:房屋裝修的年度
  • zipcode:房屋地點的郵遞區號
  • lat:房屋地點的緯度座標
  • long:房屋地點的經度座標
  • sqft_living15:2015 年的客廳面積
  • sqft_lot15:2015 年的車位面積

資料採用 csv 格式,因此我在 Tableau Desktop Public Edition 中以文字檔的格式開啟資料。我應該確認「日期」欄位已經轉換為「日期和時間」資料類型,並將所有分類欄位變更為「維度」。

接下來,我想要根據郵遞區號尋找房價最貴的地方。因此,我按兩下「郵遞區號」,將圖表類型變更為地圖,將「價格」拖曳到顏色,並將價格匯總變更為平均值。根據系統建立的地圖顯示,郵遞區號 98039 的房屋平均價格最高,為 216 萬美元。

不過,是什麼原因造成這個郵遞區號的房價這麼貴?是因為這裡房子座擁海景?還是因為這個郵遞區號的房屋通常比較大?這正是 Explain Data 可以派上用場的地方。按一下 98039 郵遞區號,工具提示會出現燈泡圖示。按一下該圖示,您會看到 Explain Data 正在執行作業,使用 AI 對這個郵遞區號提供房價較高的可能解釋。在這種情況下,98039 郵遞區號的住家有較多的臥室、較高的等級、較多的浴室,以及比其他郵遞區號住家更多的景觀,這些都可能會推高平均房價。

歡迎免費試用!Tableau Desktop 2019.3 和 Web 編輯均提供 Explain Data。下載 Tableau Desktop 2019.3 並建立您的下一個資料故事。

除了 Explain Data 之外,Tableau 2019.3 還提供更多功能,包括參數動作改進和義大利語產品語言。Tableau 社群的成員使用 #(TBD) 在 Twitter 上分享他們最喜歡的功能。直接進行對話 - 使用 #(TBD) 分享您最喜歡的功能!