將您的資料分析轉化為絕佳的故事可能會讓人振奮,不過,有時您可能在探索和瞭解資料時就會陷入困境,導致您無法獲得有趣的見解。
假設您已經找到了最豐富的資料集,其中您可以想到的所有欄和列都非常明確且結構完整。您如何發現有趣的故事?您的探索方式可能是:
- 建立長條圖以逐一查看每個變數的資料分佈情形 (單變數分析)
- 製作散點圖以查看變數之間的關係 (雙變數分析)。您可能很幸運,發現變數之間有很強的相關性。
- 尋找模式、趨勢或異常值。太完美了!您發現了一個似乎很有趣的異常值!不過是什麼原因造成的?
歡迎使用 Explain Data
Explain Data 是 Tableau 2019.3 的全新 AI 驅動功能,有助於資料探索、協助您從「現象」更快釐清「原因」。這個功能會針對選取的標記提出統計上的解釋,並且提供可供進行進一步探索的視覺化內容。
範例:為什麼房價這麼貴?
讓我們看看如何在查看房價的範例中使用 Explain Data。我嘗試建立關於西雅圖房屋市場的故事,所以我從 kaggle.com 下載了一個關於金郡房屋銷售價格的資料集,其中含有每間房子的許多資訊,包括:
- id:房子的標記
- date:房子售出的日期
- price:價格是預測目標
- bedrooms:臥室/房子數量
- bathrooms:浴室/房子數量
- sqft_living:住家坪數
- sqft_loft:車位坪數
- floors:房屋總樓層 (層)
- waterfront:有海濱景色的房屋
- view:已觀看
- condition:住家的條件
- grade:金郡評分系統的整體評分
- sqft_above:地下室除外的房子坪數
- sqft_basement:地下室坪數
- yr_built:房屋完工的年度
- yr_renovated:房屋裝修的年度
- zipcode:房屋地點的郵遞區號
- lat:房屋地點的緯度座標
- long:房屋地點的經度座標
- sqft_living15:2015 年的客廳面積
- sqft_lot15:2015 年的車位面積
資料採用 csv 格式,因此我在 Tableau Desktop Public Edition 中以文字檔的格式開啟資料。我應該確認「日期」欄位已經轉換為「日期和時間」資料類型,並將所有分類欄位變更為「維度」。
接下來,我想要根據郵遞區號尋找房價最貴的地方。因此,我按兩下「郵遞區號」,將圖表類型變更為地圖,將「價格」拖曳到顏色,並將價格匯總變更為平均值。根據系統建立的地圖顯示,郵遞區號 98039 的房屋平均價格最高,為 216 萬美元。
不過,是什麼原因造成這個郵遞區號的房價這麼貴?是因為這裡房子座擁海景?還是因為這個郵遞區號的房屋通常比較大?這正是 Explain Data 可以派上用場的地方。按一下 98039 郵遞區號,工具提示會出現燈泡圖示。按一下該圖示,您會看到 Explain Data 正在執行作業,使用 AI 對這個郵遞區號提供房價較高的可能解釋。在這種情況下,98039 郵遞區號的住家有較多的臥室、較高的等級、較多的浴室,以及比其他郵遞區號住家更多的景觀,這些都可能會推高平均房價。
歡迎免費試用!Tableau Desktop 2019.3 和 Web 編輯均提供 Explain Data。下載 Tableau Desktop 2019.3 並建立您的下一個資料故事。
除了 Explain Data 之外,Tableau 2019.3 還提供更多功能,包括參數動作改進和義大利語產品語言。Tableau 社群的成員使用 #(TBD) 在 Twitter 上分享他們最喜歡的功能。直接進行對話 - 使用 #(TBD) 分享您最喜歡的功能!