「データの説明を見る」機能でインサイトを迅速に取得

By Scott Teal- September 17, 2019

データ分析を魅力的なストーリーに変えることができれば楽しくなります。しかし、データの探索と理解に夢中になるあまり、興味深いインサイトを得ることを忘れることがあります。

たとえば、すべての列と行が完璧にクリーニングされ、きれいに構造化された理想的な最新のデータセットを見つけたとします。そこからどのようにして、興味深いストーリーを発見しますか? その探索はおそらく次のようになるでしょう。

  1. 棒グラフを作成して、各変数に関するデータの分布を 1 つずつ確認する (単変量解析)。
  2. 散布図を作成して、変数間の関係を確認する (二変量解析)。運が良ければ、強い相関関係が見つかるかもしれません。
  3. パターン、傾向、外れ値を探す。幸運にも、興味深いと思われる外れ値を発見することがあります。しかし、その原因は何でしょうか?

「データの説明を見る」機能のご紹介

データ探索に役立つ「データの説明を見る」機能は、Tableau 2019.3 に搭載された新しい AI ドリブンの機能です。これにより、「何が」から「なぜ」へと迅速に探索できます。選択されたマークの統計的説明、および、さらにそこから探索することが可能なビジュアライゼーションを提示します。


例: 住宅の価格はなぜ高いのでしょうか?

住宅の価格に関する次の例を参考にして、「データの説明を見る」機能をどのように使用するか見てみましょう。シアトルの住宅市場に関するストーリーを作成しようとしているため、キング郡の住宅販売価格のデータセットを kaggle.com からダウンロードしました。そこには次のような各住宅の情報が含まれています。

  • ID: 住宅の表記
  • 日付: 住宅が販売された日付
  • 価格: 価格が予測の対象
  • ベッドルーム: 住宅あたりのベッドルーム数
  • バスルーム: 住宅あたりのバスルーム数
  • sqft_living: 住宅の専有面積
  • sqft_loft: 土地の面積
  • 階数: 住宅の階数
  • ウォーターフロント: ウォーターフロントの眺めのある住宅
  • : 窓の数
  • 状態: 住宅の状態
  • グレード: キング郡の等級システムに基づく全体のグレード
  • sqft_above: 地下室を除く、住宅の専有面積
  • sqft_basement: 地下室の専有面積
  • yr_built: 住宅の築年
  • yr_renovated: 住宅の改築年
  • 郵便番号: 住宅住所の郵便番号
  • 緯度: 住宅住所の緯度座標
  • 経度: 住宅住所の経度座標
  • sqft_living15: 2015 年の居間面積
  • sqft_lot15: 2015 年の敷地面積

csv 形式のデータのため、Tableau Desktop Public Edition でテキストファイルとして開きます。[日付] フィールドが「日付と時刻」データ型になっていることを確認し、すべてのカテゴリフィールドをディメンションに変更します。

次に、郵便番号に基づいて、最も住宅価格が高い場所を見ます。そのためには、[郵便番号] をダブルクリックし、チャートタイプをマップに変更して [価格] を [色] にドラッグし、価格の集計を [平均] に変更します。作成されたマップには、郵便番号 98039 にある住宅の価格が最も高く、平均 216 万ドルであることが示されます。

しかし、なぜこの郵便番号の地域にある住宅の価格は高いのでしょうか? ウォーターフロントだからでしょうか、またはこの郵便番号の地域の住宅は大きいという傾向があるからでしょうか?ここで「データの説明を見る」機能を使います。郵便番号 98039 をクリックすると、ツールヒントに電球アイコンが表示されます。そのアイコンをクリックすると、「データの説明を見る」機能が起動し、AI を活用して、この郵便番号の地域で住宅価格が高くなっている潜在的な説明を提示します。この例では、郵便番号 98039 の地域にある住宅はベッドルーム数とバスルーム数が多く、より高いグレードであり、他の郵便番号の地域よりも窓が多いため、平均住宅価格が高くなっていると考えられます。

無料でお試しください。「データの説明を見る」機能は、Tableau Desktop 2019.3 および Web エディターの両方で利用できます。Tableau Desktop 2019.3 をダウンロードして、今後のデータストーリーを作成しましょう。

「データの説明を見る」機能以外にも、パラメーターアクションの強化や製品の言語オプションとしてイタリア語を利用できるようになるなど、Tableau 2019.3 にはより多くの機能が含まれています。Tableau コミュニティのメンバーが、お気に入りの機能を Twitter で #(TBD) を付けて共有しています。その会話にぜひ参加してください。#(TBD) を付けて、お気に入りの機能を共有しましょう。