Accédez plus vite aux insights avec « Explique-moi les données »

Publié par Scott Tealle September 17, 2019

Rien de plus stimulant que de transformer une analyse de données en histoire captivante ! Attention cependant : parfois, l'exploration est si intéressante qu'on en oublie de dégager des informations exploitables.

Imaginons que vous ayez trouvé l'ensemble de données idéal. Il contient toutes les colonnes et toutes les lignes dont vous rêviez, et il est parfaitement nettoyé et structuré. Comment découvrir des histoires intéressantes ? Voici comment vous pourriez procéder :

  1. Créez des graphiques à barres afin de voir la répartition des données pour chaque variable, une par une (analyse univariée)
  2. Créez des nuages de points pour voir les relations entre les variables (analyse bivariée) Avec un peu de chance, vous trouverez des corrélations solides.
  3. Recherchez des tendances ou des valeurs atypiques. Excellent ! Vous avez trouvé une valeur atypique des plus intéressantes ! Mais qu'est-ce qui la génère ?

Tableau, Explique-moi les données !

Explique-moi les données est une nouvelle fonctionnalité de Tableau 2019.3 qui s'appuie sur l'intelligence artificielle pour vous aider à comprendre plus rapidement les causes de ce que vous observez. Elle propose des explications statistiques pour un repère sélectionné et des visualisations pour approfondir votre exploration.


Exemple : Pourquoi les maisons sont-elles si chères ?

Voyons comment utiliser Explique-moi les données dans cet exemple qui traite des prix de l'immobilier. J'essaie de raconter une histoire sur le marché de l'immobilier à Seattle. J'ai donc téléchargé un ensemble de données concernant le prix de vente des maisons de King County sur kaggle.com. Il contient un certain nombre d'informations pour chaque maison, y compris :

  • id : l'identifiant d'une maison
  • date : la date à laquelle la maison a été vendue
  • price : le prix de vente prévu
  • bedrooms : le nombre de chambres par maison
  • bathrooms : le nombre de salles de bain par maison
  • sqft_living : la surface de la maison en mètres carrés
  • sqft_loft : la surface du terrain en mètres carrés
  • floors : le nombre d'étages (niveaux) dans la maison
  • waterfront : si la maison possède une vue sur la mer ou le lac
  • view : le logement a été visité
  • condition : l'état de la maison
  • grade : la note générale de la maison, basée sur le système d'évaluation de King County
  • sqft_above : la surface en mètres carrés de la maison, sans compter la cave
  • sqft_basement : la surface en mètres carrés de la cave
  • yr_built : l'année de construction de la maison
  • yr_renovated : l'année de rénovation de la maison
  • zipcode : le code postal de la maison
  • lat : la latitude de la maison
  • long : la longitude de la maison
  • sqft_living15 : la surface du salon en 2015
  • sqft_lot15 : la surface du terrain en 2015

Les données sont au format CSV. Je peux donc les ouvrir dans Tableau Desktop Public Edition en tant que fichier texte. Je dois m'assurer que mon champ « Date » est converti en type de données de date et d'heure, et modifier tous mes champs de catégorie en Dimensions.

Ensuite, je veux voir où sont situées les maisons les plus chères à l'aide du code postal. Pour cela, je clique deux fois sur « zipcode », je modifie le type de graphique en carte, je fais glisser « price » vers Couleur, et je change l'agrégation des prix en Moyenne. La carte ainsi créée montre que les maisons rattachées au code postal 98039 sont les plus chères, avec une moyenne de prix s'élevant à 2,16 millions de dollars.

Mais pourquoi les maisons de cette zone sont-elles si chères ? Est-ce parce qu'elles ont une vue sur la mer ou le lac, ou parce qu'elles sont généralement plus spacieuses ? C'est là qu'Explique-moi les données entre en jeu. Cliquez sur le code postal 98039. Une icône en forme d'ampoule apparaît alors dans l'infobulle. Cliquez sur cette icône pour voir Explique-moi les données en action : en s'appuyant sur l'intelligence artificielle, cette fonctionnalité vous fournit des explications potentielles sur les prix plus élevés dans cette zone. Dans le cas présent, les maisons rattachées au code postal 98039 ont généralement davantage de chambres, de meilleures notes, davantage de salles de bain, et plus souvent une vue sur la mer ou le lac que les maisons des autres zones. Ces éléments favorisent probablement la hausse des prix.

Essayer gratuitement Explique-moi les données est disponible à la fois dans Tableau Desktop 2019.3 et dans l'édition Web. Téléchargez Tableau Desktop 2019.3 et créez votre prochaine histoire basée sur des données.

En plus d'Explique-moi les données, Tableau 2019.3 vous propose d'autres fonctionnalités, comme les améliorations des actions de paramètre et la prise en charge de l'italien. Les membres de la communauté Tableau partagent leurs fonctionnalités préférées sur Twitter avec le hashtag #(TBD). Vous aussi, prenez part à la conversation : indiquez votre fonctionnalité favorite avec le hashtag #(TBD) !

Remarque : Si vous essayez d'installer Tableau Desktop 2019.3 sur macOS Catalina 10.15, vous rencontrerez une erreur. Pour en savoir plus, consultez cet article de la base de connaissances.