Schnellere Einblicke mit Erklär die Daten

Veröffentlicht von Scott Tealam September 17, 2019

Ihre Datenanalyse in eine überzeugende Story zu verwandeln, kann sehr anregend sein, es kann jedoch auch vorkommen, dass Sie lange Zeit vergebens versuchen, Daten zu erkunden und zu verstehen, ohne jemals interessante Erkenntnisse zu gewinnen.

Angenommen, Sie haben den interessantesten Datensatz gefunden, alle Spalten und Zeilen, die Sie sich je gewünscht haben, absolut übersichtlich und perfekt strukturiert. Wie entdecken Sie interessante Storys? Nun, Ihre Erkundung könnte ungefähr so verlaufen:

  1. Erstellen Sie Balkendiagramme, um die Verteilung der Daten für jede Variable nacheinander anzuzeigen (univariate Analyse).
  2. Erstellen Sie Streudiagramme, um die Beziehungen zwischen Variablen anzuzeigen (bivariate Analyse). Vielleicht haben Sie Glück und finden enge Zusammenhänge.
  3. Suchen Sie nach Mustern, Trends oder Ausreißern. Fantastisch! Sie haben anscheinend einen interessanten Ausreißer gefunden! Aber wodurch wird er verursacht?

Vorhang auf für Erklär die Daten

Erklär die Daten ist eine neue KI-gesteuerte Funktion in Tableau 2019.3, welche die Datenexploration unterstützt und Ihnen dabei hilft, schneller vom „Was“ zum „Warum“ zu gelangen. Sie schlägt statistische Erklärungen für eine ausgewählte Marke vor sowie Visualisierungen, die Sie zur weiteren Erkundung öffnen können.


Beispiel: Warum sind Häuser so teuer?

Sehen wir uns in einem Beispiel für Immobilienpreise an, wie Erklär die Daten angewendet werden kann. Ich versuche, eine Story über den Immobilienmarkt in Seattle zu erstellen, also habe ich einen Datensatz über die Verkaufspreise von Häusern im King County von kaggle.com heruntergeladen. Er enthält eine Fülle von Informationen zu jedem Haus, wie u. a.:

  • ID: Notation für ein Haus
  • date: Tag, an dem das Haus verkauft wurde
  • price: Der prognostizierte Verkaufspreis
  • bedrooms: Anzahl der Zimmer
  • bathrooms: Anzahl an Badezimmern
  • sqft_living: Fläche des Hauses in Quadratfuß
  • sqft_loft: Fläche des Grundstücks in Quadratfuß
  • floors: Gesamtanzahl aller Stockwerke (Etagen) des Hauses
  • waterfront: Haus mit Fluss-/Kanal-/Meeresblick
  • view: Wurde bereits angesehen
  • condition: Zustand des Hauses
  • grade: Allgemeine Bewertung gemäß dem Bewertungssystem im King County
  • sqft_above: Fläche des Hauses mit Ausnahme des Kellers in Quadratfuß
  • sqft_basement: Fläche des Kellers in Quadratfuß
  • yr_built: Jahr, in dem das Haus gebaut wurde
  • yr_renovated: Jahr, in dem das Haus renoviert wurde
  • zipcode: Postleitzahl des Hausstandortes
  • lat: Breitengrad des Hausstandortes
  • long: Längengrad des Hausstandortes
  • sqft_living15: Wohnzimmerfläche 2015
  • sqft_lot15: Dachbodenfläche 2015

Die Daten liegen im .csv-Format vor, daher öffne ich sie als Textdatei in Tableau Desktop Public Edition. Ich sollte sicherstellen, dass mein Feld „Datum“ in einen Datums- und Zeitdatentyp konvertiert wird, und ich sollte alle meine kategorialen Felder in Dimensionen ändern.

Als Nächstes möchte ich anhand der Postleitzahl herausfinden, wo Häuser am teuersten sind. Dazu doppelklicke ich auf „Postleitzahl“, ändere den Diagrammtyp in „Karte“, ziehe „Preis“ auf „Farbe“ und ändere die Preisaggregation in „Durchschnitt“. Die erstellte Karte zeigt, dass Häuser mit der Postleitzahl 98039 mit durchschnittlich 2,16 Mio. USD am teuersten sind.

Aber was macht Häuser mit dieser Postleitzahl so teuer? Liegt es daran, dass es sich um Grundstücke am Wasser handelt oder dass die Häuser mit dieser Postleitzahl tendenziell größer sind? Und hier kommt Erklär die Daten ins Spiel. Klicken Sie auf die Postleitzahl 98039, und im Tooltip wird ein Glühbirnensymbol angezeigt. Klicken Sie auf dieses Symbol und Sie werden Erklär die Daten in Aktion sehen, wie es mithilfe von KI mögliche Erklärungen für höhere Immobilienpreise in diesem Postleitzahlengebiet liefert. In diesem Fall haben Häuser mit der Postleitzahl 98039 in der Regel mehr Zimmer, sind höherwertig, verfügen über mehr Badezimmer und bieten eine bessere Aussicht als Häuser in anderen Postleitzahlgebieten, was wahrscheinlich den durchschnittlichen Hauspreis in die Höhe treibt.

Probieren Sie es kostenlos aus! Erklär die Daten ist sowohl in Tableau Desktop 2019.3 als auch für Web-Editing erhältlich. Laden Sie sich Tableau Desktop 2019.3 herunter und erstellen Sie Ihre nächste Datenstory.

Neben Erklär die Daten enthält Tableau 2019.3 mehr Features, darunter Verbesserungen der Parameteraktionen und Italienisch als Produktsprache. Mitglieder der Tableau-Community teilen ihre Lieblingsfeatures unter Verwendung von #(TBD) auf Twitter. Kommen Sie direkt mit anderen ins Gespräch – teilen Sie uns Ihr Lieblingsfeature unter Verwendung von #(TBD) mit!