Descubra informações com mais rapidez com o Explique os dados

Publicado por Scott Tealem September 17, 2019

Muitas vezes, você está animado para transformar sua análise de dados em uma história envolvente, mas pode acabar travado na etapa de exploração e compreensão dos dados, sem conseguir descobrir informações interessantes.

Imagine que você encontrou um conjunto de dados fascinante, com todas as linhas e colunas que sonhava, perfeitamente organizado e estruturado. Como você faz para descobrir histórias interessantes nesses dados? Seu processo de exploração poderia ser mais ou menos assim:

  1. Criar gráficos de barras para ver a distribuição dos dados em cada variável, uma por uma (análise univariável)
  2. Criar gráficos de dispersão para ver os relacionamentos entre as variáveis (análise bivariável). Se tiver sorte, você talvez encontre correlações bem definidas.
  3. Procure padrões, tendências e exceções. Fantástico! Você encontrou o que parece ser uma exceção interessante! Mas qual é a causa por trás dela?

Dê as boas-vindas ao Explique os dados

O Explique os dados é um novo recurso impulsionado pela IA do Tableau 2019.3 que facilita a exploração de dados, ajudando você a ir dos “quês” aos “porquês” com mais rapidez. Ele apresenta explicações estatísticas para a marca selecionada, bem como visualizações que você pode abrir para explorar mais a fundo.


Exemplo: Por que as casas são caras?

Vejamos um exemplo de como usar o Explique os dados para analisar os preços de casas. Quero criar uma história sobre o mercado imobiliário de Seattle, então baixei do site kaggle.com um conjunto de dados sobre os preços de venda de casas em King County. Ele traz muitas informações sobre cada casa, incluindo:

  • id (ID): identificador da casa
  • date (data): data em que a casa foi vendida
  • price (preço): o preço é o valor estimado
  • bedrooms (quartos): número de quartos por casa
  • bathrooms (banheiros): número de banheiros por casa
  • sqft_living (metragem): metragem da casa
  • sqft_loft (metragem do lote): metragem do lote
  • floors (andares): total de andares da casa
  • waterfront (vista para o mar): casa com vista para o mar
  • view (visita): a casa já foi visitada
  • condition (condições): condições da casa
  • grade (nota): nota geral de acordo com o sistema de avaliação de King County
  • sqft_above (metragem superior): metragem da casa sem contar o porão
  • sqft_basement (metragem do porão): metragem do porão
  • yr_built (ano de construção): ano em que a casa foi construída
  • yr_renovated (ano de reforma): ano em que a casa foi reformada
  • zipcode (código postal): código postal da localização da casa
  • lat (latitude): coordenada de latitude da localização da casa
  • long (longitude): coordenada de longitude da localização da casa
  • sqft_living15 (metragem da área útil em 2015): área útil em 2015
  • sqft_lot15 (metragem do lote em 2015): área do lote em 2015

Os dados estão em formato .CSV, então usei o Tableau Desktop Public Edition para abri-lo como um arquivo de texto. Devo assegurar que meu campo de data seja convertido para o tipo de dados “Data e hora” e alterar todos os campos categorizados para “Dimensões”.

Em seguida, quero ver em quais códigos postais as casas são mais caras. Para isso, clico duas vezes em “zipcode” (código postal), altero o tipo de gráfico para “mapa”, arrasto “price” (preço) para Cor e altero a agregação de preço para “média”. O mapa criado mostra que as casas no código postal 98039 são as mais caras, custando na faixa de US$ 2,16 milhões.

Por que será que as casas nesse código postal são tão caras? Será porque são propriedades com vista para o mar ou porque as casas nesse código postal tendem a ser maiores? É aí que podemos usar o Explique os dados. Quando clico no código postal 98039, um ícone de lâmpada aparece na dica de ferramenta. Basta clicar nele para vermos o Explique os dados em ação, usando a IA para apresentar possíveis explicações para os preços mais altos das casas nesse código postal. O que acontece é que as casas no código postal 98039 geralmente têm mais quartos, notas mais altas, mais banheiros e mais visitas do que as casas em outros códigos postais, o que provavelmente eleva seu preço médio.

Avalie gratuitamente! O Explique os dados está disponível no Tableau Desktop 2019.3 e na edição na Web. Baixe o Tableau Desktop 2019.3 e crie sua próxima história com os dados.

Além do Explique os dados, o Tableau 2019.3 traz outros recursos, incluindo melhorias nas ações de parâmetros e a interface do produto em italiano. Os membros da comunidade do Tableau estão compartilhando seus recursos favoritos no Twitter com a hashtag #(TBD). Entre na conversa e conte qual é o seu recurso favorito usando a hashtag #(TBD).