 Olá, pessoal, tudo bem? Meu nome é Adolfo Guimarães. Vou falar para vocês sobre visualização de dados abertos. Para começar, vou me apresentar rapidamente. Eu sou Adolfo Guimarães, sou Mestre em Ciência da Computação pela Universidade Federal de Minas Gerais. Atualmente sou professor e pesquisador na Universidade Tiratentes aqui em Sergipe, no Brasil. E também, desde o ano passado, faço parte da rede de pessoas embaixadoras em inovação cífica da homenóloga de Brasil. Para que a gente possa começar a entender esse tópico, eu trouxe aqui algumas definições do que é visualização de dados. A primeira que eu trago aqui para vocês é uma do Jonathan Swibich, que diz o seguinte em seu livro A Better Dar a Visualização. A visualização de dados é um mix entre ciência e arte. E, às vezes, a gente quer estar perto da ciência, ou seja, a gente usar visualizações que vão permitir ao leitor ter uma percepção mais precisa dos valores que estão sendo mostradas na visualização a ponto de poder fazer comparações. Em outro momento, a gente vai querer estar perto do espectro mais da arte, onde o objetivo é criar visualizações que engajem e excitam o leitor. Mesmo que para isso a gente perca um pouco nas comparações mais precisivas. E aí, eu enxergo isso como uma balança quando a gente está construindo a visualização de dados. A gente vai precisar equilibrar o ponto da ciência onde a gente quer essa percepção mais precisa. E o visual, e talvez por algumas escolhas visuais, a gente acaba perdendo um pouco essa possibilidade de comparação mais precisiva. E aí, eu queria deixar claro que essa balança não tem nada a ver com você não exibir a informação correta na visualização. Isso é primordial em qualquer visualização que você crie. Ela precisa, de fato, representar aqueles dados que estão sendo mostrados. Mas o que eu quero dizer aqui é que você pode permitir ou você pode reduzir um pouco essa possibilidade de comparações mais precisivas em prol de alguns elementos visuais. Uma segunda definição que eu gosto é a definição que aparece no livro do Andy Kirch, Data Visualization, a Handbook for Data Drive Design. E ele diz o seguinte, que visualização de dados é criar representações visuais e apresentar os dados de forma que facilita o entendimento. E eu gosto dessa definição porque a gente tem quatro aspectos que estão destacados aí nos slides que para mim são fundamentais quando a gente está pensando em uma visualização de dados. O primeiro é o próprio dado. Os dados são nossos fontes de informações, é o ponto de partida de toda visualização e entender o dado é fundamental para que a gente possa construir essas visualizações. Depois que a gente entenda esse conjunto de dados, a gente vai pensar quais são os tipos de representações visuais que a gente vai trabalhar. E aí existe uma série de representações visuais e entender quais representações visuais são mais adequadas para aquele conjunto de dados vai facilitar na construção das visualizações. O outro aspecto é que a gente precisa pensar em como é que a gente vai apresentar essas informações para o usuário. Não é só escolher a representação visual, mas como é que ela vai ser mostrada? E aí eu vou falar um pouquinho sobre isso mais para frente na apresentação. E, por fim, um ponto fundamental na hora de construir visualização é que o objetivo é facilitar o entendimento. O que a gente encontrou é visualização de dados a partir de um conjunto de dados com esse propósito. Para que o leitor daquela visualização ele possa olhar para o que você criou e entenda aquele conjunto de dados sem precisar necessariamente se desbruçar em cima dos dados. Então, eu acho que um ponto fundamental na visualização é exatamente isso que a gente garanta essa facilidade de entendimento. E eu vou linkar isso com os dados abertos. A gente vai ver a importância disso dentro da área de dados abertos. Quando a gente está construindo visualizações quando eu estou falando sobre visualizações eu costumo dizer sempre que visualização de dados não é só construir um gráfico. E, de fato, não é. Existe uma série de aspectos que a gente deve lavar em consideração na hora que a gente está construindo essas visualizações. Eu escolhi aqui três pontos fundamentais que eu acho bem relevantes. Vamos falar sobre cada uma delas para a gente entender como é que isso vai nos ajudar a construir visualizações melhores. O primeiro ponto é entender o publicual. Ou seja, preciso entender para quem eu vou apresentar. A partir do momento em que você sabe para quem você vai apresentar o nível de conhecimento das pessoas que vão receber essa visualização você consegue tomar desses anos melhores de quais representações você vai utilizar. E para ajudar nesse ponto eu trago um esquema que foi elaborado pelo Andy Kirk de seu livro que mostra um pouco como é que a gente percebe uma visualização. E entender esses pontos vai nos ajudar a tomar desses anos melhores na hora de construir uma visualização de dados. E ele divide essa forma de perceber visualizações em três pontos. Primeira percepção, depois a interpretação e depois a compreensão. Que é normalmente como a gente age quando a gente vê uma visualização. A gente primeiro percebe, começa a interpretar e começa a compreender aqueles dados. Então, a primeira coisa quando a gente olha a visualização é os aspectos de percepção. A gente vai começar a ver o que eu vejo, o que eu estou vendo naquela visualização. Tem um grafo, tem uma barra, tem um ponto, tem uma linha. Então, o nosso primeiro contato vem dessa percepção. E essa percepção é muito relacionada com quem cria a visualização. Porque quem cria a visualização é quem vai definir quais são os elementos que comprou aquela visualização e que vai chamar a atenção quando uma pessoa acessa aquela visualização de dados. Depois dessa parte, a gente tem a segunda parte que é a de interpretação. Ou seja, o leitor começa a pensar o que significa. O que significa dado o assunto que aquela visualização está propondo. Então, a gente tem menos controle nessa parte de interpretação mas escolher elementos certos pode ajudar que ele interprete melhor. E outra, quem está interpretando essa visualização já pode ter um conhecimento ou não sobre aquele assunto. E isso vai te guiar você mostrar mais informação ou você reduzir a quantidade de informações que você tem na visualização. E depois que ele percebe, interpreta ele começa a compreender o que que isso significa para mim, o que que eu aprendi com isso, o que que essa visualização me trouxe de informação nova e como é que eu posso usar essa visualização para tomar decisões, por exemplo. Então, a gente tem menos controle nesse processo de compreensão mas as suas decisões lá, no início das decisões do que você colocou na sua visualização pode ajudar a esse usuário a compreender melhor aquele conjunto de dados. A próxima parte que eu acho extremamente enragandante está relacionada com as representações. O que que são as representações? São os tipos de gráficos que a gente vai construir. E existe uma série de representações que a gente pode utilizar e conhecer essas representações é fundamental. Eu trouxe aqui alguns no links que vai nos ajudar a guiar um pouquinho nesse conhecimento dos tipos de representações. Então, o primeiro ponto é conhecer os tipos de gráficos. Nesse link do site StoryTerry você pode acessar aqui no guia de gráficos uma série de gráficos que vocês podem utilizar. Então, acho que esse é o primeiro ponto. Uma vez que você entendeu o conjunto de dados, se você entende o seu público-alvo você agora começa a ver que existe uma série de possibilidades de como é que você vai mostrar esses dados. E aí tem uma coisa bem interessante nessa lista desse conjunto de representações que a gente tem é que a gente consegue relacionar isso, por exemplo, com o quão preciso a gente quer mostrar aquela informação. Então, por exemplo, se eu não tenho a necessidade de que o meu usuário tenha uma definição bem precisa daquele conjunto de dados, eu posso utilizar determinados tipos de representações. Se eu preciso dessa precisão, eu vou usar outros tipos. Então, por exemplo, os gráficos de barra são muito bons para quando você quer fazer uma comparação do que precisa entre dois valores. Já, por exemplo, com uma distribuição de saturação de cores já não vai ser tão bom porque você não vai conseguir ter essa precisão. Então, acho que o primeiro ponto é você entender quais são os tipos de representações visuais que você tem e tomar essa decisão sobre o que você quer mostrar com essas representações visuais. O segundo ponto relacionado às representações visuais, eu trago desse site aqui, frontdata.tubis, que constrói uma árvore das representações visuais mas relacionado com o tipo de dado que você quer. E aí, a gente volta para aquela porta da definição onde a gente precisa entender o tipo de dado antes de criar uma visualização. Os meus dados eles são médicos, categóricos. O que eu tenho de formação? São dados geográficos. Então, a partir do que você tem, você consegue, por exemplo, direcionar um pouco melhor o que você vai utilizar. Então, aqui a gente tem uma árvore de gráficos organizados, por exemplo. Se o meu dado for numérico, eu tenho uma única variável, eu posso usar histogramas. Se eu tenho duas variáveis numéricas, eu já posso utilizar, por exemplo, um gráfico de boxflot e um outro tipo de histograma, ainda de cidade. Então, se os dados são ordenados, se eu tenho três variáveis, se eu tenho um número maior de variáveis numéricas. Então, isso vai do entendimento do seu conjunto de dados. Você entende aquele conjunto de dados que você consegue selecionar melhor as representações visuais que você tem. Só que eu gosto sempre de falar que isso não é uma regra. Não existe uma regra que você tem que usar isso para aquilo. Mas esse guia ajuda bastante para vocês pensarem nisso. E o último ponto sobre as representações que eu acho relevante para quem vai criar uma visualização de dados está relacionado exatamente com os modelos pré-atemptivos. Ou seja, como é que você chama atenção para um determinado ponto na sua visualização? E aí você pode se valer desses atributos pré-atemptivos. E aí eu peguei esse link do site do Carruque. Ele trabalha alguns modelos pré-atemptivos onde você pode ter uma barra maior, você pode ter uma espessura de uma linha maior, mudar a orientação, o tamanho, uma forma, destacar algumas partes, ver as posições, agrupar, trocar as cores, trabalhar com diferentes intensidades de cores ou diferentes contrastes de cores. Isso tudo vai ajudar vocês a chamar a atenção dentro de uma visualização. Então, vamos juntar as três coisas. Eu preciso entender quais representações visuais eu vou trabalhar. Eu preciso entender os meus dados para escolher melhor as representações visuais e eu posso valer de atributos pré-atemptivos para que eu não exiba toda a informação para o meu usuário e que ele possa, você possa guiar o usuário exatamente onde você quer mostrar, onde você que parte da visualização você quer chamar a atenção. Então, acho que esses três pontos são fundamentais para na hora que você vai construir uma visualização de dados. E aí, para que a gente possa fechar essa parte, eu vou para o último ponto que eu acho extremamente importante na hora de criar a visualização, que é relacionar aspectos de inclusão. O que é isso? Cada vez mais, a gente precisa entender o que a gente está utilizando na nossa visualização, a linguagem que a gente vai utilizar, os símbolos que a gente vai utilizar, qual é a paleta de cores que a gente vai utilizar para que a gente possa, nas visualizações, representar a grande diversidade que a gente tem na população e que a gente não acabe colocando nas nossas visualizações estereótipos que já não são mais aceitos na sociedade, nessa sociedade diversa que a gente tem. E aí, eu ilustrei esses slides com três links que eu acho bem interessante para quem está interessado em olhar esse aspecto da visualização. Primeiro, é um artigo do Jonas Weevich que fala sobre a cuidada racial dentro da visualização de dados. Como é que a gente representa diferentes raças dentro das nossas visualizações e que a gente comenta erros onde a gente não acabe sendo representativos ou, de certa forma, a gente cai em estereótipos. A mesma coisa a gente pode pensar na hora que a gente vai representar, por exemplo, os gêneros. E aí, por muitos anos, trabalhou cores como azul para meninos, rosa para meninas. E hoje a gente vive em uma sociedade extremamente diversa onde esses estereótipos já não são mais aceitos. Então, a gente pode ter uma alternativa de paleta de cores muito mais acertiva para isso e esse link ajuda a gente a pensar um pouco melhor nisso. E para o outro, eu trago um artigo do Rodrigo Cunha. O artigo está em espanhol. É o Rodrigo Cunha, pesquisador da área de visualização de dados e trabalha exatamente com o aspecto de acessibilidade para pessoas que têm algum tipo de deficiência visual. E o artigo ele fala bem de como é da preocupação que a gente tem que ter na hora que a gente cria as nossas visualizações para esse grupo de pessoas. E aí, para a gente fechar essa apresentação, eu vou falar um pouquinho da relação da visualização de dados com os dados abertos. Um outro ponto importante dentro da área de dados abertos é como é que a gente vai mostrar esses dados para a população. E aí, quando a gente pensa, por exemplo, em dados públicos, em dados de governos e a gente quer mostrar esses dados, por exemplo, para a população, essa população é extremamente diversa. E a gente precisa pensar em visualizações que atendam a esse público. Uma vez que a gente precisa entender o público, a gente está entendendo o público que é extremamente diverso. E esse impacto de a gente pegar essa visualização para atender esse público é o que vai fazer com que aquelas pessoas entendam aquele conjunto de dados do governo, por exemplo. E que possam, de fato, entender como é que os governos estão agindo porque aquela informação está chegando bem para ela. E ela vai permitir que ela seja, de fato, uma fiscalizadora do bem público. Então, nós, quando a sociedade civil, a gente vai agir na fiscalização do bem público e se a gente consegue mostrar esses dados para a população, a gente tem mais pessoas entendendo essas informações, mais pessoas fiscalizando e mais pessoas interessadas no bem público e na fiscalização das ações dos governos e desses dados que estão sendo disponibilizados. Bom, pessoal, é isso que eu tinha para passar para vocês. Eu deixo aqui nos slides uma série de referências que eu acho relevantes tanto para a área de dados abertos, quanto para a visualização, quanto para a área de dados de geral. E que tem muito material para se trabalhar e são temas bem diversos para a gente falar. Mas em 15 minutos, eu quis resumir um pouquinho para vocês o que é visualização de dados, que são os pontos importantes e como está relacionado com dados abertos. Deixo também um link com algumas visualizações que eu criei. Todas essas visualizações estão com o código aberto e vocês podem acessar e ver quais foram as minhas decisões na hora de criar visualizações. Bom, é isso. Muito obrigado para quem assistiu a esse vídeo. Obrigado a CSP Conferência pela oportunidade de passar aqui um pouquinho do meu conhecimento sobre visualização de dados. É isso. Valeu, pessoal. Até a próxima.