7. Lounge das Representações Visuais#

Neste capítulo, faremos uma aproximação às diversas classes de representações visuais disponíveis em visualização de dados sem explorar ainda as tecnicalidades de construção gráfica, parcela que será coberta no próximo módulo do curso. O nome lounge é sugestivo, pois será onde teremos um encontro casual com diversas espécies de plots que são cotidianamente aplicados para representar dados econômicos, científicos, sociais, industriais, entre outros.

O propósito será compreender a finalidade e a aplicabilidade dos plots. Organizaremos nosso lounge nos seguintes grupos de visualização:

  • quantidades;

  • distribuições;

  • proporções;

  • correlações;

  • dados geoespaciais; e

  • incertezas.

7.1. Plots para visualizar quantidades#

Plots para quantidades são naturalmente ligados a valores numéricos associados a algumas categorias. Neste grupo encontram-se os seguintes gráficos:

  • barras, simples, empilhadas (stacked) ou agrupadas (grouped), dispostas horizontal ou verticalmente;

  • pontos, uma versão simplificada dos gráficos de barras;

  • mapas de calor (heatmap), que quantificam a informação pela cor;

7.1.1. Barras (bar plot)#

Para explorar as possibilidades com gráficos de barras e verificar quando eles são ou não adequados, partiremos de uma fonte de dados relativos ao cinema. Os dataframes a seguir registram as 10 maiores bilheterias do cinema nos Estados Unidos e no Brasil, em milhões de dólares, de acordo com o website Box Office Mojo. Os títulos aparecem conforme veiculados no Brasil.

Filme Bilheteria (M US$)
0 Top Gun: Maverick 718.3
1 Pantera Negra: Wakanda para Sempre 436.5
2 Doutor Estranho no Multiverso da Loucura 411.3
3 Avatar: O Caminho da Água 401.0
4 Jurassic World: Domínio 376.8
5 Minions 2: A Origem de Gru 369.6
6 Batman 369.3
7 Thor: Amor e Trovão 343.2
8 Homem Aranha: Sem Volta para Casa 231.8
9 Sonic 2: O Filme 190.8
Filme Bilheteria (M US$)
0 Homem Aranha: Sem Volta para Casa 56.4
1 Doutor Estranho no Multiverso da Loucura 33.7
2 Avatar: O Caminho da Água 31.4
3 Thor: Amor e Trovão 23.1
4 Minions 2: A Origem de Gru 22.8
5 Batman 22.7
6 Top Gun: Maverick 22.2
7 Pantera Negra: Wakanda para Sempre 21.2
8 Jurassic World: Domínio 15.4
9 Adão Negro 15.3

7.1.1.1. Barras simples (bar plot)#

A maneira mais direta de comparar esses números é plotando um gráfico de barras. Vamos testar a disposição vertical.

../_images/07a-lounge_6_0.png

Porém, a pergunta é: quais são os filmes?! Como vemos, a identificação dos nomes dos filmes está prejudicada porque são legendas longas. Vamos testar com rotação.

../_images/07a-lounge_8_0.png

O visual não parece bom porque os nomes ainda são difíceis de ler. Vamos tentar com barras horizontais.

../_images/07a-lounge_10_0.png

Com as barras horizontais, os nomes dos filmes são melhor identificáveis. Porém, há uma série de melhorias ainda a fazer neste visual. Vamos discuti-las posteriormente.

7.1.1.2. Barras agrupadas (grouped bar plot)#

Enquanto as barras simples são capazes de mostrar como quantidades variam em relação a apenas uma categoria, as barras agrupadas são capazes de mostrar variação de quantidades em mais do que uma categoria. No exemplo anterior, a categoria única era o nome dos filmes. Agora, vamos criar um gráfico de barras agrupadas colocando lado a lado os filmes do TOP 10 internacional que também estiveram entre os TOP 10 do Brasil e criar uma categorização baseada na localização geográfica.

Primeiramente, vamos localizar os filmes intersectantes.

Filme Bilheteria (M US$)_x Bilheteria (M US$)_y
0 Top Gun: Maverick 718.3 22.2
1 Pantera Negra: Wakanda para Sempre 436.5 21.2
2 Doutor Estranho no Multiverso da Loucura 411.3 33.7
3 Avatar: O Caminho da Água 401.0 31.4
4 Jurassic World: Domínio 376.8 15.4
5 Minions 2: A Origem de Gru 369.6 22.8
6 Batman 369.3 22.7
7 Thor: Amor e Trovão 343.2 23.1
8 Homem Aranha: Sem Volta para Casa 231.8 56.4

Em seguida, vamos converter os valores das bilheterias em dólares para reais utilizando a taxa de câmbio PTAX 1:5.2171 (dezembro de 2022) e renomear as variáveis de dados.

Filme Bilheteria - BR Bilheteria - US
0 Top Gun: Maverick 115.81962 3747.44293
1 Pantera Negra: Wakanda para Sempre 110.60252 2277.26415
2 Doutor Estranho no Multiverso da Loucura 175.81627 2145.79323
3 Avatar: O Caminho da Água 163.81694 2092.05710
4 Jurassic World: Domínio 80.34334 1965.80328
5 Minions 2: A Origem de Gru 118.94988 1928.24016
6 Batman 118.42817 1926.67503
7 Thor: Amor e Trovão 120.51501 1790.50872
8 Homem Aranha: Sem Volta para Casa 294.24444 1209.32378

Em seguida, manipularemos os nossos dados para identificar cada filme e seu valor pela categoria “Local”.

../_images/07a-lounge_17_0.png

7.1.1.3. Barras empilhadas (stacked bar plot)#

Barras empilhadas são adequadas para visualizar quantidades que produzem um total significativo a partir de parcelas que exibem, com clareza, suas proporções para este todo. No exemplo a seguir, procuramos mostrar o peso das bilheterias dos filmes assistidos no Brasil comparado ao peso das bilheterias dos filmes assistidos nos Estados Unidos. Isto é, cada barra representa a soma, em reais, angariada por cada filme nos dois países e cada segmento as parcelas desta soma por localidade. Como se vê, a bilheteria americana é consideravelmente maior do que a brasileira em todos os filmes. Entretanto, percebemos que a ordem de preferência do público americano não se equiparou a da audiência brasileira.

../_images/07a-lounge_19_0.png

7.1.2. Pontos (dot plot)#

O plot de pontos simplifica a escala representada visualmente por gráficos de barra. A posição do ponto marca a quantidade expressa no eixo correspondente. Vimos um exemplo aplicado deste gráfico na Seção 6.1.1.2.7. Na representação abaixo, utilizamos a mesma fonte de dados para plotar as áreas de uma amostra de 35 municípios. A escala logarítmica permite que tenhamos uma visão ampla da extensão em quilômetros quadrados por meio de potências de 10.

../_images/07a-lounge_21_0.png

7.1.3. Mapas de calor (heatmap)#

Alternativamente às representações visuais quantitativas criadas por barras, podemos utilizar os chamados mapas de calor, que permite mapear valores em cores. Utilizaremos um mapa de calor para quantificar visualmente dados sobre crimes violentos.

No dataframe abaixo estão os resultados de uma pesquisa sobre Crimes Violentos Letais Intencionais (CVLI) cometidos em João Pessoa entre 2015 e 2018 (Dados disponíveis aqui). Em particular, constam nele a prevalência dos crimes além das tipologias de armas utilizadas entre 2015 e o primeiro semestre de 2019.

A prevalência permite compreender o quanto é comum, ou rara, uma determinada ocorrência ou situação numa população. A prevalência \(p\) é dada pela equação

\[p = \dfrac{T}{P} \times 1000,\]

onde \(T\) é a quantidade de casos registrados de CVLI e \(P\) a população de um determinado bairro.

Bairros Prevalência Arma de fogo Arma branca Outros Total de casos
0 Varadouro 15.05 44 8 4 56
1 Centro 12.34 27 14 4 45
2 Mandacaru 5.72 64 5 3 72
3 Grotão 5.68 31 4 0 35
4 Bairro das Indústrias 5.51 46 2 0 48
5 Costa do Sol 4.44 26 6 5 37
6 Distrito Industrial 4.24 5 3 0 8
7 Penha 3.89 3 0 1 3
8 Ilha do Bispo 3.63 26 1 2 29
9 Costa e Silva 3.53 24 3 1 29
10 Roger 3.47 26 5 5 36
11 Gramame 3.14 70 8 5 81
12 Varjão 3.18 49 2 3 54
13 Trincheiras 3.15 13 4 5 22
14 Padre Zé 2.02 20 0 1 21
15 Mangabeira 1.65 109 15 2 126

Manipulando os dataframe, conseguimos gerar dois mapas de calor de coluna única, visto que os dados temporais originais agregam os registros entre 2015 e 2018. O primeiro mapa gera uma escala de cor sequencial para a prevalência, ao passo que o segundo mapa faz o mesmo para a quantidade de crimes realizados com arma de fogo.

A partir do que vemos, é imediata a identificação dos bairros de maior/menor prevalência e de crimes com porte de arma de fogo.

Bairros Prevalência Arma de fogo Arma branca Outros Total de casos Ano
0 Varadouro 15.05 44 8 4 56 2015-2018
1 Centro 12.34 27 14 4 45 2015-2018
2 Mandacaru 5.72 64 5 3 72 2015-2018
3 Grotão 5.68 31 4 0 35 2015-2018
4 Bairro das Indústrias 5.51 46 2 0 48 2015-2018
5 Costa do Sol 4.44 26 6 5 37 2015-2018
6 Distrito Industrial 4.24 5 3 0 8 2015-2018
7 Penha 3.89 3 0 1 3 2015-2018
8 Ilha do Bispo 3.63 26 1 2 29 2015-2018
9 Costa e Silva 3.53 24 3 1 29 2015-2018
10 Roger 3.47 26 5 5 36 2015-2018
12 Varjão 3.18 49 2 3 54 2015-2018
13 Trincheiras 3.15 13 4 5 22 2015-2018
11 Gramame 3.14 70 8 5 81 2015-2018
14 Padre Zé 2.02 20 0 1 21 2015-2018
15 Mangabeira 1.65 109 15 2 126 2015-2018
../_images/07a-lounge_26_0.png

7.2. Plots para visualizar distribuições#

A estatística descritiva é limitada para resumir dados, visto que dados com características completamente distintas podem ter os mesmos valores para média, mediana e variância, por exemplo. Uma forma aprofundada de reconhecer as características dos dados é inspecionar a sua distribuição. No grupo das distribuições, consideraremos os seguintes plots:

  • histogramas, com intervalo de classes uniforme;

  • densidades, incluindo densidade simples;

  • cumulativos, incluindo densidade cumulativa empírica;

  • quantis, abrangendo o quantil-quantil (QQ-plot);

A fim de criar as primeiras representações visuais para este grupo, usaremos dados estatísticos reais concernentes a ànalise de um processo de moldagem em uma linha de produção de uma indústria química do Rio Grande do Sul. O propósito da análise era investigar inconsistências do processo. A tabela a seguir registra massas de amostras extraídas de duas matrizes (2 e 7) ao longo de três dias a cada 30 minutos no período compreendido entre 07:00h e 13:00h ([Saldanha et al., 2013]).

Horário Peso (g) Dia Matriz
0 07:00 39.2 1 2
1 07:30 39.4 1 2
2 08:00 39.7 1 2
3 08:30 39.2 1 2
4 09:00 39.6 1 2
... ... ... ... ...
73 11:00 39.8 3 7
74 11:30 40.2 3 7
75 12:00 40.3 3 7
76 12:30 39.9 3 7
77 13:00 40.4 3 7

78 rows × 4 columns

7.2.1. Histograma#

O histograma é a representação visual mais comumemente empregada para retratar distribuições. O gráfico é composto de retângulos preenchidos cujas alturas correspondem às frequências de observação de determinados valores que compreendem um intervalo de classe.

Na figura a seguir plotamos histogramas para as massas dos produtos processados em cada uma das matrizes. Por brevidade, consideramos no histograma todos os valores registrados ao longo dos 3 dias. Observamos que há lacunas nos histogramas pela ausência de massas reportadas nas respectivas massas.

../_images/07a-lounge_31_0.png

7.2.2. Densidade simples#

Plots de densidade simples são versões contínuas dos histogramas e vem ganhando popularidade devido à facilitação de sua construção por ferramentas computacionais modernas. Nesses gráficos, a frequência das quantidades é representada por uma curva suave que, na verdade, é uma aproximação da distribuição de probabilidade fundamental que explica o comportamento real – a qual é desconhecida. Tem sido frequente a estimativa da curva de densidade pela técnica dos estimadores de núcleo (kernel density estimator, ou simplesmente, KDE).

A metodologia do KDE recompõe a curva contínua através da mistura (combinação) de várias funções conhecidas como “núcleos” (kernels) que são abertos em torno de cada ponto amostrado dentro de uma largura de banda predefinida. Há diversos tipos de kernel possíveis de se trabalhar, tais como exponencial, linear, epanechnikov e o mais popular de todos, o gaussiano.

Abaixo, fazemos plotagens da densidade de distribuição para cada matriz da indústria. O último plot contém as duas distribuições. Vê-se que a curva “imita” o comportamento já visualizado no gráfico.

../_images/07a-lounge_33_0.png

No próximo exemplo, plotamos os histogramas juntamente com a curva estimada por KDE.

../_images/07a-lounge_35_0.png

7.2.3. Densidade cumulativa#

Histogramas e plots de densidade possuem o revés de dependerem de parâmetros que são escolhidos pelo usuário, tais como o número de intervalos de classe (bins, ou bin widths) e a largura de banda. Pelo fato de que eles podem ser livremente alterados, esses gráficos tornam-se mais uma interpretação dos dados do que uma visualização direta deles. A desvantagem é que eles são menos intuitivos.

Opostamente, plots de densidade simplesmente mostram os dados de uma só vez, sem uso de parâmetros. Para entender minimamente o conceito de densidade cumulativa, ou também de densidade cumulativa empírica (representada pelo acrônimo ECDF), usaremos um rol de dados que contém a nota auferida por estudantes de uma classe de Engenharia formada por 60 pessoas na primeira avaliação. A tabela pode ser encontrada a seguir.

Estudante Nota
0 1 4.7
1 2 6.9
2 3 7.1
3 4 7.0
4 5 5.2
5 6 7.8
6 7 7.2
7 8 5.2
8 9 6.6
9 10 4.1
10 11 8.1
11 12 6.4
12 13 8.1
13 14 7.8
14 15 5.6
15 16 7.1
16 17 3.4
17 18 7.2
18 19 6.9
19 20 7.0
20 21 6.4
21 22 2.7
22 23 3.5
23 24 4.5
24 25 7.3
25 26 7.2
26 27 7.6
27 28 8.4
28 29 8.0
29 30 7.9
30 31 7.2
31 32 7.7
32 33 7.0
33 34 9.1
34 35 9.0
35 36 8.4
36 37 8.1
37 38 7.2
38 39 6.7
39 40 8.0
40 41 5.2
41 42 6.3
42 43 7.4
43 44 4.5
44 45 7.9
45 46 7.9
46 47 2.1
47 48 7.1
48 49 8.2
49 50 9.8
50 51 10.0
51 52 8.3
52 53 7.2
53 54 4.1
54 55 8.3
55 56 7.0
56 57 7.3
57 58 6.4
58 59 7.3
59 60 9.5

A distribuição cumulativa é uma representação visual que fornece dois caminhos de compreensão para os dados quantitativos em análise.

Em primeiro lugar, sob o ponto de vista de contagem. Neste caso particular, a nota de cada estudante é disposta no eixo horizontal, enquanto que no eixo vertical consta um “ranqueamento ascendente” de estudantes. A curva cresce cumulativamente daquele(a) estudante que possui a nota mais baixa (ranqueamento 1) até o(a) estudante que possui a maior nota (ranqueamento 60).

Em segundo lugar, sob o ponto de vista de proporção. Neste caso particular, a nota de cada estudante é disposta no eixo horizontal, enquanto que no eixo vertical consta a proporção de estudantes que atingiram determinada nota. A curva é idêntica, mas podemos verificar rapidamente o ranqueamento por percentuais. Por exemplo, o gráfico mostra que em torno de 25% da turma conseguiu nota, no máximo de 6,0.

../_images/07a-lounge_39_0.png

7.2.4. Quantis#

Quantis são uma espécie de “ranqueamento” dos dados. Quando divididos em frações de 100, são chamados de percentis. Um jogador de futebol avaliado estatisticamete com percentil de 86%, por exemplo, indicaria que ele está entre os 14% melhores jogadores de futebol. Quantis então servem para dividir os dados ordenados em subconjuntos.

O plot chamado de quantil-quantil, ou QQ plot, é bastante utilizado para testar se os dados observados seguem uma determinada distribuição teórica. Quando a distribuição teórica é a normal, chamamos o gráfico de plot de probabilidades normal (veja também similaridades com o plot de probabilidades, PP-plot).

Um QQ-plot é um plot de pontos. Geralmente, coloca-se uma reta de referência. Quando os pontos desviam-se desta reta, os dados observados supostamente seguem uma distribuição que não coincide com a teórica. Em geral, é quase impossível atingir tal coincidência.

Para QQ-plots, deveremos instalar o módulo seaborn-qqplot utilizando pip para acessar a função pplot. Este módulo é uma extensão do seaborn.

Feitos esses passos, conseguimos gerar o seguinte gráfico de teste.

../_images/07a-lounge_41_0.png

7.3. Plots para visualizar proporções#

A visualização de proporções deve levar em conta projetos gráficos que sejam capazes de mostrar como algum grupo, entitade ou quantidade pode ser “quebrada” em partes menores, assim constituindo uma proporção do todo. Classicamente, o gráfico de “torta” (pie chart) é o mais tradicionalmente aplicado quando o interesse é visualizar proporções. Entretanto, muitos profissionais criticam seu uso exagerado.

Torna-se complicado interpretar gráficos de torta quando ele possui “fatias” excessivas. Por outro lado, quando ele é dividido em poucas partes, seu uso é recomendado. A polêmica em torno deste gráfico não é puramente nociva. Ela apenas ressalta a inexistência de representações “ótimas” para proporções. De fato, neste grupo de plotagem, não faremos uma separação explícita sobre os estilos, mas consideraremos uma miscelânea de plots, tanto inspirados na estrutura de outros grupos, mas adequados para representar proporções, quanto mais genéricos, que incorporam mosaicos, árvores estruturadas (treemap), diagramas de Venn, donut, dendrogramas e raios de sol (sunburst).

7.3.1. Barras#

Podemos visualizar proporções diretamente a partir de gráficos de barras. Usaremos dados do SIVIBE/MAPA sobre vinhos e bebidas para exemplos. (Nota: para operacionalizar planilhas do Excel, poderá ser necessária a instalação do módulo openpyxl).

Abaixo fazemos

Código propriedade Classificação Área Parreiral (calc) ha
0 1717411 Vinífera 14644.128633
1 1715835 Vinífera 2085.518510
2 1712357 Híbrida 12.548700
3 1712357 Vinífera 1832.432534
4 1712721 Americana 13.185600
... ... ... ...
41407 1731195 Híbrida 2.240000
41408 1731050 Americana 0.000000
41409 1730884 Vinífera 5.792904
41410 1730188 Híbrida 0.000000
41411 1729179 Híbrida 4.024428

41412 rows × 3 columns

../_images/07a-lounge_45_0.png

7.3.2. Fatias#

../_images/07a-lounge_47_0.png

7.3.3. Diagrama de Venn#

Vamos fazer um comparativo de um grupo de artistas que apenas cantam, apenas atuam ou cantam e atuam. A tabela está disposta a seguir:

Artista Canta Atua
0 Marisa Orth sim sim
1 Preta Gil sim sim
2 Clarice Falcão sim sim
3 Mariana Rios sim sim
4 Marjorie Estiano sim sim
5 Alexandre Nero sim sim
6 Chay Suede sim sim
7 Fiuk sim sim
8 Fábio Jr. sim sim
9 Evandro Mesquita sim sim
10 Seu Jorge sim sim
11 Djavan sim não
12 Lenine sim não
13 Wesley Safadão sim não
14 Ana Carolina sim não
15 Marisa Monte sim não
16 Milton Nascimento sim não
17 Bruno Gagliasso não sim
18 Osmar Prado não sim
19 Luana Piovani não sim
20 Caio Blat não sim
21 Caio Castro não sim
22 Rodrigo Lombardi não sim
23 Fernanda Montenegro não sim

Para plotar diagramas de Venn, é necessário instalar o módulo matplotlib_venn (use pip). Na representação simples abaixo, temos os conjuntos variando o diâmetro em função da cardinalidade de seus elementos.

../_images/07a-lounge_52_0.png

7.3.4. Árvore estruturada#

O diagrama de árvore estruturada (treemap) permite seccionar um todo em áreas representativas, como mostramos na apresentação deste curso. O treemap abaixo exibe o conteúdo deste curso em termos de quadros de tamanhos que variam em função da carga horária aproximada dos módulos e avaliações.

7.4. Plots para visualizar correlações#

Correlação é qualquer associação estatística entre um par de variáveis. Quanto mais correlacionadas estão duas variáveis, mais “alinhamento” há entre elas. Isto é, uma análise de correlação fornece um número que resume o grau de relacionamento linear entre duas variáveis. Introduziremos este assunto com alguns conceitos fundamentais.

Podemos interpretar a correlação também pelo ponto de vista de “dependência linear”. Duas variáveis perfeitamente correlacionadas são similares a dois vetores paralelos, ou seja, linearmente dependentes. Por outro lado, duas variáveis totalmente não correlacionadas são similares a dois vetores perpendiculares, ou seja, linearmente independentes.

Neste grupo também não apresentaremos uma divisão enfática dos tipos de representações dada a sua variedade. Estão incluídos aqui os seguintes plots:

  • dispersão (scatter plot), bolhas (bubble chart), inclinação (slopegraph), linhas;

  • contornos de densidade, classes 2D (2D bins), classes hexagonais (hex bins);

  • correlograma.

Para grandes dados, plots de dispersão tornam-se pouco informativos devido ao emaranhado de pontos. Em um cenário como este, são preferíveis os plots de contornos e classes. Para mais do que duas quantidades, correlogramas são recomendados.

Discutiremos apenas alguns exemplos.

7.4.1. Dispersão#

Este exemplo investiga a dispersão existente entre dois métodos que explicam o crescimento fetal em função da semana gestacional. O gráfico à esquerda mostra a curva de Hadlock e de Duryea, ambas para o percentil 10. À direita, plotamos o gráfico de dispersão entre ambas as curvas para saber como elas se correlacionam. A existência de uma “barriga” abaixo da linha pontilhada mostra que elas, de fato, são diferentes, embora possuam uma tendência equivalente. Caso todos os pontos verdes estivessem sobre a reta tracejada, diríamos que elas seriam idênticas. Ou seja, a dispersão é baixa.

../_images/07a-lounge_58_0.png

7.5. Plots para visualizar dados geoespaciais#

Dados geoespaciais são melhor dispostos através de mapas que projetam coordenadas do globo terrestre em superfícies planas. Geralmente, os mapas seguem o formato e as fronteiras de territórios. Neste grupo encontram-se:

  • coropletas, ou mapas coropléticos (choropleth), que colorem regiões do mapa para realizar associações com quantidades ou categorias.

  • cartogramas, que se constituem em representações distorcidas ou simplificadas das regiões. Por exemplo, associar estados da federação a formas retangulares menores arranjadas sobre uma forma poligonal maior próxima ao formato do Brasil.

O exemplo a seguir é uma coropleta para a população brasileira segundo dados do IBGE para o Censo 2022. Os valores são exibidos na tabela.

/Users/gustavo/opt/anaconda3/envs/dataviz/lib/python3.9/site-packages/geopandas/plotting.py:48: ShapelyDeprecationWarning: The 'type' attribute is deprecated, and will be removed in the future. You can use the 'geom_type' attribute instead.
  if geom is not None and geom.type.startswith(prefix) and not geom.is_empty:
../_images/07a-lounge_61_1.png
pop
UF Pop 2022 geometry
0 Acre 830018.0 POLYGON ((-68.10553 -10.72192, -68.10547 -10.7...
1 Alagoas 3127683.0 MULTIPOLYGON (((-35.88986 -9.84431, -35.88986 ...
2 Amapá 733759.0 MULTIPOLYGON (((-50.82570 2.52208, -50.82570 2...
3 Amazonas 3941613.0 POLYGON ((-58.13699 -7.35614, -58.13682 -7.356...
4 Bahia 14141626.0 MULTIPOLYGON (((-38.69208 -17.95958, -38.69208...
5 Ceará 8794957.0 MULTIPOLYGON (((-40.83181 -2.88125, -40.83181 ...
6 Distrito Federal 2817381.0 POLYGON ((-47.93915 -16.05135, -48.02110 -16.0...
7 Espírito Santo 3833712.0 MULTIPOLYGON (((-40.88403 -21.16125, -40.88403...
8 Goiás 7056495.0 POLYGON ((-49.00480 -18.53718, -49.01248 -18.5...
9 Maranhão 6776699.0 MULTIPOLYGON (((-44.54986 -1.88458, -44.54986 ...
10 Mato Grosso 3658649.0 POLYGON ((-52.47143 -16.12672, -52.48842 -16.1...
11 Mato Grosso do Sul 2757013.0 POLYGON ((-54.16836 -23.99920, -54.17063 -24.0...
12 Minas Gerais 20539989.0 POLYGON ((-50.84402 -19.96758, -50.85332 -19.9...
13 Paraná 11444380.0 MULTIPOLYGON (((-48.36514 -25.73403, -48.36514...
14 Paraíba 3974687.0 MULTIPOLYGON (((-43.01208 -9.40801, -43.01453 ...
15 Pará 8120131.0 MULTIPOLYGON (((-47.29792 -0.63375, -47.29792 ...
16 Pernambuco 9058931.0 MULTIPOLYGON (((-35.13597 -8.83792, -35.13597 ...
17 Piauí 3271199.0 POLYGON ((-42.69078 -9.54547, -42.69122 -9.545...
18 Rio Grande do Norte 3302729.0 MULTIPOLYGON (((-35.10958 -6.19375, -35.10958 ...
19 Rio Grande do Sul 10882965.0 MULTIPOLYGON (((-52.07069 -32.02847, -52.07069...
20 Rio de Janeiro 16055174.0 MULTIPOLYGON (((-44.67125 -23.35458, -44.67125...
21 Rondônia 1581196.0 POLYGON ((-62.89219 -12.86014, -62.89212 -12.8...
22 Roraima 636707.0 POLYGON ((-60.03790 0.26349, -60.04676 0.23211...
23 Santa Catarina 7610361.0 MULTIPOLYGON (((-48.54236 -27.93180, -48.54236...
24 Sergipe 2210004.0 MULTIPOLYGON (((-37.38458 -11.45986, -37.38458...
25 São Paulo 44411238.0 MULTIPOLYGON (((-48.08236 -25.28431, -48.08236...
26 Tocantins 1511460.0 POLYGON ((-49.23736 -12.88397, -49.23532 -12.8...

7.6. Plots para visualizar incertezas#

Incertezas são inerentes a medições experimentais e laboratoriais, bem como a cálculos que envolvem estimativas e previsões sobre ocorrências futuras. Geralmente, incertezas são representadas por barras ou áreas que se estendem em torno de um ponto ou linha de referência. Neste grupo, incluem-se os plots acompanhados de barras de erro de intervalos de confiança.

7.7. Referências#

SRB+13

Paulo Saldanha, Carolina Kirsch Rothe, Fabiana Regina Benedett, Diego Augusto de Jesus Pacheco, Carlos Fernando Jung, and Carla Scwenberg TEN CATEN. Analisando a aplicação do controle estatístico de processos na indústria química: um estudo de caso. Espacios (Caracas), 34:1–18, 2013.