Visualização de dados para iniciantes no RStudio
Uma estratégia de visualizar os dados, tomar decisões e representar uma ideia é por meio de gráficos. O gráfico é uma representação em forma geométrica construída de maneira exata e precisa de informações numéricas, que por sua vez foram organizadas em formato tabela.
A visualização de dados por representação geométrica, contempla de uma série de camadas, construída por: dados, tema, coordenadas, estética, geometria, facets e estatística.
Dentro desse racional, o programa RStudio se insere como uma estratégia para construir gráficos personalizados, em outras palavras, criar gráficos construídos camada por camada, cujo resultado é a visualização dados na forma como você precisa.
O RStudio oferece um pacote básico de formação em gráficos, como:
- graphics: por funções básicas é possível realizar gráficos (plot, hist e blott).
- grDevices: contém as implementações de dispositivos gráficos com X11, pdf, PostScript, png)
- Existem gráficos mais completos e profissionais usando pacotes como ggplot2, lattice e outros pacotes R.
*Para começar recomendo que não tente decorar os parâmetros, e sim foque no racional da construção da linguagem.
ATENÇÃO: Sempre se certifique quanto ao local de armazenamento de documentos, aconselho que coloque em um repositório só do computador. Use a função setwd() e a getwd() para isso.
1. Funções básicas para criar gráficos:
Plot
Assim você define as suas variáveis, não necessariamente existe a necessidade de ser x e y, pode ser apresentado por construção de vetores:
No R temos já alguns data frames prontos para treino e análises, basta que procuremos por eles. Um exemplo é o Lynx.
A opção View irá mostrar a tabela:
*Nesse caso o dataset é simples por isso não precisa especificar. Mas no caso de tabelas maiores e mais complexas, recomendo separar as colunas que você irá trabalhar ou durante a formação da função especificar as colunas da análise.
Resultado do gráfico:
2. Especificando os parâmetros
*col — cor do plot
* lty — tipo de linha
*lwd — largura de linha
* pch — símbolo no plot
* xlab — label do eixo x
* ylab — label do eixo y
* las — como os labels dos eixos são orientados
* bg — background color
* mfrow — número de plots por linha
* mfcool — número de plots por coluna
-> Funções Básicas de Plot
* plot() — scatterplots
* lines() — adiciona linhas ao gráfico
* points() — adiciona pontos ao gráfico
* text() — adiciona label ao gráfico
* title() — adiciona título ao gráfico
3. Parâmetros dos Gráficos
?par
par()
par(‘pch’)
par(‘lty’)
- vai aumentar ou diminuir os parâmetros na sessão R
Dicas
-> Em caso de dúvida de cor chama a função “colors()” e selecione a que quiser
-> Em caso de dúvida dos parâmetros para a função desejada chama o help que irá aparecer um documento explicando tudo sobre
Ex:
?plot
-> Você pode abrir os gráficos na própria plataforma ou abrir um função para salvar e outro documento como png e pdf
Ex:
Abaixo o arquivo Graf1 no repositório:
Gráfico formado:
5. Pacote Plotrix
A partir do pacote plotrix você pode estender as funções básicas do plot
Para isso:
- Dois plots juntos
Aconselho que abra o Rstudio e digite esse código, irá observar que a cada linha são acrescentadas novas informações e novos parâmetros.
1- Especificou o tipo de gráfico, as colunas do dataset para a análise, o tipo de linha, cor e o que gostaria de estar escrito no eixo x e eixo y
2- Inclusão de parâmetros, cores e tamanho
3- Inclusão de um novo plot
Resultado:
6. Plot de datasets
Para fazer gráficos de um dataset baixado, primeiro você chama por função o arquivo.
- Você pode alterar o nome das colunas chamando “mycol”
- Você pode mudar a escala
*Depois chamar na função