Visualização de dados para iniciantes no RStudio

Luíza Martins
5 min readJun 4, 2021

--

Uma estratégia de visualizar os dados, tomar decisões e representar uma ideia é por meio de gráficos. O gráfico é uma representação em forma geométrica construída de maneira exata e precisa de informações numéricas, que por sua vez foram organizadas em formato tabela.

A visualização de dados por representação geométrica, contempla de uma série de camadas, construída por: dados, tema, coordenadas, estética, geometria, facets e estatística.

Dentro desse racional, o programa RStudio se insere como uma estratégia para construir gráficos personalizados, em outras palavras, criar gráficos construídos camada por camada, cujo resultado é a visualização dados na forma como você precisa.

O RStudio oferece um pacote básico de formação em gráficos, como:

  • graphics: por funções básicas é possível realizar gráficos (plot, hist e blott).
  • grDevices: contém as implementações de dispositivos gráficos com X11, pdf, PostScript, png)
  • Existem gráficos mais completos e profissionais usando pacotes como ggplot2, lattice e outros pacotes R.

*Para começar recomendo que não tente decorar os parâmetros, e sim foque no racional da construção da linguagem.

ATENÇÃO: Sempre se certifique quanto ao local de armazenamento de documentos, aconselho que coloque em um repositório só do computador. Use a função setwd() e a getwd() para isso.

1. Funções básicas para criar gráficos:

Plot

Assim você define as suas variáveis, não necessariamente existe a necessidade de ser x e y, pode ser apresentado por construção de vetores:

No R temos já alguns data frames prontos para treino e análises, basta que procuremos por eles. Um exemplo é o Lynx.

A opção View irá mostrar a tabela:

*Nesse caso o dataset é simples por isso não precisa especificar. Mas no caso de tabelas maiores e mais complexas, recomendo separar as colunas que você irá trabalhar ou durante a formação da função especificar as colunas da análise.

Resultado do gráfico:

2. Especificando os parâmetros

*col — cor do plot

* lty — tipo de linha

*lwd — largura de linha

* pch — símbolo no plot

* xlab — label do eixo x

* ylab — label do eixo y

* las — como os labels dos eixos são orientados

* bg — background color

* mfrow — número de plots por linha

* mfcool — número de plots por coluna

-> Funções Básicas de Plot

* plot() — scatterplots

* lines() — adiciona linhas ao gráfico

* points() — adiciona pontos ao gráfico

* text() — adiciona label ao gráfico

* title() — adiciona título ao gráfico

3. Parâmetros dos Gráficos

?par

par()

par(‘pch’)

par(‘lty’)

  • vai aumentar ou diminuir os parâmetros na sessão R

Dicas

-> Em caso de dúvida de cor chama a função “colors()” e selecione a que quiser

-> Em caso de dúvida dos parâmetros para a função desejada chama o help que irá aparecer um documento explicando tudo sobre

Ex:

?plot

-> Você pode abrir os gráficos na própria plataforma ou abrir um função para salvar e outro documento como png e pdf

Ex:

Abaixo o arquivo Graf1 no repositório:

Gráfico formado:

5. Pacote Plotrix

A partir do pacote plotrix você pode estender as funções básicas do plot

Para isso:

  • Dois plots juntos

Aconselho que abra o Rstudio e digite esse código, irá observar que a cada linha são acrescentadas novas informações e novos parâmetros.

1- Especificou o tipo de gráfico, as colunas do dataset para a análise, o tipo de linha, cor e o que gostaria de estar escrito no eixo x e eixo y

2- Inclusão de parâmetros, cores e tamanho

3- Inclusão de um novo plot

Resultado:

6. Plot de datasets

Para fazer gráficos de um dataset baixado, primeiro você chama por função o arquivo.

  • Você pode alterar o nome das colunas chamando “mycol”
  • Você pode mudar a escala

*Depois chamar na função

--

--

Luíza Martins
Luíza Martins

Written by Luíza Martins

Data intern da Growth Machine e aprendiz da área de ciência de dados.

No responses yet