Como customizar o seu gráfico no R Studio (part 1)

Luíza Martins
5 min readJun 11, 2021

--

O R Studio é uma ferramenta de análise de dados que possibilita a confecção de diferentes tipos de gráficos.

De maneira mais simples, você pode começar usando o pacote que o R Studio que oferece chamado de Basic Plotting System.

Essa ferramenta os códigos são mais simples, e os gráficos são mais simples também.

A desvantagem disso é que gráficos mais simples e por vezes podem não representar a ideia que você gostaria de transmitir, e por ter a modelagem mais simples ele “peca” no quesito design.

A importância de um design que chame atenção do público é tão importante quanto a construção da análise do dado.

Pense bem: como você irá passar a sua informação ao chefe/ público-alvo, se você mesmo vê que o gráfico não está tão claro?

Hoje em dia, o quesito de melhora de design pode ser ajudado de diferentes formas que podem ser solucionadas tanto no próprio R Studio, quanto em plataformas adjacentes como o Power Bi ou Tableau.

No texto de hoje, irei demonstrar como você pode começar nesse caminho de customização do gráfico usando a ferramenta do R Studio.

Dentre as diferentes formas de aprimorar os dados no R Studio, temos o pacote ggplot2.

É um sistema gráfico completo, alternativo ao sistema básico do gráfico do R, e por isso oferece mais opções de modificações, legendas prontas e formatação mais sólida.

Primeiro instalei e rodei o pacote:

Em segundo, vou chamar um dataset que vem na linguagem R:

*a forma reShape2 ajusta forma de dados

*observe a linguagem: chamou a função qplot, colocou as observações, o tipo de dataset, o tipo de gráfico.

Resultado:

*o resultado gerado é de um gráfico Scatterplot (gráfico de pontos)

Outra forma de construir gráficos mais rebuscados é fazer essa “montagem” camada por camada.

Camada 1:

*repare na escrita geom_point é o tipo de gráfico, tipo de mapeamento aesthetic, em seguida colocou as variáveis x e y, e a cor, o tipo de dataset e o tamanho.

*chamou a função ggplot() e adicionou a primeira camada

Resultado:

Outro exemplo, de aplicação do pacote ggplot2 é da criação de modelos de regressão.

*lm é linear model ela abre a fómula para incluir as variáveis

Para olhar o modelo você pode chamar a função head:

Para criar uma nova camada, ou seja, adicionar novas informações:

Resultado:

*o resultado disso já é possível observar a criação de uma linha de regressão

E mais, para criar uma nova camada 3:

Resultado:

*nesse novo gráfico foi possível observar a construção de uma faixa de erro

Você pode construir o mesmo gráfico pela versão otimizada:

Pra quê criar camadas se tem a versão otimizada??

A questão é que criar camadas te ajuda a visualizar se o gráfico está sendo construído no caminho que você gostaria que ele for visualizado, por isso você tem as duas opções.

Outro exemplo é da criação de um barplot usando o pacote ggplot2.

Primeiro, chamei um data frame:

Em seguida, apliquei a fórmula estatística:

*primeiro faz uma cumsum = soma acumulada

Depois, apliquei o modelo:

Resultado:

*nesse caso a geometria é diferente dos anteriores é chamado de geom_rect

Você pode criar histogramas, como:

Resultado:

Pode parecer simples mas construindo as camadas você pode ir construindo o gráfico e o tornando visualmente mais atraente.

Então, acredito que através dos exemplos citados você pode entender que o racional para customizar um gráfico no R é você ir criando camadas e o modificando. Assim, você pode ir avaliando se o gráfico está se tornando mais atraente para o público, e ir modelando até chegar no ponto para uma apresentação clara.

Lembrando esse é apenas um dos exemplos de pacote. No R Studio você pode encontrar outros, mas posso te garantir que o racional para construção será parecida com essa, no sentindo de criar camadas.

--

--

Luíza Martins
Luíza Martins

Written by Luíza Martins

Data intern da Growth Machine e aprendiz da área de ciência de dados.

No responses yet