Como customizar o seu gráfico no R Studio (part 1)
O R Studio é uma ferramenta de análise de dados que possibilita a confecção de diferentes tipos de gráficos.
De maneira mais simples, você pode começar usando o pacote que o R Studio que oferece chamado de Basic Plotting System.
Essa ferramenta os códigos são mais simples, e os gráficos são mais simples também.
A desvantagem disso é que gráficos mais simples e por vezes podem não representar a ideia que você gostaria de transmitir, e por ter a modelagem mais simples ele “peca” no quesito design.
A importância de um design que chame atenção do público é tão importante quanto a construção da análise do dado.
Pense bem: como você irá passar a sua informação ao chefe/ público-alvo, se você mesmo vê que o gráfico não está tão claro?
Hoje em dia, o quesito de melhora de design pode ser ajudado de diferentes formas que podem ser solucionadas tanto no próprio R Studio, quanto em plataformas adjacentes como o Power Bi ou Tableau.
No texto de hoje, irei demonstrar como você pode começar nesse caminho de customização do gráfico usando a ferramenta do R Studio.
Dentre as diferentes formas de aprimorar os dados no R Studio, temos o pacote ggplot2.
É um sistema gráfico completo, alternativo ao sistema básico do gráfico do R, e por isso oferece mais opções de modificações, legendas prontas e formatação mais sólida.
Primeiro instalei e rodei o pacote:
Em segundo, vou chamar um dataset que vem na linguagem R:
*a forma reShape2 ajusta forma de dados
*observe a linguagem: chamou a função qplot, colocou as observações, o tipo de dataset, o tipo de gráfico.
Resultado:
*o resultado gerado é de um gráfico Scatterplot (gráfico de pontos)
Outra forma de construir gráficos mais rebuscados é fazer essa “montagem” camada por camada.
Camada 1:
*repare na escrita geom_point é o tipo de gráfico, tipo de mapeamento aesthetic, em seguida colocou as variáveis x e y, e a cor, o tipo de dataset e o tamanho.
*chamou a função ggplot() e adicionou a primeira camada
Resultado:
Outro exemplo, de aplicação do pacote ggplot2 é da criação de modelos de regressão.
*lm é linear model ela abre a fómula para incluir as variáveis
Para olhar o modelo você pode chamar a função head:
Para criar uma nova camada, ou seja, adicionar novas informações:
Resultado:
*o resultado disso já é possível observar a criação de uma linha de regressão
E mais, para criar uma nova camada 3:
Resultado:
*nesse novo gráfico foi possível observar a construção de uma faixa de erro
Você pode construir o mesmo gráfico pela versão otimizada:
Pra quê criar camadas se tem a versão otimizada??
A questão é que criar camadas te ajuda a visualizar se o gráfico está sendo construído no caminho que você gostaria que ele for visualizado, por isso você tem as duas opções.
Outro exemplo é da criação de um barplot usando o pacote ggplot2.
Primeiro, chamei um data frame:
Em seguida, apliquei a fórmula estatística:
*primeiro faz uma cumsum = soma acumulada
Depois, apliquei o modelo:
Resultado:
*nesse caso a geometria é diferente dos anteriores é chamado de geom_rect
Você pode criar histogramas, como:
Resultado:
Pode parecer simples mas construindo as camadas você pode ir construindo o gráfico e o tornando visualmente mais atraente.
Então, acredito que através dos exemplos citados você pode entender que o racional para customizar um gráfico no R é você ir criando camadas e o modificando. Assim, você pode ir avaliando se o gráfico está se tornando mais atraente para o público, e ir modelando até chegar no ponto para uma apresentação clara.
Lembrando esse é apenas um dos exemplos de pacote. No R Studio você pode encontrar outros, mas posso te garantir que o racional para construção será parecida com essa, no sentindo de criar camadas.