R

Por que usar o %>%

De onde vem e como funciona o operador pipe.

Continue lendo

A poluição do ar durante a greve dos caminhoneiros

Neste post, vamos avaliar descritivamente as concentrações de alguns poluentes durante a greve dos caminhoneiros

Continue lendo

pesqEle: dados de pesquisas eleitorais

Nesse ano eleitoral, a preocupação com as pesquisas eleitorais é ainda maior. É nossa obrigação como cidadãos e cidadãs acompanhar e monitorar as pesquisas eleitorais registradas, detectando e apontando o dedo para possíveis fraudes. Esse post busca ajudar...

Continue lendo

Modelos beseados em árvores são imunes à multicolinearidade?

Modelos baseados em árvores como árvores de decisão, random forest, ligthGBM e xgboost são conhecidos, dentre outras qualidades, pela sua robustês diante do problema de multicolinearidade. Esse post mostra que isso não é totalmente verdade.

Continue lendo

Agenda da Curso-R

Essa semana a Curso-R participará de 3 eventos relacionados à R e Estatística. Confira neste post!

Continue lendo

rfbCNPJ: Repositório de CNPJs da Receita

Durante nosso último curso de introdução a programação em R, um aluno me pediu ajuda para carregar os dados de CNPJs da Receita Federal. Eu me animei tanto com essa base que decidi montar um pacotinho para baixar ler e organizar esses dados...

Continue lendo

chorrrds: Analisando acordes de músicas brasileiras

Esse post da nossa convidada Bruna é mais uma bela aplicação de estatística em música, usando o R. Novos pacotes, lindas visualizações e insights super legais sobre a música brasileira...

Continue lendo

Webinar: Advanced Purrr

Nessa segunda feira, o Caio apresentará um Webinar sobre purrr avançado. O pacote purrr é um kit de ferramentas completo e consistente para programação funcional em R. Além das funções mais conhecidas da família map o purrr contempla uma enorme gama de funções que ajudam na sua produtividade e a deixar o seu código mais eficiente e fácil de ler. Caio é cientista da computação e apaixonado pelo purrr, com certeza um dos que mais conhece sobre o pacote no mundo.

Continue lendo

Web scraping do sistema de qualidade do ar da CETESB

Nem sempre dados públicos são disponibilizados de forma eficiente para a coleta. Neste post, vamos exercitar a arte do web scraping para raspar dados de poluição do ar da CETESB.

Continue lendo

É possível rodar python no RStudio?

RStudio é a melhor IDE para fazer ciência de dados. R e python são, no momento, as melhores linguagens para fazer ciência de dados. O RStudio foi criado para rodar R. Será que também serve para rodar python? Nesse post curtinho eu respondo que sim e explico como...

Continue lendo