Athos

Desafio de Dados - Recuperação de imagens

Na segunda edição do Desafio de Dados vamos tentar recuperar a cor de uma imagem usando modelos de regressão e árvore de decisão.

Continue lendo

Modelos beseados em árvores são imunes à multicolinearidade?

Modelos baseados em árvores como árvores de decisão, random forest, ligthGBM e xgboost são conhecidos, dentre outras qualidades, pela sua robustês diante do problema de multicolinearidade. Esse post mostra que isso não é totalmente verdade.

Continue lendo

Chamada pra briga - Competição Kaggle Guess The Correlation

Criamos uma competição no Kaggle para aprender a máquina adivinhar a correlação de um scatterplot. Desafio lançado!

Continue lendo

Como fazer o R avisar pelo telegram que bitcoin tá barato

Uma brincadeira de fazer o R enviar uma mensagem ao seu celular via Telegram quando o preço da bitcoin subir ou cair muito!

Continue lendo

Regressão Logística em: a menor deep learning do mundo

Deep learning é uma grande novidade, mas há muitos mitos em sua volta que acaba espantando pessoas que poderiam usufruir e contribuir para a comunidade de analista de dados. Esse post tem o intuito de abrir um pouquinho a caixa preta para quebrar algumas dessas fábulas.

Continue lendo

RStudio e Github no dia a dia

Versionamento de código é uma ferramenta que veio para ficar. Não dá para calcular o quanto de dor de cabeça, horas perdidas e frustrações ela economiza e já economizou na história da humanidade. Esse post mostra a rotina de um analista que usa Github no RStudio

Continue lendo

WoE em R com tidywoe

WoE (weight of evidence) é uma ferramenta bastante usada em aplicações de regressão logística, principalmente na área de score de crédito. O pacote tidywoe oferece uma interface simples para facilitar essa tarefa.

Continue lendo

Componentes Principais - Intuição

Uma ilustração gráfica simples para dar intuição sobre o que uma Análise de Componentes Principais faz.

Continue lendo

Instalando Anaconda + TensorFlow + Keras para R no Ubuntu 16.04 Server

Passo a passo de como preparar o Keras para R no Ubuntu 16.04 em cima do Anaconda.

Continue lendo

Top 10 dicas do Curso R de verão 2017

Em fevereiro desse ano ministramos o Curso de R de Verão 2017, parte do programa dos Cursos de Verão do IME-USP. Abaixo segue um compilado das 10 melhores dicas dadas durante este curso. 1. Conheça e domine a filosofia por trás do Tidyverse O conceito “tidy” deu o oriente do curso de verão e não foi à toa: o tidyverse, carinhosamente chamado de “universo arrumadinho”, está intimamente associado ao dia-a-dia de um analista de dados e sua implementação em R é tida como uma pequena revolução para os R-eiros.

Continue lendo