Análise e Discussão Big Data Cases

Análises com Rotten Tomatoes: é possível prever os favoritos ao Oscar com Big Data?

Usando Big Data para analisar o Rotten Tomatoes e prever os ganhadores do Oscar
0

Finalmente chegamos àquela época do ano. Podemos chamá-la de “carnaval dos cinéfilos”, ou simplesmente de “aquela época em sabemos que torcemos para o DiCaprio ser um dos ganhadores do Oscar”.

A época das premiações mais importantes do mundo do cinema.

Que tal aproveitar o clima cinematográfico para fugir dos palpites infudados e utilizar Big Data para analisar os (mais) prováveis ganhadores do Oscar?


Leia também: 8 tendências de Big Data em 2017


No ano passado, nosso data scientist, Luiz Mendes, fez dois posts sobre o mesmo assunto (confira os artigos aqui: Parte 1 | Parte 2). Após algumas análises, Luiz, ou melhor, seus algoritmos acertaram os ganhadores do Oscar nas categorias de melhor ator e melhor atriz, mas falharam em prever o vencedor da categoria de melhor filme.

É claro que Luiz não iria desistir de primeira após um resultado frustrado. A hipótese mais forte é a de que o ganhador do ano passado foi um outlier (um ponto fora da curva), uma vez que nem o DGA nem o PGA bateram com o ganhador do Oscar.

A saída? Aumentar o escopo de análise, aprofundar a investigação, e mirar no Rotten Tomatoes.

Usando Big Data para analisar o Rotten Tomatoes e prever os ganhadores do Oscar

O que é o Rotten Tomatoes e como ele ajuda a prever os ganhadores do Oscar?

O Oscar tem um sistema peculiar de votação, que muitas vezes dá maior valor aos filmes “menos” odiados. A partir desse raciocínio, Luiz desenvolveu uma breve análise tomando como base os valores do Rotten Tomatoes – outro site que poderia refletir os ganhadores do Oscar com mais acurácia.

O Rotten Tomatoes é um site para avaliação de filmes. Seu sistema difere um pouco de sites como o IMDb, pois cada pessoa ou crítico avalia o filme entre 1 e 5 estrelas, mas o site considera esse voto de forma binária – isto é, ou o filme é Fresh (Fresco) ou Rotten (Podre). O score final do filme é a porcentagem de notas Fresh que ele recebeu.

Outra diferença do Rotten Tomatoes é que ele possui dois valores, sendo um para críticos e outro para o público. No post, Luiz começa a construir sua análise com esses dois scores separadamente e em conjunto.


Leia também: 10 filmes sobre Inteligência Artificial e Big Data


Quais insights cinematográficos são possíveis?

Seguindo todos os passos necessários ao se deparar com uma nova feature (variável), é possível construir análises, gráficos e transformações que revelam diversos insights sobres os filmes:

  • A nota do público tende a ser mais baixa que a nota dos críticos;
  • O filme Tão Forte e Tão Perto (2009) é o único a disputar a estatueta e ser considerado Rotten pelos críticos – ou seja, mais de 50% dos críticos não gostaram do filme;
  • O filme com a menor avaliação pelo público foi Árvore da Vida, com 60% de aprovação. Curiosamente, este é o filme com a maior diferença entre a avaliação dos críticos e do público (24 pontos!);
  • O filme com a média de público e crítica mais alta foi O Pianista (que deveria ter ganho em 2003). O segundo filme foi O Senhor dos Anéis: As Duas Torres, que coincidentemente também é de 2003 – e também não ganhou.

Quer saber todos os insights do Oscar gerados pela análise do Rotten Tomatoes? Então CLIQUE AQUI para ler o artigo na íntegra, no blog dos nossos desenvolvedores!

Baixe_aqui_seu_Ebook