Comment utiliser les Big Data pour créer la meilleure série télé possible

house of cards big data

Cette semaine je vais vous parler de Big Data, et plus particulièrement de son utilisation dans le cas des séries “TV”. L’article vise à retranscrire les grandes lignes d’une conférence TED récemment postée sur leur site Internet. Vous ne connaissez pas TED ? Si tel est le cas sachez qu’il s’agit d’un organisme à but non lucratif proposant chaque année plusieurs dizaines de conférences visant à vulgariser des sujets très intéressants de sciences dures et de sciences sociales.

 Je vous propose donc de découvrir la conférence du Dr. Sebastian Wernicke, actuellement chef du département de science des data dans la boite de consulting Solon. La majeure partie de sa conférence vise à souligner la différence fondamentale de fonctionnement entre Amazon Studios (dont on parlait déjà la semaine dernière) et Netflix. Je ne vais pas retranscrire toute la conférence mais plutôt vous donner les points les plus importants de la vidéo.


 L’utilisation des Big data au sein d’Amazon Studios

D’un côté, nous avons les équipes de Roy Price au sein d’Amazon Studios. Leur but est de produire des séries originales dont la note globale sur IMDB est supérieure à 9. Cela correspond à 11 séries aujourd’hui mais à l’époque de la création d’Amazon studios, on pouvait compter les nominées sur les doigts d’une main : Friends, The Wire, Breaking Bad, Sherlock et Game of Thrones. L’ambition est grande, surtout pour un tout nouveau studio. Du coup, pour limiter les risques d’un lamentable échec, Roy Price décide de faire confiance aux données des consommateurs de séries. La méthode est de sélectionner des pilotes susceptibles de plaire au public. Cependant, à la différence des médias traditionnels, ce n’est pas à lui d’avoir le dernier mot. Cette tâche revient aux utilisateurs mêmes d’Amazon ! En effet, on leur propose un épisode pilote qu’ils doivent noter à la fin afin de savoir s’ils ont apprécié et s’ils en veulent plus. Concrètement cet avis n’est en réalité qu’une infime partie de ce qu’Amazon analyse : quand ont-ils mis pause ? Quand ont-ils remis en arrière pour revoir une scène ? Quand ont-ils zappé un passage voire arrêté de regarder le pilote ? etc… Tous ces gestes qui paraissent anecdotiques en analysant une seule personne prennent alors tout leur sens quand on les agrège sur des milliers de “bêta-testeurs” volontaires et bénévoles. De toutes ces données il en ressort que les utilisateurs aimeraient avoir une série politique à propos de 4 sénateurs américains. Et c’est ce qu’ils font en 2013 avec Alpha House  !

  Défi réussi pour Roy Price ? Pas vraiment, car si la série n’est pas mauvaise (7,6 sur 10 selon IMDB), elle s’insère finalement dans la masse des séries “justes” bonnes sans jamais parvenir à transmettre ce frisson qu’on peut ressentir en regardant Breaking Bad par exemple.


L’utilisation des Big data chez Netflix

De l’autre côté, nous trouvons les équipes de Ted Sarandos, le directeur de contenu de Netflix. Eux aussi analysent les données recueillies par les milliers d’heures de binge-watching des abonnés. Et eux aussi cherchent à développer LA série qui permettra au studio d’être considéré par ses pairs d’Holywood tout en attirant des millions d’autres internautes vers le service payant. Cependant, à la différence d’Amazon, ici pas de pilotes proposés aux internautes mais plutôt une analyse de l’ensemble des données sur l’ensemble du catalogue proposé. Dès lors, au lieu d’analyser si les acteurs choisis pour le pilote sont appréciés ou bien voir la réaction des internautes face à telle scène de tel pilote, Ted Sarandos décide d’analyser quels acteurs/réalisateurs/thèmes/humours/etc… plaisent à une période donnée. Une fois toutes ces données agrégées le studio décide alors de concevoir avec plus de clarté leur vision d’une bonne série. Les internautes aiment les séries politiques comme The West Wing (que je vous conseille d’ailleurs, elle a très bien vieilli) et les films avec Kevin Spacey ? Proposons leur une série dramatique qui suit principalement un homme dans ce milieu : c’est ainsi que House of Cards est né. Le résultat fut à la hauteur des espoirs de Sarandos avec un 9 tout pile sur IMDB !


Qu’importe la taille des données, ce qui compte c’est de savoir s’en servir 

Ainsi, les deux entreprises ont utilisé le Big Data mais pour l’une le résultat fut moyen tandis que pour l’autre le succès est indéniable. On en retire donc que la manière d’utiliser les données est essentielle. En effet, alors qu’Amazon croyait qu’un ordinateur pouvait agréger des données et recoller les morceaux pour donner un monstre de Frankenstein que tout le monde aimerait, Netflix a jugé préférable de limiter l’ordinateur à sa tâche de collecte des données tandis que les cerveaux  humains de l’entreprise devaient en retirer des conclusions pertinentes. Cela nous ramène à notre définition de la curation de contenu lors de la première revue du presse du monde du digital, quand je vous disais que seul l’humain peut rendre véritablement pertinente une collecte d’informations. De même, alors que Roy Price se défaussait de sa responsabilité en clamant que la machine, tel un dieu, lui avait indiqué la voie à priori sûre et statistiquement exacte d’une série reprenant les éléments préférés des bêta-testeurs, chez Netflix, en se basant sur un puzzle d’informations, Ted Sarandos et son équipe d’experts prenaient le risque de proposer intelligemment de nouvelles pièces pour compléter le puzzle, quitte à tordre certaines pièces pour éviter les incohérences. Comme le souligne Sebastian Wernicke  à la fin de la conférence  :

“ I find that a very encouraging message, in fact, that even in the face of huge amounts of data, it still pays off to make decisions, to be an expert in what you’re doing and take risks. Because in the end, it’s not data, it’s risks that will land you on the right end of the curve.”

S’il fallait une petite critique de la conférence je dirais que le saut de la foi de Netflix a été tout de même assez limité pour sa première série phare car House of Cards est une adaptation d’une série britannique à succès des années 90. Plus globalement, l’utilisation du Big Data dans le domaine de la culture me parait être assez délétère à long terme pour la grande majorité des productions. En effet, si l’analyse de la data permet de s’assurer des goûts des futurs spectateurs et ainsi éviter de proposer des flops commerciaux monumentaux, cela se fait au détriment de l’originalité. Concrètement, à force de suivre le choix de la masse ne risque-t-on de se retrouver avec des séries qui savent plaire mais plus vraiment étonner, émerveiller, surprendre ? Combien de Breaking Bad vont naître parmi les dizaines de séries clones ?  C’est un sujet fondamental qui mériterait un article dédié donc je me tais pour le moment et je vous laisse y réfléchir.   


Cet article était disponible au sein de la revue de presse du 1er au 06 février 2016.

Erwan Colson

Consultant Data depuis Septembre 2018 et entrepreneur (Fondateur du site RentesMania.fr), je suis rédacteur pour Toile de Fond autour des sujets orientés marketing, droit et politique. Retrouvez tous mes projets sur erwan-colson.carrd.co

2 commentaires

  1. Retrolien : Revue de presse du monde digital (du 15 au 20 Février 2016) - Toile de Fond

  2. Retrolien : Revue de presse du monde digital (du 1er au 06 février) - Toile de Fond

Votre réaction

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Partager sur Facebook