J'adore cette série... la version doublée en français pas la version originale, les voix ne me conviennent pas.
Cette série est une véritable usine à gros mots.
Pour la rencontre du Meetup R de Nantes, je me suis dit qu'il me fallait en faire quelque chose.
J'ai travaillé sur les dialogues des 93 épisodes des 8 saisons.
Esquisses.
Note méthodologique.
Les dialogues de la série viennent du site
Open Subtitles.
La liste des gros mots viennent du site
No Swearing.
De l'extraction à la composition, tout est réalisé avec R.
Librairies : RCurl, stringr, data.table, dplyr, wordcloud, extrafont, scales.
Polices : Source Sans Pro, Amatica SC.
Août 2017.
Les avis sur la série (2016)
L'année précédente j'avais travaillé sur les différents avis sur la série : audience, évaluations et récompenses.
J'ai beaucoup de notes écrites sur cette série, il faudrait que j'en fasse quelque chose.
Note méthodologique.
Les données viennent de IMDb et Wikipédia.
De l'extraction à la composition, tout est réalisé avec R.
Librairies : rvest, RCurl, stringr, scales, extrafont.
Polices : Open Sans et Roboto.
Avril 2016.
Les mots et les émotions (2015)
Lors de l'atelier de visualisation organisée à l'École de l'Image à Nantes, j'avais également travaillé sur les dialogues, les mots, les sujets et les émotions.
J'avais réalisé des tests sur Archer car c'est une série que je connais bien, cela me permettait de voir si et comment il était possible de raconter quelque chose.
J'ai travaillé sur les 75 épisodes des 6 saisons disponibles, ce qui représentait quelques 10 269 mots-racines uniques.
Les mots de la série associés aux émotions.
Le poids de chaque émotion pour chaque épisode..
Les sujets pondérés par les épisodes où ils sont présents.
Note méthodologique.
Les dialogues de la série viennent du site
Open Subtitles.
L'association mot-émotion vient de
The NRC Emotion Lexicon.
De l'extraction à la composition, tout est réalisé avec R.
Librairies : stringr, tm, dplyr, Hmisc, RCurl, rvest, igraph, scales, extrafont, plotrix, wordcloud.
Polices : Open Sans.
Novembre 2015.