échos visuels / archives /


The Signatures of Wikipedia (2014)

Au cours du premier semestre 2014, il y avait beaucoup de discussions autour du déclin de l'encyclopédie Wikipédia : moins d'éditeurs, moins de discussions, moins de corrections, moins de nouveaux articles, et ainsi de suite, le tout dans des proportions considérables au cours des sept dernières années. Mon intention initiale était juste de regarder la version anglaise... mais j'ai vu un éléphant !!!! Je me suis alors demandé quelle était la signature de chaque Wikipédia.


Dessine-moi un éléphant !

Les discussions se focalisaient sur la version anglaise, la plus importante et la plus traduite dans les autres langues. J'ai voulu voir ce qu'il en était concrètement. J'ai croisé le nombre de nouveaux articles édités chaque mois en fonction du nombre d'éditeurs mensuels - contributeurs avec au moins cinq éditions par mois - depuis la création en janvier 2001 (jusqu'en juin 2014). Pour améliorer la visibilité de la dynamique, j'ai ciblé le nombre maximum d'éditeurs mensuels atteint : autour de 50k en mars 2007 (ligne hashurée). J'ai alors séparé les deux phases et j'ai réalisé un lissage dit polynomial sur l'ensemble.

D'une part, nous avons en rouge la période de croissance allant de 0 à quelques 50K contributeurs. Nous voyons aisément trois périodes : la croissance très rapide, la phase plus modérée / lente puis le pic éditeurs / articles. Très classique ! D'autre part, nous avons en bleu la période de déclin allant de quelques 50k contributeurs à 0... non nous n'y sommes pas encore. Nous distinguons ici deux moments : un déclin rapide et brutale au cours des 3-4 années suivants le pic puis une stagnation sur les trois dernières années, un rythme mensuel de 33K éditeurs et de 27K articles chaque mois. C'est peut-être avec ces valeurs que Wikipédia doit apprendre à fonctionner... plutôt que de vouloir ressembler à toutes les autres plateformes : être toujours plus gros !

ici il y a normalement une datavisualisation

(Cliquez sur l'image si vous voulez voir la visualisation en haute-résolution.)


Dessine-moi chaque Wikipédia !

Une fois terminée cette petite visualisation, la seule chose que je voyais était le profil de l'encyclopédie, le trait noir qui dessinait un éléphant... un éléphant pour une encyclopédie, belle image, beau résumé ! C'est une signature. Alors je me suis demandé qu'elle était la forme pour toutes les versions de Wikipédia. J'ai appliqué la même méthode aux 256 versions pour lesquelles les données mois par mois étaient disponibles. Elles représentent 31 758 360 articles publiés, ce qui est juste énorme !!! Vous pouvez cliquez sur les images pour zoomer, elles sont par bloc de 24.

ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation ici il y a normalement une datavisualisation

Les 31 autres versions pour lesquelles les données mois par mois n'étaient pas disponibles sont les suivantes (entre parenthèses le nombre d'articles publiés en date d'août 2014) : Mingrelian (4,746), Zazaki (4,527), Pali (2,806), Gagauz (2,748), Palatinate German (1,975), Aramaic (1,610), Banjar (1,472), Hausa (1,389), Lak (1,202), Sranan (1,050), Zhuang (665), Min Dong (618), Cherokee (503), Moldovan (401), Fijan (271), Tigrinya (270), Kashmiri (228), Venda (206), Cree (199), Dzongkha (190), Tumbuka (174), Ndonga (21), Sichuan Yi (16), Choctaw (15), Marshellese (10), Afar (6), Kuanyama (5), Hiri Motu (3), Muscogee (2), Kanuri (1), Herero (0).

Les données proviennent de WIkipédia. Les visualisations sont réalisées avec R. Date : 1er septembre 2014.





Retourner à :

— Mon carnet html de notes du moment.
— Mes datavisualisations archivées (2011-2020).






Carnet codé par moi-même. // Aucune donnée personnelle n'est collectée. // Police de caractère Cousine de Steve Matteson. // Site hébergé par Ionos. // Copyright 1995 - 2020 Christophe Cariou, Ile de Nantes.