Copyright, droit voisin, fake news … les images publiées dans la presse permettent-elles d’en connaître l’auteur, la source et les droits? 36 sites de presse français et internationaux ont été analysés pour évaluer la présence des ces informations cruciales dans les métadonnées des images.

 

L’an dernier IMATAG publiait la première étude faite sur la présence des métadonnées, notamment de crédit et copyright, dans les images utilisées par les éditeurs de presse sur leurs sites internet.

La conclusion, bien que prévisible, était assez alarmante: une majorité (97%) des images publiées sur internet sont dépouillées de leurs métadonnées de crédit, interdisant ainsi tout rapprochement simple entre une image réutilisée hors de son contexte d’origine (une page web) et sa source, son auteur ou son ayant droit.

Notre rapport dénonçait la négligence des éditeurs pour maintenir ces données d’identification attachées au fichier image, alors qu’une simple spécification technique auprès de leur fournisseur de CMS pouvait sauver le crédit de la purge occasionnée par les compressions d’images.

#1  FOCUS 2019: LES SITES DE PRESSE

Voici une mise à jour de ces statistiques. Les  sites web des mêmes éditeurs qu’en 2018 ont été visités par nos robots, cette fois-ci en priorisant l’étude des images affichées sur la page d’accueil du site et sur les pages des articles complets pointés depuis cette page. L’observation s’est faite sur la période du mois de mai 2019, sur un échantillon de 36 sites de presse français et internationaux, représentant 100 000 images (avec un minimum de 1000 photos par site).

credit or copyright metadata study on news web sites  métadonnées de credit ou copyright sur les sites de presse

#2  SEULEMENT 5 SITES ONT PLUS DE 50% D’IMAGES AVEC CRÉDIT

Les éditeurs ayant un taux élevé de métadonnées de crédit disposent d’un CMS conçu pour les maintenir « en vie » (c’est-à-dire ne pas les effacer). Très peu sont dans ce cas: Le Spiegel en est le meilleur exemple.

#3  5 AUTRES ONT DE BONNES INTENTIONS MAIS AUSSI QUELQUES COUACS

Ceux qui se situent entre 30% et 50% peuvent avoir des comportements étranges lorsqu’on se penche sur certains détails.

Par exemple, Politico, lorsqu’il est analysé par nos robots, fournit des images créditées par défaut. Toutefois, si en tant qu’utilisateur humain vous naviguez sur leur site, les images qui s’afficheront pour vous seront redimensionnées pour s’adapter au votre profil de périphérique (taille et résolution de l’écran, réseau). Ces images redimensionnées, hélas, n’ont aucune métadonnée…

Autre exemple: Le Figaro. Cette année, nous avons modifié notre algorithme pour ne s’intéresser qu’aux champs destinés au crédit photo. Nous avons découvert que certains crédits manquaient alors que les images comportaient des métadonnées : en fait, le problème était que le champ « propriétaire » était rempli au lieu du champ « crédit ». Pas au bon endroit, donc…

#4  EN DESSOUS DE 30%, L’ÉDITEUR EST NÉGLIGENT

Les moins de 30% peuvent avoir des métadonnées « par accident », ce qui signifie que le CMS ne les efface pas, mais elles ont probablement disparu avant, pendant le processus d’édition.

#5  LA MAJORITÉ DES SITES EFFACENT SYSTÉMATIQUEMENT LES MÉTADONNÉES

En fin de compte, la majorité d’entre eux ont des métadonnées de crédit proches de 0%. Que ce soit par négligence au nouveau de l’éditeur, de ses rédacteurs ou de leurs fournisseurs d’images, la responsabilité collective des maillons de la chaîne est engagée, et ceci aura bien plus de conséquences maintenant qu’une loi a été votée par le Parlement Européen pour rétribuer les contributeurs aux flux d’information exploités par les plateformes des GAFA.

Sans la preuve que les contenus relayés par Facebook our Google News sont bien les vôtres, pas de droits voisins ! Alors même que les métadonnées sont conçues pour signer vos productions visuelles.

#6  LE PALMARES DES AGENCES PHOTOGRAPHIQUES, UNE NOUVELLE DONNÉE EXCLUSIVE IMATAG

Pour pour démontrer l’utilité des métadonnées de crédit, IMATAG a relevé dans les 3% d’images du web qui contiennent encore un crédit celles contenant le nom d’une agence photographique.

Ensuite, par agence, le nombre de sites webs sur lesquels ses images étaient trouvées a permis de les classer entre elles. On obtient ainsi une bonne idée de leur part dans la couverture mondiale.

 

La suprématie de Getty Images dans ce domaine n’était pas à prouver, elle est tout simplement flagrante dans cette étude. Puis le trio AFP, REUTERS, AP suit, à parts relativement égales. Ensuite d’autres newswires se succèdent, leur rang dépendant de leur volume de production et de l’étendue de leur couverture géographique.

CE QU’IL FAUT RETENIR DE CETTE ÉTUDE

Pour faire valoir leur copyright et leurs droits voisins, tous les acteurs de la chaîne de production et de diffusion d’images doivent se mobiliser pour sauvegarder les métadonnées d’images destinées à identifier les ayants-droit.

Pour pallier à l’effacement ou la falsification de ces données, inéluctables, il est également nécessaire de doter l’industrie de la presse d’un Registre de Contenus, unique et sécurisé, permettant l’enregistrement des contenus produits et publiés par les éditeurs, et la consultation de ces contenus par les plateformes pour en vérifier les droits (copyright) ou en évaluer la véracité (fake news).

Cette solution existe, nous vous parlerons de RoC, Register of Content, dans un prochain article !

RoC, Register of Content

Télécharger le rapport et la méthodologie:

 

Demande de téléchargement