Les métadonnées d’une image publiée sur le web peuvent-elles encore, en 2018, informer sur sa source, son contexte et ses droits ?
IMATAG a dressé un état des lieux à 360° des images circulant sur le web, depuis leur création par les photographes jusqu’à leur publication sur internet et en particulier —  à l’heure des fake news — sur les sites d’actualité.

Découvrez les principales révélations mises à jour par cette étude inédite sur la “carte d’identité” des images : les métadonnées.

 

LES METADONNEES, EN BREF

Les métadonnées d’une image sont des données autres que les pixels constituant l’image et donnant des informations sur le contenu (sujet, date, lieu…), les droits (auteur, licence etc…), et les éléments techniques liés à la prise de vue (appareil photo, logiciel de retouche). Elles sont stockées dans le même fichier (JPG, TIFF, PNG…) que l’image elle-même.

Trois formats coexistent pour contenir ces informations. Sans entrer dans les détails, EXIF est celui le plus dédié aux aspects matériels, IPTC aux aspects “attribution” et droits, et XMP est une extension modernisée d’IPTC.

A cours de l’enquête menée par IMATAG, il est apparu que ces formats coexistent sans que l’un prédomine vraiment. Ainsi, lorsqu’une image trouvée sur le web contient des métadonnées, elle a environ 60% de chances de contenir des IPTC, 65% de contenir des EXIF et 50% de contenir des XMP. En revanche le format IPTC est plus souvent utilisé pour informer sur le crédit photo (75% des images que nous arrivons à créditer en lisant leurs métadonnées l’ont été en lisant les IPTC, contre 51% pour EXIF et 33% pour XMP).

Le reste de l’étude ci-dessous ne distingue pas la provenance des données de crédit, considérant de manière égale les IPTC, EXIF et XMP.

 

#1  85% DES IMAGES PUBLIÉES SUR INTERNET N’ONT PAS (OU PLUS) DE MÉTADONNÉES

 

Tout fichier image affiché dans une page web est téléchargeable (cf article).

En théorie, si une photo ainsi téléchargée est réutilisée dans une nouvelle page qui ne mentionne pas le crédit photo, seules  les métadonnées de la photo peuvent encore livrer cette information de crédit, vitale pour les professionnels tels que les photographes, les photojournalistes, leurs agences…

85% des images sur le web n'ont pas ou plus de métadonnées

En pratique, sur un échantillon de plus de 40 millions d’images trouvées sur le web (pages publiques de plus de 250 x 250 pixels, de sites divers, hors médias sociaux, hors services de stockage), IMATAG a trouvé que seulement 15% contenaient encore des métadonnées.

Pire : parmi celles qui ont encore un fichier de métadonnées (format IPTC, EXIF ou XMP), environ une sur cinq contient des informations permettant de connaître l’auteur, les droits d’utilisation, l’agence et la description de la photo.

Encore pire : c’est compter sans les nombreuses photos présentes sur les réseaux sociaux, non prises en compte dans ces statistiques et qui viennent aggraver ce regrettable score (voir constat #6).

 

#2 SUR LES SITES D’ACTUALITÉ, SEULEMENT 8% DES PHOTOS CONTIENNENT DES MÉTADONNÉES PERTINENTES

 

Les sites d’actualité contiennent des photos pour lesquelles les métadonnées sont particulièrement importantes: ceux qui les produisent peuvent, grâce au champs de crédit, espérer une nouvelle vente; ceux qui s’informent trouveront dans les champs de lieu et de date de quoi déjouer des fake news.

8% des images de presse comprotent un crédit dans leurs métadonnées

Plus de 50 000 images ont donc été analysées par IMATAG sur 750 sites d’actualité répartis dans le monde. Si le taux de présence de métadonnées dans cette catégorie de site est assez proche de la moyenne (20%), une analyse plus poussée montre qu’en fait 8% permettent d’identifier l’auteur ou l’agence photo, ce qui est déjà mieux que la statistique globale de 3%.

Certains sites affichent le crédit dans la page (en HTML) mais ceci ne les dédouane en rien si, par ailleurs, ils suppriment les métadonnées (voir #3): lorsque la photo est reprise par d’autres sites partenaires (ou volée, bien sûr), rien de garantit que ce second site créditera correctement la photo.

 

#3 UNE MINORITÉ DE SITES D’ACTUALITÉ PRÉSERVENT LES MÉTADONNÉES IMAGES

 

Sur l’ensemble des sites de presse de notre étude, 10% préservent les métadonnées dont celles de crédit, 40% effacent toutes les métadonnées, et 50% ne font ni l’un ni l’autre (c’est-à-dire que lorsque des métadonnées sont présentes, très peu contiennent de crédit). La disparition des métadonnées varie donc d’un site de presse à l’autre. Le problème est-il connu, ignoré, ou maîtrisé par certains éditeurs?

Pour le savoir, observons 18 sites de presse français* : IMATAG a évalué le pourcentage (par site) d’images pouvant être créditées grâce à leurs métadonnées. Il se dégage de ces chiffres 4 grandes catégories, depuis les éditeurs maîtrisant la sauvegarde des métadonnées (Le Figaro, Le Monde), jusqu’aux sites qui les effacent carrément (aucune métadonnée). Entre les deux extrêmes, deux catégories assez proches : ceux qui ne les effacent pas mais dont trop peu de métadonnées sont utiles (Sud Ouest, Le Parisien), et ceux qui ne les effacent pas mais ont très exceptionnellement des images avec métadonnées (Libération, Valeurs Actuelles).

La manipulation des photos par les différents services fournisseurs de l’éditeur (retouches, import/export d’un DAM, envoi de copie d’écran…) peut également expliquer des pertes en amont de la mise en ligne par l’éditeur.

Les plus grands noms de la presse ne figurent pas tous au palmarès des bons élèves, ce qui montre bien que les éditeurs ne sont pas directement lésés par ce problème. En revanche, ceux qui protègent les métadonnées — Huffington Post, Spiegel ou Le Figaro — démontrent bien à leurs confrères que ce n’est pas techniquement impossible.

Astuce: Ils existe des plugins de protection de métadonnées disponibles pour les CMS populaires comme WordPress. Pour les systèmes personnalisés, il revient à l’éditeur de les développer spécifiquement.

*(voir la version anglaise de cet article pour l’étude sur 22 sites d’actualité d’Europe et d’Amérique du Nord)

 

#4 PLUS DE 80% DES PHOTOGRAPHES RENSEIGNENT LES MÉTADONNÉES DE LEURS PHOTOS POUR LES PROTÉGER

 

Une enquête en ligne auprès de photographes majoritairement professionnels révèle que plus de 90% d’entre eux savent ce que sont les métadonnées, et 82% les utilisent pour protéger leur photo contre le vol, en plus d’autres stratégies (lire le rapport), en y consacrant un temps parfois précieux (lire l’article de Thierry Secrétan).

les photographes remplissent leurs metadonnees

 

On sait également que ces photos, transmises à leur agence, puis sélectionnées et mises à disposition des éditeurs sur des DAM (digital assets management), continuent d’être enrichies en métadonnées de type mots-clé. 82% côté photographes contre 8% côté éditeur :  quand, pourquoi et comment les métadonnées disparaissent-elles?

82% côté photographes contre 8% côté éditeur : quand, pourquoi et comment les métadonnées disparaissent-elles?

 

#5 LES MÉTADONNÉES SONT LES PREMIÈRES VICTIMES DE L’OPTIMISATION POUR LA PERFORMANCE DES SITES.

 

Pourquoi 40% des sites de presse de notre étude retirent-ils systématiquement les métadonnées de leurs images avant de les mettre en ligne?

Pour être performants (c’est à dire repérés et bien classés par les moteurs de recherche, s’afficher rapidement et sur tout type d’écran…), la plupart des éditeurs web retraitent les images automatiquement pour qu’elles se chargent plus vite et soient de taille adaptée.

Hélas les métadonnées sont rarement réintégrées dans le nouveau fichier image. Pourquoi? De l’aveu même des DSI interrogés: par ignorance, par négligence. Également à cause d’un mythe persistant, celui du poids des métadonnées: 2 à 4kbB, dérisoire comparé à celui des pixels quand on considère qu’une image trouvée sur le web fait en moyenne entre 20 et 100 kB.

 

La manipulation des photos par les différents services fournisseur de l’éditeur (retouches, import/export d’un DAM, envoi de copie d’écran…) peut également expliquer des pertes en amont de la mise en ligne par l’éditeur (50% des sites de presse de notre étude).

Astuce : Plus vous limitez vos métadonnées à l’essentiel, plus leur poids sera faible. Editez vos métadonnées avec l’outil en ligne proposé par IMATAG pour ne garder que les champs essentiels, sans avoir à vous soucier de la norme utilisée.

 

#6 SUR LES RÉSEAUX SOCIAUX, SEUL FACEBOOK CONSERVE LES MÉTADONNÉES “CRÉATEUR” ET “MENTION DE COPYRIGHT”

 

Les réseaux sociaux sont considérés par de nombreux photographes comme une formidable vitrine pour faire connaître leur travail, pour peu qu’ils parviennent à entretenir une audience suffisante. IMATAG a donc suivi les transformations d’une image test, dont toutes les métadonnées étaient préalablement renseignées, après son partage sur les plateformes sociales les plus répandues.

Comment les réseaux sociaux gèrent les métadonnées

Résultat: les métadonnées sont effacées par la majorités des réseaux sociaux. Seul Facebook conserve les valeurs du champs “créateur” et “copyright” du format IPTC (en effaçant toutes les autres). Faire figurer le nom du photographe ou le sujet de la photo dans le nom de fichier est également en pure perte : les fichiers sont systématiquement renommés.

 

Attention, sur les réseaux sociaux:

  1. Vos photos sont téléchargeables par tous (vos fans, vos followers, les membres du réseau, selon que vous êtes sur facebook, tweeter, instagram ou autre) et seront téléchargées sans leurs métadonnées (sauf pour Facebook qui conserve votre nom de créateur et votre copyright, si vous l’avez renseigné dans les IPTC)
  2. Il y a des usurpateurs : Certains réseaux rémunèrent les comptes à forte audience, ce qui motive certains faux photographes pour faire connaître vos photos, mais en leur nom! Un des cas les plus emblématiques est celui d’Eduardo Martin, mais il est difficile de mesurer l’ampleur du phénomène. La fonction de repartage (ou freebooting) encouragée par Instagram est également déconcertante vis a vis du droit d’auteur.
  3. Il n’y a pas de recherche inversée : À ce jour aucune offre de recherche par image ne permet de retrouver vos photos dans un réseau social, pour la bonne raison que ces plateformes ne proposent aucun accès, même payant, aux développeurs ni au public. Ne comptez donc que sur votre réseau d’amis et/ou le hasard pour tomber sur une de vos photos volées.

 

Utilisez donc ces “vitrines” en connaissance de cause, en pesant le pour et le contre.

Une astuce: Marquez chaque photo avec un filigrane invisible avant de la poster sur un réseau social afin d’identifier, en cas de vol, sur quel réseau elle a été volée.

 

#7 LES MOTEURS DE RECHERCHE RÉFÉRENCENT LES IMAGES SANS LEUR MÉTADONNÉES”

 

Lorsque vos images  sont référencées par un moteur de recherche, les vignettes donnant un aperçu de votre photo ne contiennent pas les métadonnées d’origine et sont nommées différemment.

les moteurs de recherchent n'tuilisent pas vos métadonnées, ni pour référencer vos photos, ni dans leurs vignettes

De plus les information contenues dans les métadonnées des images d’origine sont ignorées par les moteurs de recherche. Ils ne s’en servent pas, ni pour associer des mots clé ni pour trouver un crédit ou des droits. Les mots clés sont attribués par des Intelligences Artificielles qui analysent visuellement l’image. Les informations de droit d’usage ne sont pas déduits des métadonnées.

Comment chercher des images par source, par auteur, par agence ? IMATAG a mis à disposition du public les images trouvées sur le web avec des métadonnées ou dont les crédits ont pu être déduits à partir d’informations fiables. Remplacez le nom du photographe par le vôtre dans cette requête dans le moteur de recherche IMATAG et trouvez les sites qui créditent vos photos sur le web.

 

QUE FAIRE ?

 

Contrairement aux apparences, renseigner ses métadonnées n’est pas une tâche inutile. Bien qu’elles puissent être maltraitées en cours de route, elles peuvent également être protégées.

Imatag a créé un coffre-fort de dépôt, ou registre, de métadonnées d’images. Le processus est simple:

1- Enregistrer des images, sécuriser les métadonnées:
Les photos et leurs métadonnées d’origine sont stockées dans un serveur protégé.
Les images sont marquées avec un identifiant invisible unique inséré dans les pixels.

2- Utilisation du moniteur:
Imatag surveille en permanence le Web et les publications print
Une fois qu’une copie de l’image est trouvée, elle peut immédiatement être associée à ses métadonnées d’origine.
Même les photos qui n’ont pas été marquées peuvent être identifiées via une recherche d’image inversée.
Grâce à sa base de données de recherche, n’importe qui peut trouver les métadonnées originales d’une image.

3- Avantages:
Informez ceux qui utilisent vos images pour gérer leurs métadonnées.
Découvrez qui pourrait utiliser vos images sans autorisation.
Découvrez si vos images sont utilisées dans un reformatage non autorisé.
Maintenez un contrôle constant sur les droits d’auteur
Résolvez tout conflit de propriété immédiatement.
Surveillez les utilisations non autorisées.
Détectez les emplacements embarrassants.

Pour toute entreprise produisant des photos pour mener ses affaires, il est essentiel de faire sécuriser celles-ci par un tiers indépendant, reconnu et faisant autorité.