intelligence artificielle générative; protocole d'exclusion des robots
Abstract :
[fr] L’année 2023 fut notamment celle de l’essor des IA génératives capables de générer des images (Stable Diffusion, Midjourney…) ou des textes (ChatGPT, Bard…) originaux. Ces nouveaux outils ont amené leur lot de polémiques. Parmi celles-ci, la question des droits d’auteur des contenus utilisés pour l’entraînement de ces modèles a rapidement touché les scènes médiatiques puis judiciaires. Dans cette recherche exploratoire, nous avons utilisé un
robot d’exploration pour analyser les fichiers « robots.txt » de plusieurs ensembles de sites web incluant le Top 100 Alexa, des sites de presse en ligne et des sites d’éditeurs scientifiques. L’objectif était d’analyser le recours à cette norme technique, soit le protocole d’exclusion des robots, pour traiter cette question de la violation de la propriété intellectuelle. Nos résultats montrent une forte utilisation des mesures de blocage par les sites vivant de la publication de contenus. Ils mettent cependant en évidence certaines incohérences dans les mesures de blocage ainsi que les limitations actuelles du protocole d’exclusion des robots.
Disciplines :
Management information systems
Author, co-author :
Viseur, Robert ; Université de Mons - UMONS > Faculté Warocqué d'Economie et de Gestion > Service des Technologies de l'Information et de la Communication
Language :
French
Title :
Régulation des IA génératives par les gestionnaires de sites web : une étude exploratoire