ia / agents conversationnel > Réponse Politique & Société sujet
-
posté 23/02 (10:32)Un article de Médiapart sur les données d'entrainement des IA. On y lit que l'IA testée (Mistral) est capable de recracher des extraits entiers d'œuvres protégées (et parfois dont les auteurs se sont clairement prononcés contre l'utilisation de leur texte).
Bien entendu, l'article mentionne aussi que les scrapers à disposition des IA pour répondre aux requêtes immédiates (il ne s'agit donc pas des données d'entrainement) ne respectent pas les robots.txt disponibles sur le site, et en lisent le contenu à la volée pour l'offrir aux clients. Bien entendu, cela se traduit par une perte financière pour des sites (pertes en revenus publicitaires, typiquement, mais aussi en visibilité de la source).
L'inéluctabilité de l'IA, ça ne marche que parce qu'il n'y a aucune politique sérieuse pour se pencher sur ces méthodes de mafieux sur internet.
curieux