ia / agents conversationnel

  • modifié 27/02 (11:20)
    +0 -1 -1 
    gloubi a écrit :

    Certes, mais on en est au point où il suffit de télécharger 3 fichiers pas bien gros créés par une entreprise chinoise (donc pas soumise aux mêmes lois sur les droits d'auteur que nous - ou au minimum, dans un pays pas toujours motivé à faire respecter les copyright occidentaux ; c'est même pas un reproche que je leur fait). la boîte de pandore pourrait pas être plus ouverte.


    Dans ma tête, je fais une équivalence entre ça et du .torrent. Oui les gens compétents et qui le souhaitent pourront accéder à des œuvres protégées. Pour les autres et pour la consommation de masse, si les SAAS sont éteints, que les sites mettant en ligne ces modèles se font strike par des juges (avec DNS menteurs, puisque c'est ce qu'on utilise beaucoup en France), il reste combien d'utilisations d'IAG ?

    voici ce que je trouve libre de droit en 1 seconde de recherche


    Et le sujet est sensible : en faisant mal la loi ici, on risque vite de se retrouver à faire la chasse au moindre adolescent dessinant un fanart d'une oeuvre protégée (ça s'est déjà vu).


    Je pense qu'il est très clair que ces images ne sont pas libres de droit. Shutterstock ment en les présentant comme telles (et c'est pas dramatique). On peut attendre des IAG qu'elles fassent le tri. Je suis d'accord avec toi que le sujet est sensible parce qu'il y a une ligne de crête. Pour ma part, je ne trouve pas absurde d'avoir des exigences supérieures pour une invention destinée à lobotomiser la planète à grands coups de milliards que pour Tim, qui dessine Sangoku sur ses feuilles A4 grands carreaux. Mais bon on n'en prend pas le chemin dans tous les cas.
  • modifié 27/02 (12:32)
    +0 -1 -1 
    Un[*b]curieux a écrit :

    Dans ma tête, je fais une équivalence entre ça et du .torrent. Oui les gens compétents et qui le souhaitent pourront accéder à des œuvres protégées. Pour les autres et pour la consommation de masse, si les SAAS sont éteints, que les sites mettant en ligne ces modèles se font strike par des juges (avec DNS menteurs, puisque c'est ce qu'on utilise beaucoup en France), il reste combien d'utilisations d'IAG ?


    La différence avec le .torrent (et tout ce qui a existé), en tout cas pour moi, c'est que sur les .torrent tu as un fichier différent par oeuvre. Soit beaucoup de fichier. Soit l'obligation de créer des "noeuds" compilant toutes les oeuvres possibles (pour avoir la visibilité issue de plein d'oeuvres côté fournisseur, et pour le confort de ne chercher que dans un seul truc où tout est dispo côté utilisateur), et donc la possibilité en face de faire fermer ces noeuds.

    Qwen (et tous les autres modèles de génération d'image - je prends qwen en exemple parce qu'il est très puissant d'un côté et que tu te heurte, côté création du modèle, à la molesse de la Chine pour ce qui est de faire respecter les droits d'auteur), c'est trois fichiers de taille raisonnable pour tout avoir. Ca me semble bien plus ardu à bloquer que tout ce qui a existé avant. Je comparerais ici plutôt à l'effet Streisand : tu bloques la mise à dispo officielle, tu as des mises à dispo pirates partout qui apparaissent, parce qu'il y a pas grand chose à mettre à dispo.

    Ces fichiers demandent un truc comme ComfyUI pour être utilisé facilement. Interdire ComfyUI, c'est équivalent à interdire les lecteur de DVD parce qu'il existe des DVD pirates. En fait, les librairies IAs "classiques" du python sont déjà capable de lire ces fichiers - ComfyUI le fait juste de façon plus optimisée et avec une GUI permettant de facilement tester des suites de manipulations (genre générer une image puis l'upscaler). Ceci étant ComfyUI donne les templates des workflow différents modèles de génération d'image, tu peux au moins attaquer ça - faire en sorte qu'il ne suffisse pas de 2 clic dans comfyui pour avoir un workflow qwen.

    Et enfin, il existe des site spécialisés génération d'image, parce qu'il y a une masse de "sous-modèles" de fine-tuning (essentiellement ce qu'on appelle les lora) et donc un besoin de les regrouper (comme pour les .torrent). Ces "sous-modèle" sont en gros, l'équivalent d'un mod pour les jeux vidéos (un fichier qu'on branche sur la base). Tu peux sans difficulté interdire ces sites, mais ça ne bloque que le "modding", et ça peut être problématique si on admet des utilisation "légitimes" de l'IA (genre des modèles entraînés purement légalement) : s'il y a des modèles légitimes, alors les modder avec un mod légitime devrait être légitime. Par ailleurs, les lora sont je suppose aussi une façon de se faire la main sur la création de modèles pour certaines personnes, mais ici j'ai aucune connaissance (j'ai l'impression que créer un lora, c'est comme créer un modèle, mais à plus petite échelle, mais en vrai j'en sais rien) ; si c'est le cas et qu'on admet des modèles légitime, c'est très problématique de bloquer la façon dont des jeunes peuvent se faire la main.

    ... Note que je suis pas du tout un expert de ceci. Si tu te contentes d'interdire les LLM, alors j'ai plus aucune connaissance en génération d'image, sur les sites etc : c'est un LLM qui m'a orienté sur ces sites, sur ComfyUI (note : ComfuUI a des tutoriaux tellement dégueulasse, je pense sans exagérer que c'était plus facile d'avoir une install Linux fonctionnelle en 1998 que d'arriver à comprendre ComfyUI aujourd'hui à partir des tuto sans aide - par exemple d'un LLM), et ce après m'avoir aidé à comprendre et programmer une base (... base sur laquelle on finit par se retrouver limité parce qu'on ne peut pas optimiser autant que comfyui, et on n'a pas une interface graphique permettant de rapidement tester des trucs en faisant des changement rapides). Bref, actuellement c'est plutôt en s'attaquant aux LLM qu'on arrive à ta situation "oui les gens compétents et qui le souhaitent pourront accéder à des œuvres protégées" - et l'accès aux LLM est actuellement facilement attaquable puisque ceux qui sont puissant ne tournent pas en local.


    Je pense qu'il est très clair que ces images ne sont pas libres de droit.


    Je sais pas. Ca ne m'étonnerait pas qu'elle ne le soient pas et que shutterstock mente ; de l'autre côté quand j'entends les musiques que le JdG fait faire pour ses vidéos, qui "imitent" une musique connue, je ne sais pas où se situe la marge de manoeuvre pour un artiste en terme d'imitation de personnage, de style, etc. (le JdG les fait faire par un vrai artiste, qui a mon avis sait ce qu'il est en droit faire. Après, peut-être qu'en vrai c'est pas légal et n'a pour objectif que de tromper le bot youtube)
  • posté 05/03 (12:55)
    +0 -1 -1 
    Lecture du jour : « The L in LLM stands for lying ».

    Les effets des IA (et des agents IA auxquels on donne des capacités d'intervention élargies) se font sentir et ciblent naturellement en premier les structures vulnérables, et le logiciel libre.

    Ici, le projet ferme les contributions au public parce qu'ils ne peuvent plus trier les contributions IA. Ici, c'est un bug bounty qui ferme. Ce n'est à mon avis que le début : ces fermetures vont se généraliser tant qu'il n'y aura pas un moyen de les éviter.

    D'ailleurs, j'en suis à me demander : est-ce qu'on sait faire un captcha qui piège un agent IA ?
  • modifié 05/03 (13:26)
    +2 -0 +2 
    Un[*b]curieux a écrit :

    D'ailleurs, j'en suis à me demander : est-ce qu'on sait faire un captcha qui piège un agent IA ?

    C'est le seul qui va dire "Oh tu as raison, quelle idée superbe" alors qu'un humain va préférer une réponse plus offensive. Mais j'ai peur qu'il apprenne vite...
  • modifié 05/03 (15:55)
    +1 -1      
    Un[*b]curieux a écrit :

    D'ailleurs, j'en suis à me demander : est-ce qu'on sait faire un captcha qui piège un agent IA ?

    Peut-être, mais sans doute pas pour longtemps, vu que les ia sont déjà capable d'analyser et décrire des images, et les modèles de génération d'image de les éditer. Les éditer en les analysant. Je précise : je suis tombé sur un article de recherche (que je sais plus retrouver) indiquant qu'actuellement une méthode d'attaque des "modérateurs ia" (qui bloquent certaines générations d'images en analysant le prompt) est de mettre les instructions de modification directement sur l'image à éditer (et rien dans le prompt). Voilà où on en est. Et j'ai l'impression que c'était même pas un comportement voulu des modèles d'édition d'images (...mais pas si étonnant vu que ces modèles sont sensé pouvoir comprendre et appliquer un prompt du type "traduis le contenu du panneau d'affichage en français, garde la même police d'écriture" : ils sont supposés pouvoir comprendre un texte dans une image).

    Je pense qu'il est plus simple de faire une ia qui détermine où cliquer dans une image, ou quoi écrire dans une textbox à partir d'une image, que ce que je viens de décrire.
  • modifié 06/04 (22:16)
    +1 -1      
    Mediapart sort une série d'articles sur l'IA d'un point de vue économique. Ils ont sorti le 2e aujourd'hui :

    Lien vers la série

    Je suis un grand fan de Romaric Godin, l'auteur, dont je trouve qu'il est souvent documenté et précis. Ici le point de vue qu'il présente me conforte dans mes biais, mais on retrouve deux points :
    - il n'est pas question à terme de laisser l'IA être un produit de consommation courante. Le coût des abonnements en font des outils pro, réservés aux personnes dont les entreprises jugeront que c'est utile.
    - et du point de vue de l'utilité, il n'est pas clair que le rendement soit au rendez-vous. Au contraire des miracles (dont ceux présentés sur le topic), on ne constate pas vraiment un gain de rentabilité suite à l'adoption des IA (je pense qu'on peut discuter les exemples donnés dans ce topic, mais pour commencer, l'IA fait surtout gagner du temps aux personnes qui ne sont pas expertes).

    Problème notable dans les articles pour le moment, la question des modèles open-source n'est pas trop abordée (en cela ça dévie légèrement du post initial). Mais pour le moment, je ne crois pas que l'adoption de modèles open source soit un objectif pour une majorité de personnes (à l'inverse, on a l'impression que les gens veulent plutôt utiliser le plus gros modèle SAAS à la mode).

    Edit : il en est en fait un peu question dans cet autre article qui parle d'une BDD de hugging face, et dont Mediapart révèle qu'elle est bourrée de matériau protégé par droit d'auteur. Cela illustre pas mal les techniques de prédation du secteur.
  • modifié 20/04 (18:22)
    +1 -0 +1 
    J'aime pas faire de la pub à Ruffin, mais il y a une semaine s'est déroulé le meilleur cross over de threads KI de tout l'univers.
  • posté 22/04 (21:28)
    +0 -1 -1 
    gloubi a écrit :

    Au top cette discussion entre Ruffin et l'IA Claude. Elle est sortie il y a une semaine et elle mérite vraiment d'être partagée massivement.
    J'ai beaucoup aimé le passage sur le fait que les riches limitent les écrans à leurs propres enfants et qu'il y aura une proportionnalité entre la richesse et la présence humaine : aux pauvres les écrans, aux riches les solutions humaines.

    ___

    Vous allez aimer me détester...
  • posté 23/04 (12:47)
    +1 -1      
    Une petite émission de Blast, plus intéressante que le truc de Ruffin.
  • modifié 28/04 (14:34)
    +1 -1      
    Dans cet article (en pré-publi), il est question des limites de l'auto apprentissage (l'idée que des modèles pourraient progresser en s'auto-alimentant est donc prouvée fausse). Une version vulgarisée est ici.

    Cela pose à mon avis une difficulté importante : le pourrissement du web par les IA.

    Les LLM sont entrainés sur des données récupérées sur Internet, or internet est désormais (depuis 2022 et de plus en plus rempli de textes/images/vidéos produites par IA. Comment éviter le pourrissement des IA par assimilation de contenu produit par IA ? Ben simplement en payant de plus en plus d'humains pour déterminer l'origine des messages et leur caractère "humanesque". Et cela deviendra obligatoire, parce que dans un contexte de compétition économique, il est impensable de ne pas sortir une nouvelle version régulièrement, et un narratif pour justifier de la vendre plus ou plus cher. Comment filer de plus en plus de données à ces modèles ? En triant les données.

    Je ne sais pas s'il existe déjà une catégorie de travailleurs/euses du clic dont la mission consiste à trier des documents pour filtrer ceux produits manifestement par IA, mais il me semble clair que ça existera à terme. Autrement dit ce n'est pas du tout sûr que l'IA (en tant que technologie capitaliste développée dans un environnement capitaliste) fait gagner la moindre heure de travail à qui que ce soit : elle va surtout déplacer du travail des sociétés occidentales vers du travail besogneux et aliénant, exécuté par des personnes de pays du sud global sous-payées.

    Je signale aussi cette vidéo récente de Garys economics (économiste signalé par Fuga sur l'autre topic). Lui postule que l'IA est porteuse d'un gain de rendement important, mais il conclut que c'est une mauvaise nouvelle pour quasiment tout le monde (avec un détour apprécié par les luddites).
  • Hier

  • 17:50

    Ils sont plein de pognon, dans la Palladium Corporation...


  • 17:49

    Vive la Cursurie !

  • Avant-hier

  • 16:21

    Soumettez-vous à la Grande Déesse !


  • 16:21

    Activé mon personnage ça fait une journée que j'attends

  • 14/05

  • 23:13

    Révolution !


  • 23:12

    VIVE LA CURSURIE


  • 23:12

    vive la cursurie

  • 10/05

  • 19:24

    Ssech, j'ai les oreilles qui sifflent...


  • 19:24

    krabot


  • 19:24

    Libère ta liberté !

  • Texte généré à 04:17:57