Projet:Observatoire des IA/Documentation
Cf. discussion en cours, 8/10/2024 : Que documenter et comment ?.
Centrer la documentation sur la problématique des usages en lien avec Wikipédia, particulièrement les problèmes que ça peut poser. Indiquer des types généraux de pratiques.
Documentation générale
modifierTypes de technos, usages actuels, problèmes connus, questions générales de principe etc.
- examen d'une étude sur le taux d'articles concernés : "As many as 5%" of new English Wikipedia articles "contain significant AI-generated content", says paper, Tilman Bayer, Wikipedia Signpost, 10 oct. 2024. (discussion de l'article)
- Articles d'intérêt à sélectionner dans Catégorie:Intelligence artificielle pour intégration dans Catégorie:Observatoire des IA ?
- Articles à développer ou créer
Détecteurs de contenus générés par IA
modifierÀ faire : donner des infos sur leur fiabilité et la manière de les utiliser sur Wikipédia
- AI Detector By Copyleaks[2],[3]
- GPTZero[4]
- Binoculars[4],[5],[6]
- Risques de pseudo-détecteurs
- zerogpt.com pourrait être un pseudo-détecteur parasitant gptzero.me de GPTZero. Le site a donné un résultat absurde cf. cette discussion
Évaluation des technologies en lien avec Wikipédia
modifierFaire des rapports sur les technos en lien avec WP. Ce qu'on a testé, les questions que ça pose.
Générateurs de texte
modifierGrand modèle de langage en général (LLM - Large Language model)
modifier- Biais et limites : à compléter par la manière dont les utilisateurs experts gèrent les défauts
- Types d'usages et valeur d'usage : brainstorming, textes standardisés (code, rédactionnel bureaucratique), agent conversationnel...
ChatGPT
modifier- Wikilegal : Copyright Analysis of ChatGPT
- GPT-4 surpasses its predecessors" in writing Wikipedia-style articles about NLP concepts, but still "occasionally exhibited lapses"
- Texte standardisé : assistant correct pour du langage codé (cf. Création d'infobox), style administratif,
- Usages en rédaction de bon niveau : les pratiques ne sont pas encore bien fixées[7], il semblerait pour l'heure qu'un utilisateur expert puisse par exemple obtenir une bonne copie de niveau terminale en philo[8] mais il faut maîtriser le sujet et l'outil ce qui le rend alors moins utile voire plus coûteux à utiliser que de rédiger directement, et l'usage le plus pertinent serait comme sorte de « partenaire » d'écriture avec qui échanger, y compris dans un cadre pédagogique pour améliorer des apprentissages[9],[10].
- utilisation de recherches en ligne : ChatGPT explore maintenant des sites comme un moteur de recherche. Je lui ai demandé[source insuffisante] dans quel contexte, réponse pour : des événements actuels ou sujets récents, des sujets peu connus ou nouveaux, de références spécifiques ou de vérification, des informations dynamiques (météo etc.). Sur une question d'actualité (attaques du 7 octobre), il m'a ainsi indiqué Bing et Human Rights Watch comme sources.
- Test complémentaire (13/10/2024), demande de résumé d'un article simple sur des remises de prix littéraire[11] qui contient une erreur de nom dans le titre (Avril Bernard au lieu de Bénard) mais pas dans le texte : il reprend l'erreur de nom , se trompe sur le titre de l'ouvrage qu'il nomme Le temps des cerises, glose dessus (« Le roman de Bernard, qui évoque les souvenirs d'enfance et le passage du temps... ») et ne mentionne pas les autres lauréats indiqués dans l'article. Erreur, hallucination, incomplet : fiabilité zéro ?
- test Fabius Lector[12] : indication de sources appréciable mais aussi résultats peu satisfaisants et l'impression que ça pouvait trop utiliser Wikipédia. P.e. à la question « Leucippe était-il une femme ? », il prenait en compte une correction que j'ai faite en mai mais sans cette correction, la réponse aurait pu être fausse puisqu'il renvoie à l'article comme source. Risque de cercle référentiel. --Fabius Lector (discuter) 13 novembre 2024 à 11:53 (CET)
- En version de base et sans inscription, tests sur divers sujets et problématiques : 0° Pour mémoire : réel risque de cercle référentiel. 1° Il s'agit d'un moteur de recherche associé aux LLM : j'ai trouvé certaines sources remarquablement adéquates à certains prompts (des thèses pointues). 2° Comme moteur de recherche également, il commence souvent par reconnaître sa relative difficulté à répondre avec les sources trouvées (il faut donc travailler les prompts ; changer de langue (pas testé), etc.) 3° Aucune hallucination trouvée dans les réponses, si ce n'est - je crois - l'invention de "vagueur" dans une des questions proposées en complément de la réponse. 4° Reste à voir du côté de la relecture des articles : a) demander si c'est moi qui trouve encore que c'est du charabia ou par ailleurs si c'est bien un point pertinent dans cet article. b) trouver les lacunes des articles (ou éliminer la redondance). Beaucoup d'avenir de mon côté ! TigH (discuter) 7 octobre 2024 à 19:58 (CEST)
- Avertissement du chat : « Gemini peut parfois se tromper ; Gemini peut fournir des réponses inexactes ou choquantes »
- Test Fabius Lector :
- « Leucippe était-il une femme ? » : cercle référentiel, s'appuie sur Leucippe pour le doute avec Jean-Paul Dumont et son évocation par Michèle Le Dœuff ainsi que Leucippe (fille de Galatée) pour le mythe de la femme transformée en homme ;
- « Was Leucippus a Woman ? » : se limite à indiquer une possible confusion entre les deux Leucippe. Indique Leucippe_(fille_de_Galatée) et Stanford Encyclopedia of Philosophy comme source.
STORM AI
modifier- STORM: AI agents role-play as "Wikipedia editors" and "experts" to create Wikipedia-like articles
- Projet de recherche afférent sur Meta, étudiants de Stanford travaillant sur un système pouvant générer une page Wikipédia complète : Wikipedia type Articles Generated by LLM (Not for Publication on Wikipedia)
- Résumés de tests par Pa2chant.bis : Résultats ko
Microsoft Copilot
modifier- Indiqué par Jean-Christophe BENOIST pour de la synthèse de sources
Projets expérimentaux
modifier- 3-10-2024, mentionné ici par Softenpoche : « Je teste depuis un mois une encyclo expérimentale entièrement basée sur 2IA fonctionnant en tandem : l'une s'occupe de la recherche des sources, l'autre analyse ce que la première a trouvé puis synthétise le tout et rédige un article sourcé. [...] J'utilise Perplexity couplé à Claude 3.5 Sonnet. »
Générateurs d'images
modifierStable Diffusion
modifierDall-e
modifierAdobe Firefly
modifierSources impactées
modifierÀ coordonner avec l'observatoire des sources ?
Notes et références
modifier- cf. p.e. Journal Computers and composition, présentation Microsoft Comprendre les outils de rédaction basés sur l’IA et les assistants d’écriture
- Indiqué par Global Donald : « Actuellement l'un des meilleurs détecteurs, et parmi les plus fiables est Copyleaks (la plupart des autres sont des blagues qui ont des faux positifs et faux négatifs en surabondance) »
- Mauvais point par ici, score de 0% ou 100% selon version anglaise ou française alors que la seconde traduit la première.
- Utilisé par les auteurs de l'étude indiquée dans "As many as 5%" of new English Wikipedia articles "contain significant AI-generated content", says paper
- Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text, Abhimanyu Hans, Avi Schwarzschild, Valeriia Cherepanova, Hamid Kazemi, Aniruddha Saha, Micah Goldblum, Jonas Geiping, Tom Goldstein, 13 Oct 2024, Arxiv
- Who Wrote That? Evaluating Tools to Detect AI-Generated Text, Jesse McCrosky, Mozilla, 28 mars 2024
- (en) Stacey Pigg, « Research writing with ChatGPT: A descriptive embodied practice framework », Computers and Composition, vol. 71, (lire en ligne) - analyse qualitative de 35 vidéos illustrant l'utilisation de ChatGPT et de Bing
- Rédaction de copie de philo notée par des profs (vidéo Youtube)
- (en) Cal Newport, « What kind of writer is ChatGPT », The New Yorker, (lire en ligne)
- Post de prof, 7-10-2024 : « je leur demande explicitement de se faire assister par ChatGPT. En revanche, ils doivent décrire leur démarche, les prompts utilisés, tout le travail de rafistolage, etc. C’est même plus contraignant »
- Avril Bernard reçoit le prix de littérature française Lire en Poche 2024
- discussion bistro
- GPT-fabricated scientific papers on Google Scholar
- Sur Amazon, des milliers de livres seraient rédigées par intelligence artificielle sous de faux noms
- Claire Léost, présidente de Prisma Media : « Voici a publié sur son site ses premiers articles avec l’aide de l’IA »