Discussion:Gaydar

Dernier commentaire : il y a 5 ans par Misc dans le sujet Papier de Michal Kosinski
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Terme LGBT ?

modifier

Notification DakledbA : Bonjour,

Cette modif m'interpelle : en quoi le terme "gaydar" serait-il spécifiquement LGBT ? Bien sûr les thèmes traités sont liés au thème LGBT, mais le mot lui-même n'est pas spécifiquement employé au sein de la communauté LGBT, à ma connaissance (à part dans le contexte du site internet de rencontres qui en utilise le nom, mais le mot date de bien avant, il est attesté depuis au moins 1982). Y a-t-il une source qui ferait de ce sujet un "terme LGBT" ? Esprit Fugace (discuter) 9 janvier 2019 à 18:13 (CET)Répondre

Bonjour Notification Esprit Fugace :, je ne sais pas. J'avais juste remarqué que beaucoup de jargon LGBT ne mentionnait pas que c'était du jargon LGBT. Je peux me tromper. Vous êtes sûr que Gaydar n'est pas propre au milieu LGBT? Je n'ai jamais entendu ou vu ce terme ailleurs que dans ce milieu.--DakledbA (discuter) 10 janvier 2019 à 08:03 (CET)Répondre
Notification DakledbA : Les premiers résultats sur lesquels je tombe lors d'une brève recherche n'ont pas l'air spécifiquement LGBT : slate, psychology today, washington post, le plus du nouvel obs... C'est pas spécialement Pink news ou Têtu. De plus, il ne faut pas confondre origine d'un mot et sens de ce mot - vos ajouts m'interpellent aussi sur les autres articles où vous avez ajouté "terme conçu par les LGBT" (ou une variante). Ce n'est clairement pas vrai sur certains articles (comme Queer), et ça ne me semble pas pertinent sur les autres. Là où c'est vrai (avec source si possible), ce type spécifique d'information touchant à l'étymologie aurait sa place sur le wiktionnaire ou dans une section dédiée à l'origine du mot, mais pas en première phrase d'intro. Les articles de Wikipédia traitent d'abord des concepts, pas des mots qui les désignent. Cordialement, Esprit Fugace (discuter) 10 janvier 2019 à 10:30 (CET)Répondre
Excusez moi si j'ai fait une erreur. Je pensais bien faire en précisant que c'était des termes liés à la communauté LGBT d'autant plus qu'ils ont tous la catégorie terme LGBT.--DakledbA (discuter) 10 janvier 2019 à 13:54 (CET)Répondre

Papier de Michal Kosinski

modifier

Bonjour,

je pense que l'étude de Michal Kosinski n'a rien à faire ici, car la presse l'a mal comprise. J'ai lu l'étude, et je ne suis pas d'accord avec l'ajout pour plusieurs raisons méthodologiques.

Primo, l'étude ne prends pas en compte les personnes bisexuelles (une part non négligeable de la communauté LGBT cf divers études/sondages, comme celui la) et suppose que les gens ne mentent pas sur leur profil de site de rencontre (ce qui est aussi faux). Vu qu'il y a quand même des préjudices ou de la fétichisations envers les personnes bies, je suis sur que tout le monde ne le mets pas sur son profil de site de rencontre. Donc il y a déjà un souci sur ça, souci noté page 33, en expliquant que si on arrive à avoir des résultats aussi précis avec des données fausses en partie, alors on peut que avoir mieux avec des bonnes données, ce qui me parait méthodologiquement incorrect, car la précision peut chuter si on rajoute des données moins séparé que le jeu de donnée utilisé (autrement dit: en:Garbage in, garbage out).

Secondo, prendre du 50/50 pour entrainer un réseau de neurone alors que la distribution en conditions réels est plus proche de 90 (hetero)/10 (non hetero), c'est sans doute une forme d'oversampling. Et ne prendre que des personnes ouvertement homosexuelles sur un site de rencontre (avec donc des profils et des photos prévus pour plaire suivant certains codes sociaux) est aussi sans doute aussi un biais statistique. Il n'y a pas non plus le nom du site de rencontre, ce qui est quand même limite au niveau de l'éthique (en plus de l'usage de photos pour ça sans avoir l'accord des gens).

Tertio, l'étude ne donne pas de chiffres sur la précision à part un laconique "AUC equal to 0.91". L'AUC ("area under the curve") est une mesure qui est censé synthétiser les différentes mesures de précision (voir en:Evaluation_of_binary_classifiers pour ce qu'il y a à simplifier), et bien que ça soit à la limite de mes connaissances en IA, je suis globalement sur que ça ne veut pas dire "est juste 91% du temps", et c'est même marqué dans le papier page 52: "The AUC .91 does not imply that 91% of gay men in a given population can be identified, or that the classification results are correct of the time". Or le Guardian dit le contraire: "an algorithm used online dating photos to create a program that could correctly identify sexual orientation 91% of the time with men and 83% with women". J'ai aussi trouvé un article disant "Il faut faire attention avec l'AUC" (papier ici).

Quarto, "notre réseau de neurone tends à prouver que l'orientation sexuelle est lié à des hormones qui se retrouve aussi à changer la forme du visage" est limite de la phrénologie. Et l'échantillon pris est fortement biaisé (cf "we were limited to studying white participants from the U.S") en plus des biais sur la selection des gens. La seule autre conclusion étant "un réseau de neurone entrainé est plus efficace qu'un humain non entrainé pour distinguer des gens sur des critéres arbitraires qu'on lui donne", c'est pas vraiment novateur.

Du coup, je pense que ça n'a pas sa place, et je vais le retirer. La citation tiré du Guardian est fausse, et le papier de base me parait faux. --Misc (discuter) 14 septembre 2019 à 11:43 (CEST)Répondre

Notification Misc : Tout d'abord, Wikipedia est principalement basé sur les sources secondaires et le papier est plutôt une source primaire. Wikipedia n'a pas à dire ce qui est vrai mais simplement à rapporter ce qui est admis. Tout d'abord, il n'est pas interdit de se limiter à un sous-ensemble parfaitement défini (Américains hommes, caucasiens et jeunes). Que l'algorithme fonctionne ou non pour des African Americans n'est pas l'objet du papier. Il est vrai que si l'algorithme reconnaît 90% des gays qui se sont identifiés en tant que tels vu qu'il n'y a que 10% de gays (ou bis), il sera plus que probable que des hétérosexuels seront libellés à tort comme gays (théorie des probabilités conditionnelles, et ce même avec une probabilité de 90% de reconnaître lesdits hétéros). Le papier dit simplement que le gaydar d'une machine est meilleur que celui d'un humain pour une population donnée. Il est donc clair que que tyran moyenâgeux de service ne pourra pas effectuer une ablation de la tête basée sur cet algorithme, car de nombreux hétérosexuels seraient raccourcis à tort (soit environ 10% de la population). J'ai aussi lu des critiques du papier en question qui confirment ce que je viens juste de dire. Il me semble être de bon sens qu'un gay efféminé sera plus imberbe qu'un homme « normal » en moyenne et aura un visage plus féminin. Lorsque le crâne est rasé, il est encore possible du premier coup d'œil de distinguer une femme d'un homme. Donc, il n'est donc pas surprenant qu'un algorithme soit capable d'effectuer le même travail. Maintenant se pose la distinction source primaire source secondaire. Je pense que The Guardian n'a pas tout compris et on dit toujours qu'une source secondaire généraliste est à éviter. Je pense que la source primaire devrait être rétablie (qui n'est pas si fausse que ça avec ses limitations) et utiliser une source secondaire qui résume le papier en question. Google Scholar en fournit plusieurs. Ce que dit le Guardian devrait être poussé en bas de page en disant qu'ils vont un peu trop vite. Cependant, une chose est acquise qui ne va pas plaire à nos chers evangelicals et autres moisis du ciboulot : ce papier démontre de manière claire que l'homosexualité est innée et n'est pas un choix car les corps des gays tendent à être différents. 2602:301:77C4:6D80:9DD2:FE0D:A97F:1773 (discuter) 15 septembre 2019 à 03:22 (CEST)Répondre
Comme dit plus haut et dit dans le papier (page 52), avoir 0.91 comme AUC ne veut pas dire correct 91% du temps. Le journaliste du Guardian ne peux donc pas affirmer ça sur la base du papier, et wikipedia n'a pas vraiment pour vocation de reprendre les choses fausses des journaux non scientifiques.
Et au dela de ça, l'exemple même du tyran moyen ageux montre bien que si c'était vraiment correct 90% du temps, alors ça ne vaudrait rien en pratique. Si sur une population de 100 personnes (90 heteros, 10 non heteros, cf sondage ifop), l'algo va désigner 10% des non heteros (1 personne) et 10% des heteros comme mal classé (10 personnes), alors on se retrouve avec 10 heteros et 9 non heteros classé comme non heteros. Quand on obtient moins de résultats corrects que de résultats incorrects, ça me parait assez mauvais, et c'est un exemple de en:Base rate fallacy.
Ensuite, le fait de n'avoir pris qu'une population blanche a un impact. Par exemple, page 20, la note de bas de page qui pointe sur le fait que les hommes gays auraient une peau plus clair est sans doute impacté par ce choix, vu qu'il n'y a aucune mention d'avoir pris un échantillon équilibré (par exemple, est ce que les communautés gays latinos vont sur d'autres sites, sachant qu'il y a d'un coté plus de personnes LGBT chez les latinos aux USAs, mais que la culture rends ça plus difficile).
Autre biais sur les images, le fait d'avoir pris un site de rencontre implique sans doute d'avoir un smartphone, ce qui est correlé avec le niveau de vie, lui même correlé avec certains groupes dans le contexte des USA (et qui va aussi avoir un impact sur la couleur de peau).
De même, le papier pointe aussi sur le fait que l'algo a pu se baser sur le style vestimentaire (ligne 386), ou le fait de sourire (ligne 388), qu'on voit quand même clairement dans le schema 4, mais c'est une nuance qui est totalement passé à la trappe dans le reste du papier et la conclusion. L'étude 2 dit que l'algo qui se base sur la facial feminity marche mais avec un AUC de 0.57, c'est assez mauvais (cf ce papier), donc dire with some accuracy est trompeur.
La partie sur la généralisation entre Facebook et le site de rencontre est aussi curieuse, sachant que Facebook a lancé un site de rencontre (certes récement), et que les sites de rencontres permettent d'importer les photos de Facebook, donc ça n'est pas aussi isolé qu'on le croit. Je note également que ce boout du papier ne prends que les hommes en compte.
Enfin, le lien entre ce qu'un réseau de neurone détecte sur une population limité et la PHT (prenatal hormone theory) me parait ténu. La PHT à elle seule ne me parait pas pouvoir expliquer la prévalence des relations entre hommes dans la Gréce antique ou d'autres cultures, donc il est fort probable qu'une forte composante culturelle soit à l'oeuvre également, ce qui montre que ça peut ne pas être inné (sauf à nier l'histoire). C'est de surcroit une position qui ne respecte pas vraiment WP:NPOV vu les controverses autour du sujet, et un point de vue qui invalide le vécu de gens ayant une sexualité plus fluide (genre, les 50% de personnes classé comme bisexuelles de la communauté LGBT, qui sont aussi absentes des études en général, et de celle la en particulier). --Misc (discuter) 15 septembre 2019 à 12:06 (CEST)Répondre
Revenir à la page « Gaydar ».