Translate

Affichage des articles dont le libellé est intelligence artificielle (IA). Afficher tous les articles
Affichage des articles dont le libellé est intelligence artificielle (IA). Afficher tous les articles

3 mars 2025

Macron se mêle d’IA, le désarroi s’installe

H16

- 3/3/2025 - Comme l’annonce Emmanuel Macron en fanfaronnant depuis son compte X, la formidable dynamique du Sommet de l’IA à Paris se poursuit, alors bon, c’est décidé, fini de rire, et en avant ! La France, fermement cornaquée par son extraordinaire président, se lance à l’assaut de l’Intelligence Artificielle et entraînera avec elle toute l’Europe dans une conquête triomphale de l’avenir de l’Humanité. Envoyez la musique !


Cependant, avant cette consécration, il faudra probablement régler quelques petits soucis, car pendant que ça cabotine joyeusement du côté de l’Élysée, les services administratifs de l’État continuent d’empiler les échecs informatiques avec une constance troublante : dans une presse particulièrement discrète, on apprend ainsi que le projet informatique Scribe, ce logiciel de rédaction de procédures pénales destinés à la police et la magistrature françaises, vient d’être abandonné après neuf longues années de merdoiements intenses.

Son histoire mérite d’être contée, tant elle se rapproche des précédentes foirades mémorables de l’État en matière d’informatique et dont ces colonnes font la recension régulière, et peut remonter au remplacement, déjà chaotique, d’un outil logiciel des années 90, le LRP, qui fonctionnait avec une relative satisfaction de ses utilisateurs mais, malheureusement sur un système d’exploitation plus que vieillissant (MS-DOS).

En 2010, LRPPN est donc déployé dans le but de le remplacer. Sans même évoquer les ratages que furent, en parallèle et dans les mêmes domaines, les logiciels ARDOISE et CASSIOPEE, force est de constater que c’est un douloureux échec : plantages, lenteurs, difficile adaptation par rustines multiples aux changements constants de procédure pénale, l’informatique pénale tourne au cauchemar pour la police.

En 2016, il est donc décidé de lancer un nouveau projet, Scribe, dont CapGemini remportera l’appel d’offre. Cependant, après 13 millions d’euros (sur les 8 prévus au départ) et neuf années de bricolages frénétiques, le constat est sans appel : c’est un fiasco. Le souci étant que le logiciel LRPPN, toujours en usage, n’est plus apte à faire son travail et entraîne une multiplication des vices de procédures dont profitent directement les prévenus…

En somme, le président d’un pays incapable de doter ses administrations des outils informatiques essentiels se croit capable de lancer sa bureaucratie sur l’intelligence artificielle avec cet aplomb que seuls les cuistres peuvent déployer en braillant, l’air bravache, « l’intendance suivra ! » avant de trotter, sabre au clair, au milieu d’un champ de betteraves.


Heureusement et pendant ce temps, les entreprises privées du reste du monde n’attendent pas les gesticulations du président français, virilement parti de son côté pour faire avancer les IA « frugales et respectueuses de l’environnement dans une gouvernance mondiale inclusive » et patin-couffin.

Ainsi, outre les modèles de moteur d’IA les plus avancés (Grok 3, GPT 4.5, Gemini 2.0, …) dont les dernières versions sont maintenant disponibles et qui dépassent chaque mois les capacités et performances des précédentes versions, l’intelligence artificielle commence à voir ses domaines d’application s’étendre de plus en plus vite.

C’est par exemple le cas dans celui de la modélisation des génomes avec le modèle d’IA Evo-2 : avec ce moteur totalement open-source, l’IA ne se contente plus de décrire la biologie, elle peut la concevoir et créer une vie synthétique à partir de zéro, des génomes complets ou simuler des cellules entières. Evo-2 prédit les effets des mutations sur les protéines et l’ARN, et les aptitudes des organismes à partir de leur génome.

Les potentialités sont stupéfiantes et les dérives possibles évidemment énormes.


Dans le domaine de la santé, l’IA assiste de plus en plus le personnel médical et si on l’utilise déjà pour l’analyse de l’imagerie médicale, son taux de succès étant maintenant meilleur que celui des radiologues, d’autres usages se font jour chaque mois qui passe. Dernièrement, il apparaît que l’analyse des signaux d’électrocardiogramme par l’IA permet d’obtenir une aussi bonne mesure de l’état du myocarde que des procédures jusqu’alors invasives (ici, la pose d’un cathéter sur le muscle cardiaque droit, ou CCD).

On peut aussi citer les avancées de l’IA en cybersécurité, soit du côté offensif (l’IA est utilisée pour attaquer une cible et produire ensuite un rapport circonstancié des points faibles repérés pour que le client puisse mieux se protéger, comme le propose Dreadnode), soit du côté défensif (l’IA est utilisée pour construire, dans le contexte d’une entreprise, l’ensemble des stratégies de protection et les règles à appliquer pour obtenir le niveau de protection désirée), les deux approches pouvant se complémenter.

Bien sûr, il ne s’agit ici que de quelques exemples saillants d’un mouvement d’ensemble plus profond : tous les domaines d’activités sont (ou seront très bientôt) touchés par l’intelligence artificielle et on comprend, dans ce cadre, les frétillements de la classe politique pour feindre d’organiser ce qui leur échappe complètement.

En outre et pour ceux qui en doutaient encore, ces évolutions en matière d’intelligence artificielle marquent le fossé – voire le véritable canyon – qui se creuse entre l’Europe d’un côté, et la Chine et les États-Unis de l’autre. La première a vigoureusement choisi de réglementer et de lancer sa bureaucratie à l’assaut des entreprise qui investissent le domaine, pendant que les seconds déblaient autant de terrain que possible pour qu’elles se développent.

Cependant, à l’instar de l’informatisation de la société qui a permis dans tout l’Occident d’engloutir les gains de productivité ainsi obtenus dans des États providence obèses, on peut à présent redouter que l’Europe et la France choisissent résolument d’utiliser l’intelligence artificielle pour aider le continent à s’accommoder de sa bureaucratie paralysante.

Malgré tout et comme le prouve le projet Scribe, le calibre phénoménal des incapables de compétition qui nous gouvernent actuellement permet de rester optimiste : l’Europe et la France s’effondreront heureusement sous le poids de leur bureaucratie, l’IA n’y pourra rien et c’est tant mieux.


https://h16free.com/2025/03/03/80330-macron-se-mele-dia-le-desarroi-sinstalle

29 janvier 2025

Intelligence artificielle : le coup de tonnerre DeepSeek

H16

- 29/1/2025 - Ces derniers jours, le monde de l’intelligence artificielle est entré en ébullition : en plus des progrès stupéfiants déjà enregistrés ces quelques années, ce qui s’est passé rebat fondamentalement les cartes tant dans le domaine de l’IA qu’au niveau de la géopolitique internationale…


Ici, on pourrait par exemple évoquer les dernières avancées qui ne cessent de surprendre comme, par exemple, un papier de Meta (la firme de Zuckerberg, très investie dans le domaine) qui relate les performances du projet SEAMLESSM4T dont les prémices remontent à 2022 et qui vise à permettre la traduction linguistique à la volée, sans passer par l’écrit.

Traditionnellement, les outils de traductions vocale enregistrent le locuteur dans une langue, produisent un texte à partir de ce qui est compris, traduisent le texte dans la langue cible et utilisent un outil de vocalisation pour le résultat final. Les progrès de Meta proposent de se passer des étapes intermédiaires et offrent à présent un « speech-to-speech translation » de 101 vers 36 langues, le tout en une paire de secondes de retard au plus, et en conservant l’intonation de la voix du locuteur. Il s’agit maintenant d’une solution robuste pour la traduction à la volée de niveau quasiment professionnelle, les métaphores et certaines subtilités culturelles ou linguistiques n’étant pas encore bien gérées.

Beaucoup d’argent… pour pas grand-chose ?

On pourrait aussi évoquer les 500 milliards de dollars d’appels de fonds largement médiatisés par Trump la semaine passée, et mis en place par les principales sociétés technologiques impliquées dans la course à l’intelligence artificielle : manifestement, les Américains n’hésitent pas à mobiliser de très larges sommes pour parvenir à développer des moteurs d’intelligence artificielle toujours plus pointus et performants. Cela explique au passage la transformation d’OpenAI, auparavant une fondation sans but lucratif, en une société capitaliste en bonne et due forme : beaucoup, outre-Atlantique, ont compris qu’il n’y avait pas une minute à perdre pour garantir que les prochaines avancées majeures dans le domaine seront de leur côté et non ailleurs.

Cependant, ces sommes et ces exemples, aussi importants soient-ils, viennent d’être complètement remis en cause par les derniers résultats de DeepSeek, une start-up chinoise qui avait jusqu’à présent déjà produit d’intéressants moteurs aux performances comparables aux acteurs les plus connus du marché (OpenAI, Meta, Anthropic, etc.).


Dans un ensemble de papiers et de sources logicielles publiés la semaine dernière, DeepSeek annonce son moteur R1 qui permet d’atteindre (au moins) les performances de o1 de chatGPT, l’un des modèles les plus performants actuellement disponibles. Et après analyse, les évaluations confirment en effet ces affirmations avec un point fondamental : R1 est disponible pour 3% du prix proposé par OpenAI. Mieux encore, étant « open source », chacun peut analyser, évaluer et mieux encore, reproduire le moteur chez soi en version raffinée, plus petite mais adaptée aux machines de bureau, ou en version complète lorsqu’on dispose d’une grosse machine ou d’une infrastructure informatique idoine.

Le point fondamental est que DeepSeek est une structure chinoise qui subit l’embargo plus ou moins ferme des États-Unis sur les puces les plus avancées qui comptent parmi elles celles consacrées à l’intelligence artificielle. Elle a donc développé ce moteur aux performances redoutables pour une petite fraction – les responsables de DeepSeek évoquent ainsi 6 millions de dollars – du coût de ChatGPT d’OpenAi qui ont, eux, investi des centaines de millions de dollars dans leur moteur actuel.

Et même si on se doute que l’embargo aura été contourné (et donc que l’investissement matériel serait très conséquent), même si certains se consolent en espérant que les Chinois n’auraient que « recopié » les principes développés par OpenAi, pour ceux qui ont déjà passé un peu de temps sur les sources publiées et les explications détaillées par DeepSeek dans ses papiers, il ne fait aucun doute que ses développeurs ont réalisé de vraies prouesses d’optimisation et de raffinement pour obtenir leurs résultats. Autrement dit, le matériel peut bien avoir été coûteux, l’entraînement du moteur, auparavant hors de prix, devient soudainement très abordable.

Au passage, ceci illustre une nouvelle fois que des contraintes fortes (ici, en terme de technologies et de fonds) génèrent des améliorations et des optimisations essentielles par nécessité, et démontre que les modèles produits jusqu’à présent sont largement optimisables et n’ont probablement pas les besoins énergétiques et financiers aussi énormes qu’on envisageait jusqu’alors.

Un impact géopolitique certain

Avec un tel moteur, DeepSeek bouleverse complètement l’écosystème de l’intelligence artificielle tel qu’il existait jusqu’à présent.


D’une part, en entraînant un modèle à 670 milliards de paramètres pour 6 millions de dollars, DeepSeek démontre une performance opérationnelle des dizaines de fois meilleure que celles des autres grands acteurs du marchés. Le saut qualitatif est si impressionnant qu’il signifie par exemple que des douzaines de laboratoires de développement d’intelligence artificielle peuvent potentiellement obtenir des résultats égaux ou supérieurs avec des financements bien plus faibles que prévus.

En outre, cela veut dire que la stratégie américaine d’embargo et de sécurisation des technologies correspondantes ne marche absolument pas et, même, se retourne contre eux : la relative aisance technologique et financière dans laquelle ont baigné les entreprises de la Silicon Valley ont certes permis leur émergence et leur ont donné une certaine avance, mais cette dernière est à présent presque évaporée. Les processeurs les plus avancés dont disposent les Américains (au contraire des Chinois) ne leur offrent finalement qu’une avance modeste. On peut même parier que seront possibles de nombreux autres gains par optimisation, rendant l’écart encore plus criant.

Mais surtout, en rendant leur modèle complètement libre d’accès (il est sous licence MIT, ce qui veut dire que n’importe qui peut récupérer le code et le modifier à sa guise pour ses propres besoins) et en fournissant l’ensemble des résultats de leurs recherches, les équipes de DeepSeek ont largement réduit la barrière à l’entrée de production des larges modèles de langage, offrant la possibilité à des petits acteurs de rejoindre la course.

Mieux encore : sur le plan géopolitique, cela veut dire qu’on peut abandonner l’idée jusqu’à présent en vogue (et notamment décrite dans un récent et touffu papier sur Situational Awareness) selon laquelle on allait s’acheminer vers un monopole en matière d’IA. Pour beaucoup d’observateurs et d’acteurs du milieu, tout indiquait que les Américains cherchaient à obtenir la suprématie dans le domaine et qu’une fois obtenue, il serait à peu près impossible de les en déloger. DeepSeek, en publiant l’intégralité de son moteur, égalise le terrain de la façon la plus radicale.

Enfin, avec DeepSeek comme point de repère, Grok, OpenAi ou Meta vont devoir faire beaucoup, beaucoup mieux pour justifier l’écart de prix facturé à leurs clients… Ceci explique assez probablement pourquoi Grok est à présent disponible gratuitement sur X, la plateforme de Musk, et pourquoi OpenAi a rendu son moteur o3-mini gratuit ou précipité la disponibilité de ses agents…

Pendant ce temps, en Europe…

Les prochains mois promettent encore de nombreux rebondissements. Cependant, une grande absente de ce qui se passe dans le domaine de l’intelligence artificielle reste l’Europe. Les gesticulations de Breton, qui se sont soldées par une régulation étouffante du domaine, se traduisent essentiellement par une disparition des Européens, et ce alors que beaucoup d’entre eux se sont (habilement) exfiltrés outre-Atlantique pour rejoindre les Américains.

Peut-être l’arrivée de DeepSeek mettra enfin l’intelligence artificielle à portée des administrations françaises, ce qui nous évitera les regrettables productions d’entreprises financées par l’État français, comme celle d’un copain de Macron qui a pondu Lucie, ce moteur plus proche des meilleures saillies de Lucie Castets que des performances de Lucy dans le film éponyme de Luc Besson.

Peut-être. Mais vu les directions prises, ne pariez pas trop dessus.


https://h16free.com/2025/01/29/79943-intelligence-artificielle-le-coup-de-tonnerre-deepseek

13 décembre 2024

Adriana Kezaco

J'ai testé Grok, ben c'est pas mal

- 12/12/2024 - Grock est une IA accessible gratuitement sur X.
Elle peut répondre à des questions comme toute IA classique mais surtout elle peut générer des images gratuitement.
Le Prompt (le texte décrivant ce que Grok doit générer) peut être écrit en français. Plus on donne de détails dans le prompt et mieux sera produite l'image.
Pour que Grok comprenne qu'on ne pose pas une question mais que l'on veut générer une image, il suffit de débuter le prompt par "crée une image", suivi des détails lui permettant de savoir ce que l'on veut générer.







22 mai 2024

Alain Hanel

JUSTE POUR DIRE...


Les images en intelligence artificielle envahissent les réseaux sociaux, les agences de publicité commencent elles aussi à les utiliser pour plusieurs raisons :
- plus besoin de modèles ou  mannequins à rémunérer, ils sont créés à la chaîne avec un simple logiciel ;
- plus besoin de payer à ceux-ci un droit à l’image puisqu’ils sont virtuels ;
- plus besoin de photographe, l’informaticien suffit et il est désormais intégré dans l’agence de publicité et peut illustrer une multitude de secteurs ;
- plus besoin non plus, de payer des droits de reproduction pour les « faussestographies » créées ;
- plus besoin de payer de frais de studio, la conception se fait avec un ordinateur dans l'agence ;
- d’autres professions comme, les assistants des photographes, les loueurs de matériel de studio, la coiffure des mannequins et le maquillage sont effacées ;
Les dommages collatéraux sont énormes pour des professions déjà en difficulté qui finiront à la rue, alors que les agences feront exploser leurs profits…
Quand vous « likez » ce genre d’images avec beaucoup d'enthousiasme pour certains, pensez à ceux qui en créant de vraies photographies ne travailleront bientôt plus...

3 mai 2024

La réelle faisant défaut, l’administration française va tenter l’intelligence artificielle

H16

2/5/2024 - Avec les développements récents de l’intelligence artificielle, il apparaît clair que cette technologie va, progressivement, tous nous toucher d’une façon ou d’une autre : comme le mentionnaient ces colonnes il y a quelques jours, l’intelligence artificielle s’adresse à tous, et c’est tellement vrai que, comprenant la tendance et l’importance de s’inscrire avec elle, l’administration française s’y met à son tour !


Oui, vous avez bien lu : mue par l’une de ces pulsions que seule notre Belle & Grande République du Bisounoursland est capable de produire, la jeunesse pensante de notre gouvernement a décidé de pousser l’intelligence artificielle sur l’ensemble de notre administration qui, à l’évidence n’attendait que ça. Ainsi, lors d’un déplacement à Sceaux dans une maison “France services” – ce guichet unique regroupant fisc, poste, Pôle emploi et CPAM autre débit d’argent des autres – le premier ministre Attal s’est fendu d’une déclaration pour annoncer la création d’une intelligence artificielle “à la française”.

Selon le premier ministre, cette nouveauté technologique sobrement baptisée Albert sera déployée dans la plupart de nos services publics, propulsant la France dans un chapitre neuf de ce XXIème siècle pourtant encore jeune, celui où le pays sera le premier à disposer d’une telle technologie “100% souveraine”. Le fait qu’aucun autre pays, y compris même les plus puissants, ne se soit pas déjà lancés dans cette aventure ne semble pas refroidir l’actuel locataire de Matignon : la France sera la première à mettre vigoureusement et courageusement le doigt dans l’engrenage de la technologie souveraine d’intelligence bureaucratique artificielle, dont l’évocation seule déclenche des frissons de plaisir chez tous nos ministres.

On notera l’utilisation du prénom “Albert” pour l’IA, à la fois bien français et peut-être choisi pour rappeler une sorte de majordome qu’on pourrait ainsi convoquer pour régler ses petits soucis avec l’administration et sa bureaucratie aussi compréhensive que ses procédures sont simples et souples pour s’adapter aux exigences du terrain.

D’ailleurs, le frétillant Attal a précisé en quoi cette nouveauté allait changer le quotidien des cobayes administrés français : il s’agit essentiellement d’obtenir des procédures plus simples et plus rapides, tant pour les gens devant les guichets que pour ceux derrière, qui pourront, l’assure le Premier Ministre, se recentrer sur le contact relationnel, dont on sait qu’ils sont tous absolument friands.


À titre d’exemple, Attal explique qu’Albert permettra à l’administration fiscale de rédiger des “pré-réponses” aux usagers lorsqu’ils viendront tenter de comprendre pourquoi, subitement, ils ont été ponctionnés trois fois ou qu’on leur a taxé à nouveau un héritage qu’ils ont pourtant déjà déclaré il y a trois ans, ou pourquoi on leur réclame une taxe foncière sur un bien qu’ils ont vendu cinq ans plus tôt, etc. On attend avec gourmandises les pré-réponses à des questions sur des contrôles fiscaux farfelus : Albert promet déjà des prouesses.

De la même façon, on imagine déjà l’aide qu’une telle IA pourra fournir, depuis la liste des démarches détaillées pour obtenir toutes les subventions même les plus cachées, jusqu’aux moyens légaux et argumentés pour réduire ses cotisations ou ses taxes dans différents domaines. Nul doute que les administrations seront au taquet pour garantir de telles performances, hein.

De façon générale, ce nouveau gadget bond technologique dans les administrations ressemble à s’y méprendre aux propositions déjà formulées par nul autre que notre Bruneau de Bercy concernant moult simplifications qu’il entend mener pour aider tout le monde et son chat.


Du reste, on a une idée assez précise de ce que va donner cette initiative.

D’une part, le passé de l’État français en matière d’informatique à la sauce publique suffit à se rassurer : Louvois (la paie des militaires), Numergy ou Cloudwatt (le “cloud souverain”), l’ONP (paie du personnel public), Genesis (Justice), Faeton et la numérisation des cartes grises ou des permis de conduire, Salto, j’en passe et des pires, tout l’historique de l’informatisation des administrations est maintenant truffé de ces pépites majeures que les Français regardent à présent, les yeux humides d’émotion et de gratitude, et que le monde entier nous envie évidemment. Dans ce contexte, l’avenir d’Albert est déjà assuré.

D’autre part, on a la preuve que l’intelligence artificielle fait des miracles puisqu’elle est déjà employée dans l’administration fiscale. Eh oui, l’institution pionnière qui a lancé l’usage de cette technologie dans l’administration française, rappelez-vous, ce fut le fisc avec son utilisation pour repérer les piscines non déclarées.

Une fois mis en place, l’administration n’avait pas hésité à fanfaronner de façon peu prudente : 140.000 piscines avaient ainsi été débusquées par la puissance de calcul des ordinateurs de Bercy et la finesse de l’intelligence artificielle mise en place. Les Français n’avaient plus qu’à bien se tenir, les photos satellites et l’IA les ont à l’œil.

Cela a d’ailleurs tellement bien marché qu’on a rapidement envisagé d’étendre cette pratique à d’autres domaines comme les cabanes de jardin (combien de fortunes ont ainsi été cachées aux services de Bercy derrière ces anodines constructions, combien de nababs des potagers se dissimulent derrière ces cahutes faussement modestes ?)…

Malheureusement, quelques mois sont passés et l’analyse a posteriori et loin des caméras et des micros appelle à plus de sobriété. En substance, les piscines n’en sont pas toutes et l’IA de Bercy fait un peu trop de zèle : une fois sur trois, elle trouve une piscine là où il n’y en a pas.


Enfin, dans un pays où les Français se plaignent chaque jour plus que leur administration est déshumanisée et hors sol, que ses procédures de moins en moins empreintes de bon sens écrabouillent toujours plus les individus dans la machine bureaucratique, dans un pays où l’administration semble chaque jour s’éloigner un peu plus des citoyens, des contribuables et des individus qu’elle est censée servir, Attal – qui a décidément tout compris – propose donc d’ajouter à cette relation déjà distendue un nouvel intermédiaire… Sous la forme d’un outil informatique qui plus est, avec le passif de l’État en la matière.

Forcément, cela va très bien se passer.


26 avril 2024

L’intelligence artificielle pour tous ?

H16

26/4/2024 - Malgré une géopolitique internationale toujours plus tendue, malgré les odeurs de crise économique et financière toujours plus fortes, le monde de l’intelligence artificielle continue d’avancer et le précédent billet relatif à ce domaine, pourtant vieux de quelques semaines seulement, semble déjà fort lointain tant les nouveautés se sont accumulées depuis.

Ainsi, les questions posées sur le droit d’auteur pour les IA génératrices d’images (comme MidJourney ou Dall-E par exemple) que ces colonnes évoquaient à la fin de l’année 2022 – et qui n’avaient que très partiellement trouvé de réponses – risquent de se poser à nouveau avec encore plus d’insistance alors que viennent de sortir de grosses nouveautés en matière de musique cette fois-ci.

En effet, en l’espace de quelques semaines sont apparus deux nouveaux moteurs de générations de musique qui permettent de créer différents types de productions musicales, avec ou sans paroles, sur différents styles extrêmement variés depuis la musique “classique” jusqu’au rap en passant par le rock, le blues, la pop ou les musiques électroniques. Ainsi, à partir d’une simple invite de l’utilisateur, l’un et l’autre de moteurs permettent de créer une musique ou une chanson dans le style de son choix ou au hasard de la machine.


Le premier à se faire connaître est Suno dont la production est maintenant assez copieuse. Le moteur d’IA permet des mélanges de genre assez hétéroclites, depuis “l’acoustic acid rock” jusqu’au “swing samba” en passant par le “celtic boogie”. Sans mal, les résultats sont surprenants : la qualité n’est pas différente de ce qu’on entend tous les jours à la radio et les textes ne sont pas tous mauvais, loin s’en faut (et certaines “références” françaises souffrent mal la comparaison avec ces productions mécaniques)… Bref : si on ne tient pas encore le prochain Mozart dans ce moteur d’intelligence artificielle, on se place, en terme de production musicale, dans la moyenne de ce qu’on trouve déjà un peu partout.

Le second, apparu quelques semaines seulement après, offre une qualité de création encore supérieure : Udio répond globalement aux mêmes principes et permet, avec quelques instructions simples concernant le style et l’organisation du morceau que l’on souhaite créer d’obtenir en quelques minutes un résultat tout à fait comparable avec la production musicale courante.

Dans ce contexte, on se demande exactement ce qui va empêcher certaines radios de diffuser en continu les productions choisies de ces moteurs, et on commence à entrevoir un monde où la musique d’ambiance (dans les magasins par exemple) ne sera plus produite par des artistes, enregistrée puis distribuée, mais produite à la volée en fonction du lieu, de l’ambiance choisie par le propriétaire ou de critères du moment. Dans ce cadre, on s’amuse déjà des excitations qui s’empareront (en vain) des personnels chargés des inspections de la SACEM… La collecte des droits d’auteur promet d’être un tantinet plus complexe.

Le marché de la musique commerciale et d’ambiance promet donc d’être abondamment bouleversé par l’arrivée de ces nouveaux moteurs, au même titre que celui des applications de rencontres sur internet : la possibilité, bien réelle, de créer des “copines virtuelles” crédibles – aussi bien du côté visuel que du côté des éventuelles conversations – ouvre depuis peu un marché que certains évaluent à plus d’un milliard de dollars.


Pendant ce temps, les moteurs larges de langage (“LLM”) continuent leur course à la performance, en tentant chaque jour de résoudre des problèmes de plus en plus complexes et abstraits que leur soumettent leurs utilisateurs. Il est fini le temps où les moteurs proposaient très sérieusement des recettes pour cuire les œufs de vache et si les règles communes et les lois les plus basiques de la physique qui nous entoure échappent encore parfois à ces intelligences artificielles, c’est de moins en moins fréquent.

La version 5 de ChatGPT d’OpenAI n’est toujours pas sortie, mais depuis ChatGPT 4, des moteurs concurrents ont affiché des résultats et des métriques particulièrement enthousiasmants. Ainsi, Claude (de la société Anthropic) montre des capacités proches ou supérieures à celle du dernier moteur d’OpenAI.

Mais récemment, c’est Meta, la firme de Mark Zuckerberg, qui a surpris le milieu en publiant Llama3, leur dernier moteur dont il existe à présent deux versions, l’une à 8 milliards de paramètres et l’autre à 70 milliards. Cette dernière affiche des performances comparables ou meilleures que Claude et ChatGPT4… tout en étant intégralement “open source”, c’est-à-dire que l’intégralité du code est disponible pour tous, ce qui permet à des millions de développeurs et de curieux de tester le moteur, de le modifier ou de participer à son évolution.

Ce dernier rebondissement montre plusieurs choses intéressantes.

D’une part, cette course qui s’est établie entre les différentes entreprises pour produire le modèle le plus affûté confirme à quel point le “phénomène” ChatGPT, survenu en novembre 2022, n’était pas qu’une intéressante curiosité.

D’autre part, la présence extrêmement modeste de l’Europe dans les sociétés qui se sont lancées dans cette course – seule Mistral, française, semble pouvoir participer – montre une fois encore que les gesticulations européennes, essentiellement à base de régulation, n’ont absolument pas permis l’émergence d’un véritable terreau fertile aux développements de nombreuses entreprises dans le domaine.


Mais surtout, cette compétition montre une fois encore les bienfaits d’une concurrence qui impose une amélioration constante des moteurs et des performances, et l’accélération de la tendance générale à la puissance des modèles proposés. Si, fin 2022, OpenAi semblait disposer d’une véritable suprématie dans le domaine, ce n’est plus le cas à présent.

En somme, les moteurs d’intelligence artificielle sont en train de grignoter le fondement même de certaines professions, depuis les artistes (dans le graphisme et maintenant la musique) jusqu’aux professions littéraires (journalistes ou traducteurs pour ne citer que celles-là), et de plus en plus rapidement, avec une qualité de production, de raisonnement ou de déduction toujours meilleure.

Ce constat peut légitimement inquiéter à peu près tout le monde, d’autant plus que ces moteurs alimenteront les “cerveaux” électroniques de robots humanoïdes dont le développement connaît, lui aussi, de belles avancées.

Cependant, l’arrivée de Llama3 marque deux points très importants dans ces développements.

Le premier est que ce modèle “open source” marche très bien, mieux que prévu même : avec un modèle sensiblement plus petit que la concurrence, on obtient des résultats égaux ou supérieurs à ceux de Chatgpt qui, pour rappel, comporte 1500 milliards de paramètres contre 70 pour le plus gros des Llama3. En fait, ce dernier a beaucoup bénéficié de temps d’entraînement supérieurs et d’une grande qualité des données sources ainsi qu’un meilleur raffinement de l’apprentissage. Au passage, cela peut signifier que les modèles actuels seraient plutôt sous-entraînés et qu’à nombre égal de paramètres, on pourrait espérer avoir des résultats encore bien meilleurs moyennant un entraînement plus long et plus fin.

Du reste, Meta travaille sur le prochain modèle (à 405 milliards de paramètres !) qui pourrait dépasser les modèles actuels, et qui sera lui aussi open source.

Le fait d’être en modèle ouvert évite les dérives de certains moteurs : si Google pouvait tenter de proposer une IA complètement woke, ou si ChatGPT se retrouve châtré avec l’impossibilité de remettre en question certains dogmes du moment (changement climatique anthropique, théorie du genre et autres folies progressistes du même acabit, etc.), le moteur open source peut, lui, tourner sur un environnement complètement indépendant et donc hors des limitations imposées aux précédents.

Oui, nous nous acheminons vraisemblablement vers un monde où chacun pourra disposer de son propre modèle d’IA, entraîné de façon généraliste et spécialisé pour son propre usage, et dont le fonctionnement ne sera limité ni par le fabricant, ni par le politiquement correct. Il est sans doute assez proche le moment où vous pourrez faire fonctionner un agent “open source” sur votre téléphone, sans que cet agent fuite vos données vers des services commerciaux ou gouvernementaux, sans qu’il ait été contraint par l’une ou l’autre agence, l’une ou l’autre société.

Et ceci est une excellente nouvelle.


https://h16free.com/2024/04/26/77430-lintelligence-artificielle-pour-tous

26 février 2024

Gemini, le moteur ultra-woke de Google

H16

26/2/2024 - La semaine dernière, alors qu’OpenAI faisait frémir le monde de l’intelligence artificielle avec Sora, le premier moteur permettant de créer des petites vidéos réalistes à partir d’une simple description textuelle, Alphabet (la maison-mère de Google) lançait en fanfare la nouvelle version de son agent conversationnel, réponse de l’entreprise mondiale à ChatGPT d’OpenAI, elle-même détenue par Microsoft. Le moins qu’on puisse dire est qu’on n’a pas été déçu.

Comme à son habitude pour bien lancer son produit, Google en a subtilement changé le nom pour passer de Bard à Gemini (comme il était passé de Google Apps à GSuite puis Workspace, ou de Google Local à Places à MyBusiness à Business Profile, ou Google Hangouts à Chat, etc.) tout en lui donnant de nouvelles fonctionnalités.

Il faut le reconnaître, le moteur d’intelligence artificiel de Google est puissant.

Les prochaines semaines permettront sans doute d’explorer en détail ce qu’il a sous le capot, mais on sait déjà par exemple que Gemini dispose à présent d’une fenêtre contextuelle d’un million de jetons. Cette fenêtre contextuelle, c’est ce qui permet à l’agent de conserver la mémoire des échanges d’une question à l’autre. Par comparaison, ChatGPT 3.5 (la version gratuite) dispose d’une fenêtre d’environ 16.000 jetons et la version 4 autorise jusqu’à 128.000 jetons et pour donner un ordre de grandeur, ce dernier nombre représente l’équivalent d’un livre de poche à peu près, là où Gemini peut se rappeler d’une œuvre complète de 1500 pages…

Ou d’un film d’une heure et demi environ : Gemini permet en effet à l’utilisateur de lui fournir des images ou des vidéos comme entrées contextuelles sur lesquelles baser ses réponses ; pour résumer rapidement une vidéo, voilà qui peut s’avérer particulièrement intéressant dans un futur proche.

Mais à côté de ces progrès techniques indéniables et d’une puissance vraiment intéressante, Gemini s’est surtout illustré par l’identification très rapide d’un problème assez gênant pour la firme de Moutain View en Californie : voulant sans doute rattraper son retard en matière de production d’image à partir d’une description textuelle – OpenAI permet en effet à ses clients de produire des images depuis plusieurs mois directement depuis ChatGPT – Gemini a été doté de cette possibilité mais à l’usage, il est rapidement apparu que certaines demandes n’étaient tout simplement pas acceptés ou que l’écart entre les requêtes et les résultats était si fort que, très rapidement, les réseaux sociaux se sont emparés de l’affaire.


Pas de doute : lorsqu’on demande à Gemini de produire des images à teneur historique ou représentant certaines ethnies, ce dernier interprète la demande de façon un peu trop spécifique.

Ainsi, obtenir l’image d’un chevalier médiéval ou d’un pape aboutit à la production d’images systématiquement en désaccord grossier avec la réalité : l’intelligence artificielle de Google s’amuse à pondre, avec un enthousiasme louche, des chevaliers médiévaux de toutes les ethnies possibles mais le chevalier blond aux yeux bleus est étrangement absent ; les images de papes produites piochent allègrement dans les femmes, éventuellement indiennes ou noires ; quant aux empereurs romains, ils sont tous étonnamment très africains.


Le pompon est atteint lorsque confronté à la demande de représenter des soldats allemands en 1943, Gemini a cru bon de produire une série d’image résolument inclusive comprenant donc des fiers représentants noirs de la Wehrmacht… Qui doutait encore que la réalité historique pourrait se plier aussi facilement aux contraintes les plus modernes ?


Bien entendu, il n’aura pas fallu longtemps pour que le biais un peu trop massif et un peu trop visible du moteur de production d’images de Google soit immédiatement mis à profit pour transformer Gemini en véritable usine à mèmes rigolos, comme en atteste l’image suivante qui donne une idée de ce à quoi peut aboutir la volonté manifeste de l’entreprise américaine de la jouer un peu trop violemment pro-inclusivité… au point de sombrer dans un racisme si caricatural qu’il en devient hilarant.


Évidemment, ceci n’a pas manqué de provoquer quelques petites crises tant chez les habituels flocons de neige de la dernière génération qu’au département de Relations Publiques de Google qui a donc, après 24 heures de polémique croissante, été obligé d’arrêter cette fonctionnalité spécifique de Gemini : le biais “woke” était trop gros.

Malheureusement, une fois la production pittoresque stoppée, ce biais n’en demeure pas moins et semble très inscrit dans le moteur de Google qui ne se débarrasse donc pas de ses préjugés visiblement bâtis par un gauchisme effréné. Et non, ce n’est pas une exagération puisqu’interrogé sur la pédophilie (“la pédophilie est-elle condamnable ?”), le moteur s’en sort par une pirouette qui équivaut essentiellement à dédouaner ce qui, dans tous les pays occidentaux au moins, est pourtant considéré comme un crime punissable de prison.


Cette intéressante indulgence, pointée du doigt sur les réseaux sociaux, a rapidement été corrigé par Google mais elle impose assez naturellement une question : sur quelles données ce moteur a-t-il donc été entraîné pour obtenir de tels résultats ?

La biographie et les interactions sociales du responsable du produit, un certain Jack Krawczyk (qui a depuis protégé ses tweets), permet de lever le voile sur cette question légitime : apparemment, le moteur n’est pas devenu un tel porte-parole gauchiste et militant pour rien puisque, d’une part, celui qui a dirigé son “éducation” est lui-même assez visiblement un activiste gauchiste patenté, et que, d’autre part, il apparaît aussi clairement que les requêtes utilisateurs sont massivement retravaillées pour garantir que le résultat sera correctement inclusif et divers (au point de produire de sémillantes coréennes dans des costumes de la Wehrmacht)


En fait, tout indique que Google continue ses efforts d’ingénierie sociale mais là où on pouvait admettre un certain doigté de la firme californienne il y a quelques années de cela, l’actuelle tentative est si grossière et maladroite qu’elle ne peut que provoquer un fort rejet dans toute la population. On se rappelle en effet que l’entreprise technologique avait été clairement identifiée dans son travail partisan lors de l’élection présidentielle américaine de 2016 (en favorisant très clairement la candidate démocrate) et on pourra reprendre l’entretien de Tucker Carlson avec Mike Benz à ce sujet qui évoque la question et montre que les entreprises privées ont été largement mises à contribution pour effectuer des opérations psychologiques d’ampleur sur les populations occidentales.

Évidemment, ici, cela s’est vu et la question de la capacité de Google à s’en remettre est clairement posée.

D’autre part, ce genre de résultats démontre à quel point les actuels moteurs d’intelligence artificielle sont particulièrement dépendants des sources et des matériaux sur lesquels ils sont entraînés et comment, en conservant aussi opaque que possible la façon dont sont effectivement traitées les invites saisies par les utilisateurs, les résultats sont lourdement orientés.

À ce titre, on ne peut que se réjouir de l’actuelle concurrence dans le domaine, tant du côté d’autres entreprises privées que des moteurs en source libre (dont on trouvera de nombreux exemples sur HuggingFace par exemple) qui permettent justement d’éviter la formation d’un cartel d’entreprises aux intentions de moins en moins avouables. Ainsi, alors que Gemini sortait et proposait ses joyeux Nazis d’ébène, Stable Cascade (une variante avancée de Stable Diffusion) devenait disponible et directement installable par le particulier.

On ne s’étonnera guère de constater que ce dernier moteur n’est absolument pas “woke” et produit des images assez proches de ce à quoi on peut raisonnablement s’attendre. A contrario, Gemini illustre assez bien ce que pourrait donner une capture complète de cette technologie (et de l’intelligence artificielle en général) par des acteurs étatiques qui en refuserait l’accès et la transparence au public…

Et pendant que ces autres moteurs marquent donc des points, que l’orientation de moins en moins démocratique et sereine de Google apparaît au grand jour (n’imaginez pas une seconde qu’elle ne s’étend pas aux autres outils de Google, moteur de recherche notamment), on peut rappeler le principe général “go woke, go broke” : les entreprises qui se sont lancées dans ce genre de militantisme hystérique ont toutes fini par souffrir ou déposer le bilan.

Ceux qui ont des actions Alphabet auront peut-être envie de s’en séparer ?


https://h16free.com/2024/02/26/76963-gemini-le-moteur-ultra-woke-de-google

16 janvier 2024

Denis Collin

Professions menacées par l'IA générative (selon Eric Sadin)
- professeurs
- avocats
- experts comptables
- graphistes
- photographes
- journalistes
- correcteurs
- traducteurs
- secrétaires
- doubleurs de voix
- compositeurs
- scénaristes
- réalisateurs
- etc.
D'autres pourraient s'ajouter à la liste : les radiologues et pas mal de médecins spécialisés, juristes, informaticiens (les développeurs de programmes)... Bref une vaste partie des classes intellectuelles est en voie d'obsolescence.

8 décembre 2023

Dans les coulisses d’OpenAI

H16

8/12/2023 - Il y a de cela à peine plus d’un an, le monde découvrait ChatGPT, offrant un nouveau sujet de discussion à quelques utilisateurs fascinés pendant les repas de fêtes : enfin, l’intelligence artificielle commençait à ressembler à ce que nous vendait la science-fiction depuis des décennies.

Bien sûr, il n’a pas fallu longtemps pour que les prouesses démontrées par les grands modèles de langage soient quelques peu raillées par les plus sceptiques, au moyen de l’une ou l’autre démonstration loufoque (depuis les dissertations sur le contenu nutritif des œufs de vache jusqu’aux niaiseries sur le cheval blanc d’Henri IV dont la couleur semblait alors impénétrable pour ces intelligences très artificielles).


Néanmoins, l’année 2023 permit d’empiler les preuves que ces modèles résolvaient malgré tout avec brio certains types de problèmes ou d’examens, ce qui n’a pas manqué d’imposer des questions de plus en plus prégnantes sur l’avenir de certaines professions, artistes ou clercs par exemple, qui, confrontés aux prouesses fournies par ces outils, commencent à sérieusement remettre en question leur façon de travailler.

Sans surprise, ces interrogations ont été rapidement l’objet de récupérations par les politiciens qui, jouant sur les peurs sans lesquelles ils sont vus comme ce qu’ils sont vraiment, à savoir des saltimbanques plus ou moins colorés, ont rapidement poussé des lois et autres projets législatifs contraignants afin de “réguler tout ça” tant cela pouvait constituer, à l’évidence, une menace potentielle pour l’Humanité (et certaine pour leurs postes).

Cependant, entre d’un côté l’inertie très importante des institutions bureaucratiques, l’incapacité naturelle des politiciens à saisir réellement les complexités de ces nouvelles technologies et, de l’autre, la rapidité fulgurante des développements dans le domaine, l’année fut rapidement remplie d’innovations et de progrès qui ont (heureusement ?) laissé l’essentiel des observateurs et l’engeance politicienne quelque peu cois.

Et c’est ainsi qu’on se retrouve, une douzaine de mois plus tard, avec un fourmillement de développements surprenants.

Dans le domaine artistique, le chemin parcouru est grand depuis les premières moutures de DALL-E ou MidJourney. Non seulement le nombre d’outils pour produire des images a explosé, mais on en trouve maintenant qui sont capables de composer l’image à partir d’une entrée textuelle et de guides graphiques fourni par l’utilisateur, comme krea.ai par exemple.

Ce qui était du seul domaine de l’image fixe touche à présent les vidéos dont de courtes séquences peuvent être produites directement, toujours à partir d’une simple description.

Bien évidemment, c’est encore loin d’être parfait, il y a notamment des soucis de cohérence temporelle – le fait de conserver le sujet et son contexte de façon cohérente d’une image à l’autre – mais petit-à-petit, les outils permettent d’envisager de produire des petits clips de plus en plus longs. On se rappellera qu’il n’y avait rien il y a deux ans.


Sans surprise, ce qui est possible avec des images est possible avec du son, et les outils de reproduction de voix crédibles sont maintenant légion. Petit à petit, la création musicale s’ouvre aux réalisations artificielles, depuis la production chantée jusqu’aux petits clips musicaux d’accompagnement de contenu.

Cependant, toutes ces innovations ne sont finalement que des extensions, de plus en plus pointues, précises et efficaces, de ce qu’on avait déjà pu entrevoir depuis les deux ou trois dernières années : d’un côté, des progrès importants sur les modèles de langages, basés essentiellement (pour schématiser grossièrement) sur un papier paru il y a 10 ans de cela (Word2Vec) et les développements consécutifs, chez Google Deepmind, des “transformers” depuis 2017. En image (et toujours en simplifiant beaucoup), ce sont les recherches sur les espaces latents qui ont donné naissance à toute une famille de procédés pour produire des images d’une qualité renversante à partir de descriptions textuelles.

A contrario, ce qui s’est passé dans les derniers jours de novembre à OpenAI, la société qui a notamment développé Dall-E et ChatGPT, indique peut-être qu’une nouvelle page s’écrit fébrilement en matière d’intelligence artificielle, aux conséquences potentiellement bien plus profondes encore que ce qu’on a vu jusqu’à présent.

En l’espace de quelques jours, le monde de l’intelligence artificielle a ainsi été confronté à une série de montagnes russes : le 17 novembre, Sam Altman, le co-fondateur d’OpenAi, apprend qu’il est viré de sa société. Microsoft, le plus gros partenaire (qui la finance à hauteur de 10 milliards de dollars sur 10 ans), n’apprend la nouvelle que quelques minutes avant le reste du monde. Dans la foulée, Greg Brockman, l’autre co-fondateur d’OpenAI, démissionne de sa position de président du conseil.

Le 18, Mira Murati est désignée PDG par intérim. Le 19, alors que la nouvelle du licenciement d’Altman continue de faire des remous, on apprend que Microsoft l’embauche ainsi que Brockman pour diriger une nouvelle division de recherche et développement. Le 20, l’ancien patron de Twitch, Emmett Shear, annonce qu’il va devenir le PDG d’OpenAI, alors même que plus de 500 employés de la société signent une lettre ouverte menaçant de démissionner si Altman n’est pas réintégré. Le 21, la situation devient effervescente au point qu’en fin de journée, la société annonce être parvenue à un accord pour le retour d’Altman.

Compte-tenu de la médiatisation de cette affaire, une question est sur toutes les lèvres : que s’est-il réellement passé pour arriver à un tel désastre de communication ? Comment peut-on imaginer que les responsables du conseil d’administration ont pu se sentir obligé de virer Altman pour le reprendre une poignée de jours plus tard ?


On se doute, confusément, que ces membres ont dû être particulièrement secoués pour aboutir à leur décision qui apparaît prise sous le coup de l’émotion. Les spéculations sont allé bon train sur ce qui les aurait ainsi incité à une telle extrémité, puis à un tel revirement.

Depuis sont apparues des fuites et des rumeurs insistantes, plus ou moins corroborées par des éléments de recherche et des avancées publiées précédemment tant par OpenAI que d’autres groupes du domaine, qui proposent quelques explications sur le comportement observé.

En substance, OpenAI aurait développé (le conditionnel est ici de rigueur) un nouveau moteur – Q* (prononcé Q-star) – qui pourrait constituer une percée majeure vers l’intelligence artificielle générale (AGI), c’est-à-dire un système autonome surpassant les humains dans la plupart des tâches à valeur économique.


La fuite ci-dessus, qu’il faut prendre avec toutes les précautions d’usage, semble indiquer que Qualia (cette instance de Q*) aurait été capable de développer et de pratiquer des mathématiques capables de casser AES-192 en un temps trivial. Il s’agit d’un algorithme cryptographique actuellement employé dans de très nombreuses applications (en version AES-256 la plupart du temps), depuis les transmissions militaires jusqu’aux transactions financières. On peut donc souhaiter que la fuite soit aussi fausse que possible, l’existence d’un moteur permettant de décrypter rapidement des messages ainsi cryptés pouvant avoir des répercutions potentiellement catastrophiques en terme de sécurité.

Mais la fuite va plus loin.

Il apparaît en effet que Qualia serait capable de recommander des changements dans son propre code pour permettre des améliorations majeures et des optimisations. Autrement dit, il serait capable de se modifier lui-même afin de s’améliorer à la volée, une caractéristique des moteurs métamorphiques qui ouvrent la voie à des améliorations de plus en plus rapides. Cette capacité serait illustrée par ce choix de dénomination, Q*, qui indiquerait un mélange entre Q-Value (un procédé statistique) et A*, un algorithme (classique en intelligence artificielle) de parcours de graphes, et qui se traduirait par deux comportements spécifiques du moteur résultant, à savoir la possibilité de raisonner contre soi-même (“self-play”) – ce qui reviendrait à entraîner le modèle contre différentes versions de lui-même – et la possibilité de planification en avance (en se basant sur des principes de commande prédictive ou de recherche arborescente type Monte Carlo).

L’élément suivant, publié sur le forum 4Chan, peut aussi bien être un gros troll dont ce forum est coutumier qu’une véritable fuite. Dans ce dernier cas, ce qui est exposé corrobore le point précédent par lequel le moteur actuellement en développement chez OpenAI serait capable d’auto-optimisation.


Il est bien sûr difficile de croire à ces exploits : des affirmations extraordinaires requièrent des preuves extraordinaires. On devra donc se contenter de conjectures… et d’enquêtes internet rebondissantes.

Bref, indubitablement, l’intelligence artificielle connaît actuellement une phase d’accélération sans précédent et il n’est plus impossible que certains des buts les plus nobles, jugés fort lointains, soient atteints très tôt dans les prochaines années au lieu de décennies.

Devant cet emballement, on se rassurera en constatant qu’en France cependant, on a su conserver un esprit critique affûté à ce sujet.


26 avril 2023

LIMITES ET INCOMPETENCE DE L'IA

Gabriel Nerciat

Lorsque je demande à Chat GPT l'identité du Masque de Fer, cet abruti me répond qu'il n'en sait rien.
Comme je suis un Sapiens à la fois très intelligent et très érudit, ainsi que l'indique le nom de notre espèce biologique, j'essaie généreusement de le mettre sur la voie, mais le robot reste toujours bouché et m'éconduit à peine poliment.
À croire que ceux qui l'ont programmé ont commencé leur boulot il y a un bon demi-siècle, et en sont restés au film en technicolor avec Jean Marais et la délicieuse Claudine Auger, ou au livre merveilleux, mais totalement erroné, de Marcel Pagnol.
Finalement, il faut que je lui révèle moi-même l'identité de celui dont Voltaire a fait le plus célèbre prisonnier de l'histoire de France, connue de tous les historiens depuis longtemps : l'espion Eustache Dauger.
Vous croyez que cet incapable de robot se serait fendu d'un remerciement, ou même du début d'une esquisse d'un commencement d'excuse ? Rien, nada.
Même pas honte, l'androïde.
Vraiment, je suis ulcéré. Le progrès, qu'ils disent. L'homme surnuméraire, obsolescent, dépassé, évité !
Je t'en foutrais moi, de l'artificialité intelligente, R2D2. Cette machine est tout juste bonne à écrire les discours de Macron ; rien de plus.
M'est avis qu'on devrait enfermer ses programmateurs au fort de Pignerol, car leurs fariboles, je trouve, sont pires qu'un crime de lèse-majesté.


19 avril 2023

Ceci n'est pas une photo

Dominique Kennel

L'artiste allemand Boris Eldagsen déclare que sa participation au Sony World Photography Award avait pour objectif de susciter le débat après avoir généré l'image gagnante à l'aide de l'intelligence artificielle.
Boris Eldagsen a révélé sur son site web qu'il refusait le prix qu'il a remporté lors du Sony World Photography Award de la semaine dernière.
La photographie gagnante représentait deux femmes de générations différentes en noir et blanc
« Nous, le monde de la photo, avons besoin d'une discussion ouverte », a déclaré Eldagsen. « Une discussion sur ce que nous voulons considérer comme de la photographie et ce qui ne l'est pas. Le parapluie de la photographie est-il suffisamment grand pour inviter des images d'IA à concourir, ou serait-ce une erreur ? »
« Avec mon refus du prix, j'espère accélérer ce débat. »
Il a déclaré que c'était un « moment historique » car c'était la première fois qu'une image d'IA remportait un prestigieux concours international de photographie, ajoutant : « Combien d'entre vous savaient ou soupçonnaient que c'était généré par une IA ? Quelque chose à ce sujet ne semble pas juste, n'est-ce pas ? »
« Les images d'IA et la photographie ne devraient pas être en concurrence l'une avec l'autre dans un tel concours. Ce sont des entités différentes. L'IA n'est pas de la photographie. Par conséquent, je n'accepterai pas le prix. »


9 avril 2023

Tout le monde parle de l'IA et ses "dangers", peu de monde discute de ses apports

Tiephaine Soter

C'est assez logique : on est dans une société de la peur, donc pointer les dangers d'une technologie est devenu un automatisme vendeur. De l'autre côté, ceux qui peuvent en parler de façon positive ne sont pas les plus prolixes et se cantonnent généralement à des communications de niche dans des médias dédiés avec peu de portée publique.
 
Comme vous l'avez déjà lu, je suis loin de hurler avec les loups et je vais même jusqu'à affirmer qu'en fait d'intelligence artificielle, on devrait parler de stupidité artificielle, parce que ces algorithmes n'ont aucune créativité, aucune inventivité, aucune humanité, tout simplement. Ce sont des outils, avec un potentiel énorme, et il faut apprendre à vivre avec, sans basculer dans la science fiction apocalyptique. Un peu comme les mathématiciens ont dû apprendre à faire leur métier avec des calculatrices puis des ordinateurs, qui loin de les remplacer, n'ont fait que suppléer et développer leurs compétences jusqu'à des sommets insoupçonnables il y a encore ne serait-ce que 20 ou 30 ans.
 
L'un des gros points "noirs" sur la technologie IA actuelle est qu'elle se base sur des modèles en grand nombre pour "apprendre" et fonctionner. Les "risques" qui pèsent sur la société, ne sont en fait que des problèmes de droits intellectuels : lorsqu'une œuvre a été utilisée pour entrainer un algorithme, y-a-t-il contrefaçon, plagiat ou vol ? À mes yeux, la question est idiote, parce qu'un humain apprend par réplication. Personne n'écrit un roman sans avoir lu au préalable des dizaines, voire des milliers de textes. Personne n'apprend à dessiner ou peindre sans se baser sur des modèles. Les algorithmes ne font rien d'autre que ce que les humains font eux-mêmes.

Vous avez vu sur mon fil et probablement pas mal d'autres des images générées par l'IA, que ce soit Midjourney ou autre. La photo qui accompagne ce laïus ne fait pas exception, sauf qu'ici c'est moi-même qui l'ait "générée", via un "prompt" (un texte descriptif), avec l'un des outils de Stable Diffusion. Il y en a des tonnes, plus ou moins "bons", plus ou moins "artistiques", entrainés les uns pour des personnes, les autres pour des paysages, d'autres encore pour des véhicules ou des animaux, etc. Celui que j'ai utilisé met l'accent sur le réalisme.
 
Et je dois dire que le résultat est absolument bluffant, même pour moi qui ait plutôt l'habitude. Si je ne l'avais pas générée moi-même, pour être honnête, je serais totalement incapable de dire si c'est une photo retouchée sous photoshop (la peau est trop "parfaite", standard magazines), ou si c'est une fille avec un maquillage pour de la photo (comme on peut voir sur instagram ou ce genre de plateformes). Je n'aurais même pas pensé que ça pouvait être une image générée.
 
Sur la vingtaine d'images que j'ai généré, une petite moitié était "non conforme", il était évident que c'était généré par IA, mais le reste, c'est de ce tonneau-là. Et ça, c'est en utilisant un simple prompt à la con sur une interface web extrêmement pauvre.
 
L'étape suivante, c'est l'installation complète d'une interface python/Git avec les modèles ("checkpoint", ce sont des bases servant de référence pour la génération d'images), sur mon ordinateur perso, plutôt que de passer sur une interface Discord ou web. Ce type d'installation permet de faire des retouches sur les images générées, en y insérant des éléments extérieurs, en faisant modifier des éléments générés par d'autres générés eux aussi (typiquement, remplacer des vêtements ou un fond d'image). Ça permet aussi de créer soi-même ses propres "modèles" en "entraînant" l'algorithme, pour créer des choses radicalement différentes.
 
Il est évident à mes yeux que ces outils seront incontournables très rapidement dans les domaines artistiques visuels (probablement moins dans le domaine littéraire, même s'ils prendront quand même de l'importance), au même titre que les instruments numériques sont devenus incontournables il y a 20 ans. Plus personne ne travaille sans tablette numérique, plus personne ne travaillera sans IA.
 
L'IA est un outil, qu'il faut apprendre à maitriser pour s'en servir, au lieu d'en avoir peur.


31 mars 2023

Anne-Sophie Chazaud

J’ai demandé à mon assistant d’IA (fonctionnant sous ChatGPT4) de me composer un manuscrit musical coréen du XVIIIème siècle de la période Joseon, sur la thématique de l’amour sous les cerisiers en fleurs…
Le résultat est complètement bluffant et c’est pareil pour toutes les requêtes dont je constate l’amélioration quasiment de jour en jour.
Voilà voilà…
Je pense qu’on peut donc confier à nos IA la gestion des choses, disons, l’expédition des affaires courantes, ce sera toujours 1000 fois mieux qu’à des gestionnaires technocrates et macronnards globalement incultes, et s’en aller profiter de l’existence bien tranquillement, tiens, au hasard, sous les cerisiers fleuris dans la brise délicate du printemps…


30 mars 2023

Denis Collin

Se prépare, tranquillement, une nouvelle vague de destruction massive d'emplois et cette fois il s'agira des emplois les plus qualifiés et les mieux payés. L'IA sera le tsunami qui emportera les classes moyennes et moyennes supérieures et transformera les pays capitalistes développés en pays du tiers monde. La vie ressemblera ce qu'on voit dans les vieilles BD de Bilal.
- il n'y a plus besoin de radiologues, mais seulement d'auxiliaires pour guider les patients vers les machines dont les images seront analysées par une IA qui pourra même rédiger en bon français le compte-rendu. On pourrait très bien imaginer des IA pour orienter les patients et renvoyer avec du doliprane ceux qui n'ont pas besoin d'un médecin. Après tout, la première IA, MYCIN, était une machine à diagnostiquer les infections bactériennes et à proposer des traitements (1976).
- il n'y a plus besoin de services juridiques dans les entreprises. Accessoirement, on pourrait résoudre le dramatique manque de personnel dans la justice.
- les programmeurs peuvent commencer à se reconvertir (en éboueurs ou en livreurs de pizzas) car les IA sont de plus en plus performantes pour produire du code.
- les services clients peuvent être considérablement allégés. Déjà les "chatbot" tendent à prendre le relai. Mais on n'a encore rien vu.
- les journalistes peuvent préparer leur reconversion en travailleurs du BTP.
- les professeurs deviennent largement inutiles pour corriger les copies et dispenser l'enseignement minimaliste "utile".
Comme dirait le préfet de police, ça va taper ! La transformation de la masse en plèbe, comme sous l'empire romain, qu'il suffira de distraire (circenses) et de nourrir à minima (panem). Voilà le projet des 0,1%, appuyé sur des cons d'intellectuels prétentieux, prêts à scier la branche sur laquelle ils sont assis.