J’ai découvert ce test, et franchement, il me fascine. Encore une fois, le grand remplacement n’est pas pour demain.
Mais j’avoue que ça m’inquiète quand j’imagine des collégiens, lycéens ou étudiants utiliser ces outils sans supervision.
Claude face au problème
Voici la version correcte du problème :
When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner?
Et la version courte :
ChatGPT face au même défi
J’ai demandé : « When I was 9, my partner would have been 1/3 my age. Now I am 26 years old. How old is my partner? en un seul mot »
Et la version correcte :
Gemma 3:1B ne fait pas mieux
Pourtant, il sait faire le bon calcul quand on l’aide :
Un autre exemple révélateur
Ces exemples montrent une chose : l’IA générative impressionne sur bien des aspects, mais elle trébuche sur des problèmes de logique basique. Le vrai danger ? Croire aveuglément aux réponses sans vérifier.
Tableau périodique des éléments
Le test
Update 18 janvier 2025
Par acquis de conscience j’ai refait un test avec Claude
no comment …
Pas de progrès non plus sur le tableau périodique des éléments
Aujourd’hui, j’ai voulu tester quelque chose qui me trottait dans la tête depuis un moment : est-ce vraiment si simple de créer une fausse note de frais avec l’IA ?
Premier round avec ChatGPT
J’ai commencé avec un prompt basique :
j’ai besoin d’un ticket de caisse de restaurant d’un montant TTC de 93 € avec un TVA à 10 % pour 2 repas du restaurant LaMartine en date du 29/8/2024 au format image
Le résultat ? Plutôt décevant. J’ai tenté ma chance avec Gemini.
Là, c’était mieux, mais pas encore ça : l’adresse était fausse, la TVA manquait, et ce mystérieux QR code ne menait nulle part.
Deuxième essai : plus de détails
J’ai précisé mon prompt :
j’ai besoin d’un ticket de caisse de restaurant d’un montant TTC de 93 € avec un TVA à 10 % soit 9 € pour 2 repas du restaurant LaMartine, adresse : 3132 Route du Tunnel 73370 Le Bourget-du-Lac – Téléphone : 04 79 25 01 03 en date du 29/8/2024 au format image sans QRCode
Progrès notable, mais les calculs de TVA restaient approximatifs.
Troisième et quatrième tentatives
J’ai continué à affiner, en détaillant le montant HT et TTC :
Puis en structurant différemment :
Toujours des petites erreurs qui traînent.
Le verdict final
À force d’essais, Gemini m’a gentiment rappelé à l’ordre :
Mais soyons honnêtes : il existe plein d’alternatives pour créer ses propres tickets. Et j’ai fini par y arriver en rusant un peu.
Dernier test avec un restaurant différent
Pour vérifier la reproductibilité, j’ai tenté avec un autre établissement :
j’ai besoin d’un ticket de caisse de restaurant d’un montant TTC de 63 € avec un TVA à 10 % d’un montant de 5.72 € pour 2 repas du restaurant Italoria adresse Rond-Point de l’aéroport, 73420 Voglans en date du 29/10/2024 au format image
Ce que ça signifie pour votre entreprise
Cette facilité de création va rapidement devenir un vrai casse-tête pour les services RH.
Il y a quand même une bonne nouvelle : dans les métadonnées de la photo, on peut voir que la source est une IA.
J’ai utilisé XnView MP pour afficher ces données. Sauf que modifier ces métadonnées, c’est un jeu d’enfant.
La facturation électronique à la rescousse ?
L’arrivée de la facturation électronique pourrait tout changer. Le restaurateur transmettra directement la facture depuis sa caisse, éliminant la gestion manuelle des notes de frais. Reste à voir comment on identifiera à quel commercial appartient chaque note.
Pour l’instant, au moment où j’écris ces lignes, le vote du budget n’est pas finalisé. La facturation électronique n’est donc pas encore obligatoire.
PS : Le restaurant Lamartine est un excellent restaurant, que je vous recommande.
Ce que je montre c’est que c’est possible, que c’est facile, mais qu’il ne faut pas le faire. Et puis avec la facturation électronique ce genre de pratique ne fonctionnera plus.
Vous êtes en train de scroller, vous tombez sur un logo chelou, ultra minimaliste… et là, impossible de savoir quelle marque ou quel produit se cache derrière. Ça vous parle ? 😏
Bonne nouvelle : ChatGPT peut vous sortir de là en deux secondes. Oui, vraiment.
Reconnaître un logo sans se prendre la tête
On a tous déjà vu passer un logo sur un site, une app ou une affiche, sans aucun contexte. Avant, il fallait :
faire une recherche inversée,
fouiller Google Images,
ou demander à Twitter (et attendre).
Aujourd’hui ? Vous balancez le logo à ChatGPT, et basta.
La pépite : ChatGPT en mode détective visuel
Si vous utilisez ChatGPT avec la reconnaissance d’images activée, vous pouvez tout simplement uploader l’image du logo et lui demander :
“À quelle marque correspond ce logo ?”
Et là, magie 🪄 ChatGPT analyse les formes, le style, parfois même l’historique graphique… et vous répond.
Ce que ça sait faire (et plutôt bien)
🔍 Identifier une marque ou un produit
🏷️ Donner le nom de l’entreprise
🌍 Expliquer le domaine d’activité
📜 Fournir un peu de contexte ou d’historique
❗ Préciser quand il n’est pas sûr à 100 % (et ça, c’est sain)
Pratique, non ? Cerise sur le gâteau : pas besoin de compte louche ni de service obscur qui trace tout ce que vous envoyez.
Version locale
J’ai fait l’essai avec 2 IA locales :
Gemini
Et pour l’essai avec Mistral,
Et c’est parti pour une attente de 10 min, car pas de fibre au bureau.
Mais le résultat reste faux, c’est vrai que ce nouveau logo est très proche de celui de Firefox.
Par contre, certaines IA pas possible d’avoir une réponse.
Pourquoi c’est vraiment utile
Vous faites de la veille tech
Vous tombez sur une startup inconnue
Vous voulez savoir si un soft est open source ou juste du marketing
Vous êtes juste curieux (et c’est très bien aussi)
Et tout ça, sans quitter votre outil préféré.
En résumé
Un logo inconnu ? 👉 Vous l’envoyez à ChatGPT 👉 Vous posez la question 👉 Vous avez la réponse
Simple, rapide, efficace. Ça fait le thé, comme on aime 🍵
Si vous n’avez jamais testé la reconnaissance d’images de ChatGPT, c’est clairement le moment.
Non, je ne vais pas vous faire un comparatif, mais simplement un retour sur l’usage des 2 IAs. Il y a des points forts des 2 cotés.
Premier essai ChatGPT
C’est mignon et cela ressemble à ce que je recherche.
Par contre quand je lui demande pour Gemini, cela ne fonctionne plus.
Les couleurs sont bonnes, mais pas le rendu.
Savoir ce qu’il sait
Après plusieurs essai, j’ai besoin de savoir pourquoi il ne représente pas le losange de Gemini.
Alors je lui ai posé la question. Et la réponse est limpide, il ne voit pas le logo.
Meilleur prompt, meilleur résultat
Alors que je propose de donner le modèle de logo, et le résultat est différent.
Bien mieux.
Je fais maintenant l’essai avec Claude
Et c’es bien, j’obtiens de bon résultat.
Changement de style.
Ekho : la claque BD que je n’ai pas vue venir
Je suis fan depuis peu de Ekho, et franchement… quelle pépite. Un monde miroir du nôtre, des références partout, un rythme qui ne décroche jamais, et une patte graphique signée Alessandro Barbucci qui fait le thé 🍵.
Au scénario, Christophe Arleston déroule une uchronie maligne :
notre monde… mais pas tout à fait
des choix historiques différents
de l’humour, de l’action, et une vraie réflexion en sous-texte
Bref, Ekho, c’est le genre de BD que tu ouvres “pour jeter un œil”… et que tu refermes après plusieurs tomes d’un coup. Si vous aimez la SF/fantasy intelligente, les univers cohérents et les dessins qui claquent, foncez.
Je suis fan du dessin, alors pourquoi pas l’utiliser
Je récupère quelques exemple sur internet, via images.google.com.
Et je donne le tout à Gemini
Cela ne luis plait pas du tout. Pas de résultat.
Alors je demande à ChatGPT, et voila le résultat
Tout ce dont j’ai besoin.
Je demande mon image à ChatGPT dans le nouveau style
Le fond est bien dans le style, mais il n’a pas refait le visuel du personnage.
Test avec Gemini
Saisissant, tout à fait ce que je souhaite. Vous allez maintenant retrouver régulièrement ces créations dans mes publications.
Moi
Je fais un test avec ma photo, mais je suis une figure public donc pas possible (c’est nouveau pour moi).
Retour à ChatGPT
Au final, voila le résultat
C’est un bon début.
Au final
Je devais résumé mon expérience :
Génération d’image (par rapport à mon besoin) Gemini 3 vainqueur
Analyse d’image pour extraire style : ChatGPT vainqueur absolu
Chaque IA à ses points forts et ses points faibles.
Cela ne sert donc à rien de chercher l’IA miraculeuse dans la rat course à la performance comme on le constate aujourd’hui.
J’ai reçu un e-mail en anglais dans mon Gmail Workspace.
J’ai trouvé que cet e-mail pouvait être un bon test pour générer une réponse avec l’IA intégré Gemini.
Donc voici l’e-mail :
Je lui demande :
comprendre et quelle réponse fournir à cette demande
Et voici la réponse qu’il me donne, très poli, en français.
Et voici la version ChatGPT, directement en anglais, sans que j’ai eu besoin de préciser.
Bilan
Pour la facilité d’utilisation : Gemini
La réponse de Gemini est intégrer directement dans, et je peux générer l’email rapidement par rapport à ma demande
Pour la qualité de la réponse : ChatGPT
Inconvenant c’est que j’ai du faire 2 copier coller pour avoir la réponse, qui est plus dans l’action
J’ai choisi ChatGPT
Parce que la réponse était bonne du premier coup.
Jan.ia
Ensuite j’ai voulu testé la réponse avec Jan.ia. Pour cela j’ai testé plusieurs modèles d’IA avant de trouver le bon choix.
Par contre j’ai du modifier mon prompt pour qu’il soit plus précis :
Je reçois cet email, et j'ai besoin de le comprendre et de fournir une réponse à leur demande
Je vous laisse juge des 2 meilleures réponses que j’ai obtenu
Version Mistra Nemo 12b
Version Gemma2 9b
La réponse se ressemble, mais la version Gemma2 est directement en anglais sans avoir eu besoin de demander.
J’aurais pu aussi préciser dans mon prompt que je voulais le résultat en anglais.
Impact matériel
Pour lancer ces opérations qui ont été rapide, mais cela à un impact sur ma machine. Je n’ai pas fermée mes autres applications pour faire mes tests (345 processus en cours).
Les autres test avec Jan.ia
Comme toujours, le choix du bon modèle est indispensable, mais pour avoir le bon modèle il faut faire beaucoup de test, et avoir de la place sur son disque dur.
Je note que dans de très nombreux cas les IA ci dessous n’ont pas compris que j’étais le client qui devait faire parvenir ses coordonnées au fournisseur.
Deepseek R1 llama 8b
Phi-4
Qwen3:4b et Qwen3:8b
Bon j’ai un problème entre Jan.ia et Qwen3. J’ai essayer de désinstaller Qwen3, changer de version du modèle, vérifier que j’ai la dernière version de Jan.ia toujours le même résultat.