Étiquette : Ollama

  • Essai OCR

    Essai OCR

    J’avais une capture d’écran d’un prompt YouTube. Le genre de screenshot que vous prenez à la volée parce que la vidéo défile et que vous n’avez pas le temps de recopier. Sauf que maintenant, j’ai besoin du texte brut.

    Capture d ecran d un prompt YouTube a convertir en texte

    Premier réflexe : Ollama avec Deepseek-OCR. Un prompt tout simple, presque insultant de simplicité :

    fait moi une reconnaissance du texte

    Et hop, en quelques secondes, l’image se transforme en texte exploitable. C’est beau, c’est rapide, ça marche.

    Resultat OCR Deepseek - texte extrait de l image

    Évidemment, comme tout geek qui se respecte, je ne me suis pas arrêté là. J’ai voulu tester glm-ocr, le nouveau modèle supposé révolutionnaire. Celui dont tout le monde parle.

    Résultat : impossible à installer localement.

    Erreur installation glm-ocr

    Vous connaissez la chanson. C’est comme ces vieilles cafetières italiennes qui font encore le meilleur café du quartier pendant que la nouvelle machine à dosettes refuse de démarrer parce qu’il lui manque une mise à jour firmware. Parfois, l’ancien marche mieux que le nouveau.

    Et c’est là que le local prend tout son sens : pas de quota, pas de surprise tarifaire, pas de changement de conditions générales à 3h du matin. Juste votre machine qui bosse pour vous. Comme au bon vieux temps.

  • Un logo inconnu ? ChatGPT peut vous dire d’où il vient en quelques secondes

    Un logo inconnu ? ChatGPT peut vous dire d’où il vient en quelques secondes

    Vous êtes en train de scroller, vous tombez sur un logo chelou, ultra minimaliste… et là, impossible de savoir quelle marque ou quel produit se cache derrière. Ça vous parle ? 😏

    Bonne nouvelle : ChatGPT peut vous sortir de là en deux secondes. Oui, vraiment.

    Reconnaître un logo sans se prendre la tête

    On a tous déjà vu passer un logo sur un site, une app ou une affiche, sans aucun contexte. Avant, il fallait :

    • faire une recherche inversée,
    • fouiller Google Images,
    • ou demander à Twitter (et attendre).

    Aujourd’hui ? Vous balancez le logo à ChatGPT, et basta.

    La pépite : ChatGPT en mode détective visuel

    Si vous utilisez ChatGPT avec la reconnaissance d’images activée, vous pouvez tout simplement uploader l’image du logo et lui demander :

    “À quelle marque correspond ce logo ?”

    Et là, magie 🪄
    ChatGPT analyse les formes, le style, parfois même l’historique graphique… et vous répond.

    Ce que ça sait faire (et plutôt bien)

    • 🔍 Identifier une marque ou un produit
    • 🏷️ Donner le nom de l’entreprise
    • 🌍 Expliquer le domaine d’activité
    • 📜 Fournir un peu de contexte ou d’historique
    • ❗ Préciser quand il n’est pas sûr à 100 % (et ça, c’est sain)

    Pratique, non ?
    Cerise sur le gâteau : pas besoin de compte louche ni de service obscur qui trace tout ce que vous envoyez.

    Version locale

    J’ai fait l’essai avec 2 IA locales :

    • Gemini

    Et pour l’essai avec Mistral,

    Et c’est parti pour une attente de 10 min, car pas de fibre au bureau.

    Mais le résultat reste faux, c’est vrai que ce nouveau logo est très proche de celui de Firefox.

    Par contre, certaines IA pas possible d’avoir une réponse.

    Pourquoi c’est vraiment utile

    • Vous faites de la veille tech
    • Vous tombez sur une startup inconnue
    • Vous voulez savoir si un soft est open source ou juste du marketing
    • Vous êtes juste curieux (et c’est très bien aussi)

    Et tout ça, sans quitter votre outil préféré.

    En résumé

    Un logo inconnu ?
    👉 Vous l’envoyez à ChatGPT
    👉 Vous posez la question
    👉 Vous avez la réponse

    Simple, rapide, efficace. Ça fait le thé, comme on aime 🍵

    Si vous n’avez jamais testé la reconnaissance d’images de ChatGPT, c’est clairement le moment.