J’ai mis Claude à l’épreuve avec un test simple : extraire les URLs d’une capture d’écran de présentation.

Le résultat ? Six liens parfaitement identifiés, sans erreur. Pas de confusion entre les caractères, pas d’URL tronquée. Claude a même poussé l’analyse en remarquant que tous ces liens concernaient le Model Context Protocol.
Ce qui m’a frappé, c’est la fiabilité. Pas besoin de corriger, pas de copier-coller approximatif. L’image contenait du texte, et Claude l’a lu aussi naturellement qu’un document texte standard.
Pourquoi c’est intéressant ? Parce que ça change la donne pour tous ceux qui passent des heures à retaper des infos depuis des captures d’écran, des PDF scannés ou des photos de tableaux. Claude ne se contente pas de voir le texte, il le comprend dans son contexte.
Dans mon cas, j’avais besoin de ces URLs pour mon travail sur MCP. Au lieu de les taper manuellement ou de risquer une erreur, j’ai simplement demandé. Trois secondes plus tard, j’avais ma liste.
L’OCR n’est plus une fonctionnalité approximative qu’on utilise en dernier recours. C’est devenu un outil de productivité à part entière, intégré naturellement dans le flux de travail.
A suivre…
Laisser un commentaire