Traduire un fichier PDF numérisé gratuit en ligneOCR intégré et traduction par IA dans plus de 40 langues
Téléchargez un fichier PDF numérisé ou contenant des images. Le texte est extrait directement dans votre navigateur à l'aide de la reconnaissance optique de caractères (OCR), puis traduit. Aucun téléchargement vers un serveur n'est nécessaire pour l'OCR. Aucune inscription. Aucun paiement.
ou par glisser-déposer · taille maximale de 50 Mo · les fichiers ne sont pas conservés
Comment fonctionne la traduction de fichiers PDF numérisés
De l'image numérisée au texte traduit
Deux étapes, entièrement automatisées. Les deux s'exécutent dans votre navigateur. Votre scan n'est pas téléchargé pour l'OCR.
1. Détecter
Les premières pages de votre fichier PDF sont analysées. Si aucun texte sélectionnable n'est détecté, le fichier PDF est considéré comme un document numérisé et la fonction OCR vous est proposée.
2. Reconnaître
Tesseract OCR fonctionne en local dans votre navigateur, page par page, dans la langue de votre choix. Votre fichier ne quitte pas votre appareil.
3. Traduire
Le texte extrait est traduit dans votre langue cible et s'affiche à côté de la numérisation originale, page par page.
OCR privé par défaut
La plupart des outils en ligne combinant OCR et traduction téléchargent votre fichier PDF numérisé sur un serveur. Ici, l'OCR utilise WebAssembly Tesseract directement dans votre navigateur. Le fichier numérisé ne passe pas par nos serveurs. Seul le texte reconnu est envoyé pour être traduit.
Gratuit, sans quota
La plupart des services OCR en ligne gratuits vous limitent à quelques pages par jour avant de vous demander de payer. Ici, vous pouvez traduire jusqu'à 15 pages par document, sans limite quant au nombre de documents et sans avoir à payer.
Plus de 40 langues prises en charge par l'OCR
Anglais, arabe, chinois, japonais, coréen, hindi, marathi, bengali, tamoul, russe, grec, hébreu, thaï et plus de 30 autres langues. Sélectionnez la langue de votre document numérisé et le modèle OCR approprié sera chargé automatiquement.
Aucune configuration, aucune installation
La fonction OCR d'Adobe Acrobat fonctionne bien, mais coûte au moins 20 $ par mois. La version autonome de Tesseract nécessite une installation et une utilisation en ligne de commande. Cette page vous permet d'accéder aux deux d'un simple clic.
Foire aux questions
Traduire un fichier PDF numérisé — foire aux questions
Puis-je faire traduire gratuitement un fichier PDF numérisé ?+
Oui. La reconnaissance optique de caractères (OCR) s'effectue directement dans votre navigateur sur votre fichier PDF numérisé, puis le texte extrait est traduit à l'aide de l'IA. Aucune inscription, aucun filigrane, aucun paiement requis.
Comment fonctionne la traduction de fichiers PDF numérisés ?+
Deux étapes. Tout d'abord, l'OCR extrait le texte des images de la page. Cette opération s'effectue directement dans votre navigateur à l'aide de Tesseract ; le fichier ne quitte donc pas votre appareil. Ensuite, le texte extrait est traduit dans la langue de votre choix à l'aide d'un modèle linguistique de grande envergure.
Quelles langues la fonction OCR prend-elle en charge ?+
Tesseract prend en charge plus de 40 langues, dont l'anglais, l'espagnol, le français, l'allemand, l'italien, le portugais, le russe, le chinois (simplifié et traditionnel), le japonais, le coréen, l'arabe, l'hindi, le marathi, le bengali, le tamoul, le turc, le néerlandais, le polonais, le tchèque, le grec, l'hébreu, le thaï et le vietnamien.
Quelle est la précision de l'OCR ?+
La qualité dépend de la numérisation. Les numérisations nettes à 300 ppp d'un texte imprimé lisible donnent généralement un résultat quasi parfait. Un texte délavé, une écriture manuscrite, des photos de pages à faible résolution ou des numérisations de travers peuvent entraîner des erreurs de reconnaissance qui se répercutent sur la traduction.
Combien de temps cela prend-il ?+
La reconnaissance optique de caractères (OCR) s'effectue localement dans votre navigateur ; le temps nécessaire dépend donc de votre appareil. Comptez environ 5 à 20 secondes par page pour un texte standard. L'étape de traduction prend ensuite quelques secondes par page.
Mes fichiers numérisés sont-ils téléchargés quelque part ?+
Non. Le fichier PDF est affiché sur un canevas et la reconnaissance optique de caractères (OCR) est effectuée directement dans votre navigateur. Le fichier lui-même n'est jamais envoyé à un serveur. Seul le texte extrait est envoyé pour être traduit.
Quelle est la limite de pages pour les fichiers PDF numérisés ?+
Comme pour tout autre fichier PDF : jusqu'à 15 pages et 50 Mo gratuitement. L'OCR est plus gourmand en ressources que l'extraction de texte ; le traitement des documents plus longs sera donc plus lent. Il est recommandé de diviser les fichiers volumineux.
La traduction conservera-t-elle la mise en page du document numérisé ?+
Le résultat de la traduction se présente sous forme de texte. L'image numérisée n'est pas réaffichée avec le texte traduit par-dessus. Vous recevez le texte traduit à côté de l'aperçu du PDF d'origine, que vous pouvez copier ou exporter.