Comment faire pour OCR des documents en ligne avec ABBYY FineReader

Si vous n'utilisez pas de papier, vous aurez besoin d'un moyen simple de rendre vos documents numérisés accessibles à la recherche. Il ne s'agit donc pas uniquement d'images statiques de vos documents papier. Nous avons déjà examiné différentes manières de faire de la ROC dans des applications telles que Adobe Acrobat, PDFPen et Google Drive. Bien que chacune de ces applications puisse reconnaître du texte dans vos documents, ce n'est pas leur fonction principale..

ABBYY est peut-être l’un des développeurs OCR les plus connus. Il produit de nombreux programmes de gestion sans papier. Dans ce tutoriel, je vais vous montrer comment utiliser leur application Web FineReader et sa technologie OCR pour convertir des PDF, des numérisations et d'autres fichiers image en texte modifiable..

L'avantage ABBYY FineReader

Même si la version en ligne n’est pas aussi puissante que la version de bureau, ABBYY FineReader Online est peut-être le service de ROC en ligne le plus puissant actuellement disponible..

Pré-traitement

ABBYY FineReader supprime la plupart des tâches qui auraient dû être effectuées pour que l'OCR réussisse dans un autre service, car le pré-traitement est effectué dans l'application elle-même. Avant de lancer la numérisation, ABBYY FineReader corrige les distorsions d'image, telles que l'orientation de la page et le bruit. Bien entendu, des aspects tels que la luminosité et la qualité de l'image dépendent de l'utilisateur, mais aucune modification supplémentaire n'est nécessaire de la part de l'utilisateur..

Le processus de numérisation

Après le pré-traitement, ABBYY FineReader décompose le document en éléments tels que des tableaux, des images et des blocs de texte avant de détecter les lignes, les lettres et les mots individuels. La technologie détermine ensuite la relation entre toutes les propriétés de la page. Ceci permet d’assurer une réplication précise non seulement du texte du document, mais également de la mise en page complète de la page elle-même..

Support linguistique

ABBYY FineReader Online prend actuellement en charge 42 langues, même celles avec des caractères non latins tels que l'hébreu et le coréen. Le dictionnaire prend en charge 37 de ces langues, ce qui permet de créer une récréation encore plus précise en vérifiant les mots détectés dans au moins un dictionnaire. Le service est capable d’OCR sur des documents en trois langues différentes à la fois..

La liste complète des langues prises en charge pour ABBYY FineReader Online.

En plus de la prise en charge linguistique, le service peut numériser d'anciens textes en allemand et en letton qui étaient écrits en lettres noires, faisant d'ABBYY FineReader Online une option viable pour l'OCR de documents historiques..

Le coût

Un service aussi puissant n’est pas sans prix. OCR sur ABBYY FineReader Online n’est pas trop onéreux: les crédits de page coûtent entre 3 $ et 10 $ US par tranche de 20 à 200 crédits de page, respectivement. Cependant, vous obtenez 20 crédits de page gratuitement lors de votre inscription au service..

Le processus d'OCR

Une fois connecté à votre compte ABBYY FineReader Online, vous serez redirigé vers la page de téléchargement..

Commencer

Commencez par rechercher le document ou l'image que vous souhaitez télécharger, puis assurez-vous qu'ABBYY FineReader prend en charge l'OCR pour votre fichier. Le service prend en charge l'OCR pour les fichiers PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif et .djvu. La taille maximale du fichier est de 30 Mo.

Pointe: Pour de meilleurs résultats, assurez-vous que votre fichier est de haute qualité et que la taille du texte est d'au moins 9 ou 10 points..

Si vous souhaitez convertir un document physique en OCR, utilisez un scanner de matériel, tel que Doxie, ou une application mobile pour convertir le document physique en un format de fichier compatible avec ABBYY FineReader..

Télécharger le document

Une fois votre document prêt à être téléchargé, cliquez sur le bouton Télécharger bouton sous le Charger un fichier à traiter champ. Trouvez votre fichier dans le Fenêtre du Finder, et cliquez Ouvrir. Je vous recommande de cocher la Envoyez-moi un lien de téléchargement par e-mail zone située juste en dessous du champ de fichier pour un accès facile au document recréé une fois le fichier OCRé. Le fichier téléchargé apparaît dans le Sélectionner les fichiers à traiter terrain quelques sections ci-dessous.

Sélectionnez un fichier à télécharger.

Ensuite, définissez les langues de votre document sous l'onglet Sélectionnez la ou les langues de votre document champ. Faites défiler la liste jusqu'à trouver les langues de votre document. Si vous en avez plusieurs, sélectionnez les langues supplémentaires en maintenant la touche Commander clé, si vous utilisez un Mac, ou le Contrôle clé, si vous utilisez un PC, et en cliquant sur.

ABBYY FineReader Online prend en charge l'OCR dans trois langues au maximum dans un seul document..

Si vous numérisez un document plus ancien défini en lettre noire, cliquez sur le bouton hyperlien à droite de la zone de sélection de la langue. La liste des langues changera et vous proposera les options allemandes et lettones appropriées pour la reconnaissance optique des caractères.

Ensuite, allez au Sélectionnez un format de sortie champ pour sélectionner le format dans lequel le fichier sera OCRed. À ce stade, ABBYY FineReader Online peut exporter les fichiers au format Microsoft Word ou Excel (dans les formats 97-2003 et nouveaux), Open Office, PDF, RTF ou Texte brut. Choisissez le format de conversion du document final dans le menu déroulant..

Sélectionnez un format de sortie dans le menu déroulant..

Pointe: Lors de la sélection de la sortie de votre document, méfiez-vous des tableaux, graphiques et autres images susceptibles de figurer dans votre document de saisie, car le traitement de texte risque de ne pas être en mesure de les traiter correctement et de produire des résultats médiocres.

Assurez-vous que les documents que vous voulez OCRed sont cochés dans le menu déroulant. Sélectionner les fichiers à traiter champ. Maintenant, appuyez sur le Reconnaître et ABBYY FineReader commencera l’OCR.

presse Reconnaître pour commencer le processus d'OCR.

Traitement du document

Après avoir appuyé sur Reconnaître, vous serez redirigé vers le Historique des tâches page, où vous pourrez vérifier l'état d'avancement du document OCRed. En fonction de la taille du fichier, l'OCR peut durer de quelques secondes à quelques minutes..

Le traitement peut prendre entre quelques secondes et quelques minutes..

Une fois le traitement terminé, vous pouvez télécharger votre document dans le format que vous avez sélectionné et l'exporter directement de l'application Web vers Google Drive, Evernote et Dropbox. Vous pouvez également évaluer la qualité du travail d'OCR, ce qui permet à ABBYY d'améliorer ses produits..

Une fois le traitement terminé, vous pouvez télécharger le document ou l'exporter directement vers un service cloud..

Les documents OCRed restent sur le serveur d’ABBYY FineReader pendant deux semaines avant d’être automatiquement supprimés..

Maintenant au travail!

ABBYY FineReader Online est un moyen simple d’OCR pour des documents compliqués sur le Web à un coût avantageux. Bien qu'il ne soit pas parfaitement parfait lorsqu'il traite d'images et d'autres éléments stylistiques, il traduit parfaitement le texte, même dans les documents de plusieurs langues, en de nombreux formats de fichiers modifiables..

Si vous rencontrez des problèmes liés à l'OCR dans ABBYY FineReader Online, ou si vous avez des préoccupations ou des inquiétudes au sujet de l'OCR ou du manque de papier en général, laissez un commentaire ci-dessous.!

Compétences informatiques