Quelle est la meilleure bibliothèque OCR pour Android ?


Il existe de nombreuses bibliothèques OCR disponibles pour l'intégration avec Android - Tesseract est très largement utilisé. D'après mon expérience, l'extraction sur l'OCR n'est généralement pas si grande. Donc ce que vous devriez faire est - faire un test d'extraction de base sur l'Android pour s'assurer que l'image est prise correctement, n'a pas de tremblement, etc et ensuite l'envoyer à une bibliothèque côté serveur pour une extraction plus profonde et un prétraitement.

La partie plus délicate est ce qu'il faut faire après que le moteur OCR vous donne le texte. L'extraction de texte est beaucoup plus compliquée que l'OCR. Pour l'extraction de texte, vous devez vous soucier de deux choses supplémentaires :

  1. Les règles d'extraction : Les logiciels d'OCR déversent généralement le texte de votre document dans un champ de texte de forme libre. Cela fonctionne très bien si vous numérisez une page d'un livre ou un doc de texte. Mais si vous avez besoin de séparer les éléments de ligne du document, vous devez également appliquer de nombreuses règles à cet effet. Cela peut prendre beaucoup plus de temps que l'intégration du moteur d'OCR
  2. Machine Learning : Obtenir du texte OCR est un bon début mais d'après mon expérience dans la construction de solutions OCR, cette valeur en soi n'est pas d'une grande utilité. Vous devez la combiner avec d'autres facteurs et la tisser dans un algorithme qui peut apprendre de vos résultats d'extraction au fil du temps et l'utiliser pour prédire quel est le bon texte.

Pour les applications métier, il existe des situations où le moteur d'OCR est assez confiant dans les données extraites, mais le texte ne s'additionne pas dans le contexte de toutes les autres données qui l'entourent. C'est là que les moteurs d'OCR classiques échouent. Beaucoup d'entreprises ont réussi à contourner ce problème en construisant de solides algorithmes de texte basés sur l'apprentissage automatique qui peuvent combler les lacunes du moteur d'OCR en matière de lisibilité.