Quelle est la meilleure façon de rechercher dans les fichiers PDF dans iOS ?


C'est un problème beaucoup plus difficile que la plupart des gens ne le réalisent, car le PDF n'est guère plus qu'un flux de commandes de dessin (essentiellement un fichier .ps) accompagné des polices, images ou autres ressources nécessaires. Le format PDF est destiné aux imprimantes, et non aux humains. Ainsi, bien qu'il reproduise fidèlement le contenu sur divers appareils, le format n'a aucune compréhension profonde de ce que sont ces contenus. Ce n'est pas comme HTML où le contenu est juste stylé par des balises - dans PDF, le dessin de chaque caractère est une commande séparée, et ils pourraient potentiellement venir dans n'importe quel ordre et être toujours valides.


Lorsque j'ai écrit le support PDF pour une application iPad, j'ai essentiellement dû mettre en page chaque page en mémoire et observer quels caractères étaient proches les uns des autres et plus ou moins sur la même "ligne" afin de supporter la recherche et la mise en évidence. Fouiller profondément dans les PDF est un cauchemar absolu, et est à éviter si vous le pouvez.

Si vous avez seulement besoin de prendre en charge iOS, PDPDFKit (http://pspdfkit.com) est la voie à suivre. Il'est largement utilisé et a été développé depuis longtemps, donc il'est testé au combat.


.