PDF avec recherches

Si du texte apparaît dans vos fichiers PDF constitués uniquement d'images, ou si vos PDF ont été créés à partir de fichiers image sur lesquels figure du texte, vous ne pourrez pas lancer de recherche sur le contenu de ces documents. Pour pouvoir effectuer des recherches sur ces fichiers, vous devez préalablement extraire leur texte par OCR. Un PDF avec recherches contient non seulement les images des pages du document, mais également un calque séparé sur lequel figure le texte reconnu, chaque caractère de texte renvoyant à son équivalent dans l'image. C'est grâce aux informations contenues sur ce calque que le fichier PDF peut faire l'objet de recherches. Le format PDF avec recherches est particulièrement utile pour accéder au contenu de documents qui doivent être archivés tout en conservant leur apparence d'origine.

 

Remarque

Lorsque l'option PDF avec recherches est sélectionnée, le processus d'OCR n'est exécuté que si aucun calque de texte accessible n'est détectée dans un fichier d'entrée. Dans le cas contraire, le calque de texte permet de générer un PDF standard autorisant les recherches sans qu'il soit nécessaire d'exécuter d'OCR. Dans ce cas, le fichier généré autorisera les recherches, même si l'option PDF avec recherches est désactivée.

 

L'Assistant Create permet de générer des PDF avec recherches à partir de n'importe quel PDF constitué uniquement d'images ou de quasiment n'importe quel fichier image.

Vous pouvez définir la langue d'OCR dans la boîte de dialogue Paramètres de conversion PDF avec recherches.

Astuce

Consultez la rubrique Assistant Create pour connaître les types de fichiers pris en charge.

 

L'Assistant Create propose un profil nommé « PDF avec recherches », mais vous pouvez toutefois créer des PDF avec recherches en utilisant n'importe quel autre profil du programme. Pour ce faire, cochez simplement la case PDF avec recherches dans la fenêtre du profil que vous souhaitez utiliser.

 

Pour utiliser le profil « PDF avec recherches » dans l'Assistant Create

  1. Dans la liste déroulante Profil de l'Assistant Create, sélectionnez PDF avec recherches.

  2. Ouvrez un ou plusieurs fichiers à convertir en PDF avec recherches.

  3. Cliquez sur le bouton Profils pour afficher la boîte de dialogue Profils PDF Create et vérifier les paramètres correspondants. La case PDF avec recherches est cochée d'office. Conservez ce paramètre et modifiez si nécessaire d'autres options (par exemple, les paramètres de protection, filigrane, etc.).

  4. Cliquez sur le bouton Réglages pour afficher la boîte de dialogue Paramètres de conversion PDF avec recherches. Sélectionnez la langue dans laquelle est rédigé votre document source, puis fermez la boîte de dialogue. Cliquez sur OK pour fermer la boîte de dialogue Profils PDF Create.


  5. Cliquez sur l'outil Lancer la création PDF. Si vous sélectionnez plusieurs fichiers et choisissez l'option Créer un PDF pour chaque document source et si vous sélectionnez l'option de sauvegarde Demander le nom du fichier, la boîte de dialogue Enregistrer sous s'affiche pour chaque fichier PDF généré.

Pour créer des PDF avec recherches à l'aide d'autres profils

  1. Dans la liste déroulante Profil de l'Assistant Create, sélectionnez PDF avec recherches.

  2. Cliquez sur le bouton Profils.

  3. Dans la boîte de dialogue Profils PDF Create, cochez la case Avec recherches.

  4. Cliquez sur le bouton Réglages pour afficher la boîte de dialogue Paramètres de conversion PDF avec recherches. Sélectionnez la langue dans laquelle est rédigé votre document source, puis cliquez sur OK.

  5. Dans la boîte de dialogue Profils PDF Create, sélectionnez et modifiez si nécessaire d'autres paramètres (par exemple, les paramètres de protection, filigrane, etc.). Cliquez sur OK et lancez la création comme décrit ci-dessus.

Astuce

Pour obtenir un PDF avec recherches, et lui appliquer une compression MRC, cochez les deux cases. Cliquez alors sur le bouton Réglages pour afficher la boîte de dialogue Paramètres de conversion PDF MRC avec recherches.

 

 

Lorsque vous ouvrez un fichier PDF constitué uniquement d'images dans Power PDF ou un fichier PDF possédant des pages constituées uniquement d'images, le programme le détecte automatiquement (si l'option correspondante a été cochée sous Fichier > Options > Document > Documents PDF avec recherches). Pour ce faire, désélectionnez la case correspondante (sélectionnée par défaut). Si vous avez activé la demande d'invite, le programme propose d'enregistrer le document aux formats suivants : 

Pour plus de détails, consultez la rubrique Édition de documents PDF.

 

Remarque

Dans Power PDF, il est possible de transformer un PDF composé totalement ou partiellement d'images en PDF autorisant les recherches, via la commande Autoriser les recherches. Vous pouvez définir les paramètres de conversion correspondants sous Fichier > Options > Document > Documents PDF avec recherches. Choisissez d'exécuter l'OCR seulement sur les pages contenant des zones constituées uniquement d'images, ou sur toutes les pages. Dans ce cas, si le PDF contient déjà un calque de texte, le contenu du calque sera remplacé par les résultats de l'OCR. Une autre option permet d'exécuter l'OCR si un calque de texte est présent, mais que celui-ci est inutilisable en raison d'un encodage non standard.

 

 

Voir aussi