PDF avec balises

Les fichiers PDF balisés intègrent des métadonnées décrivant la structure du document et l'ordre des différents éléments composant le document (par exemple images, blocs de texte, colonnes, titres). Les balises facilitent l'extraction du texte ou des graphiques présents dans les fichiers PDF et permettent aux lecteurs d'écran de définir l'ordre de lecture correct des différents éléments d'un PDF. Certaines normes d'accessibilité peuvent nécessiter le balisage des fichiers PDF.

Créer des PDF balisés

Pour créer des PDF balisés, procédez comme suit à partir d'un profil de l'Assistant Create.

Dans la zone de sélection Profil, sélectionnez PDF avec balises. Par défaut, l'option Baliser le PDF est activée par défaut pour ce profil.

Vous pouvez cependant sélectionner un autre profil dans la zone de sélection Profil, et activer l'option Baliser le PDF dans la boîte de dialogue Profils PDF Create.

 

L'algorithme de balisage analyse le contenu du fichier PDF. Il détecte les paragraphes, les tableaux, les cellules de tableaux et les images (bitmap). Si le fichier d'entrée est un PDF comportant des annotations et/ou des champs de formulaires, ces derniers sont également balisés. Les noms standard des balises sont <div> pour une page et <p> pour le contenu considéré comme un paragraphe.

Ajout de balises à des fichiers existants

 

Cliquez sur l'outil Balise dans Power PDF pour ajouter des balises au document PDF actif. Pour cela, sélectionnez Traitement avancé > Document actif > Balises. Si vous utilisez cette commande sur un PDF balisé, les balises existantes sont remplacées.

Modification des informations de balises

Utilisez l'outil Modifier un objet (Édition > Modification). Sélectionnez un objet ou un bloc de texte pour étudier ou modifier ses informations de balises. Cliquez dessus avec le bouton droit, puis sélectionnez Propriétés pour afficher la boîte de dialogue Propriétés de l'objet. Accédez ensuite aux volets Contenu et Balises.

Le volet Balises permet de réaliser diverses opérations sur les balises. Utilisez-le pour vérifier si le paragraphe a été correctement détecté, pour fusionner les balises si nécessaire et pour ajouter un texte descriptif aux éléments balisés.

Le balisage d'un PDF est une opération sollicitant de nombreuses ressources (plusieurs minutes peuvent être nécessaires). Appuyez sur la touche Échap. pour annuler un processus de balisage.

 

 

Remarques

Nous vous déconseillons d'utiliser la fonction de balisage avec des fichiers superposés ou contenant des filigranes. Avec ces fichiers, les paragraphes et tableaux risquent en effet de ne pas être détectés.

Il n'est pas possible de générer des fichiers PDF balisés en choisissant l'imprimante Nuance PDF depuis une boîte de dialogue Imprimer.

Vous pouvez également générer des fichiers PDF balisés à partir de vos documents Word. Pour accéder aux options de balisage, ouvrez l'onglet Balises de la boîte de dialogue Paramètres Nuance PDF pour Word.