Contenu | Rechercher | Menus

Le format PDF

Cette page traite de la gestion des fichiers de type PDF sous Ubuntu.

PDF est-il vraiment un format ouvert ?

Le PDF est considéré comme un format ouvert. Néanmoins, le PDF est une technologie appartenant à la société Adobe, laquelle y a inclus des spécifications propriétaires optionnelles comme par exemple pour les formulaires PDF (formulaires CERFA, ou XFA).1)

Cadre d'utilisation des logiciels disponibles

Adobe Reader © : le visionneur de PDF d'Adobe ® (avec plugin pour Firefox). Ce logiciel propriétaire reste cependant indispensable à ce jour pour lire correctement les commentaires, annotations et les formulaire XFA, ainsi que pour éviter les déconvenues dans les PDF de production type PAO tel Scribus. Toutefois, les versions d'Acrobat Reader © ne semblent pas lire correctement les annotations générées par autre chose que le format Adobe ®.

Les clones libres ou commerciaux ne prennent pas en charge les fichiers PDF de type formulaires CERFA

Ceux-ci comportent des champs et une signature électronique (formulaires CERFA de l'Administration Publique Française notamment, disponibles sur la page de téléchargement des différents documents officiels de l'Administration Publique Française) ;

Ce format XFA est la propriété exclusive d'Adobe et développé depuis la version 9 d'Adobe Reader ©.

Avec la norme XFA propriétaire exclusive ou format fermé on remarque un revirement vers le cadre législatif de droits commerciaux au niveau du code tout en conservant un cadre du logiciel à diffusion libre et gratuite de la part d'Adobe depuis le lancement de la version 9 du célèbre lecteur Acrobat © désormais dénommée Adobe Reader ©.

Autrement dit, si le logiciel Adobe Reader 9 - et suivants - est toujours libre de droits de diffusion et est par conséquent diffusé gratuitement, le code-source - lui - répond désormais aux règles du droit commercial sur le Copyright.

On peut objectivement parler d'une politique de diffusion selon le principe commercial d'obsolescence programmée de la part d'Adobe

Passer en "tout libre" pour le les fichiers PDF hormis administratif (avec l'installation de la dernière version d'Adobe Reader © en binôme dans ce cas précis) devient ainsi une alternative de plus en plus pertinente.

Les logiciels de code-source et de droits de diffusion libres

On trouve bon nombre de logiciels libres capables d'exploiter les fichiers PDF de code-source libre.

Caractéristiques des formats PDF générés

Ces logiciels - basés sur du code libre jusqu'à la version 8 d'Acrobat Reader - sont fondés sur les spécifications antérieures à la norme de code fermé XFA.

De ce fait, ils sont dans l'incapacité d'exploiter les formulaires PDF développés dans cette norme.

Quelques logiciels libres sous les différents environnements de l'univers Linux

Néanmoins, si le fichier PDF que vous désirez exploiter est d'un format compatible et que vous désirez vous cantonner au monde du libre, on trouve - entre-autres - les logiciels suivants:

sous l'environnement graphiques Gnome

Sous l'environnement graphique KDE

  • Okular : Okular est l'afficheur de documents du projet KDE4 SC. Il remplace les anciens logiciels KPDF, KGhostView, Kfax et KDVI, tout en prenant soin de ne pas se cantonner à la seule fonction de logiciel d'affichage du format PDF.

Sous l'environnement Xfce

  • XPDF : visionneuse de PDF très léger voire basique pour ne pas dire austère. (disponibilité dans les dépôts de la version libre à vérifier). NB: semble performant pour lire des PDF contenant des caractères asiatiques. La dernière version stable des sources de la version GNU est disponible à la page dédiée de l'éditeur. Libre pour un usage privé. Cf la section "Logiciels propriétaires" pour un usage professionnel sous licence commerciale.
  • QPDF View : lecteur PDF avec onglets, permettant d'avoir une interface plus riche dans une seule fenêtre. Lit le PostScript, le format DjVu. CUPS pour le support d'impression (à ne pas confondre avec QPDF Viewer sous Android®).

Logiciels propriétaires sous licence GNU libre (éventuellement disponible dans les dépots Universe et Multiverse)

  • XPDF : visionneuse de PDF très légère - voire basique - pour ne pas dire austère. NB: semble performant pour lire des PDF contenant des caractères asiatiques. Vous pouvez obtenir une licence commerciale en vous rendant sur le site de l'éditeur Glyph & Cog®.
  • MuPDF : autre visionneuse libre, très légère et très performante, disponible dans les dépôts : lien vers le paquet MuPDF. Bien que libre pour un usage privé et disponible dans les dépôts officiels, le logiciel est placé dans cette catégorie car lle existe également sous licence pour une utilisation commerciale. (site anglophone)
  • Master PDF Editor : pour éditer, modifier, protéger, insérer, surligner etc… (site anglophone)
  • PDF Cube : visualiseur de PDF avec effets 3D disponible dans les dépôts à vérifier. lien vers PDF Cube (site anglophone)

logiciels de la communauté anglophone

Les inclassables

Logiciels en fin vie ou obsolètes

  • PDFtk : Logiciel libre en ligne de commandes assez restrictif (ne permet pas de traiter le format PDF v.1.6). La procédure d'installation se trouve à la page consacrée à PDFtk.
  • Foxit Reader pour Linux : Progiciel anglophone venu du monde Windows ®; il se montrait très rapide et performant, mais il n'est plus maintenu sous GNU/Linux. Il est préférable de se tourner vers son concurrent direct Adobe Reader sous Linux ou bien lui préférer Evince développé sous Gnome si l'on souhaite avoir les même fonctionnalités dans le monde du libre.

Vous trouverez sur ce site non seulement un tableau fournissant des liens vers quelques visionneuses libres, mais surtout un historique du développement et de l'évolution du format PDF qui synthétise les objectifs et les enjeux d'un format que l'on ne peut que souhaiter voir demeurer libre à l'image du protocole fondateur du Web 1.0: j'ai nommé le code HTTP!.

Logiciels de bureautique et de création documentaire capables de gérer et générer le format PDF à l'aide d'outils dédiés

Textes, images et mise en page

  • LibreOffice Draw LibreOffice intègre directement l'ancienne extension pdf-import. il faut toutefois installer libreoffice-pdfimport Version LibreOffice du module PDF-Import. Pour importer le fichier PDF avec LibreOffice Draw il faut sélectionner l'option dans la boite de dialogue mais dans le même temps - ne surtout pas oublier de sélectionner le format "PDF - portable document format (Draw)" dans la liste déroulante présélectionnée sur "tous les fichiers".
  • Openoffice.org-pdfimport (dans les dépôts depuis Ubuntu 9.04): extension d'OpenOffice.org permettant de modifier des PDF (en les important dans Open Office Draw puis en les ré-enregistrant en PDF).
  • Pdfedit : pour éditer vos PDF (moins intuitif que openoffice.org-pdfimport).
  • Inkscape : permet la modification des pdf. Encore à améliorer mais très efficace; quelques fonctionnalités marquantes : enregistre les fichiers au format icone vectoriel SVG et permet de les retravailler; offre le choix de la taille de police; autorise l'importation d'image dans le fichier etc).
  • Evince : permet le transfert de fichiers PDF vers le format d'image vectorielle SVG avant impression vers un éditeur de type Inkscape.
  • Poppler-utils : permet l'extraction de texte, d'images, l'importation vers le format HTML etc…
  • Scribus à partir de la version 1.5 permet d'importer des fichiers PDF multipages (les textes sont toutefois convertis en polygones) et de les éditer dans tous leurs aspects.
  • GIMP : l'éditeur d'images bien connu permet également d'importer des PDF (et les transforme en images). <note important>ATTENTION à choisir une résolution - en Dot-per-Inch (DPI) comprenez Point-Par-Pouce - qui correspondent au résultat espéré.</note>

Au regard des versions éditées en date de Juin 2013, l'importation entre logiciels offre des résultats assez aléatoires selon la paire de logiciels utilisée. Les images ne sont pas toujours bien restituées, les polices ne sont pas restituées à l'identique…

Il faut garder à l'esprit que le choix de l'importation restera toujours une solution pis-aller qui ne fera que réinterpréter le document selon la qualité de son filtre PDF ou graphique… Qui dit filtre dit aussi approximation dans le traitement, donc un résultat pas toujours conforme aux résultats attendus et espérés.

L'importation qui fonctionne assez bien et donne des résultats quasi identiques consiste à ouvrir votre PDF dans Evince, à « l'imprimer dans un fichier » au format "dessin vectoriel" SVG puis à ouvrir le document avec Inkscape. ATTENTION, une seule page à la fois : Evince regroupe toutes les pages sur une seule page.

Quant à LibreOffice Draw il gère bien le texte et la mise en page est sensiblement respectée mais il "oublie" les images. Inkscape fait un assez bon travail mais modifie légèrement la police du texte. Gimp ne permet pas de modifier le texte (format image).

REMARQUE : Afin d'obtenir un fichier sauvegardé au format PDF, à partir des logiciels ci-dessus, ou de n'importe quel autre, il suffit d'imprimer dans un fichier et de choisir PDF comme format de sortie.

La mise en page finale des éléments graphiques d'un PDF modifié dans GIMP au format JPG se fera - par exemple - à l'aide de la fonction "imprimer dans un fichier PDF" du logiciel Gthumb.

Les logiciels dédiés au format PDF sous l'angle de la fonction

Découpe, fusion, réorganisation, rotation et autres manipulations...

  • Livret réordonne les pages d'un PDF pour avoir une brochure PDF prête à l'impression.
  • LibreOffice Draw (voir au dessus) permet aussi la réorganisation en brochure, la fonction est disponible dans le panneau d'impression (onglet "Mise en page"). Pour exporter en PDF, c'est aussi possible en demandant l'impression dans un fichier (onglet "Options")
  • PDFmod : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi exporter des images, modifier le titre, le sujet, l'auteur, les mots-clés, la table des matières.
  • PDF Chain : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi rajouter un watermark.
  • PDFshuffler : pour supprimer des pages, tourner, assembler, re-arranger vos PDF, et aussi rogner des pages.
  • PDF Split and Merge (PdfSam) : logiciel permettant de couper/assembler des PDF (moins pratique que PDFshuffler et PDFmod).
  • briss : pour rogner des PDF par sélection à la souris (pour rogner des pages, essayez aussi PDFshuffler).
  • Krop Permet le recadrage et le redimensionnement de pdf.

Export ou conversion (PDF cible)

  • OpenOffice.org ou LibreOffice : permet d'enregistrer vos documents (textes, feuilles de calcul, diaporamas) en PDF.
  • scenari : générer des documents vers plusieurs formats dont le PDF (basé sur OpenOffice.org).
  • Scribus : logiciel de PAO qui permet l'export en PDF de qualité professionnelle (accepté par les grandes imprimeries).
  • Cups-PDF : imprimante virtuelle PDF (pour générer des PDF à partir de n'importe quelle application permettant d'imprimer).
  • HtmlDoc: convertir des pages HTML en un document PDF ou PostScript. (non recommandé car pas très performant)
  • WkHtmlToPdf Convertit les pages HTML au format PDF ou image. Utilise le moteur de rendu WebKit (recommandé)
  • CutyCapt Convertit les pages HTML au format PDF ou image, utilise aussi webkit (recommandé)
  • ps2pdf: convertir des fichiers PostScript en PDF.
  • tiff2pdf : convertir vos images en PDF.

Exportation ou conversion (PDF source)

  • pdftohtml : exporter un fichier PDF en fichier HTML.
  • pdftops : exporter un fichier PDF en fichier PS (PostScript). pdftops utilise la librairie poppler.
  • pdf2ps: exporte aussi de PDF en PS (wrapper de la commande gs). Utilise la librairie ghostscript.
  • pdf2tif : Script pour exporter un fichier PDF en fichier Tiff.
  • Le paquet xpdf-utils contient pdftops (convertisseur PDF vers PostScript), pdfinfo (extracteur d'informations de documents PDF), pdfimages (extracteur d'images PDF), pdftotext (convertisseur PDF vers texte) et pdffonts (analyseur de polices PDF).
  • Le paquet xpdf-reader contient pdftoppm, un utilitaire de conversion de fichier PDF vers les formats PBM, PGM et PPM.
  • k2pdfopt : permet de modifier les PDF afin de les rendre plus lisibles sur smartphones et tablettes numériques.
    • gestionnaire d'eBook permettant également de convertir des PDF en autres formats et inverse
    • Il existe également une ligne de commande permettant de convertir :
      • ebook-convert "source" "destination" --chapter-mark pagebreak

Quelques fonctions appliquées aux fichiers PDF en détails

Réduire la taille d'un fichier PDF

  • Copier votre fichier PDF dans votre Dossier personnel.
  • saisir dans un terminal la commande suivante :
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=fichier_reduit.pdf fichier_a_reduire.pdf

Pour plus d'information, consulter cette discussion.

Il est possible aussi d'utiliser pdfmm («pdf moins moins»), un assistant graphique qui permet d'effectuer la même tâche.

Concaténation, découper, rotation, compression... en ligne de commande

Voir la page sur PDFTK

Imprimer un livre en cahiers pour le relier à l'ancienne

Un livre classique (non broché) est constitué de cahiers / livrets qui sont reliés entre eux par du fil de couture.

Pour imprimer de tels cahiers, consulter cette discussion sur debian-fr.org.

NB : Les livres brochés sont constitués uniquement de feuilles collées sur leur tranche. Le livre qui en résulte est moins solide car les pages peuvent se détacher avec le temps, lorsque la colle durcit et se casse. C'est le cas des livres de poche.

Déocériser un PDF (pour empêcher le copié/collé)

Voir cette discussion sur le forum ubuntu-fr.

Ghostscript permet de générer des fichiers PDF 1.3 protégés :

gs -dBATCH -DNOPAUSE -q -sDEVICE=pdfwrite -dEncryptionR=3 -dKeyLength=40 -dPermissions=65472 -sOwnerPassword=null -sOutputFile=sortie.pdf -f Entree.pdf

L'option -dPermissions permet de sélectionner les actions autorisées : ici ni copier, ni coller, ni imprimer n'est autorisé. Ceci permet de garder un fichier de taille faible et de qualité identique.

Il serait très intéressant d'avoir ici une explication détaillée quant aux différentes valeurs possibles pour l'option -dPermissions.

Le format PDF... ah ben parlons-en, tiens!


Contributeurs:eagle08.

1) voir l'introduction de la page PDF


Le contenu de ce wiki est sous licence : CC BY-SA v3.0