Ceci est une ancienne révision du document !



Qu'est-ce que le format PDF ?

Le format PDF - dont l'acronyme signifie en Anglais "Portable Document Format" ou en Français "Format de Document Portable" - démontre la volonté initiale de ses concepteurs d'unifier le portage ou transfert de documents au sein d'architectures informatiques - notamment d'entreprises - de plus en plus hétérogènes du point de vue matériel et logiciel.

Le format du fichier généré

Le logiciel est destiné a synthétiser des données sous forme de fichier; A chaque logiciel correspond un type de fichier natif généré et caractérisé par son extension spécifique. Dans l'optique de permettre une certaine portabilité des données, la plupart des logiciels offre la possibilité de sauvegarder les données dans un fichier au format popularisé par une autre entreprise positionnée sur un secteur de production documentaire spécifique.

Quelques formats de fichiers populaires:

  • Dans le secteur bureautique:

on trouve les formats des suites bureautiques populaires telles la suite Microsoft Office (DOCX, DOC, XLS,…), ceux des suites libres d'Oracle Open Office et Libre Office, basés sur cette dernière (ODT, ODS, ODP,…).

  • Dans le secteur des bases de données:

Tels les formats Microsoft Office (ACCDB, MDB,…), le format Oracle SQL, les formats libres (HSQLBD, JDBC)

  • Dans le secteur du développement logiciel:

Tels les formats Microsoft (BAS, BAT, VBS…), les formats libres (SH, DEB, RPM,…).

Il est intéressant de signaler que le format Archive Binaire (BIN) est commun au code-source non libre des logiciels propriétaires de Microsoft et le code-source propriétaire des développeurs sous l'environnement Unix de diffusion libre.

Ce format de code-source commun aux deux environnements libre et propriétaire nous sert de transition opportune vers une définition du code source d'une application

Le code-source de l'application

Le code-source est constitué de lignes de code de programmation regroupées sous forme de routines au sein d'un ou plusieurs fichiers de code.

Ce ou ces fichiers de code-source sont ensuite pré-compilés afin de générer les fichiers de code binaires (EXE, BIN, DEB) sous forme de fichiers-conteneurs d'instructions intelligibles par la machine après l'installation de ce qui devient alors un logiciel ou application disponible afin d'exécuter la tache spécifique pour laquelle il a été conçu.

Le logiciel peut être libre de droits de diffusion tout en contenant du code-source soumis aux droits de propriété intellectuelle et commerciale dans le cadre de la législation américaine sur le Copyright et la législation française sur les droits d'auteurs.

Dans cette catégorie, sans être exclusive au monde Unix, le caractérise fortement concernant les logiciels (souvent des pilotes). On trouve notamment le code-source des fichiers Binaires (BIN) et le code-source des pilotes propriétaires NVIDIA, ATI, BROADCOM, sans oublier celui des versions antérieures à la version 9 de la visionneuse PDF développée par Adobe Inc.

Le code-source du format PDF était à l'origine diffusé aux développeurs: il était à ce titre considéré comme un format ouvert.
La société Adobe Inc. - à l'origine du concept et du développement du logiciel capable de l'exploiter - en possède les droits dont - jusqu'à l'adoption de la norme XML sous sa forme propriétaire XFA - elle a autorisé la diffusion des spécifications du code source afin de permettre aux développeurs tiers de l'implanter librement dans leurs applications et ainsi favoriser sa diffusion, donc sa popularisation.
Néanmoins, depuis le développement et l'accord de diffusion légale de la signature numérique adoptée notamment par l'Administration Française avec l’avènement récent de la pratique du "Zéro Émission Papier" - sauf cas exceptionnel d'impression pour signature et copie papier - les documents officiels, autrefois imprimés, peuvent désormais transiter via la toile ou sur support de sauvegarde numérique type clé USB au format "formulaire CERFA" techniquement dénommé XFA (en Anglais XML Format Architecture ou Architecture au Format XML).

Le XML (eXtensive Mark-up Language ou Langage de Balisage Extensible) est un langage informatique destiné à coder de manière dynamique (contrairement au langage HTLM intrinsèquement statique) la structure et l’organisation de l’information d’un document. Ce langage ouvert permet notamment l’échange des données et de leurs structures;

Vous pouvez obtenir de plus amples informations sur le langage de balisage extensible sur cette page très didactique consacrée au format XML.
Les clones libres ou commerciaux ne prennent pas en charge les fichiers PDF de type formulaires CERFA

Ceux-ci comportent des champs et une signature électronique (formulaires CERFA de l'Administration Publique Française notamment, disponibles sur la page de téléchargement des différents documents officiels de l'Administration Publique Française) ;

Ce format XFA est la propriété exclusive d'Adobe et développé depuis la version 9 d'Adobe Reader.

Avec la norme XFA propriétaire exclusive ou format fermé on remarque un revirement vers le cadre législatif de droits commerciaux au niveau du code tout en conservant un cadre du logiciel à diffusion libre et gratuite de la part d'Adobe depuis le lancement de la version 9 du célèbre lecteur Acrobat désormais dénommée Adobe Reader.

Autrement dit, si le logiciel Adobe Reader 9 - et suivants - est toujours libre de droits de diffusion et est par conséquent diffusé gratuitement, le code-source - lui - répond désormais aux règles du droit commercial sur le Copyright.

On peut objectivement parler d'une politique de diffusion selon le principe commercial d'obsolescence programmée de la part d'Adobe

Adobe Reader : le visionneur de PDF d'Adobe (avec plugin pour Firefox). Cependant indispensable à ce jour pour lire correctement les commentaires, annotations et les formulaire XFA, ainsi que pour éviter les déconvenues dans les PDF de production type PAO tel Scribus. Toutefois, les dernières versions d'Acrobat Reader ne semblent pas lire correctement les annotations générées par autre chose que le format Adobe; passer en "tout libre" pour le PDF hormis administratif devient ainsi une alternative de plus en plus pertinente.

On trouve bon nombre de logiciels libres capables d'exploiter les fichiers PDF de code-source libre.

Caractéristiques des formats PDF générés

Ces logiciels - basés sur du code libre jusqu'à la version 8 d'Acrobat Reader - sont fondés sur les spécifications antérieures à la norme de code fermé XFA.

De ce fait, ils sont dans l'incapacité d'exploiter les formulaires PDF développés dans cette norme.

Quelques logiciels libres sous les différents environnements de l'univers Linux

Néanmoins, si le fichier PDF que vous désirez exploiter est d'un format compatible et que vous désirez vous cantonner au monde du libre, on trouve - entre-autres - les logiciels suivants:

sous l'environnement graphiques Gnome

  • Evince : le visionneur de documents dispose de l'intégration à Firefox. Il est disponible dans les dépôts; le site officiel d'Evince.
  • PDFtk. Logiciel en ligne de commandes assez restrictif - voire obsolète - (ne permet pas de traiter le format PDF v.1.6). La procédure d'installation se trouve à la page consacrée à PDFtk.

Sous l'environnement graphique KDE

  • Okular : Okular est l'afficheur de documents du projet KDE4 SC. Il remplace les anciens logiciels KPDF, KGhostView, Kfax et KDVI, tout en dépassant le simple logiciel d'affichage PDF.
  • ePDFView : un visionneur de documents PDF libre et léger.

Sous l'environnement Xfce

  • Xpdf : visionneur de PDF très léger (note: semble performant pour lire des PDF contenant des caractères asiatiques).

Logiciels propriétaires

  • Master PDF Editor : pour éditer, modifier, protéger, insérer, surligner etc… (site anglophone)
  • Foxit Reader pour Linux : progiciel venu du monde Windows, il se montrait très rapide et performant, mais il n'est plus maintenu sous GNU/Linux. Il est préférable de ce tourner vers son conccurent direct Adobe Reader 9 sous Linux ou bien lui préférer Evince si l'on souhaite avoir les même fonctionnalités dans le monde du libre.

logiciels de la communauté anglophone

Code libre

Ci-dessous, une large sélection de logiciels dont le code est libre (donc antérieurs au format XFA) ayant trait aux fichiers de type PDF.

  • Liste à puceEvince : le visionneur de documents de GNOME (avec intégration à Firefox).
  • Liste à puceOkular : le visionneur de documents de KDE.
  • Liste à puceZathura : visionneur de documents PDF extrêmement léger et pratique dont les raccourcis clavier sont basés sur ceux de VIM.

La navigation via la souris est également possible.

  • Liste à puceePDFView : un visionneur de documents PDF libre et léger.
  • Liste à puceXpdf : visionneur de PDF très léger (note: semble performant pour lire des PDF contenant des caractères asiatiques).
  • Liste à puceMaster PDF Editor : pour éditer, modifier, protéger, insérer, surligner et ajouter (http://code-industry.net/free-pdf-editor.php).
  • Liste à puceMuPDF : autre visionneur libre, très léger et très performant, disponible dans les dépôts :
    • *mupdf (site web). * Liste à pucepdfcube : visualiseur de PDF avec effets 3D (pdfcube). * Liste à puceqpdfview : lecteur PDF avec onglets, permettant d'avoir une interface plus riche dans une seule fenêtre * Liste à puceFoxit Reader pour Linux (propriétaire) : logiciel très rapide et performant, mais n'étant plus maintenu sous GNU/Linux * Liste à puceXournal : logiciel de prise de notes manuscrites, surtout destiné à prendre des notes sur des documents PDF et à les annoter. === Résumé : Liste de lecteurs pdfs libres. ===== Logiciels de création et de modification de PDF ===== Textes, images et mise en page : * LibreOffice Draw LibreOffice intègre directement l'ancienne extension pdf-import. il faut toutefois installer libreoffice-pdfimport Version LibreOffice de du module pdfimport. Pour importer le fichier PDF avec LibreOffice Draw il faut le choisir dans la boite de dialogue mais sans oublier de sélectionner le format "PDF - portable document format (Draw)" dans la liste déroulante "tous les fichiers". * Openoffice.org-pdfimport (dans les dépôts depuis Ubuntu 9.04): extension d'OpenOffice.org permettant de modifier des PDF (en les important dans OOo Draw puis en les ré-enregistrant en PDF). * Pdfedit : pour éditer vos PDF (moins intuitif que openoffice.org-pdfimport). * Inkscape : permet la modification des pdf. Encore à améliorer mais très efficace (enregistre les fichiers en .svg et permet de les retravailler. Choix de la taille de police, import d'image dans le fichier etc). * Evince : permet l'impression de pdf en svg, puis l'édition avec un éditeur de svg comme Inkscape. * Poppler-utils : permet l'extraction de texte, d'images, l'import vers html etc. * Scribus à partir de la version 1.5 permet d'importer des fichiers PDF multipages (les textes sont toutefois convertis en polygones) et de les éditer dans tous leurs aspects. * GIMP : l'éditeur d'images bien connu permet également d'importer des PDF (et les transforme en images). ATTENTION à choisir une résolution (en dpi) qui correspondent au résultat espéré. <note tip>En Juin 2013, les résultats d'imports sont assez aléatoires selon les logiciels utlilisés. Les images ne sont pas toujours bien restituées, les polices ne sont pas restituées à l'identique… Ce qui fonctionne assez bien, pour obtenir un rendu identique est d'ouvrir le PDF avec Evince, « l'imprimer » en SVG puis ouvrir le document avec Inkscape. ATTENTION, une seule page à la fois : Evince écrit toutes les pages sur une seule page. Sinon LibreOffice Draw récupère bien le texte et à peu près la mise en page, moins les images. Inkscape fait un assez bon travail mais modifie légèrement la police du texte. Gimp ne permet pas de modifier le texte (format image). REMARQUE : Afin d'obtenir un fichier sauvegardé au format PDF, à partir des logiciels ci-dessus, ou de n'importe quel autre, il suffit d'imprimer dans un fichier et de choisir PDF comme format de sortie. Le réassemblage final des éléments graphiques d'un PDF modifié dans GIMP au format JPG se fera - par exemple - à l'aide de la fonction "imprimer dans un fichier PDF du logiciel Gthumb. </note> Découpe, fusion, réorganisation, rotation, etc. : * Livret réordonne les pages d'un PDF pour avoir une brochure PDF prête à l'impression. * LibreOffice Draw (voir au dessus) permet aussi la réorganisation en brochure, la fonction est disponible dans le panneau d'impression (onglet "Mise en page"). Pour exporter en PDF, c'est aussi possible en demandant l'impression dans un fichier (onglet "Options") * PDFmod : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi exporter des images, modifier le titre, le sujet, l'auteur, les mots-clés, la table des matières. * PDF Chain : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi rajouter un watermark. * PDFshuffler : pour supprimer des pages, tourner, assembler, re-arranger vos PDF, et aussi rogner des pages. * PDF Split and Merge (PdfSam) : logiciel permettant de couper/assembler des PDF (moins pratique que PDFshuffler et PDFmod). * briss : pour rogner des PDF par sélection à la souris (pour rogner des pages, essayez aussi PDFshuffler). * Krop Permet le recadrage et le redimensionnement de pdf. Autres : * gscan2pdf : création, concaténation, compression de PDF depuis scanner ou fichiers. * xournal : permet d'annoter, surligner… les PDF. * flpsed permet d'annoter les PDF. * pdftk : manipulation de PDF en ligne de commande. * pdfjumbler : réorganisation de fichier PDF. * pdfcrack : pour gérer les PDF protégés par mot-de-passe (pdfcrack). * pdfposter : assemblage de PDF pour créer un poster (pdfposter). * pdfresurrect : pour gérer l'historique de vos PDF (pdfresurrect). * whyteboard : dessiner et annoter des images sur un PDF. (présent dans les dépots depuis Oneiric whyteboard). * SoPDF : pour rendre vos PDF lisibles par les lecteurs Sony Reader. ===== Logiciels d'export ou conversion vers le PDF ===== * OpenOffice.org ou LibreOffice : permet d'enregistrer vos documents (textes, feuilles de calcul, diaporamas) en PDF. * scenari : générer des documents vers plusieurs formats dont le PDF (basé sur OpenOffice.org). * Scribus : logiciel de PAO qui permet l'export en PDF de qualité professionnelle (accepté par les grandes imprimeries). * Cups-PDF : imprimante virtuelle PDF (pour générer des PDF à partir de n'importe quelle application permettant d'imprimer). * HtmlDoc: convertir des pages HTML en un document PDF ou PostScript. (non recommandé car pas très performant) * WkHtmlToPdf Convertit les pages HTML au format PDF ou image. Utilise le moteur de rendu WebKit (recommandé) * CutyCapt Convertit les pages HTML au format PDF ou image, utilise aussi webkit (recommandé) * ps2pdf: convertir des fichiers PostScript en PDF. * tiff2pdf : convertir vos images en PDF. ===== Logiciels d'export ou conversion depuis le PDF ===== * pdftohtml : exporter un fichier PDF en fichier HTML. * pdftops : exporter un fichier PDF en fichier PS (PostScript). pdftops utilise la librairie poppler. * pdf2ps: exporte aussi de PDF en PS (wrapper de la commande gs). Utilise la librairie ghostscript. * pdf2tif : Script pour exporter un fichier PDF en fichier Tiff. * Le paquet xpdf-utils contient pdftops (convertisseur PDF vers PostScript), pdfinfo (extracteur d'informations de documents PDF), pdfimages (extracteur d'images PDF), pdftotext (convertisseur PDF vers texte) et pdffonts (analyseur de polices PDF). * Le paquet xpdf-reader contient pdftoppm, un utilitaire de conversion de fichier PDF vers les formats PBM, PGM et PPM. * k2pdfopt : permet de modifier les PDF afin de les rendre plus lisibles sur smartphones et tablettes numériques. * Calibre : * gestionnaire d'eBook permettant également de convertir des PDF en autres formats et inverse * Il existe également une ligne de commande permettant de convertir : * <code>ebook-convert "source" "destination" –chapter-mark pagebreak</code> ===== Réduire la taille d'un fichier PDF ===== *Copier votre fichier PDF dans votre Dossier personnel. *saisir dans un terminal la commande suivante : <code>gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=fichier_reduit.pdf fichier_a_reduire.pdf</code> Pour plus d'information, consulter cette discussion. Il est possible aussi d'utiliser pdfmm («pdf moins moins»), un assistant graphique qui permet d'effectuer la même tâche. ===== Concaténation, découper, rotation, compression… en ligne de commande ===== Voir la page sur PDFTK ===== Imprimer un livre en cahiers pour le relier à l'ancienne ===== Un livre classique (non broché) est constitué de cahiers / livrets qui sont reliés entre eux par du fil de couture. Pour imprimer de tels cahiers, consulter cette discussion sur debian-fr.org. NB :** Les livres brochés sont constitués uniquement de feuilles collées sur leur tranche. Le livre qui en résulte est moins solide car les pages peuvent se détacher avec le temps, lorsque la colle durcit et se casse. C'est le cas des livres de poche.

Voir cette discussion sur le forum ubuntu-fr.

Ghostscript permet de générer des fichiers PDF 1.3 protégés :

gs -dBATCH -DNOPAUSE -q -sDEVICE=pdfwrite -dEncryptionR=3 -dKeyLength=40 -dPermissions=65472 -sOwnerPassword=null -sOutputFile=sortie.pdf -f Entree.pdf

L'option -dPermissions permet de sélectionner les actions autorisées : ici ni copier, ni coller, ni imprimer n'est autorisé. Ceci permet de garder un fichier de taille faible et de qualité identique.

Il serait très intéressant d'avoir ici une explication détaillée quant aux différentes valeurs possibles pour l'option -dPermissions.
  • pdf.1405352133.txt.gz
  • Dernière modification: Le 14/07/2014, 17:35
  • par eagle08