OOo2sDbk - Guide de conversion

2002-12-03

Version 0.1 (draft) pour Ooo2sDbk-0.4

Eric Bellot

Résumé

Ce document présente les modalités de conversion d'un document OpenOffice-Writer au format Docbook avec Ooo2sDbk. On y trouvera notamment la table de correspondance complète entre les styles et objets d'OpenOffice et le résultat de leur conversion.

Licence

Permission vous est donnée de copier, distribuer et/ou modifier ce document selon les termes de la Licence GNU Free Documentation License, Version 1.1 ou ultérieure publiée par la Free Software Foundation ;

Avec les sections inaltérables suivantes : - La section « Licence »

Avec le texte de première page de couverture suivant : - pas de texte de première page de couverture -

Avec le texte de dernière page de couverture suivant : - pas de texte de dernière page de couverture -

La licence officielle peut être consultée sur le Web à l'adresse suivante :

http://www.gnu.org/licenses/fdl.html


Table des matières

1. Présentation
1.1. Les limites de la conversion
2. Titres et sections
3. Métadonnées et infoarticle
3.1. Titre du document et sous-titre
3.2. Date de publication
3.3. Version du document
3.4. Auteur, éditeur et "othercredit"
3.5. Email
3.6. Corpauthor
3.7. Bibliomisc
3.8. Sujets et mots-clefs
3.9. Résumé
3.10. Copyright
3.11. Licence (notice légale)
4. Paragraphes
4.1. Les retours de lignes dans les paragraphes
4.2. Corps de texte et standard
4.3. Programlisting et Texte préformatté
4.4. Literallayout
4.5. Citation, Blockquote et Epigraph
4.6. Notes
5. Notes de bas de page et de fin
6. Tableaux
7. Listes
7.1. Listes à puces
7.2. Liste numérotées
7.3. Listes de termes (varlist)
8. Hyperliens et références croisés
8.1. URLs
8.2. Images liées
8.3. Repères de texte et renvois internes
9. Images et figures
9.1. Images liées et images incorporées
9.2. Positionnement vertical des images flottantes
9.3. Images légendées et cadres
10. Table des correspondances

1. Présentation

OOo2sDbk se base sur les styles du document OpenOffice-Writer pour construire le document Docbook.

La plupart du temps, un style d'OpenOffice correspond à une balise de la Docbook. Par exemple, un texte sur lequel aura été appliqué le style Accentuation sera encadré par les balises <emphasis>texte</emphasis> dans le document Docbook.

Nous proposons en téléchargement un modèle de document OpenOffice destiné à la création de documents Docbook. On y trouvera un grand nombre de styles spécialement créés pour correspondre aux balises de la simplified Docbook.

Pour simplifier la correspondance entre les styles d'OpenOffice et les balises Docbook, nous avons systématiquement nommés les styles d'OpenOffice avec les mêmes noms que leur équivalent Docbook. Par exemple, le style de paragraphe Copyright sera rendu par la balise <copyright>.

De même, ce document suppose que les balises courantes de la simplified Docbook soient connues. N'hésitez pas à consulter The simplified Docbook definitive guide pour connaître la signification des balises et des styles OpenOffice correspondants.

1.1. Les limites de la conversion

1.1.1. Les mises en formes sont perdues

Un document docbook est un document structuré. Les mises en formes sont donc perdues lors de la conversion car elles n'ont aucune signification pour un document Docbook :

  • Les formats de caractères sont perdus (souligné, police, taille de caractères, etc.)

  • Les formats de paragraphes sont perdus (alinéa, interligne, tabulations, etc.).

Cette perte n'est pas un inconvénient, en fait c'est même un avantage. Il possible de personnaliser les styles du document OpenOffice à votre convenance sans que cela interfère sur le document Docbook produit.

1.1.2. Les limites d'OpenOffice

OpenOffice ne permet pas une imbrication des balises aussi subtile que celle d'un document Docbook "fait main". Il est, par exemple, impossible d'imbriquer deux styles de caractères dans OpenOffice.

Le fragment de code ci-dessous est en style Literal avec le nom de la commande "java" en style Command et les paramètres "-fo" et "-pdf" en style Option :

java org.apache.fop.apps.Fop -fo manuel.fo -pdf manuel.pdf

On obtiendra le code suivant :

<command>java</command><literal> org.apache.fop.apps.Fop </literal>
<option>-fo</option><literal> manuel.fo </literal>
<option>-pdf</option><literal> manuel.pdf</literal>

et pas (ce qu'on aurait souhaité) :

<literal><command>java</command> org.apache.fop.apps.Fop 
<option>-fo</option>manuel.fo 
<option>-pdf</option> manuel.pdf</literal>

Les styles sont juxtaposés au lieux d'être imbriqués. Ce problème ne vient pas d'OOo2sDbk, mais du code XML d'OpenOffice qui n'imbrique pas les styles.

1.1.3. Les limites d'OOo2sDbk

Ooo2sDbk est encore loin d'être finalisé. Un certain nombre de styles de la simplified Docbook ne sont pas encore supportés :

  • Les images flottantes ancrées à la page sont perdues. En général, elle permettent de décorer les documents et n'ont donc pas à être transmisent au document Docbook.

  • Les exemples (<example>).

  • Les objets audio et video (<audioobject> et <videoobject>).

  • L'historique des révisions (<revhistory>)[1]

  • Les métadonnées de section (<sectioninfo>)

  • Les informations sur les objets (<objectinfo>). OpenOffice ne propose rien qui puisse servir de support à cette balise et aux informations qu'elle contient.

  • Les sidebar (<sidebar>), c'est à dire les notes de marges.

1.1.4. Les limites de la simplified Docbook

La DTD simplified Docbook est une version allégée de la DTD Docbook standard. Elle ne contient qu'une centaine de balises au lieu des 600 de la version complète. On ne doit donc pas espérer atteindre toute la subtilité qu'offre la Docbook standard.

La simplified Docbook est destinée aux document courts (les "articles" au sens de la Docbook).

La DTD simplified Docbook n'est pas encore finalisée, seule la Candidate Release 3.0 de la version 1.0 est disponible au moment de l'écriture de ces lignes.

C'est pour cette raison que, par défaut, qu'Ooo2sDbk attribue aux documents générés la déclaration de type de document de la Docbook 4.1.2.



[1] OpenOffice propose un gestionnaire de version de document. Toutefois, le fichier XML qui conserve cet historique se trouve dans une partie séparée des fichiers XML standards d'OpenOffice et n'est pas intégré dans la DTD. Il ne faut donc pas espérer un support rapide.


Copyright©2002 Eric Bellot
http://www.chez.com/ebellot/ooo2sdbk
Miroir : http://membres.lycos.fr/ebellot