Génération de PDF en UTF-8

Bonjour

Voici une nouvelle question envoyée à l'aide du formulaire de demande d'aide (http://fr.libreoffice.org/get-help/poser-une-question/).
Si vous répondez, merci de penser à utiliser la fonction "répondre à tous" de votre logiciel de courrier électronique de façon que le demandeur reçoive une copie de votre réponse.

Email: - jose.charters@free.fr
Sujet: - Génération de PDF en UTF-8
Question: - Bonjour,

Je voudrais être sûr de générer un fichier PDF en UTF-8. D'où mes questions :
Comment connaître l'encodage de caractères d'un fichier .odt ?
Comment être sûr que le fichier PDF générer avec libre office sera bien en UTF-8 ?

Merci,

José

Bonjour,

[...]

Question: - Bonjour,

Je voudrais être sûr de générer un fichier PDF en UTF-8. D'où mes questions :
Comment connaître l'encodage de caractères d'un fichier .odt ?
Comment être sûr que le fichier PDF générer avec libre office sera bien en UTF-8 ?

Tous les fichiers xml constitutifs d'un document au format OpenDocument
généré par LibreOffice sont encodés en UTF-8. Vous pouvez le vérifier en
décompressant un fichier .odt (renommez le en .zip) et en ouvrant un des
fichiers .xml avec votre éditeur de texte préféré.

Cela étant dit c'est la première fois que je vois poser une question sur
l'encodage des caractères dans un fichier PDF. En quoi est-ce important
? Il me semble que le format emporte toute l'information nécessaire pour
que le rendu soit le même quelle que soit la plateforme.
Est-ce que vous voulez pouvoir éditer et modifier la fichier pdf ? Si
c'est le cas vous devriez sûrement utiliser le format pdf hybride qui
permet d'embarquer le doc .odt dans le pdf. Ainsi quand on demandera à
LibreOffice d'ouvrir le fichier pdf ce sera le odt correspondant qu'il
ouvrira.

Si vous répondez, merci de penser à utiliser la fonction "répondre à
tous" de votre logiciel de courrier électronique de façon que la liste
de discussion reçoive une copie de votre réponse.

Bonne journée
JBF

​Je ne serais pas surpris que le système automatisé d'un éditeur/d'une
administration fasse une vérification de ce type, aussi absurde qu'elle
soit. Je n'arrive plus à mettre la main dessus, mais il y avait des
contraintes farfelues de ce genre dans le système de soumission de
manuscrits d'une université...

Bonjour,

[...]

Question: - Bonjour,

Je voudrais être sûr de générer un fichier PDF en UTF-8. D'où mes questions :
Comment connaître l'encodage de caractères d'un fichier .odt ?
Comment être sûr que le fichier PDF générer avec libre office sera bien en UTF-8 ?

Tous les fichiers xml constitutifs d'un document au format OpenDocument
généré par LibreOffice sont encodés en UTF-8. Vous pouvez le vérifier en
décompressant un fichier .odt (renommez le en .zip) et en ouvrant un des
fichiers .xml avec votre éditeur de texte préféré.

Bonjour,

Merci de votre réponse.

Je m'attendais bien à ce que l'encodage UTF-8 soit bien celui par défaut dans libre office.

J'ai vérifié après avoir décompresser le fichier en question et je vois bien le codage UTF-8 dans les fichier xml.

Cela étant dit c'est la première fois que je vois poser une question sur
l'encodage des caractères dans un fichier PDF. En quoi est-ce important
? Il me semble que le format emporte toute l'information nécessaire pour
que le rendu soit le même quelle que soit la plateforme.
Est-ce que vous voulez pouvoir éditer et modifier la fichier pdf ? Si
c'est le cas vous devriez sûrement utiliser le format pdf hybride qui
permet d'embarquer le doc .odt dans le pdf. Ainsi quand on demandera à
LibreOffice d'ouvrir le fichier pdf ce sera le odt correspondant qu'il
ouvrira.

En fait, ma question vient du fait qu'a partir de Libre Office, je génère un fichier PDF.

Ce fichier PDF est ensuite utiliser dans un programme en PHP, pour écrire par dessus. Et je m'aperçois que je suis obligé d'utiliser la fonction utf8_decode pour que les caractères soit bien affichés. Cette fonction décode l'encodage utf-8 en iso-8859-1.

Je ne comprends par pourquoi je dois recodé en iso-8859-1 alors que j'ai tout mis en utf-8. Je me disais que le fichier PDF pouvait être lui en iso-8859.

Bon apparemment, je fais fausse route. Je dois chercher ailleurs.

Merci.

Cordialement,

José

​Ah. Il faut savoir que le support de l'UTF-8 dans PHP est... compliqué, et
varie en fonction de ce qu'on veut en faire. Juste faire passer les données
à droite à gauche ça va, pour le reste...