Convertir PDF en HTML

Bonjour,

Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport (1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le résultat d'importation semble bien plus prés de la réalité avec http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.

Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.

Avez-vous une procédure plus efficace ?

D'avance merci.

isaric

Bonjour,

Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport
(1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le
résultat d'importation semble bien plus prés de la réalité avec
http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.

Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.

Avez-vous une procédure plus efficace ?

le pdf un encapsuleur donc cela dépend beaucoup du contenu !
si vous avez un pdf contenant un scan de page (image), il ne faut pas compter
en sortir du texte sinon par ocr.
il y a pdf2html qui est intégré dans toute distribution linux mais si l'ffichage
est bien respecté tous les espaces sont remplacés par l'espace insécable html
http://www.pdf2html.org/

D'avance merci.

isaric

Gérard

Merci Gérard, le est déjà pas mal.
Au départ, j'ai :
isaric.cof.free.fr/PDFtoHTML/urssaf.pdf

avec la commande pdftohtml urssaf.pdf j'obtiens :
http://isaric.cof.free.fr/PDFtoHTML/pdftohtml/urssaf.html

http://www.zamzar.com/ donne à partir .pdf
isaric.cof.free.fr/PDFtoHTML/urssaf.odt

y a t-il un équivalent pour .odt ?

D'avance merci
Eric

Je recherche toujours un équivalent à http://www.zamzar.com/ s'il existe pour convertir un pdf en .odt
D'avance merci.