[rech] script table des matiere

Bonjour,

Je suis embêté j’ai un pc sous W10, et 1500 document en natif en pdf, et en
html (peut-être) en *.mobi sûr .

J’ai les table des matiere quand j’envoie sur kindle, qui ne sont pas
clickable, alors qu’elles le sont dans d’autre collections.

Je me demande faute de savoir le faire avc power shell, si libre office à
un langage de script, pour faire les 1500 document comme un batch ?

De plus les documents apparaissent dans kindle avec le chemin absolu qui a
servi à les produire : aperçu-avant impression_titre du document.
Est il possible de renommer via libre office sous W10 à la volé les 1500
documents?

Merci
Philippe

Bonjour

Ça donne quoi un de ces documents pdf ouvert avec LibreOffice (et via le. Mobi ?)
Et les html ?

Vous voulez faire quoi en fait ? Fusionner ces 1500 documents qui ont tous un sommaire ?
Dans quel but en fait ?

Je fusionne les csv via l'invite windows avec copy. Je ne sais pas ce que ça donne sur de l'odf.
Après il y a aussi le document maître.
Peut être, sûrement, scriptable.

Mais fusionner 1500 docs, s'ils ne faisaient chacun qu'une page, ça ferait un doc  de 1500 pages qui aurait déjà a gérer des conversions de format puisque nativement vous n'avez pas d'odf. Hors comme le docs ont un sommaire que vous semblez vouloir exploiter... Ce rend l'opération encore plus hasardeuse.

Bref vous êtes vraiment tenté par un Frankenstein ???

Après s'il y a quelque chose de récurrent dans ces 1500 docs que vous voudriez récupérer dans un seul doc brut. Peut-être que l'exploitation des content.xml... via python.. mais franchement votre source de départ n'étant pas saine, il faut le vouloir !

Claire

Une dernière précision
Fusionner/ extraire les tables de matières demande a ce qu'elles soient toutes enregistrées comme telle dans le doc source utilisé. (Au sens de LibreOffice c.a.d correctement décrites avec les bonnes balises xml dans le content.xml de chaque odf). Et l'import nécessaire que vous décrivez ne le garanti pas vraiment