Hi Achim, *,
[...]
Was wolltest Du uns mit dem "manpage-snippet" sagen?
ich will mit Perl einen Parser bauen, der XY-Datein nach Textmustern durchsucht und sich dann diese (z.T großen) ASCII-Texte herauskopiert.
Soweit ja kein Problem, keine Ahnung was XY-Dateien sind, aber hat ja
dann erstmal noch nichts mit ODF/ODT oder LibreOffice zu tun.
Es geht also um große Mengen unformatierten Texts., richtig?
"Lazy" (klingt schöner als in deutsch) wie ich bin, habe ich einfach so zu mir gedacht tausche doch einfach mal vorgefertigten Text ###Baustein_0001### im ODT-File gegen den gaaaaanz vielen ASCII-Text aus der XY-Datei aus.
Ja, geht im Prinzip auch so, nur muß man wissen:
Absatz in LO/OOo kann maximak 64k Zeichen haben. Wenn der Text also
länger ist, dann mußt Du ihn in mehrere Absätze aufsplitten.
ERGEBNIS: Der Text war zwar bis zum Seitenende da (der Rest war wohl abgeschnitten),
Naja "war wohl" ist wenig präzise. Wenn der Text in einer
Tabellenzelle gelandet ist, dann muß für die Tabelle "allow cells to
split" aktiviert sein.
aber alles ohne Formatierungen.
ASCII mit Formatiernungen? Wie soll das funktinoieren?
Verschwunden waren im odt-File alle Zeilenschaltungen und vieles mehr.
Ja klar, weil für XML whitespace quasi egal ist. Zeielnumbrüche mußt
Du in entsprechende yml-Tags packen. Absätze in entsprechende
Absatz-tags.
Mehrere Leerzeichen mußt Du genauso escapen - dein man-page snippet
zeigts ja schon:
<text:s text:c="7"/> = 7 Leerzeichen.
Und natürlich mußt du alles escapen, was ansonsten als Teil des XMLs
angesehen wird.
Wenn Du es nicht selber in die Datei reinschreiben willst, kannst Du
ja auch LO dafür nehmen. Einfügen | Datei, oder auch verknüft in einem
Bereich,....
ciao
Christian