Hallo,
ich experimentiere zur Zeit mit Texten, die per OCR erfasst werden. In den
Texten ist auch wörtliche Rede dargestellt. Die Texte sind zwar auf
deutsch, haben aber französische Anführungszeichen. Bei der Erkennung
werden dann aus einem öffnenden '<<' tatsächlich zwei "kleiner als"-
Zeichen, das schließende '>>' wird korrekt erkannt und auch im Text
eingesetzt.
Ich ersetze in einem Texteditor die "falschen" Zeichen, durch normale obere
Anführungszeichen. Mit der Extension Writer2Epub wird dann ein E-Buch
erstellt, das in Calibre soll.
Ich hätte gerne vor der Erstellung des E-Buchs, die Anführungszeichen durch
die typographisch korrekten Zeichen ersetzt. Leider kann Writer das jedoch
nur bei der Eingabe automatisch machen. Zumindest finde ich nichts anderes.
Wie kann ich das automatisieren? Ich habe nämlich keine Lust im gesamten
Text die Anführungszeichen zu Suchen und von Hand zu ersetzen. Denn dann
werden auch die typographischen eingesetzt. Aber ich müsste zuerst alle
Zeichen vor einem Wortbeginn suchen und ersetzen und dann nochmals alle
nach einem Wortende. So sind jedenfalls in Writer öffnende und schließende
Anführungszeichen definiert.