Textcodierung/Zeichensatz

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der Textcodierung „Unicode“ einwandfrei. Wenn ich diese Textdatei dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne, erscheint im Voraussichtsfenster des Fensters „Öffnen“ der Text ebenfalls einwandfrei. Sobald der Text aber im Arbeitsfenster geöffnet ist, sind die Umlaute und „ß“ nur kryptischen Zeichen, z. B. ß als ß, ü als ü usw. Unter Einstellungen => HTML-Kompatibilität habe ich als Zeichensatz „Unicode (UTF-8)“ eingestellt. Nach meiner Kenntnis müßte dieser Zeichensatz zutreffen. Mit anderen der angebotenen Zeichensätze habe ich aber auch kein besseres Ergebnis erzielen können. Sollte ich hier mit Auto-Korrektur nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein einwandfreies Schriftbild erreiche?

Mit freundlichen Grüßen

Leopold

Welche Textdatei? Bisher hast du nur beschreiben, dass du eine /Email/
mit /TB/ *öffnest*. Aber kein Wort darüber, wie du zu besagter
/Textdatei/ kommst. Speicherst du die Email von TB aus als .eml?
Kopierst du den Body der Email in ein anderes Textprogramm, in dem du
dann das Dokument speicherst? Machst du einen Screenshot, den du
abspeicherst? Nutzt du spirituelle Techniken? Magie? :wink:

Wolfgang

Hallo Wolfgang,

für mich ist eine Textdatei eine Datei der Endung .txt.

Es geht also von TB zur Speicherung als .txt und anschließend zur Öffnung mit LO und dann erforderlichenfalls zur Speicherung als .odt-Datei zur weiteren Verarbeitung.

Gruß Leopold

Hallo Leopold,

Du gehst also bei Thunderbird auf Datei > Speichern als > *.txt
und hast dann eine Textdatei.

Gerade getestet und dann diese Datei von LibreOffice aus geöffnet. Du
siehst vermutlich die Vorschau auf die Datei, wenn Du beim Öffnen die
Vorschau aktiviert hast. Habe ich standardmäßig nicht, deswegen war mir
unklar, was Du da machst.

Ich habe das gerade durch getestet: Bei mir wird eine gespeicherte
Textdatei (wie die vorangegangene E-Mail als Textdatei gespeichert)
einwandfrei geöffnet. Keine Probleme mit Umlauten.

Mit HTML-Einstellungen wird das nichts zu tun haben, weil dort ja nur
der Zugriff auf HTML-Dateien beschrieben wird.

System hier: OpenSUSE 15.1 mit KDE-Benutzeroberfläche.

Gruß

Robert

Hallo Leopold,

>>
>> eingehende E-Mail übernimmt mein Thunderbird in der Textcodierung
>> „Unicode“ einwandfrei. Wenn ich diese Textdatei dann mit LO (Win
>> 10, LO Vers. 6.3.5.2 (x64)) öffne,

> Welche Textdatei? Bisher hast du nur beschreiben, dass du
> eine /Email/ mit /TB/ *öffnest*. Aber kein Wort darüber, wie du zu
> besagter /Textdatei/ kommst. Speicherst du die Email von TB aus
> als .eml? Kopierst du den Body der Email in ein anderes
> Textprogramm, in dem du dann das Dokument speicherst? Machst du
> einen Screenshot, den du abspeicherst? Nutzt du spirituelle
> Techniken? Magie? :wink:
>

für mich ist eine Textdatei eine Datei der Endung .txt.

Es geht also von TB zur Speicherung als .txt und anschließend zur
Öffnung mit LO und dann erforderlichenfalls zur Speicherung als
.odt-Datei zur weiteren Verarbeitung.

Deine Antwort klärt die Nachfrage von Wolfgang nicht, weil Du den
Schritt, wie Du zu der Textdatei kommst, nicht nennst. Kopierst Du den
Mailtext in einen Editor und speicherst anschließend im Format ".txt -
oder wie?

Viele Grüße

Rainer

Hallo Leopold Proelß,

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der
Textcodierung „Unicode“ einwandfrei. Wenn ich diese Textdatei
dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne, erscheint im
Voraussichtsfenster des Fensters „Öffnen“ der Text ebenfalls
einwandfrei. Sobald der Text aber im Arbeitsfenster geöffnet
ist, sind die Umlaute und „ß“ nur kryptischen Zeichen, z. B. ß
als ß, ü als ü usw. Unter Einstellungen => HTML-Kompatibilität
habe ich als Zeichensatz „Unicode (UTF-8)“ eingestellt. Nach
meiner Kenntnis müßte dieser Zeichensatz zutreffen. Mit anderen
der angebotenen Zeichensätze habe ich aber auch kein besseres
Ergebnis erzielen können. Sollte ich hier mit Auto-Korrektur
nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat mit
anschließendem Öffnen dieser Textdatei per LibreOffice funktioniert
hier einwandfrei. Zwar sind dann erstmal fünf Seiten nur die
Mail-Header, bevor auf der sechsten Seite ein bisschen Mailtext
kommt, von daher würde ich sowas nie verwenden ... :wink:

Danke, Robert,

mein System läuft unter Win10. Vielleicht hast Du dar´durch bessere Karten!

Gruß Leopold

Hallo, Rainer,

die TB-Datei speichere ich statt als eml-Datei als Txt-Datei!

Gruß Leopold

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Gruß Leopold

Hallo Leopold,

Hallo Leopold Proelß,

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der
Textcodierung „Unicode“ einwandfrei. Wenn ich diese
Textdatei dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne,
erscheint im Voraussichtsfenster des Fensters „Öffnen“ der
Text ebenfalls einwandfrei. Sobald der Text aber im
Arbeitsfenster geöffnet ist, sind die Umlaute und „ß“ nur
kryptischen Zeichen, z. B. ß als ß, ü als ü usw. Unter
Einstellungen => HTML-Kompatibilität habe ich als Zeichensatz
„Unicode (UTF-8)“ eingestellt. Nach meiner Kenntnis müßte
dieser Zeichensatz zutreffen. Mit anderen der angebotenen
Zeichensätze habe ich aber auch kein besseres Ergebnis
erzielen können. Sollte ich hier mit Auto-Korrektur
nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat
mit anschließendem Öffnen dieser Textdatei per LibreOffice
funktioniert hier einwandfrei. Zwar sind dann erstmal fünf
Seiten nur die Mail-Header, bevor auf der sechsten Seite ein
bisschen Mailtext kommt, von daher würde ich sowas nie
verwenden ... :wink:

Leopold

-- ..... und tschuess

Franklin

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Ich dachte, dass ich das vorstehend gemacht hätte. Was fehlt Dir
denn noch zum Nachvollziehen oder zum Vergleichen mit Deinem Ablauf?

Hallo Leopold Proelß,

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der
Textcodierung „Unicode“ einwandfrei. Wenn ich diese Textdatei
dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne, erscheint im
Voraussichtsfenster des Fensters „Öffnen“ der Text ebenfalls
einwandfrei. Sobald der Text aber im Arbeitsfenster geöffnet
ist, sind die Umlaute und „ß“ nur kryptischen Zeichen, z. B. ß
als ß, ü als ü usw. Unter Einstellungen => HTML-Kompatibilität
habe ich als Zeichensatz „Unicode (UTF-8)“ eingestellt. Nach
meiner Kenntnis müßte dieser Zeichensatz zutreffen. Mit anderen
der angebotenen Zeichensätze habe ich aber auch kein besseres
Ergebnis erzielen können. Sollte ich hier mit Auto-Korrektur
nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat mit
anschließendem Öffnen dieser Textdatei per LibreOffice funktioniert
hier einwandfrei. Zwar sind dann erstmal fünf Seiten nur die
Mail-Header, bevor auf der sechsten Seite ein bisschen Mailtext
kommt, von daher würde ich sowas nie verwenden ... :wink:

Leopold

--
..... und tschuess

Franklin

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Ich dachte, dass ich das vorstehend gemacht hätte. Was fehlt Dir denn noch?

Hallo Leopold,

>>
>> Kann mir jemand einen Hinweis geben, wie ich gleich ein
>> einwandfreies Schriftbild erreiche?

> Das Speichern einer E-Mail aus meinem TB heraus im Textformat mit
> anschließendem Öffnen dieser Textdatei per LibreOffice funktioniert
> hier einwandfrei. Zwar sind dann erstmal fünf Seiten nur die
> Mail-Header, bevor auf der sechsten Seite ein bisschen Mailtext
> kommt, von daher würde ich sowas nie verwenden ... :wink:
>
Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Für mich sieht es so aus, als ob Franklin nicht im Text, sondern im
Mail-Format (eml) abgespeichert hat. Der Header-Kram zeigt sich bei mir
nämlich, wenn ich genau das tue. Wenn ich die eml-Datei anschließend
öffne (egal, ob mit einem Texteditor oder mit LO-Writer), sehe ich das
alles - allerdings auch einige kryptische Zeichen. Speichere ich von
vornherein im Text-Format ab und öffne die Datei /egal ob mit Editor
oder LO), habe ich eine einwandfreie Darstellung -

Vielleicht installierst Du versuchsweise mal einen weiteren Texteditor.

Viele Grüße

Rainer

Hallo Rainer,

Hallo Leopold,

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat
mit anschließendem Öffnen dieser Textdatei per LibreOffice
funktioniert hier einwandfrei. Zwar sind dann erstmal fünf
Seiten nur die Mail-Header, bevor auf der sechsten Seite ein
bisschen Mailtext kommt, von daher würde ich sowas nie
verwenden ... :wink:

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Für mich sieht es so aus, als ob Franklin nicht im Text, sondern
im Mail-Format (eml) abgespeichert hat.

Falsch vermutet ... wenn ich schreibe, dass ich im Text-Format
abgespeichert habe, dann habe ich das auch so getan.

Der Header-Kram zeigt sich bei mir nämlich, wenn ich genau das
tue.

Bei mir halt auch im TXT-Format .... aber das liegt vielleicht
daran, dass Mails hier auch grundsätzlich nur als reiner Text und
ohne den überflüssigen HTML-Code angezeigt werden.

Wenn ich die eml-Datei anschließend öffne (egal, ob mit einem
Texteditor oder mit LO-Writer), sehe ich das alles - allerdings
auch einige kryptische Zeichen. Speichere ich von vornherein im
Text-Format ab und öffne die Datei /egal ob mit Editor oder LO),
habe ich eine einwandfreie Darstellung -

Vielleicht installierst Du versuchsweise mal einen weiteren
Texteditor.

Viele Grüße

Rainer

.... und tschüss

            Franklin

Hallo Leopold,

Hallo Leopold Proelß,

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der
Textcodierung „Unicode“ einwandfrei. Wenn ich diese
Textdatei dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne,
erscheint im Voraussichtsfenster des Fensters „Öffnen“ der
Text ebenfalls einwandfrei. Sobald der Text aber im
Arbeitsfenster geöffnet ist, sind die Umlaute und „ß“ nur
kryptischen Zeichen, z. B. ß als ß, ü als ü usw. Unter
Einstellungen => HTML-Kompatibilität habe ich als Zeichensatz
„Unicode (UTF-8)“ eingestellt. Nach meiner Kenntnis müßte
dieser Zeichensatz zutreffen. Mit anderen der angebotenen
Zeichensätze habe ich aber auch kein besseres Ergebnis
erzielen können. Sollte ich hier mit Auto-Korrektur
nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat
mit anschließendem Öffnen dieser Textdatei per LibreOffice
funktioniert hier einwandfrei. Zwar sind dann erstmal fünf
Seiten nur die Mail-Header, bevor auf der sechsten Seite ein
bisschen Mailtext kommt, von daher würde ich sowas nie
verwenden ... :wink:

Leopold

-- ..... und tschuess

Franklin

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Ich dachte, dass ich das vorstehend gemacht hätte. Was fehlt Dir
denn noch zum Nachvollziehen oder zum Vergleichen mit Deinem Ablauf?

Vielleicht ist ja noch für Dein Problem bedeutsam, dass hier Mails
grundsätzlich immer ohne den überflüssigen HTML-Code, sondern nur
als reiner Text angezeigt werden.

Hallo Franklin,

mir fehlen einfach Deine Textcodierungen. Vielleicht komme ich damit schon weiter!

Gruß Leopold

Hallo Leopold,

Von: Leopold Proelß <post@leopold-proelss.de> An:
users@de.libreoffice.org Empfangen: 18.04.2020 17:22:20
Betreff: Re: [de-users] Textcodierung/Zeichensatz

Hallo Leopold Proelß,

Hallo in die Runde,

eingehende E-Mail übernimmt mein Thunderbird in der
Textcodierung „Unicode“ einwandfrei. Wenn ich diese
Textdatei dann mit LO (Win 10, LO Vers. 6.3.5.2 (x64)) öffne,
erscheint im Voraussichtsfenster des Fensters „Öffnen“ der
Text ebenfalls einwandfrei. Sobald der Text aber im
Arbeitsfenster geöffnet ist, sind die Umlaute und „ß“ nur
kryptischen Zeichen, z. B. ß als ß, ü als ü usw. Unter
Einstellungen => HTML-Kompatibilität habe ich als Zeichensatz
„Unicode (UTF-8)“ eingestellt. Nach meiner Kenntnis müßte
dieser Zeichensatz zutreffen. Mit anderen der angebotenen
Zeichensätze habe ich aber auch kein besseres Ergebnis
erzielen können. Sollte ich hier mit Auto-Korrektur
nachbessern?

Kann mir jemand einen Hinweis geben, wie ich gleich ein
einwandfreies Schriftbild erreiche?

Das Speichern einer E-Mail aus meinem TB heraus im Textformat
mit anschließendem Öffnen dieser Textdatei per LibreOffice
funktioniert hier einwandfrei. Zwar sind dann erstmal fünf
Seiten nur die Mail-Header, bevor auf der sechsten Seite ein
bisschen Mailtext kommt, von daher würde ich sowas nie
verwenden ... :wink:

Leopold

-- ..... und tschuess

Franklin

Hallo Franklin,

warum erklärst Du mir nicht, was Du machst?

Ich dachte, dass ich das vorstehend gemacht hätte. Was fehlt
Dir denn noch?

Gruß Leopold

Hallo Franklin,

mir fehlen einfach Deine Textcodierungen. Vielleicht komme ich
damit schon weiter!

Das glaube ich ja nicht, dass Dir das diesbezüglich weiter hilft,
aber bei der Mail, wo ich's probiert hab, war's:

MIME-Version:
1.0
Content-Type:
text/plain; charset="utf-8"
Content-Transfer-Encoding:
base64

Gehst Du denn genauso vor, wie von mir beschrieben?

Hallo Leopold & alle anderen :wink:

ich kann den Fehler auch unter Win10 nachvollziehen:
- ich speichere die Nachricht - z.B deine hier - als Textdatei *.txt
- wenn ich die Textdatei im Editor oder in Notepad++ öffne, ist alles in Ordnung
- wenn ich die Textdatei aus dem Editor in LO-Writer kopiere, passt auch alles.
- beim direkten Öffnen mit LO-Writer sehe ich die problematischen Sonderzeichen.

Wenn ich die TXT-Datei mit Notepad++ in ANSI konvertiere und speichere, hat auch LO keine Probleme mehr damit.

Ich vermute, dass Writer das ANSI-Format erwartet und UTF-8 hier nicht erkennt.

Meine Ideen zur Problemlösung:
- statt als txt-Datei die Mails im HTML-Format speichern - damit hat LO -Writer keine Probleme - oder
- eine Batchkonvertierung UTF-8 zu ANSI über die Dateien drüberlaufen lassen - hier gibt es durchaus Ideen im Netz.

MfG

Hallo,

Hallo Leopold & alle anderen :wink:

ich kann den Fehler auch unter Win10 nachvollziehen:
- ich speichere die Nachricht - z.B deine hier - als Textdatei *.txt
- wenn ich die Textdatei im Editor oder in Notepad++ öffne, ist alles in Ordnung
- wenn ich die Textdatei aus dem Editor in LO-Writer kopiere, passt auch alles.
- beim direkten Öffnen mit LO-Writer sehe ich die problematischen Sonderzeichen.

Versuche es mal mit Datei > Öffnen und in dem Dialog den Filter "Text - Textkodierung wählen (*.txt)". Dann erscheint der "ASCII-Filter-Optionen"-Dialog.

Kandidaten für den Zeichensatz sind "Westeuropäisch (Windows-1252/WinLatin )" oder "Unicode (UTF-8)", zumindest für Mails aus Deutschland.

Es kommt bei Mails nicht nur darauf an, was das E-Mail-Programm standardmäßig zum Speichern benutzt, sondern auch darauf, welche Kodierung der Sender benutzt hat.

Mit freundlichen Grüßen
Regina

Bei dieser Vorgehensweise geht die Info zur Kodierung verloren; ist ein
Fehler von TB, welches keine BOM (Byte Order Mark, auch Magic Number
genannt) einfügt. Bei UTF-8 müsste die Datei korrekterweise
eigentlich mit der Bytesequenz EF BB BF beginnen, tatsächlich beginnt
sie jedoch mit der Sequenz 0D 0A aka Zeilenwechsel. Eine Datei ohne BOM ist
aber definiert als reines ANSII.

Der Fehler ist allerdings nachvollziebar, da es durchaus immer noch
(v.a. ältere) Texteditoren gibt, die mit BOMs nicht zurecht kommen.
Viele andere Editoren nehmen darauf Rücksicht. Wie man es also macht, ist
es irgendwie falsch.

Jedenfalls, eine solche Datei ohne BOM lässt sich von LO nur aus LO
heraus öffen, also nicht durch "Rechtsklick => Öffnen mit => Libre
Office" auf Dateiebene. Und beim Öffenn über "Datei => Öffnen" muss man
die Dateiauswahl (Default: "Alle Dateien") auf "Text - Textkodierung
wählen" stellen, und dann manuell UTF-8 auswählen.

Wolfgang

Super! Danke vielmals - wieder was gelernt!

MfG Alois