Ich habe eine frage um die trennung.lst Datei. Weil ich in Schwedisch schreibe bin ich davon recht anhängig. Das Problem ist das viele Wörter nicht getrennt werden trotzdem sie in der Datei stehen. Habe ich vielleicht die trennung.lst Datei zerstört? Manchmal habe ich sie in Wordpad geöffnet um sie zu editieren. Das soll man vielleicht nicht tun? Ich verstehe das .lst Vormat nicht. Es ist ja nicht ein Standard Windowsvormat, oder? Bitte, wie kann ich die .lst Datei irgendwie reparieren? Ich habe etwa 1000 Trennungsausnahmen da eingeschrieben.
Wenn die Datei in Windows Notes geöffnet ist sind die Wörter alle zusammengeschrieben wie ein einziges Block. Aber wenn ich sie in Wordpad or in Papyrus öffne ist jedes Wort eine eigene Zeile. Enden die Wörten mit eine Zeilenende oder mit eine Absatsende? Ich möchte das gerne verstehen.
Die Zeilen-Trennung ist egal, CR LF geht, wie auch nur LF.
Eminent wichtig ist die korrekte alphabetische Sortierung.
Am besten die Datei einfach mal per Mail zu uns schicken, wir schauen gerne mal drauf. Am besten mit einem Beispieldokument, in dem Wörter nicht getrennt werden.
Öffne die Datei mit einem reinen Texteditor. Z.B. EditPad, dort hast du eine Liste von einzelnen Wörtern mit Bindestrich und korrekten Umlauten: Süd-a-me-ri-ka. Papyrus zeigt an:Süd-a-me-ri-ka. Im Windows-Texteditor bekommst du einen ganzen Textblock, die einzelnen Wörter durch Quadrat getrennt…
Ich nehme stark an, dass das am verwendeten Zeichensatz liegt, bzw. ob das jeweilige Programm den korrekt erkennt.
Alfred du schreibst dass in Windows Texteditor “die einzelnen Wörter durch Quadrat getrennt” werden. Ich kann nicht mehr einige Quadraten sehen aber kann mich erinneren das ich sowas früher gesehen haben. Die sind wahrscheinlich verlorengegangen. Ist das vielleicht das Problem? Und wie kann ich die Quadraten dann wieder herstellen?
Die fehlenden Quadrate dürften kein Problem sein. Sie werden angezeigt, wenn der Texteditor die Unix-Zeilenenden LF (Line Feed) nicht versteht und nur MS-DOS-Zeilenenden erkennen kann (CRLF = Carriage Return / Line Feed). Die Quadrate sind in diesem Fall nur Platzhalter für die unsichtbaren LF-Zeichen. Wenn sie nicht angezeigt werden, heißt das nur, dass kein Platzhalter sichtbar ist. Die Zeichen als solche sind aber noch da.
Ja, ich sehe jetzt dass das originale deutsche trennung Datei da ist. Aber, wenn ich dass öffne siehen die Sonderzeichen nicht genaou so aus wie in meine eigene trennung Datei. Zum Beispiel, das Buchstab ö ist ö in meine Datei, aber in the German Orginaldatei ist ö ö. Vielleicht bedeutet das etwas…? Ich muss mal ein Texteditor ausprobieren.
Jetzt fungiert die trennung.lst perfekt! Ich habe den Texteditor EditPad installiert und die Datei unter Unicode UTF-8 repariert. Das letzte problem ist auch gelöst, ich habe nicht gewusst das Papyrus laufen darf weil man die Datei editiere.
simpleman
Schweden
Special thanks to Alfred und Glucose! Jetzt kan ich also mit Papyrus weiterarbeiten, und darüber freue ich mir sehr.