TextKonverter

Dateibearbeitung

Funktionen für die Bearbeitung von Textdateien auf Dateiebene finden Sie im TextKonverter im Bereich "Aktionen > Dateien" auf der rechten Seite des Hauptfensters. Mit diesen Funktionen ist es möglich, mehrere Dateien aneinanderzuhängen, eine Datei in mehrere neue Dateien zu teilen oder die Kodierung und den Zeilenumbruchtyp von Dateien zu ändern. Außerdem finden Sie in diesem Bereich Optionen dafür, Dateien mit einer bestimmten Kodierung oder einem bestimmten Zeilenumbruchtyp einzulesen anstatt Kodierung und Zeilenumbruchtyp automatisch vom TextConverter beim Einlesen bestimmen zu lassen. Mit den folgenden Links können Sie direkt zu dem jeweiligen Abschnitt innerhalb dieser Erläuterungen springen:

Die Funktionen und Optionen zum Bearbeiten des Inhalts von Texten und Textdateien finden Sie je nach Aufgabe eingeteilt in die Bereiche Textbearbeitung als Ganzes, Zeilen-Bearbeitung, CSV-Bearbeitung und XML-Bearbeitung.

Dateien aneinanderhängen

Mit der Funktion "Aktionen > Dateien > Dateien aneinanderhängen" können Sie mehrere Dateien miteinander verschmelzen. Je nach Ihren Wünschen kann die Funktion nicht nur dafür verwendet werden, den Inhalt mehrerer Dateien lediglich aneinander zu hängen, sondern auch zu bearbeiten. Zusätzlich ist es möglich, Texte zu definieren, die zwischen, vor oder hinter den Inhalten aus den Dateien eingefügt werden. In diesen Texten können Sie natürlich auch alle im TextKonverter verfügbaren Platzhalter verwenden. Damit ist es zum Beispiel möglich, den Dateinamen der Ursprungsdatei vor dem Inhalt der jeweiligen Datei einzufügen und somit in der vereinten neuen Datei automatisch die Quelle anzugeben. Wie dies alles funktioniert erfahren Sie im Tutorial über das Zusammenfügen von Textdateien.

Das Gegenteil dieser Funktion ist das Trennen einer Datei in mehrere neue Dateien. Auch diese Aufgabe können Sie mit dem TextKonverter erledigen. Mehr dazu im nächsten Abschnitt.

Dateien splitten

Mit der Funktion "Aktionen > Dateien > Dateien splitten" können Sie den Inhalt einer existierenden Datei in mehrere Teile separieren und jeden dieser Teile als neue Datei speichern. Ihnen stehen mehrere Möglichkeiten beziehungsweise Kriterien zur Verfügung, nach denen Sie die Trennung der Dateien vollziehen können. So können Sie zum Beispiel an einem beliebigen Text oder an einem regulären Ausdruck trennen, Sie können jede Zeile einer Datei als neue Datei speichern oder eine bestimmte Anzahl von Zeichen definieren, nach denen eine neue Datei begonnen wird. Auch eine Kombination beziehungsweise gemeinsame Anwendung dieser Kriterien ist möglich.

Zusätzlich stehen Ihnen einige Optionen zur Verfügung, mit denen Sie die Trennung und den Inhalt der neuen Dateien an Ihre Bedürfnisse anpassen können. Mehr dazu erfahren Sie im Tutorial über das Trennen von Textdateien mit dem TextKonverter.

Kodierung

Mit den Einstellungen und Optionen unter "Aktionen > Dateien > Kodierung" können Sie bestimmen, welche Kodierung beim Einlesen und Speichern der Dateien verwendet werden soll. Unterstützt werden die Formate ASCII, Latin-1 (ISO 8859-1), Latin-2 (ISO 8859-2), WIN-1250 (Mitteleuropäisch), WIN-1251 (Kyrillisch), WIN-1252 (Westeuropäisch), WIN-1253 (Griechisch), UTF-7, UTF-8, UTF-16 LE, UTF-16 BE, UTF-32 LE und UTF-32 BE. In den Formaten UTF-7, UTF-8, UTF-16 LE, UTF-16 BE, UTF-32 LE sowie UTF-32 BE kann wahlweise mit oder ohne Byte Order Mark (BOM) gespeichert werden.

Wenn Sie die Aktion "Kodierung" nicht aktivieren, wird standardmäßig versucht die Kodierung einer Datei beim Einlesen automatisch zu erkennen. Die ermittelte Kodierung wird dann auch wieder für die Speicherung der Datei verwendet, so dass die Art der Kodierung bei einer bloßen Änderung des Inhaltes einer Datei unverändert bleibt. Diese Grundeinstellung entspricht den Einstellungen "Automatische Erkennung" und "Beibehalten".

In den meisten Fällen sollten Sie die Einstellung unter "Einlesen" auf "Automatische Erkennung" belassen. Eine Ausnahme bilden zum Beispiel Dateien, die mit einer 8-Bit Zeichenkodierung wie beispielsweise mit einer der Windows Code Pages oder mit einer Kodierung aus der ISO 8859 Encoding Family gespeichert wurden, da sich diese Kodierungen auf Byteebene oftmals nicht eindeutig unterscheiden lassen. Wenn Sie eine solche Datei automatisch erkennen lassen, wird der TextKonverter bevorzugt Latin1 (ISO 8859-1) sowie die Windows Codepage der Sprachversion Ihres Windows-Systems detektieren. Insbesondere wenn Sie Dateien mit Windows-Code-Pages, die nicht zu Ihrem Computersystem passen, einlesen möchten, sollten Sie also die Codepage der Datei explizit angeben. Die Vorschau im TextKonverter hilft Ihnen dabei, zu sehen, wie die Bytes einer Datei mit Ihren aktuellen Einstellungen interpretiert werden.

Die Einstellungen unter "Speichern" und "Byte Order Mark" sollten Sie nur dann ändern, wenn Sie explizit die Kodierung Ihrer Dateien ändern möchten beziehungsweise wenn Sie eine Byte Order Mark zu Ihren Dateien hinzufügen oder aus Ihren Dateien entfernen möchten.

Mehr zu dem Thema "Kodierung" erhalten Sie in der Übersicht über die Formate von Textdateien sowie in der Übersicht über die unterstützten Formate des TextKonverters im Abschnitt "Kodierungen".

Zeilenumbruchtyp

Mit den Einstellungen unter "Aktionen > Dateien > Zeilenumbruchtyp" können Sie bestimmen, welche Zeichen oder welche anderen Kriterien in Ihren Dateien als Zeilenumbruch beziehungsweise als Zeile interpretiert werden sollen. Wie auch bei der Kodierung können Sie unterschiedliche Kriterien für das Einlesen und Speichern definieren und damit Ihre Dateien nicht nur mit einem bestimmten Zeilenumbruchtyp einlesen sondern auch den Zeilenumbruchtyp Ihrer Dateien ändern.

Unterstützt werden sowohl einzelne als auch mehrere unabhängige Zeichen oder Unicode-Codepoints als Zeilenumbruch sowie Zeilen, die durch eine beliebige feste Anzahl von Zeichen pro Zeile definiert sind. Typische und häufig benutzte Zeilenumbruchtypen wie beispielsweise CR LF (Windows) oder LF (Unix, Linux, macOS) können direkt aus der Auswahlbox ausgewählt werden, individuelle Zeilenumbruchtypen können als Zeichen oder über ihre Codepoints frei definiert werden.

Wenn Sie die Aktion "Zeilenumbruchtyp" nicht aktivieren, wird versucht, den Zeilenumbruchtyp einer Datei beim Einlesen automatisch zu ermitteln. Dieser Zeilenumbruchtyp wird dann auch für die Speicherung wiederverwendet, so dass der Zeilenumbruchtyp der Datei bei einer Bearbeitung mit anderen Aktionen unverändert bleibt. Analog zu der Aktion "Kodierung" entspricht diese Grundeinstellung auch beim Zeilenumbruchtyp den Optionen "Automatische Erkennung" und "Beibehalten" aus den Auswahlboxen.

Neben der Möglichkeit einer Änderung des Zeilenumbruchtyps von Dateien und Texten sind diese Einstellungen insbesondere auch für die Zeilenaktionen und die CSV-Aktionen relevant, da die CSV- und Zeilenaktionen das als Zeile betrachten, was hier definiert wurde. Durch die Definition von "Zeilen" über beliebige inklusive mehrerer Zeichen als Zeilenende oder über andere Kriterien wie Zeichenlängen können die Zeilenaktionen und CSV-Aktionen so zu einer sehr flexiblen Art der Textbearbeitung beitragen.

Mehr über das Thema "Zeilenumbruchtypen" erfahren Sie in der Übersicht über verschiedene häufig benutzte Typen von Zeilenumbrüchen sowie in den Erläuterungen über die unterstützten Formate des TextKonverters im Abschnitt "Zeilenumbruchtypen". In diesen Erläuterungen erfahren Sie auch, wie Sie benutzerdefinierte Zeilenumbrüche über Zeichen oder Codepoints definieren können, wie Sie Zeilen mit fixer Zeilenlänge festlegen können und wie Sie Zeilenumbrüche an mehreren verschiedenen Zeichen oder Codepoints realisieren können.

TextEncoder

Wenn Sie keine anderen Änderungen an Ihren Dateien vornehmen möchten außer die Kodierung oder den verwendeten Zeilenumbruchtyp zu ändern, können Sie diese Aufgabe auch mit dem TextEncoder erledigen. Diesen gibt es entweder als eigenständiges Programm oder integriert im TextKonverter im Menü unter Tools > TextEncoder.

Speicheroptionen

Unten rechts im Hauptfenster finden Sie den Bereich "Speicheroptionen". Hier können Sie festlegen, in welchem Ordner, unter welchem Namen und mit welcher Dateiendung Ihre Dateien nach der Bearbeitung abgespeichert werden.

Falls Sie als Dateiendung JPG, PNG oder BMP auswählen, wird Ihre Textdatei als Bild gespeichert (alle Einstellungen für die Speicherung als Bild finden Sie im Menü "Einstellungen > Bildexport"). Falls Sie als Dateiendung XLSX oder ODS angeben, wird Ihre Textdatei als CSV gemäß der aktuellen CSV-Einstellungen interpretiert und als Spreadsheet für eine Office-Anwendung wie Microsoft Excel, LibreOffice Calc oder OpenOffice Calc exportiert. Und falls Sie sich für eine der Dateiendungen DOCX oder XLS entscheiden, wird Ihre Textdatei als Office-Dokument für eine Anwendung wie Microsoft Word, LibreOffice Writer oder OpenOffice Writer exportiert. Alle anderen Dateiendungen speichern als Textdatei.