TextKonverter

Textdateien in mehrere neue Dateien trennen

Wenn wir den Inhalt einer Textdatei auf mehrere neue Dateien aufteilen möchten, kann uns eine Automatisierung dieser Aufgabe viel Arbeit und vor allem viel Zeit ersparen. Insbesondere wenn wir eine sehr große Anzahl von Dateien spalten möchten und die Trennung immer nach dem gleichen Muster vollzogen werden soll, ist die Aufgabe einfach zu automatisieren und die Ersparnis besonders groß. In diesem Tutorial möchten wir Ihnen einen einfachen Weg zeigen, wie Sie ohne viel Aufwand einfach zu einem schnellen Ergebnis kommen. Wir nutzen dafür das Programm TextKonverter.

Generelle Vorgehensweise

Bevor wir uns die einzelnen Möglichkeiten der Trennung sowie die dazugehörigen Optionen detailliert ansehen, möchten wir zuerst einen Blick auf die generelle Vorgehensweise werfen, wie Sie den TextKonverter dazu nutzen können, einzelne Dateien in mehrere neue Dateien zu splitten:

In dieser generellen Beschreibung der Vorgehensweise sind wir noch nicht darauf eingegangen, welche Kriterien wir für die Trennung auswählen können. Darauf möchten wir im nächsten Abschnitt eingehen.

Möglichkeiten der Trennung

Der TextKonverter bietet Ihnen 3 verschiedene Möglichkeiten beziehungsweise Kriterien an, nach denen Sie Ihre Dateien trennen können. Diese Möglichkeiten können auch miteinander kombiniert werden:

Dateien an einem Text oder an einem regulärem Ausdruck trennen

Mit dieser Option können Sie Ihre Originaldatei an einem bestimmten Text trennen. Das heißt, nach jedem Auftreten dieses Suchtextes wird eine neue Datei begonnen. Kommt Ihr Text zweimal in der Originaldatei vor, werden entsprechend drei neue Dateien gespeichert (eine mit dem Text, der in der Originaldatei vor dem ersten Vorkommen des Suchtextes steht, eine mit dem Text zwischen dem ersten Vorkommen und dem zweiten Vorkommen des Suchtextes sowie eine dritte Datei mit dem Text, der in der Originaldatei hinter dem zweiten Vorkommen des Suchtextes steht).

Dabei spielt es keine Rolle, ob Ihr Suchtext aus nur einem Zeichen, aus mehreren Wörtern oder sogar mehreren Zeilen besteht. Auch muss es sich bei dem Suchtext nicht um einen statischen Text handeln: Wenn Sie die Option "Als regulären Ausdruck interpretieren" unter der Textbox aktivieren, können Sie an dieser Stelle auch mit regulären Ausdrücken arbeiten. Ein einfaches Beispiel wäre der reguläre Ausdruck [0-9] der eine Trennung an einer beliebigen Ziffer durchführt.

Wenn Sie den Suchtext, an dem getrennt wurde, in den neuen Dateien erhalten möchten, können Sie eine oder beide der Optionen "Suchtext am Anfang jeder neuen Datei erhalten" oder "Suchtext am Ende jeder neuen Datei erhalten" aktivieren. Wenn Sie keine der beiden Optionen aktivieren, wird der Suchtext nicht mehr in den neuen Dateien auftauchen.

Eine weitere Option ermöglicht es, nicht direkt am Suchtext zu trennen sondern erst am nächsten Zeilenumbruch. Wenn die Option "Am nächsten Zeilenumbruch trennen" aktiviert ist, bleiben zusammengehörige Wörter eines Abschnitts in der selben Datei und werden nicht voneinander getrennt. Damit können Sie zum Beispiel nach Abschnitten trennen, die bestimmte Wörter enthalten, ohne die jeweiligen Abschnitte auseinander zu reißen.

Dateien an Zeilenumbrüchen trennen

Mit dieser Option können Sie die Originaldatei an Ihren Zeilenumbrüchen trennen. Das heißt, je Zeile der Originaldatei wird eine neue Datei angelegt, die den Text der jeweiligen Zeile enthält.

Für diese Option gelten die Einstellungen unter "Aktionen > Dateien > Zeilenumbruchtyp". Standardmäßig, also wenn Sie hier keine Änderungen vornehmen, wird der Zeilenumbruchtyp der Originaldatei automatisch erkannt und Sie erhalten das Ergebnis, welches man allgemeinhin erwarten würde. Ausschlaggebend ist dann der typische Zeilenumbruch, den Sie aus einem durchschnittlichen Texteditor kennen. Jedoch können im TextKonverter auch andere Kriterien für einen Zeilenumbruch festgelegt werden. So ist es beispielsweise möglich, beliebige Zeichen, Zeichenketten oder auch mehrere verschiedene Zeichen als Zeilenumbruch zu definieren. Dadurch erhalten Sie weitere Möglichkeiten, Ihre Dateien flexibel zu trennen. Wie das funktioniert erfahren Sie in den Erläuterungen zu benutzerdefinierten Zeilenumbrüchen an einem oder an mehreren Zeichen.

Dateien nach Anzahl von Zeichen trennen

Mit dieser Option können Sie Ihre Originaldatei in Stücke mit einer frei wählbaren Anzahl beziehungsweise Länge von Zeichen zerschneiden. Sie können einen beliebigen Zahlenwert in das Feld eingeben. Wenn Ihre Ausgangsdatei beispielsweise 2500 Zeichen hat und Sie einen Wert von 1000 Zeichen angeben, wird Ihre Ausgangsdatei in 3 Teile gesplittet: Die erste neue Datei enthält die ersten 1000 Zeichen der Originaldatei, die zweite neue Datei enthält die zweiten 1000 Zeichen der Ausgangsdatei und die dritte neue Datei enthält die restlichen 500 Zeichen. Falls Ihre Ausgangsdatei weniger Zeichen als den angegebenen Wert enthält, findet keine Trennung statt und die Originaldatei bleibt mit ihrem Inhalt erhalten.

Diese Option können Sie auch dazu nutzen, den Text aller erstellten Dateien auf eine maximale Anzahl von Zeichen zu begrenzen. Zum Beispiel wenn Sie diese Option mit den anderen Optionen kombinieren.

Kombination mehrerer Kriterien

Es muss mindestens eine dieser vorgestellten Optionen aktiviert sein, um die Funktion ausführen zu können. Auch die Aktivierung von mehreren dieser Optionen ist möglich. In diesem Fall wird zuerst nach dem Kriterium der ersten aktivierten Option getrennt. Anschließend werden die resultierenden Teile erneut nach dem Kriterium der zweiten aktivierten Option getrennt und so weiter.

Wenn Sie zum Beispiel sowohl die Option für eine Trennung an Zeilenumbrüchen als auch die Option für eine Trennung nach einer bestimmten Anzahl von Zeichen aktivieren, wird als erstes an allen Zeilenumbrüchen getrennt. Anschließend werden alle Teile (hier entsprechend die Zeilen) durchgegangen und falls eine Zeile aus mehr als den erlaubten Zeichen besteht, wird innerhalb der betreffenden Zeile erneut gemäß dem zweiten Kriterium getrennt.

Allgemeine Optionen für alle Trennungen

Unter den 3 Optionen, mit denen Sie die Kriterien für die Trennung der Dateien festlegen können, finden Sie weitere allgemeine Optionen, die unabhängig von den Kriterien immer angewendet werden:

Speicherung und Konfiguration der Dateinamen der Teile

In welchem Ordner und unter welchem Namen die neuen Dateien gespeichert werden sollen, können Sie rechts unten im Hauptfenster des TextKonverters festlegen. Hier können Sie einen beliebigen Ordner auswählen und einen Basisnamen für alle Dateien bestimmen. Mit der Option "beibehalten" kann dies auch der Ordner oder Name der Originaldatei sein. Die einzelnen Teile beziehungsweise Dateien werden schließlich der Reihe nach durchnummeriert, indem an den angegebenen Namen eine fortlaufende Nummer angehängt wird.

Auch wenn wir in diesem Tutorial manchmal nur von einer Datei als Ausgangslage oder Originaldatei sprechen, kann die Funktion natürlich trotzdem für mehrere Dateien gleichzeitig angewendet werden. Das heißt, falls Sie mehrere Dateien in Ihrer Dateiliste haben, wird jede Datei unabhängig voneinander einzeln getrennt.

Mehrere Textdateien miteinander verbinden

Neben der Möglichkeit, einzelne Dateien in mehrere neue Dateien zu trennen, beherrscht der TextKonverter übrigens auch den umgekehrten Weg: Wie Sie eine beliebige Anzahl von - zum Beispiel auseinandergerissenen - Dateien wieder zusammenfügen können, erfahren Sie im Tutorial über das Zusammenfügen von mehreren Textdateien.