Unicode

Einführung

Nach und nach wurden alle Programme von Stefan Trost Media um eine Unterstützung von Unicode erweitert, um die internationale Kompatibilität jeder Software zu gewährleisten. Was aber ist Unicode überhaupt und was gibt es beim Umgang mit Unicode zu beachten? Auf diesen Seiten erhalten Sie alle wichtigen Informationen zu Unicode, den Möglichkeiten Texte mit Unicode in verschiedenen Formaten zu speichern und was beim Thema Schriftarten bei Unicode zu beachten ist. Wie Sie Unicode Zeichen eingeben, erfahren Sie auf der Seite Eingabe. Darüberhinaus bietet das Unicode Lexikon die Möglichkeit, sich über die verwendeten Begriffe und Formate zu informieren.

Was ist Unicode?

Entgegen vieler Annahmen ist Unicode weder eine bestimmte Schriftart noch irgendeine Programmiersprache. Vielmehr ist Unicode ein internationaler Standard, in dem jedem Zeichen ein inidividueller Code zugeordnet ist. Auf lange Sicht sollen irgendwann weltweit alle Schriftzeichen und Textelemente aller bekannter Zeichensysteme eine Entsprechung in Unicode finden, womit viele Vorteile gegenüber anderen Kodierungen einhergehen.

Während die Speicherung eines Textes im herkömmlichen ASCII-Format lediglich 128 verschiedene Zeichen erlaubt (256 im ANSI-Format), ist es mit Unicode theoretisch möglich, in einem Text und einer Datei sämtliche mögliche Zeichen aller Schriftsysteme auf einmal zu speichern. Hinzu kommt, dass im ASCII und ANSI Format viele der Zeichen bereits vordefinierte Steuerzeichen sind, so dass noch weniger unterschiedliche Zeichen darstellbar sind. Gerade im internationalen Austausch von Dateien oder der Kompatibilität von Software, die auf weltweit möglichst vielen Rechneren lauffähig sein soll, wird damit Unicode eine besondere Bedeutung zuteil.

Entwickelt wird und wurde der Unicode Standard von dem 1991 gegründeten Unicode Consortium. Das Unicode Consortium ist eine gemeinnützige Organisation, das ausschließlich über Mitgliedsbeiträge finanziert wird. Inzwischen gehören fast alle großen Softwareunternehmen wie Google, Microsoft, Apple und IBM dem Unicode Konsortium an. Das Konsortium arbeitet eng mit der Internationalen Organisation für Normung (ISO) zusammen. Die ISO gibt die Norm ISO 10646 heraus, die vollkommen mit der Unicode-Kodierung übereinstimmt.

Inzwischen enthält Unicode bereits Codes für mehr als 100.000 Schriftzeichen bereit, so dass sich der gesamte Coderaum nicht mehr als Zeichen innerhalb einer Schriftdatei einbetten lässt. In den gängisten Schriftdateiformaten TrueType und OpenType lassen sich nämlich maximal nur 65.536 Glyphen speichern. Ohnehin enthalten die meisten Schriftarten im Vergleich zu den Möglichkeiten von Unicode nur sehr wenige Zeichen und Zeichensätze (Mehr zu diesem Thema unter dem Punkt Schriften).

Die Speicherung von Unicode kann in verschiedenen Formaten geschehen, die verschiedene Vor- und Nachteile haben, so dass entsprechend dem Verwendungszweck entschieden werden muss, welches Format am Besten ist. Der Bereich Formate auf dieser Seite beschäftigt sich mit diesem Thema und den unterschiedlichen Unicode Transformation Formaten (UTF). Trotzdem ist es wichtig festzuhalten, dass jeder einzelne Code Point nur einem bestimmten Zeichen entspricht und einmal festgelegte Zeichen sich nie mehr ändern dürfen, um die Kompatibilität zu gewährleisten. Mehr Informationen zu diesem Thema erhalten Sie hier. Die unterschiedlichen Formate beziehen sich nur auf die unterschiedliche Representation ein und desselben Code Points.

Zuletzt erhalten Sie unter dem Punkt Software eine Auflistung aller Software von Stefan Trost Media, die mit Unicode umgehen kann und welche Funktionen, die mit Unicode zusammenhängen, mit dieser Software ausgeführt werden kann. Auf dieser Seite erhalten Sie auch die Gelegenheit, gleich zur Beschreibung und zum Download der Software weitergeleitet zu werden.