InfoCenter

Eingabe von Unicode Zeichen

Die Eingabe aller mehr als 140.000 möglichen Unicode-Zeichen kann natürlich nicht einfach mit einer einzelnen Taste über eine herkömmliche Tastatur erfolgen, da Tastaturen immer nur über eine kleine Auswahl der gebräuchlichsten Zeichen verfügen können - für alle erdenklichen anderen Zeichen ist einfach kein Platz vorhanden.

Was aber können wir tun, um auch jedes beliebige andere Zeichen eingeben zu können, das wir nicht auf unserer Tastatur finden? Es gibt dafür mehrere Möglichkeiten, die wir uns im folgenden anschauen werden.

Die vorgestellten Möglichkeiten und Hinweise bezüglich der Eingabe von Unicode-Zeichen sind in die folgenden Abschnitte gegliedert:

Eingabe über den Zeichencode

In vielen Programmen, wie beispielsweise Microsoft Word oder WordPad können Unicode Zeichen direkt über ihren Zeichencode (Code Point) eingegeben werden. Halten Sie dazu die Taste ALT gedrückt und geben Sie über das Num Pad (Nummerntastatur) den dezimalen Code des Zeichens ein. Beispielsweise wäre die Kombination ALT + 142 der Buchstabe Ä oder die Kombination ALT + 8364 das Euro-Zeichen €.

Zu beachten ist, dass die Eingabe über den Zahlenblock (üblicherweise auf der rechten Seite der Tastatur) erfolgen muss (nicht über die Zahlen, die sich auf der Tastatur über den Buchstaben befinden) und die Nummerntastatur dafür eingeschaltet sein muss. Das geht in der Regel über die Taste NUM über dem Nummernblock. Schwieriger ist es auf Laptops, die über keinen gesonderten Nummernblock verfügen. In diesem Fall muss in der Regel die FN-Taste benutzt werden, um auf einen Nummernblock zugreifen zu können, der sich auf anderen Buchstaben der Tastatur befindet.

Die Zeichencodes der Zeichen bekommen Sie aus entsprechenden Tabellen, wie Sie beispielsweise das Unicode Konsortium auf der Seite unicode.org/charts bereithält. Beachten Sie bitte, dass viele dieser Tabellen die Zeichen in hexadezimaler Schreibweise aufführen, die Eingabe aber in dezimaler Schreibweise erfolgen muss, um das korrekte Zeichen darzustellen. Notfalls müssen Sie den hexadezimalen Code dazu umrechnen.

Weiterhin gilt zu beachten dass nicht alle Programme beliebige Zeichencodes unterstützen. In einigen Programmen wie zum Beispiel alten Versionen des Windows Editors werden nur Codes bis 255 unterstützt, alle Codes über 255 werden durch 256 geteilt und das Zeichen ausgegeben, das dem Divisionsrest entspricht. Also zum Beispiel ¼ anstelle des €-Zeichens (8364 MOD 256 = 172).

Natürlich ist die Eingabe über den Zeichencode relativ umständlich, vor allem wenn Tabellen nur für die hexadezimale Schreibweise verfügbar sind und falls Sie bestimmte Zeichen häufig verwenden. Eine verbesserte Möglichkeit besteht darin, die Zeichen entweder direkt aus Zeichentabellen oder Zeichenlisten auszuwählen, die zum Beispiel von allen großen Betriebssystemen zur Verfügung gestellt werden und auch in einigen Programmen wie Microsoft Word, LibreOffice oder OpenOffice direkt enthalten sind. Gleichzeitig bieten diese Programme auch oft die Möglichkeit Tastenkombinationen für häufige Unicodezeichen anzulegen, wie es zum Beispiel mit Microsoft Word möglich ist. Eine Beschreibung dieser Möglichkeiten finden Sie im nächsten Abschnitt "Einfügen über Zeichentabellen".

Eine andere Möglichkeit besteht darin, ein eigenes Tastaturlayout zu erstellen, bei dem Ihre persönlichen und häufig benutzten Zeichen auf einer Tastaturtaste liegen und somit sofort in allen Programmen zur Verfügung stehen. Über diese Möglichkeit werden Sie im übernächsten Abschnitt "Eigenes Tastaturlayout" informiert.

Einfügen über Zeichentabellen

Über die erwähnte Möglichkeit der Eingabe über den Zeichencode hinaus bieten viele Betriebssysteme wie beispielsweise Windows oder macOS sowie einige Programme wie zum Beispiel Microsoft Word, LibreOffice oder OpenOffice die Möglichkeit, Sonderzeichen direkt über Zeichentabellen einzufügen. Damit entfällt die mühsame Suche nach dem richtigen Zeichencode und die Zeichen können bequem kopiert und über die Zwischenablage eingefügt werden.

Um eine Zeichentabelle aufzurufen, öffnen Sie in Windows einfach das vorinstallierte Programm "Zeichentabelle". Unter macOS heißt die Zeichentabelle nur "Zeichen" und kann zum Beispiel über das Menü "Bearbeiten > Emojis und Symbole" aus vielen Programmen aufgerufen werden (meist werden nach dem Öffnen nur Emojis angezeigt und die Ansicht aller Zeichen muss über das Symbol oben rechts aufgeklappt werden). In Programmen wie Office-Anwendungen und anderen Textverarbeitungsprogrammen rufen Sie die Tabelle in der Regel über das Menü "Einfügen > Sonderzeichen" oder "Einfügen > Symbole" auf, sofern das jeweilige Programm eine Zeichentabelle bereit stellt.

Natürlich sieht die Zeichentabelle je nach Betriebssystem und Programm unterschiedlich aus. In der Regel handelt es sich aber um ein Fenster, in dem alle verfügbaren Zeichen oder eine Auswahl von Zeichen aufgeführt sind. Entweder gehen Sie alle dieser Zeichen durch bis Sie Ihr gewünschtes Zeichen gefunden haben oder Sie grenzen ihre Suche ein, indem Sie die Suchfunktion nutzen oder bestimmte Zeichen (zum Beispiel Latin, mathematische Symbole, Satzzeichen oder kyrillische Buchstaben) in den Optionen auswählen. Die zur Verfügung stehenden Filter unterscheiden sich natürlich auch von der jeweiligen Implementierung der Zeichentabelle. Wenn Sie Ihr gesuchtes Zeichen gefunden haben, können Sie es in der Regel durch Anklicken in die Zwischenablage kopieren oder direkt einfügen.

Je nach Umsetzung können Sie die Zeichentabelle auch dazu verwenden, sich einen Überblick darüber zu verschaffen, welche Zeichen in welchen Schriftarten vorhanden sind. Auch besteht oftmals je nach System und Programm in diesem Fenster die Möglichkeit, Tastenkombinationen für einzelne Sonderzeichen festzulegen. Damit können Sie auf häufig benutzte Zeichen schneller und einfacher zugreifen anstatt immer die Zeichentabelle aufrufen zu müssen.

Zu beachten ist, dass manche dieser Zeichentabellen nicht alle Unicode-Zeichen anzeigen. Oft sind die Zeichen nur auf die in der ausgewählten Schriftart enthaltenen Glyphen beschränkt, andere Zeichentabellen zeigen nur die Zeichen aus der Basic Multilingual Plane (BMP). Ein Programm, das eine Zeichentabelle mit wirklich allen Unicode-Zeichen anzeigt ist Babelmap das im gleichnamigen Abschnitt vorgestellt wird.

Zeichen ohne Zeichentabellen finden

Falls Sie keine Zeichentabelle zur Verfügung haben oder die Zeichentabelle Sie nicht weiter bringt, können Sie auch einfach nach dem Namen eines Zeichens oder Symbols im Internet suchen. Sie werden genug Seiten finden, die Zeichen und deren Unicode-Codepoints auflisten. Die gefundenen Zeichen können direkt mit STRG + C und STRG + V aus dem Browser in eine andere Anwendung kopiert werden.

Ein weiterer Tipp ist, sich eine eigene Zeichentabelle anzulegen. Dazu reicht eine einfache Textdatei oder ein Office-Dokument mit einer Sammlung Ihrer häufig benutzten Unicode-Zeichen. Jedes Mal wenn Sie auf ein neues Zeichen stoßen, das Sie abermals verwenden möchten, kopieren Sie das Zeichen einfach in die Datei. Und wenn Sie Zeichen benötigen, die Sie schon in Ihrer Datei haben, müssen Sie nicht mehr aufwendig suchen sondern können direkt die Zeichen aus der Datei kopieren und wiederverwenden.

Eigenes Tastaturlayout

Eine elegante Möglichkeit, häufig benutzte Unicode-Zeichen verfügbar zu machen und in Programmen zu verwenden ist die Erstellung eines eigenen Tastaturlayouts. Das bedeutet, dass Sie selbst bestimmen, wie die Tasten Ihrer Tastatur belegt sind und gegebenenfalls zwischen mehreren Tastaturbelegungen wechseln können. Beispielsweise können Sie das Copyright-Zeichen einfach auf die Taste ALT GR + C legen oder auch jede andere Taste oder Tastenkombination für sich umstellen. Das erspart viel Zeit für das Suchen in Zeichentabellen und ist komfortabler als jede Menge Codes auswendig zu lernen - insbesondere wenn Sie immer wieder dieselben Unicode-Zeichen verwenden.

Ihr eigenes Tastaturlayout können Sie bequem mit Programmen wie dem Microsoft Keyboad Layout Creator (hier gehts zum Download) oder dem Keyboard Layout Manager erstellen. Beide Programme erfüllen im Grunde genommen den selben Zweck, der Keyboard Layout Manager ist nur ein viel schlankeres Programm als die Alternative von Microsoft.

Mit den Programmen ist es möglich, vorhandene Keyboad-Layouts anzupassen oder ganz neue anzulegen. Automatisch erstellt das Programm Ihnen das entsprechende Installationspaket für Ihre individuelle Tastaturbelegung.

Eingabe in HTML und XML

Falls Sie ein bestimmtes Unicode Zeichen in HTML oder XML verwenden möchten, können Sie auch dafür direkt den Code des Zeichens verwenden. Für dezimale Codes lautet die Notation � und für hexadezimale Codes lautet sie �. Der Code kann direkt in dieser Form in den HTML-Quellcode oder die XML-Datei eingetragen werden, wobei das 0000 durch die Nummer des Unicode Zeichens in dezimaler beziehungsweise in hexadezimaler Schreibweise ersetzt werden muss. Also zum Beispiel © oder © für das Copyright-Zeichen ©.

In HTML besteht noch eine weitere Möglichkeit, Unicode- und Sonderzeichen einzugeben. Diese nennt sich benannte Zeichen (Named Entities oder HTML Entities), was bedeutet, dass es für einige Zeichen Namen gibt, die in der Form &name; in die HTML Datei eingegeben werden können. Für Ä kann man zum Beispiel die Kodierung Ä (für A-Umlaut - ä ist das klein geschriebene ä) verwenden, © steht für das Copyright-Zeichen ©, € für das Euro-Währungszeichen € oder   für ein nicht umbrechendes beziehungsweise geschütztes Leerzeichen (non breaking space). Eine Liste der entsprechenden Zeichen und Kodierungen erhalten Sie hier. Jedoch hat natürlich nicht jedes beliebige Unicode-Zeichen eine eigene HTML-Entity.

Eine besondere Bedeutung haben benannte Zeichen in HTML und XML auch für den Fall, dass Zeichen mit einer Bedeutung innerhalb der XML-Syntax als sichtbarer Text in den HTML-Quelltext oder in XML-Dateien geschrieben werden sollen. Konkret geht es also um die spitzen Klammern < und > sowie um das Anführungszeichen " und das &-Zeichen, die problemlos als &lt; (lower than = kleiner als), &gt; (greater than = größer als), &quot; (quote) und &amp; (ampersand) geschrieben werden können ohne die XML-Syntax zu stören.

Allerdings verliert die Möglichkeit, Unicode-Zeichen über ihren Zeichencode oder mit der Hilfe von benannten Zeichen in HTML- oder XML-Dateien einzufügen in der heutigen Zeit immer mehr an Bedeutung. Anfang der 2000er Jahre nutzten die meisten Websites ASCII- oder ANSI-Kodierungen wie zum Beispiel Latin-1, mit denen nur eine begrenzte Anzahl von Zeichen direkt darstellbar war. Sollten Unicode-Zeichen, die außerhalb des unterstützten Code-Bereichs lagen eingebunden werden, war man auf benannte Zeichen oder andere Möglichkeiten angewiesen. In der heutigen Zeit nutzen fast alle Webseiten die Kodierung UTF-8 mit der alle Unicode-Zeichen dargestellt werden können. Daher sind die alten Hilfsmittel in den meisten Fällen heute nicht mehr nötig, da die Zeichen direkt in die Datei geschrieben werden können. Natürlich mit der Ausnahme von Zeichen, die eine Bedeutung in der Syntax haben. Auch bei Zeichen, die schwer im Code als solche erkennbar sind, wie zum Beispiel geschützte Leerzeichen oder bedingte Trennstriche, ist die Nutzung noch immer sinnvoll.

Unicode in Microsoft Word, WordPad und LibreOffice

Ab Microsoft Word 2002 kann man ein Unicode-Zeichen direkt über seinen Code eingeben. Dazu gibt man einfach den hexadezimalen Code des Zeichens direkt als Text in das Word Dokument ein und drückt anschließend die Taste ALT + C (in Dialogfeldern ALT + X). Anschließend erscheint automatisch das geforderte Unicode-Zeichen, das sich hinter diesem Zeichencode verbirgt. Dieselbe Tastenkombination kann auch dazu verwendet werden, um den Code des Zeichens, das gerade vor dem Cursor steht, anzeigen zu lassen. Mit dem wiederholten Drücken von ALT + C lässt sich so zwischen dem Code und dem Zeichen hin und her wechseln.

Ähnlich funktioniert es mit der Anwendung WordPad von Microsoft, die für gewöhnlich auf Windows-Systemen vorinstalliert ist. Hier müssen wir aber stattdessen die Tastenkombination ALT + X verwenden um Unicode-Zeichencodes in Unicode-Zeichen zu verwandeln oder Unicode-Zeichen in ihre Zeichencodes. Bis auf die abweichende Tastenkombination funktioniert die Funktion aber genauso wie in Microsoft Word.

Auch im Office-Programm "Writer" von LibreOffice können wir das Tastaturkürzel ALT + X verwenden. Der einzige Unterschied im Vergleich zu Microsoft Word und WordPad besteht darin, dass LibreOffice den hexadezimalen Zeichencode in einer anderen Form anzeigt: Während Microsoft Word und WordPad den Code für das Euro-Zeichen (€) in der Form "20AC" anzeigen, nutzt LibreOffice die Form "U+20AC". OpenOffice bietet aktuell eine derartige Funktion leider nicht an.

Eine Tabelle aller Zeichencodes erhalten Sie auf der Seite unicode.org/charts des Unicode Konsortiums. Darüber hinaus können in den Office-Programmen natürlich auch Zeichentabellen für die Eingabe von Unicode-Zeichen genutzt werden, die über das Menü "Einfügen > Sonderzeichen" aufgerufen werden können.

BabelMap

Abschließend möchten wir Ihnen noch ein nützliches Programm vorstellen, das ebenfalls bei der Eingabe von Unicode-Zeichen behilflich sein kann. Es heißt BabelMap und man kann es kostenlos auf der Seite babelstone.co.uk herunterladen.

BabelMap ermöglicht es, komfortabel Unicode-Zeichen nach ihrer Nummer beziehungsweise ihrem Code Point oder ihrem Namen zu suchen, anzuzeigen und über die Zwischenablage in einer anderen Anwendung zu verwenden. Im Gegensatz zu manchen anderen Zeichentabellen zeigt BabelMap nicht nur die Zeichen aus der Basic Multilingual Plane (BMP) sondern unterstützt alle Unicode Planes (BMP, SMP, SIP, TIP, SSP, SPUA-A, SPUA-B) und ermöglicht damit durch alle vorhandenen Unicode-Zeichen zu browsen. Hinzu kommen zahlreiche Funktionen für die Suche von Zeichen und die Analyse von Schriftarten bezüglich ihrer Unterstützung für Zeichen oder Zeichenblöcke, die das Programm zu einem nützlichen Tool machen und die über die Möglichkeiten einer herkömmlichen Zeichentabelle weit hinaus gehen. Eine Erklärung aller Funktionen finden Sie auf der Website von BabelMap.

Darstellbarkeit von Zeichen

Unabhängig davon, welche der vorgestellten Methoden Sie für die Eingabe von Unicode-Zeichen anwenden, hängt das Ergebnis allerdings auch immer davon ab, ob das betreffende Zeichen auch mit der verwendeten Schriftart dargestellt werden kann. Insbesondere ungewöhnliche oder ungebräuchliche Zeichen können hier schnell zu Problemen führen.

Der Hintergrund dieser Problematik ist, dass vereinfachend gesagt jede Schriftart eine Sammlung von Bildern ist, die in der jeweiligen Schriftdatei gespeichert sind. Diese Bilder nennt man Glyphen. Jeder dieser Glyphen ist ein Zeichen zugeordnet, also zum Beispiel eine Glyphe für das Zeichen "A", eine Glyphe für das Zeichen "a", eine Glyphe für das Zeichen "." und so weiter. Schreiben wir mit einer Schriftart nun ein Zeichen, versucht das Betriebssystem oder das verwendete Programm aus der Schriftdatei die Glyphe für das entsprechende Zeichen zu holen und dieses auszugeben. Ob das gelingt hängt davon ab, ob in der betreffenden Schriftart auch eine Glyphe für das gewünschte Zeichen vorhanden ist.

Ist dies nicht der Fall, kann es sein, dass das Programm versucht, das Zeichen mit einer anderen Schriftart darzustellen (die eine Glyphe für das Zeichen hat) oder es wird ein Ersatzsymbol statt dem Zeichen angezeigt. Auch dieses Ersatzsymbol ist eine Glyphe, die innerhalb einer Schriftdatei gespeichert ist (die .notdef Glyphe). Typischerweise ist dies ein leeres Kästchen, ein Kästchen mit einem X oder ein Kästchen mit einem Fragezeichen. Welche Schriftart möglicherweise als Ersatz verwendet wird, hängt von dem Betriebssystem und der Software ab. Manche Programme nutzen nur bestimmte Schriftarten als Fallback, andere können nach einer geeigneten Glyphe in allen installierten Schriftarten suchen.

Gängige Schriftdateiformate wie TrueType (TTF) oder OpenType (OTF) können insgesamt maximal nur 65.536 Glyphen enthalten. Demgegenüber stehen über 140.000 Unicode-Schriftzeichen. Das heißt, selbst wenn sich ein Schriftdesigner die Arbeit macht, eine Schrift mit der maximal möglichen Anzahl von Glyphen herzustellen, wird die Schrift immer noch nicht einmal die Hälfte aller möglichen Unicode-Zeichen enthalten. Die meisten verfügbaren Schriftarten enthalten sehr viel weniger Zeichen und unterstützen nur wenige Schriftsysteme, viele Schriften enthalten auch nur eine Auswahl von Zeichen eines Schriftsystems. Welche Glyphen für welche Zeichen eine Schriftart enthält können Sie zum Beispiel über Zeichentabellen ermitteln.