-
Verfahren und Anordnung zur Eingabe von chinesischen
-
Schriftzeichen in ein Endgerät Die Erfindung bezieht sich auf ein
Verfahren zur Eingabe von chinesischen Schriftzeichen in ein Endgerät gemäß dem
Oberbegriff des Patentanspruchs 1. Weiterhin bezieht sich die Erfindung auf eine
Anordnung zur Durchführung des Verfahrens.
-
Es ist bereits allgemein bekannt, chinesische Schriftzeichen mit Hilfe
von Wörtern in ausgeschriebener Pinyin-Umschrift unter Verwendung von Tastaturen
einzugeben. Durch die Umschrift werden die Silben ähnlich einer Lautschrift durch
Folgen von lateinischen Buchstaben eingegeben.
-
Die chinesischen Wörter setzen sich aus Silben zusammen, die jeweils
aus einem Anlaut und aus einer Endung bestehen. Dabei kommen etwa 410 verschiedene
Silben vor, die jeweils aus einem der 25 möglichen Anlaute und einer der 34 möglichen
Endungen gebildet sind. Jede Silbe wird im Chinesischen durch ein Schriftzeichen
aus einer der Silbe zugeordneten Mehrzahl von Schriftzeichen (Homophone) wiedergegeben.
Wörter sind damit Folgen von einem oder mehreren Schriftzeichen und damit von einer
oder mehreren Silben.
-
Es wäre denkbar, die chinesischen Schriftzeichen mit Tastaturen einzugeben,
die in zwei Ebenen belegt sind und in einer Ebene die Anlaute und in einer zweiten
Ebene die Endungen enthalten. Die Umschaltung von einer Belegung zur anderen kann
dabei selbsttätig erfolgen, da jeweils
Anlaut und Endung abwechselnd
eingegeben werden. Soweit die Wörter durch Anschlagen der Leertaste getrennt werden,
bereitet die Zerlegung der Wörter in Silben keine Schwierigkeiten, da jeweils zwei
Tastenanschläge einer Silbe zuzuordnen sind.
-
Falls die chinesischen Schriftzeichen mittels einer üblichen internationalen
Tastatur mit lateinischen Buchstaben durch die ausgeschriebene Umschrift eingegeben
werden, so ist eine einfache Zerlegung der Wörter in einzelne Silben nicht ohne
weiteres möglich, da Anlaute aus null bis zwei und Endungen aus einem bis vier Buchstaben
bestehen können.
-
Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und
eine Anordnung anzugeben, mit deren Hilfe es möglich ist, chinesische Wörter, die
unter Verwendung der ausgeschriebenen Umschrift eingegeben werden, selbsttätig in
einzelne Silben aufzuteilen.
-
Erfindungsgemäß wird die Aufgabe bei dem Verfahren der eingangs genannten
Art durch die im kennzeichnenden Teil des Patentanspruchs 1 angegebenen Merkmale
gelöst.
-
Das Verfahren gemaß der Erfindung hat den Vorteil, daß vorhandene
übliche internationale Tastaturen ohne wesentliche Änderungen auch für die Eingabe
chinesischer Schriftzeichen verwendet werden können und daß die Eingabe einen geringen
Bedienungsaufwand erfordert.
-
Um Mehrdeutigkeiten bei der Zerlegung der Wörter in Silben zu vermeiden,
ist es zweckmäßig, wenn an denjenigen Stellen, an denen Mehrdeutigkeiten auftreten
können, Trennzeichen eingefügt werden. Diese Trennzeichen können beispielsweise
das Zeichen Itl'l oder das Zeichen ~-~ sein.
-
Für eine Weiterverarbeitung ist es günstig, wenn jeder Silbe eine
Silbenkennzahl zugeordnet wird und das Wort in eine eindeutige Folge von Silbenkennzahlen
übersetzt wird.
-
Die Silbenkennzahlen werden zweckmäßigerweise den alphabetisch geordneten
vorkommenden Silben zugeordnet.
-
Eine vorteilhafte Anordnung zur Durchführung des Verfahrens ist dadurch
gekennzeichnet, daß ein Speicher vorgesehen ist, in dem alle üblichen Silben gespeichert
sind und daß eine Steuereinheit vorgesehen ist, die nach jeder Eingabe eines Zeichens
durch Vergleich mit in dem Speicher gespeicherten Silben prüft, ob eine Silbe eindeutig
als solche erkannt wird und die andernfalls das jeweils nachfolgende Zeichen berücksichtigt,
um das Wort in Silben zu trennen.
-
Zweckmäßigerweise ist die Steuereinheit derart ausgebildet, daß sie
nach der Eingabe eines Trennzeichens die unmittelbar vorhergehende Silbe unabhängig
von den nachfolgenden Buchstaben abschleißt.
-
In dem Speicher sind für eine Weiterverarbeitung den Silben die Silbenkennungen
zugeordnet und nach dem eindeutigen Vorliegen einer Silbe liest die Steuereinheit
die zugehörige Silbenkennung aus dem Speicher aus.
-
Die im Speicher gespeicherten Silbenkennzahlen entsprechen der alphabetischen
Ordnung der vorkommenden Silben.
-
Im folgenden werden das Verfahren gemäß der Erfindung und eine Anordnung
zur Durchführung des Verfahrens anhand von Zeichnungen näher erläutert. Es zeigen
Fig.
1 ein Blockschaltbild einer Anordnung zur Durchführung des Verfahrens, Fig. 2 eine
Darstellung von drei Wörtern durch chinesische Schriftzei-chen.
-
Die in Fig. 1 dargestellte Anordnung enthält eine Tastatur TA, die
im wesentlichen als übliche internationale Tastatur mit Tasten für die Eingabe lateinischer
Buchstaben und für die Eingabe von Ziffern ausgebildet ist. Die Tastatur TA ist
an einer Steuereinheit ST angeschlossen, die vorzugsweise einen oder mehrere Mikrorechner
enthält. Die Steuereinheit ST ist mit einem Speicher SP verbunden, in dem 410 in
Umschrift dargestellte und binärcodierte chinesische Silben gespeichert sind. Zusätzlich
sind in dem Speicher SP den Silben Silbenkennzahlen zugeordnet, die der alphabetischen
Ordnung der vorkommenden Silben entsprechen. Die Steuereinheit ST ist weiterhin
mit einer einen Bildschirm BS enthaltenden Anzeigeeinheit AE verbunden und kann
auch mit einem Drucker DR verbunden sein. Schließlich ist sie mit einer Verarbeitungseinheit
VE verbunden, der die Silbenkennzahlen zugeführt werden und die gemeinsam mit den
vorstehend erwähnten Teilen ein Endgerät für ein Textsystem, eine Druck- oder Schreibeinrichtung,
einen Rechner oder ein an eine Fernleitung FL angeschlossenes Telekommunikationsendgerät
darstellt. Insbesondere sind in der Verarbeitungseinheit VE Einrichtungen vorgesehen,
die eine Zuordnung der Silben zu den chinesischen Zeichen durchführt, da jeweils
einer Silbe jeweils eine Vielzahl von chinesischen Zeichen, die gleich ausgesprochen
werden oder zumindest in der Umschrift gleich dargestellt werden, zugeordnet werden
kann.
-
Mittels der Tastatur TA werden die chinesischen Wörter
unter
Verwendung der Pinyin-Umschrift eingegeben und die Steuereinheit ST trennt mit Hilfe
des Speichers SP selbsttätig die eingegebenen Wörter in die einzelnen Silben und
ordnet den Silben die Silbenkennzahlen zu, die sie an die Verarbeitungseinheit VE
abgibt. Zur Kontrolle können die eingegebenen Wörter und/oder die Silben und/oder
die Silbenkennzahlen und/oder die entsprechenden chinesischen Schriftzeichen an
dem Bildschirm BS oder an dem Drucker DR ausgegeben werden.
-
Jede Silbe wird aus 25 möglichen Anlauten und 34 möglichen Endungen
gebildet und die Anlaute können aus null bis zwei und die Endungen können aus einem
bis vier Buchstaben bestehen. Unter Verwendung der Steuereinheit ST und des Speichers
SP werden nun bei den eingegebenen Wörtern die entsprechenden Silben selbsttätig
ermittelt, wobei die eingegebenen Buchstaben folgen jeweils mit im Speicher SP gespeicherten
Silben verglichen werden und bei einem eindeutigen Erkennen einer Silbe wird diese
mit einer ebenfalls gespeicherten Silbenkennzahl versehen und an die Verarbeitungseinheit
VE abgegeben. Die eingegebenen Buchstaben, die sowohl zu einer betrachteten Silbe
wie auch der nächsten Silbe zugeordnet werden können, werden dabei immer der jeweils
betrachteten Silbe zugeordnet.
-
In dem Speicher SP sind die Silben entsprechend ihrer alphabetischen
Ordnung eingespeichert und jeder Silbe ist in aufsteigender Reihenfolge eine Zahl
von 1 bis 410 zugeordnet. Eine Zuordnungsliste zwischen den Silbenkennzahlen und
den Silben ist vereinfacht in Tabelle 1 dargestellt und die Tabelle 2 zeigt umgekehrt
die Zuordnung zwischen den Silben und den Silbenkennzahlen.
-
Tabelle 1
0 1 2 3 4 5 6 7 8 0 |
O a ai an ang ao ba bai ban bang |
10 bao bei ben beng bi bian biao bie bin bin |
20 bo bu ca cai can can cao ce |
190 m ma ma inaö mang mao me .. .. mu |
210 na nai nan nan nao .. .. |
410 zuo |
Tabelle 2
b c d m n z |
a 1 6 22 57 191 210 374 |
ai 2 7 23 58 192 211 375 |
an 3 8 24 59 193 212 376 |
an 4 9 25 60 194 213 377 |
ao 5 10 26 61 195 214 378 |
e 79 0 27 62 196 215 379 |
ei 80 11 0 63 0 197 216 380 |
üe 0 0 0 0 0 232 |
Falls beispielsweise durch die Umschrift das chinesische Wort "babaocai" eingegeben
wird, prüft die Steuereinheit
ST nach der Eingabe des Buchstabens
b, ob bereits eine vollständige Silbe vorhanden ist. Da nach den Zuordnung listen
nach den Tabellen 1 und 2 der Buchstabe "b" noch keine Silbe bildet, wird nach der
Eingabe des nächsten Buchstabens "a" erneut geprüft, ob eine Silbe eindeutig erkannt
werden kann. Dies ist im vorliegenden Fall immer noch nicht möglich, da zwar die
Silbe ba eine unter der Silbenkennzahl 6 gespeicherte Silbe sein kann, jedoch können
noch weitere Buchstaben folgen, so daß es sich lediglich um einen Teil der Silben
"bai"," ban, bang oder bao handeln kann. Erst mit der Eingabe des nächsten Buchstabens
b erkennt die Steuereinheit ST, da in der Zuordnungsliste im Speicher SP keine Silbe
bab vorhanden ist, daß die erste Silbe "ba" lautet.
-
Die Silbe wird als abgeschlossen gekennzeichnet und ihr wird die Silbenkennzahl
6 zugeordnet. Wenn anschließend nach dem Buchstaben "b" der Buchstabe a eingegeben
wird, wird wiederum geprüft, ob die Silbe vollständig ist und es muß in diesem Fall
wiederum der nächste Buchstabe abgewartet werden. Wenn nun als nächstes der Buchstabe
o eingegeben wird, erkennt die Steuereinheit, daß die Silbe bao vollständig ist,
da in der Zuordnungsliste im Speicher SP keine weiteren Silben gespeichert sind,
die mit bao beginnen. Deshalb wird auch diese Silbe nun abgeschlossen und entsprechend
der Zuordnungsliste nach Tabelle 1 oder 2 mit der Silbenkennzahl 10 versehen. Nach
der Eingabe des nachfolgenden Buchstabens "c" kann wieder keine Silbe erkannt werden
und nach der nachfolgenden Eingabe des Buchstabens a kann die Silbe noch nicht eindeutig
erkannt werden, da es sich um die Silben "ca", "cai", "can", "cang" oder cao handeln
kann. Erst nach der Eingabe des letzten Buchstabens i wird die Silbe cai eindeutig
erkannt und ihr wird entsprechend der Zuordnungsliste die Silbenkennzahl 23 zugeordnet.
-
Bei der Zuordnungsliste nach Tabelle 1 sind die Silben entsprechend
ihrer alphabetischen Ordnung eingetragen und in aufsteigender Reihenfolge von 1
bis 410 durchnumeriert.
-
Bei der Zuordnungsliste nach Tabelle 2 sind in der ersten Spalte die
Endungen aufgetragen, die mit einem Vokal beginnen, und in der zweiten Spalte sind
die zugehörigen Silbenkennzahlen dargestellt. In der ersten Zeile sind die Anlaute
dargestellt, mit denen Silben beginnen können und auf die die in der ersten Spalte
angegebenen Teilsilben folgen können. In den Kreuzungspunkten sind jeweils die Silbenkennzahlen
derjenigen Silben angegeben, die mit dem Anlaut der ersten Zeile beginnen und denen
sich die in der Zeile angegebenen Endungen anschließen können.
-
Aus der Tabelle 2 ist durch den Wert O im Kreuzungspunkt der Spalten
und Zeilen angegeben, daß eine derartige Silbe nicht existiert. Beispielsweise existiert
keine Silbe "be" oder "cei" sowie keine Silbe "müe" oder "züe". Die bei der Eingabe
des Wortes "babaocai" und eines Wortes banama auftretenden Silben sowie die zugehörigen
Silbenkennzahlen sind in den Tabellen 1 und 2 jeweils dick umrandet gekennzeichnet.
-
Bei der Eingabe des Wortes banama wird in entsprechender Weise wie
bei der Eingabe des Wortes babaocai zunächst der Buchstabe b und dann der Buchstabe
a eingegeben. Da nach der Eingabe der Buchstaben ba wiederum die Silbe noch nicht
eindeutig identifiziert werden kann, wird erst nach der Eingabe des Buchstabens
n die vollständige Silbe erkannt und die Silbenkennzahl 8 an die Verarbeitungseinheit
VE abgegeben. Nach der Eingabe des Buchstabens "a" kann die folgende Silbe wiederum
nicht eindeutig erkannt werden. Erst nach der Eingabe des Buchstabens m wird, da
es keine Silbe am im Speicher SP gibt, der Buchstabe a als vollständige Silbe erkannt
und
ihm wird die Silbenkennzahl 1 zugeordnet. In entsprechender Weise wird nach der
Eingabe der Buchstaben ma und des nachfolgenden Zwischenraums die Silbe ma erkannt
und ihr wird die Silbenkennzahl 191 zugeordnet.
-
Wie der Zuordnungsliste nach Tabelle 1 zu entnehmen ist, wäre es auch
möglich gewesen, das Wort "banama", das in diesem Fall als Wort "ba'nama" oder ba-nama"
eingegeben wird, in Silben ba, na, ma mit den Kennzahlen 6, 210 und 191 aufzuteilen.
Da gemäß dem Verfahren ein Buchstabe, der sowohl zu einer betrachteten Silbe wie
auch zur nächsten Silbe zugeordnet werden könnte, immer der betrachteten Silbe zugeordnet
wird, muß somit, falls die Gefahr einer anderen Zuordnung besteht, ein besonderes
Trennzeichen eingegeben werden. Dieses Trennzeichen ist beispielsweise das Zeichen
""' oder das Zeichen ~-~, so daß in diesen Sonderfällen eine eindeutige Zerlegung
in die Silben möglich ist.
-
Die Zuordnung der Silben zu den chinesischen Schriftzeichen kann nun
nicht ohne weiteres erfolgen, da jeder Silbe in der Umschrift eine Vielzahl von
chinesischen Schriftzeichen entspricht. Für die Silbe "ba" stehen beispielsweise
18 verschiedene Schriftzeichen zur Verfügung und für die Silben bao und "cai" stehen
jeweils 17 bzw. 11 Schriftzeichen zur Verfügung. Die Auswahl des entsprechenden
Schriftzeichens kann nun durch die Verarbeitungseinheit VE selbsttätig erfolgen,
wie es in der gleichzeitig eingereichten Patentanmeldung P ........... beschrieben
ist. Hierzu wird eine Wortliste verwendet, in der beispielsweise 30 000 chinesische
Wörter durch ihre Silbenkennzahlen gespeichert sind und wobei jeweils angegeben
ist, um das wievielte der jeweiligen Silbe zugeordnete Zeichen es sich handelt.
-Diesem Zeichen wird dann eine vereinbarte vierstellige Ziffernfolge zugeordnet,
die das
entsprechende chinesische Schriftzeichen kennzeichnet.
An dem Bildschirm BS der Anzeigeeinheit AE oder an dem Drukker DR können dann die
chinesischen Schriftzeichen der eingegebenen Wörter dargestellt werden. Bei einer
Ubertragung von Texten können über die an der Verarbeitungseinheit VE angeschlossene
Fernleitung FL entweder die den Schriftzeichen zugeordneten vierstelligen Ziffernfolgen
oder die Silbenkennzahlen übertragen werden, wobei die Übertragung der Silbenkennzahlen
voraussetzt, daß in der empfangenden Einheit die Zuordnung der chinesischen Schriftzeichen
zu den Silbenkennzahlen unter Verwendung des Wortspeichers möglich ist.
-
In Fig. 2 sind für die Wörter ~babaocai", tbanama und "ba'nama" und
ihre zugehörigen Silbenkennzahlen sowie wie mittels des Wortspeichers ermittelten
chinesischen Schriftzeichen dargestellt.