DE3505276A1 - Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet - Google Patents

Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet

Info

Publication number
DE3505276A1
DE3505276A1 DE19853505276 DE3505276A DE3505276A1 DE 3505276 A1 DE3505276 A1 DE 3505276A1 DE 19853505276 DE19853505276 DE 19853505276 DE 3505276 A DE3505276 A DE 3505276A DE 3505276 A1 DE3505276 A1 DE 3505276A1
Authority
DE
Germany
Prior art keywords
syllable
word
words
characters
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19853505276
Other languages
English (en)
Other versions
DE3505276C2 (de
Inventor
Joachim Prof Dr Ing Heinzl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEINZL, JOACHIM, PROF. DR., 81549 MUENCHEN, DE
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19853505276 priority Critical patent/DE3505276A1/de
Priority to CN86100123A priority patent/CN1003194B/zh
Priority to JP61029119A priority patent/JPH0622029B2/ja
Publication of DE3505276A1 publication Critical patent/DE3505276A1/de
Application granted granted Critical
Publication of DE3505276C2 publication Critical patent/DE3505276C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/01Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for special character, e.g. for Chinese characters or barcodes

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

  • Verfahren und Anordnung zur Eingabe von chinesischen
  • Schriftzeichen in ein Endgerät Die Erfindung bezieht sich auf ein Verfahren zur Eingabe von chinesischen Schriftzeichen in ein Endgerät gemäß dem Oberbegriff des Patentanspruches 1. Weiterhin bezieht sich die Erfindung auf eine Anordnung zur Durchführung des Verfahrens.
  • Es ist bereits allgemein bekannt, chinesische Schriftzeichen unter Verwendung der Pinyin-Umschrift mittels einer Tastatur mit lateinischen Buchstaben einzugeben. Hierzu können 410 Silben verwendet werden, die eine Art Lautschrift. darstellen und die 6764 chinesischen Schriftzeichen zugeordnet sind. Hieraus ergibt sich, daß viele chinesischen Schriftzeichen gleich ausgesprochen werden (Homophone), und die Zuordnung einzelner Silben zu den chinesischen Schriftzeichen ist sehr häufig mehrdeutig.
  • Es ist weiterhin bekannt, die 6764 chinesischen Schriftzeichen durch Codewörter zu kennzeichnen, die jeweils aus vier Ziffern bestehen und die jeweils einem chinesischen Schriftzeichen eindeutig zugeordnet sind. Es ist somit möglich, beispielsweise für eine Übertragung von chinesischen Texten jeweils die Codewörter einzugeben und zu übertragen. Hierzu ist es jedoch auf der Sendeseite erforderlich, zu jedem chinesischen Schriftzeichen das zugehörige Codewort zu ermitteln, was nur anhand von umfangreichen Tabellen möglich ist.
  • Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Anordnung zur Eingabe von chinesischen Schriftzeichen anzugeben, bei deren Verwendung nach der Eingabe der Wörter mittels der Umschrift die zugehörigen chinesischen Schriftzeichen selbsttätig ermittelt werden.
  • Erfindungsgemäß wird die Aufgabe bei dem Verfahren der eingangs genannten Art durch die im kennzeichnenden Teil des Patentanspruchs 1 angegebenen Merkmale gelöst.
  • Die Erfindung geht von der Erkenntnis aus, daß sich im Gegensatz zur Zuordnung einzelner Silben zu chinesischen Schriftzeichen, die sehr häufig mehrdeutig ist, Folgen von mehreren Silben, die Wörtern entsprechen, in den meisten Fällen eindeutig einer Folge von chinesischen Schriftzeichen zuordnen lassen. Hierzu wird jeder Silbe in der Umschrift eine Silbenkennzahl zugeordnet und in einem Wortspeicher wird eine Vielzahl von chinesischen Wörtern durch die Folgen von Silbenkennzahlen gespeichert. Außerdem wird zu jeder Silbenkennzahl zugehörig eine Ordnungszahl gespeichert die angibt, um das wievielte chinesische Schriftzeichen aus der Mehrzahl der durch eine Silbenkennzahl gekennzeichneten Schriftzeichen es sich handelt. In dem Wortspeicher sind beispielsweise die Folgen von Silbenkennzahlen von 30 000 Wörtern und die zugehörigen Ordnungszahlen gespeichert.
  • Es erweist sich als zweckmäßig, den Wortspeicher derart zu organisieren, daß er für jede vorkommende Silbenzahl, die größer als 1 ist, einen eigenen Speicherbereich enthält. Auf diese Weise ist es möglich, den Suchvorgang nach einer bestimmten Folge von Silbenkennzahlen und den zugehörigen Ordnungszahlen zu beschleunigen.
  • Die Silbenfolgen sind zweckmäßigerweise streng nach den Silbenkennzahlen geordnet und zwar derart, daß zunächst nach der Silbenkennzahl der ersten Silbe geordnet wird, dann nach der Kennzahl der zweiten Silbe, der dritten Silbe usw.
  • Die Suche nach einem bestimmten Wort wird insbesondere dann sehr schnell durchgeführt, wenn sie durch Strichproben im Bereich der entsprechenden Silbenkennzahl erfolgt, wobei bei jeder Stichprobe ausgewertet wird, ob der Eintrag, wenn er vorhanden ist, im Bereich vor oder nach der Stichprobe enthalten sein muß.
  • Falls Folgen mehrerer Silben sich nicht eindeutig einer Folge von Schriftzeichen zuordnen lassen, ist es günstig, daß zunächst eine erste Folge von chinesischen Schriftzeichen an einer Ausgabeeinheit angezeigt wird, die der eingegebenen Silbenfolge entspricht und in Abhängigkeit von dem Betätigen einer ersten bzw. zweiten Taste die Silbenfolge als richtig gekennzeichnet wird bzw. eine weitere Silbenfolge angezeigt wird.
  • Falls eine oder mehrere Silben als Folgen von chinesischen Schriftzeichen in einem längeren Wort enthalten sind, ist es auch möglich, diese Silben durch zusätzliche Eingabe der längeren Wörter zu kennzeichnen und sie dadurch zu bestimmen, sofern die längeren Wörter im Wortspeicher enthalten sind.
  • Um auch Redewendungen oder feststehende häufige Wortfolgen auf einfache Weise eingeben zu können, ist es vorteilhaft, wenn Redewendungen, die aus mehreren Worten bestehen, wie mehrsilbige Wörter behandelt werden, indem anstelle der Zwischenräume zwischen den einzelnen Wörtern ein Trennzeichen eingegeben wird und damit kenntlich macht, daß die Wortfolge, wie ein mehrsilbiges Wort im Wortspeicher gesucht werden soll.
  • Der Wortspeicher ist vorzugsweise erweiterungsfähig aus- gebildet, so daß Wörter nach der Eingabe über die Tastatur aus einzelnen chinesischen Schriftzeichen zusammensetzbar sind und daß nach dem Betätigen einer entsprechenden Befehlstaste für das Einfügen die Ordnung im Wortspeicher nach dem Einfügen selbsttätig wieder hergestellt wird.
  • Zum Anpassen des Wortspeichers an den Wortschatz des Benutzers ist es auch günstig, wenn die Wörter im Wortspeicher gelöscht werden, indem sie nach der Eingabe über die Tastatur und nach dem Betätigen einer einem Löschbefehl zugeordneten Taste gelöscht werden, wobei die Ordnung im Wortspeicher nach dem Löschen selbsttätig wieder hergestellt wird.
  • Falls ein Wort im Wortspeicher nicht vorhanden ist, ist es für die Eingabe vorteilhaft, wenn an der Ausgabeeinheit eine Folge von chinesischen Schriftzeichen dargestellt wird, die aus kürzeren Folgen von Schriftzeichen besteht, die Teile des gesuchten Worts entsprechen und aus den häufigsten Silben für die restlichen Silben und ein Signal erzeugt wird, um den Benutzer aufzufordern, die Folge zu bestätigen oder abschnittsweise weitere Folgen anzufordern.
  • Eine Durchführung des Verfahrens gemäß der Erfindung und eine ~Anordnung zur Durchführung des Verfahrens werden im folgenden anhand von Zeichnungen näher erläutert. Es zeigen Fig. 1 ein Blockschaltbild einer Anordnung zur Durchführung des Verfahrens, Fig. 2 einen Ausschnitt aus einer Zuordnungsliste für die Zuordnung von Silben zu Silbenkennzahlen, Ordnungszahlen, Codewörtern und chinesischen Schriftzeichen, Fig. 3 eine Zuordnungsliste von zweisilbigen Wörtern zu Silbenkennzahlen, Ordnungszahlen, Codewörtern und chinesischen Schriftzeichen, Fig. 4 eine Zuordnungsliste von dreisilbigen Wörtern zu Silbenkennzahlen, Ordnungszahlen, Codewörtern und chinesischen Schriftzeichen, Fig. 5 eine Darstellung von mehreren chinesischen Schriftzeichen, die der Silbe §'ba" zugeordnet sind, Fig. 6 eine Darstellung von zwei der Silbe ba zugeordneten chinesischen Schriftzeichen, Fig. 7 eine Darstellung von chinesischen Schriftzeichen, die der Silbe ba mit den Randzeichen ~,ge" und ti zugeordnet sind, Fig. 8 eine Darstellung von chinesischen Schriftzeichen, die den Silben ba, "bao" und jiao zugeordnet sind und Fig. 9 eine Darstellung der chinesischen Redewendung aibing bi streng.
  • Bei der in Fig. 1 dargestellten Anordnung werden die chinesischen Schriftzeichen unter Verwendung der Pinyin-Umschrift mittels einer internationalen Tastatur TA mit lateinischen Buchstaben eingegeben. Die Anordnung enthält einen Speicher SP, der mit einem Zeichengenerator ZG für 6764 codierte chinesische Schriftzeichen und deren phonetische Attribute versehen ist. Weiterhin enthält der Speicher SP einen Wortspeicher SP, in dem beispielsweise 30 000 chinesische Wörter codiert gespeichert sind. Weiterhin enthält die Anordnung eine Verarbeitungseinheit VE und eine Ausgabeeinheit, die als mit einem Bildschirm BS versehene Anzeigeeinheit AE und/oder als Drucker DR, vor- zugsweise als Matrixdrucker ausgebildet sein kann. Die Verarbeitungseinheit VE gibt an eine Rechenanlage oder an eine Übertragungsstrecke Codewörter CW für die Weiterverarbeitung der eingegebenen Schriftzeichen ab.
  • Ein chinesisches Wort wird unter Verwendung der Umschrift mittels der Tastatur TA eingegeben. Die Silben werden dabei zusammengeschrieben, wie es in modernen Wörterbüchern der Fall ist. Das Ende eines Worts wird durch die Eingabe eines Zwischenraums oder eines Satzzeichens gekennzeichnet. Um die Eingabe überprüfen zu können, kann diese an dem Bildschirm BS der Anzeigeeinheit und/oder am Drucker DR angezeigt werden und zwar in Form der chinesischen Schriftzeichen, der mittels der Umschrift eingegebenen Silben und/oder der international vereinbarten Codewörter CW, die jeweils einem chinesischen Schriftzeichen zugeordnet sind.
  • Nach der Eingabe der Buchstaben eines Worts werden diese zu einzelnen Silben zusammengefaßt. Dies kann dadurch erfolgen, daß nach der Eingabe jeder Silbe ein Trennzeichen, beispielsweise ein Zeichen ""''oder ein Zeichen "-t eingegeben wird oder die Aufteilung in die einzelnen Silben erfolgt selbsttätig, wie es in der gleichzeitig eingereichten Patentanmeldung P ............ beschrieben ist.
  • Der Speicher SP enthält einen Speicher SKS für die Silbenkennzahlen und jeder der möglichen 410 Silben wird eine Silbenkennzahl zugeordnet. Anschließend beginnt die Suche nach einem Wort mit derselben Folge von Silbenkennzahlen im Wortspeicher WS. In dem Wortspeicher WS sind die 30 000 Wörter durch ihre Silbenkennzahlen gespeichert. Die Einträge in dem Wortspeicher WS sind dabei folgendermaßen geordnet: 1. Entsprechend der Anzahl der chinesischen Schriftzeichen des Worts, d. h. entsprechend der Anzahl der Silben, dann alphabetisch entsprechend der Umschrift des ersten chinesischen Schriftzeichens, dann alphabetisch entsprechend der Umschrift des zweiten chinesischen Schriftzeichens und dann alphabetisch entsprechend der Umschrift und der Silbenkennzahl des nachfolgenden chinesischen Schriftzeichens usw.
  • Die Suche nach einer Folge von chinesischen Schriftzeichen, die der eingegebenen Folge von Silben entspricht, wird somit in einer geordneten Liste von Silbenkennzahlen der zweiten Silbe fortgesetzt. Die Anfangs- und die Endadresse dieser Liste wird als Funktion der Anzahl der Silben und der Silbenkennzahlen der ersten Silbe gespeichert. Selbst im Fall von langen Wörtern erfordert die Suche weniger als 100 ms.
  • Falls es mehr als eine Folge von chinesischen Schriftzeichen entsprechend der eingegebenen Folge von Silben in dem Wortspeicher WS gibt, wird die erste Folge von chinesischen Schriftzeichen angezeigt und der Benutzer wird aufgefordert, entweder diese zu bestätigen oder ihm wird die nächstmögliche geeignete Folge von chinesischen Schriftzeichen angeboten. Im Fall von zweisilbigen Wörtern sind etwa 2 % der eingegebenen Wörter mehrdeutig.
  • Wenn ein Wort aus drei oder mehr Silben besteht, ist die Mehrdeutigkeit sehr klein, was zur Folge hat, daß die Suche sehr schnell beendet ist.
  • Falls ein Wort in dem Wortspeicher WS noch nicht enthalten ist, wird es als eine Folge von einzelnen Zeichen eingegeben. Sie wird in einem kleinen, unsortierten Bereich des Wortspeichers WS gespeichert, bis es beim nächsten Aktualisierungsvorgang des Wortspeichers WS richtig eingeordnet wird. Der Wortspeicher WS ist auf diese Weise an den Wortschatz des Benutzers anpaßbar.
  • In dem Wortspeicher WS sind nur die Silbenkennzahlen und die zugehörigen Ordnungszahlen gespeichert. Für jedes chinesisches Schriftzeichen sind daher zwei Byte erforderlich. Bei 30 000 Wörtern, die im Durchschnitt aus drei Schriftzeichen bestehen; ist eine Speicherkapazität von 180 kByte erforderlich. Der Wortspeicher WS ist für eine schnelle Suche derart organisiert, daß für jede vorkommende Silbenzahl die größer als 1 ist ein eigener Speicherbereich vorgesehen ist. Die einzelnen Einträge von Silbenfolgen sind streng nach den Silbenkennzahlen geordnet und zwar zunächst nach der Silbenkennzahl der ersten Silbe, dann nach der Silbenkennzahl der zweiten Silbe, der dritten Silbe usw.
  • Die Suche nach einem Wort im Wortspeicher WS erfolgt durch Stichproben im Bereich der entsprechenden Silbenkennzahl, wobei die Stichprobe jeweils in der Mitte des noch verbleibenden Suchbereichs erfolgt und bei jeder Stichprobe ausgewertet wird, ob der Eintrag, wenn er vorhanden ist, im Bereich vor oder nach der Stichprobe enthalten ist, so daß sich mit jeder Stichprobe der verbleibende Suchbereich halbiert und so der Eintrag mit wenigen weiteren Stichproben gefunden wird.
  • Die Zuordnung der Silbenkennzahlen und der Ordnungszahlen zu den Codewörtern CW erfolgt unter Verwendung eines ebenfalls im Speicher SP enthaltenen Codewortspeichers CWS.
  • Die Codewörter CW werden auch an den Zeichengenerator ZG abgegeben, um die Schriftzeichen an der Ausgabeeinheit darzustellen.
  • Wenn unter Verwendung der Tastatur TA mittels der Umschrift ein chinesisches Schriftzeichen eingegeben wird, kann die Verarbeitungseinheit VE selbsttätig das Wort in die einzelnen Silben zerlegen. Es ist auch möglich, das Wort silbenweise getrennt durch Trennzeichen, beispielsweise die Zeichen ""' oder "-" einzugeben. Die Verarbeitungseinheit VE ermittelt unter Verwendung des Speichers SKS die der jeweiligen Silbe zugehörige Silbenkennzahl.
  • Um auch häufig gebrauchte Wortfolgen oder Redewendungen eingeben zu können, die aus mehreren Wörtern bestehen, werden diese wie mehrsilbige Wörter behandelt, indem anstelle der Zwischenräume zwischen den einzelnen Wörtern ein weiteres Trennzeichen, beispielsweise das Zeichen ~#~ eingegeben wird und damit kenntlich macht, daß die Wortfolge, wie ein mehrsilbiges Wort im Wortspeicher gesucht werden soll.
  • Die nachfolgende Tabelle zeigt eine Zuordnungsliste zwischen den 410 Silben und den entsprechenden Silbenkennzahlen.
  • Tabelle
    0 1 2 3 4 5 6 7 8 9
    0 a ai an ang ao ba bai ban bang
    10 bao bei ben ben bi bian biao bie bin bin
    20 bo bu ca cai can cang cao ce cen cen
    : : : : : : : : : :
    400 zhuiizhun zhuo zi zaig zon zu zuan zui zun
    410 zuo
    Falls beispielsweise das Wort ~babaocai" eingegeben wird, wird dieses in die Silben "ba", "bao" und "cai" aufgeteilt und diesen Silben werden die Kennzahlen 6, 10 bzw.
  • 23 zugeordnet.
  • Die Verarbeitungseinheit VE ermittelt nun unter Verwendung des Wortspeichers WS aufgrund der Folge von Silbenkennzahlen die Ordnungszahlen, die angeben, das wievielte chinesische Schriftzeichen, das durch die Silbenkennzahl gekennzeichnet ist, dem Wort zugeordnet ist. Anschließend ermittelt die Verarbeitungseinheit VE unter Verwendung des Codewortspeichers CWS die diesen chinesischen Schrift- zeichen zugeordneten Codewörter CW, die beispielsweise für eine weitere Verarbeitung in einen Rechner eingegeben werden oder zu einem weiteren Endgerät übertragen werden.
  • Die Fig. 2 zeigt einen Ausschnitt aus einer in dem Wortspeicher WS gespeicherten Zuordnungsliste für die Zuordnung der Codewörter CW und der Silben zu den chinesischen Schriftzeichen. In der vollständigen Zuordnungsliste sind 6764 chinesische Schriftzeichen den 410 Silben und den entsprechenden Codewörtern CW zugeordnet.
  • Die Darstellung in Fig. 3 zeigt einen Ausschnitt aus einer im Wortspeicher WS gespeicherten Zuordnungliste für zweisilbige Wörter, die mittels der Umschrift eingegeben werden und entsprechende chinesische Schriftzeichen.
  • Falls beispielsweise das Wort "aci" eingegeben wird, ermittelt die Verarbeitungseinheit unter Verwendung des Speichers SKS die Silbenkennzahlen 1 und 49, die den Silben ~a" bzw. ttcitt zugeordnet sind. Unter Verwendung des Wortspeichers WS, in dem alle üblichen zweisilbigen Wörter gespeichert sind, wird ermittelt, das wievielte Schriftzeichen, das der jeweiligen Silbe zugeordnet ist, in dem eingegebenen Wort auftritt. Die Ordnungszahl DZ beginnt jeweils mit der Ziffer 0 und im vorliegenden Fall wird im Wortspeicher WS für die Silbe a die Ordnungszahl 1 ermittelt, die angibt, daß es sich um das zweite Schriftzeichen der Silbe a handelt, die das Codewort CW 1602 hat. Das zugehörige chinesische Schriftzeichen CHZ ist in Fig. 3 ebenfalls dargestellt. In entsprechender Weise gibt der Wortspeicher WS durch die Ordnungszahl DZ von .9 an, daß es sich um das zehnte Schriftzeichen der Silbe ci mit der Silbenkennzahl 49 handelt, das das Codewort CW 2044 aufweist. In entsprechender Weise werden die Silbenkennzahlen SK, die Ordnungszahlen DZ und die Codewörter CW sowie die chinesischen Schriftzeichen CHZ für die eingegebenen Wörter "adou", §afi" und ~aiai" er- mittelt. Im Hinblick auf das Wort "aiai" ist in der Tabelle zu erkennen, daß es sich um die Silbe mit der Silbenkennzahl 2 handelt. Aus dem Wortspeicher WS wird ermittelt, daß dieses Wort mit den Schriftzeichen der Ordnungszahl 5, also den jeweils sechsten Schriftzeichen der Silbe ai mit dem Codewort 1608 dargestellt wird und die entsprechenden Schriftzeichen sind dargestellt.
  • Bei der Darstellung in Fig. 4 sind die Silbenkennzahlen SK, die Ordnungszahlen DZ, die Codewörter CW und die chinesischen Schriftzeichen CHZ für einige im Wortspeicher WS gespeicherte dreisilbige Wörter gezeigt. Falls beispielsweise das Wort "aihaozai" eingegeben wird, ermittelt die Verarbeitungseinheit die Silbenkennzahlen SK von 2, 115 bzw. 388. Mittels des Wortspeichers WS wird ermittelt, daß diesem Wort die Ordnungszahlen DZ 11, 5 bzw. 0 zugeordnet sind und aus dem Codewortspeicher CWS ergeben sich die Codewörter 1614, 2635 und 5358. Aus dem Zeichengenerator ZG können dann aufgrund dieser Codewörter CW die chinesischen Schriftzeichen CHZ an der Ausgabeeinheit ausgegeben werden.
  • Falls in dem Wortspeicher WS mehrere Einträge vorhanden sind, die der eingegebenen Folge von Silbenkennzahlen SK entsprechen, wird zunächst eine erste Folge von Schriftzeichen an der Ausgabeeinheit dargestellt und der Benutzer wird aufgefordert, sie zu bestätigen oder weiterzublättern.
  • Wenn nur eine einzige Silbe eingegeben wird, gibt es, wie Fig. 2 zu entnehmen ist, jeweils eine Mehrzahl von Möglichkeiten für die Zuordnung der Schriftzeichen zu diesen Silben. In Fig. 2 sind für die Silben "a" und "ai" jeweils nur die häufigsten chinesischen Schriftzeichen CHZ dargestellt. Als Codewörter CW' sind noch weitere Codewörter angegeben, die ebenfalls der Silbe "a" bzw. "ai" zugeordnet sind, jedoch verhältnismäßig selten vorkommen.
  • Zum Ermitteln des gewünschten Schriftzeichens aufgrund der in der Umschrift dargestellten Silbe gibt es mehrere Möglichkeiten. Bei der Darstellung in Fig. 5 wird beispielsweise angenommen, daß ein bestimmtes Schriftzeichen, das der Silbe ba zugeordnet ist, für die Eingabe eines Worts erwünscht ist. Wenn nur die Umschrift ba eingegeben wird, wird an der Ausgabeeinheit, beispielsweise am Bildschirm BS der Anzeigeeinheit AE zunächst das Schriftzeichen mit dem Codewort CW 1649 angezeigt, das das häufigste der Silbe "ba" zugeordnete Schriftzeichen ist. Da jedoch das in Fig. 5 oben dargestellte Schriftzeichen gewünscht wird, wird das dargestellte Schriftzeichen nicht akzeptiert und der Benutzer betätigt eine Taste "Weiterblättern" solange, bis das gewünschte Schriftzeichen mit dem Codewort CW 1648 auftritt, das ein verhältnismäßig seltenes Schriftzeichen ist. Dieses wird durch das Betätigen einer Taste "Bestätigung" akzeptiert.
  • In Fig. 5 sind die Schriftzeichen nebeneinander dargestellt, jedoch erscheinen sie an dem Bildschirm BS zeitlich nacheinander.
  • Die Darstellung in Fig. 6 zeigt eine weitere Möglichkeit, ein gewünschtes Schriftzeichen, das der Silbe "ba" zugeordnet ist, sehr schnell zu finden. Zusätzlich zu der Silbe ba wird die Zahl 3 angegeben, die angibt, daß die Silbe in dem dritten Ton gesprochen wird und es werden dem Benutzer nur noch die beiden Schriftzeichen mit den Codewörtern CW 1649 und 1648 angeboten.
  • Bei der Darstellung in Fig. 7 ist eine weitere Möglichkeit gezeigt, sehr schnell ein gewünschtes Schriftzeichen zu finden. Zusätzlich zu der Silbe "ba" wird, durch einen Doppelbalken getrennt angegeben, daß das Randzeichen ge in dem Zeichen vorkommt und in diesem Fall wird sofort das gewünschte Schriftzeichen mit dem Codewort CW 1648 angezeigt. Falls ein Schriftzeichen der Silbe ba ge- wünscht wird, das das Randzeichen liti" aufweist, wird dieses durch den Doppelbalken getrennt eingegeben und am Bildschirm BS erscheinen zeitlich nacheinander die vier Schriftzeichen mit den Codewörtern CW 1638 bis 1649.
  • Wenn ein- oder mehrsilbige Wörter gesucht werden, die als Zeichenfolge in längeren Wörtern enthalten sind, besteht eine weitere Möglichkeit dadurch, daß das bekannte längere Wort zusätzlich eingegeben wird und zwar durch ein Trennzeichen, beispielsweise das Zeichen Il< ". Bei der Darstellung in Fig. 8 wird die Silbe "ba" gesucht, die in dem Wort "baxin" enthalten ist und dem Benutzer werden die Schriftzeichen mit den Codewörtern 1648 und 1649 angeboten. Falls die Silbe "ba" gesucht wird, die auch in dem Wort "bachang" enthalten ist, wird dem Benutzer nur die Silbe mit dem Codewort CW 1648 angeboten. In entsprechender Weise kann beispielsweise das Schriftzeichen "bau" ermittelt werden, das in dem Wort 'Ibabao" auftritt oder das Schriftzeichen "jiao" ermittelt werden, das in dem Wort bajiaoshan enthalten ist.
  • Der Wortspeicher WS kann an die Bedürfnisse des Benutzers angepaßt werden, indem weitere Wörter eingefügt werden oder nicht benötigte Wörter gelöscht werden. Die Eingabe der Wörter erfolgt dadurch, daß sie über die Tastatur TA im Dialog mit der Ausgabeeinheit aus Einzelzeichen zusammengesetzt werden und anschließend ein Befehl zum Einfügen abgegeben wird, worauf die Ordnung im Wortspeicher WS nach dem Einfügen automatisch wieder hergestellt wird.
  • Das Löschen von Wörtern im Wortspeicher WS erfolgt dadurch, daß die Wörter ebenfalls über die Tastatur TA eingegeben werden und nach einem Löschbefehl wird das Wort gelöscht, wobei die Ordnung im Wortspeicher WS nach dem Löschen des Eintrags selbsttätig wieder hergestellt wird.
  • Falls ein Wort im Wortspeicher WS nicht gefunden wird, wird dem Benutzer ein Vorschlag an der Ausgabeeinheit gemacht, wie die Zeichenfolge aussehen könnte, bestehend aus kürzeren Zeichenfolgen, die Teilen des gesuchten Worts entsprechen und aus den häufigsten Homophonen für die restlichen Silben. Der Benutzer wird anschließend aufgefordert, die Zeichenfolge zu bestätigen oder abschnittsweise weiterzublättern.
  • Bei der Darstellung in Fig. 9 ist eine aus mehreren Wörtern gebildete chinesische Redewendung aibing bi streng dargestellt, die in gleicher Weise wie ein chinesisches mehrsilbiges Wort behandelt wird. Anstelle der Zwischenräume zwischen den Wörtern werden weitere Trennzeichen, beispielsweise das Zeichen " " eingegeben und mittels des, Wortspeichers WS werden die zugehörigen Silben der Wörter ermittelt und mittels des Codewortspeichers CWS werden den Silben dann in gleicher Weise wie bei einzelnen Wörtern die Codewörter zugeordnet.
  • 15 Patentansprüche 9 Figuren

Claims (15)

  1. Patentansprüche 1. Verfahren zur Eingabe von chinesischen Schriftzeichen in ein Endgerät, wobei aus den chinesischen Schriftzeichen gebildete Wörter mittels einer Umschrift aus lateinischen Buchstaben eingegeben werden, wobei jeweils eine Silbe einem chinesischen Schriftzeichen entspricht, d a d u r c h g e k e n n z e i c h n e t , daß jeder Silbe eines in der Umschrift eingegebenen Worts eine Silbenkennzahl (SK) zugeordnet wird, daß in einem Wortspeicher (WS) für jede Folge von Silben jeweils eine Folge von Silbenkennzahlen (SK) gespeichert ist, der eine Folge von Ordnungszahlen (OZ) zugeordnet ist, die entsprechende Schriftzeichen innerhalb einer Mehrzahl von einer Silbenkennzahl (SK) zugeordnete Schriftzeichen angibt und daß aufgrund der Silbenkennzahlen (SK) und der zugehörigen Ordnungszahlen (OZ) die dem entsprechenden Wort zugeordneten Schriftzeichen (CHZ) ermittelt werden.
  2. 2. Verfahren nach Anspruch 1, d a d u r c h g e -k e n n z e i c h n e t , daß der Wortspeicher (WS) für jede vorkommende Silbenkennzahl (SK) einen eigenen Speicherbereich enthält.
  3. 3. Verfahren nach Anspruch 1 oder Anspruch 2, d a -d u r c h g e k e n n z e i c h n e t , daß die einzelnen Einträge von Folgen von Silbenkennzahlen (SK) streng nach den Silbenkennzahlen (SK) geordnet sind und zwar zunächst nach der Silbenkennzahl (SK) der ersten Silbe, dann erst nach der Silbenkennzahl (SK) der zweiten Silbe, der dritten Silbe usw.
  4. 4. Verfahren nach einem der Ansprüche 1 bis 3, d a -d u r c h g e k e n n z e i c h n e t , daß die Suche nach einem Wort durch Stichproben im Bereich der entsprechenden Silbenkennzahl (SK) erfolgt, wobei die Stichprobe jeweils in der Mitte des noch verbleibenden Suchbereichs erfolgt und bei jeder Stichprobe ausgewertet wird, ob der Eintrag, wenn er vorhanden ist, im Bereich vor oder nach der Stichprobe enthalten ist, so daß sich mit jeder Stichprobe der verbleibende Suchbereich halbiert.
  5. 5. Verfahren nach einem der Ansprüche 1 bis 4, d a -d u r c h g e k e n n z e i c h n e t , daß wenn mehr als ein Eintrag im Wortspeicher (WS) gefunden wird, der der eingegebenen Silbenfolge entspricht, zunächst eine erste Folge von Schriftzeichen (CHZ) angezeigt wird und daß nach dem Betätigen entsprechender Tasten diese Folge bestätigt wird oder eine weitere Folge dargestellt wird.
  6. 6. Verfahren nach einem der Ansprüche 1 bis 5, d a -d u r c h g e k e n n z e i c h n e t , daß ein oder mehrsilbige Wörter, die als Folge von Schriftzeichen (CHZ) in längeren Wörtern enthalten sind, durch eine zusätzliche Eingabe der längeren Wörter zusätzlich gekennzeichnet werden.
  7. 7. Verfahren nach einem der Ansprüche 1 bis 6, d a -d u r c h g e k e n n z e i c h n e t , daß Redewendungen, die aus mehreren Worten bestehen, wie mehrsilbige Wörter behandelt werden, indem anstelle der Zwischenräume zwischen den einzelnen Wörtern ein Trennzeichen eingegeben wird und damit kenntlich macht, daß die Wort folge, wie ein mehrsilbiges Wort im Wortspeicher (WS) gesucht werden soll.
  8. 8. Verfahren nach einem der Ansprüche 1 bis 7, d a -d u r c h g e k e n n z e i c h n e t , daß Wörter in den Wortspeicher (WS) eingefügt werden, in dem sie über die Tastatur (TA) im Dialog mit der Ausgabeeinheit (AE, DR) aus einzelnen Schriftzeichen (CHZ) zusammenge- setzt und anschließend in den Wortspeicher (WS) eingespeichert werden, worauf die Ordnung im Wortspeicher (WS) nach dem Einfügen selbsttätig wieder hergestellt wird.
  9. 9. Verfahren nach einem der Ansprüche 1 bis 8, d a -d u r c h g e k e n n z e i c h n e t , daß Wörter im Wortspeicher (WS) gelöscht werden, indem sie über die Tastatur (TA) eingegeben werden und nach einer Eingabe eines Löschbefehls gelöscht werden, wobei die Ordnung im Wortspeicher (WS) nach der Löschung des Eintrags selbsttätig wieder hergestellt wird.
  10. 10. Verfahren nach einem der Ansprüche 1 bis 9, d a -d u r c h g e k e n n z e i c h n e t , daß, falls ein Wort im Wortspeicher (WS) nicht gefunden wird, an der Ausgabeeinheit (AE, DR) ein Vorschlag gemacht wird, wie die Folge der Schriftzeichen (CHZ) aussehen könnte, bestehend aus kürzeren Folgen, die Teilen des gesuchten Worts entsprechen und aus den häufigsten Schriftzeichen (CHZ), die den restlichen Silben zugeordnet sind.
  11. 11. Verfahren nach einem der Ansprüche 1 bis 10, d a -d u r c h g e k e n n z e i c h n e t , daß unter Verwendung der Silbenkennzahlen (SK) und der Ordnungszahlen (DZ) den Schriftzeichen zugeordnete Codewörter ermittelt werden.
  12. 12. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, g e k e n n z e i c h n e t d u r c h einen Silbenkennzahlspeicher (SKS) in dem für jede eingegebene Silbe eine Silbenkennzahl (SK) gespeichert ist, durch einen Wortspeicher (WS), in dem eine Vielzahl von Wörtern durch ihre Folgen von Silbenkennzahlen (SK) und zugehörige Ordnungszahlen (OZ) gespeichert ist, die angeben, um das wievielte Schriftzeichen aus einer Mehrzahl von durch die jeweilige Silbenkennzahl (SK) gekennzeich- neten Schriftzeichen (CHZ) es sich handelt, und durch eine Verarbeitungseinheit (VE), die jeder Silbe eines Worts eine Silbenkennzahl (SK) zuordnet, die mittels des Wortspeichers (WS) die jeder Silbe zugeordnete Ordnungszahl (OZ) ermittelt und die aufgrund jeder Silbenkennzahl (SK) und der zugehörigen Ordnungszahl (OZ) ein entsprechendes Schriftzeichen (CHZ) des Worts ermittelt.
  13. 13. Anordnung nach Anspruch 12, d a d u r c h g e -k e n n z e i c h n e t , daß ein Codewortspeicher (CWS) vorgesehen ist, in dem den Silbenkennzahlen (SK) und den zugehörigen Ordnungszahlen (OZ) zugeordnete Codewörter (CW) gespeichert sind, die jeweils einem chinesischen Schriftzeichen (CHZ) zugeordnet sind.
  14. 14. Anordnung nach Anspruch 13, d a d u r c h g e -k e n n z e i c h n e t , daß ein Zeichengenerator (ZG) vorgesehen ist, in dem den Formen der chinesischen Schriftzeichen (CHZ) zugeordnete Datenwörter gespeichert sind und der aufgrund der Codewörter (CW) die dem jeweiligen chinesischen Schriftzeichen (CHZ) zugeordneten Datenwörter an eine Ausgabeeinheit (AE, DR) abgibt.
  15. 15. Anordnung nach einem der Ansprüche 12 bis 14, d a -d u r c h g e k e n n z e i c h n e t , daß als Ausgabeeinheit eine mit einem Bildschirm (BS) versehene Anzeigeeinheit (AE) und/oder ein Drucker (DR) der nach dem Matrixdruckprinzip arbeitet, vorgesehen ist.
DE19853505276 1985-02-15 1985-02-15 Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet Granted DE3505276A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE19853505276 DE3505276A1 (de) 1985-02-15 1985-02-15 Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet
CN86100123A CN1003194B (zh) 1985-02-15 1986-01-10 汉字输入终端的方法与装置
JP61029119A JPH0622029B2 (ja) 1985-02-15 1986-02-14 端末装置に中国語の文字記号を入力するための方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19853505276 DE3505276A1 (de) 1985-02-15 1985-02-15 Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet

Publications (2)

Publication Number Publication Date
DE3505276A1 true DE3505276A1 (de) 1986-08-21
DE3505276C2 DE3505276C2 (de) 1988-09-08

Family

ID=6262661

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19853505276 Granted DE3505276A1 (de) 1985-02-15 1985-02-15 Verfahren und anordnung zur eingabe von chinesischen schriftzeichen in ein endgeraet

Country Status (3)

Country Link
JP (1) JPH0622029B2 (de)
CN (1) CN1003194B (de)
DE (1) DE3505276A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0827793B2 (ja) * 1987-02-12 1996-03-21 シャープ株式会社 中国語文章作成装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2160254A1 (de) * 1970-12-31 1972-07-13 Ibm Dynamisches tastengesteuertes Eingabesystem
DE2939919A1 (de) * 1978-10-03 1980-04-24 Pok Fun Ng Anordnung zum codieren von ideographischen zeichen
GB2060231A (en) * 1979-10-12 1981-04-29 Int Telecommunications Adminis Easy and Flexible Method of Inputting Ideogram-type Language Characters into a Computer System
DE3142138A1 (de) * 1981-10-23 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur eingabe chinesischer zeichen sowie vorrichtung zur durchfuehrung des verfahrens
DE3214362A1 (de) * 1982-04-20 1983-10-20 Olympia Werke Ag Schaltungsanordnung in schreib- oder aehnlichen maschinen mit grossem zeichenvorrat

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2160254A1 (de) * 1970-12-31 1972-07-13 Ibm Dynamisches tastengesteuertes Eingabesystem
DE2939919A1 (de) * 1978-10-03 1980-04-24 Pok Fun Ng Anordnung zum codieren von ideographischen zeichen
GB2060231A (en) * 1979-10-12 1981-04-29 Int Telecommunications Adminis Easy and Flexible Method of Inputting Ideogram-type Language Characters into a Computer System
DE3142138A1 (de) * 1981-10-23 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur eingabe chinesischer zeichen sowie vorrichtung zur durchfuehrung des verfahrens
DE3214362A1 (de) * 1982-04-20 1983-10-20 Olympia Werke Ag Schaltungsanordnung in schreib- oder aehnlichen maschinen mit grossem zeichenvorrat

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP 58-217039 A. In: Patents Abstr. of Japan, P-265 April 4, 1984, Vol. 8, No. 72 *

Also Published As

Publication number Publication date
JPS61193257A (ja) 1986-08-27
DE3505276C2 (de) 1988-09-08
CN86100123A (zh) 1986-08-13
CN1003194B (zh) 1989-02-01
JPH0622029B2 (ja) 1994-03-23

Similar Documents

Publication Publication Date Title
DE3112958C2 (de)
DE2946857C2 (de) Wortspeichergerät
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
EP0304129B1 (de) Verfahren und Anordnung zum Aufbereiten eines Kennsignals
DE3115318C2 (de) Elektronisches Übersetzungsgerät
DE2854837A1 (de) Uebersetzungsvorrichtung
DE3034509C2 (de) Elektronisches Übersetzungsgerät
DE10392170T5 (de) Verfahren und Benutzerinterface zur Texteingabe
EP0590173A1 (de) Computersystem zur Spracherkennung
DE3240209C2 (de) Elektronischer Übersetzer
DE3129011A1 (de) &#34;elektronisches uebersetzungsgeraet&#34;
DE3034510C2 (de) Elektronisches Übersetzungsgerät
DE3142138C2 (de) Verfahren zur Eingabe chinesischer Zeichen sowie Vorrichtung zur Durchführung des Verfahrens
DE2939919A1 (de) Anordnung zum codieren von ideographischen zeichen
DD141912A5 (de) Verfahren und vorrichtung zum aufbau von texten mit arabischen buchstaben
DE3233194C2 (de) Elektronischer Taschenübersetzer
DE2825519A1 (de) Elektronisches ausgabegeraet fuer mehrzeilige textwiedergabe
DE3505276C2 (de)
DE4213533C2 (de) Verfahren und Computersystem zum Zerlegen von zusammengesetzten Wörtern
DE3505291C2 (de)
DE60131490T2 (de) Methode zur Konvertierung von UNICODE Text in gemischte Codepages
DE112005002061T5 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE4309362A1 (de) Informations-Rückgewinnungsvorrichtung
DE2729809A1 (de) Apparat zum umwandeln von worten von einer sprache in eine andere
DE4124024A1 (de) Verfahren zum verarbeiten von tastatureingaben in einem rechner, einer schreibmaschine oder dergleichen

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: HEINZL, JOACHIM, PROF. DR., 81549 MUENCHEN, DE

8339 Ceased/non-payment of the annual fee