DE2847085A1 - Verfahren und vorrichtung zur verarbeitung arabisch-farsischer sprachdaten - Google Patents

Verfahren und vorrichtung zur verarbeitung arabisch-farsischer sprachdaten

Info

Publication number
DE2847085A1
DE2847085A1 DE19782847085 DE2847085A DE2847085A1 DE 2847085 A1 DE2847085 A1 DE 2847085A1 DE 19782847085 DE19782847085 DE 19782847085 DE 2847085 A DE2847085 A DE 2847085A DE 2847085 A1 DE2847085 A1 DE 2847085A1
Authority
DE
Germany
Prior art keywords
character
bit
characters
arabic
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19782847085
Other languages
English (en)
Other versions
DE2847085C2 (de
Inventor
Khaled Mahmud Diab
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US05/846,824 external-priority patent/US4145570A/en
Application filed by Individual filed Critical Individual
Publication of DE2847085A1 publication Critical patent/DE2847085A1/de
Application granted granted Critical
Publication of DE2847085C2 publication Critical patent/DE2847085C2/de
Expired legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L17/00Apparatus or local circuits for transmitting or receiving codes wherein each character is represented by the same number of equal-length code elements, e.g. Baudot code
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/01Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for special character, e.g. for Chinese characters or barcodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Communication Control (AREA)
  • Character Discrimination (AREA)

Description

DR.-ING. DIPI ING. M. SC. CMrI THYS. ΟΠ. OIPL.-PHYS. HÖGER - STELLRECHT - GRIE-SSBACH - HAECKER PATENTANWÄLTE IN STUTTGART
A 43 117 m Anmelder: Khaled M. Diab
U - 175 Orlando, Florida
2^.lU.iy78 32 809 USA
Verfahren, und Vorrichtung zur Verarbeitung arabisch-farsischer Sprachdaten
Die Erfindung betrifft ein Verfahren zur Verarbeitung arabischfarsischer Sprachdaten sovi/ie eine Vorrichtung zur Durchführung des Verfahrens, insbesondere zur Verarbeitung arabisch-farsischer Sprachdaten in Fernschreibsystemen, Schreibmaschinen, Setzmaschinen, Computer-Terminals und Anzeigeeinheiten. Zusätzlich können das Verfahren und die Vorrichtung bei ähnlichen Terminals verwendet werden, die die arabische mit anderen Sprachen kombiniert .
Arabische Schriften, die für Sprachen wie Arabisch, Persisch oder Urdu (arabisch-farsische Sprachen) benutzt werden, enthalten gewöhnlich wesentlich mehr Zeichen und Zeichenfarmen als die lateinische Schrift, die für Englisch, Französisch etc. benutzt wird. Daher können L'odiertechniken, die für die Übertragung, den Empfang, Schriftsetzen und dergleichen im Zusammenhang mit den die lateinische Sprache verwendenden Sprachen entwickelt worden sind,nicht direkt für die Codierung und De-Codierung von Sprachen verwendet werden, die die arabische Schrift benützen.
Ein wichtiges Beispiel einer für die Übertragung der englischen Sprache benutzten Codiertechnik ist die 5-bit- Baudot-Codierung, die in der ganzen Welt in einem internationalen Austauschsystem für das Fernschreiben benutzt wird. Diese 5-bit-Codierung kann die lateinische Schrift übertragen, da nur 26 Buchstaben oder Zeichen vorgesehen sind und alle 26 Zeichen + 10 Ziffern und verschiedene Satzzeichen, Symbole und Funktionssignale in
909822/0551
2!>.10.iy78
dem Baudot-Code aufgenommen u/erden können. Im Gegensatz dazu war man der Meinung, daß der 5-bit-Baudot-Code die 60 oder mehr Zeichen und Zeichenformen nicht aufnehmen kann, die notwendig sind, um die arabisch-farsischen Sprachen über einen Fernschreiben mit guter Qualität zu übertragen. Man hat daher verschiedene Kompromisse vorgeschlagen und auch verschiedene Codiertechniken, die mehr als 5 bit benötigen und daher mit den existierenden internationalen Austauscherfordernissen nicht verträglich sind.
Eine durch M. S. Chaudhry im U.S. Patent 3 998 310 vorgeschlagene Lösung sieht nicht alle Zeichenformen vor, und berücksichtigt nicht die Anforderungen für Ziffern, arithmetische Zeichen, Satzzeichen und diakritische Zeichen. Außerdem werden die Anforderungen an die Codierung soweit ausgedehnt, daß sie mit dem existierenden Fernschreibsystem nicht mehr vereinbar sind. Chaudhry reduziert die Zahl der Buchstaben auf einer Tastatur, indem er die arabischen Buchstaben in 2 Formen einteilt, nämlich eine Kurzform und eine vollständige Form, wobei er jedoch -die anderen im folgenden beschriebenen Formen unberücksichtigt läßt. Zeichen, die sowohl eine vollständige als auch eine Kurzform haben, werden in der Kurzform gespeichert, wenn ein anderes Zeichen folgt und in der vollständigen Form, wenn eine Leerstelle folgt. Chaudhry erweitert auch die Anforderungen, in dem er einen 6-bit-Code verwendet mit einem 7. bit als Kontrollbit« Obwohl vorgeschlagen wird, daß andere Codierungen verwendet werden können, wird in diesem Patent kein ,System genannt, das die Übertragung, und den Empfang vollständiger arabischer-farsischer Sprachen über ein Standard-Fernschreibsystem ermöglicht.
In dem U.S. Patent 35Ii 968 (Hanson) ist ein Setzsteuerungssystem beschrieben, in welchem 6-bit Signale, die arabische Zeichen und Leerstellen darstellen, in einem ersten'Schieberegister ge-
9G9822/0551
U - 175
25.10.1978
speichert und sukzessive decodiert «/erden, um die Daten in eine von drei Klassen zu klassifizieren, die in einem zuzeiten Schieberegister gespeichert sind. Ein zweiter Decoder bestimmt die Form der Zeichen aufgrund der Zeichenklassifizierung der unmittelbar vorhergehend und der unmittelbar nachfolgend auftretenden Zeichen. Diese Information sowie die Zeichenform werden verwendet, um einen Speicher zu adressieren, der dann das Zeichen in der gewünschten Form auswählt.
Das U.S. Patent 3 938 099 (Hyder) beschreibt ein Drucksystem, in welchem arabische Zeichen unter Verwendung von 8 bits und 11 bits codiert werden. Eine Analysiereinrichtung ist vorgesehen, die die Uerkettungseigenschaften analysiert, die auf jedes Zeichen anwendbar sind, wobei Bbolsche Gleichungen verwendet werden, die auf der Kenntnis der Variablen der vorhergehenden und der nachfolgenden Zeichen beruhen. Diese Information der Analysiereinrichtung zusammen mit dem Zeichendarstellungscode und dem zusammengesetzten Code wird dann in einen Code verwandelt, der zum Antrieb der Ausgabeeinheiten geeignet ist.
Weitere Bemühungen sind unternommen worden, um die Zahl der auf Maschinen, u/ie beispielsweise auf Fernschreibern, benötigten Zeichen dadurch zu vermindern, daß man einige arabische Zeichenformen und einige arithmetische Zeichen und Satzzeichen wegläßt, so daß die sich ergebende Zahl der Zeichen und Steuerbefehle in einem binären, üblichen 5-bit-Baudot-Code aufgenommen
worden werden kann. Weiterhin ist bereits vorgeschlagen/, das englische (d.H. das lateinische) Alphabetzum übertragen der arabischen Schriftzeichen auf englichen Fernschreibern zu verwenden. Keinerder beschriebenen Vorschläge löst das Problem, arabische Schriftzeichen, Ziffern, arithmetische Zeichen etc. mit guter Qualität über die internationalen Austauschsysteme zu übertragen, die beim Telex- und beim Gentex-System verwendet werden und die ein standardisiertes, binäres 5=bit=Baudot-Codier-
909822/0S51
2847Q85
25.10.197B * J* - ff -
U - 175 . J.
system verwenden. Das Weglassen von Zeichen setzt die Qualität der arabischen Sprachübertragung wesentlich herab. Dabei kann ein Teil der Ausdrucksfähigkeit verlorengehen oder die Sprache wird zumindestens schwer lesbar.
Um die gewünschte Qualität mit den bisher bekannten Verfahren zu erreichen, benötigte man wesentlich mehr als 5 binäre Bits zur Codierung der arabischen Zeichen. Als Folge davon wird bei der Speicherung von arabischen Schriften wesentlich mehr Speicherplatz benötigt als bei der Speicherung von lateinischen Schriften. Außerdem wird die Übertragungsenergie, die zur Übertragung einer bestimmten Nachricht erforderlich ist, wesentlich verringert, wenn die Zahl der Bits pro Zeichen verringert wird. Eine solche Verringerung ist daher wünschenswert.
Es ist Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung zur Durchführung dieses Verfahrens zu schaffen, mit denen die Übertragung arabischer Zeichen mit einer digitalen Codier- und Decodiertechnik möglich ist, bei welcher jedes Zeichen in einem binären 5-bit-Code codiert und in diesem übertragbar ist.
Diese Aufgabe wird beim Verfahren der eingangs beschriebenen Art erfindungsgemäß dadurch gelöst, daß man eine Folge von Zeichencodierungen erzeugt, die jeweils einer Form jedes Zeichens der Sprachdaten entsprechen, daß man die Daten klassifiziert und dabei jedes Zeichen der Daten einer von mindestens 3 vorbestimmten Gruppen zuordnet, daß man in die Folge der Zeichencodierungen eine von mindestens 3 Identifikationscodierungen einfügt, die mindestens eine nachfolgende Zeichencodierung als zu der vorbestimmten Gruppe gehörig identifizieren, daß man die Folge der Codierungen speichert, daß man die
909822/0551
U - 17b . JIQ.
25.Ιο.1978 - 1/6 -
Codierungen nacheinander aus dem Speicher ausliest und die Form jedes durch eine Zeichencodierung dargestellten Zeichens als Funktion der Identität des Zeichen selbst sowie des vorhergehenden und des nachfolgenden Zeichens bestimmt, und daß man die Daten mit den Zeichen in ihrer richtigen Form und in ihrer richtigen Position darstellt, wobei die Position von zwei aufeinanderfolgenden Zeichen in Abhängigkeit von den ausgelesenen Zeichencodierungen und der bestimmten Zeichenform identisch sein kann.
Gemäß einer bevorzugten Ausführungsform ist vorgesehen, daß man die Daten dadurch klassifiziert, daß man jedem Zeichen in einer Gruppe eine bestimmte 5-bit-Codierung zuordnet, wobei Zeichen in verschiedenen Gruppen gleiche 5-bit-Codierungen zugeordnet sind, daß man eine 5-bit-Identifikationscodierung erzeugt, die angibt, welcher Gruppe ein Zeichen zugeordnet ist, und daß man die 5-bit-Identifikationscodierung in die Folge der 5-bit-Zeichencodierungen immer dann vor eine Zeichencodierung einschiebt, wenn das dieser Zeichencodierung entsprechende Zeichen einer anderen Gruppe zugeordnet ist als das der vorhergehenden Zeichencodierung entsprechende Zeichen.
Bei einem Verfahren zum Betrieb eines Fernschreibsystems für arabisch-farsische Sprachen kann zusätzlich vorgesehen sein, daß man eine Folge von 5-bit-Zeichencodierungen erzeugt, in der jede 5-bit-Zeichencodierung einen arabischen Buchstaben und ein Satzzeichen, eine Ziffer oder ein diakritisches Zeichen darstellt, wobei die 5-bit-Zeichencodierung jedes arabischen Buchstabens diesen ungeachtet seiner Form wiedergibt, daß man in die Folge der Zeichencodierungen eine von mindestens 3 5-bit-Identifikationscodierungen einfügt, welche die unmittelbar folgende Zeichencodierung als zu einer vorbestimmten
909822/0551
U - 173 ää
25.10.1978 ''/l'
Zeichengruppe gehörig identifiziert, daß man die Folge von 5-bit-Zeichencodierungen an einen entfernten Ort überträgt, daß man die Folge von 5-bit-Zeichencodierungen an dem entfernten Ort aufnimmt und jede 5-bit-Zeichencodierung kurzzeitig speichert, daß man das durch die gespeicherte Zeichencodierung dargestellte Zeichen als eines aus der Zahl der
möglichen Zeichen klassifiziert, daß man für jede einen arabischen Buchstaben darstellende 5-bit-Zeichencodierung eine Formcodierung erzeugt, die die Form des durch die 5-bit-Codierung dargestellten Buchstabens als Funktion der der gespeicherten 5-bit-Codierung mittelbar vorangehenden bzw.
nachfolgenden Zeichen angibt, und dau man die aufgenommene Folge der 5-bit-Codierungen als arabische Zeichen in richtiger Form und Position sowie als andere durch die 5-bit-Codierungen spezifizierte Zeichen in Abhängigkeit von den 5-bit-Zeichencodierungen und den Identifikationscodierungen wiedergibt.
Diese Aufgabe wird ferner durch eine Vorrichtung der eingangs beschriebenen Art gelöst, die gekennzeichnet ist, durch eine erste Codiereinrichtung zur Erzeugung einer Folge von Zeichencodierungen, die ju/eils einer Form jedes Zeichens der arabisch-farsischen Sprache entsprechen, durch eine Einrichtung zum Einschieben einer von mindestens 3 Identifikationscodierungen in eine Folge von Zeichencodierungen, die angibt,
daß zumindest eine nachfolgende Zeichencodierung einer von mindestens 3 Zeichengruppen zuzuordnen ist, die der eingeschobenen Identifikationacodierung entspricht, durch Speicher zur Speicherung der Codierungen wären mindestens zwei aufeinanderfolgenden Zeichen, durch eine auf die beiden gespeicherten Codierungen ansprechende Einrichtung zum Klassifizieren des ersten gespeicherten Zeichens als eines einer Vielzahl vorbestimmter Zeichentypen, durch eine zweite Codiereinrichtung
909822/05S1
U - 175
25.10.197H
zur Erzeugung einer zweiten Codierung, die das erste' gespeicherte Zeichen abhängig von der Klassifizierung des Zeichentyps des unmittelbar vorhergehenden und des nachfolgenden Zeichens als eines einer Mehrzahl arabischer Buchstabenformen identifiziert, durch eine Einrichtung für den Zugriff zu Daten in einem Speicher, der Daten enthält, die die richtige Form arabischer Zeichen in Abhängigkeit der zuerst gespeicherten Zeichencodierung und der zweiten Codierung angeben, und durch eine Einrichtung zur Darstellung jedes durch die Daten in dem Speicher (224) repräsentierten arabischen Zeichens in richtiger Form und Position mit Mitteln, die in Abhängigkeit von der Klassifizierungseinrichtung, die angibt, wann ein darzustellendes Zeichen den Typ eines nicht mit einem Vorschub korrelieren Zeichens hat, aufeinanderfolgende Zeichen gegebenenfalls in derselben Position darstellen.
Die Erfindung sieht auch eine Vorrichtung zur Übertragung arabisch-farsischer Sprachen per Fernschreiber vor, welche dadurch gekennzeichnet sind, daß die erste Codiereinrichtung eine Folge von 5-bit-Zeichencodierungen erzeugt, von denen jede einen arabischen Buchstaben der arabisch-farsischen Sprache oder ein Zeichen einer Anzahl von Standard-Fernschreibzeichen, nämlich Ziffern, Satzzeichen oder Steuersignalen darstellt, wobei die jeweilige Form eines arabischen Buchstabens, unberücksichtigt bleibt, daß die Einrichtung zum Einschieben der Identifikationscodierungen eine von mindestens 3 5-bit-Identifikationscodierungen in die Folge von 5-bit-Zeichencodierungen einschieben kann, um zumindest eine der nachfolgenden 5-bit-Zeichencodierungen als zu einer von mindestens 3 vorbestimmten Zeichengruppen gehörig zu identifizieren, die der eingeschobenen 5-bit-Identifikationscodierung entspricht, daß der Speicher die 5-bit-Codierungen mindestens
909822/0SS1
U - 175 Λ3
25.±0.1970
während zwei aufeinanderfolgender Zeichen speichert, daß die Klassifizierungseinrichtung auf die gespeicherte 5-bit-Codierung anspricht und jedes empfangene Zeichen als eines einer Menge eines vorbestimmten Zeichentyps klassifiziert, daß die zweite Codiereinrichtung eine zweite Codierung erzeugt, die jeder ein arabisches Zeichen darstellenden, gespeicherten 5-bit-Codierungen in Abhängigkeit des klassifizierten Typs des unmittelbar vorhergehenden und des unmittelbar nachfolgenden Zeichens eine Form zuordnet, und daß die Einrichtung zur Darstellung der Zeichen die von der 5-bit-Zeicheneodierung dargestellten arabischen Zeichen in Abhängigkeit von der Identifikationscodierung, der zweiten Codierung und der gespeicherten 5-bit-Zeichencodierung in der richtigen Form darstellt.
Weitere vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche. '
Mit dem erfindungsgemäßen Verfahren und der Vorrichtung zur Durchführung dieses Verfahrens ist es möglich, arabisch-farsiche Sprachen über die bestehenden internationalen Fernschreibnetze zu übertragen, wobei nur ein Minimum an zusätzlicher Ausrüstung notwendig ist und insbesondere der dort verwendete Code verwendet werden kann.
Das neue Verfahren und die Vorrichtung zur Durchführung des Verfahrens kann für verschiedene Zwecke verwendet werden und ist nicht ausschließlich für die Übertragung per Fernschreiben vorgesehen. Es ist auch möglich, dieses Verfahren und die zugehörige Vorrichtung zur Übertragung von Nachrichten zu verwenden, die in verschiedenen Sprachen vorliegen und verschiedene Schriftzeichen verwenden.
909322/0551
U - 175 .JlL.
25.10.1978 ' - M, -
Das erfindungsgemäße Verfahren und die zugehörige Vorrichtung ermöglichen es ,bis zu 4 verschiedene Formen pro Buchstaben der arabisch-farsischen Sprachen und zusätzlich die Ziffern 0 bis 9 , verschiedene Fernschreibsteuersignale, die wichtigsten arithmetischen Zeichen und eine ausgewählte Anzahl von Satzzeichen und diakritischen Zeichen zu übertragen. Die übertragenen und empfangenen Codierungen verwenden den stadardisierten, binären 5-bit-Baudot-Code. Daher können die internationalen Telex- und Gentex-Netze zur Übertragung vollständiger Texte in arabisch-farsischen Schriftzeichen verwendet werden, ohne daß hinsichtlich der Qualität der zu übertragenden Nachricht Kompromisse eingegangen werden müssen. Bei der Verarbeitung arabisch-farsischer Texte ergeben sich dadurch wesentliche Ersparnisse hinsichtlich der benötigten Codierungswörter, der Bits zur Übertragung einer Nachricht und des Speicherplatzes .
Bei einem Ausführungsbeispiel der Erfindung werden verschiedene Eigenschaften der arabisch-farsischen Sprachen verwendet, um eine vollständigere Reproduktion aller arabischen Zeichen, aller benötigter Ziffern, aller Satzzeichen etc. zu erreichen, die zur vollständigen Übertragung von arabisch-farsischen Sprachen per Fernschreiber unter Verwendung des standardisierten 5-bit-Cidcs benötigt werden. Die sprachlichen Eigenschaften, die dabei verwendet werden, sind die folgenden:
1. Obwohl es mehr als 60 Zeichen und Zeichenformen (oder Variationen) in den arabisch-farsichen Sprachen gibt, gibt es 20 Basisbuchstaben oder Zeichen in den arabischfarsischen Sprachen, von denen einige je nach Art des vorangehenden oder des folgenden Zeichens und in Abhängigheit von dem verwendeten Schreibstil verschiedene Formen
909822/0551
28A7085
25.10.1978 - ty -
annehmen. Man muß daher für jedes arabische Zeichen nur ein Codewort übertragen, ii/enn an dem Empfangsdrucker oder an der Empfangsanzeige eine Logik vorgesehen ist, die die benötigte Form aussucht und dem Drucker oder der Anzeigeeinheit ein entsprechendes Steuersignal zuführt.
2. Die 6 arabischen Buchstaben in Figur 9a sind dieselben wie die in Figur 9b, sie unterscheiden sich von diesen lediglich dadurch, daß die Buchstaben der ersten Gruppe einen Punkt oberhalb des Buchstabens aufweisen. Daher kann ein Buchstabe der ersten Gruppe erkannt werden, wenn ein Code für den Punkt empfangen wird, dem ein Code des entsprechenden Buchstaben folgt. Auf diese Weise kann die Anzahl der erforderlichen Codewörter weiterhin um 5 reduziert werden.
3. Arabische Buchstaben, Ziffern, Satzzeichen, arithmetische Zeichen und diakritische Zeichen einschließlich des Punktes oberhalb ausgewählter Buchstaben sowie Fernschreibersteuersignale können in die folgenden Typen klassifiziert werden:
Typ A
Zeichen,die sich mit dem folgenden Zeichen in einem gegebenen Wort und mit dem vorhergehenden Zeichen verbinden,
Typ B
Zeichen, die sich nicht mit dem folgenden Zeichen in einem gegebenen Wort verbinden, jedoch mit dem vorangehenden Zeichen,
909822/0551
28A7085
25.10.1978 ' //Hf' -
Zeichen, die sich weder mit dem voranstehenden noch mit dem folgenden Zeichen verbinden. Diese Zeichen umfassen auch Ziffern, arithmetische Zeichen und Satzzeichen.
Typ D
Diese Zeichen führen zu keinem Vorschub der Druckwalze oder der Anzeige; es handelt sich dabei um diakritische Zeichen und um Hoch- und TiefStellungssignale,.
Es handelt sich hierbei um Fernschreibersteuersignale, wie beispielsweise "wer sind sie", "hier ist", Glockenzeichen, Wagenrücklauf und Zeilenvorschub.
4. Die diakritischen Zeichen sind oberhalb oder unterhalb der entsprechenden Zeichen angeordnet, ähnlich wie der Punkt oberhalb des Buchstabens. Wenn diakritische Zeichen gedruckt werden, führen sie zu keinem Vorschub des Druckzylinders, des Druckkugelkopfes oder der Katodenstrahlanzeige; außerdem beeinflussen sie die Wahl der Zeichenform nicht. Auch Fernschreibsteuersignale, wie beispielsweise die Steuersignale für Hochstellung und Tief stellung"/werden nicht gedruckt und führen zu keinem Vorschub der Druckwalze, des Druckkugelkopfes oder der Anzeige.
Gemäß einem weiteren bevorzugten Ausführungsbeispiel der Erfindung werden die in den §§ 1, 3 und 4 beschriebenen Eigenschaften der arabisch-farsischen Sprachen verwendet, um die Gesamtzahl der Codcwörter zu reduzieren, die benötigt wird, um die gesamte arabisch-farsische Sprache zu codieren. Weiterhin können zusätzliche Codewörter verfügbar gemacht werden,
909822/0551
/If-
U - 175
25.1Ü.1978
in dem man mindestens 3 Codewörter als sogenannte "Level-Indikatoren" oder "Höhen-Indikatoren" oder "Niveau-Indikatoren" verwendet. Wenn solche als Niveau-Indikator dienende Codierwörter in einer Folge von Zeichenkodierungen auftreten, dann geben Sie an, daß die in der Folge unmittelbar anschliessenden Codierungen einer bestimmten Zeichengruppe zugehören. Auf diese Weise kann ein 5-bit-Code verwendet M/erden, um bis zu 93 Zeichen zu codieren (96 - die 3 Niveau-Codierungswörter). Auf diese Weise können die vollständige arabischefarsische Sprache und andere Zeichen, wie Fernschreibsteuersignale, Ziffern etc. codiert werden.
Zusätzlich ist im Rahmen der vorliegenden Erfindung eine Technik vorgesehen, durch welche die Zahl der Tasten auf der Tastatur einer arabisch-farsischen Schreibmaschine oder eines Fernschreibers verringert werden kann. Dies wird erreicht, in dem man bei Zeichen, die in mehreren Formen auftreten können, jeweils nur eine Form auf der Tastatur vorsieht. Ein gemäß den obenbeschriebenen Prinzipien arbeitender Arabisch· Adapter wird verwendet, um die richtige Form des Zeichens zu bestimmen,und auf diese Weise kann trotz der geringeren Anzahl der'Tasten die vollständige arabisch-farsische Sprache erzeugt werden. Natürlich wird auf diese Weise die Tastatur erheblich vereinfacht. Dadurch wird die Arbeit der Bedienungsperson erleichtert, sowohl im Hinblick auf die Betätigung der Tastatur als auch im Hinblick auf die erforderliche Lernarbeit.
Im Rahmen der Erfindung werden auch Steuerungen beschrieben, die es ermöglichen, eine mittels einer arabisch-farsischen Tastatur betätigbare Druckvorrichtung als Fernschreiber oder
909822/0551
U - 175 . 70«
25.10.1978 - y& -
als Schreibmaschinentastatur zu verwenden. Es wird ferner vorgeschlagen, Vorrichtungen für lateinische und für die arabisch-farsische Schrift mit peripheren Einheiten zu betreiben, beispielsweise mit einem Lochstanzer.
Die Erfindung stellt unter Verwendung der oben beschriebenen Eigenschaften ein Verfahren und eine Vorrichtung zur Durchführung dieses Verfahrens zur Verfugung, mit denen das vollständige arabische Alphabet, die Zahlen, die wesentlichen arithmetischen Zeichen, ausgewählte Satzzeichen, diakritische Zeichen und Fernschreibsteuersignale in einem binären 5-bit-Baudot-Code codiert werden können. Weiterhin ist eine Vorrichtung beschrieben, die einem Drucker oder einer Anzeigeeinheit zugeordnet werden kann, so daß alle arabischen Buchstabenformen entsprechend angezeigt oder gedruckt werden können.
Die nachfolgende Beschreibung bevorzugter Ausführungssformen der Erfindung dient zusammen mit der Zeichnung der näheren Erläuterung. Es zeigen:
Figur 1: eine Blockschaltung eines Fernschreibsystems gemäß der Erfindung zur Übertragung und Aufnahme arabischfarsischer Sprachen mit Hilfe eines 5-bit-Standard-Codes;
Figur 2: eine Blockschaltung der Arabisch-Adapter-Schaltung der Figur 1 mit mehr Einzelheiten;
Figur 3: eine Blockschaltung einer Codierschaltung, die automatisch einen Punkt- und einen Buchstabencode erzeugt, wenn bestimmte Typen vom Benutzer verlangt werden;
909822/0551
U - 175 25.10.1978
Figur 4: eine bildliche Darstellung einer Fernschreibtastatur zur erfindungsgemäßen Übertragung und Aufnahme arabischer Sprachen;
Figur 5: eine bildliche Darstellung einer abgewandelten Fernschreibtastatur, die neben den arabischen Typen auch Typen mit lateinischer Schrift enthält, wobei die Zuordnung so getroffen ist, wie es in der Tabelle III angegeben ist;
Figur 6: eine Tabelle der Klassifikationsgruppen der arabischfarsischen Fernschreibzeichen« die eine Art der Typenklassifikation angibt, wie sie in dem Ausführungsbeispiel der Figur 1 Verwendung findet;
Figur 7: eine Tabelle, die die Regeln zusammenstellt, nach welcher gemäß der vorliegenden Erfindung die Buchstabenform ausgewählt wird;
Figur 8: eine Tabelle mit einem Beispiel einer Baudot-Codierung arabisch-farsischer Zeichen gemäß einem bevorzugten Ausführungsbeispiel der Erfindung;
Figur 9a und 9b: zwei Gruppen arabisch-farsischer Zeichen, die bis auf einen Punkt oberhalb jedes Zeichens gleichsind;
Figur 10: eine Tabelle mit einem weiteren bevorzugten Ausführungsbeispiel einer Baudot-Codierung arabischfarsischer Zeichen, bei welcher ein Dreier-Code benutzt wird und bei welchem die Zeichen in drei Code-Gruppen eingeordnet werden;
909822/0551
U - 175 · 50·
25.10.197a - y6 -
Figur Ii: eine Blockschaltung eines Ausführungsbeispiels der Erfindung, welches für bis zu 3 Zeichengruppen verwendbar ist;
Figur 12: eine schematische Daraufsicht auf eine eingeschränkte Eingabetastatur gemäß der Erfindung und
Figur 13: eine Blockschaltung eines Ausführungsbeispiels eines Druckersystems für arabisch-farsische Zeichen, welches die Eingabetastatur der Figur 12 verwendet.
Es gibt im wesentlichen 28 arabische Buchstaben oder Zeichen, jedoch einige Buchstaben können abhängig von ihrer Position in bezug auf andere Zeichen in bis zu vier verschiedenen Formen auftreten. Wie aus Figur 8 ersichtlich, gibt es Zeichen, die vier verschiedene Formen annehmen können, während andere in drei, wieder andere in zwei und wieder andere schlieülich in nur einer Form auftreten können. Die Form des Zeichens ergibt sich entsprechend der Logik und der Klassifizierung, die in den Figuren 6 und 7 angegeben ist. Entsprechend einem bevorzugten Ausführungsbeispiel der Erfindung werden arabische Buchstaben, Zahlen, arithmetische Zeichen, Satzzeichen und diakritische Zeichen (einschlielilich des Punktes oberhalb bestimmter Buchstaben) sowie die Steuerbefehle des Fernschreibers in 5 verschiedene Fernschreiberzeichen A, B, C, D und 0 klassifiziert, die oben und in Figur 6 definiert sind.
Die Form eines arabisch-farsischen Buchstabens kann eine von 4 Möglichkeiten aufweisen: Die Anfangsform, die Mittelform, die Endform und die unabhängige Form. Die Form des Buchstabens wird in dem bevorzugten Ausführungsbeispiel entsprechend der Regeln in Figur 7 logisch bestimmt, wobei das (+)-Zeichen
"oder" bedeutet.
909822/0SS1
U - 1/5 · rf'i·
25. Iu.1978 * - 2/ -
Figur 1 stellt ein erfindungsgemäßes Fefnschreibsystem dar, welches die angegebenen Kriterien benutzt, um arabisch-farsische Sprachen mit der Technik eines 5-bit-Standardcodes zu übertragen und zu empfangen. Eine Tastatur 11 ist über eine Leitung
12 mit einem konventionellen 5-bit-Baudot-Codierer 13 verbunden. Die Tastatur 11 kann eine englische Standardtastatur sein, die mit arabischen Buchstaben, den Zahlen, den arithmetischen Zeichen, den ausgewählten Satzzeichen und den diakritischen Zeichen sowie den Fernschreibsteuerbefehlen versehen ist, wie dies beispielsweise aus Figur 8 ersichtlich ist. Der Codierer 15 codiert die Buchstaben in einem binären Baudot-Code mit 5 bit. In Figur 8 ist ein Beispiel angegeben, wie die Tastaturzeichen in einem binären Baudot-Code mit 5 bit verschlüsselt werden können.
Der 5-bit-Codierer 13 ist über eine Leitung 14 mit einem konventionellen Speicher oder einem Lochstreifenstanzer 15 verbunden, der über eine Leitung 129 mit einer geeigneten Speicher- oder Lochstreifenstanzsteuerung 16 verbunden ist.. Der 5-bit-Codierer Ii ist weiterhin über eine Leitung 19 mit einem konventionellen Modem 111 verbunden, welches seinerseits mit einem konventionellen Übertrager 117 sowie einem konventionellen Empfänger 113 verbunden ist.. Der Übertrager und der Empfänger werden mittels einer konventionellen Rufschaltung 119 über eine Leitung 116 gesteuert, wie dies aus der Zeichnung erkennbar ist.
Modem 111 und Speicher oder Lochstanzer 15 sind über Leitungen 126 und 128 verbunden. Speicher oder Lochstanzer 15, Codierer
13 und Modem 111 sind auch mittels Leitungen 17, 18 und 110 mit einem Schalter 125 verbunden. Schalter 125 verbindet die 3 Einheiten 13, 15. bzw, 111 selektiv entweder mit einer
909822/0551
QlP).
25.10.1978
U - 173 t QO _ 2/ -
Schreib- oder Anzeigeeinheit 124 für die englische oder eine andere Sprache oder mit einem Arabisch-Adapter 120, der nachfolgend ausführlich beschrieben wird. Der Arabisch-Adapter 120 ist mit einer Schreib- oder Anzeigeeinheit 122 für die arabische Sprache verbunden, beispielsweise mit einer konventionellen Katodenstrahlanzeigeeinheit oder mit einem konventionellen arabischen Fernschreiber.
Die Tastatur 11, der 5-bit-Codierer 13, der Speicher oder Lochstanzer 15, die zugehörige Steuerung 16, das Modem 111, der Empfänger 113, der Übertrager 117 und die Rufschaltung 119 bilden zusammen mit der Schreib- oder Anzeigeeinheit
124 für die englische oder eine andere Sprache eine Standardfernschreibeinheit der Weise, wie sie üblicherweise zur Übertragung der englischen Sprache oder einer anderen auf lateinischen Buchstaben basierenden Sprache Verwendung findet.
Der Unterschied in diesem System ist darin zu sehen, daß die Tastatur mit arabischen Buchstaben, Zahlen, arithmetischen Zeichen, Satzzeichen, diakritischen Zeichen und in einem Ausführungsbeispiel mit einer dritten Codierebene sowie mit Fernschreibsteuersignalen ausgestattet ist, wie es beispielsweise aus Figur 8 ersichtlich ist. Außerdem wäre der Schalter
125 bei einm einsprachigen System normalerweise unnötig.
Der in Figur 1 dargestellte Fernschreiber kann zum Senden oder Empfangen verwendet werden oder im rein lokalen Betrieb, wobei Daten weder ausgesandt noch empfangen werden. Im lokalen Betrieb wird der Übertrager 117 ausgeschaltet, so daß über Tastatur 11 eingegebene Daten nicht übertragen werden. Die Daten werden jedoch vom Codierer 13 in einen 5-bit-Baudot-Code umgeschrieben. Diese 5-bit-Codierungen werden je nach
909822/0551
U - 175 - 23 -
25.10.1978 ♦ 53#
der Stellung des Schalters 125 der Schreib- oder Anzeigeeinheit 124 oder dem Arabisch-Adapter 120 zugeführt.
Wenn man das System für die arabische Sprache verwenden will und der Benutzer die arabischen Typen auf der Tastatur 11 verwendet, dann wird der Schalter 125 in die in der Zeichnung dargestellte Stellung gelegt. Die auf der Tastatur 11 betätigten Tasten erzeugen für jede gedrückte Taste einen 5-bit-Code, der dem Arabisch-Adapter 120 zugeführt wird. Der Arabisch-Adapter übersetzt die 5-bit-Codes in 8-bit-Codes, in dem er zwei Bits hinzufügt, die die richtige Form des Buchstabens anzeigen/und ein weiteres Bit, welches anzeigt, ob der Buchstabe oben oder unten ist. Die zusätzlichen 2 Bits, die die Form des Buchstabens angeben, werden erhalten, indem man die vorstehend beschriebenen Eigenschaften der arabisch-farsischen Sprachen verwendet.
Wenn der Fernschreiber in Empfangsmode arbeitet und wenn der Schalter in der dargestellten Stellung steht, dann werden die vom Empfänger 113 über die Leitung 114 empfangenen Daten über das Modem 111 dem Speicher oder dem Lochstanzer 15 und dem Arabisch-Adapter 120 zugeführt. Entsprechend der Einstellung der Speicher- oder Lochstanzer-Steuerung 16 werden die eingehenden Daten entweder durch den Speicher gespeichert oder durch den Lochstanzer 15, und .zwar auf konventionelle Weise. Die.dem Arabisch-Adapter zugeführten Daten werden in der obenbeschriebenen Weise in ein 8-bit-Signal umgewandelt und ermöglichen die richtige
Darstellung der arabischen Zeichen auf der Schreib- oder Anzeigeinheit 122.
909822/0551
U - 175
25.10.1978 ftl -
Wenn der in Figur 1 dargestellte Fernschreiber im Sendemode arbeitet, wobei der Schalter 125 in der dargestellten Arabisch-Stellung steht, dann wird der Übertrager 117 eingeschaltet. 5-bit-Codes werden vom Codierer 13 sowohl dem Arabisch-Adapter als auch über das Modem 111 dem Übertrager 117 zugeführt. Das Modem kann die 5-bit-Codes stattdessen auch von dem Speicher oder dem Lochstanzer 15 über die Leitung 128 erhalten, wie dies bei typischen, konventionellen Fernschreibersystemen der Fall ist. Figur 8 zeigt ein Beispiel einer binären 5-bit-Baudot-Codierung der arabischen Sprache im Vergleich mit der Codierung der englichen Sprache auf einer Standard-Fernschreiber-Tastatur. Die Codierung bietet 32 Möglichkeiten, jedoch können wesentlich mehr Zeichen übertragen werden,
da die Tasten in einer unteren und einer oberen Stellung beZeilen
tätigt werden können. Die in den/32 bis 38 aufgeführten Zeichen haben keine separaten Codierungen, sondern werden aus einem Punkt-Code (00000) und einem darauffolgenden, entsprechenden Zeichencode gebildet. Aus der Darstellung der Figur 8 erkennt man, daß auf der Tastatur alle arabischen Zeichen und Zeichenformen neben den Ziffen, den arithmetischen Zeichen, den Satzzeichen und diakritischen Zeichen und neben den Steuerbefehlen eines Standard-Fernschreibers vorgesehen sind. Die Codierung für die in den Zeilen 33 bis 38 aufgeführten Zeichen erhält man, indem man zunächst die Taste für den Punkt betätigt (und dadurch die Codierung erzeugt) und dann die Taste für das gewünschte Zeichen betätigt, oder indem man nur eine Taste betätigt und automatisch beide Codes erzeugt, wie dies im Folgenden beschrieben ist.
Man erkennt aus der Darstellung der Figur 8, daß die Zeichen, die mehr als eine Form aufweisen können, nur einer Tastenposition auf der Tastatur zugeordnet sind und daher auch nur einer 5-bit-Codierung entsprechen. Eine 5-bit-Codierung
909822/0551
25.10.1978 . 55
stellt daher ein Zeichen dar, daß bis zu 4 verschiedenen Formen annehmen kann, wobei in der 5-bit-Codierung selbst nichts enthalten ist, was über die Form des Zeichens eine Information geben könnte. Die Empfangsstation des Systems (d.h., ein entfernter Empfänger oder ein lokaler Drucker) müssen daher die Form des Buchstabens anhand der obenbezeichneten Kriterien bestimmen.
Das arabische Zeichen in der Tiefstellung der Tastatur, das in Figur 8 mit 1 bezeichnet ist, entspricht beispielsweise dem englichen Q (vergleiche beispielsweise Figur 5). Das arabische Zeichen der mit 1 bezeichneten Stellung in der Figur 8 dargestellten Tafel und das englische Q werden daher mit derselben Codierung codiert, d.h. 10111. Wenn also das arabische Zeichen in der Position 1 der Tafel der Figur 8 auf der Tastatur der Figuren 1 und 5 betätigt wird, dann erzeugt der Codierer 13 eine 10111-Codierung. Wenn der Schalter 125 in der dargestellten Position steht, dann wird eines der beiden verschiedene Formen aufweisenden arabisch-farsischen Zeichen entsprechend Nr. 1 in Figur 8 dargestellt werden, wobei es von der Stellung dieses Zeichens relativ zu anderen Zeichen abhängt, welche der beiden Formen gewählt werden. Wenn der Schalter 125 den Codierer direkt mit der Schreiboder Anzeigeeinheit 124 verbindet, wird der Buchstabe Q dargestellt. Man erkennt also, daß der arabische Adapter 120 aufgrund der obenbeschrieben Kriterien die Entscheidung fällt, welches arabische Zeichen dargestellt wird, obwohl die empfangene 5-bit-Codierung keine direkt Information hinsichtlich der richtigen Form des Zeichens liefert.
S09822/0551
U - 175
25.10.1978
Ein Ausführungsbeispiel des Arabisch-Adapters 120 der Figur 1 ist ausführlicher in Figur 2 dargestellt. Der Arabisch-Adapter verwendet bei der Übertragung und beim Empfang aller arabisch-farsischer Sprachen die Standard-5-bit-Baudot-Codierung und ermöglicht es, alle arabischen Zeichen beim Empfang des Übertragungssystems in der richtigen Form wiederzugeben. Um dies zu erreichen, führt die Schaltung der Figur 2 folgende Schritte durch:
(A) Identifizierung einer Zeichenfolge als hochgestellt oder tiefgestellt,
(B) Identifizierung des Typs jedes Zeichens einschließlich der Feststellung, ob das Zeichen mit oder ohne Wagenvorschub darzustellen ist oder ob ein Wagenvorschub ohne Zeichendarstellung vorliegt,
(C) Verwendung der Informationen (A) und (B) zusammen mit einer Verzögerung, so daß die Form jedes Zeichens zum Zeitpunkt des Drückens festgestellt wird. Wegen der Verzögerung erfolgt der Ausdruck eines Zeichens im allgemeinen gegenüber dem Empfang des Zeichens um ein Zeichen versetzt.
Wie man aus Figur 2 erkennt, umfaßt der Arabisch-Adapter
Zweifach-Wählschalter 25 und 28, die die codierte Zeicheninformation bzw. eine Zeichenindikator-Information (ein Markierungssignal IND), welches als Zeitsignal für die empfangene Information dient) entweder von einer lokalen Tastatur oder einem lokalen Speicher oder von einem Übertragungssystem auswählen. In einer Stellung der Schalter 25 und 28 werden beispielsweise eine 5-bit-ßaudot-Codierung und ein Indikator-
9Q9822/0SS1
U - 175
25.10.1978 * AT · - 27 -
signal für ein gültiges Zeichen (die Markierung) vom Modem 111 des in Figur 1 dargestellten Übertragungssystems aufgenommen, In der anderen Stellung der Schalter 25 und 28 werden das Zeichen und das Inddkatorzeichen von dem der Tastatur zugeordneten Codierer 13 der Figur 1 aufgenommen.
Das ausgewählte Zeichen wird als 5-bit-Signal über eine Leitung 26 einem konventionellen 5-bit-Paraltel-ein/Paral]el-aus-Schieberegister 210 zugeführt. Das Ausgangssignal des Schieberegisters 210 wird einem zweiten identischen Schieberegister 220, einer Erkennungsschaltung 218 für die Hoch- und Tiefstellung sowie dem Adressiereingang eines Lesespeichers (ROM) 231 zugeführt.
Das vom Schalter 28 ausgewählte Indikatorsignal eines gültigen Zeichens wird über eine Leitung 29 einer konventionellen Verzögerungsschaltung 213, wie beispielsweise einem Flip-Flop, und dem einen Eingang eines Gatters 216 zugeführt. Das Ausgangssignal der Verzögerungsschaltung 230 wird über eine Leitung 212 dem Schiebeeingang des Schieberegister 210 und einer zweiten konventionellen Verzögerungsschaltung 214 zugeführt. Das Signal der zweiten· Verzögerungsschaltung 214 wird an eine dritte konventionelle Verzögerungsschaltung 222 und einen Eingang eines konventionellen logischen Gatters 235 mit drei Eingängen geleitet. Das Ausgangssignal der Verzögerungsschaltung 220 wird dem Zeiteingang eines Registers 227 und einem Eingang eines logischen Gatters 247 zugeführt.
Das CHANGE-Ausgangssignal der Erkennungsschaltung 218, welches angibt, daß ein Wechsel vom hochgestellten zum tiefgestellten Zustand oder umgekehrt stattgefunden hat, wird einem Eingang dee Gatter· 235, einem invertierenden (logisch negativen! Eingang des Cattere 216 und je einem Eingang von 3 konventionellen logischen Gattern 243, 245 und 247 (beispielsweise und'
U - 175
25.10.1978 ·
Gatter) zugeführt. Das Ausgangssignal des Gatters 216 wird über eine Leitung 217 dem Zeit- oder Schiebereingang des Registers 220 zugeleitet. Die Ausgangssignale der Gatter 243, 245 und 247 werden der Schreib- oder Anzeigeeinheit 122 (Figur 1) als Indikatorsignal (INDj, als Vorschubsignal (CARRFEED) bzu/. als Drucksignal (PRINT) zugeführt. Ein Lesespeicher 224 empfängt ein 8-bit-Adressierungssignal (das verzögerte Zeichen, ein Signal STATE, Angabe der Hoch- oder Tiefstellung sowie ein 2-bit-Signal MODE zur Angabe der Zeichenforni) und liefert eine 8-bit-Zeichencodierung an das konventionelle 8-bit-Register 227. Das Ausgangssignal CHAR des Registers 227 ist die Codierung, die feststellt, welche Zeichenform dargestellt wird.
Der Lesespeicher 231 empfängt eine 6-bit-Information, welche die letzte empfangene 5-bit-Zeichencodierung und das laufende STATE-Signal für die Hoch- bzvi/. Tiefstellung umfaßt, und liefert eine 4-bit-Information, die angibt, welchen Typ das empfangene Zeichen hatte (TYPE), ob ein Vorschub stattfinden soll oder nicht (CARRIAGE) und ob ein Zeichen dargestellt werden soll (PRINT). Das ΤΥΡΕ-Signal ist eine 2-bit-Codierung, die sowohl einem Register 236 als auch einer logischen Schaltung 241 zugeführt wird. Das Zeichen kann vom Typ A,B, C oder 0 sein, wie das vorstehend beschrieben wurde (Typ D wird ausgeschlossen, da dieses ein Nichtvorschubsignal ist). Das CARRIAGE-Signal ist ein 1-bit-Signal, welches angibt, ob das laufende Zeichen mit einem Vorschub verbunden ist oder nicht. Das PRINT-Signal ist ein 1-bit-Signal, welches angibt, ob ein Zeichen gedruckt werden soll (beispielsweise Zeichen vom Typ 0 werden nicht gedruckt).
Das ΤΥΡΕ-Signal wird über eine Leitung 232 den Dateneingängen von 2 Stufen eines konventionellen 4-bit-ParalleL-ein/Parallel-aMs-
909822/0SS1
U - 175 ' * 59
25.IU.1978
Schieberegister 236 zugeführt. Die Ausgangssignale der ersten zwei Stufen M/erden über eine Leitung 238 den Eingängen der anderen zwei Stufen des Schieberegisters 236 zugeführt. Die Ausgangssignale dieser letzten beiden Stufen werden als PRECEDE-Signal der konventionellen logischen Schaltung 241 zugeleitet. Das ΤΥΡΕ-Signal wird den beiden anderen Eingängen der logischen Schaltung 241 als FOLLOW-Signal zugeführt. Die logische Schaltung 241 kann eine konventionelle logische Schaltung sein (beispielsweise eine Mehrzahl von AND-, OR-, NAND-°der NOR-Gattern) die in konventioneller Weise derart miteinander verbunden sind, daß sie die Gleichungen der Tabelle II lösen.Das sich ergebende MODE-Signal gibt auf diese Weise in 2 bits eine der 4 vorstehend diskutierten möglichen Formen eines Zeichens an.
Im Betrieb ermöglichen es die Schalter 25 und 28, 5-bit-Baudot-Zeichen und ein Indikatorzeichen für ein gültiges Zeichen entweder von einer lokalen Tastatur oder von einem Übertragungssystem auszuwählen. Das Übertragungssystem arbeitet in der üblichen Weise mit einem 5-bit-Baudot-Code.
Das Indikator-Signal für ein gültiges Zeichen wird üblicherweise in einem Fernschreibsystem erzeugt, um die Anwesenheit eines Zeichens anzuzeigen. Dieses Signal wird durch die Verzögerungsschaltungen 213, 214 und 222 verzögert, so daß eine gesteuerte Abfolge der Ereignisse in der unten beschriebenen Weise ermöglicht wird.
Die Erkennungsschaltung 218 zur Feststellung der Hochstellung oder der Tiefstellung prüft das zuletzt im Register 210 aufgenommene Zeichen und erzeugt 2 Ausgangssignale,, Das Zustands-
U - 175 -30* j
25.10.1978 - 3/1 -
Ausgangssignal STATE gibt an, daß alle Zeichen entsprechend dem so bezeichneten Binär-Zustand hochgestellt oder tiefgestellt sind, bis dieser Zustand geändert wird. Beispielsweise kann eine binäre 1 auf der Leitung 229 Hochstellung angeben, während eine binäre 0 die Tiefstellung anzeigt. Ein CHANGE-Signal auf der Leitung 219 zeigt eine Zustandsänderung an, wenn das zuletzt aufgenommene Zeichen ein Indikatorzeichen für Hoch- oder Tiefstellung war. Wenn das zuletzt aufgenommene Zeichen ein Indikatorzeichen für Hoch- oder Tiefstellung war (d.h., wenn die Taste, die gemäß der Angabe der Figur 8 Hochstellung oder Tiefstellung anzeigt, gedrückt worden ist), dann besteht die einzige Aktivität beim nächsten Zeichen darin, daß das Zustandssignal auf der Leitung 229 geändert und das Register 210 geladen werden, während das CHANGE-Signal auf Leitung 219 das Gatter 216 sperrt und eine Ladung des Registers 220 verhindert.
Wenn das letzte aufgenommene Zeichen kein Indikatorzeichen für Hoch- oder Tiefstellung ist, dann wird das als nächstes auf der Leitung 29 aufgenommene Indikatorzeichen durch das Gatter 216 hindurchgelassen und führt dazu, daß die im Register 210 gespeicherten Daten in das Register 220 transferiert werden.
Nach einer Verzögerung T wird das letzte über die Leitung 26 aufgenommene Zeichen im Register 210 in Abhängigkeit des verzögerten Impulses der Verzögerungsschaltung 213 eingelesen. Dieses letzte 5-bit-Zeichen bildet zusammen mit dem 1-bit-STATE-Signal eine 6-bit-Adresse für den Lesespeicher 231. Dieser Lesespeicher speichert für jede Adresse ein 4-bit-Wort. 2 Bits identifizieren die Form des Zeichens als O5, A5 B oder C5 wie dies in Figur 7 angegeben i s t $, ein Bit gibt an, ob rr.ic diesem Zeichen ein Vorschub verbunden ist5 und
25.10.1978
ein Bit gibt an, ob mit diesem Zeichen ein Druck- oder Darstellungsvorgang verbunden ist. Beispielweise erzeugt eine Leerstelle keinen Druck- oder Darstellungsvorgang, während die Hinzufügung eines Punktes oder eines diakritischen Zeichens einen Druck- oder Darstellungsvorgang auslöst, während damit kein Vorschub verbunden ist.
Nach einer weiteren Verzögerung T_ werden die TYPE-Daten im Register 236 durch das Signal des Gatters 235 weitergeleitet. Wenn das Signal im Register 210 ein Indikator-Signal für Hoch- oder Tiefstellung ist oder wenn mit dem Zeichen .
\schub verpunden isti
einschließlich des Hochstellungs- Tiefstellungs-Zustands kein Vor-\ was durch das CARRIAGE-Signal auf der Leitung 233 angezeigt wird, dann werden die Daten im Register 236 nicht vorgeschoben. Wenn die Daten vorgeschoben werden, dann werden die zwei binären Bits des·ΤΥΡΕ-Signals im Register 236 gespeichert und erscheinen an der Leitung 238, während die vorher an der Leitung 238 anstehenden Daten gleichzeitig an der Leitung 240 des Registers 236 erscheinen. Die resultierenden 4 Bits, die der logischen Schaltung 241 von dem Register 236 zugeführt werden, erzeugen ein MODE-Ausgangssignal. Das MODE-Ausgangssignal legt die Form des Zeichen fest und gibt an, ob es sich um ein Anfangszeichen, ein Mittelzeichen, ein Endzeichen oder ein unabhängiges Zeichen handelt (vergleiche Figur 7). Die 5-bit-Zeichencodierung des Registers 220, das MODE-Signal für die Zeichenform und das Indikatorsignal für Hoch- oder Tiefstellung bilden zusammen eine Adresse, welche aus einer geeigneten Speicherstelle des Lesespeichers 224 ein geeignetes Indikator-Signal für den Druck- oder Darstellvorgang des Zeichens in der richtigen Form liefert.
Als letzte Arbeitsschritte erfolgen ein Laden des Registers 227 nach einer zusätzlichen Verzögerung3zeit.T- und
U - 175 ♦ 3<
25.10.1978
eine Ausgabe des Zeichenindikators an eine Druck- oder Darstellvorrichtung über eine Leitung 248. Wenn das zuletzt aufgenommene Zeichen ein Indikator-Signal für Hoch- oder Tiefstellung war, dann sind das Indikator-Signal IND, das Vorschub-Signal CARRFEED und das Druck-Signal PRINT gesperrt.
Abhängig von der Art des verwendeten Druckers sind die Steuersignale für unabhängigen Vorschub und Druck nicht unbedingt notwendig, da diese Information mittelbar auch in dem 8-bit-Zeichen auf der Leitung 228 enthalten ist, welches dem Drucker zugeführt wird.
Die endgültige Auswahl von Daten mit bis zu 8 Bit (einige Systeme benötigen nur 7 Bit) für den Drucker wird mittels des Lesespeichers 224 erreicht. Die 8-bit-Adresse dieses Lesespeichers besteht aus 5 Bits, die über eine Leitung zugeführt werden,und der ursprünglich aufgenommenen Baudot-CocLierung entsprechen, einem Bit, welches über die Leitung 229 aufgenommen wird und die Hoch- oder Tiefstellung angibt, und einem 2-bit-MODE-Signal, welches über die Leitung 242 zugeführt wird und in der obenbeschriebenen Weise die richtige Form eines Buchstabens angibt.
Wie bereits erwähnt, gibt es 6 arabische Buchstaben oder Zeichen, die sich von anderen nur dadurch unterscheiden, daß sie einen Punkt oberhalb des Zeichens aufweisen. Bei der im Zusammenhang mit Figur 8 diskutierten Tastatur ist vorgeschlagen worden, daß diese mit einem Punkt versehenen Zeichen für eine folgende Decodierung dadurch codiert werden können, daß man eine "Punkt"-Taste auf der Tastatur vorsieht^ die man drücken muß, bevor man eine der 6„ bereits auf der Tastatur angeordneten "ungepunkteten" Zeichen drüekts wodurch
U - 175
25.10.1978
diese in "gepunktete" Zeichen transformiert werden. Alternativ kann man das Zeichen mit dem Punkt selbst auf der Tastatur anordnen, wie dies in Figur 4 dargestellt ist, und eine Schaltung wie die in Figur 3 dargestellte Schaltung vorsehen, die verwendet werden kann,, um automatisch den Punkt-Code und den Code des entsprechenden Zeichens zu erzeugen, sobald die entsprechenden Tasten gedruckt werden. Man erkennt, daß dies natürlich keine zusätzlichen Code-Wörter erforderlich macht, sondern daß man die Bedienung der Tastatur dadurch nur vereinfacht.
Figur 3 zeigt eine Schaltung, welche die Übertragung einer Punktcodierung (00000) ermöglicht, welcher die Codierung des entsprechenden Buchstabens folgt, wenn einer der einen Punkt aufweisenden Buchstaben gewählt wird. Wenn beispielsweise der dritte Buchstabe von links in der Figur 9a gewählt wird, dann werden 2 Zeichencodierungen übertragen, nämlich
(00000) für den Punkt und anschließend (10101) für das Zeichen, welches dem gepunkteten Zeichen (3.Zeichen von links in Figur 9a) entspricht.
Die 6 Eingangszeichen, deren erstes mit dem Bezugszeichen 301 bezeichnet ist, sind die 6 arabischen Buchstaben ohne Punkt. Sie werden in der obenbeschriebenen Weise in einem der Tastatur zugeordneten 5-bit-Codierer 305 verarbeitet. Dieselben 6 Buchstabenzeichen (diesmal jedoch mit Punkt) sind mit dem Bezugszeichen 302 bezeichnet. Durch 6 ODER-Gatter 303 gelangt bei jeder Betätigung der entsprechenden Tasten der Tastatur einer der 6 Buchstaben mit oder ohne Punkt in gleicher Weise in den Codierer 305. Gleichzeitig liefert ein ODER-Gatter 3Q4 mit 6 Eingängen ein Ausgangssignal an einer Leitung 319S .welches (J3n Eingang eines der
U - 175
25.10.1978
6 "gepunkteten" Buchstaben entspricht. Ein Zeichenindikatorsignal auf der Leitung 318 vom Codierer 305 wird über UND-Gatter 310 und 311 mit dem Signal von dem ODER-Gatter 304 bzw. dessen invertierter Form kombiniert. Die Signale der UND-Gatter 310 und 311 und das Signal vom Codierer 305 werden dann zusammen mit einer konventionellen Verzögerungsschaltung 312, einem UND-Gatter 308, einem UND-Gatter 306 und einem ODER-Gatter 313 benutzt, um die folgenden Schritte und Ausgangssignale zu erzeugen.
Wenn eine Taste für ein Eingangszeichen 301 ohne Punkt betätigt wird, dann wird das UND-Gatter 306 durchgestellt, so daß das 5-bit-Zeichen am Ausgang 307 erscheinen kann, wenn gleichzeitig ein einziges Zeichenindikator-Signal an einer Leitung 317 erscheint.
Wenn eine Taste für ein Zeichen 302 mit einem Punkt betätigt wird, dann erscheinen an der Ausgangsleitung 317 zwei aufeinanderfolgende Zeichenindikator-Signale, die zeitlich um die von der Verzögerungsschaltung 312 bestimmte Zeitspanne auseinanderliegen. Die Zeitspanne liegt in der Größenordnung von 10 bis 30 Millisekunden, so daß einerseits eine Trennung ermöglicht wird und andererseits der Bediener der Fernschreibeinrichtung noch nicht eine weitere Taste gedrückt hat, bevor das Doppelz'eichen vollständig ist. Während des ersten Zeichenindikators-Signal CHAR IND ist das UND-Gatter 306· gesperrt, so daß das Ausgangssignal auf der Leitung 307 die vollständige Null-Codierung für den Punkt ist. Während des zweiten Zeichenindikator-Signals ist das ODER-Gatter 308 gesperrt^ so daß die Codierung für das Zeichen 301 ohne den Punkt an der aus dem Codierer führenden Leitungen 306 am Ausgang 307 erscheint.
;j υ ω, ζ. ϊ Uj
U - 175
25.10.1978
Bei dem in Figur 1 dargestellten Ausführungsbeispxel der Erfindung mit der Zeichengruppierung und Codierung der Figur 8 wird eine Punkt-CodieTung vorgesehen, um die Unterschiede zwischen den Zeichen der Figur 9a und 9b zu berücksichtigen. Wie aus der Tabelle der Figur 10 ersichtlich, werden dort die Zeichen in drei Gruppen eingeteilt, und für jede Gruppe wird eine Höhen-Codierung vorgesehen. Auf diese Weise hat man 93 Zeichen und Steuer-Codierungen zur Verfügung. Auf diese Weise kann die gesamte in Figur 10 dargestellte Information sowie im Bedarfsfalll notwendige Information für Übertragungsoder Speicherzwecke codiert werden.
Man erkennt aus der Figur 10, daß zwei der Höhen-Codes die Codierungen Hill für die Tiefstellung und die Codierung 11011 für die Hochstellung sind. Die 0-Codierung 00000 kann als dritte Höhen- oder Niveau-Codierung verwendet werden.
Mit einem solchen Drei-Niveau-System kann die Schaltung der Figuren 1 und 2 mit einer geringen Abänderung der Erkennungs-Bchaltung 218 für die Hoch- und Tiefstellung und der Lesespeicher Verwendung finden, wobei die Abänderungen derart gewählt sind, daß die Codierung des dritten Niveaus erkannt und zur Adressierung der geeigneten Zeichen im Speicher verwendet werden kann, wie dies anhand eines Zwei-Niveau-Systems oben erörtert wurde. Selbstverständlich können die vorstehend -erwähnten Funktionen ausgeführt werden,, indem man Standard-Fücroprocessor- und Speicher-Chips (integrierte Schaltungen) verwendet, um eine zusätzliche Flexibilität zu erreichen.
Alternativ kann man eine Schaltung verwenden, wie sie in Figur JLI dargestellt ist. Eine Tastatur 400 ähnlich der in
U - 175
25.10.1978
Figur 4 dargestellten (oder eine arabische Standard-Schreibmaschinen-Tastatur mit zusätzlichen Fernschreibbetätigungstasten) liefert ein ASCII-codiertes Zeichensignal CHAR an den Eingang eines Speichers 402; gleichzeitig wird ein Markierungssignal CHAR IND an den Eingang eines logischen Schaltkreises 404 geliefert.
Das CHAR-Signal der Tastatur ist ein 8-bit-ASCII-Signal, wenn man im Handel erhältliche Vorrichtungen benutzt. Der Eingangsspeicher 402 benutzt diesen Code und einen 2-bit-Code LVL aus der logischen Eingangsschaltung 404, um entsprechende 5-bit-Baudot-Codierungen CHAR1 im Speicher zu adressieren. Mit dem 5-bit-Code im Speicher ist ein 3-bit-Identifizierungs-Code ID gespeichert, welcher der logischen Eingangsschaltung 404 zugeführt wird.
Das CHARLSignal wird einer konventionellen Schiebeschaltung 406 zugeleitet, die als sogenannte first-in, first-out-Schaltung (FIFO) arbeitet. Diese Schaltung 406 wird durch IN-Signale und durch OUT-Signale der logischen Schaltung 404 gesteuert. Die FIFO-Schaltung 406 "glättet" auf konventionelle Weise die Übertragsrate des CHARLSignals, so daß diese Rate relativ gleichförmig ist und die Kapazität eines Fernschreibers oder eines Druckers nicht überschreitet (beispielsweise überschreitet sie nicht 75 Bauds).
Das 5-bit-Zeichensignal CHAR1 der FIFO-Schaltung wird einem konventiunellen "universellen asynchronen Empfänger-Übertrager" 408 (universal asynchronous Receiver-Transmitter UART) zugeführt, der dieses Signal seinerseits zum Zweckdar Übertragung als TS-Signal einer konventionellen Interface -Schaltung 410 (STUNT-CIRCÖITS)zuleitet, die die Übertragung und den Empfang der Signale mit akzeptabler Stärke und in geeigneter
U - 175
25.10.1978 -
Of-
Form steuern. Steuersignale für die Interface-Schaltung 410 werden von einer Signal-Steuerlogik 412 geliefert, welche Steuersignale LOCAL,OFF-LINE von der Tastatur oder einer anderen Steuersignalquelle empfängt. Wenn das System als Fernschreiber arbeitet (also nicht im LOCAL-Betr.ieb und nicht im OFF-LINE-Betrieb), wird die Eingangsinformation von der Tastatur 400 aus der Interface -Schaltung zum TTY und zu dem Empfänger-Übertrager zur gleichzeitigen Übertragung und Darstellung geleitet» Im LOCAL-Betrieb wird das TS-Signal (als RS-Signal) durch die Interface -Schaltung einem Drucker zugeleitet und außerdem einem in der Zeichnung nicht dargestellten Wählschalter. Der Wählschalter kann die Informationssignale einem Lochstanzer oder einem anderen Speicher zuführen,so daßdie Daten der Tastatur gleichzeitig mit dem Ausdruck gespeichert werden. Das System kann auch im OFF-LINE-Betrieb arbeiten, so daß die von der Interface-Schaltung empfangenen, eingehenden Daten dem Wählschalter zur Speicherung und zum später erfolgenden Ausdrucken zugeführt werden.
Das RS-Signal wird von dem Empfänger-Übertrager UART einer Drucksteuerschaltung zugeführt, die in der Weise ähnlich der Eingangsschaltung aufgebaut ist, daß die Hoch- Tiefstellungscodierung erkannt wird, so daß das empfangene Zeichen erkannt wird. Die Form .des Zeichens wird bestimmt und ein geeignetes Zeichen wird durch die Adressierung eines Speichers ausgewählt ,wie dies oben beschrieben wurde. In diesem Zusammenhang wird das RS-Signal einem Register 414 (Register 1) zugeführt, dessen Ausgangssignal Registern 416 und 418 zugeleitet wird.
Die Ausgangssignale der Register 414 und 410 werden einem Ausgangsspeicher 420 zugeführt, der ein PRINT-Signal liefert,
909822/0SB1
U - 175 s
25.10.1978 _Γ> - 3ß -
daß im ASCII-Code oder in einem anderen kompatiblen Code vorliegt. Das PRINT-Signal wird einem geeigneten Druckmechanismus zugeleitet, beispielsweise dem elektrisch erregbaren Antriebselementen der Schreibtastatur, welche die den individuellen Zeichen zugeordneten Druckvorrichtungen betätigen. Das PRINT-Signal wird außerdem einer logischen Ausgangsschaltung 422 zugeleitet, welche ein Druckmarkierungssignal PRINT STRB für den Fernschreiber oder eine andere Ausgabeeinheit liefert. Die logische Ausgangsschaltung liefert außerdem ein 2-bit-Signal zur Angabe der Hoch- oder Tiefstellung an das Register 1 (414) und Steuersignale, die das ' Einlesen der Register 414 bis 418 steuern.
Im Betrieb wählen das 7-bit-Zeichensignal CHAR der Tastatur und das LVL-Signal des logischen Schaltkreises 404 den geeigneten 5-bit-Baudot-Code im Speicher 402 aus, der dann der Schiebeschaltung 406 durch ein logisches Signal IN zugeführt wird. Der logische Schaltkreis 404 bestimmt auch die Gruppe, zu welcher das Zeichen gehört, und sorgt dafür, daß der geeignete Hoch- und Tiefstsllungs-Code im Speicher aufgefunden und in die Folge der Zeichencodierungen eingeschoben wird.
Der logische Eingangsschaltkreis 404 bestimmt aufgrund des ID-Signals, wenn die im Speicher angesteuerte Codierung die eines diakritischen Zeichens ist. Wenn das der Fall ist, dann ist einem solchen Zeichen keine besondere Form zugeordnet (beispielsweise Anfangsform, Mittelform, Endform oder unabhängige Form). Wenn ein diakritisches Zeichen in einer Folge von Zeichen auftritt, dann wird es oberhalb des unmittelbar vorhergehenden Zeichens gedruckt. Wenn also eine Folge von Zeichen Ci5 C2, C3 und C4 übertragen wird mit einem diakritischen Zeichen DM zwischen C2 und C3 (d„h. die Folge
909822/0551
U - 175 .
25.10.1978 .39* _ 3* -
ergibt sich dann zu Cl, C2 DM, C3, C4), dann muß DM gedruckt u/erden, ehe C3 gedruckt wird, jedoch kann C2 nicht gedruckt werden, bis C3 zwei Zeichen später empfangen ist. Um nun zu vermeiden, daß 'der Drucker mit doppelter Geschwindigkeit drucken muß, ändert der logische Eingangsschaltkreis 404 die Folge dadurch, daß ein erster Hoch- oder Tiefstellungs-Code Ll, (11111) hinter dem Zeichen eingefügt wird, oberhalb dessen das diakritische Zeichen erscheint (d.h. nach C3), so daß die Folge nun lautet Cl, C2, DM, C3, Ll, C4. Auf diese Weise wird auf der Empfängerseite C2/T wennvu3 empfangen wird, DM wird gedruckt, wenn Ll empfangen wird, und C3 wird gedruckt, wenn C4 empfangen wird. Der Drucker kann daher gelegentlich verzögert werden, aber er muß niemals schneller drucken als mit normaler Geschwindigkeit. Natürlich arbeitet die Schiebeschaltung 406 als glättender Puffer während des Einschubes des Hoch- Tiefstellungs-Codes und während jeglicher nicht gleichförmiger Einfügung von Zeichen, so daß eine gleichmäßige Übertragungsrate erreicht wird.
Beim Empfang von Zeichen für den Druckvorgang enthält das Register 1 die zuletzt empfangene Zeichencodierung. Das als nächstes empfangene Zeichen führt dazu, daß der Inhalt des Registers 1 in das Register 2 (oder in das Register 3, falls das Register 1 ein diakritisches Zeichen enthält) übertragen wird und daß dieses als nächste empfangene Zeichen in das Register 1 eingelesen wird. Die logische Ausgangsschaltung 422 bestimmt die Form des Zeichens und liefert zusammen mit dem 5-bit-Zeichen-Code Form-ID-Signale FID an den Ausgangsepeicher 420. Die Form des Zeichens hängt natürlich von dem S-bit-Code^ der Stellung des Zeichens in einem Wort und dem Hoch- oder Tiefstellung-Code des vorhergehenden Zeichens (erst·!, zweites oder drittes Niveau) ab. Die Tatsache, ob das Zeichen ein diakritisches Zeichen ist oder nicht, bestimmt
U - 173 ι y
25.10.1978 # Lq. - t& -
den Druckvorgang, da diakritische Zeichen keinen Vorschub benötigen. In diesem Falle wird das diakritische Zeichen im Register 3 gespeichert, und eine Zeitfolge wird gestartet, so daß der zeitliche Ablauf des Druckvorganges in der obenbeschriebenen Weise verläuft (d.h. C 1, C 2, DM, C 3, L 1,' C 4).
Gemäß der vorliegenden Erfindung können Arabisch-Adapter, wie sie in den Figuren 2 oder 11 dargestellt sind, verwendet werden, um die Tastatur einer arabischer Schreibmaschine oder einer anderen Druckmaschine im Aufbau zu vereinfachen, so daß einerseits die Schreibgeschwindigkeit der Bedienungsperson erhöht und andererseits das Training vereinfacht werden kann. Wie das im einzelnen erreicht werden kann, ist in den Figuren 12 und 13 dargestellt.
Eine vereinfachte Tastatur 450 für arabisch-farsische Schriftzeichen hat für jeden Buchstaben nur eine Form. Diese Tastatur ist mit einem Arabisch-Adapter 120 verbunden, wie er in Figur 2 dargestellt ist. Die an den Eingangs- und Ausgangsklemmen des Adapters 120 angegebenen Signale sind dieselben wie die in Figur 2 dargestellten. Die Ausgangssignale des Adapters 120 werden einem geeigneten konventionellen Drucker oder einer geeigneten Ausgabeeinheit 452 zugeführt.
Die Leitung 211 vom Register 210 des Arabisch-Adapters (wie in Figur 2 dargestellt) liefert die zuletzt eingelesene Zeichencodierung an eine Leuchtdiode (LED) in der Ausgabeeinheit 452, so daß das zuletzt eingegebene Zeichen angezeigt wird.. Diese Leuchtdiodenanzeige kann in einer geeigneten Position angeordnet werden, so daß sie die Bedienungsperson leicht sieht.
909822/0551
U -175
25.10.1978
Im Betrieb hat die Bedienungsperson eine Tastatur 450, die nur Tasten für eine Form der arabisch-farsischen Zeichen hat. Daher kann jedes Zeichen geschrieben werden, ohne daß man von einem Zeichenniveau zum anderen umschalten muß (beispielsweise wie das bei Hoch- und Tiefstellung notwendig ist, wenn eine Taste 2 Zeichen trägt). Wenn ein Wort geschrieben wird, wird die Codierung für jede von der Bedienungsperson betätigte Zeichentaste in der konventionellen Weise erzeugt., und der Arabisch-Adapter 120 bestimmt die Form des Zeichens aus seiner Position in der Zeichenfolge in der obenbeschriebenen Weise. Der tatsächlich geschriebene oder gedruckte Buchstabe hat dann die richtige Form, obwohl die Bedienungsperson in allen Fällen nur eine Form des Buchstabens in die Tastatur eingegeben hat. Es wird daraufhingewiesen, daß die Ausgabeeinheit in der obenbeschriebenen Weise aufgebaut ist (beispielsweise als konventionelle Schreibmaschinenausgabeeinheit für die komplette arabisch-farsische Sprache) und in der Lage ist, alle Formen der Buchstaben zu schreiben.
Da der Arabisch~Adapter 120 nur dann ein Zeichen liefert, wenn zwei aufeinanderfolgende Zeichen in die Tastatur eingegeben worden sind, wird die Leuchtdiodenanzeige benötigt, um den zuletzt eingegebenen Buchstaben anzuzeigen. Eine solche Anzeige kann für eine geübte Bedienungsperson unnötig sein, sie stellt jedoch eine Hilfe dar, wenn beim Schreiben Unterbrechungen auftreten.
Diese vereinfachte Form einer Tastatur reduziert die Umschaltvorgänge erheblich, die bei bekannten Standard-Schreibmaschinen der arabischen Sprache notwendig sind. Während eine gute Bedienungspeson auf einer bekannten Vorrichtung 35 bis 40
'09822/95
U - 175 '
25.10.1978
Wörter pro Minute schreiben kann, u/erden die Schreibgeschwindigkeiten durch die Vorrichtungen der Figuren 12 und 13 fast verdoppelt, so daß eine Schreibgeschu/indigkeit erreichbar ist, die Schreibmaschinen mit lateinischer Schrift entspricht..
Natürlich kann man auch eine arabische Standard-Tastatur mit allen Formen der arabisch-farsischen Buchstaben verwenden, wenn eine Bedienungsperson, die bisher auf einer solchen Tastatur geschrieben hat, weiterhin mit einer solchen Tastatur schreiben will. Dasselbe System wie es in Figur 13 dargestellt ist, kann dann trotzdem verwendet werden, wobei die Umschaltungen von Hoch- in Tiefstellung und umgekehrt entweder nicht erfolgen oder, falls sie doch erfolgen, bei der Codierung der Zeichen nicht berücksichtigt werden.
Die vorliegende Erfindung kann auch in anderen Ausführungsformen Verwendung finden, ohne daß dadurch der Bereich der Erfindung verlassen wird. Beispielsweise kann die vorliegende Erfindung zur Speicherung und zum Abrufen von Information in der in Figur 1 dargestellten Weise verwendet werden, indem man das System nur im lokalen Betrieb arbeiten läßt und durch die Tastatur 11 eingegebene Information in den Speicher 15 einliest. Wenn man diese Information verwenden will, kann sie mittels des Arabisch-Adapters ausgelesen und einer Anzeigeeinheit zugeführt werden.
ί 0 9 8 i 2 / ·■; S

Claims (1)

  1. DR.-ING. DIPL.-ING. M. SC. DIP'.. PHYS. D^. DTU-PHYS.
    HÖGER - STELLRECHT - GRiESSBACH - HAtCKER
    PATENTANWÄLTE IN STUTTGART " "
    A 43 117 m Anmelder: Khaled M. Diab
    U - 175 Orlando, Florida
    2b.10.1978 32 809 USA
    (Iy Verfahren zur Verarbeitung arabisch-farsischer Sprachdaten, dadurch gekennzeichnet, daß man eine Folge von Zeichenkodierungen erzeugt, die jeweils einer Form jedes Zeichens der Sprachdaten entsprechen, daß man die Daten klassifiziert und dabei jedes Zeichen der Daten einer von mindestens drei vorbestimmten Gruppen zuordnet, daß man in die Folge der Zeichenkodierungen eine von mindestens drei' Identifikationskodierungen einfügt, die mindestens eine nachfolgende Zeichenkodierung als zu der vorbestimmten Gruppe gehörig identifizieren, daß man die Folge, der Kodierungen speichert, daß man die Kodierungen nacheinander aus dem Speicher ausliest und die Form jedes durch eine Zeichenkodierung dargestellten Zeichens als Funktion der Identität des Zeichens selbst sowie des vorhergehenden und des nachfolgenden Zeichens bestimmt, und daß man die Daten mit den Zeichen in ihrer richtigen Form und in ihrer richtigen Position darstellt, wobei die Position von zwei aufeinanderfolgenden Zeichen in Abhängigkeit von den ausgelesenen Zeichenkoaierungen und der bestimmten Zeichenform identisch sein kann.
    2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Daten dadurch klassifiziert, daß man jedem Zeichen in einer Gruppe eine bestimmte 5-bit-Kodierung zuordnet, wobei Zeichen in verschiedenen Gruppen gleiche 5-bit-Kodierungen zugeordnet sind, daß man eine 5-bit-Identifikationskodierung erzeugt, die angibt, welcher Gruppe ein Zeichen zugeordnet ist, und daß man die 5-bit-Identi-
    909822/0551
    U - 175
    25.IU.1978
    fikationskodierung in die Folge der 5-bit-Zeichenkodierungen immer dann vor eine Zeichenkodierung einschiebt, wenn das dieser Zeichenkodierung entsprechende Zeichen einer anderen Gruppe zugeordnet ist, als das der vorhergehenden Zeichenkodierung entsprechende Zeichen.
    Verfahren nach Anspruch 2 zum Betrieb eines Fernschreibsystems für arabisch-farsische Sprachen, dadurch gekennzeichnet, daß man eine Folge von 5-bit-Zeichenkodierungen erzeugt, in der jede 5-bit-Zeichenkodierung einen arabischen Buchstaben oder ein Satzzeichen, eine Ziffer oder ein diakritisches Zeichen darstellt, wobei die 5-bit-Zeichenkodierung jedes arabischen Buchstabens diesen ungeachtet seiner Form wiedergibt, daß man in die Folge der Zeichenkodierungen eine von mindestens 3 5-bit-Identifikationskodierungen einfügt, welche die unmittelbar folgende Zeichenkodierung als zu einer vorbestimmten Zeichengruppe gehörig identifiziert, daß man die Folge von 5-bit-Zeichenkodierungen an einen entfernten Ort überträgt, daß man die Folge von 5-bit-Zeichenkodierungen an dem entfernten Ort aufnimmt und jede 5-bit-Zeichenkodierung kurzzeitig speichert, daü man das durch die gespeicherte Zeichenkodierung dargestellte Zeichen als eines aus der Zahl der möglichen Zeichen klassifiziert, daß man für jede einen arabischen Buchstaben darstellende 5-bit-Zeichenkodierung eine Formkodierung erzeugt, die die Form des durch die 5-bit-Kodierung dargestellten Buchstabens als Funktion der der gespeicherten 5-bit-Kodierung unmittelbar vorangehenden bzw. nachfolgenden Zeichen angibt, und daß man die aufgenommene Folge der 5-bit-Kodierungen als arabische Zeichen in richtiger Form und richtiger Position sowie als andere durch die·
    909822/0551
    U - 175
    25.10.1978
    5-bit-Kodierung spezifizierte Zeichen in Abhängigkeit von den 5-bit-Zeichenkodierungen und den Identifikationskodierungen wi-cdergibt.
    4. Vorrichtung zur Durchführung des Verfahrens der Ansprüche 1, 2 oder 3, gekennzeichnet durch eine erste Kodiereinrichtung (13) zur Erzeugung einer Folge von Zeichenkodierungen, die jeweils einer Form jedes Zeichens der arabisch-farsischen Sprache entsprechen, durch eine Einrichtung zum Einschieben einer von mindestens 3 Identifikationskodierungen in eine Folge von Zeichenkodierungen, die angibt, daß zumindest eine nachfolgende Zeichenkodierung einer von mindestens 3 Zeichengruppen zuzuordnen ist, die der eingeschobenen Identifikationskodierung entspricht, durch Speicher (21U, 220) zur Speicherung der Kodierungen während mindestens zwei aufeinanderfolgender Zeichen, durch eine auf die beiden gespeicherten Kodierungen ansprechende Einrichtung (231) zum Klassifizieren des ersten gespeicherten Zeichens als eines einer Vielzahl vorbestimmter Zeichentypen, durch eine zweite Kodiereinrichtung (241) zur Erzeugung einer zweiten Kodierung, die das erste gespeicherte Zeichen abhängig von der Klassifizierung des Zeichentyps des unmittelbar vorhergehenden und des nachfolgenden Zeichens als eines einer Mehrzahl arabischer Buchstabenformen identifiziert, durch eine Einrichtung für den Zugriff zu Daten in einem Speicher (224), der Daten enthält, die die richtige Form arabischer Zeichen in Abhängigkeit der zuerst gespeicherten Zeichenkodierung und der zweiten Kodierungen angeben, und durch eine Einrichtung zur Darstellung jedes durch die Daten in dem Speicher (224) repräsentierten arabischen Zeichens in richtiger Form und Position mit Mitteln, die in Abhängig-
    909822/0551
    u - 175 .α. ,
    25.10.1978 ^ - / -
    keit von der Klassifizierungseinrichtung, die angibt, wann ein darzustellendes Zeichen den Typ eines nicht mit einem Vorschub korrelierten Zeichens hat, aufeinanderfolgende Zeichen in derselben Position darstellen.
    Vorrichtung nach Anspruch 4 zur Übertragung arabischfarsischer Sprachen per Fernschreiber, dadurch gekennzeichnet, daß die erste Kodiereinrichtung (13) eine Folge von 5-bit-Zeichenkodierungen erzeugt, von denen jede einen arabischen Buchstaben der arabisch-farsischen Sprache oder ein Zeichen einer Anzahl von Standard-Fernschreibzeichen, nämlich Ziffern, Satzzeichen oder Steuersignalen, darstellt , wobei die jeweilige Form eines arabischen Buchstabens unberücksichtigt bleibt, daß die Einrichtung zum Einschieben der Identifikationskodierungen eine von mindestens 3 5-bit-Identifikationskodierungen in die Folge von 5-bit-Zeichenkodierungen einschieben kann, um zumindest eine der nachfolgenden 5-bit-Zeichenkodierungen als zu einer von mindestens 3 vorbestimmten Zeichengruppen gehörig zu identifizieren, die der eingeschobenen 5-bit-Identifikationskodierung entspricht, daß der Speicher (210, 220) die 5-bit-Kodierungen mindestens während zwei aufeinanderfolgenden Zeichen speichert, daß die Klassifizierungseinrichtung (231) auf die gespeicherte 5-bit-Kodierung anspricht und jedes empfangene Zeichen als eines einer Menge eines vorbestimmten Zeichentyps klassifiziert, daß die zweite Kodiereinrichtung (241) eine" zweite Kodierung erzeugt, die jeder ein arabisches Zeichen darstellenden gespeicherten 5-bit-Kodierung in Abhängigkeit des klassifizierten Typs des unmittelbar vorhergehenden und des unmittelbar nachfolgenden Zeichens eine Form zuordnet, und daß die Einrichtung zur Darstellung der Zeichen die von der 5-bit-Zeichen-
    909822/0Si1
    284708S
    U - 175 , ζ.
    25.10.1978 ** -P-
    kodierung dargestellten arabischen Zeichen in Abhängigheit von der Identifikationskodierung, der zweiten Kodierung und der gespeicherten 5-bit-Zeichenkodierung in der richtigen Form darstellt.
    6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, daß der Klassifizierungseinrichtung (231) Mittel zugeordnet sind, die jedes empfangene Zeichen als ein Zeichen von dem Typ spezifizieren, der sich in einem Wort mit dem vorhergehenden oder dem folgenden Zeichen verbindet, der sich in einem Wort mit dem vorhergehenden, nicht aber mit dem folgenden Zeichen verbindet, der sich weder mit dem vorhergehenden noch mit dem folgenden Zeichen verbindet, der keinen Vorschub der Anzeige auf eine folgende Stelle hervorruft oder der ein Fernschreiberbetätigungssignal spezifiziert.
    7. Vorrichtung nach einem der Ansprüche 4.:bis 6, dadurch gekennzeichnet, daß die Einrichtung zur Darstellung der Zeichen Mittel zur Erzeugung einer 8-bit-Kodierung aufweist, die die gespeicherte 5-bit-Kodierung als eines einer Anzahl möglicher Zeichen einschließlich aller arabischer Schriftzeichen und ihrer Formen, der üblichen Fernschreibsteuersignale, der Satzzeichen, der Ziffern und der diakritischen Zeichen spezifiziert, wobei die Zahl der möglichen Zeichen und Zeichenformen über IUO liegt.
    909822/0551
DE2847085A 1977-10-31 1978-10-28 Verfahren und Vorrichtung zur Verarbeitung arabisch-farsischer Textdaten Expired DE2847085C2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US05/846,824 US4145570A (en) 1977-10-31 1977-10-31 Method and system for 5-bit encoding of complete Arabic-Farsi languages
US92467978A 1978-07-14 1978-07-14

Publications (2)

Publication Number Publication Date
DE2847085A1 true DE2847085A1 (de) 1979-05-31
DE2847085C2 DE2847085C2 (de) 1983-07-14

Family

ID=27126672

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2847085A Expired DE2847085C2 (de) 1977-10-31 1978-10-28 Verfahren und Vorrichtung zur Verarbeitung arabisch-farsischer Textdaten

Country Status (11)

Country Link
JP (1) JPS5474336A (de)
CA (1) CA1121061A (de)
CH (1) CH643974A5 (de)
DE (1) DE2847085C2 (de)
ES (1) ES474730A1 (de)
FR (1) FR2407525A1 (de)
GB (1) GB2007413B (de)
GR (1) GR66560B (de)
IT (1) IT1175361B (de)
MA (1) MA18599A1 (de)
NL (1) NL185491C (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2490365B1 (fr) * 1980-09-17 1986-11-21 Texas Instruments France Dispositif de visualisation de donnees en des ecritures de natures differentes telles que les ecritures arabe et latine
IT8153183V0 (it) * 1981-04-29 1981-04-29 Olivetti & Co Spa Dispositivo di scrittura
BE891911A (fr) * 1982-01-27 1982-05-17 Europ Agence Spatiale Dispositif numerique pour commander la representation graphique de caracteres
CA1207905A (en) * 1983-05-17 1986-07-15 Mohamed F. Metwaly Method and system for the generation of arabic script
JPS60239862A (ja) * 1984-05-15 1985-11-28 Toshikazu Ichiki アラビア語ワ−ドプロセツサ方式
GB2184876B (en) * 1985-06-25 1988-10-19 John Robert Alfred Jones Machine writing-character joining arabic related script
GB2186766A (en) * 1986-02-17 1987-08-19 Philips Electronic Associated Character display apparatus
GB2186767A (en) * 1986-02-17 1987-08-19 Philips Electronic Associated Animated display apparatus
FR2599670B1 (fr) * 1986-06-10 1988-09-16 Sagem Procede de commande d'un systeme d'ecriture et systeme d'ecriture en ecriture devanagari
GB8719115D0 (en) * 1987-08-12 1987-09-16 Linotype Ltd Printing
WO2010094121A1 (en) * 2009-02-20 2010-08-26 Mohamed Madi Mohsen Keyboard for languages based on the arabic script

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE903587C (de) * 1950-08-05 1954-02-08 Siemens Ag Fernschreiber mit Umschalteinrichtungen fuer verschiedene Funktionsgruppen
DE941800C (de) * 1954-07-18 1956-04-19 Werk Fuer Fernmeldewesen Veb Fernschreiber mit fernbetaetigter doppelter Umschaltung der Schreibeinrichtung
US3513968A (en) * 1967-01-24 1970-05-26 Compugraphic Corp Control system for typesetting arabic
DE2444326A1 (de) * 1973-11-01 1975-05-07 Mohammad Saeed Chaudhry Vorrichtung zum aufzeichnen bzw. wiedergeben von daten bzw. informationen in arabischer schrift
US3938099A (en) * 1972-11-02 1976-02-10 Alephtran Systems Ltd. Electronic digital system and method for reproducing languages using the Arabic-Farsi script
DE2748218A1 (de) * 1977-10-27 1979-05-03 Siemens Ag Verfahren und anordnung zum uebertragen von zeichen

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1162180A (en) * 1966-12-24 1969-08-20 Linotype Machinery Ltd Means for Controlling Typographic Composing Machines
US3852720A (en) * 1973-02-12 1974-12-03 H Park Method and apparatus for automatically generating korean character fonts

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE903587C (de) * 1950-08-05 1954-02-08 Siemens Ag Fernschreiber mit Umschalteinrichtungen fuer verschiedene Funktionsgruppen
DE941800C (de) * 1954-07-18 1956-04-19 Werk Fuer Fernmeldewesen Veb Fernschreiber mit fernbetaetigter doppelter Umschaltung der Schreibeinrichtung
US3513968A (en) * 1967-01-24 1970-05-26 Compugraphic Corp Control system for typesetting arabic
US3938099A (en) * 1972-11-02 1976-02-10 Alephtran Systems Ltd. Electronic digital system and method for reproducing languages using the Arabic-Farsi script
DE2444326A1 (de) * 1973-11-01 1975-05-07 Mohammad Saeed Chaudhry Vorrichtung zum aufzeichnen bzw. wiedergeben von daten bzw. informationen in arabischer schrift
US3998310A (en) * 1973-11-01 1976-12-21 International Business Machines Corporation Apparatus for recording data in arabic script
DE2748218A1 (de) * 1977-10-27 1979-05-03 Siemens Ag Verfahren und anordnung zum uebertragen von zeichen

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"ASV-CODAR", Entwicklungs- und Forschungs- institut zur Förderung der arabischen Sprache, b.p. rabal (Castarab-Konferenz vom Aug. 1976, Resolution Nr.19, Nairobi, Nov. 1976), S.4-7, 43-45 *
Blattschreiber T typ 37g mit arab. Schrift, vorläufige Beschreibung FS BS 2161/14, Ausg. Dez. 1952, Siemens AG *
Electronics, 1977, H.10 Mai, S.33,34 *

Also Published As

Publication number Publication date
FR2407525B1 (de) 1983-11-25
GB2007413A (en) 1979-05-16
CA1121061A (en) 1982-03-30
GR66560B (de) 1981-03-27
JPS5474336A (en) 1979-06-14
NL185491C (nl) 1990-04-17
NL7810825A (nl) 1979-05-02
JPS5747582B2 (de) 1982-10-09
GB2007413B (en) 1982-04-28
IT1175361B (it) 1987-07-01
ES474730A1 (es) 1979-11-01
DE2847085C2 (de) 1983-07-14
CH643974A5 (de) 1984-06-29
MA18599A1 (fr) 1980-04-01
FR2407525A1 (fr) 1979-05-25
NL185491B (nl) 1989-11-16
IT7812845A0 (it) 1978-10-31

Similar Documents

Publication Publication Date Title
DE2818974A1 (de) Datenstation fuer datenverarbeitungsanlagen
DE1296182B (de) Verfahren zur UEbertragung binaerkodierter Informationssignale sowie Kodierer zur Abgabe solcher Signale und mit diesem betreibbarer Dekodierer
DE2847085C2 (de) Verfahren und Vorrichtung zur Verarbeitung arabisch-farsischer Textdaten
DE2749012C2 (de)
DE1295591B (de) Steuerschaltungsanordnung zur selbsttaetigen Wahl der UEbertragungsgeschwindigkeit in Anlagen der Datenuebermittlung
DE2463146C2 (de) Vorrichtung zum aufzeichnen bzw. wiedergeben von daten bzw. informationen in arabischer schrift
DE2902312C2 (de) Verfahren und Vorrichtung zum Aufbau von Texten mit arabischen Schriftzeichen
DE3142138A1 (de) Verfahren zur eingabe chinesischer zeichen sowie vorrichtung zur durchfuehrung des verfahrens
DE2748289B1 (de) Verfahren und Anordnung zum Vermindern der Redundanz von Zeichen oder grafische Muster beschreibenden binaeren Zeichenfolgen
DE1941858A1 (de) Vorrichtung,insbesondere zur Umwandlung einer Schreibmaschine in ein Geraet zur Aufzeichnung in Brailleschrift oder zur Aufzeichnung in einem anderen Schrift- oder Codesystem
DE2716028C3 (de) Gemischte Übermittlung von Texten, Kommandos und Instruktionen
US4145570A (en) Method and system for 5-bit encoding of complete Arabic-Farsi languages
AT387877B (de) System und vorrichtung zur verarbeitung arabisch-farsischer textdaten
DE2904753A1 (de) Verfahren und vorrichtung zum erstellen eines vorabdrucks von text und befehlen in einer textverarbeitungsanlage
EP0152135B1 (de) Verfahren zur Uebertragung von Zeichen mittels Codewörtern eines Telegraphen-Alphabets, insbesondere des Internationalen Telegraphen-Alphabets Nr. 2, und Vorrichtung zur Ausführung desselben
DE2246551C2 (de) Datenübertragungsanordnung
DE3046216C1 (de) Verfahren und Anordnung zum Darstellen von Zeichen
DE2748218C3 (de) Verfahren und Anordnung zum Übertragen von Zeichen
DE3014218C2 (de) Faksimileeinrichtung
EP0990218B1 (de) Verfahren zum selektiven erfassen und auslesen einer zeichenkette
DE3124076A1 (de) &#34;nachrichtenuebertragungs-,-empfangs- und -verarbeitungsgeraet-&#34;
EP0251185B1 (de) Verfahren zur Erkennung einer beliebigen, gerätespezifischen New Line-Sequenz für Telexmaschinen
DE2640848C2 (de) Anordnung zum Codieren und Decodieren von alphanumerischen Informationszeichen
CH663704A5 (de) Fernschreibmaschine zum fernuebertragen von zeichen mittels des internationalen telegraphen-alphabets nr. 2.
DE2542864C2 (de) Anordnung zur Eingabe und Codierung von Datenzeichen

Legal Events

Date Code Title Description
OAP Request for examination filed
OD Request for examination
8128 New person/name/address of the agent

Representative=s name: ZAPFE, H., DIPL.-ING., PAT.-ANW., 6054 RODGAU

8181 Inventor (new situation)

Free format text: ERFINDER IST ANMELDER

D2 Grant after examination
8363 Opposition against the patent
8331 Complete revocation