AT387877B - System und vorrichtung zur verarbeitung arabisch-farsischer textdaten - Google Patents

System und vorrichtung zur verarbeitung arabisch-farsischer textdaten

Info

Publication number
AT387877B
AT387877B AT777378A AT777378A AT387877B AT 387877 B AT387877 B AT 387877B AT 777378 A AT777378 A AT 777378A AT 777378 A AT777378 A AT 777378A AT 387877 B AT387877 B AT 387877B
Authority
AT
Austria
Prior art keywords
bit
character
characters
arabic
coding
Prior art date
Application number
AT777378A
Other languages
English (en)
Other versions
ATA777378A (de
Original Assignee
Diab Khaled Mahmud
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US05/846,824 external-priority patent/US4145570A/en
Application filed by Diab Khaled Mahmud filed Critical Diab Khaled Mahmud
Priority to AT777378A priority Critical patent/AT387877B/de
Publication of ATA777378A publication Critical patent/ATA777378A/de
Application granted granted Critical
Publication of AT387877B publication Critical patent/AT387877B/de

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/01Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for special character, e.g. for Chinese characters or barcodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L17/00Apparatus or local circuits for transmitting or receiving codes wherein each character is represented by the same number of equal-length code elements, e.g. Baudot code

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Controls And Circuits For Display Device (AREA)

Description


   <Desc/Clms Page number 1> 
 



   Die Erfindung betrifft ein System zur Verarbeitung arabisch-farsischer Textdaten, wobei eine Folge von Zeichencodierungen erzeugt und die Daten als eine Folge von 5-bit-Digitalwörtern codiert werden, von denen jedes für ein Zeichen steht, und bei welchem mit den Zeichencodierungen die Zeichen dargestellt werden, sowie eine Vorrichtung zur Anwendung dieses Systems, insbesondere zur Verarbeitung solcher Daten in Fernschreibsystemen,   Schreib-und Setzmaschinen,-Computer-   terminals und Anzeigeeinheiten. 



   Übertragungssysteme und Übertragungsvorrichtungen, die unter anderem auch für die Übertragung von arabischen Schriftzeichen geeignet sind, sind beispielsweise aus der DE-OS 2748218 oder aus dem Kurzartikel in Electronics, 1977, Heft 10, Mai, Seite 33,34 bekannt. Bei diesen Systemen ergeben sich jedoch ebenso wie bei andern Übertragungssystemen für arabische Schriftzeichen erhebliche Schwierigkeiten. 



   Arabische Schriften, die für Sprachen wie Arabisch, Persisch oder Urdu (Arabisch-farsische Sprachen) benutzt werden, enthalten gewöhnlich wesentlich mehr Zeichen und Zeichenformen als die lateinische Schrift, die für Englisch, Französisch usw. benutzt wird. Daher können Codiertechniken, die für die Übertragung, den Empfang, Schriftsetzen   u. dgl.   im Zusammenhang mit den die lateinische Sprache verwendeten Sprachen entwickelt worden sind, nicht direkt für die Codierung und De-Codierung von Sprachen verwendet werden, die die arabische Schrift benutzen. 



   Ein wichtiges Beispiel einer für die Übertragung der englischen Sprache benutzten Codiertechnik ist die 5-bit-Baudot-Codierung, die in der ganzen Welt in einem internationalen Austauschsystem für das Fernschreiben benutzt wird. Diese 5-bit-Codierung kann die lateinische Schrift übertragen, da nur 26 Buchstaben oder Zeichen vorgesehen sind und alle 26 Zeichen + 10 Ziffern und verschiedene Satzzeichen, Symbole und Funktionssignale in dem Baudot-Code aufgenommen werden können. 



   Die maximale Anzahl von 5-bit-Zeichencodes ist zwar nur 25 = 32, doch durch Verwendung von zwei der 5-bit-Codes als Identifikationscodes (auch als Höhen oder Verschiebungscodes bekannt) erhält man in Kombination 2   (25) - 2   = 62 5-bit-Zeichencodes und damit genug, um die lateinische Schrift zu   übertragen."Vollständiges"Arabisch/Farsi   hat jedoch mehr als 62 Zeichen. Deshalb war man der Meinung, dass es mittels der 5-bit-Baudot-Codes nicht möglich sei, die arabisch-farsischen Sprachen über einen Fernschreiber mit guter Qualität zu übertragen. 



  Man hat daher verschiedene Kompromisse vorgeschlagen und auch verschiedene Codiertechniken, die mehr als 5 bit benötigen und daher mit den existierenden internationalen Austauscherfordernissen nicht verträglich sind. 



   Eine in der US-PS Nr. 3, 998, 310 vorgeschlagene Lösung sieht nicht alle Zeichenformen vor, und berücksichtigt nicht die Anforderungen für Ziffern, arithmische Zeichen, Satzzeichen und diakritische Zeichen. Ausserdem werden die Anforderungen an die Codierung soweit ausgedehnt, dass sie mit dem existierenden Fernschreibsystem nicht mehr vereinbar sind. Es wird die Zahl der Buchstaben auf einer Tastatur reduziert, indem die arabischen Buchstaben in zwei Formen eingeteilt werden, nämlich eine Kurzform und eine vollständige Form, wobei jedoch die andern im folgenden beschriebenen Formen unberücksichtigt gelassen werden. Zeichen, die sowohl eine vollständige als auch eine Kurzform haben, werden in der Kurzform gespeichert, wenn ein anderes Zeichen folgt und in der vollständigen Form, wenn eine Leerstelle folgt.

   Auch die Anforderungen werden erweitert, indem ein 6-bit-Code mit einem 7. bit als Kontrollbit verwendet wird. Obwohl vorgeschlagen wird, dass andere Codierungen verwendet werden können, wird in der US-PS Nr. 3, 998, 310 kein System genannt, das die Übertragung und den Empfang vollständiger arabischer- - farsischer Sprachen über ein Standard-Fernschreibsystem ermöglicht. 



   In der US-PS Nr. 3, 513, 968 ist ein Setzsteuerungssystem beschrieben, in welchem 6-bit-Signale, die arabische Zeichen und Leerstellen darstellen, in einem ersten Schieberegister gespeichert und sukzessive decodiert werden, um die Daten in eine von drei Klassen zu klassifizieren, die in einem zweiten Schieberegister gespeichert sind. Ein zweiter Decoder bestimmt die Form der Zeichen auf Grund der Zeichenklassifizierung der unmittelbar vorhergehend und der unmittelbar nachfolgend auftretenden Zeichen. Diese Information sowie die Zeichenform werden verwendet, um einen Speicher zu adressieren, der dann das Zeichen in der gewünschten Form auswählt. 



   Die US-PS Nr. 3, 938, 099 beschreibt ein Drucksystem, in welchem arabische Zeichen unter 

 <Desc/Clms Page number 2> 

 Verwendung von 8 und 11 bits codiert werden. Eine Analysiereinrichtung ist vorgesehen, die die Verkettungseigenschaften analysiert, die auf jedes Zeichen anwendbar sind, wobei Boolsche Gleichungen verwendet werden, die auf der Kenntnis der Variablen der vorhergehenden und der nachfolgenden Zeichen beruhen. Diese Information der Analysiereinrichtung zusammen mit dem Zeichendarstellungscode und dem zusammengesetzten Code wird dann in einen Code verwandelt, der zum Antrieb der Ausgabeeinheiten geeignet ist. 



   Weitere Bemühungen sind unternommen worden, um die Zahl der auf Maschinen, wie beispielsweise auf Fernschreibern, benötigten Zeichen dadurch zu vermindern, dass man einige arabische Zeichenformen und einige arithmetische Zeichen und Satzzeichen weglässt, so dass die sich ergebende Zahl der Zeichen und Steuerbefehle in einem binären, üblichen 5-bit-Baudot-Code aufgenommen werden kann. Weiterhin ist bereits vorgeschlagen worden, dass englische   (d. h.   das lateinische) Alphabet zum Übertragen der arabischen Schriftzeichen auf englischen Fernschreibern zu verwenden. 



   Keiner der beschriebenen Vorschläge löst das Problem, arabische Schriftzeichen, Ziffern, arithmetische Zeichen usw. mit guter Qualität über die internationalen Austauschsysteme, die beim Telex- und beim Gentex-System verwendet werden, zu übertragen, unter Verwendung eines standardisierten, binären 5-bit-Baudot-Codiersystems. Eine Übertragung mittels dieses Systems zwang bisher zum Weglassen von Zeichen, was die Qualität der arabischen Sprachübertragung wesentlich herabsetzt. Denn es kann dabei ein Teil der Ausdrucksfähigkeit verloren gehen oder der Schriftsatz kann zumindest schwer lesbar werden. 



   Eine Übertragung in guter Qualität erforderte daher bisher Systeme mit wesentlich mehr als 5 binären bits zur Codierung der arabischen Zeichen. Das bedingt wieder, dass zur Speicherung von arabischen Schriften wesentlich mehr Speicherplatz benötigt wird als bei der Speicherung von lateinischen Schriften. Ausserdem ist der Energieaufwand, der zur Übertragung einer bestimmten Nachricht erforderlich ist, umso höher, je mehr bits pro Zeichen notwendig sind. Eine Beschränkung der bit-Anzahl auf fünf wäre daher auch aus diesem Grund wünschenswert. 



   Die Erfindung stellt sich somit die Aufgabe, ein System zur Verarbeitung arabisch-farsischer Textdaten und eine Vorrichtung zur Anwendung dieses Systems anzugeben, mit denen trotz Verwendung eines binären 5-bit-Codes die vollständige,   d. h.   zeichengerechte Übertragung arabischer Zeichen mit einer digitalen Codier- und Decodiertechnik möglich ist. 



   Diese Aufgabe wird beim System der eingangs beschriebenen Art erfindungsgemäss dadurch gelöst, dass die 5-bit-Digitalwörter derart gewählt werden, dass sie arabische Buchstaben ungeachtet deren richtiger Form jeweils nur in einer einzigen Form wiedergeben, dass die Daten klassifiziert und dabei jedes Zeichen der Daten einer von mindestens drei vorbestimmten Gruppen zugeordnet werden, dass in die Folge der 5-bit-Digitalwörter eine von mindestens drei 5-bit-Identifikationscodierungen eingeführt werden, die mindestens ein nachfolgendes 5-bit-Digitalwort als zu der vorbestimmten Gruppe gehörig identifizieren, dass die Sprachdaten als Folge von 5-bit-Digitalwörtern in einem temporären sequentiellen Speicher gespeichert werden, von denen jedes ein Zeichen der Daten einschliesslich arabischer Zeichen darstellt,

   wobei die richtige Form der arabischen Zeichen unberücksichtigt bleibt, dass die 5-bit-Wörter nacheinander aus dem Speicher ausgelesen werden und die richtige Form jedes durch ein 5-bit-Wort dargestellten arabischen Zeichens als Funktion der Identität des arabischen Zeichens selbst sowie des vorhergehenden und des nachfolgenden 5-bit-Wortes betimmt wird, und dass die Daten mit den arabischen Zeichen in ihrer richtigen Form und in ihrer richtigen Position dargestellt werden, wobei die Position von zwei aufeinanderfolgenden Zeichen in Abhängigkeit von den ausgelesenen 5-bit-Wörtern und der bestimmten arabischen Zeichenform identisch sein kann. 



   Das erste Merkmal der Erfindung besteht also darin, einen dritten Identifikationscode 
 EMI2.1 
 

 <Desc/Clms Page number 3> 

 



   Ein weiteres Merkmal der Erfindung umfasst auch das Codieren der andern Arabisch/Farsi-Zeichen in 5-bit-Codes, ohne Rücksicht auf die richtige Form des Zeichens, das vom Code repräsentiert wird [dies ist beispielsweise durch die drei Zeichenformen der Tiefstellung (Identifikationscode) von 01100 (5-bit-Code) unter Nr. 27 in Fig. 8 gezeigt]. Die richtige Form dieses Zeichens wird dann als eine Funktion seiner Identität (01100) und des vorhergehenden und als nächsten folgenden 5-bit-Zeichencodes bestimmt. Dies erfordert eine (temporäre) Speicherung, so dass ein 5-bit-Code mit dem vorhergehenden und dem als nächsten folgenden 5-bit-Code verglichen werden kann. Die richtige Zeichenform wird dann durch diese Vergleiche gemäss den Algorithmusoder Klassifikationsregeln, die in den Fig. 6 und 7 dargelegt sind, ausgewählt. 



   Bei der Bestimmung der richtige Form des arabischen Zeichens unterscheiden sich-als nächstes Merkmal der Erfindung - einige Formen arabischer Zeichen in einem diakritischen Zeichen, wie einem Umlaut. Die Darstellung solcher Zeichen in ihrer richtigen Form erfordert dann, dass die Position des Schriftzeichens und des diakritischen Zeichens die gleiche ist, wie das Setzen eines Umlautes. 



   Eine vorteilhafte Variante des Systems ist dadurch gekennzeichnet, dass Zeichen in verschiedenen Gruppen gleiche 5-bit-Wörter als Codierung zugeordnet werden, dass eine 5-bit-Identifikationscodierung erzeugt wird, die angibt, welcher Gruppe ein Zeichen zugeordnet ist, und dass die 5-bit-Identifikationscodierung in die Folge der 5-bit-Wörter immer dann vor ein 5-bit-Wort eingeschoben wird, wenn das diesem 5-bit-Wort entsprechende Zeichen einer andern Gruppe zugeordnet ist, als das dem vorhergehenden 5-bit-Wort entsprechende Zeichen. 



   Eine weitere bevorzugte Variante besteht darin, dass in die Folge der 5-bit-Wörter eine von mindestens drei 5-bit-Identifikationscodierungen eingefügt wird, welche mindestens eines der folgenden 5-bit-Wörter als zu einer vorbestimmten Gruppe gehörig identifiziert, dass die Folge von 5-bit-Wörtern und   5-bit-Identifikationscodierungen   an einen entfernten Ort übertragen wird, dass die Folge von 5-bit-Wörtern und 5-bit-Identifikationscodierungen an dem entfernten Ort aufgenommen wird und jedes aufgenommene 5-bit-Wort und jede aufgenommene 5-bit-Identifikationscodierung kurzzeitig gespeichert wird, dass das durch das gespeicherte 5-bit-Wort dargestellte Zeichen als eines aus der Zahl der möglichen Zeichen klassifiziert wird, dass für jedes einen arabischen Buchstaben darstellende 5-bit-Wort eine Formcodierung erzeugt wird,

   die die Form des durch das 5-bit-Wort dargestellten Buchstabens als Funktion der dem gespeicherten 5-bit-Wort unmittelbar vorangehenden bzw. nachfolgenden Zeichen angibt, und dass die aufgenommene Folge der 5-bit-Wörter als arabische Zeichen in richtiger Form und richtiger Position sowie als andere durch die 5-bit-Wörter spezifizierte Zeichen in Abhängigkeit von den 5-bit-Wörtern und den 5-bit-Identifikationscodierungen wiedergegeben wird, wobei aufeinanderfolgende Zeichen in derselben Position dargestellt werden, wenn ein Signal empfangen wird, das angibt, dass ein empfangenes Zeichen von der Art ist, dass die Anzeigeposition ungeändert bleibt. Auf dieser Weise können arabisch-farsische Textdaten vollständig über Standard-Fernschreiber übertragen werden. 



   Die Erfindung umfasst auch eine Vorrichtung zur Anwendung des Systems mit einer Einrichtung zur Erzeugung einer Folge von Zeichencodierungen, die jeweils einem Zeichen der arabisch-farsischen Sprachen entsprechen, und einer Wiedergabeeinheit für die Zeichen, gekennzeichnet durch eine Einrichtung zum Einschieben einer von mindestens drei 5-bit-Identifikationscodierungen in eine Folge von durch 5-bit-Digitalwörter gebildete Zeichencodierungen, die angibt, dass zumindest ein nachfolgendes 5-bit-Wort einer von mindestens drei Zeichengruppen zuzuordnen ist, die der eingeschobenen 5-bit-Identifikationscodierung entspricht, durch temporäre sequentielle Speicher zur Speicherung der 5-bit-Wörter während mindestens zwei aufeinanderfolgender Zeichen,

   durch eine auf die beiden gespeicherten 5-bit-Wörter ansprechende Einrichtung zum Klassifizieren jedes gespeicherten 5-bit-Wortes als eines einer Vielzahl vorbestimmter Zeichentypen, durch eine zweite Codiereinrichtung zur Erzeugung einer zweiten Codierung, die jedes gespeicherte 5-bit-Wort abhängig von der Klassifizierung des Zeichentyps des unmittelbar vorhergehenden und des nachfolgenden Zeichens als eine von vier möglichen arabischen Buchstabenformen identifiziert, und durch eine Einrichtung zur Darstellung jedes durch ein gespeichertes 5-bit-Wort repräsentierten arabischen Zeichens in richtiger Form und Position in Abhängigkeit der zweiten Codierung und des gespeicherten 5-bit-Wortes mit einer Einrichtung zur Vorschubunterdrückung, 

 <Desc/Clms Page number 4> 

 die in Abhängigkeit von der Klassifizierungseinrichtung, die angibt,

   wann ein darzustellendes Zeichen den Typ eines nicht mit einem Vorschub korrelierten Zeichens hat, aufeinanderfolgende Zeichen in derselben Position dargestellt. 



   Eine günstige Ausgestaltung der Vorrichtung besteht darin, dass die Einrichtung zur Darstellung der Zeichen die von den 5-bit-Wörtern dargestellten arabischen Zeichen in Abhängigkeit von der 5-bit-Identifikationscodierung, der zweiten Codierung und dem gespeicherten 5-bit-Wort in der richtigen Form darstellt. 



   Es ist weiters besonders zweckmässig, wenn die Einrichtung zur Darstellung der Zeichen eine Codiereinrichtung zur Erzeugung einer 8-bit-Codierung aufweist, die das gespeicherte 5-bit-Wort als eines einer Anzahl möglicher Zeichen einschliesslich aller arabischer Schriftzeichen und ihrer Formen, der üblichen Fernschreibsteuersignale, der Satzzeichen, der Ziffern und der diakritischen Zeichen spezifiziert, wobei die Zahl der möglichen Zeichen und Zeichenformen über 100 liegt. 



   Mit dem erfindungsgemässen System und der Vorrichtung zur Anwendung dieses Systems ist es möglich, arabisch-farsische Sprachen über die bestehenden internationalen Fernschreibnetze zu übertragen, wobei nur ein Minimum an zusätzlicher Ausrüstung notwendig ist und insbesondere der dort verwendete Code verwendet werden kann. 



   Das neue System und die Vorrichtung zur Anwendung des Systems können für verschiedene Zwecke verwendet werden und sind nicht ausschliesslich für die Übertragung per Fernschreiben vorgesehen. 



   Das erfindungsgemässe System und die zugehörige Vorrichtung ermöglichen es, bis zu vier verschiedene Formen pro Buchstaben der arabisch-farsischen Sprachen und zusätzlich die Ziffern 0 bis 9, verschiedene Fernschreibsteuersignale, die wichtigsten arithmetischen Zeichen und eine ausgewählte Anzahl von Satzzeichen und diakritischen Zeichen zu übertragen. Die übertragenen und empfangenen Codierungen verwenden den standardisierten, binären 5-bit-Baudot- - Code. Daher können die internationalen Telex- und Gentex-Netze zur Übertragung vollständiger Texte in arabisch-farsischen Schriftzeichen verwendet werden, ohne dass hinsichtlich der Qualität der zu übertragenden Nachricht Kompromisse eingegangen werden müssen.

   Bei der Verarbeitung arabisch-farsischer Texte ergeben sich dadurch wesentliche Ersparnisse hinsichtlich der benötigten Codierungswörter, der Bits zur Übertragung einer Nachricht und des Speicherplatzes. 



   Bei einem Ausführungsbeispiel der Erfindung werden verschiedene Eigenschaften der arabisch- - farsischen Sprachen verwendet, um eine vollständigere Reproduktion aller arabischen Zeichen, aller benötigter Ziffern, aller Satzzeichen usw. zu erreichen, die zur vollständigen Übertragung von arabisch-farsischen Sprachen per Fernschreiber unter Verwendung des standardisierten 5-bit- - Codes benötigt werden. Die sprachlichen Eigenschaften, die dabei verwendet werden, sind die folgenden :
1. Obwohl es mehr als 60 Zeichen und Zeichenformen (oder Variationen) in den arabisch-farsi- schen Sprachen gibt, gibt es 28 Basisbuchstaben oder Zeichen in den arabisch-farsischen
Sprachen, von denen einige je nach Art des vorangehenden oder des folgenden Zeichens und in Abhängigkeit von dem verwendeten Schreibstil verschiedene Formen annehmen. 



   Man muss daher für jedes arabische Zeichen nur ein Codewort übertragen, wenn an dem Empfangsdrucker oder an der Empfangsanzeige eine Logik vorgesehen ist, die die benötigte Form aussucht und dem Drucker oder der Anzeigeeinheit ein entsprechendes
Steuersignal zuführt. 



   2. Die sechs arabischen Buchstaben in Fig. 9a sind dieselben wie die in Fig. 9b, sie unter- scheiden sich von diesen lediglich dadurch, dass die Buchstaben der ersten Gruppe einen Punkt oberhalb des Buchstabens aufweisen. Daher kann ein Buchstabe der ersten
Gruppe erkannt werden, wenn ein Code für den Punkt empfangen wird, dem ein Code des entsprechenden Buchstabens folgt. Auf diese Weise kann die Anzahl der erforder- lichen Codewörter weiterhin um fünf reduziert werden. 



   3. Arabische Buchstaben, Ziffern, Satzzeichen, arithmetische Zeichen und diakritische
Zeichen einschliesslich des Punktes oberhalb ausgewählter Buchstaben sowie Fernschreib- steuersignale können in den folgenden Typen klassifiziert werden : 

 <Desc/Clms Page number 5> 

 
Typ A
Zeichen, die sich mit dem folgenden Zeichen in einem gegebenen Wort und mit dem vorhergehenden Zeichen verbinden. 



   Typ B
Zeichen, die sich nicht mit dem folgenden Zeichen in einem gegebenen Wort verbinden, jedoch mit dem vorangehenden Zeichen. 



   Typ C
Zeichen, die sich weder mit dem voranstehenden noch mit dem folgenden Zeichen verbin- den. Diese Zeichen umfassen auch Ziffern, arithmetische Zeichen und Satzzeichen. 



   Typ D
Diese Zeichen führen zu keinem Vorschub der Druckwalze oder der Anzeige ; es handelt sich dabei um diakritische Zeichen und um Hoch- und Tiefstellungssignale. 



   Typ 0
Es handelt sich hiebei um Fernschreibsteuersignale, wie beispielsweise "wer sind sie", "hier ist", Glockenzeichen, Wagenrücklauf und Zeilenvorschub. 



   4. Die diakritschen Zeichen sind oberhalb oder unterhalb der entsprechenden Zeichen ange- ordnet, ähnlich wie der Punkt oberhalb des Buchstabens. Wenn diakritische Zeichen gedruckt werden, führen sie zu keinem Vorschub des Druckzylinders, des Druckkugelkopfes oder der   Kathodenstrahlanzeige ;   ausserdem beeinflussen sie die Wahl der Zeichenform nicht. Auch Fernschreibsteuersignale, wie beispielsweise die Steuersignale für Hochstellung und Tiefstellung, werden nicht gedruckt und führen zu keinem Vorschub der Druckwalze, des Druckkugelkopfes oder der Anzeige. 



   Gemäss einem weiteren bevorzugten Ausführungsbeispiel der Erfindung werden die in den Abschnitten 1., 3. und 4. beschriebenen Eigenschaften der arabisch-farsischen Sprachen verwendet, um die Gesamtzahl der Codewörter zu reduzieren, die benötigt wird, um die gesamte arabisch-farsische Sprache zu codieren. Weiterhin können zusätzliche Codewörter verfügbar gemacht werden, indem man mindestens drei. Codewörter als   sogenannte "Level-Indikatoren" oder "Höhen-Indikato-     ren" oder "Niveau-Indikatoren" verwendet.   Wenn solche als Niveau-Indikator dienende Codierwörter in einer Folge von Zeichencodierungen auftreten, dann geben sie an, dass die in der Folge unmittelbar anschliessenden Codierungen einer bestimmten Zeichengruppe zugehören.

   Auf diese Weise kann ein 5-bit-Code verwendet werden, um bis zu 93 Zeichen zu codieren   (96 - die   3 Niveau-   - Codierungswörter).   Auf diese Weise können die vollständige arabisch-farsische Sprache und andere Zeichen, wie Fernschreibsteuersignale, Ziffern usw. codiert werden. 



   Der Erfindungsgegenstand weist den weiteren Vorteil auf, dass die Zahl der Tasten auf der Tastatur einer arabisch-farsischen Schreibmaschine oder eines Fernschreibers verringert werden kann. Es kann nämlich bei Zeichen, die in mehreren Formen auftreten, nur jeweils eine Form auf der Tastatur vorgesehen werden. 



   Ein gemäss den obenbeschriebenen Prinzipien arbeitender Arabisch-Adapter wird verwendet, um die richtige Form des Zeichens zu bestimmen, und auf diese Weise kann trotz der geringeren Anzahl der Tasten die vollständige arabisch-farsische Sprache erzeugt werden. Natürlich wird auf diese Weise die Tastatur erheblich vereinfacht. Dadurch wird die Arbeit der Bedienungsperson erleichtert, sowohl im Hinblick auf die Betätigung der Tastatur als auch im Hinblick auf die erforderliche Lernarbeit. 



   Im Rahmen der Erfindung werden auch Steuerungen beschrieben, die es ermöglichen, eine mittels einer arabisch-farsischen Tastatur betätigbare Druckvorrichtung als Fernschreiber oder als Schreibmaschinendruckwerk zu verwenden. Der Erfindungsgegenstand kann ferner in vorteilhafter Weise mit peripheren Einheiten betrieben werden, beispielsweise mit einem Lochstanzer. 



   Die Erfindung stellt unter Verwendung der oben beschriebenen Eigenschaften ein Verfahren und eine Vorrichtung zur Durchführung dieses Verfahrens zur Verfügung, mit denen das vollständige arabische Alphabet, die Zahlen, die wesentlichen arithmetischen Zeichen, ausgewählte Satzzeichen, diakritische Zeichen und Fernschreibsteuersignale in einem binären 5-bit-Baudot-Code codiert werden können. Weiterhin ist eine Vorrichtung beschrieben, die einem Drucker oder einer Anzeigeeinheit zugeordnet werden kann, so dass alle arabischen Buchstabenformen entsprechend 

 <Desc/Clms Page number 6> 

 angezeigt oder gedruckt werden können. 



   Die nachfolgende Beschreibung bevorzugter Ausführungsformen der Erfindung dient zusammen mit den Zeichnungen der näheren Erläuterung. Es zeigen Fig. 1 eine Blockschaltung eines Fernschreibsystems gemäss der Erfindung zur Übertragung und Aufnahme arabisch-farsischer Sprachen mit Hilfe eines   5-bit-Standard-Codes ; Fig. 2   eine Blockschaltung der   Arabisch-Adapter-Schaltung   der Fig. 1 mit mehr Einzelheiten ; Fig. 3 eine Blockschaltung einer Codierschaltung, die automatisch einen Punkt- und einen Buchstabencode erzeugt, wenn bestimmte Typen vom Benutzer verlangt werden ; Fig. 4 eine bildlich Darstellung einer Fernschreibtastatur zur erfindungsgemässen Übertragung und Aufnahme arabischer Sprachen ;

   Fig. 5 eine bildliche Darstellung einer abgewandelten Fernschreibtastatur, die neben den arabischen Typen auch Typen mit lateinischer Schrift enthält, wobei die Zuordnung so getroffen ist, wie es in der Tabelle III angegeben ist ; Fig. 6 eine Tabelle der Klassifikationsgruppen der arabisch-farsischen Fernschreibzeichen, die eine Art der Typenklassifikation angibt, wie sie in dem Ausführungsbeispiel der Fig. 1 Verwendung findet ; Fig. 7 eine Tabelle, die die Regeln zusammenstellt, nach welcher gemäss der Erfindung die Buchstabenform ausgewählt wird ; Fig. 8 eine Tabelle mit einem Beispiel einer Baudot-Codierung arabisch-farsischer Zeichen gemäss einem bevorzugten Ausführungsbeispiel der Erfindung ; Fig. 9a und 9b zwei Gruppen arabisch-farsischer Zeichen, die bis auf einen Punkt oberhalb jedes Zeichens gleich sind ;

   Fig. 10 eine Tabelle mit einem weiteren bevorzugten Ausführungsbeispiel einer Baudot-Codierung arabisch-farsicher Zeichen, bei welcher ein Dreier-Code benutzt wird und bei welchem die Zeichen in drei Code- - Gruppen eingeordnet werden ; Fig. 11 eine Blockschaltung eines Ausführungsbeispiels der Erfindung, welches für bis zu drei Zeichengruppen verwendbar ist ; Fig. 12 eine schematische Draufsicht auf eine eingeschränkte Eingabetastatur gemäss der Erfindung und Fig. 13 eine Blockschaltung eines Ausführungsbeispiels eines Druckersystems für arabisch-farsische Zeichen, welches die Eingabetastatur der Fig. 12 verwendet. 



   Es gibt im wesentlichen 28 arabische Buchstaben oder Zeichen, jedoch einige Buchstaben können abhängig von ihrer Position in bezug auf andere Zeichen in bis zu vier verschiedenen Formen auftreten. Wie aus Fig. 8 ersichtlich, gibt es Zeichen, die vier verschiedene Formen annehmen können, während andere in drei, wieder andere in zwei und wieder andere schliesslich in nur einer Form auftreten können. Die Form des Zeichens ergibt sich entsprechend der Logik und der Klassifizierung, die in den Fig. 6 und 7 angegeben ist.

   Entsprechend einem bevorzugten Ausführungsbeispiel der Erfindung werden arabische Buchstaben, Zahlen, arithmetische Zeichen, Satzzeichen und diakritische Zeichen   (einschliesslich   des Punktes oberhalb bestimmter Buchstaben) sowie die Steuerbefehle des Fernschreibers in fünf verschiedenen Fernschreibzeichen A, B, C, D und 0 klassifiziert, die oben und in Fig. 6 definiert sind. 



   Die Form eines arabisch-farsischen Buchstabens kann eine von vier Möglichkeiten aufweisen : Die Anfangsform, die Mittelform, die Endform und die unabhängige Form. Die Form des Buchstabens wird in dem bevorzugten Ausführungsbeispiel entsprechend der Regeln in Fig. 7 logisch bestimmt, wobei das (+)-Zeichen "oder" bedeutet. 



   Fig. 1 stellt ein erfindungsgemässes Fernschreibsystem dar, welches die angegebenen Kriterien benutzt, um arabisch-farsische Sprachen mit der Technik eines 5-bit-Standardcodes zu übertragen und zu empfangen. Eine Tastatur --11-- ist über eine   Leitung --12-- mit   einem konventionellen 5-bit-Baudot-Codierer --13-- verbunden. Die   Tastatur --11-- kann   eine englische Standardtastatur sein, die mit arabischen Buchstaben, den Zahlen, den arithmetischen Zeichen, den ausgewählten Satzzeichen und den diakritischen Zeichen sowie den Fernschreibsteuerbefehlen versehen ist, wie dies beispielsweise aus Fig. 8 ersichtlich ist. Der   Codierer --13-- codiert   die Buchstaben in einem binären Baudot-Code mit 5 bit.

   In Fig. 8 ist ein Beispiel angegeben, wie die Tastaturzeichen in einem binären Baudot-Code mit 5 bit verschlüsselt werden können. 



   Der 5-bit-Codierer --13-- ist über eine Leitung --14-- mit einem konventionellen Speicher oder einem Lochstreifenstanzer --15-- verbunden, der über eine Leitung --129-- mit einer geeigneten Speicher- oder Lochstreifenstanzsteuerung --16-- verbunden ist. Der 5-bit-Codierer --13-ist weiterhin über eine Leitung --19-- mit einem Modem --111-- verbunden, welches seinerseits mit einem   Übertrager --117-- sowie   einem   Empfänger --113-- verbunden   ist. Der Übertrager und der Empfänger werden mittels einer Rufschaltung --119-- über eine Leitung --116-- ge- 

 <Desc/Clms Page number 7> 

 steuert, wie dies aus den Zeichnungen erkennbar ist. 



     Modem --111-- und   Speicher oder Lochstanzer --15-- sind über Leitungen --126 und 128-verbunden. Speicher oder Lochstanzer --15--, Codierer --13-- und Modem --111-- sind auch mittels Leitungen --17, 18 und 110-- mit eim Schalter --125-- verbunden. Schalter --125-verbindet die drei Einheiten --13, 15 bzw. 111-- selektiv entweder mit einer Schreib- oder   Anzeigeeinheit --124-- für   die englische oder eine andere Sprache oder mit einem Arabisch-Adapter --120--, der nachfolgend ausführlich beschrieben wird. Der Arabisch-Adapter --120-- ist mit einer   Schreib- oder Anzeigeeinheit --122-- für   die arabische Sprache verbunden, beispielsweise mit einer konventionellen Kathodenstrahlanzeigeeinheit oder mit einem konventionellen arabischen Fernschreiber. 



   Die   Tastatur --11--,   der 5-bit-Codierer --13--, der Speicher oder Lochstanzer --15--, die zugehörige Steuerung --16--, das   Modem   der   Empfänger --113--,   der Übertrager --117-- und die   Rufschaltung --119-- bilden   zusammen mit der Schreib- oder Anzeigeein-   heit --124-- für   die englische oder eine andere Sprache eine Standardfernschreibeinheit der Weise, wie sie üblicherweise zur Übertragung der englischen Sprache oder einer andern auf lateinischen Buchstaben basierenden Sprache Verwendung findet.

   Der Unterschied in diesem System ist darin zu sehen, dass die Tastatur mit arabischen Buchstaben, Zahlen, arithmetischen Zeichen, Satzzeichen, diakritischen Zeichen und in einem Ausführungsbeispiel mit einer dritten Codierebene sowie mit Fernschreibsteuersignalen ausgestattet ist, wie es beispielsweise aus Fig. 8 ersichtlich ist. Ausserdem wäre der Schalter --125-- bei einem einsprachigen System normalerweise unnötig. 



   Der in Fig. 1 dargestellte Fernschreiber kann zum Senden oder Empfangen verwendet werden oder im rein lokalen Betrieb, wobei Daten weder ausgesendet noch empfangen werden. Im lokalen Betrieb wird der   Übertrager --117-- ausgeschaltet,   so dass über Tastatur --11-- eingegebene Daten nicht übertragen werden. Die Daten werden jedoch vom Codierer --13-- in einen 5-bit-Baudot-Code umgeschrieben. Diese 5-bit-Codierungen werden je nach der Stellung des Schalters   - -125-- der Schreib- oder Anzeigeeinheit --124-- oder   dem   Arabisch-Adapter --120-- zugeführt.   



   Wenn man das   System. für   die arabischen Sprache verwenden will und der Benutzer die arabischen Typen auf der Tastatur --11-- verwendet, dann wird der Schalter --125-- in die in den Zeichnungen dargestellte Stellung gelegt. Die auf der   Tastatur --11-- betätigten   Tasten erzeugen für jede gedrückte Taste einen 5-bit-Code, der dem   Arabisch-Adapter --120-- zugeführt   wird. Der Arabisch-Adapter übersetzt die 5-bit-Codes in 8-bit-Codes, indem er 2 bits hinzufügt, die die richtige Form des Buchstabens anzeigen, und ein weiterers bit, welches anzeigt, ob der Buchstabe oben oder unten ist. Die zusätzlichen 2 bits, die die Form des Buchstabens angeben, werden erhalten, indem man die vorstehend beschriebenen Eigenschaften der arabisch-farsisehen Sprachen verwendet. 



   Wenn der Fernschreiber in Empfangsmode arbeitet und wenn der Schalter in der dargestellten Stellung steht, dann werden die vom   Empfänger --113-- über   die Leitung --114-- empfangenen Daten über das   Modem --111-- dem   Speicher oder dem Lochstanzer --15-- und dem Arabisch-Adap-   ter --120-- zugeführt.   Entsprechend der Einstellung der Speicher- oder Lochstanzer-Steuerung --16-werden die eingehenden Daten entweder durch den Speicher gespeichert oder durch den Lochstan-   zer --15--, u. zw.   auf konventionelle Weise. Die dem   Arabisch-Adapter --120-- zugeführten   Daten werden in der obenbeschriebenen Weise in ein 8-bit-Signal umgewandelt und ermöglichen die richtige Darstellung der arabischen Zeichen auf der Schreib- oder Anzeigeeinheit --122--. 



   Wenn der in Fig. l dargestellte Fernschreiber im   Sendemode   arbeitet, wobei der Schalter--125-in der dargestellten Arabisch-Stellung steht, dann wird der   Übertrager --117-- eingeschaltet.   



  5-bit-Codes werden vom Codierer --13-- sowohl dem Arabisch-Adapter als auch über das Mo-   dem --111-- dem Übertrager --117-- zugeführt.   Das Modem kann die 5-bit-Codes stattdessen auch von dem Speicher oder dem Lochstanzer --15-- über die Leitung --128-- erhalten, wie dies bei typischen, konventionellen Fernschreibsystemen der Fall ist. Fig. 8 zeigt ein Beispiel einer binären 5-bit-Baudot-Codierung der arabischen Sprache im Vergleich mit der Codierung der englischen Sprache auf einer Standard-Fernschreibtastatur. Die Codierung bietet 32 Möglichkeiten, jedoch können wesentlich mehr Zeichen übertragen werden, da die Tasten in einer unteren und einer oberen Stellung betätigt werden können.

   Die in den Zeilen 32 bis 38 aufgeführten Zeichen haben keine separaten Codierungen, sondern 

 <Desc/Clms Page number 8> 

 werden aus einem Punkt-Code (00000) und einem darauffolgenden, entsprechenden Zeichencode gebildet. Aus der Darstellung der Fig. 8 erkennt man, dass auf der Tastatur alle arabischen
Zeichen und Zeichenformen neben den Ziffern, den arithmetischen Zeichen, den Satzzeichen und diakritischen Zeichen und neben den Steuerbefehlen eines Standard-Fernschreibers vorgesehen sind. Die Codierung für die in den Zeilen 33 bis 38 aufgeführten Zeichen erhält man, indem man zunächst die Taste für den Punkt betätigt (und dadurch die Codierung erzeugt) und dann die Taste für das gewünschte Zeichen betätigt, oder indem man nur eine Taste betätigt und automatisch beide Codes erzeugt, wie dies im folgenden beschrieben ist. 



   Man erkennt aus der Darstellung der Fig. 8, dass die Zeichen, die mehr als eine Form aufweisen können, nur einer Tastenposition auf der Tastatur zugeordnet sind und daher auch nur einer 5-bit-Codierung entsprechen. Eine 5-bit-Codierung stellt daher ein Zeichen dar, dass bis zu vier verschiedene Formen annehmen kann, wobei in der 5-bit-Codierung selbst nichts enthalten ist, was über die Form des Zeichens eine Information geben könnte. Die Empfangsstation des Systems (d. h., ein entfernter Empfänger oder ein lokaler Drucker) müssen daher die Form eines Buchstabens an Hand der obenbezeichneten Kriterien bestimmen. 



   Das arabische Zeichen in der Tiefstellung der Tastatur, das in Fig. 8 mit 1 bezeichnet ist, entspricht beispielsweise dem englischen Q (vgl. beispielsweise Fig. 5). Das arabische Zeichen der mit 1 bezeichneten Stellung in der Fig. 8 dargestellten Tafel und das englische Q werden daher mit derselben Codierung codiert,   d. h.   10111. Wenn also das arabische Zeichen in der Position 1 der Tafel der Fig. 8 auf der Tastatur der   Fig. 1   und 5 betätigt wird, dann erzeugt der Codierer --13-- eine 10111-Codierung.

   Wenn der Schalter --125-- in der dargestellten Position steht, dann wird eines der beiden verschiedenen Formen aufweisenden arabisch-farsischen Zeichen entsprechend   Ni. l   in Fig. 8 dargestellt werden, wobei es von der Stellung dieses Zeichens relativ zu andern Zeichen abhängt, welche der beiden Formen gewählt werden. Wenn der Schalter --125-den Codierer direkt mit der Schreib- und Anzeigeeinheit --124-- verbindet, wird der Buchstabe Q dargestellt. Man erkennt also, dass der Arabisch-Adapter --120-- auf Grund der obenbeschriebenen Kriterien der Entscheidung fällt, welches arabische Zeichen dargestellt wird, obwohl die empfangene 5-bit-Codierung keine direkte Information hinsichtlich der richtigen Form des Zeichens liefert. 



   Ein Ausführungsbeispiel des   Arabisch-Adapters --120-- der Fig. 1   ist ausführlicher in Fig. 2 dargestellt. Der Arabisch-Adapter verwendet bei der Übertragung und beim Empfang aller arabisch-farsischer Sprachen die Standard-5-bit-Baudot-Codierung und ermöglicht es, alle arabischen Zeichen beim Empfang des Übertragungssystems in der richtigen Form wiederzugeben.

   Um dies zu erreichen, führt die Schaltung der Fig. 2 folgende Schritte durch : (A) Identifizierung einer Zeichenfolge als hochgestellt oder tiefgestellt,   (B)   Identifizierung des Typs jedes Zeichens einschliesslich der Feststellung, ob das Zeichen mit oder ohne Wagenvorschub darzustellen ist oder ob ein Wagenvorschub ohne Zeichendar- stellung vorliegt, (C) Verwendung der Informationen (A) und (B) zusammen mit einer Verzögerung, so dass die Form jedes Zeichens zum Zeitpunkt des Druckens festgestellt wird. Wegen der
Verzögerung erfolgt der Ausdruck eines Zeichens im allgemeinen gegenüber dem Empfang des Zeichens um ein Zeichen versetzt. 



   Wie man aus Fig. 2 erkennt, umfasst der Arabisch-Adapter   Zweifach-Wählschalter-25   und 28--, die die codierte Zeicheninformation bzw. eine Zeichenindikator-Information (ein Markierungssignal IND), welches als Zeitsignal für die empfangene Information dient) entweder von einer lokalen Tastatur oder einem lokalen Speicher oder von einem Übertragungssystem   auswählen,   
 EMI8.1 
 --25Fig. 1 dargestellten Übertragungssystems aufgenommen.

   In der andern Stellung der Schalter --25 und 28-- werden das Zeichen oder das Indikatorzeichen von dem der Tastatur zugeordneten   Codierer --13-- der Fig. 1 aufgenommen.    
 EMI8.2 
 

 <Desc/Clms Page number 9> 

    --26-- einemschaltung --218-- für   die Hoch-und Tiefstellung sowie dem Adressiereingang eines Lesespeichers   (ROM) --231-- zugeführt.   



   Das vom   Schalter --28-- ausgewählte   Indikatorsignal eines gültigen Zeichens wird über eine Leitung --29-- einer konventionellen   Verzögerungsschaltung --213--,   wie beispielsweise einem Flip-Flop, und dem einen Eingang eines   Gatters --216-- zugeführt.   Das Ausgangssignal der   Verzögerungschaltung --230-- wird   über eine Leitung --212-- dem Schiebeeingang des Schieberegister --210-- und einer zweiten konventionellen   Verzögerungsschaltung --214-- zugeführt.   



  Das Signal der zweiten   Verzögerungsschaltung --214-- wird   an eine dritte konventionelle Verzöge-   rungsschaltung --222-- und   einen Eingang eines konventionellen logischen Gatters --235-mit drei Eingängen geleitet. Dsas Ausgangssignal der   Verzögerungsschaltung --220-- wird   dem Zeiteingang eines Registers --227-- und einem Eingang eines logischen   Gatters --247-- zugeführt.   



   Das CHANGE-Ausgangssignal der Erkennungsschaltung --218--, welches angibt, dass ein Wechsel vom hochgestellten zum tiefgestellten Zustand oder umgekehrt stattgefunden hat, wird einem Eingang des Gatters --235--, einem invertierenden (logisch negativen) Eingang des Gatters --216-- und je einem Eingang von drei konventionellen logischen Gattern --243, 245 und 247-- (beispielsweise UND-Gatter) zugeführt. Das Ausgangssignal des Gatters --216-- wird über eine Leitung --217-- dem Zeit- oder Schiebereingang des Registers --220-- zugeleitet. Die Ausgangssignale der   Gatter --243,   245 und 247-werden der Schreib- oder Anzeigeeinheit --122-- 
 EMI9.1 
 Zeichen, ein Signal STATE, Angabe der Hoch- oder Tiefstellung sowie ein 2-bit-Signal MODE zur Angabe der Zeichenform) und liefert eine 8-bit-Zeichencodierung an das konventionelle 8-bit-Register --227--.

   Das Ausgangssignal CHAR des Registers --227-- ist die Codierung, die feststellt, welche Zeichenform dargestellt wird. 



   Der   Lesespeicher --231-- empfängt'eine 6-bit-Information,   welche die letzte empfangene 5-bit-Zeichencodierung und das laufende STATE-Signal für die Hoch- bzw. Tiefstellung umfasst, und liefert eine 4-bit-Information, die angibt, welchen Typ das empfangene Zeichen hatte (TYPE), ob ein Vorschub stattfinden sol oder nicht (CARRIAGE) oder ob ein Zeichen dargestellt werden soll (PRINT). Das TYPE-Signal ist eine 2-bit-Codierung, die sowohl einem Register-236als auch einer logischen   Schaltung --241-- zugeführt   wird. Das Zeichen kann vom Typ A, B, C oder D sein, wie das vorstehend beschrieben wurde (Typ D wird ausgeschlossen, da dieses ein Nichtvorschubsignal ist). Das CARRIAGE-Signal ist ein 1-bit-Signal, welches angibt, ob das laufende Zeichen mit einem Vorschub verbunden ist oder nicht.

   Das PRINT-Signal ist ein   1-bit-Signal,   welches angibt, ob ein Zeichen gedruckt werden soll (beispielsweise Zeichen vom Typ 0 werden nicht gedruckt). 



   Das TYPE-Signal wird über eine Leitung --232-- den Dateneingängen von zwei Stufen eines konventionellen   4-bit-Parallel-ein/Parallel-aus-Schieberegister --236-- zugeführt.   Die Ausgangssignale der ersten zwei Stufen werden über eine Leitung --238-- den Eingängen der andern zwei Stufen des   Schieberegisters --236-- zugeführt.   Die Ausgangssignale dieser letzten beiden Stufen werden als PRECEDE-Signal der konventionellen logischen Schaltung --241-zugeleitet. Das TYPE-Signal wird den beiden andern Eingängen der logischen Schaltung --241-als FOLLOW-Signal zugeführt. Die logische Schaltung --241-- kann eine konventionelle logische Schaltung sein (beispielsweise eine Mehrzahl von AND-, OR-, NAND- oder NOR-Gattern) die in konventioneller Weise derart miteinander verbunden sind, dass sie die Gleichungen der Tabelle II lösen.

   Das sich ergebende MODE-Signal gibt auf diese Weise in 2 bits eine der vier vorstehend diskutierten möglichen Formen eines Zeichens an. 



   Im Betrieb ermöglichen es die   Schalter --25   und 28--, 5-bit-Baudot-Zeichen und ein Indikatorzeichen für ein gültiges Zeichen entweder von einer lokalen Tastatur oder von einem Übertragungssystem auszuwählen. Das Übertragungssystem arbeitet in der üblichen Weise mit einem 5-bit-Baudot-Code. 



   Das Indikatorsignal für ein gültiges Zeichen wird üblicherweise in einem Fernschreibsystem erzeugt, um die Anwesenheit eines Zeichens anzuzeigen. Dieses Signal wird durch die Verzögerungs-   schaltungen --213,   214 und   222-- verzögert,   so dass eine gesteuerte Abfolge der Ereignisse 

 <Desc/Clms Page number 10> 

 in der unten beschriebenen Weise ermöglicht wird. 



   Die Erkennungsschaltung --218-- zur Feststellung der Hochstellung oder der Tiefstellung prüft das zuletzt im Register --210-- aufgenommene Zeichen und erzeugt zwei Ausgangssignale. 



  Das Zustands-Ausgangssignal STATE gibt an, dass alle Zeichen entsprechend dem so bezeichneten Binär-Zustand hochgestellt oder tiefgestellt sind, bis dieser Zustand geändert wird. Beispielsweise kann eine binäre 1 auf der Leitung --229-- Hochstellung angeben, während eine binäre 0 die Tiefstellung anzeigt. Ein CHANGE-Signal auf der Leitung --219-- zeigt eine Zustandsänderung an, wenn das zuletzt aufgenommene Zeichen ein Indikatorzeichen für Hoch- oder Tiefstellung war.

   Wenn das zuletzt aufgenommene Zeichen ein Indikatorzeichen für Hoch- oder Tiefstellung war (d. h., wenn die Taste, die gemäss der Angabe der Fig. 8 Hoch- oder Tiefstellung anzeigt, gedrückt worden ist), dann besteht die einzige Aktivität beim nächsten Zeichen darin, dass das Zustandssignal auf der   Leitung --229-- geändert   und das Register --210-- geladen werden, während das CHANGE-Signal auf Leitung --219-- das Gatter --216-- sperrt und eine Ladung des Registers --220-- verhindert. 



   Wenn das letzte aufgenommene Zeichen kein Indikatorzeichen für Hoch- oder Tiefstellung ist, dann wird das als nächstes auf der Leitung --29-- aufgenommene Indikatorzeichen durch das Gatter --216-- hindurchgelassen und führt dazu, dass die im Register --210-- gespeicherten Daten in das Register --220-- transferiert werden. 



   Nach einer Verzögerung Tl wird das letzte über die Leitung --26-- aufgenommene Zeichen im Register --210-- in Abhängigkeit des verzögerten Impulses der   Verzögerungsschaltung --213--   eingelesen. Dieses letzte 5-bit-Zeichen bildet zusammen mit dem 1-bit-STATE-Signal eine 6-bit- - Adresse für den Lesespeicher --231--. Dieser Lesespeicher speichert für jede Adresse ein 4-bit- - Wort. 2 bits identifizieren die Form des Zeichens als D, A, B oder C, wie dies in Fig. 7 angegeben ist, 1 bit gibt an, ob mit diesem Zeichen ein Vorschub verbunden ist, und 1 bit gibt an, ob mit diesem Zeichen ein Druck- oder Darstellungsvorgang verbunden ist.

   Beispielsweise erzeugt eine Leerstelle keinen Druck- oder Darstellungsvorgang, während die Hinzufügung eines Punktes oder eines diakritischen Zeichens einen Druck- oder Darstellungsvorgang auslöst, während damit kein Vorschub verbunden ist. 



   Nach einer weiteren Verzögerung   T   werden die TYPE-Daten im Register --236-- durch das Signal des Gatters --235-- weitergeleitet. Wenn das Signal im Register --210-- ein Indikatorsignal für   Hoch-oder Tief Stellung   ist oder wenn mit dem Zeichen einschliesslich des Hochstellungs- - Tiefstellungs-Zustands kein Vorschub verbunden ist, was durch das CARRIAGE-Signal auf der Leitung --233-- angezeigt wird, dann werden die Daten im   Register --236-- nicht   vorgeschoben. 



  Wenn die Daten vorgeschoben werden, dann werden die zwei binären bits des TYPE-Signals im Register --236-- gespeichert und erscheinen an der Leitung --238--, während die vorher an der Leitung --238-- anstehenden Daten gleichzeitig an der Leitung --240-- des Registers --236-- erscheinen. Die resultierenden 4 bits, der der logischen Schaltung --241-- von vom   Register --236-- zugeführt   werden, erzeugen ein MODE-Ausgangssignal.

   Das MODE-Ausgangssignal legt die Form des Zeichens fest und gibt an, ob es sich um ein Anfangszeichen, ein Mittelzeichen, ein Endzeichen oder ein unabhängiges Zeichen handelt (vgl.   Fig. 7).   Die 5-bit-Zeichencodierung des Registers --220-, das MODE-Signal für die Zeichenform und das Indikatorsignal für Hoch- oder Tiefstellung bilden zusammen eine Adresse, welche aus einer geeigneten Speicherstelle des   Lesespeichers --224-- ein   geeignetes Indikatorsignal für den Druck- oder Darstellungsvorgang des Zeichens in der richtigen Form liefert. 



   Als letzte Arbeitsschritte erfolgen ein Laden des Registers --227-- nach einer zusätzlichen Verzögerungszeit   T3   und eine Ausgabe des Zeichenindikators an eine Druck- oder Darstellungsvorrichtung über eine Leitung --248--. Wenn das zuletzt aufgenommene Zeichen ein Indikatorsignal für Hoch- oder Tiefstellung war, dann sind die Indikatorsignal IND, das Vorschubsignal CARRFEED und das Drucksignal PRINT gesperrt. Abhängig von der Art des verwendeten Druckers sind die Steuersignale für unabhängigen Vorschub und Druck nicht unbedingt notwendig, da diese Information mittelbar auch in dem 8-bit-Zeichen auf der Leitung --228-- enthalten ist, welches dem Drucker zugeführt wird. 



   Die endgültige Auswahl von Daten mit bis zu 8 bit (einige Systeme benötigen nur 7 bit) 

 <Desc/Clms Page number 11> 

 
 EMI11.1 
 für den Drucker wird mittels des Lesespeichers --224-- erreicht. Die 8-bit-Adresse dieses Lesespeichers besteht aus 5 bits, die über eine   Leitung --221-- zugeführt   werden, und der ursprünglich aufgenommenen Baudot-Codierung entsprechen, 1 bit, welches über die Leitung --229-- aufgenommen wird und die   Hoch- oder Tiefstellung angibt,   und einem 2-bit-MODE-Signal, welches über die   Leitung --242-- zugeführt   wird und in der obenbeschriebenen Weise die richtige Form eines Buchstabens angibt. 



   Wie bereits erwähnt, gibt es sechs arabische Buchstaben oder Zeichen, die sich von andern nur dadurch unterscheiden, dass sie einen Punkt oberhalb des Zeichens aufweisen. Bei der im Zusammenhang mit Fig. 8 diskutierten Tastatur ist vorgeschlagen worden, dass diese mit einem Punkt versehenen Zeichen für eine folgende Decodierung dadurch codiert werden können, dass man eine "Punkt"-Taste auf der Tastatur vorsieht, die man drücken muss, bevor man eine der sechs, 
 EMI11.2 
 werden. Man erkennt, dass dies natürlich keine zusätzlichen Codewörer erforderlich macht, sondern dass man die Bedienung der Tastatur dadurch nur vereinfacht. 



   Fig. 3 zeigt eine Schaltung, welche die Übertragung einer Punkt-Codierung (00000) ermöglicht, welcher die Codierung des entsprechenden Buchstabens folgt, wenn einer der einen Punkt aufweisenden Buchstaben gewählt wird. Wenn beispielsweise der dritte Buchstabe von links in der Fig. 9a gewählt wird, dann werden zwei Zeichencodierungen übertragen, nämlich (00000) für den Punkt und anschliessend (10101) für das Zeichen, welches dem gepunkteten Zeichen   (S. Zeichen   von links in Fig. 9a) entspricht. 



   Die sechs Eingangszeichen, deren erstes mit dem Bezugszeichen --301-- bezeichnet ist, sind die sechs arabischen Buchstaben ohne Punkt. Sie werden in der obenbeschriebenen Weise in einem der Tastatur zugeordneten 5-bit-Codierer --305-- verarbeitet. Dieselben sechs Buchstabenzeichen (diesmal jedoch mit Punkt) sind mit dem Bezugszeichen --302-- bezeichnet. Durch sechs ODER-Gatter --303-- gelangt bei jeder Betätigung der entsprechenden Tasten der Tastatur einer der sechs Buchstaben mit oder ohne Punkt in gleicher Weise in den Codierer --305--. Gleichzeitig liefert ein   ODER-Gatter-304-- mit sechs   Eingängen ein Ausgangssignal an einer Leitung --319--, welches dem Eingang eines der sechs"gepunkteten"Buchstaben entspricht.

   Ein Zeichenindikatorsignal auf der Leitung --318-- vom Codierer --305-- wird über UND-Gatter --310 und 311-mit dem Signal von dem ODER-Gatter --304-- bzw. dessen invertierter Form kombiniert. Die Signale der UND-Gatter --310 und 311-- und das Signal vom Coderer --305-- werden dann zusammen mit einer konventionellen   Verzögerungsschaltung-312-,   einem UND-Gatter --308--, einem UND-Gatter --306-- und einem ODER-Gatter --313-- benutzt, um die folgenden Schritte und Ausgangssignale zu erzeugen. 



   Wenn eine Taste für ein Eingangszeichen --301-- ohne Punkt betätigt wird, dann wird das UND-Gatter-306-- durchgestellt, so dass das 5-bit-Zeichen am   Ausgang --307-- erscheinen   kann, wenn gleichzeitig ein einziges Zeichenindikatorsignal an einer Leitung --317-- erscheint. 



   Wenn eine Taste für ein Zeichen --302-- mit einem Punkt betätigt wird, dann erscheinen an der Ausgangsleitung --317-- zwei aufeinanderfolgende Zeichenindikatorsignale, die zeitlich um die von der   Verzögerungsschaltung --312-- bestimmte   Zeitspanne auseinanderliegen. Die Zeitspanne liegt in der Grössenordnung von 10 bis 30 ms, so dass einerseits eine Trennung ermöglicht wird und anderseits der Bediener der Fernschreibeinrichtung noch nicht eine weitere Taste gedrückt hat, bevor das Doppelzeichen vollständig   ist. Während   des ersten Zeichenindikatorsignals CHAR IND ist das UND-Gatter --306-- gesperrt, so dass das Ausgangssignal auf der Leitung --307-- die vollständige Null-Codierung für den Punkt ist.

   Während des zweiten Zeichenindikatorsignals ist der das ODER-Gatter --308-- gesperrt, so dass die Codierung für das Zeichen --301-- ohne den Punkt an den aus dem Codierer führenden Leitungen --306-- am Ausgang --307-- erscheint. 



   Bei dem in Fig. 1 dargestellten Ausführungsbeispiel der Erfindung mit der Zeichengruppierung 

 <Desc/Clms Page number 12> 

 und Codierung der Fig. 8 wird eine Punkt-Codierung vorgesehen, um die Unterschiede zwischen den Zeichen der Fig. 9a und 9b zu berücksichtigen. Wie aus der Tabelle der Fig. 10 ersichtlich, werden dort die Zeichen in drei Gruppen eingeteilt, und für jede Gruppe wird eine Höhen-Codierung vorgesehen. Auf diese Weise hat man 93 Zeichen und Steuer-Codierungen zur Verfügung. 



  Auf diese Weise kann die gesamte in Fig. 10 dargestellte Information sowie im Bedarfsfall notwendige Information für   Übertragungs- oder   Speicherzwecke codiert werden. 



   Man erkennt aus der Fig. 10, dass zwei der Höhen-Codes die Codierungen 11111 für die Tiefstellung und die Codierung 11011 für die Hochstellung sind. Die 0-Codierung 00000 kann als dritte   Höhen- und   Niveau-Codierung verwendet werden. 



   Mit einem solchen Drei-Niveau-System kann die Schaltung der Fig. 1 und 2 mit einer geringen Abänderung der   Erkennungsschaltung --218-- für   die Hoch-und Tiefstellung und der Lesespeicher Verwendung finden, wobei die Abänderungen derart gewählt sind, dass die Codierung des dritten Niveaus erkannt und zur Adressierung der geeigneten Zeichen im Speicher verwendet werden kann, wie dies an Hand eines Zwei-Niveau-Systems oben erörtert wurde. Selbstverständlich können die vorstehend erwähnten Funktionen ausgeführt werden, indem man Standard-Mikroprocessorund Speicher-Chips (integrierte Schaltungen) verwendet, um eine zusätzliche Flexibilität zu erreichen. 



   Alternativ kann man eine Schaltung verwenden, wie sie in Fig. 11 dargestellt ist. Eine Tastatur --400-- ähnlich der in Fig. 4 dargestellten (oder eine arabische Standard-Schreibmaschinen- - Tastatur mit zusätzlichen Fernschreibbetätigungstasten) liefert ein ASCII-codiertes Zeichensignal CHAR an den Eingang eines   Speichers-402-- ;   gleichzeitig wird ein Markierungsignal CHAR IND an den Eingang eines logischen Schaltkreises --404-- geliefert. 



   Das CHAR-Signal der Tastatur ist ein 8-bit-ASCII-Signal, wenn man im Handel erhältliche 
 EMI12.1 
 im Speicher zu adressieren. Mit dem 5-bit-Code im Speicher ist ein 3-bit-Identifizierungscode ID gespeichert, welcher der logischen   Eingangsschaltung --404-- zugeführt   wird. 



   Das CHAR'-Signal wird einer konventionellen Schiebeschaltung --406-- zugeleitet, die als sogenannte first-in, fist-out-Schaltung (FIFO) arbeitet. Diese Schaltung --406-- wird durch IN-Signale und durch OUT-Signale der logischen Schaltung --404-- gesteuert. Die FIFO-Schal-   tung --406-- "glättet" auf   konventionelle Weise die Übertragsrate des CHAR'-Signals, so dass diese Rate relativ gleichförmig ist und die Kapazität eines Fernschreibers oder eines Druckers nicht überschreitet (beispielsweise überschreitet sie nicht 75 Bauds). 



   Das 5-bit-Zeichensignal CHAR'der FIFO-Schaltung wird einem konventionellen "universellen asynchronen   Empfänger-Übertrager" --408--   (universal asynchronous Receiver-Transmitter UART) zugeführt, der dieses Signal seinerseits zum Zwecke der Übertragung als TS-Signal einer konventionellen Interface-Schaltung --410-- (STUNT-CIRCUITS) zuleitet, die die Übertragung und den Empfang der Signale mit akzeptabler Stärke und in geeigneter Form steuern. Steuersignale für die Interface-Schaltung --410-- werden von einer Signal-Steuerlogik --412-- geliefert, welche Steuersignale LOCAL, OFF-LINE von der Tastatur oder einer andern Steuersignalquelle empfängt. 



  Wenn das System als Fernschreiber arbeitet (also nicht im LOCAL-Betrieb und nicht im OFF-LINE- - Betrieb), wird die Eingangsinformation von der Tastatur --400-- aus der Interface-Schaltung zum TTY und zu dem Empfänger-Übertrager zur gleichzeitigen Übertragung und Darstellung geleitet. 



  Im LOCAL-Betrieb wird das IS-Signal (als RS-Signal) durch die Interface-Schaltung einem Drucker zugeleitet und ausserdem einem in den Zeichnungen nicht dargestellten Wählschalter. Der Wählschalter kann die Informationssignale einem Lochstanzer oder einem andern Speicher zuführen, so dass die Daten der Tastatur gleichzeitig mit dem Ausdruck gespeichert werden. Das System kann auch im OFF-LINE-Betrieb arbeiten, so dass die von der Interface-Schaltung empfangenen, eingehenden Daten dem Wählschalter zur Speicherung und zum später erfolgenden Ausdrucken zugeführt werden. 



   Das RS-Signal wird von dem Empfänger-Übertrager UART einer Drucksteuerschaltung zugeführt, die in der Weise ähnlich der Eingangsschaltung aufgebaut ist, dass die Hoch-Tiefstellungscodierung erkannt wird, so dass das empfangene Zeichen erkannt wird. Die Form des Zeichens wird bestimmt und ein geeignetes Zeichen wird durch die Adressierung eines Speichers ausgewählt, 

 <Desc/Clms Page number 13> 

 
 EMI13.1 
 geleitet wird. 



   Die Ausgangssignale der Register --414 und 418-werden einem Ausgangsspeicher --420-zugeführt, der ein PRINT-Signal liefert, dass im ASCII-Code oder in einem andern kompatiblen Code vorliegt. Das PRINT-Signal wird einem geeigneten Druckmechanismus zugeleitet, beispielsweise dem elektrisch erregbaren Antriebselement der Schreibtastatur, welche die den individuellen Zeichen zugeordneten Druckvorrichtungen betätigen. Das PRINT-Signal wird ausserdem einer logischen   Ausgangsschaltung --422-- zugeleitet,   welche ein Druckmarkierungssignal PRINT STRB für den Fernschreiber oder eine andere Ausgabeeinheit liefert. Die logische Ausgangsschaltung liefert ausserdem ein 2-bit-Signal zur Angabe der Hoch- oder Tiefstellung an das Register-l- (414) und Steuersignale, die das Einlesen der Register --414 bis 418-- steuern. 



   Im Betrieb wählen das 7-bit-Zeichensignal CHAR der Tastatur und das LVL-Signal des logischen Schaltkreises --404-- den geeigneten 5-bit-Baudot-Code im Speicher --402-- aus, der dann der   Schiebeschaltung --406-- durch   ein logisches Signal IN zugeführt wird. Der logische Schaltkreis --404-- bestimmt auch die Gruppe, zu welcher das Zeichen gehört, und sorgt dafür, dass der geeignete Hoch- und Tiefstellungs-Code im Speicher aufgefunden und in die Folge der Zeichencodierungen eingeschoben wird. 



   Der logische   Eingangsschaltkreis --404-- bestimmt   auf Grund des ID-Signals, wenn die im Speicher angesteuerte Codierung die eines diaktritischen Zeichens ist. Wenn das der Fall ist, dann ist einem solchen Zeichen keine besondere Form zugeordnet (beispielsweise Anfangsform, Mittelform, Endform oder unabhängige Form). Wenn ein diakritisches Zeichen in einer Folge von Zeichen auftritt, dann wird es oberhalb des unmittelbar vorhergehenden Zeichens gedruckt. 



  Wenn also eine Folge von Zeichen   Cl,   C2, C3 und C3 übertragen wird mit einem diaktrischen Zeichen DM zwischen C2 und C3   (d. h.   die Folge ergibt sich dann zu Cl, C2, DM, C3, C4) dann muss DM gedruckt werden, ehe C3 gedruckt wird, jedoch kann C2 nicht gedruckt werden, bis C3 zwei Zeichen später empfangen ist. Um nun zu vermeiden, dass der Drucker mit doppelter Geschwindigkeit drucken muss, ändert der logische   Eingangsschaltkreis --404-- die   Folge dadurch, dass ein erster Hoch- oder Tiefstellungs-Code LI, (11111) hinter dem Zeichen eingefügt wird, oberhalb dessen das diakritische Zeichen erscheint   (d. h.   nach C3), so dass die Folge nun lautet Cl, C2, DM, C3, Ll, C4.

   Auf diese Weise wird auf der Empfängerseite C2 gedruckt, wenn C3 empfangen wird, DM wird gedruckt, wenn Ll empfangen wird, und C3 wird gedruckt, wenn C4 empfangen wird. Der Drucker kann daher gelegentlich verzögert werden, aber er muss niemals schneller drucken als mit normaler Geschwindigkeit. Natürlich arbeitet die   Schiebeschaltung --406-- als   glättender Puffer während des Einschubes des Hoch- und Tiefstellungs-Codes und während jeglicher nicht gleichförmiger Einfügung von Zeichen, so dass eine gleichmässige Übertragungsrate erreicht wird. 



   Beim Empfang von Zeichen für den Druckvorgang enthält das   Register --1-- die   zuletzt empfangene Zeichencodierung. Das als nächstes empfangene Zeichen führt dazu, dass der Inhalt des Registers-l-in das Register --2-- (oder in das Register --3--, falls das Register-lein diakritisches Zeichen enthält) übertragen wird und dass dieses als nächste empfangene Zeichen in das Register-l-eingelesen wird. Die logische   Ausgangsschaltung --422-- bestimmt   die Form des Zeichens und liefert zusammen mit dem 5-bit-Zeichen-Code Form-ID-Signale FID an den Ausgangsspeicher --420--. Die Form des Zeichens hängt natürlich von dem 5-bit-Code, der Stellung des Zeichens in einem Wort und dem Hoch- oder Tiefstellungs-Code des vorhergehenden Zeichens (erstes, zweites oder drittes Niveau) ab.

   Die Tatsache, ob das Zeichen ein diakritisches Zeichen ist oder nicht, bestimmt den Druckvorgang, da diakritische Zeichen keinen Vorschub benötigen. In diesem Falle wird das diakritische Zeichen im Register --3-- gespeichert, und eine Zeitfolge wird gestartet, so dass der zeitliche Ablauf des Druckvorganges in der oben beschriebenen Weise verläuft   (d. h. Cl,   C2, DM, C3, L1). 



   Bei Verwendung des Erfindungsgegenstandes in Verbindung mit Arabisch-Adaptern, von denen Ausführungsbeispiele in den Fig. 2 und 11 beschrieben sind, kann die Tastatur einer arabischen Schreibmaschine oder einer andern Druckmaschine im Aufbau vereinfacht werden, 

 <Desc/Clms Page number 14> 

 so dass einerseits die Schreibgeschwindigkeit der Bedienungsperson erhöht und anderseits das Training vereinfacht werden kann. Wie das im einzelnen erreicht werden kann, ist in den Fig. 12 und 13 dargestellt. 



   Eine vereinfachte   Tastatur --450-- für   arabisch-farsische Schriftzeichen hat für jeden Buchstaben nur eine Form. Diese Tastatur ist mit einem   Arabisch-Adapter --120-- verbunden,   wie er in Fig. 2 dargestellt ist. Die an den Eingangs- und Ausgangsklemmen des Adapters --120-angegebenen Signale sind dieselben wie die in Fig. 2 dargestellten. Die Ausgangssignale des 
 EMI14.1 
 liefert die zuletzt eingelesene Zeichencodierung an eine Leuchtdiode (LED) in der Ausgabeeinheit --452--, so dass das zuletzt eingegebene Zeichen angezeigt wird. Diese Leuchtdiodenanzeige kann in einer geeigneten Position angeordnet werden, so dass sie die Bedienungsperson leicht sieht. 



   Im Betrieb hat die Bedienungsperson eine   Tastatur --450--,   die nur Tasten für eine Form der arabisch-farsischen Zeichen hat. Daher kann jedes Zeichen geschrieben werden, ohne dass man von einem Zeichenniveau zum andern umschalten muss (beispielsweise wie das bei Hochund Tiefstellung notwendig ist, wenn eine Taste zwei Zeichen trägt). Wenn ein Wort geschrieben wird, wird der Codierung für jede von der Bedienungsperson betätigte Zeichentaste in der konventionellen Weise erzeugt, und der   Arabisch-Adapter --120-- bestimmt   die Form des Zeichens aus seiner Position in der Zeichenfolge in der obenbeschriebenen Weise. Der tatsächlich geschriebene oder gedruckte Buchstabe hat dann die richtige Form, obwohl die Bedienungsperson in allen Fällen nur eine Form des Buchstabens in die Tastatur eingegeben hat.

   Es wird darauf hingewiesen, dass die Ausgabeeinheit in der obenbeschriebenen Weise aufgebaut ist (beispielsweise als konventionelle Schreibmaschinenausgabeeinheit für die komplette arabisch-farsische Sprache) und in der Lage ist, alle Formen der Buchstaben zu schreiben. 



   Da der Arabisch-Adapter --120-- nur dann ein Zeichen liefert, wenn zwei aufeinanderfolgende Zeichen in die Tastatur eingegeben worden sind, wird die Leuchtdiodenanzeige benötigt, um den zuletzt eingegebenen Buchstaben anzuzeigen. Eine solche Anzeige kann für eine geübte Bedienungsperson unnötig sein, sie stellt jedoch eine Hilfe dar, wenn beim Schreiben Unterbrechungen auftreten. 



   Diese vereinfachte Form einer Tastatur reduziert die Umschaltvorgänge erheblich, die bei bekannten Standard-Schreibmaschinen der arabischen Sprache notwendig sind. Während eine gute Bedienungsperson auf einer bekannten Vorrichtung 35 bis 40 Wörter/min schreiben kann, werden die Schreibgeschwindigkeiten durch die Vorrichtungen der Fig. 12 und 13 fast verdoppelt, so dass eine Schreibgeschwindigkeit erreichbar ist, die Schreibmaschinen mit lateinischer Schrift entspricht. 



   Natürlich kann man auch eine arabische Standard-Tastatur mit allen Formen der arabisch-farsischen Buchstaben verwenden, wenn eine Bedienungsperson, die bisher auf einer solchen Tastatur geschrieben hat, weiterhin mit einer solchen Tastatur schreiben will. Dasselbe System wie es in Fig. 13 dargestellt ist, kann dann trotzdem verwendet werden, wobei die Umschaltungen von Hoch- in Tiefstellung und umgekehrt entweder nicht erfolgen oder, falls sie doch erfolgen, bei der Codierung der Zeichen nicht berücksichtigt werden. 



   Die Erfindung kann auch zur Speicherung und zum Abrufen von Informationen in der in Fig. 1 dargestellten Weise verwendet werden, indem man das System nur im lokalen Betrieb arbeiten lässt und durch die Tastatur eingegebene Informationen in den Speicher --15-- einliest. Wenn man diese Informationen verwenden will, können sie mittels des Arabisch-Adapters ausgelesen und einer Anzeigeeinheit zugeführt werden. 

**WARNUNG** Ende DESC Feld kannt Anfang CLMS uberlappen**.

Claims (1)

  1. PATENTANSPRÜCHE : 1. System zur Verarbeitung arabisch-farsischer Textdaten, wobei eine Folge von Zeichenco- <Desc/Clms Page number 15> dierungen erzeugt und die Daten als eine Folge von 5-bit-Digitalwörtern codiert werden, von denen jedes für ein Zeichen steht, und bei welchem mit den Zeichencodierungen die Zeichen dargestellt werden, dadurch gekennzeichnet, dass die 5-bit-Digitalwörter derart gewählt werden, dass sie arabische Buchstaben ungeachtet deren richtiger Form jeweils nur in einer einzigen Form wiedergeben, dass die Daten klassifiziert und dabei jedes Zeichen der Daten einer von mindestens drei vorbestimmten Gruppen zugeordneten werden, dass in die Folge der 5-bit-Digitalwörter eine von mindestens drei 5-bit-Identifikationscodierungen eingefügt werden,
    die mindestens ein nachfolgendes 5-bit-Digitalwort als zu der vorbestimmten Gruppe gehörig identifizieren, dass die Sprachdaten als Folge von 5-bit-Digitalwörtern in einem temporären sequentiellen Speicher gespeichert werden, von denen jedes Zeichen der Daten einschliesslich arabische Zeichen darstellt, wobei die richtige Form der arabischen Zeichen unberücksichtigt bleibt, dass die 5-bit-Wörter nacheinander aus dem Speicher ausgelesen werden und die richtige Form jedes durch ein 5-bit-Wort dargestellten arabischen Zeichens als Funktion der Identität des arabischen Zeichens selbst sowie des vorhergehenden und des nachfolgenden 5-bit-Wortes bestimmt wird, und dass die Daten mit den arabischen Zeichen in ihrer richtigen Form und in ihrer richtigen Position dargestellt werden,
    wobei die Position von zwei aufeinanderfolgenden Zeichen in Abhängigkeit von den ausgelesenen 5-bit-Wörtern und der bestimmten arabischen Zeichenform identisch sein kann.
    2. System nach Anspruch 1, dadurch gekennzeichnet, dass Zeichen in verschiedenen Gruppen gleiche 5-bit-Wörter als Codierung zugeordnet werden, dass eine 5-bit-Identifikationscodierung erzeugt wird, die angibt, welcher Gruppe ein Zeichen zugeordnet ist, und dass die 5-bit-Identifikationscodierung in die Folge der 5-bit-Wörter immer dann vor ein 5-bit-Wort eingeschoben wird, wenn das diesem 5-bit-Wort entsprechende Zeichen einer andern Gruppe zugeordnet ist, als das dem vorhergehenden 5-bit-Wort entsprechende Zeichen.
    3. System nach Anspruch 2 zum Übertragen der arabisch-farsischen Textdaten durch Fernschreiber, dadurch gekennzeichnet, dass in die Folge der 5-bit-Wörter eine von mindestens drei 5-bit-Identifikationscodierungen eingefügt wird, welche mindestens eines der folgenden 5-bit-Wörter als zu einer vorbestimmten Gruppe gehörig identifiziert, dass die Folge von 5-bit-Wörtern und 5-bit-Identifikationscodierungen an einen entfernten Ort übertragen wird, dass die Folge von 5-bit-Wörtern und 5-bit-Identifikationscodierungen an dem entfernten Ort aufgenommen wird und jedes aufgenommene 5-bit-Wort und jede aufgenommene 5-bit-Identifikationscodierung kurzzeitig gespeichert wird, dass das durch das gespeicherte 5-bit-Wort dargestellte Zeichen als eines aus der Zahl der möglichen Zeichen klassifiziert wird,
    dass für jedes einen arabischen Buchstaben darstellende 5-bit-Wort eine Formcodierung erzeugt wird, die die Form des durch das 5-bit-Wort dargestellten Buchstabens als Funktion der dem gespeicherten 5-bit-Wort unmittelbar vorangehenden bzw. nachfolgenden Zeichen angibt, und dass die aufgenommene Folge der 5-bit-Wörter als arabische Zeichen in richtiger Form und richtiger Position sowie als andere durch die 5-bit-Wörter spezifizierte Zeichen in Abhängigkeit von den 5-bit-Wörtern und den 5-bit-Identifikationscodierungen wiedergegeben wird, wobei aufeinanderfolgende Zeichen in derselben Position dargestellt werden, wenn ein Signal empfangen wird, das angibt, dass ein empfangenes Zeichen von der Art ist, dass die Anzeigeposition ungeändert bleibt.
    4. Vorrichtung zur Anwendung des Systems nach den Ansprüchen 1 bis 3, mit einer Einrichtung zur Erzeugung einer Folge von Zeichencodierungen, die jeweils einem Zeichen der arabisch-farsischen Sprache entsprechen, und einer Wiedergabeeinheit für die Zeichen, gekennzeichnet durch eine Einrichtung zum Einschieben einer von mindestens drei 5-bit-Identifikationscodierungen in eine Folge von durch 5-bit-Digitalwörter gebildete Zeichencodierungen, die angibt, dass mindestens ein nachfolgendes 5-bit-Wort einer von mindestens drei Zeichengruppen zuzuordnen ist, die der eingeschobenen 5-bit-Identifikationscodierung entspricht, durch temporäre sequentielle Speicher (210,220) zur Speicherung der 5-bit-Wörter während mindestens zwei aufeinanderfolgender Zeichen, durch eine auf die beiden gespeicherten 5-bit-Wörter ansprechende Einrichtung (231)
    zum Klassifizieren jedes gespeicherten 5-bit-Wortes als eines einer Vielzahl vorbestimmter Zeichentypen, durch eine zweite Codiereinrichtung (241) zur Erzeugung einer zweiten Codierung, die jedes gespeicherte 5-bit-Wort abhängig von der Klassifizierung des Zeichentyps des unmittelbar vorher- <Desc/Clms Page number 16> gehenden und des nachfolgenden Zeichens als eine von vier möglichen arabischen Buchstabenformen identifiziert, und durch eine Einrichtung zur Darstellung jedes durch ein gespeichertes 5-bit-Wort repräsentierten arabischen Zeichens in richtiger Form und Position in Abhängigkeit der zweiten Codierung und des gespeicherten 5-bit-Wortes mit einer Einrichtung zur Vorschubunterdrückung, die in Abhängigkeit von der Klassifizierungseinrichtung, die angibt, wann ein darzustellendes Zeichen den Typ eines nicht mit einem Vorschub korrelierten Zeichens hat,
    aufeinanderfolgende Zeichen in derselben Position darstellt.
    5. Vorrichtung nach Anspruch 4, dadurch gekennzeichnet, dass die Einrichtung zur Darstellung der Zeichen die von den 5-bit-Wörtern dargestellten arabischen Zeichen in Abhängigkeit von der 5-bit-Identifikationscodierung, der zweiten Codierung und dem gespeicherten 5-bit-Wort in der richtigen Form darstellt.
    6. Vorrichtung nach den Ansprüchen 4 und 5, dadurch gekennzeichnet, dass die Einrichtung zur Darstellung der Zeichen eine Codiereinrichtung zur Erzeugung eines 8-bit-Adressierungssignals aufweist, die das gespeicherte 5-bit-Wort als eines einer Anzahl möglicher Zeichen einschliesslich aller arabischer Schriftzeichen und ihrer Formen, der üblichen Fernschreibsteuersignale, der Satzzeichen, der Ziffern und der diakritischen Zeichen spezifiziert, wobei die Zahl der möglichen Zeichen und Zeichenformen über 100 liegt.
AT777378A 1977-10-31 1978-10-31 System und vorrichtung zur verarbeitung arabisch-farsischer textdaten AT387877B (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AT777378A AT387877B (de) 1977-10-31 1978-10-31 System und vorrichtung zur verarbeitung arabisch-farsischer textdaten

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US05/846,824 US4145570A (en) 1977-10-31 1977-10-31 Method and system for 5-bit encoding of complete Arabic-Farsi languages
US92467978A 1978-07-14 1978-07-14
AT777378A AT387877B (de) 1977-10-31 1978-10-31 System und vorrichtung zur verarbeitung arabisch-farsischer textdaten

Publications (2)

Publication Number Publication Date
ATA777378A ATA777378A (de) 1988-08-15
AT387877B true AT387877B (de) 1989-03-28

Family

ID=27150881

Family Applications (1)

Application Number Title Priority Date Filing Date
AT777378A AT387877B (de) 1977-10-31 1978-10-31 System und vorrichtung zur verarbeitung arabisch-farsischer textdaten

Country Status (1)

Country Link
AT (1) AT387877B (de)

Also Published As

Publication number Publication date
ATA777378A (de) 1988-08-15

Similar Documents

Publication Publication Date Title
DE2835320C2 (de) Schaltungsanordnung für die Einstellung des linken Randes bei einem Textverarbeitungsgerät
DE1296182B (de) Verfahren zur UEbertragung binaerkodierter Informationssignale sowie Kodierer zur Abgabe solcher Signale und mit diesem betreibbarer Dekodierer
DE1925031A1 (de) Schreibautomaten
DE2847085C2 (de) Verfahren und Vorrichtung zur Verarbeitung arabisch-farsischer Textdaten
DE2749012C2 (de)
DE2548719A1 (de) Drucker mit pufferspeicher
DE2444326C2 (de) Vorrichtung zum aufzeichnen bzw. wiedergeben von daten bzw. informationen in arabischer schrift
DE2452867C3 (de) Steuereinrichtung für einen Punktmatrixdrucker
DD141912A5 (de) Verfahren und vorrichtung zum aufbau von texten mit arabischen buchstaben
DE2727855A1 (de) Anordnung zur steuerung einer informationswiedergabe
DE2748289B1 (de) Verfahren und Anordnung zum Vermindern der Redundanz von Zeichen oder grafische Muster beschreibenden binaeren Zeichenfolgen
DE2716028C3 (de) Gemischte Übermittlung von Texten, Kommandos und Instruktionen
US4145570A (en) Method and system for 5-bit encoding of complete Arabic-Farsi languages
AT387877B (de) System und vorrichtung zur verarbeitung arabisch-farsischer textdaten
DE2416587A1 (de) Vorrichtung zur informationsaufzeichnung
DE69019312T2 (de) Serien-Drucker in Punktmatrixverfahren.
DE2904753A1 (de) Verfahren und vorrichtung zum erstellen eines vorabdrucks von text und befehlen in einer textverarbeitungsanlage
EP0152135B1 (de) Verfahren zur Uebertragung von Zeichen mittels Codewörtern eines Telegraphen-Alphabets, insbesondere des Internationalen Telegraphen-Alphabets Nr. 2, und Vorrichtung zur Ausführung desselben
DE2246551C2 (de) Datenübertragungsanordnung
DE2748218C3 (de) Verfahren und Anordnung zum Übertragen von Zeichen
EP0053660B1 (de) Verfahren zum Darstellen von Zeichen
DE3014218C2 (de) Faksimileeinrichtung
DE2640848C2 (de) Anordnung zum Codieren und Decodieren von alphanumerischen Informationszeichen
DE2233452A1 (de) Steuereinrichtung fuer datenendgeraete
DE3303405A1 (de) Vorrichtung zur erweiterung der anzahl verschiedenartiger, fernuebertragbarer zeichen fuer fernschreibmaschinen

Legal Events

Date Code Title Description
ELJ Ceased due to non-payment of the annual fee