FR2604814A1 - LANGUAGE ANALYZER - Google Patents

LANGUAGE ANALYZER Download PDF

Info

Publication number
FR2604814A1
FR2604814A1 FR8713742A FR8713742A FR2604814A1 FR 2604814 A1 FR2604814 A1 FR 2604814A1 FR 8713742 A FR8713742 A FR 8713742A FR 8713742 A FR8713742 A FR 8713742A FR 2604814 A1 FR2604814 A1 FR 2604814A1
Authority
FR
France
Prior art keywords
dictionary
analysis
characters
information
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8713742A
Other languages
French (fr)
Other versions
FR2604814B1 (en
Inventor
Toshihiko Yokogawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP61234328A external-priority patent/JPH0821031B2/en
Priority claimed from JP61234327A external-priority patent/JPH0816910B2/en
Priority claimed from JP61240215A external-priority patent/JPH0821032B2/en
Priority claimed from JP61243197A external-priority patent/JPH0821033B2/en
Priority claimed from JP61245196A external-priority patent/JPH0797372B2/en
Priority claimed from JP61248431A external-priority patent/JPH0821034B2/en
Priority claimed from JP61251916A external-priority patent/JPS63106867A/en
Priority claimed from JP61253763A external-priority patent/JPS63113669A/en
Priority claimed from JP61255512A external-priority patent/JP2688020B2/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of FR2604814A1 publication Critical patent/FR2604814A1/en
Publication of FR2604814B1 publication Critical patent/FR2604814B1/en
Application granted granted Critical
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

L'ANALYSEUR DE LANGAGE SELON L'INVENTION COMPREND UN DICTIONNAIRE 1018 DANS LEQUEL SONT EMMAGASINEES DES DONNEES DE DICTIONNAIRE COMPORTANT DES DONNEES DE MORPHEMES POUR LES MOTS, LES MOTS COMPOSES ET LES LOCUTIONS, ET UN MOYEN D'ANALYSE 1016 PERMETTANT D'EFFECTUER L'ANALYSE MORPHOLOGIQUE D'UNE PHRASE INTRODUITE EN SE REPORTANT AU DICTIONNAIRE, OU LE DICTIONNAIRE CONTIENT DES DONNEES DE DEGRE DE COUPLAGE QUI INDIQUENT LE DEGRE DE COUPLAGE ENTRE CHACUN DES MOTS CONSTITUANT LES MOTS COMPOSES ET LES LOCUTIONS, ET LE MOYEN D'ANALYSE SE REPORTE AU DICTIONNAIRE POUR LES MOTS RESPECTIFS CONTENUS DANS LA PHRASE D'ENTREE ET, LORSQUE PLUSIEURS DONNEES DE DICTIONNAIRE SONT TROUVEES POUR UN SEUL MOT EN COMBINAISON AVEC D'AUTRES MOTS, IL CHOISIT LA COMBINAISON DE MOTS AYANT LE DEGRE DE COUPLAGE LE PLUS ELEVE EN S'APPUYANT SUR LES DONNEES DU DEGRE DE COUPLAGE.LANGUAGE ANALYZER ACCORDING TO THE INVENTION INCLUDES A 1018 DICTIONARY IN WHICH DICTIONARY DATA COMPRISING MORPHEM DATA FOR WORDS, COMPOSED WORDS AND LOCATIONS, AND A MEANS OF EFFECT 1016 MORPHOLOGICAL ANALYSIS OF A PHRASE INTRODUCED WITH REFERENCE TO THE DICTIONARY, OR THE DICTIONARY CONTAINS DATA OF DEGREE OF COUPLING WHICH INDICATES THE DEGREE OF COUPLING BETWEEN EACH OF THE WORDS CONSTITUTING THE WORDS COMPOSED AND THE LOCATIONS, AND THE MEANS OF ANALYSIS DICTIONARY FOR THE RESPECTIVE WORDS CONTAINED IN THE ENTRY PHRASE AND, WHEN SEVERAL DICTIONARY DATA ARE FOUND FOR A SINGLE WORD IN COMBINATION WITH OTHER WORDS, IT CHOOSES THE HIGHEST COUPLING OF WORDS BASED ON THE DATA OF THE DEGREE OF COUPLING.

Description

REQU TE (suite) 2 6 0 4 81 4 ère d'utiliser cette liasse suite " au cas oREQU TE (continued) 2 6 0 4 81 4 st use this package continued "in case

l'un des emplacements de la liasse requête sayrpj-rait,insuffisant pour ritenir le renseignement a fournir. Chacune des rubriques ainsi complétée sur la présente Tla's'e sera repérée par son  one of the locations in the sayrpj-rait request bundle, insufficient to contain the information to be provided. Each of the sections thus completed on this Tla's'e will be identified by its

néro et son titre l p. ex. * 2 Demandeur ( suite)).  néro and its title l p. ex. * 2 Applicant (continued)).

7) DECLARATION DE PRIORITE DATE DE DEPOT NUMERO  7) DECLARATION OF PRIORITY DATE OF DEPOSIT NUMBER

Pays d'origine JP 24/10/86 n 251916/86 JP 27/10/86 n 253763/86 JP 27/10/86 n 255512/86 Le 3 Octobre 1987 étant un samedi, nous déposons valablement ce jour Lundi 5 Octobre 1987; MV Paris 208.79.35 DB0162 1060, 06-79 suite La présente invention concerne un analyseur de langage et, en particulier, elle concerne un analyseur de langage visant à analyser des langages naturels pour servir dans des dispositifs de  Country of origin JP 24/10/86 n 251916/86 JP 27/10/86 n 253763/86 JP 27/10/86 n 255512/86 October 3, 1987 being a Saturday, we validly deposit this day Monday October 5 1987; MV Paris 208.79.35 DB0162 1060, 06-79 continued The present invention relates to a language analyzer and, in particular, it relates to a language analyzer intended to analyze natural languages for use in communication devices.

traduction automatique.automatic translation.

Les analyseurs de langage de la technique antérieure font  The prior art language analyzers make

intervenir les problèmes ci-dessous décrits.  intervene the problems described below.

Lors de l'analyse morphologique d'une chaîne d'entrée dans une phrase, par exemple de mots, il est important, et ceci donne un effet significatif pour le résultat de l'analyse, de déterminer si  When morphing an input string into a sentence, for example of words, it is important, and this gives a significant effect to the result of the analysis, to determine whether

un certain mot est utilisé seul ou s'il est utilisé dans un mnt com-  a certain word is used alone or if it is used in a common mnt

posé ou une Locution, couplé à un ou plusieurs mots.  posed or a phrase, coupled with one or more words.

Les analyseurs classiques emploient un système qui con-  Conventional analyzers employ a system which

siste à mener l'analyse pour le cas o des mots successifs sont supposés constituer une phrase et pour le cas o il s'agit de mots indépendants et à finalement choisir une traduction appropriée sur la base de son résultat, ou bien un système consistant à déterminer de manière préférentielle ces mots successifs comme constituant une phrase. Toutefois, le premier système demande un temps prolongé de traitement, alors que le dernier système implique des risques  is to conduct the analysis for the case where successive words are supposed to constitute a sentence and for the case where they are independent words and finally to choose an appropriate translation on the basis of its result, or else a system consisting of preferentially determine these successive words as constituting a sentence. However, the former system requires an extended processing time, while the latter system involves risks

élevés de produire une traduction erronée.  high to produce a wrong translation.

Lors de l'analyse morphologique effectuée pour la production d'une traduction, une "partie de discours" ou quelque autre information au sujet du morphème, par exemple un mot, s'obtiennent au moyen d'une recherche dans un dictionnaire. Dans le  During the morphological analysis carried out for the production of a translation, a "part of speech" or some other information about the morpheme, for example a word, is obtained by means of a search in a dictionary. In the

cas de mots usuels tels que des noms et des verbes, puisque la plu-  common words such as nouns and verbs, since most

part d'entre eux peuvent être emmagasinés dans le dictionnaire, on  part of them can be stored in the dictionary, we

peut facilement les retrouver pour obtenir l'information.  can easily find them for information.

Toutefois, puisque des expressions telles que celles indiquant par exemple une longueur (m), une vitesse (m/s), une accélération (m/s2) et de semblables autres unités comprennent des genres extrêmement variés, il n'est pas efficace de les emmagasiner toutes dans le dictionnaire, puisque ceci augmenterait de manière  However, since expressions such as those indicating, for example, length (m), speed (m / s), acceleration (m / s2) and the like include very diverse genres, it is not effective to store them all in the dictionary, since this would increase so

inutile la capacité de mémoire relative à l'information du diction-  useless memory capacity relating to diction information-

naire.nary.

2 6 0 4 8 12 6 0 4 8 1

Dans le cas de l'analyse morphologique d'une phrase, l'expression numérique dans une certaine langue ne peut pas toujours s'accorder exactement avec cellesd'autres langues. Par  In the case of morphological analysis of a sentence, the numerical expression in a certain language cannot always agree exactly with those of other languages. By

exemple, le concept fondamental du comptage de nombres, c'est-à-  example, the fundamental concept of counting numbers, that is

dire la notation positionnellediffère entre la langue japonaise et  say different positional notation between Japanese language and

les langues européennes comme l'anglais par exemple.  European languages like English for example.

Ainsi, par exemple, si l'expression anglaise pour la valeur numérique "a hundred and two thousand two hundred and four  So, for example, if the English expression for the numeric value "a hundred and two thousand two hundred and four

(cent et deux mille deux cents et quatre)" se décompose simple-  (one hundred and two thousand two hundred and four) "breaks down simple-

ment en ses constituants et est facilement remplacée par l'expres-  its constituents and is easily replaced by the expression

sion japonaise correspondante, elle s'analyse simplement sous la forme "100 et 2 200 et 4". Ceci se traduirait finalement de manière correcte par "102 204", c'est-à-dire "10-man 2-sen 3-yaku 4(10-dix  corresponding Japanese sion, it can be analyzed simply in the form "100 and 2200 and 4". This would ultimately translate correctly to "102,204", that is, "10-man 2-sen 3-yaku 4 (10-ten

mille 2-mille 2-cent 4)" en langue japonaise. Dans l'analyse mor-  mille 2-mille 2-cent 4) "in Japanese. In the moral analysis

phologique effectuée au moment de la formation de la traduction, une phrase introduite est divisée en unités de référence du dictionnaire par le moyen de délimiteurs tel que des espacements, despoints et des virgules, et une recherche est faite dans le dictionnaire au moyen d'unités de référence du dictionnaire pour produire une partie de discours ou une autre information. Dans ce cas, un nom propre par exemple peut être utilisé suivant deux sens différents, ou plus, selon le contexte. Par exemple, "Osaka City (la Ville d'Osaka)" est une expression utilisée pour indiquer un groupe faisant fonction de sujet, comme par exemple "la Ville d'Osaka a décidé...", et dans le sens indiquant le lieu et faisant fonction d'objet, comme par exemple "... dans la Ville d'Osaka". Dans cette mesure, puisqu'un seul sens est emmagasiné pour chaque nom propre, celui-ci ne peut pas assurer différentes utilisations qui sont fonction du sens, ce  phological carried out at the time of the formation of the translation, an introduced sentence is divided into reference units of the dictionary by means of delimiters such as spaces, periods and commas, and a search is made in the dictionary by means of units dictionary reference to produce part of speech or other information. In this case, a proper name for example can be used in two or more different meanings, depending on the context. For example, "Osaka City (the City of Osaka)" is an expression used to indicate a group acting as subject, for example "the City of Osaka decided ...", and in the sense indicating the place and acting as an object, such as "... in the City of Osaka". To this extent, since only one meaning is stored for each proper name, it cannot ensure different uses which are function of the meaning, this

qui réduit la précision de l'analyse.  which reduces the accuracy of the analysis.

Par exemple, dans le cas de la phrase anglaise "... in the Central Park John Willson had a... (dans Central Park John Willson a un...)", la phrase ne peut pas être grammaticalement analysée à moins que sa reconnaissance n'intervienne qu'après la séparation entre le nom propre "Central Park" et l'autre nom propre "John Willson" dans ce contexte. De la même manière, dans le cas de la phrase anglaise "... in Boston Mr. Baker was... (...à Boston M. Baker était...)", celle-ci doit être reconnue après la séparation entre le nom propre "Boston" et le nom propre "M. Baker".Toutefois, dans le système classique, une série de semblables noms propres est reconnue de manière erronée comme constituant dans son ensemble un  For example, in the case of the English sentence "... in the Central Park John Willson had a ... (in Central Park John Willson has a ...)", the sentence cannot be grammatically analyzed unless its recognition comes only after the separation between the proper name "Central Park" and the other proper name "John Willson" in this context. Similarly, in the case of the English phrase "... in Boston Mr. Baker was ... (... in Boston Mr. Baker was ...)", this must be recognized after separation between the proper name "Boston" and the proper name "M. Baker". However, in the classical system, a series of similar proper names is erroneously recognized as constituting as a whole a

unique nom propre.unique proper name.

Par exemple, dans l'analyse morphologiqcue d'une phrase  For example, in the morphological analysis of a sentence

anglaise, une succession de mots commençant par une lettre majus-  English, a succession of words starting with a capital letter-

cule est généralement grammaticalement analysée comme constituant un nom propre. Toutefois, si des mots commençant par une lettre majuscule se poursuivent ainsi, il n'est pas toujours approprié de les reconnaître comme étant un seul nom propre dans leur ensemble.Il existe un cas o il s'agit en réalité de plusieurs noms propres qui apparaissent successivement par un fait occasionnel. Dans l'analyse morphologique effectuée au moment de la production de la traduction, on obtient une partie de discours ou une autre information en faisant une recherche dans un dictionnaire. Dans ce cas, puisque la plupart des noms communs, des verbes, etc. peuvent être emmagasinés dans le dictionnaire, on peut facilement les  cule is generally grammatically analyzed as constituting a proper noun. However, if words starting with an uppercase letter continue like this, it is not always appropriate to recognize them as a single proper name as a whole. There is a case where they are actually several proper names which appear successively by an occasional fact. In the morphological analysis carried out at the time of production of the translation, part of the speech or other information is obtained by searching in a dictionary. In this case, since most common nouns, verbs, etc. can be stored in the dictionary, you can easily store them

retrouver pour obtenir l'information cherchée.  find to obtain the information sought.

Toutefois, puisque des formes variables de mots existent pour les noms propres, il est impossible de tous les emmagasiner  However, since variable forms of words exist for proper names, it is impossible to store them all

dans un dictionnaire. Par conséquent, ces noms propres non enregis-  in a dictionary. Therefore, these unregistered proper names

trés dans le dictionnaire ne peuvent pas être reconnus comme des  very in the dictionary cannot be recognized as

noms propres.proper names.

Dans le cas o un ensemble de caractères combiné en une configuration particulière est présent, il existe un risque éLeyé  In the case where a set of characters combined in a particular configuration is present, there is a high risk

de produire une analyse erronée si le traitement des-  to produce an erroneous analysis if the processing

tiné aux unités de mots réguliers qui est appliqué aux phrases  tined to regular word units which is applied to sentences

ordinaires est alors appliqué à un semblable ensemble de carac-  ordinary is then applied to a similar set of charac-

tères, et ceci peut amener une traduction dénuée de sens.  tères, and this can lead to a meaningless translation.

Par exemple, dans le cas o il y a un ensemble de carac-  For example, in the case where there is a set of characters-

tères en anglais "Sunday, 26 Jan., '80 (dimanche 26 janvier 1980)', il est très difficile de les traduire en japonais, car il faut les iL est très difficile de Les traduire en japonais, car il faut Les  tères en anglais "Sunday, 26 Jan., '80 (Sunday 26 January 1980) ', it is very difficult to translate them into Japanese, because you need them iL is very difficult to translate them into Japanese, because you need them

exprimer sous la forme "80-nen, 1-gatsu, 26-nichi, nichiyobi (80-  express in the form "80-nen, 1-gatsu, 26-nichi, nichiyobi (80-

ans, 1-mois, 26-jour, dimanche)".years, 1-month, 26-day, Sunday) ".

En outre, pour les mots dérivés, puisque aucune estima-  In addition, for derived words, since no estimate

tion n'a été effectuée pour la partie de discours et la nature  tion was only done for the speech part and the nature

particulière sémantique, il ne peut, selon le cas, être obtenu au-  particular semantics, it cannot, depending on the case, be obtained

cune traduction exacte.no exact translation.

La grammaire utilisée pour analyser le langage, par la grammaire indépendante du contexte (cfg), présente l'inconvénient de fournir de nombreuses solutions inutiles qui ne peuvent pas être finalement utilisées même avec l'emploi de la méthode  The grammar used to analyze language, by context-independent grammar (cfg), has the disadvantage of providing many useless solutions which cannot ultimately be used even with the use of the method

dite de haut en bas et la méthode dite de bas en haut.  called from top to bottom and the method called from bottom to top.

On reconnaît clairement un grand nombre de ces solutions  Many of these solutions are clearly recognized

inutiles comme des erreurs lorsqu'on les lit réellement. Toute-  useless as mistakes when you actually read them. Any-

fois, puisque la transformation de la structure ou la formation de la traduction s'effectue également pour ces solutions inutiles, après quoi la validité du résultat est déterminée au cours des étapes de traitement respectives, il en résulte un gaspillage du temps de traitement. Par exemple, le mot anglais "let (laissez, ou bien particule de l'impératif)" possède les deux sens d'instruction et d'invitation, si bien que l'analyse grammaticale doit être effectuée pour les deux possibilités respectives, ce qui réduit le  times, since the transformation of the structure or the formation of the translation also takes place for these useless solutions, after which the validity of the result is determined during the respective processing steps, this results in a waste of the processing time. For example, the English word "let (leave, or particle of imperative)" has both directions of instruction and invitation, so that grammatical analysis must be carried out for the two respective possibilities, which reduce the

rendement. En outre, il est difficile de choisir entre elles.  yield. In addition, it is difficult to choose between them.

En outre, dans la langue anglaise, plusieurs mots peuvent être combinés au moyen de traits d'union, comme par exemple dans "take-care-of-him attitude (attitude consistant à prendre soin de lui, ou attitude protectrice)" pour ainsi former librement ungroupe adjectival. Toutefois, il est difficile de manipuler ces mots à  Furthermore, in the English language, several words can be combined by means of hyphens, such as for example in "take-care-of-him attitude" for so freely form an adjective group. However, it is difficult to manipulate these words to

l'aide de l'analyse grammaticale ordinaire, comme cela est habi-  using ordinary grammar analysis, as is usual

tuel.tuel.

La situation se révèle également identique pour l'inter-  The situation is also identical for the

rogation redondante.Alors que la forme de l'interrogation redondante dans la langue anglaise est extrêmement limitée, elle nécessite un  While the form of the redundant query in the English language is extremely limited, it requires a

traitement extrêmement complexe dans le procédé d'analyse habituel.  extremely complex treatment in the usual analysis method.

Il n'est pas facile de déterminer à quel verbe l'interrogation  It is not easy to determine to which verb the interrogation

redondante, c'est-à-dire "isn't it ?" (n'est-ce pas ?),se rapporte.  redundant, that is to say "isn't it?" (isn't it?), relates.

L'invention a été réalisée en vue de répondre aux pro-  The invention was made in order to respond to the pro-

blèmes ci-dessus exposés.above exposed problems.

Le premier but de l'invention est de fournir un analyseur de langage susceptible de déterminer l'étendue du degré de couplage entre deux mots successifs et susceptible de déterminer  The first object of the invention is to provide a language analyzer capable of determining the extent of the degree of coupling between two successive words and capable of determining

s'ils forment ou non une locution sur la base du résultat de l'opé-  whether or not they form a phrase on the basis of the result of the operation

ration.ration.

Un deuxième but de l'invention est de fournir un analy-  A second object of the invention is to provide an analysis

seur de langage susceptible d'effectuer une analyse morphologique dans une phrase introduite contenant un ensemble de caractères composites, par exemple des unités de dimension, sans  language sister capable of carrying out a morphological analysis in an introduced sentence containing a set of composite characters, for example units of dimension, without

devoir emmagasiner tous ces ensembles de caractères dans un dic-  having to store all of these character sets in a dictionary

tionnaire.tionnaire.

Un troisième but de l'invention est de fournir un analy-  A third object of the invention is to provide an analysis

seur de langage susceptible d'effectuer une analyse mor-  language sister capable of carrying out a moral analysis

phologique appropriée en relation avec une expression contenant des  appropriate phology in relation to an expression containing

valeurs numériques.numerical values.

Un quatrième but de l'invention est de fournir un analy-  A fourth object of the invention is to provide an analysis

seur de langage susceptible de traduire un nom propre suivant un  language sister capable of translating a proper name according to a

sens qui est en accord avec le contexte.  meaning that is consistent with the context.

Un cinquième but de l'invention est de fournir un analy-  A fifth object of the invention is to provide an analysis

seur de langage susceptible d'analyser morphologiquement de manière  language sister capable of morphologically analyzing in a way

correcte des chaînes dans le cas d'une expression contenant plu-  correct strings for an expression containing more

sieurs noms propres successifs.successive proper names.

Un sixième but de l'invention est de fournir un analyseur de langage susceptible de traiter un nom propre non enregistré et susceptible d'effectuer une analyse appropriée pour un nom propre tout en prenant en considération la relation existant  A sixth object of the invention is to provide a language analyzer capable of processing an unregistered proper name and capable of performing an appropriate analysis for a proper name while taking into account the existing relationship

avec des groupes de mots disposés avant et après lui.  with groups of words arranged before and after him.

Un septième but de l'invention est de fournir un analy-  A seventh object of the invention is to provide an analysis

seur de langage susceptible d'analyser morphologiquementde manière correcte des chaînes dans le cas d'un ensemble de caractères exprimant un sens spécifique du fait qu'ils sont combinés suivant  language sister capable of correctly analyzing strings morphologically in the case of a set of characters expressing a specific meaning because they are combined according to

une règle particulière.a special rule.

Un huitième but de l'invention est de fournir un analy-  An eighth object of the invention is to provide an analysis

seur de langage susceptible de donner une estimation de la nature grammaticale, du sens, etc. d'un mot reconnu comme étantun mot dérivé  language sizer capable of giving an estimate of grammatical nature, meaning, etc. of a word recognized as being a derived word

obtenu selon une règle prédéterminée.  obtained according to a predetermined rule.

Un neuvième but de l'invention est de fournir un analy-  A ninth object of the invention is to provide an analysis

seur de langage susceptible de reconnaître la particularité struc-  language sister capable of recognizing the structural particularity

turelle d'une phrase proposée et d'effectuer l'analyse  of a proposed sentence and perform the analysis

d'après la particularité.according to the particularity.

Le premier but de l'invention peut être atteint à l'aide d'un analyseur de langage qui comprend un dictionnaire emmagasinant des données de dictionnaire contenant les données associées à des morphèmes en ce qui concerne des mots, des mots composés et des phrases, et  The first object of the invention can be achieved using a language analyzer which includes a dictionary storing dictionary data containing the data associated with morphemes with regard to words, compound words and sentences, and

un moyen d'analysemorphoLogique permettant d'appliquer l'ana-  a means of morphological analysis allowing to apply the analysis

lyse morphologique à une phrase proposée tout en faisant référence au dictionnaire, o le dictionnaire contient des données relatives au degré de  morphological lysis of a proposed sentence while referring to the dictionary, o the dictionary contains data relating to the degree of

couplage indiquant le degré de couplage entre des mots qui consti-  coupling indicating the degree of coupling between words that make up

tuent un mot composé et une locution, et  kill a compound word and a phrase, and

le moyen d'analyse fait référence au diction-  the means of analysis refers to diction-

naire pour les mots respectifs contenus dans la locution proposée et, lorsque plusieurs données du dictionnaire ont été retrouvées pour un seul mot en combinaison avec d'autres mots, il choisit la combinaison de mots qui possède le degré de couplage le plus éLevé  for the respective words contained in the proposed phrase and, when several data from the dictionary have been found for a single word in combination with other words, it chooses the combination of words which has the highest degree of coupling

tout en faisant référence aux données relatives au degré de cou-  while referring to the data relating to the degree of

plage. Le deuxième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant  beach. The second object of the invention can be achieved using a language analyzer comprising

un moyen d'entrée servant à introduire un ensemble de carac-  an input means for introducing a set of characteristics

tères d'une langue prédéterminée, un dictionnaire fondamental utilisé pour les opérations de  ters of a predetermined language, a fundamental dictionary used for the operations of

recherche relatives à l'ensemble de caractères introduit et emma-  search relating to the set of characters entered and emma-

gasinant des données fondamentales, et un moyen d'analyse pour l'ensemble de caractères introduits faisant appel à la recherche dans le dictionnaire, o le moyen d'analyse effectue l'analyse d'un ensemble de caractères introduit lorsqu'une partie de l'ensemble de  wasting fundamental data, and a means of analysis for the set of introduced characters calling upon the search in the dictionary, o the means of analysis carries out the analysis of a set of characters introduced when a part of the 'together

caractèresa été retrouvée par recherche dans le dictionnaire fonda-  characters was found by search in the basic dictionary

mental en ce qui concerne l'ensemble de caractères introduit, par une recherche analogue dans le dictionnaire fondamental pour  mental with regard to the set of characters introduced, by an analogous search in the fundamental dictionary for

l'autre partie de l'ensemble de caractères.  the other part of the character set.

Le troisième but de l'invention peut être atteint à l'aide d'un analyse de langage comprenant: un dictionnaire emmagasinant des données de dictionnaire sur toutes les unités de recherche dans le dictionnaire, et un moyen d'analyse servant à diviser une phrase introduite en unités de référence du dictionnaire et à effectuer une analyse des éléments en relation avec les unités  The third object of the invention can be achieved using a language analysis comprising: a dictionary storing dictionary data on all the search units in the dictionary, and an analysis means serving to divide a sentence introduced in dictionary reference units and to perform an analysis of elements related to the units

de référence du dictionnaire tout en faisant référence au diction-  dictionary reference while referring to diction-

naire, onary, o

le dictionnaire contient, au titre des données du diction-  the dictionary contains, under the data of the diction-

naire, des indications de distinction permettant d'indiquer que l'unité de référence du dictionnaire exprimant des nombres est destinée à exprimer des nombres, et  nary, indications of distinction making it possible to indicate that the reference unit of the dictionary expressing numbers is intended to express numbers, and

le moyen d'analyse fait référence au diction-  the means of analysis refers to diction-

naire pour les unités de référence du dictionnaire respectives contenues dans la phrase introduite et, lorsque les indications de distinction sont contenues dans les données de dictionnaire extraites, il combine l'unité de référence du dictionnaire pour laquelle l'indication de distinction a été trouvée avec une autre  for the respective dictionary reference units contained in the entered sentence and, when the indications of distinction are contained in the extracted dictionary data, it combines the dictionary reference unit for which the indication of distinction was found with another

unité de référence du dictionnaire avec laquelle une autre indica-  dictionary reference unit with which another indication

tion de distinction a été retrouvée disposée au voisinage de l'uni-  tion of distinction was found disposed in the vicinity of the university

té de référence du dictionnaire juste mentionnée, il calcule les valeurs numériques signifiées par les deux unités de référence du dictionnaire de façon à obtenir une seule valeur numérique et met les deux unités de référence du dictionnaire sous la forme d'une  dictionary reference tee just mentioned, it calculates the numerical values signified by the two dictionary reference units so as to obtain a single numerical value and puts the two dictionary reference units in the form of a

seule unité d'analyse.single unit of analysis.

Le quatrième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant:  The fourth object of the invention can be achieved using a language analyzer comprising:

2 6048142 604814

un moyen d'entrée servant à introduire un ensemble de carac-  an input means for introducing a set of characteristics

tères d'une langue prédéterminée,  mothers of a predetermined language,

un dictionnaire utilisé pour retrouver un ensemble de carac-  a dictionary used to find a set of characters

tères introduit à partir du moyen d'entrée,  tères introduced from the means of entry,

un moyen de recherche servant à consulter le diction-  a means of research used to consult the diction-

naire en relation avec l'ensemble de caractères introduits, un moyen de production d'une information de nature qui produit une information relative à la nature pour l'ensemble de caractères non enregistré dans le dictionnaire et l'ensemble de caractères dont l'information de nature n'est pas enregistrée dans le dictionnaire parmi l'ensemble de caractères introduit, o le moyen producteur d'une information relative à la nature est conçu pour produire plusieurs informations de nature pour  in relation to the set of characters introduced, a means of producing nature information which produces information relating to nature for the set of characters not recorded in the dictionary and the set of characters whose information of nature is not recorded in the dictionary among the set of characters introduced, o the means producing information relating to nature is designed to produce several information of nature for

l'ensemble de caractères ne possédant par d'information de nature.  the set of characters having no information of a nature.

Le cinquième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant: un dictionnaire qui emmagasine des données de dictionnaire sur toutes les unités de référence du dictionnaire, et un moyen d'analyse servant à diviser la phrase proposée en unités de référence du dictionnaire et à effectuer une analyse morphologique de chaînes d'entrée pour les unités de  The fifth object of the invention can be achieved using a language analyzer comprising: a dictionary which stores dictionary data on all the reference units of the dictionary, and an analysis means serving to divide the sentence proposed in reference units of the dictionary and to perform a morphological analysis of input strings for the units of

référence du dictionnaire tout en faisant référence au diction-  dictionary reference while referring to diction-

naire, onary, o

le dictionnaire contient, au titre des données du diction-  the dictionary contains, under the data of the diction-

naire, une information de distinction permettant de spécifier une position admissible dans une succession de noms propres consituée de plusieurs noms propres successifs relativement à l'unité de référence du dictionnaire qui signifie un nom propre, et  nary, information of distinction making it possible to specify an admissible position in a succession of proper names consisting of several successive proper names relative to the reference unit of the dictionary which signifies a proper name, and

le moyen d'analyse est conçu pour faire référence au diction-  the means of analysis is designed to refer to diction-

naire pour les unités de référence du dictionnaire respectives  for the respective dictionary reference units

contenues dans la phrase proposée et, lorsque l'information de dis-  contained in the proposed sentence and, when the information available

tinction est contenue dans la donnée de dictionnaire retrouvée, il  extinction is contained in the dictionary data found, it

combine l'unité de référence du dictionnaire pour laquelle l'infor-  combines the dictionary reference unit for which the information

mation de distinction a été retrouvée avec une autre unité de référence du dictionnaire qui signifie un autre nom propre et se trouve au voisinage de l'unité de référence du dictionnaire qui vient juste d'être mentionnée en fonction de la position spécifiée par l'information de distinction pour obtenir une unique unité d'analyse. Le sixième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant:  mation of distinction has been found with another reference unit of the dictionary which means another proper name and is located in the vicinity of the reference unit of the dictionary which has just been mentioned according to the position specified by the information of distinction to obtain a single unit of analysis. The sixth object of the invention can be achieved using a language analyzer comprising:

un moyen d'entrée servant à introduire un ensemble de carac-  an input means for introducing a set of characteristics

tères d'une langue prédéterminée,  mothers of a predetermined language,

un dictionnaire utilisé pour retrouver l'ensemble de carac-  a dictionary used to find the set of characters

tères introduit par le moyen d'entrée, et un moyen d'analyse de l'information relative à la nature, servant à retrouver dans le dictionnaire ce qui concerne l'ensemble de caractères introduit, puis à analyser l'information de nature relativement à l'ensemble de caractères, o le moyen d'analyse de l'information de  tères introduced by the input means, and a means of analysis of the information relating to the nature, used to find in the dictionary what concerns the set of characters introduced, then to analyze the information of nature relative to the set of characters, o the means of analyzing information from

nature est conçu pour analyser l'information con-  nature is designed to analyze information

cernant la nature d'un ensemble de caractères tout prenant en considération l'information relative à la nature de l'ensemble de caractères qui est disposé avant et après l'ensemble de caractères qui vient juste d'être mentionné. Le moyen d'analyse de l'information relative à la nature est conçu pour analyser l'information relative à la nature de plusieurs rangées de lettres  defining the nature of a set of characters while taking into consideration the information relating to the nature of the set of characters which is arranged before and after the set of characters which has just been mentioned. The nature information analysis means is designed to analyze the nature information of multiple rows of letters

en agençant collectivement les ensembles de caractères.  by arranging the character sets collectively.

Le septième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant: un dictionnaire qui emmagasine les données de dictionnaire sur toutes les unités de référence du dictionnaire, et un moyen d'analyse servant à diviser une phrase introduite en unités de référence de dictionnaire et à effectuer l'analyse morphologique tout en se reportant au dictionnaire, o le moyen d'analyse est conçu pour distinguer une succession d'unités de référence de dictionnaire contenant un  The seventh object of the invention can be achieved using a language analyzer comprising: a dictionary which stores the dictionary data on all the reference units of the dictionary, and an analysis means serving to divide a sentence introduced in dictionary reference units and performing the morphological analysis while referring to the dictionary, o the analysis means is designed to distinguish a succession of dictionary reference units containing a

élément de signification spécifique comme unité d'assemblage expri-  element of specific meaning as an expressive assembly unit

mant une signification spécifique constituée sous une certaine  mant a specific meaning constituted under a certain

260 4 8 1 4260 4 8 1 4

règle et formant une succession d'unités de référence de diction-  rule and forming a succession of diction reference units-

naire qui possèdent les éléments de signification spécifique en une  who have the elements of specific meaning in one

seule unité d'analyse grammaticale.  single unit of grammatical analysis.

Le huitième but de l'invention peut être atteint à l'aide d'un analyseur de langage dans lequel la nature grammaticale, la nature sémantique ou le mot traduit sont estimés pour les mots qui ne sont pas enregistrés dans un dictionnaire et pour les mots qui  The eighth object of the invention can be achieved using a language analyzer in which the grammatical nature, the semantic nature or the translated word are estimated for the words which are not recorded in a dictionary and for the words who

sont reconnus comme étant des motsdérivés fonction d'une particula-  are recognized as derivative words based on a particular

rité propre au morphème, comme un affixe.  rity proper to the morpheme, like an affix.

Le neuvième but de l'invention peut être atteint à l'aide d'un analyseur de langage comprenant:  The ninth object of the invention can be achieved using a language analyzer comprising:

un premier moyen d'analyse servant à morpho-  a first means of analysis used to morpho-

logiquement analyser une phrase proposée d'une langue prédéterminée,  logically analyze a proposed sentence of a predetermined language,

un deuxième moyen d'analyse servant à syntaxi-  a second means of analysis used for syntaxi-

quement analyser la structure d'une phrase de la langue sur la base du résultat de l'analyse morphologique par le premier moyen d'analyse, un dictionnaire des données de dictionnaire pour la langue utilisée avec les premier et deuxième moyens d'analyse et,  cally analyze the structure of a sentence of the language on the basis of the result of the morphological analysis by the first means of analysis, a dictionary of dictionary data for the language used with the first and second means of analysis and,

un moyen de commande servant à rechercher dans le diction-  control means for searching the diction-

naire afin d'amener les premier et deuxième moyens d'analyse à effectuer l'analyse, o  in order to bring the first and second means of analysis to perform the analysis, o

le premier moyen d'analyse est conçu pour faire des opé-  the first means of analysis is designed to perform operations

rations de recherche dans le dictionnaire, distinguer les particu-  search rations in the dictionary, distinguish the particu-

larités morphologiques de la phase proposée de la langue afin de distinguer l'agencement en relation avec la stucture de la phrase, et estimer la nature devant être le résultat de l'analyse relative à l'agencement et le rôle de l'agencement eu égard à la structure de la phrase qui existe dans la phrase, et  morphological differences of the proposed phase of the language in order to distinguish the arrangement in relation to the structure of the sentence, and estimate the nature to be the result of the analysis relating to the arrangement and the role of the arrangement with regard to the sentence structure that exists in the sentence, and

le deuxième moyen d'analyse est conçu pour morpholo-  the second means of analysis is designed for morpholo-

giquement analyser la structure de la couche de surface d'une phrase de la langue en appliquant une règle grammaticale reposant sur la nature estimée et le rôle, et pour analyser une relation subsidiaire possible pour les constituants contenus  gically analyze the structure of the surface layer of a sentence of the language by applying a grammatical rule based on the estimated nature and role, and to analyze a possible subsidiary relationship for the constituents contained

dans la phrase.in the sentence.

Selon l'analyseur de langage de l'invention, on peut obtenir une traduction automatique d'une grande vitesse et d'une  According to the language analyzer of the invention, an automatic translation can be obtained with high speed and

grande qualité.high quality.

La description suivante, conçue à titre d'illustration de  The following description, intended as an illustration of

l'invention vise à donner une meilleure compréhension de ses carac-  the invention aims to give a better understanding of its characteristics

téristiques et avantages; elle s'appuie sur les dessins annexés, parmi lesquels: les figures 1 à 10 illustrent un premier mode de réalisation  teristics and advantages; it is based on the appended drawings, among which: FIGS. 1 to 10 illustrate a first embodiment

de l'analyseur de langage selon l'invention, appliqué à un dispo-  of the language analyzer according to the invention, applied to a device

sitif de traduction automatique anglais-japonais, et, plus parti-  English to Japanese machine translation, and more particularly

culièrement, la figure 1 est un schéma de principe fonctionnel illustrant  especially, Figure 1 is a functional block diagram illustrating

un exemple de la structure détaillée d'une section d'analyse mor-  an example of the detailed structure of a mor-

phologique; la figure 2 est un schéma de principe fonctionnel illustrant la structure toute entière; - la figure 3 est une vue explicative illustrant un exemple de la structure d'un fichier du type dictionnaire attaché à l'aide d'un drapeau portant la préférence la plus éLevée; la figure 4 est un organigramme illustrant un exemple d'un processus d'analyse morphologique;  phological; Figure 2 is a functional block diagram illustrating the entire structure; - Figure 3 is an explanatory view illustrating an example of the structure of a dictionary-type file attached using a flag with the highest preference; Figure 4 is a flowchart illustrating an example of a morphological analysis process;

la figure 5 est un organigramme illustrant un exemple du pro-  Figure 5 is a flowchart illustrating an example of the pro-

cessus d'entrée se trouvant dans le processus d'analyse morpho-  entry stops found in the morpho- analysis process

logique; la figure 6 est une vue explicative illustrant un exemple de mise en forme d'un ensemble de caractères introduit; la figure 7 est une vue explicative illustrant un exemple de recherche dans le dictionnaire; les figures 8A à 8D sont des organigrammes illustrant un exemple de l'opération d'élimination de la contradiction relative au drapeau portant la préférence la plus élevée dans l'analyse morphologique; La figure 9 est une vue explicative illustrant un exemple du contenu du tampon d'information de dictionnaire trouvée après qu'il a été fait appeL au dictionnaire; la figure 10 est une vue explicative illustrant un exemple du  logic; FIG. 6 is an explanatory view illustrating an example of formatting of a set of characters introduced; FIG. 7 is an explanatory view illustrating an example of search in the dictionary; FIGS. 8A to 8D are flowcharts illustrating an example of the operation of eliminating the contradiction relating to the flag with the highest preference in the morphological analysis; Fig. 9 is an explanatory view illustrating an example of the contents of the dictionary information buffer found after it has been called the dictionary; FIG. 10 is an explanatory view illustrating an example of the

contenu du tampon d'information de dictionnaire trouvée en résul-  contents of the dictionary information buffer found in the result-

tat de l'opération d'élimination de la contradiction pour le dra-  status of the operation to eliminate the contradiction for the

peau portant la plus grande préférence;  skin with the greatest preference;

Les figures 11 à 16 illustrent le deuxième mode de réalisa-  Figures 11 to 16 illustrate the second embodiment

tion de L'invention, et, plus particulièrement,  tion of the invention, and, more particularly,

la figure 11 est un schéma de principe du mode de réalisa-  Figure 11 is a block diagram of the embodiment

tion; la figure 12 est un diagramme illustrant un exemple de données emmagasinées dans un fichier dictionnaire; la figure 13 est un diagramme illustrant un exemple de  tion; FIG. 12 is a diagram illustrating an example of data stored in a dictionary file; Figure 13 is a diagram illustrating an example of

données emmagasinées dans un fichier dictionnaire d'unités fonda-  data stored in a dictionary file of basic units

mentales.; la figure 14 est un diagramme ilustrant un exemple de données emmagasinées dans un tableau de mise en réserve d'information du dictionnaire; la figure 15 est un organigramme illustrant le fonctionnement du dispositif; la figure 16 est un organigramme illustrant la reconnaissance des unités;  mental .; FIG. 14 is a diagram illustrating an example of data stored in a dictionary information storage table; Figure 15 is a flowchart illustrating the operation of the device; Figure 16 is a flowchart illustrating the recognition of units;

les figures 17 à 29 illustrent le troisième mode de réalisa-  Figures 17 to 29 illustrate the third embodiment

tion de l'analyseur de langage selon l'invention, appliqué à un dispositif de traduction automatique anglais-japonais, et, plus particulièrement, la figure 17 est un schéma de principe fonctionnel  tion of the language analyzer according to the invention, applied to an English-Japanese automatic translation device, and, more particularly, FIG. 17 is a functional block diagram

illustrant un exemple de la structure détaillée de l'analyse morpho-  illustrating an example of the detailed structure of the morpho- analysis

logique; la figure 18 est un schéma de principe fonctionnel illustrant la structure dans son ensemble; les figures 19A et 19B sont des organigrammes illustrant un exemple de l'analyse morphologique; la figure 20 est un organigramme illustrant un exemple de l'agencement collectif du symbole de monnaie et de l'unité dans l'analyse morphologique; les figures 21A et 21B sont des organigrammes illustrant un exemple des nombres liés par des traits d'union dans l'analyse morphologique; les figures 22A et 22B sont des organigrammes illustrant un  logic; Figure 18 is a functional block diagram illustrating the structure as a whole; Figures 19A and 19B are flow charts illustrating an example of the morphological analysis; Fig. 20 is a flow chart illustrating an example of the collective arrangement of the currency symbol and the unit in morphological analysis; Figs. 21A and 21B are flow charts illustrating an example of the numbers linked by hyphens in the morphological analysis; Figures 22A and 22B are flowcharts illustrating a

exemple de traitement de nombres successifs dans l'analyse morpholo-  example of treatment of successive numbers in morpholo-

gique; les figures 23A et 23B sont des organigrammes illustrant un  gic; Figures 23A and 23B are flow charts illustrating a

exemple de l'agencement collectif avec la valeur numérique précé-  example of collective arrangement with the preceding numerical value

dente dans l'analyse morphologique; la figure 24 est une vue explicative illustrant un exemple de  dent in morphological analysis; FIG. 24 is an explanatory view illustrating an example of

la structure d'un fichier dictionnaire attaché à l'aide d'un dra-  the structure of a dictionary file attached using a dra-

peau numérique; la figure 25 est une vue explicative illustrant un exemple d'un ensemble de caractères introduit; les figures 26A à 26D sont des vues explicatives illustrant  digital skin; Fig. 25 is an explanatory view illustrating an example of a set of characters entered; FIGS. 26A to 26D are explanatory views illustrating

le contenu de la table de mise en réserve d'information de diction-  the content of the diction information storage table-

naire telle qu'elle est extraite du dictionnaire pour l'ensemble de caractères introduit qui est illustré sur la figure 25 en fonction des étapes de traitement; la figure 27 est une vue explicative illustrant un autre exemple de l'ensemble de caractères introduit; la figure 28 est une vue explicative illustrant le contenu  nary as it is extracted from the dictionary for the set of characters entered which is illustrated in FIG. 25 according to the processing steps; FIG. 27 is an explanatory view illustrating another example of the set of characters introduced; Figure 28 is an explanatory view illustrating the content

d'une table de symboles de monnaie, d'une table de notations posi-  a table of currency symbols, a table of notations

tionnelles, d'une table de virgules décimales du dictionnaire; les figures 29A à 29D sont des vues explicatives illustrant  tional, from a table of decimal points in the dictionary; Figures 29A to 29D are explanatory views illustrating

un exemple de la table de mise en réserve d'information du diction-  an example of the diction information storage table-

naire telle qu'elle est extraite du dictionnaire pour l'ensemble de caractères introduit représenté sur la figure 27, en fonction des étapes de traitement;  nary as it is extracted from the dictionary for the set of characters introduced represented in FIG. 27, according to the processing steps;

les figures 30 à 36 illustrent le quatrième mode de réalisa-  Figures 30 to 36 illustrate the fourth embodiment

tion selon l'invention, et, plus particulièrement,  tion according to the invention, and, more particularly,

la figure 30 est un schéma de principe du mode de réalisa-  Figure 30 is a block diagram of the embodiment

tion; la figure 31 est un diagramme illustrant un exemple des données emmagasinées dans un dictionnaire de référence; la figure 32 est un organigramme illustrant le fonctionnement du dispositif tout entier; la figure 33 est un organigramme illustrant le traitement du nom propre enregistré dans un dictionnaire; la figure 34 est un organigramme ilLustrant le traitement du nom propre non enregistré dans le dictionnaire; la figure 35 est un organigramme illustrant le traitement permettant de produire une information de nature faisant défaut; la figure 36 est un diagramme illustrant un exemple dans lequel les données emmagasinées dans la table de mise en réserve d'information de dictionnaire sont modifiées après le traitement de la phrase introduite;  tion; FIG. 31 is a diagram illustrating an example of the data stored in a reference dictionary; Figure 32 is a flow diagram illustrating the operation of the entire device; FIG. 33 is a flowchart illustrating the processing of the proper name registered in a dictionary; FIG. 34 is a flow chart illustrating the processing of the proper name not registered in the dictionary; FIG. 35 is a flowchart illustrating the processing making it possible to produce information of a missing nature; FIG. 36 is a diagram illustrating an example in which the data stored in the dictionary information reserve table is modified after the processing of the entered sentence;

les figures 37 à 46 illustrent le cinquième mode de réalisa- tion de l'analyseur de langage selon l'invention, appliqué à un dispositif  FIGS. 37 to 46 illustrate the fifth embodiment of the language analyzer according to the invention, applied to a device

de traduction automatique anglais-japonais, et, plus particulièrement, la figure 37 est un schéma de principe fonctionnel illustrant  English-Japanese machine translation, and, more particularly, Figure 37 is a functional block diagram illustrating

un exemple d'une structure détaillée de la section d'analyse mor-  an example of a detailed structure of the mor-

phologique; la figure 38 est un schéma de principe fonctionnel illustrant la structure dans son ensemble; la figure 39 est une vue explicative illustrant un mode de réalisation pour la structure d'un fichier dictionnaire; la figure 40 est un organigramme illustrant un exemple de l'analyse morphologique pour un nom propre; la figure 41 est un organigramme illustrant un exemple de l'agencement collectif pour des noms propres enregistrés dans un dictionnaire lors de l'analyse morphologique; les figures 42, 43 et 44 sont des organigrammes illustrant un exemple de traitement en fonction de l'information de position du nom propre dans l'analyse d'un nom propre la figure 45 est un organigramme iLLustrant un exempLe de l'agencement collectif pour des noms propres non enregistrés dans un dictionnaire lors de l'analyse morphologique; les figures 46A à 46F sont des vues explicatives montrant le  phological; Figure 38 is a functional block diagram illustrating the structure as a whole; FIG. 39 is an explanatory view illustrating an embodiment for the structure of a dictionary file; Figure 40 is a flowchart illustrating an example of morphological analysis for a proper name; FIG. 41 is a flowchart illustrating an example of the collective arrangement for proper names recorded in a dictionary during the morphological analysis; FIGS. 42, 43 and 44 are flow diagrams illustrating an example of processing according to the position information of the proper name in the analysis of a proper name FIG. 45 is a flow diagram illustrating an example of the collective arrangement for proper names not recorded in a dictionary during morphological analysis; Figures 46A to 46F are explanatory views showing the

contenu de la table de mise en réserve d'information de diction-  content of the diction information storage table-

naire, rapportée au dictionnaire, pour l'exemple d'un ensemble de caractères introduit, selon les étapes de traitement; les figures 47 à 52 illustrent le sixième mode de réalisation de l'invention, et, plus particulièrement,  naire, reported in the dictionary, for the example of a set of characters introduced, according to the processing steps; FIGS. 47 to 52 illustrate the sixth embodiment of the invention, and, more particularly,

la figure 47 est un schéma de principe du mode de réalisa-  Figure 47 is a block diagram of the embodiment

tion; la figure 48 est un diagramme illustrant un exemple de données emmagasinées dans un dictionnaire de référence; la figure 49 est un organigramme illustrant le fonctionnement du dispositif tout entier; la figure 50 est un organigramme illustrant le traitement des noms propres enregistrés dans le dictionnaire; la figure 51 est un organigramme illustrant le traitement de noms propres non enregistrés dans le dictionnaire; la figure 52 est un diagramme illustrant un exemple dans lequel des données emmagasinées dans la table de mise en réserve d'information de dictionnaire sont modifiées après le traitement de la phrase introduite;  tion; Figure 48 is a diagram illustrating an example of data stored in a reference dictionary; Figure 49 is a flow diagram illustrating the operation of the entire device; Figure 50 is a flowchart illustrating the processing of proper names registered in the dictionary; Figure 51 is a flowchart illustrating the processing of proper names not registered in the dictionary; Fig. 52 is a diagram illustrating an example in which data stored in the dictionary information reserve table is changed after processing the entered sentence;

les figures 53 à 57 illustrent le septième mode de réalisa-  Figures 53 to 57 illustrate the seventh embodiment

tion de l'analyseur de langage selon l'invention, appliqué à un dispositif de traduction automatique anglais-japonais, et, plus particulièrement, la figure 53 est un schéma de principe fonctionnel illustrant un mode de réalisation de la structure détaillée de la section d'analyse morphologique; la figure 54 est un schéma de principe fonctionnel illustrant la structure toute entière; les figures 55A et 55B sont des organigrammes illustrant un exemple de l'analyse morphologique; la figure 56 est une vue explicative illustrant un exemple du  tion of the language analyzer according to the invention, applied to an English-Japanese automatic translation device, and, more particularly, FIG. 53 is a functional block diagram illustrating an embodiment of the detailed structure of section d 'morphological analysis; Figure 54 is a functional block diagram illustrating the entire structure; Figures 55A and 55B are flow charts illustrating an example of the morphological analysis; FIG. 56 is an explanatory view illustrating an example of the

contenu de la table d'information appartenant à La section produc-  content of the information table belonging to the production section

trice d'information de traitement des morphèmes; la figure 57 est une vue explicative illustrant un exemple du contenu d'une table d'adaptation;  morphemes processing information; Fig. 57 is an explanatory view illustrating an example of the contents of an adaptation table;

les figures 58 à 63 illustrent le huitième mode de réalisa-  Figures 58 to 63 illustrate the eighth embodiment

tion selon l'invention, et, plus particulièrement, la figure 58 est un schéma de principe permettant d'expliquer la structure toute entière; la figure 59 est un schéma de principe permettant d'expliquer, un exemple de traitement de mots dérivés par l'intermédiaire d'un préfixe; la figure 60 est un schéma de principe permettant d'illustrer un exemple de traitement de mots dérivés par l'intermédiaire d'un suffixe; la figure 61 est un schéma de principe présentant des détails complets préparé par une synthèse des figures 58, 59 et 60; la figure 62 est un schéma de principe montrant d'autres détails pour une section de traitement de mots non enregistrés complets de la figure 61; et la figure 63 est un schéma de principe permettant d'expliquer un mode de réalisation d'un dispositif de traduction automatique auquel l'invention est appliquée;  tion according to the invention, and, more particularly, Figure 58 is a block diagram for explaining the entire structure; Figure 59 is a block diagram for explaining, an example of processing of derived words through a prefix; FIG. 60 is a block diagram for illustrating an example of processing of derived words by means of a suffix; Figure 61 is a block diagram showing complete details prepared by a synthesis of Figures 58, 59 and 60; Figure 62 is a block diagram showing other details for a complete unregistered word processing section of Figure 61; and Figure 63 is a block diagram for explaining an embodiment of an automatic translation device to which the invention is applied;

les figures 64 à 90 illustrent le neuvième mode de réalisa-  Figures 64 to 90 illustrate the ninth embodiment

tion de l'analyseur de langage selon l'invention, appliqué à un  tion of the language analyzer according to the invention, applied to a

dispositif de traduction anglais-japonais, et, plus particulière-  English-Japanese translation system, and, more particularly-

ment, la figure 64 est un schéma de principe fonctionnel illustrant la structure toute entière; la figure 65 est un schéma de principe fonctionnel collectif montrant la fonction de reconnaissance de l'agencement structurel d'une phrase anglaise introduite d'un seul bloc; la figure 66 est un organigramme illustrant un exemple relatif à l'agencement collectif d'un bloc en relation avec la phrase anglaise introduite; la figure 67 est un organigramme ilLustrant les détaiLs d'une opération de sortie de mot dans le programme de traitement; la figure 68 est une vue explicative illustrant un exemple de L'information du dictionnaire pour des mots ou des phrases d'anglais emmagasinés dans un dictionnaire de mots; la figure 69 est une vue explicative illustrant un exemple  Figure 64 is a functional block diagram illustrating the entire structure; FIG. 65 is a collective functional principle diagram showing the function of recognizing the structural arrangement of an English sentence introduced in one piece; FIG. 66 is a flowchart illustrating an example relating to the collective arrangement of a block in relation to the English sentence introduced; Figure 67 is a flow chart illustrating the details of a word output operation in the processing program; Fig. 68 is an explanatory view illustrating an example of Dictionary information for words or phrases of English stored in a dictionary of words; Figure 69 is an explanatory view illustrating an example

des données de table pour la condition de tête de bloc, la con-  table data for the head of block condition, the con-

dition de fin de bloc et la condition d'estimation du but et du rôle, emmagasinés dans un fichier de règles d'analyse; la figure 70 est une vue explicative illustrant un exemple d'agencement collectif pour la structure; la figure 71 est une vue explicative illustrant un exemple d'agencement collectif pour le bloc; la figure 72 est une vue explicative illustrant un exemple d'information sur l'anglais et d'information sur les mots agencés collectivement en un bloc;  end of block edition and the condition of goal and role estimation, stored in an analysis rules file; FIG. 70 is an explanatory view illustrating an example of collective arrangement for the structure; FIG. 71 is an explanatory view illustrating an example of collective arrangement for the block; Fig. 72 is an explanatory view illustrating an example of information on English and information on words collectively arranged in a block;

la figure 73 est un organigramme illustrant un exem-  Figure 73 is a flowchart illustrating an example

ple d'une opération d'analyse illustré dans une section d'analyse; la figure 74 est une vue explicative analogue à celle de la figure 68, illustrant un exemple relatif à l'entrée dans un  ple of an analysis operation illustrated in an analysis section; FIG. 74 is an explanatory view similar to that of FIG. 68, illustrating an example relating to the entry into a

dictionnaire de locutions dans le cas o ce mode de réalisation pos-  dictionary of expressions in the case where this embodiment pos-

* sède une fonction d'estimation des cas identiques; la figure 75 est une vue explicative analogue à celle de la figure 69, illustrant un exemple pour la condition de tête et de fin du bloc et une table de l'information de préparation de bloc* has an estimation function for identical cases; FIG. 75 is an explanatory view similar to that of FIG. 69, illustrating an example for the head and end condition of the block and a table of the block preparation information

dans le cas o ce mode de réalisation possède une fonction d'esti-  in the case where this embodiment has an estimation function

mation des cas identiques; la figure 76 est un schéma de principe fonctionnel analogue à celui de la figure 64, illustrant la structure toute entière dans une modification de ce mode de réalisation; la figure 77 est un schéma de principe fonctionnel analogue à celui de la figure 76 pour le recueil de la fonction de l'analyse de l'information sur "let" en relation avec le mode de réalisation modifié présenté sur la figure 76;  identical cases; Figure 76 is a functional block diagram similar to that of Figure 64, illustrating the entire structure in a modification of this embodiment; FIG. 77 is a functional block diagram similar to that of FIG. 76 for the collection of the function of the analysis of the information on "let" in relation to the modified embodiment presented in FIG. 76;

2 6 0 48142 6 0 4814

la figure 78 est une vue explicative illustrant un exemple d'information du dictionnaire qui contient une information sur "Let" pour des mots et des Locutions d'anglais emmagasinés dans le dictionnaire de mots du mode de réalisation modifié; les figures 79 et 80 sont des vues explicatives analogues à celle de la figure 72, illustrant un exemple de l'information de bloc et de l'information de mot o une phrase en anglais contenant l'information sur "Let" est collectivement agencée en un bloc; la figure 81 est un organigramme analogue à celui de la figure 66 et de la figure 73, illustrant un exemple d'un programme pour l'agencement collectif de l'information sur "Let" en ce qui concerne la phrase anglaise introduite; la figure 82 est un organigramme analogue à celui de la  Fig. 78 is an explanatory view illustrating an example of dictionary information which contains "Let" information for English words and phrases stored in the word dictionary of the modified embodiment; FIGS. 79 and 80 are explanatory views similar to that of FIG. 72, illustrating an example of the block information and the word information where a sentence in English containing the information on "Let" is collectively arranged in a block; FIG. 81 is a flowchart similar to that of FIG. 66 and of FIG. 73, illustrating an example of a program for the collective arrangement of information on "Let" with regard to the English sentence introduced; Figure 82 is a flowchart similar to that of

figure 73, illustrant un exemple pour le traitement d'analyse con-  figure 73, illustrating an example for the analysis processing con-

tenant l'information sur "Let" exécuté dans la section d'analyse pour le mode de réalisation modifié; les figures 83A et 83B sont des organigrammes illustrant un exemple du programme pour l'analyse de l'information sur "Let" pour la phrase anglaise introduite; la figure 84 est un organigramme illustrant un exemple du programme de l'analyse grammaticale pour des mots avec traits d'union dans le cas de la phrase anglaise introduite; la figure 85 est une vue explicative analogue à celle de la figure 72, illustrant un exemple de l'information de bloc et de l'information de mot qui sont collectivement disposés sur la base de la phrase anglaise introduite contenant le mot avec trait d'union, en un bloc; la figure 86 est un schéma de principe fonctionnel analogue à celui de la figure 64, illustrant la structure toute entière d'un autre mode de réalisation modifié; la figure 87 est un schéma de principe analogue à celui de la figure 65, o une fonction d'analyse de l'interrogation redondante pour la phrase anglaise introduite est collectivement agencée dans le mode de réalisation modifié présenté sur la figure 86; les figures 88 et 89 sont des vues expLicatives analogues à celle de la figure 72, illustrant un exemple d'information de bloc et d'information de mot coLLectivement agencées à partir de la phrase anglaise contenant une interrogation redondante, enun bloc; et les figures 90A et 90B sont des organigrammes illustrant un exemple d'un programme d'analyse de l'interrogation redonante pour  keeping the information on "Let" executed in the analysis section for the modified embodiment; FIGS. 83A and 83B are flowcharts illustrating an example of the program for the analysis of the information on "Let" for the English sentence entered; Fig. 84 is a flowchart illustrating an example of the grammatical analysis program for hyphenated words in the case of the introduced English sentence; Figure 85 is an explanatory view similar to that of Figure 72, illustrating an example of the block information and word information which are collectively arranged based on the introduced English sentence containing the word with a dash union, in one block; Figure 86 is a functional block diagram similar to that of Figure 64, illustrating the entire structure of another modified embodiment; Figure 87 is a block diagram similar to that of Figure 65, where a redundant query analysis function for the English sentence entered is collectively arranged in the modified embodiment shown in Figure 86; Figures 88 and 89 are explanatory views similar to that of Figure 72, illustrating an example of block information and word information collectively arranged from the English sentence containing a redundant query, in one block; and Figures 90A and 90B are flow charts illustrating an example of a redundant query analysis program for

la phrase anglaise introduite.the English sentence introduced.

Le premier mode de réalisation selon l'invention va être décrit. La figure 2 montre la constitution globale du premier mode de réalisation, dans lequel un analyseur de langage selon l'invention est appliqué à un dispositif de traduction automatique anglais-japonais. L'invention peut naturellement être appliquée efficacement non seulement à un semblable dispositif de traduction automatique anglais-japonais qui traduit l'anglais en japonais, mais également à n'importe lequel des analyseurs de langage dans  The first embodiment according to the invention will be described. FIG. 2 shows the overall constitution of the first embodiment, in which a language analyzer according to the invention is applied to an English-Japanese automatic translation device. The invention can of course be applied effectively not only to a similar English-Japanese machine translation device which translates English into Japanese, but also to any of the language analyzers in

lesquels des phrases du langage d'entrée sont principalement ana-  which sentences of the input language are mainly ana-

lysées au moment de la traduction d'une certaine langue en une autre. Le mode de réalisation représenté sur les figures possède une section d'entrée 1010, par laquelle un texte anglais 1012 devant être traduit en japonais est introduit. La section d'entrée 1010 comprend par exemple un clavier possédant des touches de caractères comme des touches alphanumériques ou des touches de fonction, un dispositif pour la lecteur optique des caractères (OCR) servant à lire le texte anglais enregistré sur du papier et, ou bien, un dispositif de mémoire à fichier servant à lire le texte anglais enregistré sur un support de mémoire, par exemple un disque magnétique. Le texte anglais introduit à la section d'entrée 1010 est lu et est fourni à une section de pré-mise en forme 1014, o un pré-traitement de traduction est effectué. Dans cette section, il est principalement réalisé un traitement de reconnaissance de phrase pour les mots inconnus. Cette opération fait partie de  lysed when translating from one language to another. The embodiment shown in the figures has an input section 1010, through which an English text 1012 to be translated into Japanese is introduced. The input section 1010 includes, for example, a keyboard having character keys such as alphanumeric keys or function keys, an optical character reader (OCR) device for reading English text recorded on paper, and, or well, a file memory device for reading English text recorded on a memory medium, for example a magnetic disc. The English text introduced in the input section 1010 is read and is supplied to a pre-formatting section 1014, where a translation pre-processing is carried out. In this section, it is mainly carried out a sentence recognition processing for unknown words. This operation is part of

l'analyse morphologique.morphological analysis.

Les données d'anglais pré-mises en forme sont transfé-  Pre-formatted English data is transferred

rées, en même temps que l'information obtenue lors de la pré-mise en forme, à une section d'analyse morphologiQue 1016. La section 1016  at the same time as the information obtained during pre-shaping, to a morphological analysis section 1016. Section 1016

d'analyse morpholoqique divise la phrase en se reportant à un dic-  of morphological analysis divides the sentence by referring to a dictionary

tionnaire de mots 1018, analyse morphologiquement la chaîne de la  1018 word tutor, morphologically analyzes the chain of

phrase d'anglais, effectue différents types d'agen-  English phrase, performs different types of agen-

cements,tels que traitementsdes mots inconnus, des noms propres, de  cements, such as treatment of unknown words, proper names,

l'expression du temps, de l'expression des nombres, etc. et effec-  expression of time, expression of numbers, etc. and made

tue un traitement relatif à la phrase toute entière, tel qu'inter-  kills a process related to the entire sentence, such as

rogation redondante et reconnaissance des cas identiques. La règle propre à l'analyse morphologique est emmagasinée dans  redundant derogation and recognition of identical cases. The rule specific to morphological analysis is stored in

un fichier 1036 de règles d'analyse grammaticale.  a 1036 file of grammar analysis rules.

Les données d'anglais obtenues après l'analyse morpholo-  English data obtained after morpholo-

gique sont transférées en même temps que l'information relative au dictionnaire obtenue par l'analyse morphologique à une section I d'analyse morphologique 1020. La section I d'analyse morphologique  gic are transferred at the same time as the information relating to the dictionary obtained by morphological analysis to a section I of morphological analysis 1020. Section I of morphological analysis

1020 est une section fonctionnelle qui effectue l'analyse morpholo-  1020 is a functional section that performs morpholo-

gique de la structure de surface d'une phrase d'anglais en appliquant une règle grammaticale aux données d'anglais et qui met  gic of the surface structure of an English sentence by applying a grammatical rule to English data and which puts

à jour toutes les possibilités structurelles.  all structural possibilities.

Après l'analyse dans la section I d'analyse morphologique 1020, les données d'anglais sont envoyées en même temps que L'information d'analyse à une section II d'analyse syntaxique 1022. Dans cette section, une solution est choisie par application  After the analysis in section I of morphological analysis 1020, the English data is sent at the same time as the information of analysis to a section II of syntactic analysis 1022. In this section, a solution is chosen by application

d'une description de structure issue du résultat de l'analyse rela-  a description of the structure resulting from the result of the related analysis

tive à la couche de surface par la section I d'analyse. Un arbre d'analyse plausible pour la phrase d'anglais est ainsi préparé afin de former la structure de celle-ci. Ces règles d'analyse sont également emmagasinées dans le fichier  tive to the surface layer by section I analysis. A plausible analysis tree for the English sentence is thus prepared in order to form the structure thereof. These analysis rules are also stored in the file

1036 de règles d'analyse.1036 analysis rules.

Apres l'analyse, les données d'anglais sont transférées, au titre de données relatives à l'arbre d'analyse, à une section  After the analysis, the English data is transferred, as data relating to the analysis tree, to a section

1024 de transformation de structure. La section 1024 de transfor-  1024 of structural transformation. Section 1024 of transform-

mation de structure prépare un arbre de phrase correspondant en japonais à partir d'un arbre structurel, c'est-à-dire une structure  structure mation prepares a corresponding sentence tree in Japanese from a structural tree, i.e. a structure

intermédiaire de la phrase d'anglais et la transforme en une struc-  intermediate of the English sentence and transforms it into a struc-

ture sous-jacente de japonais à partir de laquelle on peut aisément  underlying Japanese ture from which one can easily

traduire en japonais.translate into Japanese.

Les données de l'arbre structurel montrant la structure  Structural tree data showing structure

sous-jacente en japonais qui sont ainsi soumises à la transforma-  underlying in Japanese which are thus subject to transforma-

tion de structure sont envoyées à une section 1026 de production de traduction, o la phrase traduite est formée. Il s'agit là d'une section fonctionneLle servant à produire une phrase en japonais à  structure structure are sent to a translation production section 1026, where the translated sentence is formed. This is a working section for producing a Japanese sentence to

partir de la structure d'arbre de L'arbre structurel en japonais.  from the tree structure of The structural tree in Japanese.

Les données de phrase de japonais ainsi traduites, c'est-  The Japanese sentence data thus translated, that is,

à-dire les données de la phrase traduite, sont envoyées à une section 1030 de post-mise en forme. La section de post-mise en forme 1030 modifie Les données de phrase traduites en se reportant au dictionnaire 1018 tout en utilisant l'information utilisée dans le processus de traduction afin d'arriver à une phrase de japonais  ie the data of the translated sentence is sent to a post-formatting section 1030. The post-formatting section 1030 modifies the translated sentence data by referring to the 1018 dictionary while using the information used in the translation process to arrive at a Japanese sentence.

plus naturelle. Les données de la phrase de japonais sont trans-  more natural. The Japanese sentence data is trans-

férées à une section de sortie 1032, puis délivrées, au titre de la phrase de japonais traduite 1034,par la section de sortie 1032. La section de sortie 1032 comprend par exemple une imprimante, un afficheur et, ou bien, un dispositif de mémoire à fichier, comme un  linked to an output section 1032, then delivered, under the translated Japanese sentence 1034, by the output section 1032. The output section 1032 comprises for example a printer, a display and, or alternatively, a memory device to file, like a

disque magnétique.magnetic disc.

Le déroulement des opérations successives de traduction est commandé par une section de commande 1038 qui gouverne la marche du dispositif dans son ensemble. Le dictionnaire de mots 1018 emmagasine des données de dictionnaire pour les mots des langues anglaise et japonaise o non seulement le vocabulaire, mais aussi diverses informations telles que des relations de connexion, à savoir relation de coexistence, significations, formes du pluriel et du singulier,'partie de discours, etc., sont établis dans ce mode de réalisation. De plus, le fichier 1036 de règles d'analyse emmagasine les données de règles pour l'analyse morphologique et  The progress of the successive translation operations is controlled by a control section 1038 which governs the operation of the device as a whole. The 1018 word dictionary stores dictionary data for words in the English and Japanese languages where not only the vocabulary, but also various information such as connection relationships, namely coexistence relationship, meanings, forms of the plural and singular, 'part of speech, etc., are established in this embodiment. In addition, the analysis rules file 1036 stores the rule data for morphological analysis and

l'analyse syntaxique.syntactic analysis.

La section de commande 1038 est connectée à une section d'affichage d'opération 1040. La section d'affichage d'opération 1040 comporte des touches d'opération par lesquelles un opérateur donne diverses instructions au dispositif de l'invention, comme des touches d'instruction de traduction ou des touches de curseur, un  The control section 1038 is connected to an operation display section 1040. The operation display section 1040 includes operation keys by which an operator gives various instructions to the device of the invention, such as keys translation instruction or cursor keys, a

affichage ou un indicateur qui visualise le texte d'anglais intro-  display or indicator that displays intro English text

duit, la phrase de japonais qui est le résultat de la traduction,  duit, the Japanese sentence which is the result of the translation,

des données intermédiaires telles que les informations du diction-  intermediate data such as diction information-

naire, diverses instructions destinées à l'opérateur, etc. La  various instructions for the operator, etc. The

plupart des fonctions d'affichage d'opération peuvent être consti-  most of the operation display functions can be

26 0 4 8 1 426 0 4 8 1 4

tuées de façon à être contenues dans un clavier si celui-ci est disposé dans La section d'entrée 1010 ou dans un afficheur s'il est  killed so as to be contained in a keyboard if it is arranged in the input section 1010 or in a display if it is

fourni pour la section de sortie 1032.  supplied for output section 1032.

On passe à la figure 1, qui montre la structure détaillée de ta section 1016 d'analyse morphologique. La section 1016 d'analyse morphologique oossède un dispositif d'entrée 1100, par exemple un clavier pour la section d'entrée 1010 et une interface d'entrée 1104 faisant interface avec le fichier du document d'entrée 1102. L'interface d'entrée 1104 est disposée de façon à comprendre un tampon d'ensemble de caractères d'entrée recevant les données relatives à l'ensemble de caractère en anglais sous la forme de données de code, par exemple ASCII, de la part du dispositif d'entrée 1100 ou du fichier du document d'entrée 1102, et elle emmagasine temporairement les données de l'ensemble de caractères. L'ensemble de caractères introduit peut être celui qui  We pass to FIG. 1, which shows the detailed structure of your section 1016 of morphological analysis. The morphological analysis section 1016 has an input device 1100, for example a keyboard for the input section 1010 and an input interface 1104 which interfaces with the file of the input document 1102. The interface input 1104 is arranged so as to include an input character set buffer receiving the data relating to the character set in English in the form of code data, for example ASCII, from the input device 1100 or from the input document file 1102, and it temporarily stores the data of the character set. The set of characters entered can be the one that

est pré-mis en forme dans la section de pré-mise en forme 1014.  is pre-shaped in pre-shaping section 1014.

La section 1016 d'analyse morphologique, comme représenté sur la figure, comprend une section de traitement 1106, une section 1108 de report au dictionnaire, une section 1110 de traitement de règles d'élimination des contradictions, et une section de commande 1112. La section de traitement 1106 est une section fonctionnelle d'analyse permettant d'effectuer l'analyse morphologique et elle comprend un tampon d'information de dictionnaire extraite, c'est-à-dire une table de mise en réserve d'information de dictionnaire 1120 (on pourra se reporter à la figure 9). L'analyse morphologique est exécutée sur la base des opérations suivantes: il est donné instruction de rechercher dans le dictionnaire dans un ordre qui part du haut de l'ensemble de caractères d'entrée selon l'ensemble de caractères de clé de recherche, l'information du dictionnaire obtenue de la section de recherche dans le dictionnaire 1108 qui lui est  The morphological analysis section 1016, as shown in the figure, includes a processing section 1106, a dictionary transfer section 1108, a processing section for rules for eliminating contradictions, and a control section 1112. processing section 1106 is a functional analysis section for performing the morphological analysis and it includes an extracted dictionary information buffer, that is to say a dictionary information storage table 1120 (we can refer to figure 9). The morphological analysis is carried out on the basis of the following operations: the instruction is given to search the dictionary in an order which starts from the top of the set of input characters according to the set of characters of the search key, l dictionary information obtained from the 1108 dictionary search section

relative est emmagasinée dans le tampon d'information de diction-  relative is stored in the diction information buffer-

naire extraite 1120, et le traitement consistant à obtenir un degré  nary extracted 1120, and the treatment of obtaining a degree

de préférence en fonction du drapeau de plus haute préférence ci-  preferably according to the flag of higher preference above

après décrit est exécuté.after described is executed.

La section 1108 de recherche dans le dictionnaire est une section fonctionneLLe servant à prendre l'information se trouvant dans le dictionnaire en recherchant dans le dictionnaire de mots 1118 sur la base de l'ensemble de caractères de clé de recherche qui ont fait l'objet d'une instruction de la part de la section de traitement 1106 et à la transférer à la section de  Dictionary search section 1108 is a working section used to retrieve information from the dictionary by searching the dictionary of words 1118 based on the set of search key characters that were the subject of an instruction from the processing section 1106 and to transfer it to the processing section

traitement 1106.treatment 1106.

Le dictionnaire de mots 1118 emmagasine une information grammaticale, telle que les parties du discours et lesflexions de La  The 1118 word dictionary stores grammatical information, such as parts of speech and La

rubrique d'entrée de chacun des mots,ainsi qu'un drapeau de préfé-  entry section for each of the words, as well as a prefecture flag

rence la plus élevée, comme représenté sur la figure 3 pour l'exempLe de l'information d'entrée. Le dictionnaire est considéré comme étant un fichier du type dictionnaire ayant un drapeau de  highest frequency, as shown in Figure 3 for the example of the input information. The dictionary is considered to be a dictionary type file with a flag of

préférence la plus élevée. Le "drapeau de préférence la plus éle-  highest preference. The "highest preference flag"

vée" est un drapeau indiquant l'étendue du couplage entre des mots contenus dans un mot composé ou une locution constituant l'entrée du dictionnaire, et "0" indique un couplage faible ou une absence de couplage tandis que "1" indique un couplage fort. Dans ce cas, l'usage comme locution est estimé valable pour un mot composé ou  vée "is a flag indicating the extent of coupling between words contained in a compound word or a phrase constituting the dictionary entry, and" 0 "indicates weak coupling or no coupling while" 1 "indicates coupling In this case, use as a phrase is considered valid for a compound word or

une locution considéréscomme ayant un couplage fort, sinon la pos-  a phrase considered to have strong coupling, otherwise the pos-

sibilité d'une utilisation comme mots distincts est également  sibility of use as separate words is also

considérée en parallèle.considered in parallel.

Comme cela est illustré par l'exemple de la figure 3,  As illustrated by the example in Figure 3,

chacune des entrées du dictionnaire de mots 1118 est agencée res-  each of the entries in the word dictionary 1118 is arranged res-

pectivement pour le mot composé, la locution et les mots distincts les constituant, sans faire de différence entre les mots distincts  pectively for the compound word, the locution and the distinct words constituting them, without making a difference between the distinct words

et le mot composé ou la locution. De plus, chaque forme flexion-  and the word compound or phrase. In addition, each bending form

nelle constitue une entrée à part. S'il existe plusieurs formes flexionnelles, elles sont respectivement enregistrées comme des entrées différentes. Le type de flexion est affiché dans la section des flexions. La situation est identique pour les parties de discours, o un enregistrement est admis pour plusieurs parties de discours, et l'information relative aux parties de discours est  It constitutes a separate entrance. If there are several inflectional forms, they are respectively recorded as different entries. The type of bending is displayed in the bending section. The situation is the same for parts of speech, where a recording is allowed for several parts of speech, and the information relating to parts of speech is

contenue pour chacune d'elles. Comme autres informations, le carac-  contained for each of them. Like other information, the character-

tère comptable ou non comptable d'un nom, le fait qu'un verbe soit transitif ou intransitif, ou le fait qu'iL s'agisse d'un mot  accounting or non-accounting of a noun, the fact that a verb is transitive or intransitive, or the fact that it is a word

traduit, etc. sont enregistrées.translated, etc. are saved.

Par exemple, "get (obtenir, ainsi que beaucoup d'autres  For example, "get (and many others

sens)" est la forme infinitive d'un verbe et le drapeau de préfé-  meaning) "is the infinitive form of a verb and the prefect flag

rence la plus élevée est "0". La locution "get up (se lever, monter, etc.) " est une locution pour un verbe infinitif et son drapeau de préférence la plus élevée est "1". De plus, le groupe prépositionnel "up to (jusqu'à) " possède le drapeau de plus haute préférence "1", mais un groupe nominal tel que "white house (maison blanche)" considéré comme un nom composé possède le drapeau de plus haute préférence "0", ce qui montre, dans ce dernier cas, que le  The highest frequency is "0". The phrase "get up (get up, go up, etc.)" is an expression for an infinitive verb and its highest preference flag is "1". In addition, the prepositional group "up to" has the flag of highest preference "1", but a nominal group such as "white house" considered a composite name has the flag of more high preference "0", which shows, in the latter case, that the

degré de couplage entre les mots est faible. Sur la figure, le sym-  degree of coupling between words is low. In the figure, the sym-

bole..U" désigne une vacance de caractère.  bole..U "indicates a vacancy of character.

De cette manière, l'information du dictionnaire trouvée dans la section 108 de recherche dans le dictionnaire contient le drapeau de plus haute préférence. Dans le cas o, si "1" est fixé pour le drapeau de plus haute performance pour des ensembles de  In this way, the dictionary information found in the dictionary search section 108 contains the flag of highest preference. In the case where, if "1" is set for the highest performance flag for sets of

caractères identiques ou des ensembles de caractères se chevau-  identical characters or overlapping sets of characters

chant, une semblable contradiction doit être éliminée. La section 1110 de traitement des règles d'élimination des contradictions  song, a similar contradiction must be eliminated. Section 1110 dealing with rules for eliminating contradictions

effectue l'élimination de la contradiction et elle fait le traite-  eliminates the contradiction and processes it

ment tout en se reportant à la règle d'élimination des contradic-  while referring to the rule of elimination of contradictions

tions pour le drapeau de plus haute préférence qui est emmagasinée  tions for the flag of highest preference which is stored

dans le fichier 1036 des règles d'analyse.  in file 1036 of the analysis rules.

La règle d'élimination des contradictions est appliquée dans le mode de réalisation, pour la manière dont la préférence est  The rule for eliminating contradictions is applied in the embodiment, for the way in which the preference is

accordée, suivant l'ordre de (1) à (3).  granted, in the order of (1) to (3).

(1) La locution ou le mot dont la partie du discours est un verbe.  (1) The phrase or word whose part of the speech is a verb.

(2) Le mot composé, la locution ou le mot possédant de nombreux  (2) The compound word, the phrase or the word with many

mots constitutifs.constituent words.

(3) Le mot composé, la locution ou le mot situé dans la partie  (3) The compound word, the phrase or the word located in the part

avant de la phrase.before the sentence.

L'usage employé pour le mot ainsi sélectionné, à savoir l'unité d'analyse, est affiché au titre d'information active relative au tampon d'information du dictionnaire trouvée 1120 par la section de traitement 1016. L'information active montre que l'unité d'analyse est valable ou effective si elle est "1", tandis qu'elle montre que sa possibilité n'est pas  The usage used for the word thus selected, namely the analysis unit, is displayed as active information relating to the dictionary information buffer found 1120 by the processing section 1016. The active information shows that the unit of analysis is valid or effective if it is "1", while it shows that its possibility is not

employée si elle est "0".used if it is "0".

La section de commande 1112 est une section fonctionnelle servant à gouverner et commander le fonctionnement et le traitement  The control section 1112 is a functional section used to govern and control the operation and the processing

dans chacune des sections fonctionnelles de la section 1016 d'ana-  in each of the functional sections of section 1016 of ana-

lyse morphologique. La section peut être incorporée dans la section de commande 1038 pour effectuer la commande du  morphological lysis. The section can be incorporated into the control section 1038 to control the

dispositif dans son ensemble.device as a whole.

Le résultat de L'analyse morphologique est transféré par l'intermédiaire d'une interface de sortie 1114 à la section I d'analyse 1020. Dans le cas o le résultat n'est pas directement transféré à la section I d'analyse 1020, il est une fois emmagasiné dans le fichier d'entrée d'analyse 1116 et  The result of the morphological analysis is transferred via an output interface 1114 to the analysis section I 1020. In the case where the result is not directly transferred to the analysis section I 1020, it is once stored in the analysis input file 1116 and

dans le fichier d'information du dictionnaire d'analyse 1118.  in the information file of the analysis dictionary 1118.

Dans ce mode de réalisation, alors que tous les mots, mots composés ou locutions partant de la partie de coupure de l'unité de référence du dictionnaire sont pris lors de l'analyse morphologique, l'information du dictionnaire obtenue pour des mots distincts constituant le mot composé ou la locution pour lesquels il a été décidé qu'il s'agissait d'une "unité" collective selon le drapeau de plus haute préférence est rejetée. C'est-à-dire que l'étendue du couplage entre les mots d'une phrase est déterminée tandis qu'il est fait référence au drapeau de plus haute préférence  In this embodiment, while all the words, compound words or phrases starting from the cut-off part of the dictionary reference unit are taken during the morphological analysis, the information from the dictionary obtained for distinct words constituting the compound word or phrase for which it has been decided that it is a collective "unity" according to the flag of highest preference is rejected. That is, the extent of coupling between words in a sentence is determined while reference is made to the flag of highest preference

pour l'information du dictionnaire obtenue dans l'analyse morpho-  for dictionary information obtained in morpho- analysis

logique. Parmi les mots composés ou les locutions, ceux qui sont déterminés comme ayant un couplage fort sont estimés devoir être utilisés comme locutionsdans la phrase et, si ce n'est pas le cas, la possibilité de leur utilisation comme mots distincts  logic. Of the compound words or phrases, those that are determined to have strong coupling are considered to be used as phrases in the sentence and, if not, the possibility of their use as separate words

est également considérée en parallèle.  is also considered in parallel.

Un tel traitement s'appuyant sur le drapeau de plus haute préférence est effectué à l'aide de la séquence présentée sur la  Such processing using the flag of highest preference is carried out using the sequence presented on the

figure 4. Les données relatives aux ensembles de caractères intro-  figure 4. Data relating to intro character sets

duits sont reçues en provenance de La section d'entrée 1010 (1200),  duits are received from input section 1010 (1200),

l'ensemble de caractères d'entrée est coupé par l'unité de réfé-  the input character set is cut by the reference unit

rence du dictionnaire pour la recherche dans le fichier diction-  dence dictionary dictionary search

naire 1018 avec le drapeau de plus haute préférence (1201), il est cherché dans le dictionnaire 1018 en fonction de cela (1203), la recherche étant menée jusqu'à la position finale de la phrase indiquée par les données de l'ensemble de caractères introduits (1202), puis la contradiction relative au drapeau de plus haute  nary 1018 with the flag of highest preference (1201), it is searched in the dictionary 1018 according to this (1203), the search being carried out until the final position of the sentence indicated by the data of the set of characters introduced (1202), then the contradiction relating to the highest flag

préférence est éLiminée (1204), et le résultat de l'analyse mor-  preference is eliminated (1204), and the result of the mor-

phologique est délivré à la section I d'analyse 1020  is issued in section I of analysis 1020

(1205).(1205).

Dans le traitement d'entrée 1200, les données sont  In input processing 1200, the data is

d'abord lues sur le fichier du document d'entrée 1102 ou le dispo-  first read from or available from the 1102 input document file

sitif d'entrée 1100 pour être placées dans le tampon de l'ensemble de caractères d'entrée de l'interface d'entrée 1104 (1210, voir la figure 5). Les données relatives à l'ensemble de caractères d'entrée sont introduites par exemple sous la forme ASCII, et,  input sitive 1100 to be placed in the buffer of the input character set of the input interface 1104 (1210, see Figure 5). The data relating to the set of input characters are introduced for example in the form ASCII, and,

lorsque le symbole EOF (fin de fichier) est lu, la section de trai-  when the EOF symbol (end of file) is read, the processing section

tement 1106 écrit le code NULL (vide) dans le tampon de l'ensemble  tement 1106 writes the NULL code (empty) in the set's buffer

de caractères d'entrée pour la position finale.  input characters for the end position.

Puis, la section de traitement 1106 donne une nouvelle forme à l'ensemble des caractères d'entrée (1211). Par exemple, si deux caractères, ou plus, appartenant au caractère correspondant à un espace se suivent, ils sont modifiés et corrigés en un seul  Then, the processing section 1106 gives a new form to the set of input characters (1211). For example, if two or more characters belonging to the character corresponding to a space follow one another, they are modified and corrected into one

caractère de vacance. Le caractères correspondant à un espace com-  vacancy character. The character corresponding to a space

porte le caractère de vacance (représenté par le symbole.U..), la tabulation, le retour à la ligne (représenté par le symbole ""v), etc. De plus, ces caractères correspondant à un espace apparaissant entre le sommet et le premier caractère produit qui est autre que le caractère correspondant à un espace dans le tampon des ensembles  carries the vacancy character (represented by the symbol.U ..), the tabulation, the line break (represented by the symbol "" v), etc. In addition, these characters corresponding to a space appearing between the vertex and the first produced character which is other than the character corresponding to a space in the set buffer.

de caractères d'entrée sont éliminés.  input characters are eliminated.

Par exemple, l'ensemble de caractères d'entrée "UUIUwillUUgetUuputoUgoUtoUaUwhiteUhouseU...- (je me lèverai pour aller à une maison blanche) est remis à la forme présentée sur la figure 6, à savoir "IUwillUgetUup utou gouto U aUwhiteUhouse..... (NULL)". La position du symbole (NULL)  For example, the input character set "UUIUwillUUgetUuputoUgoUtoUaUwhiteUhouseU ...- (I will get up to go to a white house) is reset to the form shown in Figure 6, namely" IUwillUgetUup utou gouto U aUwhiteUhouse ... .. (NULL) ". The position of the symbol (NULL)

indique la position finale dans le tampon.  indicates the final position in the buffer.

Les délimiteurs de référence du dictionnaire qui sont utilisés pour le processus de coupure 1201 de l'unité de référence  Dictionary reference delimiters which are used for the 1201 clipping process of the reference unit

du dictionnaire sont disposés à la position du caractère alphabé-  of the dictionary are arranged at the position of the alphabetic character

tique, du caractère numérique, de l'apostrophe,et des caractères tels  tick, numeric character, apostrophe, and characters such

que le trait d'union et le point-virgule ainsi que pour l'apostro-  that the hyphen and the semicolon as well as for the apostro-

phe faisant suite à des caractères de vacance. La section de trai-  phe following vacancy characters. The processing section

tement 1106 possède un pointeur supérieur pour la référence du  1106 has an upper pointer for the reference of the

dictionnaire, lequel est d'abord placé en tête du tampon.  dictionary, which is first placed at the head of the buffer.

Ensuite, la section 1108 de recherche dans le diction-  Then section 1108 search in the diction-

naire consulte le fichier dictionnaire1118 attaché à l'aide du  naire consults the dictionary1118 file attached using the

drapeau de plus haute préférence en utilisant l'ensemble de carac-  flag of highest preference using the character set

tères qui va du caractère indiqué par le pointeur de tête jusqu'au caractère précédant le délimiteur suivant comme ensemble de caractères de clé de recherche. La rubrique d'entrée du dictionnaire et l'ensemble de caractères de clé de recherche  tères which goes from the character indicated by the head pointer to the character preceding the following delimiter as a set of search key characters. Dictionary entry field and search key character set

sont soumis à une comparaison et, si tous sont identiques, l'infor-  are subject to comparison and, if all are the same, the information

mation du dictionnaire est acceptée (1203). Cet accord est estimé bon lorsque tout l'ensemble de caractères de l'entrée du diction-  Dictionary entry is accepted (1203). This agreement is considered good when all the character set of the entry of the diction-

naire est en accord avec au moins une partie de l'ensemble de caractères partant de l'extrémité supérieure et si la partie qui vient juste après cette partie est un délimiteur de référence du  naire is in agreement with at least part of the set of characters starting from the upper end and if the part which comes just after this part is a reference delimiter of the

dictionnaire, une apostrophe ou un point. Par exemple, comme repré-  dictionary, an apostrophe or period. For example, as shown

senté sur la figure 7, si le pointeur de tête indique le carac-  felt in figure 7, if the head pointer indicates the character

tère de tête "g" dans l'ensemble de caractères de clé de recherche, "get upon (obtenir sur)", "get (obtenir)" et "get  lead g "in the search key character set," get upon (get on) "," get (get) "and" get

upon" de l'entrée du dictionnaire sont en accord avec cela.  upon "from the dictionary entry agree with that.

L'information du dictionnaire retrouvée est emmagasinée  Dictionary information retrieved is stored

dans le tampon 1120 d'information du dictionnaire retrouvée appar-  in buffer 1120 of dictionary information found apparently

tenant à la section de traitement 1106. En même temps que ce qui est lu, la position initiale reconnue et la position finale de  related to processing section 1106. At the same time as what is read, the recognized initial position and the final position of

l'ensemble de caractères sont emmagasinées. Ceci précise la posi-  the set of characters are stored. This clarifies the posi-

tion des caractères dans le tampon d'entrée suivant un ordre qui part de La tête. Une région d'accumuLation pour L'information active est disposée dans le tampon 1120 d'information du dictionnaire retrouvée, qui est une information indiquant si L'information du  tion of the characters in the input buffer in an order starting from the head. An accumulation region for active information is arranged in the dictionary information buffer 1120, which is information indicating whether the information of the

dictionnaire retrouvée est ou non effective pour La suite du trai-  dictionary found is effective or not for The rest of the process

tement, toutes celles-ci étant fixées à "1" à cette étape.  All of these are set to "1" at this stage.

Ensuite, le pointeur de tête est remis à jour sur toutes les références du dictionnaire et il est positionné sur le  Then, the head pointer is updated on all the references in the dictionary and it is positioned on the

caractère venant juste après le déLimiteur qui apparaît au voisi-  character just after the delimiter that appears next to it

nage immédiat du présent pointeur de tête lorsqu'on regarde l'ensemble de caractères de la gauche vers la droite. Le report au  Immediate swim of the present pointer when looking at the set of characters from left to right. The postponement to

dictionnaire est donc effectué avec succès. Dans l'exemple ci-  dictionary is therefore performed successfully. In the example above

dessus mentionné, le caractère se trouvant en tête de l'unité de référence du dictionnaire est indiqué en employant "I" pour "I" au début, puis "w" pour "will", puis enfin "g" pour "get". Lorsque le pointeur de tête arrive au code NULL, il est déterminé qu'il  above mentioned, the character at the head of the dictionary reference unit is indicated by using "I" for "I" at the beginning, then "w" for "will", then finally "g" for "get". When the head pointer arrives at NULL, it is determined that it

se trouve à la position finale (1202).  is in the final position (1202).

La figure 9 montre un exemple d'une information du dic-  Figure 9 shows an example of information from the dic-

tionnaire trouvée de cette manière pour l'exemple de l'ensemble  found in this way for the example of the whole

de caractères d'anglais introduit qui a été décrit ci-dessus.  of English characters introduced which has been described above.

On va maintenant donner des explications au sujet du traitement d'élimination des contradictions 1204 effectué par la  We will now give explanations concerning the treatment for eliminating contradictions 1204 carried out by the

section 1110 de traitement des règles d'élimination des contradic-  section 1110 of treatment of the rules for eliminating contradictions

tions, en même temps qu'on se reporte au fichier des règles d'éli-  at the same time as referring to the file of election rules

mination des contradictions pour le fichier de plus grande préfé-  mination of contradictions for the file of greatest prefe-

rence 1036, en relation avec les figures 8A à 8D. L'organigramme présenté sur les figures 8A et 8B illustre le traitement effectué dans le cas o les positions relatives aux mots o les drapeaux de plus haute préférence sont positionnés se chevauchent entre elles,  rence 1036, in connection with FIGS. 8A to 8D. The flowchart presented in FIGS. 8A and 8B illustrates the processing carried out in the case where the positions relative to the words where the flags of highest preference are positioned overlap with one another,

tandis que l'organigramme des figures 8C et 8D illustrent le trai-  while the flowchart of Figures 8C and 8D illustrate the process

tement d'élimination appliqué aux unités d'analyse, c'est-à-  elimination applied to the units of analysis, i.e.

dire des éléments par le drapeau de plus haute préférence, c'est-à-  say items with the flag of highest preference, that is

dire un traitement permettant de transformer l'information active en "0". Dans ces organigrammes, la référence "≤" représente la substitution, "'" représente la référence, et "Po-x" représente le contenu de x que possède respectivement La rubrique d'entrée du pointeur p. Tout d'abord, un groupe de mots qui ont chacun un drapeau de plus haute référence valant "1" et dont les positions dans la phrase se chevauchent mutuellement sont détectés (étapes 1220 à 1223). Ensuite, la règle d'élimination du drapeau de plus haute préférence est appliquée à chacun des groupes détectés, et ceux qui, parmi eux, se révèlent effectifs sont sélectionnés (étapes  to say a treatment allowing to transform the active information into "0". In these flowcharts, the reference "≤" represents the substitution, "'" represents the reference, and "Po-x" represents the content of x that the entry field of the pointer p respectively has. First, a group of words which each have a higher reference flag of "1" and whose positions in the sentence overlap each other are detected (steps 1220 to 1223). Then, the rule of elimination of the flag of highest preference is applied to each of the groups detected, and those which, among them, prove effective are selected (steps

1224 à 1235).1224 to 1235).

Par exemple, dans le mode de réalisation ci-dessus décrit, le drapeau de plus haute préférence "1" est fixé à "get up" pour la position de départ "8" et la position terminale "13" et à "up to" pour la position initiale "12" et la position terminale "16" en ce qui concerne le groupe de caractères "get up to", comme représenté sur la figure 9, et les positions des caractères  For example, in the embodiment described above, the flag of highest preference "1" is set to "get up" for the start position "8" and the end position "13" and to "up to" for the initial position "12" and the end position "16" with regard to the group of characters "get up to", as shown in FIG. 9, and the positions of the characters

se chevauchent entre elles. Ensuite, la règle (1) telle que ci-  overlap each other. Then, rule (1) as below

dessus décrite est d'abord appliquée pour servir à déterminer s'il s'agit ou non d'un verbe en même temps qu'il est fait référence à la partie de discours du pointeur de mise en réserve"psave"et à la partie de discours du pointeur p (1224). Dans cet exemple, puisqu'il correspond à un verbe, la combinaison "get up" est choisie. Si la règle (1) n'est pas satisfaite, la règle (2) est appliquée (1228), et la longueur (lens) de l'ensemble de caractères  above described is first applied to serve to determine whether or not it is a verb at the same time as reference is made to the speech part of the "psave" reserve pointer and to the part of speech from the pointer p (1224). In this example, since it corresponds to a verb, the combination "get up" is chosen. If the rule (1) is not satisfied, the rule (2) is applied (1228), and the length (lens) of the character set

associé à l'entrée du pointeur de mise en réserve psave est com-  associated with the entry of the psave reserve pointer is com-

parée avec la longueur (len) de l'ensemble de caractères associé à l'entrée du pointeur p. De plus, si la règle (2) n'est pas non plus satisfaite, la règle (3) est appliquée (1229), et la position de début associée à la position initiale du pointeur de mise en réserve psave est comparéeavec le début de position associée à la position initiale du pointeur p. Ensuite, lorsque l'une quelconque des règles (1) à (3) d'élimination des contradiction a été satisfaite, l'application se faisant dans cet ordre, l'information active de la rubrique  trimmed with the length (len) of the set of characters associated with the entry of the pointer p. In addition, if rule (2) is not satisfied either, rule (3) is applied (1229), and the start position associated with the initial position of the psave reserve pointer is compared with the start of position associated with the initial pointer position p. Then, when any one of the rules (1) to (3) for eliminating contradictions has been satisfied, the application being done in this order, the active information in the section

d'entrée non satisfaite, c'est-à-dire non effective, est trans-  input input, i.e. not effective, is trans-

formée en "0" (1232), tandis que l'autre, c'est-à-dire l'information active de l'autre rubrique d'entrée, c'est-à-dire de l'entrée effective, est laissée comme elle était, à "1" (1231). Une telle  formed as "0" (1232), while the other, i.e. the active information of the other entry item, i.e. of the actual entry, is left as it was, at "1" (1231). Such a

application de la règle d'élimination des contradictions est appli-  application of the rule of elimination of contradictions is applied

quée en succession tandis que le pointeur p avance par degrés (1234, 1235) jusqu'à la position finale pour chacune des rubriques d'entrée successives, l'information active étant mise sous la forme "1" dans le seul cas d'une rubrique d'entrée effective. L'état correspondant à l'exemple ci-dessus mentionné est présenté sur la figure 10. Par exemple, pour la rubrique d'entrée "up to", son  quée in succession while the pointer p advances by degrees (1234, 1235) to the final position for each of the successive entry headings, the active information being put in the form "1" in the only case of a effective entry section. The state corresponding to the example mentioned above is presented in FIG. 10. For example, for the entry item "up to", its

information active est mise sous la forme "0".  active information is put in the form "0".

Ensuite, les éléments se trouvant en chevauchement, même partiel, pour la position associée à la combinaison dans laquelle l'information active et le drapeau de plus haute préférence sont tous deux "1" sont détectés (1236 à 1241), et leur information active est ramenée à "0" (1142, 1249). L'application d'une telle règle d'élimination des contradictions est exécutée dans l'ordre donné pour chacune des rubriques d'entrée tandis que le pointeur p avance par degrés(1243, 1248) jusqu'à la position finale et que l'information active des rubriques d'entrée non effectives est ramenée à "0". Ainsi, l'information active qui est relative à "get" et à "up" est ramenée "0", par exemple, pour la rubrique d'entrée "get up" (figure 10). Pour les entrées "white", "white house" et "house", puisque tous leurs drapeaux de plus haute préférence sont "0" même si les positions sont en chevauchement, leurs informations  Then, the elements being overlapped, even partial, for the position associated with the combination in which the active information and the flag of highest preference are both "1" are detected (1236 to 1241), and their active information is returned to "0" (1142, 1249). The application of such a rule for eliminating contradictions is executed in the order given for each of the entry headings while the pointer p advances by degrees (1243, 1248) to the final position and the active information of ineffective entry items is reduced to "0". Thus, the active information which relates to "get" and to "up" is brought back to "0", for example, for the entry item "get up" (FIG. 10). For the "white", "white house" and "house" entries, since all their flags of highest preference are "0" even if the positions are overlapping, their information

actives sont maintenues à "1".active are kept at "1".

De cette manière, lorsque le traitement a été effectué jusque juste avant la position finale (NULL), le contenu du tampon d'entrée de l'interface d'entrée 1104 et du tampon d'information de dictionnaire retrouvée 1120 sont délivrés par l'interface de sortie 1114 à la section I d'analyse 1116. Le contenu du tampon d'information de dictionnaire trouvée 1120 n'est délivré que pour la rubrique d'entrée pour laquelle "1" est indiqué comme information active. Par exemple, le contenu du  In this way, when the processing has been carried out just before the final position (NULL), the content of the input buffer of the input interface 1104 and of the dictionary information buffer found 1120 are delivered by the output interface 1114 to analysis section I 1116. The content of the dictionary information buffer found 1120 is only delivered for the input item for which "1" is indicated as active information. For example, the content of the

tampon d'entrée peut être écrit dans le fichier d'entrée de l'ana-  input buffer can be written to the input file of the analysis

lyse 1116, tandis que le contenu du tampon d'informa-  lyse 1116, while the content of the information buffer

tion de dictionnaire trouvée 1120 peut être écrite dans le  dictionary entry found 1120 can be written in the

fichier d'information de dictionnaire d'analyse 1118.  analysis dictionary information file 1118.

Dans ce cas, puisque l'information active et le drapeau de plus haute préférence sont tous deux également délivrés, la structure du fichier d'information de dictionnaire d'analyse 1118 est identique à celle du tampon d'information de dictionnaire retrouvée. Il peut également se trouver que l'information active et  In this case, since the active information and the flag of higher preference are both also delivered, the structure of the analysis dictionary information file 1118 is identical to that of the dictionary information buffer found. It may also happen that active information and

le drapeau de plus haute préférence ne sont pas délivrés.  the flag of highest preference is not issued.

On va maintenant décrire plus spécialement le deuxième  We will now describe more specifically the second

mode de réalisation.embodiment.

La figure 11 illustre le deuxième mode de réalisation de l'analyseur de Langage selon l'invention, appliqué à un dispositif  FIG. 11 illustrates the second embodiment of the Language analyzer according to the invention, applied to a device

de traduction automatique anglais-japonais.  English-Japanese machine translation.

Ce mode de réalisation possède une section d'entrée 2014, à laquelle des données sont délivrées de la part d'un dispositif  This embodiment has an input section 2014, to which data is delivered from a device

d'entrée 2010 ou d'un fichier de document d'entrée 2012. Le dispo-  2010 entry file or a 2012 entry document file.

sitif 2010 comprend par exemple un clavier possédant des touches de caractères comme par exemple des touches elphanumériques ou des  sitif 2010 includes for example a keyboard having character keys such as for example elphanumeric keys or

touches de fonction, et un dispositif de lecture optique de carac-  function keys, and an optical character reading device

tères permettant de lire un texte en anglais enregistré sur une  tères allowing to read a text in English recorded on a

feuille de papier. Le fichier de document d'entrée 2012 est un dis-  sheet of paper. The 2012 input document file is a dis-

positif de mémoire dans lequel le texte en anglais est enregistré  memory positive in which the English text is saved

sur un support de mémoire, par exemple un disque magnétique.  on a memory medium, for example a magnetic disc.

La section d'entrée 2014 comprend un tampon 2014a d'ensemble de caractères d'entrée et emmagasine la phrase d'anglais d'entrée qui est délivrée par le dispositif d'entrée 2010 ou le  The 2014 input section includes a 2014a input character set buffer and stores the input English phrase that is delivered by the 2010 input device or the

fichier de document d'entrée 2012 au tampon d'ensemble de carac-  2012 input document file to the character set buffer

tères d'entrée 2014a. La section 2014 lit la phrase d'entrée emma-  input ters 2014a. The 2014 section reads the input sentence emma-

gasinée dans le tampon d'ensemble de caractères d'entrée 2014 et la  stored in the 2014 input character set buffer and the

délivre à une section de traitement 2016.  delivers to a 2016 processing section.

La section de traitement 2016 est une section fonction-  The 2016 treatment section is a functional section.

nelle effectuant l'analyse morphologique relativement à la phrase fournie qui est délivrée par la section d'entrée 2014  nelle performing the morphological analysis relative to the sentence provided which is delivered by the entrance section 2014

en effectuant une recherche dans un fichier dictionnaire, c'est-à-  by performing a search in a dictionary file, i.e.

dire en consultant un fichier dictoinnaire ou bien en tentant d'y retrouver ce qu'on y cherche. La section de traitement 2016  say by consulting a dictionary file or by trying to find what you are looking for. The 2016 treatment section

comprend une table 2016a de mise en réserve d'information du dic-  includes a table 2016a for storing information in the dictionary

tionnaire et elle emmagasine l'information obtenue par la consulta-  shareholder and it stores the information obtained by the consulta-

tion d'un fichier dictionnaire 2022 ou bien un fichier dictionnaire d'unités fondamentales 2026 qui sera décrit ci-après pour la placer  tion of a dictionary file 2022 or a dictionary file of fundamental units 2026 which will be described below to place it

dans la table 2016a de mise en réserve d'informations du diction-  in the 2016a table for storing diction information-

naire. La section de traitement 2016 consulte un ensemble de caractères de clé de consultation en une seule unité dans le cas  nary. The 2016 processing section consults a set of consultation key characters in a single unit in the case

de la consultation du dictionnaire à partir de l'ensemble de carac-  of consulting the dictionary from the set of characters

tères constituant la phrase d'entrée qui a été délivrée par la section d'entrée 2014. L'ensemble de caractères de clé de consultation est consulté suivant un ordre qui part du premier caractère de l'ensemble de caractères constituant la phrase  tères constituting the entry sentence which was issued by the entry section 2014. The set of consultation key characters is consulted in an order starting from the first character of the set of characters constituting the sentence

d'entrée, sur la base d'une règle de consultation prédéterminée.  entry, based on a predetermined consultation rule.

Par exemple, la phrase d'entrée est divisée à partir du haut de la phrase, dans l'ordre, au moyen de délimiteurs, par exemple des espaces, des virgules, etc., et les ensembles de caractères divisés sont respectivement utilisés comme ensemble de caractères de clé de consultation. Dans ce cas, les ensembles de caractères exprimant des unités telles que m, km, m/s sont respectivement constitués en ensemble de caractères de clé de consultation. La section de traitement 2016 envoie l'ensemble de caractères de clé de consultation, qui est retrouvé à partir de l'ensemble de caractères constituant la phrase d'entrée, à la section 2020 de consultation  For example, the input sentence is split from the top of the sentence, in order, using delimiters, such as spaces, commas, etc., and the sets of divided characters are used as a set, respectively. of consultation key characters. In this case, the sets of characters expressing units such as m, km, m / s respectively consist of a set of consultation key characters. The processing section 2016 sends the consultation key character set, which is found from the character set constituting the input sentence, to the consultation section 2020

du dictionnaire.from the dictionary.

La section 2020 de recherche dans le dictionnaire con-  The 2020 search section in the dictionary con-

sulte un fichier dictionnaire 2022 sur la base des ensembles de caractères de consultation qui sont délivrés par la section de traitement 2016. Dans le fichier dictionnaire 2022, les rubriques d'entrée et les informations grammaticales telles que les parties de discours sont emmagasinées comme indiqué sur la figure 12. S'il y a une entrée, ou rubrique d'entrée, dans le fichier dictionnaire  a 2022 dictionary file is consulted on the basis of the sets of consultation characters which are delivered by the processing section 2016. In the 2022 dictionary file, the entry items and grammatical information such as the speech parts are stored as indicated on Figure 12. If there is an entry, or entry item, in the dictionary file

2022, la section de consultation du dictionnaire 2020 lit l'infor-  2022, the consultation section of the 2020 dictionary reads the information

mation de la partie discours, etc., de cette entrée et la délivre à la section de traitement 2016. S'il n'y a pas d'entrée dans le  mation of the speech, etc. part of this entry and delivers it to the 2016 processing section. If there is no entry in the

fichier dictionnaire 2022 suite à la consultation du fichier dic-  dictionary file 2022 following consultation of the dic- file

tionnaire 2022, la section de consultation de dictionnaire 2020  2022, the dictionary consultation section 2020

informe la section de traitement 2016 de la situation.  inform the 2016 processing section of the situation.

La section de traitement 2016 emmagasine l'information de partie de discours, etc., trouvée par la section de consultation de  The 2016 processing section stores the speech part information, etc., found by the consultation section of

dictionnaire 2020 dans une table 2016a de mise en réserve d'infor-  2020 dictionary in a 2016a information storage table

mation du dictionnaire. S'il n'y a pas d'entrée pour l'ensembLe de caractères de clé de consultation dans le fichier dictionnaire  Dictionary mation. If there is no entry for the set of lookup key characters in the dictionary file

2022, la section de traitement 2016 délivre l'ensemble de carac-  2022, the 2016 processing section delivers the entire character-

tères de touche de consultation à une section de reconnaissance  touch keys to a recognition section

d'unité 2024.unit 2024.

La section de reconnaissance d'unité 2024 consulte un fichier dictionnaire d'unités fondamentales 2026 sur la base de l'ensemble de caractères de clé de consultation délivré par La section de traitement 2016. Les entrées d'unités fondamentales sont emmagasinées dans le fichier dictionnaire d'unités fondamentales 2026, comme représenté sur la figure 13 s'il n'y a aucune entrée dans le fichier dictionnaire 2026 d'unités fondamentales, ou unités  The unit recognition section 2024 consults a dictionary file of fundamental units 2026 on the basis of the set of consultation key characters issued by The processing section 2016. The entries of fundamental units are stored in the dictionary file of 2026 fundamental units, as shown in Figure 13 if there is no entry in the 2026 dictionary file of fundamental units, or units

* de mesure de base, l'ensemble de caractères de touche de consulta-* basic measurement, the set of consultation key characters

tion est divisé en plusieurs ensembles de caractères, comme décrit ciaprès, et le fichier dictionnaire 2026 d'unités de base est consulté plusieurs fois. Ensuite, si des entrées d'unités de base sont présentes respectivement plusieurs fois dans la recherche  tion is divided into several sets of characters, as described below, and the 2026 dictionary of base units is consulted several times. Then, if base unit entries are present more than once in the search

effectuée dans le fichier dictionnaire d'unités de base 2026, plu-  performed in the 2026 base unit dictionary file, more

sieurs informations d'unités sont obtenues à partir des entrées d'unités de base. S'il n'y a aucune entrée d'unité de base dans aucun des différents résultats de recherche, iL est obtenu une information indiquant que l'objet cherché n'est pas enregistré dans  Several unit information is obtained from the base unit entries. If there is no base unit entry in any of the different search results, iL is obtained information indicating that the object sought is not saved in

le dictionnaire.the dictionary.

La section de reconnaissance des unités 2024 délivre l'entrée d'unité de base, l'information d'unité composée et l'information indiquant que le mot n'est pas enregistré dans le  The 2024 unit recognition section provides the base unit entry, the compound unit information, and the information that the word is not recorded in the

dictionnaire à la section de traitement 2016. La section de traite-  dictionary to the processing section 2016. The processing section

ment 2016 emmagasine ces informations délivrées par la section de reconnaissance des unités 2024 dans la table de mise en réserve d'information du dictionnaire 2016a. La table 2016a de mise en réserve d'information du dictionnaire emmagasine à des fins de  2016 stores this information delivered by the 2024 unit recognition section in the information reserve table of the 2016a dictionary. Dictionary storage table 2016a stores for

conservation la rubrique d'entrée relative aux ensembles de carac-  conservation the entry section relating to character sets

tères de clé de consultation et l'information grammaticale, par exemple la partie de discours obtenue par la recherche dans le fichier dictionnaire 2022 ou le fichier dictionnaire d'unités de base 2026 se rapportant à l'ensemble de caractères de clé de consultation. Après que les données ont été emmagasinées dans la table de mise en réserve d'informations du dictionnaire 2016a, la section de traitement 2016 délivre ces données en même temps que la phrase introduite à l'interface de sortie 2018. L'interface de sortie 2018 délivre la phrase d'entrée et les données relatives à l'analyse morphologique fournie par la section de traitement 2016 à un dispositif de sortie 2030, par exemple une imprimante ou un afficheur, ou bien à un fichier de mémoire 2032,  lookup key terms and grammatical information, for example the speech part obtained by searching in the dictionary file 2022 or the base unit dictionary file 2026 relating to the set of lookup key characters. After the data has been stored in the information storage table of the dictionary 2016a, the processing section 2016 delivers this data at the same time as the sentence entered at the output interface 2018. The output interface 2018 delivers the input sentence and the data relating to the morphological analysis supplied by the processing section 2016 to an output device 2030, for example a printer or a display, or else to a memory file 2032,

par exemple un disque magnétique.for example a magnetic disc.

Selon une autre possibilité, on fournit la phrase d'entrée et les données de l'analyse morphologique délivrées par la section de traitement 2016 directement à un moyen d'analyse (non représenté) pour effectuer l'analyse relative à la phrase d'entrée dans le moyen d'analyse et, de plus,  According to another possibility, the input sentence and the data of the morphological analysis delivered by the processing section 2016 are supplied directly to an analysis means (not shown) for carrying out the analysis relating to the input sentence in the means of analysis and, moreover,

préparer une phrase traduite sur la base de l'analyse.  prepare a translated sentence based on the analysis.

La section de commande 2028 sert à commander le fonction-  The control section 2028 is used to control the function-

nement de chacune des sections fonctionnelles du dispositif et peut  each of the functional sections of the device and can

avantageusement être constituée par un microcalculateur.  advantageously be constituted by a microcomputer.

On va maintenant expliquer le fonctionnement du disposi-  We will now explain the operation of the device.

tif en relation avec l'organigramme présenté sur la figure 15.  tif in relation to the organization chart presented in figure 15.

Au début, la phrase d'anglais fournie en entrée est lue dans le dispositif d'entrée 2010 ou le fichier de document d'entrée 2012 pour être placée dans la section d'entrée 2014 (2100). La phrase d'entrée lue et placée dans la section d'entrée 2014 est  At the start, the English sentence provided as input is read in the 2010 input device or the 2012 input document file to be placed in the 2014 input section (2100). The input sentence read and placed in the 2014 input section is

emmagasinée dans le tampon d'ensemble de caractères d'entrée 2014a.  stored in the input character set buffer 2014a.

La phrase d'entrée emmagasinée dans le tampon d'ensemble de carac-  The input sentence stored in the character set buffer

tères d'entrée 2014a est ensuite lue et délivrée à la section de  entry points 2014a is then read and issued to the

traitement 2016.2016 treatment.

Dans la section de traitement 2016, lorsque la phrase d'entrée est délivrée, l'unité de recherche dans le dictionnaire est soumise à une opération de coupure (2102). Ainsi, l'ensemble de caractères constituant la phrase d'entrée est divisée, au nom d'une  In the processing section 2016, when the input sentence is delivered, the dictionary search unit is subjected to a cutting operation (2102). Thus, the set of characters constituting the input sentence is divided, in the name of a

règle prédéterminée, en ensembles de caractères de clé de con-  predetermined rule, in sets of key characters

sultation qui forment les unités de recherche dans le fichier dictionnaire 2022 ou le fichier dictionnaire d'unités de base 2026, ces unités étant successivement prises depuis la tête de l'ensemble de caractères. IL est alors décidé si l'ensemble de caractères de consultation divisé est ou non présent (2104) et, s'il est présent, l'ensemble de caractères de cLé de consultation est envoyé à la  sultation which form the search units in the dictionary file 2022 or the dictionary file of basic units 2026, these units being successively taken from the head of the set of characters. It is then decided whether or not the split set of consultation characters is present (2104) and, if it is present, the set of consultation key characters is sent to the

section 2020 de consultation de dictionnaire.  Dictionary Lookup Section 2020.

Lorsque l'ensemble de caractères de clé de recherche est envoyé à la section 2020 de recherche dans le dictionnaire,  When the search key character set is sent to the dictionary search section 2020,

cette dernière consulte le fichier dictionnaire 2022 pour y recher-  the latter consults the 2022 dictionary file to search for

cher l'ensemble de caractère de clé de consultation (2106). Il est déterminé si l'ensemble de caractères de clé de consultation  expensive lookup key character set (2106). It is determined whether the lookup key character set

est ou non présent dans la rubrique d'entrée du fichier diction-  is present or not in the entry section of the diction- file

naire 2022, comme représenté sur la figure 12, et, si l'entrée est présente, une information grammaticale, par exemple une partie de discours, emmagasinée dans le fichier dictionnaire 2022 est lue et ces données lues sont envoyées à la section de traitement 2016 pour être emmagasinées dans la table de mise en réserve d'informations de dictionnaire 2016a (2110). Ensuite, le programme revient à l'étape 2102 et l'unité de consultation de dictionnaire est de  nary 2022, as shown in FIG. 12, and, if the entry is present, grammatical information, for example a portion of speech, stored in the dictionary file 2022 is read and this read data is sent to the processing section 2016 to be stored in the dictionary information storage table 2016a (2110). Then, the program returns to step 2102 and the dictionary consultation unit is

nouveau soumise à une opération de coupure.  again subject to a cut operation.

S'il n'y a pas d'entrée dans le fichier dictionnaire 2022, la section de consultation de dictionnaire 2020 renvoie l'ensemble de caractères de clé de consultation à la-section de traitement 2016, et cette dernière envoie l'ensemble de caractères de clé de consultation à la section de reconnaissance des unités  If there is no entry in the dictionary file 2022, the dictionary consultation section 2020 returns the set of consultation key characters to the processing section 2016, and the processing section sends the set of consultation key characters in the unit recognition section

2024, o il est effectué une reconnaissance d'unités (2112).  2024, where units are recognized (2112).

Dans le cas o l'ensemble de caractères de clé de consultation envoyé à la section de consultation du dictionnaire 2020 est constitué de mots ordinaires, comme des noms et des verbes, puisqu'il existe des entrées pour la plupart d'entre eux dans le fichier dictionnaire 2022, l'information grammaticale telle que la partie de discours est lue dans le fichier dictionnaire 2022 et les données correspondantes sont envoyées à la section de traitement 2016 et enregistrées dans la table de mise en réserve d'information de dictionnaire 2016a. Comme décrit ci-dessus, les rubriques d'entrée des mots usuels tels que les noms et Les verbes sont formées, mais aucune entrée n'est formée pour l'ensemble de caractères exprimant des unités dans le fichier dictionnaire 2022. Par conséquent, dans le cas o l'ensemble de caractères de cLé de consultation est un ensemble de caractères exprimant une unité telle que kg ou m/s, puisqu'il n'y a pas d'entrée dans le fichier dictionnaire 2022, Le programme passe à  In the case where the set of consultation key characters sent to the consultation section of the 2020 dictionary consists of ordinary words, such as nouns and verbs, since there are entries for most of them in the dictionary file 2022, the grammatical information such as the speech part is read from the dictionary file 2022 and the corresponding data is sent to the processing section 2016 and recorded in the dictionary information storage table 2016a. As described above, the entry fields for common words such as nouns and verbs are formed, but no entry is formed for the set of characters expressing units in the 2022 dictionary file. Therefore, in the case where the set of characters of consultation key is a set of characters expressing a unit such as kg or m / s, since there is no entry in the dictionary file 2022, The program goes to

l'étape 2112 en vue d'une reconnaissance des unités.  step 2112 for the purpose of recognizing the units.

L'opération de reconnaissance des unités effectuée à l'étape 20112 va maintenant être expliquée en relation avec la  The unit recognition operation carried out in step 20112 will now be explained in relation to the

figure 16.figure 16.

Lorsque l'ensemble de caractères de cLé de consulta-  When the set of characters from the consultation key

tion, pour lequel aucune entrée n'est présente dans le fichier dictionnaire 2022 lors de la consultation du fichier dictionnaire 2022, est envoyé de la section de traitement 2016 à la section de reconnaissance d'unités 2024, le pointeur P est positionné sur le caractère se trouvant à La partie de tête de l'ensemble de  tion, for which no entry is present in the dictionary file 2022 when consulting the dictionary file 2022, is sent from the processing section 2016 to the unit recognition section 2024, the pointer P is positioned on the character lying at the head part of the set of

caractères de c Lé de consultation dans la section de reconnais-  characters of c Lookup in the recognition section

sance d'unités 2024 (2200).sance of units 2024 (2200).

Ensuite, la section de reconnaissance d'unités 2024 consulte le fichier dictionnaire d'unités de base 2026 pour  Then, the unit recognition section 2024 consults the base unit dictionary file 2026 for

l'ensemble de caractères partant du caractère pour lequel le poin-  the set of characters starting from the character for which the point-

teur P a été positionné (2201). Dans cette recherche, il est décidé si l'unité de base pour laquelle l'entrée existe dans le fichier dictionnaire d'unités de base 2026 apparaît ou non comme un  P P was positioned (2201). In this search, it is decided whether the base unit for which the entry exists in the 2026 base unit dictionary file appears or not as a

ensemble de caractères complet dans l'ensemble de caractères par-  complete character set in character set par-

tant du caractère pour lequel le pointeur P a été positionné et s'il  both of the character for which the pointer P was positioned and whether

commence ou non au caractère pour lequel le pointeur P a été posi-  starts or not starts with the character for which the pointer P was posi-

tionné. Ainsi, il est tenté de trouver si un ensemble de caractères  tionné. So, it is tempted to find if a set of characters

comprenant un ou plusieurs caractères partant du carac-  comprising one or more characters starting from the character-

tère pour lequel le pointeur P a été positionné est conforme à l'une quelconque des unités fondamentales pour lesquelles il existe  tère for which the pointer P was positioned conforms to any one of the fundamental units for which it exists

une rubrique d'entrée dans le fichier dictionnaire d'unités fonda-  an entry item in the dictionary of basic units

mentales 2026. Par exemple, dans le cas o les caractères sur LesqueLs le pointeur P est positionné sont k, m, s, etc., des rubriques d'entrée existent dans le fichier dictionnaire d'unités de base 2026 pour ces caractères particuliers à partir du caractère sur lequel le pointeur P a été positionné, comme représenté sur La  2026. For example, in the case where the characters on which the pointer P is positioned are k, m, s, etc., input items exist in the base unit dictionary file 2026 for these particular characters. starting from the character on which the pointer P was positioned, as represented on La

figure 13.figure 13.

La section 2024 de reconnaissance des unités détermine si l'entrée existe ou non dans le fichier dictionnaire d'unités de base 2026 en résuLtat de la recherche effectuée dans le fichier dictionnaire d'unités de base 2026 (2204) et, si l'entrée existe, le pointeur P avance de la Longueur de l'unité de base reconnue (2208). Par conséquent, dans le cas o l'unité de base est k, m, s, etc., le pointeur P avance d'un seul caractère, puis se positionne sur le caractère suivant de l'ensemble de caractères de cLé de consultation. La section de reconnaissance des unités 2024 détermine si  The unit recognition section 2024 determines whether or not the entry exists in the base unit dictionary file 2026 as a result of the search carried out in the base unit dictionary file 2026 (2204) and, if the entry exists, the pointer P advances the Length of the recognized base unit (2208). Consequently, in the case where the basic unit is k, m, s, etc., the pointer P advances by a single character, then positions itself on the next character of the set of characters of consultation key. The 2024 unit recognition section determines whether

un ensemble de caractères partant du caractère sur lequel le poin-  a set of characters starting from the character on which the point-

teur P est positionné est ou non encore présent (2208). Dans le cas o un tel ensemble de caractères est encore présent, le programme revient à l'étape 2202, o le fichier dictionnaire d'unités de base  P P is positioned or not yet present (2208). In the case where such a set of characters is still present, the program returns to step 2202, o the dictionary file of basic units

2026 est de nouveau consulté relativement à l'ensemble de carac-  2026 is again consulted in relation to the character set

tères qui part du caractère pour lequel le pointeur P est posi-  tères which starts from the character for which the pointer P is posi-

tionné. Ensuite, la section décide si la rubrique d'entrée existe ou non dans l'unité de base (2204) en résultat de la recherche effectuée dans le fichier dictionnaire d'unités de base 2026 et, si l'entrée est présente, le pointeur P avance de la longueur de l'unité  tionné. Then, the section decides whether the entry item exists or not in the base unit (2204) as a result of the search carried out in the dictionary file of base units 2026 and, if the entry is present, the pointer P advance the length of the unit

de base reconnue.recognized base.

avance de la longueur de l'unité de base reconnue.  advance the length of the recognized base unit.

A l'étape 2208, si l'ensemble de caractères partant du  In step 2208, if the set of characters starting from

caractère pour lequel le pointeur P est positionné n'est plus pré-  character for which the pointer P is positioned is no longer pre-

sent, la recherche dans le fichier dictionnaire d'unités de base  sent, the search in the dictionary file of basic units

2026 prend fin, c'est-à-dire que la reconnaissance de l'unité com-  2026 comes to an end, i.e. the recognition of unity

posée a été effectuée avec succès.  was successfully completed.

Par exemple, dans le cas o l'ensemble de caractères de clé de consultation déLivré à la section de reconnaissance d'unités 2024 est km/s, ce qui représente une unité, l'entrée n'est pas présente dans le fichier dictionnaire d'unités de base 2026, puisque km/s est lui-même une unité complexe. Ainsi, le pointeur P est d'abord placé sur k (2200), et k est retrouvé dans le fichier dictionnaire d'unités de base 2026 pour confirmer la présence de  For example, in the case where the set of consultation key characters delivered to the unit recognition section 2024 is km / s, which represents a unit, the entry is not present in the dictionary file d 'base units 2026, since km / s is itself a complex unit. Thus, the pointer P is first placed on k (2200), and k is found in the dictionary of base units 2026 to confirm the presence of

l'entrée (2202).the entrance (2202).

Ensuite, le pointeur est positionné sur m (2206), et m est retrouvé dans le fichier dictionnaire d'unités de base 2026  Then, the pointer is positioned on m (2206), and m is found in the base unit dictionary file 2026

(2202) pour confirmer la présence de l'entrée, de la même manière.  (2202) to confirm the presence of the entry, in the same way.

Puisque la section de reconnaissance d'unités 2024 considère la barre oblique (/), le point (.), etc., comme faisant partie de l'unité, le pointeur se positionne ensuite sur le s en sautant le symbole "/" de km/s (2206). Alors, s est retrouvé dans le fichier dictionnaire d'unités de base 2026 pour confirmer la présence de  Since the 2024 unit recognition section considers the forward slash (/), period (.), Etc. as part of the unit, the pointer then positions itself on the s by jumping the "/" symbol from km / s (2206). So, s was found in the base unit dictionary file 2026 to confirm the presence of

l'entrée, de la même manière, (2202). En résultat, puisque la pré-  the entrance, in the same way, (2202). As a result, since the pre-

sence est confirmée pour chacun des caractères k, m et s lors de la recherche dans le fichier dictionnaire d'unités fondamentales 2026, il est décidé que km/s est un ensemble de caractères exprimant une unité. De cette manière, dans le cas o des rubriques d'entrée existent dans le fichier dictionnaire d'unités de base 2026 pour tous les caractères constituant l'ensemble de caractères de c Lé de consultation, ou bien dans le cas o des rubriques d'entrée existent dans la fichier dictionnaire d'unités fondamentales 2026 pour tous les caractères sauf les symboles tels que la barre oblique et le point, etc., qui sont considérés comme faisant partie de l'unité, il est déterminé que l'ensemble de caractères de clé  sence is confirmed for each of the characters k, m and s during the search in the dictionary file of fundamental units 2026, it is decided that km / s is a set of characters expressing a unit. In this way, in the case where entry headings exist in the base unit dictionary file 2026 for all the characters constituting the set of characters of the consultation line, or else in the case of headings entry exists in the basic unit dictionary file 2026 for all characters except symbols such as slash and period, etc. which are considered part of the unit, it is determined that the character set of key

de consultation est un ensemble de caractères qui exprime l'unité.  consultation is a set of characters that express unity.

Lorsque la section de reconnaissance d'unités 2024 a achevé de consulter le fichier dictionnaire d'unités de base 2026  When the 2024 unit recognition section has finished consulting the 2026 base unit dictionary file

et réussi à reconnaître l'unité composée, elle délivre l'informa-  and succeeded in recognizing the compound unity, it delivers information

tion d'unité ainsi obtenu à la section de traitement 2016, pour l'emmagasiner dans la table de mise en réserve d'information de dictionnaire 2016a (2210). La reconnaissance des unités est donc terminée. A l'étape 2204, si aucune entrée n'est présente dans le fichier dictionnaire d'unités de base 2026 en résultat de la  tion unit thus obtained in the processing section 2016, to store it in the dictionary information storage table 2016a (2210). The recognition of the units is therefore over. In step 2204, if no entry is present in the base unit dictionary file 2026 as a result of the

2 6 0 4 8 1 42 6 0 4 8 1 4

recherche dans le fichier dictionnaire d'unités de base 2026 pour  search in the 2026 base unit dictionary file for

l'ensemble de caractères partant du caractère sur lequeL Le poin-  the set of characters starting from the character on which the point

teur P est positionné, ceci signifie que l'ensemble de caractères ne peut pas être reconnue comme une unité de base ou une unité composée. Ainsi, la section de reconnaissance d'unité 2024 envoie une information pour indiquer que l'ensemble de caractères est un  tor P is set, this means that the character set cannot be recognized as a basic unit or a composite unit. Thus, the unit recognition section 2024 sends information to indicate that the character set is a

mot non enregistré dans le dictionnaire, c'est-à-dire une informa-  word not registered in the dictionary, that is to say an informa-

tion indiquant que le mot n'exprime pas une unité, à destination de la section de traitement 2016, cette information étant mise en  tion indicating that the word does not express a unit, intended for the processing section 2016, this information being put in

réserve dans la table de mise en réserve d'information de diction-  reserve in the diction information reserve table-

naire 2016a de La section de traitement 2016, ce qui met fin à  naire 2016a of The treatment section 2016, which puts an end to

l'opération de reconnaissance des unités.  the unit recognition operation.

On se reporte maintenant à la figure 15. Lorsque la reconnaissance des unités (2112) a pris fin, le programme revient à l'étape 2101 et une coupure visant à isoler l'unité de référence du dictionnaire est de nouveau effectuée par la section de traitement 2016. Apres la coupure de L'unité de référence du dictionnaire, la section de traitement 2016 détermine si l'unité isolée est ou non encore présente (2104) et, si l'unité isolée, c'est-à-dire un  Referring now to FIG. 15. When the recognition of the units (2112) has ended, the program returns to step 2101 and a cut-out intended to isolate the reference unit from the dictionary is again carried out by the section of processing 2016. After cutting the reference unit from the dictionary, the processing section 2016 determines whether or not the isolated unit is still present (2104) and, if the isolated unit, i.e. a

ensemble de caractères de cLé de consultation, n'est plus pré-  set of consultation key characters, is no longer pre-

sente, elle délivre l'information emmagasinée dans la table de mise en réserve d'information de dictionnaire 2016a au dispositif de  smells, it delivers the information stored in the dictionary information storage table 2016a to the

sortie par l'intermédiaire de l'interface de sortie 2018 (2114).  output via the 2018 output interface (2114).

L'analyse de la phrase d'entrée a donc été effectuée.  Analysis of the input sentence was therefore carried out.

Comme décrit ci-dessus selon ce mode de réalisation, la phrase d'anglais fournie en entrée est divisée en ensembles de caractères de cl é deconsultation et est d'abord recherchée dans un fichier dictionnaire ordinaire 2022 et, s'il n'existe aucune rubrique d'entrée correspondante dans le fichier dictionnaire 2022, il est effectué une reconnaissance d'unités. Dans la reconnaissance d'unités, l'ensemble de caractères de cLé de consultation est divisé et repéré par le pointeur P, et le fichier dictionnaire des unités de base 2026 est consulté pour chacun des ensembles de caractères divisés. Ensuite, ceux qui sont enregistrés dans le fichier dictionnaire d'unités fondamentales 2026 ou bien ceux qui sont composés d'une succession d'ensembles enregistrés dans le fichier dictionnaire d'unités fondamentales 2026 sont déterminés  As described above according to this embodiment, the English sentence supplied as input is divided into sets of key characters for consultation and is first searched for in an ordinary dictionary file 2022 and, if there is no corresponding entry item in the 2022 dictionary file, units are recognized. In unit recognition, the set of consultation key characters is divided and identified by the pointer P, and the dictionary file of the basic units 2026 is consulted for each of the divided character sets. Then, those which are recorded in the dictionary file of fundamental units 2026 or those which are composed of a succession of sets recorded in the dictionary file of fundamental units 2026 are determined.

comme étant des ensembles de caractères exprimant des unités.  as sets of characters expressing units.

Ainsi, puisqu'il est possible d'effectuer une reconnais-  Since it is possible to recognize

sance d'unités même pour un ensembles de caractères exprimant une unité complexe en combinant des unités de base emmagasinées dans le fichier dictionnaire d'unités de base 2026, on peut effectuer une analyse correspondant à l'expression multiforme des unités. De plus, puisqu'il suffit que le fichier dictionnaire d'unités de base 2026 emmagasine des unités de base, par exemple k, m, s, etc., et qu'il n'est pas besoin d'emmagasiner des unités complexes composées à partir de combinaisons d'unités de base, par exemple km, km/s, etc., il est possible de réduire la capacité du  sance of units even for a set of characters expressing a complex unit by combining basic units stored in the basic unit dictionary file 2026, an analysis corresponding to the multiform expression of the units can be performed. In addition, since it suffices that the base unit dictionary file 2026 stores basic units, for example k, m, s, etc., and that there is no need to store complex compound units from combinations of basic units, for example km, km / s, etc., it is possible to reduce the capacity of the

fichier dictionnaire.dictionary file.

26 0 4 8 1 426 0 4 8 1 4

Le troisième mode de réalisation va maintenant être expliqué. La figure 18 iLlustre la structure générale du troisième mode de réalisation, dans lequel l'analyse de Langage selon l'invention est appliqué à un dispositif de traduction automatique anglais-japonais. Ce mode de réalisation comprend une section d'entrée 3010, par laquelle un texte d'anglais 3012 à traduire en japonais est introduit. La section d'entrée 3010 peut comporter par exemple un clavier possédant des touches de caractères, par exemple des touches alphanumériques, ou des touches de fonction, un lecteur optique de caractères (OCR) permettant de lire le texte d'anglais enregistré sur une feuille de papier et, ou bien, un dispositif de mémoire à fichier permettant de lire le texte d'anglais enregistré  The third embodiment will now be explained. FIG. 18 illustrates the general structure of the third embodiment, in which the language analysis according to the invention is applied to an English-Japanese automatic translation device. This embodiment includes an input section 3010, through which an English text 3012 to be translated into Japanese is introduced. The input section 3010 can comprise, for example, a keyboard having character keys, for example alphanumeric keys, or function keys, an optical character reader (OCR) making it possible to read the English text recorded on a sheet. paper and / or a file memory device for reading the recorded English text

sur un support de mémoire, par exemple un disque magnétique.  on a memory medium, for example a magnetic disc.

Le texte d'anglais introduit par la section d'entrée 3010 est lu et fourni à une section de pré-mise en forme 3014 o un pré-traitement est effectué en vue de la traduction. Dans ce cas, la reconnaissance de la phrase et le traitement de mots inconnus y sont principalement effectués. Elle fonctionne de manière à faire  The English text introduced by the input section 3010 is read and supplied to a pre-formatting section 3014 where pre-processing is carried out for translation. In this case, the recognition of the sentence and the processing of unknown words are mainly carried out there. It works in such a way as to

une partie de l'analyse morphologique.  part of the morphological analysis.

Les données d'anglais issues de la pré-mise en forme sont transférées à une section 3016 d'analyse morphologique en même temps que l'information obtenue lors de la pré-mise en  The English data from the pre-layout is transferred to a section 3016 of morphological analysis at the same time as the information obtained during the pre-layout.

forme. La section 3016 d'analyse morphologique analyse morphologi-  form. Section 3016 Morphological Analysis Morphological Analysis

quement la chaîne de la phrase d'anglais et la divise en effec-  only the English sentence chain and divides it into effect

tuant une consultation d'un dictionnaire de mots 3018, effectue divers agencements tels qu'un traitement des mots inconnus, des noms propres, des expressions du temps, des nombres, etc., et effectue un traitement de la phrase dans son ensemble, tel qu'une reconnaissance de l'interrogation redondante etune reconnaissance de l'apposition. Les règles d'analyse miorphologique sont  killing a consultation of a dictionary of words 3018, performs various arrangements such as a processing of unknown words, proper names, expressions of time, numbers, etc., and performs a processing of the sentence as a whole, such recognition of the redundant interrogation and recognition of the apposition. The rules for miorphological analysis are

emmagasinées dans un fichier de règles d'analyse 3036.  stored in an analysis rules file 3036.

Les données d'anglais obtenues après l'analyse morpholo-  English data obtained after morpholo-

gique sont transférées dans une section I d'analyse 3020 en même temps que l'information de dictionnaire obtenu à la suite de L'analyse morphologique. La section I d'analyse 3020 est une section fonctionnelle qui analyse la structure de lacouche de surface relative à la phrase en appliquant des règles grammaticales aux données d'anglais afin  gics are transferred to an analysis section I 3020 at the same time as the dictionary information obtained following the morphological analysis. Analysis section 3020 is a functional section that analyzes the structure of the sentence-related surface layer by applying grammatical rules to English data in order to

de découvrir toutes les possibilités concernant la structure.  to discover all the possibilities concerning the structure.

Les données d'anglais qui sont soumises à l'analyse dans la section I d'analyse 3020 sont transférées dans une section II d'analyse 3022 en même temps que l'information obtenue par l'analyse. Dans cette section, une solution est  The English data which is submitted for analysis in analysis section I 3020 is transferred to analysis section II 3022 together with the information obtained by the analysis. In this section, a solution is

choisie grâce à l'application d'une description structurelle repo-  chosen thanks to the application of a structural description repo-

sant sur le résultat de l'analyse relative à la struc-  on the result of the analysis relating to the structure

ture de la couche de surface effectuée par la section I d'analyse syntaxique, grâce à quoi un arbre d'analyse plausible de la phrase d'anglais est préparé de manière à en former la structure. Ces règles d'analyse sont également  ture of the surface layer carried out by section I of syntactic analysis, thanks to which a plausible tree of analysis of the English sentence is prepared so as to form its structure. These analysis rules are also

emmagasinées dans le fichier de règles d'analyse 3036.  stored in analysis rules file 3036.

Les données d'anglais soumises à l'analyse sont trans-  English data submitted for analysis is trans-

férées dans une section 3024 de transformation de structure en même temps que les données relatives à l'arbre d'analyse. La section de transformation de structure 3024 prépare un arbre de structure pour  fées in a section 3024 of structural transformation at the same time as the data relating to the analysis tree. The structure transformation section 3024 prepares a structure tree for

une phrase de japonais correspondante à partir de l'arbre de struc-  a corresponding Japanese phrase from the struc-

ture, qui constitue une structure intermédiaire de la phrase  ture, which constitutes an intermediate structure of the sentence

d'anglais, afin de transformer la phrase de japonais en une struc-  of English, in order to transform the sentence from Japanese into a struc-

ture sous-jacente par rapport à la langue japonaise, à partir de laquelle on peut facilement obtenir une phrase de traduction en japonais. Les données d'arbre de structure indiquant la structure  underlying ture compared to the Japanese language, from which one can easily obtain a Japanese translation sentence. Structure tree data indicating structure

sous-jacente en japonais qui ont ainsi été transformées sont déli-  underlying in Japanese which have thus been transformed are deli-

vrées à une section de formation de traduction 3026, o la phrase  vrees to a translation training section 3026, where the sentence

traduite est formée. Il s'agit d'une section fonctionnelle permet-  translated is formed. This is a functional section allowing

tant de former une phrase en japonais à partir de la structure de  so much to form a sentence in Japanese from the structure of

l'arbre de structure de la phrase en japonais.  the sentence structure tree in Japanese.

Les données de la phrase en japonais qui sont préparées sous forme d'une phrase traduite, c'est-à-dire les données  Japanese sentence data that is prepared as a translated sentence, i.e. data

2 6 0 4 8 1 42 6 0 4 8 1 4

traduites, sont envoyées à une section de post-mise en forme 3030.  translated, are sent to a post-shaping section 3030.

La section de post-mise en forme 3030 modifie Les données de tra-  The post-shaping section 3030 modifies the work data.

duction en recherchant dans un dictionnaire 3018 sur La base des informations utilisées dans le traitement de traduction pour arriver finalement à une phrase de japonais plus naturelle. Les données relatives à la phrase de japonais sont transférées dans une section de sortie 3032 et sont délivrés par cette dernière sous forme d'une phrase traduite en japonais 3034. La section de sortie 3032 comporte par exemple une imprimante, un afficheur et, ou bien,  duction by searching in a dictionary 3018 on the basis of the information used in the translation processing to finally arrive at a more natural Japanese sentence. Data relating to the Japanese sentence is transferred to an output section 3032 and is delivered by the latter in the form of a sentence translated into Japanese 3034. The output section 3032 comprises for example a printer, a display and, or ,

un dispositif de mémoire à fichier, par exemple un disque magné-  a file memory device, for example a magnetic disc

tique. Le déroulement de la série des opérations de traitement de traduction est commandé par une section de commande 3038, qui  tick. The sequence of the translation processing operations is controlled by a control section 3038, which

gouverne la commande du dispositif dans son ensemble.  governs the control of the device as a whole.

Dans ce mode de réalisation, le dictionnaire de mots 3018 emmagasine des données de dictionnaire, ou données lexicologiques, pour les mots d'anglais et de japonais, mais il fournit diverses informations telles que des relations de connexion, à savoir des relations de coexistence, des sens, la forme du pluriel ou la forme du singulier, les parties de discours, etc., en plus des mots de  In this embodiment, the word dictionary 3018 stores dictionary data, or lexicological data, for English and Japanese words, but it provides various information such as connection relationships, namely coexistence relationships, meanings, plural form or singular form, parts of speech, etc., in addition to the words of

vocabulaire. En outre, le fichier de règles d'analyse 3036 emmaga-  vocabulary. In addition, the analysis rule file 3036 stores

sine des données de règles pour l'analyse morphologique et l'analyse syntaxique. La section de commande 3038 est connectée à une section d'affichage d'opérations 3040. La section d'affichage d'opérations 3040 comporte par exemple des touches d'opération, comme par exemple des touches d'indication de traduction ou des touches de  sine rule data for morphological analysis and syntactic analysis. The control section 3038 is connected to an operation display section 3040. The operation display section 3040 includes, for example, operation keys, such as, for example, translation indication keys or

curseur, par lesquelles l'opérateur peut donner diverses instruc-  cursor, by which the operator can give various instructions

tions au dispositif de l'invention, un afficheur ou un indicateur indiquant visuellement le texte d'anglais introduit, la phrase de  the device of the invention, a display or an indicator visually indicating the English text entered, the sentence of

japonais qui est le résultat de la traduction, des données inter-  Japanese which is the result of translation, inter-

médiaires telles que des informations du dictionnaire, ou informa-  mediators such as dictionary information, or informa-

tions lexicologiques, etc., ainsi que diverses indications des-  lexicological information, etc., as well as various indications of-

tinées à l'opérateur. Un grand nombre de ces opérations indiquant des fonctions peuvent être ainsi constituées qu'elles sont incluses  to the operator. Many of these operations indicating functions can be so constituted that they are included

260 4814260 4814

dans un clavier, s'il en est disposé un pour la section d'entrée 3010, ou bien apparaissent sur un afficheur, s'il en est disposé un  in a keyboard, if one is arranged for the input section 3010, or else appear on a display, if one is arranged

dans la section de sortie 3032.in outlet section 3032.

On se reporte à la figure 17. Elle montre un exempLe de structures détaillées relatives au traitement des nombres dans la  Reference is made to FIG. 17. It shows an example of detailed structures relating to the processing of numbers in the

section 3016 d'analyse morphologique. La section d'analyse morpholo-  section 3016 of morphological analysis. The morpholo-

gique 3016 comprend naturellement d'autres sections fonctionnelles d'analyse, mais les sections qui concernent plus directement la compréhension de l'invention vont être illustrées présentement. L'analyse morphologique s'effectue par le fait qu'il est donné instruction de rechecheher dans le dictionnaire en commençant par la tête de l'ensemble de caractères d'entrée et  gique 3016 naturally includes other functional analysis sections, but the sections which relate more directly to the understanding of the invention will be illustrated below. Morphological analysis is performed by the fact that it is given instruction to search in the dictionary starting with the head of the set of input characters and

en procédant successivement en relation avec l'ensemble de carac-  by proceeding successively in relation to the character set

tères de la clé de recherche, ou clé de consultation, et par le fait que le traitement de l'information lexicologique obtenue de  search key, or consultation key, and by the fact that the processing of lexicological information obtained from

la part de la section de consultation de dictionnaire 3104 est exé-  the part of the dictionary consultation section 3104 is exe

cuté en fonction d'un drapeau numérique qui sera décrit ci-après.  cut according to a digital flag which will be described below.

La section d'analyse morphologique 3016  Morphological analysis section 3016

comprend une section de traitement d'entrée 3100 destinée à rece-  includes an input processing section 3100 for receiving

voir et à traiter les données relatives à l'ensemble de caractères d'entrée qui proviennent de la section de pré-traitement 3014. La section de traitement d'entrée 3100 est dotée d'un tampon d'ensemble de caractères d'entrée qui reçoit en entrée les données de l'ensemble de caractères d'anglais sous la forme d'une donnée de code, par exemple le code ASCII, et elle emmagasine temporairement  view and process input character set data from the pre-processing section 3014. The input processing section 3100 has an input character set buffer which receives as input the data of the English character set in the form of a code data, for example the ASCII code, and it stores temporarily

les données de l'ensemble de caractères.  the character set data.

Les données d'ensemble de caractères d'entrée qui sont temporairement emmagasinées dans la section de traitement d'entrée 3100 sont envoyées à une section de découpage, ou d'isolation, d'unités 3102 qui découpe les données d'ensemble de caractères d'entrée en unités de consultation du dictionnaire, telles que des  The input character set data which is temporarily stored in the input processing section 3100 is sent to a unit cutting, or isolation section 3102 which cuts the character set data d entry into dictionary lookup units, such as

mots. La section 3102 de découpage d'unités est une section fonc-  words. The unit cutting section 3102 is a functional section.

tionnelle servant à distinguer les unités de référence du diction-  used to distinguish the reference units from diction-

naire qui constituent un ensemble de caractères de clé de  which constitute a set of key characters of

consultation au moment de la consultation ultérieure du diction-  consultation at the time of the subsequent consultation of the diction-

naire 3018 appartenant à la section 3104 de consultation de dic-  nary 3018 belonging to section 3104 of consultation of dictionary

tionnaire. Le délimiteur de référence du dictionnaire, qui est utiLisé pour découper l'unité de référence du dictionnaire est disposé au niveau de La position d'un caractère d'anglais, d'un os caractère numérique, d'une apostrophe, d'un caractère autre que le trait d'union et le point, aussi bien que de l'apostrophe faisant suite à un caractère de vacance. Ce déLimiteur est emmagasiné dans une table de déLimiteurs 3108 à laquelle on se reporte au moment du découpage de l'unité de référence du dictionnaire dans la section  tionnaire. The dictionary reference delimiter, which is used to cut out the dictionary reference unit, is arranged at the position of an English character, a numeric bone, an apostrophe, a character other than the hyphen and period, as well as the apostrophe following a vacancy character. This delimiter is stored in a delimiter table 3108 to which we refer when cutting the dictionary reference unit in the section

de découpage d'unités 3102.cutting units 3102.

Le dictionnaire de mots 3018 contient, tout particulière-  The dictionary of words 3018 contains, very particular-

ment, l'information associée à la recherche de l'unité de décou-  the information associated with the search for the discovery unit

page. Comme représenté par l'exemple de l'information de rubrique d'entrée de la figure 24, l'emmagasinage a lieu pour la rubrique  page. As shown in the example of the entry item information in Figure 24, storage takes place for the item

d'entrée relative à chacune des unités de référence du diction-  input relating to each of the diction reference units-

naire, à savoir Les mots, les informations grammaticales telles que parties de discours, ainsi qu'indications de distinction montrant qu'un mot représente un nombre, c'est-à-dire un drapeau de nombre,  nary, namely words, grammatical information such as parts of speech, as well as indications of distinction showing that a word represents a number, that is to say a flag of number,

et une information de valeur numérique indiquant la valeur numé-  and digital value information indicating the digital value

rique relative à un mot indiquant un nombre.  risk relating to a word indicating a number.

Comme représenté sur la figure, les formes du singulier et du pluriel sont toutes deux décrites en même temps que chacune  As shown in the figure, both the singular and plural forms are described together with each

des entrées du dictionnaire de mots 3018, et chacune d'elles cons-  entries from the dictionary of words 3018, each of which

titue une entrée particulière.tituates a particular entry.

Le drapeau de nombre indique qu'un mot signifie un nombre lorsque "1" est positionné à cet effet. Comme autres informations,  The number flag indicates that a word means a number when "1" is set for this purpose. Like other information,

on trouve par exemple le caractère de comptabilité ou de non-  we find for example the character of accounting or non

comptabilité d'un nom, l'identification relative à la transitivité ou à la non-transitivité d'un verbe, les mots traduits, etc. Si l'on se reporte par exemple à "thousand (mille)", puisqu'il  accounting of a name, identification relating to the transitivity or non-transitivity of a verb, translated words, etc. If we refer for example to "thousand (thousand)", since

s'agit d'un nom représentant un nombre, le drapeau numérique asso-  is a name representing a number, the associated digital flag

cié est "1" et la valeur numérique "1000". De plus, si l'on se rapporte à "thread (filet)", puisqu'il s'agit d'un nom, mais non d'un nom de nombre, c'est-à-dire d'un nombre, le drapeau numérique  cie is "1" and the numeric value "1000". In addition, if we refer to "thread (filet)", since it is a name, but not a number name, that is to say a number, the digital flag

est enregistré sous la forme "0".is saved as "0".

La reconnaissance d'un nombre est effectuée à L'aide du  The recognition of a number is carried out using the

drapeau numérique associé dans le cas o il s'agit d'un mot enre-  associated digital flag in case it is a word rec-

gistré dans Le dictionnaire 3018, par exemple comme "one (un)" ou "thousand (miLLe)". Même les mots non enregistrés, comme par exemple une succession de caractères numériques telle que "123", deux groupes successifs de chiffres séparés par un point numérique (en anglais, mais en français, il s'agit d'une virgule numérique)  stored in the 3018 dictionary, for example as "one (one)" or "thousand (miLLe)". Even unregistered words, such as a succession of numeric characters such as "123", two successive groups of numbers separated by a numeric dot (in English, but in French, it is a numeric comma)

par exemple un petit nombre tel que "10.2 (10,2)", et une succes-  for example a small number such as "10.2 (10.2)", and a success

sion de caractères numériques séparés par une virgule numérique (en anglais, mais en français, on emploie un point ou un espace) comme par exemple "1,000,000 (1 000 000)", sont également reconnus  sion of numeric characters separated by a comma (in English, but in French, a dot or a space is used) such as for example "1,000,000 (1,000,000)", are also recognized

comme des nombres. Dans la présente description, l'expression  like numbers. In the present description, the expression

"caractère numérique" comporte habituellement non seulement les chiffres arabes, mais aussi des nombres exprimés en toutes lettres  "numeric character" usually includes not only Arabic numerals, but also numbers expressed in full

comme "thirteen (treize)".like "thirteen (thirteen)".

Comme représenté sur la figure 28, le dictionnaire 3018  As shown in Figure 28, the dictionary 3018

comprend une table de symboles monétaires 3018a, o sont enregis-  includes a table of currency symbols 3018a, where are stored

trés divers symboles de monnaies, une table de symboles de notation 3018b o sont enregistrés des symboles de notation tels que la virgule ",", le point ".", l'espace " ", et une table de signes de ponctuation décimaux 3018c, o sont enregistrés le point décimal "." (respectivement, en français, une virgule décimale), la virgule décimale "," (en français, on laisse un espace ou on emploie un point), etc. Les tables relatives aux symboles de notation ou à la ponctuation décimale sont prévues dans la mesure o on utilise ","  various currency symbols, a notation symbol table 3018b where notation symbols such as the comma ",", the period ".", the space "", and a decimal punctuation mark table 3018c are recorded, where the decimal point "." (respectively, in French, a decimal point), the decimal point "," (in French, we leave a space or use a period), etc. The tables relating to notation symbols or decimal punctuation are provided to the extent that ","

comme symbole de notation ou bien on utilise "." comme point déci-  as a notation symbol or else use "." as a deci-

mal en japonais et en anglais, tandis que l'on utilise principale-  poorly in Japanese and English, while we use main-

ment un espace ou bien "." pour la notation symbolique et on uti-  either a space or "." for symbolic notation and we use

lise "," comme point décimal dans d'autres Langues européennes telles que le français ou l'allemand, si bien que l'utilisation des  read "," as a decimal point in other European languages such as French or German, so that the use of

symboles diffère selon la langue à traiter.  symbols differ depending on the language to be treated.

La section 3104 de consultation de dictionnaire est une section fonctionnelle qui découpe l'information du dictionnaire en consultant le dictionnaire de mots 3018 sur la base de l'ensemble de caractères de consultation introduit à partir de la section de  Dictionary lookup section 3104 is a functional section which cuts dictionary information by looking up the word dictionary 3018 based on the set of lookup characters introduced from the lookup section.

2 6 0 48142 6 0 4814

découpage d'unités 3102 et qui transfère celle-ci aux sections de  cutting of units 3102 and which transfers this to the sections of

traitement 3110, 3112 et 3116.processing 3110, 3112 and 3116.

L'agencement de La succession des caractères numériques est effectué à l'aide des deux traitements suivants. En premier  The arrangement of the succession of numeric characters is carried out using the following two treatments. First

lieu, si un mot est reconnu comme étant un nombre, de la façon ci-  place, if a word is recognized as a number, as follows

dessus indiquée, alors, lorsque l'unité de référence du diction-  above indicated, then, when the reference unit of diction-

naire suivante à laquelle on se reporte est également reconnue comme étant un nombre, ils sont collectivement disposés de manière qu'on puisse les synthétiser en un unique nombre. L'opération se répète aussi longtemps que des nombres se succèdent. Par exemple, "30 thousand (mille) " est transformé en "30 000" et "1.5 million (1,5 millions)" est transformé en "1 500 000". Ensuite, lorsque  The next year to which we refer is also recognized as a number, they are collectively arranged so that they can be synthesized into a single number. The operation is repeated as long as numbers follow one another. For example, "30 thousand (thousand)" is changed to "30,000" and "1.5 million (1.5 million)" is changed to "1,500,000". Then when

l'expression numérique se poursuit toujours au moyen de l'interpo-  digital expression always continues by means of the interpo-

sition de "and (et)", si tous les chiffres se trouvant à gauche de "and" qui correspondent à chacun des chiffres de valeurs numériques indiquées par le pointeur à droite de "and" sont des "zéros", dans  sition of "and (and)", if all the digits to the left of "and" which correspond to each of the digits of numerical values indicated by the pointer to the right of "and" are "zeros", in

le but de donner le sens de l'expression numérique, ils sont syn-  the purpose of making sense of the digital expression they are syn-

thétisés en un seul nombre. Par exemple, "one hundred and thirty (cent et trente)" est synthétisé en "130", tandis que "30 thousand and two hundred (30 mille et deux cents)" est synthétisé en  thetized in a single number. For example, "one hundred and thirty (hundred and thirty)" is synthesized in "130", while "30 thousand and two hundred (30 thousand and two hundred)" is synthesized in

"30 200"."30,200".

Après la reconnaissance d'un tel nombre, il est effectué en outre une analyse locale nécessaire. Au cours de cette opération, une série d'unités d'analyse activées par l'information d'activation de morphème pour chacune des unités d'analyse est collectivement agencée en une seule unité d'analyse sur la base d'une règle d'analyse locale. Par exemple, un symbole monétaire et une valeur numérique, à savoir "41,000", sont collectivement agencés sous la forme "1 000 yen", tandis qu'une valeur numérique et une unité, à savoir  After the recognition of such a number, a necessary local analysis is also carried out. During this operation, a series of analysis units activated by the morpheme activation information for each of the analysis units is collectively arranged in a single analysis unit on the basis of a rule of local analysis. For example, a currency symbol and a numeric value, namely "41,000", are collectively arranged in the form "1,000 yen", while a numerical value and a unit, namely

"1.5 km", sont collectivement agencées sous la forme "1.5 kilo-  "1.5 km", are collectively arranged in the form "1.5 kilo-

meter (1,5 kilomètres)".meter (1.5 kilometers) ".

Ces arrangements sont effectués dans les sections de traitement 3110 à 3122. La section de traitement 3110 est une section fonctionnelle servant à collectivement agencer un nombre avec un symbole monétaire ou une unité. La section de traitement 3112 est une section fonctionnelle effectuant la mise sous forme numérique du nombre. De plus, la section de traitement 3114 est une section fonctionnelle servant à traiter les nombres reliés par un trait d'union. De plus, la section de traitement 3116 est une section fonctionnelle servant à traiter les caractères numériques  These arrangements are made in processing sections 3110 to 3122. Processing section 3110 is a functional section used to collectively arrange a number with a currency symbol or a unit. The processing section 3112 is a functional section performing the numerical form of the number. In addition, processing section 3114 is a functional section for processing numbers linked by a hyphen. In addition, processing section 3116 is a functional section for processing numeric characters.

se succédant.succeeding each other.

Eu égard au nombre obtenu après l'agencement avec un symbole monétaire ou une unité, l'agencement du symbole monétaire et de la valeur numérique en un unique nom est effectué dans la section de traitement 3118. De plus, l'agencement de l'unité et de la valeur numérique en un unique nom est effectué dans la section de traitement 3120. De plus, dans le cas d'un nombre qui a été soumis à un traitement de mise sous forme numérique, d'un nombre lié par un ou plusieurs traits d'union et d'un nombre continu, le traitement d'agencement avec la valeur numérique précédente est  With regard to the number obtained after arrangement with a currency symbol or a unit, the arrangement of the currency symbol and the numerical value into a single name is performed in the processing section 3118. In addition, the arrangement of the unit and numeric value in a single name is done in processing section 3120. In addition, in the case of a number that has been subjected to numeric processing, a number linked by one or several hyphens and a continuous number, the arrangement processing with the previous numeric value is

effectué dans la section de traitement 3122. L'information lexico-  performed in processing section 3122. Lexical information

logique relative à l'ensemble de caractères introduit qui a finale-  logic relating to the introduced character set which has final-

ment été traité à l'aide de ce processus est emmagasinée dans le tampon d'information lexicologique triée, à savoir la table de mise  If it has been processed using this process, it is stored in the sorted lexicological information buffer, namely the bet table.

en réserve d'information lexicologique 3124.  in lexicological information reserve 3124.

Les résultats de l'analyse morphologique sont  The results of the morphological analysis are

transférés de la table de mise en réserve d'information lexicolo-  transferred from the lexicolo- information storage table

gique 3124 à la section I d'analyse 3020.  see 3124 in section I of analysis 3020.

Le traitement par le drapeau numérique est exécuté dans la séquence qui est représentée sur les figures 19A et 19B. Les données relatives à l'ensemble de caractères d'entrée sont reçues dans la section de traitement d'entrée 3100, o un traitement d'entrée est effectué (3200). Ensuite, la section de découpage d'unité 3102 découpe l'ensemble de caractères d'entrée en unité de référence de dictionnaire, ou unités lexicologiques en vue de la  The digital flag processing is performed in the sequence shown in Figures 19A and 19B. Data relating to the input character set is received in the input processing section 3100, where input processing is performed (3200). Next, the unit splitting section 3102 splits the set of input characters into a dictionary reference unit, or lexicological units for the purpose of

consultation du dictionnaire 3018 (3201). La section 3104 de con-  consultation of the dictionary 3018 (3201). Section 3104 of con-

sultation du dictionnaire effectue une opération de recherchedans le dictionnaire 3018 en relation avec ces données (3203) et, s'il existe une rubrique d'entrée du dictionnaire (3204), elle examine le drapeau numérique (3205). Si le drapeau numérique n'est pas positionné, puisque le mot n'est pas un nombre, L'information du dictionnaire, ou information Lexicologique, est stockée dans la table de mise en réserve d'information lexicologique (3124). Si "1" a été positionné dans le drapeau numérique, le nombre est numérisé,  Dictionary Lookup performs a search operation in dictionary 3018 in relation to this data (3203) and, if there is a dictionary entry field (3204), it examines the digital flag (3205). If the digital flag is not positioned, since the word is not a number, the dictionary information, or Lexicological information, is stored in the lexicological information reserve table (3124). If "1" has been set in the digital flag, the number is scanned,

c'est-à-dire mis sous forme numérique, dans la section de traite-  that is to say put in digital form, in the processing section

ment 3112 (3206), et l'agencement collectif 3207 avec la valeur numérique précédente est effectué dans la section de traitement 3122. Lorsque ces opérations ont été effectuées jusqu'à la position finale d'une phrase indiquée par les données de l'ensemble de caractères d'entrée (3202), l'agencement collectif (3209) avec le  3112 (3206), and the collective arrangement 3207 with the preceding numerical value is carried out in the processing section 3122. When these operations have been carried out up to the final position of a sentence indicated by the data of the set of input characters (3202), the collective arrangement (3209) with the

symbole monétaire ou l'unité est effectué dans la section de trai-  currency symbol or unit is made in the processing section

tement 3118, 3120, et le résultat de l'analyse morphologique est finalement déLivré à la section I d'analyse syntaxique  3118, 3120, and the result of the morphological analysis is finally delivered in section I of syntactic analysis

(3210).(3210).

A la suite du report au dictionnaire, lorsqu'il n'existe aucune rubrique d'entrée, à l'étape 3204, et, si l'élément est lié à l'aide d'un trait d'union (3212), le traitement réservé aux nombres liés par des traits d'union (3213) est effectué dans la section de traitement 3114. Si le premier caractère n'est pas un caractère lié par un trait d'union, mais un symbole monétaire (3214), le symbole monétaire seul est mis en réserve dans la table de mise en réserve d'information lexicologique 3124 (3216) et le symbole monétaire est rejeté (3217) de l'unité de référence du  Following the transfer to the dictionary, when there is no entry item, in step 3204, and, if the element is linked using a hyphen (3212), the processing reserved for numbers linked by hyphens (3213) is performed in processing section 3114. If the first character is not a character linked by a hyphen, but a currency symbol (3214), the currency symbol only is placed in reserve in lexicological information storage table 3124 (3216) and the currency symbol is rejected (3217) from the reference unit of the

dictionnaire. Si le premier caractère n'est pas un symbole moné-  dictionary. If the first character is not a mon-

taire (3214), le traitement destiné aux caractères numériques se  shut up (3214), the processing for numeric characters is

suivant 3215 est effectué dans la section de traitement 3116.  next 3215 is performed in processing section 3116.

L'exécution de l'opération se poursuit jusqu'à la position finale  The operation continues until the final position

(3202).(3202).

L'agencement collectif 3209 avec le signal monétaire ou l'unité est effectué dans la section de traitement 3110 suivant l'organigramme de traitement présenté sur la figure 20. Tout d'abord, lors du traitement initial 3220, le pointeur de tête utilisé pour le traitement est positionné sur la tête du tampon. Si l'élément indiqué par le pointeur n'est pas une valeur numérique 3221, le pointeur avance par degrés (3226). Dans le cas o le caractère est une valeur numérique, mais o il n'y a pas auparavant un signal monétaire, ni, à La suite, une unité, le pointeur est également avancé par degrés (3222, 3224). Le traitement se poursuit o5 jusqu'à la position finale de l'unité de référence du dictionnaire  The collective arrangement 3209 with the monetary signal or the unit is carried out in the processing section 3110 according to the processing flow diagram presented in FIG. 20. First, during the initial processing 3220, the head pointer used to the treatment is positioned on the head of the tampon. If the item indicated by the pointer is not a numeric value 3221, the pointer advances by degrees (3226). In the case where the character is a numerical value, but where there is not previously a monetary signal, nor, Thereafter, a unit, the pointer is also advanced by degrees (3222, 3224). Processing continues o5 until the final position of the dictionary reference unit

(3227).(3227).

Si le-caractère est une valeur numérique (3222), le sym-  If the-character is a numeric value (3222), the sym-

bole monétaire et la valeur numérique sont collectivement agencés en un seul nom (3223). Par exemple, le symbole monétaire et le caractère numérique "41,00" est agencé en un unique nom. De plus, si le caractère précédent n'est pas un symbole monétaire et que le caractère suivant est une unité, la valeur numérique et l'unité sont collectivement agencées en un unique nom (3225). Par exemple,  monetary bole and numeric value are collectively arranged in one name (3223). For example, the currency symbol and the numeric character "41.00" is arranged in a single name. Additionally, if the preceding character is not a currency symbol and the following character is a unit, the numeric value and the unit are collectively arranged in a single name (3225). For example,

le caractère numérique et l'unité "1.5 km (1,5 km)" sont collecti-  the numeric character and the unit "1.5 km (1.5 km)" are collectively

vement agencés en un unique nom. Le traitement se poursuit jusqu'à la position finale de l'unité de consultation du dictionnaire  vely arranged in a single name. Processing continues until the final position of the dictionary consultation unit

(3227).(3227).

* Le traitement destiné aux nombres liés par un trait d'union est effectué dans la section de traitement 3114 suivant l'organigramme présenté sur les figures 21A et 21B. Tout d'abord, l'unité de référence du dictionnaire liée par un trait d'union est emmagasinée dans le tampon lors du traitement initial 3230. De plus, la valeur numérique "O"est mise en réserve et le trait d'union contenu dans l'unité de référence du dictionnaire initiale* The processing intended for the numbers linked by a hyphen is carried out in the processing section 3114 according to the flow chart presented in FIGS. 21A and 21B. First, the dictionary reference unit linked by a hyphen is stored in the buffer during initial processing 3230. In addition, the numeric value "O" is put in reserve and the hyphen contained in the reference unit of the initial dictionary

est changé en un espace.is changed to a space.

Ensuite, l'unité de consultation du dictionnaire est  Then, the dictionary consultation unit is

découpée (3231) afin que soit effectuée la consultation du diction-  cut out (3231) so that the diction-

naire (3235). Suite à la consultation du dictionnaire, s'il n'est trouvé aucune rubrique d'entrée, c'est-à-dire si le mot n'est pas enregistré dans le dictionnaire (3236), l'unité de référence du dictionnaire liée par un trait d'union est, dans son ensemble, mise en réserve, comme mot non enregistré dans le dictionnaire, dans la  nary (3235). Following consultation of the dictionary, if no entry item is found, i.e. if the word is not registered in the dictionary (3236), the reference unit of the linked dictionary by a hyphen is, as a whole, put in reserve, as a word not registered in the dictionary, in the

table de mise en réserve d'information lexicologique 3124 (3237).  lexicological information storage table 3124 (3237).

A la suite de la consultation du dictionnaire, s'il est obtenu une rubrique d'entrée (3236), il est vérifié si le drapeau numérique associé est ou non "1". Si le drapeau numérique n'est pas  Following consultation of the dictionary, if an entry item (3236) is obtained, it is checked whether the associated digital flag is "1" or not. If the digital flag is not

"1", cela signifie que Le caractère n'est pas un caractère numé-  "1" means that the character is not a numeric character

rique, et l'unité de référence du dictionnaire liée par un trait d'union est, dans son ensemble, mise en réserve, comme mot non enregistré dans le dictionnaire, dans la table de mise en réserve  risk, and the dictionary reference unit linked by a hyphen is, as a whole, put in reserve, as a word not recorded in the dictionary, in the reserve table

d'information du dictionnaire 3124 (3237).  Information from dictionary 3124 (3237).

Lorsque la valeur "1" a été positionnée dans le drapeau numérique pour la rubrique d'entrée du dictionnaire, la section de traitement 3012 numérise le nombre sur la base des données de la  When the value "1" has been set in the digital flag for the dictionary entry item, the processing section 3012 scans the number based on the data from the

rubrique d'entrée (3239). Ensuite, la valeur numérique ainsi numé-  entry section (3239). Then, the numerical value thus numer-

risée est ajoutée à une valeur numérique mise en réserve au moment considéré (3240), et le résultat de l'addition est mis en réserve  laugh is added to a numeric value stored at the time considered (3240), and the result of the addition is stored

(3241). Ainsi, par exemple "two (deux)" de "twenty-two (trente-  (3241). So, for example "two (two)" of "twenty-two (thirty-

deux)" est ajouté à "3020" venant du "twenty (vingt)" juste avant pour former "3022". Le traitement se poursuit jusqu'à la position  two) "is added to" 3020 "coming from" twenty (twenty) "just before to form" 3022 ". Processing continues until the position

finale de l'unité de consultation du dictionnaire (3232).  final of the dictionary consultation unit (3232).

Lorsqu'il a avancé par degrés jusqu'à la position finale, l'organigramme passe au traitement 3233 à l'étape 3232, et la valeur numérique mise en réserve est transformée en une valeur numérique pour toute l'unité de référence du dictionnaire liée par un trait d'union. Ensuite, l'agencement collectif 3207 de la valeur  When it has advanced by degrees to the final position, the flowchart proceeds to processing 3233 in step 3232, and the numerical value set aside is transformed into a numerical value for the entire reference unit of the linked dictionary with a hyphen. Then the collective arrangement 3207 of the value

numérique avec la valeur numérique précédente est effectué.  numeric with the previous numeric value is performed.

On va maintenant expliquer le traitement 3215 du carac-  We will now explain the treatment 3215 of the character-

tère numérique suivant, qui est exécuté dans la section de traite-  next digital tere, which is executed in the processing section

ment 3116, en relation avec les figures 22A et 22B. Dans cet orga-  ment 3116, in relation to FIGS. 22A and 22B. In this organ-

nigramme, le symbole "=" signifie une substitution. Tout d'abord, il est effectué une initialisation 3250, au cours de laquelle la valeur numérique mise en réserve, soit "val-save", est mise à "O", le paramètre "i" est mis à "1", et le pointeur p est positionné sur le haut de l'ensemble de caractères de l'unité de référence du dictionnaire. Ensuite, il est vérifié si le caractère p indiqué par le  nigram, the symbol "=" means a substitution. First of all, an initialization 3250 is carried out, during which the numerical value placed in reserve, ie "val-save", is set to "O", the parameter "i" is set to "1", and the pointer p is positioned on the top of the character set of the dictionary reference unit. Then it is checked whether the character p indicated by the

pointeur p est un caractère numérique (3251), un caractère de nota-  pointer p is a numeric character (3251), a notar character

tion (3252) ou un point décimal (qui est, en français, une virgule décimale) (3253) et, s'il ne correspond à aucun d'eux, l'ensemble de caractères tout entier est emmagasiné, comme mot non enregistré  tion (3252) or a decimal point (which is, in French, a decimal point) (3253) and, if it does not match any of them, the entire character set is stored, as an unregistered word

dans le dictionnaire, dans La table de mise en réserve d'informa-  in the dictionary, in The information storage table

tion lexicologique 3124 (3255). S'il s'agit d'un point décimal (qui est une virgule décimale en français) (3253), le paramètre "i" est multiplié par 10 (3254), et l'étape 3258 est exécutée. A l'étape 3258, la valeur numérique "num" (*p) du caractère *p est ajoutée à la valeur numérique mise en réserve "val-save" afin de préparer une nouvelle valeur numérique mise en réserve. La valeur numérique  lexicological section 3124 (3255). If it is a decimal point (which is a decimal point in French) (3253), the parameter "i" is multiplied by 10 (3254), and step 3258 is executed. In step 3258, the numerical value "num" (* p) of the character * p is added to the numerical value placed in reserve "val-save" in order to prepare a new numerical value put in reserve. The numerical value

"num" ( p) est une valeur par laquelle le caractère (C p) est consi-  "num" (p) is a value by which the character (C p) is consi-

déré comme une valeur numérique.derived as a numeric value.

A l'étape 3251 ou 3252, si le caractère est un caractère numérique ou un caractère de notation, l'étape 3257 est exécutée. A l'étape 3257, la valeur numérique mise en réserve "val-save" est multipliée par 10, et la valeur numérique "num" (*p) du caractère *  In step 3251 or 3252, if the character is a numeric character or a notation character, step 3257 is executed. In step 3257, the numerical value set aside "val-save" is multiplied by 10, and the numerical value "num" (* p) of the character *

p est ajoutée au résultat pour préparer une nouvelle valeur numé-  p is added to the result to prepare a new numerical value

rique mise en réserve.risk put in reserve.

Après ces opérations, le pointeur avance par degrés (3259) et le processus se répète jusqu'à la position finale de l'unité de référence du dictionnaire (3260). S'il se trouve à la position finale de l'ensemble de caractères, la valeur numérique relative à l'ensemble de caractères tout entier est placée comme valeur numérique mise en réserve (3261), et un agencement collectif  After these operations, the pointer advances by degrees (3259) and the process repeats to the final position of the dictionary reference unit (3260). If it is in the final position of the character set, the numerical value relative to the entire character set is placed as a reserved numeric value (3261), and a collective arrangement

3207 avec la valeur numérique précédente est exécuté dans la sec-  3207 with the previous numerical value is executed in the sec-

tion de traitement 3122. Par cette opération, des caractères numé-  processing operation 3122. By this operation, numeric characters

riques successifs tels que "1,000.5" sont analysés comme corres-  successive risks such as "1,000.5" are analyzed as corresponding

pondant à la valeur numérique "1000.5 (1 000,5)".  corresponding to the numerical value "1000.5 (1000.5)".

L'agencement collectif 3207 avec la valeur numérique précédente esteffectué de la manière suivante dans la section de  Collective arrangement 3207 with the previous numerical value is carried out as follows in the section of

traitement 3122. Tout d'abord, le pointeur de la table du diction-  processing 3122. First, the pointer to the diction-

naire est positionné sur une position précédant l'unité de référence du dictionnaire (3270). S'il n'y a rien à cette position, cela signifie que la première position de la table de mise en réserve indique la valeur numérique, après quoi la valeur numérique  naire is positioned on a position preceding the dictionary reference unit (3270). If there is nothing at this position, it means that the first position of the reserve table indicates the numerical value, after which the numerical value

de l'unité de référence du dictionnaire qui est en cours d'utili-  of the dictionary reference unit that is being used

sation est enregistrée dans la table de mise en réserve du diction-  dation is recorded in the diction reserve table-

naire 3124 (3284). La position enregistrée est La position qui fait suite à la position présentement indiquée pour le pointeur P. Si, à l'étape 3271, un mot est présent à la position précédente, si la rubrique d'entrée indiquée par le pointeur p n'est pas "and (et)" (3272), et si le pointeur p n'indique pas la valeur numérique (3273), la valeur numérique relative à l'unité de référence du dictionnaire en cours d'utilisation est enregistrée à la suite de la position en cours d'utilisation qui est indiquée par le pointeur p dans la table de mise en réserve du dictionnaire 3124 (3284). Par exemple, dans l'exemple "to him two... (à lui deux...)", "two (deux)" est réenregistré comme la valeur numérique "2".  Mayor 3124 (3284). The recorded position is The position which follows the position currently indicated for the pointer P. If, at step 3271, a word is present at the previous position, if the entry item indicated by the pointer p is not not "and (and)" (3272), and if the pointer p does not indicate the numerical value (3273), the numerical value relative to the reference unit of the dictionary in use is recorded following the position in use which is indicated by the pointer p in the reserve table of the dictionary 3124 (3284). For example, in the example "to him two ...", "two (two)" is re-saved as the numeric value "2".

A l'étape 3273, si le pointeur p indique une valeur numé-  In step 3273, if the pointer p indicates a numerical value

rique, la valeur numérique p - v relative à la rubrique d'entrée indiquée par le pointeur p est multipliée par la valeur numérique "v-now" qui est relative à l'unité de référence de dictionnaire en cours d'utilisation afin de former une nouvelle valeur numérique p - v relative à la rubrique d'entrée indiquée par le pointeur p (3274). Dans le cas de "two thousand (deux mille)" par exemple, l'opération "2 x 1 000 = 2 000" est exécutée afin d'agencer en une seule toute l'expression "two thousand (deux mille) ". Ensuite, la position terminale de l'unité de référence de dictionnaire en cours d'utilisation est fixée comme position terminale pour la rubrique  rique, the numerical value p - v relative to the entry item indicated by the pointer p is multiplied by the numerical value "v-now" which is relative to the dictionary reference unit in use in order to form a new numerical value p - v relating to the entry item indicated by the pointer p (3274). In the case of "two thousand (two thousand)" for example, the operation "2 x 1,000 = 2,000" is executed in order to combine the expression "two thousand (two thousand)" into one. Then, the end position of the dictionary reference unit in use is set as the end position for the item

d'entrée du pointeur p, c'est-à-dire la position "p-end" (3282).  input of the pointer p, that is to say the position "p-end" (3282).

A l'étape 3272, si la rubrique d'entrée indiquée par le pointeur p est "and (et)",le pointeur p est transféré à l'unité de consultation de dictionnaire située avant (3275). S'il n'est pas à la position finale (3276) et si c'est une valeur numérique (3277), la valeur numérique "vnow" de l'unité de référence de dictionnaire en cours d'utilisation est produite et est arrondie au chiffre le plus significatif, pour être fixée à une valeur "vl". Si la valeur numérique "v-now" de l'unité de référence de dictionnaire en cours d'utilisation est par exemple "8", "8.1 (8,1)", "98" ou bien "11",  In step 3272, if the entry item indicated by the pointer p is "and (and)", the pointer p is transferred to the dictionary consultation unit located before (3275). If it is not at the final position (3276) and if it is a numeric value (3277), the numerical value "vnow" of the dictionary reference unit in use is produced and is rounded to the most significant figure, to be set to a value "vl". If the numeric value "v-now" of the dictionary reference unit in use is for example "8", "8.1 (8.1)", "98" or "11",

la valeur respective de vl est "10", "10", "100" ou bien "100".  the respective value of vl is "10", "10", "100" or else "100".

2 6 0 4 8 1 42 6 0 4 8 1 4

Ensuite, il est vérifié si l'excédent, ou reste, obtenu en divisant par vl la valeur numérique "p-v" pour la rubrique d'entrée indiquée par le pointeur p, ce que L'on appelera mod (p-v,  Then, it is checked if the excess, or remainder, obtained by dividing by vl the numerical value "p-v" for the entry item indicated by the pointer p, what we will call mod (p-v,

vl), est ou non "O". Si ce n'est pas "0", le pointeur p est incré-  vl), is or is not "O". If it is not "0", the pointer p is incremented

menté (3283), et la valeur numérique relative à l'unité de réfé-  mented (3283), and the numerical value relating to the unit of reference

rence de dictionnaire en cours est enregistrée à la position courante indiquée par le pointeur p dans la table de mise en réserve du dictionnaire 3124 (3284). Dans le cas de "I and two" par  The current dictionary reference is saved at the current position indicated by the pointer p in the dictionary reserve table 3124 (3284). In the case of "I and two" by

exemple, "two" est réenregistré sous la forme de la valeur numéri-  example, "two" is re-stored as the numeric value

que "2".than "2".

Si l'excédent est "0" à l'étape 3279, la valeur numérique "v-now" relative à l'unité de référence de dictionnaire en cours d'utilisation est ajoutée à la valeur numérique "p - v" relative à la rubrique d'entrée indiquée par le pointeur p pour former une nouvelle valeur numérique "p - v" relative à l'entrée indiquée par le pointeur p (3280). Dans le cas de "two thousand and two (deux mille et deux)" par exemple, "two thousand (deux mille)" est déjà arrangé sous la forme "2 000" à ce stade. Ensuite, il est ajouté  If the excess is "0" in step 3279, the numerical value "v-now" relative to the dictionary reference unit in use is added to the numerical value "p - v" relative to the entry item indicated by the pointer p to form a new numeric value "p - v" relative to the entry indicated by the pointer p (3280). In the case of "two thousand and two (two thousand and two)" for example, "two thousand (two thousand)" is already arranged in the form "2000" at this point. Then it is added

avec le "2" de "two" par l'addition 3200 de façon à agencer collec-  with the "2" of "two" by the addition 3200 so as to arrange collectively

tivement toute la partie sous la forme "2002". Ensuite, l'informa-  the whole part in the form "2002". Then the informa-

tion "and (et)" indiquée par le pointeur p+l est rejetée de la  tion "and (and)" indicated by the pointer p + l is rejected from the

table de mise en réserve d'information 3124 (3281) et l'organi-  information storage table 3124 (3281) and the organization

gramme passe à l'étape 3282.gram goes to step 3282.

On va maintenant présenté des explications en relation  We will now present explanations in relation

avec un exemple. Lorsque la consultation du dictionnaire est effec-  with an example. When the dictionary consultation is carried out

tuée par exemple pour l'ensemble de caractères d'entrée "to him two thousand and twenty-two... (à lui deux mille et vingt-deux...)", comme indiqué sur la figure 25, l'information de la rubrique d'entrée du dictionnaire est inscrite dans la table de mise en réserve d'information du dictionnaire 3124, comme représenté sur la figure 26A. Pour "him (lui) " par exemple, la position de départ est "4", la position finale est "6", et la partie de discours est un pronom. Pendant le traitement numérique, il est d'abord décidé en ce qui concerne "two (deux)" que le drapeau numérique est "1"  killed for example for the set of input characters "to him two thousand and twenty-two ... (to him two thousand and twenty-two ...)", as shown in figure 25, the information of the dictionary entry item is entered in the dictionary information storage table 3124, as shown in FIG. 26A. For "him (him)" for example, the starting position is "4", the final position is "6", and the speech part is a pronoun. During digital processing, it is first decided with regard to "two (two)" that the digital flag is "1"

(3205) et que la valeur numérique est donc "2". Puisque le carac-  (3205) and that the numerical value is therefore "2". Since the character-

tère qui précède "two (deux)" dans cet ensemble de caractères n'est pas une valeur numérique, il est emmagasiné directement dans la  tère preceding "two (deux)" in this set of characters is not a numeric value, it is stored directly in the

table 3124 (3206, 3208, 3284).table 3124 (3206, 3208, 3284).

Ensuite, le pointeur est incrémenté afin de passer au S05 traitement de "thousand (mille)". Le drapeau numérique est "1" et la valeur numérique est "1000" (3205, 3206). De plus, puisque la valeur numérique du caractère précédent est "2" (3207, 3273), la multiplication 2x1000 est exécutée (3274), et son résultat est emmagasiné dans la table 3124 (voir la figure 26B). Ensuite, pour  Then, the pointer is incremented in order to pass to S05 processing of "thousand (thousand)". The digital flag is "1" and the numeric value is "1000" (3205, 3206). In addition, since the numeric value of the previous character is "2" (3207, 3273), the 2x1000 multiplication is executed (3274), and its result is stored in table 3124 (see Figure 26B). Then, for

le mot suivant "and (et)", l'information du dictionnaire est tempo-  the next word "and (and)", the dictionary information is tempo-

rairement emmagasinée sans changement dans la table 3124 (voir  usually stored without change in table 3124 (see

figure 26C).Figure 26C).

Le pointeur avance de nouveau pour traiter "twenty-two (vingt-deux)". Puisque les mots sont liés par un trait d'union et forment un mot qui ne se trouve pas dans les rubriques d'entrée du dictionnaire (3212), l'opération "20+2=22" est exécutée par le traitement 3213 relatif aux nombres lié par des traits d'union (3237, 3239 à 3241). Puisque le mot précédent est "and (et)" (3272) et que la valeur numérique qui le précède est "2000" (3277), la valeur numérique "22" est arrondie au chiffre le plus significatif de manière à former par conséquent "100" (3278) et l'opération de division 3273 est exécutée. Puisque l'excédent, ou reste, est "0", l'addition 3280 entre "2000" et "22" est effectuée. L'information relative à "and (et)" est éliminée (3282) de la table de mise en réserve 3124, et le résultat de l'addition "2022" est mis en réserve comme valeur numérique dans la table 3124, grâce à quoi "two thousand and twenty-two (deux mille et vingt-deux)" est reconnu comme étant "2022". Ainsi, L'agencement collectif avec la  The pointer advances again to process "twenty-two (twenty-two)". Since the words are linked by a hyphen and form a word which is not found in the entry fields of the dictionary (3212), the operation "20 + 2 = 22" is executed by the processing 3213 relating to numbers linked by hyphens (3237, 3239 to 3241). Since the previous word is "and (and)" (3272) and the numerical value before it is "2000" (3277), the numerical value "22" is rounded to the most significant digit so as to form " 100 "(3278) and the division operation 3273 is executed. Since the excess, or remainder, is "0", the addition 3280 between "2000" and "22" is performed. The information relating to "and (and)" is eliminated (3282) from the reserve table 3124, and the result of the addition "2022" is reserved as a numerical value in table 3124, whereby "two thousand and twenty-two (two thousand and twenty-two)" is recognized as "2022". Thus, the collective arrangement with the

valeur numérique précédente a été exécuté (3207).  previous numeric value has been executed (3207).

On va présenter un autre exemple. Comme le montre la figure 27, une analyse grammaticale est exécutée pour l'ensemble de caractères d'entrée "you said $1,000.5 thousand was... (vous avez dit 1000,5 milliers de dollards étaient...)". Le mot "p1,000.5"  We will present another example. As shown in Figure 27, a grammatical analysis is performed for the input character set "you said $ 1,000.5 thousand was ... (you said 1000.5 thousand dollars were ...)". The word "p1,000.5"

n'est pas enregistré dans le dictionnaire 3018. Le premier carac-  is not saved in the 3018 dictionary. The first character

tère est un symbole monétaire "$" qui peut être reconnu comme un symbole monétaire dans les rubriques d'entrée du dictionnaire. Ceci est enregistré indépendamment dans la table de mise en réserve 3124  tère is a currency symbol "$" which can be recognized as a currency symbol in the dictionary entry fields. This is stored independently in reserve table 3124

(3214, 3216, figure 29A).(3214, 3216, Figure 29A).

Ensuite, "1,000.5" est transformé en une valeur numérique "1000.5" par Le traitement 3215 destiné aux caractères numériques se succédant. Puisque le caractère précédent est le symbole "t" et non une valeur numérique, la valeur numérique est enregistrée sans  Then, "1,000.5" is transformed into a numerical value "1000.5" by Processing 3215 intended for the successive numeric characters. Since the preceding character is the symbol "t" and not a numerical value, the numerical value is recorded without

modification (3280-3273, 3284, figure 29B).  modification (3280-3273, 3284, Figure 29B).

Le mot suivant "thousand (mille)" est un nombre et sa valeur numérique est "1000". Puisque le caractère précédent est une valeur numérique (3272, 3273), le calcul "1000.5x1000=1000500"  The next word "thousand (thousand)" is a number and its numeric value is "1000". Since the preceding character is a numeric value (3272, 3273), the calculation "1000.5x1000 = 1000500"

(3274) est exécuté (figure 29C).(3274) is executed (FIG. 29C).

Après que la recherche dans le dictionnaire a été menée à son terme, les données contenues dans la table de mise en réserve  After the dictionary search has been completed, the data in the reserve table

d'information du dictionnaire 3174 sont examinées successivement.  Information files from dictionary 3174 are examined successively.

Puisque le symbole monétaire "" est présent juste avant la valeur numérique "1000500", tous deux sont collectivement agencés et "$1000500" est produit pour former une entrée comprenant un nom unique (3209, 32213223, figure 29D) (on dirait en français  Since the currency symbol "" is present just before the numeric value "1000500", both are collectively arranged and "$ 1000500" is produced to form an entry with a unique name (3209, 32213223, Figure 29D) (it looks like in French

1 000 5O 00).1000 50 00).

On va expliquer le quatrième mode de réalisation de l'invention. La figure 30 montre le quatrième mode de réalisation de l'analyseur de langage selon l'invention, appliqué à un dispositif  The fourth embodiment of the invention will be explained. FIG. 30 shows the fourth embodiment of the language analyzer according to the invention, applied to a device

de traduction automatique anglais-japonais.  English-Japanese machine translation.

Ce mode de réalisation possède une section de traitement d'entrée 4014, et la section de traitement d'entrée 4014 reçoit des données de la part d'un dispositif d'entrée 4012. Le dispositif d'entrée 4012 comporte par exemple un clavier possédant des touches de caractères, par exemple des touches alphanumériques, et des touches de fonction, un dispositif de lecture optique de caractères permettant de lire un texte d'anglais enregistré sur une  This embodiment has an input processing section 4014, and the input processing section 4014 receives data from an input device 4012. The input device 4012 for example includes a keyboard having character keys, for example alphanumeric keys, and function keys, an optical character reading device making it possible to read English text recorded on a

feuille de papier, et un lecteur, par exemple pour disque magné-  sheet of paper, and a reader, for example for magnetic disc

tique. La section de traitement d'entrée 4014 possède un tampon d'ensemble de caractères d'entrée 4014a et emmagasine la phrase d'anglais d'entrée fournie par le dispositif d'entre 4012 dans le  tick. The input processing section 4014 has an input character set buffer 4014a and stores the input English phrase provided by the input device 4012 in the

tampon d'ensemble de caractères d'entrée 4014a. La section de trai-  input character set buffer 4014a. The processing section

tement d'entrée 4014 lit une phrase d'entrée emmagasinée dans le tampon d'ensemble de caractères 4014a et le délivre à une section de découpage d'unités 4016. La section de découpage d'unités 4016 est une section fonctionnelle qui découpe des unités de référence lexicographiques de la phrase d'entrée délivrée par la section de traitement d'entrée 4014. Une table d'emmagasinage de délimiteurs 4018 emmagasine des délimiteurs tels que des espacements et des virgules. La section de découpage d'unités 4016 lit des délimiteurs dans la table de délimiteurs'4018 et divise la phrase d'entrée envoyée par la section de traitement d'entrée 4014 en ensembles de caractères,qui sont pris comme unités en relation avec la recherche dans un dictionnaire de référence 4020,en séparant la phrase au niveau des parties o sont présents les délimiteurs. Les ensembles de caractères divisés sont fournis à une section de recherche dans  input header 4014 reads an input phrase stored in the character set buffer 4014a and outputs it to a unit cutting section 4016. The unit cutting section 4016 is a functional section which cuts units lexicographic reference code for the input sentence delivered by the input processing section 4014. A delimiter storage table 4018 stores delimiters such as spaces and commas. The unit splitting section 4016 reads delimiters from the delimiter table '4018 and divides the input sentence sent by the input processing section 4014 into character sets, which are taken as units in relation to the search in a reference dictionary 4020, by separating the sentence at the level of the parts where the delimiters are present. Divided character sets are provided to a search section in

le dictionnaire, ou de consultation du dictionnaire, 4022.  dictionary, or dictionary lookup, 4022.

La section 4022 de consultation du dictionnaire consulte le dictionnaire de référence 4020 en relation avec la phrase d'entrée divisée en unités de référence lexicographiques fournies par la section de découpage d'unités 4016. Le dictionnaire de  The dictionary consultation section 4022 consults the reference dictionary 4020 in relation to the input sentence divided into lexicographic reference units provided by the unit splitting section 4016. The dictionary

référence 4020 contient des rubriques d'entrée, ou entrées, concer-  reference 4020 contains entry items, or entries, relating to

nant des ensembles de caractères d'anglais, les "parties de discour's" formées par ceux-ci, des informations sur leur nature, etc., par exemple, comme représenté sur la figure 31. Le dictionnaire de référence 4020 emmagasine également, en plus de noms propres tels que présentés sur la figure 31,des ensembles de caractères pour  from sets of English characters, the "speech parts" formed by them, information about their nature, etc., for example, as shown in Figure 31. The reference dictionary 4020 also stores, in addition proper names as shown in Figure 31, sets of characters for

d'autres parties de discours, par exemple des verbes et des adjec-  other parts of speech, for example verbs and adjec-

tifs. L'enregistrement de noms propres comme parties de discours  tifs. Recording proper names as parts of speech

vise à une application liée au traitement des noms propres enregis-  aims at an application linked to the processing of registered proper names

trés décrit ci-après, mais ne cherche pas à exprimer la valeur grammaticale usuelle des noms propres. De plus, l'information sur la nature indique ce que représente le nom propre, ce qui ne se ramène pas toujours seulement à une entité, puisque, comme indiqué ci-après, un nom propre peut représenter plusieurs entités selon  very described below, but does not try to express the usual grammatical value of proper names. In addition, information on the nature indicates what the proper name represents, which does not always reduce only to an entity, since, as indicated below, a proper name can represent several entities according to

l'utilisation qui en est faite.the use made of it.

La section de consultation de dictionnaire 4022 consulte le dictionnaire de référence 4020 relativement à l'ensemble de caractères divisé en unités de référence lexicographiques et, si l'ensemble de caractères est un nom propre, elle le délivre à la section 4024 de traitement de noms propres o un traitement destiné aux noms propres, qui est décrit ci- après, est effectué. S'il ne s'agit pas d'un nom propre, l'ensemble est fourni à une section de traitement 4036 et est mis en réserve dans une table de mise en  The dictionary consultation section 4022 consults the reference dictionary 4020 relative to the set of characters divided into lexicographic reference units and, if the character set is a proper name, it delivers it to the section 4024 for processing names o a processing for proper names, which is described below, is carried out. If it is not a proper name, the assembly is supplied to a processing section 4036 and is put in reserve in a setting table.

réserve d'information lexicographique 4036a de la section de trai-  vocabulary information store 4036a of the processing section

tement 4036.4036.

La section de traitement des noms propres 4024 comprend une section 4026 de traitement de la fin de la phrase précédente, une section 4028 de traitement du nom propre précédent, une section  The proper names processing section 4024 comprises a section 4026 for processing the end of the preceding sentence, a section 4028 for processing the previous proper name, a section

4030 de traitement du nom propre lui-même, une section de trai-  4030 proper name processing itself, a processing section

tement 4032 s'appliquant au nom propre précédent et au nom propre luimême, et une section 4034 produisant une information de  4032 applying to the previous proper name and to the proper name itself, and a section 4034 producing information of

particularité manquante.missing feature.

La section 4026 de traitement de fin de phrase précédente  Previous end-of-sentence processing section 4026

décide si l'ensemble de caractères précédent l'ensemble de carac-  decides whether the character set preceding the character set

tères cherché fourni par la section de consultation du dictionnaire 4022 se trouve ou non à la fin de la phrase et, si l'ensemble de  search terms provided by the lookup section of the 4022 dictionary may or may not be at the end of the sentence and, if all of

caractères précédent se trouve à la fin de la phrase, elle trans-  preceding characters is found at the end of the sentence, it trans-

forme la lettre majuscule se trouvant en haut de l'ensemble de caractères à traiter en une minuscule, le délivre à la section de  forms the capital letter at the top of the set of characters to be treated in lowercase, delivers it to the section of

consultation de dictionnaire 4022 et amène la section de consulta-  4022 dictionary lookup and brings up the lookup section

tion de dictionnaire 4022 à consulter de nouveau le dictionnaire de référence 4020. L'ensemble de caractères non retrouvé même après la  dictionary 4022 to consult the reference dictionary 4020 again. The character set not found even after the

deuxième recherche est jugé comme étant un nom propre non enregis-  second search is deemed to be an unregistered proper name

tré, qui est envoyé à la section de traitement 4036, puis est emmagasiné dans la table de mise en réserve d'information du  tré, which is sent to processing section 4036, then is stored in the information storage table of the

dictionnaire 4036a. De plus, dans le cas o l'ensemble de carac-  dictionary 4036a. In addition, in the case where the character set

tères précédent ne se trouve pas à la fin de la phrase, il est délivré à la section de traitement 4036 au titre de nom propre pour lequel il n'y a pas d'information de particularité etest enregistré dans la table de mise en réserve d'informationdu dictionnaire4036a,  tères precedent is not found at the end of the sentence, it is delivered to the processing section 4036 under the proper name for which there is no particularity information and is recorded in the reserve table d dictionary information 4036a,

comme décrit ci-après.as described below.

La section 4028 de traitement du nom propre précédent effectue une analyse sur l'information de particularité pour l'ensemble de caractères précédent fourni par la section de traitement de fin de phrase précédente 4026 et délivre le résultat à la section 4030 de traitement du nom propre lui-même. La section de traitement du nom propre lui-même 4030 examine l'information de particularité du nom propre à analyser et, comme décrit ci-après, si l'information de particularité du nom propre aussi bien que du nom propre précédent n'est pas enregistrée, elle analyse le nom propre et le nom propre précédent d'une manière collective à l'aide de l'information enregistrée pour les autres mots et le met en réserve dans la table de mise en réserve d'information lexicographique 4036a de la section de traitement  The previous proper name processing section 4028 performs an analysis on the particularity information for the preceding character set provided by the preceding end of sentence processing section 4026 and delivers the result to the proper name processing section 4030. himself. The proper name processing section 4030 examines the particularity information of the proper name to be analyzed and, as described below, whether the particularity information of the proper name as well as the previous proper name is not recorded, it analyzes the proper noun and the previous proper noun in a collective way using the information recorded for the other words and puts it in reserve in the lexicographic information storage table 4036a of the section treatment

4036.4036.

La section de traitement 4032 du nom propre précédent et  The processing section 4032 of the previous proper name and

du nom propre lui-même examine la partie en commun de l'informa-  of the proper name itself examines the common part of the information-

tion de particularité du nom propre et du nom propre précédent, analyse ces noms propres à partir de la partie commune, délivre le résultat à la section de traitement 4036, puis  particularity of the proper name and the previous proper name, analyzes these proper names from the common part, delivers the result to the processing section 4036, then

emmagasine dans la table de mise en réserve d'information lexico-  stores in the lexico- information storage table

graphique 4036a de la section de traitement 4036.  graph 4036a of processing section 4036.

La section 4034 de production d'information de particula-  Section 4034 for the production of particular information

rité manquante fournit une information de particularité d'un nompro-  missing rity provides particularity information of a nom-

pre qui, après sa lecture dans la table de réserve d'information lexicographique 4036a, a été envoyée via la section de découpage d'unités 4016 à la section de consultation du dictionnaire 4022 et s'est révélée ne pas posséder l'information de particularité lors de la consultation du dictionnaire de référence 4020 de la section de consultation de dictionnaire 4022. Puisqu'il est vrai qu'un nom propre a différents types de particularités selon la situation oỏn  pre which, after having been read in the lexicographic information reserve table 4036a, was sent via the unit cutting section 4016 to the consultation section of the dictionary 4022 and was found not to have the specific information when consulting the reference dictionary 4020 of the dictionary consultation section 4022. Since it is true that a proper name has different types of features depending on the situation in which

utilise, toutes les informations de nature considérées comme néces-  uses, all information of a nature considered necessary

saire sont prévues. Par exemple, on prévoit "personne, lieu,  are planned. For example, we provide "person, place,

groupe, et autres". Après avoir doté le nom propre d'une informa-  group, and others ". After having given the proper name of an information

tion de particularité,la section 4034 de production d'une information de particularité manquante envoie les données à la section  particularity, section 4034 for producing missing particularity information sends the data to the section

4036 et les emmagasine dans la table de mise en réserve d'informa-  4036 and stores them in the information storage table

tion lexicographique 4036a de la section de traitement 4036.  lexicographic section 4036a of processing section 4036.

La section de traitement 4036, comportant la table de mise en réserve d'information lexicographique 4036a, emmagasine les données envoyées par la section de traitement 4032 du nom propre  The processing section 4036, comprising the lexicographic information storage table 4036a, stores the data sent by the processing section 4032 of the proper name.

précédent et du nom propre lui-même, la section 4034 de produc-  previous and proper name itself, section 4034 of produc-

tion d'information de particularité manquante ou la section de con-  tion of missing particularity information or the section of con-

sultation 4022 afin qu'elles se trouvent placées dans la table de mise en réserve d'information lexicographique 4036a, après quoi elle lit Les données emmagasinées et les délivre à la section d'analyse 4038. La section d'analyse 4038 effectue l'analyse relative à la phrase d'entrée après qu'elle a été soumise à une analyse morphologique et lue dans la  sultation 4022 so that they are placed in the lexicographic information storage table 4036a, after which it reads the stored data and delivers them to the analysis section 4038. The analysis section 4038 performs the analysis relating to the input sentence after it has been subjected to morphological analysis and read in the

table de mise en réserve d'information lexicographique 4036a.  lexicographic information storage table 4036a.

On va maintenant expliquer le fonctionnement de ce dispo-  We will now explain how this arrangement works.

sitif en se reportant à l'organigramme de la figure 32.  refer to the flowchart in Figure 32.

Tout d'abord, une phrase d'entrée d'anglais provenant du  First, an English entry sentence from the

dispositif d'entrée 4032 est lue et placée dans la section de trai-  input device 4032 is read and placed in the processing section

tement d'entrée 4014 (4100). La phrase d'entrée Lue et placée dans la section de traitement d'entrée 4014 est alors chargée dans le tampon d'ensemble de caractères d'entrée 4014a. La phrase d'entrée chargée dans le tampon d'ensemble de caractères d'entrée 4014a et lue pour être délivrée à la section de découpage d'unités  entry 4014 (4100). The input sentence read and placed in the input processing section 4014 is then loaded into the input character set buffer 4014a. The input sentence loaded into the input character set buffer 4014a and read to be delivered to the unit splitting section

4016.4016.

Lorsque la phrase d'entrée a été introduite, la section de découpage d'unités4016 lit les délimiteurs venant de la table de  When the input sentence has been entered, the unit splitting section 4016 reads the delimiters from the table.

délimiteurs 4018 afin de procéder au découpage des unités de réfé-  delimiters 4018 in order to proceed to the cutting of the reference units

rence de dictionnaire (4102). Ainsi, les ensembles de caractères  dictionary reference (4102). So the character sets

constituant la phrase d'entrée introduite sont divisés successive-  constituting the input sentence entered are divided successively-

ment, à partir de la tête des ensembles de caractères, en ensembles de caractères de clé de consultation, destinés à constituer les unités permettant la consultation du dictionnaire de référence 4020, par le fait qu'on les divise au niveau des parties o se trouvent des délimiteurs tels qu'un espacement ou le signe "deux points". Cette section détermine si les unités de référence de dictionnaire obtenues par la division, c'est-à-dire les ensembles decaractères de clé de consultation sont ou non arrivés à leur terme (4104) et, s'il existe encore des ensembles de caractères de clé de consultation, elle envoie l'ensemble de caractères de  ment, from the head of the sets of characters, into sets of consultation key characters, intended to constitute the units allowing the consultation of the reference dictionary 4020, by the fact that they are divided at the level of the parts o are found delimiters such as a space or a colon. This section determines whether the dictionary reference units obtained by the division, i.e. the sets of lookup key characters, have expired or not (4104) and, if there are still sets of characters. consultation key, it sends the character set of

consultation à la section de consultation du dictionnaire 4022.  consultation in the consultation section of the 4022 dictionary.

Lorsqu'un ensemble de caractères de clé de consulta-  When a set of consultation key characters

tion est envoyé à la section de consultation du dictionnaire 4022, cette dernière consulte le dictionnaire de référence 4020 afin de  tion is sent to the consultation section of the dictionary 4022, the latter consults the reference dictionary 4020 in order to

traiter l'ensemble de caractères de clé de consultation (4106).  processing the lookup key character set (4106).

La section détermine si l'ensemble de caractères de clé de consultation est ou non présent dans les rubriques d'entrée du dictionnaire de référence 4020, comme représenté sur la figure 31,  The section determines whether or not the set of consultation key characters is present in the input items of the reference dictionary 4020, as shown in FIG. 31,

(4108) et, s'il existe une rubrique d'entrée, elle lit l'informa-  (4108) and, if there is an entry section, it reads the information

tion relative à la partie de discours qui est emmagasinée dans Le dictionnaire de référence 4020 et décide si L'ensemble de caractères de clé de consultation est ou non un nom propre  tion relating to the part of speech which is stored in the reference dictionary 4020 and decides whether the set of characters of consultation key is or not a proper name

(4110).(4110).

Si l'ensemble de caractères de c lé de consultation ne  If the consultation line character set does not

constitue pas un nom propre, la section de consultation du diction-  is not a proper name, the consultation section of the diction-

naire 4022 envoie les données lues dans le dictionnaire de réfé-  naire 4022 sends the data read from the reference dictionary

rence 4020 à la section de traitement 4036 et les enregistre dans la table de mise en réserve d'information lexicographique 4036a  rence 4020 to processing section 4036 and records them in the lexicographic information storage table 4036a

(4112). Lorsque les données sont emmagasinées dans la table d'emma-  (4112). When the data is stored in the storage table

ginage d'information lexicographique 4036a, les données d'entrée indiquant que les données ont été emmagasinées dans la section de découpage d'unités 4016 et les données relatives à l'ensemble de  gination of lexicographic information 4036a, the input data indicating that the data have been stored in the unit cutting section 4016 and the data relating to the set of

caractères de clé de consultation mis en réserve juste aupara-  consultation key characters set aside just before-

vant sont fournies par la section de traitement 4036. Ensuite, l'organigramme revient à l'étape 4102 et l'unité de référence du dictionnaire est de nouveau découpée dans la section de découpage  vant are provided by the processing section 4036. Then, the flowchart returns to step 4102 and the dictionary reference unit is again cut out in the cutting section

d'unités 4016.4016 units.

A l'étape 4110, si l'ensemble de caractères de clé de consultation est un nom propre, la section de consultation de dictionnaire 4022 envoie les données relatives au nom propre lu dans le dictionnaire de référence 4020 (ci-après simplement appelé le nom propre) à la section de traitement du nom propre 4024, en même temps que les données relatives à l'ensemble de caractères de clé de consultation précédent fourni par la table de mise en  In step 4110, if the set of consultation key characters is a proper name, the dictionary consultation section 4022 sends the data relating to the proper name read in the reference dictionary 4020 (hereinafter simply called the name proper) to the proper name processing section 4024, along with the data for the previous lookup key character set provided by the layout table

réserve d'information lexicographique 4036a de la section de trai-  vocabulary information store 4036a of the processing section

tement 4036 via la section de découpage d'unités 4016 à la section de consultation de dictionnaire 4022, et le traitement du nom propre enregistré dans le dictionnaire est effectué dans la section  4036 via the unit splitting section 4016 to the dictionary consultation section 4022, and the processing of the proper name registered in the dictionary is carried out in the section

de traitement du nom propre 4024 (4124).  proper name processing 4024 (4124).

On va maintenant expliquer le traitement du nom propre enregistré dans le dictionnaire en relation avec l'organigramme  We will now explain the processing of the proper name recorded in the dictionary in relation to the flowchart

présenté sur la figure 33.shown in Figure 33.

2 6 0 4 8 1 42 6 0 4 8 1 4

Les données envoyées par la section de consultation de dictionnaire 4022 à la section de traitement de nom propre 4024 sont fournies par le moyen de la section de traitement de fin de phrase précédente 4026 à la section de traitement de nom propre précédent 4028. Lors du traitement du nom propre enregistré dans Le dictionnaire, la section de traitement de fin de phrase précédente  The data sent from the dictionary lookup section 4022 to the proper noun processing section 4024 is provided by means of the preceding end-of-sentence processing section 4026 to the previous proper noun processing section 4028. During processing of the proper name registered in The dictionary, the previous end-of-sentence processing section

4026 ne fonctionne pas.4026 does not work.

La section 4028 de traitement du nom propre précédent détermine si la rubrique d'entrée précédant le nom propre est ou non un nom propre non enregistré dans le dictionnaire de référence 4020, c'est-à-dire s'il lui est ou non appliqué le traitement destiné aux noms propres non enregistrés dans le dictionnaire,  The previous proper name processing section 4028 determines whether or not the entry item preceding the proper name is a proper name not registered in the reference dictionary 4020, that is to say whether or not it is applied to it. the processing intended for proper names not registered in the dictionary,

décrit ci-après, (4100). S'il s'agit d'un nom propre non enregis-  described below, (4100). If it is an unregistered proper name

tré, la section de traitement décide que toute la partie du nom propre et du nom propre non enregistré précédent est comme un nom propre ayant l'information de nature du nom propre (4202), envoie Les données à la section de traitement 4036 et les emmagasine dans la table de mise en réserve d'information du dictionnaire 4036a  very, the processing section decides that all the part of the proper name and the previous unregistered proper name is like a proper name having the proper nature information (4202), sends the data to the processing section 4036 and the stores in the dictionary information storage table 4036a

(4218).(4218).

Si la section 4028 de traitement du nom propre précédent décide, à l'étape 4200, que la rubrique d'entrée précédant le nom propre n'est pas un nom propre enregistré, elle détermine si la rubrique d'entrée précédant le nom propre est ou non un nom propre enregistré dans le dictionnaire de référence 4020 (4204). Si la rubrique d'entrée qui précède juste le nom propre est un nom propre enregistré, il est déterminé si l'information de particularité du nom propre précédent est ou non inconnue, c'est-à-dire si elle est, ou non, non enregistrée dans le dictionnaire de référence 4020  If the preceding proper name processing section 4028 decides, at step 4200, that the entry item preceding the proper name is not a registered proper name, it determines whether the entry item preceding the proper name is or not a proper name registered in the reference dictionary 4020 (4204). If the entry item which just precedes the proper proper name is a registered proper name, it is determined whether the particularity information of the preceding proper name is or is not unknown, that is to say whether or not it is, not registered in the reference dictionary 4020

(4206).(4206).

Dans le cas o l'information de particularité du nom propre précédent est inconnue, l'organigramme passe à l'étape 4202 et décide que la partie entière du nom propre lui-même et du nom  In the case where the specific information of the previous proper name is unknown, the flowchart goes to step 4202 and decides that the whole part of the proper name itself and of the name

propre juste précédent comme étant un nom propre qui a une infor-  own just previous as being a proper name which has an inform-

mation de particularité (4202), et la section de traitement 4028 du nom propre précédent envoie les données à La section de traitement 4036. Les données envoyées à la section de traitement 4036 sont  special feature (4202), and the processing section 4028 of the previous proper name sends the data to the processing section 4036. The data sent to the processing section 4036 is

enregistrées dans la table de mise en réserve d'information Lexico-  recorded in the Lexico- information storage table

graphique 4036a (4218).graphic 4036a (4218).

Si la section de traitement du nom propre précédent 4028 détermine à l'étape 4206 que L'information de particularité du nom propre précédent n'est pas inconnue, c'est-à-dire si elle est enregistrée dans le dictionnaire de référence 4020, les données  If the processing section of the previous proper name 4028 determines in step 4206 that the information of particularity of the previous proper name is not unknown, that is to say if it is recorded in the reference dictionary 4020, the data

sont envoyées de la section 4028 de traitement du nom propre précé-  are sent from section 4028 of the previous proper name processing

dent à la section 4030 de traitement du nom propre lui-même. La section 4030 de traitement du nom propre lui-même détermine si  tooth in section 4030 proper name processing itself. The proper name processing section 4030 itself determines whether

l'information de nature du nom propre est inconnue ou non (4208).  information of the proper name is unknown or not (4208).

Si l'information de particularité du nom propre est inconnue, la section 4030 de traitement du nom propre lui-même détermine la partie tout entière du nom propre lui-même et, du nom propre  If the particularity information of the proper name is unknown, section 4030 of processing the proper name itself determines the entire part of the proper name itself and, of the proper name

juste précédent comme étant un nom propre qui possède une informa-  just preceding as being a proper name which has information

tion de particularité du nom propre (4210),et envoie les données à la section de traitement 4036. Les données envoyées à la section de traitement 4036 sont enregistrées dans la table de mise en réserve  specific feature of the proper name (4210), and sends the data to the processing section 4036. The data sent to the processing section 4036 is recorded in the reserve table

d'information lexicographique 4036a.  for lexicographic information 4036a.

Si la section 4030 de traitement du nom propre en lui-  If the proper name processing section 4030 in itself

même détermine que l'information de particularité du nom propre lui-  even determines that the particularity information of the proper name itself

même n'est pas inconnue, c'est-à-dire si elle est enregistrée dans le dictionnaire de référence 4020, la section de traitement du nom  even is not unknown, i.e. if it is registered in the reference dictionary 4020, the name processing section

propre lui-même 4030 envoie les données à la section de traite-  own 4030 sends the data to the processing section

ment 4032 du nom propre précédent et du nom propre lui-même. La section de traitement 4032 du nom propre précédent et du nom propre lui-même détermine s'il y a ou non une particularité commune dans l'information de nature entre le nom propre lui-même et le nom propre juste précédent (4212) et, s'ilya uneparticularité commune, elle détermine la partie tout entière du nom propre lui-même et du nom propre juste précèdent comme étant un nom propre qui a l'information de particularité de la partie commune (4214) et envoie les données à la section de traitement 4036. Les données envoyées à la  ment 4032 of the previous proper name and of the proper name itself. The processing section 4032 of the previous proper name and of the proper name itself determines whether or not there is a common characteristic in the information of nature between the proper name itself and the just preceding proper name (4212) and , if there is a common particularity, it determines the entire part of the proper name itself and of the proper name just preceding as being a proper name which has the particularity information of the common part (4214) and sends the data to the processing section 4036. The data sent to the

2 6048142 604814

section de traitement 4036 sont enregistrées dans La table de mise  processing section 4036 are recorded in the stake table

en réserve d'information lexicographique 4036a (4218).  in lexicographic information reserve 4036a (4218).

S'il n'y a rien de commun entre les informations de particularité du nom propre lui-même et du nom propre qui le précède immédiatement, la section de traitement détermine que le nom propre est un nom propreayantune information de particularité trouvée dans le dictionnaire de référence 4020 qui diffère du nom propre le précédant immédiatement (4216) et envoie les données à la section de traitement 4036. Les données envoyées à la section de traitement 4036 sont enregistrées dans la table de mise en réserve  If there is nothing in common between the information of particularity of the proper name itself and of the proper name which immediately precedes it, the processing section determines that the proper name is a proper name having specific information found in the dictionary 4020 which differs from the proper name immediately preceding it (4216) and sends the data to the processing section 4036. The data sent to the processing section 4036 are recorded in the reserve table

d'information lexicographique 4036a (4218).  of lexicographic information 4036a (4218).

On revient à la figure 32. A l'étape 4108, s'il n'y a pas d'ensemble de caractères de clé de consultation dans la rubrique d'entrée du dictionnaire de référence 4020, il est déterminé si le  We return to FIG. 32. In step 4108, if there is no set of consultation key characters in the entry item of the reference dictionary 4020, it is determined whether the

premier caractère de l'ensemble de caractères de clé de consul-  first character in the set of consultation key characters

tation est ou non une lettre majuscule (4116) et, s'il ne s'agit  tation is or is not a capital letter (4116) and, if it is not

pas d'une lettre majuscule, la section de consultation du diction-  not a capital letter, the consultation section of the diction-

naire 4022 détermine l'ensemble de caractères de clé de consul-  naire 4022 determines the character set of consultation key

tation comme étant un mot non enregistré, l'envoie à la section de traitement 4036 pour l'enregistrer dans la table de mise en réserve  as an unregistered word, send it to processing section 4036 to save it to the reserve table

d'information lexicographique 4036a (4118).  for lexicographic information 4036a (4118).

Si le premier caractère est une lettre majuscule, les  If the first character is a capital letter, the

données relatives à l'ensemble de caractères de clé de consul-  data relating to the set of consultation key characters

tation sont envoyées à la section de traitement du nom propre en même temps que les données relatives à l'ensemble de caractères de  tation are sent to the proper name processing section together with the data relating to the character set of

clé de consultation précédent issu de la section de consulta-  previous consultation key from the consultation section

tion du dictonnaire 4022, le traitement destiné au nom propre non enregistré dans le dictionnaire étant effectué dans cette section  dictionary 4022, the processing for the proper name not registered in the dictionary being carried out in this section

de traitement du nom propre (4120). On va maintenant expliquer le traitement des noms propres non enregistrésproper name processing (4120). We will now explain the treatment of unregistered proper names

dans le dictionnaire, en relation avec la figure 34. Les données relatives à l'ensemble de caractères de  in the dictionary, in relation to FIG. 34. The data relating to the set of characters of

clé de consultation sont envoyées à la section 4026 de traite-  consultation key are sent to processing section 4026

ment de fin de phrase précédente en même temps que les données  preceding end of sentence together with the data

relatives à l'ensemble de caractères de clé de consultation pré-  relating to the set of pre-consultation key characters

cèdent, et la section de traitement de fin de phrase précédente 4026 détermine si la fin de la rubrique d'entrée précédente est ou  yield, and the preceding end-of-sentence processing section 4026 determines whether the end of the preceding entry item is or

non susceptible de constituer la fin de la phrase (4300). La déci-  not likely to constitute the end of the sentence (4300). The deci-

sion prise sur la possibilité qu'elle constitue ou non la fin de la phrase est prise en fonction de la détermination du fait que la fin  sion taken on the possibility that it constitutes or not the end of the sentence is taken according to the determination of the fact that the end

de la rubrique d'entrée précédente est ou non susceptible de cons-  of the previous entry item may or may not constitute

tituer la fin de la phrase, par exemple du fait que la présence éventuelle d'un point distinct ".", etc.  substitute the end of the sentence, for example that the possible presence of a separate dot ".", etc.

Si la fin de la rubrique d'entrée précédente est suscep-  If the end of the previous entry item is suspected

tible de constituer la fin de la phrase, les données sont envoyées de la section 4026 de traitement de fin de phrase précédente à la section 4028 de traitement du nom propre précédent, et la section 4028 de traitement du nom propre précédent détermine la rubrique  tible of constituting the end of the sentence, the data is sent from section 4026 of processing of the end of the preceding sentence to section 4028 of processing of the previous proper name, and the section 4028 of processing of the previous proper name determines the item

d'entrée précédente comme étant la fin de la phrase (4302), trans-  previous entry as the end of the sentence (4302), trans-

forme le premier caractère de l'ensemble de caractères de clé de consultation en un caractère minuscule et l'envoie à la section de  forms the first character in the lookup key character set in lowercase and sends it to the section of

consultation du dictionnaire 4022.consultation of the dictionary 4022.

La section de consultation du dictionnaire 4022 consulte le dictionnaire de référence 4020 relativement à l'ensemble de caractères de clé de consultation qui a été transformé en un caractère minuscule (4304) et détermine s'il s'agit ou non d'une rubrique d'entrée du dictionnaire de référence 4020 (4306). S'il s'agit d'une rubrique d'entrée, la section de consultation du dictionnaire 4022 envoie les données trouvées dans le dictionnaire de référence 4020 à la section de traitement 4036 et les emmagasine dans la table de mise en réserve d'information lexicographique  The consultation section of the dictionary 4022 consults the reference dictionary 4020 relative to the set of consultation key characters which has been transformed into a lowercase character (4304) and determines whether or not it is an item d entry from reference dictionary 4020 (4306). If it is an entry item, the consultation section of the dictionary 4022 sends the data found in the reference dictionary 4020 to the processing section 4036 and stores it in the information storage table. lexicographic

4036a (4308). S'il ne s'agit pas d'une rubrique d'entrée, la sec-  4036a (4308). If it is not an entry item, the sec-

tion de consultation du dictionnaire 4022 remet le premier carac-  consultation of the 4022 dictionary gives the first character

tère de l'ensemble de caractères de consultation sous la forme d'une lettre majuscule et envoie celui-ci, au titre de nom propre  tère of the set of consultation characters in the form of a capital letter and sends this one, under proper name

non enregistré, à la section de traitement 4036 en vue de son enre-  not registered, to processing section 4036 for registration

gistrement dans la table de mise en réserve d'information lexico-  registration in the lexico- information storage table

graphique 4036a (4310).graphic 4036a (4310).

26 0 4 8 1 426 0 4 8 1 4

A l'étape 4300, si la section 4026 de traitement de fin de phrase précédente détermine que la fin de la rubrique d'entrée précédente n'est pas susceptible de constituer la fin de la phrase, les données sont envoyées de la section 4026 de traitement de fin de phrase précédente à La section 4028 de traitement de nom propre précédent, et la section 4028 de traitement de nom propre précédent détermine La rubrique d'entrée précédente comme n'étant pas la fin de la phrase (4312). Les données sont envoyées de la section 4028  In step 4300, if the preceding sentence processing section 4026 determines that the end of the previous entry item is not likely to constitute the end of the sentence, the data is sent from section 4026 of previous end-of-sentence processing in Section 4028 of previous proper noun processing, and section 4028 of previous proper noun processing determines the previous entry item as not being the end of the sentence (4312). Data is sent from section 4028

de traitement du nom propre précédent à la section 4030 du traite-  processing of the previous proper name in section 4030 of the treaty

ment du nom propre lui-même, et la section 4030 de traitement du nom propre en lui-même détermine l'ensemble de caractères de clé de consultation comme étant un nom propre dont l'information de  proper name itself, and proper name processing section 4030 determines the lookup key character set to be a proper name whose information

*particularité est inconnue (4314).* particularity is unknown (4314).

La section 4030 de traitement du nom propre lui-même renvoie les données à la section 4028 de traitement du nom propre précédent, et la section 4028 de traitement du nom propre précédent effectue le traitement destiné aux noms propres enregistrés dans le dictionnaire (4316). Le traitement des noms propres enregistrés dans le dictionnaire est le même que celui présenté sur la figure  The proper name processing section 4030 itself returns the data to the previous proper name processing section 4028, and the previous proper name processing section 4028 performs the processing for the proper names registered in the dictionary (4316). The treatment of proper names registered in the dictionary is the same as that shown in the figure

33.33.

On revient de nouveau à la figure 32. Si l'unité de réfé-  We return again to Figure 32. If the reference unit

rence de dictionnaire découpée se trouve à la fin au moment de l'étape 4104, la section de consultation du dictionnaire 4022 envoie un signal indiquant à la section 4034 de production d'une information de particularité manquante que L'unité de référence est à la fin, et la section 4034 de productiond'information de particularité manquante lit L'information enregistrée dans la table de mise en  rence of cut dictionary is at the end at the time of step 4104, the consultation section of the dictionary 4022 sends a signal indicating to the section 4034 of production of information of missing particularity that the reference unit is at the end, and the missing feature information section 4034 reads The information recorded in the layout table

réserve d'information lexicographique 4036a de la section de trai-  vocabulary information store 4036a of the processing section

tement 4036 et dote le nom propre de l'information departicularité  4036 and gives the proper name of the particularity information

manquante (4122).missing (4122).

On va maintenant expliquer l'opération qui consiste à doter le nom propre de l'information de particularité manquante,  We will now explain the operation which consists in endowing the proper name with the information of missing particularity,

à l'aide de la figure 35.using Figure 35.

Dans la section 4034 de production de l'information de particuLarité manquante, un pointeur est d'abord positionné sur le haut  In section 4034 of production of the missing particle information, a pointer is first positioned on the top

2 6 0 4 8 1 42 6 0 4 8 1 4

des données dans La table de mise en réserve d'information Lexico-  data in the Lexico- information storage table

graphique 4036a (4400). Ainsi, Le pointeur est positionné sur La rubrique d'entrée de tête de la phrase fournie divisée en rubriques d'entrée, lesquelles sont respectivement dotées d'informations du  graphic 4036a (4400). Thus, the pointer is positioned on the entry heading of the sentence supplied divided into entry headings, which are respectively provided with information from the

fait de la recherche dans le dictionnaire de référence 4020.  searches the 4020 reference dictionary.

Ensuite, il est déterminé si la rubrique d'entrée indiquée par le pointeur est ou non un nom propre (4402) et, s'il s'agit d'un nom propre, il est déterminé si l'information de particularité du nom propre est ou non inconnue (4404).s'ilne s'agitpas d'un nom propre, l'organigramme passe à l'étape 4408 et le pointeur avance  Then, it is determined whether or not the entry item indicated by the pointer is a proper name (4402) and, if it is a proper name, it is determined whether the particular information of the proper name is unknown or not (4404). if it is not a proper name, the flowchart goes to step 4408 and the pointer advances

à la rubrique d'entrée suivante.in the next entry section.

A l'étape 4404, si l'information de particularité du nom propre est inconnue, l'information de particularité manquante est fournie (4406). Pour ce qui est la production de l'information de particularité manquante, cette dernière est fournie à un nom propre dont l'information de particularité est inconnue comme cela est représenté dans la partie inférieure de la figure 36. Par exemple, le nom propre "Johnson" dont l'information de particularité est  In step 4404, if the particularity information of the proper name is unknown, the missing particularity information is supplied (4406). Regarding the production of the missing particularity information, the latter is supplied to a proper name whose specificity information is unknown as shown in the lower part of figure 36. For example, the proper name " Johnson "whose particularity information is

inconnue est doté de tous les types d'informations de particula-  unknown has all kinds of specific information

rité, c'est-à-dire "personne, lieu, groupe, et autres". En fournis-  rity, that is to say "person, place, group, and others". By providing-

sant tous les types d'informations de particularité au nom propre, on peut laisser la place permettant d'analyser te nom propre suivant n'importe laquelle des diverses particularités lors de la  sant all the types of information of particularity with proper name, one can leave the place allowing to analyze te propername according to any of the various particularities during the

poursuite de l'analyse syntaxique.further syntactic analysis.

A l'étape 4404, si l'information de particularité du nom propre n'est pas inconnue, l'organigramme passe à l'étape 4408  At step 4404, if the specific information of the proper name is not unknown, the flowchart goes to step 4408

et le pointeur avance à une rubrique d'entrée suivante.  and the pointer advances to a next entry item.

IL est déterminé si la rubrique d'entrée indiquée par le pointeur se trouve ou non à la fin (4408) et, si elle n'est pas à la fin, l'organigramme revient à l'étape 4402, et il est alors déterminé si la rubrique d'entrée suivante est ou non un nom propre. Si la rubrique d'entrée indiquée par le pointeur se trouve  It is determined whether the entry item indicated by the pointer is at the end or not (4408) and, if it is not at the end, the flowchart returns to step 4402, and it is then determined whether or not the next entry item is a proper name. If the entry item indicated by the pointer is located

à la fin, la production de l'information manquante est terminée.  at the end, the production of the missing information is finished.

Une fois terminée, la production de l'information de  Once completed, the production of information from

particularité manquante destinée au nom propre,les données enregis-  missing feature for the proper name, the data recorded

trées dans la table de mise en réserve d'information lexicogra-  entered in the lexicogra information storage table

phique 4036a sont délivrées par la section de traitement 4036 à la  4036a are delivered by the processing section 4036 to the

S05 section d'analyse syntaxique (4124), ce par quoi L'analyse morphoLo-  S05 syntactic analysis section (4124), whereby MorphoLo- analysis

gique dans ce mode de réalisation est menée à son terme.  gic in this embodiment is completed.

On va maintenant donner les explications concernant le fonctionnement du dispositif ci-dessus mentionné en relation avec  We will now give the explanations concerning the operation of the above-mentioned device in relation to

un exemple de phrase fournie.an example of a sentence provided.

L'explication sera donnée dans le cas o la phrase d'entrée "In Tokyo Station Mr. Walter met Johnson (Dans la Gare de Tokyo Mr. Walter rencontra Johnson)" est fournie. Tout d'abord, un traitement d'entrée (4100) permettant de lire la phrase d'entrée et  The explanation will be given in case the input phrase "In Tokyo Station Mr. Walter met Johnson (In Tokyo Station Mr. Walter met Johnson)" is provided. First, an input processing (4100) allowing to read the input sentence and

de la placer dans la section de traitement d'entrée 4014 est effec-  placing it in the input processing section 4014 is done

tué. Ensuite, l'unité de référence de dictionnaire est découpée (4102) et la phrase d'entrée est divisée respectivement en mots par des espacements. Le dictionnaire de référence 4020 est tout d'abord consulté pour "In (Dans)" (4106). Puisqu'il n'y a pas de rubrique d'entrée pour "In" sous cette forme précise dans le dictionnaire de référence 4020, l'étape conduit au traitement des noms propres non enregistrés dans le dictionnaire. Toutefois, puisque la partie précédente se trouve en tête de l'ensemble de caractères d'entrée, elle est considérée comme susceptible de constituer la fin de La phrase, et fait l'objet d'une recherche,sous la forme "in" après  kill. Then, the dictionary reference unit is split (4102) and the input sentence is divided into words respectively by spaces. The reference dictionary 4020 is first consulted for "In (In)" (4106). Since there is no entry item for "In" in this precise form in the reference dictionary 4020, the step leads to the processing of proper names not recorded in the dictionary. However, since the previous part is at the top of the set of input characters, it is considered likely to constitute the end of the sentence, and is the subject of a search, in the form "in" after

conversion de I en idans le dictionnaire de référence 4020.  conversion from I to id in the 4020 reference dictionary.

Puisqu'il ne s'agit pas d'un nom propre (4110), les données recher-  Since it is not a proper name (4110), the data sought

chées dans le dictionnaire de référence 4020 sont enregistrées dans la table de mise en réserve -d'information lexicographique 4036  in the reference dictionary 4020 are recorded in the lexicographic information storage table 4036

(4112).(4112).

Ensuite, le dictionnaire de référence 4020 est consulté pour "Tokyo" (4106). Puisqu'il n'y a pas de rubrique d'entrée dans le dictionnaire de référence 4020 pour "Tokyo" (4108) et que Le premier caractère est une lettre majuscule (4116), un traitement relatif aux noms propres non enregistrés dans le dictionnaire est  Then, the reference dictionary 4020 is consulted for "Tokyo" (4106). Since there is no entry heading in the 4020 reference dictionary for "Tokyo" (4108) and the first character is an uppercase letter (4116), a processing relating to proper names not registered in the dictionary East

effectué (4120). Alors, l'organigramme passe à la figure 34.  performed (4120). Then, the flowchart goes to figure 34.

Puisque la partie précédente est "In (Dans)" et qu'il ne s'agit pas d'une partie susceptible de constituer La fin de la phrase (4300), il est déterminé que "In" n'est pas la fin de la phrase (4312),  Since the previous part is "In (Dans)" and it is not a part likely to constitute the end of the sentence (4300), it is determined that "In" is not the end of the sentence (4312),

puis "Tokyo" est reconnu comme étant un nom propre dont l'informa-  then "Tokyo" is recognized as a proper name whose informa-

tion de particularité est inconnue (4314), et un traitement pour noms  special feature is unknown (4314), and processing for names

propres enregistrés dans Le dictionnaire est effectué (4316).  own saved in Dictionary is performed (4316).

L'organigramme passe à la figure 33. Puisque "In" qui occupe la partie précédente n'est pas un nom propre non enregistré  The flowchart goes to figure 33. Since "In" which occupies the previous part is not an unregistered proper name

(4200) et n'est pas un nom propre enregistré (4204), il est enre-  (4200) and is not a registered proper name (4204), it is registered

gistré comme nom propre possédant par lui-même une information de particularité, c'est-à-dire comme un nom propre dont l'informationd  registered as a proper name possessing specific information by itself, i.e. as a proper name whose informationd

particularité est inconnue (4216).particularity is unknown (4216).

On revient alors à la figure 32. La recherche dans le dictionnaire de référence 4020 est alors effectuée pour "Station  We then return to FIG. 32. The search in the reference dictionary 4020 is then carried out for "Station

(Gare)" (4106). Puisqu'il y a une rubrique d'entrée dans le dic-  (Station) "(4106). Since there is an entry section in the dictionary

tionnaire de référence 4020 pour "Station" (4108) et puisqu'il s'agit d'un nom propre (4110), un traitement pour noms propres  reference tenant 4020 for "Station" (4108) and since it is a proper name (4110), processing for proper names

enregistrés dans Le dictionnaire est effectué (4114). L'organi-  saved in The dictionary is performed (4114). The organization

gramme passe à la figure 33. Puisque "Tokyo", de la partie précé-  gram goes to figure 33. Since "Tokyo", from the previous part

dente, est un nom propre non enregistré (4200), l'ensemble "Tokyo Station (Gare de Tokyo)" est enregistré comme étant un nom propre qui présente, globalement, l'information de particularité "lieu, groupe" qui est celle de "Station" (4202). Ensuite, Le dictionnaire de référence 4020 est consulté, comme le montre la figure 32, pour "Mr." (4106). Puisque "Mr." possède une rubrique d'entrée dans le dictionnaire de référence 4020 et qu'il s'agit d'un nom propre (4110), Le traitement réservé aux noms propres enregistrés du dictionnaire est effectué (4114). Ensuite, l'organigramme passe à la figure 33. Puisque "Station", de la partie précédente, n'est pas un nom propre non enregistré (4200), mais un nom propre enregistré (4204), il a été déterminé que l'information de particularité  dente, is an unregistered proper name (4200), the whole "Tokyo Station (Tokyo Station)" is recorded as being a proper name which, globally, presents the specific information "place, group" which is that of "Station" (4202). Then, the reference dictionary 4020 is consulted, as shown in FIG. 32, for "Mr." (4106). Since "Mr." has an entry item in the reference dictionary 4020 and that it is a proper name (4110). The processing reserved for registered proper names of the dictionary is carried out (4114). Next, the flow chart proceeds to Figure 33. Since "Station" in the previous section is not an unregistered proper name (4200) but a registered proper name (4204), it has been determined that the specific information

(lieu, groupe) est connue (4206). Puisque "Mr." possède une infor-  (place, group) is known (4206). Since "Mr." has information

mation de particularité "personne" et n'est pas inconnue 44208), il est déterminé s'il s'agit ou non d'une partie commune pour l'information de nature entre "Station" de la partie précédente et "Mr." (4212). Puisque "Station" signifie "lieu, groupe", alors que "Mr." signifie "personne" et qu'il n'y a pas de partie commune entre eux, "Mr." est enregistré seul comme un nom propre ayant  particularity "person" and is not unknown 44208), it is determined whether or not it is a common part for information of a nature between "Station" from the previous part and "Mr." (4212). Since "Station" means "place, group", while "Mr." means "person" and there is no common part between them, "Mr." is registered alone as a proper name having

l'information de particularité d'une "personne" (4216).  particularity information for a "person" (4216).

Alors, l'organigramme revient à la figure 32, et le dic-  So the flowchart comes back to figure 32, and the dic-

tionnaire de référence 4220 est consulté pour "Walter" (4106).  reference shareholder 4220 is consulted for "Walter" (4106).

Puisqu'il existe une rubrique d'entrée pour "Walter" dans le dictionnaire de référence 4020 (4108) et qu'il s'agit d'un nom propre (4110), un traitement pour noms propres enregistrés dans le dictionnaire est effectué (4114). L'organigramme passe à la figure 33. Puisque "Mr." de la partie précédente n'est pas un nom propre non enregistré (4200) et est un nom propre enregistré (4204), et puisque l'information de particularité, celle d'une personne, n'est pas inconnue (4206) et que l'information de particularité de "Walter", qui se présente comme "personne, lieu, groupe" n'est pas  Since there is an entry item for "Walter" in the reference dictionary 4020 (4108) and it is a proper name (4110), processing for proper names registered in the dictionary is performed ( 4114). The flowchart goes to Figure 33. Since "Mr." of the previous part is not an unregistered proper name (4200) and is a registered proper name (4204), and since the information of particularity, that of a person, is not unknown (4206) and that the specific information of "Walter", which presents itself as "person, place, group" is not

non plus inconnue (4208), il est déterminé qu'il y a une partie com-  no longer unknown (4208), it is determined that there is a com-

mune pour l'information de particularité (4112). Puisque la partie "personne" est présente pour l'information departicularité, "Mr.Walter" est enregistré collectivement comme étant un nom composé qui possède  mune for specific information (4112). Since the "person" part is present for specific information, "Mr.Walter" is registered collectively as a compound name which has

l'information de particularité d'une "personne" (4214).  the specific information of a "person" (4214).

Ensuite, "met" est cherché dans le dictionnaire de réfé-  Then, "met" is looked up in the reference dictionary

rence 4020 et, puisqu'il existe une rubrique d'entrée (4108) et qu'il ne s'agit pas d'un nom propre (4110), les données trouvées dans le dictionnaire de référence 4020 sont enregistrées dans la table de mise en réserve d'information lexicographique 4036a  rence 4020 and, since there is an entry item (4108) and it is not a proper name (4110), the data found in the reference dictionary 4020 is recorded in the bet table in lexicographic information reserve 4036a

(4112).(4112).

Plus loin, "Johnson" est cherché dans le dictionnaire de référence 4020 (4106). Puisqu'il n'y a pas de rubrique d'entrée  Further on, "Johnson" is searched for in the reference dictionary 4020 (4106). Since there is no entry rubric

pour "Johnson" (4108) et que le premier caractère une lettre majus-  for "Johnson" (4108) and that the first character a letter uppercase-

cule (4116), le traitement des noms propres non enregistrés dans le dictionnaire est effectué (4120). Ensuite, l'organigramme passe à la figure 34. Puisque "met (rencontra)" de la partie précédente n'est pas susceptible de constituer la fin de la phrase (4300), il est déterminé que "met" n'est pas la fin de la phrase (4312), "Johnson" est considéré comme un nom propre ayant une information de particularité inconnue (4314) , et le traitement des noms propres enregistrés dans le dictionnaire est effectué (4316). Ensuite, l'organigramme passe à la figure 33. Puisque "met" de La partie précédente n'est ni un nom propre non enregistré (4200) , ni un nom propre enregistré (4204), "Johnson" est enregistré seul comme un  cule (4116), the proper names not registered in the dictionary are processed (4120). Next, the flow chart goes to Figure 34. Since "met (meet)" from the previous section is unlikely to constitute the end of the sentence (4300), it is determined that "met" is not the end of the sentence (4312), "Johnson" is considered as a proper name having information of unknown particularity (4314), and the processing of proper names registered in the dictionary is carried out (4316). Then the flowchart goes to Figure 33. Since "met" from The previous section is neither an unregistered proper name (4200), nor a registered proper name (4204), "Johnson" is recorded alone as a

nom propre dont l'information de particularité est inconnue.  proper name whose particularity information is unknown.

Une fois les traitements précédents effectués, l'informa-  Once the previous treatments have been carried out, the information

tion de particularité manquante est fournie au nom propre de la  the missing feature is provided in the proper name of the

manière indiquée sur la figure 35.  as shown in figure 35.

Le pointeur est positionné sur "In (Dans)" à l'unité de référence de dictionnaire supérieure (4400). Puisqu'il ne s'agit  The pointer is positioned at "In (In)" at the upper dictionary reference unit (4400). Since it is not

pas d'un nom propre (4402), le pointeur avance (4408) et se posi-  not a proper name (4402), the pointer advances (4408) and posi-

tionne sur "Tokyo Station (Gare de Tokyo)". Puisque "Tokyo Station" est un nom propre (4402) et que l'information de particularité n'est pas inconnue, car toute la partie "Tokyo Station" a été reconnue comme étant un lieu ou un groupe dans le précédent traitement des noms propres enregistrés (4404), le  operates on "Tokyo Station". Since "Tokyo Station" is a proper name (4402) and the information of particularity is not unknown, because the whole part "Tokyo Station" was recognized as being a place or a group in the previous treatment of proper names registered (4404), the

pointeur avance (4408) et se positionne sur "Mr. WaLter".  pointer advances (4408) and is positioned on "Mr. WaLter".

Puisque "Mr. Walter" est également un nom propre (4402) et que l'information de particularité n'est pas inconnue, (4404), le pointeur avance (4408). Puisque "met (rencontra)" n'est pas un nom propre (4402), le pointeur avance (4408). Puisque "Johnson" est un nom propre (4402) et que l'information de particularité est inconnue (4404), une information de particularité manquante est fournie (4406) et "Johnson" se trouve doté d'une information de particularité "personne, lieu, groupe et autres", comme indiqué sur  Since "Mr. Walter" is also a proper name (4402) and the information of particularity is not unknown, (4404), the pointer advances (4408). Since "met (meet)" is not a proper name (4402), the pointer advances (4408). Since "Johnson" is a proper name (4402) and the particularity information is unknown (4404), missing particularity information is provided (4406) and "Johnson" is provided with specificity information "person, location, group and others ", as shown on

la figure 36.Figure 36.

Comme décrit ci-dessus dans ce mode de réalisation, une phrase d'anglais d'entrée est divisée en ensembles de caractères de clé de consultation, pour lesquels sont ensuite effectuées des recherches dans le dictionnaire de référence 4020 et, s'il existe  As described above in this embodiment, an input English sentence is divided into sets of lookup key characters, which are then searched in the reference dictionary 4020 and, if there is one

une rubrique d'entrée pour nom propre dans le dictionnaire de réfé-  an entry item for proper name in the reference dictionary

rence 4020, le traitement pour noms propres enregistrés est effectué. Dans le traitement des noms propres enregistrés, il est tenu compte de l'ensemble de caractères de cLé de consultation précédent et, si l'ensemble de caractères de clé de consultation précédent est un nom propre, les informations de particularité de l'ensemble de caractères de clé de consultation précédent et au nom propre considéré sont examinées. S'il n'y a aucune information de  rence 4020, processing for registered proper names is carried out. In the processing of registered proper names, account is taken of the previous set of consultation key characters and, if the previous set of consultation key characters are a proper name, the specific information of the set of Previous lookup key characters and proper noun considered are examined. If there is no information from

particularité, d'autres informations de particularité sont pro-  particularity, other particularity information is pro-

duites, tandis que, si une quelconque information de particularité est présente pour l'ensemble et le nom, la partie commune est considérée comme l'information de particularité de ces noms  picks, while, if any particularity information is present for the set and the name, the common part is considered as the particularity information for these names

propres. Par conséquent, il est possible de doter de manière conve-  clean. Therefore, it is possible to endow appropriately

nable un nom propre ne possédant pas d'information de particularité d'une information de particularité appropriée, aussi bien que de restreindre de manière convenable l'information de particularité fournie à une information de particularité plus appropriée. Ceci permet une analyse plus effective lors de l'analyse syntaxique  nable a proper name not having information of particularity of an information of appropriate particularity, as well as to restrict in a suitable way the information of particularity provided to a information of particularity more appropriate. This allows more effective analysis during parsing

ultérieure et conduit à une traduction appropriée.  later and leads to an appropriate translation.

De plus, pour l'ensemble de caractères non enregistré dans le dictionnaire de référence 4020, si le premier caractère est une lettre majuscule et que l'ensemble de caractères précédent a été déterminé comme étant la fin de la phrase, puisque la lettre  In addition, for the character set not registered in the reference dictionary 4020, if the first character is an uppercase letter and the preceding character set has been determined to be the end of the sentence, since the letter

majuscule est transformée en une lettre minuscule et que le dic-  uppercase is transformed into a lowercase letter and that the dic-

tionnaire de référence 4020 est de nouveau consulté, il est possible d'effectuer également la consultation pour l'ensemble de caractères se trouvant en tête de la phrase dans le dictionnaire de référence 4020. De plus, dans le cas o un ensemble de caractères commençant par une lettre majuscule apparaît dans une autre partie que la tête de la phrase, il est déterminé comme étant un nom propre et l'information de particularité de ce nom propre est fournie par le moyen d'un nom propre possédant une information de particularité inscrite s'il en existe avant et après celuici. Par conséquent, il est possible d'analyser dans une certaine mesure un  reference 4020 is consulted again, it is also possible to consult for the set of characters at the head of the sentence in the reference dictionary 4020. In addition, in the case where a set of characters begins by a capital letter appears in a part other than the head of the sentence, it is determined as being a proper name and the information of particularity of this proper name is provided by means of a proper name having information of particularity registered if it exists before and after it. Therefore, it is possible to analyze to some extent a

nom propre non enregistré dans le dictionnaire de référence 4020.  proper name not registered in the reference dictionary 4020.

De plus, puisqu'un nom propre qui n'est pas doté d'une  In addition, since a proper name which does not have a

information de particulartité se voit fournir toutes les informa-  particularity information is provided with all information

tions de particularité utiles et que les informations de particu-  useful special features and that the particu-

larité inutiles sont retirées lors du traitement du mot, il est  unnecessary arity are removed when processing the word it is

26048 1426048 14

possible d'analyser un nom propre dont l'information de particula-  possible to analyze a proper name whose particular information

rité est inconnue ou un nom propre non enregistré.  rity is unknown or an unregistered proper name.

De plus, puisque plusieurs informations de particularité sont fournies à un nom propre spécifique et que les informations de  In addition, since several information of particularity is provided to a specific proper name and that information of

particularité appropriées sont choisies en fonction de l'informa-  appropriate features are selected based on the informa-

tion de particularité du nom propre se trouvant avant ou après  particularity of the proper name before or after

celui-ci, il est possible de choisir des informations de particu-  it is possible to choose particular information

larité appropriées dans le cas de l'analyse d'un nom propre possé-  the appropriateity in the case of the analysis of a proper noun posses-

dant plusieurs espèces d'informations de particularité en fonction de la relation qui existe avec d'autres mots placés avant et après celui-ci, ce qui autorise une analyse effective de la phrase fournie.  dant several kinds of information of particularity depending on the relationship that exists with other words placed before and after it, which allows an effective analysis of the sentence provided.

On va maintenant expliquer le cinquième mode de réali-  We will now explain the fifth mode of realization

sation de l'invention.sation of the invention.

La figure 38 iLLustre la structure générale du cinquième mode de réalisation de L'analyseur de langage selon L'invention,  FIG. 38 illustrates the general structure of the fifth embodiment of the language analyzer according to the invention,

appliquée à un dispositif de traduction automatique angLais-  applied to an angLais- machine translation device

japonais. Ce mode de réalisation comprend une section d'entrée  Japanese. This embodiment includes an input section

5010, et un texte d'anglais 5012 à traduire en japonais est intro-  5010, and an English text 5012 to translate into Japanese is intro-

duit par cette section. La section d'entrée 5010 peut comporter par exemple un clavier qui possède des touches de caractères, telles que des touches alphanumériques, ou des touches fonctionnelles, un dispositif de lecture optique de caractères (OCR) permettant de lire le texte d'anglais enregistré sur une feuille de papier, et, ou bien, un dispositif de mémoire à fichier permettant de lire le texte d'anglais enregistré sur un support de mémoire tel qu'un  duit by this section. The input section 5010 may for example comprise a keyboard which has character keys, such as alphanumeric keys, or functional keys, an optical character reading device (OCR) making it possible to read the English text recorded on a sheet of paper, and, or, a file memory device for reading English text saved on a memory medium such as a

support magnétique.magnetic support.

Le texte d'anglais fourni par la section d'entrée 5010  English text provided by entry section 5010

est lu dans une section de pré-mise en forme 5014 o un pré-  is read in a pre-shaping section 5014 o a pre-

traitement est effectué en vue de la traduction. Dans ce cas, la reconnaissance des phrases et les traitement des mots inconnus sont  processing is carried out for translation. In this case, recognition of sentences and processing of unknown words is

principalement effectués. Cette fonction est une partie de l'ana-  mainly performed. This function is part of the analysis.

lyse morphologique.morphological lysis.

Les données d'anglais pré-mises en forme sont transférées à une section d'analyse morphologique 5016 en même temps que l'information obtenue lors de la pré-mise en forme. La section 5016  The pre-formatted English data is transferred to a morphological analysis section 5016 at the same time as the information obtained during the pre-formatting. Section 5016

d'analyse morphologique divise les données en phrases en recher-  of morphological analysis divides the data into sentences in search

chant dans un dictionnaire de mots 5018, analyse morphologiquement la chaîne d'entrée, effectue le traitement de mots inconnnus, de noms propres, ainsi que divers agencements tels que l'expression du  song in a 5018 word dictionary, morphologically analyzes the input string, performs the processing of unknown words, proper names, as well as various arrangements such as the expression of

temps et des nombres, et effectue également les traitements concer-  time and numbers, and also performs the related processing

nant la phrase tout entière telle que la reconnaissance d'apposi-  the entire sentence such as recognition of apposi-

tions et d'interrogations de répétition, ou redondantes (que l'on désigne dans les grammaires anglaises sous l'appellation "tag questions". Les règles de l'analyse morphologique sont emmagasinées  repetitive or redundant questions and interrogations (which one designates in English grammars under the name "tag questions". The rules of morphological analysis are stored

dans un fichier de règles d'analyse 5036.  in an analysis rules file 5036.

Les données d'anglais venant après l'analyse morpholo-  The English data coming after the morpholo-

gique sont transférées à une section I d'analyse syntaxique 5020 en même temps que l'information du dictionnaire obtenue lors de l'analyse morphologique. La section I d'analyse syntaxique 5020 est une section fonctionnelle qui analyse la structure de surface de la phrase en appliquant des règles de grammaire aux données d'anglais  gics are transferred to a syntax analysis section I 5020 at the same time as the dictionary information obtained during the morphological analysis. Parsing section 5020 is a functional section which analyzes the surface structure of the sentence by applying grammar rules to English data

et en découvrant toutes les possibilités structurelles.  and discovering all the structural possibilities.

Les données d'anglais soumises à l'analyse syntaxique dans la section I d'analyse syntaxique 5020 sont envoyées, en même  The English data submitted for parsing in Section I parsing 5020 is sent, together

temps que l'information analysée, à une section II d'analyse syn-  time that the information analyzed, in a section II of syn-

taxique 5022, o une solution est choisie parmi les résultats de l'analyse syntaxique effectués en relation avec la structure de  taxic 5022, where a solution is chosen from the results of the syntactic analysis carried out in relation to the structure of

surface par la section I d'analyse syntaxique, au moyen de l'appli-  surface by section I syntactic analysis, by means of the appli-

cation d'une description structurelle. Un arbre d'analyse plausible  cation of a structural description. A plausible analysis tree

de la phrase d'anglais est donc préparé et sa structure est formée.  of the English sentence is therefore prepared and its structure is formed.

Les règles d'analyse syntaxique sont également emmagasinées dans le  Parsing rules are also stored in the

fichier de règles d'analyse 5036.analysis rule file 5036.

Après avoir été soumises à l'analyse syntaxique, les données d'anglais sont transférées, sous forme de données d'arbre d'analyse, à une section 5024 de transformation de structure. Dans la section de transformation de structure 5024, un arbre structurel de la phrase japonaise correspondante est préparé à partir de l'arbre structurel qui est une structure intermédiaire de la phrase d'anglais et est convertie en une structure sous-jacente de japonais à partir de laquelle la phrase de japonais peut être  After being subjected to parsing, the English data is transferred, in the form of analysis tree data, to a structure transformation section 5024. In the structure transformation section 5024, a structural tree of the corresponding Japanese sentence is prepared from the structural tree which is an intermediate structure of the English sentence and is converted into an underlying Japanese structure from from which the Japanese phrase can be

obtenue avec facilité.obtained with ease.

Les données relatives à l'arbre structurel indiquant la stucture sousjacente de japonais ayant ainsi été soumises à la transformation de structure sont envoyées à une section 5026 de formation de traduction, o une phrase traduite est produite. Il s'agit d'une section fonctionnelle qui produit une phrase de japonais à partir de la structure d'arbre de l'arbre structureL de japonais.  The data relating to the structural tree indicating the underlying Japanese structure having thus been subjected to the structural transformation are sent to a translation training section 5026, where a translated sentence is produced. This is a functional section that produces a Japanese sentence from the tree structure of the Japanese structureL tree.

Les données de japonais obtenues en résultat de la forma-  The Japanese data obtained as a result of the training

tion de la traduction, c'est-à-dire les données associées à la  tion of the translation, i.e. the data associated with the

2 6 0 4 8 1 42 6 0 4 8 1 4

phrase traduite, sont envoyées à une section 5030 de post-mise en forme. La section de post-mise en forme 5030 modifie les données traduites en cherchant dans un dictionnaire 5018 à l'aide de l'information utilisée dans le traitement de traduction afin d'aboutir à une phrase de japonais plus naturelle. Les données relatives à la phrase de japonais sont transférées à une section de sortie 5032 et délivrées, comme phrase de japonais traduite 5034,  translated sentence, are sent to a post-formatting section 5030. The post-formatting section 5030 modifies the translated data by searching in a dictionary 5018 using the information used in the translation processing in order to arrive at a more natural Japanese sentence. Data for the Japanese phrase is transferred to an output section 5032 and output, as a translated Japanese phrase 5034,

par la section de sortie 5032. La section de sortie 5032 peut com-  via the 5032 outlet section. The 5032 outlet section can

porter par exemple une imprimante, un afficheur, et un dispositif  wear for example a printer, a display, and a device

de mémoire à fichier, par exemple un disque magnétique.  from memory to file, for example a magnetic disk.

Le déroulement de la série des opérations de traduction est commandée par une section de commande 5038 qui gouverne la  The progress of the series of translation operations is controlled by a control section 5038 which governs the

commande du dispositif dans son ensemble.  control of the device as a whole.

Le dictionnaire de mots 5018 emmagasine des données de dictionnaire, ou données lexicographiques, relativement aux mots d'anglais et de japonais, et diverses informations y sont établies, telles que des relations de connexion, à savoir relations de coexistence, aussi bien que significations, formes du singulier et du pluriel, parties de discours, etc., en plus du vocabulaire. En outre, le fichier de règles d'analyse 5036 emmagasine des données  The word dictionary 5018 stores dictionary data, or lexicographic data, relative to English and Japanese words, and various information is established there, such as connection relationships, namely coexistence relationships, as well as meanings, singular and plural forms, parts of speech, etc., in addition to vocabulary. In addition, analysis rule file 5036 stores data

de règles pour L'analyse morphologique et l'analyse syntaxique.  rules for Morphological analysis and syntactic analysis.

La section de commande 5038 est connectée à une section  The control section 5038 is connected to a section

5040 d'affichage des opérations. La section d'affichage d'opéra-  5040 display of operations. The operation display section

tions 5040 possède des touches d'opération par lesquelles un opéra-  tions 5040 has operation keys by which an operation

teur peut fournir diverses indications au dispositif, par exemple une touche d'indication de traduction, une touche de curseur, etc., et un afficheur ou un indicateur qui affiche visuellement le texte d'anglais fourni, le texte de japonais qui est le résultat de la traduction, des données intermédiaires telles que des informations lexicologiques, diverses indications destinées à l'opérateur, etc. Le dispositif peut être constitué de façon que le plupart des fonctions d'indication d'opérations soient incorporées dans un clavier si celui-ci est disposé du côté de la section d'entrée 5010, ou bien dans un afficheur s'il est disposé du côté de la  can provide various indications to the device, for example a translation indication key, a cursor key, etc., and a display or indicator which visually displays the English text supplied, the Japanese text which is the result translation, intermediate data such as lexicological information, various indications intended for the operator, etc. The device can be constructed so that most of the operation indication functions are incorporated into a keyboard if this is arranged on the side of the input section 5010, or else into a display if it is arranged from the side of the

section de sortie 5032.outlet section 5032.

On se reporte ensuite à la figure 37, qui montre un exempLe de structures détaillées se rapportant au traitement des noms propres dans la section 5016 d'analyse morphologique. La section d'analyse morphologique 5016 est iLLustrée pour La partie qui possède un Lien direct avec La compréhension de l'invention, bien qu'elle possède naturellement d'autres sections fonctionnelles d'analyse. L'analyse morphologique s'effectue par le fait qu'il est donné instruction de rechercher dans le dictionnaire à partir deLa tête de l'ensemble de caractères d'entrée et en succession suivant  Reference is then made to FIG. 37, which shows an example of detailed structures relating to the treatment of proper names in section 5016 of morphological analysis. The morphological analysis section 5016 is illustrated for the part which has a direct link with the understanding of the invention, although it naturally has other functional analysis sections. Morphological analysis is carried out by the fact that instructions are given to search the dictionary from the head of the set of input characters and in following succession

l'ensemble de caractères de clé de consultation et que Le trai-  the set of consultation key characters and that The

tement est exécuté pour l'information LexicoLogique obtenue sur  is executed for the LexicoLogical information obtained on

cette base en provenance de la section de consultation du diction-  this base coming from the consultation section of the diction-

naire 5104 en fonction de l'information de position du nom propre,  naire 5104 according to the position information of the proper name,

comme décrit ci-après.as described below.

La section d'analyse morphologique 5016 possède une section de traitement d'entrée 5100 servant à recevoir les données relatives à l'ensemble de caractères d'entrée qui sont fournies par la section de pré-traitement 5014 et à effectuer le traitement d'entrée. La section de traitement d'entrée 5100 est dotée d'un tampon d'ensemble de caractères d'entrée qui reçoit les données de L'ensemble de caractères d'anglais sous la forme d'une donnée de code, par exemple Le code ASCII, et qui accumule temporairement les  The morphological analysis section 5016 has an input processing section 5100 used to receive the data relating to the set of input characters which are supplied by the pre-processing section 5014 and to perform the input processing . The input processing section 5100 is provided with an input character set buffer which receives the data from the English character set in the form of code data, for example the ASCII code. , and which temporarily accumulates

données de l'ensemble de caractères.  character set data.

Les données relatives à l'ensemble de caractères d'entrée qui sont temporairement emmagasinées dans la section de traitement d'entrée 5100 sont envoyées à une section de découpage d'unités 5012 qui découpe tes donnéesen unités de référence du dictionnaire, par exemple des mots. La section de découpage d'unités 5102 est une section fonctionnelle qui fait la distinction entre les unités de référence du dictionnaire constituant les ensembles de caractères de clé de consultation lors de la consultation ultérieure du dictionnaire 5018 dans la section de consultation du dictionnaire 5104. Les délimiteurs de références qui sont utilisés dans le trai-  The data relating to the set of input characters which are temporarily stored in the input processing section 5100 is sent to a unit splitting section 5012 which splits your data into reference units of the dictionary, for example words . The 5102 unit splitting section is a functional section which distinguishes between the dictionary reference units constituting the sets of consultation key characters when the dictionary 5018 is subsequently consulted in the consultation section of the 5104 dictionary. reference delimiters which are used in the treatment

tement de découpage des unités de référence du dictionnaire sont  the dictionary reference units are

placés à la position du caractère d'anglais, du nombre, de l'apos-  placed in the position of English character, number, apos-

trophe, des caractères autres que le trait d'union et le point, aussi bien que de L'apostrophe faisant suite à un caractère de vacance. Ils sont emmagasinés dans une table de délimiteurs 5108 à Laquelle iL est fait référence lors du découpage des unités de référence du dictionnaire dans La section du découpage d'unités 5102.  trophe, characters other than the hyphen and the point, as well as the apostrophe following a vacancy character. They are stored in a delimiter table 5108 to which iL is referenced when cutting the reference units from the dictionary in the section for cutting units 5102.

Le dictionnaire de référence 5018 emmagasiné en particu-  The reference dictionary 5018 stored in particular

lier l'information destinées à La recherche de l'unité de décou-  link the information intended for the search for the discovery unit

page. Par exemple, comme représenté sur La figure 38, pour l'exemple de l'information associé à La rubrique d'entrée, une information grammaticale, telle que la partie de discours, est contenue dans chacune des unités de référence du dictionnaire, par exemple la rubrique d'entrée d'un mot. L'information de partie de discours contient, pour le nom, une indication précisant s'il s'agit d'un nom propre ou d'un nom commun. Pour le nom propre, une  page. For example, as shown in FIG. 38, for the example of the information associated with the entry heading, grammatical information, such as the speech part, is contained in each of the reference units of the dictionary, for example the entry section of a word. The speech part information contains, for the name, an indication specifying whether it is a proper name or a common name. For the proper name, a

indication de distinction montrant la manière de limiter la posi-  indication of distinction showing how to limit the posi-

tion dans la phrase, c'est-à-dire une information de position rela-  tion in the sentence, that is to say relative position information

tive au nom propre, est emmagasinée. Ceci sera décrit plus parti-  tive in the proper name, is stored. This will be described more particularly

culièrement ci-après. Sont également enregistrées d'autres informa-  especially below. Other information is also recorded.

tions, comme par exemple le caractère de comptabilité ou de non-  such as the character of accounting or non-accounting

comptabilité d'un nom, le caractère distinctif de transitivité ou d'intransitive d'un verbe, la traduction du mot, etc. Il existe quatre types d'informations de position pour le nom propre, à savoir des configurations "0" à "3" dans le présent mode de réalisation. La configuration "0" indique un nom propre qui n'est soumis à aucune restriction de position, par exemple "City  accounting of a noun, the distinctive character of transitivity or intransitive of a verb, translation of the word, etc. There are four types of position information for the proper name, namely configurations "0" to "3" in this embodiment. Configuration "0" indicates a proper name which is not subject to any position restriction, for example "City

(Cité ou Ville)" ou le nom d'une personne "Walter". La configura-  (City or City) "or the name of a person" Walter ".

tion "1" indique qu'il s'agit d'un nom propre, par exemple "Mr.", situé en tête d'un nom propre isoLé, ou bien une succession de plusieurs noms propres, c'est-à-dire un nom propre qui est agencé en un groupe unique de noms propres. La configuration "2" indique qu'il s'agit d'un nom propre, par exemple "Station (Gare)" ou bien "Bay (Baie)", situé à la fin d'un nom propre isoLé, ou d'un nom propre qui a été agencé en un seul mot formant un groupe de noms propres, et qui n'entre pas dans le cas de la configuration "3" décrite ci-après. La configuration "3" indique qu'il s'agit d'un nom propre, comme par exemple "River (Rivière)" dans "the Sumida River (La Rivière Sumida)", qui est analogue à la configuration "2", mais est accompagné par l'article défini "the (le, la ou les)" en tête d'un nom propre arrangé de manière à former une unité  tion "1" indicates that it is a proper name, for example "Mr.", located at the head of an isolated proper name, or else a succession of several proper names, that is to say a proper name which is arranged in a unique group of proper names. Configuration "2" indicates that it is a proper name, for example "Station (Station)" or "Bay (Bay)", located at the end of an isolated proper name, or a proper name which has been arranged in a single word forming a group of proper names, and which does not enter into the case of configuration "3" described below. The configuration "3" indicates that it is a proper name, such as "River (Rivière)" in "the Sumida River (La Rivière Sumida)", which is similar to the configuration "2", but is accompanied by the definite article "the (the, the or them)" at the head of a proper name arranged so as to form a unit

sur la base d'un groupe de noms propres.  based on a group of proper names.

La section de consultation du dictionnaire 5104 est une section fonctionnelle qui prélève une information lexicologique en consultant le dictionnaire de mots 5013 sur la base de l'ensemble de caractères de clé de consultation fourni par la section de découpage d'unités 5102 et la transfère à la table de mise en  The consultation section of the dictionary 5104 is a functional section which takes lexicological information by consulting the word dictionary 5013 on the basis of the set of consultation key characters provided by the unit cutting section 5102 and transfers it to the setting table

réserve d'information lexicologique 5124, à la section de traite-  lexicological information reserve 5124, in the processing section

ment d'information de position 5110 et à la section de détermina-  position information 5110 and to the determination section

tion de la fin de la phrase précédente 5112.  tion of the end of the preceding sentence 5112.

Le traitement utilisant les configurations "0" à "3" en fonction de l'information de position des noms propres recherchés  Processing using configurations "0" to "3" depending on the position information of the proper names sought

dans le dictionnaire 5018 est effectué par les sections de traite-  in dictionary 5018 is done by the milking sections

ment de noms propres 5114, 5116 et 5118. Le traitement des noms propres est effectué en relation avec la configuration I dans la section de traitement de noms propres5114, en relation avec les configurations 2 et 3 dans la section de traitement de noms propres 5116 et en relation avec la configuration 0 dans les sections de  proper names ment 5114, 5116 and 5118. The proper names are processed in connection with configuration I in the proper names processing section 5114, in connection with configurations 2 and 3 in the proper names processing section 5116 and in connection with configuration 0 in the sections of

traitement de noms propres 5118 et 5114.  processing of proper names 5118 and 5114.

Dans ce mode de réalisation, on réalise l'agencement collectif des noms propres en utilisant, comme clé, un mot qui est une partie de l'ensemble de noms propres groupés en un seul nom propre et qui subit une restriction de position lorsqu'il est agencé en tant que nom propre. Ainsi, même si plusieurs noms propres sont présents de façon continue, on peut les agencer de  In this embodiment, the collective arrangement of proper names is carried out using, as a key, a word which is a part of the set of proper names grouped into a single proper name and which is subject to a position restriction when it is arranged as a proper name. Thus, even if several proper names are present continuously, we can arrange them by

manière appropriée en relation avec le contexte sans faire l'agen-  appropriately in relation to the context without doing the agen-

cement erroné qui consiste à toujours les agencer simplement comme un seul groupe de noms propres. Dans ce but, le traitement est effectué par les sections de traitement de noms propres 5114, 5116  erroneous cement which consists in always arranging them simply as a single group of proper names. For this purpose, processing is carried out by the proper names processing sections 5114, 5116

et 5118.and 5118.

Dans une certaine mesure, les noms propres sont enregis-  To a certain extent proper names are registered

trés dans le dictionnaire de référence 5018. Ces noms propres enregistrés dans le dictionnaire sont soumis à une analyse dans la section de traitement d'information de position 5110 et dans les  very in the reference dictionary 5018. These proper names registered in the dictionary are subjected to an analysis in the position information processing section 5110 and in the

sections de traitement de noms propres 5114, 5116 et 5118. CeLles-  proper names processing sections 5114, 5116 and 5118. CeLles-

ci constituent une section de traitement des noms propres enregis-  these constitute a section for processing registered proper names

trés dans le dictionnaire. Les noms propres non enregistrés dans le dictionnaire 5018 sont analysés dans la section de détermination de  trés in Dictionary. Proper names not registered in the 5018 dictionary are analyzed in the determination section.

la fin de la phrase précédente 5112 et dans la section de traite-  the end of the previous sentence 5112 and in the milking section

ment de noms propres à configuration "0" 5118. Celles-ci consti-  names proper to configuration "0" 5118. These consist of

tuent la section de traitement des noms propres non enregistrés  kill the processing section of unregistered proper names

dans le dictionnaire.in Dictionary.

Le traitement appliqué à un nom propre est effectué suivant les deux étapes ci-dessous présentées. Tout d'abord, un nom propre appartenant à un ensemble de caractères d'entrée est reconnu. Dans le cas d'un mot enregistré dans le dictionnaire 5018, ceci se réalise par le fait que le nom propre est indiqué dans son information d'activation de morphème. De plus, dans le cas d'un mot non enregistré dans le dictionnaire 5018, ceci se réalise par le fait que le caractère situé en tête est une lettre majuscule anglaise, par exemple "John" ou "U.S.", etc.  The processing applied to a proper name is carried out according to the two stages below presented. First, a proper name belonging to a set of input characters is recognized. In the case of a word recorded in the dictionary 5018, this is achieved by the fact that the proper name is indicated in its morpheme activation information. In addition, in the case of a word not registered in the 5018 dictionary, this is accomplished by the fact that the character located at the head is an English capital letter, for example "John" or "U.S.", etc.

Ensuite, un groupe de noms propres est soumis à un agen-  Then a group of proper names is submitted to an agent.

cement collectif qui va transformer la partie considérée toute entière en un unique nom propre. Lorsque celui-ci est reconnu comme un nom propre à l'aide de l'information du dictionnaire et si la nouvelle unité de référence du dictionnaire est également un nom propre, toute la partie considérée est collectivement synthétisée  collective cement which will transform the whole part considered into a single proper name. When the latter is recognized as a proper name using the dictionary information and if the new dictionary reference unit is also a proper name, the whole part considered is collectively synthesized

en un seul nom propre.in one proper name.

Par exemple, "M. Weber" est analysé comme étant un seul nom propre. Le résultat de cette analyse conduit à une forme  For example, "Mr. Weber" is analyzed as a single proper name. The result of this analysis leads to a form

susceptible d'être regroupée en une expression idiomatique compor-  capable of being grouped into an idiomatic expression comprising

tant des noms propres lors de l'analyse locale.  both proper names during local analysis.

Ensuite, il est effectué une nécessaire analyse locale.  Then a necessary local analysis is carried out.

Dans ce cas, une succession d'unités d'analyse activées par l'adjonction d'une information d'activation de morphème pour chacune des unités d'analyse sont collectivement agencées en une seuLe unité d'analyse grâce à L'emploi d'une règle d'analyse Locale, et, par exemple, un agencement est effectué. Par exemple "Mr. Brown" est collectivement agencé en "Brown shi". De plus, des mots constituant une partie d'un nom géographique sont également agencés collectivement. Par exemple, "Lake Biwa (Lac Biwa)" est collectivement agencé en "Biwaco". De la même manière, des mots qui  In this case, a succession of analysis units activated by the addition of morpheme activation information for each of the analysis units are collectively arranged in a single analysis unit thanks to the use of a Local analysis rule, and, for example, an arrangement is made. For example "Mr. Brown" is collectively arranged in "Brown shi". In addition, words constituting part of a geographical name are also arranged collectively. For example, "Lake Biwa (Lake Biwa)" is collectively arranged in "Biwaco". Likewise, words that

constituent une partie d'un nom de groupe sont également collec-  form part of a group name are also collected

tivement agencés. Par exemple, "Yale University (Université de  tively arranged. For example, "Yale University (University of

Yale)" est analysé comme étant "Yale Daigaku".  Yale) "is analyzed as" Yale Daigaku ".

Dans le cas du nom propre "Mr...." ou "Lake...", juste avant le mot, il existe toujours une fin eu égard au contexte. Par conséquent, dans la phrase d'anglais "With Tom Mr. Brown went to...", il existe une certaine forme de fin entre "Tom" et "Mr." eu égard au contexte. Par conséquent, si "Tom Mr. Brown" était agencé collectivement en un seul nom propre, une erreur serait produite lors de l'analyse ultérieure. Par exemple, le nom propre "University" est toujours suivi d'une fin, venant juste après. Par exemple, dans la phrase d'anglais "At Yale University Tom is...", il est reconnu qu'il existe une ponctuation entre "University" et  In the case of the proper name "Mr ...." or "Lake ...", just before the word, there is always an end having regard to the context. Therefore, in the English phrase "With Tom Mr. Brown went to ...", there is some form of ending between "Tom" and "Mr." having regard to the context. Therefore, if "Tom Mr. Brown" was collectively arranged under one proper name, an error would be produced in the subsequent analysis. For example, the proper name "University" is always followed by an end, coming immediately after. For example, in the English phrase "At Yale University Tom is ...", it is recognized that there is punctuation between "University" and

"Tom". Dans ce mode réalisation, l'information relative à la posi-  "Tom". In this embodiment, the information relating to the posi-

tion o des noms propres respectifs d'une succession de noms propres subissent une restriction de position est emmagasinée dans le dictionnaire 5018 au titre d'une information de position telle que ci- dessus décrite, c'est-à-dire par les configurations "0" à  tion o of the respective proper names of a succession of proper names undergo a position restriction is stored in the dictionary 5018 as position information as described above, that is to say by the configurations " 0 "to

"3". L'agencement collectif qui utilise ces informations de posi-  "3". The collective arrangement which uses this position information

tion est effectué dans les sections de traitement 5110, 5112, 5114, 5116 et 5118. Les informations lexicologiques se rapportant à l'ensemble de caractères d'entrée sont, une fois ces traitements terminés, emmagasinées dans le tampon d'informations lexicologiques consultées, c'est-à-dire la table de mise en réserve d'information  tion is carried out in processing sections 5110, 5112, 5114, 5116 and 5118. The lexicological information relating to the set of input characters is, once these treatments are completed, stored in the lexicological information buffer consulted, that is to say the information storage table

lexicologique 5124.lexicological 5124.

Le résultat de l'analyse morphologique est transféré de la table de mise en réserve d'information lexicologique 5124 à la  The result of the morphological analysis is transferred from the lexicological information storage table 5124 to the

section I d'analyse syntaxique 5020.  section I parsing 5020.

Le traitement utiLisant l'information de position du nom propre est effectué via La séquence présentée sur la figure 40. Le traitement initial est effectué par La réception des données de L'ensemble de caractères d'entrée dans La section de traitement d'entrée 5100 (5200). Ensuite, la section de découpage d'unités 5102 découpe l'ensemble de caractères d'entrée en unités de  The processing using the proper noun position information is performed via the sequence shown in Figure 40. The initial processing is performed by receiving the data from the input character set in the input processing section 5100 (5200). Next, the unit splitting section 5102 splits the set of input characters into units of

référence du dictionnaire en vue de la recherche dans le diction-  dictionary reference for diction search-

naire 5018 (5201). La section de consultation du dictionnaire 5104 recherche dans le dictionnaire 5018 sur la base ainsi énoncée (5203) et, s'il existe une rubrique d'entrée du dictionnaire  Mayor 5018 (5201). Dictionary lookup section 5104 searches dictionary 5018 on the basis thus stated (5203) and, if there is a dictionary entry field

(5204), elle examine la partie de discours qu'elle contient (5205).  (5204), she examines the part of speech that it contains (5205).

Si la partie de discours n'est pas un nom propre, le traitement  If the speech part is not a proper name, the processing

réservé au nom propre dans ce mode de réalisation n'est pas effec-  reserved to the proper name in this embodiment is not effective

tué, mais l'information lexicographique est emmagasinée dans latable de mise en réserve d'information lexicographique 5124 (5206). S'il s'agit d'un nom propre, le traitement des noms propres enregistrés dans le dictionnaire 5207 est effectué dans la section 5110 de traitement d'information de position et dans les sections 5114,  killed, but the lexicographic information is stored in the lexicographic information storage table 5124 (5206). If it is a proper name, proper names stored in dictionary 5207 are processed in section 5110 of position information processing and in sections 5114,

5116 et 5118 de traitement des noms propres. Lorsque ces traite-  5116 and 5118 for processing proper names. When these treat-

ments ont été effectués jusqu'à la position finale de la phrase indiquée par les données pour l'ensemble de caractères d'entrée (5202), le résultat de l'analyse morphologique est délivré à la  have been made up to the final sentence position indicated by the data for the input character set (5202), the result of the morphological analysis is delivered to the

section I d'analyse syntaxique de la phrase 5020 (5210).  syntax analysis section I of sentence 5020 (5210).

En résultat de la consultation du dictionnaire, s'il n'y a pas de rubrique d'entrée à l'étape 5204 et si l'éLément commence par une lettre majuscule (5212), il est reconnu comme étant un nom propre non enregistré dans le dictionnaire et le traitement réservé aux noms propres non enregistrés dans le dictionnaire 5213 est  As a result of consulting the dictionary, if there is no entry item at step 5204 and if the element begins with a capital letter (5212), it is recognized as being an unregistered proper name in the dictionary and the treatment of proper names not registered in the dictionary 5213 is

effectué dans la section 5112 de détermination de la partie précé-  performed in section 5112 determining the previous part

dente et dans la section 5118 de traitement des noms propres. Si le caractère initial n'est pas une lettre majuscule, puisqu'il s'agit d'un nom non enregistré dans le dictionnaire 5018, il est mis en réserve, au titre de mot non enregistré, dans la table de mise en réserve d'information lexicographique 5124 (5214). Ce traitement  dente and in section 5118 on proper names treatment. If the initial character is not an uppercase letter, since it is a name not registered in the dictionary 5018, it is placed in reserve, as an unregistered word, in the reserve table d lexicographic information 5124 (5214). This treatment

est exécuté jusqu'à la position finale (5202).  is executed up to the final position (5202).

Le traitement des noms propres enregistrés dans Le dictionnaire 5207 est effectué dans Les sections de traitement 5110, 5114, 5116 et 5118 suivant l'organigramme présenté sur la figure 41. Tout d'abord, il est fait référence à l'information de  The processing of proper names recorded in Dictionary 5207 is carried out in Processing sections 5110, 5114, 5116 and 5118 according to the flow chart presented in FIG. 41. First of all, reference is made to the information of

position obtenue qui est contenue dans l'information lexicogra-  position obtained which is contained in the lexicogra- information

phique. Ensuite, le traitement des noms propres 5221 pour la confi-  phique. Then, the processing of proper names 5221 for the confi-

guration 0 est effectué s'il est indiqué une configuration "0", le traitement des noms propres 5222 est effectué pour la configuration 1 s'il est indiqué une configuration "1", et le traitement des noms propres 5223 est effectué pour les configurations 2 ou 3 s'il est  guration 0 is carried out if a configuration "0" is indicated, the processing of proper names 5222 is carried out for configuration 1 if it is indicated a configuration "1", and the processing of proper names 5223 is carried out for configurations 2 or 3 if it is

indiqué respectivement une configuration "2" ou "3".  indicated respectively a configuration "2" or "3".

Le traitement des noms propres 5221 pour la configura-  The processing of proper names 5221 for the configuration

tion 0 est exécuté dans la section de traitement 5114. Le traite-  tion 0 is executed in processing section 5114. Processing

ment est appliqué à un nom propre qui ne comporte aucune restric-  ment is applied to a proper name which contains no restrictions

tion de position. Tout d'abord, si une partie précédent l'unité de référence du dictionnaire est un nom propre non enregistré (5230), la partie toute entière est collectivement agencée en un nom propre dans l'information de position de nom propre, soit "pos",est "1" et elle est emmagasinée dans la table de mise en réserve d'information Lexicographique 5124 (5233). Si la partie précédente est un nom propre dont l'information de position, soit "pos", vaut "1" (5231),  position. First of all, if a part preceding the reference unit of the dictionary is an unregistered proper name (5230), the whole part is collectively arranged in a proper name in the proper noun position information, ie "pos ", is" 1 "and it is stored in the Lexicographic information storage table 5124 (5233). If the previous part is a proper noun whose position information, ie "pos", is equal to "1" (5231),

te traitement s'effectue de la même manière.  The treatment is carried out in the same way.

* Si la partie précédente est un nom propre ayant une information de position "O" (5231), la partie toute entière est collectivement agencée en un nom propre ayant l'information de position "0" et est emmagasinée dans la table de mise en réserve d'information du dictionnaire 5124 (5235) . De plus, si la partie* If the previous part is a proper name having position information "O" (5231), the entire part is collectively arranged in a proper name having position information "0" and is stored in the layout table. Dictionary information reserve 5124 (5235). In addition, if the party

précédente n'est pas un nom propre ayant une information de posi-  previous is not a proper noun having position information

tion "0", la partie toute entière est emmagasinée seule comme un nom propre ayant une information de position "0" dans la table de mise  tion "0", the entire game is stored alone as a proper name with position information "0" in the betting table

en réserve d'information lexicographique 5124 (5134).  in lexicographic information reserve 5124 (5134).

Le traitement des noms propres 5222 relativement à la configuration 1 s'effectue de la manière décrite ci-dessous. Ce  The processing of proper names 5222 relative to configuration 1 is carried out as described below. This

traitement est appliqué à un nom propre tel que par exemple "Mr."  processing is applied to a proper name such as for example "Mr."

qui est disposé en position de tête d'un nom propre isolé ou bien en  which is arranged in the head position of an individual proper name or else in

2 6 0 4 8 1 42 6 0 4 8 1 4

tête d'un nom propre agencé en un seul groupe à partir d'une suc-  head of a proper name arranged in a single group from a success-

cession de plusieurs noms propres. Tout d'abord, si la partie précédant l'unité de référence du dictionnaire considérée est un nom propre non enregistré (5240), le mot est transformé en non  transfer of several proper names. First of all, if the part preceding the reference unit of the dictionary considered is an unregistered proper name (5240), the word is transformed into non

enregistré (5241). S'il ne s'agit pas d'un nom propre non enregis-  registered (5241). If it is not an unregistered proper name

tré, il est emmagasiné seul, comme nom propre qui possède une information de position "pos" valant "1" dans la table de mise en  very, it is stored alone, as a proper name which has position information "pos" worth "1" in the layout table

réserve d'information lexicographique 5124 (5242).  lexicographic information pool 5124 (5242).

On va maintenant apporter des explications pour ce qui  We will now provide explanations for what

concerne le traitement des noms propres 5223 pour les configura-  concerns the treatment of proper names 5223 for configura-

tions 2 et 3, en relation avec la figure 44. Le traitement est appliqué par exemple à un nom propre tel que "Station (Gare)" ou "River (Rivière)" qui est situé à la fin d'un nom propre isolé ou d'un nom propre agencé en un seul groupe à partir d'une succession de plusieurs noms propres. Tout d'abord, si la partie précédant l'unité de référence du dictionnaire considérée est un nom propre non enregistré (5250), elle est collectivement agencée avec le mot précédent pour former un nom propre possédant, comme information de position de nom propre "pos" une information de position de nom propre "pos-self" qui lui est particulière, et elle est emmagasinée dans la table de mise en réserve d'information lexicographique 5124 (5225). De plus, le traitement est effectué de la même manière si  2 and 3, in relation to FIG. 44. The processing is applied for example to a proper name such as "Station (Gare)" or "River (Rivière)" which is located at the end of an isolated proper name or of a proper name arranged in a single group from a succession of several proper names. First of all, if the part preceding the reference unit of the dictionary considered is an unregistered proper name (5250), it is collectively arranged with the preceding word to form a proper name having, as proper name position information " pos "proper position-specific position information" pos-self ", and it is stored in the lexicographic information storage table 5124 (5225). In addition, the processing is carried out in the same way if

la partie précédente est un nom propre ayant l'information de posi-  the previous part is a proper name with position information

tion "1" (5251)."1" (5251).

Si la partie précédente n'est pas un nom propre ayant l'information de position "0" (5252), elle est collectivement agencée seule en un nom propre possédant, comme information de position de nom propre, une information de position de nom propre "pos-self" qui lui est particulière, et elle est emmagasinée dans la table de mise en réserve d'information lexicographique 5124  If the previous part is not a proper name having position information "0" (5252), it is collectively arranged alone in a proper name having, as proper name position information, proper name position information "pos-self" which is specific to it, and it is stored in the lexicographic information storage table 5124

(5257).(5257).

A l'étape 5252, si la partie précédente est un nom propre ayant l'information de position "O", l'information de position de nom propre "pos-self" qui lui est particulière est vérifiée (5253), et le traitement 5255 est effectué s'il s'agit de la configuration  In step 5252, if the preceding part is a proper name having the position information "O", the proper position position information "pos-self" which is specific to it is checked (5253), and the processing 5255 is performed if it is the configuration

2 6 0 4 8 1 42 6 0 4 8 1 4

"2". Si l'information de position de nom propre "pos-self" qui lui est particulière est la configuration "3", il est en outre vérifié  "2". If the proper position-specific position information "pos-self" is configuration "3", it is also checked

si l'élément qui se trouve avant l'unité de référence du diction-  if the element before the diction reference unit-

naire est ou non "the (le, la ou les)". S'il ne s'agit pas de l'article défini "the", le traitement 5255 est effectué. S'il s'agit de "the", le groupe qui va de "the" à l'élément particulier est agencé collectivement en un nom propre ayant l'information de position de nom propre "3" et il est emmagasiné dans la table de  naire is or is not "the (le, la or les)". If it is not the defined article "the", processing 5255 is carried out. If it is "the", the group going from "the" to the particular element is collectively arranged in a proper name having the proper noun position information "3" and it is stored in the table of

mise en réserve d'information lexicographique 5124 (5256).  storage of lexicographic information 5124 (5256).

Pour un mot commençant par une lettre majuscule et  For a word starting with a capital letter and

reconnu comme étant un mot non enregistré pour lequel aucune ru-  recognized as an unregistered word for which no word

brique d'entrée n'a été obtenue dans le dictionnaire de référence  input brick was only obtained in the reference dictionary

5018 à la suite de la consultation du dictionnaire 5203, l'organi-  5018 following consultation of the dictionary 5203, the organization

gramme passe,via les étapes 5204 et 5212, au traitement 5213, et le traitement 5213 est exécuté dans la section 5112 de détermination de fin de phrase précédente. Tout d'abord, si la partie précédant  gram passes, via steps 5204 and 5212, to processing 5213, and processing 5213 is executed in the preceding end of sentence determination section 5112. First of all, if the previous part

l'unité de référence du dictionnaire considérée n'est pas suscep-  the dictionary reference unit considered is not suscep-

tible de faire la fin de la phrase, le traitement de noms propres 5221 relatif à la configuration 0, tel que ci-dessus décrit, est  tible to make the end of the sentence, the processing of proper names 5221 relating to configuration 0, as described above, is

effectué dans la section de traitement 5118.  performed in processing section 5118.

La partie précédente peut être susceptible de constituer la fin de la phrase dans les quatre cas suivants. Tout d'abord, il y a Le cas o un point distinct "." est présent. Ensuite, il y a le cas o la rubrique d'entrée précédente comporte un point à la fin et o l'information de position du nom propre n'est pas "1". Ce cas comporte par exemple les abréviations telles que "U.S.A.". En outre, il y a le cas du signe "deux points" noté ":", le cas du point -virgule ";", celui de la succession d'un point et d'une apostrophe ".'" et celui de la succession d'un point et d'un guillemet "."". Ce dernier cas est celui correspondant à la tête du  The preceding part may be likely to constitute the end of the sentence in the following four cases. First, there is The case where a separate point "." is present. Then there is the case where the previous entry item has a period at the end and where the position information of the proper name is not "1". This case includes for example abbreviations such as "U.S.A.". In addition, there is the case of the sign "two points" noted ":", the case of the semicolon ";", that of the succession of a point and an apostrophe ". '" And that of the succession of a point and a quotation mark "." ". This last case is that corresponding to the head of the

tampon d'ensemble de caractères d'entrée.  input character set buffer.

Si la partie précédente est l'un des quatre cas ci-dessus  If the previous part is one of the four cases above

mentionnés, cette partie précédente, qui est susceptible de consti-  mentioned, this previous part, which is likely to constitute

tuer la fin de la phrase, est reconnue comme étant effectivement la fin de la phrase (5261) et le dictionnaire est consulté après transformation de La lettre majuscule de ce mot en une minuscule (5262). En résultat de la consultation, Lorsqu'il est obtenu une  kill the end of the sentence, is recognized as effectively being the end of the sentence (5261) and the dictionary is consulted after transformation of the capital letter of this word into a lowercase (5262). As a result of the consultation, When a

rubrique d'entrée dans Le dictionnaire (5263), Le mot est enregis-  entry entry in The dictionary (5263), The word is saved

tré dans La table de mise en réserve du dictionnaire 5124 (5264).  very in Dictionary storage table 5124 (5264).

Si tel n'est pas Le cas, iL est enregistré dans La table de mise en réserve du dictionnaire 5124 comme nom propre non enregistré, c'est-àdire non inscrit, Le caractère placé en tête restant  If this is not the case, iL is recorded in the reserve table of the dictionary 5124 as an unregistered proper name, that is to say not registered, the character placed at the head remaining

inchangé, c'est-à-dire restant une Lettre majuscule (5265).  unchanged, i.e. remaining a capital letter (5265).

On va maintenant fournir des explications en se reportant à un exemple. Par exemple, Lorsqu'iL est fait appel au dictionnaire pour un ensemble de caractères d'entrée tel que "Along the Sumida River Paul and Mr. Gold Smith went... (Le long de la Rivière Sumida Paul et Mr. Gold Smith aLLèrent...)", L'information d'entrée du dictionnaire est d'abord écrite dans la table de mise en réserve d'information lexicographique 5124, comme représenté sur la figure 46A. En ce qui concerne par exemple "the (la)", la position initiale dans la phrase est "7" et la position finale est "9", et la partie de discours s'appelle un article défini. Aucune rubrique d'entrée en peut être obtenue pour le mot "Along (Le long de)" pour la position de tête de l'ensemble de caractères d'entrée lors de la consultation du dictionnaire 5203, et ce mot est déterminé comme n'étant pas inscrit. Toutefois, puisque la partie précédente peut satisfaire les conditions propres à la fin d'une phrase, car il se trouve en haut, ou en tête, du tampon d'entrée (5260), la lettre majuscule "A" se trouvant en tête est transformée en un caractère minuscule et la recherche dans le dictionnaire 5262 conduit à "along".  We will now provide explanations with reference to an example. For example, when using the dictionary for a set of input characters such as "Along the Sumida River Paul and Mr. Gold Smith went ... (Along the Sumida River Paul and Mr. Gold Smith went ...) ", The dictionary input information is first written to the lexicographic information storage table 5124, as shown in Figure 46A. Regarding for example "the (la)", the initial position in the sentence is "7" and the final position is "9", and the speech part is called a definite article. No entry rubric can be obtained for the word "Along" for the head position of the input character set when consulting the dictionary 5203, and this word is determined as n ' being not registered. However, since the previous part can satisfy the conditions specific to the end of a sentence, because it is at the top, or at the top, of the input buffer (5260), the capital letter "A" at the top is transformed into a lowercase character and searching the 5262 dictionary leads to "along".

Ensuite, le pointeur est incrémenté ppur passer au trai-  Then, the pointer is incremented to pass to the process.

tement de "Sumida". Dans ce mode de réalisation, ce mot n'est pas inscrit dans le dictionnaire 5018. Puisque la partie précédente  "Sumida". In this embodiment, this word is not included in the dictionary 5018. Since the previous part

n'est pas susceptible de constituer la fin de la phrase, l'organi-  is not likely to constitute the end of the sentence, the organizer

gramme passe au traitement des noms propres 5221 pour la configura-  gram goes to processing of proper names 5221 for configuration

tion 0. Comme représenté sur la figure 46A, un nom propre et "0" sont respectivement trouvés pour la partie de discours et pour  tion 0. As shown in Figure 46A, a proper name and "0" are found respectively for the speech part and for

l'information de position de nom propre.  proper name position information.

L'unité de référence de dictionnaire suivante "River (Rivière)" est un nom propre ayant l'information de position de nom  The following dictionary reference unit "River" is a proper name with name position information

propre "3". La partie précédente est un nom propre ayant l'informa-  own "3". The previous part is a proper name having the informa-

tion de position "0" et la partie antépénultième est "the (la)". Eu égard à ce qui a été énoncé ci-dessus, "the Sumida River (la Rivière Sumida)" est collectivement agencé en un seul nom propre  tion of position "0" and the antepenultimate part is "the (la)". In view of what has been stated above, "the Sumida River" is collectively arranged under a single proper name

par le biais des étapes 5250 à 5254 et est emmagasiné, comme infor-  through steps 5250 to 5254 and is stored, as inform-

mation de position de nom propre "3", dans la table de mise en  proper noun position position "3", in the layout table

réserve d'information lexicographique 5124 (figure 46B).  lexicographic information store 5124 (figure 46B).

Ensuite, l'unité de référence de dictionnaire suivante  Then the next dictionary reference unit

"Paul" est un nom propre non inscrit ayant l'information de posi-  "Paul" is a proper unregistered noun having position information

tion de nom propre "0", pour lequel le traitement 5213 est exécute.  proper noun "0", for which processing 5213 is executed.

Bien que le nom précédent soit un nom propre, puisque l'information de position relative à ce mot est "3", il n'est pas collectivement  Although the previous name is a proper name, since the position information for this word is "3", it is not collectively

agencé avec celui-ci, mais l'information lexicographique est accu-  arranged with it, but the lexicographic information is accumulated

muLée sans changement dans la table 5124 (figure 46C). Un traite-  muLé unchanged in table 5124 (Figure 46C). A treaty-

ment ordinaire est appliqué à la conjonction "and (et)" qui lui succède.  ordinary is applied to the conjunction "and (and)" which follows it.

Le mot suivant "Mr." est un nom propre ayant l'informa-  The next word "Mr." is a proper name having the informa-

tion de position "1", qui est accumuLé sans modification dans la table de mise en réserve d'information lexicographique 5124 (figure 46D). Même si la partie précédente est un nom propre "Paul", puisqu'une ponctuation entre mots est présente juste avant "Mr.", ce mot est mis en réserve sans modification dans la table de mise  tion of position "1", which is accumulated without modification in the lexicographic information reserve table 5124 (FIG. 46D). Even if the previous part is a proper name "Paul", since a punctuation between words is present just before "Mr.", this word is put in reserve without modification in the bet table

en réserve d'information lexicographique 5124.  in lexicographic information reserve 5124.

Ensuite, le mot "Gold" est un nom propre non inscrit dans le dictionnaire et se voit appliquer le traitement 5213. Puisque le mot "Mr." qui le précède possède l'information de position "1", tous deux sont collectivement agencés, et La partie tout entière est transformée en un nom propre ayant l'information de position "1" (figure 46E). Puis le traitement est appliqué de la même façon au mot suivant "Smith" (figure 46F). Le mot suivant "went (allèrent)" est une forme verbale du passé et une analyse usuelle  Then, the word "Gold" is a proper name not registered in the dictionary and is treated 5213. Since the word "Mr." which precedes it has position information "1", both are collectively arranged, and The entire part is transformed into a proper name having position information "1" (Figure 46E). Then the treatment is applied in the same way to the next word "Smith" (Figure 46F). The next word "went" is a verb form of the past and a common analysis

est effectuée après cela.is done after that.

Comme décrit ci-dessus dans le présent mode de réalisa-  As described above in this embodiment

tion, Les noms propres sont coLlectivement agencés grâce à l'utili-  tion, The proper names are collectively arranged using the

sation, comme clé, d'un mot qui constitue une partie d'un groupe de noms propres collectivement agencés en un seul nom propre et qui  sation, as key, of a word which constitutes a part of a group of proper names collectively arranged in a single proper name and which

est soumis à une restriction de position lorsqu'ils sont collecti-  is subject to a position restriction when they are collecti-

vement agencés en un nom propre. De cette manière, même si plu-  vely arranged in a proper name. In this way, even if more

sieurs noms propres sont présents de façon continue, il est possible d'effectuer un agencement collectif convenablement en fonction du contexte sans que se produise l'agencement collectif erroné qui consisterait à simplement les grouper en un ensemble de noms propres. Dans l'exemple ci-dessus mentionné, "the Sumida River (la Rivière Sumida) " est analyse comme étant un groupe de noms  if their proper names are present continuously, it is possible to carry out a collective arrangement suitably according to the context without producing the erroneous collective arrangement which would consist in simply grouping them into a set of proper names. In the above example, "the Sumida River" is analyzed as a group of names

propres qui est séparé du nom propre suivant "Paul". De plus, "Mr.  which is separated from the proper name "Paul". In addition, "Mr.

Gold Smith" est également analysé comme étant un groupe de noms  Gold Smith "is also analyzed as a group of names

propres.clean.

2 6 0 48142 6 0 4814

On va ensuite expliquer le sixième mode de réaLisation  We will then explain the sixth embodiment

selon l'invention.according to the invention.

La figure 47 illustre le sixième mode de réalisation de l'analyseur de langage selon l'invention, appliqué à un dispositif  FIG. 47 illustrates the sixth embodiment of the language analyzer according to the invention, applied to a device

de traduction automatique anglais-japonais.  English-Japanese machine translation.

Le présent mode de réalisation possède une section de traitement d'entrée 6014 et des données sont fournies à la section de traitement d'entrée 6014 par un dispositif d'entrée 6012. Le dispositif d'entrée 6012 comprend par exemple un clavier comportant des touches de caractères, par exemple des touches alphanumériques, et des touches de fonction, un dispositif de lecture optique de caractères permettant de lire le texte d'anglais enregistré sur une  The present embodiment has an input processing section 6014 and data is supplied to the input processing section 6014 by an input device 6012. The input device 6012 for example comprises a keyboard comprising keys characters, for example alphanumeric keys, and function keys, an optical character reading device for reading English text recorded on a

feuille de papier, et un dispositif de lecture pour disque magné-  sheet of paper, and a reading device for a magnetic disc

tique. La section de traitement d'entrée 6014 possède un tampon d'ensemble de caractères d'entrée 6014a et emmagasine la phrase d'entrée d'anglais fournie par le dispositif d'entrée 6012 dans le tampon d'ensemble de caractères 6014a. La section de traitement d'entrée 6014 lit la phrase d'entrée emmagasinée dans le tampon d'ensemble de caractères d'entrée 6014a et la délivre à une section 6016 de découpage d'unités. La section 6016 de découpage d'unités est une section fonctionnelle qui découpe des unités de référence du dictionnaire dans la phrase d'entrée envoyée par la section de traitement d'entrée 6014 en faisant une recherche dans une table de  tick. The input processing section 6014 has an input character set buffer 6014a and stores the English input phrase supplied by the input device 6012 in the character set buffer 6014a. The input processing section 6014 reads the input sentence stored in the input character set buffer 6014a and outputs it to a unit splitting section 6016. The unit splitting section 6016 is a functional section which splits dictionary reference units in the input sentence sent by the input processing section 6014 by searching in a table of

délimiteurs 6018. La table de délimiteurs 6018 contient des délimi-  6018 delimiters. The 6018 delimiters table contains delimi-

teurs tels que l'espacement, le point, etc. La section de découpage d'unités 6016 lit les délimiteurs dans la table de délimiteur 6018 et divise la phrase d'entrée  such as spacing, point, etc. The unit splitting section 6016 reads the delimiters in the delimiter table 6018 and divides the input sentence

envoyée par la section de traitement 6014 en ensembles de carac-  sent by processing section 6014 in character sets

tères qui constituent les unités utilisées pour la recherche dans un dictionnaire de référence 6020 en divisant la phrase au niveau des parties o des délimiteurs sont présents. Les ensembles de caractères divisés sont envoyés à une section de consultation de  tères which constitute the units used for searching in a reference dictionary 6020 by dividing the sentence at the level of the parts where delimiters are present. Divided character sets are sent to a consultation section of

dictionnaire 6022.Dictionary 6022.

La section de consultation de dictionnaire 6022 consuLte le dictionnaire de référence 6020 pour traiter la phrase d'entrée envoyée par la section de découpage d'unités 6016, qui a été divisée en unités de référence de dictionnaire. Le dictionnaire de référence 6020 contient, comme représenté par exemple sur la figure 48, des rubriques d'entrée pour les ensembles de caractères, des parties de discours correspondant à ceux-ci, des informations de particularité, et d'autres informations utiles pour interpréter la phrase d'anglais. Le dictionnaire de référence 6020 contient, en plus des noms propres indiqués sur la figure, des ensembles de caractères se rapportant à d'autres parties de discours, par exemple des verbes, des adjectifs, etc. Les noms propres considérés comme des parties de discours sur cette figure correspondent à ceux auxquels est appliqué le traitement des noms propres inscrits décrits ci-après, mais ne se rapportent pas aux noms propres en tant qu'entités grammaticales usuelles. De plus, l'information relative à la particularité indique ce que le nom propre  The dictionary look-up section 6022 consults the reference dictionary 6020 to process the input sentence sent by the unit splitting section 6016, which has been divided into dictionary reference units. The reference dictionary 6020 contains, as shown for example in FIG. 48, input items for the sets of characters, parts of speech corresponding to these, specific information, and other information useful for interpreting the English phrase. The reference dictionary 6020 contains, in addition to the proper names indicated in the figure, sets of characters referring to other parts of speech, for example verbs, adjectives, etc. The proper names considered as parts of speech in this figure correspond to those to which the treatment of the inscribed proper names described below is applied, but do not refer to the proper names as usual grammatical entities. In addition, the information relating to the particularity indicates what the proper name

concerné exprime et n'est pas limitée à une seule catégorie.  concerned expresses and is not limited to a single category.

La section 6022 de consultation de dictionnaire consulte le dictionnaire de référence 6020 pour l'ensemble de caractères divisé en unités de référence du dictionnaire et, si l'ensemble de caractères est un nom propre, elle le délivre à une section 6024 de traitement de noms propres destinée à effectuer le traitement des noms propres ci-après décrit. De plus, s'il ne s'agit pas d'un nom propre, il est délivré à une section de traitement 6036 et est  Dictionary lookup section 6022 consults the reference dictionary 6020 for the character set divided into dictionary reference units and, if the character set is a proper name, it delivers it to a name processing section 6024 for the processing of proper names described below. In addition, if it is not a proper name, it is issued to a processing section 6036 and is

emmagasiné dans la table de mise en réserve d'information lexico-  stored in the lexico- information storage table

graphique 6036a de la section de traitement 6036.  graph 6036a of processing section 6036.

La section 6024 de traitement des noms propres comprend une section 6026 de traitement de fin de phrase précédente, une section 6028 de traitement de nom propre précédent, et une section  The proper names processing section 6024 includes a preceding end of sentence processing section 6026, a previous proper names processing section 6028, and a section

6030 de traitement de nom propre lui-même. La section 6026 de traitement de fin de phrase précédente détermine si un  6030 proper name processing itself. The preceding end-of-sentence processing section 6026 determines whether a

ensemble de caractères précédant l'ensemble de caractères fourni recherché dans la section de consultation de dictionnaire 6022 se trouve ou non à la fin de la phrase et, si l'ensemble de caractères précédent se trouve à la fin de la phrase, elle l'envoie à La section de consultation de dictionnaire 6022 après avoir transformé la lettre majuscule se trouvant en tête de l'ensemble de caractères à traiter en une lettre minuscule et fait rechercher de nouveau dans le dictionnaire de référence 6020 par la  character set preceding the supplied character set searched for in the dictionary lookup section 6022 may or may not be at the end of the sentence and, if the preceding character set is at the end of the sentence, it sends to Dictionary consultation section 6022 after transforming the capital letter at the head of the set of characters to be processed into a lowercase letter and has the 6020 reference dictionary searched again by the

section de consultation de dictionnaire 6022. L'ensemble de carac-  Dictionary lookup section 6022. The character set

tères non trouvé lors de la deuxième recherche est considéré comme  tères not found during the second search is considered

étant un nom propre non inscrit, est envoyé à la section de traite-  being a proper name not registered, is sent to the processing section

ment 6036 et est mis en réserve dans la table de mise en réserve d'information lexicographique 6036a. De plus, si L'ensemble de caractères précédant l'ensemble de caractères fourni n'est pas à la fin de la phrase, il est envoyé à la section de traitement 6036 comme étant un nom propre pour lequel l'information relative à la particularité n'est pas connue et est inscrit dans la table de mise en réserve d'information lexicographique 6036a comme décrit ci-après. La section 6028 de traitement du nom propre précédent analyse L'information relative à la particularité de  6036 and is stored in the lexicographic information storage table 6036a. In addition, if the character set preceding the supplied character set is not at the end of the sentence, it is sent to the processing section 6036 as being a proper name for which the information relating to the particularity is not known and is entered in the lexicographic information storage table 6036a as described below. Section 6028 of proper name treatment previous analysis Information on the peculiarity of

l'ensemble de caractères précédent venant de la section de traite-  the previous set of characters from the milking section

ment de fin de phrase précédente 6026 et délivre le résultat à la section 6030 de traitement du nom propre lui-même. La section 6030 de traitement du nom propre lui-même vérifie l'information relative à la particularité du nom propre à analyser et,  ment at the end of the previous sentence 6026 and delivers the result to section 6030 for processing the proper name itself. The proper name processing section 6030 itself verifies the information relating to the particularity of the proper name to be analyzed and,

comme décrit ci-après, si l'information relative à la particu -  as described below, if the information relating to the particu -

Larité n'est pas inscrite pour le nom propre ou bien pour le nom propre précédent, c'est-à-dire pour l'un des deux, elle analyse ensemble le nom propre et le nom propre précédent au moyen de l'information de particularité de l'autre et emmagasine le  The entity is not entered for the proper name or else for the previous proper name, that is to say for one of the two, it analyzes together the proper name and the previous proper name using the information of peculiarity of the other and stores the

résultat dans la table de mise en réserve d'information lexicogra-  result in the lexicogra- information storage table

phique 6036a de la section de traitement 6036.  ph 6036a from processing section 6036.

La section de traitement 6036, qui possède la table de mise en réserve d'information lexicographique 6036a, emmagasine dans cette dernière les données envoyées par la section 6028 de traitement du nom propre précédent ou la section de consultation du dictionnaire 6022, puis lit les données ainsi emmagasinées et les délivre à une section 6038 d'analyse de structure, ou analyse syntaxique. La section 6038 d'analyse syntaxique effectue L'analyse de structure de La phrase d'entrée, lue dans La table de mise en réserve d'information Lexicographique 6036a et soumise à L'anaLyse  The processing section 6036, which has the lexicographic information storage table 6036a, stores therein the data sent by the previous proper name processing section 6028 or the dictionary consultation section 6022, then reads the data. thus stored and delivers them to a section 6038 of structural analysis, or syntactic analysis. The syntax analysis section 6038 performs the structural analysis of the input sentence, read in the Lexicographic information storage table 6036a and submitted to the analysis.

morphologique.morphological.

On va maintenant expLiquer le fonctionnement du dispo-  We will now explain the operation of the

sitif en se reportant à L'organigramme illustré sur La figure 49.  refer to the flowchart illustrated in Figure 49.

Tout d'abord, une phrase d'entrée d'anglais venant du dispositif d'entrée 6012 est Lue dans La section de traitement d'entrée 6014 (6100). La phrase d'entrée lue dans La section de traitement  First, an English input sentence from the input device 6012 is read in The input processing section 6014 (6100). The input sentence read in The processing section

d'entrée 6014 est emmagasinée dans le tampon d'ensemble de carac-  input 6014 is stored in the character set buffer

tères d'entrée 6014a. La phrase d'entrée emmagasinée dans Le tampon d'ensemble de caractères d'entrée 6014a est lue et placée dans la  entry points 6014a. The input phrase stored in The input character set buffer 6014a is read and placed in the

section de découpage d'unités 6016.  unit cutting section 6016.

Lorsque la phrase d'entrée a été introduite, la section de découpage d'unités 6018 Lit les délimiteurs dans la table de  When the input sentence has been entered, the unit splitting section 6018 Reads the delimiters in the table

délimiteurs 6018 afin d'effectuer le découpage des unités de réfé-  6018 delimiters in order to split the reference units

rence du dictionnaire (6102). Ainsi, les ensembles de caractères constituant la phrase d'entrée fournie sont successivement divisés, en partant du haut de la phrase, c'est-à-dire de sa tête, en ensembles de caractères de cLé de consultation qui constituent les  dictionary reference (6102). Thus, the sets of characters constituting the input sentence provided are successively divided, starting from the top of the sentence, that is to say from its head, into sets of consultation key characters which constitute the

unités employées lors de la consultation du dictionnaire de réfé-  units used when consulting the reference dictionary

rence 6020, grâce à une division opérée au niveau des positions ou les délimiteurs, par exemple des espacements et des signes "deux points", sont présents. Il est déterminé si les unités de référence du dictionnaire ainsi divisées, c'est-à-dire les ensembles de caractères de clé de consultation, sont ou non arrivés à leur terme (6104) et, s'il est encore présent un ensemble de caractères de cLé de consultation, l'ensemble de caractères de clé de consultation  rence 6020, thanks to a division operated at the level of positions or delimiters, for example spacings and signs "colon", are present. It is determined whether or not the dictionary reference units thus divided, that is, the lookup key character sets, have expired or not (6104) and, if there is still a set of lookup key characters, lookup key character set

est envoyé à la section de consultation du dictionnaire 6022.  is sent to the consultation section of dictionary 6022.

Lorsque l'ensemble de caractères de clé de consultation est envoyé à la section de consultation du dictionnaire 6022, la  When the lookup key character set is sent to the lookup section of dictionary 6022, the

section de consultation du dictionnaire 6022 consulte le diction-  consultation section of the dictionary 6022 consult the diction-

naire de référence 6020 relativement à l'ensemble de caractères de cLé de consultation (6106). Il est déterminé si l'ensemble de caractères de clé de consultation est ou non présent dans les  nary of reference 6020 relative to the set of characters of consultation key (6106). It is determined whether or not the set of consultation key characters is present in the

rubriques d'entrée du dictionnaire de référence 6020, comme repre-  input items from the reference dictionary 6020, as repre-

senté sur la figure 48, (6108) et, s'il existe une rubrique d'entrée, l'information relative à la partie de discours qui est emmagasinée dans le dictionnaire de référence 6020 est lue et il  felt in FIG. 48, (6108) and, if there is an entry item, the information relating to the part of speech which is stored in the reference dictionary 6020 is read and it

peut être déterminé si l'ensemble de caractères de clé de consulta-  can be determined whether the character set of consultation key

tion est ou non un nom propre (6110).  tion is or is not a proper name (6110).

Dans le cas o l'ensemble de caractères de clé de consul-  In the case where the set of consul- tation key characters

tation n'est pas un nom propre, la section de consultation du dictionnaire 6022 délivre les données lues dans le dictionnaire de référence 6020 à la section de traitement 6036 et les emmagasine dans la table de mise en réserve d'information lexicographique 6036a (6112). Lorsque les données sont emmagasinées dans la table de mise en réserve d'information du dictionnaire 6036a, un signal d'entrée indiquant que les données d'entrée sont emmagasinées et les données de l'ensemble de caractères de clé de consultation emmagasiné juste avant sont envoyées par la section de traitement 6036 à la section de découpage d'unités 6016. Alors, l'organigramme revient à l'étape 6012 et le découpage des unités de référence du dictionnaire est de nouveau effectué dans la section de découpage  tation is not a proper name, the consultation section of the dictionary 6022 delivers the data read in the reference dictionary 6020 to the processing section 6036 and stores them in the lexicographic information storage table 6036a (6112) . When the data is stored in the dictionary information storage table 6036a, an input signal indicating that the input data is stored and the data of the consultation key character set stored just before is sent by the processing section 6036 to the unit cutting section 6016. Then, the flowchart returns to step 6012 and the cutting of the dictionary reference units is carried out again in the cutting section

d'unités 6016.6016 units.

A l'étape 6110, si l'ensemble de caractères de clé de  In step 6110, if the key character character set of

consultation est un nom propre, la section de consultation du dic-  consultation is a proper name, the consultation section of the dictionary

tionnaire 6022 envoie le nom propre lu dans le dictionnaire de référence 6020 (qui sera ci-après plus simplement désigné comme étant le nom propre) , en même temps que les données de l'ensemble de caractères de clé de consultation précédent fourni par la table  tionnaire 6022 sends the proper name read in the reference dictionary 6020 (which will be referred to hereinafter simply as the proper name), together with the data from the previous set of consultation key characters provided by the table

de mise en réserve d'information du dictionnaire 6036a de la sec-  for securing information from the 6036a dictionary of the sec-

tion de traitement 6036 à la section de consultation du diction-  treatment 6036 in the consultation section of the diction-

naire 6022 par l'intermédiaire de la section de découpage d'unités  naire 6022 via the unit cutting section

6016, à la section de traitement des noms propres 6024, o le trai-  6016, in the proper names processing section 6024, where the

tement du nom propre inscrit dans le dictionnaire est effectué  the proper name entered in the dictionary is carried out

(6114).(6114).

Ensuite, on va expliquer le traitement appliqué aux noms  Next, we will explain the treatment applied to names

propres inscrits dans le dictionnaire en se reportant à l'organi-  own registered in the dictionary by referring to the organization

gramme de la figure 50.gram of Figure 50.

Les données envoyées par la section de consultation du dictionnaire 6022 à la section de traitement des noms propres 6024 sont délivrées, via la section 6026 de traitement de fin de phrase  The data sent by the dictionary consultation section 6022 to the proper names processing section 6024 is delivered, via the end of sentence processing section 6026

précédente, à la section 6028 de traitement du nom propre précé-  above, in section 6028 of processing of the proper proper name

dent. Pour le traitement du nom propre inscrit dans le diction-  tooth. For the treatment of the proper name registered in the diction-

naire, la section 6026 de traitement de fin de phrase précédente ne  nary, section 6026 of the preceding end-of-sentence processing does not

joue aucun rôle.plays no role.

Dans la section 6028 de traitement du nom propre précé-  In section 6028 of the proper proper name treatment

dent, il est déterminé si l'ensemble de caractères de clé de consultation qui précède le nom propre est ou non un nom propre non inscrit dans le dictionnaire de référence 6020, c'est-à-dire s'il est ou non un nom propre soumis au traitement réservé au noms  tooth, it is determined whether or not the set of consultation key characters which precedes the proper name is a proper name not included in the reference dictionary 6020, that is to say whether or not it is a name own subject to name processing

propres non inscrits dans le dictionnaire (6200), comme décrit ci-  own not listed in the dictionary (6200), as described above

après. S'il s'agit d'un nom propre non inscrit, la partie tout entière constituée par le nom propre et le nom propre non inscrit  after. If it is a proper name not registered, the whole part consisting of the proper name and the proper name not registered

précédent est déterminée comme étant un nom propre ayant l'in-  previous is determined to be a proper noun having the in-

formation de particularité d'un nom propre (6202), et les données sont envoyées à la section de traitement 6036 et emmagasinées dans la table de mise en réserve d'information lexicographique 6036a  peculiarity formation of a proper name (6202), and the data is sent to the processing section 6036 and stored in the lexicographic information storage table 6036a

(6214).(6214).

Dans la section 6028 de traitement du nom propre précé-  In section 6028 of the proper proper name treatment

dent, si l'ensemble de caractères de clé de consultation précédant le nom propre est déterminé comme étant un nom propre non inscrit, à l'étape 6200, il est déterminé si l'ensemble de caractères de clé de consultation précédant le nom propre est ou non un nom propre inscrit dans le dictionnaire de référence 6020 (6204). Si l'ensemble de caractères de clé de consultation précédant le nom propre est un nom propre inscrit, il est déterminé si l'information  tooth, if the set of lookup key characters preceding the proper name is determined to be an unregistered proper name, at step 6200 it is determined whether the set of lookup key characters before the proper name is or not a proper name registered in the reference dictionary 6020 (6204). If the lookup key character set preceding the proper name is a registered proper name, it is determined whether the information

de particularité du nom propre précédent est ou non inconnue, c'est-  particularity of the previous proper name is unknown or not, that is

à-dire s'il est ou non non inscrit dans le dictionnaire de référence  ie whether or not it is not registered in the reference dictionary

6020 (6206).6020 (6206).

Si L'information de particuLarité du nom propre précédent est inconnue, L'organigramme passe à L'étape 6202,o La partie tout entière constituée du nom propre et du nom propre précédent est déterminée comme étant un unique nom propre ayant L'information de particularité du nom propre (6202), et la section 6028 de traitement du nom propre précédent envoie les données à la section de traitement 6036. Les données envoyées à la section de traitement 6036 sont  If the particular information of the previous proper name is unknown, the flowchart proceeds to Step 6202, o The whole part consisting of the proper name and the previous proper name is determined to be a unique proper name having the information of peculiarity of the proper name (6202), and the previous proper name processing section 6028 sends the data to the processing section 6036. The data sent to the processing section 6036 is

emmagasinées dans la table de mise en réserve d'information lexico-  stored in the lexico- information storage table

graphique 6036a (6214).chart 6036a (6214).

Dans la section 6028 de traitement du nom propre précé-  In section 6028 of the proper proper name treatment

dent, si l'information de particularité de ce nom est déter-  tooth, if the particularity information of this name is deter-

minée comme n'étant pas non inconnue, c'est-à-dire si elle est déterminée comme étant inscrite dans le dictionnaire de référence 6020, les données sont envoyées par la section 6028 de traitement du nom propre unique précédent à la section de traitement du nom propre 6030. Dans la section 6030 de traitement du nom propre, il est déterminé si l'information de particularité de ce nom est non inconnue ou non (6208). Si l'information de particularité du nom propre est inconnue, la section de traitement du nom propre 6030 détermine que la partie tout entière constituée du nom propre  mined as not not unknown, that is, if it is determined to be registered in the reference dictionary 6020, the data is sent by the processing section 6028 of the unique proper name preceding to the processing section of the proper name 6030. In the proper name processing section 6030, it is determined whether the particularity information of this name is not unknown or not (6208). If the proper name specificity information is unknown, the proper name processing section 6030 determines that the entire part consisting of the proper name

et du nom propre précédent est affectée de l'information de particu-  and of the previous proper name is assigned specific information

larité du nom propre précédent (6210), et envoie les données à la section de traitement 6036. Les données délivrées à la section de traitement 6036 sont enregistrées dans la table de mise en réserve  the name of the previous proper name (6210), and sends the data to the processing section 6036. The data delivered to the processing section 6036 are recorded in the reserve table

d'information lexicographique 6036a (6214).  lexicographical information 6036a (6214).

Dans la section 6030 de la section de traitement du nom propre, s'il est déterminé que l'information de particularité de ce nom n'est pas non inconnue, c'est-à-dire si elle est inscrite  In section 6030 of the proper name processing section, if it is determined that the particularity information of this name is not unknown, that is, if it is entered

dans le dictionnaire de référence 6020, la section 6030 de traite-  in reference dictionary 6020, section 6030 of processing

ment du nom propre détermine que le nom propre est un nom propre ayant une information de particularité trouvée dans Ledictionnaire de référence 6020, indépendamment du nom propre précédent (6212), et elle délivre les données à la section de traitement 6036. Les données envoyées à la section de traitement 6036 sont enregistrées dans la table de mise en réserve d'information lexicographique  proper name determines that the proper name is a proper name having specific information found in the reference dictionary 6020, independently of the previous proper name (6212), and it delivers the data to the processing section 6036. The data sent to the processing section 6036 are recorded in the lexicographic information storage table

6036a (6214).6036a (6214).

On revient à la figure 49. S'il n'y a pas d'ensemble de caractères de clé de consultation dans les rubriques d'entrée du dictionnaire de référence 6020 à l'étape 6108, il est déterminé si  We return to FIG. 49. If there is no set of consultation key characters in the entry items of the reference dictionary 6020 at step 6108, it is determined whether

le premier caractère de l'ensemble de caractères de clé de consul-  the first character in the character set of the consultation key

tation est ou non une lettre majuscule (6116) et, s'il ne s'agit  tation is or is not a capital letter (6116) and, if it is not

pas d'une lettre majuscule, la section de consultation du diction-  not a capital letter, the consultation section of the diction-

naire 6022 détermine que l'ensemble de caractères de clé de consul-  nary 6022 determines that the character set of consultation key

tation est un mot non inscrit, elle l'envoie à la section de trai-  tation is an unregistered word, it sends it to the processing section

tement 6036 et l'emmagasine dans la table de mise en réserve  6036 and stores it in the reserve table

d'information lexicographique 6036a (6118).  of lexicographic information 6036a (6118).

Si le premier caractère est une lettre majuscule, les données relatives à l'ensemble de caractères de clé de consultation sont envoyées, en même temps que les données relatives à l'ensemble de caractères de clé de consultation précédent, de la section de consultation de dictionnaire 6022 à la section de traitement du nom propre 6024, o le traitement réservé au nom propre non inscrit  If the first character is a capital letter, the data relating to the set of consultation key characters is sent, together with the data relating to the previous set of consultation key characters, from the consultation section of dictionary 6022 in the proper name processing section 6024, o the treatment reserved for the unregistered proper name

dans le dictionnaire est effectué (6120).  in the dictionary is performed (6120).

On va maintenant expliquer le traitement appliqué au nom propre non inscrit dans le dictionnaire, en relation avec la  We will now explain the treatment applied to the proper name not registered in the dictionary, in relation to the

figure 51.figure 51.

Les données relatives à l'ensemble de caractères de clé de consultation sont envoyées, en même temps que les données relatives à la rubrique d'entrée précédente enregistrée dans la table de mise en réserve d'information lexicographique, à la section 6026 de traitement de fin de phrase précédente o il est déterminé si la fin de la rubrique d'entrée précédente enregistrée  The data relating to the set of consultation key characters is sent, together with the data relating to the previous entry item recorded in the lexicographic information reserve table, in section 6026 for processing previous end of sentence o it is determined whether the end of the previous entry item saved

dans la table de mise en réserve d'information est ou non suscep-  in the information storage table is or is not suscep-

tible d'être la fin de la phrase (6300). Cette décision quant à la possibilité qu'il s'agisse de la fin de la phrase est obtenue par détermination du fait que la fin de la rubrique d'entrée précédente  tible to be the end of the sentence (6300). This decision as to whether it is the end of the sentence is obtained by determining that the end of the previous entry rubric

enregistrée dans la table de mise en réserve d'information lexico-  recorded in the lexico- information storage table

graphique est ou non susceptible de constituer la fin de la phrase, par exemple par l'existence d'un point distinct ".", etc. Si la fin de la rubrique d'entrée précédente enregistrée dans la table de mise en réserve d'information lexicographique est susceptible de constituer La fin de La phrase, Les données sont  graphic may or may not constitute the end of the sentence, for example by the existence of a separate dot ".", etc. If the end of the previous entry item recorded in the lexicographic information storage table is likely to constitute the end of the sentence, the data are

envoyées par La section 6026 de traitement de fin de phrase précé-  sent by Section 6026 of end-of-sentence processing

dente à la section 6028 de traitement du nom propre précédent, et La section de traitement 6028 détermine que La rubrique d'entrée  to the previous proper name processing section 6028, and The processing section 6028 determines that The entry topic

précédente enregistrée dans la table de mise en réserve d'informa-  stored in the information storage table

tion lexicographique constitue la fin de La phrase (6302) et eLle envoie Les données à La section de consultation du dictionnaire 6022 après avoir changé La lettre majuscuLe se trouvant à La tête de L'ensembLe de caractères de cLé de consultation en une lettre minuscule. La section de consuLtation du dictionnaire 6022 consulte le dictionnaire de référence 6020 pour L'ensembLe de caractères de cLé de consultation transformé par le changement de la majuscule en minuscule (6304), et elle détermine s'il existe une rubrique d'entrée dans le dictionnaire de référence 6020 (6306) . S'il existe une rubrique d'entrée, la section de consultation du dictionnaire 6022 envoie les données trouvées dans le dictionnaire de référence 6020 à la section de traitement 6036 et elle les emmagasine dans la table de mise en réserve d'information lexicographique 6036a  lexicographic tion constitutes the end of the sentence (6302) and it sends the data to the consultation section of dictionary 6022 after changing the capital letter at the head of the consultation key character set to a lowercase letter. The consultation section of the 6022 dictionary consults the reference dictionary 6020 for the set of consultation key characters transformed by the change from capital letters to lowercase (6304), and it determines whether there is an entry item in the reference dictionary 6020 (6306). If there is an entry item, the consultation section of the dictionary 6022 sends the data found in the reference dictionary 6020 to the processing section 6036 and stores it in the lexicographic information storage table 6036a

(6308). S'il n'y a pas de rubrique d'entrée, la section de consul-  (6308). If there is no entry section, the consultation section

tation du dictionnaire 6022 retransforme le premier caractère de l'ensemble de caractères de clé de consultation en une lettre majuscule, le délivre comme nom propre non inscrit à la section de traitement 6036 et l'emmagasine dans la table de mise en réserve  tation from the dictionary 6022 transforms the first character of the set of consultation key characters into an uppercase letter, delivers it as a proper name not entered in the processing section 6036 and stores it in the reserve table

d'information lexicographique 6036a (6310).  lexicographical information 6036a (6310).

A l'étape 6300, si la section 6026 de traitement de fin de phrase précédente détermine que la fin de la rubrique d'entrée  In step 6300, if the preceding sentence processing section 6026 determines that the end of the entry item

précédente enregistrée dans la table de mise en réserve d'informa-  stored in the information storage table

tion lexicographique n'est pas susceptible de constituer la fin de  lexicographic tion is not likely to constitute the end of

la phrase, les données sont envoyées de la section 6026 de traite-  the sentence, the data is sent from processing section 6026

ment de fin de phrase précédente à la section 6028 de traitement du nom propre précédent, et la section 6028 de traitement du nom propre précédent détermine que la rubrique d'entrée précédente  preceding end-of-sentence ment in section 6028 of previous proper noun processing, and section 6028 of previous proper noun processing determines that the previous entry item

enregistrée dans la table de mise en réserve d'information lexico-  recorded in the lexico- information storage table

graphique n'est pas la fin de la phrase (6312). Les données sont envoyées de la section 6028 de traitement du nom propre précédent à  graphic is not the end of the sentence (6312). Data is sent from the previous proper name processing section 6028 to

la section 6030 du traitement du nom propre, et la section de trai-  Section 6030 of the proper name processing, and the processing section

tement 6030 détermine que l'ensemble de caractères de cLé de  6030 determines that the key character set of

consultation est un nom propre pour lequel l'information de parti-  consultation is a proper name for which the information of parti-

cularité est inconnue (6314).circularity is unknown (6314).

La section 6030 de traitement du nom propre renvoie les données à la section 6028 de traitement du nom propre précédent et le traitement réservé au nom propre inscrit dans le dictionnaire est effectué dans la section 6028 de traitement du nom propre précédent (6316). Le traitement du nom propre inscrit dans le dictionnaire est identique à ce qui a été présenté sur la  The proper name processing section 6030 returns the data to the previous proper name processing section 6028 and the processing reserved for the proper proper name registered in the dictionary is carried out in the previous proper name processing section 6028 (6316). The treatment of the proper name entered in the dictionary is identical to what was presented on the

figure 50.figure 50.

On revient à la figure 49, si Le découpage des unités de référence du dictionnaire opéré à l'étape 6104 est terminé, les données enregistrées dans La table de mise en réserve d'information lexicographique 6036a sont envoyée par la section de traitement 6036 à la section d'analyse syntaxique 6038 (6122), ce par quoi  Returning to FIG. 49, if the cutting of the dictionary reference units operated in step 6104 is finished, the data recorded in the lexicographic information reserve table 6036a are sent by the processing section 6036 to the parsing section 6038 (6122), what

l'anaLyse morphologique selon l'invention est terminée.  the morphological analysis according to the invention is completed.

On va maintenant expliqué fonctionnement du dispositif du présent mode de réalisation, tel qu'il a été décrit ci-dessus, en  We will now explain the operation of the device of this embodiment, as described above, in

relation avec une phrase d'entrée fournie à titre d'exemple.  relation to an example input sentence.

Les explications seront données en relation avec la figure 52 dans le cas, pris à titre d'exemple, de la phrase  The explanations will be given in relation to FIG. 52 in the case, taken by way of example, of the sentence

d'entrée "In Tokyo Station Mr. Walter... (Dans la Gare de Tokyo Mr.  "In Tokyo Station Mr. Walter ... (In Tokyo Station Mr.

Walter...)". Tout d'abord, le traitement d'entrée 6100 visant à  Walter ...) ". First, the entry processing 6100 aimed at

lire la phrase d'entrée et à la placer dans la section de traite-  read the input sentence and place it in the milking section

ment d'entrée 6014 est effectuée. Puis les unités de découpage de dictionnaire sont découpée 6102, de manière à diviser la phrase d'entrée en mots respectifs au moyen d'espacements. Tout d'abord, le dictionnaire de référence 6020 est consulté pour "In (Dans)" (6106). Il n'y a pas de rubrique d'entrée pour "In" dans le dictionnaire de référence 6020. Lorsque l'organigramme passe au traitement du nom propre non inscrit dans le dictionnaire, puisque  Entry 6014 is performed. Then the dictionary splitting units are split 6102, so as to divide the input sentence into respective words by means of spaces. First of all, the reference dictionary 6020 is consulted for "In (In)" (6106). There is no entry heading for "In" in the reference dictionary 6020. When the organization chart passes to the processing of the proper name not registered in the dictionary, since

2 6 0 4 8 142 6 0 4 8 14

La partie précédente est reconnue comme étant La tête de la phrase (le haut du fichier), "In" est transformé en "in'. Puisque "in" possède une rubrique d'entrée dans le dictionnaire de référence 6020 et qu'il n'est pas un nom propre (6110), Les données trouvées dans le dictionnaire de référence 6020 sont enregistrées dans la table de mise en réserve d'information lexicographique 6036a  The previous part is recognized as being The head of the sentence (the top of the file), "In" is transformed into "in '. Since" in "has an entry item in the reference dictionary 6020 and it doesn is not a proper name (6110), The data found in the reference dictionary 6020 are recorded in the lexicographic information storage table 6036a

(6112).(6112).

Ensuite, le dictionnaire de référence 6020 est consulté pour "Tokyo" (6106). Puisqu'il n'y pas de rubrique d'entrée pour "Tokyo" dans le dictionnaire de référence 6020 (6108) et que le premier caractère est une lettre majuscule (6116), le traitement destiné au nom propre non inscrit dans le dictionnaire est effectue (6120). Ensuite, l'orgranigramme passe à la figure 51. Puisque la  Then, the reference dictionary 6020 is consulted for "Tokyo" (6106). Since there is no entry field for "Tokyo" in the reference dictionary 6020 (6108) and since the first character is a capital letter (6116), the processing intended for the proper name not registered in the dictionary is performs (6120). Then the flowchart goes to figure 51. Since the

partie précédente est "In" et qu'il n'est pas susceptible de cons-  previous part is "In" and it is not likely to cons-

tituer la fin de la phrase (6300), "In" est reconnu comme n'étant pas la fin de la phrase (6312), "Tokyo" est reconnu comme étant un nom propre dont l'information de particularité n'est pas connue (6314), et le traitement du nom propre inscrit dans le dictionnaire  titrate the end of the sentence (6300), "In" is recognized as not being the end of the sentence (6312), "Tokyo" is recognized as being a proper name whose particularity information is not known (6314), and the processing of the proper name entered in the dictionary

est effectué (6316).is performed (6316).

Ensuite, l'organigramme passe à la figure 50. Puisque le mot précédent "In" n'est ni un nom propre inscrit, ni un nom propre non inscrit (6204), "Tokyo" est enregistré seuL comme étant un nom propre possédant une information de particularité qui lui est propre,  Next, the flowchart goes to Figure 50. Since the previous word "In" is neither a registered proper name, nor an unregistered proper name (6204), "Tokyo" is recorded only as a proper name with a specific information of its own,

c'est-à-dire un nom propre pour lequel l'information de particulari-  that is to say a proper name for which the particular information

té est inconnue (6216).tee is unknown (6216).

Ensuite, l'organigramme revient à la figure 49, et le dictionnaire de référence 6200 est consulté pour "Station (Gare)" (6106). Puisqu'il existe une rubrique d'entrée pour "Station" dans le dictionnaire de référence 6020 (6108) et que celle-ci concerne un nom propre (6110), le traitement destiné au nom propre inscrit dans le dictionnaire est effectué (6114). L'organigramme passe à la figure 50. Puisque le mot précédent "Tokyo" est un nom propre non inscrit (6200), la partie tout entière "Tokyo Station (Gare de Tokyo)" est enregistrée comme étant un nom propre qui possède  Then, the flowchart returns to FIG. 49, and the reference dictionary 6200 is consulted for "Station (Station)" (6106). Since there is an entry item for "Station" in the reference dictionary 6020 (6108) and this relates to a proper name (6110), the processing for the proper name entered in the dictionary is carried out (6114) . The flowchart goes to Figure 50. Since the previous word "Tokyo" is an unregistered proper name (6200), the entire part "Tokyo Station (Tokyo Station)" is recorded as a proper name that has

l'information de particularité "lieu" appartenant à "Station" (6202).  the specific information "place" belonging to "Station" (6202).

Ensuite, comme indiqué sur La figure 49, Le dictionnaire de référence 6200 est consulté pour "Mr." (6016). Puisqu'iL existe une rubrique d'entrée pour "Mr." dans Le dictionnaire de référence 6020 et qu'il s'agit d'un nom propre (6110), Le traitement destiné  Then, as shown in Figure 49, The 6200 reference dictionary is consulted for "Mr." (6016). Since there is an entry section for "Mr." in the reference dictionary 6020 and that it is a proper name (6110), The treatment intended

au nom propre inscrit dans le dictionnaire est effectué (6114).  in the proper name entered in the dictionary is made (6114).

Ensuite, l'organigramme passe à la figure 50. Le mot précédent "Station" n'est pas un nom propre non inscrit (6200), mais un nom propre inscrit (6204), et l'information de particularité "lieu" n'est pas inconnue (6206) . Puisque "Mr." possède l'information de particularité "personne" qui n'est pas inconnue (6208), "Mr." est  Next, the flowchart passes to FIG. 50. The preceding word "Station" is not an unregistered proper name (6200), but a registered proper name (6204), and the specific information "place" does not is not unknown (6206). Since "Mr." has specific information "person" which is not unknown (6208), "Mr." East

inscrit seul comme un nom propre ayant L'information de particula-  listed alone as a proper name having particular information

rité "personne" (6212)."person" rity (6212).

Ensuite, on revient de nouveau à la figure 49, et le  Then we come back to figure 49, and the

dictionnaire de référence 6020 est consulté pour "Walter" (6016).  reference dictionary 6020 is consulted for "Walter" (6016).

Puisque "Walter" possède une rubrique d'entrée dans le dictionnaire de référence 6020 (6108) et qu'il s'agit d'un nom propre (6110), le traitement réservé aux noms propres inscrits dans le dictionnaire est  Since "Walter" has an entry item in the reference dictionary 6020 (6108) and it is a proper name (6110), the treatment reserved for proper names registered in the dictionary is

effectué (6114). Ensuite, l'organigramme passe à la figure 50.  performed (6114). Next, the flowchart goes to Figure 50.

Puisque le mot précédent "Mr." n'est pas un nom propre non inscrit (6200), mais est un nom propre inscrit (6204) ayant l'information de particularité "personne", qui n'est pas inconnue, (6202), alors que l'information de particularité de "Walter" est inconnue (6208), "Mr. Walter" est agencé collectivement et est enregistré  Since the previous word "Mr." is not an unregistered proper name (6200), but is a registered proper name (6204) having specificity information "person", which is not unknown, (6202), while specificity information from "Walter" is unknown (6208), "Mr. Walter" is collectively arranged and recorded

comme un nom propre ayant l'information de particularité "per-  as a proper name having the specific information "per-

sonne" (6210).rings "(6210).

* Comme cela a été décrit ci-dessus, dans le présent mode de réalisation, la phrase d'entrée d'anglais est divisée en ensembles de caractères de cLé de consultation pour lesquels, tout d'abord, le dictionnaire de référence 6020 est consulté. S'il existe une rubrique d'entrée en tant que nom propre dans le dictionnaire de référence 6020, le traitement du nom propre inscrit est effectué. Le traitement du nom propre inscrit est effectué en même temps qu'est prise en considération la rubrique d'entrée* As described above, in this embodiment, the English input sentence is divided into sets of lookup key characters for which, first, the reference dictionary 6020 is looked up . If there is an entry item as a proper name in the reference dictionary 6020, the processing of the registered proper name is carried out. The processing of the registered proper name is carried out at the same time as the entry section is taken into consideration

précédente enregistrée dans la table de mise en réserve d'informa-  stored in the information storage table

tion lexicographique. Si la rubrique d'entrée précédente enre-  lexicographic tion. If the previous entry rubric

26 0 4 8 1 426 0 4 8 1 4

gistrée dans la table de mise en réserve d'information lexicogra-  registered in the lexicogra- information storage table

phique est un nom propre, il est fait une vérification de l'infor-  phique is a proper name, it is a verification of the information

mation de particularité de la rubrique précédente enregistrée dans la table de mise en réserve d'information lexicographique et du nom propre en cours de traitement. Si l'un des deux n'est pas doté d'une information de particularité, l'information de nature de l'autre mot est prise, tandis que, si tous deux ont une information de particularité, ils sont reconnus comme étant des noms propres possédant séparément des informations de particularité qui leur  particularity of the previous item recorded in the lexicographic information storage table and of the proper name being processed. If one of the two does not have specific information, the information of the nature of the other word is taken, while, if both have specific information, they are recognized as names own own separately specific information that their

sont respectivement propres.are respectively clean.

Il est par conséquent possible de doter d'une information  It is therefore possible to provide information

de particularité appropriée un nom propre ne possédant pas d'infor-  of proper particularity a proper name with no information

mation de particularité ainsi que de limiter l'information de particularité produite d'une manière plus convenable. Ceci permet une analyse plus efficace lors de l'analyse syntaxique ultérieure  particularity as well as limiting the particularity information produced in a more suitable manner. This allows more efficient parsing during subsequent parsing

et une traduction adéquate. -and an adequate translation. -

En outre, pour l'ensemble de caractères non inscrits dans le dictionnaire de référence 6020, si le premier caractère est une lettre majuscule et que l'ensembLe de caractères précédent est  In addition, for the set of characters not entered in the reference dictionary 6020, if the first character is a capital letter and the preceding set of characters is

déterminé comme étant la fin de la phrase, le dictionnaire de réfé-  determined to be the end of the sentence, the dictionary of reference

rence 6020 est de nouveau consulté après que la lettre majuscule a été transformée en minuscule et, par conséquent, il et possible de consulter le dictionnaire de référence 6020 également pour l'ensemble de caractères se trouvant en tête de la phrase. En outre, si un ensemble de caractères commençant par une lettre majuscule apparaît à uneposition autre que la tête de la phrase, il est déterminé comme étant un nom propre, et son information de particularité du nom propre est fournie par un nom propre doté d'une information de particularité inscrite qui est présent avant ou après lui. Par conséquent, il est possible d'analyser dans une certaine mesure un nom propre non inscrit dans le dictionnaire de  rence 6020 is consulted again after the capital letter has been converted to lowercase and, therefore, it is possible to consult the reference dictionary 6020 also for the set of characters at the head of the sentence. In addition, if a set of characters beginning with an uppercase letter appears at a position other than the head of the sentence, it is determined to be a proper name, and its proper name specificity information is provided by a proper name with information of particularity entered which is present before or after it. Consequently, it is possible to analyze to a certain extent a proper name not registered in the dictionary of

référence 6020.reference 6020.

26048 1 426048 1 4

On va maintenant expliquer le septième mode de réalisa-  We will now explain the seventh embodiment

tion de l'invention.tion of the invention.

La figure 54 illustre la structure générale du septième mode de réalisation de l'analyseur de langage selon l'invention,  FIG. 54 illustrates the general structure of the seventh embodiment of the language analyzer according to the invention,

appliqué à un dispositif de traduction automatique anglais-japo-  applied to an English-Japanese machine translation device

nais. Ce mode de réalisation possède une section d'entrée 7010, par laquelle un texte d'anglais 7012 à traduire en japonais est fourni. La section d'entrée 7010 peut comporter par exemple un clavier possédant des touches numériques, par exemple des touches alphanumériques, et des touches de fonction, un dispositif de lecture optique de caractère (OCR) qui lit le texte d'anglais enregistré sur une feuille de papier et, ou bien, un dispositif de mémoire à fichier permettant de lire le texte d'anglais enregistré  born. This embodiment has an input section 7010, through which an English text 7012 to be translated into Japanese is provided. The input section 7010 can for example comprise a keyboard having numeric keys, for example alphanumeric keys, and function keys, an optical character reading device (OCR) which reads the English text recorded on a sheet paper and / or a file memory device for reading the recorded English text

sur un support de mémoire, par exemple un disque magnétique.  on a memory medium, for example a magnetic disc.

Le texte d'anglais fourni par la section d'entrée 7010  English text provided by entrance section 7010

est lu dans une section de pré-mise en forme 7014, o un pré-trai-  is read in a pre-shaping section 7014, where a pre-process

tement de traduction est effectué. Dans ce cas, la reconnaissance de la phrase et le traitement des mots inconnus sont principalement  Translation is done. In this case, sentence recognition and the processing of unknown words are mainly

effectués. Celle-ci a pour fonction d'exécuter une partie de l'ana-  performed. Its function is to execute part of the analysis.

lyse morphologique.morphological lysis.

Les données d'anglais pré-mise en forme sont transférées à une section 7016 d'analyse morphologique en même temps que l'information obtenue lors de la pré-mise en forme. La section d'analyse morphologique 7016 analyse morphologiquement la chaîne d'entrée de la phrase d'anglais en même temps qu'elle la divise en consultant un dictionnaire de mots 7018, et effectuer divers types  The pre-formatted English data is transferred to a section 7016 of morphological analysis at the same time as the information obtained during the pre-formatting. The morphological analysis section 7016 morphologically analyzes the input string of the English sentence at the same time as it divides it by consulting a dictionary of words 7018, and performs various types

d'agencements tels que le traitement des mots inconnus, l'expres-  arrangements such as the processing of unknown words, the expression

sion des noms propres, du temps, des nombres, etc., et exécute le traitement de la phrase dans son ensemble, par exemple pour l'interrogation redondante, du type "isn't it ? (n'est-ce pas ?)"  proper names, time, numbers, etc., and performs the processing of the whole sentence, for example for redundant query, of the type "isn't it? (isn't it?) "

et la reconnaissance de la position. Les règles d'analyse morpholo-  and position recognition. Morpholo-

gique sont contenues dans un fichier de règles d'analyse 7036.  are contained in a 7036 analysis rules file.

Les données d'anglais soumises à l'analyse morphologique sont transférées à une section I d'analyse syntaxique 7020 en même  English data subject to morphological analysis is transferred to a syntax analysis section I 7020 at the same

2 6 0 4 8 142 6 0 4 8 14

temps que l'information du dictionnaire obtenue par l'analyse mor-  time that the dictionary information obtained by moral analysis

phologique. La section I d'anaLyse syntaxique 7020 est une section fonctionneLle qui analyse La structure de la couche cb-surface de la phrase tout en appliquant des règles de grammaire aux données  phological. Section I of syntax analysis 7020 is a functional section which analyzes the structure of the cb-surface of the sentence while applying grammar rules to the data.

d'angLais et met à jour toutes les possibilités structureLLes.  English and updates all structural possibilities.

Les données d'anglais soumises à l'analyse dans la section I d'anaLyse syntaxique 7020 sont envoyées, en même temps que l'information d'analyse, à une section II d'analyse syntaxique 7022, o une solution est choisie sur la base de l'analyse relative à la structure de couche de surface faite dans la section I  The English data submitted for analysis in section I of syntax analysis 7020 are sent, together with the analysis information, to a section II of syntax analysis 7022, where a solution is chosen on the basis of the analysis relating to the surface layer structure made in section I

d'analyse syntaxique par l'application d'une description structu-  syntactic analysis by applying a structured description

relie. Alors, un arbre d'analyse plausible de la phrase d'anglais est préparé, et la structure est réalisée. Les règles d'analyse syntaxique sont également emmagasinées dans le fichier de règles  connects. Then, a plausible tree of analysis of the English sentence is prepared, and the structure is achieved. Parsing rules are also stored in the rules file

d'analyse 7036.7036.

Après avoir été soumises à l'analyse, les données d'anglais sonttransférées sous forme de données d'arbre d'analyse à une section 7024 de transformation de structure. La section 7024 de transformation de structure prépare un arbre de structure japonais correspondant à partir de l'arbre de structure, qui est une structure d'anglais intermédiaire, et le transforme en une structure sous-jacente de japonais, à partir de laquelle une phrase  After being submitted for analysis, the English data is transferred in the form of analysis tree data to a structure transformation section 7024. Section 7024 of structural transformation prepares a corresponding Japanese structure tree from the structure tree, which is an intermediate English structure, and transforms it into an underlying Japanese structure, from which a sentence

de japonais peut être traduite avec facilité.  from Japanese can be easily translated.

Les données de l'arbre structurel montrant la structure sous-jacente de japonais ainsi transformées sont envoyées à une section 7026 de production de traduction, o une phrase traduite  Data from the structural tree showing the underlying structure of Japanese thus transformed is sent to a translation production section 7026, o a translated sentence

est produite. Il s'agit d'une section fonctionnelle servant à pro-  is produced. This is a functional section used to pro-

duire une phrase de japonais à partir de L'arbre de structure de japonais. Les données de japonais formées sous forme d'une phrase traduite, c'està-dire les données de la phrase traduite sont envoyées à une section de post-mise en forme 7030. La section de post-mise en forme 7030 modifie les données de la phrase traduite en faisant appel au dictionnaire 7018 et en utilisant aussi les informations employées dans le traitement de traduction afin d'obtenir finalement une phrase de japonais plus naturelLe. Les données de la phrase de japonais sont transférées à une section de sortie 7032, puis sont délivrées par cette dernière sous forme d'une phrase de japonais traduite 7034. La section de sortie 7032 peut comporter par exemple une imprimante, un afficheur, et, ou bien, un dispositif de mémoire à fichier, par exemple un disque magnétique. Le déroulement de la série des traitements de traduction est commandé par une section de commande 7038 qui gouverne la  draw a Japanese sentence from the Japanese structure tree. Japanese data formed as a translated sentence, that is, data from the translated sentence, is sent to a post-shaping section 7030. The post-shaping section 7030 modifies the data from the sentence translated using the 7018 dictionary and also using the information used in the translation processing to finally obtain a more natural Japanese sentence. The data of the Japanese sentence is transferred to an output section 7032, then is delivered by the latter in the form of a translated Japanese sentence 7034. The output section 7032 can comprise for example a printer, a display, and, or a file memory device, for example a magnetic disk. The flow of the translation processing series is controlled by a control section 7038 which governs the

commande du dispositif dans son ensemble.  control of the device as a whole.

Dans ce mode de réalisation, les données lexicographiques relatives aux mots d'anglais de japonais sont emmagasinées dans le dictionnaire de mots 7018. Il s'agit du vocabulaire établi, ainsi que des relations de connexion, à savoir relations de co-existence et diverses informations telles que les significations, les formes du singulier et du pluriel, les "parties de discours", etc. En outre, les données de règles de l'analyse morphologique et de l'analyse syntaxique sont emmagasinées dans le fichier de règles  In this embodiment, the lexicographic data relating to Japanese English words are stored in the word dictionary 7018. These are the established vocabulary, as well as connection relationships, namely coexistence relationships and various information such as meanings, forms of singular and plural, "parts of speech", etc. In addition, the rules data for morphological analysis and syntax analysis are stored in the rules file.

d'analyse 7036.7036.

La section de commande 7038 est connectée à la section  The control section 7038 is connected to the section

d'affichage d'opérations 7040. La section 7040 d'affichage d'opéra-  7040 Operation Display Section. 7040 Operation Display Section

tions comprend des touches d'opération par lesquelles un opérateur peut donner diverses instructions au dispositif, par exemple une touche d'instruction de traduction et une touche de curseur, et un afficheur ou indicateur qui affiche visuellement le texte de la  tions includes operation keys by which an operator can give various instructions to the device, for example a translation instruction key and a cursor key, and a display or indicator which visually displays the text of the

phrase d'anglais d'entrée, la phrase de japonais obtenue en résul-  input English sentence, the resulting Japanese sentence

tat de la traduction, des données intermédiaires telles que des informations lexicographiques et diverses instructions destinées à l'opérateur. Il peut être fait en sorte que la plupart des fonctions d'affichage d'opération soient incorporées dans un clavier, qui sera alors placé dans la section d'entrée 7010, ou bien dans un  translation status, intermediate data such as lexicographic information and various instructions for the operator. It can be arranged that most of the operation display functions are incorporated in a keyboard, which will then be placed in the input section 7010, or else in a

afficheur, qui sera alors placé dans la section de sortie 7032.  display, which will then be placed in the output section 7032.

On se reporte à la figure 53, qui montre des exemples de structures détaillées se rapportant à la section 7016 d'analyse morphologique dans le cas du traitement de nombres. Les parties qui sont en relation directe avec la compréhension de l'invention sont présentées, même si la section d'analyse morphologique 7016 possède  Reference is made to FIG. 53, which shows examples of detailed structures relating to section 7016 of morphological analysis in the case of number processing. The parts which are directly related to the understanding of the invention are presented, even if the morphological analysis section 7016 has

naturellement d'autres sections fonctionnelles d'analyse.  of course other functional analysis sections.

La section 7016 de l'analyse morphologique possède une section de traitement d'entrée 7100 qui reçoit et traite les  Section 7016 of the morphological analysis has an input processing section 7100 which receives and processes the

données de l'ensemble de caractères d'entrée fournies par la sec-  input character set data provided by sec-

tion de pré-mise en forme 7014. La section de traitement d'entrée  pre-shaping tion 7014. The input processing section

7100 est dotée d'un tampon d'ensemble de caractères d'entrée rece-  7100 has a received input character set buffer

vant les données relatives à l'ensemble de caractères d'anglais sous la forme de données codées, par exemple le code ASCII, et emmagasine temporairement les données relatives à l'ensemble de caractères.  the data relating to the English character set in the form of coded data, for example the ASCII code, and temporarily stores the data relating to the character set.

Les données de l'ensemble de caractères d'entrée tempo-  The data for the tempo input character set

rairement emmagasinées dans la section de traitement d'entrée 7100 sont envoyées à une section de découpage d'unités 7102 qui découpe les données en unités de référence du dictionnaire, par exemple en  often stored in the input processing section 7100 are sent to a unit splitting section 7102 which splits the data into dictionary reference units, for example by

mots. La section 7102 de découpage d'unités est une section fonc-  words. Section 7102 for unit cutting is a functional section.

tionnelle qui distingue une unité de référence du dictionnaire  which distinguishes a reference unit from the dictionary

constituant l'ensemble de caractères lors de la consultation ulté-  constituting the set of characters during the subsequent consultation

rieure du dictionnaire 7018 dans la section de consultation de dictionnaire 7106. Des délimiteurs de référence de dictionnaire qui  dictionary 7018 in dictionary lookup section 7106. Dictionary reference delimiters that

sont utilisés dans le processus de découpage des unités de réfé-  are used in the process of cutting the reference units

rence de dictionnaire sont placés à la position d'un caractère  dictionary rence are placed at the position of a character

d'anglais, d'un caractère numérique, d'une apostrophe, de carac-  English, numeric, single quote, character

tères autres que le trait d'union et le point, ainsi que de l'apos-  other than the hyphen and the dot, as well as the appos-

trophe faisant suite à un caractère de vacance. Ils sont emmaga-  trophe following a vacancy character. They are housed

sinés dans une table de délimiteurs 7104 et il est fait appel à eux lors du découpage des unités de référence de dictionnaire dans la  sines in a table of delimiters 7104 and it is called upon when cutting the dictionary reference units in the

section de découpage d'unités 7102.  unit cutting section 7102.

Le dictionnaire 7018 contient des informations particu-  The 7018 dictionary contains specific information

lières pour la recherche des unités découpées. De plus, le diction-  liers for the search for cut units. In addition, the diction-

naire 7018 contient une information de traitement de morphème, comme par exemple le nom du mois, le nom du jour de la semaine, le nombre cardinal représentant seulement un chiffre numérique, le  naire 7018 contains morpheme processing information, such as the name of the month, the name of the day of the week, the cardinal number representing only a numeric number, the

nombre ordinal, l'unité servant à exprimer Le gramme ou une gran-  ordinal number, the unit used to express The gram or a large

deur analogue, Le temps, "the (article défini)", "of (de)", la vir-  analogous deur, Le temps, "the (definite article)", "of (de)", the vir-

guLe "," Le point ".", etc. La section de consultation du dictionnaire 7106 est une section fonctionnelle qui consulte le dictionnaire 7018 pour extraire des informations lexicographiques relatives à l'ensemble de caractères fournis par la section 7102 de découpage d'unités et transfère celles-ci à une section-7108 de production d'information  guLe "," Le point ".", etc. The consultation section of the dictionary 7106 is a functional section which consults the dictionary 7018 to extract lexicographic information relating to the set of characters provided by the unit splitting section 7102 and transfers these to a production section-7108 of information

de traitement de morphème.morpheme treatment.

La section 7108 de production d'information de traitement de morphème contient des informations de traitement de morphème  Morpheme Processing Information Production Section 7108 Contains Morpheme Processing Information

(voir la figure 56) indiquant qu'une succession de caractères pré-  (see Figure 56) indicating that a succession of characters pre-

sentant un certain aspect morphologique possède une signification  feeling a certain morphological aspect has meaning

temporelle, comme l'heure, l'année, le mois, etc., et une informa-  time, such as time, year, month, etc., and information

tion spécifique supplémentaire est fournie pour l'ensemble de carac-  additional specific tion is provided for the character set

tères qui est reconnu comme contenant un nombre cardinal ou une  which is recognized as containing a cardinal number or a

signification du temps, dans la section de consultation de diction-  meaning of time, in the diction consultation section-

naire 7016. Par exemple, il est fourni une information telle que:  naire 7016. For example, information such as:

"chiffre chiffre" signifie "année".  "figure figure" means "year".

L'ensemble de caractères auquel a été adjointe une infor-  The set of characters to which an information has been added

mation dans la section 7108 de production d'information de traite-  mation in section 7108 for processing information production

ment de morphème se voit en outre appliquer une analyse locale nécessaire.  In addition, the morpheme is subject to the necessary local analysis.

Dans ce cas, un groupe d'unités formé d'unités de réfé-  In this case, a group of units made up of reference units

rence de dictionnaire, par exemple un mot, activé par une informa-  dictionary reference, for example a word, activated by information

tion d'activation de morphème est collectivement agencé en une seule unité par l'emploi de règles d'analyse locale. Par exemple "nom de mois", "expression numérique" sont collectivement agencés en "nom de mois + expression numérique", c'est-à-dire que "Oct." et "18" sont regroupés en "Oct. 18 (en français, l'usage impose de dire 18 oct.)". Parallèlement, on effectue aussi un agencement collectif tel que, par exemple, "November the 2nd" (novembre le 2ème, c'est-à-dire 2 novembre) pour "nom de mois + the (le) -+  tion of morpheme activation is collectively arranged in a single unit by the use of local analysis rules. For example "month name", "numerical expression" are collectively arranged in "month name + numerical expression", that is to say that "Oct." and "18" are grouped in "Oct. 18 (in French, the practice requires saying 18 Oct.)". At the same time, there is also a collective arrangement such as, for example, "November the 2nd" (November 2nd, that is to say November 2) for "month name + the (the) - +

expression numérique", "22 March (22 mars)" pour "expression numé-  digital expression "," 22 March (22 March) "for" digital expression

rique + nom de mois", "the 23rd May" (le 23ème mai, c'est-à-dire 23  rique + nom de mois "," the 23rd May "(23rd of May, ie 23

26048 1426048 14

mai) pour "the (le) + expression numérique + nom de mois", "the 11th of June (le 11ème de juin, c'est-à-dire 11 juin)" pour "the  May) for "the (le) + numeric expression + month name", "the 11th of June (le 11ème de juin, i.e. 11 June)" for "the

(le) + expression numérique + of (de) + nom de mois", "'86, Jan.  (le) + numeric expression + of (de) + nom de mois "," '86, Jan.

27, Mon. (86, Jan. 27, lun., c'est-à-dire Lundi 27 janvier 1986)" pour "année +, + mois et jours +, + jour de la semaine", "Sunday, 26, Jan., 1986 (dimanche 26 janvier 1986)" pour "jour de la semaine +, + mois et jour +, + année", "11:30 a.m. (11 h 30 du matin)" pour "chiffre: chiffre + a.m. (c'est-à-dire avant midi) (ou bien p.m. (c'est-à-dire après midi))" ou bien "nom de mois + année", "nom de mois + of (de) + année", etc. Le traitement relatif à l'analyse locale est effectué dans une section 7110 de fixation de valeur initiale, une section 7112 de recherche de mise en concordance, une section 7114 de découpage d'unités, une section 7118 de production d'information de traitement de morphème, des sections de recherche 7116 et 7120 et des sections de traitement 7122 et 7124, ainsi qu'une table de mise en concordance 7128 contenant une table d'indication de traitement de morphème qui est une table de distinction/référence permettant de distinguer le fait qu'une succession d'unités comprenant des facteurs temporels et des chiffres, comme représenté sur la figure 57, est une unité réunissant des facteurs temporels qui obéit à une certaine règle. La section 7110 de fixation de valeur initiale fixe la valeur unitiale d'un compteur n qui compte le nombre d'unités de référence de dictionnaire avec mise en concordance lors de la recherche d'une succession d'unités de référence de dictionnaire formant un groupe d'unités comme ci-dessus décrit dans la section  27, Mon. (86, Jan. 27, Mon, that is Monday January 27, 1986) "for" year +, + month and days +, + day of the week "," Sunday, 26, Jan., 1986 (Sunday January 26, 1986) "for" day of the week +, + month and day +, + year "," 11:30 am (11:30 am) "for" number: number + am (that is ie before noon) (or pm (ie after noon)) "or" name of month + year "," name of month + of (of) + year ", etc. Processing relating to local analysis is carried out in a section 7110 for setting the initial value, a section 7112 for finding a match, a section 7114 for dividing up units, a section 7118 for producing morpheme processing information, search sections 7116 and 7120 and processing sections 7122 and 7124, as well as a matching table 7128 containing a morpheme processing indication table which is a distinction / reference table making it possible to distinguish the fact that '' a succession of units comprising of s time factors and numbers, as shown in Figure 57, is a unit of time factors that obeys a certain rule. Section 7110 for setting the initial value fixes the unit value of a counter n which counts the number of dictionary reference units with matching when searching for a succession of dictionary reference units forming a group units as described above in the section

de recherche de mise en concordance 7112.  search engine 7112.

La section 7112 de recherche de mise en concordance con-  Section 7112 concordance search con-

sulte la table de mise en concordance 7128 pour chacune des unités  see the matching table 7128 for each of the units

de référence du dictionnaire afin d'effectuer la mise en concor-  dictionary reference in order to match

dance. La section 7114 de découpage d'unités distingue les unités de référence de dictionnaire, qui seront supposées être "p", complétées du fait de la recherche dans le dictionnaire réalisée dans la section de consultation du dictionnaire 7106, à partir des unités de référence de dictionnaire constituant les ensembles de caractères après que les unités de référence de dictionnaire ont été complétées à l'aide de la consultation du dictionnaire par le  dance. The unit splitting section 7114 distinguishes the dictionary reference units, which will be assumed to be "p", supplemented by the dictionary search carried out in the dictionary consultation section 7106, from the reference reference units. dictionary constituting the sets of characters after the dictionary reference units have been completed using the dictionary consultation by the

compteur n.counter n.

La section de consultation 7116 est une section fonction-  The consultation section 7116 is a functional section.

nelle possédant la même fonction que la section de consultation du dictionnaire 7106, c'est-à-dire qu'elle consulte le dictionnaire  with the same function as the consultation section of the dictionary 7106, that is to say that it consults the dictionary

7018 pour extraire des informations de dictionnaire, ou informa-  7018 to extract dictionary information, or informa-

tions lexicographiques, relatives à l'ensemble de caractères qui se trouve distingué dans la section de découpage d'unités 7114 et les  lexicographical terms, relating to the set of characters which is distinguished in the unit cutting section 7114 and the

transfère à la section 7118 de production d'information de traite-  transfers to section 7118 for processing information production

ment de morphème. La section 7118 de production d'information de traitement de morphème possède la même fonction que la section de production d'information de traitement de morphème 7108, o une information spécifique supplémentaire est fournie pour chacun de ceux qui sont reconnus comme étant des nombres ordinaux ou des  morpheme. The morpheme processing information producing section 7118 has the same function as the morpheme processing information producing section 7108, where additional specific information is provided for each of those recognized as ordinal numbers or of

facteurs temporels dans la section de consultation 7116.  time factors in consultation section 7116.

La section de consultation 7120 et les sections de trai-  The consultation section 7120 and the treatment sections

tement 7122 et 7124 produisent un agencement collectif pour une succession d'unités de référence de dictionnaire allant jusqu'à "p+n" obtenue de la section de recherche de mise en concordance 7112 via le traitement effectué dans la section 7118 de production d'information de traitement de morphème, afin d'en former une unique unité de référence du dictionnaire. Ensuite, le résultat est  7122 and 7124 produce a collective arrangement for a succession of dictionary reference units up to "p + n" obtained from the search matching section 7112 via the processing carried out in section 7118 of production of morpheme processing information, in order to form a single reference unit of the dictionary. Then the result is

emmagasiné dans la table de mise en réserve d'information lexico-  stored in the lexico- information storage table

graphique 7126, qui est un tampon servant à emmagasiner l'informa-  graphic 7126, which is a buffer for storing information

tion lexicographique finalement obtenue à l'aide de la consultation  lexicographic tion finally obtained with the help of the consultation

du dictionnaire.from the dictionary.

Le résultat de l'analyse morphologique est transférée de la table de mise en réserve d'information lexicographique 7126 à la  The result of the morphological analysis is transferred from the lexicographic information storage table 7126 to the

section I d'analyse syntaxique 7020.  section I parsing 7020.

On va ensuite expliquerl'agencement collectif obtenu par l'intermédiaire de l'information de traitement de morphème selon l'invention, en se reportant aux organigrammes présentés sur les  We will then explain the collective arrangement obtained through the morpheme processing information according to the invention, referring to the flowcharts presented on the

figures 55A et 55B.Figures 55A and 55B.

26 0 4 8 1 426 0 4 8 1 4

On suppose par exemple que l'ensemble de caractères  Suppose for example that the set of characters

suivant est fourni à la section de traitement d'entrée 7100 (7300).  Next is provided to the input processing section 7100 (7300).

Ensemble de caractères d'entrée:Input character set:

"..26 Jan., '80 he.. (..26 janvier 1980 il..)".  ".. 26 Jan., '80 he .. (.. 26 January 1980 it ..)".

La section de découpage d'unités 7102 découpe l'ensemble de caractères d'entrée en unités de référence du dictionnaire dans le but de consulter le dictionnaire 7018 (7302). Dans l'ensemble de caractères d'entrée, "26" est considéré comme une unité lors du découpage des unités de référence de dictionnaire. Il est déterminé si le découpage des unités de référence du dictionnaire est ou non terminé pour l'ensemble de caractères d'entrée et, s'il est terminé, l'opération prend fin (7304), tandis que, s'il n'est pas  The unit splitting section 7102 splits the set of input characters into dictionary reference units for the purpose of consulting the dictionary 7018 (7302). In the input character set, "26" is considered to be one unit when cutting dictionary reference units. It is determined whether or not the division of the reference units of the dictionary is completed for the set of input characters and, if it is finished, the operation ends (7304), while, if it does not is not

terminé, l'organigramme passe à l'opération suivante 7306.  finished, the flowchart goes to the next operation 7306.

Le dictionnaire 7018 est consulté pour "26", qui repré-  The dictionary 7018 is consulted for "26", which represents

sente, dans l'ensemble de caractères d'entrée, l'unité découpée pour le report au dictionnaire, de sorte qu'il est pris dans le  feels, in the set of input characters, the unit cut out for the transfer to the dictionary, so that it is taken in the

dictionnaire l'information indiquant que "26" est "chiffre" (7306).  dictionary the information indicating that "26" is "digit" (7306).

Ensuite, une information de traitement de morphème indiquant que  Next, morpheme processing information indicating that

"chiffre" possède une nature morphologique particulière, c'est-à-  "figure" has a particular morphological nature, that is to say

dire qu'il s'agit d'une succession de chiffres devant être traités comme un nombre cardinal regroupé (7308). Il est déterminé si le groupe associé à l'information du dictionnaire a ou non été doté d'une information de traitement de morphème au cours de l'étape 7308 (7310). Ensuite, si c'est le cas, l'organigramme passe à l'étape 7314 en vue de l'application supplémentaire d'un traitement reposant sur la règle d'analyse locale, tandis qu'un groupe qui n'a pas été doté de cette information est enregistré dans la table de mise en réserve d'information lexicographique 7126 (7312), après quoi l'organigramme revient à l'étape 7302. Par conséquent, "26" doté de l'information de traitement de morphème avance à l'étape 7314.  say that it is a succession of digits to be treated as a combined cardinal number (7308). It is determined whether or not the group associated with the dictionary information was provided with morpheme processing information during step 7308 (7310). Then, if this is the case, the flowchart goes to step 7314 for the further application of processing based on the local analysis rule, while a group which has not been endowed of this information is recorded in the lexicographic information storage table 7126 (7312), after which the flowchart returns to step 7302. Therefore, "26" with the morpheme processing information advances to step 7314.

Le traitement de l'étape 7314 est effectué selon l'orga-  The processing of step 7314 is carried out according to the organ-

nigramme présenté sur la figure 55B.  flowchart shown in Figure 55B.

Tout d'abord, une valeur initiale "0" est positionnée dans un compteur n qui compte le nombre de mises en concordance  First, an initial value "0" is positioned in a counter n which counts the number of matches

d'unités de référence du dictionnaire lorsque les unités de réfé-  dictionary reference units when the reference units

rence du dictionnaire sont cherchées dans La section 7112 de recherche de mise en concordance (7410). De plus, puisque L'unité de référence du dictionnaire complétée par la consultation du  References of the dictionary are sought in Section 7112 of search for concordance (7410). In addition, since the dictionary reference unit completed by consulting the

dictionnaire effectuée dans la section de consultation du diction-  dictionary performed in the consultation section of the diction-

naire 7016 est positionnée comme étant à "p", la table de mise en concordance 7128 est consultée pour la (p+n)ème avec (n=0) unité de référence du dictionnaire, c'est-à-dire "26", par la section de recherche de mise en concordance 7112 (7412). Puisque "26" a été doté de l'information de traitement de morphème indiquant qu'il  naire 7016 is positioned as being at "p", the matching table 7128 is consulted for the (p + n) th with (n = 0) dictionary reference unit, ie "26" , by the matching search section 7112 (7412). Since "26" was provided with morpheme processing information indicating that it

s'agit d'un nombre cardinal à l'étape 7308 et puisque ces agence-  is a cardinal number in step 7308 and since these agencies-

ments "ayant chacun un nombre cardinal" à leur partie de tête sont présents au deuxième et après le deuxième dans la rubrique relative à l'agencement dans la table de mise en concordance 7128 (voir la figure 57) , l'unité de référence de dictionnaire "26" est égale à l'information de la table de mise en concordance 7128 et est donc en concordance avec cette information. Dans ce cas, la mise en concordance est effectuée pour Ms-Me (voir la figure 57) en même qu'est fixé le deuxième agencement mis en concordance tel que "Ms", en même temps que la dernière donnée de combinaison ayant le "nombre cardinal" à sa partie de tête tel que "Me" dans la table de  ment "each having a cardinal number" at their head part are present in the second and after the second in the section on the arrangement in the mapping table 7128 (see Figure 57), the reference unit of dictionary "26" is equal to the information in the mapping table 7128 and is therefore in agreement with this information. In this case, the matching is done for Ms-Me (see Figure 57) at the same time as the second matching arrangement such as "Ms" is fixed, together with the last combination data item having the " cardinal number "at its head part such as" Me "in the table of

mise en concordance 7128.reconciliation 7128.

Sur la base des résultats de la mise en concordance réalisée dans la table de mise en concordance 7128 pour la (p+n) éme (avec n=0) unité de référence du dictionnaire, il est fait une tentative de décision quant à l'état de mise en concordance (7414) et, s'il est déterminé qu'il y a concordance, l'organigramme passe à l'étape 7416, tandis que, s'il est déterminé qu'il n'y pas concordance,  On the basis of the results of the matching carried out in the matching table 7128 for the (p + n) th (with n = 0) reference unit of the dictionary, an attempt is made to decide on the matching state (7414) and, if it is determined that there is a match, the flow chart proceeds to step 7416, while, if it is determined that there is no match,

l'organigramme passe à l'étape 7424.  the flow chart proceeds to step 7424.

S'il est déterminé qu'il y a concordance, "1" est posi-  If it is determined that there is a match, "1" is posi-

tionné dans le compteur n afin que soit effectué le découpage de l'unité de découpage de dictionnaire à la (p+l)ème position (n=1) dans l'ensemble de caractères d'entrée. Le découpage s'effectue de la même manière que dans l'étape 7302. Le dictionnaire 7018 est consulté pour "jan.," dans l'ensemble de caractère d'entrée découpé  tioned in the counter n so that the dictionary cutting unit is cut out at the (p + l) th position (n = 1) in the set of input characters. The cutting is carried out in the same way as in step 7302. The dictionary 7018 is consulted for "jan.," In the set of input characters cut out.

2 6 0 48142 6 0 4814

comme unité de référence du dictionnaire au voisinage immédiat de "26" par le traitement afin de produire l'information de traitement de morphème (7420, 7422). Ces traitements sont effectués de la même  as a dictionary reference unit in the immediate vicinity of "26" by the processing in order to produce the morpheme processing information (7420, 7422). These treatments are performed the same

manière que dans l'étape 7306 et l'étape 7308.  so as in step 7306 and step 7308.

En répétant les procédures comprises entre l'étape 7412 et l'étape 7422 ci-dessus, l'organigramme boucle jusqu'à "26 Jan., he (26 janvier 1980 il) ". Toutefois, puisque "il" ne se met pas en concordance dans la mise en concordance avec la table de mise en concordance 7128 à l'étape 7412, l'organigramme avance via l'étape 7414 à l'étape 7424. Cela signifie que, alors que les données sont, jusqu'à "26 Jan., '80",mises en concordance avec "nombre cardinal, mois, année" dans la table de mise en concordance 7128, la mise en  By repeating the procedures between step 7412 and step 7422 above, the flowchart loops to "Jan. 26, he (Jan. 26, 1980)." However, since "it" does not match in the matching with the matching table 7128 in step 7412, the flowchart advances via step 7414 to step 7424. This means that, while the data is, until "Jan 26, '80", matched with "cardinal number, month, year" in the match table 7128, the match

concordance échoue pour "26, jan., '80 he".  concordance fails for "26, Jan, '80 he".

De plus, si la phrase se termine à l'ensemble de carac-  In addition, if the sentence ends at the character set

tères d'entrée, par exemple "26 Jan., '80", c'est-à-dire s'il n'y  input tères, for example "26 Jan., '80", that is to say if there

pas une coupure à la suite pour l'unité de référence de diction-  not a break in succession for the diction reference unit-

naire suivante, l'organigramme avance via l'étape 7418 jusqu'à  next year, the flowchart advances via step 7418 to

l'étape 7424.step 7424.

Dans le cas o il est déterminé qu'il n'y pas mise en concordance à l'étape 7414, il est déterminé si le contenu du compteur n n'est pas supérieur à 1 ou est supérieur à 1 (7424), et, s'il n'est pas supérieur à 1, il est enregistré comme unique unité de  In the case where it is determined that there is no matching at step 7414, it is determined if the content of the counter n is not greater than 1 or is greater than 1 (7424), and, if it is not greater than 1, it is registered as the sole unit of

référence du dictionnaire dans la table de mise en réserve d'infor-  dictionary reference in the information storage table

mation lexicolographique 7126 (7434).  lexicolographic mation 7126 (7434).

S'il n'est pas inférieur à 1, la mise en concordance est effectuée pour p+ n (n=3), c'est-à-dire que "he (il)" de "26 Jan., he" est "EOS", ce qui indique la fin de l'agencement (7426, 7428). S'il n'y pas mise en concordance, l'organigramme avance à l'étape 7434. S'il y a mise en concordance, "26 Jan., '80" qui  If it is not less than 1, the matching is performed for p + n (n = 3), that is to say that "he (il)" from "Jan 26, he" is " EOS ", which indicates the end of the arrangement (7426, 7428). If there is no matching, the flowchart advances to step 7434. If there is matching, "Jan 26, '80" which

constitue la position p-(p+n-1) pour l'unité de référence du dic-  constitutes the position p- (p + n-1) for the reference unit of the dic-

tionnaire, est collectivement agencée en fonction du résultat de l'agencement correspondant à l'agencement Ms dans la table de mise en concordance 7128, et le résultat est enregistré dans la table  , is collectively arranged according to the result of the arrangement corresponding to the Ms arrangement in the mapping table 7128, and the result is recorded in the table

7126 de mise en réserve d'information lexicographique.  7126 for storing lexicographic information.

Ensuite, il est admis que les unités de référence du dictionnaire sont arrivées à leur fin, c'est-à-dire à la (p+n-1)ème unité, et il est effectué un repositionnement de (p+n-1) à "p"  Then, it is accepted that the reference units of the dictionary have reached their end, that is to say at the (p + n-1) th unit, and a repositioning of (p + n-1) is carried out ) to "p"

(7432).(7432).

Le huitième mode de réalisation de l'invention va mainte-  The eighth embodiment of the invention will now

nant être expliqué.nant be explained.

La figure 63 illustre la structure générale du huitième mode de réalisation de l'analyseur de langage selon l'invention,  FIG. 63 illustrates the general structure of the eighth embodiment of the language analyzer according to the invention,

appliquée à un dispositif de traduction automatique anglais-  applied to an English machine translation device-

japonais. Sur la figure 63, sont représentés une section d'entrée 8001, un texte d'anglais 8002, une section de pré-mise en forme 8003, une section d'analyse morphologique 8004, une section I d'analyse syntaxique 8005, une section II d'analyse syntaxique de phrase 8006, une section d'affichage d'opérations 8007, un dictionnaire de mots 8008, un fichier de règles d'analyse 8009, une  Japanese. In FIG. 63, an input section 8001, an English text 8002, a pre-formatting section 8003, a morphological analysis section 8004, a syntactic analysis section 8005, a section are represented. Sentence syntax analysis II 8006, an operation display section 8007, a word dictionary 8008, an analysis rule file 8009, a

section de commande 8010, une section de transformation de struc-  8010 control section, a structural transformation section

ture 8011, une section de production de phrase traduite 8012, une section de post-mise en forme 8013, une section de sortie 8014, et  ture 8011, a translated sentence production section 8012, a post-shaping section 8013, an output section 8014, and

un texte de japonais 8015.8015 Japanese text.

Le présent dispositif de traduction comporte, comme cela est représenté sur la figure, une section d'entrée 8001 par  The present translation device comprises, as shown in the figure, an input section 8001 by

laquelle le texte d'anglais 8002 à traduire en japonais est intro-  which the English text 8002 to translate into Japanese is intro-

duit. La section d'entrée 8001 peut comporter par exemple un clavier possédant des touches de caractères, telles que des touches alphanumériques, et des touches de fonction, un dispositif de lecture optique de caractères (OCR) servant à lire le texte  duit. The input section 8001 may for example include a keyboard having character keys, such as alphanumeric keys, and function keys, an optical character reading device (OCR) for reading the text.

d'anglais, et, ou bien, un dispositif de mémoire à fichier permet-  English, or alternatively a file memory device allows

tant de lire le texte d'anglais enregistré sur un support.de  both read the English text saved on a medium.

mémoire, par exemple un disque magnétique.  memory, for example a magnetic disc.

Le texte d'anglais fourni par la section d'entrée 8001  English text provided by entrance section 8001

est lu dans la section de pré-mise en forme 8003, o un pré-  is read in the pre-shaping section 8003, where a pre-

traitement de traduction est effectué. Dans ce cas, la reconnais-  translation processing is performed. In this case, the recognition

cance de la phrase et le traitement des mots inconnus sont princi-  cance of the sentence and the treatment of unknown words are main

palement effectués. Cette section a pour rôle d'effectuer une  palement carried out. The role of this section is to

partie de l'analyse morphologique.part of the morphological analysis.

Les données d'anglais pré-mises en forme sont envoyées à la section d'analyse morphologique 8004 en même que l'information obtenue lors de la pré-mise en forme. La section 8004 d'analyse morphologique divise Les données en se reportant au dictionnaire de mots 8008, analyse morphologiquement la chaîne d'anglais, effectue  The pre-formatted English data is sent to the morphological analysis section 8004 along with the information obtained during the pre-formatting. Section 8004 of morphological analysis divides the data by referring to the dictionary of words 8008, morphologically analyzes the English string, performs

divers types d'agencements tels que le traitement des mots incon-  various types of arrangements such as word processing incon-

nus, l'expression des noms propres, du temps et des nombres, et effectue un traitement se rapportant à La phrase tout entière, par exemple pour l'interrogation redondante (qui est connue sous  nudes, the expression of proper names, time and numbers, and performs a processing relating to the entire sentence, for example for the redundant query (which is known as

l'appellation "tag question") et la reconnaissance de l'apposition.  the designation "tag question") and recognition of the affixing.

Les règles d'analyse morphologique sont contenues dans le fichier  Morphological analysis rules are contained in the file

de règles d'analyse 8009.of analysis rules 8009.

Après que les données d'anglais ont été soumises à l'analyse morphologique, elles sont transférées à la section I d'analyse syntaxique 8005 en même temps que l'information du dictionnaire, ou information lexicographique, obtenue par l'analyse morphologique. La section I d'analyse syntaxique 8005 est une section fonctionnelle qui analyse, au niveau de la syntaxe, la structure de la couche de surface des phrases en appliquant une règle grammaticale aux données d'anglais et met à jour toutes les  After the English data has been subjected to morphological analysis, it is transferred to Section I of syntactic analysis 8005 together with the dictionary information, or lexicographic information, obtained by morphological analysis. Section I of parsing 8005 is a functional section which analyzes, at the syntax level, the structure of the surface layer of sentences by applying a grammatical rule to English data and updates all the

possibilités structurelLes.structural possibilities.

Après avoir été soumises à l'analyse dans la section I d'analyse syntaxique 8005, les données sont envoyées, en même temps que l'information d'analyse, à la section II d'analyse syntaxique 8806, o une solution est choisie parmi les résultats de l'analyse syntaxique effectuée en relation avec la couche de surface par la section I d'analyse syntaxique, au moyen de l'application de la  After being subjected to analysis in section I parsing 8005, the data is sent, together with the analysis information, to section II parsing 8806, where a solution is chosen from the results of the syntactic analysis carried out in relation to the surface layer by section I of syntactic analysis, by means of the application of the

description struturelle. Ainsi, il est préparé un arbre d'analyse  structural description. Thus, an analysis tree is prepared

plausible pour la description en anglais de manière à en établir la  plausible for the description in English so as to establish the

structure. Ces règles d'analyse sont également contenues dans le  structure. These analysis rules are also contained in the

fichier de règlesd'analyse 8009.analysis rules file 8009.

Les données d'anglais soumises à l'anaLyse syntaxique sont transférées, comme données d'arbre d'analyse, à la section de transformation de structure 8011. La section de transformation de  The English data submitted to the syntax analysis is transferred, as analysis tree data, to the structure transformation section 8011. The transformation section of

structure 8011 prépare un arbre de structure de japonais correspon-  structure 8011 prepares a corresponding Japanese structure tree

dant à partir de l'arbre de structure, qui est une structure inter-  from the structure tree, which is an inter-

médiaire de la phrase d'anglais, afin de la transformer en une structure sous-jacente de japonais à partir de laquelle la phrase  medium of the English sentence, in order to transform it into an underlying Japanese structure from which the sentence

de japonais peut être traduite avec facilité.  from Japanese can be easily translated.

Les données relatives à l'arbre de structure indiquant la structure sousjacente de japonais ainsi transformée sont envoyées à la section de production de traduction 8012, o la phrase traduite est produite. Il s'agit d'une section fonctionnelle servant à produire une phrase de japonais à partir de la structure  The data relating to the structure tree indicating the underlying structure of Japanese thus transformed is sent to the translation production section 8012, where the translated sentence is produced. This is a functional section used to generate a Japanese sentence from the structure

de l'arbre de structure de la phrase de japonais.  of the Japanese sentence structure tree.

Les données de la phrase de japonais ainsi traduites, c'est-à-dire les données se rapportant à la phrase traduite, sont envoyées à la section de post-mise en forme 8013. La section de post-mise en forme 8013 modifie les données traduites en consultant le dictionnaire 8008 tout en utilisant l'information employée dans Le traitement de traduction afin d'arriver finalement à une phrase de japonais plus natureLLe. Les données relatives à la phrase de japonais traduite sont transférées à la section de sortie 8014 et délivrées, comme phrase de japonais traduite 8015, par la section de sortie 8014. La section de sortie 8014 comporte par exemple une imprimante, un afficheur, et, ou bien, un dispositif de mémoire à  The Japanese sentence data thus translated, that is, the data relating to the translated sentence, is sent to the post-shaping section 8013. The post-shaping section 8013 modifies the data translated by consulting the dictionary 8008 while using the information used in the translation processing in order to finally arrive at a more natural Japanese sentence. The data relating to the translated Japanese sentence is transferred to the output section 8014 and delivered, as a translated Japanese sentence 8015, by the output section 8014. The output section 8014 comprises for example a printer, a display, and, or, a memory device to

fichier, par exemple un disque magnétique.  file, for example a magnetic disc.

Le déroulement de la série des traitements de traduction est commandé par la section de commande 8010, qui gouverne la commande du dispositif dans son ensemble. Le dictionnaire de mots 8008 contient, dans le cas du mode de réalisation représenté, des données lexicographiques se rapportant aux mots d'anglais et de japonais, dans lesquelles sont établies, en plus du vocabulaire,  The flow of the translation processing series is controlled by the control section 8010, which governs the control of the device as a whole. The dictionary of words 8008 contains, in the case of the embodiment shown, lexicographical data relating to the words of English and Japanese, in which are established, in addition to the vocabulary,

diverses informations telles que des relations de connexion, c'est-  various information such as connection relationships,

à-dire les relations de coexistence, les significations, les formes du singulier et du pluriel, les "parties de discours", etc. De plus, le fichier de règles d'analyse 8009 contient des données de  ie coexistence relationships, meanings, singular and plural forms, "parts of speech", etc. In addition, the analysis rules file 8009 contains data from

règles pour l'analyse morphologique et l'analyse syntaxique.  rules for morphological analysis and syntactic analysis.

La section de commande 8010 est reliée à la section  The control section 8010 is connected to the section

d'affichage d'opérations 8007. La section 8007 d'affichage d'opéra-  8007 Operation Display Section 8007 Operation Display Section

tion comporte des touches d'opération par lesquelles un opérateur peut fournir diverses instructions au présent dispositif, par exemple une touche d'instruction de traduction, une touche de curseur, etc., un afficheur ou indicateur qui affiche visuellement le texte de la phrase d'anglais d'entrée, la phrase japonaise obtenue en résultat de la traduction, des données intermédiaires  tion comprises operation keys by which an operator can supply various instructions to the present device, for example a translation instruction key, a cursor key, etc., a display or indicator which visually displays the text of the sentence d input English, Japanese sentence obtained as a result of translation, intermediate data

telles que des informations du dictionnaire et diverses instruc-  such as dictionary information and various instruc-

tions destinées à l'opérateur. Elle peut aussi être constituée de façon que la plupart de ces fonctions d'affichage d'opérations soient contenues dans le clavier si celui-ci est placé à la section d'entrée 8001, ou bien dans l'afficheur ci celui-ci est disposé du  for the operator. It can also be set up so that most of these operation display functions are contained in the keyboard if this is placed in the input section 8001, or else in the display, this is arranged. of

côté de la section de sortie 8014.  side of outlet section 8014.

Le mode de réalisation de l'invention se rapporte au dispositif de traduction automatique ci-dessus décrit, et il est conçu de façon que, si un mot dérivé est contenu dans le texte  The embodiment of the invention relates to the machine translation device described above, and it is designed so that, if a derived word is contained in the text

d'anglais 8002, une règle de grammaire, une particularité sémen-  of English 8002, a grammar rule, a peculiarity

tique, l'équivalent (en japonais), etc., soient estimés en fonction des conditions propres à ce mot dérivé, lequel est reconnu comme tel par l'intermédiaire d'un affixe, ou d'un élément analogue, tout ceci permettant d'accroître la fiabilité du résultat d'analyse obtenu ou du résultat de traduction obtenu. Un dictionnaire d'affixes est utilisé pour fournir les estimations des informations du dictionnaire se rapportant à des mots inconnus lors de l'analyse morphologique. Quant aux modes de traitement, il faut faire appel à trois types de traitements, à savoir le traitement relatif au  tick, the equivalent (in Japanese), etc., are estimated according to the conditions specific to this derived word, which is recognized as such through an affix, or an analogous element, all this allowing d '' increase the reliability of the analysis result obtained or the translation result obtained. An affix dictionary is used to provide estimates of dictionary information relating to unknown words during morphological analysis. As for treatment methods, three types of treatment must be used, namely treatment relating to

préfixe, le traitement relatif au suffixe, et le traitement d'esti-  prefix, suffix processing, and esti-

mation par le suffixe. Toutefois, les données comprennent sensible-  suffixed. However, the data include sensitive-

ment deux types, à savoir des données d'estimation utilisant le  two types, namely estimation data using the

préfixe et des données d'estimation utilisant le suffixe.  prefix and estimation data using the suffix.

On va d'abord fournir des explications pour les données d'estimation par préfixe et les données d'estimation par suffixe,  We will first provide explanations for the estimation data by prefix and the estimation data by suffix,

citées ci-dessus.cited above.

A. Données d'estimation par préfixe.  A. Prefix estimation data.

Si la partie de préfixe d'un mot non inscrit dans le dictionnaires'accorde avec ce qui est décrit ci-après et que la partie restante est présente dans le dictionnaire, le mot est traité selon les données du dictionnaire concernant sa racine. Dans 1 20  If the prefix part of a word not entered in the dictionary agrees with what is described below and the remaining part is present in the dictionary, the word is treated according to the dictionary data concerning its root. In 1 20

Les données du dictionnaire, il est possible d'ajouter une particu-  Dictionary data, it is possible to add a particu-

larité interne à La rangée concernant la particuLarité interne  the internal aspect of the row concerning the internal particularity

initiale et d'ajouter un suffixe de japonais au mot de la traduc-  initial and add a Japanese suffix to the word for translation

tion initiale. Pour le mot d'entrée "electrochemical (éLectro-  initial tion. For the input word "electrochemical (electro-

chimique)" par exemple, la rubrique d'entrée de la table de mise en  chemical) "for example, the entry heading of the layout table

réserve d'information du dictionnaire constituée par "electro-  dictionary information reserve constituted by "electro-

chemical" peut être formée, selon les données du dictionnaire, par la rubrique d'entrée du type préfixe "electro (électro)" et par la rubrique d'entrée du dictionnaire "chemical (chimique)", comme  chemical "can be formed, according to the dictionary data, by the entry item of the prefix type" electro (electro) "and by the entry item of the dictionary" chemical (chemical) ", as

*indiqué ci-dessous.*indicated below.

Rubrique d'entrée du Rubrique d'entrée du type préfixe dictionnaire electro chemical (électro) (chimique) Mot d'entrée Rubrique d'entrée de la table de mise en réserve  Input item of the Input item of the prefix type dictionary electro chemical (electro) (chemical) Input word Input item of the reserve table

d'information du diction-diction information-

naire electrochemical electrochemical (électrochimique) (électrochimique) De cette manière, la rubrique d'entrée de la table de mise en réserve d'information du dictionnaire reprend toutes les  naire electrochemical electrochemical (electrochemical) (electrochemical) In this way, the entry section of the dictionary information storage table includes all the

informations du dictionaire auxquelles les racines des mots corres-  information from the dictionary to which the roots of the words correspond

pondent.lay.

B. Données d'estimation par suffixe.  B. Estimated data by suffix.

Si la partie suffixe d'un mot non inscrit dans le dictionnaire est en accord avec ce qui est décrit ci-après et que la partie restante est présente dans le dictionnaire, ce mot est inscrit par production d'une nouvelle donnée du dictionnaire en  If the suffix part of a word not registered in the dictionary is in agreement with what is described below and the remaining part is present in the dictionary, this word is registered by production of a new datum of the dictionary in

fonction de l'information décrite dans le dictionnaire de suffixes.  function of the information described in the suffix dictionary.

Dans ce cas, le premier équivalent (de japonais) de la donnée du 1 21 dictionnaire correspondant à la partie de la racine du mot est pr4s et utiLisé comme équivalent (en japonais) dans la nouveLLe donnée  In this case, the first equivalent (of Japanese) of the data from the 1 21 dictionary corresponding to the root part of the word is pr4s and used as an equivalent (in Japanese) in the new data.

du dictionnaire.from the dictionary.

Par exemple, pour Le mot d'entrée "controLer (contrô-  For example, for the input word "control (control-

leur)", une rubrique d'entrée de la table de mise en réserve  their) ", an entry item from the reserve table

d'information du dictionnaire constituée par "controler (contrô-  dictionary information consisting of "controler

leur)" est inscrit sur la base de la rubrique d'entrée du type suffixe "(e)r (c'est-à-dire en français -eur)" et de la rubrique  their) "is entered on the basis of the entry section of the suffix type" (e) r (ie in French -eur) "and the section

d'entrée du dictionnaire "control (contrôler)".  input from the dictionary "control".

Rubrique d'entrée du Rubrique d'entrée du type suffixe dictionnaire (verb) -(e)r control ((verbe)-eur) (contrôler) nom verbe Mot d'entrée Rubrique d'entrée de la table de mise en réserve  Entry item of the Entry item of the suffix type dictionary (verb) - (e) r control ((verb) -eur) (to control) verb name Input word Entry item of the reserve table

d'information du diction-diction information-

naire Controler Controler (contrôleur) (contrôleur) nom On va ensuite donner des explications sur les grandes lignes du traitement d'un mot dérivé et du traitement d'un mot  naire Controler Controler (controller) (controller) name We will then give explanations on the main lines of the processing of a derived word and the processing of a word

inconnu.unknown.

(1) Pour un mot non inscrit dans le dictionnaire, si un préfixe ou un suffixe sont respectivement présents en tête ou en fin du mot et que la partie restante du mot est inscrite dans le dictionnaire, l'information de "partie de discours" d'anglais, la particularité interne et L'équivaLent de japonais sont synthétisés sur La base de  (1) For a word not included in the dictionary, if a prefix or a suffix are respectively present at the head or at the end of the word and the remaining part of the word is registered in the dictionary, the information of "speech part" of English, the internal peculiarity and the equivalence of Japanese are synthesized on the basis of

L'information du dictionnaire et de l'information d'affixe.  Dictionary information and affix information.

(2) Les préfixes et Les suffixes sont respectivement rangés dans un  (2) The prefixes and suffixes are respectively arranged in a

système de film et peuvent être produits indépendamment d'un pro-  film system and can be produced independently of a pro-

gramme.gram.

(3) La possibilité est prévue d'essayer Le préfixe d'abord, puis, en  (3) It is planned to try The prefix first, then, by

cas d'échec, d'essayer ensuite le suffixe. Si tous deux sont conte-  if it fails, then try the suffix. If both are contained

nus dans le mot, l'essai n'est pas effectué.  naked in the word, the test is not performed.

(4) Dans le cas o L'estimation d'essai d'un mot n'a pas réussi, il est effectué un traitement de la partie terminale, comme s'il  (4) In the event that the test estimate of a word has not succeeded, a processing of the terminal part is carried out, as if it

s'agissait d'un mot inconnu.it was an unknown word.

On va maintenant apporter des explications plus particu-  We will now provide more specific explanations.

Lières sur le huitième mode de réalisation de l'invention tout en  Lières on the eighth embodiment of the invention while

se reportant aux dessins.referring to the drawings.

La figure 58 est un schéma de principe permettant d'expliquer un mode de réalisation seLon l'invention. Sur cette figure, sont représentés une section de traitement d'entrée 8020, une section de découpage d'unités 8021, une table de délimiteurs 8022, une section de consultation de dictionnaire 8026, une section de traitement de mot dérivé 8023, un dictionnaire de référence 8024  Figure 58 is a block diagram for explaining an embodiment according to the invention. In this figure, an input processing section 8020, a unit cutting section 8021, a delimiter table 8022, a dictionary consultation section 8026, a derivative word processing section 8023, a dictionary are shown. reference 8024

et une table de mise en réserve d'information de dictionnaire 8025.  and a dictionary information storage table 8025.

Tout d'abord, une phrase d'anglais est Lue et placée dans La sec-  First, an English sentence is read and placed in The sec-

tion de traitement d'entrée en provenance d'un dispositif d'entrée constitué par un fichier du document d'entrée, un clavier, ou un dispositif de lecture optique de caractères, etc. Ensuite, L'unité  input processing from an input device consisting of a file of the input document, a keyboard, or an optical character reading device, etc. Then the unit

de référence du dictionnaire est découpée dans la section de décou-  dictionary reference is cut out in the discovery section

page d'unités de référence du dictionnaire en même temps qu'il est  dictionary reference units page at the same time that it is

fait usage de la table de déLimiteurs et, s'il n'y a pas aboutis-  makes use of the delimiter table and, if it is not successful -

sement, la consultation du dictionnaire est effectuée à l'aide du dictionnaire de référence. Ensuite, s'il existe une rubrique d'entrée pouvant faire fonction de résultat de la consultation, le résultat de la consultation est enregistré dans la table de mise en réserve d'information du dictionnaire, tandis que le traitement d'un mot dérivé est effectué s'il n'existe pas de rubrique  The dictionary is consulted using the reference dictionary. Then, if there is an entry item that can function as the result of the consultation, the result of the consultation is recorded in the information storage table of the dictionary, while the processing of a derived word is performed if there is no section

d'entrée.entry.

26 0 4 8 1 426 0 4 8 1 4

La figure 59 est un schéma de principe permettant d'expliquer un mode de réalisation du traitement d'un mot dérivé à l'aide d'un préfixe. Sur cette figure, sont représentés une section de mise en concordance 8030 entre la partie placée en tête et le dictionnaire de préfixes, un dictionnaire de préfixes 8031, une section de consultation de dictionnaire 8032 servant à la consultation du dictionnaire en dehors du cas o il s'agit de la  Figure 59 is a block diagram for explaining an embodiment of the processing of a derived word using a prefix. In this figure, a cross-section 8030 is represented between the part placed at the head and the dictionary of prefixes, a dictionary of prefixes 8031, a dictionary consultation section 8032 used for consulting the dictionary outside the case where it this is the

partie préfixe, une section de mise en concordance 8033 s'appli-  prefix part, an 8033 cross-matching section applies

quant à la partie de discours contenue dans le dictionnaire de préfixes et à la partie de discours de la rubrique d'entrée, une section de préparation d'information du dictionnaire 8034  as for the speech part contained in the prefix dictionary and the speech part of the entry section, an information preparation section of the dictionary 8034

s'appuyant sur l'estimation par préfixe, et une section de traite-  based on prefix estimation, and a processing section

ment de mot dérivé 8035 s'appuyant sur l'utilisation du préfixe.  derived word ment 8035 based on the use of the prefix.

La figure 60 est un schéma de principe permettant d'illustrer un mode de réalisation du traitement d'un mot dérivé à l'aide du suffixe. Sur cette figure, sont représentés une section 8040 se trouvant entre la partie de fin et le dictionnaire de  Figure 60 is a block diagram for illustrating an embodiment of the processing of a derived word using the suffix. This figure shows a section 8040 between the end part and the dictionary of

suffixes, un dictionnaire de suffixes 8041, une section de traite-  suffixes, a dictionary of suffixes 8041, a processing section

ment 8042 destinée aux mots complètement non inscrits (tout à fait inconnus), une section de consultation de dictionnaire 8043 servant à consulter le dictionnaire sauf dans le cas o il s'agit de la partie suffixe, une section de mise en concordance 8044 entre la  8042 for completely unregistered (completely unknown) words, a dictionary consultation section 8043 used to consult the dictionary except in the case where it is the suffix part, a section for matching 8044 between the

partie de discours de La racine et la partie de discours de la ru-  speech part of the root and speech part of the ru-

brique d'entrée du dictionnaire de suffixes,une section de traite-  entry brick for the suffix dictionary, a processing section

ment de préparation d'information de dictionnaire 8045 utilisant  8045 dictionary information preparation ment using

l'estimation par le suffixe, une section de consultation de diction-  suffix estimation, a diction consultation section-

naire 8046 qui consulte le dictionnaire en ajoutant le changement cd racine dans le dictionnaire de suffixes à la partie autre quela partie suffixe, et une section de traitement de mot non inscrit 8047 par estimation par suffixe. On met d'abord en concordance la partie terminale et le dictionnaire de suffixes. S'il n'est pas obtenu de mise en concordance, le mot est traité comme étant un mot complètement non inscrit (entièrement inconnu), tandis que, s'il y a mise en concordance, le dictionnaire est consulté pour la  naire 8046 who consults the dictionary by adding the change root cd in the dictionary of suffixes to the part other than the suffix part, and an unregistered word processing section 8047 by estimation by suffix. We first match the terminal part and the dictionary of suffixes. If a match is not obtained, the word is treated as a completely unregistered word (entirely unknown), while, if there is a match, the dictionary is consulted for the

partie autre que la partie suffixe. Comme résultat de la consulta-  part other than the suffix part. As a result of the consultation

tion du dictionnaire, s'iL n'y pas de rubrique d'entrée, la recherche dans Le dictionnaire est effectuée en même temps qu'est ajouté le changement de racine dans le dictionnaire de suffixes à une partie autre que la partie suffixe. En résuLtat du cas o iL n'y a pas de rubrique d'entrée, un traitement pour mot non inscrit est effectué à l'aide de l'estimation par suffixe. Tandis que, inversement, s'il existe une rubrique d'entrée, il est fait une mise en concordance entre la partie de discours de la rubrique d'entrée et la partie de discours de La racine dans le dictionnaire de suffixes de la même manière que dans Le cas o la rubrique  tion of the dictionary, if there is no entry item, the search in the dictionary is carried out at the same time as the change of root in the dictionary of suffixes is added to a part other than the suffix part. As a result of the case where there is no entry item, processing for a word not entered is carried out using the estimate by suffix. Whereas, conversely, if there is an entry item, there is a matching between the speech part of the entry item and the speech part of The root in the dictionary of suffixes in the same way only in the case where the heading

d'entrée est présente par suite de la recherche dans le diction-  input is present as a result of research in diction-

naire pour la partie autre que la partie suffixe. Si la mise en concordance est trouvée, le traitement de préparation d'information du dictionnaire est effectué à l'aide de l'estimation par suffixe, tandis que, s'il n'y a pas mise en concordance, le traitement pour  nary for the part other than the suffix part. If matching is found, dictionary information preparation processing is performed using suffix estimation, while, if there is no matching, processing for

mot non inscrit est effectué à l'aide de l'estimation par suffixe.  word not entered is done using suffix estimation.

La figure 61 est un schéma de principe montrant le détaiL de la structure générale obtenue par synthétisation des parties des figures 58, 59 et 60, et la figure 62 illustre le détail de la section 8042 de traitement de mot complètement non inscrit (tout à fait inconnu) qui est représentée sur la figure 61. La section 8042 de traitement de mot complètement non inscrit, qui est représentée  FIG. 61 is a block diagram showing the detail of the general structure obtained by synthesizing the parts of FIGS. 58, 59 and 60, and FIG. 62 illustrates the detail of section 8042 for processing word completely unregistered (quite unknown) which is shown in Fig. 61. The 8042 completely unregistered word processing section which is shown

sur la figure 61, comprend une section 8050 de traitement de pré-  in Figure 61, includes a pre-processing section 8050

paration d'information estimée pour un nom et une section 8051 de  estimated information fencing for a name and a section 8051 of

traitement de préparation d'information estimée pour un verbe.  information preparation processing estimated for a verb.

Toutefois, puisque chacune des parties des figures 61 et 62 a déjà  However, since each of the parts of FIGS. 61 and 62 has already

été décrite en particulier, on omettra d'en fournir ici les expli-  been described in particular, we will omit to provide explanations here

cations. Le neuvième mode de réalisation selon l'invention va  cations. The ninth embodiment according to the invention will

maintenant être décrit.now be described.

La figure 64 illustre la structure générale du neuvième mode de réalisation selon l'invention, appliquée à un dispositif de  FIG. 64 illustrates the general structure of the ninth embodiment according to the invention, applied to a device for

traduction automatique anglais-japonais.  English-Japanese automatic translation.

Ce mode de réalisation possède une section d'entrée 9010, par laquelle un texte d'anglais 9012 à traduire en japonais est introduit. La section d'entrée 9010 comporte un clavier possédant des touches de caractères, par exemple des touches alphanumériques, et des touches de fonction, un dispositif de lecture optique de caractères (OCR) servant à lire le texte d'anglais enregistré sur une feuille de papier, et, ou bien, un dispositif de mémoire à fichier permettant de lire le texte d'anglais enregistré sur un  This embodiment has an input section 9010, through which an English text 9012 to be translated into Japanese is introduced. The input section 9010 includes a keyboard having character keys, for example alphanumeric keys, and function keys, an optical character reading device (OCR) for reading English text recorded on a sheet of paper, and / or a file memory device for reading English text saved on a

support de mémoire, par exemple un disque magnétique.  storage medium, for example a magnetic disc.

Le texte d'anglais introduit par la section d'entrée 9010 est lu dans une section de pré-mise en forme 9014, o un  The English text introduced by the input section 9010 is read in a pre-formatting section 9014, where a

pré-traitement de traduction est effectué. Dans ce cas, la recon-  translation pre-processing is carried out. In this case, the recognition

naissance de la phrase et le traitement des mots inconnus y sont principalement effectués. Cette section a pour fonction d'effectuer  birth of the sentence and the processing of unknown words are mainly carried out there. The purpose of this section is to

une partie de l'analyse morphologique.  part of the morphological analysis.

Les données d'anglais pré-mises en forme sont transférées à une section d'analyse morphologique 9016 en même temps que l'information obtenue lors de la pré-mise en forme. La section d'analyse morphologique 9016 divise la phrase en consultant un dictionnaire de mots 9018, analyse morphologiquement la chaîne de  The pre-formatted English data is transferred to a morphological analysis section 9016 at the same time as the information obtained during the pre-formatting. The morphological analysis section 9016 divides the sentence by consulting a dictionary of words 9018, morphologically analyzes the chain of

la phrase anglaise, effectue divers agencements, comme le traite-  the English sentence, makes various arrangements, such as the

ment des mots inconnus, le traitement des noms propres, l'expres-  ment of unknown words, the treatment of proper names, the expression

sion du temps, des nombres, etc., et effectue également un traite-  time, numbers, etc., and also processes

ment sur la phrase toute entière, par exemple pour l'interrogation redondante (connue sous l'appellation grammaticale originale "tag  ment on the entire sentence, for example for the redundant query (known under the original grammatical name "tag

question") et la reconnaissance de l'apposition. Les règles d'ana-  question ") and recognition of apposition.

lyse morphologique sont contenues dans un fichier de règles  morphological lysis are contained in a rules file

d'analyse 9036.9036.

Les données d'anglais soumises à l'analyse morphologique sont transférées à une section I d'analyse syntaxique 9020 en même temps que l'information du dictionnaire obtenue Lors de l'analyse morphologique. La section I d'analyse syntaxique 9020 est, dans ce mode de réaLisation, une section fonctionnelle qui analyse la structure de la couche de surface en procédant de bas en haut et de droite à gauche pour la phrase par application de la règle cfg aux données d'anglais, et elle met à jour toutes les possibilités structurellest Apres analyse dans la section I d'analyse syntaxique 9020, les données d'anglais sont envoyées à la section II d'analyse syntaxique 9022 en même temps que l'information analysée. La section sélectionne une solution à partir du résultat de l'analyse  The English data submitted to the morphological analysis are transferred to a syntax analysis section I 9020 at the same time as the dictionary information obtained during the morphological analysis. Section I of parsing 9020 is, in this embodiment, a functional section which analyzes the structure of the surface layer by proceeding from bottom to top and from right to left for the sentence by applying the cfg rule to the data. of English, and it updates all the structural possibilities. After analysis in Section I of parsing 9020, the English data is sent to Section II of parsing 9022 together with the information analyzed. The section selects a solution from the result of the analysis

relative à la structure de couche de surface effectuée dans la sec-  relating to the surface layer structure carried out in the sec-

tion I d'analyse syntaxique par l'application d'une description  tion I of syntactic analysis by the application of a description

structurelle. De cette manière, il est préparé pour la phrase  structural. In this way, he is prepared for the sentence

d'anglais un arbre d'analyse plausible en vue d'établir sa struc-  of English a plausible tree of analysis in order to establish its structure

ture. Ces règles d'analyse syntaxique sont également emmagasinées  ture. These parsing rules are also stored

dans le fichier de règles d'analyse 9036.  in the analysis rules file 9036.

Apres avoir été soumises à l'analyse, les données  After being subjected to the analysis, the data

d'anglais sont transférées à la section de transformation de struc-  of English are transferred to the processing section of struc-

ture 9024 en même temps que les données de l'arbre d'analyse. Dans la section de transformation de structure 9025, l'arbre d'analyse relatif à la phrase de japonais correspondante est préparé à partir d'un arbre structurel qui est une structure intermédiaire d'une phrase d'anglais et est transformé en une structure sous-jacente de japonais, à partir de laquelle on peut traduire une phrase de  ture 9024 at the same time as the data in the analysis tree. In the structure transformation section 9025, the analysis tree relating to the corresponding Japanese sentence is prepared from a structural tree which is an intermediate structure of an English sentence and is transformed into a structure under - adjacent Japanese, from which we can translate a sentence from

japonais avec facilité.Japanese with ease.

Les données de l'arbre structurel indiquant la structure sous-jacente de japonais ainsi transformée sont envoyées à une section de production de traduction 9026 o la phrase traduite est produite. Cette section est une fonction de production d'une phrase  The data from the structural tree indicating the underlying structure of Japanese thus transformed is sent to a translation production section 9026 where the translated sentence is produced. This section is a sentence production function

de japonais à partir d'une structure d'arbre de l'arbre de struc-  of Japanese from a tree structure of the struc-

ture de japonais. Tout d'abord, La production d'une structure de phrase est effectuée, dans laquelle la structure d'arbre est modifiée par changement de l'ordre dans le but d'être mise en accord avec celle du japonais, puis une production de morphèmes est  Japanese ture. First, the production of a sentence structure is carried out, in which the tree structure is modified by changing the order in order to be in agreement with that of Japanese, then a production of morphemes East

26 0 4 8 1 426 0 4 8 1 4

effectuée afin de produire une phrase traduite suivante une manière procédant de haut en bas et de gauche à droite dans l'arbre de  performed in order to produce a translated sentence following a top-down and left-to-right manner in the tree of

structure de la phrase.sentence structure.

Les données relatives à la phrase de japonais ainsi produites, c'est-àdire les données de traduction, sont envoyées à une section de post-mise en forme 9030. La section de pos-mise en forme 9030 modifie les données de traduction en consultant le dictionnaire 9018 sur la base des informations utilisées dans le traitement de traduction afin d'arriver finalement à une phrase de japonais plus naturelle. Les données de la phrase de japonais sont transférées à une section de sortie 9032, puis délivrées, comme phrase de japonais traduite 9034, par la section de sortie 9032. La section de sortie 9032 comporte par exemple une imprimante, un afficheur et, ou bien, un dispositif de mémoire à fichier tel qu'un  The data relating to the Japanese sentence thus produced, that is to say the translation data, are sent to a post-shaping section 9030. The post-shaping section 9030 modifies the translation data by consulting dictionary 9018 based on the information used in the translation processing in order to finally arrive at a more natural Japanese sentence. The data of the Japanese sentence is transferred to an output section 9032, then delivered, as a translated Japanese sentence 9034, by the output section 9032. The output section 9032 comprises for example a printer, a display and, or , a file memory device such as a

disque magnétique.magnetic disc.

Le déroulement de la série des traitements de traduction est commandé par une section de commande 9038 qui gouverne la commande de l'ensemble du dispositif. Le fichier dictionnaire 9018 emmagasine des données lexicographiques pour les mots d'anglais et de japonais, et le fichier de règles d'analyse 9036 emmagasine des  The progress of the translation processing series is controlled by a control section 9038 which governs the control of the entire device. The dictionary file 9018 stores lexicographic data for English and Japanese words, and the analysis rules file 9036 stores

données de règles pour l'analyse morphologique et l'analyse syn-  rule data for morphological analysis and syn-

taxique, dans ce mode de réalisation.  taxic, in this embodiment.

La section de commande 9038 est reliée à une section d'affichage d'opérations 9040. La section d'affichage d'opération 9040 comporte des touches d'opération par lesquelles un opérateur peut fournir diverses instructions au présent dispositif, par exemple une touche d'instruction de traduction ou une touche de curseur, et un afficheur ou indicateur qui affiche visuellement le texte d'anglais fourni, la phrase de japonais qui est le résultat  The control section 9038 is connected to an operation display section 9040. The operation display section 9040 includes operation keys by which an operator can provide various instructions to the present device, for example a key translation instruction or a cursor key, and a display or indicator that visually displays the English text provided, the Japanese sentence which is the result

de la traduction, des données intermédiaires telles que des infor-  translation, intermediate data such as information

mations du dictionnaire et diverses instructions destinées à l'opérateur. Elle peut être ainsi constituée que la plupart des fonctions d'affichage d'opérations soient contenues dans un clavier, si elle disposée du côté de la section d'entrée 9010, ou  Dictionary information and various operator instructions. It can thus be constituted that most of the operations display functions are contained in a keyboard, if it is placed on the side of the input section 9010, or

26 0 4 8 1 426 0 4 8 1 4

1 28 bien dans un afficheur si elle est disposée du coté de La section  1 28 well in a display if it is placed on the side of the section

de sortie 9032.9032 output.

De cette manière, dans la section I d'analyse syntaxique 9020, la règle sfg est appliquée à la phrase d'anglais dans le mode bas en haut, droite vers gauche pour les données d'anglais après  In this way, in section I parsing 9020, the sfg rule is applied to the English sentence in the mode bottom up, right to left for the English data after

l'analyse morphologique, afin que soient déduites toutes les solu-  morphological analysis, so that all solutions are deduced

tions possibles pour la structure de la phrase. Les solutions sont  options for the sentence structure. The solutions are

généralement comprises sous la forme d'un arbre de structure.  generally understood as a tree structure.

Celui-ci montre la relation pour les mots ou les groupes contenus dans chacune des phrases qui sont reliés entre eux suivant une  This shows the relationship for the words or groups contained in each of the sentences which are linked together according to a

relation subsidiaire ou de coexistence, comme une relation de modi-  subsidiary relation or of coexistence, like a relation of modi-

fication ou une relation de cas, par exemple une relation subsi-  a case relationship, for example a subsi-

diaire réciproque comme pour des parents, des enfants et des petits enfants, etc. Chacun des mots ou des groupes se situe au noeud de  reciprocal diary as for parents, children and grandchildren, etc. Each of the words or groups is located at the node of

la structure d'arbre.tree structure.

Dans ce mode de réalisation, avant l'analyse syntaxique,  In this embodiment, before parsing,

il est établi des distinctions pour les particularités se rappor-  distinctions are drawn up for the particularities related

tant à la forme et au vocabulaire d'une phrase afin qu'il puisse être décidé un agencement collectif relativement à la structure de la phrase. Il est traité ici de l'agencement relatif à la structure  both in the form and in the vocabulary of a sentence so that a collective arrangement can be decided in relation to the structure of the sentence. It is treated here of the arrangement relating to the structure

de la phrase en termes d'"unité" et de "bloc".  of the sentence in terms of "unit" and "block".

L'"unité" est un mot ou un groupe de mots constituant l'unité minimale dans le processus de traduction, que l'on traite exactement comme s'il s'agissait d'un seul mot dans l'analyse, et l'information du dictionnaire pour chacun des éléments constitutifs  The "unit" is a word or group of words constituting the minimum unit in the translation process, which is treated exactly as if it were a single word in the analysis, and the dictionary information for each of the constituent elements

contenus dans celui-ci n'est pas utilisée.  contained in it is not used.

Le "bloc" est un agencement structurel, pour lequel l'analyse menée est celle concernant l'intérieur de préférence à celle concernant l'extérieur, ce qui est traité de la même manière qu'une unité se rapportant à la partie extérieure de celui-ci. Par exemple, il peut s'agir d'un membre de phrase, d'une locution,  The "block" is a structural arrangement, for which the analysis carried out is that concerning the interior rather than that concerning the exterior, which is treated in the same way as a unit relating to the exterior of it -this. For example, it could be a phrase, a phrase,

etc., aussi bien que d'éléments correspondant à des symboles inter-  etc., as well as elements corresponding to inter-

médiaires utilisés dans la grammaire cfg. De plus, il peut y avoir une structure d'accueil, c'est-à-dire qu'un bloc peut contenir un autre bloc. En outre, le concept du bloc peut également comprendre une phrase, un paragraphe, des phrases entières, qui peuvent chacun être considérés comme un bloc. Le traitement donnant la préférence à  mediaries used in the grammar cfg. In addition, there can be a reception structure, that is to say that a block can contain another block. In addition, the concept of the block can also include a sentence, a paragraph, whole sentences, which can each be considered as a block. Treatment giving preference to

L'analyse partieLle est désigné ici comme "analyse partielle".  Partial analysis is referred to here as "partial analysis".

Celle-ci vise à réduire Le nombre des solutions structurelles inutiles décrites ci-dessus afin d'améliorer le rendement de  This aims to reduce the number of unnecessary structural solutions described above in order to improve the efficiency of

l'analyse et d'obtenir un résultat d'analyse plus plausible.  analysis and obtain a more plausible analysis result.

On définit deux particularités du bloc dans un mode de réalisation. L'une d'elles est un symbole dans la règle cfg, qui  Two specific features of the block are defined in one embodiment. One of them is a symbol in the cfg rule, which

est désignée comme étant un "but" (goal) dans la description,  is referred to as a "goal" in the description,

lequel doit être agencé sur la base du résultat de l'analyse  which must be arranged based on the result of the analysis

lorsque celle-ci a été effectuée pour chacun des éléments constitu-  when this has been done for each of the constituent elements

tifs se trouvant à l'intérieur du bloc, c'est-à-dire un symbole décrivant la structure ou l'attribut du bloc. L'autre est un symbole de la règle cfg, désigné ici comme étant un "rôle" (role), lequel symbole est porté par le bloc lorsqu'est menée l'analyse concernant l'extérieur du bloc relatif à la phrase, la locution ou le membre de phrase contenant le bloc, c'est-à-dire un symbole  tifs inside the block, that is to say a symbol describing the structure or attribute of the block. The other is a symbol of the cfg rule, designated here as a "role", which symbol is carried by the block when the analysis concerning the outside of the block relating to the sentence, the phrase is carried out. or the phrase containing the block, i.e. a symbol

décrivant la relation ou le rôle du bloc vis-à-vis des autres.  describing the relationship or role of the block vis-à-vis others.

Par exemple, dans le cas de la phrase d'anglais: I said, "White House isn't white (jedisais, "La Maison Blanche n'est pas blanche")  For example, in the case of the English sentence: I said, "White House isn't white (jedisais," La Maison Blanche n'est pas blanche ")

le but est une phrase et le rôle est un nom (membre de phrase).  the goal is a sentence and the role is a name (phrase).

Alors que le but et le rôle sont généralement identiques dans la plupart des cas, ils peuvent quelque fois être différents l'un de  While the purpose and role are generally the same in most cases, they can sometimes be different from one of

l'autre, comme dans cet exemple.the other, as in this example.

Pour le mode de réalisation présenté sur la figure 64,.  For the embodiment shown in Figure 64 ,.

lorsque l'agencement structurel de la phrase d'anglais d'entrée est reconnu comme un bloc, les sections fonctionnelles chargées d'estimer son but et son rôle ont été résumées dans la structure présentée sur la figure 65. Comme on peut le voir sur cette figure,  when the structural arrangement of the input English sentence is recognized as a block, the functional sections responsible for estimating its purpose and role have been summarized in the structure presented in Figure 65. As can be seen in this figure,

l'agencement structurel des données de la phrase d'anglais pré-  the structural arrangement of the data of the English sentence pre-

mises en forme dans la section de pré-mise en forme 9014 est distingué dans la section d'analyse morphologique 9016 à l'aide du  shaped in the pre-shaping section 9014 is distinguished in the morphological analysis section 9016 using the

dictionnaire de mots 9018 et du fichier de règles d'analyse 9036.  word dictionary 9018 and analysis rule file 9036.

Le dictionnaire de mots 9018 emmagasine des informations  9018 word dictionary stores information

lexicographiques relativement aux mots et aux phrases d'anglais.  lexicographic relating to English words and phrases.

Par exemple, comme représenté sur la figure 68, des rubriques d'entrée sont formées pour toutes les variantes de chaque mot dans ce mode de réalisation et toutes les informations sont créées. Pour  For example, as shown in Figure 68, input headings are formed for all variants of each word in this embodiment and all of the information is created. For

l'information relative à la "partie de discours" par exemple, plu-  information relating to the "part of speech" for example, more

sieurs informations de partie de discours peuvent être prévues, comme représenté sur cette figure. Il apparaîtra clairement que la manière de constituer le dictionnaire 9018 n'est pas limitée à ce  Several speech part information can be provided, as shown in this figure. It will be clear that the manner of constituting the 9018 dictionary is not limited to this

seul exemple.only example.

Le fichier de règles d'analyse 9036 emmagasine les données relatives à la situation de haut, ou de tête, indiquant le haut, ou la tête, du bloc, à la situation de fin indiquant la fin, aussi bien que les informations de préparation de bloc servant à doter le bloc du but et du rôle sous la forme d'une table. Un exemple est présenté sur la figure 69. Par exemple, un bloc commence par ", conjonction" et il se termine à la fin de la phrase. Par conséquent, un premier bloc est formé à partir de la tête et va jusqu'à "," précédant juste la conjonction, et le but est un membre de phrase, tandis que le rôle est une phrase. De plus, un autre bloc est formé à partir de la conjonction et va jusqu'à la fin de la phrase, o le but et le rôle sont tous deux un  The analysis rule file 9036 stores the data relating to the top situation, or head, indicating the top, or the head, of the block, to the end situation indicating the end, as well as the preparation information of block used to endow the block with purpose and role in the form of a table. An example is shown in Figure 69. For example, a block begins with ", conjunction" and ends at the end of the sentence. Therefore, a first block is formed from the head and goes to "," just preceding the conjunction, and the goal is a phrase, while the role is a phrase. In addition, another block is formed from the conjunction and goes to the end of the sentence, where the goal and the role are both a

membre de phrase.phrase.

De plus, un bloc commence par ", pronom relatif" et se termine par "," ou bien par la fin de la phrase. Comme dans ce cas, la possibilité qu'il existe plusieurs conditions de fin est admise pour une condition de tête. Dans le cas o le bloc se termine par ",", un amas partant de "," juste avant le pronom relatif et allant jusqu'à la prochaine apparition de "," forme un bloc dans lequel le  In addition, a block begins with ", relative pronoun" and ends with "," or the end of the sentence. As in this case, the possibility that there are several end conditions is accepted for a head condition. In the case where the block ends with ",", a cluster starting from "," just before the relative pronoun and going until the next appearance of "," forms a block in which the

but est un membre de phrase et le rôle est un adverbe ou un adjec-  but is a phrase and the role is an adverb or an adjec-

tif. Ainsi, ceci signifie que l'amas fait fonction d'amas adverbial ou d'amas adjectival. Dans le cas d'une terminaison à la fin de la phrase, un amas partant de "," juste avant le pronom relatif pour aller jusqu'à la fin de la phrase constitue un bloc, dans lequel le but est un membre de phrase et le rôle est un adverbe ou un  tif. Thus, this means that the cluster functions as an adverbial cluster or an adjectival cluster. In the case of a termination at the end of the sentence, a cluster starting from "," just before the relative pronoun to go to the end of the sentence constitutes a block, in which the goal is a phrase and the role is an adverb or a

2 6 0 4 8 1 42 6 0 4 8 1 4

adjectif. Tout ceci se présente en fonction des conditions de  adjective. All this is presented according to the conditions of

formation de La Locution, du membre de phrase ou de La phrase appa-  formation of the phrase, the phrase or the phrase appa-

raissant dans des phrases d'anglais moderne ordinaires. Sur La  falling into ordinary modern English phrases. On the

figure, le symbole,U" représente un espacement.  figure, the symbol, U "represents a spacing.

De cette manière, dans la section d'analyse morphologique 9016, le texte d'anglais introduit par La section de pré-mise en forme 9014 est d'abord divisé en phrases constituant Les unités de traduction. Dans ce cas, Les orthographes erronées et les mots non inscrits sont détectés. Le dictionnaire 9018 est consulté pour  In this way, in the morphological analysis section 9016, the English text introduced by the pre-shaping section 9014 is first divided into sentences constituting the translation units. In this case, Incorrect spellings and unregistered words are detected. The 9018 dictionary is consulted for

toutes Les unités de phrase et l'information du dictionnaire rela-  all Phrase units and related dictionary information

tive à chacun des constituants est extraite. Divers modes d'agence-  tive to each of the constituents is extracted. Various agency modes-

ment sont effectués en fonction de ces informations du diction-  are based on this information from the diction-

naire. La figure 66 présente un organigramme pour l'agencement  nary. Figure 66 shows a flowchart for the layout

collectif d'un bloc effectué dans la section d'analyse morpholo-  collective of a block performed in the morpholo- analysis section

gique 9016. Tout d'abord, un pointeur de position indiquant la position lue pour une phrase d'anglais est positionné sur Le haut, ou à la tête, (9100). La position de tête désigne non le mot se  gic 9016. First of all, a position pointer indicating the position read for an English phrase is positioned on the top, or at the head, (9100). The head position designates not the word se

trouvant à la tête, mais la tête (immaginaire) de la phrase immé-  finding at the head, but the (imaginary) head of the sentence imma-

diatement précédente. Le traitement de préLèvement de mot 9001 est exécuté à la position. Comme représenté sur la figure 67, dans le traitement de prélèvement de mot 9101, on préLève un mot en faisant avancer la position d'un pas (9111) à moins qu'il ne se trouve à la  diatly previous. Word picking processing 9001 is performed at the position. As shown in FIG. 67, in the word picking process 9101, a word is picked by advancing the position by one step (9111) unless it is at the

fin de la phrase (9110), et on consulte le dictionnaire 9018 rela-  end of the sentence (9110), and consult the dictionary 9018 related

tivement au mot (9112) afin d'écrire l'information de mot (9113).  word (9112) to write the word information (9113).

De cette manière, Lorsque l'information de mot est pré-  In this way, When the word information is pre-

levée dans le traitement de prélèvement de mot 9101, la table 9036 relative aux conditions de tête et de fin du bloc est sollicitée, afin qu'il soit déterminé s'il en existe ou non un qui satisfait la condition de tête (9102). De cette manière, les étapes 9101 et 9102 se répètent jusqu'à ce que le mot qui satisfait la condition de  thrown in the word picking processing 9101, the table 9036 relating to the head and end conditions of the block is requested, so that it is determined whether or not one exists which satisfies the head condition (9102). In this way, steps 9101 and 9102 are repeated until the word which satisfies the condition of

tête ait été détecté.head has been detected.

Lorsque la condition de tête est satisfaite, le mot immé-  When the head condition is satisfied, the word imm-

diatement suivant et les mots lui succédant prélevés en nombre  next diat and the succeeding words taken in number

voulu sont examinés afin que soit vérifié l'accord avec la condi-  wanted are examined in order to verify the agreement with the condi-

tion de tête du bloc (9104). Dans ce cas, le dictionnaire est consulté pour chacun des mots si cela est nécessaire. Le pointeur  block head (9104). In this case, the dictionary is consulted for each of the words if necessary. The pointer

de position n'avance pas.position does not advance.

Si La concordance a Lieu avec la condition de tête du bloc à l'étape 9104, alors un mot qui satisfait la condition de fin du bloc, eu égard à la condition de tête, est recherché (9105). Les étapes 9014-9106 sont reprises cycliquement jusqu'à ce que le mot qui satisfait la condition de fin ait été découvert. Lorsqu'un mot satisfait la condition de fin (9106), un amas contenant le mot est reconnu comme étant un bloc, et le bloc est écrit (9107). Plus spécialement, il est préparé un bloc sur la base du fait qu'il est estimé que la condition de préparation du bloc est satisfaite à la position o la condition de fin a d'abord été satisfaite. Ensuite, en référence avec la table d'information de préparation de bloc 9036, la position relative au mot indiqué par le pointeur à la position o son avance a été arrêtée dans le traitement 9103 est définie comme étant la position de tête du bloc, et la position satisfaisant la condition de fin apparaissant en premier après cela est définie comme étant la position de fin du bloc. Simultanément,  If the match takes place with the head condition of the block in step 9104, then a word which satisfies the end condition of the block, having regard to the head condition, is searched (9105). The steps 9014-9106 are repeated cyclically until the word which satisfies the end condition has been discovered. When a word satisfies the end condition (9106), a cluster containing the word is recognized as a block, and the block is written (9107). More specifically, a block is prepared based on the fact that it is judged that the condition for preparing the block is satisfied at the position where the end condition has first been satisfied. Then, with reference to the block preparation information table 9036, the position relative to the word indicated by the pointer at the position where its advance was stopped in processing 9103 is defined as being the head position of the block, and the position satisfying the end condition appearing first after that is defined as the end position of the block. Simultaneously,

le but et le rôle du bloc sont également écrits.  the purpose and role of the block are also written.

En résultat de cette reconnaissance du bloc, s'il y a "..., conjonction... " dans la phrase d'anglais par exemple, comme représenté sur la figure 70, l'amas partant de la tête de la phrase et allant jusqu'à la partie qui précède "," est reconnu comme étant un premier bloc, tandis que l'amas qui part de ", conjonction" qui  As a result of this recognition of the block, if there is "..., conjunction ..." in the English sentence for example, as shown in FIG. 70, the cluster starting from the head of the sentence and going to the preceding part "," is recognized as being a first block, while the cluster which starts from ", conjunction" which

va jusqu'à la fin de la phrase est reconnu comme étant un autre.  goes to the end of the sentence is recognized as another.

bloc. Sur la figure, ce qui est à l'intérieur des signes E] indique un bloc. Dans ce bloc, le but et le rôle sont tous deux une  block. In the figure, what is inside the signs E] indicates a block. In this block, the goal and the role are both a

phrase. De plus, un amas allant du mot qui vient après la conjonc-  phrasing. In addition, a cluster going from the word that comes after the conjuction-

tion jusqu'à la fin de la phrase forme un autre bloc, dans lequel  tion until the end of the sentence forms another block, in which

Le but et le rôle sont également unephrase. Selon une autre possi-  The purpose and role are also unephrase. According to another possibility

bilité, l'amas allant de la conjonction jusqu'à la fin de la phrase peut être défini comme un bloc. Dans ce cas, le but est un membre  bility, the cluster going from the conjunction to the end of the sentence can be defined as a block. In this case, the goal is a member

de phrase et le rôle est un adverbe.  and the role is an adverb.

Le bloc peut également être défini comme partant de La position ne contenant pas ",". De plus, il est possible d'exclure du champ d'action de L'analyse la ponctuation, ou des éléments  The block can also be defined as starting from the position not containing ",". In addition, it is possible to exclude from the scope of the Analysis punctuation, or elements

analogues, au titre de l'information possédée par le bloc.  analogues, under the information possessed by the block.

De la même manière, s'il y a "... pronon relatif...", ", pronom relatif... " peut être reconnu comme un bloc. Dans ce bloc, Le but est un membre de phrase ou une phrase et le rôle est un  In the same way, if there is "... relative pronon ...", ", relative pronoun ..." can be recognized as a block. In this block, The goal is a phrase or phrase and the role is a

adverbe ou un adjectif.adverb or adjective.

Le bloc peut naturellement être une structure d'accueil.  The block can naturally be a reception structure.

Par exemple, si la phrase d'anglais possède une structure telle que "(tête de la phrase)..., conjonction,..., pronom relatif... (fin de la phrase)"comme cela est représenté par exemple sur la figure 71, l'amas partant de ", conjonction" et allant jusqu'à la fin de  For example, if the English sentence has a structure such as "(head of the sentence) ..., conjunction, ..., relative pronoun ... (end of the sentence)" as shown for example on Figure 71, the cluster starting from ", conjunction" and going until the end of

la phrase constitue un bloc BL1-BL1, dans lequel ", pronom rela-  the sentence constitutes a block BL1-BL1, in which ", pronoun rela-

tif...," est un autre bloc BL2-BL2 contenu dans le premier bloc.  tif ..., "is another BL2-BL2 block contained in the first block.

De cette manière, la section d'analyse morphologique 9016 distingue Les particularités de La phrase en ce qui concerne la  In this way, the morphological analysis section 9016 distinguishes The particularities of The sentence with regard to the

forme et le vocabulaire de manière à pouvoir particulariser vis-à-  form and vocabulary so as to be able to specialize vis-à-vis

vis du reste l'agencement structurel en tant que bloc. En outre, en  screw the rest of the structural arrangement as a block. Furthermore, in

plus de cette reconnaissance de bloc, la section d'analyse morpho-  In addition to this block recognition, the morpho- analysis section

logique 9016 effectue également divers traitements tels que l'expression d'un nom propre, d'un mot dérivé, d'un mot inconnu, d'une abréviation, d'une expression numérique, d'une expression temporelle, d'un mot avec trait d'union, d'une apostrophe "'", aussi bien que l'estimation d'une apposition et le traitement d'une interrogation redondante, afin de préparer les données d'analyse morphologique. La phrase d'anglais qui a été ainsi soumise à une analyse morphologique est transférée à la section I d'analyse syntaxique 9020 en même temps que l'information d'analyse. La figure 72 montre un exemple des données de sortie. Cette figure montre le résultat obtenu lorsque la phrase d'anglais: I said, "White House is'nt white"Je disais, "La Maison Blanche n'est pas blanche")  logic 9016 also performs various processes such as the expression of a proper name, a derived word, an unknown word, an abbreviation, a numeric expression, a temporal expression, a word with hyphen, an apostrophe "'", as well as the estimation of an apposition and the processing of a redundant query, in order to prepare the morphological analysis data. The English sentence which has thus been subjected to a morphological analysis is transferred to the syntax analysis section I 9020 together with the analysis information. Figure 72 shows an example of the output data. This figure shows the result obtained when the English sentence: I said, "White House is'nt white" I said, "The White House is not white")

2 6 0 4 8 1 42 6 0 4 8 1 4

a été fournie par La section d'entrée 9010 et anaLysée dans La section d'analyse morphologique 9016. Le bloc I commence à la position de mot n 4 et se termine à la position no 10, auquel cas te but et le rôle sont tous deux, dans ce cas, d'une nature à choisir. De la même manière, le bloc 2 commence à la position n 5 et se termine à la position n 6, auquel le but est un groupe nominal, tandis que le rôle est un nom propre. Ainsi, le bloc "White House is'nt white (La Maison Blanche n'est pas blanche)" contient, à titre de structure d'accueil, un autre bloc "White House (Maison Blanche)". Dans un bloc, c'est-à-dire le plus petit bloc "White House", chacun des constituants placé à l'intérieur fait fonction de nom propre, tandis qu'il possède une position de membre de phrase nominal par rapport à l'extérieur, à savoir "is'nt white. (n'est pas blanche.)". "White House" peut être traité comme  was provided by The input section 9010 and analyzed in The morphological analysis section 9016. Block I starts at the word position n 4 and ends at the position no 10, in which case the goal and the role are all two, in this case, of a nature to choose. Similarly, block 2 starts at position n 5 and ends at position n 6, for which the goal is a nominal group, while the role is a proper name. Thus, the block "White House is'nt white (The White House is not white)" contains, as a reception structure, another block "White House (White House)". In a block, that is to say the smallest "White House" block, each of the constituents placed inside acts as a proper name, while it has a nominal phrase position with respect to the exterior, namely "is'nt white. (is not white.)". "White House" can be treated as

une unité.a unit.

En même temps qu'un semblable bloc d'information, l'information de mot trouvée dans le dictionnaire de mots 9018 est, après avoir été ajoutée à l'information de bloc, envoyée par la section d'analyse morphologique 9016 à la section I d'analyse  Along with a similar block of information, the word information found in the word dictionary 9018 is, after being added to the block information, sent by the morphological analysis section 9016 to section I analysis

syntaxique 9020.syntax 9020.

La section I d'analyse syntaxique 9020 analyse la struc-  Section I parsing 9020 analyzes the structure

ture de surface de la phrase d'anglais en appliquant une règle cfg emmagasinée dans le fichier de règles d'analyse 9036 afin de mettre à jour tous les arbres structurels possibles. Dans ce cas, si un bloc est contenu, l'analyse partielle décrite ci-dessus est  surface ture of the English sentence by applying a cfg rule stored in the analysis rule file 9036 in order to update all possible structural trees. In this case, if a block is contained, the partial analysis described above is

effectuée tandis qu'il est donné la préférence à l'analyse locale.  carried out while preference is given to local analysis.

Ceci peut améliorer le rendement et la précision de l'analyse.  This can improve the performance and accuracy of the analysis.

Plus particulièrement, la relation d'inclusion du bloc est préparée à partir de l'information de position relative au bloc. Ensuite, le bloc situé le plus à l'intérieur est analysé. Le bloc pour lequel l'analyse a été achevée est considéré comme une unité et plus aucun traitement n'est effectué à l'intérieur de  More particularly, the inclusion relationship of the block is prepared from the position information relating to the block. Then, the innermost block is analyzed. The block for which the analysis has been completed is considered as a unit and no more processing is carried out inside

celui-ci. De cette manière, la portée de l'analyse s'étend graduel-  this one. In this way, the scope of the analysis gradually extends-

lement vers les blocs voisins extérieurs. Finalement, toute la phrase est analysée. L'analyse est effectuée sur la base de la  towards the neighboring neighboring blocks. Finally, the whole sentence is analyzed. Analysis is performed on the basis of

26 0 4 8 1 426 0 4 8 1 4

règle cfg suivant un mode bas en haut, droite vers gauche dans la phrase d'anglais. L'analyse est effectuée d'une manière telle qu'it est possible de maintenir toutes les possibilités offertes par les  cfg rule following a mode down at the top, right to left in the English sentence. The analysis is carried out in such a way that it is possible to maintain all the possibilities offered by the

règles de la grammaire.grammar rules.

La figure 73 illustre un exemple d'un tel organigramme de traitement d'analyse. Tout d'abord, sur la base des données d'anglais fournies à la section I d'analyse syntaxique 9020, tous les agencements structurels relatifs à une phrase sont reconnus comme étant des blocs, et il y est fait une estimation du but et du rôle 9120. Le mode d'agencement est tel que représenté sur la  Figure 73 illustrates an example of such an analysis processing flowchart. First, on the basis of the English data provided in Section I of parsing 9020, all the structural arrangements relating to a sentence are recognized as being blocks, and there is an estimate of the purpose and the role 9120. The arrangement mode is as shown in the

figure 70. Ensuite, s'il n'y a aucun bloc présent dans un tel agen-  figure 70. Then, if there is no block present in such an arrangement

cement (9121), la phrase est analysée (9125), et une seule phrase collectivement agencée en un symbole est sélectionnée, et l'analyse de la phrase est terminée (9126). Puisque les traitements 9125 et 9126 sont inclus dans les traitements 9121-9124 si le système de traitement de la phrase tout entière en un seul bloc est employé,  cement (9121), the sentence is analyzed (9125), and a single sentence collectively arranged as a symbol is selected, and the analysis of the sentence is completed (9126). Since processes 9125 and 9126 are included in processes 9121-9124 if the whole sentence processing system in one block is used,

alors ilsne sont pas inutiles.so they are not useless.

Si un bloc est présent, le bloc le plus intérieur est analysé en premier (9122). Dans l'exemple présenté sur la figure 71, l'intérieur du bloc BL2BL2 est analysé. Tandis que diverses solutions sont généralement obtenues par l'analyse, une solution dans laquelle le bloc est collectivement agencé en un unique symbole cfg et qui est en accord avec le but du bloc est choisie parmi ces solutions (9123). Dans ce cas, pour ceux qui possèdent un but"au choix"relativement au bloc, tous ceux qui sont agencés en un  If a block is present, the innermost block is analyzed first (9122). In the example presented in FIG. 71, the interior of the block BL2BL2 is analyzed. While various solutions are generally obtained by analysis, a solution in which the block is collectively arranged in a single symbol cfg and which is in agreement with the purpose of the block is chosen from these solutions (9123). In this case, for those who have a "choice" goal relative to the block, all those who are arranged in a

seul symbole sont sélectionnés. Ensuite, ceux qui ont été sélec-  single symbol are selected. Then those who have been selected

tionnés de cette manière sont traités comme un unique agencement possédant le rôle relatif au bloc (9124). Dans le bloc qui possède  treated in this way are treated as a single arrangement having the role relating to the block (9124). In the block that has

un rôle dit"au choix' un rôle du symbole qui est recueilli collec-  a role called "at choice" a role of the symbol which is collected collectively

tivement dans le traiterment 9123 est défini comme étant le rôle.  in treatment 9123 is defined as the role.

Les traitements 9121-9124 se répètent successivement.  Treatments 9121-9124 are repeated successively.

De cette manière, dans l'exemple de la figure 71, l'inté-  In this way, in the example of figure 71, the inte-

rieur du bloc BL2-BL2 est d'abord analysé, puis l'intérieur de BL1-  the block BL2-BL2 is first analyzed, then the interior of BL1-

BL1 est analysé. Dans ce cas, le bloc BL2-BL2 est traité de la même  BL1 is analyzed. In this case, the BL2-BL2 block is treated the same

manière qu'un mot unique, et aucun des constituants qui le compo-  so that a single word, and none of the constituents that compose it

sent n'est analysé.sent is not analyzed.

De cette manières, lorsque les données définissant l'agencement structurel et la relation subsidiaire sont obtenues, elles sont envoyées à la section II d'analyse syntaxique 9022. Les données peuvent être reconnues facilement sous la forme d'un arbre de structure, comme ci- dessus décrit. Les données sont ramenées à  In this way, when the data defining the structural arrangement and the subsidiary relationship is obtained, it is sent to the syntax analysis section II 9022. The data can be easily recognized in the form of a structure tree, as shown below. - described above. Data is brought back to

la stucture de la phrase de japonais dans la section de transforma-  the Japanese sentence structure in the transform section

tion de structure 9024 et, dans la section de production de traduc-  structure 9024 and in the translation production section

tion 9026, une phrase traduite est produite pour chacun des noeuds qu'elle contient. Le traitement des noeuds de l'arbre structurel  tion 9026, a translated sentence is produced for each of the nodes it contains. Treatment of structural tree nodes

est effectué dans le mode haut en bas, gauche vers droite.  is performed in the top to bottom mode, left to right.

La phrase traduite ainsi produite est soumise à une post-  The translated sentence thus produced is subject to a post-

mise en forme dans la section de post-mise en forme 9030, est visuellement affichée dans la section d'affichage d'opérations 9040 et, par exemple, est imprimée sous la forme d'une phrase de  formatted in the post-formatting section 9030, is visually displayed in the operation display section 9040 and, for example, is printed as a sentence of

* japonais 9034 dans La section de sortie 9032.* Japanese 9034 in the output section 9032.

De cette manière, selon le présent mode de réalisation, les particularités de la phrase d'anglais relativement à la forme et au vocabulaire sont distinguées de manière à pouvoir détacher l'agencement structurel en forme de bloc. Pour le bloc, un but qui peut être le résultat de l'analyse et le rôle structurel avec  In this way, according to the present embodiment, the peculiarities of the English sentence relating to form and vocabulary are distinguished so as to be able to detach the structural arrangement in the form of a block. For the block, a goal which can be the result of the analysis and the structural role with

lequel le bloc fonctionne vis-à-vis de l'extérieur sont estimés.  which block works vis-à-vis the outside are estimated.

Ensuite, la structure de couche de surface de la phrase d'anglais est analysée par application d'une règle cfg afin que tous les arbres structureIs possibles soient mis à jour. Ceci permet de  Next, the surface layer structure of the English sentence is analyzed by applying a cfg rule so that all possible structureIs trees are updated. This allows

réduire le nombre des solutions inutiles et d'améliorer le rende-  reduce the number of unnecessary solutions and improve the return

ment d'analyse, aussi bien que de fournir un résultat d'analyse  analysis as well as providing an analysis result

plus fiable.More reliable.

De cette manière, puisqu'il existe diverses configura-  In this way, since there are various configurations

tions pour l'expression de l'apposition, il est difficile de les reconnaître dans l'analyse, en particulier dans l'analyse du type cfg. Dans ces conditions, puisqu'il est généralement difficile d'effectuer la reconnaissance de l'apposition après l'analyse, une  tions for the expression of apposition, it is difficult to recognize them in the analysis, in particular in the analysis of the cfg type. In these conditions, since it is generally difficult to recognize the apposition after the analysis, a

traduction ambiguë est inévitable. De plus, si une règle suscep-  ambiguous translation is inevitable. In addition, if a rule suscep-

tibLe de les reconnaître était préparée, il y aurait un risque qu'aucune expression de l'apposition ne soit reconnue comme un cas identique ou que le nombre des combinaisons possibles deviennent excessif. Ainsi, une analyse locale inutiLe est effectuée entre les parties contenues dans l'expression en apposition et les autres parties. En relation avec le présent mode de réalisation, la charge imposée au traitement dans l'étape d'analyse peut être adoucie par une reconnaissance de l'expression de l'apposition grâce aux particularités de la phrase se rapportant à la forme ou  tibLe to recognize them was prepared, there would be a risk that no expression of apposition would be recognized as an identical case or that the number of possible combinations would become excessive. Thus, an unnecessary local analysis is carried out between the parts contained in the expression in apposition and the other parts. In relation to the present embodiment, the load imposed on the processing in the analysis step can be softened by recognizing the expression of the apposition thanks to the peculiarities of the sentence relating to the form or

aux particularités sémantiques des mots. Une estimation de l'appo-  to the semantic peculiarities of words. An estimate of the appo-

sition est effectuée par une reconnaissance de la configuration  sition is performed by recognizing the configuration

immédiatement suivante comme constituant un bloc.  immediately following as constituting a block.

Pour la structure de phrase d'anglais "-, pronom relatif L._", le pronom relatif est reconnu du fait de l'existence du code  For the English sentence structure "-, relative pronoun L._", the relative pronoun is recognized due to the existence of the code

de "partie de discours" du mot, par exemple un code spécifique "R".  of "speech part" of the word, for example a specific code "R".

Dans ce cas, la partie intérieure encadrée par "," est considérée comme un bloc à la condition qu'il n'y ait pas intersection avec un bloc ou une unité indiqués dans la pré-mise en forme et qu'ils ne contiennent pas "and (et)" ou bien "or (ou)" dans la partie venant après le deuxième ",". Pour la stucture de phrase d'anglais "_, pronom relatif-.", la partie intérieure encadrée par "," et "," est considérée comme un bloc. Le point pourrait être un autre  In this case, the inner part framed by "," is considered as a block provided that there is no intersection with a block or a unit indicated in the pre-layout and that they do not contain "and (and)" or "or (or)" in the part coming after the second ",". For the English sentence structure "_, relative pronoun-.", The inner part surrounded by "," and "," is considered as a block. The point could be another

symbole utilisé pour indiquer la fin de phrase.  symbol used to indicate the end of the sentence.

Pour permettre l'exécution d'une semblable estimation de  To allow a similar estimate to be made

l'apposition; le dictionnaire 9018 est conçu de manière à emmaga-.  apposition; dictionary 9018 is designed to store.

siner une information de signification des mots. L'information de signification représente un moyen de discerner l'article, le lieu, la personne, etc., comme représenté sur la figure 74. En outre, également pour les conditions de préparation du bloc, la table 9036 est constituée de la manière présentée sur la figure 75 de sorte que la tête du bloc soit reconnue par "nom propre (personne), nom (personne)" comme condition de tête, et la tête du bloc est U reconnue par "nom propre (personne), article nom (personne)". Il est donc possible de produire une estimation de l'expression de l'apposition en relation avec les particularités morphologiques et  siner a word meaning information. The significance information represents a means of discerning the article, the place, the person, etc., as shown in FIG. 74. In addition, also for the conditions of preparation of the block, the table 9036 is constituted in the manner shown in Figure 75 so that the head of the block is recognized by "proper name (person), name (person)" as the head condition, and the head of the block is U recognized by "proper name (person), item name (nobody)". It is therefore possible to produce an estimate of the expression of the apposition in relation to the morphological and

sémantiques sans devoir effectuer l'analyse et d'effectuer l'ana-  without having to perform the analysis and perform the analysis

lyse en considération de l'estimation de l'apposition dans  lysis in consideration of the apposition estimate in

l'exemple présenté dans la figure 64 pour d'autres traitements.  the example presented in figure 64 for other treatments.

En outre, dans la phrase d'anglais, il y a des groupes qui portent une information extrêmement particulière et ne sont utlisés que de façon restrictive. S'ils sont analysés de la même manière que des groupes ordinaires, ils sont analysés dans La phrase de manière entièrement autre et il est difficile d'obtenir  In addition, in the English sentence, there are groups which carry extremely specific information and are used only in a restrictive manner. If they are analyzed in the same way as ordinary groups, they are analyzed in The sentence in an entirely different way and it is difficult to obtain

ta nature particulière initiale de la phrase à l'aide de l'analyse.  your initial particular nature of the sentence using analysis.

De plus, ceci entraîne des pertes importantes.  In addition, this results in significant losses.

Par exemple, "let's" ou "let us" venant juste après la ponctuation est analysé comme une phrase à l'impératif utilisant le  For example, "let's" or "let us" coming just after punctuation is analyzed as a sentence in the imperative using the

verbe causatif "let" et il doit être analysé comme un groupe possé-  causative verb "let" and it should be analyzed as a possessed group

dant la particularité de l'invention.Le mot "Let" possède également diverses utilisations comme verbe transitif et comme nom et son usage n'est pas limité aux invitations comme c'est le cas pour les verbes auxiliaires. Par conséquent, l'analyse doit être menée sur la base des différentes possibilités respectives, ce qui réduit l'efficacité. En outre, il est difficile de donner la préférence à l'utilisation en tant qu'invitation à partir du résultat de l'analyse, puisqu'il n'y a pas de différence entre l'utilisation dans le sens causatif et dans le sens de l'invitation sur la seule base de la structure de la phrase et qu'il est donc difficile de  dant the particularity of the invention.The word "Let" also has various uses as a transitive verb and as a noun and its use is not limited to invitations as is the case for auxiliary verbs. Therefore, the analysis should be conducted on the basis of the respective respective possibilities, which reduces the efficiency. In addition, it is difficult to give preference to use as an invitation from the result of the analysis, since there is no difference between use in the causative sense and in the sense of the invitation based solely on the structure of the sentence and therefore it is difficult to

les distinguer sur la seule base de la structure de la phrase.  distinguish them on the sole basis of the structure of the sentence.

Alors, on peut diminuer le temps perdu à effectuer l'analyse en excluant de l'objet de l'analyse "let's" ou "let us" juste après la ponctuation. De plus, en les séparant de l'usage fondamental du mot, à savoir de l'usage causatif, on peut aisément  So, we can reduce the time lost in performing the analysis by excluding from the subject of the analysis "let's" or "let us" just after the punctuation. Moreover, by separating them from the fundamental use of the word, namely from the causative use, one can easily

effectuer l'analyse sémantique.perform semantic analysis.

Lorsque "please (s'il vous plait)", "let's" ou "let us" apparaissent à la tête du bloc, un drapeau est positionné, puis  When "please", "let's" or "let us" appear at the head of the block, a flag is positioned, then

l'information de bloc et tout ce qui concerne l'information rela-  block information and everything related to related information

tive à l'unité dans chacun des cas ne sont pas délivrés. Par exemple, la phrase d'anglais "let's go to school. (allons à  tive to the unit in each case are not issued. For example, the English phrase "let's go to school."

2 6048 142 6048 14

l'école.)" est traité comme <go to school (aller à L'école)>  school.) "is treated as <go to school>

<attaché à "let's">.<attached to "let's">.

Pour effectuer une semblable analyse de "Let", iL est prévu une section 9200 de traitement d'information relative à "let" entre la section d'analyse morphologique 9016 et la section I  To perform a similar analysis of "Let", iL is provided a section 9200 of information processing relating to "let" between the morphological analysis section 9016 and section I

d'analyse syntaxique 9020 selon une variante de ce mode de réalisa-  parsing 9020 according to a variant of this embodiment

tion. La figure 77 illustre collectivement les sections consi-  tion. Figure 77 collectively illustrates the sections

dérées. Sur ces figures, les éléments identiques à ceux présentés  derées. In these figures, the elements identical to those presented

sur la figure 64 sont désignés par les mêmes numéros de référence.  in Figure 64 are designated by the same reference numbers.

En outre, le dictionnaire 9018 est constitué de manière à emmagasiner l'information sur "let" pour le mot. Comme représenté sur la figure 78, l'information sur "let" fournit "0" pour les mots ordinaires, "1" pour "let's" et "let us", et "2" pour "please (s'il  In addition, the 9018 dictionary is constructed to store the "let" information for the word. As shown in Figure 78, the information on "let" provides "0" for ordinary words, "1" for "let's" and "let us", and "2" for "please (if

vous plait)".Please)".

La section 9200 de traitement d'information sur "let" a pour fonction de recevoir le résultat de l'analyse morphologique, en même temps que la phrase d'anglais d'entrée, de la section d'analyse morphologique 9016 et d'ajouter l'information sur "let" comme information complémentaire de l'information d'un mot pendant l'analyse, comme représenté sur la figure 79. Dans ce cas, il est présenté un bloc pour la phrase. Dans i'exemple montré sur cette figure, le bloc 0 est (début: 1, fin: 10, but: phrase, rôle: phrase). Ainsi, le bloc de cet exemple comporte par exemple une phrase en plus d'un membre de phrase, d'un groupe, etc. Dans ce cas, le concept relatif au bloc comporte également un paragraphe et la phrase tout entière, chacun d'eux pouvant être considéré comme un bloc unique. De plus, "racine de verbe transitif (attaché à 's)"  The function of the information processing section 9200 on "let" is to receive the result of the morphological analysis, at the same time as the input English sentence, from the morphological analysis section 9016 and to add the information on "let" as additional information to the information of a word during the analysis, as shown in FIG. 79. In this case, a block is presented for the sentence. In the example shown in this figure, block 0 is (start: 1, end: 10, goal: sentence, role: sentence). Thus, the block of this example includes for example a sentence in addition to a phrase, a group, etc. In this case, the concept of the block also includes a paragraph and the entire sentence, each of which can be considered as a single block. In addition, "transitive verb root (attached to 's)"

est décrit comme la partie de discours de "let's" pour l'informa-  is described as the speech part of "let's" for the informa-

tion du mot, et l'information sur "let" est "1".  tion of the word, and the information on "let" is "1".

Comme représenté sur la figure 81, un traitement de préparation d'un bloc de la phrase 9300 est effectué avant que ne soit commencé l'agencement collectif du bloc pour la phrase  As shown in FIG. 81, a processing for preparing a block of the sentence 9300 is carried out before the collective arrangement of the block for the sentence has been started.

d'anglais d'entrée. Les traitements suivants peuvent être iden-  Entrance English. The following treatments can be

tiques à ceux de l'organigramme de la figure 66. Par exemple, dans la phrase d'anglais,  ticks to those in the flowchart in Figure 66. For example, in the English sentence,

26 0 4 8 1 426 0 4 8 1 4

I said, "Let's go to school. (Je disais, allons à L'écoLe.)", le bloc 0 (début: tête de la phrase, fin: fin de la phrase,  I said, "Let's go to school. (I said, let's go to School.)", Block 0 (start: head of the sentence, end: end of the sentence,

rôle: phrase, but: phrase) est formé.  role: sentence, goal: sentence) is formed.

Comme représenté sur la figure 81, dans la section I d'analyse syntaxique 9020,chacun des agencements structurels est reconnu comme étant un bloc sur la base des données d'anglais qui lui sont délivrées et le but et le rôle de ce bloc sont estimés (9120). Si Le bloc n'est pas présent dans l'agencement (9121), l'analyse prend fin. Si des blocs sont présents dans la phrase  As shown in FIG. 81, in the syntax analysis section I 9020, each of the structural arrangements is recognized as being a block on the basis of the English data which are delivered to it and the purpose and the role of this block are estimated (9120). If the block is not present in the layout (9121), the analysis ends. If blocks are present in the sentence

d'entrée, le bloc le plus intérieur est d'abord analysé (9122).  first, the innermost block is first analyzed (9122).

Alors que diverses solutions sont généralement obtenues par l'ana-  While various solutions are generally obtained by the ana-

lyse, seule la solution collectivement agencée en tant que symbole cfg est retenue parmi elles (9123). Les traitements suivants sont  lysis, only the solution collectively arranged as a cfg symbol is retained among them (9123). The following treatments are

identiques à ceux présentés sur la figure 73.  identical to those presented in figure 73.

Le traitement d'information sur "Let" est effectué dans la section 9200 de traitement d'information sur "let" suivant les organigrammes présentés à titre d'exemple sur les figures 83A et 83B. Tout d'abord, un pointeur est positionné sur le bloc de tête (9330), afin que soit vérifié le mot placé à la tête du bloc (9331). Si l'information sur "let" est "0", le pointeur avance d'un  Information processing on "Let" is carried out in section 9200 of information processing on "let" according to the flowcharts presented by way of example in FIGS. 83A and 83B. First, a pointer is positioned on the head block (9330), so that the word placed at the head of the block (9331) is checked. If the information on "let" is "0", the pointer advances by one

cran (9339) afin d'être transféré au mot suivant.  notch (9339) to be transferred to the next word.

Si l'information sur "let" n'est pas "0", l'unité de référence du dictionnaire précédente est vérifiée (9322). S'il ne s'agit pas d'une ponctuation ou si le pointeur n'indique pas la tête, le pointeur avance par degrés (9339) pour se tranférer au mot suivant. Lorsque l'unité de référence du dictionnaire précédente  If the information on "let" is not "0", the reference unit of the previous dictionary is checked (9322). If it is not punctuation or if the pointer does not indicate the head, the pointer advances by degrees (9339) to transfer to the next word. When the previous dictionary reference unit

se révèle, à la vérification, être une ponctuation, ou si le poin-  turns out to be punctuation, or if the point-

teur indique la tête, le bloc de la couche la plus intérieure  tor indicates the head, the innermost layer block

contenant le mot se voit affecterun repère (9333).  containing the word is assigned a mark (9333).

Ensuite, si l'information sur "let" est "1" (9334), puisqu'il s'agit de l'expression "let's" ou "let us" venant juste après la ponctuation, le rôle du bloc repéré est reconnu comme étant une "phrase d'invitation" (9336). Si l'information est "2", puisque ceci correspond à "please (s'il vous plait)", le rôle du  Then, if the information on "let" is "1" (9334), since it is the expression "let's" or "let us" coming just after the punctuation, the role of the block identified is recognized as being an "invitation phrase" (9336). If the information is "2", since this corresponds to "please (please)", the role of

bloc repéré est reconnu comme étant une "phrase de demande" (9335).  block identified is recognized as a "request phrase" (9335).

Ensuite, le but du bloc repéré est reconnu comme étant une phrase à l'impératif (9337) et l'information relative au mot indiquée par Le pointeur est annulée (9338). Ensuite, le pointeur avance d'un cran (9339), afin de se transférer au mot suivant. Le traitement est  Then, the goal of the identified block is recognized as being a sentence in the imperative (9337) and the information relating to the word indicated by the pointer is canceled (9338). Then, the pointer advances by one notch (9339), in order to transfer to the next word. The treatment is

exécuté pour le mot se trouvant à la position finale (9340).  executed for the word in the final position (9340).

La figure 80 montre des exemples se rapportant au-  Figure 80 shows examples of

résultat de l'analyse pour laquelle le traitement d'information sur "let" a été exécuté en application à l'exemple de la phrase d'entrée ci-dessus mentionnée I said "let's go to school. (Je disais, allons à l'école.)" La section 9200 de traitement d'information sur "let", lorsqu'elle ajoute l'information sur "Let" à l'information relative au mot, élimine l'information relative au mot concernant l'information sur "let" dans la table, et l'information relative au bloc est décrite comme étant une "phrase impérative" quant au but et comme une "phrase d'invitation" quant au rôle, comme représenté sur la  result of the analysis for which the information processing on "let" was executed in application to the example of the above mentioned input sentence I said "let's go to school. (I said, let's go to the 'school.) "Section 9200 for processing information on" let ", when adding information on" Let "to the word information, eliminates the word information about the" let "in the table, and the block information is described as being an" imperative sentence "regarding the goal and as an" invitation sentence "regarding the role, as shown in the

figure 80.figure 80.

En outre, dans le cas o le dictionnaire 9018 est consulté pour l'ensemble formé par plusieurs mots couplés par des traits d'union, lorsqu'on est dans le cas o sont manipulés des mots liés par des traits d'union dans la phrase d'anglais, si leurs  In addition, in the case where the dictionary 9018 is consulted for the set formed by several words coupled by hyphens, when one is in the case where words linked by hyphens are manipulated in the sentence of English, if their

rubriques d'entrée existent dans le dictionnaire 9018, le traite-  entry headings exist in dictionary 9018, the

ment aboutit. Pour un mot avec trait d'union non inscrit dans le dictionnaire 9018, si toute la partie est traitée comme étant un mot inconnu, par exemple un adjectif, puisque l'information du dictionnaire pour chacun des mots couplés par des traits d'union appartenant au groupe de mots liés par des traits d'union ne peut pas être utilisée, il ne peut être traduit. En outre, si une  ment succeeds. For a hyphenated word not entered in the dictionary 9018, if the whole part is treated as being an unknown word, for example an adjective, since the dictionary information for each of the words coupled by hyphens belonging to the group of words linked by hyphens cannot be used, it cannot be translated. In addition, if a

rubrique d'entrée pour l'information relative à chacun des consti-  entry section for information relating to each of the

tuants du groupe de mots liés par des traits d'union est présente dans le dictionnaire 9018, il n'est pas possible de faire autrement que de les négliger. De plus, si l'analyse a été effectuée par décomposition en chacun des éléments constituants, le couplage des mots liés par des traits d'union est alors susceptible de prendre  kills from the group of words linked by hyphens is present in the dictionary 9018, it is not possible to do otherwise than to neglect them. In addition, if the analysis has been carried out by decomposition into each of the constituent elements, the coupling of the words linked by hyphens is then likely to take

des formes extrêmement diverses.extremely diverse forms.

Eu égard à ce qui a été énoncé ci-dessus, pour éliminer le problème, l'ensemble formé par des mots liés par des traits d'union est analysé comme constituant un adjectif dans la phrase,  In view of what has been stated above, to eliminate the problem, the set formed by words linked by hyphens is analyzed as constituting an adjective in the sentence,

en même temps que l'analyse est menée pour la seule partie inté-  at the same time as the analysis is carried out for the only integrated part

rieure des mots liés par des traits d'union, les éléments consti-  of words linked by hyphens, the elements

tuants de l'ensemble formé des mots liés par des traits d'union et  kills of the set formed of words linked by hyphens and

l'ensemble ainsi obtenu étant alors combinés. Ceci permet d'effec-  the assembly thus obtained then being combined. This allows for

tuer l'analyse des mots liés par des traits d'union tout en utili-  kill the analysis of words linked by hyphens while using

sant l'information relative à chacun des mots constitutifs. Ainsi, pour des mots liés par des traits d'union qui ne sont pas inscrits dans le dictionnaire 9018, l'ensemble formé par tous ces mots est traité de la même façon qu'un adjectif. Les noms couplés par des traits d'union sont cherchés dans le dictionnaire et l'analyse est menée sous une forme fermée pour le seul contenu intérieur du  information relating to each of the constituent words. Thus, for words linked by hyphens which are not listed in the dictionary 9018, the set formed by all these words is treated in the same way as an adjective. Names linked by hyphens are searched for in the dictionary and the analysis is carried out in a closed form for the sole internal content of the

groupe de mots liés par des traits d'union.  group of words linked by hyphens.

Ainsi, si le mot avec traits d'union est un mot non inscrit dans le dictionnaire 9018, une information de bloc est délivrée qui concerne l'ensemble du groupe de mots considéré comme un seul bloc et la consultation du dictionnaire est effectuée pour chacun des constituants de l'intérieur du bloc afin d'obtenir les informations relatives aux unités respectives, sans tenir compte des traits d'union. Pour le mot non inscrit dans le dictionnaire, un traitement d'estimation final est effectué parmi les traitements de mots inconnus à la manière d'un triage des traitements de mots inconnus. Ce traitement des traits d'union peut être effectué suivant l'exemple de la structure présentée sur la figure 64. Dans ce cas, la position du mot dans la phrase n'est pas exprimée par le numéro appliqué au mot, mais par le nombre de caractères compté à partir de la tête de la phrase, c'est-à-dire le nombre de caractères. La figure 84 montre un exemple de traitement de mots liés  Thus, if the hyphenated word is a word not entered in the dictionary 9018, block information is delivered which relates to the entire group of words considered as a single block and the dictionary is consulted for each of the constituents of the interior of the block in order to obtain the information relating to the respective units, without taking account of the hyphens. For the word not entered in the dictionary, a final estimation processing is carried out among the processing of unknown words in the manner of sorting the processing of unknown words. This treatment of the hyphens can be carried out according to the example of the structure presented in FIG. 64. In this case, the position of the word in the sentence is not expressed by the number applied to the word, but by the number of characters counted from the head of the sentence, i.e. the number of characters. Figure 84 shows an example of related word processing

par des traits d'union effectué dans la section d'analyse morpho-  by hyphens performed in the morpho- analysis section

Logique 9016. Pour une phrase d'anglais d'entrée teLLe que, par  Logic 9016. For an input English sentence such as, for example

exempLe, "The anti-war attitude is her open-door policy. (L'atti-  example, "The anti-war attitude is her open-door policy.

tude anti-guerre (c'est-à-dire pacifiste) est sa poLitique de porteouverte (c'est-à-dire de libre accès ou de Libre échange).)", Le pointeur de position avance par degrés pour faire sortir un mot (9135) et effectue la consultation du dictionnaire (9353). Dans ce cas, le trait d'union n'est pas utilisé comme un  anti-war study (that is to say pacifist) is its policy of open door (that is to say of free access or free exchange).) ", The position pointer advances by degrees to bring out a word (9135) and searches the dictionary (9353). In this case, the hyphen is not used as a

délimiteur pour le mot.delimiter for the word.

Si la rubrique d'entrée existe (9353), l'information relative au mot est alors écrite (9359). Ceci se répète jusqu'à la  If the entry item exists (9353), the information relating to the word is then written (9359). This is repeated until the

fin de la phrase.end of sentence.

Dans le cas o l'entrée n'est pas trouvée lors de la consultation du dictionnaire (9352), s'il ne s'agit pas d'un mot contenant un trait d'union (9354), l'information relative au mot est alors écrite (9359), tandis que, s'il s'agit d'un mot contenant un trait d'union, le bloc possédant le trait d'union est écrit (9355). Dans le bloc possédant le trait d'union, la position de départ est la position initiale du mot avec trait d'union et la  If the entry is not found when consulting the dictionary (9352), if it is not a word containing a hyphen (9354), the information relating to the word is then written (9359), while, if it is a word containing a hyphen, the block with the hyphen is written (9355). In the block with the hyphen, the starting position is the initial position of the hyphenated word and the

position de fin est la position finale du mot avec trait d'union.  end position is the final position of the hyphenated word.

Le but est du type "au choix" et le rôle est "adjectif/nom".  The goal is of the "choice" type and the role is "adjective / noun".

Ensuite, on détache le trait d'union pour extraire chacun des mots constituants (9356), et les mots constituants respectifs sont cherchés dans le dictionnaire (9357). L'information relative au mot obtenue en résultat de la consultation du dictionnaire (9358) est alors écrite. Pour le cas de l'écriture de l'information de mot aux étapes 9359 et 9358, il est écrit sous la forme "partie de discours = mot non inscrit dans le dictionnaire" dans le cas d'un  Next, the hyphen is detached to extract each of the constituent words (9356), and the respective constituent words are searched for in the dictionary (9357). The information relating to the word obtained as a result of consulting the dictionary (9358) is then written. For the case of writing the word information in steps 9359 and 9358, it is written in the form "part of speech = word not entered in the dictionary" in the case of a

mot non inscrit dans le dictionnaire.  word not listed in the dictionary.

La figure 85 montre des exemples relatifs à l'information de bloc et à l'information de mot du bloc d'anglais collectivement agencé en un bloc à la suite du traitement de l'exemple de la  FIG. 85 shows examples relating to the block information and to the word information of the block of English collectively arranged in a block following the processing of the example of the

phrase d'entrée. Dans cet exemple, le mot avec trait d'union "anti-  input sentence. In this example, the hyphenated word "anti

war (anti-guerre)" est inscrit dans le dictionnaire 9018 et le mot  war (anti-guerre) "is inscribed in the dictionary 9018 and the word

"open-door (porte-ouverte)" n'est pas inscrit dans le dictionnaire.  "open-door" is not listed in the dictionary.

Par conséquent, la rubrique d'entrée du mot avec trait d'union "anti-war" est alors écrite comme information du mot. Toutefois, pour les mots liés par trait d'union "open-door', ils sont décomposés en "open (ouvert)" et "door (porte)" et écrits comme informations pour les mots, et le bloc 1 (début: 30, fin: 38, but: au choix, rôle: adjectif/nom) est écrit comme information  Therefore, the entry box for the hyphenated word "anti-war" is then written as word information. However, for hyphenated words "open-door ', they are broken down into" open (open) "and" door (porte) "and written as information for the words, and block 1 (start: 30 , end: 38, goal: optional, role: adjective / noun) is written as information

pour le bloc.for the block.

En outre, alors que la forme de l'interrogation redon-  Furthermore, while the form of the question

dante de l'anglais est extrêmement limitée, son traitement se révèle extrêmement complexe par le procédé d'analyse ordinaire. De  Dante of English is extremely limited, its treatment is extremely complex by the ordinary method of analysis. Of

plus, il n'est pas facile de déterminer le verbe auquel l'interro-  moreover, it is not easy to determine the verb to which the question

gation additive se rapporte.Additive gation relates.

Eu égard à ce qui vient d'être énoncé, après Qu'il a été reconnu qu'il s'agissait d'une interrogation redondante sur la base de l'aspect particulier de la phrase considéree du point de vue de sa forme, celle-ci est traitée comme une information relative à l'arrangement structurel auquel elle appartient, grâce à quoi le verbe visé par l'interrogation redondante peut être précisée, c'est-à-dire que la partie de l'interrogation redondante de la phrase d'anglais se voit découverte comme étant une configuration stucturelle et qu'on effectue l'analyse en considérant la partie de l'interrogation redondante comme étant une simple information qui  Having regard to what has just been stated, after It has been recognized that this was a redundant questioning on the basis of the particular aspect of the sentence considered from the point of view of its form, that -this is treated as information relating to the structural arrangement to which it belongs, thanks to which the verb targeted by the redundant query can be specified, that is to say that the part of the redundant query of the sentence of English is discovered as being a structural configuration and the analysis is carried out by considering the part of the redundant query as being simple information which

possède un certain type d'agencement structureL lui appartenant.  has a certain type of structureL arrangement belonging to it.

Dans le présent mode de réalisation, une unité ou un bloc est décrit sous la forme d'un symbole (à partir de l'indication de point selon laquelle il s'agit d'un point de fin d'unité ou de bloc). Le texte de la phrase d'entrée est conformé pendant l'analyse morphologique durant laquelle la reconnaissance du bloc est également effectuée. Dans le présent mode de réalisation, le C signe "guillemet" est désigné par "Q" et le signe de l'accolade est désigné par "P". Par exemple, ces signes sont spécifiés de la manière ci-après présentée: ....' par \(Q'....\)', "...." par \(Q".... \)", (....) par (\(P....\)),  In the present embodiment, a unit or a block is described in the form of a symbol (from the point indication that it is an end point of a unit or block). The text of the input sentence is conformed during the morphological analysis during which the block recognition is also carried out. In the present embodiment, the C sign "quotation mark" is designated by "Q" and the sign of the brace is designated by "P". For example, these signs are specified in the following manner: .... 'by \ (Q' .... \) ', "...." by \ (Q ".... \) ", (....) by (\ (P .... \)),

<....> par <\(P....<....> by <\ (P ....

par L\(P....\)} etby L \ (P .... \)} and

E....] par E\(P....\)] respectivement.  E ....] by E \ (P .... \)] respectively.

La reconnaissance du bloc s'effectue donc de cette manière.  The block is therefore recognized in this way.

Le symbole de début et le symbole de fin du bloc ne sont appliques que dans le contexte o le bloc s'ouvre ou se ferme à l'aide de ces symboles. La partie qui précède immédiatement le signal de début et celle qui vient juste après le signal de fin  The start symbol and the end symbol of the block are only applied in the context where the block opens or closes using these symbols. The part immediately preceding the start signal and the part immediately following the end signal

doivent être des symboles autres que des symboles alphanumériques.  must be symbols other than alphanumeric symbols.

Les symboles ci-dessus ne correspondant pas au cas précité sont traités comme de simples symboles. Les blocs peuvent parfois être dans des relations d'accueil dans la mesure o ils ne présentent  The above symbols which do not correspond to the above case are treated as simple symbols. The blocks can sometimes be in host relationships insofar as they do not present

pas d'intersection entre eux.no intersection between them.

Lors du traitement de l'interrogation redondante, si le groupe de mots venant ensuite succède à une situation pour laquelle le pointeur indique ",", l'amas qui part. après "," et qui va  During the processing of the redundant query, if the group of words coming next follows a situation for which the pointer indicates ",", the cluster which leaves. after "," and who goes

jusqu'à "?" est rejeté en tant qu'unité et un drapeau est posi-  until "?" is rejected as a unit and a flag is posi-

tionné comme pour un bloc. Ainsi, la forme de la phrase d'interro-  tioned as for a block. So the form of the phrase

gation redondante comprend: ", (verbe auxiliaire) + (pronom personnel) ?" ", (verbe auxiliaire) n't + (pronom personnel) ?" ", (verbe auxiliaire) + (pronom personnel) + not (c'est-à-dire la  redundant gation includes: ", (auxiliary verb) + (personal pronoun)?" ", (auxiliary verb) n't + (personal pronoun)?" ", (auxiliary verb) + (personal pronoun) + not (i.e.

particule de négation utilisée pour la conjugaison) ?".  negation particle used for conjugation)? ".

De plus, les verbes auxiliaires comprennent les types tels que: "am, is, are (formes de conjugaison du verbe être au présent)", "was, were (formes de conjugaison du verbe être au passé)", "do,  In addition, auxiliary verbs include types such as: "am, is, are (forms of conjugation of the verb to be in the present)", "was, were (forms of conjugation of the verb to be in the past)", "do,

does, did (particules verbales de la négation et de l'interroga-  does, did (verbal particles of negation and questioning

tion)", "have, has, had (formes de la conjugaison du verbe avqir au présent et au passé)", "will, shall, would, should (particules verbales de la conjugaison du futur et du conditionnel)", "can, cannot, could (formes du verbe pouvoir au présent (affirmatif et négatif) et au passé)", "may, might (formes d'un autre verbe pouvoir au présent et au passé)", "must, ought (diverses formes du verbe exprimant l'obligation)", "won't, shan't (particules du futur et du conditionnel à la forme négative)", "need (verbe avoir besoin)", "dare (verbe oser)", "used (forme verbale utilisée pour exprimer l'habitude)". Les pronoms personnels comprennent "I (je)", "you (tu/vous)", "he, she, it (il ou elle respectivement pour L'homme, la femme et l'animal ou l'objet)", "we (nous)", "they (ils  tion) "," have, has, had (forms of the conjugation of the verb avqir in the present and the past) "," will, shall, would, should (verbal particles of the conjugation of the future and the conditional) "," can , cannot, could (forms of the verb power in the present (affirmative and negative) and the past) "," may, might (forms of another verb power in the present and the past) "," must, ought (various forms of the verb expressing obligation) "," won't, shan't (future and conditional particles in negative form) "," need (verb to need) "," dare (verb to dare) "," used ( verb form used to express habit) ". Personal pronouns include" I (I) "," you (you / you) "," he, she, it (he or she respectively for Man, Woman and animal or object) "," we (we) "," they (they

ou elles)". Tout ceci est utilisé comme information pour le bloc de la couche situéeor them) ". All this is used as information for the block of the layer located

le plus à l'intérieur auquel ces expressions appartiennent. Par exemple, dans la phrase d'anglais: you said so, didn't you ? (vous avez dit cela, n'est-ce-pas ?) toute cette partie est reconnue comme étant un bloc en relation avec l'agencement structurel EYou said so (vous avez dit cela)] <avec interrogation redondante>. De même, dans la phrase d'anglais: I said, "You said so, didn't you ?" (je disais, "vous avez dit cela, n'estce-pas ?" la phrase mise entre guillemets "You said so, didn't you ?" est  the most inside to which these expressions belong. For example, in the English sentence: you said so, didn't you? (you said that, right?) this whole part is recognized as being a block in relation to the structural arrangement EYou said so (you said that)] <with redundant interrogation>. Similarly, in the English sentence: I said, "You said so, didn't you?" (I said, "You said that, didn't you?" the quotation mark "You said so, didn't you?" is

reconnue comme étant un bloc 1 sur la base de l'arrangement struc-  recognized as being a block 1 on the basis of the structural arrangement

turel et, de plus, l'ensemble de la partie est reconnue comme étant un bloc 2 sur la base de l'arrangement structurel, c'est-a-dire [I  turel and, moreover, the whole of the part is recognized as being a block 2 on the basis of the structural arrangement, that is to say [I

said, [you said so,] <attaché à une interrogation redondante>.  said, [you said so,] <attached to a redundant query>.

Le mot abrégé "didn't" est traité après avoir été déve-  The abbreviated word "didn't" is processed after being developed

loppé à sa forme orthographique complète à l'aide d'une table prédéterminée. Dans le cas de mots possédant plusieurs formes  loped to its full spelling form using a predetermined table. In the case of words having several forms

développées, elles sont toutes fournies.  developed, they are all supplied.

Pour effectuer un tel traitement de l'interrogation  To perform such interrogation processing

redondante, une section 9210 de traitement d'interrogation redon-  redundant, a redundant query processing section 9210

dante est disposée entre la section d'analyse morphologique 9016 et la section I d'analyse syntaxique 9020 suivant une autre variante  dante is arranged between the morphological analysis section 9016 and the syntax analysis section I 9020 according to another variant

du présent mode de réalisation. La figure 87 représente collecti-  of this embodiment. Figure 87 shows collecti-

vement les sections considérées. Sur cette figure, les éléments identiques à ceux présentés sur la figure 64 portent les mêmes  the sections considered. In this figure, the elements identical to those presented in Figure 64 bear the same

numéros de référence.reference numbers.

La section 9210 de traitement d'interrogation redondante reçoit le résultat de l'analyse morphologique en même temps que la  The redundant interrogation processing section 9210 receives the result of the morphological analysis at the same time as the

phrase d'anglais d'entrée de la part de la section d'analyse mor-  entry English sentence from the Moral Analysis Section

phologique 9016 et, comme représenté sur la figure 88, un bloc est réalisé pour la phrase. Dans les exemples présentés sur cette figure, le bloc 0 est (début: 1, fin: 12, but: phrase, rôLe: phrase). Dans ce cas, le mot est représenté par le numéro du mot pour ce mode de réalisation modifié). Dans ce mode de réalisation modifié, le bloc comporte par exemple une phrase en plus du membre de phrase et du groupe. Dans ce cas, le concept du bloc comporte également Le paragraphe et la phrase toute entière, qui peuvent  phological 9016 and, as shown in figure 88, a block is made for the sentence. In the examples presented in this figure, block 0 is (start: 1, end: 12, goal: sentence, role: sentence). In this case, the word is represented by the word number for this modified embodiment). In this modified embodiment, the block includes for example a sentence in addition to the phrase and the group. In this case, the concept of the block also includes the paragraph and the entire sentence, which can

chacun être considérés comme un bloc unique.  each be considered a single block.

L'agencement collectif du bloc de la phrase d'anglais d'entrée comportant l'interrogation redondante peut être  The collective arrangement of the block of the input English sentence with the redundant query can be

le même que celui présenté dans l'organigramme de la figure 81 -ci-  the same as that presented in the flowchart of figure 81 -ci-

dessus décrite. Ainsi, le traitement 9300 servant à préparer le bloc de la phrase est effectué avant le début du traitement. Par exemple, dans la phrase d'anglais:  above described. Thus, the processing 9300 used to prepare the block of the sentence is carried out before the start of the processing. For example, in the English sentence:

I said, "It is good, isn't it ?" (je disais, "c'est bon, n'est-ce-  I said, "It is good, isn't it?" (I said, "It's good, isn't it-

pas ?) le bloc O (début: tête de la phrase, fin: fin de la phrase,  not?) the O block (start: head of the sentence, end: end of the sentence,

rôle: phrase, but: phrase) est formé.  role: sentence, goal: sentence) is formed.

Dans la section I d'analyse syntaxique 9020, l'analyse est exécutée suivant le même organigramme que celui présenté sur la  In section I of parsing 9020, the analysis is executed according to the same flowchart as that presented on the

figure 82.figure 82.

On va maintenant expliquer le traitement effectué dans la section de traitement de l'interrogation redondante 9210 à l'aide des figures 90A et 90B. Tout d'abord, un pointeur est positionné  We will now explain the processing carried out in the processing section of the redundant query 9210 using FIGS. 90A and 90B. First, a pointer is positioned

sur le mot se trouvant à la tête de l'information de mot (9370).  on the word at the head of the word information (9370).

S'il ne s'agit pas d'une virgule, le pointeur avance d'un cran  If it is not a comma, the pointer moves up a notch

(9384) et cela se répète jusqu'à la fin de la phrase (9371).  (9384) and it repeats until the end of the sentence (9371).

Ensuite, il est vérifié si le mot venant après la virgule est un mot appartenant au groupe c ou le mot appartenant au groupe e, tandis que le pointeur reste à la position qu'il occupait (9373, 9379). Dans ce cas, il est défini que les mots contenant un verbe auxiliaire ou le verbe "être" dans la "partie de discours", quand il ne s'agit pas de la forme négative, sont des mots appartenant au  Then, it is checked whether the word coming after the decimal point is a word belonging to group c or the word belonging to group e, while the pointer remains in the position it occupied (9373, 9379). In this case, it is defined that the words containing an auxiliary verb or the verb "to be" in the "speech part", when it is not a question of the negative form, are words belonging to the

26O481426O4814

groupe a, tandis que ceux qui contiennent la forme négative du verbe auxiliaire ou du verbe "être" dans la partie de discours sont des mots appartenant au groupe e. Si le mot n'appartient à aucun  group a, while those which contain the negative form of the auxiliary verb or the verb "to be" in the speech part are words belonging to group e. If the word does not belong to any

des deux groupes, le pointeur avance d'un cran (9484) et les opéra-  of the two groups, the pointer advances by one notch (9484) and the operations

tions se répètent jusqu'à la fin de la phrase (9371).  tions repeat until the end of the sentence (9371).

Dans le cas o le mot appartient au groupe a, l'étape 9384 à Laquelle le pointeur a avancé est éxécutée si le mot suivant les mots du groupe a n'est pas un pronom. S'il s'agit d'un pronom, il est vérifié si Le mot suivant est ou non "not (particule de négation utilisée dans la conjugaison)" (9375) et, s'il ne s'agit pas de "not", il est déterminé si le mot suivant le pronom est ou non un point d'interrogation (9377). S'il ne s'agit pas du oint d'interrogation, l'opération 9384 à laquelle le pointeur a été avancé est exécute. S'iL s'agit du point d'interrogation, le but est réécrit sous la forme "phrase négative" et le rôLe sous la forme "phrase d'interrogation redondante" pour le bloc de la couche située le plus à l'intérieur (9378), tandis que ",...? est rejeté de la table d'information relative au mot (9383). Le bloc de la couche située le plus à l'intérieur désigne des blocs satisfaisant La condition: position de début 4 (position de ","), ainsi que la condition: position finale > (position de "?") pour la position  In the case where the word belongs to group a, step 9384 at which the pointer has advanced is executed if the word following the words of group a is not a pronoun. If it is a pronoun, it is checked whether or not the next word is "not (negation particle used in conjugation)" (9375) and, if it is not "not" , it is determined whether or not the word following the pronoun is a question mark (9377). If it is not the interrogation anoint, operation 9384 to which the pointer has been advanced is executed. If it is the question mark, the goal is rewritten in the form "negative sentence" and the role in the form "redundant question sentence" for the block of the layer most inside ( 9378), while ", ...? Is rejected from the word information table (9383). The block in the innermost layer indicates blocks satisfying The condition: start position 4 ( position of ","), as well as the condition: final position> (position of "?") for the position

du bloc, avec un intervalle minimal pour (position finale -  of the block, with a minimum interval for (final position -

position initiale).initial position).

Si le mot faisant suite au pronom est "not" à l'étape 9375, il est alors vérifié si le mot suivant "not" est ou non un  If the word following the pronoun is "not" in step 9375, it is then checked whether the next word "not" is or not a

point d'interrogation (9376). S'il ne s'agit pas d'un point d'in-  question mark (9376). If it is not an information point

terrogation, l'opération 9384 à laquelle le pointeur a avancé est exécutée. S'il s'agit d'un point d'interrogatiQn, le but relatif au bloc de la couche située le plus à l'intérieur est réécrit sous la forme "phrase affirmative", tandis que le rôle est réécrit sous la forme "phrase d'interrogation redondante" (9382), et ",..?" est  terrogation, operation 9384 to which the pointer advanced is executed. If it is a question mark, the goal relating to the block of the innermost layer is rewritten in the form "affirmative sentence", while the role is rewritten in the form "sentence redundant query "(9382), and", ..? " East

rejeté de la table d'information sur le mot (9383).  rejected from the word information table (9383).

A l'étape 9379, si le mot faisant suite à la virgule est un mot appartenant au groupe a, l'opération 9384 jusqu'à laquelle le pointeur a avancé est exécutée si le mot faisant suite au groupe  In step 9379, if the word following the decimal point is a word belonging to group a, operation 9384 until which the pointer has advanced is executed if the word following the group

26048 1426048 14

n'est pas un pronom. S'il s'agit d'un pronom, il est déterminé si  is not a pronoun. If it is a pronoun, it is determined whether

le mot lui faisant immédiatement suite est ou non un point d'inter-  the word immediately following it or not is a point of inter-

rogation (9383) et on passe à l'étape 9384 à laqueLLe le pointeur a avancé s'il ne s'agit pas d'un point d'interrogation. S'il s'agit d'un point d'interrogation, le but du bloc de la couche située le plus à l'intérieur est réécrit sous la forme "phrase affirmative",  rogation (9383) and we go to step 9384 with which the pointer has advanced if it is not a question mark. If it is a question mark, the purpose of the innermost layer block is rewritten as "affirmative phrase",

tandis que le rôle est réécrit sous la forme "phrase d'interroga-  while the role is rewritten in the form "sentence of interroga-

tion redondante" (9382), et ",...?" est rejeté de la table d'infor-  redundant tion "(9382), and", ...? "is rejected from the information table

mation sur le mot (9383). Ensuite, le pointeur avance d'un cran  mation on the word (9383). Then the pointer moves up a notch

(9384), et les opérations se répètent jusqu'à la fin de la phrase.  (9384), and the operations are repeated until the end of the sentence.

A titre d'exemple, la figure 88 montre l'information relative aux blocs et aux mots fournie par la section d'analyse morphologique 9016 à la section de traitement d'interrogation redondante 9210 pour la phrase d'anglais:  As an example, Figure 88 shows the block and word information provided by the morphology analysis section 9016 to the redundant query processing section 9210 for the English sentence:

I said, "It is good, isn't it ?" (je disais, "c'est bon, n'est-ce-  I said, "It is good, isn't it?" (I said, "It's good, isn't it-

pas ?") décrite ci-dessus. L'information de bloc pour le bloc 1 est (début: 4, fin: 12, but: au choix, rôle: au choix). Si elle est soumise au traitement d'interrogation redondante dans la section 9210 de traitement d'interrogation redondante, l'information de bloc relative au bloc 1 est récrite sous la forme (début: 4, fin:  not? ") described above. The block information for block 1 is (start: 4, end: 12, goal: optional, role: optional). If it is subject to redundant query processing in the redundant interrogation processing section 9210, the block information relating to block 1 is rewritten in the form (start: 4, end:

12, but: phrase affirmative, rôle: phrase d'interrogation redon-  12, goal: affirmative sentence, role: redundant question sentence

dante) et, dans le même temps, l'information de mot se rapportant à l'interrogation redondante allant du numéro 8 au numéro 11 est  dante) and, at the same time, the word information relating to the redundant query going from number 8 to number 11 is

abandonnée.abandoned.

Bien entendu, l'homme de l'art sera en mesure d'imaginer,  Of course, those skilled in the art will be able to imagine,

à partir du dispositif dont la description vient d'être donnée à  from the device whose description has just been given to

titre simplement illustratif et nullement limitatif, diverses  title merely illustrative and not limiting, various

variantes et modifications ne sortant pas du cadre de l'invention.  variants and modifications not departing from the scope of the invention.

On aura compris que le terme "attitude", parfois employé,  We will have understood that the term "attitude", sometimes used,

doit être entendu au même sens que le terme "but" (goal).  must be understood in the same sense as the term "goal".

260 4814260 4814

Claims (30)

REVENDICATIONS 1. Analyseur de langage, caractérisé en ce qu'il comprend un dictionnaire (1018) dans lequel sont emmagasinées des données de dictionnaire contenant des données de morphèmes pour des mots, des mots composés et des locutions, et un moyen d'analyse (1016) permettant d'effectuer une analyse morphologique d'une phrase d'entrée (1012) en se reportant au dictionnaire, o: le dictionnaire contient des données relatives au degré de couplage indiquant le degré de couplage entre chacun des mots constituant les mots composés et les locutions, et  1. Language analyzer, characterized in that it comprises a dictionary (1018) in which are stored dictionary data containing morpheme data for words, compound words and phrases, and an analysis means (1016 ) making it possible to carry out a morphological analysis of an input sentence (1012) by referring to the dictionary, o: the dictionary contains data relating to the degree of coupling indicating the degree of coupling between each of the words constituting the compound words and the phrases, and ledit moyen d'analyse se reporte au dictionnaire relati-  said means of analysis refers to the related dictionary vement aux mots respectifs contenus dans la phrase d'entrée et, lorsque plusieurs données du dictionnaire sont consultées pour un  the respective words contained in the input sentence and, when several data from the dictionary are consulted for a seul mot en combinaison avec d'autres mots, il choisit la combi-  single word in combination with other words, it chooses the combination naison de mots ayant le degré de couplage le plus élevé en se  naison of words having the highest degree of coupling in se reportant aux données relatives audit degré de couplage.  referring to the data relating to said degree of coupling. 2. Analyseur selon la revendication 1, caractérisé en ce que, lorsque les données relatives au degré de couplage indiquent un degré de couplage élevé pour plusieurs combinaisons entre un mot trouvé dans le dictionnaire et d'autres mots, le moyen d'analyse prépare des données de préférence afin de donner la préférence à  2. Analyzer according to claim 1, characterized in that, when the data relating to the degree of coupling indicate a high degree of coupling for several combinations between a word found in the dictionary and other words, the analysis means prepares preference data in order to give preference to l'une desdites combinaisons sur la base d'une certaine règle.  one of said combinations based on a certain rule. 3. Analyseur de langage, caractérisé en ce qu'il comprend: un moyen d'entrée (2014) servant à introduire un ensemble de caractères d'une langue prédéterminée, un dictionnaire fondamental (2024, 2026) utilisé pour la recherche dudit ensemble de caractères introduit et dans lequel sont emmagasinées des données fondamentales, et un moyen d'analyse (2016) permettant d'analyser ledit ensemble de caractères introduit en consultant le dictionnaire fondamental, o:  3. Language analyzer, characterized in that it comprises: an input means (2014) used to introduce a set of characters of a predetermined language, a fundamental dictionary (2024, 2026) used for searching for said set of characters entered and in which fundamental data are stored, and an analysis means (2016) making it possible to analyze said set of characters introduced by consulting the fundamental dictionary, where: ledit moyen d'anaLyse consulte le dictionnaire fondamen-  said means of anaLyse consults the basic dictionary tal relativement audit ensemble de caractères introduit et, si une partie dudit ensemble de caractères est trouvée par lui, il consulte le dictionnaire fondamental de la même manière pour d'autres parties dudit ensemble de caractères afin d'analyser ledit  tal relative to said introduced character set and, if a part of said character set is found by him, he consults the fundamental dictionary in the same way for other parts of said character set in order to analyze said ensemble de caractères.set of characters. 4. Analyseur selon la revendication 3, caractérisé en ce que  4. Analyzer according to claim 3, characterized in that le dictionnaire fondamental est un dictionnaire d'unités fondamen-  the fundamental dictionary is a dictionary of basic units tales possédant des données qui permettent d'exprimer des unités de dimension emmagasinées dans le dictionnaire, et en ce que le moyen  tales having data which allow to express dimension units stored in the dictionary, and in that the means d'analyse consulte le dictionnaire d'unités fondamentales relati-  of analysis consult the dictionary of relative fundamental units vement audit ensemble de caractères d'entrée de manière à ainsi analyser si ledit ensemble de caractères exprime ou non une unité  to said set of input characters so as to thus analyze whether or not said set of characters expresses a unit de dimension.of dimension. 5. Analyseur selon la revendication 4, caractérisé en ce que le moyen d'analyse consulte le dictionnaire d'unités fondamentales  5. Analyzer according to claim 4, characterized in that the analysis means consults the dictionary of fundamental units relativement à l'ensemble de caractères et, si l'ensemble de carac-  relative to the character set and, if the character set tères est constitué seulement par la combinaison d'ensembles de caractères emmagasinés dans le dictionnaire d'unités fondamentales  tères consists only of the combination of sets of characters stored in the dictionary of fundamental units qui exprime une unité en résultat de la consultation, il le déter-  which expresses a unity as a result of the consultation, it deter- mine comme étant un ensemble de caractères permettant d'exprimer l'unité.  mine as a set of characters used to express unity. 6. Analyseur selon l'une quelconque des revendications 3 à  6. Analyzer according to any one of claims 3 to , caractérisé en ce que le moyen d'analyse possède un pointeur, ledit pointeur est positionné sur un caractère placé à la tête de l'ensemble de caractères introduit et, si une partie dudit ensemble de caractères est trouvée par la consultation du dictionnaire fondamental relativement à l'ensemble de caractères à partir du caractère sur lequel le pointeur a été positionné, ledit pointeur se positionne sur un ensemble de caractères faisant suite à la partie dudit ensemble de caractères retrouvé, puis le dictionnaire fondamental est de nouveau consulté relativement à l'ensemble de  , characterized in that the analysis means has a pointer, said pointer is positioned on a character placed at the head of the set of characters entered and, if part of said set of characters is found by consulting the fundamental dictionary relatively to the set of characters from the character on which the pointer has been positioned, said pointer is positioned on a set of characters following the part of said set of characters found, then the fundamental dictionary is again consulted in relation to the together caractères suivant,sur lequel ledit pointeur a été positionné.  next characters, on which said pointer was positioned. 7. Analyseur selon l'une quelconque des revendications 3 à  7. Analyzer according to any one of claims 3 to 6, caractérisé en ce que l'ensemble de caractères introduit est trouvé à l'aide d'un dictionnaire usuel et n'est pas emmagasiné  6, characterized in that the set of characters entered is found using a standard dictionary and is not stored dans ledit dictionnaire.in said dictionary. 8. Analyseur de langage, caractérisé en ce qu'iL comprend:  8. Language analyzer, characterized in that iL comprises: un dictionnaire (3018, 3104) dans lequel sont emmaga-  a dictionary (3018, 3104) in which are stored sinées des données de dictionnaire portant sur toutes les unités de référence du dictionnaire, et un moyen d'analyse (3016) permettant de diviser une phrase introduite en unités de référence du dictionnaire et d'effectuer une analyse morphologique desdites unités de référence du dictionnaire tout en se reportant audit dictionnaire, o: le dictionnaire contient, au titre desdites données de dictionnaire, une indication de distinction indiquant que lesdites unités de référence du dictionnaire représentent des nombres pour les unités de référence du dictionnaire représentatives de nombres, et ledit moyen d'analyse se reporte au dictionnaire pour les unités de référence du dictionnaire respectives contenues dans la phrase d'entrée et, si ladite indication de distinction est contenue dans lesdites données de dictionnaire trouvées, il combine l'unité de référence du dictionnaire pour lequel ladite indication  dictionary data relating to all the reference units of the dictionary, and an analysis means (3016) making it possible to divide an introduced sentence into reference units of the dictionary and to carry out a morphological analysis of said reference units of the dictionary while with reference to said dictionary, o: the dictionary contains, under said dictionary data, an indication of distinction indicating that said dictionary reference units represent numbers for dictionary reference units representative of numbers, and said means of analysis refers to the dictionary for the respective dictionary reference units contained in the input sentence and, if said distinction indication is contained in said dictionary data found, it combines the dictionary reference unit for which said indication de distinction a été trouvée avec une unité de référence du dic-  of distinction was found with a reference unit of the dic- tionnaire présente au voisinage de ladite unité de dictionnaire et pour laquelle une autre dite indication de distinction a été trouvée, puis il calcule les valeurs numériques qui sont signifiées par les deux dites unités de référence du dictionnaire afin de former une unique valeur numérique et forme les unités de référence  present in the vicinity of said dictionary unit and for which another said indication of distinction has been found, then it calculates the numerical values which are signified by the two said dictionary reference units in order to form a single numerical value and forms the reference units du dictionnaire en une seule unité d'analyse.  of the dictionary in a single unit of analysis. 9. Analyseur selon la revendication 8, caractérisé en ce que le moyen d'analyse agence ladite unité d'analyse, si elle est accompagnée d'une unité de référence du dictionnaire exprimant un  9. Analyzer according to claim 8, characterized in that the analysis means arranges said analysis unit, if it is accompanied by a reference unit of the dictionary expressing a symbole monétaire ou une unité de dimension, avec la valeur numé-  currency symbol or unit of dimension, with the numerical value rique afin de former une unique unité d'analyse.  risk to form a single unit of analysis. 26048 1426048 14 10. Analyseur de langage, caractérisé en ce qu'il comprend: un moyen d'entrée (4014) servant à introduire un ensemble de caractères d'une langue prédéterminée, un dictionnaire (4020) utilisé pour rechercher ledit ensemble de caractères introduit par ledit moyen d'entrée,  10. Language analyzer, characterized in that it comprises: an input means (4014) used to introduce a set of characters of a predetermined language, a dictionary (4020) used to search for said set of characters introduced by said entry way, un moyen de consultation (4022) qui consulte le diction-  a means of consultation (4022) which consults the diction- naire relativement audit ensemble de caractères introduit, et un moyen de production d'information de particularité, qui produit une information de particularité d'un  relatively to said set of characters introduced, and a means of producing particularity information, which produces specificity information of a ensemble de caractères non enregistrés dans le dic-  set of characters not recorded in the dictionary tionnaire et d'un ensemble de caractères pour lequel une infor-  tionnaire and a set of characters for which information mation de particularité n'a pas été enregistrés dans le dictionnaire, parmi lesdits ensembles de caractères introduits en résultat de la recherche effectuée par ledit moyen de consultation, o: ledit moyen de production d'informationdeparticularité fournit plusieurs informations de particularité audit ensemble de  feature of particularity has not been recorded in the dictionary, among said sets of characters introduced as a result of the search carried out by said means of consultation, o: said means of production of particularity provides several information of particularity to said set of caractères ne possédant pas d'information de particularité.  characters without specific information. 11. Analyseur selon la revendication 10, caractérisé en ce qu'il comprend en outre: un moyen de découpage d'unités servant à diviser  11. Analyzer according to claim 10, characterized in that it further comprises: means for cutting units used for dividing l'ensemble de caractères d'entrée en unités en vue de la consulta-  the set of input characters in units for consultation tion du dictionnaire, et un moyen d'analyse servant à analyser l'ensemble de  tion of the dictionary, and an analysis means used to analyze all of caractères divisé par le moyen de découpage d'unités après consul-  characters divided by the means of cutting units after consultation tation du dictionnaire par ledit moyen de consultation, en même  tation of the dictionary by said means of consultation, at the same temps que l'ensemble de caractères précédent.  time than the previous set of characters. 12. Analyseur selon la revendication 11, caractérisé en ce que, lorsque l'information de particularité est présente pour un seul des ensembles formés par ledit ensemble de caractères et l'ensemble de caractères le précédant, et qu'aucune information de particularité n'est présente dans l'autreensemble de caractères, le moyen d'analyse dote de l'informationdeparticularité dudit premier ensemble de caractères ledit ensemble de caractères  12. Analyzer according to claim 11, characterized in that, when the particularity information is present for only one of the sets formed by said set of characters and the set of characters preceding it, and that no particularity information is present. is present in the other set of characters, the analysis means provides the specific information of said first set of characters said set of characters ne possédant pas d'information de particularité.  not having specific information. 13. Analyseur selon la revendication 11, caractérisé en ce que,si une information de particularité est présente dans chacun des ensembles de caractères, à savoir ledit ensemble de caractères et l'ensemble de caractères précédent, le moyen d'analyse fournit une information de particularité commune comme information de particularité dudit ensemble de caractères et  13. Analyzer according to claim 11, characterized in that, if specific information is present in each of the sets of characters, namely said set of characters and the preceding set of characters, the analysis means provides information of common particularity as particularity information of said set of characters and de l'ensemble de caractères précédent.  from the previous character set. 14. Analyseur selon l'une quelconque des revendications 11 à  14. Analyzer according to any one of claims 11 to 13, caractérisé en ce que l'ensemble de caractères et l'ensemble de caractères précédent qui sont analysés par ledit moyen d'analyse  13, characterized in that the set of characters and the preceding set of characters which are analyzed by said analysis means sont des noms propres.are proper names. 15. Analyseur selon la revendication 11, caractérisé en ce que, si l'ensemble de caractères commence par un caractère en lettre majuscule et que l'ensemble de caractères précédent n'est pas à la fin de la phrase, le moyen d'analyse transforme la lettre majuscule se trouvant en tête dudit ensemble de caractères en une lettre minuscule, puis consulte le dictionnaire à l'aide dudit moyen de consultation, et, s'il n'apparaît pas comme inscrit dans le dictionnaire à la suite de ladite consultation, le moyen d'analyse analyse ledit ensemble de caractères comme étant un nom  15. Analyzer according to claim 11, characterized in that, if the set of characters begins with a character in capital letters and that the preceding set of characters is not at the end of the sentence, the means of analysis transforms the capital letter at the head of said set of characters into a lowercase letter, then consults the dictionary using said means of consultation, and, if it does not appear as entered in the dictionary following said consultation , the analysis means analyzes said set of characters as being a name propre non inscrit.own not registered. 16. Analyseur de langage, caractérisé en ce qu'il comprend: un dictionnaire (5018) dans lequel sont emmagasinées des données de dictionnaire portant sur toutes les unités de référence du dictionnaire, et un moyen d'analyse (5016) permettant de diviser en unités de référence du dictionnaire une phrase introduite et d'effectuer  16. Language analyzer, characterized in that it comprises: a dictionary (5018) in which dictionary data relating to all the reference units of the dictionary are stored, and an analysis means (5016) making it possible to divide into dictionary reference units an introduced sentence and perform l'analyse morphologique en se reportant au dictionnaire relative-  morphological analysis by referring to the relative dictionary- ment auxdites unités de référence du dictionnaire,  ment to said dictionary reference units, o: -o: - le dictionnaire contient, au titre desdites données de dictionnaire, une information de distinction permettant de préciser la position à laquelle plusieurs noms propres sont autorisés à se trouver dans un groupe de noms propres successifs pour une unité de consultation du dictionnaire qui indique un nom propre, et  the dictionary contains, under the said dictionary data, information of distinction making it possible to specify the position at which several proper names are authorized to be found in a group of successive proper names for a unit for consulting the dictionary which indicates a proper name, and Ledit moyen d'analyse se reporte au dictionnaire relati-  Said means of analysis refers to the related dictionary vement aux unités de référence du dictionnaire respectives qui sont contenues dans la phrase introduite et, si Ladite information de distinction est contenue dans les données de dictionnaire trouvées, il combine l'unité de référence du dictionnaire pour laquelle ladite information de distinction a été trouvée avec l'unité de référence du dictionnaire qui est au voisinage de ladite unité de référence du dictionnaire et signifie un autre nom propre de manière à former une unique unité d'analyse en fonction de la  to the respective dictionary reference units which are contained in the entered sentence and, if Said distinction information is contained in the dictionary data found, it combines the dictionary reference unit for which said distinction information was found with the dictionary reference unit which is in the vicinity of said dictionary reference unit and signifies another proper name so as to form a single unit of analysis according to the position spécifiée par ladite information de distinction.  position specified by said distinction information. 17. Analyseur de langage, caractérisé en ce qu'il comprend: un moyen d'entrée (6014) servant à introduire un ensemble de caractères d'une langue prédéterminée, un dictionnaire (6020) utilisé pour rechercher ledit ensemble de caractères introduit par le moyen d'entrée, et un moyen d'analyse d'information de particularité (6024)  17. Language analyzer, characterized in that it comprises: an input means (6014) used to introduce a set of characters of a predetermined language, a dictionary (6020) used to search for said set of characters introduced by the input means, and a feature information analysis means (6024) qui consulte le dictionnaire relativement audit ensemble de carac-  who consults the dictionary with respect to said character set tères introduit, puis analyse l'information de particularité dudit ensemble de caractères, o: ledit moyen d'analyse de l'information de particularité analyse l'information de particularité dudit ensemble de caractères tout en prenant enconsidération l'information de particularité des ensembles de caractères se trouvant avant et après ledit ensemble  ters introduced, then analyzes the particularity information of said set of characters, o: said means of analysis of particularity information analyzes the particularity information of said set of characters while taking into consideration the particularity information of the sets of characters before and after said set de caractères. -of characters. - 18. Analyseur selon la revendication 17, caractérisé en ce que le moyen d'analyse d'information de particularité analyse l'information de particularité de plusieurs ensembles de caractères  18. Analyzer according to claim 17, characterized in that the feature information analysis means analyzes the feature information of several sets of characters en agençant collectivement lesdits ensembles de caractères.  by arranging collectively said sets of characters. 19. Analyseur selon la revendication 17, caractérisé en ce que, si l'information de particularité est présente pour un seul des ensembles formés dudit ensemble de caractères et d'un ensemble de caractères le précédant, et que l'information departicularitén'est  19. Analyzer according to claim 17, characterized in that, if the particularity information is present for only one of the sets formed of said set of characters and of a set of characters preceding it, and that the particularity information is pas présente pour l'autre, le moyen d'analyse d'information de par-  not present for the other, the means of parsing information ticularité dote de l'information de particularité dudit premier ensemble de caractères, L'ensemble de caractères ne possédant pas  particularity provides the particularity information of said first set of characters, The set of characters not having d'information de particularité.specific information. 20. AnaLyseur selon L'une quelconque des revendications 17 à  20. AnaLyser according to any one of claims 17 to 19, caractérisé en ce que l'ensemble de caractères analysé par ledit moyen d'analyse d'information de particularité est un nom propre.  19, characterized in that the set of characters analyzed by said particularity information analysis means is a proper name. 21. Analyseur de langage, caractérisé en ce qu'il comprend: un dictionnaire (7018) dans lequel sont emmagasinées des21. Language analyzer, characterized in that it comprises: a dictionary (7018) in which are stored données de dictionnaire sur toutes les unités de référence du dic-  dictionary data on all dic- reference units tionnaire, et un moyen d'analyse (7016) permettant de diviser en unités de référence du dictionnaire une phrase introduite et d'effectuer l'analyse morphologique relative auxdites unités de référence du dictionnaire en consultant le dictionnaire, o: ledit moyen d'analyse distingue qu'une succession  tionnaire, and an analysis means (7016) making it possible to divide into dictionary reference units an introduced sentence and to carry out the morphological analysis relating to said dictionary reference units by consulting the dictionary, o: said analysis means distinguishes that an estate d'unités de référence du dictionnaire possédant un élément séman-  dictionary reference units with a semantic element tique particulier est une unité d'assemblage exprimant une signi-  particular tick is an assembly unit expressing a signi fication spécifique constituée d'une certaine règLe et forme une succession d'unités de référence du dictionnaire possédant ledit  specific specification consisting of a certain rule and forms a succession of reference units of the dictionary having said élément sémantique spécifique en une seule unité d'analyse.  specific semantic element in a single unit of analysis. 22. Analyseur selon la revendication 21, caractérisé en ce que le dictionnaire contient des données permettant de distinguer les unités de référence du dictionnaire ayant un élément sémantique particulier,  22. Analyzer according to claim 21, characterized in that the dictionary contains data making it possible to distinguish the reference units from the dictionary having a particular semantic element, le moyen d'analyse comprend une table de mise en corres-  the analysis means includes a matching table pondance de distinction permettant de distinguer qu'une succession d'unités de référence du dictionnaire possédant ledit élément sémantique spécifique est une unité d'assemblage exprimant une signification spécifique composée d'après une certaine règle, et le moyen d'analyse consulte le dictionnaire relativement aux unités de référence du dictionnaire respectives contenues dans la phrase introduite et forme la succession d'unités de référence du dictionnaire possédant ledit élément sémantique spécifique en une unique unité d'analyse en effectuant une mise en correspondance à L'aide de la table de mise en correspondance de distinction  weighting of distinction making it possible to distinguish that a succession of reference units of the dictionary having said specific semantic element is a unit of assembly expressing a specific meaning composed according to a certain rule, and the means of analysis consults the dictionary relatively to the respective dictionary reference units contained in the sentence entered and forms the succession of dictionary reference units having said specific semantic element into a single analysis unit by performing a mapping using the matching table in correspondence of distinction lorsqu'eLle a été distinguée de l'unité de référence de diction-  when it has been distinguished from the diction reference unit - naire possédant ledit élément sémantique spécifique.  nary having said specific semantic element. 23. AnaLyseur de Langage, caractérisé en ce qu'une particu-  23. Language AnaLyser, characterized in that a particular Larité grammaticale, une particularité sémantique ou un mot traduit est estimé se rapporter à un mot non inscrit dans un dictionnaire, Lequel est reconnu comme un mot dérivé eu égard à une particularité  Grammaticality, a semantic particularity or a translated word is estimated to relate to a word not entered in a dictionary, Which is recognized as a derived word with regard to a particularity morphologique telle qu'un affixe.morphological such as an affix. 24. Analyseur de Langage, caractérisé en ce qu'il comprend: un premier moyen d'analyse (9020) permettant d'effectuer l'analyse morphologique pour une phrase introduite d'une langue prédéterminée, un deuxième moyen d'analyse (9022) effectuant l'analyse de la phrase de ladite langue sur la base des résultats de l'analyse morphologique effectuée par ledit premier moyen d'analyse, un dictionnaire (9018) dans lequel sont emmagasinées des données de dictionnaire de ladite langue utilisées pour l'analyse par lesdites premier et deuxième moyens d'analyse, et  24. Language analyzer, characterized in that it comprises: a first analysis means (9020) making it possible to carry out the morphological analysis for a sentence introduced from a predetermined language, a second analysis means (9022) analyzing the sentence of said language on the basis of the results of the morphological analysis carried out by said first analysis means, a dictionary (9018) in which dictionary data for said language used for analysis are stored by said first and second analysis means, and un moyen de commande (9038) servant à consulter le dic-  a control means (9038) used to consult the dictionary tionnaire et à faire que lesdites premier et deuxième moyens d'analyse effectuent l'analyse, o: le premier moyen d'analyse consulte le dictionnaire, distingue l'agencement structurel en distinguant la particularité de la phrase introduite de ladite langue eu égard à sa forme et  and to have said first and second means of analysis perform the analysis, o: the first means of analysis consults the dictionary, distinguishes the structural arrangement by distinguishing the particularity of the sentence introduced from said language having regard to its shape and produit l'estimation d'une certaine attitude comme étant le résul-  produces the estimate of a certain attitude as being the result tat de l'analyse et du rôle structurel dudit agencement qui s'exerce dans ladite phrase pour ledit agencement, et ledit deuxième moyen d'analyse analyse la structure de la couche de surface de la phrase de ladite langue en appliquant une règle grammaticale reposant sur ladite attitude estimée et sur le rôle, et analyse la relation subsidiaire possible des constituants  state of the analysis and of the structural role of said arrangement which is exerted in said sentence for said arrangement, and said second means of analysis analyzes the structure of the surface layer of the sentence of said language by applying a grammatical rule based on said estimated attitude and on the role, and analyzes the possible subsidiary relationship of the constituents contenus dans ladite phrase.contained in said sentence. 25. Analyseur selon la revendication 24, caractérisé en ce que le deuxième moyen d'analyse effectue l'analyse de l'agencement préférentiellement à d'autres si ledit agencement est contenu dans  25. Analyzer according to claim 24, characterized in that the second analysis means performs the analysis of the arrangement preferentially to others if said arrangement is contained in la phrase de ladite langue.the sentence of said language. 26. Analyseur selon la revendication 24, caractérisé en ce que le premier moyen d'analyse distingue la particularité de la phrase de ladite langue eu égard à sa forme et à sa signification et produit une estimation d'une expression de l'apposition sur la  26. Analyzer according to claim 24, characterized in that the first means of analysis distinguishes the peculiarity of the sentence of said language having regard to its form and its meaning and produces an estimate of an expression of the apposition on the base desdites particularités distinguées.  basis of said distinguished features. 27. Analyseur selon la revendication 24, caractérisé en ce que la langue prédéterminée est l'anglais, et le dictionnaire contient, comme données de dictionnaire, une information de distinction qui distingue des mots prédéterminés contenant "let's" et "let us" (ces deux expressions indiquant que le verbe qui suit est utilisé à la première personne du pluriel de l'impératif, et ayant d'autres significations), et  27. An analyzer according to claim 24, characterized in that the predetermined language is English, and the dictionary contains, as dictionary data, information of distinction which distinguishes predetermined words containing "let's" and "let us" (these two expressions indicating that the following verb is used in the first person plural of the imperative, and having other meanings), and lorsque le premier moyen d'analyse consulte le diction-  when the first means of analysis consults the diction- naire pour obtenir ladite information de distinction, il exclut "let's" aussi bien que "let us" de l'objet de l'analyse par le deuxième moyen d'analyse si une ponctuation est présente à la  nary to obtain said information of distinction, it excludes "let's" as well as "let us" from the object of the analysis by the second means of analysis if a punctuation is present at the partie précédente.previous part. 28. Analyseur selon la revendication 27, caractérisé en ce  28. Analyzer according to claim 27, characterized in that que le premier moyen d'analyse estime l'attitude comme une instruc-  that the first means of analysis estimates attitude as an instruc- tion et le rôle comme une invitation pour l'agencement contenant la  tion and role as an invitation to the arrangement containing the partie exclue.excluded part. 29. Analyseur selon la revendication 24, caractérisé en ce que le premier moyen d'analyse, si aucune donnée de dictionnaire n'est obtenue lors de la consultation du dictionnaire relativement  29. Analyzer according to claim 24, characterized in that the first analysis means, if no dictionary data is obtained during consultation of the dictionary relatively à plusieurs mots liés par des traits d'union, consulte le diction-  to several words linked by hyphens, consult the diction- naire pour chacun des différents mots, estime l'ensemble de la partie contenant les différents mots comme étant un arrangement et estime l'attitude dudit arrangement comme étant un groupe adjectival.  nary for each of the different words, estimates the whole of the part containing the different words as being an arrangement and estimates the attitude of said arrangement as being an adjectival group. 30. Analyseur selon la revendication 24, caractérisé en ce que la langue prédéterminée est l'anglais, et le premier moyen d'analyse distingue la particularité de30. Analyzer according to claim 24, characterized in that the predetermined language is English, and the first means of analysis distinguishes the peculiarity of la phrase d'anglais eu égard à sa forme, distingue le groupe cons-  the sentence of English having regard to its form, distinguishes the group cons-
FR8713742A 1986-10-03 1987-10-05 LANGUAGE ANALYZER Expired - Fee Related FR2604814B1 (en)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP61234327A JPH0816910B2 (en) 1986-10-03 1986-10-03 Language analyzer
JP61234328A JPH0821031B2 (en) 1986-10-03 1986-10-03 Language analyzer
JP61240215A JPH0821032B2 (en) 1986-10-11 1986-10-11 Language analyzer
JP61243197A JPH0821033B2 (en) 1986-10-15 1986-10-15 Language analyzer
JP61245196A JPH0797372B2 (en) 1986-10-17 1986-10-17 Language analyzer
JP61248431A JPH0821034B2 (en) 1986-10-21 1986-10-21 Language analyzer
JP61251916A JPS63106867A (en) 1986-10-24 1986-10-24 Language analyzer
JP61253763A JPS63113669A (en) 1986-05-16 1986-10-27 Language analyzing device
JP61255512A JP2688020B2 (en) 1986-10-27 1986-10-27 Derivative word processing method

Publications (2)

Publication Number Publication Date
FR2604814A1 true FR2604814A1 (en) 1988-04-08
FR2604814B1 FR2604814B1 (en) 1991-05-17

Family

ID=27577644

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8713742A Expired - Fee Related FR2604814B1 (en) 1986-10-03 1987-10-05 LANGUAGE ANALYZER

Country Status (3)

Country Link
DE (1) DE3733674A1 (en)
FR (1) FR2604814B1 (en)
NL (1) NL8702359A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0357370A2 (en) * 1988-09-02 1990-03-07 Sharp Kabushiki Kaisha Computer assisted language translating machine

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2963463B2 (en) * 1989-05-18 1999-10-18 株式会社リコー Interactive language analyzer
DE19510083C2 (en) * 1995-03-20 1997-04-24 Ibm Method and arrangement for speech recognition in languages containing word composites
DE19942171A1 (en) * 1999-09-03 2001-03-15 Siemens Ag Method for sentence end determination in automatic speech processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214979A (en) * 1983-05-23 1984-12-04 Hitachi Ltd Language converting system
EP0168814A2 (en) * 1984-07-17 1986-01-22 Nec Corporation Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions
EP0175357A2 (en) * 1984-09-18 1986-03-26 Sharp Kabushiki Kaisha Translation system
EP0180888A2 (en) * 1984-10-29 1986-05-14 Hitachi, Ltd. Method and apparatus for natural language processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214979A (en) * 1983-05-23 1984-12-04 Hitachi Ltd Language converting system
EP0168814A2 (en) * 1984-07-17 1986-01-22 Nec Corporation Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions
EP0175357A2 (en) * 1984-09-18 1986-03-26 Sharp Kabushiki Kaisha Translation system
EP0180888A2 (en) * 1984-10-29 1986-05-14 Hitachi, Ltd. Method and apparatus for natural language processing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FUJITSU SCIENTIFIC & TECHNICAL JOURNAL, vol. 21, no. 3, juillet 1985, Kawasaki, JP; H. UCHIDA et al.: "ATLAS: Automatic translation system", pages 317-329 *
PATENT ABSTRACTS OF JAPAN, vol. 9, no. 86 (P-349)[1809], 16 avril 1985; & JP-A-59 214 979 (HITACHI SEISAKUSHO K.K.) 04-12-1984 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0357370A2 (en) * 1988-09-02 1990-03-07 Sharp Kabushiki Kaisha Computer assisted language translating machine
EP0357370A3 (en) * 1988-09-02 1991-11-21 Sharp Kabushiki Kaisha Computer assisted language translating machine

Also Published As

Publication number Publication date
DE3733674C2 (en) 1992-02-06
DE3733674A1 (en) 1988-04-21
FR2604814B1 (en) 1991-05-17
NL8702359A (en) 1988-05-02

Similar Documents

Publication Publication Date Title
US5225981A (en) Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes
Kopaczyk The legal language of scottish burghs: standardization and lexical bundles (1380-1560)
CA2726576C (en) Financial event and relationship extraction
EP1364316A2 (en) Device for retrieving data from a knowledge-based text
EP1733324A1 (en) Method for finding data, research engine and microprocessor therefor
CA3068819A1 (en) System and method for natural language music search
Campesato Natural language processing fundamentals for developers
EP2126735B1 (en) Automatic translation method
Zeldes et al. An NLP pipeline for Coptic
KR102418260B1 (en) Method for analyzing customer consultation record
FR2604814A1 (en) LANGUAGE ANALYZER
Pasça High-performance, open-domain question answering from large text collections
CN101499056A (en) Backward reference sentence pattern language analysis method
JP4018668B2 (en) Sino-Japanese machine translation device, Sino-Japanese machine translation method, and Sino-Japanese machine translation program
Kjellander Ambiguity at work: lexical blends in an American English web news context
JP2005063030A (en) Method for expressing concept, method and device for creating expression of concept, program for implementing this method, and recording medium for recording this program
KR100487716B1 (en) Method for machine translation using word-level statistical information and apparatus thereof
Raj et al. Natural Language Processing for Chatbots
Subalalitha et al. Query Focused Summary Generation System using Unique Discourse Structure
EP2812814A1 (en) Method for identifying a set of sentences in a digital document, method for generating a digital document, and associated device
Neme An arabic language resource for computational morphology based on the semitic model
Savary Representation and Processing of Composition, Variation and Approximation in Language Resources and Tools
Banchs et al. The Structure of Language
Henrich et al. LISGrammarChecker: Language Independent Statistical Grammar Checking
Suarez A Data-driven Approach to Natural Language Processing for Contemporary and Historical French

Legal Events

Date Code Title Description
ST Notification of lapse