JPS6165360A - Electronic hyphenate dictionary of french language - Google Patents

Electronic hyphenate dictionary of french language

Info

Publication number
JPS6165360A
JPS6165360A JP59187197A JP18719784A JPS6165360A JP S6165360 A JPS6165360 A JP S6165360A JP 59187197 A JP59187197 A JP 59187197A JP 18719784 A JP18719784 A JP 18719784A JP S6165360 A JPS6165360 A JP S6165360A
Authority
JP
Japan
Prior art keywords
dictionary
word
french
hyphonate
hyphenate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59187197A
Other languages
Japanese (ja)
Inventor
Yoshizo Saito
齋藤 佳三
Toshio Naohara
直原 利夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP59187197A priority Critical patent/JPS6165360A/en
Priority to FR8513212A priority patent/FR2569883B1/en
Publication of JPS6165360A publication Critical patent/JPS6165360A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To compress the data quantity and to reduce significantly the memory capacity of a hyphenate dictionary by supplying a prospective hyphen input position quickly and securely with the aid of an electronic hyphenate dictionary and adopting an hyphenate rule table, a prefix dictionary and a suffix dictionary. CONSTITUTION:When a word W projects from the display possible area A of a display device 3 and covers a margin at the right hand M at the time of inputting a character string to a memory device 2 by means of the input device 1 of a word processor, prospective hyphen input positions h1, h2, h3- of the word W are detected by an hyphenate dictionary 4. Then an hyphen is inputted to the position h2 nearest to the margin at the right hand M, and the word W is automatically divided into two lines and displayed. French essential prefix and suffix are alphabetically arranged to produce prefix and suffixdictionaries, which are stored in a prefix word dictionary storage area 4b and suffix word dictionary storage area 4c of the dictionary 4. Moreover hyphenate information prospective hyphen input position) on exceptional French words which do not obey an hyphenate rule is sequentially registered on a denial rule table, which is stored in a denial rule table storage area 4d of the dictionary 4.

Description

【発明の詳細な説明】 [産業−1−の利用分野1 本発明は、仏fit詔を取り扱う計算(幾システムや仏
t1)ワードプロセッサー等に内蔵される電子的な1ノ
、詔ハイ7オネー1・辞書に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Application of Industry-1-1] The present invention is an electronic 1-no, an edict high-7-on-1 built in a word processor, etc.・Regarding dictionaries.

[従来技術1 従来、欧文用のワードプロセッサー等に内蔵される電子
式Ht語辞庸にナタいて、英単語辞書ではスペルチェッ
ク、ハイフォネート、構文チェック等の機能が実現され
ているが、仏単語辞書では仏8jiの変化の多様性等種
々の要件か重なり、通常はスペルチェック機能以外は実
現されていない。そのため、作成した交信の右マージン
位置にかかったjit語をハイフンで区切って複数行で
表現する必要がある場合、オペド−タ自身か゛その単J
11のハイフン入力可能位置を覚えていてハイフンを入
力Vるか、或いは441 !!’lの辞書、文法書を用
いてハイフン入力可能位置を検索して入力しでおり、ハ
イフン位置の識別に極めて手間がかかると共に、場合に
J:つでは誤った位置にハイフンを入力してしまうとい
った問題がある。
[Prior Art 1 Conventionally, English word dictionaries have functions such as spell check, hyphonate, and syntax check, based on electronic Ht-word dictionaries built into European language word processors, etc., but French word dictionaries do not. Due to various requirements such as the variety of changes in Buddha 8ji, functions other than spell check are usually not implemented. Therefore, if it is necessary to express the jit word placed in the right margin position of the created communication in multiple lines separated by hyphens, the operator itself or
Remember the hyphen input position in 11 and input the hyphen, or 441! ! 'l's dictionary and grammar book are used to search for and enter positions where hyphens can be input, and it takes a lot of effort to identify the hyphen position, and in some cases, the hyphen is input in the wrong position. There are problems like this.

そこで、第1表の如く、従来のスペルチェック用の辞書
内にハイフンの入力可能位置を記憶させておくことが考
えられるが、各単語についていちいちハイフン位置を記
憶させたのでは、辞書の記憶容量が極めて大とくなる。
Therefore, as shown in Table 1, it is conceivable to store the possible input positions of hyphens in a dictionary for conventional spell checking, but if the hyphen positions are memorized for each word, the storage capacity of the dictionary is insufficient. becomes extremely large.

[発明の目的1 本発明は、電子的なハイフォネート辞書によって仏語の
ハイフォネート情報を供給しうるようにすると共に、ハ
イ7オネート情報に格納するデータを圧縮し、ハイフォ
ネート辞書の記憶容量を可及的に減少させることを目的
としている。
[Objective of the Invention 1] The present invention enables an electronic hyphonate dictionary to supply French hyphonate information, compresses data stored in the hy7onate information, and maximizes the storage capacity of the hyphonate dictionary. The aim is to reduce

[発明の構成1 上述の目的を達成するため、本発明では仏文法によるハ
イフォネートルールを辞書内に格納し、入力された仏単
語にこのルールを適用する、二とに゛  よっでハイフ
ン入力可能位置を判定するようにした。但し、接頭語及
び接尾語は常にそれだけで独立しているので、これらは
別途辞書内に格納し、接頭語及び接尾語を有する仏単語
についてはまずそれらを分離した後、残りの語幹部分に
ついて1−記のハイフォネートルールを適用するように
した。
[Configuration 1 of the Invention In order to achieve the above-mentioned object, the present invention stores a hyphonate rule based on French grammar in a dictionary, and applies this rule to an input French word. Possible positions are now determined. However, since prefixes and suffixes are always independent, they are stored separately in the dictionary, and for French words that have prefixes and suffixes, first separate them, and then 1. - The hyphonate rules listed below are now applied.

又、複合語等一部の■hは」1記のハイフォネートルー
ルに従わないので、これら例外語についてはハイフン入
力可能位置を逐語的に辞書内に格納した。
Also, since some compound words and the like do not follow the hyphenate rule in 1, the positions where hyphens can be input are stored verbatim in the dictionary for these exceptional words.

すなわち、本発明による仏語ハイ7オネート辞書は、仏
文法に基づく仏単語のハイフォネートルールを列記した
ハイフォネートルールテーブルを格納するハイフォネー
トルールテーブル格納領域と、仏語の接頭語辞書及び接
尾語辞書を夫々格納する接頭語辞書格納領域及び接尾語
辞書格納領域と、通常のハイ7オネート情報ルに従わな
い例外的な仏単語のハイ7オネート情報を逐語的に登録
した拒否ルールテーブルを格納する拒否ルールテーブル
格納領域とを備えたことを特徴としている。
That is, the French high 7 onate dictionary according to the present invention includes a hyphonate rule table storage area that stores a hyphonate rule table listing hyphonate rules for French words based on French grammar, and a French prefix dictionary and suffix. Stores a prefix dictionary storage area and a suffix dictionary storage area that store word dictionaries, respectively, and a rejection rule table in which the high 7 onate information of exceptional French words that do not follow the normal high 7 onate information is registered verbatim. It is characterized by comprising a storage area for a rejection rule table.

なお、−1,記ハイフォネートルールテーブル内には、
ハイフンによって分離不能な複数の2連続子音字列に共
通する1文字目の文字群と2文字目の文字群を互いに分
割して登録しておくことか好ましい。
In addition, in the hyphonate rule table marked -1,
It is preferable to register the first character group and the second character group that are common to a plurality of two consecutive consonant character strings that cannot be separated by a hyphen.

[発明の効果1 本発明によると、電子式ハイ7オネート辞書によって仏
単語のハイフン入力可能位置を迅速正確に供給すること
ができると共に、ハイフォネートルールテーブル及び接
頭語辞書、接尾語辞書の採用によってデータ量を圧縮し
、全ての仏単語のハイフォネート情報を逐語的に記憶さ
せる場合に比して、上記ハイフォネート辞書の記憶容量
を大幅に減少させることが可能になる。
[Advantageous Effects of the Invention 1] According to the present invention, positions where hyphens can be input in French words can be quickly and accurately supplied by an electronic hy7onate dictionary, and a hyphonate rule table, a prefix dictionary, and a suffix dictionary are employed. By compressing the amount of data, it is possible to significantly reduce the storage capacity of the hyphonate dictionary, compared to the case where the hyphonate information of all French words is stored verbatim.

[実施例1 次に、添付図面及び表を参照しながら本発明の詳細な説
明する。
[Example 1] Next, the present invention will be described in detail with reference to the accompanying drawings and tables.

第1図は仏語を使用する言語処理システムの一般的な全
体構成を示すブロック図であり、上記言語処理システム
は、入力装置1と、記憶装置2と、出力装置3と、ハイ
フォネート辞書4と、制御装置5とを備えて構成される
FIG. 1 is a block diagram showing the general overall configuration of a language processing system using French, and the language processing system includes an input device 1, a storage device 2, an output device 3, a hyphonate dictionary 4, and a control device 5.

上記入力装置1は、文字、単語情報を記憶装置2に入力
するための装置であって、具体的には鍵盤装置、タブレ
ット装置若しくはOCR等である。
The input device 1 is a device for inputting character and word information into the storage device 2, and is specifically a keyboard device, a tablet device, an OCR, or the like.

記憶装置2は入力装置1から入力された文字情報を保存
、編集するための装置で、具体的にはコアメモリー、I
Cメモリー等である。
The storage device 2 is a device for storing and editing character information input from the input device 1, and specifically includes core memory, I
C memory, etc.

出力装置3は記憶装置2で保存、編集されたデータを出
力する装置であって、例えばプリンター、ディスプレイ
装置等が使用される。
The output device 3 is a device that outputs the data stored and edited in the storage device 2, and is, for example, a printer, a display device, or the like.

辞書4は記憶装置2に格納している単語データに関する
ハイ7オネート情報の間合せに対し有効な情報を供給す
る辞書であって、具体的にはコアメモリー、ICメモリ
ー、ROM、磁気ディスク等からなる。このハイフォネ
ート辞書」は、ハイフォネートルールテーブル格納領域
4aと、接頭語辞書格納領域41〕と、接尾語辞書格納
領域4cと、拒否ルールテーブル格納領域4dとから構
成される。
The dictionary 4 is a dictionary that supplies effective information for adjusting high-7onate information related to word data stored in the storage device 2, and specifically, it supplies information from core memory, IC memory, ROM, magnetic disk, etc. Become. This "hyphonate dictionary" is composed of a highphonate rule table storage area 4a, a prefix dictionary storage area 41], a suffix dictionary storage area 4c, and a rejection rule table storage area 4d.

制御装置5は、」二記各構成要素間の信号の伝達を制御
する装置であって、具体的には例えばコンピュータであ
る。
The control device 5 is a device that controls the transmission of signals between the respective constituent elements, and is specifically, for example, a computer.

以下、図示の言語処理システムが仏語ワードプロセッサ
ーである場合を想定して説明する。すなわち、ハイ7オ
ネート辞書4内に格納されたデータを利用することによ
り、−]二二記語ワードプロセ・。
The following description will be made assuming that the illustrated language processing system is a French word processor. That is, by using the data stored in the High 7 Onate Dictionary 4, -] 22-word word processing.

サーにおいで、第2図に示すディスプレイ装M(出力装
置)3に入力された文字列を表示しながらワードプロセ
ッサーの入力装置1で記憶装置2に文字列を入力するに
際して、単語Wがディスプレイ装置3の表示可能領域A
からはみ出して右マージンMにかかった場合、上記ハイ
フォネート辞書4によって単語Wのハイフン入力可能位
tlHl+2+113・・・が検出され、右マージンM
に最も近いハイフン入力可能位置112にハイフンが入
力されて、単語Wが自動的に2行に分割されて表示され
るようになっている。なお、上記仏語ワードプロセッサ
ーには、ハイ7オネート辞書4に加えて、通常スペルチ
ェック用辞書が内蔵されるが、この点は必須の要件では
ない。次に、まずハイ7オネートルール4について述べ
る。
When inputting a character string into the storage device 2 using the input device 1 of the word processor while displaying the input character string on the display device M (output device) 3 shown in FIG. Displayable area A
If the hyphen extends beyond the right margin M, the hyphen dictionary 4 detects the possible hyphen input positions of the word W, tlHl+2+113..., and the right margin M
A hyphen is input into the hyphen input possible position 112 closest to , and the word W is automatically divided into two lines and displayed. Note that the French word processor has a built-in spell check dictionary in addition to the High7 Onate dictionary 4, but this is not an essential requirement. Next, we will first discuss High 7 Onate Rule 4.

(、)ハイフォネート辞書4には、仏文法に基づく仏単
語のハイ7オネートルールが記憶される。
(,) The high phonate dictionary 4 stores high 7 onate rules for French words based on French grammar.

以下に主要なハイ7オネートルールを列記Vる。The main high 7 onate rules are listed below.

ルール(〔川・つづり字は11字のi;1で切る。但し
、411尾のl音字は分離で外ない。
Rules ([The spelling of river is the 11th letter i; cut at 1. However, the 411th letter l is separated and cannot be missed.

ルール4)・・・連続する2子音字は2つに分ける。Rule 4)...Divide two consecutive consonants into two.

ルー/醐i−・但し、・次の2連続子音字列は切ること
かできない; liL、 <:1. Fl、 liL 
1山山νl、 br。
Lu/鐐i-・However,・The following two consecutive consonant strings cannot be cut; liL, <:1. Fl, liL
1 Yamayama νl, br.

cr、 dr、 fr、 gr、 pr、 lr、 V
r、 CI’l+ pl++ tl+、 8n。
cr, dr, fr, gr, pr, lr, V
r, CI'l+ pl++ tl+, 8n.

ルール4)・・・3連続のl音字は前の2文字と後の1
文字で切る。但し、その場合もルールI8・は守らねば
ならない。
Rule 4)...Three consecutive l syllables are the first two letters and the last one
Cut by letter. However, even in that case, Rule I8 must be followed.

ルール(f’i)・・・連続するIl音字を切ることは
できない。
Rule (f'i): Consecutive Il syllables cannot be cut.

J:述のルール中〜ij;) ’lテーブルの形式でハ
イ7オネート辞書4のハイフォネートルールテーブル格
納領域4aに格納し、これらルール十〜山)を記憶装置
2内に入力された仏、(:4′L語に適用してハイフン
人力可能位置の1イリ定を行う。
J: The above rules are stored in the high phonate rule table storage area 4a of the high 7 onate dictionary 4 in the form of a , (:4'Apply to the L word to determine the possible position of the hyphen manually.

ところで、ルールイ8)による分離不能な2連続子音字
列を2文字jit位で検索した場合は、検索時間か゛か
なり長くなることか′予想される。そこで不発明では上
述の2連続子音字列の検索を容易にするため、次のよう
な工夫をした。
By the way, if an inseparable double consonant character string according to Rule 8) is searched for about two characters, it is expected that the search time will be quite long. Therefore, in order to facilitate the search for the above-mentioned two consecutive consonant character strings, we devised the following.

すなわも、第2表に示す如く、分離不能な2連続子音字
列の1文字目はl)+ e* d+ ft Fh ll
+ f+ Vに、2文字目はl、 r、 II、 nに
限定される。ところで、第2表の空白領域に入る文字列
+111. dh、 fh・・・は、文法上は分離不能
な2連続子音字列には指定されていないが、現実的には
この上うな2連続子音字列bh、 dlr、 f1門を
有する仏単語が見当らないので、2連続子音字列が分離
不能であるか否かを1文字目と2文字目を分離して1文
字単位で判別することがでトる。
In other words, as shown in Table 2, the first letter of an inseparable double consonant string is l)+ e* d+ ft Fh ll
+f+V, the second character is limited to l, r, II, n. By the way, the character string +111 that falls in the blank area of Table 2. dh, fh... are not designated as inseparable two-consecutive consonant strings in grammar, but in reality, French words with two consecutive consonant strings bh, dlr, f1 are Since it is not found, it is possible to separate the first and second characters and determine whether the two consecutive consonant character strings are inseparable or not, character by character.

このような知見に基づト、本発明ではルール■による分
離不能な2連続子音字列を2文字単位で登録する代わり
に、上記2連続子音字列の1文字目に共通する文字群(
1)+ C+ (LL Fh ’11+ L+ V)と
2文字目に共通する文字群(1,r、 h、 n)とに
分割してそれらを互いに独立に辞書4のハイフォネート
ルール格納領域4aに格納し、ルールG)のチェックに
際しては、例えば2連続子音字列の1文字目が(1+、
 el d+ L g+Il+ l+いのいずれかであ
るか否かを判別した後、それらのいずれかである場合に
ついて2文字目か゛(l、 r、 lI、 n)のいず
れかであるか否かを判別するようにした。それにより、
ルール■のチェックに要する時間を短縮することがでと
る。なお、」1記の判別は、2文字目から順に行っても
良い。
Based on this knowledge, in the present invention, instead of registering inseparable two-consecutive consonant character strings in units of two characters according to rule (■), a group of characters (
1) Divide into + C+ (LL Fh '11+ L+ V) and the character group common to the second character (1, r, h, n) and store them independently in the highphonate rule storage area 4a of the dictionary 4. When checking rule G), for example, if the first character of a string of two consecutive consonants is (1+,
After determining whether it is either el d+ L g+Il+ l+, if it is any of them, determine whether the second character is either (l, r, lI, n). I decided to do so. Thereby,
This can be achieved by shortening the time required to check rule ■. Note that the determination in ``1'' may be performed sequentially starting from the second character.

又、第1表に示す如く、単語animalはa−ni−
+++alとハイフォネートされ、文法」二は先頭の1
文字aを1音節としで取扱うことがでとるが、単語a 
II ! ++181が仏語ワードプロセッサーの右マ
ージンMにかかった場合、先頭の1文字aと残りの文字
列とに分割して2行で表わしたのでは文字数的にアンバ
ランスを生じる。そこで、このような場合は、右マージ
ンMにかかった単語の先頭又は末尾の少数の文字列が文
法的には分割可能であっても、敢えて2行に跨って表現
しない旨のルールを設定し、−1−述のハイフォネート
ルール格納領域4aに格納する。なお、先頭又は末尾の
河文字以内の文字列を分割しないかは、全体の文字数を
ら考1した1−で決定でとる。
Also, as shown in Table 1, the word animal is a-ni-
+++al is hyphonated, and the ``grammar''``2'' is the first 1.
The letter a can be treated as one syllable, but the word a
II! If ++181 is placed in the right margin M of a French word processor, dividing it into the first character a and the rest of the character string and representing them in two lines would result in an imbalance in terms of the number of characters. Therefore, in such cases, even if the small number of characters at the beginning or end of a word that extends into the right margin M can be grammatically divided, we deliberately set a rule that prevents it from being expressed across two lines. , -1- is stored in the hyphonate rule storage area 4a. Note that whether or not to divide a character string within the first or last river character is determined by taking the total number of characters into consideration.

(1))ところで、仏単語には種々の接頭語及び接尾語
があり、これら接頭語及び接尾語は前掲のハイフォネー
トルール(1)〜■)とは無関係に、常にそれだけで独
立しでいるので、接頭語又は接尾語を有する仏単語にハ
イフォネートルール(1)〜(6)をそのまま適用した
のでは、ハイフォネートが正確に行われなくなる問題が
ある。例示すれば、(ioIl−st、a+山5ub−
stan−ce等の語(con、 sul+は接頭語)
は上述のハイ7オネートルール@ −Cへ1には従わな
い。
(1)) By the way, French words have various prefixes and suffixes, and these prefixes and suffixes are always independent on their own, regardless of the hyphonate rules (1) to ■) listed above. Therefore, if the hyphonation rules (1) to (6) are applied as they are to French words that have prefixes or suffixes, there is a problem that hyphonation will not be performed accurately. For example, (ioIl-st, a + mountain 5ub-
Words such as stan-ce (con, sul+ are prefixes)
does not follow the high 7 onate rule @ -C to 1 above.

そこで、本発明では、仏語の主要な接頭語及び接尾語を
アルファベット類に整理して接頭語辞書(第3表参照)
及び接尾語辞書(第4表参照)を作成し、これらを辞書
4の接尾語辞書格納領域旧J及び接尾語辞書格納領域4
cに格納した。ハイフォネートに際しでは、まず、これ
らの領域旧〕、4cに格納されている接頭語辞書及び接
尾語辞書を参照腰入力された単語に接頭語又は接尾語が
ある場合はそれらを分離した後、残りの語幹部分につい
てハイフォネートルール−1)〜(6)を適用する。な
お、−1−記接頭J11辞書及び接尾語辞書には、IL
 fijjの殆んど全ての接頭8ji及び接尾語が網羅
されているが、両辞書に記載されていない接頭語、接尾
Nriも適宜両辞書内に編入することか“でとる。
Therefore, in the present invention, the main prefixes and suffixes of French are organized into alphabets, and a prefix dictionary (see Table 3)
and suffix dictionary (see Table 4), and store these in the suffix dictionary storage area old J of dictionary 4 and the suffix dictionary storage area 4.
Stored in c. When hyphonating, first refer to the prefix dictionary and suffix dictionary stored in these areas 4c and 4c.If the input word has a prefix or suffix, separate them, and then Hyphonate rules-1) to (6) are applied to the word stem. In addition, in the -1- prefix J11 dictionary and suffix dictionary, IL
Although almost all prefixes 8ji and suffixes of fijj are covered, prefixes and suffixes Nri that are not listed in both dictionaries may also be incorporated into both dictionaries as appropriate.

(c)Lh化なか1仏単語の中には複合語の如< !i
i語全体としては文法によるハイフォネートルールに従
わないものが存在する。例えば、単語aνantlet
1.reにルール(1ン−CrEiを適用すればa−v
an−1,1eL−treとハイフォネートされるが、
avantlettrel土avanlと1ettre
との複合語であるから正解はa−VallL−let、
−treである。従って、本発明では、このようなハイ
7オネートルール(lj−@iこ従わない例外的な1〕
、単語に関するハイ7オネート情報(ハイフン入力可能
位置)を、逐語的に拒否ルールテーブル(具体的には示
さない)に登録し、上記拒否ルールテーブルを辞書4の
拒否ルールテーブル格納領域4dに格納した。
(c) Some French words in the Lh system are compound words! i
There are some i-words that do not follow the grammatical hyphonate rules. For example, the word aνantlet
1. If you apply the rule (1-CrEi to re), a-v
It is hyphonated as an-1,1eL-tre,
avantlettrel sat avanl and 1ettre
Since it is a compound word with , the correct answer is a-VallL-let,
-tre. Therefore, in the present invention, such a high 7 onate rule (an exceptional 1 that does not follow lj-@i)
, the hy7onate information (hyphen input possible position) regarding the word was registered verbatim in a rejection rule table (not specifically shown), and the rejection rule table was stored in the rejection rule table storage area 4d of the dictionary 4. .

なお、上記拒否ルールテーブルには、右マージンMにか
かった単語の文字数が最小限何文字以」二であれば、実
際にハイフォネートを行うかを定める最小限の文字数を
設定しておくことができる。
In addition, in the above rejection rule table, a minimum number of characters can be set that determines whether to actually hyphonate a word if it has a minimum number of characters in the right margin M. .

例えば、最小限の文字数を6に設定すると、5文字以下
の単語が右マージンMにかかった場合には、敢えてハイ
フォネートは実施されず、単語全体が次行に移される。
For example, if the minimum number of characters is set to 6, if a word of 5 characters or less falls within the right margin M, hyphonation is not intentionally performed and the entire word is moved to the next line.

なお、最小限の文字数は、6文字以外にも任意に設定で
とる。
Note that the minimum number of characters can be set arbitrarily other than six characters.

次に、第3図を参照しながら、入力された単語Wが右マ
ージンMにかかった場合の処理手順を今1度順を迫って
説明する。
Next, with reference to FIG. 3, the processing procedure when the input word W falls within the right margin M will be explained in detail once again.

(i)  入力された単語Wが右マージンMにかかった
場合、ステップ■でまず右マージンMまでのカラム数が
検出される。
(i) When the input word W falls within the right margin M, the number of columns up to the right margin M is first detected in step (3).

(ii)  次に、ステップIIで単語Wの文字数がカ
ウントされ、単語Wの文字数が辞書4の領域4dに格納
された拒否ルールテーブルに設定された設定数に満たな
い場合はハイフォネートが実施されず、単語W全体が次
行へ移される。
(ii) Next, in step II, the number of characters in the word W is counted, and if the number of characters in the word W is less than the number set in the rejection rule table stored in the area 4d of the dictionary 4, hyphonation is not performed. , the entire word W is moved to the next line.

(iii)単語Wの文字数が設定数以上である場合は、
ステップIIIで単語Wが上記拒否ルールテーブルに登
録された例外語と対照される。
(iii) If the number of characters in word W is greater than or equal to the set number,
In step III, the word W is compared with the exception words registered in the rejection rule table.

(iv)  単語Wが例外語である場合は、ステップI
Vで拒否ルールテーブルに登!!されtこ単語\・〜′
1こ関するハイ7オネート情報に基づいてハイフン位置
が決定される。例えば例外語avan1.− tel、
−1,reの場合、5文字目と);文字目の後にハイフ
ン人力可能であるので、数値5,8が供給される。これ
に対し、ステップ1で検出された右マージンN1までの
カラム数が6であれば、5文字目の次にハイフンが入力
され、avant−1ettreと2行に跨って表示さ
れる。
(iv) If word W is an exception word, step I
Enter the rejection rule table with V! ! Saretko word\・~'
The hyphen position is determined based on the hyphen onate information related to the hyphen. For example, the exception word avan1. - tel,
In the case of -1, re, the 5th character); Since a hyphen can be entered manually after the 5th character, the numerical values 5, 8 are supplied. On the other hand, if the number of columns up to the right margin N1 detected in step 1 is 6, a hyphen is input next to the 5th character and is displayed across two lines as avant-1ettre.

(v)  単語Wが例外語でない場合は、ステップ\l
で単語Wが辞書4の領域旧〕に格納された接頭語辞書に
記載された接頭語を有するか否かが判定される。
(v) If word W is not an exception word, step \l
Then, it is determined whether the word W has a prefix listed in the prefix dictionary stored in the area OLD of the dictionary 4.

(vi)  単語Wが接頭語を有する場合、ステップV
lで接頭語の後にハイフン入力可能位置が設定される。
(vi) If word W has a prefix, step V
A position where a hyphen can be input is set after the prefix in l.

(vii)次にステツブシIIで、単語Wが辞書4の領
域4cに格納された接尾語辞書に記載された接尾語を有
するか否かが判定される。
(vii) Next, in Step II, it is determined whether the word W has a suffix listed in the suffix dictionary stored in the area 4c of the dictionary 4.

(viii)  単語〜\rが接尾語を有する場合、接
尾語の前にハイフン入力可能位置か設定される。
(viii) If the word ~\r has a suffix, a position where a hyphen can be input is set before the suffix.

(iX)  次にステップIXで、接頭語及び接尾語を
有さない単語Wに関しては単語全体について一方接頭語
及び/又は接尾語を有する単語に関してはそれを取り除
いた語幹部分について、辞書4の領域4aに格納されて
いるハイフォネートルールテーフ゛ルiコ列記Z h 
r:ハイフォネートルール一′1ノ・〜(チ)に基づい
て文法チェックを行い、最終的にハイフン入力可能位置
を設定する。
(iX) Next, in step IX, for words W without a prefix and suffix, the whole word is processed, while for words with a prefix and/or suffix, the stem part from which they are removed is processed in the area of the dictionary 4. List of hyphonate rule tables stored in 4a Z h
r: Performs a grammar check based on the hyphonate rules 1'1 and 1, and finally sets the position where a hyphen can be input.

(×)  ステップXでは、ハイフン入力可能位置が複
数箇所ある場合は、ステップ■で求めた右マージンMま
でのカラム数との比較で最も右マージンMに近いハイフ
ン入力可能位置が選択され、一方、ハイフン入力可能位
置が1箇所のみである場合はその位置にハイフンが入力
されて単語Wが2行に跨って表示される。
(×) In step If there is only one position where a hyphen can be input, a hyphen is input at that position and the word W is displayed across two lines.

上述の実施例では、ハイフォネート辞書4が仏語ワード
プロセッサーに内蔵される場合を説明したが、本発明に
よるハイフォネート辞書4は仏単語を取扱う計9(幾シ
ステム等各種言語処理システムに内蔵することがでと、
その用途も右マーノンにかかった単語の分割のみに限定
されるものではない。
In the above-described embodiment, the case where the hyphonate dictionary 4 is built into a French word processor has been explained, but the hyphonate dictionary 4 according to the present invention can be built into various language processing systems such as a total of nine language processing systems that handle French words. ,
Its use is not limited to the division of words on the right mernon.

以」ユ説明したように、本発明は、)−イフォネートル
ールを列記したハイフォネーi・ルールテーブルを格納
するハイフォネートルールテーブル格納領域、1aと、
接頭語辞書及び接尾語辞書を格納する接尾語辞書格納領
域旧〕及び接尾8ji辞書格納領域4cと、例外8ji
のハイフォネート情報を逐語的に登録した11否ルール
テーブルを格納する拒否ルールテーブル格納領域4(1
とを備えた電子式1!、Jj1ハイ7オネート辞書・1
を提(i(「るものであり、それによって仏lit語の
ハイフン入力可能位置を迅速正確に供給できると共に、
データ量を圧縮し・(全ての仏’!’−Nr!のハイフ
ォネート情報を逐8jj的に記憶させる場合に比して記
憶容量を大幅に減少さぜること力呵能になる。
As explained above, the present invention includes a high phonate rule table storage area 1a for storing a hyphonic i-rule table listing iphonate rules;
The suffix dictionary storage area 4c which stores the prefix dictionary and the suffix dictionary] and the suffix 8ji dictionary storage area 4c, and the exception 8ji
Rejection rule table storage area 4 (1
Electronic type 1 with! , Jj1 High 7 Onate Dictionary 1
It is possible to quickly and accurately supply the positions where hyphens can be entered in French Lit, and
It is possible to compress the amount of data and greatly reduce the storage capacity (compared to the case where all the hyphonate information of French '!'-Nr! is stored one by one).

又、本発明では、111述のハイフォネートルールの内
、ルールI3)によって規定されるハイフンによりて分
離不能な2連続子音字列1)l、 CI、 dl等を2
文字単位で登録するのではなく、上記2連続子音字列に
共通する1文字目の文字群(b、 cl dt r、 
Fhl)、 t、 v)と、2文字目の文字群(l、 
r、 h+ n)とに分割して前記ハイフォネートルー
ルテーブルに登録するようにしたので、分離不能な2連
続子音字列を検索するに際して1文字目と2文字目とを
分割して順次1文字単位で検索することかでト、検索時
間を短縮でとる。
In addition, in the present invention, among the hyphonate rules described in 111, two consecutive consonant character strings that cannot be separated by a hyphen defined by Rule I3) 1) l, CI, dl, etc.
Rather than registering character by character, the first character group (b, cl dt r,
Fhl), t, v) and the second character group (l,
r, h + n) and are registered in the highphonate rule table, so when searching for two consecutive consonant character strings that cannot be separated, the first and second characters are divided and the first and second characters are divided and registered in the highphonate rule table. By searching character by character, the search time can be shortened.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明に係るハイフォネート辞書を内蔵した仏
語を取扱う言語処理システムの一般的な全体構成を示す
ブロック図、第2図は本発明に係るハイフォネート辞書
を内蔵した仏語ワードプロセッサーのディスプレイ装置
の説明図、第3図は第2図の仏語ワードプロセッサーに
おいて単語が右マージンにかかった場合の処理手順を示
すフロー図である。 4・・・ハイフォネート辞書、 4a・・・ハイフォネートルールテーブル格納領31、
=16− ・11〕・・・接頭語辞書格納領域、 4c・・・接尾語辞書格納領域、 ・1d・・・拒否ルールテーブル格納領域。 特許出願人  シャープ株式台ネ1 ほか1名代 理 
人  弁理士前111葆  はか2名第1表 第2表 第3表−(1)  接頭語辞書 al  a−、ad・deca− ab−+ abs−deci− amb−d品(0)− ampl+ i−図 ;−、ex(o)−an”r a
llLe−+ alllI−ell−1ell−ana
−enLre− apo−exLra− anLl+ropc              ec
−、eX−nrclr+arcl+i−+arabtニ
ーendo−auLo−ennja・ el   bene−+  bien−51ectr(
oトbe−、bes−epi− 1月−+  bis−eu− baro−、bary−filfou−、for−、f
our−1+ibl io−iR]  gasLro−
1+io−ge′o− rcl  caco−1ira160−+ gramm
aLo−caka−nk  hors−+ hor−c
is−IIyper− ellron(o)−hemi− crypL(o)−1iekt(a)−(!O−v e
olll−+ con−1+ex(a)−conLra
−、conLre−t+elio−curvi−ltj
mo−、bl!1lla−1ag−+ des−l+e
re”ro−di−、dis−1+1er(o)− dia−1+1pp(o)− dy S−horog(o)−+  bo+n(o)−
dacLyle−1+ydr(o)− 第3表−(2)  接頭語辞書 lX1]  in−post− inter−ρara− i++1ra−+ 1nLro−、1ntus−per
i−iso−pent−+ penLa−+ pent
e−1;jl  justa−poly− 国 kilo−paleo− 旧1i1ho−pan−+ pant(o)’Q II
al°+ ma15−+ mall−phil(o)−
111eS−+ me−phoro− +ni−phoLo− 11(ta−pseudo− mulLi−■re−,rr− macro−rどlro− mgHa−+  mcgalo−E   5cllli
−IIIicro−5ou−、5ous−+ sub−
mis(o)−5ur−、5uper−、5upra−
100rpH0−911!+−+5yn−+5yII+
−1syL+nolo−田trans−,tra−、t
r#my1.l+o−tri− mono−teLra− myr+a−、myr+o−Lr1− 囲 non−L〆1e′− n(o−tl+e’o− B  oし               LI+er
mo−outre−凹 ulLra− o+nn1−             p  zoo
−oct−v OCL&−+ ocLo−I  par
−1per− our− re− prO−+  l1rO9− #4表−(1)  接尾語辞書 l1i1 −ade                
f!]  −de−acle            
         −derme−ace+ −ass
e                −didacLe
−action                  
−drome+  −dromie−aie     
                −duc−ain 
               li  −i+ −6
e−ail、 −aille            
   −ege−ailler           
       −elet、 −elel、Le−ai
s(e)−elIce+−enSe−aison   
                −ende−a1g
+e−er、−ere、−1er−al       
               −erie−ance
、−anse−’es −arcbie                  
−esque−6rd               
       −eresse’1lrqlle   
                        −
esse−asse                
      −eL、  −jte−ance    
                   −eter−
B11de−eur、 −euse −arde                    
−ellX+  −eLlse−aud       
              −tierlil  −
bilit5               −fum
e−ble(−able、  −1ble、  −−市
le)      ’g  −gone回−che  
                 −Bone、 −
8onal−ellrome、 −chroIIie 
           −Bra+oIOe−el+r
one+  −cbroniqus+  −c+l+r
onisml    −grapHe−cide   
                   4ro1+I
+ie+  −Hral+lIi中1e−cole  
                −gyne−col
o                [j’l  −1
aLre+ −1alricc−colore    
               −1de−cral、
e+  −eraLIe+ −Cral!qLle  
     −!−culLeur、  −cu!Lur
e                    −+en
、  −+enne第4表−(2)  接尾語辞書 0ion−ou −sent                    
  −sperme164表−(3)  接尾語辞書 −Lion、−aLio+++iLion−LQme+
  −1oIIie −Lrope1−Lro1+ie、  −tropis
+ne−1,ude −Lype+ −typie 同−l息 一1lellX、  −11f!use−ull! −ure、−azure Il−vore べ Q7へ
FIG. 1 is a block diagram showing the general overall configuration of a language processing system that handles French and has a built-in hyphonate dictionary according to the present invention, and FIG. 2 is an explanation of a display device for a French word processor that has a built-in hyphonate dictionary according to the present invention. 3 is a flowchart showing the processing procedure when a word falls on the right margin in the French word processor of FIG. 2. 4... Hyphonate dictionary, 4a... Hyphonate rule table storage area 31,
=16-・11]...Prefix dictionary storage area, 4c...Suffix dictionary storage area, 1d...Rejection rule table storage area. Patent applicant Sharp Co., Ltd. 1 and 1 other representative
Person Patent attorney 111 葆 2 people Table 1 Table 2 Table 3 - (1) Prefix dictionary al a-, ad/deca- ab-+ abs-deci- amb-d product (0)- ampl+ i-figure ;-, ex(o)-an”ra
llLe-+ allllI-ell-1ell-ana
-enLre- apo-exLra- anLl+ropc ec
-, eX-nrclr+arcl+i-+arabt knee endo-auLo-ennja・el bene-+ bien-51ectr(
otobe-, bes-epi- January-+ bis-eu- baro-, bary-filfou-, for-, f
our-1+ibl io-iR] gasLro-
1+io-ge'o- rcl caco-1ira160-+ gramm
aLo-caka-nk hors-+ hor-c
is-IIyper- ellron(o)-hemi- crypL(o)-1iekt(a)-(!O-ve
oll-+con-1+ex(a)-conLra
-, conLre-t+elio-curvi-ltj
mo-, bl! 1lla-1ag-+ des-l+e
re”ro-di-, dis-1+1er(o)- dia-1+1pp(o)-dy S-horog(o)-+ bo+n(o)-
dacLyle-1+ydr(o)- Table 3-(2) Prefix dictionary lX1] in-post- inter-ρara- i++1ra-+ 1nLro-, 1ntus-per
i-iso-pent-+ penLa-+ pent
e-1;jl justa-poly- country kilo-paleo- old 1i1ho-pan-+ pant(o)'Q II
al°+ ma15-+ mall-phil(o)-
111eS-+ me-phoro- +ni-phoLo- 11(ta-pseudo- mulLi-■re-,rr- macro-rdo lro- mgHa-+ mcgalo-E 5cllli
-IIIicro-5ou-, 5ous-+ sub-
mis(o)-5ur-, 5uper-, 5upra-
100rpH0-911! +-+5yn-+5yII+
-1syL+nolo-trans-, tra-, t
r#my1. l+o-tri- mono-teLra- myr+a-, myr+o-Lr1- surrounding non-L〆1e'- n(o-tl+e'o- Boshi LI+er
mo-outre-concave ulLra- o+nn1- p zooo
-oct-v OCL&-+ ocLo-I par
-1per- our- re- prO-+ l1rO9- #4 table-(1) Suffix dictionary l1i1 -ade
f! ] -de-acle
-derme-ace+ -ass
e-didacLe
-action
-drome+ -dromie-aie
-duc-ain
li −i+ −6
e-ail, -aille
-ege-ailer
-elet, -elel, Le-ai
s(e)-elIce+-enSe-aison
-ende-a1g
+e-er, -ere, -1er-al
-erie-ance
, -anse-'es -arcbie
-esque-6rd
-eresse'1lrqlle

esse-asse
-eL, -jte-ance
-eter-
B11de-eur, -euse -arde
-ellX+ -eLlse-aud
-tierlil-
bilit5-fum
e-ble(-able, -1ble, --shi le) 'g -gone times-che
-Bone, -
8onal-ellrome, -chroIIie
-Bra+oIOe-el+r
one+ -cbronikus+ -c+l+r
onisml-graphHe-side
4ro1+I
+ie+ -Hral+lIi 1e-cole
-gyne-col
o [j'l −1
aLre+ -1alricc-colore
-1de-cral,
e+ -eraLIe+ -Cral! qLle
-! -culLeur, -cu! Lur
e −+en
, -+enne Table 4-(2) Suffix dictionary 0ion-ou -sent
-sperme164 table-(3) Suffix dictionary-Lion, -aLio+++iLion-LQme+
-1oIIie -Lrope1-Lro1+ie, -tropis
+ne-1,ude -Lype+ -typeie Same-l Breath 1lellX, -11f! Use-ull! -ure, -azure Il-vore BeQ7

Claims (2)

【特許請求の範囲】[Claims] (1)仏文法に基づく仏単語のハイフォネートルールを
列記したハイフォネートルールテーブルを格納するハイ
フォネートルールテーブル格納領域と、仏語の接頭語辞
書及び接尾語辞書を夫々格納する接頭語辞書格納領域及
び接尾語辞書格納領域と、通常のハイフォネートルール
に従わない例外的な仏単語のハイフォネート情報を逐語
的に登録した拒否ルールテーブルを格納する拒否ルール
テーブル格納領域とを備えたことを特徴とする電子式仏
語ハイフォネート辞書。
(1) A hyphonate rule table storage area that stores a hyphonate rule table that lists hyphonate rules for French words based on French grammar, and a prefix dictionary that stores a French prefix dictionary and a suffix dictionary, respectively. A storage area, a suffix dictionary storage area, and a rejection rule table storage area for storing a rejection rule table in which hyphonate information of exceptional French words that do not follow normal hyphonate rules are registered verbatim. Features an electronic French high phonate dictionary.
(2)上記ハイフォネートルールテーブル内にハイフン
によって分離不能な複数の2連続子音字列に共通する1
文字目の文字群と2文字目の文字群とが互いに分割され
て登録されたことを特徴とする特許請求の範囲第(1)
項記載の電子式仏語ハイフォネート辞書。
(2) 1 that is common to multiple two consecutive consonant character strings that cannot be separated by hyphens in the above hyphonate rule table
Claim (1) characterized in that the character group of the first character and the character group of the second character are registered separately from each other.
Electronic French hyphonate dictionary described in Section 1.
JP59187197A 1984-09-05 1984-09-05 Electronic hyphenate dictionary of french language Pending JPS6165360A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP59187197A JPS6165360A (en) 1984-09-05 1984-09-05 Electronic hyphenate dictionary of french language
FR8513212A FR2569883B1 (en) 1984-09-05 1985-09-05 ELECTRONIC DICTIONARY FOR USE IN A FRENCH TEXT PROCESSING SYSTEM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59187197A JPS6165360A (en) 1984-09-05 1984-09-05 Electronic hyphenate dictionary of french language

Publications (1)

Publication Number Publication Date
JPS6165360A true JPS6165360A (en) 1986-04-03

Family

ID=16201795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59187197A Pending JPS6165360A (en) 1984-09-05 1984-09-05 Electronic hyphenate dictionary of french language

Country Status (1)

Country Link
JP (1) JPS6165360A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63121970A (en) * 1986-11-12 1988-05-26 Canon Inc Document processor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5875240A (en) * 1981-10-09 1983-05-06 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション Data signal inspection system
JPS58225429A (en) * 1982-06-25 1983-12-27 Fujitsu Ltd Spelling error processing system of engilish sentence processor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5875240A (en) * 1981-10-09 1983-05-06 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション Data signal inspection system
JPS58225429A (en) * 1982-06-25 1983-12-27 Fujitsu Ltd Spelling error processing system of engilish sentence processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63121970A (en) * 1986-11-12 1988-05-26 Canon Inc Document processor

Similar Documents

Publication Publication Date Title
Gatbonton Patterned phonetic variability in second-language speech: A gradual diffusion model
Macdonald et al. The writer's workbench: Computer aids for text analysis
Perea et al. The search for an input-coding scheme: Transposed-letter priming in Arabic
Brown Russian Learners' Dictionary: 10,000 Russian Words in Frequency Order
Bergenholtz et al. A new perspective on the access process
Jahani Standardization and orthography in the Balochi language
van Heuven et al. Analysis and synthesis of speech: strategic research towards high-quality text-to-speech generation
Goldsmith Linguistica: An automatic morphological analyzer
Hughes Late medieval liturgical offices: resources for electronic research: texts
US6999915B2 (en) Process and device for translation expressed in two different phonetic forms
JP2928233B2 (en) Foreign language dictionary of alphabet
US7010487B1 (en) Method for comparing similarity between phonetic transcriptions of foreign word
JPS6165360A (en) Electronic hyphenate dictionary of french language
Bakker Bardaisan's book of the laws of the countries: a computer-assisted linguistic analysis
Kytö et al. English witness depositions 1560-1760: An electronic text edition
Шамуратова Challenges in simultaneous interpretation
Siewert et al. Towards a balanced annotated Low Saxon dataset for diachronic investigation of dialectal variation
JP3136973B2 (en) Language analysis system and method
Aimuratova Challenges in simultaneous interpretation
Chitauro.-Mawema Challenges encountered in the compilation of an advanced Shona dictionary
JPS62144269A (en) Information retrieving device
Akan et al. On Linguistic Reviews of Arabic and Bangla: A Comparative Study
Parry Late Hebrew Forms in 1QIsaa
Blake The part played by the publications of the United States government in the development of Philippine linguistic studies
Koerner On ‘Unrewriting the History of Linguistics’