JPS63187299A - Word spelling-pronunciation sign conversion system - Google Patents

Word spelling-pronunciation sign conversion system

Info

Publication number
JPS63187299A
JPS63187299A JP62018649A JP1864987A JPS63187299A JP S63187299 A JPS63187299 A JP S63187299A JP 62018649 A JP62018649 A JP 62018649A JP 1864987 A JP1864987 A JP 1864987A JP S63187299 A JPS63187299 A JP S63187299A
Authority
JP
Japan
Prior art keywords
word
spelling
affix
separation
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62018649A
Other languages
Japanese (ja)
Other versions
JPH0827636B2 (en
Inventor
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62018649A priority Critical patent/JPH0827636B2/en
Publication of JPS63187299A publication Critical patent/JPS63187299A/en
Publication of JPH0827636B2 publication Critical patent/JPH0827636B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔概 要〕 単語つづり一発音記号変換方式において、所定の接辞分
離ルールに従って単語又は語幹のつづりより接辞を一つ
分離する毎に、接辞を分離された語幹部分が例外的な発
音をする例外語に該当するか検索する。これにより、単
語つづり一発音記号変換処理を高速化すると共に、余分
に接辞分離が行われるのを防止して誤りない単語つづり
一発音記号変換を行うことが出来る。
[Detailed Description of the Invention] [Summary] In the word spelling-one-phonetic symbol conversion method, each time one affix is separated from the spelling of a word or word stem according to a predetermined affix separation rule, the word stem part from which the affix has been separated becomes an exception. Search for exception words with similar pronunciations. Thereby, it is possible to speed up the word spelling-one-phonetic-symbol conversion process, and to prevent error-free word-spelling-one-phonetic symbol conversion by preventing unnecessary affix separation.

〔産業上の利用分野〕[Industrial application field]

本発明は、任意の文章を音声に変換する文−音声変換過
程において単語つづりを発音記号に変換する処理を高速
且つ誤りなく行う単語つづり一発音記号変換方式に関す
る。
The present invention relates to a word spelling-to-phonetic symbol conversion method that converts word spellings into phonetic symbols at high speed and without errors in a sentence-to-speech conversion process for converting arbitrary sentences into speech.

任意の文章を音声に変換する場合、先ず、文中の各単語
をその発音を表す記号即ち発音記号に変換する処理が行
われる。
When converting an arbitrary sentence into speech, first, each word in the sentence is converted into a symbol representing its pronunciation, that is, a phonetic symbol.

然しなから、単語の中には、規則的な変換ルールに従わ
ない例外的な発音をする単語も多い。例えば、つづりr
oVElは通常の規則的な発音は(o u v)又は〔
ΔV〕であるが、例外的に〔U:v〕と発音される。後
者の例として、例えばmove (mu:v)やpro
ve (pru:v)がある。
However, there are many words that have exceptional pronunciations that do not follow regular conversion rules. For example, the spelling r
The regular pronunciation of oVEl is (o u v) or [
ΔV], but in exceptional cases it is pronounced as [U:v]. Examples of the latter include move (mu:v) and pro
There is ve (pru:v).

この様な例外的な発音の単語の派生形をすべて辞書に持
つとすれば、膨大な記憶容量の辞書が必要となり実用的
でない。又、新しい単語が造られた場合には、それに対
応することが出来ない。そこで、例外語用の辞書には単
語の基本形(語幹)だけを持ち、単語つづりを接尾辞や
接頭辞等の接辞と語幹とに分離した後側外語辞書の検索
を行う様にすることにより、例外語辞書の記憶容量を低
減化すると共に、多種多用な例外語が検索出来る様にし
ている。
If a dictionary were to contain all the derivative forms of words with such exceptional pronunciation, it would be impractical because it would require a dictionary with an enormous storage capacity. Also, when new words are created, it is not possible to respond to them. Therefore, by having only the basic form (word stem) of the word in the dictionary for exception words, and searching the back foreign word dictionary that separates the word spelling into affixes such as suffixes and prefixes and the word stem, The storage capacity of the exception word dictionary is reduced, and a wide variety of exception words can be searched.

又、同じ単語でもアクセントの位置によって発音が変化
する場合がある。例えば、英語のつづりrxJは後の母
音にアクセントがある場合は〔g2〕と発音されるが、
その他の場合には(ks)と発音される。従って、単語
つづりを発音記号に変換する場合には、その単語つづり
のアクセント位置を決め、所定の発音ルールに従って単
語つづりを発音記号に変換することが必要である。
Furthermore, the pronunciation of the same word may change depending on the position of the accent. For example, the English spelling rxJ is pronounced as [g2] when the last vowel is accented.
In other cases, it is pronounced (ks). Therefore, when converting a word spelling into a phonetic symbol, it is necessary to determine the accent position of the word spelling and convert the word spelling into a phonetic symbol according to a predetermined pronunciation rule.

そこで、単語つづりを発音記号に変換する場合は、規則
的な変換ルールによる変換処理と例外語処理を組み合わ
せることにより単語つづり一発音記号変換処理を効率良
く行う様にしている。
Therefore, when converting a word spelling into a phonetic symbol, the conversion process based on regular conversion rules and exceptional word processing are combined to efficiently perform the word spelling one phonetic symbol conversion process.

〔従来の技術〕[Conventional technology]

第4図は、従来の単語つづり一発音記号変換方式の構成
をブロック図で示したものである。
FIG. 4 is a block diagram showing the configuration of a conventional word spelling and phonetic symbol conversion method.

第4図において、30は例外語処理手段で、例外的な発
音をする単語の処理を行う。この例外語処理手段30に
おいて31は例外語辞書で、例外的な発音をする単語の
つづりとその発音記号のつづり又は例外的なアクセント
が付加される単語のつづりとそのつづりにアクセントを
付加したつづりとが組になって格納されている。
In FIG. 4, reference numeral 30 denotes an exceptional word processing means, which processes words with exceptional pronunciation. In this exceptional word processing means 30, 31 is an exceptional word dictionary, which records the spelling of a word with an exceptional pronunciation and its phonetic symbol, or the spelling of a word to which an exceptional accent is added and the spelling with an accent added to that spelling. are stored in pairs.

32は接尾辞分離ルール辞書で、単語の語幹から接尾辞
を分離するための接尾辞分離ルールが格納されている。
A suffix separation rule dictionary 32 stores suffix separation rules for separating suffixes from word stems.

33は接頭辞分離ルール辞書で、単語の語幹から接頭辞
を分離するための接頭辞分離ルールが格納されている。
A prefix separation rule dictionary 33 stores prefix separation rules for separating prefixes from word stems.

34は第1例外語辞書検索部で、入力された単語つづり
が例外語辞書31中に存在するか検索する処理を行う。
Reference numeral 34 denotes a first exception word dictionary search unit, which performs processing to search whether the input word spelling exists in the exception word dictionary 31.

35は接尾辞分離処理部で、接尾辞分離ルール辞書32
を参照し、各接尾辞の分離ルールを適用して単語の語幹
に付加されている各接尾辞を語幹から分離する処理を行
う。
35 is a suffix separation processing unit, which includes a suffix separation rule dictionary 32;
With reference to , each suffix separation rule is applied to separate each suffix added to the word stem from the word stem.

36は第2例外語辞書検索部で、接尾辞の分離された語
幹が例外語辞書31中に存在するか検索する処理を行う
Reference numeral 36 denotes a second exceptional word dictionary search unit, which performs processing to search whether a word stem from which a suffix has been separated exists in the exceptional word dictionary 31.

37は接頭辞分離処理部で、接頭辞分離ルール辞書33
を参照し、各接頭辞の分離ルールを適用して単語の語幹
に付加されている各接頭辞を語幹から分離する処理を行
う。
37 is a prefix separation processing unit, which includes a prefix separation rule dictionary 33;
, and performs processing to separate each prefix added to the word stem from the word stem by applying the separation rules for each prefix.

38は第3例外語辞書検索部で、接頭辞の分離された語
幹が例外語辞書31中に存在するか検索する処理を行う
Reference numeral 38 denotes a third exceptional word dictionary search unit, which performs processing to search whether a word stem from which a prefix has been separated exists in the exceptional word dictionary 31.

41はアクセント位置推定ルール辞書で、単語つづりに
アクセントを付加するためのルールが格納されている。
Reference numeral 41 is an accent position estimation rule dictionary, which stores rules for adding an accent to the spelling of words.

42はアクセント位置推定部で、アクセント位置推定ル
ール辞書41を参照し、入力された単語つづり、又は未
変換の接辞つづりと発音記号の結合したつづりに対する
アクセント位置を推定する処理を行う。
Reference numeral 42 denotes an accent position estimating unit that refers to the accent position estimation rule dictionary 41 and performs a process of estimating the accent position for the input word spelling or the spelling that is a combination of an unconverted affix spelling and a phonetic symbol.

43は発音ルール辞書で、アクセントの付加されたつづ
りを発音記号へ変換するためのルールが格納されている
A pronunciation rule dictionary 43 stores rules for converting accented spellings into phonetic symbols.

44はつづり一発音記号変換部で、発音ルール辞書43
を参照し、入力されたアクセント付きつづり又はつづり
と発音記号の組合せにアクセントの付加された文字列を
発音記号に変換する処理を行う。
44 is a spelling and phonetic symbol converter, and a pronunciation rule dictionary 43
With reference to , processing is performed to convert the input accented spelling or a combination of spelling and phonetic symbols into a character string with an accent added to the phonetic symbols.

次に、第4図の単語−発音記号処理動作について説明す
る。
Next, the word-phonetic symbol processing operation shown in FIG. 4 will be explained.

文章から読み取られた単語つづりのデータが例外語処理
手段30に入力されると、第1例外語辞書検索部34は
、例外語辞書31中に入力単語のつづりが存在するか検
索する。例外語辞四31中に存在し且つ発音記号と組に
なったものである場合は、その発音記号を出力して例外
語処理を終了する。アクセント付きつづりと組となった
ものである場合は、そのアクセント付きつづりをつづり
一発音記号変換部44に入力する。
When word spelling data read from a sentence is input to the exception word processing means 30, the first exception word dictionary search unit 34 searches the exception word dictionary 31 to see if the spelling of the input word exists. If the word exists in the exception word dictionary 431 and is paired with a phonetic symbol, the phonetic symbol is output and the exceptional word processing ends. If the spelling is paired with an accented spelling, the accented spelling is input to the spelling-one-phonetic-symbol converter 44.

例外語辞書31中に存在しない場合、即ち検索に失敗し
た場合は、単語つづりを接尾辞分離処理部35に入力す
る。
If the word does not exist in the exception word dictionary 31, that is, if the search fails, the spelling of the word is input to the suffix separation processing unit 35.

接尾辞分離処理部35は、接尾辞分離ルール辞書32を
参照し、各接尾辞の分離ルールを適用して単語の語幹に
付加されている各接尾辞を語幹から分離する処理を行う
。語幹に複数の接尾辞が付加されている場合は、各接尾
辞の分離ルールを順次適用することにより付加されてい
る各接尾辞がすべて分離される。
The suffix separation processing unit 35 refers to the suffix separation rule dictionary 32, applies separation rules for each suffix, and performs processing to separate each suffix added to the word stem from the word stem. When multiple suffixes are added to a word stem, all the added suffixes are separated by sequentially applying the separation rules for each suffix.

第2例外語辞書検索部36は、接尾辞の分離された語幹
が例外語辞書31中に存在するか検索する処理を行う。
The second exception word dictionary search unit 36 performs processing to search whether the word stem from which the suffix has been separated exists in the exception word dictionary 31.

例外語辞書31中に存在する場合はその語幹の発音記号
が読み出され、分離された接尾辞と組み合わされた文字
列として出力される。
If the word exists in the exception word dictionary 31, the phonetic symbol of the word stem is read out and output as a character string combined with the separated suffix.

この文字列出力は発音記号(語幹部分)と未変換のつづ
り(接尾辞部分)で構成されておりアクセント位置が未
決定であるので、アクセント位置を決めるためにアクセ
ント位置推定部42に送られる。
This character string output is composed of phonetic symbols (stem part) and unconverted spelling (suffix part), and since the accent position has not been determined, it is sent to the accent position estimating unit 42 to determine the accent position.

例外語辞書31中に存在しない場合、即ち検索に失敗し
た場合は、語幹と接尾辞の組み合わされた文字列を接頭
辞分離処理部37に入力する。
If the word does not exist in the exception word dictionary 31, that is, if the search fails, a character string consisting of a word stem and a suffix is input to the prefix separation processing unit 37.

接頭辞分離処理部37は、接頭辞分離ルール辞書33を
参照し、各接頭辞の分離ルールを適用して単語の語幹に
付加されている各接頭辞を語幹から分離する処理を行う
。語幹に複数の接頭辞が付加されている場合は、各接頭
辞の分離ルールを順次適用することにより付加されてい
る各接頭辞がすべて分離される。
The prefix separation processing unit 37 refers to the prefix separation rule dictionary 33, applies separation rules for each prefix, and performs processing to separate each prefix added to the word stem from the word stem. If multiple prefixes are added to a word stem, all the added prefixes are separated by sequentially applying the separation rules for each prefix.

第3例外語辞書検索部38は、接頭辞の分離された語幹
が例外語辞書31中に存在するか検索する処理を行う。
The third exception word dictionary search unit 38 performs processing to search whether the word stem from which the prefix has been separated exists in the exception word dictionary 31.

例外語辞書31中に存在する場合はその語幹の発音記号
が読み出され、分離された接頭辞及び接尾辞と結合され
た文字列として出力される。この文字列出力は発音記号
(語幹部分)と未変換のつづり(接頭辞及び接尾辞部分
)で構成されておりアクセント位置が未決定であるので
、アクセント位置を決めるためにアクセント位置推定部
42に送られる。
If it exists in the exceptional word dictionary 31, the phonetic symbol of the stem is read out and output as a character string combined with the separated prefix and suffix. This character string output consists of phonetic symbols (stem part) and unconverted spellings (prefix and suffix parts), and the accent position has not been determined. Therefore, in order to determine the accent position, the accent position estimation unit 42 Sent.

例外語辞書31中に存在しないとき、即ち検索に失敗し
た場合は、入力された単語つづりが規則的な変換ルール
に従って発音記号に変換される単語つづりであって、例
外語でないケースである。
If the word does not exist in the exception word dictionary 31, that is, if the search fails, this is a case in which the input word spelling is a word spelling that is converted into phonetic symbols according to regular conversion rules and is not an exception word.

この場合も、単位つづりのアクセント位置を決めるため
にアクセント位置推定部42に入力される。
In this case as well, the information is input to the accent position estimation unit 42 in order to determine the accent position of the unit spelling.

アクセント位置推定部42は、第2及び第3例外語辞書
検索部36及び38から入力された接辞つづりと発音記
号の結合された文字列並びに第3例外語辞書検索部24
5から入力され単語つづりに対し、アクセント位置推定
ルール辞書41を参照してそれぞれアクセント位置を推
定する処理を行って、つづり一発音記号変換部44に送
る。
The accent position estimating unit 42 uses the character strings in which the affix spelling and phonetic symbol are combined, which are input from the second and third exceptional word dictionary searching units 36 and 38, and the third exceptional word dictionary searching unit 24.
For the word spellings input from 5, the accent position is estimated by referring to the accent position estimation rule dictionary 41, and the processed words are sent to the spelling and phonetic symbol conversion section 44.

つづり一発音記号変換部44は、発音ルール辞書43を
参照し、入力されたアクセント付きつづり又はつづりと
発音記号が結合され更にアクセント情報の付加された文
字列を発音記号に変換する処理を行う。
The spelling/phonetic symbol conversion unit 44 refers to the pronunciation rule dictionary 43, and performs a process of converting the input accented spelling or the character string in which the spelling and the phonetic symbol are combined and accent information is added into the phonetic symbol.

以上の様にして、入力単語つづりが例外語である場合及
び規則的な変換ルールに従って発音記号に変換される場
合も含めて、単語つづりを発音記号に変換することが出
来る。
In the manner described above, the spelling of a word can be converted into a phonetic symbol, including cases where the input word spelling is an exception word and cases where the spelling of the input word is converted into a phonetic symbol according to regular conversion rules.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

一つの単語に接続する接辞の数は、一般に多い数ではな
い。例えば英語の単語の場合は、接頭辞で0〜3個、接
尾辞で0〜4個である。従って、多くの接辞分離ルール
の中でその単語に適用できるものは、多くてもフルール
程度である。
Generally, the number of affixes connected to one word is not large. For example, in the case of English words, there are 0 to 3 prefixes and 0 to 4 suffixes. Therefore, among the many affix separation rules, the only one that can be applied to that word is Fleur.

然し、どのルールが適用できるかは分からないので、接
尾辞及び接頭辞の各分離ルール辞書中のすべてのルール
についてその適用の可能性を調べる必要がある。例えば
、辞書の先頭にある分離ルールだけが適用可能でありそ
の他のルールは適用の可能性がない場合でも、辞書中の
ルールすべてについてその適用の可能性が調べられる。
However, since it is not known which rules can be applied, it is necessary to check the applicability of all rules in the suffix and prefix separation rule dictionaries. For example, even if only the separation rule at the beginning of the dictionary is applicable and the other rules have no applicability, all rules in the dictionary are checked for applicability.

このため、従来の単語つづり一発音記号変換方式では、
無駄な検索が多(なって例外語処理が効率良く行われな
いという問題があった。
For this reason, in the conventional word spelling-one-phonetic symbol conversion method,
There was a problem that there were a lot of useless searches (and the exception word processing was not performed efficiently).

更に、ある接辞が接続した場合だけ例外的な発音となる
単語がある場合は、接辞分離処理の後にその語幹につい
て例外語辞書の検索を行うと、接辞が分離された語幹は
例外語でなくなるため辞書検索に失敗するという問題が
あった。
Furthermore, if there is a word that has an exceptional pronunciation only when a certain affix is connected, if you search the exception word dictionary for the stem after affix separation processing, the stem from which the affix has been separated will no longer be an exception word. There was a problem in which dictionary searches failed.

本発明は、接辞分離ルールによってつづりから一つの接
尾辞が分離される毎に、その接続の分離された語幹が例
外語処理部に存在するか検索することにより、例外語処
理を高速化すると共に、余分に接辞を分離して例外語辞
書検索に失敗することを防止して単語つづり一発音記号
変換が誤りなく行える様に改良した単語つづり一発音記
号変換方弐を提供することを目的とする。
Each time a suffix is separated from a spelling by the affix separation rule, the present invention searches for the existence of the separated word stem of that connection in the exception word processing unit, thereby speeding up exceptional word processing. The purpose of this invention is to provide an improved method for converting word spelling and phonetic symbol 2, which is improved so that the word spelling and phonetic symbol conversion can be performed without errors by preventing the failure of exceptional word dictionary searches due to the separation of extra affixes. .

〔問題点を解決するための手段〕[Means for solving problems]

本発明の講じた手段を、第1図を参照して説明する。第
1図は、本発明の基本構成をブロック図で示したもので
ある。
The measures taken by the present invention will be explained with reference to FIG. FIG. 1 is a block diagram showing the basic configuration of the present invention.

第1図において、10は例外的な発音をする単語の処理
を行う例外語処理手段で、内部に接辞分離処理部11及
び例外語処理部12を備えている。
In FIG. 1, reference numeral 10 denotes an exceptional word processing means for processing words with exceptional pronunciation, which includes an affix separation processing section 11 and an exceptional word processing section 12.

接辞分離処理部11は、所定の接辞分離ルールに従って
単語又は語幹つづりより接辞を個別に分離する処理を行
う。
The affix separation processing unit 11 performs a process of individually separating affixes from words or stem spellings according to predetermined affix separation rules.

例外語処理部12は、単語又は語幹のつづりから一つの
接辞が分離される毎に、接辞を分離された語幹部分が例
外語に該当するか否かを検索する処理を行う。
Every time an affix is separated from the spelling of a word or a word stem, the exception word processing unit 12 performs a process of searching whether or not the stem part from which the affix has been separated corresponds to an exception word.

〔作 用〕[For production]

単語つづりが例外語処理手段10に入力されると、接辞
分離処理部11は、所定の接辞分離ルールに従って単語
つづりより一つの接辞を分離する処理を行う。
When the word spelling is input to the exception word processing means 10, the affix separation processing section 11 performs a process of separating one affix from the word spelling according to a predetermined affix separation rule.

例外語処理部12は、一つの接辞が分離された単語つづ
りの語幹部分についてそれが例外語に該当するかを検索
する。例外語に該当する検索結果が得られたときは例外
語処理を終了する。検索に失敗した場合は、接辞分離処
理部11に通知して次の接辞分離処理を行わせる。
The exception word processing unit 12 searches the stem part of a spelled word from which one affix has been separated to see if it corresponds to an exception word. When a search result corresponding to the exception word is obtained, the exception word processing is terminated. If the search fails, the affix separation processing unit 11 is notified and causes the next affix separation process to be performed.

以下同様にして、例外語処理部12は、接辞分離処理部
11によって語幹から一つの接辞が分離される毎に接辞
の分離された語幹部分が例外語に該当するかを検索する
処理を行い、語幹部分が例外語に該当することが検索さ
れた場合は直ちに例外語を終了し、例外語に該当しない
場合にのみ接辞分離処理部11に次の接辞の分離処理を
行わせる様にする。
In the same way, the exception word processing unit 12 performs processing to search whether the stem part from which the affix has been separated corresponds to an exception word each time one affix is separated from the word stem by the affix separation processing unit 11. When it is found that the word stem part corresponds to an exceptional word, the exceptional word is immediately terminated, and only when it does not correspond to an exceptional word, the affix separation processing unit 11 is made to perform the next affix separation process.

以上の様にすることにより、従来方式の様にすべての接
辞分離ルールの適用の可能性を調べるという無駄が省か
れ、例外語処理を高速化することが出来る。又、接辞を
一つ分離する毎に例外語に該当するかを検索する処理が
行われるので、余分に接辞を分離して例外語検索に失敗
することが防止され、単語つづり一発音記号変換処理を
誤りなく行うことが出来る。
By doing the above, it is possible to eliminate the waste of checking the applicability of all affix separation rules as in the conventional method, and to speed up exceptional word processing. In addition, each time an affix is separated, a search process is performed to see if it corresponds to an exceptional word, so it is possible to prevent an extra affix from separating and failing to search for an exception word, and the word spelling and phonetic symbol conversion process is performed. can be performed without error.

〔実施例〕〔Example〕

本発明の実施例を、第2図及び第3図を参照して説明す
る。第2図は本発明の一実施例の構成のブロック説明図
、第3図は同実施例による単語つづり一発音記号変換処
理の具体例の説明図である。
An embodiment of the present invention will be described with reference to FIGS. 2 and 3. FIG. 2 is a block diagram illustrating the configuration of an embodiment of the present invention, and FIG. 3 is a diagram illustrating a specific example of word spelling and phonetic symbol conversion processing according to the embodiment.

(A)実施例の構成 第2図において、例外語処理手段10、接辞分離処理部
IL例外語処理部12については、第1図で説明した通
りである。
(A) Structure of Embodiment In FIG. 2, the exception word processing means 10 and the affix separation processing unit IL exception word processing section 12 are as described in FIG.

接辞分離処理部11において、111は接辞分離ルール
辞書で、単語又は語幹から接辞を分離するための接辞分
離ルールが格納されている。
In the affix separation processing unit 11, an affix separation rule dictionary 111 stores affix separation rules for separating affixes from words or word stems.

112は接辞分離ルール読込部で、接辞分離ルール辞書
111より所定の順番で接辞分離ルールを個別に読み込
む処理を行う。各種の接尾辞及び接頭辞は配列の順番が
それぞれ決まっているので、接尾辞の場合はその最末尾
の接尾辞の分離ルールから読み込まれる。接頭辞の場合
はその最先頭の接頭辞の分離から読み込まれる。
Reference numeral 112 denotes an affix separation rule reading unit that performs a process of individually reading affix separation rules from the affix separation rule dictionary 111 in a predetermined order. Since the order of arrangement of various suffixes and prefixes is determined, the suffixes are read from the separation rule of the last suffix. If it is a prefix, it is read from the first prefix separation.

113はルール終了判定部で、接辞分離ルール辞書11
1中のすべての接辞分離ルールの読み込みが終了したか
を判定する。
Reference numeral 113 denotes a rule end determination unit, which includes an affix separation rule dictionary 11
It is determined whether reading of all affix separation rules in 1 has been completed.

114はルール適用判定部で、読み込んだ接辞分離ルー
ルが入力単語又は語幹へ適用可能であるか判定する処理
を行う。
A rule application determination unit 114 performs processing to determine whether the read affix separation rule is applicable to the input word or word stem.

°115は接辞分離処理部で、接辞分離ルールが適用可
能である場合に入力単語又は語幹に適用して、接辞の分
離処理を行う。
An affix separation processing unit 115 applies an affix separation rule to the input word or word stem when applicable, and performs affix separation processing.

例外語処理部12において、121は例外語辞凹で、例
外的な発音をする単語のつづりとその発音記号のつづり
又は例外的なアクセントが付加される単語のつづりとそ
のつづりにアクセントを付加したつづりとが組になって
格納されている。
In the exceptional word processing unit 12, 121 is an exceptional word dictionary, in which the spelling of a word with an exceptional pronunciation and the spelling of its phonetic symbol, or the spelling of a word to which an exceptional accent is added, and an accent added to the spelling. The spelling is stored in pairs.

122は第2例外語辞書検索部で、入力された単語又は
語幹のつづりが例外語辞書121中に存在するか検索す
る処理を行う。
Reference numeral 122 denotes a second exceptional word dictionary search unit that performs processing to search whether the spelling of the input word or word stem exists in the exceptional word dictionary 121.

13は第1例外語辞書検索部で、入力された単語のつづ
りが例外語辞書121中に存在する処理を行う。
Reference numeral 13 denotes a first exception word dictionary search unit, which performs processing to determine whether the spelling of the input word exists in the exception word dictionary 121.

21はアクセント位置推定ルール辞書で、単語つづりに
アクセントを付加するためのルールが格納される。
Reference numeral 21 is an accent position estimation rule dictionary, which stores rules for adding an accent to the spelling of words.

22はアクセント位置推定部で、アクセント位置推定ル
ール辞書21を参照し、入力された単語つづり、又は未
変換の接辞つづりと発音記号の結合したつづりに対する
アクセントを推定する処理を行う。
Reference numeral 22 denotes an accent position estimating unit that refers to the accent position estimation rule dictionary 21 and performs a process of estimating an accent for an input word spelling or a spelling that is a combination of an unconverted affix spelling and a phonetic symbol.

23は発音ルール辞書で、アクセントの付加されたつづ
りを発音記号に変換するためのルールが格納されている
A pronunciation rule dictionary 23 stores rules for converting accented spellings into phonetic symbols.

24はつづり一発音記号変換部で、発音ルール辞書23
を参照し、入力されたアクセント情報付きのつづりを発
音記号に変換する処理を行う。
24 is a spelling and phonetic symbol converter, and a pronunciation rule dictionary 23
, and converts the input spelling with accent information into phonetic symbols.

(B)実施例の動作 文章から読み取られた単語つづりが例外語処理手段10
に入力されると、第1例外語辞書検索部13は、入力語
つづり全体が例外的な発音又はアクセントとなるかどう
かを、例外語辞書121を検索することによって調べる
。辞書の検索は、例えばハツシュ(I(ash)関数を
用いて行われる。
(B) The spelling of the word read from the action sentence of the example is the exception word processing means 10
, the first exceptional word dictionary search unit 13 searches the exceptional word dictionary 121 to determine whether the entire spelling of the input word has an exceptional pronunciation or accent. The dictionary search is performed using, for example, a hash (I(ash)) function.

例外語辞書121中に単語つづりが存在している場合は
、組になっている方の文字列と入力単語つづりと置換し
て例外語処理を終える。この場合、出力される文字列は
発音記号(以下■で示す)又はアクセント情報付きつづ
り(以下■で示す)である。発音記号■の場合はそのま
ま出力され、アクセント情報付きつづり■の場合はつづ
り一発音記号変換部24に入力される。
If the word spelling exists in the exception word dictionary 121, the character string of the pair is replaced with the input word spelling, and the exception word processing ends. In this case, the output character string is a phonetic symbol (hereinafter indicated by ■) or a spelling with accent information (hereinafter indicated by ■). In the case of the phonetic symbol ■, it is output as is, and in the case of the spelling ■ with accent information, it is input to the spelling-one-phonetic symbol converter 24.

単語つづりが例外語辞書121中に存在しない場合は検
索は失敗し、そのことが接辞分離ルール読込部112に
通知される。
If the spelling of the word does not exist in the exception word dictionary 121, the search fails, and the affix separation rule reading unit 112 is notified of this fact.

接辞分離ルール読込部112は、第1例外語辞書検索部
13より検索失敗の通知を受けると、接辞分離ルール辞
書111より予め決められた順番に従って最初の接辞分
離ルールの読み込みを行って、ルール終了判定部113
に送る。
When the affix separation rule reading unit 112 receives a notification of search failure from the first exception word dictionary search unit 13, it reads the first affix separation rule from the affix separation rule dictionary 111 in a predetermined order, and ends the rule. Determination unit 113
send to

ルール終了判定部113は、入力された接辞分離ルール
から接辞分離ルール辞書111中のすべての接辞分離ル
ールの読み込みが終了したかを判定する。すべての接辞
分離ルールの読み込みが終了した場合は、以下の説明か
ら明らかとなる様に入力単語が例外語でない場合である
ので、例外語処理を終了して入力単語つづり(以下◎で
示す)をアクセント位置推定部22に送る。
The rule end determination unit 113 determines whether all affix separation rules in the affix separation rule dictionary 111 have been read from the input affix separation rules. If all affix separation rules have been read, the input word is not an exception word, as will be clear from the explanation below, so the exception word processing is finished and the input word spelling (indicated by ◎ below) is determined. It is sent to the accent position estimating section 22.

すべての接辞分離ルールの読み込みが終了していない場
合は、読み込んだ接辞分離ルールはルール適用判定部1
14に送られ、入力単語つづりへ適用可能であるか判定
される。入力単語つづりへの適用が可能でない場合は、
その旨が接辞分離ルール読込部112に通知される。
If all the affix separation rules have not been read, the read affix separation rules are stored in the rule application determination unit 1.
14 to determine whether it is applicable to the input word spelling. If it is not possible to apply to the input word spelling,
The affix separation rule reading unit 112 is notified of this fact.

接続分離ルール読込部112は、この通知を受けると接
辞分離ルール辞書111より次の接辞分離ルールを読み
出し、ルール終了判定部113及びルール適用判定部1
14とともに前述の各処理を行う。
When the connection separation rule reading unit 112 receives this notification, it reads the next affix separation rule from the affix separation rule dictionary 111, and then the connection separation rule reading unit 112 reads out the next affix separation rule from the affix separation rule dictionary 111, and the rule end judgment unit 113 and the rule application judgment unit 1
14 and performs each of the above-mentioned processes.

ルール適用判定部114において、接辞分離ルールが入
力単語つづりに適用可能と判定した場合は、接辞分離処
理部115にその接辞分離ルールと入力単語つづりを送
り、接辞分離処理を行わせる。
When the rule application determining unit 114 determines that the affix separation rule is applicable to the spelling of the input word, the affix separation rule and the spelling of the input word are sent to the affix separation processing unit 115 to perform affix separation processing.

接辞分離処理部115は、入力された接辞分離ルールに
従って単語つづりに対し接辞分離処理を施し、第2例外
語辞書検索部122に送る。
The affix separation processing section 115 performs affix separation processing on the word spelling according to the input affix separation rule, and sends it to the second exception word dictionary search section 122 .

第2例外語辞書検索部122は、生成された語幹部分が
例外語辞書121中に存在するか検索する。検索に失敗
した場合即ち生成された語幹つづりが例外語辞書121
中に存在しない場合は、接辞分離ルール読込部112に
通知する。
The second exception word dictionary search unit 122 searches whether the generated word stem portion exists in the exception word dictionary 121. If the search fails, that is, the generated stem spelling is the exception word dictionary 121.
If the affix separation rule does not exist, the affix separation rule reading unit 112 is notified.

接辞分離ルール読込部112は、この通知を受けると接
辞分離ルール辞書111より次の接辞分離ルールを読み
込んで、前述の各処理を繰り返す。
Upon receiving this notification, the affix separation rule reading unit 112 reads the next affix separation rule from the affix separation rule dictionary 111, and repeats each of the above-described processes.

検索に成功した場合即ち生成された語幹つづりが例外語
辞書121中に存在した場合は、組になっている方の文
字列と語幹部分のつづりを置換して例外語処理を終える
。この場合は、出力される文字列には語幹部分の発音記
号に未変換の接辞つづり(以下、つづり十発音記号@で
示す)が含まれており、これらのアクセント位置を決定
する必要があるので、アクセント位置推定部22に送ら
れる。
If the search is successful, that is, if the generated stem spelling exists in the exceptional word dictionary 121, the spelling of the word stem is replaced with the character string of the pair, and the exceptional word processing is completed. In this case, the output character string contains unconverted affix spellings (hereinafter indicated by the ten phonetic symbol @) in the phonetic symbol of the root part, and it is necessary to determine the accent position of these. , is sent to the accent position estimation section 22.

以下、第3図を参照し、単語つづりr improνm
ents Jをその発音記号(impru  ニジme
n ts )に変換する場合を例にとって説明する。
Below, with reference to Figure 3, the word spelling r improνm
ents J with its phonetic symbol (impru niji me)
The case of converting to (nts) will be explained as an example.

単語つづりr improνments Jにおいて、
r imJは接頭辞であり、rmentJ及び語尾のr
sJは接尾辞であり、r prove Jが本来の語幹
である。「prove JはroJの発音が〔U:〕と
なる例外的な単語であり、このr prove Jだけ
が例外語辞書121に格納されている。
In the word spelling r improvements J,
r imJ is a prefix, rmentJ and the ending r
sJ is a suffix, and r prove J is the original root. “prove J is an exceptional word in which the pronunciation of roJ is [U:], and only this r prove J is stored in the exceptional word dictionary 121.

文章から読み取られた単語つづりr improvme
ntS」が例外語処理手段10に入力されると、第1例
外語辞書検索部13は、入力語つづりr improv
ments J全体が例外的な発音又はアクセントとな
るかどうかを、例外語辞書121を検索することによっ
て調べる。rimprovments Jは例外語辞凹
121中に存在しないので検索は失敗し、そのことが接
辞分離ルール読込部112に通知される。
Spelling of words read from sentences r improvme
ntS" is input to the exception word processing means 10, the first exception word dictionary search unit 13 searches the input word spelling r improv.
ments J as a whole is checked by searching the exceptional word dictionary 121 to see if it has an exceptional pronunciation or accent. Since rimprovments J does not exist in the exception word recess 121, the search fails, and the affix separation rule reading unit 112 is notified of this fact.

入力単語つづりrimprovments Jにおいて
は、接尾辞rsJ、rmentJ及び接頭辞rimJに
対する接辞分離ルールが適用可能である。
In the input word spelling rimprovments J, the affix separation rules for the suffixes rsJ, rmentJ and the prefix rimJ are applicable.

最初に末尾の接尾辞rsJに対する接辞分離ルール■、
例えば第3図(blに示す“φ瞬* / C(CC)3
*”が適用される。第3図の各接辞分離ルールにおいて
、■は母音字、Cは子音字、両端の*は語尾又は語頭を
示す。第3図(blに示す接辞分離ルール■は、1〜3
個の子音字に続いてその後にrsJがあるならば、rs
JO前に接辞分離記号*を挿入するというルールである
First, the affix separation rule for the final suffix rsJ,
For example, “φ instant * / C (CC) 3 shown in Figure 3 (bl)
*" is applied. In each affix separation rule in Figure 3, ■ is a vowel, C is a consonant, and * at both ends indicates the ending or beginning of a word. The affix separation rule ■ shown in Figure 3 (bl) is 1-3
If there are four consonants followed by rsJ, then rs
The rule is to insert an affix separator * before JO.

この接辞分離ルールのを適用することにより末尾の接尾
辞rsJが分離され、第3図(C1に示す様に” * 
improvment * 、s * ”が生成される
By applying this affix separation rule, the final suffix rsJ is separated, as shown in Figure 3 (C1).
improvement*, s*'' are generated.

生成された文字列中の*で囲まれた語幹部分[impr
ovments Jが例外語辞書121中に存在しない
ので、第2例外語辞書検索部122は検索に失敗し、接
辞分離ルール読込部112に通知して次の接辞分離ルー
ルの読込みを行わせる。
The stem part surrounded by * in the generated character string [impr
Since ovments J does not exist in the exception word dictionary 121, the second exception word dictionary search unit 122 fails in the search and notifies the affix separation rule reading unit 112 to read the next affix separation rule.

次に適用可能なルールは、接尾辞r men t Jを
分離する接辞分離ルール■で、例えば第3図(dlに示
す様に“φ→e *、 /VC(CC)   ment
 *”で表わされる。この接辞分離ルール■は、“母音
字+1〜2個の子音字+ment*”ならば“men 
t”の前にeと*、を挿入するというルールである。
The next applicable rule is the affix separation rule ■ that separates the suffix r ment J. For example, as shown in Figure 3 (dl), “φ→e *, /VC(CC) ment
*”.This affix separation rule ■ is “vowel + 1 to 2 consonants + ment*”, then “men
The rule is to insert e and * before t''.

この接辞分離ルール■を通用することにより接尾辞r 
men t Jが分離され、第3図telに示す様に“
* improve*、 ment*、s* ”が生成
される。
By applying this affix separation rule ■, the suffix r
Men t J was separated, and as shown in Figure 3 tel “
*improve*, ment*, s*” are generated.

生成された文字列中の語幹部分子improve Jは
例外語辞書121中に存在しないので、第2例外語辞害
検索部122は検索に失敗し、接辞分離ルール読込部1
12に通知して次の接辞分離ルールの読み込みを行わせ
る。
Since the word stem molecule improve J in the generated character string does not exist in the exception word dictionary 121, the second exception word punctuation search unit 122 fails in the search, and the affix separation rule reading unit 1
12 to read the next affix separation rule.

次に適用可能なルールは、接頭辞r imJを分離する
接辞分離ルール■で、例えば第3図(f)に示す様に“
φ→、*/* im    C(CC) V (V)C
(CC)V”で与えられる。この接辞分離ルール■は、
“*im+1〜3個の子音字+1個〜2個の母音字+1
個〜3個の子音字+母音字”ならば、即ち2音節以上の
文字列の前に“*im”があるならば、“im”の後に
接辞分離記号、*を挿入するというルールである。
The next applicable rule is the affix separation rule ■ which separates the prefix r imJ. For example, as shown in Figure 3(f), “
φ→, */* im C(CC) V (V)C
(CC)V”. This affix separation rule ■ is given by
“*im + 1 to 3 consonants + 1 to 2 vowels + 1
The rule is that if "*im" is in front of a string of two or more syllables, an affix separator * is inserted after "im". .

この接辞分離ルール■を適用することにより接頭辞「i
mjが分離され、第3図(g)に示す様に“*im、 
 *prOVe *、 ment*、s* ”が生成さ
れる。なお、前述の各接辞分離ルールは、例えば特願昭
60−271261号や特願昭61−122009号等
に詳細に開示されている。
By applying this affix separation rule■, the prefix ``i''
mj is separated, and as shown in Figure 3(g), “*im,
*prOVe*, ment*, s*'' are generated. The above-mentioned affix separation rules are disclosed in detail in, for example, Japanese Patent Application No. 60-271261 and Japanese Patent Application No. 61-122009.

生成された文字列中の*で囲まれた語幹部分「prov
e Jは、母音「0」が〔U;〕と例外的な発音をする
ので例外語辞書121中に存在する。
The stem part surrounded by * in the generated character string "prov
e J exists in the exceptional word dictionary 121 because the vowel "0" is pronounced as [U;] in an exceptional manner.

第2例外語辞書検索部122は、r prove Jの
検索に成功すると、第3図(i)に示す様に語幹部分子
prove Jを例外語辞書121より読み取った発音
記号(pru:v)に置換する。
When the second exceptional word dictionary search unit 122 succeeds in searching for r prove J, the second exceptional word dictionary search unit 122 converts the word stem molecule prove J into the phonetic symbol (pru:v) read from the exceptional word dictionary 121, as shown in FIG. 3(i). Replace.

この様にして生成された“*im、  * (p ru
 :V) *、 ment*、s*”は未変換の各接辞
つづりと発音記号が結合したものであってアクセントが
未決定であるので、つづり十発音記号■としてアクセン
ト位置推定部22に送られる。
“*im, *(p ru
:V) *, ment*, s*” are combinations of unconverted affix spellings and phonetic symbols, and the accents are undetermined, so they are sent to the accent position estimating unit 22 as spelling ten phonetic symbols ■. .

アクセント位置推定部22は、ルール終了判定部113
より入力された単語つづり◎又は第2例外辞書検索部1
22より入力されたつづり十発音記号■に対し、アクセ
ント位置推定ルール辞書21より読み出されたルールに
従ってアクセント情報を付加する処理を行って、つづり
一発音記号変換部24に送る。
The accent position estimating unit 22 is connected to the rule end determining unit 113.
Word spelling input from ◎ or second exception dictionary search section 1
For the spelling ten phonetic symbols ■ input from 22, accent information is added according to the rules read from the accent position estimation rule dictionary 21, and the result is sent to the spelling one phonetic symbol conversion section 24.

つづり一発音記号変換部24は、発音ルール辞書23を
参照して、アクセント位置推定部22又は第1例外語辞
書検索部13より入力されたアクセント情報付きつづり
■を発音記号に変換する処理を行う。
The spelling 1 phonetic symbol conversion unit 24 refers to the pronunciation rule dictionary 23 and performs a process of converting the spelling with accent information inputted from the accent position estimation unit 22 or the first exception word dictionary search unit 13 into a phonetic symbol. .

以上の様にして、入力単語つづりを、対応する発音記号
に変換することが出来る。
In the manner described above, the spelling of an input word can be converted into the corresponding phonetic symbol.

次に、本発明の単語つづり一発音記号変換方式と、第4
図に示した従来方式との例外語処理効率 (について説
明する。
Next, the word spelling-phonetic symbol conversion method of the present invention and the fourth
The exception word processing efficiency compared to the conventional method shown in the figure will be explained.

入力単語の種類は、(al接辞が接続しない例外語、(
bl接辞が接続した例外語、(C)接辞が接続しない規
則的な単語、(dl接辞が接続した規則的な単語の4種
類が考えられる。それぞれ単語について、例外語処理に
必要な時間を、従来方式の場合を、Ta1 、Tbl 
、Tcl 、Tdl、本発明の方式の場合を、Ta2.
Tb2.Tc2.Ta2とする。
The types of input words are (exceptional words in which the al affix is not connected, (
There are four possible types of words: exceptional words connected with the bl affix, (C) regular words not connected with the affix, and regular words connected with the dl affix.For each word, the time required for exceptional word processing is In the case of the conventional method, Ta1, Tbl
, Tcl, Tdl, the case of the method of the present invention is Ta2.
Tb2. Tc2. Let it be Ta2.

(i)接辞が接続しない例外語の場合、両方式とも最初
に例外語処理部を設けているので、処理時間は例外語辞
書の検索時間に等しくなり、同じ′辞書、同じ検索方法
を使用する限り、Ta1= 1Ta2となる。
(i) In the case of an exception word with no connected affixes, both methods have an exception word processing section first, so the processing time is equal to the search time of the exception word dictionary, and the same dictionary and the same search method are used. As long as Ta1=1Ta2.

にi)接辞の接続しない規則的な単語の場合、すべての
接辞分離ルールとつづりのマツチングが行われることに
なり、同じ接辞分離ルール辞書、同じマツチングアルゴ
リズムを使用している限り、処理時間は両方式とも等し
くなり、Tc1−Tc2となる。
i) For regular words with no connected affixes, all affix separation rules and spellings will be matched, and as long as the same affix separation rule dictionary and the same matching algorithm are used, the processing time will be Both equations are equal, resulting in Tc1-Tc2.

iii )接辞が接続した規則的な単語の場合、Tdl
=すべてのルールとつづりのマツチングに必要な時間+
側外語辞書検索時間 Td2=すべてのルールとつづりのマツチングに必要な
時間十例外語辞書検索時 間×接辞の個数 となる。しかし、例外語辞書検索を高速のアルゴリズム
を用いれば、前に述べたように、一つの単語に接続する
接辞の数は多くても7個程度であり、例外語辞書検索の
回数も7回程度となるので、TdlとTa2もほぼ等し
いと考えられる。
iii) For regular words connected by affixes, Tdl
= Time required to match all rules and spellings +
Extraneous word dictionary search time Td2 = time required for matching all rules and spellings x extraneous word dictionary search time x number of affixes. However, if a high-speed algorithm is used for exceptional word dictionary searches, as mentioned earlier, the number of affixes connected to one word is at most seven, and the number of exceptional word dictionary searches is about seven times. Therefore, Tdl and Ta2 are considered to be approximately equal.

iv)接辞が接続した例外語の場合、 Tb1=tべてのルールとつづりのマツチングに必要な
時間+側外語辞書検索時間 Tb2=適用可能なルールまでのルールとつづりとのマ
ツチングに必要な時間十 例外語辞書検索時間 となる。入力つづりに適用可能なルールがルール辞書の
最後尾にある場合、Tb1=Tb2となるが、それ以外
の場合は、必ずTbl>Tb2となる。
iv) In the case of an exceptional word with connected affixes, Tb1 = Time required to match all rules and spellings + Extra-lateral language dictionary search time Tb2 = Time required to match spellings with rules up to the applicable rule This is the time required to search the dictionary for ten exceptions. If the rule applicable to the input spelling is at the end of the rule dictionary, Tb1=Tb2, but otherwise Tbl>Tb2.

よって、Ta 1 +Tb 1 +Tc 1 +Td 
1≧Ta 2 +Tb 2+TC2+Td 2となり、
本発明の方式が従来方式よりも例外語処理を高速に行う
ことが出来る。
Therefore, Ta 1 +Tb 1 +Tc 1 +Td
1≧Ta 2 + Tb 2 + TC2 + Td 2,
The method of the present invention can perform exceptional word processing faster than the conventional method.

以上、英語単語つづりを発音記号に変換する実施例につ
いて説明したが、本発明は英語以外の言語の単語つづり
一発音記号変換方式にも適用されるものである。
Although the embodiment of converting the spelling of an English word into a phonetic symbol has been described above, the present invention is also applicable to a word spelling-one-phonetic symbol conversion method for languages other than English.

〔発明の効果〕〔Effect of the invention〕

以上説明した様に、本発明によれば次の諸効果が得られ
る。
As explained above, according to the present invention, the following effects can be obtained.

(イ)接辞が単語又は語幹のつづりから分離される毎に
語幹部分が例外的な発音又はアクセントとなるかが検索
され、検索に成功した場合は直ちに別外部処理が終了す
るので、従来方式よりも例外語処理を高速化することが
出来る。
(b) Every time an affix is separated from a word or the spelling of a word stem, a search is made to see if the stem part has an exceptional pronunciation or accent, and if the search is successful, the separate external processing ends immediately, which is better than the conventional method. can also speed up exceptional word processing.

(ロ)接辞を一つ分離する毎に例外語に該当するかを検
索する処理が行われるので、接辞を余分に分離して例外
語検索に失敗することが防止され、単語つづり一発音記
号変換処理を誤りなく行うことが出来る。
(b) Each time an affix is separated, a search process is performed to see if it corresponds to an exceptional word, so it is possible to prevent an extra affix from separating and failing to search for an exception word, and to convert the spelling of a word into a phonetic symbol. Processing can be performed without error.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の基本構成の説明図、 第2図は本発明の一実施例の構成の説明図、第3図は同
実施例による単語つづり一発音記号変換処理の具体例の
説明図、 第4図は従来の単語つづり一発音記号変換方式の説明図
である。 第1図及び第2図において、 10・・・例外語処理手段、11・・・接辞分離処理部
、12・・・例外語処理部、13・・・第1例外語辞書
検索部、21・・・アクセント位置推定ルール辞書、2
2・・・アクセント位置推定部、23・・・発音ルール
辞書、25・・・つづり一発音記号変換部。
FIG. 1 is an explanatory diagram of the basic configuration of the present invention, FIG. 2 is an explanatory diagram of the configuration of an embodiment of the present invention, and FIG. 3 is an explanatory diagram of a specific example of word spelling and phonetic symbol conversion processing according to the same embodiment. , FIG. 4 is an explanatory diagram of the conventional word spelling-one-phonetic symbol conversion method. 1 and 2, 10... exceptional word processing means, 11... affix separation processing section, 12... exceptional word processing section, 13... first exceptional word dictionary search section, 21.・Accent position estimation rule dictionary, 2
2...Accent position estimation unit, 23...Pronunciation rule dictionary, 25...Spelling and phonetic symbol conversion unit.

Claims (1)

【特許請求の範囲】 例外的な発音をする例外語の単語つづりの処理を行う例
外語処理手段(10)を備え、任意の文章を音声に変換
する場合の単語つづり−発音記号変換方式において、前
記例外語処理手段(10)に、 (a)所定の接辞分離ルールに従って単語又は語幹のつ
づりより接辞を個別に分離する接辞分離処理部(11)
と、 (b)単語又は語幹のつづりから一つの接辞が分離され
る毎に、接辞を分離された語幹部分が例外語に該当する
かを検索する例外語処理部(12)を設けたことを特徴
とする単語つづり−発音記号変換方式。
[Scope of Claims] A word spelling-phonetic symbol conversion method for converting an arbitrary sentence into speech, comprising an exceptional word processing means (10) for processing the word spelling of an exceptional word with an exceptional pronunciation, The exceptional word processing means (10) includes: (a) an affix separation processing unit (11) that individually separates affixes from the spelling of a word or word stem according to a predetermined affix separation rule;
(b) Each time an affix is separated from the spelling of a word or a word stem, an exception word processing unit (12) is provided which searches whether the stem part from which the affix has been separated corresponds to an exception word. Features a word spelling-phonetic symbol conversion method.
JP62018649A 1987-01-30 1987-01-30 Word spelling-phonetic symbol converter Expired - Lifetime JPH0827636B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62018649A JPH0827636B2 (en) 1987-01-30 1987-01-30 Word spelling-phonetic symbol converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62018649A JPH0827636B2 (en) 1987-01-30 1987-01-30 Word spelling-phonetic symbol converter

Publications (2)

Publication Number Publication Date
JPS63187299A true JPS63187299A (en) 1988-08-02
JPH0827636B2 JPH0827636B2 (en) 1996-03-21

Family

ID=11977462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62018649A Expired - Lifetime JPH0827636B2 (en) 1987-01-30 1987-01-30 Word spelling-phonetic symbol converter

Country Status (1)

Country Link
JP (1) JPH0827636B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282289A (en) * 1993-03-26 1994-10-07 A T R Jido Honyaku Denwa Kenkyusho:Kk Two-character idiom accent pattern estimating device
JP2006526160A (en) * 2003-05-19 2006-11-16 株式会社東芝 Vocabulary emphasis prediction

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61122009A (en) * 1984-11-20 1986-06-10 Bridgestone Corp Pneumatic tire

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61122009A (en) * 1984-11-20 1986-06-10 Bridgestone Corp Pneumatic tire

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282289A (en) * 1993-03-26 1994-10-07 A T R Jido Honyaku Denwa Kenkyusho:Kk Two-character idiom accent pattern estimating device
JP2006526160A (en) * 2003-05-19 2006-11-16 株式会社東芝 Vocabulary emphasis prediction
JP4737990B2 (en) * 2003-05-19 2011-08-03 株式会社東芝 Vocabulary stress prediction

Also Published As

Publication number Publication date
JPH0827636B2 (en) 1996-03-21

Similar Documents

Publication Publication Date Title
KR100734741B1 (en) Recognizing words and their parts of speech in one or more natural languages
TW448381B (en) Automatic segmentation of a text
JP3971373B2 (en) Hybrid automatic translation system that mixes rule-based method and translation pattern method
CA1288871C (en) Method for verifying spelling of compound words
JPH01501977A (en) language translation system
US8121829B2 (en) Method and apparatus for constructing translation knowledge
JPH08508346A (en) Text / waveform conversion
JPH0689302A (en) Dictionary memory
KR20080039009A (en) Device and method for correcting both mis-spacing words and mis-spelled words using n-gram
KR100509917B1 (en) Apparatus and method for checking word by using word n-gram model
Subhagya et al. Data driven approach to sinhala spellchecker and correction
Kaur et al. Spell checker for Punjabi language using deep neural network
JPS63187299A (en) Word spelling-pronunciation sign conversion system
Mercer et al. A method for efficient storage and rapid application of context-sensitive phonological rules for automatic speech recognition
Hurskainen et al. Computational description of verbs in disjoining writing systems
Tsalidis et al. An electronic dictionary as a basis for NLP tools: The Greek case
Akshatha et al. Kannada Spell Checker with Sandhi Splitter
JPH02105968A (en) Automatic test and correction system for japanese sentence error
Dermatas et al. A language-independent probabilistic model for automatic conversion between graphemic and phonemic transcription of words
JP3048101B2 (en) Morphological analyzer
JPH02118785A (en) Method for correcting erroneous recognition
JPS62150462A (en) Sentence error automatic correcting system
Aparna et al. MORPHOLOGICAL PARSING OF'SANDHI'BASED WORDS IN SANSKRIT TEXT
JPH047670A (en) Sentence analysis system
HASANPOUR et al. Design and implementation of a software system for detecting orthographical or morphological errors in persian words