JPH0264867A - Correspondence relation deciding system for character description result - Google Patents

Correspondence relation deciding system for character description result

Info

Publication number
JPH0264867A
JPH0264867A JP63215194A JP21519488A JPH0264867A JP H0264867 A JPH0264867 A JP H0264867A JP 63215194 A JP63215194 A JP 63215194A JP 21519488 A JP21519488 A JP 21519488A JP H0264867 A JPH0264867 A JP H0264867A
Authority
JP
Japan
Prior art keywords
phoneme
notation
character
group
phonemes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63215194A
Other languages
Japanese (ja)
Other versions
JPH07113925B2 (en
Inventor
Etsuko Obuka
大深 悦子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON I B M KK
IBM Japan Ltd
Original Assignee
NIPPON I B M KK
IBM Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON I B M KK, IBM Japan Ltd filed Critical NIPPON I B M KK
Priority to JP63215194A priority Critical patent/JPH07113925B2/en
Publication of JPH0264867A publication Critical patent/JPH0264867A/en
Publication of JPH07113925B2 publication Critical patent/JPH07113925B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To eliminate a trouble to prepare a dictionary by converting character described result into a phoneme row, and deciding the correspondence relation of the character described results by calculating the degree of difference at a phoneme level. CONSTITUTION:The title system is provided with a means to convert the objective character described result to be compared into the phoneme row, the means to calculate the degree of difference at the phoneme level and the means to decide the correspondence relation between the character described results themselves according to the degree of difference at the phoneme level. As for English language description, the means to convert English described result into the phoneme row consisting of the phonemes to be used in English language is provided, and in the case where the correspondence relation between KATAKANA (square form of Japanese syllabary) described result and the English described result is desired to decide, a tabling means to generate one or plural Japanese phonemes corresponding to each phoneme to be used in the English language is provided. Thus, a foreign language description dictionary need not be generated beforehand, and continuous renewal such as the registration of a newly-coined word, a derivative and a proper noun is unnecessary as well.

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は、同一または異なる文字表記法による表記結果
同士の対応関係を判定するシステムに関し、さらに詳し
くは文字表記結果を音素列に変換し、音素レベルでの相
違度を計算することによって文字表記結果の対応関係を
判定するシステムに関する。ここでいう対応関係は、対
応する・しない(対応関係あり・なし)という2値的に
判定されるものであってもよいし、相違度に応じてより
細かく、例えば、対応関係強・弱・なしのように判定さ
れるものであってもよい。
DETAILED DESCRIPTION OF THE INVENTION A. Field of Industrial Application The present invention relates to a system for determining the correspondence between the results of notation using the same or different character notations, and more specifically, converts the results of character notation into a phoneme string, The present invention relates to a system that determines the correspondence of character transcription results by calculating the degree of dissimilarity at the phoneme level. The correspondence here may be determined in a binary manner such as correspondence or not (correspondence exists or no correspondence), or it may be determined in more detail depending on the degree of difference, for example, correspondence is strong, weak, or It may be determined that there is no such thing.

B、従来技術およびその問題点 日本語のカナ等の音標文字による表記を使って、外来語
を表記する場合、複数の表記のしがたがあることが多い
、原表記結果”interview”を例にとると、そ
の表記には、 1nterviey インタビュ、インタヴユ、 インタビーン、インタビーン インタビュー、インタビ− ンンタービュー、インタービュー などがある、これらの複数の表記結果は、すべて同一語
“interview”を表わしているが1例えば“イ
ンタビーン”は、これを表わしていない。
B. Prior art and its problems When writing foreign words using phonetic alphabets such as Japanese kana, there are often multiple ways to write them.An example of the original notation "interview" Accordingly, the notations include 1nterviey interview, interview, interview, interview, interview, interview, etc. These multiple notations all represent the same word "interview". However, 1, for example, "interbeen" does not represent this.

このような、表記結果同士が同一語を表わしているかど
うかの判定が求められている場として。
In situations like this, where it is required to determine whether or not the notation results represent the same word.

日本語ワードプロセッサにおける校正システムや情報検
索システムがある。
There are proofreading systems and information retrieval systems for Japanese word processors.

従来の校正システムでは、田中他「科学技術文献抄録に
おける片仮名列の解析」 (計量国語学Vo1.14、
NO,1,1983)でも指摘されているように、〈原
表記結果−カナ表記結果〉対を登録する辞書式が使われ
ていた。また従来の情報検索においても、辞書式が、特
開昭62−11932号公報に開示されている。
In the conventional proofreading system, Tanaka et al. "Analysis of Katakana sequences in scientific and technical literature abstracts" (Metric Japanese Linguistics Vol. 1.14,
No. 1, 1983), a dictionary system was used to register pairs of <original notation result - kana notation result>. Furthermore, in conventional information retrieval, a dictionary system is disclosed in Japanese Patent Application Laid-open No. 11932/1983.

しかし、辞書式には1次のような問題点がある。However, the dictionary system has the following first-order problems.

・新造語、派生語、固有名詞をすべて辞書に登録する必
要があるので、辞書を作る手間がががり。
・Since all newly coined words, derived words, and proper nouns must be registered in the dictionary, it takes time to create a dictionary.

継続的更新が必要である。Continuous updates are required.

・カナ表記が定まらない場合は、すべてのカナ表記を網
羅しなければならない。
- If the kana notation cannot be determined, all kana notations must be covered.

一方、カナ表記結果同士の対応関係判定を行なう方法と
して、カナ表記結果のうち、上記公報で示唆されている
ような対応関係にあるものすべてを、辞書の1つのエン
トリーにおさめる方法の他に、統一表記を使うやり方も
ある。統一表記を得る方法は、後藤他「片仮名表記をと
る技術用語における表記の多様性」 (三田図書館情報
学会大会、1985)の論文に開示されている。
On the other hand, as a method for determining the correspondence between kana notation results, in addition to the method of storing all of the kana notation results that have a correspondence as suggested in the above publication into one entry in the dictionary, There is also a way to use uniform notation. A method for obtaining a unified notation is disclosed in a paper by Goto et al., ``Diversity of notation in technical terms that use katakana notation'' (Mita Library and Information Society Conference, 1985).

これは処理対象のカナ列に対して、その先頭文字列から
逐次、交換規則(例えば、長音符号、促音削除、拗音の
大文字化、f音→h音、V音→b音の書き換えなど)を
適用して、統一表記結果を得る。そしてこの統一表記結
果同士の一致、不一致によってカナ列同士の対応関係あ
り・なしの判定を行なうものである。
This applies exchange rules (for example, long sound, deletion of consonants, capitalization of consonants, rewriting f sound → h sound, V sound → b sound, etc.) sequentially from the first character string to the kana string to be processed. Apply it to get unified notation results. Then, it is determined whether or not there is a correspondence between kana strings based on whether the unified notation results match or do not match.

この方式には、次の問題点がある。This method has the following problems.

同一語を表わす表記群を、互いに異なる語と判断しない
ためには、なるべく多くの変換規則を設定する必要があ
るが、これによって、異なる語を同一とみなしてしまう
確率が高くなる。
In order to prevent groups of notations representing the same word from being judged as different words, it is necessary to set as many conversion rules as possible, but this increases the probability that different words will be regarded as the same.

例えば「オータナチブ」と「オルタナチブ」は、ともに
“alternative”を表わしている。これを統
一するために(゛ル′→長音)という変換規則を追加す
ると、これは長音符号削除の規則と組み合わさって(゛
ル′→長音→削除)となる、従って、これを「バックル
」に適用すると「バック」となり、この2つを区別でき
なくなる。
For example, "alternative" and "alternative" both represent "alternative." In order to unify this, we add the conversion rule (゛ru' → long sound), which is combined with the long sound sign deletion rule to become (゛ru' → long sound → deletion). Therefore, this can be called "buckle". When applied to , it becomes ``back'' and it becomes impossible to distinguish between the two.

C0問題点を解決するための手段 本発明は上記問題点に鑑みなされたもので、比較対象の
文字表記結果を音素列に変換する手段と。
Means for Solving the C0 Problems The present invention has been made in view of the above problems, and includes means for converting character notation results to be compared into phoneme strings.

音素レベルでの相異度を計算する手段と、音素レベルで
の相違度にもとづいて文字表記結果同士の対応関係を判
定する手段を備えたことを特徴とする。
The present invention is characterized by comprising means for calculating the degree of dissimilarity at the phoneme level, and means for determining the correspondence between character notation results based on the degree of dissimilarity at the phoneme level.

例えばカタカナ表記については、カタカナ表記結果を日
本語で用いる音素からなる音素列に変換する手段が用意
される。なお本明細書でいう日本語で用いる音素とは、
ヨミに促音、長音、拗音の概念を含めたもののことであ
る。
For example, for katakana notation, means is provided for converting the katakana notation result into a phoneme string consisting of phonemes used in Japanese. Note that the phonemes used in Japanese in this specification are:
This is a reading that includes the concepts of consonants, long consonants, and consonants.

英語表記については、英語表記結果を英語で用いる音素
からなる音素列に変換する手段が用意される。カタカナ
表記結果と英語表記結果の対応関係を判定したい場合に
は、英語で用いる各音素について対応する日本語の1ま
たは複数の音素を生成するテーブル手段が用意される。
For English notation, a means is provided for converting the English notation result into a phoneme string consisting of phonemes used in English. When it is desired to determine the correspondence between the Katakana notation result and the English notation result, a table means is prepared that generates one or more Japanese phonemes corresponding to each phoneme used in English.

D、実施例 Dl、英語表記−カナ表記間の対応関係判定システム 以下、本発明を英語表記−力す表記間の対応関係判定シ
ステムに即して説明する。まず、同システムにより行な
われる一連の処理の流れを第1図に示す、  D2〜D
8で、第1図に示された各手段の詳細を説明することに
する。
D. Embodiment D1: System for determining correspondence between English notation and kana notation The present invention will be described below with reference to a system for determining correspondence between English notation and kana notation. First, the flow of a series of processes performed by the system is shown in Figure 1, D2 to D.
8, details of each means shown in FIG. 1 will be explained.

D2.日本語音素列生成手段 ■ カタカナ表記結果を、例えばキーボードから文字コ
ードの形で入力する。
D2. Japanese phoneme string generation means ■ Input the katakana notation result in the form of a character code from the keyboard, for example.

■ 各文字ごとに表1をひいて対応する音素列を得る。■ Check Table 1 for each letter to obtain the corresponding phoneme string.

(例「プレイヤー」→音素列: pureiya)促音
(ツ)長音(−)、拗音(ヤ、ユ、ヨ)は単独で使われ
ないので、音素とみなさない、直前の音素を(X l 
とすると、促音、長音はXの長さという形で、拗音はX
の拗音要素という形で扱う。
(Example: "player" → phoneme sequence: pureiya) Consonants (tsu), long sounds (-), and persistent sounds (ya, yu, yo) are not used alone, so they are not considered phonemes, and the previous phoneme is (X l
Then, the consonant and long consonant have the length of X, and the consonant has the length of X.
It is treated in the form of a consonant element.

(D4◎参照) 表記は、X  −+X、X−→X。(See D4◎) The notation is X-+X, X-→X.

ツ X−+X、、X   →X 。tsu X-+X,,X →X.

ヤ   Ja    ユ   Ja X  −4X、  とする。Ya Ja Ja Let X be -4X.

ヨ    J 0 表16日本語カナー音素列表 ■ ■で得た音素列の左から右へ、次に述べる変換規則
を適用して統一音素列を得る。
Yo J 0 Table 16 Japanese Kanah Phoneme Sequence Table ■ From left to right of the phoneme string obtained in ■, apply the conversion rules described below to obtain a unified phoneme string.

変換規則の主なものを次に挙げる。The main conversion rules are listed below.

1、母音にはさまれた長音削除規則 例に圭gi−+に圭ui 2、半母音(y、w)の変換規則 語頭以外のw −’+ u 例sanldowici−+5antdouici語頭
以外のy −* i 例Pureiy−a→Pureiia 3、二重母音の変換規則 先行母音をV > +後続母音をv2とすると。
1. Rule for deleting long sounds sandwiched between vowels Example: Kei gi-+ to Keui 2. Conversion rule for semi-vowels (y, w) w −'+ u other than the beginning of a word Example: sanldowici-+5 antdouici y −* i other than the beginning of a word Example: Pureiy-a → Pureiia 3. Conversion rules for diphthongs: Let the preceding vowel be V > + the following vowel v2.

母音列viv2は表2によって変換される。The vowel string viv2 is converted according to Table 2.

表2 二重母音(VIV2)の変換表 ・パ行、バ行の前のム(m u )→ン(nり例 ラム
プ→ランプ 5、無声化しやすい母音に関する規則 ・kis−+kus 例 テキスト→チクスト (tekisuto) (tekusuto)例 「プ
レイヤー」 ここに 例 空白:無変換 v :v十長音符号 ():省略可能 a O→ a O e 1 → e Ua →ua、  a、  ua、  a4、撥音(ン
)に関する規則 ・す行、マ行の前の撥音削除(後藤他の上掲論文に開示
) 例 チャンネル→チャネル ■ くって得られた統一音素列を、与えられたカタカナ
表記結果の日本語音素列としてメモリ中の作業域に、−
旦、格納する。
Table 2 Conversion table for diphthongs (VIV2) - Mu (m u ) in front of the Pa line and B line → N (n example Rump → Rump 5, rules regarding vowels that are easily devoiced - kis-+kus Example Text → Chixt ( tekisuto) (tekusuto) Example "Player" Example here Blank: No conversion v : v Macon sign (): Optional a O→ a O e 1 → e Ua →ua, a, ua, a4, syllabic sound (n) Rules for deletion of the syllables before the lines S and M (disclosed in the above-mentioned paper by Goto et al.) Example Channel → Channel In the working area in memory, -
Then, store it.

D3.英語音素列生成手段 ■ 英語表記結果を、例えばキーボードから文字コード
の形で入力する。
D3. English phoneme string generation means■ Input the English notation result in the form of a character code from the keyboard, for example.

■ 英語のつづりから音素列を得る。■ Obtain phoneme sequences from English spelling.

このアルゴリズムは既存で、例えば Elovitz他″’Letter−to−3ound
 Ru1es forAutomatic Trans
lation of English Textto 
Phonetics” (工εEE Trans、Vo
l、ASSP−24、No、 6.1976)などに開
示されているので、詳細は、これらの文献を参照された
い。
This algorithm already exists; for example, Elovitz et al.
Rules for Automatic Trans
lation of English Text
Phonetics” (ENGεEE Trans, Vo
ASSP-24, No. 6.1976), etc., so please refer to these documents for details.

本明細書では、英語音素として表3に示したものを使う
In this specification, the English phonemes shown in Table 3 are used.

(■ ■で得られた音素列を、与えられた英語表記の英
語音素列として、メモリ中の作業域に一旦。
(■ Temporarily store the phoneme string obtained in ■ as the English phoneme string in the given English notation in the working area in memory.

格納する。Store.

表3 英語音素記号表 D4.英語音素、日本語音素対応テーブル手段■ 音素
の表現形式 英語音素と日本語音素の比較をするため、音素の表現形
式を次のように定める。
Table 3 English phoneme symbol table D4. English phoneme, Japanese phoneme correspondence table means ■ Expression format of phonemes In order to compare English phonemes and Japanese phonemes, the expression format of phonemes is defined as follows.

子音音素(c)ミRc + F 1 + F 2母音音
素(v)ERv十F1+F3+F4R(。)二子音に属
する音素に対応する、日本語でのヨミ R(V)”母音に属する音素に対応する。
Consonant phoneme (c) Mi Rc + F 1 + F 2 Vowel phoneme (v) ERv 1 + F 1 + F 3 + F 4 R (.) Corresponds to a phoneme that belongs to two consonants, Yomi R (V) in Japanese, corresponds to a phoneme that belongs to vowel. .

日本語でのヨミ 日本語における促音、長音、拗音のj音は、ヨミに含め
ない 例「キャラ」を例にとると。
Reading in Japanese The J sounds of consonants, long sounds, and persistent sounds in Japanese are not included in the reading.Take ``Chara'' as an example.

日本語音素列:kjaで Rc==に、Rv=aとなる。Japanese phoneme sequence: kja Rc==, and Rv=a.

Fl:1つの音素に対応する、日本語でのヨミが複数あ
る場合の優先順位 F2:拗音(j音)の有無 F3:促音であるかないかを表わす。
Fl: Priority order when there are multiple readings in Japanese corresponding to one phoneme F2: Presence or absence of a consonant (j sound) F3: Indicates whether it is a consonant or not.

F4:長音であるかないかを表わす 「キャラ」を例にとると 子音音素=Rc (ヨミ:k)+F1(優先順位:■)
 +F2 (拗音:j) 母音音素=Rv(ヨミ:a)十F1(優先順位:■)+
F3(促音=6) 十F4 (長音二〇) ■ D3■で得た英語音素列を入力とする。
F4: Taking "Chara" as an example, which indicates whether it is a long sound or not, the consonant phoneme = Rc (Yomi: k) + F1 (Priority: ■)
+F2 (Sound: j) Vowel phoneme = Rv (Yomi: a) 10F1 (Priority: ■) +
F3 (consonant = 6) 10F4 (20 long sounds) ■ Input the English phoneme string obtained in D3■.

■ 英語音素列を2表4より■で説明した表現形式に変
換する。
■ Convert the English phoneme string from Table 2 to the expression format explained in ■.

なお、表4の項目で @:音素の種類(c:子音、V:母 音) 十■:子音の次に母音がない場合、カ タカナ表記上つける母音を表わ す。例えばcatの/1/は、日 本語ではト=toと表わされる ので+v=”o’となる。In addition, the items in Table 4 @: Type of phoneme (c: consonant, V: mother) sound) 10■: If there is no vowel after a consonant, Represents the vowel added in Takana notation. vinegar. For example, /1/ in cat is day In Japanese, it is expressed as to. Therefore, +v=”o’.

母音音素のF2:先行子音に拗音要素を付加することを
表わす。英語、日本語音 素レベル比較の際、先行子音の F2に加えて用いられる。
F2 of vowel phoneme: represents adding a persistent consonant element to the preceding consonant. When comparing English and Japanese phoneme levels, it is used in addition to the preceding consonant F2.

表4 @:音素 BX c:PX BX c:BX BX c:TX c:TX BX c  :  DX c  :  DX BX c:KX c:KX c:KX BX c:GX 英語音素、日本語音素対応表 子  音 : Fl : R(yomi) : F2(+j): 
+v:破裂音 −>/P/ :1  :p     −:u  ニ ー>/b/ :1  :b     ’      :u  ニー>
71./ :1  :t     :2     :o  ::2
 :C°     :u ニ ー>/d/ :1   :ci        ’        
  :o   ::2:Z 〜〉/に/ : 1  : k 222g :3:C −>/g/ =1:g : u   : : u   : : u   : : i  : : u   : c:GX c:GX FX c:MX c:MX FX c  :  NX c:NX NG c:NG c  :  NG FX c:LX FX c:FX c  :  FX x = 2 : k :3:z 鼻  音 −>/m/ : 1  二m :1:n! −>/n/ :1:nj :1:n −>10/ :1:n! :1   :n!gu 促音 −>/ Q / :1:r 摩擦音 −>/f/ :1:h : 2  : b −>/v/ CH c  :  SH c  :  SH c:SH CH c  :  ZH FX c:HX c:HX FX c  :  RX CH c:CH c:CH CH c:JH c:JH c:JH c:JH −>/S/ :1:S :j :2:z :3:し −〉// :1:Z −>/ h / :1:h =2二〇 −>/r/ :1:r 破擦音 −>/15  / :1:c : 2 : k −>/d3  / =1:Z : 2 :3:C :3二g :3:0 : u   : : u   : : U c:VX c:VX c:VX CH c:TH c:TH c:TH CH c:DH c  : DH c:DH FX c:sX c:sX c:sX FX a  :  ZX c  :  ZX :1:b =3:0 :3:u −>10/ :1:S :2:z :2:を −〉/凸/ :1:z :2:S :3:を −>/s/ :1:S :2:z :3:C −>/z/ =1:z :2:S : u   : : u   : : u   : : U : 0   : : u   : 複数形に対応する特殊な記号 c:Ts   :1:c   :   :u:/*=T
XSX  例えばtea<ts)傘/c:DS   :
1:z   :   :u:/$=I)XZX  例え
ば、 c a r<d s)*/半母音 @:音素  : Fl :R(yomi): F2(+
j):+v:JH−>/j/ a:JX   :1:y    +      :u:
v:JX   :1  :i    ”WX  −>/
W/ v:WX   :1  :o    ・v:WX   
:1  :u    ’c:WX   :3  :b 
   0:u  :母音 @:赫: Fl : R(youi):F2(+j):
+v : F3(、): F40:IX−>/i/ v:IX:1:i  :  :  :2  :O:v:
IX:2:ai  :  :  :O:O:v:IX:
3:e  :  :  :1  :’7  :v:IX
  :3  :u     :EE−>/i:/ v:EE  :1   :i     :v:EE  
:3  :ia    :v:EE  :3   :i
e v:EE   :2   :e     :v:EE 
 :3  :ea    :v:EE  :3  :a v:EE  :3  :ai    :v:EE  :
3  :aie   :E I −>/ e / v:EI   :1   :e v:EI   :1   :a v:EI   :3  :ai v:EI   :3  :1 EH−>/ε/ v:EH:1   :e v:EH:2  :i v:EH:3  :u v:EH:3  :a :1 :1 ::1 ::? :   :O :   :2 俸    j 9 :1:に 二? ::? :? v:AXIX:lai 二〇 v:AXIX:2:i :3 AXUX −>/au/ v:AXUX:1:au    : v:AXUX:2:a     : v:AXUX:2:o     : v:AXUX:3:u     : ○U−>10/ v:OU  :l   :o     :v:OU  
:2  :a     :v:OU  :3  :u 
    :V:○U:3:ui: v:OU  :3  :oa    :AW−>/)/ v:AW  :1  :o     :v:AW  :
2  :a     :v:AW  :3  :ao 
   :v:AW  :3   :au    :AW
IX−>10i/ v:AWIX:1:oi    : 二〇 :0 :3 二〇 AE−>/ ;e/ v:AE:1:a    :     :   :2 
   :1    :v:AE:2:e    :  
   :   :’)    :3    :v:AE
:3:o    :     :   :?    :
?    :UH−>/Aまたはlai v:tJH:1  :a    :     :   
:2    :1    :v:UH:2:o    
:     :   :O:1    :v:UH:2
  :u    :1    :1  :1    :
O:v:UH:3:e    :     :   :
?    :’:’    :v:UH:3  :ia
   :     :   :?    :’;’  
  :ER−>/さ/ v:ER:1:a    :     :   :O:
3    :v:ER:3:e    :     ;
   :?    :?    :Er−>/&/ /
*ER+X (母音)  >Er+RX+X廖/v:E
r:1:a    :     :   :?    
:?    :V:Er:1:ua   :     
:   :?    :Q    :AA−>/  / v:AA:1:o    :     :   :2 
   :1    :v:AA:2:a    :  
   :   :1’    :1    :AX I
 X −>/ a i / UX−>/u/ v:UX  :1  :u     :UU−>/u:
/ v:UU  :1  :u     :v:UU  :
3  :o     :WX v:WX  :1  :u     :v:WX  :
3  :o     :j xUU  >/ j u 
: / v:jxUU:1:u    :2 v:jxUU:3:a    :O v:jxUU:3:o     :1 −>/:/ vニー:1:o: v:     :2  :a     ::3 :0 :    :1     :3     ::    
:’il     :1     ::    :3 
    :O: :    :?    :?    :=2 :O 二〇二〇 =1 :? :    :O:3     : :    :O:3     : ■ 英語音素列の各音素と、■で得た変換結果を対にし
て、メモリの作業域に一旦、格納する。
Table 4 @: Phoneme BX c: PX BX c: BX BX c: TX c: TX BX c: DX c: DX BX c: KX c: KX c: KX BX c: GX English phoneme, Japanese phoneme correspondence table Sound: Fl: R (yomi): F2 (+j):
+v: Plosive ->/P/ :1 :p -:u Knee>/b/ :1 :b' :u Knee>
71. / :1 :t :2 :o ::2
:C° :u Knee>/d/ :1 :ci'
:o ::2:Z ~>/ni/ : 1 : k 222g :3:C ->/g/ =1:g : u : : u : : u : : i : : u : c : GX c : GX FX c:MX c:MX FX c: NX c:NX NG c:NG c: NG FX c:LX FX c:FX c: FX x = 2: k: 3:z Nasal ->/m/: 1 2m :1:n! ->/n/ :1:nj :1:n ->10/ :1:n! :1 :n! gu consonant ->/ Q / :1:r fricative ->/f/ :1:h : 2 : b ->/v/ CH c : SH c : SH c:SH CH c : ZH FX c:HX c: HX FX c: RX CH c:CH c:CH CH c:JH c:JH c:JH c:JH ->/S/ :1:S :j :2:z :3:Shi->// :1 :Z ->/h / :1:h =220->/r/ :1:r Affricate->/15/ :1:c : 2 :k ->/d3 / =1:Z : 2:3:C:32g:3:0:u::u::U c:VX c:VX c:VX CH c:TH c:TH c:TH CH c:DH c: DH c:DH FX c: sX c: sX c: sX FX a : ZX c : ZX :1:b =3:0 :3:u ->10/ :1:S :2:z :2: ->/Convex/ :1:z :2:S :3: ->/s/ :1:S :2:z :3:C ->/z/ =1:z :2:S : u : : u : : u : : U : 0 : : u : Special symbol corresponding to plural c:Ts :1:c : :u :/*=T
XSX For example tea<ts) umbrella/c:DS:
1:z: :u:/$=I)XZX For example, c a r<d s)*/semi-vowel @:phoneme: Fl:R(yomi):F2(+
j):+v:JH->/j/a:JX:1:y+:u:
v:JX :1 :i ”WX ->/
W/ v:WX :1 :o ・v:WX
:1 :u'c:WX :3 :b
0: u: vowel @: 赫: Fl: R (youi): F2 (+j):
+v: F3(,): F40:IX->/i/ v:IX:1:i: : :2 :O:v:
IX:2:ai : : :O:O:v:IX:
3:e:::1:'7:v:IX
:3 :u :EE->/i:/v:EE :1 :i :v:EE
:3 :ia :v:EE :3 :i
e v:EE :2 :e :v:EE
:3 :ea :v:EE :3 :av:EE :3 :ai :v:EE :
3 :aie :E I ->/e/v:EI :1 :e v:EI :1 :av:EI :3 :ai v:EI :3 :1 EH->/ε/v:EH:1 :ev:EH:2 :iv:EH:3 :u v:EH:3 :a :1 :1 ::1 ::? : :O : :2 Salary j 9 :1: Nii? ::? :? v:AXIX:lai 20v:AXIX:2:i:3 AXUX ->/au/ v:AXUX:1:au: v:AXUX:2:a: v:AXUX:2:o: v:AXUX: 3:u: ○U->10/v:OU:l:o:v:OU
:2 :a :v:OU :3 :u
:V:○U:3:ui: v:OU :3 :oa :AW->/)/v:AW :1 :o :v:AW :
2:a:v:AW:3:ao
:v:AW :3 :au :AW
IX->10i/v:AWIX:1:oi: 20:0:3 20AE->/;e/v:AE:1:a:::2
:1 :v:AE:2:e :
: :') :3 :v:AE
:3:o : : :? :
? :UH->/A or lai v:tJH:1 :a : :
:2 :1 :v:UH:2:o
: : :O:1 :v:UH:2
:u :1 :1 :1 :
O:v:UH:3:e:::
? :':' :v:UH:3 :ia
: : :? :';'
:ER->/sa/ v:ER:1:a : : :O:
3:v:ER:3:e:;
:? :? :Er->/&//
*ER+X (vowel) >Er+RX+X Liao/v:E
r:1:a:::?
:? :V:Er:1:ua:
: :? :Q :AA->/ / v:AA:1:o : : :2
:1 :v:AA:2:a :
: :1' :1 :AX I
X ->/a i / UX->/u/ v:UX :1 :u :UU->/u:
/v:UU:1:u:v:UU:
3:o:WX v:WX:1:u:v:WX:
3 :o :j xUU >/ j u
: / v:jxUU:1:u :2 v:jxUU:3:a :O v:jxUU:3:o :1 ->/:/ vknee:1:o: v: :2 :a ::3 :0 : :1 :3 ::
:'il :1 :: :3
:O: : :? :? :=2 :O 2020=1 :? : :O:3 : : :O:3 : ■ Each phoneme of the English phoneme string and the conversion result obtained in step (■) are paired and temporarily stored in the working area of the memory.

例11cuPI+ 英語音素列:KX  UHPXとなり、これらの音素の
変換結果は以下のようになる。
Example 11 cuPI+English phoneme string: KX UHPX, and the conversion result of these phonemes is as follows.

音素:変換結果 (1)音素に対応する日本語でのヨミに関する調整その
音素の前後の音韻環境、対応するつづりを考慮した調整
規則によりヨミの優先順位(Fl)、拗音の可能性(F
2)を変更する。
Phoneme: Conversion result (1) Adjustment of the reading in Japanese corresponding to the phoneme Adjustment rules that take into account the phonetic environment before and after the phoneme, and the corresponding spelling, the priority of the reading (Fl), the possibility of a persistent sound (F
2) Change.

以下に、調整規則の主なものを述べる。The main adjustment rules are described below.

規則は、音素:条件→条件を満たした場合とるべきアク
ション、の形で表現スル。
Rules are expressed in the form of phoneme: condition → action to be taken when the condition is met.

MX:後続音素がI’X、BX、MXである→Fl(ヨ
ミ: n り =0 記では「ランプ」となる。
MX: The following phoneme is I'X, BX, MX → Fl (reading: n ri = 0 In writing, it becomes "lamp".

NX:後続音素がTX、DX、NXである→Fl(ヨミ
: n り =0 PX: (Rc(P)十F1(■)+F2(拗音二〇)
〕D5.英語音素列の変換結果調整手段 ■ D4■で得た英語音素列変換結果を、音韻環境、つ
づりによって調整する。以下、2つの調整項目について
説明する。
NX: The subsequent phoneme is TX, DX, NX → Fl (reading: n ri = 0 PX: (Rc (P) 10 F1 (■) + F2 (20 sounds)
] D5. English phoneme string conversion result adjustment means ■ Adjust the English phoneme string conversion results obtained in D4■ according to the phonetic environment and spelling. The two adjustment items will be explained below.

記では「テント」となる。In the book, it is called ``tent.''

EE:対応するつづりがe′である→ Fl(ヨミ:e)=0 例:“meter”のカナ表記は「メーター」となる 例 “action”のカナ表記は「アクション」でU
Hを0′と読む。
EE: The corresponding spelling is e' → Fl (reading: e) = 0 Example: The kana notation for "meter" is "meter" The kana notation for "action" is "U"
Read H as 0'.

AE:先行音素がKX又はGXであり、かつ後続音素が
PX、BX、TX、DX、 KX、GX、RXである→ F2=2 先行音素がKX又はGXであり、かつ 後続音素が(PX、BX、TX、DX、KX、GX、R
X)以外の 子音である→F2=I UH:対応するつづりがa′である→ Fl(ヨミ:a)=0 例 ”China”のカナ表記は「チャイナ」でUHを
% aIと読む。
AE: The preceding phoneme is KX or GX, and the following phoneme is PX, BX, TX, DX, KX, GX, RX → F2=2 The preceding phoneme is KX or GX, and the following phoneme is (PX, BX, TX, DX, KX, GX, R
It is a consonant other than X) → F2 = I UH: The corresponding spelling is a' → Fl (read: a) = 0 Example The kana notation for "China" is "China" and UH is read as % aI.

AA:後続音素がのばす音゛−′である→Fl(ヨミ:
a)=0 例 ”part”  (PXロ囚二TX)のカナ表記は
「バート」でAAをa′と読む。
AA: The following phoneme is the elongated sound ゛-'→Fl (reading:
a) = 0 Example The kana notation for "part" (PXro Prisoner 2 TX) is "bert" and AA is read as a'.

(2)子音の直前あるいは語尾に位置する母音音素の長
さに関する調整 日本語において母音の長さは、単語を区別するための重
要な要素である。ここでは、その母音の長さについて、
以下に述べる調整規則により、母音長の調整値(Alと
する)を計算する。この値は、D6音素レベル相違度計
算において、F3(促音の有無)、F4(長音の有無)
比較に使う。
(2) Adjustment regarding the length of vowel phonemes located immediately before consonants or at the end of words In Japanese, the length of vowels is an important element for distinguishing words. Here, regarding the length of the vowel,
The vowel length adjustment value (denoted as Al) is calculated according to the adjustment rules described below. In D6 phoneme level difference calculation, this value is F3 (presence or absence of consonant), F4 (presence or absence of long consonant)
Use for comparison.

対応するつづりが−O/である→ Fl(ヨミ:o)=0 説明のために、対象となる単語の音素列を・・・v c
 v2・・・ (v:調整すべき母音音素、C:後続子
音音素、v2:cに後続する母音音素)と表わす。
The corresponding spelling is -O/ → Fl (read: o) = 0 For explanation, the phoneme sequence of the target word is...v c
v2... (v: vowel phoneme to be adjusted, C: subsequent consonant phoneme, v2: vowel phoneme following c).

■ 後続子音音素(c)がPX、TX、KXの場合 以上である→A1=0 ■後続子音音素(c)が(PX、TX、KX)以外の場
合 ■ 英語音素と、■で調整した変換結果および母音長の
調整値(A1)を対にして、メモリ中の作業域に格納す
る。
■ If the following consonant phoneme (c) is PX, TX, KX or above → A1 = 0 ■ If the subsequent consonant phoneme (c) is other than (PX, TX, KX) ■ Conversion adjusted with English phoneme and ■ The result and vowel length adjustment value (A1) are stored as a pair in a work area in memory.

D 6 、音素レベル相違度計算手段 ■ D2、■で得た日本語音素列(以下J音素列という
)、およびD 5 tDで得た、調整済みの英語音素列
変換結果(以下、E音素列)を入力とする。
D 6 , phoneme level difference calculation means ■ The Japanese phoneme string obtained in D2, ■ (hereinafter referred to as J phoneme string), and the adjusted English phoneme string conversion result obtained in D 5 tD (hereinafter referred to as E phoneme string) ) as input.

■ J音素列とE音素列の相違度を以下に述べる手順に
従って計算する。最初にチャンクという概念を説明する (■−0チャンクの 全 本明細書で使うチャンクとは、この音素列を各子音の先
頭で区切って作った固まりを表わす。
■ Calculate the degree of difference between the J phoneme string and the E phoneme string according to the procedure described below. First, the concept of a chunk will be explained (■-0 chunk) A chunk as used in this specification refers to a block created by dividing this phoneme string at the beginning of each consonant.

例1 “alternative” 英語音素列はAW−LXTXERNX TJHTXI XVXとなる。Example 1 “alternative” The English phoneme sequence is AW-LXTXERNX It becomes TJHTXI XVX.

子音は左から順にLX、TX、NX、TX。From left to right, the consonants are LX, TX, NX, and TX.

VXなのでAW −I LX I TXERI NXU
HI TX I X I V)l 6−+(7)チャン
クに分けられる6 例2 「オータナティブ」 日本語音素列は、otanatibuとなる。子音は左
から順にt、n+ t、bなのでoltalnalti
lbu と5つのチャンクに分けられる。
Since it is VX, AW -I LX I TXERI NXU
HI TX I The consonants are t, n+ t, b from left to right, so it is alternative
lbu and divided into five chunks.

例3 Fキーライ」の場合は子音が1つ(k)なので、
1チヤンクとなる。
Example 3 In the case of “F Keerai”, there is one consonant (k), so
1 yank.

■−1音素レベル相′度計算の J音素列とE音素列に対して チャンク数マツチングを行ない、チャンク数が一致した
ものに関して 第1マツチング (子音部のヨミRe) 第2マツチング を順に行ない、該当する項目に与えられたペナルティ−
の総和を相違度とする。
■-1 Chunk number matching is performed on the J phoneme string and E phoneme string of the phoneme level phase calculation, and the first matching (consonant part reading Re) and second matching are performed in order for those with the same chunk number, Penalty given to applicable items −
Let the sum total be the dissimilarity degree.

最初に、チャンク数マツチングを行なう。First, matching the number of chunks is performed.

(1)  雨音素列のチャンク数が2以上異なる場合。(1) When the number of chunks in the rain phoneme sequence differs by 2 or more.

これらの音素列をもつ表記結果は不一致とみなす。(相
違度=100X両音素列のチャンク数の差) (II)  雨音素列のチャンク数が1異なる場合、チ
ャンク数が1多い方をX音素列、もう−方をX′音素列
とすると、X音素列のどのチャンクがX′音素列と対応
しないかを、以下の方法で決定する。X音素列の第1チ
ヤンクから1つずつ順番にぬいて作ったチャンク列と、
X′音素列のチャンク列とに、第1マツチングを行なう
。X音素列から第iチャンクをぬいて作ったチャンク列
のとき、X′音素列のチャンク列と子音部が一致したと
みなされたとき(第1マツチングのペナルティ−につい
ては、後述する。)、第iチャンクを“対応しないチャ
ンク”とみなす。
Representation results with these phoneme sequences are considered to be inconsistent. (Difference level = 100X difference in the number of chunks of both phoneme strings) (II) If the number of chunks of the rain phoneme strings differs by 1, then let the one with the larger number of chunks be the X phoneme string and the other - the X' phoneme string. Which chunk of the X phoneme sequence does not correspond to the X' phoneme sequence is determined by the following method. A chunk sequence created by sequentially removing one chunk from the first chunk of the X phoneme sequence,
A first matching is performed on the chunk sequence of the X′ phoneme sequence. When a chunk string is created by removing the i-th chunk from the The i-th chunk is regarded as a "non-corresponding chunk."

例えば“Keys”(第1チャンク:KxEE第2チャ
ンク:ZX)と「キー」 (第1チャンク: Ki)の
場合、  ”Keys”の第2チヤンク(ZX)が“対
応しないチャンク″となる。
For example, in the case of "Keys" (first chunk: KxEE, second chunk: ZX) and "key" (first chunk: Ki), the second chunk (ZX) of "Keys" is the "uncorresponding chunk."

′“対応しないチャンク”がない場合は、両表記は不一
致とみなす(相違度=100)″対応しないチャンク″
がある場合、その子音部が表5に記載されている場合は
、X音素列から“対応しないチャンク”をぬいたちのと
X′音素列について第2マツチングを行なう。相違度は
、第1マツチングでのペナルティ−総和十表5の該当ペ
ナルティ−子弟2マツチングでのペナルティ−総和にな
る。
``If there is no "non-corresponding chunk", the two notations are considered to be inconsistent (difference = 100) "non-corresponding chunk"
If there is a consonant part, and the consonant part is listed in Table 5, a second matching is performed on the X' phoneme sequence by removing the "uncorresponding chunk" from the X phoneme sequence. The degree of dissimilarity is the penalty in the first matching - the sum of the penalties in Table 5 - the penalty in the matching of the two children - the sum.

11対応しないチャンク″があってかつその子音部が表
5に記載されていない場合は、両表記は不一致とみなす
。(相違度=100)表5一致していなくてもよい子音
音素とペナルティ−J音素列の子音部のヨミ (JRc
とかく)と、E音素列の子音部のヨミ候補(ERci)
を第1チヤンクから順に比較する。E Rc iは表4
のR(yomi)で与えられる。
11 If there is a chunk" that does not correspond and its consonant part is not listed in Table 5, both notations are considered to be inconsistent. (Difference = 100) Table 5 Consonant phonemes that do not need to match and penalties - Reading of the consonant part of the J phoneme sequence (JRc
) and reading candidates for the consonant part of the E phoneme sequence (ERci)
are compared in order starting from the first yank. E Rc i is shown in Table 4
It is given by R(yomi).

例 「キャット」 J音素列:kjat。Example “cat” J phoneme sequence: kjat.

↓ 子音+母音の組み合わせで表現する。↓ Expressed by a combination of consonants and vowels.

(III)  チャンク数が一致する場合。(III) When the number of chunks match.

第1マツチングを行なう。各チャンクの子音が一致する
とみなされたものについてのみ第2マツチングを行なう
Perform the first matching. The second matching is performed only for chunks whose consonants are considered to match.

相違度は、第1マツチングでのペナルティ−の総和子弟
2マツチングでのペナルティ−の総和となる。
The degree of dissimilarity is the sum of the penalties in the first matching and the sum of the penalties in the second child matching.

以下に第1マツチング、第2マツチングを説明する。The first matching and the second matching will be explained below.

■−21マツチング JRc     ’     k c a t″ E音素列:KX  AE ↓ TX 従ってE音素列の第1チヤンクの子音部(KX)のヨミ
候補は E Rc 、 = k 、 E Rc 、 = g +
E Rc 、 = c第2チャンクの子音部(TX)の
ヨミ候補はERc、=t、ERc2=c となる。
■-21 Matching JRc ' k cat '' E phoneme string: KX AE ↓ TX Therefore, the reading candidates for the consonant part (KX) of the first yank of the E phoneme string are E Rc , = k , E Rc , = g +
E Rc , = c The reading candidates for the consonant part (TX) of the second chunk are ERc, = t, ERc2 = c.

なお、r5J語審議会報告[外来語の表記」によると。According to the r5J language council report [Representation of foreign words].

ティ(t i)→チ(ci)、デイ(di)→ジ(z 
i)と表わすことになる。従ってティのときはJRc=
tまたはC、デイのときはJRc=dまたは2とみなし
て比較する。
Ti (t i) → Chi (ci), Dei (di) → Ji (z
It will be expressed as i). Therefore, when teeing, JRc=
When it is t, C or day, JRc is assumed to be d or 2 and compared.

(i)  JRcとERclが単数−複数(t−c、d
 −z )の関係のとき、ペナルティ−(+2)で一致
するとみなす。
(i) JRc and ERcl are singular-plural (t-c, d
-z), it is assumed that they match with a penalty of -(+2).

例「キャット」と“c a t s ”の第2チヤンク
の子音部はJ Rc = t −E Rc L= cと
なり。
For example, the consonant part of the second yank of "cat" and "cats" is J Rc = t - E Rc L = c.

tとCはペナルティ−2で一致する。t and C match with a penalty of -2.

(ii)  JRcとERclが有声−無声例「レディ
ース」と” 1adics ”の第33チヤンクの子音
部は、 J Rc = s 、 E Rc 、 := 
Zで」1記の関係である。
(ii) JRc and ERcl are voiced-unvoiced examples. The consonant part of the 33rd yank of "ladies" and "1adics" is J Rc = s, E Rc, :=
This is the relationship described in 1.

(a ) J Rc 、 E Rc 1の少なくとも一
方において、 この子音音素が有声音ならば直前または直後子音が無声
音、 この子音音素が無声音ならば直前または直後子音が有声
音 のとき、ペナルティ−→+1とする。
(a) In at least one of J Rc and E Rc 1, if this consonant phoneme is a voiced sound, the immediately preceding or immediately following consonant is an unvoiced sound, and if this consonant phoneme is an unvoiced sound and the immediately preceding or immediately following consonant is a voiced sound, the penalty -→+1 shall be.

これは直前/直後子音の有声、無声によって該当子音の
有声無声が変わることがあるからである。
This is because the voicedness or unvoicedness of the corresponding consonant may change depending on whether the consonant immediately before or after the consonant is voiced or unvoiced.

例「レディース」のJ音素例:redisuでdは有声
音、Sは無声音なので、このSと“’ 1adiCs”
の第3チヤンクのERc工=2はペナルティ−(+]2
)で一致する。
Example J phoneme example of "ladies": In redisu, d is a voiced sound and S is a voiceless sound, so this S and "'1adiCs"
The third yank of ERc = 2 is penalty -(+]2
) matches.

(b)  (a)以外はペナルティ−→+3とする。(b) For cases other than (a), the penalty is -→+3.

(ni)  (i)(ii)に該当しないものは子音が
違うとみなす。      (相違度=100)2、J
RcがERc i中にある場合 J Rc = E Rc mとすると、(i)ERcm
の優先順位(Fl)が0あるいはlのときペナルティ−
→O (it)ERcmの優先順位が2のとき(iii)ER
cmの優先順位が3以上のとき。
(ni) Those that do not fall under (i) and (ii) are considered to have different consonants. (Difference = 100) 2, J
If Rc is in ERc i, then J Rc = E Rc m, (i) ERcm
When the priority (Fl) of is 0 or l, the penalty -
→O (it) When the priority of ERcm is 2 (iii) ER
When the priority of cm is 3 or higher.

ミ(JRv)とE音素列の母音部を構成する音素jのヨ
ミ候補(ERvjk)を比較する。
Mi (JRv) is compared with the reading candidate (ERvjk) of phoneme j that constitutes the vowel part of the E phoneme string.

説明のため、JRv=viv2−v  (v  は日本
語音素) ERv=ERvIERv、−ERvm(ERvjは英語
音素) ■−2ですべてのチャンクの子音が一致したとみなされ
た場合1 、■音素列、E音素列について1次の3項目のマツチン
グを行なう。
For the sake of explanation, JRv = viv2-v (v is a Japanese phoneme) ERv = ERvIERv, -ERvm (ERvj is an English phoneme) ■ If the consonants of all chunks are considered to match in -2 1, ■ Phoneme string , E. Matching of three items of first order is performed for the phoneme sequence.

(a)母音部のヨミ (Rv) (b)抑音の有%(F2) (c)各チャンク最後の母−f音素の長さ(F3、F4
) (a)母音部のヨミ(Rv)のマツチング第1チヤンク
から順にJ音素列の母音部のヨn:JRvを構成する音
素数、m:ERVを構成する音素数とする。
(a) Vowel part reading (Rv) (b) Presence of attenuation (F2) (c) Length of vowel-f phoneme at the end of each chunk (F3, F4
) (a) Matching of readings (Rv) of the vowel part In the vowel part of the J phoneme string, yon: the number of phonemes forming JRv, and m: the number of phonemes forming ERV, in order from the first chunk.

各ERvjのヨミ候補から任意に1つずつ選を作り、v
lから順番にev  列と比較していく。ヨミのうち省
略可能なもの(JRvの()で囲まれた音素、evjk
二〇のもの)は。
Create one selection arbitrarily from the reading candidates for each ERvj, and v
Starting from l, it is compared with the ev column in order. Those that can be omitted from the reading (phonemes enclosed in parentheses in JRv, evjk
20 things).

対応するヨミが相手の音素列に見つからなければないも
のとして扱う。また、E音素列のチャンクが子音で終わ
っている場合は表4のtvの母音を補って比較する。
If the corresponding reading is not found in the other party's phoneme sequence, it is treated as missing. Furthermore, if the chunk of the E phoneme sequence ends with a consonant, the vowel of tv in Table 4 is supplemented for comparison.

各ev  列につき、JRvのdx番目の音素まで一致
するヨミが見つかったとし、最大のdxをdとする。
Assume that for each ev column, a reading that matches up to the dxth phoneme of JRv is found, and the maximum dx is set as d.

例「キーライ4(kTui)と’key”(KXEE)
の比較において、JRv=iui (v1=i+ v、
=u、y、=i、n=3)  、ERv=EE 従ってJRvとevlの比較においてはv1=ev1□
よりd1=1、 JRvとQV、の比較においては v□≠evt2よりd、=O1 同様にしてd n = 0 よってd=最大のdx=d1=1 以上のようにして、JRvのヨミと一致するERvjの
ヨミ候補(cvjkとする)が見つかるごとに、evj
kの優先順位と表6よりペナルティ−を求め、それを相
違度に加算する。
Example "Key 4 (kTui) and 'key' (KXEE)
In the comparison, JRv=iui (v1=i+v,
=u, y, =i, n=3), ERv=EE Therefore, in comparing JRv and evl, v1=ev1□
Therefore, d1 = 1, and when comparing JRv and QV, v□≠evt2, d, = O1 Similarly, d n = 0 Therefore, d = maximum dx = d1 = 1 As above, it matches the reading of JRv Every time a reading candidate for ERvj (called cvjk) is found,
A penalty is obtained from the priority order of k and Table 6, and it is added to the degree of dissimilarity.

表6 E音素列の母音部のヨミの優先順位とペナルティ
− ただし、D5−■−(1)の調整によって、優先順位が
0のものが、該当音素の別候補として存在している場合
、ペナルティ−は(表6の値+1)とする。
Table 6 Priority and penalty for the reading of the vowel part of the E phoneme string - However, if a priority of 0 exists as another candidate for the corresponding phoneme by adjusting D5-■-(1), the penalty will be - is (value in Table 6 + 1).

また、d=nとなるev  が複数ある場合は、最小の
ペナルティ−をここでのペナルティ−とする。
Furthermore, if there are multiple ev's where d=n, the minimum penalty is taken as the penalty here.

マツチング終了時に、以下の条件を満たす場合は、該当
するペナルティ−を加算する。
At the end of matching, if the following conditions are met, the corresponding penalty will be added.

(i)  d<nの場合 ・d=oのとき(nX3)のペナルティ−を加算する ・d>Oのとき((n−d)X2)のペナルティ−を加
算する (ii)  d=nかっ、マツチングに使われなかった
E音素がある場合(余ったE音素数×2)のペナルティ
− 上記の例、「キーライJ  (kiui)と“k e 
y ”  (K X E E )では、v1=ev、、
=iかつCVllの優先順位=1よりペナルティ−0で
あるが、d=1、n=3より(i ) d < nかつ
d>Oを満たし、(3−1)×2=4のペナルティ−が
加算される。従ってペナルティ−合計は4となる。
(i) When d<n ・When d=o, add the penalty of (nX3) ・When d>O, add the penalty of ((nd-d)X2) (ii) When d=n , penalty when there is an E phoneme that was not used in matching (number of remaining E phonemes x 2) - In the above example, "kiui" and "ke
y ” (K X E E ), v1=ev,,
= i and CVll priority = 1, so the penalty is -0, but since d = 1 and n = 3, (i) satisfies d < n and d > O, and the penalty of (3-1) x 2 = 4 - is added. Therefore, the total penalty is 4.

b   の 41  F2  のマツチングJ音素列と
E音素列の対応チャンクにおいて。
In the corresponding chunks of matching J and E phoneme sequences of 41 F2 of b.

拗音の有無(F2)により表7のとおりペナルティ−を
定める。
Penalties are determined according to the presence or absence of persistent sounds (F2) as shown in Table 7.

表7 J音素列とE音素列のF2(拗音の有無)による
ペナルティ− J音素列の母音音素の長さ(Kとする)の定義KEF4
−F3 (c)ペナルティ−計算 表9によってペナルティ−を怪える。
Table 7 Penalty due to F2 (presence or absence of persistent consonant) of J phoneme string and E phoneme string - Definition of vowel phoneme length (denoted as K) of J phoneme string KEF4
-F3 (c) Calculate the penalty using the penalty calculation table 9.

表9 母音音素の畏さマツチングにおけるペナ(2)E
音素列の母音音素の長さ(Aとする)の定義AEA工+
A2 へ〇:音韻環境、つづりによる調整値(D5−■−(2
)) Aパ表4のF3、F4から表8によって与えられる値 表8 E音素列の母音音素の長さ(A2)ただし、日本
語のカナ表記上、ティーをチーデイをデーと書くことが
あるのでtiとte、cliとdeの組み合わせには、
ペナルティ−を与えない ■■で得た相違度をメモリの作業域に格納する。
Table 9 Pena (2) E in vowel phoneme awe matching
Definition of the vowel phoneme length (A) of a phoneme string AEA +
Go to A2〇: Adjustment value due to phonological environment and spelling (D5-■-(2
)) Values given by Table 8 from F3 and F4 in Table 4 of A-Pa Table 8 Length of the vowel phoneme of the E phoneme string (A2) However, in Japanese kana notation, Tee is sometimes written as Chee-day and Day. Therefore, the combinations of ti and te, cli and de,
The difference obtained by ■■ without giving a penalty is stored in the memory work area.

D7 文字表記レベルでの対応関係判定手段■ D6■
で得た相違度を入力とする。
D7 Correspondence determination method at character notation level■ D6■
The dissimilarity obtained in is input.

■ 適用ケースによって適当なしきい値を定める。■ Determine an appropriate threshold depending on the application case.

例えば、これを3とすると 相違度く3ならば両表記結果は対応するとみなす。For example, if this is 3 If the degree of difference is 3, both notation results are considered to correspond.

相違度=3ならば両表記結果は対応の可能性があるとみ
なす。
If the degree of difference is 3, it is considered that there is a possibility that the two notation results correspond.

相違度〉3ならば両表記結果は対応しないとみなす。If the degree of difference>3, it is assumed that the two notation results do not correspond.

のように対応関係判定を行なう。The correspondence relationship is determined as follows.

■ 出力は、例えばユーザへの表示の形で行なう。■ Output is performed, for example, in the form of a display to the user.

具体的な例としては校正システムにおいて「同一語に対
する複数表記結果が存在しています」という表示を出す
、などが考えられる。適用例はD17 D18を参照さ
れたい。
As a specific example, a proofreading system may display a message saying ``Multiple transcription results exist for the same word.'' For application examples, please refer to D17 and D18.

D8.  判定の具体例(英語表記結果とカナ表記結果
の比較) 例1:カナ表記結果「ファジー」と英語表記結果” f
 u z z y ”の対応関係判定を行なう。
D8. Specific example of judgment (comparison of English notation results and kana notation results) Example 1: Kana notation result “Fuzzy” and English notation result” f
uz z y ” is determined.

1、「ファジー」をD2.日 によりJ音素列=:haziに変換する。1. “Fuzzy” D2. Day is converted into J phoneme sequence=:hazi.

2、”hazi”をD4−■の表現形式に変換する。2. Convert "hazi" into the D4-■ expression format.

音素 ヨミ(RC/v):Fl:F2:F3:F4(拗
音)(長音)(促音) h   Rc=h     : ■  : O:a  
 Rv=a     : ■  ::O:Oz   R
c=z      : ■  : 0  :i   R
v=i      : ■  ::0:63 e  ”
f u z z y” を旦」」(量j」(牲注成手段
−によりE音素列=FXUH2XEEに変換する。
Phoneme reading (RC/v): Fl: F2: F3: F4 (persistent sound) (long sound) (continent sound) h Rc=h: ■: O:a
Rv=a: ■ ::O:Oz R
c=z : ■ : 0 : i R
v=i: ■::0:63 e”
f u z z y” is converted into E phoneme sequence = FXUH2XEE by means of sacrificial composition.

4、D4英語音 、日本語音素対・テープ少手により、
表4を使ってD4−■の表現形式に変換する。
4. D4 English sound, Japanese phoneme pair, by tape small hand,
Using Table 4, convert to the expression format of D4-■.

音素ヨミ(Rcv): Fl : F2  : F3 
 : F4(拗音)(促音)(長音) FX  Rc=h  :■ : 0 :Rc=b  :
■ : 0 : UHRv=a  :■ ::2:I Rv=o  :■ ::O:I Rv=u:■ ::1:0 Rv==e  :■ ::?:? Rv=i a :■ :    :?ニアZX  Rc
=z  :■ : 0 :Rc=s  :■ : 0 
: EE  Rv=i  :■ ::1:3Rv=ia:■
 :    :0   ニアRv=ie:■ ::O:
2 Rv=e  :■ ::2:1 5、4で得た変換M果をo5”     (7)   
P求災1毛段によって以下のように変更する。
Phoneme reading (Rcv): Fl: F2: F3
: F4 (persistent sound) (continuous sound) (long sound) FX Rc=h :■ : 0 :Rc=b :
■: 0: UHRv=a:■::2:I Rv=o:■::O:I Rv=u:■::1:0 Rv==e:■::? :? Rv=ia :■ : :? Near ZX Rc
=z :■ : 0 :Rc=s :■ : 0
: EE Rv=i :■ ::1:3Rv=ia:■
: :0 Near Rv=ie:■ ::O:
2 Rv=e :■ ::2:1 5. O5'' (7)
Changes are made as follows depending on P Disaster 1 Kedan.

D5−■−(1)該当項目なし D5−■−(2)の該当母音はUH,EEである。D5-■-(1) No applicable items The corresponding vowels in D5-■-(2) are UH and EE.

UH:D5−■−(2)−■(1) (if)よりA1
=O EE : D5−■−(2)−■(1) (it)より
A1=0 6.2で得た「ファジー」の表現と、4,5で得た“f
uzzy”の表現を使い、旦且皇亙yべ皮皿産皮1見毛
度により以下のように相違度を計算する。
UH: A1 from D5-■-(2)-■(1) (if)
=O EE: D5-■-(2)-■(1) From (it), A1=0 The expression of "fuzzy" obtained in 6.2 and the "f" obtained in 4 and 5
Using the expression "Uzzy", the degree of dissimilarity is calculated as follows based on the degree of hair growth of the skin.

(i)  チャンクへの分割 「ファジー」→(ha)  (zi) “fuzzy”−+ (FXUH)(ZXEE)チャン
ク数は、2で一致しているので第1マツチングを行なう
(i) Division into chunks "Fuzzy"→(ha) (zi) "fuzzy"-+ (FXUH) (ZXEE) Since the number of chunks is 2 and matches, the first matching is performed.

(n)  第1マツチング ・チャンク:hとFX である。(n) First matching ・Chunk: h and FX It is.

(JRc=ERc1)かつ(E Rclの優先順位=1
)なのでペナルティ−はOとなる。
(JRc=ERc1) and (E Rcl priority=1
), so the penalty is O.

・チャンク2:ZとZx である。・Chunk 2: Z and Zx It is.

同様にしてペナルティ−はOとなる。Similarly, the penalty becomes O.

相違度=0+0=0で子音部が一致していることがわか
った。
It was found that the consonant parts matched with the degree of difference = 0 + 0 = 0.

次に第2マツチングを行なう。Next, a second matching is performed.

(市)第2マツチング ・チャンク1:aとUH (a)ヨミ(Rv)のマツチング J  Rv =a 、 (b)拗音の有無(F2)のマツチングF2(ha)=
O1F2 (FXUH)=Oより、ペナルティ −はOとなる。
(City) Second matching chunk 1: a and UH (a) Matching of reading (Rv) J Rv = a , (b) Matching of presence/absence of persistent sound (F2) F2 (ha) =
Since O1F2 (FXUH)=O, the penalty becomes O.

(c)母音音素の長さ(F3、F4)のマツチング K (a) =O A (UH: a)=Al+A2=O+(1−2)=−
1 表9のに=OかつIAI≦1の条件に 該当するので、ペナルティ−は0とな る。
(c) Matching K of vowel phoneme lengths (F3, F4) (a) =O A (UH: a) = Al + A2 = O + (1-2) = -
1 Since the conditions of =O and IAI≦1 in Table 9 are met, the penalty is 0.

・チャンク2:iとEE (a)ヨミ(Rv)のマツチング J Rv zi 。・Chunk 2: i and EE (a) Matching readings (Rv) J Rv zi .

(J Rv = E RVIL)かつ(E RV、、の
優先順位=1)なので、ペナルティ −は0となる。
Since (J Rv = E RVIL) and (E RV, priority order = 1), the penalty is 0.

である。It is.

(J Rv = E Rv、、)かつ(E Rvl、の
優先順位=1)なのでペナルティ−は 0となる。
Since (J Rv = E Rv, ,) and the priority of (E Rvl, = 1), the penalty is 0.

(b)拗音の有無(I”2)のマツチングF2 (zi
)=Q、F2 (ZXEE)=Oよりペナルティ−はO
となる。
(b) Matching F2 (zi
) = Q, F2 (ZXEE) = O, the penalty is O
becomes.

(c)母音音素の長さ(F3、F4)のマツチング K  (i)  =6 A (EE : 1)=AI+A2=O+(3−1)=
2 表9のに≠0かつIK−AI≦4の条 件に該当するので、ペナルティ−は0となる。
(c) Matching of vowel phoneme lengths (F3, F4) K (i) = 6 A (EE: 1) = AI + A2 = O + (3-1) =
2 Since the conditions in Table 9 of ≠0 and IK-AI≦4 are met, the penalty is 0.

以上より、相違度二〇である。From the above, the degree of difference is 20.

7、D7文   レベルでの対 関     により「
ファジー」と“fuzzy”は対応すると判定される。
7. D7 Sentence level relationship “
It is determined that "fuzzy" and "fuzzy" correspond.

例2:英語表記結果” Q u p ”に対して、カナ
表記結果1 「カップ」、2「コツプ」、3「カーブJ
の3つを入力した場合の判定を行なう。
Example 2: For the English notation result “Q u p”, the kana notation results 1 “cup”, 2 “kop”, 3 “curve J”
A judgment is made when three of the above are input.

l 、  II cuPIIのEf素列は(KXUH)
(PX)(()はチャンクを表わす)となる。表4より
変換結果 、゛[↑素ヨミ(Rev):Fl:F2:  F3  
:  F4(拗音)(促音) (長音) KXRc=に:■ : 0 : Rc=g:■ : 0 : Rc=c:■ : 0 : UHRv=a:■ :   :2:I Rv=o:■ :   :O:I Rv=u  :■ :1:  1  :  0Rv=e
  :■ :   :?:? Rv=ia:■ :   :?:? PX  Rc=P  :■ : 0 :を得る。
The Ef prime sequence of l, II cuPII is (KXUH)
(PX) (() represents a chunk). From Table 4, the conversion results are as follows.
: F4 (continuous sound) (continental sound) (long sound) KXRc=ni:■ : 0 : Rc=g:■ : 0 : Rc=c:■ : 0 : UHRv=a:■ : :2:I Rv=o:■ : :O:I Rv=u :■ :1: 1 :0Rv=e
:■ : :? :? Rv=ia: ■ : :? :? PX Rc=P : ■ : 0 : is obtained.

2、調整規則を使って1の変換結果を変更する。2. Modify the conversion result of 1 using adjustment rules.

D5−■−(1):該当項目なし D5−の−(2):対象となる母音音素はUH■(1)
(市)よりA1=−1 3、カナ表記結果1「カップ」と” c u p ”の
相違度を求める。
D5-■-(1): No applicable item D5-'s-(2): Target vowel phoneme is UH■(1)
(City), A1=-1 3, kana notation result 1 Find the degree of difference between "cup" and "cup".

J音素列は(kみ)(pu)(()はチャンクを表わす
) (i)  チャンク数は2で等しいので、第1マツチン
グを行なう。
The J phoneme sequence is (k) (pu) (() represents chunks) (i) Since the number of chunks is equal to 2, the first matching is performed.

(ii)  第1マツチング ・チャンクににとKXのマツチングによりペナルティ−
0 ・チャンク2:pとPXのマツチングによりペナルティ
−〇 (iii)  第2マツチング ・チャンク1:aとUH (a)ヨミ(Rv)のマツチング JRv=ERv、、(UH: a)でペナルティ−0 (b)拗音の有無(F2)のマツチングF2 (ka)
=F2(KXUH)=Oでペナルティ−0 (c)母音音素の長さ(F3、F4)のマツチング K(a)=−6 A  (UH:  a)=A1+A2=−1+(1−2
)=−2 表9のに≠Oかつl K−A I≦4の条件に該当し、
ペナルティ−0 °チャンク2: E音素列第2チャンク(px)が子音で終わっているの
で、D4■より+Vの母音を補足して比較する。
(ii) Penalty due to matching of KX to the first matching chunk.
0 - Chunk 2: Penalty for matching p and PX - 〇 (iii) Second matching chunk 1: a and UH (a) Matching reading (Rv) JRv = ERv,, (UH: Penalty - 0 for a) (b) Matching of presence/absence of persistent sounds (F2) F2 (ka)
= F2 (KXUH) = Penalty -0 for = O (c) Matching vowel phoneme length (F3, F4) K (a) = -6 A (UH: a) = A1 + A2 = -1 + (1-2
)=-2 In Table 9, the conditions of ≠O and lK-A I≦4 are met,
Penalty -0 ° Chunk 2: Since the second chunk (px) of the E phoneme sequence ends with a consonant, the +V vowel is captured from D4■ and compared.

従って、J母音音素=UとE補足母音音素(+v)=u
を比較することになり(a)。
Therefore, J vowel phoneme = U and E supplementary vowel phoneme (+v) = u
We will compare (a).

(b)、(c)とも一致し、ペナルティ−〇となる。Both (b) and (c) match, resulting in a penalty of -0.

以上より相違度(“cup    rカップ」)=0と
なる。
From the above, the degree of difference (“cup r cup”)=0.

4、カナ表記結果2「コツプ」と“a u p ”の相
違度を求める。
4. Calculate the degree of difference between kana notation result 2 “kotsupu” and “a u p”.

J音素列は(kみ)(pu)(()はチャンクを表わす
) (i)  チャンク数は2で、一致する。
The J phoneme sequence is (k) (pu) (() represents a chunk) (i) The number of chunks is 2 and they match.

(it)  第1マツチング 3、の場合と同様にしてペナルティ−〇となる (iii)  第2マツチング 3、の場合と比べると、チャンク1の母音部(0)が違
うだけなので″み″とxi U Hppの比較について
述べる。
(it) As in the case of the first matching 3, the penalty becomes -〇. (iii) Compared to the case of the second matching 3, only the vowel part (0) of chunk 1 is different, so "mi" and xi A comparison of U Hpp will be described.

(a)  ヨミ(Rv)のマツチング J Rv −E Rv x x (U H: o )で
ERVtzの優先順位が2のためペナルティ−は+1と
なる。
(a) In reading (Rv) matching J Rv -E Rv x x (U H: o), the priority of ERVtz is 2, so the penalty is +1.

(b)  拗音の有無(F2)のマツチングF 2  
(k o)  = F 2  (KXUH)  =0よ
りペナルティ−はOとなる。
(b) Matching of presence/absence of persistent sounds (F2) F2
Since (k o) = F 2 (KXUH) = 0, the penalty is O.

(c)  母音音素の長さ(F3、F4)のマツチング K(る)=−6 A  (UH: o)=AI+A2=−1+(1−0)
=0 表9のKf−Oかつl K−A I =6の条件に該当
し、ペナルティ−は+1となる。
(c) Matching of vowel phoneme lengths (F3, F4) K(ru)=-6 A (UH: o)=AI+A2=-1+(1-0)
=0 The conditions of Kf-O and l K-A I =6 in Table 9 are met, and the penalty is +1.

以上より相違度(“c u p 11−「コツプ」)=
+1+1=2となる。
From the above, the degree of dissimilarity (“c u p 11 - “kotup”) =
+1+1=2.

5、カナ表記結果3「カーブ」と“Q u p ”の相
違度を求める。
5. Find the degree of difference between kana notation result 3 “curve” and “Q u p ”.

J音素列は(ka)(pu)(()はチャンクを表わす
) (i)チャンク数は2で、一致する。
The J phoneme sequence is (ka) (pu) (() represents a chunk) (i) The number of chunks is 2 and they match.

(n)第1マツチング 3、の場合と同様にして、ペナルティ−〇となる。(n) First matching Similarly to case 3, the penalty becomes -0.

(nu)第2マツチング 3、の場合と比べて、チャンク1の母音部に)が違うだ
けなので、′a”と“UH”の比較について述べる。
(nu) Compared to the case of second matching 3, the only difference is the vowel part of chunk 1), so a comparison between ``a'' and ``UH'' will be described.

(a)ヨミ(Rv)のマツチング JRv=ERv、、(UH: a)で、ペナルティ−0 (b)拗音の有無(F2)のマツチングF2 (ka)
=F2 (KXUH)=Oで、ペナルティ−0 (c)母音音素の長さ(F3、F4)のマツチング K (a) =+6 A (UH: a)=A1+A2=−1+(1−2)=
−2 表9のに≠0かつ1K−AI>7(…)(a)に該当し
、ペナルティ−は+3となる。
(a) Matching of reading (Rv) JRv=ERv,, (UH: a), penalty -0 (b) Matching of presence/absence of persistent sound (F2) F2 (ka)
= F2 (KXUH) = O, penalty -0 (c) Matching K of vowel phoneme length (F3, F4) (a) = +6 A (UH: a) = A1 + A2 = -1 + (1-2) =
-2 In Table 9, ≠0 and 1K-AI>7 (...) (a) apply, and the penalty - is +3.

以上より相違度(″cupH−rカップ」)=3となる
From the above, the degree of difference (“cupH−r cup”)=3.

6、D7のしきい値を使って“Qup”と上記3つのカ
ナ表記との対応関係判定を行なうと、rカップ」、「コ
ツプ」は対応する 14Q u p ”と「カーブ」は対応の可能性がある
(似ている)となる。
6. When determining the correspondence between "Qup" and the above three kana notations using the threshold value of D7, it is found that "r cup" and "kotsupu" correspond to 14. "Q u p" and "curve" can correspond. There is a gender (similarity).

D9.辞書との併用 原音とかけはなれたヨミを生じさせる表記が定着した外
来語、例えば” s a 11 a d”と「サラダ」
、“doQfiar”と「ドル」の場合は、辞書を併用
することによって精度を上げることができる。
D9. Used in combination with a dictionary Foreign words that have been written to sound far apart from the original sound, such as "s a 11 a d" and "salad"
, "doQfiar" and "dollar", accuracy can be improved by using a dictionary together.

このような外来語は、既に日本語であるという意識の強
いものであり、数も限られているため、このような辞書
を用意するのは、容易である。
Such foreign words have a strong sense of being Japanese and are limited in number, so it is easy to prepare such a dictionary.

Dlo、カナ表記間の対応関係判定システムカタカナ表
記−ひらがな表記、カタカナ表記−カタカナ表記間の対
応関係判定について述べる。
Dlo, a system for determining the correspondence between katakana and hiragana notations, and a system for determining the correspondence between katakana and hiragana, and katakana and katakana.

ひらがなとカタカナは一対一対応であるので、カタカナ
表記間の対応関係判定についてのみ、第2図、第3図を
使って説明する。
Since hiragana and katakana have a one-to-one correspondence, only the determination of the correspondence between katakana notations will be explained using FIGS. 2 and 3.

第2図、第3図の違いは、関連ヨミ対応手段の有無であ
る。対応関係判定の対象となる雨音素列で、拗音の有無
、母音音素のヨミ(促音、長音の違いは無視する)で一
致しないものがあるとき。
The difference between FIG. 2 and FIG. 3 is the presence or absence of related reading handling means. When there are rain phoneme strings that are subject to correspondence determination that do not match in the presence or absence of persistent consonants and vowel phoneme readings (ignoring differences in consonants and long consonants).

これを使う。Use this.

以下、D11〜015で、第2図に示された各手段の詳
細を説明する。
Hereinafter, the details of each means shown in FIG. 2 will be explained in D11 to D015.

D110日本語音素列生成手段 D2と同様に行なう。D110 Japanese phoneme string generation means Do the same as D2.

D12.関連ヨミ対応手段 ■ Dllで得た日本語音素列のどちらか一方を入力と
する。
D12. Related Reading Measures ■ Input either one of the Japanese phoneme strings obtained by Dll.

■ ■の)コ本語音素列のうち、表10のXlに−致し
、かつ〈条件〉を満たすものがあるとき、関連ヨミ (
X2)を対応させる。
■ If there is a phoneme string in the original language (from
Make X2) correspond.

Xがj以外の日本語音素(列)を表わすとすると、D4
−■で述べた表現形式のR,Fiとの関係は1次のとお
りである。
If X represents a Japanese phoneme (sequence) other than j, then D4
The relationship between R and Fi of the expression format described in -■ is as follows.

X−)ヨミ(R)=x、F2(拗音)=0、F3(促音
)=0、F4(長音)=O X→ヨミ(R)= x 、  F 2 (拗音)=O,
F3 (促音)=0、F4 (長音)=6 e′が表10の e−+1(F1=2)<3チャンク以上から構成されて
おり、かつe の後続子音かに、t、P。
X-) Reading (R) = x, F2 (persistent sound) = 0, F3 (consonant sound) = 0, F4 (long sound) = O
F3 (consonant) = 0, F4 (long consonant) = 6 e' is composed of e-+1 (F1 = 2) < 3 chunks or more in Table 10, and the consonants following e are t, P.

s、hである。〉 に該当するため、i′を関連ヨミとみなし、変換結果は
次のようになる。
s, h. 〉, so i' is regarded as a related reading, and the conversion result is as follows.

■ ■で得た結果をメモリの作業域に格納する。■ Store the results obtained in ■ in the memory work area.

表100日本語音素列における関連ヨミ表z−+ヨミ(
R)=x、F2(拗音)=0、F3(促音)=6、F4
 (長音)=O Xをx、x、妄のどれかを表わすとするとX j−+ヨ
ミ (R)=x、F2 (拗音)=3、F3=F3 (
X)、F4=F4 (X)例  「レポートJ  ((
r eNp oHt o))のD13.音素レベル相違
度計算手段 ■ Dllで得た日本語音素列(J音素列という)とD
12■で得た日本語音素列(J’音素列という)を入力
とする。
Table 100 Related reading table for Japanese phoneme sequences z-+ reading (
R) = x, F2 (continent) = 0, F3 (consonant) = 6, F4
(Long sound) = O If X represents x, x, or delusion, then
X), F4=F4 (X) Example “Report J ((
r eNp oHt o)) D13. Phoneme level difference calculation means■ Japanese phoneme string obtained with Dll (referred to as J phoneme string) and D
The Japanese phoneme string (referred to as the J' phoneme string) obtained in 12■ is input.

■ J音素列、J′音素列の相違度を、以下の手順に従
って計算する。
■ Calculate the degree of difference between the J phoneme string and the J' phoneme string according to the following procedure.

最初にチャンク数マツチングを行なう (1)  チャンク数が2以上異なる場合、(■)チャ
ンク数が1異なる場合の処理は、D6−■−1の(1)
(U)と同様6 (m)  チャンク数が一致している場合。
First, match the number of chunks (1) If the number of chunks differs by 2 or more, (■) If the number of chunks differs by 1, the process is D6-■-1 (1)
Same as (U) 6 (m) When the number of chunks matches.

(1)第1マツチング D6−■−2と同様に行なう。(1) First matching Proceed in the same manner as D6-■-2.

(2)第2マツチング (1)の第1マツチングで、すべてのチャンクの子音部
が一致したとみなされた場合、J音素列、J′音素列に
ついて次の3項目のマツチングを行なう、相違度は該当
項目のペナルティ−の総和とする。
(2) Second matching If the consonant parts of all chunks are considered to match in the first matching of (1), the following three items are matched for the J phoneme string and J' phoneme string, and the degree of dissimilarity is determined. is the sum of penalties for the applicable items.

(a)母音部のヨミ(Rv)のマツチングマツチングの
しかたはD6−■−3− (a)と同様−(J’RvがERvに当たる、)ペナル
ティ−は、表6のかわりに表11を使う。
(a) Matching of vowel reading (Rv) Matching method is D6-■-3- Same as (a) - (J'Rv corresponds to ERv) Penalty - Table 11 instead of Table 6 use.

表11.J’音素列の母音部のヨミの (b)拗音の有無(F2)のマツチングD6−■−3−
(b)と同様 (c)各チャンク最後の母音音素の長さ(F3、F4)
のマツチング J音素列の各チャンク最後の母音音素 の長さをに、J’音素列の各チャンク最後の母音音素の
長さをに′とするとき(K、に’の定義は、D6−■−
3−(c)同様(F4−F3)とする)、K、に’の組
み合わせによるペナルティ−を表12のように定める。
Table 11. (b) Matching of vowel part reading of J' phoneme string (b) Presence or absence of persistent sound (F2) D6-■-3-
Same as (b) (c) Length of the last vowel phoneme of each chunk (F3, F4)
Matching When the length of the last vowel phoneme of each chunk of the J phoneme string is , and the length of the last vowel phoneme of each chunk of the J' phoneme string is , then the definition of K, ni' is D6-■ −
3-(c) Same as (F4-F3)), the penalty due to the combination of K and ni' is determined as shown in Table 12.

表12.母音音素の長さマツチングに ■■で得た相違度をメモリの作業域に格納する。Table 12. For length matching of vowel phonemes Store the dissimilarity obtained in ■■ in the memory work area.

D140文字表記レベルでの対応関係判定手段D7と同
様に行なう。
D140 Correspondence determining means at character notation level This is performed in the same manner as D7.

D15.対応関係判定の具体例(カナ表記結果同士の比
較) カナ表記結果「レポート」と「リポート」の対応関係判
定を行なう。
D15. Specific example of correspondence relationship determination (comparison of kana notation results) The correspondence relationship between the kana notation results “report” and “report” is determined.

1、上記のカナ表記結果を、Dll日    生皮1反
により音素列に変換する。
1. Convert the above kana notation result into a phoneme string using Dll day rawhide 1 roll.

「レポート」のJ音素列= r e p o t 。J phoneme sequence of “report” = r e p o t.

「リポート」のJ′音素列=rip百t。J′ phoneme sequence of “report” = rip 100t.

2、J音素列(repoto)をD4−■の表現形式に
変換する。
2. Convert the J phoneme string (repoto) into the D4-■ expression format.

音素 ヨミ(Rc/v): Fl : F2 : F3
 : F4(拗音)(促音)(長音) r    Rc=r:  ■ :  O:e    R
v=e:  ■ :     :O:     。
Phoneme reading (Rc/v): Fl: F2: F3
: F4 (continuous sound) (continuous sound) (long sound) r Rc=r: ■ : O:e R
v=e: ■: :O: .

p   Rc=p:  ■ :  O:o   Rv=
o:  ■ :    :O:    6t    R
c=t:  ■ :  0 :o    Rv=o: 
 ■ :     :0:     03.2と同様に
して J′音素列(ripoto)をD4−@の表現形式に変
換する。
p Rc=p: ■ : O:o Rv=
o: ■ : :O: 6t R
c=t: ■ : 0 :o Rv=o:
■ : :0: Similarly to 03.2, convert the J' phoneme sequence (ripoto) into the D4-@ expression format.

4、JT音素列にD12   ヨミ・・  を適用する
と、該当音素は“i°′のみである。従って以下の結果
を得る。
4. When applying D12 Yomi... to the JT phoneme string, the only corresponding phoneme is "i°'. Therefore, the following result is obtained.

音素 ヨミ(RC/v): Fl : F2 : F3
 : F4(促音)(拗音)(長音) i    i : ■ ::O:O l    e : ■ ::O:0 その他の音素はJ音素列と同じ。
Phoneme reading (RC/v): Fl: F2: F3
: F4 (consonant) (persistent) (long) i i : ■ :: O: O l e : ■ :: O: 0 Other phonemes are the same as the J phoneme sequence.

5゜2と4で得た結果についてD13音素レベル相違計
算手段により相違度を計算する。
The degree of difference is calculated for the results obtained in 5°2 and 4 using the D13 phoneme level difference calculation means.

J音素列のチャンクは(r e)(p o)(t o)
J′音素列  tr   (r imp o)(t o
)となり、第1チヤンクの母音音素11 eI7とi″
のみ異なっているため、この2つのマツチングについて
のみ述べる。
The chunks of the J phoneme sequence are (r e) (p o) (t o)
J′ phoneme sequence tr (r imp o) (t o
), and the vowel phoneme 11 of the first yank eI7 and i''
Only the matching of these two will be described.

J音素CはJ′音素iの関連ヨミC(優先順位=2)と
一致しているため1表11よりペナルティは+2である
Since the J phoneme C matches the related reading C (priority = 2) of the J' phoneme i, the penalty is +2 from Table 11.

以上より相違度(「レポート」−「リポート」)=2と
なる。
From the above, the degree of difference (“report”−“report”)=2.

6、D14文 表記レベルでの   係より、「レポー
ト」と「リポート」は“対応する″と判定する。
6. Sentence D14 Based on the relationship at the notation level, it is determined that "report" and "report" are "corresponding."

D16.他の文字表記への拡張 以上1本発明をカナ表記間および英語表記−カナ表記間
の対応関係判定システムについて説明したが、他の表記
、例えば仏語表記−カナ表記間の同様のシステムに本発
明を適用することも可能である。その場合、上記の英語
音素列生成手段に代えて仏語音素列生成手段を準備する
必要があるが、仏語つづりから仏語発音記号列を生成す
るアルゴリズムは知られているので、準備は容易である
D16. Expansion to other character notations Although the present invention has been described above as a system for determining the correspondence between kana notations and between English notation and kana notation, the present invention can also be applied to a similar system for other notations, such as between French notation and kana notation. It is also possible to apply In that case, it is necessary to prepare a French phoneme string generation means in place of the above-mentioned English phoneme string generation means, but since algorithms for generating French phoneme strings from French spellings are known, the preparation is easy.

またカナと同様に、発音を基に作られた文字としてハン
グル文字があるが1本発明の思想をそのまま適用すれば
、英語表記−ハングル表記間対応関係判定システムを作
成することも可能であるD17.適用例■・・・日本語
ワードプロセッサにおける校正システムの一機能 日本語ワードプロセッサの校正システムに、本発明を適
用して、外来語表記のばらつき検出を行なう例を第4図
を使って説明する。
Furthermore, like Kana, there are Hangul characters that are created based on pronunciation.1 If the idea of the present invention is applied as is, it is also possible to create a system for determining the correspondence relationship between English and Hangul notations.D17 .. Application Example 2: A function of a proofreading system in a Japanese word processor An example in which the present invention is applied to a proofreading system in a Japanese word processor to detect variations in foreign word notation will be described with reference to FIG.

第4図の符号:説明 1:ユーザはキーボードを使ってコン ピュータに、日本語テキストを入 力する。Symbols in Figure 4: Explanation 1: The user uses the keyboard to control Enter Japanese text into your computer. Strengthen.

2ニジステムは、入力されたテキスト より、カタカナ列(カタカナ表記 結果)、アルファベラ1−列(ここ では英語表記結果とする)をとり 出す。The second system is the input text From katakana string (katakana notation) result), Alphabella 1-column (here Let's take the English notation result) put out.

3:2で得た表記結果の任意の2つの 組み合わせ中、アルファベット列 一アルファベット列の組み合わせ を除いたものすべての対に対して。3: Any two of the notation results obtained in 2 In combination, alphabet string combination of one alphabet string For all pairs except .

4〜6に従って相違度計算を行な う。Perform dissimilarity calculation according to steps 4 to 6. cormorant.

4:チャンク数マツチングを行なう。4: Perform chunk number matching.

ペナルティ−の総和を相違度とす る。The total sum of penalties is the degree of dissimilarity. Ru.

5:4で一致したとみなされるものに ついてのみ、第1マツチングを行 なう。相違度にペナルティ−を加 算する。5:4 to be considered a match Only then, perform the first matching. Now. Add penalty to dissimilarity Calculate.

6:5で一致したとみなされるもめに ついてのみ、第2マツチングを行 なう。相違度にペナルティ−を加 算する。In a conflict that is considered to be a 6:5 agreement. Perform the second matching only when Now. Add penalty to dissimilarity Calculate.

7:相違度が、あらかじめ定めたしき い値以下なら、これらの表記結果 は、同一語の表記のばらつきであ ると判定する。7: The degree of difference is as determined in advance If the value is less than or equal to the value, these notation results is the variation in spelling of the same word. It is determined that

8ニアで表記のばらつきと判定された 表記結果対について、デイスプレ ィ装置を通じて、例えば文字表示 の色を変えることによって、ユー ザに警告する。It was determined that there was a discrepancy in the notation at 8 near. For notation result pairs, display e.g. character display through a digital device. By changing the color of Warn the.

9:ユーザは、警告に従って、必要で あれば表記結果を統一する。9: The user must follow the warning and If possible, standardize the notation results.

10ニジステムは、修正されたテキストを例えばディス
クD1に書き込み、 保存する。
10 system writes and saves the modified text, for example on disk D1.

D18.適用例■・・・情報検索システム本発明の文献
検索システムへの適用例を第5図を使って説明する。た
だし、入力キーワードがカタカナ表記か英語表記の場合
にのみ、本発明を適用した効果が得られるので、以下、
キーワードがこれらの表記のどちらかで書かれていると
仮定する。
D18. Application example (1) Information retrieval system An example of application of the present invention to a document retrieval system will be described with reference to FIG. However, the effect of applying the present invention can be obtained only when the input keyword is written in Katakana or English.
Assume that the keyword is written in one of these notations.

第5図の符号:説明 11:ユーザはキーボードよりコンピュータに、検索し
たい文献のキーワ ードを入力する。(1−KWDと する) 12ニジステムは文献データベースD2から、各文献の
キーワードを読み 込む、(これをP  K W D I J ;i:文献
番号、j:キーワード番 号とする) 13:P  KWDijとI−KWDの相違度を計算す
る。
Reference numerals in FIG. 5: Explanation 11: The user inputs the keyword of the document to be searched into the computer from the keyboard. (Let it be 1-KWD) 12 System reads the keyword of each document from the literature database D2 (Let this be P K W D I J ; i: document number, j: keyword number) 13: P KWDij and I - Calculate the KWD dissimilarity.

14:相違度があらかじめ定めたしきい値以下なら、こ
の対は対応すると みなす。
14: If the degree of dissimilarity is less than or equal to a predetermined threshold, the pair is considered to correspond.

J、5:対応するとみなされたキーワード(p−Kwo
i、j)をもつ文献 (i)の情報を1文献データベース から読み込む。
J, 5: Keywords considered to correspond (p-Kwo
Information on document (i) with i, j) is read from the 1-document database.

16:デイスプレィ端末に15で得た情報を表示する。16: Display the information obtained in 15 on the display terminal.

従来のシステムでは、I−KWDと完全に一致したP−
KWDijLか許さなかったため、キーワードに表記の
ばらつきがある場合、それらをすべて文献キーワードに
含むか、ユーザに統一表記で入力するよう要請するしか
なかった。しかし。
In the conventional system, P-KWD completely matches I-KWD.
Because KWDijL was not allowed, if there were variations in the notation of keywords, the only option was to include them all in the literature keywords or request the user to input them in a uniform notation. but.

このシステムでは、カナ、英語表記間のばらつきについ
て相違度が計算できるので、ユーザは例えば入力キーワ
ード「ファン」で文献キーワード「ファジーJ、rハシ
」、“fuzzy”などをもつ文献を得ることができる
This system can calculate the degree of dissimilarity between kana and English spellings, so users can, for example, use the input keyword ``fan'' to obtain documents with document keywords ``fuzzy J, r hashi'', ``fuzzy'', etc. .

E、効果 本発明によれば、辞書を用いた従来の文字表記結果対応
関係判定システムと比較して。
E. Effects According to the present invention, compared to a conventional character notation result correspondence determination system using a dictionary.

・あらかじめ外来語表記辞書を作る必要がな・新造語1
派生語、固有名詞の辞書への登録といった継続的更新の
必要がない という長所がある。
・No need to create a foreign word notation dictionary in advance ・Newly coined word 1
It has the advantage that there is no need for continuous updates such as registration of derived words and proper nouns in the dictionary.

さらに、本発明をカナ表記結果同士の判定システムに限
って適用した場合でも、従来の統一表記間での対応関係
(一致・不一′9X)を判定するシステムに比べて ・適当なしきい値を設定することにより1表記のばらつ
きと判定するものの範囲を変えることができる。
Furthermore, even when the present invention is applied only to a system for determining the results of kana notation, an appropriate threshold value can be set compared to the conventional system for determining the correspondence relationship (match/discrepancy'9X) between unified notations. By setting, it is possible to change the range of what is determined to be a variation in one notation.

・また、より対応関係の強いものから順に表示できる という長所がある。・Also, you can display items in descending order of correspondence. There is an advantage.

【図面の簡単な説明】 第1図は1本発明を適用した英語表記−カナ表記間の対
応関係判定システムの実施例を示すための図、 第2図および第3図は1本発明を適用した、カナ表記間
の対応関係判定システムの実施例を示すだめの図。 第4図は、本発明の日本語ワードプロセッサにおける校
正システムへの適用例を説明するための図。 第5図は、本発明の情報検索システムへの適用例を説明
するための図である。 出願人  日本アイ・ビー・エム株式会社代理人  弁
理士  頓  宮  孝 (外1名) カナ表記后也果 箪1図 英悟表記結果 カクカナSL己結果。 「レホ゛−←」 ひもかt/カタカナ表記結襄 「りぽ−と」/「り才S−ト」 日本筒音素列 repδt0 日本横1に電炉」 rip5t。 相濃菌 =2 相遭良二〇 笛2図 カフカナ表記糸告果 「フ7 :/−J ひらか−/カタカナ表記結果 「13、おし」/「フ7シ」 日本語音#白1 aZ 日本を吾音素列 az 相違度:0 第3図
[BRIEF DESCRIPTION OF THE DRAWINGS] Fig. 1 is a diagram showing an embodiment of a correspondence determination system between English notation and kana notation to which the present invention is applied; Fig. 2 and 3 are to which the present invention is applied. FIG. 2 is a schematic diagram showing an embodiment of a correspondence relationship determination system between kana notations. FIG. 4 is a diagram for explaining an example of application of the present invention to a proofreading system in a Japanese word processor. FIG. 5 is a diagram for explaining an example of application of the present invention to an information search system. Applicant IBM Japan Co., Ltd. Agent Patent Attorney Takashi Tonmiya (1 other person) Kana notation Houya Katan 1 illustration Eigo notation result Kakakana SL self result. ``Reho-←'' Himokat/Katakana notation combination ``Riport''/``Risai S-to'' Japanese tube phoneme sequence repδt0 Nihon Yoko 1 ni electric furnace'' rip5t. Ainobacteria = 2 Aien Ryo 20 Flute 2 Kafukana notation Thread confession "F7: / - J Hiraka - / Katakana notation result "13, Oshi" / "Fu7shi" Japanese sound # White 1 aZ Japan A phoneme sequence az Dissimilarity: 0 Figure 3

Claims (5)

【特許請求の範囲】[Claims] (1)第一の文字表記法による表記結果と第二の文字表
記法による表記結果の対応関係を判定するシステムであ
って、 (a)第一の文字表記法による表記結果を第一の音素群
から選んだ音素からなる音素列に変換する手段と、 (b)第二の文字表記法による表記結果を第二の音素群
から選んだ音素からなる音素列に変換する手段と、 (c)上記第二の音素群の各音素に対応する第一の音素
群のなかの一又は複数の音素を生成するためのテーブル
手段と、 (d)上記(a)の手段を使つて上記第一の文字表記法
による表記結果を変換して得られた音素列と、上記(b
)及び(c)の手段を使つて上記第二の文字表記法によ
る表記結果を変換して得られた一又は複数の音素列とを
比較して、上記第一の音素群レベルでの相違度を計算す
る手段と、 (e)上記第一の音素群レベルでの相違度に基づいて、
上記第一の文字表記法による表記結果と上記第二の文字
表記法による表記結果の対応関係を判定する手段 とを備えたことを特徴とする文字表記結果の対応関係判
定システム。
(1) A system for determining the correspondence between a notation result by a first character notation method and a notation result by a second character notation method, the system comprising: (a) converting the notation result by the first character notation method into a first phoneme; (b) means for converting the notation result by the second writing system into a phoneme string consisting of phonemes selected from the second phoneme group; (c) (d) table means for generating one or more phonemes in the first phoneme group corresponding to each phoneme in the second phoneme group; (d) using the means in (a) above to generate the first phoneme; The phoneme string obtained by converting the notation result according to the character notation method and the above (b
) and one or more phoneme strings obtained by converting the notation result according to the second character notation method using the means of (c), and determine the degree of difference at the first phoneme group level. (e) Based on the degree of difference at the first phoneme group level,
A system for determining a correspondence relationship between character notation results, comprising means for determining a correspondence relationship between a notation result according to the first character notation method and a notation result according to the second character notation method.
(2)第一の文字表記法による表記結果と第二の文字表
記法による表記結果の対応関係を判定するシステムであ
つて、 (a)第一の文字表記法による表記結果を一群の音素か
ら選んだ音素からなる音素列に変換する手段と、 (b)第二の文字表記法による表記結果を上記一群の音
素から選んだ音素からなる音素列に変換する手段と、 (c)上記一群の少なくとも一部を占めるサブ・グルー
プの音素毎に、当該音素と関連性を持つ上記一群の音素
の中の一又は複数の音素を生成するためのテーブル手段
と、 (d)上記(a)の手段を使つて上記第一の文字表記法
による表記結果を変換して得られた音素列と、上記(b
)及び(c)の手段を使つて上記第二の文字表記法によ
表記結果を変換して得られた一又は複数の音素列とを比
較して、上記一群の音素レベルでの相違度を計算する手
段と、 (e)上記一群の音素レベルでの相違度に基づいて、上
記第一の文字表記法による表記結果と上記第二の文字表
記法による表記結果の対応関係を判定する手段 とを備えたことを特徴とする文字表記結果の対応関係判
定システム。
(2) A system for determining the correspondence between a notation result according to a first character notation method and a notation result according to a second character notation method, comprising: (a) a notation result according to a first character notation method from a group of phonemes; (b) means for converting the notation result by the second character notation method into a phoneme string consisting of the phonemes selected from the above group of phonemes; Table means for generating, for each phoneme of a sub-group that occupies at least a portion, one or more phonemes from the group of phonemes that are related to the phoneme; (d) the means of (a) above; The phoneme string obtained by converting the notation result according to the first character notation method using
) and (c) to compare the notation result with one or more phoneme strings obtained by converting the notation result to the second character notation method, and determine the degree of difference at the phoneme level of the group. (e) means for determining the correspondence between the notation result according to the first character notation method and the notation result according to the second character notation method based on the degree of difference at the phoneme level of the group; A correspondence determination system for character notation results, characterized by comprising:
(3)同一の文字表記法による第一の表記結果と第二の
表記結果の対応関係を判定するシステムであつて、 (a)上記文字表記法による表記結果を一群の音素から
選んだ音素からなる音素列に変換する手段と、 (b)上記一群の少なくとも一部を占めるサブ・グルー
プの音素毎に、当該音素と関連性を持つ上記一群の音素
の中の一又は複数の音素を生成するためのテーブル手段
と、 (c)上記(a)の手段を使つて上記第一の表記結果を
変換して得られた音素列と、上記(a)及び(b)の手
段を使つて上記第二の表記結果を変換して得られた一又
は複数の音素列とを比較して、上記一群の音素レベルで
の相違度を計算する手段と、 (d)上記一群の音素レベルでの相違度に基づいて、上
記第一の文字表記法による表記結果と上記第二の文字表
記法による表記結果の対応関係を判定する手段 とを備えたことを特徴とする文字表記結果の対応関係判
定システム。
(3) A system for determining the correspondence between a first notation result and a second notation result based on the same character notation method, which (a) determines the notation result by the above character notation method from a phoneme selected from a group of phonemes; (b) for each sub-group phoneme that occupies at least a portion of the group, one or more phonemes from the group of phonemes that are related to the phoneme are generated; (c) a phoneme string obtained by converting the first transcription result using the means (a) above; (d) means for calculating the degree of dissimilarity at the phoneme level of the group by comparing one or more phoneme strings obtained by converting the notation results of (d) the degree of dissimilarity at the phoneme level of the group; A correspondence relationship determination system for character notation results, comprising means for determining a correspondence relationship between a notation result by the first character notation method and a notation result by the second character notation method, based on the above.
(4)第一の文字表記法による表記結果と第二の文字表
記法による表記結果の対応関係を判定するシステムであ
つて、 (a)第一の文字表記法による表記結果を一群の音素か
ら選んだ音素からなる音素列に変換する手段と、 (b)第二の文字表記法による表記結果を上記一群の音
素から選んだ音素からなる音素列に変換する手段と、 (c)上記(a)の手段を使つて上記第一の文字表記法
による表記結果を変換して得られた音素列と、上記(b
)の手段を使つて上記第二の文字表記法による表記結果
を変換して得られた音素列とを比較して、上記一群の音
素レベルでの相違度を計算する手段と、 (d)上記一群の音素レベルでの相違度に基づいて、上
記第一の文字表記法による表記結果と上記第二の文字表
記法による表記結果の対応関係を判定する手段 とを備えたことを特徴とする文字表記結果の対応関係判
定システム。
(4) A system for determining the correspondence between a notation result according to a first character notation method and a notation result according to a second character notation method, the system comprising: (b) means for converting the notation result by the second character notation method into a phoneme string consisting of the phonemes selected from the group of phonemes; (c) the above (a) ), the phoneme string obtained by converting the notation result according to the first character notation method, and the above (b
(d) means for calculating the degree of difference at the phoneme level of the group of phonemes by comparing the phoneme sequence obtained by converting the notation result according to the second character notation method using the means of (d) the above-mentioned method; A character characterized by comprising means for determining the correspondence between the notation result according to the first character notation method and the notation result according to the second character notation method based on the degree of difference at the level of a group of phonemes. Correspondence determination system for notation results.
(5)同一の文字表記法による表記結果同士の対応関係
を判定するためのシステムであつて、 (a)上記文字表記法による表記結果を一群の音素から
選んだ音素からなる音素列に変換する手段と、 (b)上記(a)の手段を使つて表記結果を変換して得
られた音素列同士を比較して、上記一群の音素レベルで
の相違度を計算する手段と、 (c)上記一群の音素レベルでの相違度に基づいて、上
記文字表記法による表記結果同士の対応関係を判定する
手段 とを備えたことを特徴とする文字表記結果の対応関係判
定システム。
(5) A system for determining the correspondence between notation results based on the same character notation system, which (a) converts the notation results based on the above character notation system into a phoneme string consisting of phonemes selected from a group of phonemes; (b) means for comparing phoneme strings obtained by converting orthographic results using the means in (a) above to calculate the degree of difference at the phoneme level of the group; (c) A system for determining the correspondence of character notation results, comprising: means for determining the correspondence of the notation results according to the character notation method based on the degree of difference at the phoneme level of the group.
JP63215194A 1988-08-31 1988-08-31 Correspondence determination system for character notation results Expired - Lifetime JPH07113925B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63215194A JPH07113925B2 (en) 1988-08-31 1988-08-31 Correspondence determination system for character notation results

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63215194A JPH07113925B2 (en) 1988-08-31 1988-08-31 Correspondence determination system for character notation results

Publications (2)

Publication Number Publication Date
JPH0264867A true JPH0264867A (en) 1990-03-05
JPH07113925B2 JPH07113925B2 (en) 1995-12-06

Family

ID=16668241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63215194A Expired - Lifetime JPH07113925B2 (en) 1988-08-31 1988-08-31 Correspondence determination system for character notation results

Country Status (1)

Country Link
JP (1) JPH07113925B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134842A (en) * 2006-11-28 2008-06-12 Yahoo Japan Corp Part-of-speech variation generation device
WO2022029848A1 (en) * 2020-08-03 2022-02-10 日本電信電話株式会社 Determination device, determination method, and determination program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4136055B2 (en) * 1997-03-31 2008-08-20 富士通エフ・アイ・ピー株式会社 Similar character string search system and recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134842A (en) * 2006-11-28 2008-06-12 Yahoo Japan Corp Part-of-speech variation generation device
WO2022029848A1 (en) * 2020-08-03 2022-02-10 日本電信電話株式会社 Determination device, determination method, and determination program

Also Published As

Publication number Publication date
JPH07113925B2 (en) 1995-12-06

Similar Documents

Publication Publication Date Title
Van Berkel et al. Triphone Analysis: A Combined Method for the Correction of Orthographical and Typographical Errors.
JP5444308B2 (en) System and method for spelling correction of non-Roman letters and words
JPH04117560A (en) Clause/phrase boundary extracting system
US20150170648A1 (en) Ebook interaction using speech recognition
KR20190065665A (en) Apparatus and method for recognizing Korean named entity using deep-learning
Samudravijaya Indian language speech label (ILSL): a de facto national standard
Al-Thubaity et al. Arabic diacritization using bidirectional long short-term memory neural networks with conditional random fields
Rei et al. Automatic truecasing of video subtitles using bert: A multilingual adaptable approach
UzZaman et al. A bangla phonetic encoding for better spelling suggesions
Yu et al. Simple methods to overcome the limitations of general word representations in natural language processing tasks
KR100318763B1 (en) The similarity comparitive method of foreign language a tunning fork transcription
Miethaner Orthographic transcriptions of non‐standard varieties: The case of Earlier African‐American English
JPH0264867A (en) Correspondence relation deciding system for character description result
JP2007317163A (en) Electronic dictionary and retrieval method
Hammond The Velar Nasal in Rapid Cuban Spanish.
Min et al. Typographical and Orthographical Spelling Error Correction.
Zock et al. How can computers help the writer/speaker experiencing the tip-of-the-tongue problem
Hummel et al. Multi-level Digital Annotation of Ethiopic Texts
Bajec et al. Punctuation Restoration System for Slovene Language
Raju et al. Tamil to Malayalam transliteration
Ghayoomi et al. A POS-based word prediction system for the Persian language
Nakano Using Neural Network Models for Diacritics Restoration in Māori
Reddy et al. Kannada phonemes to speech dictionary: statistical approach
Paramonov et al. Phonetic string matching for languages with cyrillic alphabet
Chemerys et al. Normalization of a Historic Western Ukrainian orthographic system Zhelekhivka in the Ukrainian Language Reference Corpus (GRAC)