JPS5934592A - 文字音韻変換装置 - Google Patents

文字音韻変換装置

Info

Publication number
JPS5934592A
JPS5934592A JP57144861A JP14486182A JPS5934592A JP S5934592 A JPS5934592 A JP S5934592A JP 57144861 A JP57144861 A JP 57144861A JP 14486182 A JP14486182 A JP 14486182A JP S5934592 A JPS5934592 A JP S5934592A
Authority
JP
Japan
Prior art keywords
word
kanji
ending
hiragana
conjugated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57144861A
Other languages
English (en)
Other versions
JPS648839B2 (ja
Inventor
典正 野村
恒雄 新田
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP57144861A priority Critical patent/JPS5934592A/ja
Publication of JPS5934592A publication Critical patent/JPS5934592A/ja
Publication of JPS648839B2 publication Critical patent/JPS648839B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] この発明は、日本語文の文字列を音韻系列に変換する文
字音韻変換装置に関する。
[発明の技術的背景及びその問題点] 日本語の文章を音声に変換するには1文字列を音韻系列
に変換することが必要である。
従来例えば「私は会社に行く。」という文字列を、人間
が[watashiwa u kaishani Ll
 iku、Jという音韻系列に変換し、これを音声合成
装置に大刀していた。但し、「口」は区切り符号である
このような変換を人間ではなく、自動的に機械装置で実
行しようとすると、従来非常に困難であった。特に、ひ
らがな文字列中における助詞「は」及び助詞「へ」を音
韻「waJ及び音韻[−C」に変換するのは、機械にと
って非常に困難であった。
[発明の目的] この発明は以上の欠点を除去し、日本語の文章の文字列
を音韻系列に正確に変換すること、特にひらがな文字系
列中の助詞「は」及び「へ」を正しく音1uに変換する
こさを目的とする。
[発明の概WJ] 本発明は、漢字かな混りの文字列を文節単位に区分1〜
、その文節中の漢字単語を漢字単語辞書との照合によっ
て音韻系列に変換し、上記単語の品詞が用言のとき活用
語尾の検定を行い、文節中から、上記漢字単1mとその
活用語尾を除いンヒ残シの文字列(でついて、上記活用
語尾が連体形もしくは連用形のききは、ひらがな自立を
倍辞1jj:照合によって音韻系列に変換し、それ以外
のみきおよび漢字単語が用言でないときは、付#4語辞
書照合によって音I漬系列に変換するものである。
そ1−で自立語と付PA#の区別を明確に行うことによ
って、文章を音声に変換する際に重便な、呼気段落の候
補となる音韻系列を区切シを、高精度で検定するもので
ある。
[発明の効果] 本発明によって、日本語文章の文字列を高精度で音韻系
列に変換できる。とくに、ひらがな文字列について、ひ
らがな自立語と付属語とを明確に区別でき、これによっ
て、文字「は」および文字「へ」が、ひらがな自立語の
構成文字であるときは、それぞれ音韻「ha J及び「
heJに、また、助詞きして用いられているときは、音
韻rWaJ及び「e」に正しく変換することができる。
さらに、文章を音声に変換する際に重要な、呼気段落の
候補となる音韻系列の区切シを、同時に検定することが
可能となる。
[発明の実施例] この発明の実施例を図面に従って説明する。この実施例
での文字音韻変換装置は、第1図に示されるように、漢
字かな混り文を、コード列として記憶している入力文章
記憶装置(1υと、この文字列を仮シの文節に分離する
文節切り回路α埠と、この文節切り回路(12)によっ
て分離され走入カ゛文節を記憶する入力文節レジスタ(
I3)と、漢字ではじまる単語の語幹を見出し語とし、
その単語の品詞を表わす文法情報及びその単語の音韻系
列を格納している漢字単語辞書記憶装置(I4)と、入
力文節レジスタ03)に保持されている一文節と漢字辞
書記憶装置04)内の見出し語とを照合し、かつ、一致
検出された文字列のうち最も長い文字列、即ち、最長マ
ツチング単語から順に、候補単語として一時記憶する漢
字単語照合回路+tSと、この漢字単語照合回路05)
での最長マツチング単語が用言である場合に、その活用
語尾の検定を行う活用語尾検定回路a0と、この活用語
尾回路α0によって活用語尾が検定されたなら、入力文
節中の文字列から漢字単語及び活用語尾を取り除いた残
余文字列をつくり、活用語尾が連体形又は連用形のとき
に残余文字列をひらがな自立語照合回路αのに送出し、
それ以外の時には、付属語照合回路θ尋に送出する辞書
照合順序判定回路G俤と、ひらがなではじまる自立語を
見出し語とし、その自立語の品詞を示す文法情報及びそ
の音韻系列を格納しひらがな自立語照合回路αηでの照
合の基となるひらがな自刃語辞書記憶装置0@と、助詞
、助動詞及び助詞と助動詞の複合形の文字列を見出し語
とし、その音韻系列及び付属語が接続する単語について
の条件(以下的接続条件と呼ぶ。)が格納されている付
属語辞書記憶装置(2υと、漢字単語照合回路a9、ひ
らがな自立語照合回路a7)及び付属語照合回路(18
1とのそれぞれで一致が検出された際の音韻系列を収納
する音韻系列レジスタ(2のとから成る。
文節切り回路α功では、入力文章を、文字種の変化、例
えばひらがなから漢字に変化する箇所で切断する。例え
ば、「私は会社には行かない。」という文章ならば、「
私は」 「会社には」及び「行ない。
このように切られた例の文節ごとに漢字単語照合回路0
ωにおいて、まず漢字単語辞書記憶装置α荀に格納され
ている辞書を読み出して照合する0この漢字単語辞書は
、漢字で始まる単語が見出し語として登録されている。
第1図に示されるように、ルコードは、左端から1文字
コードで表わされた見出し語領域(3I)、品詞及び活
用形を表わす文法情報領域(34及び音韻系列を表わす
音韻情報領域(至)とから成る。
「私は」という文節の場合、「私は」に対して漢字単語
辞書記憶装置θaの見出し語との一致を調べて行く。こ
の場合、「私は」に一致検出された漢字単語の文字列の
うち、最も長いのは「私」である。文字「私」には読み
方が2通りあるが、単独の単語として用いる時には、1
−WATAKUSHI jという読み方しかないので、
漢字単語辞書記憶装置(14)には1つしか登録してお
かない。
そこで、この「私」に関する情報のうち、音韻情報であ
る[WATAKU SHI Jという情報を漢字単語照
合回路(I5)の中の記憶レジスタに一時記憶する。
漢字単語辞書に該当する見出し語が複数ある場合には、
一致j−だ文字数の多いものから、つまり最長マツチの
単語から順次候補単語として用いる。
次に、候補単語の文字列を取り除き、残余文字列をつく
る。このとき、候補単語の音韻系列が、その前に区切り
符号を付けられて、音韻系列レジスタ(2イに送られる
。区切り符号は、原則として自立語の前に付けられる。
この例では、「私は」から「私」を取り除き残余文字列
は「は」となる。
この残余文字「は」に対して、前述の候補単語が名詞で
あって活用語でないので、活用語尾検定回路(161に
は行かず、付属語照合回路(a槌での照合処理を行う。
この付属語照合回路α梯での照合は、付属語辞書記憶装
置(21)に格納された付属語辞書を用いて行う。
この付属語辞書には、単独の助詞、助動詞及び助詞と助
動詞が複数個結合した形が登録されている。
この辞書には、伺属語が自立語に接続するときの条件(
前接続条件と呼ばれる。)及び付属語に対応する音韻系
列が格納されている。
この例の場合の残余文字列「は」を照合してみると、付
属語辞書に見出し語として「は」、音韻系列としてl−
waJが登録されている。従って、残余文字列「は」が
付属暗として照合される。この照合された付属暗に対し
て前接続条件による検定を行う。
付属語辞書には、付属語「は」の前接続条件として、体
言に接続可能であることが登録されている。この例の場
合の「は」は名詞「私」に接続しているので、前接続条
件を満たすことが検定される。この場合、付属語である
ので、区切り符号を前に付けることなしに、音韻情報r
−ajが音韻系列レジスタ(2つに送られる。
て上記の処理が繰り返して行われる。
次に、第2の文節「会社には」に対しても同様な処理が
施され音韻系列レジスタ(221に、「ml kais
haniwajという音韻系列が収納される。
次に、[行かない]という文節に対して、漢字単語照合
回路α句によって候補単語として「行」(自互かrIl
)r行」(他方わ「0KONAj ’)という2つが上
がる。
第1の候補単語として、r行」(他方わ[0KONAJ
)を用いたとする。このとき、この候補単語が用言であ
るので、残余文字列「かない」について活用語尾検定回
路aOで検定する。
この活用語尾検定回路06)には、活用表が記憶されて
いる。そこでまず文法情報「他方わ」を参照して、この
活用表を指定する。すると、「わ」(未然1)、「わ」
(未然2)、「わ」(未然3)、「お」(未然4)、「
い」(連用1)、「っ」(連用2)、「う」(終止)、
「う」(連体)、「れ」(仮定)、「れ」(命令)とい
う活用がわかる。
この活用語尾と、残余文字列「かない」との検定を行う
。すると、すべての活用語尾が不合格となる。従って、
この第1の候補単語は採用されない0 次に、第2の候補単語として、r行」(自互か「I」)
を用いる。この場合にも、文法情報によりr行」が動詞
なので、前述と同様に、残余文字列「かないJ VCつ
いて、活用語尾検定回路0υで検定する。
文法情報が「自互か」であることから、活用語尾検定回
路ae内の活用表から、「か」(未然1)、「か」(未
然2)、「か」(未然3)、「こ」(未然4)、「き」
(連体)、「け」(仮定)、「け」(命令)という活用
がわかる。
この活用語尾表を用いて、残余文字列「かない」との検
定を行う。すると、残余文字列「かない」の「か」が未
然形の活用語尾であることがわかる。
「か」はこれで語尾検定できたことになる。
活用語尾が検定で合格のとき、文節切シ回路(+21に
よって分離された文節文字列から第2の候補単語及び活
用語尾とを取シ除く。すると「ない」という残余文字列
ができる。ここで、候補単語の音韻系列がその前に区切
り符号が付けられて、音韻系列レジスタ(2功に送られ
る。ここで、活用語尾の音韻系列が、区切り符号を付け
られずに、音韻系列レジスタ働に送られる。
活用語尾検定回路(16)での活用語尾の活用形「未然
形」という情報を参照しながら、残余文字列「ない」を
、辞書照合順序判定回路([1に送る。
この辞書照合順序判定回路a9では、用言について、活
用語尾の活用形が、連体形又は連用形の場合には残余文
字列を、ひらがな自立語照合回路α力に送り、それ以外
の活用形の場合は、付属語照合回路aFjに送る。ただ
し、活用語尾が連用形又は連体形以外の場合には、文字
列を付属語照合回路θ印に送り、照合を行う。
この例の残余文字列「ない」の場合には、この残余文字
列の前におかれている動詞の活用語尾が1未然形」であ
るため、付属語照合回路UK、残余文字列「ない」が送
られる。
付属語照合回路a8では、前述と同様に付属語辞書を用
いて、付属語の検定を行う。ここで、「ない」、が助動
詞として検定合格になると、音韻系列1”naiJが区
切り符号を付けられずに、音韻系列レジスタ(2渇に収
納される。
以上で「私は会社には行かない。」という文が音韻系列
に変換された。
例えば、「美しいひとが」という文節を例にとって説明
する。まず、漢字単語照合回路aつに於いて、「美し」
が分離される。この「美し」は、形容詞であシ、その音
韻系列が1−UTSUKUSHIJである。この音韻系
列が、区切り符号を前に付けられて、音韻系列レジスタ
(24に送られる。
次に、「美し」が形容詞であることから、残余文字列「
いひとが」が活用語尾検定回路aQに送られ、活用語尾
の検定を行う。すると、「い」は、終止形又は連体形で
あることがわかる。しかし、文字列が続くときには、そ
の文字列中に終止形が現われることはないので、rい」
は語尾検定されしかも連体形であることがわかる。そし
て、この音韻系列rIJが音韻系列レジスタC4に送ら
れる。
区切り符号は付けられない。以下では、残余文字列とし
て「いひとが」から「い」が取り除かれた「ひとが」を
用いる。
この活用語尾が連体形であるという情報に基づいて、辞
書照合順序判定回路(IIでは、残余文字列「ひとが」
を、ひらがな自立語照合回路aηに送る。
活用語尾が連体形又は連用形の場合には、この活用語尾
に接続する単語が自立語であることが多いからである。
ひらがな自立語辞書を検索すると「ひと」が照合される
。との「ひと」の文法情報は名詞でありその音韻系列は
l’−HITOjである。この音韻系列はその前に区切
シ符号が付されて音韻系列レジスタ(24に送られる。
次に、残余文字列「が」を付属語照合回路a枠で照合す
る。すると、この「が」が格助詞で、その音韻系列が「
0人」であると照合される。しかも、前接続条件を満足
している。これは検定合格であシ、音韻系列1’−GA
Jが音韻系列レジス0zに送られる。ただし、音韻系列
の前に、区切シ符号は付けない。これで、音韻系列レジ
スタ(2Z K ハ、1’−UTSUKU8HI I 
tJ HITOGAJが収納され音韻変換完了する。
他方、付属語照合回路(181での検定が不合格の場合
は、一般的に次のような処理を行う。即ち、一致検出さ
れた付属語のうちで次に長いものについて以上と同様の
処理を行う。
ここで、最終的に合格する付属語がないとき、すなわち
、付属語辞書照合に失敗したときには、ひらがな自立語
照合回路α力に、文字列を送る。
以上の処理を繰シ返すことによって、文字列を正しく音
韻系列に変換でき、しかも、音韻系列の区切りも検定す
ることができる。
以上の実施例において、ひらがな自立語であっても、活
用語尾の検定は、活用語尾検定回路α0で行う。
又、文節切り回M(1:10によって行われる仮りの文
節切シが適切なものでない場合でも漢字単語照合回路a
最、ひらがな自立語照合回路側、付属語照合回路(18
1での照合により修正される。
更に、この発明では、すべてひらがなで表わされた文章
であっても音韻系列に変換できる。この時には、文節切
シ回路a3は、機能せず、文節に分離することはできな
い。しかしながら、ひらがな自立語照合回路07)及び
付属語照合回路α樽によって正確に音韻系列に変換でき
る。
以上この発明の実施例につき詳説しだが、この発明は、
この実施例に限定されるものではない。
この発明の趣旨を逸脱しない限シどのような変形をもこ
の発明に含まれるのは当然である。
【図面の簡単な説明】
第1図は、一実施例の構成図、第2図は、第1図に示さ
れる漢字単語辞書記憶装置内のバイト構成を示す図であ
る。 04・・・漢字単語辞書記憶装置、 OS・・・漢字単語照合回路、 aυ・・・活用語尾検定回路、 αη・・・ひらがな自立語照合回路、 08・・・付属語照合回路、 翰・・・辞書照合順序判定回路、 (イ)・・・ひらがな自立語辞書記憶装置、0υ・・・
付属語辞書記憶装置。 第1図 Xカリ      丈l菅を月9    .2、鉋・1
1装置  回路 ff    )、−1艷  、3 しシ′又り 足フ卑葛     j茎輪醪堪 東谷回路   鉋°唱14 比累1尾 教回路  だ q @書照会・・)蝉 判定回路 びラ  ・ ″   巨77ゞ7“1垂1−一第2図

Claims (1)

    【特許請求の範囲】
  1. (1)漢字で始まる単語文字列、この卑語文字列の文法
    情報及び前記単語文字列の音韻系列とを記憶する漢字単
    語辞書記憶手段と、ひらがな自立語、このひらがな自立
    語についての文法情報及び前記ひらがな自立語の音韻系
    列とを記憶するひらがな自立語辞書記憶手段と、付属語
    、この付属語の音韻系列及び先行する単語との接続に関
    する条件を記憶する付属語辞書記憶手段と、入力文字列
    と前記漢字単語辞書記憶手段に記憶されている卑語文字
    列との照合を行う漢字単語照合手段と、この漢字単語照
    合手段により照合された前記単語文字列が用言の場合活
    用語尾の検定を行う古井詐m手秦孝専考等活用語尾検定
    手段とを備え、この活用語尾検定手段によって検定され
    た活用語尾が連体形又は連用形のときは、前記入力文字
    列から前記漢字単語照合手段によって照合された漢字単
    語及びその活用語尾を取り除いた残余文字列について、
    ひらがな自立語辞書記憶手段に記憶されている内容との
    照合を行い、他方前記活用語尾が連体形又は連用形以外
    のときは、前記付属語辞書記憶手段に記憶されている内
    容との照合を行うことによって文字音韻変換を実行する
    ことを特徴とする文字音韻変換装置。
JP57144861A 1982-08-23 1982-08-23 文字音韻変換装置 Granted JPS5934592A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57144861A JPS5934592A (ja) 1982-08-23 1982-08-23 文字音韻変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57144861A JPS5934592A (ja) 1982-08-23 1982-08-23 文字音韻変換装置

Publications (2)

Publication Number Publication Date
JPS5934592A true JPS5934592A (ja) 1984-02-24
JPS648839B2 JPS648839B2 (ja) 1989-02-15

Family

ID=15372100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57144861A Granted JPS5934592A (ja) 1982-08-23 1982-08-23 文字音韻変換装置

Country Status (1)

Country Link
JP (1) JPS5934592A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129619A (ja) * 1993-10-29 1995-05-19 Hiuka Sangyo Kk 音声電子ブック

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129619A (ja) * 1993-10-29 1995-05-19 Hiuka Sangyo Kk 音声電子ブック

Also Published As

Publication number Publication date
JPS648839B2 (ja) 1989-02-15

Similar Documents

Publication Publication Date Title
Hirschberg et al. Training intonational phrasing rules automatically for English and Spanish text-to-speech
US5283833A (en) Method and apparatus for speech processing using morphology and rhyming
JPS5214331A (en) Device for checking alphabetic word
DE68913669T2 (de) Namenaussprache durch einen Synthetisator.
Elovitz et al. Automatic translation of English text to phonetics by means of letter-to-sound rules
Dybo et al. A tonological hypothesis on the origin of paradigmatic accent systems
JPS5934592A (ja) 文字音韻変換装置
JPH0244080B2 (ja)
Meng et al. CU VOCAL: corpus-based syllable concatenation for Chinese speech synthesis across domains and dialects.
CN111429886A (zh) 一种语音识别方法及系统
Fabb " Of" in Paradise Lost as evidence for the metrical line
JPH0130173B2 (ja)
Rao et al. Word boundary hypothesization in Hindi speech
Mumtaz et al. Break Index (BI) annotated speech corpus for Urdu TTS
Forgie et al. An overview of the Lincoln Laboratory speech recognition system
Nagabhushan et al. Dictionary supported generation of English text from Pitman shorthand scripted phonetic text
Veilleux et al. Probabilistic parse scoring based on prosodic phrasing
Wiesen et al. An evaluation of the Lincoln Laboratory speech recognition system
Rytting Greek word segmentation using minimal information
Cowan A Morphological Study of Egyptian Colloquial Arabic
Hall et al. Parsing and word matching in the Lincoln Laboratory, speech recognition system
Lowerre Comparison of two speech understanding systems
JPH02105968A (ja) 日本文誤り自動検定・訂正方式
JPS6283796A (ja) 音声入力装置
JPS5972495A (ja) 文字音韻変換装置