JP2801601B2 - テキスト音声合成装置 - Google Patents

テキスト音声合成装置

Info

Publication number
JP2801601B2
JP2801601B2 JP63155438A JP15543888A JP2801601B2 JP 2801601 B2 JP2801601 B2 JP 2801601B2 JP 63155438 A JP63155438 A JP 63155438A JP 15543888 A JP15543888 A JP 15543888A JP 2801601 B2 JP2801601 B2 JP 2801601B2
Authority
JP
Japan
Prior art keywords
reading
kanji
word
unregistered
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63155438A
Other languages
English (en)
Other versions
JPH01321557A (ja
Inventor
昭一 佐々部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63155438A priority Critical patent/JP2801601B2/ja
Publication of JPH01321557A publication Critical patent/JPH01321557A/ja
Application granted granted Critical
Publication of JP2801601B2 publication Critical patent/JP2801601B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、テキスト音声合成装置、より詳細には、テ
キスト音声合成装置の未登録語処理において、未登録語
の漢字文字列に適切な読みを付与する処理に関する。
従来技術 日本語テキストの文章解析を行う場合、一般には、先
ず文章を単語に分割する処理が施されるが、これはあら
かじめ辞書に登録された単語とのマッチングによって検
索される。しかしながら、任意のテキストに出現する単
語の全てを辞書に登録しておくことは不可能であり、未
登録語は必ず存在し、その同定処理が必要となる。
従来はその未登録語文字列が少なくとも二つの漢字連
続なる音読み、孤立した漢字とその次の文字が平仮名な
ら訓読みとする、といったような判断によって読みを選
択していた。しかし、この様な方法では、同定された未
登録語が和語であるときには正しい読みが付与できなか
った。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、任意の日本語文章を音声に変換、音読する日
本語テキスト音声合成装置において、日本語の文章解析
(形態素解析、構文解析、意味解析)に関する単語分割
に際し、辞書に未登録な単語が検出されたとき、検出さ
れた単語に適切な読みを付与することを目的としてなさ
れたものである。
構成 本発明は、上記目的を達成するために、(1)日本語
文章を形態素解析、構文解析、意味解析等の日本語解析
を行って韻律生成に必要な情報をもとに音声に変換する
テキスト音声合成装置であって、入力された日本語文章
を予め作成された辞書中の単語とのマッチングにより単
語単位に分割する処理において、前記辞書中に存在しな
かった未登録語を検出する未登録語検出部及び単漢字に
関する情報を登録した漢字辞書を有し、前記未登録語検
出部で検出された未登録語に漢字が含まれる場合、該漢
字の各々について前記漢字辞書から抽出した読みと該未
登録語の前後の単語の形態素情報あるいは、表記とから
判断して複数の読みの中から1つを選択し付与するとき
に、該未登録語の次の単語が和語名詞であるときには、
該未登録語に含まれる漢字に訓読みを優先して付与する
ようにしたこと、更には、(2)前記漢字辞書は最も頻
度の高い代表読みと音読み、訓読みが登録されており、
前記未登録語が漢字一字で次の文字がひらがなのときに
限り、該漢字の代表読みが訓読みならば、その読みを選
択し、そうでないときには音読みを選択すること、更に
は、(3)前記読みの選択として、音読みが存在しない
ときには代表読みを選択し、訓読みが存在しないときに
は音読みを選択することを特徴としたものである。以
下、本発明の実施例に基いて説明する。
第1図は、本発明の一実施例を説明するための構成図
で、図中、1は日本語処理部、2は韻律生成部、3は音
声合成部、4は単語辞書、5は漢字辞書、6は漢字読み
付与部、7は辞書検索部、8は未登録語処理部、9は形
態素解析部、10は構文解析部、11は意味解析部で、本発
明は、任意の日本語文章を音声に変換するテキスト音声
合成装置において、辞書に未登録の単語が同定されたと
き、その単語の文字列の漢字に適切な読みを付与するた
め、読みが登録されている漢字辞書を用意し、複数の読
みの中から、一定の規則により選択するようにしたもの
である。
第1図において、入力された日本語文章は日本語処理
部1で形態素、構文、意味解析などの必要な解析を施し
て、韻律生成に必要な情報を抽出する。読み、アクセン
ト、形態素情報、構文情報、意味情報などが韻律生成部
2に入力され、これらの情報を用いて、文章レベルで
の、アクセント、ストレス、ポーズ位置、ポーズ長、抑
揚などの韻律情報を生成して、音声合成部3に出力し、
これを受けて音声信号を生成する処理を行う。漢字読み
付与は、検出同定された未登録語の漢字について処理を
施す。この処理は、第1図に示した実施例では、未登録
語が検出される毎に処理しているが、検出処理が完了し
た後ならば、韻律生成に移行するまでどの段階で付与処
理しても良い。
第2図は、漢字の読み付与処理の一例を説明するため
の図で、図中、21は文字表記形態抽出部、22は漢字辞
書、23は読み検索部、24は判定規則部、25は読み選択判
定部、26は訓読みの代表読み選択部、27は訓読み選択
部、28は音読み選択部、29は代表読み選択部、30は抽出
した読み付与部で、この漢字の読み付与処理には、未登
録語として同定された文字列や前後の単語の表記、形態
素情報や、構文、文脈情報などが入力される。先ず、未
登録語文字列の表示の形態を調べ、文字数や漢字の連続
とその文字数、ひらがなの存在やその文字などを抽出す
る。次に、文字列に含まれる漢字の各々について漢字辞
書を検索して、読み、漢字の意味、字源などを抽出す
る。これらの情報を読み選択判定部に与え、判定規則を
用いて、読みの選択を指示して各々の選択処理に進み、
抽出された読みを付与する。読みは単漢字の全ての読み
の中から最も頻度が高い読みを代表読みとして、第2図
に示すように、代表読み、訓読み、音読みを登録するこ
とが考えられる。また、音読みは慣用音、漢音、呉音、
唐音、宋音などの種別をあるいは種別に登録しても良
い。読み選択判定に使用される規則としては、例えば、
未登録語検出文字列が漢字1字で次の文字がひらがなで
あるとき訓読みの代表読み選択を指示し、検出文字列が
漢字2文字と続く文字がひらがなであるときに訓読み選
択を指示し、それ以外の場合に音読み選択を指示するこ
となどが考えられる。これらの判断は他の入力情報によ
る規則から行うことも考えられ、例えば、形態素情報か
らは前記の選択指示に優先して、未登録語の次が和語で
あるときには、訓読みを選択を指示する。構文、文脈情
報、漢字の意味、字源からは、係り受けや意味による単
語の共起を利用することもできる。
以上の説明から明らかなように、本発明は、任意の日
本語文章を音声に変換するテキスト音声合成装置におい
て、入力された日本語文章をあらかじめ作成された辞書
中の単語とのマッチングにより単語単位に分解する処理
において、前記辞書中に存在しなかった未登録語文字列
を検出する未登録語検出部および単漢字に関する情報を
登録した漢字辞書を有し、検出された未登録語に漢字が
含まれるときには、漢字読み付与処理によって漢字辞書
から選択的に読みを付与するものであるが、更に具体的
には、 漢字の読みの選択は、検出された未登録語表記や前後
の単語に関する、文字表記、形態素情報、あるいは検出
された未登録語の漢字の意味、字源、構文情報、文脈情
報などの少なくとも一つの情報によって判断し、或い
は、 未登録語検出文字列が一字漢字で次の文字がひらがな
であるか、検出文字列が漢字二字と続く少なくとも一字
のひらがなであるとき、訓読みを選択し、その他の場合
は音読みを選択するものであり、或いは、 文字表記からの判断による読みの選択に優先して、未
登録語の次の単語が和語名詞であるときは、未登録語検
出文字列に訓読みを付し、また、 漢字辞書は最も頻度の高い代表読みと、音読み、訓読
みが登録されており、未登録文字列が漢字一次で次の文
字がひらがなのときに限り、代表読みが訓読みならば、
その読みを選択し、そうでないときに音読みを選択し、
更には、 読みの選択に際して、音読みが存在しないときは代表
読みを選択し、訓読みが存在しないときは音読みを選択
するものである。
効果 以上の説明から明らかなように、本発明によると、テ
キスト音声合成の未登録語処理によって抽出同定された
未登録の漢字文字列に、適切な読みを付与することが出
来る。
【図面の簡単な説明】
第1図は、本発明によるテキスト音声合成装置の一実施
例を説明するための構成図、第2図は、漢字の読み付与
処理の一例を説明するための図である。 1……日本語処理部、2……韻律生成部、3……音声合
成部、4……単語辞書、5……漢字辞書、6……漢字読
み付与部、7……辞書検索部、8……未登録語処理部、
9……形態素解析部、10……構文解析部、11……意味解
析部、21……文字表記形態抽出部、22……漢字辞書、23
……読み検索部、24……判定規則部、25……読み選択判
定部、26……訓読みの代表読み選択部、27……訓読み選
択部、28……音読み選択部、29……代表読み選択部、30
……抽出した読み付与部。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】日本語文章を形態素解析、構文解析、意味
    解析等の日本語解析を行って韻律生成に必要な情報をも
    とに音声に変換するテキスト音声合成装置であって、入
    力された日本語文章を予め作成された辞書中の単語との
    マッチングにより単語単位に分割する処理において、前
    記辞書中に存在しなかった未登録語を検出する未登録語
    検出部及び単漢字に関する情報を登録した漢字辞書を有
    し、前記未登録語検出部で検出された未登録語に漢字が
    含まれる場合、該漢字の各々について前記漢字辞書から
    抽出した読みと該未登録語の前後の単語の形態素情報あ
    るいは、表記とから判断して複数の読みの中から1つを
    選択し付与するときに、該未登録語の次の単語が和語名
    詞であるときには、該未登録語に含まれる漢字に訓読み
    を優先して付与するようにしたことを特徴とするテキス
    ト音声合成装置。
  2. 【請求項2】前記漢字辞書は最も頻度の高い代表読みと
    音読み、訓読みが登録されており、前記未登録語が漢字
    一字で次の文字がひらがなのときに限り、該漢字の代表
    読みが訓読みならば、その読みを選択し、そうでないと
    きには音読みを選択することを特徴とする請求項1記載
    のテキスト音声合成装置。
  3. 【請求項3】前記読みの選択として、音読みが存在しな
    いときには代表読みを選択し、訓読みが存在しないとき
    には音読みを選択することを特徴とする請求項1又は2
    記載のテキスト音声合成装置。
JP63155438A 1988-06-23 1988-06-23 テキスト音声合成装置 Expired - Lifetime JP2801601B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63155438A JP2801601B2 (ja) 1988-06-23 1988-06-23 テキスト音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63155438A JP2801601B2 (ja) 1988-06-23 1988-06-23 テキスト音声合成装置

Publications (2)

Publication Number Publication Date
JPH01321557A JPH01321557A (ja) 1989-12-27
JP2801601B2 true JP2801601B2 (ja) 1998-09-21

Family

ID=15606034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63155438A Expired - Lifetime JP2801601B2 (ja) 1988-06-23 1988-06-23 テキスト音声合成装置

Country Status (1)

Country Link
JP (1) JP2801601B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634175B2 (ja) * 1985-11-20 1994-05-02 富士通株式会社 文章読上げ装置
JPS63189933A (ja) * 1987-02-02 1988-08-05 Fujitsu Ltd 文章読み上げ装置

Also Published As

Publication number Publication date
JPH01321557A (ja) 1989-12-27

Similar Documents

Publication Publication Date Title
EP0262938B1 (en) Language translation system
US6141642A (en) Text-to-speech apparatus and method for processing multiple languages
US5384701A (en) Language translation system
JPH06282290A (ja) 自然言語処理装置およびその方法
JP2801601B2 (ja) テキスト音声合成装置
JP3371761B2 (ja) 氏名読み音声合成装置
JPH07262191A (ja) 単語分割方法、および音声合成装置
JPS58123129A (ja) 仮名漢字変換装置
JPH11338498A (ja) 音声合成装置
JP2580568B2 (ja) 発音辞書更新装置
JP2996978B2 (ja) テキスト音声合成装置
JPH0363767A (ja) テキスト音声合成装置
JP2938466B2 (ja) テキスト音声合成システム
JPH06289890A (ja) 自然言語処理装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP3573889B2 (ja) 音声出力装置
JPH0760378B2 (ja) 文章読み上げ装置
JPH09281993A (ja) 発音記号生成装置
JP2728440B2 (ja) 音声出力装置
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
Granström et al. A danish text-to-speech system using a text normalizer based on morph analysis.
JPH11224250A (ja) 辞書装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
Da Silva et al. F0 generation in a text-to-speech system using a database of natural F0 patterns

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070710

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

EXPY Cancellation because of completion of term