JP2575252B2 - 発音辞書管理方法 - Google Patents

発音辞書管理方法

Info

Publication number
JP2575252B2
JP2575252B2 JP3345091A JP34509191A JP2575252B2 JP 2575252 B2 JP2575252 B2 JP 2575252B2 JP 3345091 A JP3345091 A JP 3345091A JP 34509191 A JP34509191 A JP 34509191A JP 2575252 B2 JP2575252 B2 JP 2575252B2
Authority
JP
Japan
Prior art keywords
pronunciation dictionary
accent
word
registered
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3345091A
Other languages
English (en)
Other versions
JPH05210482A (ja
Inventor
博樹 釜中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3345091A priority Critical patent/JP2575252B2/ja
Publication of JPH05210482A publication Critical patent/JPH05210482A/ja
Application granted granted Critical
Publication of JP2575252B2 publication Critical patent/JP2575252B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語テキスト音声変
換に用いられる発音辞書への言葉の登録管理、削除管理
を行う発音辞書管理方法に関する。
【0002】
【従来の技術】一般に、日本語テキスト音声変換システ
ムは我々が日常読み書きしている漢字かな混じり文を入
力として、それを音声に変換し合成出力するものであ
る。このシステムの構成を図2に基づいて説明する。
【0003】テキスト解析部21では、発音辞書22を
参照することにより、入力された漢字かな混じり文から
音韻・韻律記号列が生成される。ここで音韻・韻律記号
列とは、入力文の読み、アクセント、イントネーション
等を文字列として記述したもの(中間言語)である。各
単語の読みとアクセントは発音辞書22に登録されてお
り、この辞書22を参照しながら音韻・韻律記号列が生
成される。なお、日本語は高低アクセントを有し、高か
ら低へ下降する位置が語頭から数えてn音節目にある
時、その単語はn型のアクセントを持つという。n=0
は下降する位置がない場合で、平板型と言われる。発音
辞書22には、図3に示すように、各単語(助詞、接尾
語のような付属語は除く)に対するアクセント型を示す
数値や、各単語の表記、読み等が登録されている。
【0004】さらに、テキスト解析部21には、図4に
示すアクセント結合規則がルール化されている。これは
以下の理由による。日本語では複数の単語が結合して複
合語を形成する場合に、アクセントの移動、生起、消失
という現象が起こる。このため、この現象をアクセント
結合規則としてルール化しておき、単語の結合時にこの
ルールを適用することにより複合語や文節のアクセント
を決定する。
【0005】合成パラメータ生成部23では、音韻・韻
記号列に基づき、音声素片(音の種類)、音韻継続時
間(音の長さ)、基本周波数パターン(音の高さ)とい
った合成パラメータが生成される。音声素片は接続して
合成波形をつくるための音声の基本単位であり、音の種
類等に応じて様々なものが、ROM等で実現された音声
素片格納部24の中に蓄積されている。
【0006】音声合成部25では、合成パラメータに基
づき合成波形が生成され、スピーカ26を通して合成音
が出力される。
【0007】
【発明が解決しようとする課題】ところで、テキスト解
析部21では図4のアクセント結合規則に基づいて単語
の結合時に複合語や文節のアクセントを決定するが、こ
のアクセント結合規則は単語結合時におけるアクセント
変化の一般的傾向を表したものであり、例外もある。従
って、このルールを適用してもそのアクセントが実現で
きない複合語はそれ自体を一つの単語として発音辞書2
2に登録しておく必要がある。逆に、このルールを適用
すればそのアクセントが得られる複合語は登録しておく
必要がない。
【0008】ところが、発音辞書22はこのようなアク
セント結合規則を考慮して作られていないので、登録し
ておく必要のない複合語も登録しておく必要のある複合
語と一緒に登録されていることがある。また、システム
のバージョンアップに伴ってアクセント結合規則が改良
された場合等に、それまでは登録の必要性があった複合
語がそれ以降登録の必要性がなくなることもある。
【0009】このような場合、登録しておく必要又は登
録する必要がなくなった言葉が辞書容量の一部を無駄に
使用することになり、限られた辞書容量の効率的使用を
図れないという問題点がある。
【0010】本発明は以上の問題点に鑑みなされたもの
で、その目的は発音辞書に新規登録する言葉及び登録し
た言葉を必要に応じて取捨選択して発音辞書の効率的使
用を図ることができる発音辞書管理方法を提供すること
にある。
【0011】
【課題を解決するための手段】前記課題を解決するため
に第1の発明は、発音辞書に言葉を新規に登録する際
に、その言葉にアクセント結合規則を施し、その言葉の
正しい読みとアクセントが得られたときはその言葉を登
録せず、得られないときに登録することを特徴とする。
【0012】また、第2の発明は、発音辞書に登録済み
の言葉を削除する際に、その読みとアクセントが複数の
既登録単語にアクセント結合規則を施すことにより得ら
れるとき、その言葉を発音辞書から削除し、得られない
ときは削除しないことを特徴とする。
【0013】
【作用】前記方法により、アクセント結合規則で処理で
きる言葉は登録せず、またこの規則で処理できる既登録
の言葉は削除することで、発音辞書に新規登録する言葉
及び登録した言葉を必要に応じて取捨選択し、発音辞書
の効率的使用を図ることができる。
【0014】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。
【0015】本実施例に係る発音辞書管理システムは、
図5に示すように、CRT11、アクセント結合規則1
2、キーボード13、制御部14、テキスト解析部15
及び発音辞書16から構成される。
【0016】制御部14は、テキスト解析部15との間
でのデータのやり取り、発音辞書16の登録管理及び削
除管理、CRT11及びキーボード13による入出力処
理などを行う。この制御部14には、登録管理及び削除
管理を行うために、図1及び図7に示す処理機能が実現
されている。
【0017】テキスト解析部15は、発音辞書16とア
クセント結合規則12を用いることにより、制御部14
から送られてきたテキスト(言葉)の読みとアクセント
を決定し、その解析結果を制御部14に返す。発音辞書
16には、図3に示すように、各単語(複合語も含む)
の表記、読み、アクセント等が登録されている。アクセ
ント結合規則12は、図4に例を示すように、単語が結
合した時、アクセントがどのように変化するかをルール
としてまとめたものである。この発音辞書16及びアク
セント結合規則12の登録内容は従来のものと同様であ
る。キーボード13は発音辞書16に登録する言葉やシ
ステムへの動作指示などを入力するためのものである。
CRT11にはテキスト解析した結果である読み、アク
セントなどが表示される。
【0018】次に、以上の構成の発音辞書管理システム
において発音辞書16に言葉(特に複合語)を登録する
場合の処理(発音辞書16の登録管理方法)を図1の流
れ図を用いて説明する。なお、ここでは「裏日本(ウラニホ
ン:4)」と「角砂糖(カクサ゛トー:3)」の登録を例示する。
【0019】制御部14において、これらの表記がキー
ボード13から入力されると、それをテキスト解析部1
5に送る(ステップ31)。テキスト解析部15では後
述する図6の処理が行われる。
【0020】次いで、テキスト解析部15から解析結果
を受信したか否かを判断し(ステップ32)、受信する
まで待つ。テキスト解析部15から解析結果を受信する
と、その解析結果をCRT11に表示し(ステップ3
3)、オペレータに読みとアクセントの確認を求める。
そして、このCRT11の表示を確認したオペレータか
らのキーボード13による入力を待つ(ステップ3
4)。この入力はCRT11での表示内容が正しいか否
かを指示するもので、「Yes」か「No」で入力す
る。
【0021】次いでキーボード入力が「Yes」である
か否かを判断する(ステップ35)。「Yes」である
ときは、解析結果〔ウラニホン:4[裏日本]〕が正しいとい
うことであり、登録の必要がなく、この処理を終了す
る。
【0022】一方、「No」が入力されると、解析結果
〔カクサトー:4[角砂糖]〕は誤りであることが分り、正し
い読みとアクセント(カクサ゛トー:3)の入力を待つ(ステッ
プ36)。正しい読みとアクセントが入力されると、そ
の読みとアクセントを表記と共に発音辞書16に登録し
(ステップ37)、処理を終了する。
【0023】ここで、テキスト解析部15での処理を図
6に基づいて説明する。
【0024】前記ステップ31により制御部14から表
記〔「裏日本(ウラニホン:4)」と「角砂糖(カクサ゛トー:
3)」〕が送られてくると、これらを発音辞書16を参
照して複数の単語[裏・日本、角・砂糖]に分割する。
即ち、形態素解析を行う(ステップ41)。そして、ア
クセント結合規則12(この場合、図4〔1〕の名詞+
名詞のルール)を適用して以下のように読みとアクセン
トを決定する(ステップ42)。
【0025】ウラ:2+ニホン:2→ウラニホン:4[裏日本]カク :1+サトー:2→カクサトー:4[角砂糖] そして、この解析結果を制御部14へ送信する(ステッ
プ43)。これにより、制御部14ではステップ33の
解析結果表示が行われ、その後の処理が進められる。
【0026】次に、発音辞書16から言葉(特に複合
語)を削除する場合の処理(削除管理方法)を図7の流
れ図を用いて説明する。なお、ここでは既登録の「貨物
船(カモツセン:0)」を削除するものとする。
【0027】制御部14は発音辞書16から言葉(単
語)を一つ取出し、その表記[貨物船]をテキスト解析
部15に送る(ステップ51)。テキスト解析部15で
は後述する図8の処理が行われる。
【0028】次いで、テキスト解析部15から信号受信
があったか否かを判断し(ステップ52)、信号を受信
するまで待つ。信号を受信したらその信号が解析結果の
通知か単語が分割不可である旨の通知かを判断する(ス
テップ53)。分割不可の通知であれば、その単語を削
除することなくそのまま処理を終了する。解析結果の通
知であれば、その単語の解析結果(形態素解析により分
割された複数の単語にアクセント結合規則12を施して
得られた読み、アクセント)と、その単語を発音辞書1
6から取り出すことにより直接得られた読み、アクセン
トとを比較し、これらが同じか否かを判断する(ステッ
プ54)。読み、アクセントが同じでなければアクセン
ト結合規則12では処理できない言葉ということであ
り、削除せず、この処理を終了する。
【0029】一方、読みとアクセントが同じであれば、
アクセント結合規則12で処理することができ、発音辞
書16に登録しておく必要のないものであり、発音辞書
16からその言葉「貨物船(カモツセン:0)」を削除して処
理を終了する(ステップ55)。
【0030】ここで、テキスト解析部15での処理を図
8に基づいて説明する。
【0031】前記ステップ51により制御部14から表
記[貨物船]が送られてくると、これらを発音辞書16
を参照して複数の単語[貨物・船]に分割する。即ち、
形態素解析を行う(ステップ61)。形態素解析の結
果、複数の単語に分割できたか否かを判断し(ステップ
62)、複数の単語に分割できなかった場合はその旨を
制御部14に通知し(ステップ63)、処理を終了す
る。分割できた場合はアクセント結合規則12(この場
合、図4〔2〕の名詞+接尾語のルール)を適用して以
下のように読みとアクセントを決定する(ステップ6
4)。
【0032】カモツ:1+セン→カモツセン:0[貨物船] そして、この解析結果を制御部14へ送信する(ステッ
プ65)。これにより、制御部14ではステップ53の
分割不可の通知か否かを判断し、その後の処理が進めら
れる。
【0033】以上により、必要な言葉は登録し、不要な
言葉は削除することで、読みとアクセントの面から見て
冗長性のない発音辞書16を能率よく作成することがで
きる。即ち、発音辞書16のデータ容量の低減を図るこ
とができる。
【0034】また、既製の発音辞書16を、無駄を省い
た辞書に作り直すことが可能である。
【0035】なお、日本語テキスト音声変換システムが
製品化される場合、発音辞書16はROM化されること
が多く、その場合は書き換えが不可能になる。従って、
本実施例で説明した発音辞書管理システムは、発音辞書
16がROM化される前の開発ツールとして用いること
ができる。
【0036】ただし、日本語テキスト音声変換システム
が書き換え可能なユーザ辞書(ユーザ専用の発音辞書)
を有している場合は、この辞書の管理ツールとして発音
辞書管理システムを日本語テキスト音声変換システムに
組み込んで用いてもよい。これにより、冗長性のない
ーザ辞書を新規に作成することができる。また、既製の
発音辞書16を無駄を省いたユーザ辞書に作り直すこと
できる。
【0037】
【発明の効果】本発明の発音辞書管理方法を用いること
により、読みとアクセントの面から見て冗長性のない発
音辞書を能率よく作成することができる。
【図面の簡単な説明】
【図1】本発明の発音辞書管理方法に係る辞書登録の処
理手順を示す流れ図である。
【図2】従来の技術に係る日本語テキスト音声変換シス
テムを示すブロック図である。
【図3】発音辞書の内容を示す説明図である。
【図4】アクセント結合規則を示す説明図である。
【図5】本発明の発音辞書管理方法に係る発音辞書管理
システムを示すブロック図である。
【図6】テキスト解析部での辞書登録時の処理を示す流
れ図である。
【図7】単語削除の処理手順を示す流れ図である。
【図8】テキスト解析部での単語削除時の処理を示す流
れ図である。
【符号の説明】
11 CRT 12 アクセント結合規則 13 キーボード 14 制御部 15 テキスト解析部 16 発音辞書

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 発音辞書に言葉を新規に登録する際に、
    その言葉にアクセント結合規則を施し、その言葉の正し
    い読みとアクセントが得られたときはその言葉を登録せ
    ず、得られないときに登録することを特徴とする発音辞
    書管理方法。
  2. 【請求項2】 発音辞書に登録済みの言葉を削除する際
    に、その読みとアクセントが複数の既登録単語にアクセ
    ント結合規則を施すことにより得られるときその言葉を
    発音辞書から削除し、得られないときは削除しないこと
    を特徴とする発音辞書管理方法。
JP3345091A 1991-12-26 1991-12-26 発音辞書管理方法 Expired - Fee Related JP2575252B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3345091A JP2575252B2 (ja) 1991-12-26 1991-12-26 発音辞書管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3345091A JP2575252B2 (ja) 1991-12-26 1991-12-26 発音辞書管理方法

Publications (2)

Publication Number Publication Date
JPH05210482A JPH05210482A (ja) 1993-08-20
JP2575252B2 true JP2575252B2 (ja) 1997-01-22

Family

ID=18374228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3345091A Expired - Fee Related JP2575252B2 (ja) 1991-12-26 1991-12-26 発音辞書管理方法

Country Status (1)

Country Link
JP (1) JP2575252B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3706758B2 (ja) * 1998-12-02 2005-10-19 松下電器産業株式会社 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP5482503B2 (ja) * 2010-06-23 2014-05-07 富士通株式会社 ユーザ辞書登録装置、ユーザ辞書登録方法、及びユーザ辞書登録プログラム
WO2012172596A1 (ja) * 2011-06-14 2012-12-20 三菱電機株式会社 発音情報生成装置、車載情報装置およびデータベース生成方法

Also Published As

Publication number Publication date
JPH05210482A (ja) 1993-08-20

Similar Documents

Publication Publication Date Title
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
JP2575252B2 (ja) 発音辞書管理方法
JP3589972B2 (ja) 音声合成装置
JPS5972494A (ja) 規則合成方式
JPH05134691A (ja) 音声合成方法および装置
JPH0229797A (ja) テキスト音声変換装置
JPH08160983A (ja) 音声合成装置
JP3364820B2 (ja) 合成音声出力方法及び装置
JP2003005776A (ja) 音声合成装置
JPH11259094A (ja) 規則音声合成装置
JP2022141520A (ja) 音声合成記号編集装置、方法及びプログラム
JPH02240699A (ja) 音声合成装置
JPH0323500A (ja) テキスト音声合成装置
Emorine et al. The MULTIVOC text-to-speech system
JPH06176023A (ja) 音声合成システム
JP2009098292A (ja) 音声記号列生成方法、音声合成方法及び音声合成装置
JPH05189194A (ja) 文書読み上げ装置
JPH06168265A (ja) 言語処理装置および音声合成装置
JPH05143092A (ja) 音声メツセージ作成装置
JPH07210571A (ja) 単語検索処理装置及び単語検索処理方法
JPH07152392A (ja) 音声合成装置
JPH07210549A (ja) 仮名漢字変換装置及び方法
JPS6325762A (ja) 音声出力ワ−ドプロセツサ
JPS59186041A (ja) 音声文書作成装置
JPH06289889A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees