JP3709578B2 - 音声規則合成装置および音声規則合成方法 - Google Patents

音声規則合成装置および音声規則合成方法 Download PDF

Info

Publication number
JP3709578B2
JP3709578B2 JP10938795A JP10938795A JP3709578B2 JP 3709578 B2 JP3709578 B2 JP 3709578B2 JP 10938795 A JP10938795 A JP 10938795A JP 10938795 A JP10938795 A JP 10938795A JP 3709578 B2 JP3709578 B2 JP 3709578B2
Authority
JP
Japan
Prior art keywords
character string
key
phonetic
kanji
additional information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10938795A
Other languages
English (en)
Other versions
JPH08305542A (ja
Inventor
則夫 伊豆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10938795A priority Critical patent/JP3709578B2/ja
Publication of JPH08305542A publication Critical patent/JPH08305542A/ja
Application granted granted Critical
Publication of JP3709578B2 publication Critical patent/JP3709578B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【産業上の利用分野】
本発明は、電話を用いた情報提供サービス等において、コンピュータに蓄積されている文字,数字等のデータを自動的に音声規則合成して、音声で伝達する装置および方法に関する。
【0002】
【従来の技術】
従来の音声規則合成装置では、「漢字かな混じり文」を解析し、音声辞書を参照することにより読み方(読みかなとアクセント等)を得て、それを基に音声波形を合成する(規則合成)方式を採用していた。
【0003】
図7は表音文字列例解図であり、この音声辞書によって得られる表音文字列を現すパターンとコードであり、同図でA)とB)はフォーマットを例示したものである。即ち、表音文字列はシフトJISの半角カタカナまたはローマ字(大文字)で記述され、最大128文字または区切記号までが処理単位として音声処理される。
【0004】
ー処理単位は制御文字列で始まり、空白に続けて音声文字列または空白に続く区切記号に続けて音声文字列を付与し、区切記号で完結する。
同図C)は上記制御記号,区切記号,音声文字列およびアクセントのコードの説明図であり、例えば、女声(F)によるやや早め(S)の音声を用いて、「明瞭な音声を合成します。」という文章を音声辞書を用いて出力された表音文字列は、「F4S8 メ−リョーナ オ’ンセーヲ ゴーセーシ’マス%」と出力される。ところが、漢字は一般に「音」「訓」があり、特に読み方が最も多いー例として良く引き合いに出される漢字として、「生」がある。例えば、「ナマハンカ(生半可),セイカツ(生活),イきる(生きる),ショウゴク(生国),キイッポン(生ー本),イケバナ=セイカ(生花),ナリワイ=セイギョウ(生業)」等と読み方も多種である。しかし、このような漢字/熟語等の読み方は、音声辞書にー通りだけで格納されており、入力データの「漢字かな混じり文」に対して一意に決まる読み方で音声規則合成されていた。
【0005】
【発明が解決しようとする課題】
従来の方式では、同じ文字列で複数の読み方が存在する場合に、音声辞書に登録されているーつの読み方でのみ音声規則合成することになり、誤った読み方で音声規則合成される場合があった。
【0006】
例えば、漢字「三田」に対応する一般的な読み方として、「ミタ」が音声辞書に登録されていると、入力された漢字「三田」は常に読み方が「ミタ」となって音声規則合成され、地名または人名としての「三田」が使用され、しかもこの読み方が「サンダ」であっても、音声辞書には「ミタ」のみが登録されているために、「ミタ」として音声出力されるという問題があった。
【0007】
本発明はこのような点にかんがみて、表意文字である漢字に必然的に纏わる複数読み方に正しく対処でき、地名/個人名等の固有の読み方を持つ漢字に対しても正しく音声出力する手段を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記の課題は下記の如くに構成された本発明によって解決される。
図1(A)は本発明による構成原理図である。図において、1は入力変換部、2は情報提供サービス側が保有するデータベース、3は音声出力の対象とする文字列およびその付加情報を抽出する文字列抽出部、4は音声辞書5を参照して表音文字列を出力する音声規則合成部である。
【0009】
また、 図1(B)は本発明によるプロセス原理図であり、表意と表音混じり文中の表意を含む文字列を出力する第1プロセスと、前記文字列を音声対象に指定する第一情報と、前記文字列に対応した音声態様を指定する第二情報と、前記第二情報の類別を指定する第三情報と、から成る付加情報を出力する第2プロセスと、前記文字列と前記付加情報によって音声辞書を検索して、前記付加情報における第二情報に対応する表音態様を示す表音文字列を出力する第3プロセスと、から成る。
【0010】
さらに本発明は、前記付加情報を、前記文字列を音声対象に指定する第一情報と、前記文字列に対応した音声態様を指定する第二情報と、前記第二情報の類別を指定する第三情報とから構成する。
【0011】
【作用】
本発明の構成において、プッシュホン等の音声情報機器から照会データが入力されると、入力変換部1はこれをコードデータ(表意と表音,例えば漢字かな混じり文字列)に変換して出力する。
【0012】
文字列抽出部3は上記コードデータでデータベース2を検索し、上記照会データに応答する情報を読み出し、この応答情報に含まれる文字列および当該文字列の付加情報を抽出する。
【0013】
音声規則合成部4は入力された文字列および付加情報を用いて音声辞書5のインデックスを検索し、照合された文字列対応の表音文字列を出力する。
また、本発明のプロセスにおいて、第1ステップでは読みを指定する表意文字列部分を抽出し、第2ステップではこの表意文字列に対する付加情報として、表意文字列の文字数を示す第1情報と、表意文字列の読みに関連するデータを示す第2情報と、更にこの第2情報を類別するデータを示す第3情報とを出力し、第3ステップでは上記表意文字列と付加情報を用いて音声辞書から表音文字列を出力する。
【0014】
【実施例】
以下、実施例としてホテル照会システムを用い、図2乃至図6を使用して本発明を詳細に説明する。
【0015】
図2は本発明の実施例の機能ブロック図であり、図において、10はプッシュホン等の音声入力を行なう入力部、11はプッシュ信号をコードデータ(文字列)に変換するPB信号変換部、20は顧客保有データベース(図3,参照)、30はPB信号変換部11からの入力コードデータ(文字列)を顧客保有データベース20を参照し、漢字を含む文字列とこの文字列対応の読み情報を出力する検索組立部、31は検索組立部30から出力されたデータを書き込む出力バッファ、40は出力バッファ31からデータを読み出し、音声辞書50(図6,参照)を検索して表音文字列を出力する音声合成部、41は音声合成部40から出力された表音文字列を書き込む表音文字列バッファ、60は表音文字列を音声波形に変換して出力する音声出力部であり、全図を通して同一符号は同一物を示す。
【0016】
上記構成を備えたホテル照会システムを利用する時のプロセスを、図4(処理フローチャートその1)および図5(処理フローチャートその2)を用いて説明する。
【0017】
ステップS1:
ホテルの空室を予約したい顧客は、プッシュホンを用い、情報コード番号(ホテル空室照会=23)で入力部10から照会する。このプッシュホン信号はPB信号変換部11でコードデータ(文字列)に変換される。
【0018】
ステップS2:
検索組立部30は、入力コードが空室予約のコード番号(23)か否かを確認した後に、
ステップS3:
顧客保有データベース(DB)20をオープン処理する。
【0019】
ステップS4:
顧客保有データベース(DB)20から室数欄を検索し、空室があるホテル(ニュー三田ホテル)のホテル名(漢字欄,カタカナ欄)を読み出して、保持する。
【0020】
ステップS5:
ステップK1(図5;組み立て部)に移行する。
ここで、処理フローチャートのその2(図5)を説明すると、
ステップK1:
固定文字列列の『ホテル名は、』をセットする。
【0021】
ステップK2:
ホテル名の漢字欄とカタカナ欄を比較し、最初のー致文字列の『ニュー』をセットする。
【0022】
ステップK3:
ホテル名の漢字欄とカタカナ欄を比較し、不一致な文字列部分である漢字の『三田』と読みの『サンダ』を両者から抽出して保持する。
【0023】
ステップK4:
漢字の『三田』をセットする。
ステップK5:
固定文字の『〔』と、ステップK4で出力した文字数の『2』をセットする。
【0024】
ステップK6:
固定文字列の『,1,』をセットする。
ステップK7:
ステップK3で保持したカタカナの『サンダ』と、固定文字の『〕』をセットする。
【0025】
ステップK8:
ホテル名の漢字欄とカタカナ欄を比較し、不一致な文字列部分の直後から照合して、一致部分の『ホテル』をセットする。
【0026】
ステップK9:
固定文字列の『で、所在地は、』をセットする。
ステップK10:
所在地の漢字欄の『三田市』をセットする。
【0027】
ステップK11:
固定文字の『〔』と、ステップK10で出力した文字数『3』をセットする。
ステップK12:
固定文字列の『,2,』をセットする。
【0028】
ステップK13:
所在地の住所コード欄の『28210』と、固定文字列の『〕です。』をセットする。
【0029】
以上の処理プロセスが完了すると、再び処理フローチャートその1(図4)のステップS4に戻り、顧客保有データベース(DB)20から室数欄を検索し、次の空室があるホテル(堺セントラル)についても、ステップS5において同様の処理を反復する。この時、空室が無くなるか、または顧客の要望から位置的に不適当なホテルは除外して処理を続行し、全データの照合が完了すると次のステップS6へ移行する。
【0030】
ステップS6:
顧客保有データベース20(DB)をクローズ処理する。
ステップS7:
文字列の、『ホテル名は、ニュー三田〔2,1,サンダ〕ホテルで、所在地は、三田市〔3,2,28210〕です。』を出力バッファ31に出力する。
【0031】
この文字列内で、『所在地』や『名』は付加情報を持たず、ホテル名である漢字『三田』は付加情報『〔〔2,1,サンダ〕』を有し、またホテルの住所である漢字『三田市』は付加情報『〔3,2,28210〕』を有している。
【0032】
ここで、付加情報内において、第1パートは読みの対象となる文字数、第2パートは後述する類別符号、第3パートは類別に対応した読み情報である。
上記の出力バッファ31に出力された文字列『ホテル名は、〜です。』は、次の音声合成部40において、音声辞書50(図6,参照)を検索して表音文字化される。
【0033】
図6は音声辞書構造図であり、付加情報内における類別符号(0,1,2)に基づき分類される第1辞書51と、表音文字列を出力する第2辞書52の二段階で構成されている。
【0034】
第1辞書は、類別欄とキー欄と検索キー欄を備えている。
「類別=0」は、読み対象漢字(所在地,名,三田,...)に付加情報が付与されずに入力された場合であり、読み対象漢字自身(所在地,名,三田,...)をキー欄で検索し、検索キー欄によって第2辞書52を検索する。
【0035】
「類別=1」は、読み対象漢字(三田,三田市,...)に読み方が付加情報として入力された場合であり、読み方(ミタ、サンダ,オンダ,ヤマダ,...)でキー欄を検索し、且つ読み対象漢字を併用した検索キー欄によって第2辞書52を検索する。
【0036】
「類別=2」は、読み対象漢字(三田市,堺市,...)に住所コードが付加情報として入力された場合であり、住所コード(28210,27410,...)でキー欄を検索し、検索キー欄によって第2辞書52を検索する。
【0037】
次に、第2辞書52は、被検索キー欄と表音文字列欄を備えている。第1辞書51からの出力データ(検索キー欄出力)で被検索キー欄を照合し、一致した時の表音文字列欄の内容を出力する。この出力データが音声出力部60(図2)によって音声として出力されるものである。
【0038】
以下、音声合成部40における処理を説明する。
検索組立部30(図2)から出力され、出力バッファ31に書き込まれた文字列、『ホテル名は、ニュー三田〔2,1,サンダ〕ホテルで、所在地は、三田市〔3,2,28210〕です。』が音声合成部40に入力される。
【0039】
この文字列内で、『所在地』は付加情報が付与されていないので、『類別=0』で分類され、第1辞書51のキー欄は『所在地』で照合され、検索キー欄の『所在地+0001』が出力される。この出力データが第2辞書52の被検索キー欄で照合され、表音文字列欄の『ショザイチ』が表音文字列として出力される。
【0040】
また、最初の付加情報『〔2,1,サンダ〕』によって、読み上げ文字列は直前の2文字部分(三田)であり、『類別=1』であるから、読み方が『サンダ』として付与されていることになる。そこで、第1辞書51のキー欄は『サンダ』が照合され、検索キー欄の2通り(『三田+0002』,『山田+0002』)から読み上げ文字列の『三田』に基づいた『三田+0002』が出力される。この出力データが第2辞書52の被検索キー欄で照合され、表音文字列欄の『サンダ』が表音文字列として出力される。
【0041】
また、次の付加情報『〔3,2,28210〕』によって、読み上げ文字列は直前の3文字部分(三田市)であり、『類別=2』であるから、読み方が住所コード『28210』として付与されていることになる。そこで、第1辞書51のキー欄は『28210』が照合され、検索キー欄の『三田市+0001』が出力される。この出力データが第2辞書52の被検索キー欄で照合され、表音文字列欄の『サンダシ』が表音文字列として出力される。
【0042】
上記の実施例では、読み方の対象文字列数を1以上としているが、省略してもよく、例えば、『所在地は、三田〔2,1,サンダ〕です。』に代えて、『所在地は、〔0,1,サンダ〕です。』とすることも出来る。
【0043】
また、本実施例では読み方対象の文字列を漢字または漢字かな混じり文としているが、本発明はこれに限定されないことは勿論であり、コード化されたデータであれば、その種類を問うものではない。
【0044】
【発明の効果】
本発明は、表意文字である漢字に必然的に纏わる複数の読み方に正しく対処でき、地名/団体名/個人名等の固有の読み方を持つ漢字に対しても正しく音声出力することで、聞き誤りによる誤解や、訪問地の住所を間違えて時間とお金を無駄にすることを防止できると言う格別な効果を奏するものである。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】実施例の機能ブロック図である。
【図3】顧客保有データベース構築例図である。
【図4】処理フローチャート(その1)である。
【図5】処理フローチャート(その2)である。
【図6】音声辞書構造図である。
【図7】表音文字列例解図である。
【符号の説明】
1 入力変換部
2 データベース
3 文字列抽出部
4 音声規則合成部
5 音声辞書
10 入力部
11 PB信号変換部
20 顧客保有データベース
30 検索組立部
31 出力バッファ
40 音声合成部
41 表音文字列バッファ
50 音声辞書
60 音声出力部

Claims (2)

  1. 漢字文字列を含む文字列を表音文字列に変換する音声規則合成装置であって、
    前記漢字文字列に、該漢字文字列の読み方または該漢字文字列に対応する住所コードを付加情報として付加する付加情報付加手段と、
    前記漢字文字列に付加情報が付加されない場合には該漢字文字列自身で、または付加情報として読み方が付加された場合には前記読み方で、または付加情報として住所コードが付加された場合には前記住所コードで、検索する第1のキーと、該第1のキーに対応する漢字文字列を含んだ第2のキーを対応させた表音文字列検索キーテーブルと、
    前記第2のキーを該漢字文字列の表音文字列と対応付けた表音文字列辞書と、
    前記第1のキーで前記表音文字列検索キーテーブルを検索して対応する第2のキーを取得し、更に該第1のキーに対応する複数の第2のキーを検出したときには、前記漢字文字列を含んだ該第2のキーを選択して取得する検索キー取得手段と、
    前記取得した第2のキーを検索キーとして前記表音文字列辞書を検索して表音文字列を出力する表音文字列検索手段と、
    を備えることを特徴とする音声規則合成装置。
  2. 漢字文字列を含む文字列を表音文字列に変換する音声規則合成方法であって、
    前記漢字文字列に、該漢字文字列の読み方または該漢字文字列に対応する住所コードを付加情報として付加するステップと、
    前記漢字文字列に付加情報が付加されない場合には該漢字文字列自身で、または付加情報として読み方が付加された場合には前記読み方で、または付加情報として住所コードが付加された場合には前記住所コードで、検索する第1のキーと、該第1のキーに対応する漢字文字列を含んだ第2のキーを対応させた表音文字列検索キーテーブルと前記第2のキーを該漢字文字列の表音文字列と対応付けた表音文字列辞書とを用いて、漢字文字列に付加された付加情報に含まれる第1のキーで前記表音文字列検索キーテーブルを検索して対応する第2のキーを取得し、更に該第1のキーに対応する複数の第2のキーを検出したときには、前記漢字文字列を含んだ該第2のキーを選択して取得するステップと、
    前記取得した第2のキーを検索キーとして前記表音文字列辞書を検索して表音文字列を出力するステップと、
    を有することを特徴とする音声規則合成方法。
JP10938795A 1995-05-08 1995-05-08 音声規則合成装置および音声規則合成方法 Expired - Lifetime JP3709578B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10938795A JP3709578B2 (ja) 1995-05-08 1995-05-08 音声規則合成装置および音声規則合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10938795A JP3709578B2 (ja) 1995-05-08 1995-05-08 音声規則合成装置および音声規則合成方法

Publications (2)

Publication Number Publication Date
JPH08305542A JPH08305542A (ja) 1996-11-22
JP3709578B2 true JP3709578B2 (ja) 2005-10-26

Family

ID=14508951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10938795A Expired - Lifetime JP3709578B2 (ja) 1995-05-08 1995-05-08 音声規則合成装置および音声規則合成方法

Country Status (1)

Country Link
JP (1) JP3709578B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000058949A1 (en) * 1999-03-25 2000-10-05 Kent Ridge Digital Labs Low data transmission rate and intelligible speech communication
JP4200852B2 (ja) * 2003-07-25 2008-12-24 トヨタ自動車株式会社 電子メールの配信方法および電子メールを配信するセンター
JP4822847B2 (ja) * 2006-01-10 2011-11-24 アルパイン株式会社 音声変換処理装置

Also Published As

Publication number Publication date
JPH08305542A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
US11037553B2 (en) Learning-type interactive device
JP3135233B2 (ja) 音声認識を用いたロボットホテル従業員
CN107430851B (zh) 发言提示装置及发言提示方法
US7987093B2 (en) Speech synthesizing device, speech synthesizing system, language processing device, speech synthesizing method and recording medium
CN87106964A (zh) 语言翻译系统
KR100785755B1 (ko) 초성 자동완성 및 그에 따른 검색 결과 제공 방법 및시스템
JP3709578B2 (ja) 音声規則合成装置および音声規則合成方法
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JP3071804B2 (ja) 音声合成装置
JP2008293098A (ja) 応答スコア情報生成装置、対話処理装置
JP4515186B2 (ja) 音声辞書作成装置、音声辞書作成方法、及びプログラム
JPS5941226B2 (ja) 音声翻訳装置
KR101132469B1 (ko) 초성 자동완성 및 그에 따른 검색 결과 제공 방법 및시스템
JP2612030B2 (ja) 文章読み上げ装置
JP7231171B1 (ja) 処理動作支援装置及びプログラム
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JP2004139530A (ja) 読み修正プログラム
Zitouni et al. OrienTel: speech-based interactive communication applications for the mediterranean and the Middle East
JPH07319890A (ja) 文書登録検索システム
JP5252209B2 (ja) 読み生成装置
JP2002116789A (ja) データ変換システム、データ認識システム、データ加工システム、およびプログラムを記憶した記憶媒体
JP2005332271A (ja) 質問種別判定装置、質問種別判定方法、および質問種別判定プログラム
Park et al. A Study on the Audio Comparison Expletive Filtering System using TTS
GB2362746A (en) Data recognition and retrieval
JPH1013546A (ja) 音声ダイヤルシステム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040406

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100819

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110819

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130819

Year of fee payment: 8

EXPY Cancellation because of completion of term