JP3073293B2 - 音声情報出力システム - Google Patents

音声情報出力システム

Info

Publication number
JP3073293B2
JP3073293B2 JP03346095A JP34609591A JP3073293B2 JP 3073293 B2 JP3073293 B2 JP 3073293B2 JP 03346095 A JP03346095 A JP 03346095A JP 34609591 A JP34609591 A JP 34609591A JP 3073293 B2 JP3073293 B2 JP 3073293B2
Authority
JP
Japan
Prior art keywords
document data
voice
information
combination
information output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03346095A
Other languages
English (en)
Other versions
JPH05181492A (ja
Inventor
幸雄 田部井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03346095A priority Critical patent/JP3073293B2/ja
Publication of JPH05181492A publication Critical patent/JPH05181492A/ja
Application granted granted Critical
Publication of JP3073293B2 publication Critical patent/JP3073293B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、予め格納されている
各種の情報を合成音声メッセージによって出力する音声
情報出力システムに関するものである。
【0002】
【従来の技術】近年、音声合成技術の発達に伴い、色々
な情報提供分野で合成音による情報提供サービスが普及
しつつある。
【0003】この様な状況のなかでも例えば、電話回線
を利用したデータベースシステムである、具体的には音
声情報サービスシステムなどにおいては、電話機の広範
な普及によってニュースや新聞情報や通信販売などの音
声による提供サービスが用意されており、遠隔地に対す
る即時性の高い情報提供を行うことができるようになっ
ている。
【0004】この様な音声情報による情報提供を行うシ
ステムとして、例えば音声案内制御システムが特願平3
−109725号の明細書及び図面に示されている。
【0005】この音声案内制御システムは、予め複数の
話者の発声による合成単位データを話者別合成単位デー
タベースに用意し、情報データベースに格納された文書
データは、規則合成制御手段によって、話者制御手段の
指定する話者の合成単位データを結合することによって
合成用データを生成し、合成用データベースに格納す
る。この様な構成によってサービスの提供を行う場合
は、合成用データベースに格納されたサービス毎に話者
の異なる合成用データにより音声合成を実施するもので
ある。
【0006】
【発明が解決しようとする課題】しかしながら、以上の
音声案内制御システムにおいては、情報データベースに
格納されている文書データ(例えば、案内や天気予報や
報道ニュースなど)に応じて上記話者別合成単位データ
ベース上のいずれの話者の合成単位データを用い、いず
れかの文書データに対応する合成音を音声合成してお
り、文書データが変われば合成音も変わるが、同じ文書
データを出力要求指定すると常に同じ合成音で情報提供
される。つまり、各文書データに対応して合成音の声質
を固定的に決めているものであるため頻繁に同じ文書デ
ータの情報提供を受けるものにとっては、常に同じ声質
の合成音で聴取することになるため声質の変化がなく、
このシステムを使用して情報を得ることに対して飽きや
すくなり、この様な音声案内制御システムを利用して新
しい情報を得ようという期待感も減退させるという問題
がある。
【0007】この発明は、以上の課題に鑑み為されたも
のであり、その目的とするところは、このシステムにア
クセスするごとに同じ文書データに対する情報出力要求
であっても、異なる声質の合成音声で所望の情報を音声
メッセージ出力することができる音声情報出力システム
を提供することである。
【0008】
【課題を解決するための手段】この発明は、以上の目的
を達成するために、予め文書データを格納している文書
データ格納手段と、上記文書データに対して複数種類の
声質の内、いずれかの声質を有する音声メッセージに変
換する音声合成手段とを備えて、上記文書データに対す
る外部からの情報出力要求の取り込みによって、当該文
書データに対応する上記音声メッセージを出力する音声
情報出力システムにおいて、以下の特徴的な構成で改良
した。
【0009】つまり、複数種類の文書データに対して異
なる声質の音声合成で音声メッセージに変換する場合
の、各文書データと、それぞれに対応する異なる声質の
音声合成を指定する音声合成指定情報との変更可能な組
み合わせをテーブルで管理する組み合わせテーブル管理
手段と、外部から上記情報出力要求を取り込むごとに、
上記組み合わせテーブル管理手段で管理されている上記
組み合わせの内の少なくとも上記情報出力要求取り込み
時に指定される文書データに対応する上記音声合成指定
情報のみを変更する、又は上記管理されている各文書デ
ータに対応する音声合成指定情報を全て変更する組み合
わせ変更手段とを備えて、上記いずれかの文書データに
対する情報出力要求を外部から取り込むと、この情報出
力要求に該当する文書データを上記文書データ格納手段
で検索して、上記組み合わせテーブル管理手段の組み合
わせで指定される上記音声合成指定情報を上記音声合成
手段に供給して、上記検索された該当文書データに対応
する上記音声メッセージを生成して出力することを特徴
とするまた、上記組み合わせ変更手段は、乱数発生に
よって得られる乱数を利用して、上記組み合わせテーブ
ル管理手段で管理されている上記各文書データと、それ
ぞれに対応する上記音声合成指定情報との上記組み合わ
せを変更することが好ましい。
【0010】
【作用】この発明によれば、上記組み合わせテーブル管
理手段と、上記組み合わせ変更手段とで、各文書データ
に対する音声合成を異なる声質に、外部から上記情報出
力要求を取り込むごとに変更しているので、例えば、同
じ文書データに対する出力要求であっても、毎回異なる
声質の合成音で音声出力でき、この様な組み合わせの変
更によって、この音声情報出力システムを利用させるユ
ーザの期待を喚起させ、バラエティーに富んだ音声情報
提供を行うことができる。
【0011】また上記変更を乱数で行うことによって、
自動的に不規則に変更を行うことができるので更にバラ
エティーな音声メッセージを提供するこができる。
【0012】
【実施例】次にこの発明に係る音声情報出力システムの
好適な一実施例を図面を用いて説明する。
【0013】この実施例の目的は、従来の様な予め話者
の音声情報を取り込んで利用することなく合成音を生成
でき、しかも同じカテゴリー(例えば、新聞情報などの
場合、政治面や経済面やスポーツ面などに相当)にアク
セスしても、アクセスするごとに声質の異なる合成音
で、予め格納されている複数のカテゴリーの情報の内、
所望のカテゴリーの情報を音声情報で出力する音声情報
出力システムを提供する。
【0014】この目的を実現するために、各カテゴリー
分野に対応して、複数の合成音声の内、いずれの声質の
合成音声で情報を出力するか否かを決める組み合わせ情
報を疑似乱数などを利用して発生させ、この組み合わせ
情報は、電話回線からの電話などによる情報提供要求の
アクセスのごとに、この組み合わせ情報を自動的にラン
ダムに変更し、例えば、同じカテゴリー分野に対する出
力要求であっても、毎回異なる声質の合成音で音声出力
できる様にした。
【0015】また、予め声質の異なる合成音声を生成さ
せるための複数の種類の音声素片情報を各メモリに格納
して、これに基づき音声合成できる様にした。
【0016】図1は、この実施例に係る音声情報出力シ
ステムの機能ブロック図を示している。
【0017】この図1において、この実施例の音声情報
出力システムは、主制御部102と、文書データベース
ファイル103と、組み合わせテーブル発生部104
と、テキスト・音声変換系110とで構成されている。
そして、上記テキスト音声・変換系110は、日本語解
析部106と、単語辞書105と、規則合成部108
と、声質(1〜N)素片メモリ107(1)〜107
(N)とで構成されている。また、上記組み合わせテー
ブル発生部104は、乱数発生部分1041も含まれて
いる。
【0018】主制御部102は、電話回線などとこの音
声情報出力システムとを回線接続するための回線接続部
から呼び出し信号やメニュー選択信号などを取り込み、
そして、メニュー音声信号や規則合成された合成音声情
報などを回線接続部へ供給する。
【0019】文書データベースファイル103は、予め
複数(M)のカテゴリー(例えば、新聞情報などの場
合、政治面や経済面やスポーツ面などに相当)分野ごと
に日本語文書データを格納している。
【0020】単語辞書105は、例えば、一般辞書領域
とユーザ辞書領域などから構成され、色々な漢字やカタ
カナなどに対する読み方の情報や、そのアクセント位置
の情報や、文法情報などを格納している。
【0021】日本語解析部106は、文書データベース
ファイル103から供給された漢字仮名混じり文である
文書データを単語辞書105を用いて形態素解析してア
クセント記号付きの仮名文に変換して規則合成部108
に供給する。
【0022】声質(1〜N)素片メモリ107(1)〜
107(N)はそれぞれ異なる声質の合成音声を生成す
るための音声素片情報を予め格納している。この音声素
片とは、現在研究及び実施されつつある規則音声合成に
適したスペクトル包絡情報である。この音声素片の作成
方法については、例えば文献:沖電気研究開発、199
1年10月第152号Vol.58、No.4、pp8
5〜pp90などに示されている。
【0023】規則合成部108は、上記声質(1〜N)
素片メモリ107(1)〜107(N)のいずれか一つ
の音声素片情報を用いて、上記日本語解析部106の解
析で生成されたアクセント記号付きの仮名文に対する規
則音声合成を行い、合成音声を主制御部102に供給す
る。このときにいずれの音声素片メモリの情報を使用す
るかは、組み合わせテーブル発生部104から供給され
る組み合わせ情報に基づき選択する。
【0024】組み合わせテーブル発生部104は、上記
各カテゴリー分野に対応して、いずれの声質の合成音声
で情報を出力するか否かを決める組み合わせ情報を発生
して規則合成部108に供給する。この組み合わせ情報
は、電話回線からの電話などによる情報要求のアクセス
のごとに、この組み合わせ情報はランダムに変更する。
この様にランダムに変更させることによって、例えば、
同じカテゴリー分野に対する出力要求であっても、毎回
異なる声質の合成音で音声出力できる様にさせるために
行うものである。この様な組み合わせの変更によって、
この音声情報出力システムを利用させるユーザの期待を
喚起させ、バラエティーに富んだ音声情報の提供を行う
ことができる。
【0025】この組み合わせ情報を、情報要求のアクセ
スごとにランダムに変更するためには、乱数発生部分1
041で発生する疑似乱数などを用いて変更することが
できる。
【0026】あるアクセス(a回目)時の上記組み合わ
せ情報の例を以下の表1に示す。
【0027】
【表1】 また、あるアクセス(d回目)時の上記組み合わせ情報
の変更例を以下の表2に示す。
【0028】
【表2】 上記のような場合、例えば声質の種類N個とカテゴリー
の種類M個の関係がN≧Mの場合は、組み合わせの数は
=N!/(N−M)!として表すことができる。
【0029】そして、上記組み合わせ情報は、例えば、
あるアクセス(例えば、d回目)時のカテゴリーK1の
情報を声質(1)の合成音で出力させたならば、次に当
該アクセスで継続してカテゴリーK2の情報の出力に
は、前回カテゴリーK1の情報出力に使用した声質
(1)は使用しないものとする。これは例えば同じアク
セス内の情報出力においては、異なるカテゴリーの情報
を重複して同じ声質の合成音で出力させない様にさせる
ためである。この様にするのは情報の提供を受ける者が
声質の変化を聴取することによってカテゴリーの変化を
認識しやすくさせるためである。
【0030】図2は、上述の図1の音声情報出力システ
ムの処理フローチャートである。
【0031】この図2において、まず主制御部102
は、回線接続されたか否かを判断する(S201)。回
線接続されたと判断されると、主制御部102は、情報
出力アクセス要求を受けて、これに基づき上記組み合わ
せテーブル発生部104に組み合わせ情報の出力命令を
供給し、この命令を受けた組み合わせテーブル発生部1
04は、乱数発生部分1041の乱数発生によって、各
カテゴリーに対する異なる声質を割り当てる。例えば上
述のようにカテゴリーK(1)に対して声質(N)、・
・・などを割り当て、全てのカテゴリーに対して異なる
声質符号を割り当てて、得られた上述のような組み合わ
せ情報を規則合成部108に供給する(S202)。
【0032】次に主制御部102は、アクセス要求を発
行した電話機の話者に対していずれのカテゴリーの文書
データを音声出力させるかを選択させるために、メニュ
ー合成音を回線接続部に供給する(S203)。上記話
者の電話機に上記メニューが供給されると、話者からの
電話機のプッシュボタン操作入力などによって入力され
たカテゴリーK選択番号を主制御部102は取り込む
(S204)。次にこの取り込んだカテゴリーK選択番
号がストップコードであるか否かを判断する(S20
5)。ここでストップコードであると判断されると情報
出力サービスの処理を終了させる。
【0033】しかしながら、上記S205でストップコ
ードでないと判断されると、次に主制御部102は取り
込まれたカテゴリーK選択番号が、K(1)〜K(M)
のいずれかに該当するか否かを判断し(S206)、該
当しなければエラメッセージを生成して回線接続部へ供
給し(S210)、再び前記S203の処理を行う。し
かしながら、前記S206において、カテゴリーK選択
番号が該当すると判断されると、次に主制御部102は
文書データベースファイル103に対して、カテゴリー
K選択番号を供給して、該当する文書データを読み出し
て日本語解析部106に供給する(S207)。
【0034】次に日本語解析部106は供給されたカテ
ゴリーK(番号)の文書データに対して、上記単語辞書
105を用いて解析して、漢字仮名混じり文をアクセン
ト記号付き仮名文に変換生成して規則合成部108に供
給する(S208)。次に規則合成部108は、前記S
202で生成されて供給された組み合わせ情報に基づ
き、カテゴリーK(番号)に対応する声質(番号)の素
片メモリの音声素片情報を使用して、日本語解析部10
6から供給された上記アクセント記号付き仮名文に対応
する合成音を生成して主制御部102に供給する(S2
09)。
【0035】例えば、上記表1によれば、カテゴリーK
(1)の新聞の1面政治分野に対して声質(1)の合成
音声を生成する。
【0036】この様にして得られた合成音声は、回線接
続部に供給してこの回線接続部から要求話者に音声情報
を提供する。そして、前記S209における音声合成が
終了したならば前記S203に再び戻って処理を繰り返
す。
【0037】以上の実施例に示した様に、上記組み合わ
せテーブル発生部104は、上記各カテゴリー分野に対
応して、いずれの声質の合成音声で情報を出力するか否
かを決める組み合わせ情報を疑似乱数など利用して発生
させている。この組み合わせ情報は、電話回線からの電
話などによる情報提供要求のアクセスのごとに、この組
み合わせ情報を自動的にランダムに変更しているので、
例えば、同じカテゴリー分野に対する出力要求であって
も、毎回異なる声質の合成音で音声出力でき、この様な
組み合わせの変更によって、この音声情報出力システム
を利用させるユーザの期待を喚起させ、バラエティーに
富んだ音声情報提供を行うことができる。
【0038】また、予め声質の異なる合成音声を生成さ
せるための音声素片情報を各メモリに格納しているの
で、あるサンプルの音声素片情報であるスペクトル包絡
情報などを修正処理などして合成疑似音声を生成でき
る。従って、従来の様に異なる複数人の発生音声を一々
マイクなどで取り込んで、情報を抽出する手間がかから
ず、この実施例によれば、例えば、肉声とは感じられな
くとも、異なる複数の合成疑似音声を比較的簡単に生成
できる。
【0039】以上の実施例においては、音声情報出力シ
ステムを例に説明したが、音声情報案内システムであっ
ても適用でき、音声情報提供サービスシステムであって
も適用でき、データベースシステムで音声応答などを行
うシステムであっても適用することができる。
【0040】以上の実施例においては、日本語による音
声合成を例に説明したが、これに限るものではなく、他
の言語による音声合成であっても適用できる。また、文
書データベースファイル103に格納されている各文書
データも日本語以外の他の言語の文書データなどが混ざ
っていても適用することができる。
【0041】また、以上の実施例の図1においては、声
質(1〜N)素片メモリを別々のメモリに格納する様に
構成したが、これに限るものではない。他に例えば一つ
のメモリ素子(RAMやROMなど)に格納する様に構
成してもよい。
【0042】以上の実施例においては、外部からの情報
出力要求が供給されるごとに、組み合わせテーブル発生
部104に管理している各文書データに対する組み合わ
せ情報を全部一度に変更したが、これに限るものではな
い。例えば、外部から情報出力要求が供給された時に指
定されたカテゴリーの文書データのみに対する合成音声
の声質を上記疑似乱数で変更するように構成してもよ
い。
【0043】
【発明の効果】以上述べたようにこの発明によれば、上
記組み合わせテーブル管理手段と、組み合わせ変更手段
とを備えているので、この発明のシステムにアクセスす
るごとに毎回同じ文書データに対する情報出力要求であ
っても、自動的に異なる声質の合成音声で所望の情報を
音声メッセージ出力する音声情報出力システムを提供す
ることができる。
【図面の簡単な説明】
【図1】この実施例に係る音声情報出力システムの機能
ブロック図である。
【図2】この実施例に係る音声情報出力システムの処理
フローチャートである。
【符号の説明】
102…主制御部、103…文書データベースファイ
ル、104…組み合わせテーブル発生部、105…単語
辞書、106…日本語解析部、107(1)〜(N)…
声質(1〜N)素片メモリ、108…規則合成部、10
41…乱数発生部分。
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 G06F 3/16 340 H04M 11/10 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 予め文書データを格納している文書デー
    タ格納手段と、上記文書データに対して複数種類の声質
    の内、いずれかの声質を有する音声メッセージに変換す
    る音声合成手段とを備えて、上記文書データに対する外
    部からの情報出力要求の取り込みによって、当該文書デ
    ータに対応する上記音声メッセージを出力する音声情報
    出力システムにおいて、 複数種類の文書データに対して異なる声質の音声合成で
    音声メッセージに変換する場合の、各文書データと、そ
    れぞれに対応する異なる声質の音声合成を指定する音声
    合成指定情報との変更可能な組み合わせをテーブルで管
    理する組み合わせテーブル管理手段と、 外部から上記情報出力要求を取り込むごとに、上記組み
    合わせテーブル管理手段で管理されている上記組み合わ
    せの内の少なくとも上記情報出力要求取り込み時に指定
    される文書データに対応する上記音声合成指定情報のみ
    を変更する、又は上記管理されている各文書データに対
    応する音声合成指定情報を全て変更する組み合わせ変更
    手段とを備えて、 上記いずれかの文書データに対する情報出力要求を外部
    から取り込むと、この情報出力要求に該当する文書デー
    タを上記文書データ格納手段で検索して、上記組み合わ
    せテーブル管理手段の組み合わせで指定される上記音声
    合成指定情報を上記音声合成手段に供給して、上記検索
    された該当文書データに対応する上記音声メッセージを
    生成して出力することを特徴とする音声情報出力システ
    ム。
  2. 【請求項2】 上記組み合わせ変更手段は、乱数発生に
    よって得られる乱数を利用して、上記組み合わせテーブ
    ル管理手段で管理されている上記各文書データと、それ
    ぞれに対応する上記音声合成指定情報との上記組み合わ
    せを変更することを特徴とする請求項1に記載の音声情
    報出力システム。
JP03346095A 1991-12-27 1991-12-27 音声情報出力システム Expired - Fee Related JP3073293B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03346095A JP3073293B2 (ja) 1991-12-27 1991-12-27 音声情報出力システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03346095A JP3073293B2 (ja) 1991-12-27 1991-12-27 音声情報出力システム

Publications (2)

Publication Number Publication Date
JPH05181492A JPH05181492A (ja) 1993-07-23
JP3073293B2 true JP3073293B2 (ja) 2000-08-07

Family

ID=18381105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03346095A Expired - Fee Related JP3073293B2 (ja) 1991-12-27 1991-12-27 音声情報出力システム

Country Status (1)

Country Link
JP (1) JP3073293B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3274041B2 (ja) * 1995-05-26 2002-04-15 株式会社タイトー 音声出力の声色を変えることができるゲーム機
JP2002297174A (ja) * 2001-04-02 2002-10-11 Oki Electric Ind Co Ltd テキスト音声合成装置
US6681208B2 (en) 2001-09-25 2004-01-20 Motorola, Inc. Text-to-speech native coding in a communication system
WO2018175135A1 (en) 2017-03-21 2018-09-27 International Paper Company Odor control pulp composition

Also Published As

Publication number Publication date
JPH05181492A (ja) 1993-07-23

Similar Documents

Publication Publication Date Title
US6895257B2 (en) Personalized agent for portable devices and cellular phone
JP3037947B2 (ja) 無線システム、情報信号送付システム、ユ―ザ端末及びクライアント/サ―バ・システム
US7027568B1 (en) Personal message service with enhanced text to speech synthesis
US6081780A (en) TTS and prosody based authoring system
US6678659B1 (en) System and method of voice information dissemination over a network using semantic representation
US7693719B2 (en) Providing personalized voice font for text-to-speech applications
US9812120B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US20040064322A1 (en) Automatic consolidation of voice enabled multi-user meeting minutes
US20060210028A1 (en) System and method for personalized text-to-voice synthesis
US20090012793A1 (en) Text-to-speech assist for portable communication devices
JP2008529101A (ja) 移動通信装置の音声語彙を自動的に拡張するための方法及び装置
KR20020094988A (ko) 음성합성방법 및 그것을 실시하는 음성합성장치
JP2009112000A (ja) 実時間対話型コンテンツを無線交信ネットワーク及びインターネット上に形成及び分配する方法及び装置
JP2009112000A6 (ja) 実時間対話型コンテンツを無線交信ネットワーク及びインターネット上に形成及び分配する方法及び装置
KR20010076508A (ko) Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
US20080045199A1 (en) Mobile communication terminal and text-to-speech method
US20050114139A1 (en) Method of operating a speech dialog system
JP2011253389A (ja) 端末および擬似会話用返答情報作成プログラム
US6574598B1 (en) Transmitter and receiver, apparatus and method, all for delivery of information
JP3073293B2 (ja) 音声情報出力システム
JP3595041B2 (ja) 音声合成システムおよび音声合成方法
US20030120492A1 (en) Apparatus and method for communication with reality in virtual environments
JPH04175049A (ja) 音声応答装置
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP2007259427A (ja) 携帯端末装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080602

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees