JP2001272992A - 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体 - Google Patents

音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体

Info

Publication number
JP2001272992A
JP2001272992A JP2000090732A JP2000090732A JP2001272992A JP 2001272992 A JP2001272992 A JP 2001272992A JP 2000090732 A JP2000090732 A JP 2000090732A JP 2000090732 A JP2000090732 A JP 2000090732A JP 2001272992 A JP2001272992 A JP 2001272992A
Authority
JP
Japan
Prior art keywords
dictionary
terminal device
speech
server
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000090732A
Other languages
English (en)
Inventor
Akira Ro
彬 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000090732A priority Critical patent/JP2001272992A/ja
Publication of JP2001272992A publication Critical patent/JP2001272992A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 各端末装置に大規模の音声合成用辞書をもた
せることなく、各端末装置において所望の音声合成用辞
書を容易に獲得することの可能なテキスト読上げシステ
ムを提供する。 【解決手段】 端末装置30−1の辞書獲得手段32
は、所望の声質の音声合成用辞書の特徴情報をネットワ
ーク20を介して辞書サーバー10に送信し、これによ
り、サーバー10から所望の声質の音声合成用辞書を獲
得するようになっている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声処理システム
およびテキスト読上げシステムおよび音声認識システム
および辞書獲得方法および辞書登録方法および端末装置
および辞書サーバーおよび記録媒体に関する。
【0002】
【従来の技術】従来、例えば、特開平11−10219
8号には、異なる声質の複数の音声合成用辞書をテキス
ト読上げ装置に持たせ、複数の電子メールなどのような
メッセージを読上げる際、ユーザに区別できるように、
異なる声質で読上げる技術が示されている。
【0003】また、特開平11−38996号には、ネ
ットワークに接続されている各端末装置に音声合成用辞
書作成機能を持たせ、相手ユーザの端末装置に、メール
とともに新規作成した音声合成用辞書を送信でき、相手
ユーザの端末装置では、メールの読上げ時に、メールの
ヘッダーに記述されているユーザIDと相手ユーザの端
末装置に格納されている各音声合成用辞書の識別情報と
を照合し、そのユーザIDと一致する音声合成用辞書を
選択することで、ユーザにより分かりやすくメールを読
上げることの可能な音声メールシステムが示されてい
る。すなわち、この音声メールシステムでは、音声合成
用辞書を選択することで、すなわち声質を変えること
で、ユーザにとってより分かりやすく、聞き取りやすい
ようにメールを読み上げることができる。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
11−102198号に示されているテキスト読上げ装
置では、テキスト読上げ装置の持っている既存の声質で
しか読上げができないため、ユーザにとって、読上げる
声の質の選択余地がほとんど与えられていない。例え
ば、ユーザが自分の声あるいは好きな他人の声でテキス
ト読上げ装置にテキストを読上げさせることができない
という問題があった。
【0005】また、特開平11−38996号に示され
ている音声メールシステムでは、ネットワークに接続さ
れている各端末装置に音声合成用辞書作成機能を持たせ
ることによって、ユーザ自身の声や他人の声で、受信し
たメールを読上げることができるが、複数個の音声合成
用辞書を各ユーザの端末装置に格納しなければならな
い。現在の音声合成に関する研究では、より良い音声で
文書を読上げるため、音声合成用辞書の規模が拡大され
る傾向があるので、大規模の音声合成用辞書を1つの端
末装置にもたせるには限界がある。
【0006】また、同じ音声合成用辞書を、ネットワー
クに接続されている複数個の各端末装置のそれぞれにも
たせると、資源の無駄になってしまう。
【0007】さらに、メールは、メールのやりとりのあ
るユーザ同士の間でしかできないので、互いに全く知ら
ないユーザ間では、音声合成用辞書の交換を行なうこと
ができないという問題があった。
【0008】本発明は、各端末装置に大規模の音声処理
用辞書または音声合成用辞書または音声認識用辞書をも
たせることなく、各端末装置において所望の音声処理用
辞書または音声合成用辞書または音声認識用辞書を容易
に獲得することの可能な音声処理システムおよびテキス
ト読上げシステムおよび音声認識システムおよび辞書獲
得方法および辞書登録方法および端末装置および辞書サ
ーバーおよび記録媒体を提供することを目的としてい
る。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、音声処理機能を備えた端末
装置と、少なくとも1つの音声処理用辞書が格納されて
いる辞書サーバーとを備え、端末装置が辞書サーバーに
ネットワークを介して接続されている音声処理システム
であって、端末装置は、所望の音声処理用辞書を辞書サ
ーバーからネットワークを介して獲得する辞書獲得手段
を有していることを特徴としている。
【0010】また、請求項2記載の発明は、請求項1記
載の音声処理システムにおいて、辞書サーバーは、少な
くとも1つの音声処理用辞書を格納する辞書格納手段
と、辞書格納手段に格納されている音声処理用辞書の特
徴情報が記述されている辞書検索テーブルとを有し、端
末装置の辞書獲得手段は、所望の音声処理用辞書の特徴
情報をネットワークを介して辞書サーバーに送信し、辞
書サーバーは、音声処理用辞書の特徴情報を端末装置か
ら受信したときに、受信した音声処理用辞書の特徴情報
を辞書検索テーブルと照合し、照合の結果、最も一致す
る音声処理用辞書を辞書格納手段から取り出して、端末
装置に送信するようになっていることを特徴としてい
る。
【0011】また、請求項3記載の発明は、音声処理機
能を備えた端末装置と、少なくとも1つの音声処理用辞
書が格納される辞書サーバーとを備え、端末装置が辞書
サーバーにネットワークを介して接続されている音声処
理システムであって、端末装置は、音声処理用辞書を作
成するための辞書作成手段を有し、また、辞書サーバー
は、少なくとも1つの音声処理用辞書を格納する辞書格
納手段を有しており、端末装置が辞書作成手段によって
作成された音声処理用辞書をネットワークを介して辞書
サーバーに送信するとき、辞書サーバーは、端末装置か
ら送信された音声処理用辞書を辞書格納手段に登録する
ようになっていることを特徴としている。
【0012】また、請求項4記載の発明は、請求項3記
載の音声処理システムにおいて、端末装置は、さらに、
辞書作成手段によって作成された音声処理用辞書の特徴
情報を作成する特徴情報作成手段を有し、また、辞書サ
ーバーは、辞書格納手段に格納されている音声処理用辞
書の特徴情報が記述されている辞書検索テーブルをさら
に有し、端末装置は、辞書作成手段によって作成された
音声処理用辞書および特徴情報作成手段によって作成さ
れた音声処理用辞書の特徴情報をネットワークを介して
辞書サーバーに送信するとき、辞書サーバーは、端末装
置から送信された音声処理用辞書を辞書格納手段に登録
するとともに、端末装置から送信された特徴情報を辞書
検索テーブルに登録するようになっていることを特徴と
している。
【0013】また、請求項5記載の発明は、音声処理機
能を備えた端末装置と少なくとも1つの音声処理用辞書
が格納されている辞書サーバーとがネットワークを介し
て接続されているときに、端末装置は、所望の音声処理
用辞書を辞書サーバーからネットワークを介して獲得す
ることを特徴としている。
【0014】また、請求項6記載の発明は、音声処理機
能を備えた端末装置と少なくとも1つの音声処理用辞書
が格納される辞書サーバーとがネットワークを介して接
続されているときに、端末装置において、音声処理用辞
書を作成し、作成した音声処理用辞書をネットワークを
介して辞書サーバーに送信すると、辞書サーバーは、端
末装置から送信された音声処理用辞書を登録することを
特徴としている。
【0015】また、請求項7記載の発明は、音声処理用
辞書が格納されている辞書サーバーにネットワークを介
して接続されている端末装置であって、端末装置は、所
望の音声処理用辞書を辞書サーバーからネットワークを
介して獲得する辞書獲得手段を有していることを特徴と
している。
【0016】また、請求項8記載の発明は、少なくとも
1つの音声処理用辞書を格納する辞書格納手段と、辞書
格納手段に格納されている音声処理用辞書の特徴情報が
記述されている辞書検索テーブルとを有している辞書サ
ーバーであって、該辞書サーバーは、音声処理用辞書の
特徴情報を端末装置からネットワークを介して受信した
ときに、受信した音声処理用辞書の特徴情報を前記辞書
検索テーブルと照合し、照合の結果、最も一致する音声
処理用辞書を辞書格納手段から取り出して、端末装置に
送信するようになっていることを特徴としている。
【0017】また、請求項9記載の発明は、辞書サーバ
ーにネットワークを介して接続されている端末装置であ
って、端末装置は、ユーザの発声により入力した音声デ
ータから音声処理用辞書を作成する辞書作成手段と、該
音声処理用辞書の特徴情報をユーザに入力させる特徴情
報入力手段と、作成された音声処理用辞書と入力された
音声処理用辞書の特徴情報とをネットワークを介して辞
書サーバーに送信する送信手段とを有していることを特
徴としている。
【0018】また、請求項10記載の発明は、少なくと
も1つの音声処理用辞書を格納する辞書格納手段と、辞
書格納手段に格納されている音声処理用辞書の特徴情報
が記述されている辞書検索テーブルとを有している辞書
サーバーであって、端末装置において作成された音声処
理用辞書および音声処理用辞書の特徴情報が端末装置か
らネットワークを介して送信されるとき、辞書サーバー
は、端末装置から送信された音声処理用辞書を辞書格納
手段に登録するとともに、端末装置から送信された特徴
情報を辞書検索テーブルに登録するようになっているこ
とを特徴としている。
【0019】また、請求項11記載の発明は、ユーザの
発声により入力した音声データから音声処理用辞書を作
成する辞書作成処理と、該音声処理用辞書の特徴情報を
ユーザに入力させる特徴情報入力処理と、作成された音
声処理用辞書と入力された音声処理用辞書の特徴情報と
をネットワークを介して辞書サーバーに送信する送信処
理とをコンピュータに実行させるためのプログラムを記
録したコンピュータ読み込み可能な記録媒体である。
【0020】また、請求項12記載の発明は、端末装置
において作成された音声処理用辞書および音声処理用辞
書の特徴情報が端末装置からネットワークを介して送信
されるとき、端末装置から送信された音声処理用辞書を
辞書格納手段に登録するとともに、端末装置から送信さ
れた特徴情報を辞書検索テーブルに登録する処理をコン
ピュータに実行させるためのプログラムを記録したコン
ピュータ読み込み可能な記録媒体である。
【0021】また、請求項13記載の発明は、所定のテ
キストを合成音声で読上げるテキスト読上げ機能を備え
た端末装置と、互いに異なる声質の少なくとも1つの音
声合成用辞書が格納されている辞書サーバーとを備え、
端末装置が前記辞書サーバーにネットワークを介して接
続されているテキスト読上げシステムであって、端末装
置は、所望の声質の音声合成用辞書を辞書サーバーから
ネットワークを介して獲得する辞書獲得手段を有してい
ることを特徴としている。
【0022】また、請求項14記載の発明は、請求項1
3記載のテキスト読上げシステムにおいて、辞書サーバ
ーは、互いに異なる声質の少なくとも1つの音声合成用
辞書を格納する辞書格納手段と、辞書格納手段に格納さ
れている音声合成用辞書の特徴情報が記述されている辞
書検索テーブルとを有し、端末装置の辞書獲得手段は、
所望の声質の音声合成用辞書の特徴情報をネットワーク
を介して辞書サーバーに送信し、辞書サーバーは、音声
合成用辞書の特徴情報を端末装置から受信したときに、
受信した音声合成用辞書の特徴情報を辞書検索テーブル
と照合し、照合の結果、最も一致する音声合成用辞書を
辞書格納手段から取り出して、端末装置に送信するよう
になっていることを特徴としている。
【0023】また、請求項15記載の発明は、所定のテ
キストを合成音声で読上げるテキスト読上げ機能を備え
た端末装置と、互いに異なる声質の少なくとも1つの音
声合成用辞書が格納される辞書サーバーとを備え、端末
装置が辞書サーバーにネットワークを介して接続されて
いるテキスト読上げシステムであって、端末装置は、音
声合成用辞書を作成するための辞書作成手段を有し、ま
た、辞書サーバーは、互いに異なる声質の少なくとも1
つの音声合成用辞書を格納する辞書格納手段を有してお
り、端末装置が辞書作成手段によって作成された音声合
成用辞書をネットワークを介して辞書サーバーに送信す
るとき、辞書サーバーは、端末装置から送信された音声
合成用辞書を辞書格納手段に登録するようになっている
ことを特徴としている。
【0024】また、請求項16記載の発明は、請求項1
5記載のテキスト読上げシステムにおいて、端末装置
は、さらに、辞書作成手段によって作成された音声合成
用辞書の特徴情報を作成する特徴情報作成手段を有し、
また、辞書サーバーは、辞書格納手段に格納されている
音声合成用辞書の特徴情報が記述されている辞書検索テ
ーブルをさらに有し、端末装置は、辞書作成手段によっ
て作成された音声合成用辞書および特徴情報作成手段に
よって作成された音声合成用辞書の特徴情報をネットワ
ークを介して辞書サーバーに送信するとき、辞書サーバ
ーは、端末装置から送信された音声合成用辞書を辞書格
納手段に登録するとともに、端末装置から送信された特
徴情報を辞書検索テーブルに登録するようになっている
ことを特徴としている。
【0025】また、請求項17記載の発明は、所定のテ
キストを合成音声で読上げるテキスト読上げ機能を備え
た端末装置と少なくとも1つの音声合成用辞書が格納さ
れている辞書サーバーとがネットワークを介して接続さ
れているときに、端末装置は、所望の声質の音声合成用
辞書を辞書サーバーからネットワークを介して獲得する
ことを特徴としている。
【0026】また、請求項18記載の発明は、所定のテ
キストを合成音声で読上げるテキスト読上げ機能を備え
た端末装置と少なくとも1つの音声合成用辞書が格納さ
れる辞書サーバーとがネットワークを介して接続されて
いるときに、端末装置において、音声合成用辞書を作成
し、作成した音声合成用辞書をネットワークを介して辞
書サーバーに送信すると、辞書サーバーは、端末装置か
ら送信された音声合成用辞書を登録することを特徴とし
ている。
【0027】また、請求項19記載の発明は、請求項1
8記載の辞書登録方法において、端末装置における音声
合成用辞書の作成は、音声入力データ内容をユーザに提
示し、これに基づいてユーザが音声データを入力する
と、入力された音声データが成功したか否かを音声認識
によって判断し、入力された音声データが成功であると
判断されると、入力された音声データから各子音と母音
の素片波形を抽出することによってなされることを特徴
としている。
【0028】また、請求項20記載の発明は、音声合成
用辞書が格納されている辞書サーバーにネットワークを
介して接続されている端末装置であって、端末装置は、
所望の声質の音声合成用辞書を辞書サーバーからネット
ワークを介して獲得する辞書獲得手段を有していること
を特徴としている。
【0029】また、請求項21記載の発明は、互いに異
なる声質の少なくとも1つの音声合成用辞書を格納する
辞書格納手段と、辞書格納手段に格納されている音声合
成用辞書の特徴情報が記述されている辞書検索テーブル
とを有している辞書サーバーであって、該辞書サーバー
は、所望の声質の音声合成用辞書の特徴情報を端末装置
からネットワークを介して受信したときに、受信した音
声合成用辞書の特徴情報を前記辞書検索テーブルと照合
し、照合の結果、最も一致する音声合成用辞書を辞書格
納手段から取り出して、端末装置に送信するようになっ
ていることを特徴としている。
【0030】また、請求項22記載の発明は、辞書サー
バーにネットワークを介して接続されている端末装置で
あって、端末装置は、ユーザの発声により入力した音声
データから音声合成用辞書を作成する辞書作成手段と、
該音声合成用辞書の特徴情報をユーザに入力させる特徴
情報入力手段と、作成された音声合成用辞書と入力され
た音声合成用辞書の特徴情報とをネットワークを介して
辞書サーバーに送信する送信手段とを有していることを
特徴としている。
【0031】また、請求項23記載の発明は、互いに異
なる声質の少なくとも1つの音声合成用辞書を格納する
辞書格納手段と、辞書格納手段に格納されている音声合
成用辞書の特徴情報が記述されている辞書検索テーブル
とを有している辞書サーバーであって、端末装置におい
て作成された音声合成用辞書および音声合成用辞書の特
徴情報が端末装置からネットワークを介して送信される
とき、辞書サーバーは、端末装置から送信された音声合
成用辞書を辞書格納手段に登録するとともに、端末装置
から送信された特徴情報を辞書検索テーブルに登録する
ようになっていることを特徴としている。
【0032】また、請求項24記載の発明は、ユーザの
発声により入力した音声データから音声合成用辞書を作
成する辞書作成処理と、該音声合成用辞書の特徴情報を
ユーザに入力させる特徴情報入力処理と、作成された音
声合成用辞書と入力された音声合成用辞書の特徴情報と
をネットワークを介して辞書サーバーに送信する送信処
理とをコンピュータに実行させるためのプログラムを記
録したコンピュータ読み込み可能な記録媒体である。
【0033】また、請求項25記載の発明は、端末装置
において作成された音声合成用辞書および音声合成用辞
書の特徴情報が端末装置からネットワークを介して送信
されるとき、端末装置から送信された音声合成用辞書を
辞書格納手段に登録するとともに、端末装置から送信さ
れた特徴情報を辞書検索テーブルに登録する処理をコン
ピュータに実行させるためのプログラムを記録したコン
ピュータ読み込み可能な記録媒体である。
【0034】また、請求項26記載の発明は、音声認識
機能を備えた端末装置と、少なくとも1つの音声認識用
辞書が格納されている辞書サーバーとを備え、端末装置
が辞書サーバーにネットワークを介して接続されている
音声認識システムであって、端末装置は、所望の音声認
識用辞書を辞書サーバーからネットワークを介して獲得
する辞書獲得手段を有していることを特徴としている。
【0035】また、請求項27記載の発明は、請求項2
6記載の音声認識システムにおいて、辞書サーバーは、
少なくとも1つの音声認識用辞書を格納する辞書格納手
段と、辞書格納手段に格納されている音声認識用辞書の
特徴情報が記述されている辞書検索テーブルとを有し、
端末装置の辞書獲得手段は、所望の音声認識用辞書の特
徴情報をネットワークを介して辞書サーバーに送信し、
辞書サーバーは、音声認識用辞書の特徴情報を端末装置
から受信したときに、受信した音声認識用辞書の特徴情
報を辞書検索テーブルと照合し、照合の結果、最も一致
する音声認識用辞書を辞書格納手段から取り出して、端
末装置に送信するようになっていることを特徴としてい
る。
【0036】また、請求項28記載の発明は、音声認識
機能を備えた端末装置と、少なくとも1つの音声認識用
辞書が格納される辞書サーバーとを備え、端末装置が辞
書サーバーにネットワークを介して接続されている音声
認識システムであって、端末装置は、音声認識用辞書を
作成するための辞書作成手段を有し、また、辞書サーバ
ーは、少なくとも1つの音声認識用辞書を格納する辞書
格納手段を有しており、端末装置が辞書作成手段によっ
て作成された音声認識用辞書をネットワークを介して辞
書サーバーに送信するとき、辞書サーバーは、端末装置
から送信された音声認識用辞書を辞書格納手段に登録す
るようになっていることを特徴としている。
【0037】また、請求項29記載の発明は、請求項2
8記載の音声認識システムにおいて、端末装置は、さら
に、辞書作成手段によって作成された音声認識用辞書の
特徴情報を作成する特徴情報作成手段を有し、また、辞
書サーバーは、辞書格納手段に格納されている音声認識
用辞書の特徴情報が記述されている辞書検索テーブルを
さらに有し、端末装置は、辞書作成手段によって作成さ
れた音声認識用辞書および特徴情報作成手段によって作
成された音声認識用辞書の特徴情報をネットワークを介
して辞書サーバーに送信するとき、辞書サーバーは、端
末装置から送信された音声認識用辞書を辞書格納手段に
登録するとともに、端末装置から送信された特徴情報を
辞書検索テーブルに登録するようになっていることを特
徴としている。
【0038】また、請求項30記載の発明は、音声認識
機能を備えた端末装置と少なくとも1つの音声認識用辞
書が格納されている辞書サーバーとがネットワークを介
して接続されているときに、端末装置は、所望の音声認
識用辞書を辞書サーバーからネットワークを介して獲得
することを特徴としている。
【0039】また、請求項31記載の発明は、音声認識
機能を備えた端末装置と少なくとも1つの音声認識用辞
書が格納される辞書サーバーとがネットワークを介して
接続されているときに、端末装置において、音声認識用
辞書を作成し、作成した音声認識用辞書をネットワーク
を介して辞書サーバーに送信すると、辞書サーバーは、
端末装置から送信された音声認識用辞書を登録すること
を特徴としている。
【0040】また、請求項32記載の発明は、音声認識
用辞書が格納されている辞書サーバーにネットワークを
介して接続されている端末装置であって、端末装置は、
所望の音声認識用辞書を辞書サーバーからネットワーク
を介して獲得する辞書獲得手段を有していることを特徴
としている。
【0041】また、請求項33記載の発明は、少なくと
も1つの音声認識用辞書を格納する辞書格納手段と、辞
書格納手段に格納されている音声認識用辞書の特徴情報
が記述されている辞書検索テーブルとを有している辞書
サーバーであって、該辞書サーバーは、音声認識用辞書
の特徴情報を端末装置からネットワークを介して受信し
たときに、受信した音声認識用辞書の特徴情報を前記辞
書検索テーブルと照合し、照合の結果、最も一致する音
声認識用辞書を辞書格納手段から取り出して、端末装置
に送信するようになっていることを特徴としている。
【0042】また、請求項34記載の発明は、辞書サー
バーにネットワークを介して接続されている端末装置で
あって、端末装置は、ユーザの発声により入力した音声
データから音声認識用辞書を作成する辞書作成手段と、
該音声認識用辞書の特徴情報をユーザに入力させる特徴
情報入力手段と、作成された音声認識用辞書と入力され
た音声認識用辞書の特徴情報とをネットワークを介して
辞書サーバーに送信する送信手段とを有していることを
特徴としている。
【0043】また、請求項35記載の発明は、少なくと
も1つの音声認識用辞書を格納する辞書格納手段と、辞
書格納手段に格納されている音声認識用辞書の特徴情報
が記述されている辞書検索テーブルとを有している辞書
サーバーであって、端末装置において作成された音声認
識用辞書および音声認識用辞書の特徴情報が端末装置か
らネットワークを介して送信されるとき、辞書サーバー
は、端末装置から送信された音声認識用辞書を辞書格納
手段に登録するとともに、端末装置から送信された特徴
情報を辞書検索テーブルに登録するようになっているこ
とを特徴としている。
【0044】また、請求項36記載の発明は、ユーザの
発声により入力した音声データから音声認識用辞書を作
成する辞書作成処理と、該音声認識用辞書の特徴情報を
ユーザに入力させる特徴情報入力処理と、作成された音
声認識用辞書と入力された音声認識用辞書の特徴情報と
をネットワークを介して辞書サーバーに送信する送信処
理とをコンピュータに実行させるためのプログラムを記
録したコンピュータ読み込み可能な記録媒体である。
【0045】また、請求項37記載の発明は、端末装置
において作成された音声認識用辞書および音声認識用辞
書の特徴情報が端末装置からネットワークを介して送信
されるとき、端末装置から送信された音声認識用辞書を
辞書格納手段に登録するとともに、端末装置から送信さ
れた特徴情報を辞書検索テーブルに登録する処理をコン
ピュータに実行させるためのプログラムを記録したコン
ピュータ読み込み可能な記録媒体である。
【0046】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係るテキスト読上げ
システムの構成例を示す図である。図1を参照すると、
このテキスト読上げシステムは、少なくとも1つのテキ
スト読上げ端末装置30−1〜30−mと、各種の情報
を提供する情報提供部(プロバイダ)40と、音声合成用
辞書を提供する辞書サーバー(辞書提供部)10とを備
え、各端末装置30−1〜30−mは、プロバイダ4
0,辞書サーバー10にネットワーク20を介して接続
されている。
【0047】ここで、ネットワーク20には、電話回線
網やISDN回線網などを用いることができる。
【0048】また、このテキスト読上げシステムは、We
b上の構造化文書や電子メールなどのテキストを音声に
変換し、読上げる時に用いることができる。
【0049】図2は本発明に係るテキスト読上げシステ
ムの第1の実施形態の構成例を示す図である。なお、図
2では、説明の便宜上、1つの端末装置(例えば、30
−1)だけが示されている。図2を参照すると、この第
1の実施形態では、端末装置30−1は、テキストを読
上げる(音声合成する)テキスト読上げ手段31と、テ
キストを読上げる際に用いられる所望の声質の音声合成
用辞書を辞書サーバー10からネットワーク20を介し
て獲得する辞書獲得手段32とを有している。
【0050】ここで、テキスト読上げ手段31は、各種
の情報を提供するプロバイダ40から所望の文書(テキ
スト)をネットワーク20を介して受信し、受信した文
書(テキスト)を音声合成用辞書(後述のように辞書獲
得手段32によって獲得した音声合成用辞書)を用いて
合成音声で読上げる機能を有している。
【0051】また、端末装置30−1の辞書獲得手段3
2は、所望の声質の音声合成用辞書の特徴情報をネット
ワーク20を介して辞書サーバー10に送信し、これに
より、サーバー10から所望の声質の音声合成用辞書を
獲得するようになっている。
【0052】また、辞書サーバー10は、互いに異なる
声質の少なくとも1つの音声合成用辞書を格納する辞書
格納手段11と、辞書格納手段11に格納されている音
声合成用辞書の特徴情報が記述されている辞書検索テー
ブル12と、辞書検索手段13とを有し、辞書サーバー
10の辞書検索手段13は、所望の声質の音声合成用辞
書の特徴情報を端末装置30−1から受信したときに、
受信した音声合成用辞書の特徴情報を前記辞書検索テー
ブル12と照合し、照合の結果、最も一致する音声合成
用辞書を辞書格納手段11から取り出して、端末装置3
0−1に送信するようになっている。
【0053】このように、本発明に係るテキスト読上げ
システムの第1の実施形態では、テキスト読上げ機能を
備えた端末装置30−1〜30−mと互いに異なる声質
の少なくとも1つの音声合成用辞書が格納されている辞
書サーバー10とがネットワーク20を介して接続され
ているときに、各端末装置30−1〜30−mは、所望
の声質の音声合成用辞書を辞書サーバー10からネット
ワーク20を介して獲得することが可能に構成されてい
る。
【0054】また、図3は本発明に係るテキスト読上げ
システムの第2の実施形態の構成例を示す図である。な
お、図3では、説明の便宜上、1つの端末装置(例え
ば、30−1)だけが示されている。また、図3におい
て図2と同様の箇所には同じ符号を付している。図3を
参照すると、この第2の実施形態では、端末装置30−
1は、ユーザの発声により入力した音声データから音声
合成用辞書を作成する辞書作成手段34と、該音声合成
用辞書の特徴情報をユーザに入力させる特徴情報入力手
段35と、作成された音声合成用辞書と入力された音声
合成用辞書の特徴情報とをネットワーク20を介して辞
書サーバー10に送信する送信手段36とを有してい
る。
【0055】また、端末装置30−1において作成され
た音声合成用辞書および音声合成用辞書の特徴情報が端
末装置30−1からネットワーク20を介して送信され
るとき、辞書サーバー10は、端末装置30−1から送
信された音声合成用辞書を辞書格納手段11に登録する
とともに、端末装置30−1から送信された特徴情報を
辞書検索テーブル12に登録する登録手段14を有して
いる。
【0056】このように、本発明に係るテキスト読上げ
システムの第2の実施形態では、テキスト読上げ機能を
備えた端末装置30−1〜30−mと互いに異なる声質
の少なくとも1つの音声合成用辞書が格納される辞書サ
ーバー10とがネットワーク20を介して接続されてい
るときに、端末装置30−1〜30−mのいずれかにお
いて(例えば端末装置30−1において)、音声合成用
辞書を作成し、作成した音声合成用辞書をネットワーク
20を介して辞書サーバー10に送信すると、辞書サー
バー10は、端末装置(例えば30−1)から送信され
た音声合成用辞書を登録するように構成されている。
【0057】なお、図2,図3では、本発明に係るテキ
スト読上げシステムの第1の実施形態と第2の実施形態
とがそれぞれに分離されて構成されているが、第1,第
2の実施形態の両方を具備した構成にすることもでき
る。すなわち、1つの端末装置(例えば30−1)に、
テキスト読上げ手段31,辞書獲得手段32,辞書作成
手段34,特徴情報入力手段35,送信手段36の機能
を全てもたせ、また、辞書サーバー10に、辞書格納手
段11,辞書検索テーブル12,辞書検索手段13,登
録手段14の機能を全てもたせることができる。
【0058】本発明のテキスト読上げシステムの上述し
た第1,第2の実施形態は、具体的には、図4,図6に
示すような構成の辞書サーバー10,テキスト読上げ端
末装置(例えば30−1)によって実現できる。
【0059】すなわち、図4は辞書サーバー10の具体
例を示す図である。なお、図4の例では、辞書サーバー
10は第1,第2の実施形態の両方を具備したものとな
っているとする。図4を参照すると、辞書サーバー10
は、通信インタフェース部51と、サーバー全体を制御
する制御部52と、データ格納部53とを有している。
【0060】ここで、通信インタフェース部51は、ネ
ットワーク20と接続され、データの送受信機能を有し
ており、通信インタフェース部51には、ネットワーク
20が電話回線の場合、モデムを用いることができ、ま
た、ネットワーク20がISDN回線の場合、ISDN
回線アダプタを用いることができる。
【0061】また、データ格納部53には、互いに異な
る声質の少なくとも1つの音声合成用辞書11−1〜1
1−nと、各音声合成用辞書11−1〜11−nの特徴
情報が記述されている辞書検索テーブル12とが格納さ
れている。
【0062】図5は辞書検索テーブル12の一例を示す
図である。図5の例では、辞書検索テーブル12には、
音声合成用辞書11−1〜11−nの特徴情報が記述さ
れており、例えば辞書22−1は、Yamadaという24歳
男性話者の会話調の音声合成用辞書であって、作成者が
Yamadaであることが、特徴情報として記述されている。
なお、図5において、“-”と記述された項目は、“特
に指定なし”という意味である。
【0063】また、図4において、制御部52は、デー
タ格納部53に格納されている音声合成用辞書11−1
〜11−nを辞書検索テーブル12を用いて検索する辞
書検索機能と、データ格納部53に音声合成用辞書を登
録する登録機能とを有している。
【0064】換言すれば、辞書サーバー10に関して、
図2の辞書検索手段13および図3の登録手段14は、
図4の制御部52によって実現され、また、図2,図3
の辞書格納手段11は、図4のデータ格納部53に格納
されている音声合成用辞書11−1〜11−nによって
実現される。
【0065】また、図6は1つのテキスト読上げ端末装
置,例えば30−1の具体例を示す図である。なお、図
6の例では、テキスト読上げ端末装置30−1は第1,
第2の実施形態の両方を具備したものとなっているとす
る。図6を参照すると、このテキスト読上げ端末装置3
0−1は、通信インタフェース部61と、端末装置全体
を制御する制御部62と、データ格納部63と、画面入
力部64と、音声入力部65と、音声出力部66とを有
している。
【0066】ここで、通信インタフェース部61は、ネ
ットワーク20と接続され、データの送受信機能を有し
ており、通信インタフェース部61には、ネットワーク
20が電話回線の場合、モデムを用いることができ、ま
た、ネットワーク20がISDN回線の場合、ISDN
回線アダプタを用いることができる。
【0067】また、制御部62は、音声合成機能(テキ
スト読上げ機能)と、辞書サーバー10から所望の音声
合成用辞書を獲得する辞書獲得機能と、辞書サーバー1
0に登録するための新規の音声合成用辞書を作成する辞
書作成機能とを有している。
【0068】また、データ格納部63には、テキストを
読上げるときに用いられる音声合成用辞書が格納される
ようになっている。また、端末装置30−1において、
ユーザによって音声合成用辞書およびその特徴情報が新
規に作成された場合、新規に作成された音声合成用辞書
およびその特徴情報も、一時的にデータ格納部63に格
納されるようになっている。
【0069】また、音声入力部65は、マイクなどであ
って、音声合成用辞書を新規に作成する場合などに、ユ
ーザの音声を入力させるために設けられている。
【0070】また、画面入力部64は、ディスプレイお
よびキーボードであって、音声合成用辞書を新規に作成
する場合、あるいは、ユーザ所望の音声合成用辞書を辞
書サーバー10から獲得する場合などにおいて、所望の
音声合成用辞書の特徴情報などを入力したりするのに用
いられる。
【0071】また、音声出力部66は、スピーカなどで
あって、合成された音声を出力する(テキストの読上げ
を行なう)ために設けられている。
【0072】換言すれば、テキスト読上げ端末装置30
−1に関して、図2のテキスト読上げ手段31は、図6
の制御部62,データ格納部63,音声出力部66によ
って実現され、また、図2の辞書獲得手段32は、図6
の制御部62,画面入力部64によって実現され、ま
た、図3の辞書作成手段34は、図6の制御部62,音
声入力部65,画面入力部64によって実現され、ま
た、図3の特徴情報入力手段35は、図6の制御部6
2,画面入力部64によって実現される。
【0073】次に、このような構成のテキスト読上げシ
ステムの処理動作について説明する。図7はテキスト読
上げ端末装置による音声合成処理(テキスト読上げ処
理)の流れを示すフローチャートである。図7を参照す
ると、まず、制御部62は、テキスト読上げ端末装置の
通信インタフェース部61によって、ネットワーク20
を介し、各種の情報を提供するプロバイダー40から所
望の文書(読上げるための文書)を受信する(ステップS
1)。ユーザの所望の文書の獲得は、コンピュータ上の
電子メールの受信のようなアプリケーションによって実
現できる。
【0074】次に、制御部62は、受信した文書に対し
て言語解析を行い、音韻と韻律の読み情報を表す記号列
に変換する(ステップS2)。図8は、テキスト読上げ
端末装置による言語解析の一例を示す図である。なお、
図8で用いられている記号は、「日本電子工業振興協
会」によって作成された日本語テキスト音声合成用記号
である。また、“|”や“,”などは、韻律情報を表す
記号である。
【0075】次いで、制御部62は、言語解析によって
生成した記号列に基づき、データ格納部63に格納され
ている音声合成用辞書を用いて、プロバイダー40から
受信した文書を音声に変換する(ステップS3)。すな
わち、音声データとして合成する。
【0076】そして、制御部62は、合成した音声デー
タを音声出力部66により出力させる(ステップS
4)。
【0077】このようにして、テキスト読上げ端末装置
において、音声合成処理(テキスト読上げ処理)を行な
うことができる。
【0078】また、図9はテキスト読上げ端末装置によ
る音声合成用辞書作成処理の流れを示すフローチャート
である。図9を参照すると、まず、制御部62は、テキ
スト読上げ端末装置の音声入力部65から音声合成用辞
書の作成に必要な音声データをユーザに入力させる(ス
テップS11)。
【0079】図10には、テキスト読上げ端末装置によ
る音声データ入力処理の一例が示されている。図10を
参照すると、まず、テキスト読上げ端末装置の画面入力
部64のディスプレイに、音声合成用辞書作成に必要な
音声データリストを提示する(ステップS21)。次い
で、音声データリストの番号iを“1”に初期設定する
(ステップS22)。しかる後、ディスプレイに提示さ
れている音声データリストのi番目の音声データをユー
ザに発声させる。これにより、音声入力部65からはi
番目の音声データが入力される(ステップS23)。
【0080】次いで、この音声入力が成功したか否かを
判断する(ステップS24)。この結果、入力された音
声データが、音声入力者の発声ミスや周囲雑音の混入に
よって、入力失敗と判断された場合、入力が成功するま
で音声入力をやり直す(ステップS23,S24)。な
お、音声入力が成功したか否かについての判断は、音声
認識を用いて行なうことができる。すなわち、入力音声
が認識されたときには、入力成功と判断し、逆に、入力
音声が認識されないときには、入力失敗と判断する。
【0081】ステップS24において音声入力が成功し
たと判断された場合、iがNよりも大きくなったか否か
を判断し(音声データ入力リストが終了したか否かを判
断し)(ステップS25)、iがNよりも大きくなけれ
ば、iを“1”増加させて(ステップS26)、次の音声
データを入力させる(ステップS23)。これに対し、
ステップS25においてiがNよりも大きくなれば、音
声入力は終了となる。
【0082】このようにして、音声合成用辞書の作成に
必要なすべての音声データの入力が終了すると、入力さ
れた音声データから各子音および母音の素片波形を抽出
する(ステップS12)。具体的に、子音の場合、収録
したデータ該当区間の波形をそのまま素片波形として使
用し、母音の場合、各ピッチ毎に抽出したインパルス応
答波形を素片波形とする。すべての子音と母音の素片波
形をまとめ、音声合成用辞書を作成することができる
(ステップS13)。
【0083】次に、作成した音声合成用辞書の特徴情報
をユーザに入力させる(ステップS14)。作成した音
声合成用辞書の特徴情報の入力は、画面入力部64にお
いてディスプレイ表示とキーボード入力によって行なう
ことができる。図11は音声合成用辞書の特徴情報を入
力させるための画面入力部64の表示画面の一例を示す
図である。図11の例では、音声合成用辞書の特徴情報
として、話者情報(名前,年齢,性別,口調)と作者情報
(名前)とを入力させることができ、すべての情報が入力
されて、「OK」ボタンが押されると、音声合成用辞書
の特徴情報の入力を完了させることができる。
【0084】このようにして、ステップS13において
音声合成用辞書が作成され、また、ステップS14にお
いて音声合成用辞書の特徴情報が入力されると、制御部
62は、音声合成用辞書とその特徴情報とをテキスト読
上げ端末装置のデータ格納部63に一時的に格納する
(ステップS15)。
【0085】そして、制御部62は、データ格納部63
に一時的に格納されている音声合成用辞書とその特徴情
報を、テキスト読上げ端末装置の通信インタフェース部
61によって、ネットワーク20を介して、辞書サーバ
ー10に送信させる(ステップS16)。図12には、
辞書サーバー10に送信される送信データの構造の一例
が示されており、図12の例では、送信データは、64
バイトの音声合成用辞書特徴情報と音声合成用辞書本体
のバイナリデータにより構成されている。
【0086】このようにして、データ格納部63に一時
的に格納されている音声合成用辞書とその特徴情報の送
信が終了すると、テキスト読上げ端末装置のデータ格納
部63から該当音声合成用辞書とその特徴情報を削除す
る。
【0087】このようにして端末装置において作成され
た音声合成用辞書とその特徴情報は、辞書サーバー10
にネットワーク20を介して送信され、辞書サーバー1
0に新規の音声合成用辞書として登録される。
【0088】図13は辞書サーバー10において音声合
成用辞書を登録する処理の流れを示すフローチャートで
ある。図13を参照すると、辞書サーバー10の制御部
52は、辞書サーバー10の通信インタフェース部51
によって、ネットワーク20を介し、テキスト読上げ端
末装置から音声合成用辞書とその特徴情報を受信すると
(ステップS31)、まず、音声合成用辞書の特徴情報
を受信データから分離する(ステップS32)。この分
離処理は、受信したデータの先頭64バイトを図12に
示したような特徴情報のデータ構造で解析することによ
ってなされる。
【0089】そして、制御部52は、受信した音声合成
用辞書の特徴情報を、辞書サーバー10のデータ格納部
53内の辞書検索テーブル12に記載されている各音声
合成用辞書の特徴情報と照合し(ステップS33)、一
致する音声合成用辞書があるか否かを判断する(ステッ
プS34)。この結果、一致する音声合成用辞書があれ
ば、辞書サーバー10のデータ格納部53に格納されて
いる該当音声合成用辞書を、受信した音声合成用辞書で
置き換える(ステップS35)。これに対し、ステップ
S34において、受信した音声合成用辞書と一致する辞
書がなければ、受信した音声合成用辞書の特徴情報を辞
書検索テーブル12に登録し、受信した音声合成用辞書
を辞書サーバー10のデータ格納部53に新規の音声合
成用辞書として登録する(ステップS36)。
【0090】このように、図9,図13に示したような
処理によってテキスト読上げ端末装置で作成した音声合
成用辞書を辞書サーバー10に登録することができる。
【0091】次に、テキスト読上げ端末装置,例えば3
0−1において辞書サーバー10から所望の音声合成用
辞書を獲得する処理を説明する。この場合には、テキス
ト読上げ端末装置30−1において、まず、ユーザ所望
の音声合成用辞書の特徴情報を入力する。この入力は、
画面入力部64においてディスプレイ表示とキーボード
入力によって(例えば、前述したと同様に、図11に示
すような表示画面において)行なうことができる。すな
わち、図11の例では、音声合成用辞書の特徴情報とし
て、話者情報(名前,年齢,性別,口調)と作者情報(名
前)とを入力させることができ、すべての情報が入力さ
れて、「OK」ボタンが押されると、音声合成用辞書の
特徴情報の入力を完了させることができる。
【0092】次に、上記のように入力した所望の音声合
成用辞書の特徴情報をテキスト読上げ端末装置30−1
の通信インタフェース部61によって、ネットワーク2
0を介して、辞書サーバー10に送信する。ここで、送
信データの構造は、図12に示した音声合成用辞書の特
徴情報部分のデータ構造と同様に、64バイトのバイナ
リデータである。
【0093】図14はテキスト読上げ端末装置,例えば
30−1からユーザ所望の音声合成用辞書の特徴情報を
受信したときの辞書サーバー10の処理の流れを示すフ
ローチャートである。図14を参照すると、辞書サーバ
ー10は、その通信インタフェース部51によって、ネ
ットワーク20を介して、テキスト読上げ端末装置30
−1からユーザ所望の音声合成用辞書の特徴情報を受信
すると(ステップS41)、受信した音声合成用辞書の
特徴情報を図12に示したような特徴情報のデータ構造
で解析し、辞書サーバー10のデータ格納部53の辞書
検索テーブル12に記載されている各音声合成用辞書の
特徴情報と照合し、辞書検索テーブル12にある各音声
合成用辞書の得点を計算する(ステップS42)。この
得点の計算は、ユーザ所望の音声合成用辞書の特徴情報
の各項目を、辞書検索テーブル12の各音声合成用辞書
の(特徴情報の)各項目と照合し、一致する項目がある
場合または“-”と指定された項目の場合、該当辞書の
得点に点数の加算を行うことによってなされる。
【0094】図15には、得点を計算する例が示されて
いる。すなわち、図15の例では、先ず、特徴情報の各
項目(話者名,性別,口調,作者名,年齢)に予め点数
を付ける。図15の例では、図15(b)に示すよう
に、話者名には5点,性別には4点,口調には3点,作
者名には2点,年齢には1点が予め付けられている。い
ま、テキスト読上げ端末装置30−1から受信した特徴
情報の各項目が、図15(c)に示すものであるとする
と、受信した特徴情報の各項目を図15(a)に示す辞書
検索テーブルの各音声合成用辞書の特徴情報と照合し、
辞書検索テーブルの各音声合成用辞書の得点を図15
(d)に示すように計算する。例えば、図15(c)の特徴
情報の各項目を図15(a)の音声合成用辞書11−1の
特徴情報の各項目と照合すると、図15(c)の特徴情報
の話者名は“Yamada”であり、図15(a)の音声
合成用辞書11−1の特徴情報の話者名は“Yamad
a”であり、一致するので、図15(a)の音声合成用辞
書11−1の特徴情報の話者名の項目には、話者名の得
点“5点”が付与される。
【0095】次に、図15(c)の特徴情報の性別は
“M”であり、図15(a)の音声合成用辞書11−1の
特徴情報の性別は“M”であり、一致するので、図15
(a)の音声合成用辞書22−1の特徴情報の性別の項目
には、性別の得点“4点”が付与される。
【0096】次に、図15(c)の特徴情報の口調は“C
asual”であり、図15(a)の音声合成用辞書11
−1の特徴情報の口調は“Business”であり、
一致しないので、図15(a)の音声合成用辞書22−1
の特徴情報の口調の項目には、得点は付与されない。
【0097】次に、図15(c)の特徴情報の作者名は
“-”であり、図15(a)の音声合成用辞書11−1の
特徴情報の作者名は“Yamada”であるので、この
場合には、作者名の得点“2点”から“1点”を減じた
得点“1点”が付与される。同様に、図15(c)の特徴
情報の年令は“-”であり、図15(a)の音声合成用辞
書22−1の特徴情報の年令は“24”であるので、こ
の場合には、年令の得点“1点”から“1点”を減じた
得点“0点”が付与される。この結果、図15(a)の音
声合成用辞書11−1の得点は、図15(d)に示すよう
に、“5+4+(2−1)+(1−1)=10点”として算
出される。同様の計算により、図15(a)の音声合成用
辞書11−2,11−nの得点は、図15(d)に示すよ
うに、それぞれ、8点,1点として算出される。
【0098】このようにして、各音声合成用辞書11−
1〜11−nについて得点を算出し、得点が0以上の音
声合成用辞書があるか否かを判断し(ステップS43)、
ある場合、辞書サーバー10は、最も点数(得点)の高
い音声合成用辞書を通信インタフェース部51によっ
て、ネットワーク20を介し、テキスト読上げ端末装置
30−1に送信する(ステップS44)。図15の例に
おいて、音声合成用辞書11−1が最も点数が高い場
合、辞書サーバー10からは、音声合成用辞書11−1
がテキスト読上げ端末装置30−1に送信されることに
なる。
【0099】また、辞書検索テーブル12に登録されて
いるすべての音声合成用辞書11−1〜11−nの点数
がゼロの場合、デフォールトの音声合成用辞書をテキス
ト読上げ端末装置30−1に送信する(ステップS4
5)。例えば、デフォールトの音声合成用辞書として、
辞書検索テーブル12に記載されている一番目の音声合
成用辞書を、テキスト読上げ端末装置30−1に送信す
る。
【0100】このように、辞書サーバー10は、テキス
ト読上げ端末装置30−1から受信した音声合成用辞書
の特徴情報に最も一致する音声合成用辞書をネットワー
ク20を介して、テキスト読上げ端末装置30−1に送
信することができ、テキスト読上げ端末装置30−1で
は、その通信インタフェース部61によって辞書サーバ
ー10からの音声合成用辞書を受信すると、テキスト読
上げ端末装置30−1のデータ格納部63に現在格納さ
れている音声合成用辞書を、いま受信した音声合成用辞
書(すなわち、テキスト読上げ端末装置30−1のユー
ザ所望の声質の音声合成用辞書)に置き換える。
【0101】そして、テキスト読上げ端末装置30−1
では、上記のようにして置き換えたユーザ所望の声質の
音声合成用辞書を用いて、テキスト読上げを行なうこと
ができる。すなわち、ユーザ所望の声質でテキストの読
上げを行なうことができる。
【0102】このように、本発明では、ネットワーク2
0に接続されている各テキスト読上げ端末装置30−1
〜30−mから構成されているテキスト読上げシステム
に、さらに辞書サーバー10を追加し、ユーザによって
自分のテキスト読上げ端末装置で作成した音声合成用辞
書を、ネットワーク20を介し、辞書サーバー10に登
録することができ、また、ユーザが辞書サーバー10か
ら所望の声質の音声合成用辞書を獲得することができ
る。具体的には、各テキスト読上げ端末装置30−1〜
30−mには、1つの音声合成用辞書だけを格納してお
き、読上げの声質を変えたい時だけ、辞書サーバー10
に請求し、所望の音声合成用辞書を獲得し、現在の音声
合成用辞書を、辞書サーバー10から獲得した所望の声
質の音声合成用辞書に置き換えることができる。
【0103】すなわち、ユーザが自分のテキスト読上げ
端末装置で新規作成した音声合成用辞書を、ネットワー
ク20を介し、辞書サーバー10に登録することがで
き、さらにユーザがネットワーク20を介し、所望声質
の音声合成用辞書を辞書サーバー10から獲得すること
ができる。これによって、ユーザのテキスト読上げ端末
装置には、1つの音声合成用辞書だけを格納すれば済
み、複数個の音声合成用辞書を格納する必要がなくなる
ので、資源の節約を図ることができる。
【0104】また、同じネットワークに接続されている
テキスト読上げ端末装置のユーザであれば、誰でも新規
作成した音声合成用辞書を辞書サーバーに登録すること
ができるので、知らないユーザ間での音声合成用辞書の
交換も可能になる。さらに、多くの声質の音声合成用辞
書を辞書サーバーに登録すれば、ユーザが所望の音声合
成用辞書を辞書サーバーに請求するとき、選択範囲は広
がるので、ユーザの所望声質の音声合成用辞書の獲得
が、より容易になる。
【0105】換言すれば、各端末装置30−1〜30−
mは、辞書サーバー10を共用することができ、各端末
装置30−1〜30−mは、それぞれの中に、大規模の
音声合成用辞書を備えずとも良くなる。すなわち、各端
末装置30−1〜30−mのユーザが所望の音声合成用
辞書を必要とするときには、これを辞書サーバー10か
ら獲得することができる。また、ある端末装置,例えば
30−1で作成された音声合成用辞書が辞書サーバー1
0に登録されるとき、他の端末装置,例えば30−2
は、端末装置30−1で作成された音声合成用辞書を辞
書サーバー10から獲得することができる。従って、音
声合成用辞書の交換を互いに全く知らないユーザ間でも
行なうことが可能となる。
【0106】なお、上述の例では、本発明をテキスト読
上げシステムに適用する場合について説明し、特に、本
発明をテキスト読上げシステムに適用することで、上述
のような顕著な効果を得ることができるが、本発明は、
テキスト読上げシステムのみならず、例えば音声認識シ
ステムにも適用できる。
【0107】図16は本発明に係る音声認識システムの
構成例を示す図である。図16を参照すると、この音声
認識システムは、少なくとも1つの音声認識端末装置1
30−1〜130−mと、音声認識用辞書を提供する辞
書サーバー(辞書提供部)110とを備え、各端末装置1
30−1〜130−mは、辞書サーバー110にネット
ワーク120を介して接続されている。
【0108】ここで、ネットワーク120には、電話回
線網やISDN回線網などを用いることができる。
【0109】図17は本発明に係る音声認識システムの
第1の実施形態の構成例を示す図である。なお、図17
では、説明の便宜上、1つの端末装置(例えば、130
−1)だけが示されている。図17を参照すると、この
第1の実施形態では、端末装置130−1は、入力音声
を音声認識する音声認識手段131と、音声認識を行な
う際に用いられる所望の音声認識用辞書(例えば、特定
話者用辞書)を辞書サーバー110からネットワーク1
20を介して獲得する辞書獲得手段132とを有してい
る。
【0110】ここで、音声認識手段131は、入力音声
に対して特徴抽出を行なって得られる特徴パターンを音
声認識用辞書(後述のように辞書獲得手段132によっ
て獲得した音声認識用辞書)と照合することで、入力音
声を音声認識する機能を有している。
【0111】また、端末装置130−1の辞書獲得手段
132は、所望の音声認識用辞書の特徴情報をネットワ
ーク120を介して辞書サーバー110に送信し、これ
により、辞書サーバー110から所望の音声認識用辞書
を獲得するようになっている。
【0112】また、辞書サーバー110は、互いに異な
る少なくとも1つの音声認識用辞書を格納する辞書格納
手段111と、辞書格納手段111に格納されている音
声認識用辞書の特徴情報が記述されている辞書検索テー
ブル112と、辞書検索手段113とを有し、辞書サー
バー110の辞書検索手段113は、所望の音声認識用
辞書の特徴情報を端末装置130−1から受信したとき
に、受信した音声認識用辞書の特徴情報を前記辞書検索
テーブル112と照合し、照合の結果、最も一致する音
声認識用辞書を辞書格納手段111から取り出して、端
末装置130−1に送信するようになっている。
【0113】このように、本発明に係る音声認識システ
ムの第1の実施形態では、音声認識機能を備えた端末装
置130−1〜130−mと互いに異なる少なくとも1
つの音声認識用辞書が格納されている辞書サーバー11
0とがネットワーク120を介して接続されているとき
に、各端末装置130−1〜130−mは、所望の音声
認識用辞書を辞書サーバー110からネットワーク12
0を介して獲得することが可能に構成されている。
【0114】また、図18は本発明に係る音声認識シス
テムの第2の実施形態の構成例を示す図である。なお、
図18では、説明の便宜上、1つの端末装置(例えば、
130−1)だけが示されている。また、図18におい
て図17と同様の箇所には同じ符号を付している。図1
8を参照すると、この第2の実施形態では、端末装置1
30−1は、ユーザの発声により入力した音声データか
ら音声認識用辞書(例えば特定話者用辞書)を作成する
辞書作成手段134と、該音声認識用辞書の特徴情報を
ユーザに入力させる特徴情報入力手段135と、作成さ
れた音声認識用辞書と入力された音声認識用辞書の特徴
情報とをネットワーク120を介して辞書サーバー11
0に送信する送信手段136とを有している。
【0115】また、端末装置130−1において作成さ
れた音声認識用辞書および音声認識用辞書の特徴情報が
端末装置130−1からネットワーク120を介して送
信されるとき、辞書サーバー110は、端末装置130
−1から送信された音声認識用辞書を辞書格納手段11
1に登録するとともに、端末装置130−1から送信さ
れた特徴情報を辞書検索テーブル112に登録する登録
手段114を有している。
【0116】このように、本発明に係る音声認識システ
ムの第2の実施形態では、音声認識機能を備えた端末装
置130−1〜130−mと互いに異なる少なくとも1
つの音声認識用辞書が格納される辞書サーバー110と
がネットワーク120を介して接続されているときに、
端末装置130−1〜130−mのいずれかにおいて
(例えば端末装置130−1において)、音声認識用辞
書を作成し、作成した音声認識用辞書をネットワーク1
20を介して辞書サーバー110に送信すると、辞書サ
ーバー110は、端末装置(例えば130−1)から送
信された音声認識用辞書を登録するように構成されてい
る。
【0117】なお、図17,図18では、本発明に係る
音声認識システムの第1の実施形態と第2の実施形態と
がそれぞれに分離されて構成されているが、第1,第2
の実施形態の両方を具備した構成にすることもできる。
すなわち、1つの端末装置(例えば130−1)に、音
声認識手段131,辞書獲得手段132,辞書作成手段
134,特徴情報入力手段135,送信手段136の機
能を全てもたせ、また、辞書サーバー110に、辞書格
納手段111,辞書検索テーブル112,辞書検索手段
113,登録手段114の機能を全てもたせることがで
きる。
【0118】本発明の音声認識システムの上述した第
1,第2の実施形態は、具体的には、図19,図20に
示すような構成の辞書サーバー110,端末装置(例え
ば130−1)によって実現できる。
【0119】すなわち、図19は辞書サーバー110の
具体例を示す図である。なお、図19の例では、辞書サ
ーバー110は第1,第2の実施形態の両方を具備した
ものとなっているとする。図19を参照すると、辞書サ
ーバー110は、通信インタフェース部151と、サー
バー全体を制御する制御部152と、データ格納部15
3とを有している。
【0120】ここで、通信インタフェース部151は、
ネットワーク120と接続され、データの送受信機能を
有しており、通信インタフェース部151には、ネット
ワーク120が電話回線の場合、モデムを用いることが
でき、また、ネットワーク120がISDN回線の場
合、ISDN回線アダプタを用いることができる。
【0121】また、データ格納部153には、互いに異
なる少なくとも1つの音声認識用辞書111−1〜11
1−nと、各音声認識用辞書111−1〜111−nの
特徴情報が記述されている辞書検索テーブル112とが
格納されている。
【0122】なお、辞書検索テーブル112は、図5の
辞書検索テーブル12と同様のものであって、音声認識
用辞書111−1〜111−nの特徴情報が記述されて
いる。
【0123】また、図19において、制御部152は、
データ格納部153に格納されている音声認識用辞書1
11−1〜111−nを辞書検索テーブル112を用い
て検索する辞書検索機能と、データ格納部153に音声
認識用辞書を登録する登録機能とを有している。
【0124】換言すれば、辞書サーバー110に関し
て、図17の辞書検索手段113および図18の登録手
段114は、図19の制御部152によって実現され、
また、図17,図18の辞書格納手段111は、図19
のデータ格納部153に格納されている音声認識用辞書
111−1〜111−nによって実現される。
【0125】また、図20は1つの音声認識端末装置,
例えば130−1の具体例を示す図である。なお、図2
0の例では、音声認識端末装置130−1は第1,第2
の実施形態の両方を具備したものとなっているとする。
図20を参照すると、この音声認識端末装置130−1
は、通信インタフェース部161と、端末装置全体を制
御する制御部162と、データ格納部163と、画面入
力部164と、音声入力部165と、認識結果出力部1
66とを有している。
【0126】ここで、通信インタフェース部161は、
ネットワーク120と接続され、データの送受信機能を
有しており、通信インタフェース部161には、ネット
ワーク120が電話回線の場合、モデムを用いることが
でき、また、ネットワーク120がISDN回線の場
合、ISDN回線アダプタを用いることができる。
【0127】また、制御部162は、音声認識機能と、
辞書サーバー110から所望の音声認識用辞書を獲得す
る辞書獲得機能と、辞書サーバー110に登録するため
の新規の音声認識用辞書を作成する辞書作成機能とを有
している。
【0128】また、データ格納部163には、音声認識
を行なうときに用いられる音声認識用辞書が格納される
ようになっている。また、端末装置130−1におい
て、ユーザによって音声認識用辞書およびその特徴情報
が新規に作成された場合、新規に作成された音声認識用
辞書およびその特徴情報も、一時的にデータ格納部16
3に格納されるようになっている。
【0129】また、音声入力部165は、マイクなどで
あって、音声認識用辞書を新規に作成する場合に、ユー
ザの音声を入力させるために設けられている。
【0130】また、画面入力部164は、ディスプレイ
およびキーボードであって、音声認識用辞書を新規に作
成する場合、あるいは、ユーザ所望の音声認識用辞書を
辞書サーバー110から獲得する場合、所望の音声認識
用辞書の特徴情報などを入力したりするのに用いられ
る。
【0131】また、認識結果出力部166は、音声認識
された結果を出力するために設けられている。
【0132】換言すれば、音声認識端末装置130−1
に関して、図17の音声認識手段131は、図20の制
御部162,音声入力部165,データ格納部163,
認識結果出力部166によって実現され、また、図17
の辞書獲得手段132は、図20の制御部162,画面
入力部164によって実現され、また、図18の辞書作
成手段134は、図20の制御部162,音声入力部1
65,画面入力部164によって実現され、また、図1
8の特徴情報入力手段135は、図20の制御部16
2,画面入力部164によって実現される。
【0133】このように、本発明では、ネットワーク1
20に接続されている各音声認識端末装置130−1〜
130−mから構成されている音声認識システムに、さ
らに辞書サーバー110を追加し、ユーザによって自分
の音声認識端末装置で作成した音声認識用辞書を、ネッ
トワーク120を介し、辞書サーバー110に登録する
ことができ、また、ユーザが辞書サーバー110から所
望の音声認識用辞書を獲得することができる。具体的に
は、各音声認識端末装置130−1〜130−mには、
1つの音声認識用辞書だけを格納しておき、音声認識用
辞書をユーザ所望の音声認識用辞書(例えば、このユー
ザに適した特定話者用辞書)に変えたい時だけ、辞書サ
ーバー110に請求し、所望の音声認識用辞書を獲得
し、現在の音声認識用辞書を、辞書サーバー110から
獲得した所望の音声認識用辞書に置き換えることができ
る。
【0134】すなわち、ユーザが自分の音声認識端末装
置で新規作成した音声認識用辞書を、ネットワーク12
0を介し、辞書サーバー110に登録することができ、
さらにユーザがネットワーク120を介し、所望の音声
認識用辞書を辞書サーバー110から獲得することがで
きる。これによって、ユーザの音声認識端末装置には、
1つの音声認識用辞書だけを格納すれば済み、複数個の
音声認識用辞書を格納する必要がなくなるので、資源の
節約を図ることができる。
【0135】また、同じネットワークに接続されている
音声認識端末装置のユーザであれば、誰でも新規作成し
た音声認識用辞書を辞書サーバーに登録することができ
るので、知らないユーザ間での音声認識用辞書の交換も
可能になる。さらに、多くの音声認識用辞書を辞書サー
バーに登録すれば、ユーザが所望の音声認識用辞書を辞
書サーバーに請求するとき、選択範囲は広がるので、ユ
ーザの所望の音声認識用辞書の獲得がより容易になる。
【0136】換言すれば、各端末装置130−1〜13
0−mは、辞書サーバー110を共用することができ、
各端末装置130−1〜130−mは、それぞれの中
に、大規模の音声認識用辞書を備えずとも良くなる。す
なわち、各端末装置130−1〜130−mのユーザが
所望の音声認識用辞書を必要とするときには、これを辞
書サーバー110から獲得することができる。また、あ
る端末装置,例えば130−1で作成された音声認識用
辞書が辞書サーバー110に登録されるとき、他の端末
装置,例えば130−2は、端末装置130−1で作成
された音声認識用辞書を辞書サーバー110から獲得す
ることができる。従って、音声認識用辞書の交換を互い
に全く知らないユーザ間でも行なうことが可能となる。
【0137】また、本発明は、テキスト読上げシステ
ム,音声認識システムのみならず、辞書を必要とする任
意の音声処理システムに適用できる。
【0138】図21は本発明に係る音声処理システムの
構成例を示す図である。図21を参照すると、この音声
処理システムは、少なくとも1つの音声処理端末装置2
30−1〜230−mと、音声処理用辞書を提供する辞
書サーバー(辞書提供部)210とを備え、各端末装置2
30−1〜230−mは、辞書サーバー210にネット
ワーク220を介して接続されている。
【0139】ここで、ネットワーク220には、電話回
線網やISDN回線網などを用いることができる。
【0140】図22は本発明に係る音声処理システムの
第1の実施形態の構成例を示す図である。なお、図22
では、説明の便宜上、1つの端末装置(例えば、230
−1)だけが示されている。図22を参照すると、この
第1の実施形態では、端末装置230−1は、音声処理
を行なう音声処理手段231と、音声処理を行なう際に
用いられる所望の音声処理用辞書を辞書サーバー210
からネットワーク220を介して獲得する辞書獲得手段
232とを有している。
【0141】ここで、端末装置230−1の辞書獲得手
段232は、所望の音声処理用辞書の特徴情報をネット
ワーク220を介して辞書サーバー210に送信し、こ
れにより、辞書サーバー210から所望の音声処理用辞
書を獲得するようになっている。
【0142】また、辞書サーバー210は、互いに異な
る少なくとも1つの音声処理用辞書を格納する辞書格納
手段211と、辞書格納手段211に格納されている音
声処理用辞書の特徴情報が記述されている辞書検索テー
ブル212と、辞書検索手段213とを有し、辞書サー
バー210の辞書検索手段213は、所望の音声処理用
辞書の特徴情報を端末装置230−1から受信したとき
に、受信した音声処理用辞書の特徴情報を前記辞書検索
テーブル212と照合し、照合の結果、最も一致する音
声処理用辞書を辞書格納手段211から取り出して、端
末装置230−1に送信するようになっている。
【0143】このように、本発明に係る音声処理システ
ムの第1の実施形態では、音声処理機能を備えた端末装
置230−1〜230−mと互いに異なる少なくとも1
つの音声処理用辞書が格納されている辞書サーバー21
0とがネットワーク220を介して接続されているとき
に、各端末装置230−1〜230−mは、所望の音声
処理用辞書を辞書サーバー210からネットワーク22
0を介して獲得することが可能に構成されている。
【0144】また、図23は本発明に係る音声処理シス
テムの第2の実施形態の構成例を示す図である。なお、
図23では、説明の便宜上、1つの端末装置(例えば、
230−1)だけが示されている。また、図23におい
て図22と同様の箇所には同じ符号を付している。図2
3を参照すると、この第2の実施形態では、端末装置2
30−1は、ユーザの発声により入力した音声データか
ら音声処理用辞書を作成する辞書作成手段234と、該
音声処理用辞書の特徴情報をユーザに入力させる特徴情
報入力手段235と、作成された音声処理用辞書と入力
された音声処理用辞書の特徴情報とをネットワーク22
0を介して辞書サーバー210に送信する送信手段23
6とを有している。
【0145】また、端末装置230−1において作成さ
れた音声処理用辞書および音声処理用辞書の特徴情報が
端末装置230−1からネットワーク220を介して送
信されるとき、辞書サーバー210は、端末装置230
−1から送信された音声処理用辞書を辞書格納手段21
1に登録するとともに、端末装置230−1から送信さ
れた特徴情報を辞書検索テーブル212に登録する登録
手段214を有している。
【0146】このように、本発明に係る音声処理システ
ムの第2の実施形態では、音声処理機能を備えた端末装
置230−1〜230−mと互いに異なる少なくとも1
つの音声処理用辞書が格納される辞書サーバー210と
がネットワーク220を介して接続されているときに、
端末装置230−1〜230−mのいずれかにおいて
(例えば端末装置230−1において)、音声処理用辞
書を作成し、作成した音声処理用辞書をネットワーク2
20を介して辞書サーバー210に送信すると、辞書サ
ーバー210は、端末装置(例えば230−1)から送
信された音声処理用辞書を登録するように構成されてい
る。
【0147】なお、図22,図23では、本発明に係る
音声処理システムの第1の実施形態と第2の実施形態と
がそれぞれに分離されて構成されているが、第1,第2
の実施形態の両方を具備した構成にすることもできる。
すなわち、1つの端末装置(例えば230−1)に、音
声処理手段231,辞書獲得手段232,辞書作成手段
234,特徴情報入力手段235,送信手段236の機
能を全てもたせ、また、辞書サーバー210に、辞書格
納手段211,辞書検索テーブル212,辞書検索手段
213,登録手段14の機能を全てもたせることができ
る。
【0148】本発明の音声処理システムの上述した第
1,第2の実施形態は、具体的には、図24,図25に
示すような構成の辞書サーバー210,端末装置(例え
ば230−1)によって実現できる。
【0149】すなわち、図24は辞書サーバー210の
具体例を示す図である。なお、図24の例では、辞書サ
ーバー210は第1,第2の実施形態の両方を具備した
ものとなっているとする。図24を参照すると、辞書サ
ーバー210は、通信インタフェース部251と、サー
バー全体を制御する制御部252と、データ格納部25
3とを有している。
【0150】ここで、通信インタフェース部251は、
ネットワーク220と接続され、データの送受信機能を
有しており、通信インタフェース部251には、ネット
ワーク220が電話回線の場合、モデムを用いることが
でき、また、ネットワーク220がISDN回線の場
合、ISDN回線アダプタを用いることができる。
【0151】また、データ格納部253には、互いに異
なる少なくとも1つの音声処理用辞書211−1〜21
1−nと、各音声処理用辞書211−1〜211−nの
特徴情報が記述されている辞書検索テーブル212とが
格納されている。
【0152】なお、辞書検索テーブル212は、図5の
辞書検索テーブル12と同様のものであって、音声処理
用辞書211−1〜211−nの特徴情報が記述されて
いる。
【0153】また、図24において、制御部252は、
データ格納部253に格納されている音声処理用辞書2
11−1〜211−nを辞書検索テーブル212を用い
て検索する辞書検索機能と、データ格納部253に音声
処理用辞書を登録する登録機能とを有している。
【0154】換言すれば、辞書サーバー210に関し
て、図22の辞書検索手段213および図23の登録手
段214は、図24の制御部252によって実現され、
また、図22,図23の辞書格納手段211は、図24
のデータ格納部253に格納されている音声処理用辞書
211−1〜211−nによって実現される。
【0155】また、図25は1つの音声処理端末装置,
例えば230−1の具体例を示す図である。なお、図2
5の例では、音声処理端末装置230−1は第1,第2
の実施形態の両方を具備したものとなっているとする。
図25を参照すると、この音声処理端末装置230−1
は、通信インタフェース部261と、端末装置全体を制
御する制御部262と、データ格納部263と、画面入
力部264と、音声入力部265と、処理結果出力部2
66とを有している。
【0156】ここで、通信インタフェース部261は、
ネットワーク220と接続され、データの送受信機能を
有しており、通信インタフェース部261には、ネット
ワーク220が電話回線の場合、モデムを用いることが
でき、また、ネットワーク220がISDN回線の場
合、ISDN回線アダプタを用いることができる。
【0157】また、制御部262は、音声処理機能と、
辞書サーバー210から所望の音声処理用辞書を獲得す
る辞書獲得機能と、辞書サーバー210に登録するため
の新規の音声処理用辞書を作成する辞書作成機能とを有
している。
【0158】また、データ格納部263には、音声処理
を行なうときに用いられる音声処理用辞書が格納される
ようになっている。また、端末装置230−1におい
て、ユーザによって音声処理用辞書およびその特徴情報
が新規に作成された場合、新規に作成された音声処理用
辞書およびその特徴情報も、一時的にデータ格納部26
3に格納されるようになっている。
【0159】また、音声入力部265は、マイクなどで
あって、音声処理用辞書を新規に作成する場合に、ユー
ザの音声を入力させるために設けられている。
【0160】また、画面入力部264は、ディスプレイ
およびキーボードであって、音声処理用辞書を新規に作
成する場合、あるいは、ユーザ所望の音声処理用辞書を
辞書サーバー210から獲得する場合、所望の音声処理
用辞書の特徴情報などを入力したりするのに用いられ
る。
【0161】また、処理結果出力部266は、スピーカ
などであって、音声処理された結果を出力するために設
けられている。
【0162】換言すれば、音声処理端末装置230−1
に関して、図22の音声処理手段231は、図25の制
御部262,音声入力部265,データ格納部263,
処理結果出力部266によって実現され、また、図22
の辞書獲得手段232は、図25の制御部262,画面
入力部264によって実現され、また、図23の辞書作
成手段234は、図25の制御部262,音声入力部2
65,画面入力部264によって実現され、また、図2
3の特徴情報入力手段235は、図25の制御部26
2,画面入力部264によって実現されている。
【0163】このように、本発明では、ネットワーク2
20に接続されている各音声処理端末装置230−1〜
230−mから構成されている音声処理システムに、さ
らに辞書サーバー210を追加し、ユーザによって自分
の音声処理端末装置で作成した音声処理用辞書を、ネッ
トワーク220を介し、辞書サーバー210に登録する
ことができ、また、ユーザが辞書サーバー210から所
望の音声処理用辞書を獲得することができる。具体的に
は、各音声処理端末装置230−1〜230−mには、
1つの音声処理用辞書だけを格納しておき、音声処理用
辞書を変えたい時だけ、辞書サーバー210に請求し、
所望の音声処理用辞書を獲得し、現在の音声処理用辞書
を、辞書サーバー210から獲得した所望の音声処理用
辞書に置き換えることができる。
【0164】すなわち、ユーザが自分の音声処理端末装
置で新規作成した音声処理用辞書を、ネットワーク22
0を介し、辞書サーバー210に登録することができ、
さらにユーザがネットワーク220を介し、所望の音声
処理用辞書を辞書サーバー210から獲得することがで
きる。これによって、ユーザの音声処理端末装置には、
1つの音声処理用辞書だけを格納すれば済み、複数個の
音声処理用辞書を格納する必要がなくなるので、資源の
節約を図ることができる。
【0165】また、同じネットワークに接続されている
音声処理端末装置のユーザであれば、誰でも新規作成し
た音声処理用辞書を辞書サーバーに登録することができ
るので、知らないユーザ間での音声処理用辞書の交換も
可能になる。さらに、多くの音声処理用辞書を辞書サー
バーに登録すれば、ユーザが所望の音声処理用辞書を辞
書サーバーに請求するとき、選択範囲は広がるので、ユ
ーザの所望の音声処理用辞書の獲得がより容易になる。
【0166】換言すれば、各端末装置230−1〜23
0−mは、辞書サーバー210を共用することができ、
各端末装置230−1〜230−mは、それぞれの中
に、大規模の音声処理用辞書を備えずとも良くなる。す
なわち、各端末装置230−1〜230−mのユーザが
所望の音声処理用辞書を必要とするときには、これを辞
書サーバー210から獲得することができる。また、あ
る端末装置,例えば230−1で作成された音声処理用
辞書が辞書サーバー210に登録されるとき、他の端末
装置,例えば230−2は、端末装置230−1で作成
された音声処理用辞書を辞書サーバー210から獲得す
ることができる。従って、音声処理用辞書の交換を互い
に全く知らないユーザ間でも行なうことが可能となる。
【0167】図26は図4,図19または図24の辞書
サーバー10,110または210のハードウェア構成
例を示す図である。図26を参照すると、この辞書サー
バー10,110または210は、例えばワークステー
ションやパーソナルコンピュータ等で実現され、全体を
制御するCPU71と、CPU71の制御プログラム等
が記憶されているROM72と、CPU71のワークエ
リア等として使用されるRAM73と、ハードディスク
74と、通信インタフェース75とを有している。
【0168】ここで、ハードディスク74は、図4,図
19または図24のデータ格納部53,153または2
53の機能を有している。また、通信インタフェース7
5は、図4,図19または図24の通信インタフェース
部51,151または251の機能を有している。ま
た、CPU71,ROM72,RAM73は、図4,図
19または図24の制御部52,152または252の
機能を有している。
【0169】なお、CPU71,ROM72,RAM7
3におけるこのような制御部52,152または252
としての機能は、例えばソフトウェアパッケージ(具体
的には、CD−ROM等の情報記録媒体)の形で提供す
ることができ、このため、図26の例では、情報記録媒
体77がセットさせるとき、これを駆動する媒体駆動装
置78が設けられている。
【0170】換言すれば、本発明の辞書サーバー10,
110または210は、ワークステーション,パーソナ
ルコンピュータ等の汎用の計算機システムにCD−RO
M等の情報記録媒体に記録されたプログラムを読み込ま
せて、この汎用計算機システムのマイクロプロセッサに
辞書サーバー10,110または210の各種処理機能
(図2,図17または図22に示す辞書検索手段13,
113または213としての処理機能,図3,図18ま
たは図23に示す登録手段14,114または214と
しての処理機能)を実行させる装置構成においても実施
することが可能である。この場合、本発明の辞書サーバ
ー10,110または210の上記処理機能を実行する
ためのプログラム(すなわち、ハードウェアシステムで
用いられるプログラム)は、媒体に記録された状態で提
供される。プログラムなどが記録される情報記録媒体と
しては、CD−ROMに限られるものではなく、RO
M,RAM,フレキシブルディスク,メモリカード等が
用いられても良い。媒体に記録されたプログラムは、ハ
ードウェアシステムに組み込まれている記憶装置、例え
ばハードディスク装置にインストールされることによ
り、このプログラムを実行して、辞書検索手段13,1
13または213としての機能、登録手段14,114
または214としての機能を実現することができる。
【0171】また、図27は図6,図20または図23
の端末装置(例えば30−1)のハードウェア構成例を
示す図である。図27を参照すると、この端末装置は、
例えばワークステーションやパーソナルコンピュータ等
で実現され、全体を制御するCPU81と、CPU81
の制御プログラム等が記憶されているROM82と、C
PU81のワークエリア等として使用されるRAM83
と、ハードディスク84と、通信インタフェース85
と、音声入力部(例えばマイク)86と、音声出力部
(例えばスピーカ)87と、画面入力部(例えばディス
プレイ/キーボード)88とを有している。
【0172】ここで、ハードディスク84は、図6,図
20または図23のデータ格納部63,163,263
の機能を有している。また、通信インタフェース85
は、図6,図20または図23の通信インタフェース部
61,161,261の機能を有している。また、音声
出力部87は、図6のテキスト読上げ端末装置において
必要であり、図20,図23の端末装置では、音声出力
部87にかわって、処理結果出力部を設けることもでき
る。また、CPU81,ROM82,RAM83は、図
6,図20または図23の制御部62,162,262
の機能を有している。
【0173】なお、CPU81,ROM82,RAM8
3におけるこのような制御部62,162,262とし
ての機能は、例えばソフトウェアパッケージ(具体的に
は、CD−ROM等の情報記録媒体)の形で提供するこ
とができ、このため、図27の例では、情報記録媒体8
9がセットさせるとき、これを駆動する媒体駆動装置9
0が設けられている。
【0174】換言すれば、本発明の端末装置(例えば3
0−1,130−1あるいは230−1)は、ワークス
テーション,パーソナルコンピュータ等の汎用の計算機
システムにCD−ROM等の情報記録媒体に記録された
プログラムを読み込ませて、この汎用計算機システムの
マイクロプロセッサに端末装置(例えば30−1,13
0−1あるいは230−1)の各種処理機能(図2に示
すテキスト読上げ手段31,辞書獲得手段32としての
処理機能,図3に示す辞書作成手段34,特徴情報入力
手段35,送信手段36としての処理機能、あるいは、
図17に示す音声認識手段131,辞書獲得手段132
としての処理機能,図18に示す辞書作成手段134,
特徴情報入力手段135,送信手段136としての処理
機能、あるいは、図22に示す音声処理手段231,辞
書獲得手段232としての処理機能,図23に示す辞書
作成手段234,特徴情報入力手段235,送信手段2
36としての処理機能)を実行させる装置構成において
も実施することが可能である。この場合、本発明の端末
装置(例えば30−1,130−1あるいは230−
1)の上記処理機能を実行するためのプログラム(すな
わち、ハードウェアシステムで用いられるプログラム)
は、媒体に記録された状態で提供される。プログラムな
どが記録される情報記録媒体としては、CD−ROMに
限られるものではなく、ROM,RAM,フレキシブル
ディスク,メモリカード等が用いられても良い。媒体に
記録されたプログラムは、ハードウェアシステムに組み
込まれている記憶装置、例えばハードディスク装置にイ
ンストールされることにより、このプログラムを実行し
て、図2に示すテキスト読上げ手段31,辞書獲得手段
32としての処理機能,図3に示す辞書作成手段34,
特徴情報入力手段35,送信手段36としての処理機
能、あるいは、図17に示す音声認識手段131,辞書
獲得手段132としての処理機能,図18に示す辞書作
成手段134,特徴情報入力手段135,送信手段13
6としての処理機能、あるいは、図22に示す音声処理
手段231,辞書獲得手段232としての処理機能,図
23に示す辞書作成手段234,特徴情報入力手段23
5,送信手段236としての処理機能を実現することが
できる。
【0175】
【発明の効果】以上に説明したように、請求項1,請求
項2,請求項5,請求項7,請求項8記載の発明によれ
ば、音声処理機能を備えた端末装置と少なくとも1つの
音声処理用辞書が格納されている辞書サーバーとがネッ
トワークを介して接続されているときに、端末装置は、
所望の音声処理用辞書を辞書サーバーからネットワーク
を介して獲得するので、ユーザの端末装置には、1つの
音声処理用辞書だけを格納すれば済み、複数個の音声処
理用辞書を格納する必要がなくなるので、資源の節約を
図ることができる。
【0176】また、請求項3,請求項4,請求項6,請
求項9乃至請求項12記載の発明によれば、音声処理機
能を備えた端末装置と少なくとも1つの音声処理用辞書
が格納される辞書サーバーとがネットワークを介して接
続されているときに、端末装置において、音声処理用辞
書を作成し、作成した音声処理用辞書をネットワークを
介して辞書サーバーに送信すると、辞書サーバーは、端
末装置から送信された音声処理用辞書を登録するので、
同じネットワークに接続されている端末装置のユーザで
あれば、誰でも新規作成した音声処理用辞書を辞書サー
バーに登録することができて、知らないユーザ間での音
声処理用辞書の交換も可能になる。さらに、多くの音声
処理用辞書を辞書サーバーに登録すれば、ユーザが所望
の音声処理用辞書を辞書サーバーに請求するとき、選択
範囲は広がるので、ユーザの所望の音声処理用辞書の獲
得が、より容易になる。
【0177】また、請求項13,請求項14,請求項1
7,請求項20,請求項21記載の発明によれば、所定
のテキストを合成音声で読上げるテキスト読上げ機能を
備えた端末装置と少なくとも1つの音声合成用辞書が格
納されている辞書サーバーとがネットワークを介して接
続されているときに、端末装置は、所望の声質の音声合
成用辞書を辞書サーバーからネットワークを介して獲得
するので、ユーザの端末装置には、1つの音声合成用辞
書だけを格納すれば済み、複数個の音声合成用辞書を格
納する必要がなくなるので、資源の節約を図ることがで
きる。
【0178】また、請求項15,請求項16,請求項1
8,請求項19,請求項22乃至請求項25記載の発明
によれば、所定のテキストを合成音声で読上げるテキス
ト読上げ機能を備えた端末装置と少なくとも1つの音声
合成用辞書が格納される辞書サーバーとがネットワーク
を介して接続されているときに、端末装置において、音
声合成用辞書を作成し、作成した音声合成用辞書をネッ
トワークを介して辞書サーバーに送信すると、辞書サー
バーは、端末装置から送信された音声合成用辞書を登録
するので、同じネットワークに接続されている端末装置
のユーザであれば、誰でも新規作成した音声合成用辞書
を辞書サーバーに登録することができて、知らないユー
ザ間での音声合成用辞書の交換も可能になる。さらに、
多くの声質の音声合成用辞書を辞書サーバーに登録すれ
ば、ユーザが所望の音声合成用辞書を辞書サーバーに請
求するとき、選択範囲は広がるので、ユーザの所望声質
の音声合成用辞書の獲得が、より容易になる。
【0179】また、請求項26,請求項27,請求項3
0,請求項32,請求項33記載の発明によれば、音声
認識機能を備えた端末装置と少なくとも1つの音声認識
用辞書が格納されている辞書サーバーとがネットワーク
を介して接続されているときに、端末装置は、所望の音
声認識用辞書を辞書サーバーからネットワークを介して
獲得するので、ユーザの端末装置には、1つの音声認識
用辞書だけを格納すれば済み、複数個の音声認識用辞書
を格納する必要がなくなるので、資源の節約を図ること
ができる。
【0180】また、請求項28,請求項29,請求項3
1,請求項34乃至請求項37記載の発明によれば、音
声認識機能を備えた端末装置と少なくとも1つの音声認
識用辞書が格納される辞書サーバーとがネットワークを
介して接続されているときに、端末装置において、音声
認識用辞書を作成し、作成した音声認識用辞書をネット
ワークを介して辞書サーバーに送信すると、辞書サーバ
ーは、端末装置から送信された音声認識用辞書を登録す
るので、同じネットワークに接続されている端末装置の
ユーザであれば、誰でも新規作成した音声認識用辞書を
辞書サーバーに登録することができて、知らないユーザ
間での音声認識用辞書の交換も可能になる。さらに、多
くの音声認識用辞書を辞書サーバーに登録すれば、ユー
ザが所望の音声認識用辞書を辞書サーバーに請求すると
き、選択範囲は広がるので、ユーザの所望の音声認識用
辞書の獲得が、より容易になる。
【図面の簡単な説明】
【図1】本発明に係るテキスト読上げシステムの構成例
を示す図である。
【図2】本発明に係るテキスト読上げシステムの第1の
実施形態の構成例を示す図である。
【図3】本発明に係るテキスト読上げシステムの第2の
実施形態の構成例を示す図である。
【図4】辞書サーバーの具体例を示す図である。
【図5】辞書検索テーブルの一例を示す図である。
【図6】端末装置の具体例を示す図である。
【図7】テキスト読上げ端末装置による音声合成処理
(テキスト読上げ処理)の流れを示すフローチャートで
ある。
【図8】テキスト読上げ端末装置による言語解析の一例
を示す図である。
【図9】テキスト読上げ端末装置による音声合成用辞書
作成処理の流れを示すフローチャートである。
【図10】テキスト読上げ端末装置による音声データ入
力処理の一例を示す図である。
【図11】音声合成用辞書の特徴情報を入力させるため
の画面入力部の表示画面の一例を示す図である。
【図12】辞書サーバーに送信される送信データの構造
の一例を示す図である。
【図13】辞書サーバーにおいて音声合成用辞書を登録
する処理の流れを示すフローチャートである。
【図14】テキスト読上げ端末装置からユーザ所望の音
声合成用辞書の特徴情報を受信したときの辞書サーバー
の処理の流れを示すフローチャートである。
【図15】得点を計算する例を示す図である。
【図16】本発明に係る音声認識システムの構成例を示
す図である。
【図17】本発明に係る音声認識システムの第1の実施
形態の構成例を示す図である。
【図18】本発明に係る音声認識システムの第2の実施
形態の構成例を示す図である。
【図19】辞書サーバーの具体例を示す図である。
【図20】端末装置の具体例を示す図である。
【図21】本発明に係る音声処理システムの構成例を示
す図である。
【図22】本発明に係る音声処理システムの第1の実施
形態の構成例を示す図である。
【図23】本発明に係る音声処理システムの第2の実施
形態の構成例を示す図である。
【図24】辞書サーバーの具体例を示す図である。
【図25】端末装置の具体例を示す図である。
【図26】図4,図19または図24の辞書サーバーの
ハードウェア構成例を示す図である。
【図27】図6,図20または図23の端末装置のハー
ドウェア構成例を示す図である。
【符号の説明】
10 辞書サーバー 20 ネットワーク 30−1〜30−m テキスト読上げ端末装置 40 プロバイダ 31 テキスト読上げ手段 32 辞書獲得手段 11 辞書格納手段 12 辞書検索テーブル 13 辞書検索手段 34 辞書作成手段 35 特徴情報入力手段 36 送信手段 14 登録手段 51 通信インタフェース部 52 制御部 53 データ格納部 61 通信インタフェース部 62 制御部 63 データ格納部 64 画面入力部 65 音声入力部 66 音声出力部 110 辞書サーバー 120 ネットワーク 130−1〜130−m 音声認識端末装置 131 音声認識手段 132 辞書獲得手段 111 辞書格納手段 112 辞書検索テーブル 113 辞書検索手段 134 辞書作成手段 135 特徴情報入力手段 136 送信手段 114 登録手段 151 通信インタフェース部 152 制御部 153 データ格納部 161 通信インタフェース部 162 制御部 163 データ格納部 164 画面入力部 165 音声入力部 166 認識結果出力部 210 辞書サーバー 220 ネットワーク 230−1〜230−m 音声処理端末装置 231 音声処理手段 232 辞書獲得手段 211 辞書格納手段 212 辞書検索テーブル 213 辞書検索手段 234 辞書作成手段 235 特徴情報入力手段 236 送信手段 214 登録手段 251 通信インタフェース部 252 制御部 253 データ格納部 261 通信インタフェース部 262 制御部 263 データ格納部 264 画面入力部 265 音声入力部 266 処理結果出力部 71 CPU 72 ROM 73 RAM 74 ハードディスク 75 通信インタフェース 77 情報記憶媒体 78 媒体駆動装置 81 CPU 82 ROM 83 RAM 84 ハードディスク 85 通信インタフェース 86 音声入力部 87 音声出力部 88 画面入力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 521C 15/28 521F 551P 571A

Claims (37)

    【特許請求の範囲】
  1. 【請求項1】 音声処理機能を備えた端末装置と、少な
    くとも1つの音声処理用辞書が格納されている辞書サー
    バーとを備え、前記端末装置が前記辞書サーバーにネッ
    トワークを介して接続されている音声処理システムであ
    って、前記端末装置は、所望の音声処理用辞書を前記辞
    書サーバーからネットワークを介して獲得する辞書獲得
    手段を有していることを特徴とする音声処理システム。
  2. 【請求項2】 請求項1記載の音声処理システムにおい
    て、前記辞書サーバーは、少なくとも1つの音声処理用
    辞書を格納する辞書格納手段と、辞書格納手段に格納さ
    れている音声処理用辞書の特徴情報が記述されている辞
    書検索テーブルとを有し、前記端末装置の辞書獲得手段
    は、所望の音声処理用辞書の特徴情報をネットワークを
    介して辞書サーバーに送信し、前記辞書サーバーは、音
    声処理用辞書の特徴情報を前記端末装置から受信したと
    きに、受信した音声処理用辞書の特徴情報を前記辞書検
    索テーブルと照合し、照合の結果、最も一致する音声処
    理用辞書を辞書格納手段から取り出して、端末装置に送
    信するようになっていることを特徴とする音声処理シス
    テム。
  3. 【請求項3】 音声処理機能を備えた端末装置と、少な
    くとも1つの音声処理用辞書が格納される辞書サーバー
    とを備え、前記端末装置が前記辞書サーバーにネットワ
    ークを介して接続されている音声処理システムであっ
    て、前記端末装置は、音声処理用辞書を作成するための
    辞書作成手段を有し、また、前記辞書サーバーは、少な
    くとも1つの音声処理用辞書を格納する辞書格納手段を
    有しており、前記端末装置が辞書作成手段によって作成
    された音声処理用辞書をネットワークを介して辞書サー
    バーに送信するとき、辞書サーバーは、端末装置から送
    信された音声処理用辞書を辞書格納手段に登録するよう
    になっていることを特徴とする音声処理システム。
  4. 【請求項4】 請求項3記載の音声処理システムにおい
    て、前記端末装置は、さらに、辞書作成手段によって作
    成された音声処理用辞書の特徴情報を作成する特徴情報
    作成手段を有し、また、前記辞書サーバーは、前記辞書
    格納手段に格納されている音声処理用辞書の特徴情報が
    記述されている辞書検索テーブルをさらに有し、前記端
    末装置は、辞書作成手段によって作成された音声処理用
    辞書および特徴情報作成手段によって作成された音声処
    理用辞書の特徴情報をネットワークを介して辞書サーバ
    ーに送信するとき、辞書サーバーは、端末装置から送信
    された音声処理用辞書を辞書格納手段に登録するととも
    に、端末装置から送信された特徴情報を辞書検索テーブ
    ルに登録するようになっていることを特徴とする音声処
    理システム。
  5. 【請求項5】 音声処理機能を備えた端末装置と少なく
    とも1つの音声処理用辞書が格納されている辞書サーバ
    ーとがネットワークを介して接続されているときに、前
    記端末装置は、所望の音声処理用辞書を前記辞書サーバ
    ーからネットワークを介して獲得することを特徴とする
    辞書獲得方法。
  6. 【請求項6】 音声処理機能を備えた端末装置と少なく
    とも1つの音声処理用辞書が格納される辞書サーバーと
    がネットワークを介して接続されているときに、前記端
    末装置において、音声処理用辞書を作成し、作成した音
    声処理用辞書をネットワークを介して辞書サーバーに送
    信すると、辞書サーバーは、端末装置から送信された音
    声処理用辞書を登録することを特徴とする辞書登録方
    法。
  7. 【請求項7】 音声処理用辞書が格納されている辞書サ
    ーバーにネットワークを介して接続されている端末装置
    であって、前記端末装置は、所望の音声処理用辞書を前
    記辞書サーバーからネットワークを介して獲得する辞書
    獲得手段を有していることを特徴とする端末装置。
  8. 【請求項8】 少なくとも1つの音声処理用辞書を格納
    する辞書格納手段と、辞書格納手段に格納されている音
    声処理用辞書の特徴情報が記述されている辞書検索テー
    ブルとを有している辞書サーバーであって、該辞書サー
    バーは、音声処理用辞書の特徴情報を端末装置からネッ
    トワークを介して受信したときに、受信した音声処理用
    辞書の特徴情報を前記辞書検索テーブルと照合し、照合
    の結果、最も一致する音声処理用辞書を辞書格納手段か
    ら取り出して、端末装置に送信するようになっているこ
    とを特徴とする辞書サーバー。
  9. 【請求項9】 辞書サーバーにネットワークを介して接
    続されている端末装置であって、前記端末装置は、ユー
    ザの発声により入力した音声データから音声処理用辞書
    を作成する辞書作成手段と、該音声処理用辞書の特徴情
    報をユーザに入力させる特徴情報入力手段と、作成され
    た音声処理用辞書と入力された音声処理用辞書の特徴情
    報とをネットワークを介して辞書サーバーに送信する送
    信手段とを有していることを特徴とする端末装置。
  10. 【請求項10】 少なくとも1つの音声処理用辞書を格
    納する辞書格納手段と、辞書格納手段に格納されている
    音声処理用辞書の特徴情報が記述されている辞書検索テ
    ーブルとを有している辞書サーバーであって、端末装置
    において作成された音声処理用辞書および音声処理用辞
    書の特徴情報が端末装置からネットワークを介して送信
    されるとき、辞書サーバーは、端末装置から送信された
    音声処理用辞書を辞書格納手段に登録するとともに、端
    末装置から送信された特徴情報を辞書検索テーブルに登
    録するようになっていることを特徴とする辞書サーバ
    ー。
  11. 【請求項11】 ユーザの発声により入力した音声デー
    タから音声処理用辞書を作成する辞書作成処理と、該音
    声処理用辞書の特徴情報をユーザに入力させる特徴情報
    入力処理と、作成された音声処理用辞書と入力された音
    声処理用辞書の特徴情報とをネットワークを介して辞書
    サーバーに送信する送信処理とをコンピュータに実行さ
    せるためのプログラムを記録したコンピュータ読み込み
    可能な記録媒体。
  12. 【請求項12】 端末装置において作成された音声処理
    用辞書および音声処理用辞書の特徴情報が端末装置から
    ネットワークを介して送信されるとき、端末装置から送
    信された音声処理用辞書を辞書格納手段に登録するとと
    もに、端末装置から送信された特徴情報を辞書検索テー
    ブルに登録する処理をコンピュータに実行させるための
    プログラムを記録したコンピュータ読み込み可能な記録
    媒体。
  13. 【請求項13】 所定のテキストを合成音声で読上げる
    テキスト読上げ機能を備えた端末装置と、互いに異なる
    声質の少なくとも1つの音声合成用辞書が格納されてい
    る辞書サーバーとを備え、前記端末装置が前記辞書サー
    バーにネットワークを介して接続されているテキスト読
    上げシステムであって、前記端末装置は、所望の声質の
    音声合成用辞書を前記辞書サーバーからネットワークを
    介して獲得する辞書獲得手段を有していることを特徴と
    するテキスト読上げシステム。
  14. 【請求項14】 請求項13記載のテキスト読上げシス
    テムにおいて、前記辞書サーバーは、互いに異なる声質
    の少なくとも1つの音声合成用辞書を格納する辞書格納
    手段と、辞書格納手段に格納されている音声合成用辞書
    の特徴情報が記述されている辞書検索テーブルとを有
    し、前記端末装置の辞書獲得手段は、所望の声質の音声
    合成用辞書の特徴情報をネットワークを介して辞書サー
    バーに送信し、前記辞書サーバーは、音声合成用辞書の
    特徴情報を前記端末装置から受信したときに、受信した
    音声合成用辞書の特徴情報を前記辞書検索テーブルと照
    合し、照合の結果、最も一致する音声合成用辞書を辞書
    格納手段から取り出して、端末装置に送信するようにな
    っていることを特徴とするテキスト読上げシステム。
  15. 【請求項15】 所定のテキストを合成音声で読上げる
    テキスト読上げ機能を備えた端末装置と、互いに異なる
    声質の少なくとも1つの音声合成用辞書が格納される辞
    書サーバーとを備え、前記端末装置が前記辞書サーバー
    にネットワークを介して接続されているテキスト読上げ
    システムであって、前記端末装置は、音声合成用辞書を
    作成するための辞書作成手段を有し、また、前記辞書サ
    ーバーは、互いに異なる声質の少なくとも1つの音声合
    成用辞書を格納する辞書格納手段を有しており、前記端
    末装置が辞書作成手段によって作成された音声合成用辞
    書をネットワークを介して辞書サーバーに送信すると
    き、辞書サーバーは、端末装置から送信された音声合成
    用辞書を辞書格納手段に登録するようになっていること
    を特徴とするテキスト読上げシステム。
  16. 【請求項16】 請求項15記載のテキスト読上げシス
    テムにおいて、前記端末装置は、さらに、辞書作成手段
    によって作成された音声合成用辞書の特徴情報を作成す
    る特徴情報作成手段を有し、また、前記辞書サーバー
    は、前記辞書格納手段に格納されている音声合成用辞書
    の特徴情報が記述されている辞書検索テーブルをさらに
    有し、前記端末装置は、辞書作成手段によって作成され
    た音声合成用辞書および特徴情報作成手段によって作成
    された音声合成用辞書の特徴情報をネットワークを介し
    て辞書サーバーに送信するとき、辞書サーバーは、端末
    装置から送信された音声合成用辞書を辞書格納手段に登
    録するとともに、端末装置から送信された特徴情報を辞
    書検索テーブルに登録するようになっていることを特徴
    とするテキスト読上げシステム。
  17. 【請求項17】 所定のテキストを合成音声で読上げる
    テキスト読上げ機能を備えた端末装置と少なくとも1つ
    の音声合成用辞書が格納されている辞書サーバーとがネ
    ットワークを介して接続されているときに、前記端末装
    置は、所望の声質の音声合成用辞書を前記辞書サーバー
    からネットワークを介して獲得することを特徴とする辞
    書獲得方法。
  18. 【請求項18】 所定のテキストを合成音声で読上げる
    テキスト読上げ機能を備えた端末装置と少なくとも1つ
    の音声合成用辞書が格納される辞書サーバーとがネット
    ワークを介して接続されているときに、前記端末装置に
    おいて、音声合成用辞書を作成し、作成した音声合成用
    辞書をネットワークを介して辞書サーバーに送信する
    と、辞書サーバーは、端末装置から送信された音声合成
    用辞書を登録することを特徴とする辞書登録方法。
  19. 【請求項19】 請求項18記載の辞書登録方法におい
    て、前記端末装置における音声合成用辞書の作成は、音
    声入力データ内容をユーザに提示し、これに基づいてユ
    ーザが音声データを入力すると、入力された音声データ
    が成功したか否かを音声認識によって判断し、入力され
    た音声データが成功であると判断されると、入力された
    音声データから各子音と母音の素片波形を抽出すること
    によってなされることを特徴とする辞書登録方法。
  20. 【請求項20】 音声合成用辞書が格納されている辞書
    サーバーにネットワークを介して接続されている端末装
    置であって、前記端末装置は、所望の声質の音声合成用
    辞書を前記辞書サーバーからネットワークを介して獲得
    する辞書獲得手段を有していることを特徴とする端末装
    置。
  21. 【請求項21】 互いに異なる声質の少なくとも1つの
    音声合成用辞書を格納する辞書格納手段と、辞書格納手
    段に格納されている音声合成用辞書の特徴情報が記述さ
    れている辞書検索テーブルとを有している辞書サーバー
    であって、該辞書サーバーは、所望の声質の音声合成用
    辞書の特徴情報を端末装置からネットワークを介して受
    信したときに、受信した音声合成用辞書の特徴情報を前
    記辞書検索テーブルと照合し、照合の結果、最も一致す
    る音声合成用辞書を辞書格納手段から取り出して、端末
    装置に送信するようになっていることを特徴とする辞書
    サーバー。
  22. 【請求項22】 辞書サーバーにネットワークを介して
    接続されている端末装置であって、前記端末装置は、ユ
    ーザの発声により入力した音声データから音声合成用辞
    書を作成する辞書作成手段と、該音声合成用辞書の特徴
    情報をユーザに入力させる特徴情報入力手段と、作成さ
    れた音声合成用辞書と入力された音声合成用辞書の特徴
    情報とをネットワークを介して辞書サーバーに送信する
    送信手段とを有していることを特徴とする端末装置。
  23. 【請求項23】 互いに異なる声質の少なくとも1つの
    音声合成用辞書を格納する辞書格納手段と、辞書格納手
    段に格納されている音声合成用辞書の特徴情報が記述さ
    れている辞書検索テーブルとを有している辞書サーバー
    であって、端末装置において作成された音声合成用辞書
    および音声合成用辞書の特徴情報が端末装置からネット
    ワークを介して送信されるとき、辞書サーバーは、端末
    装置から送信された音声合成用辞書を辞書格納手段に登
    録するとともに、端末装置から送信された特徴情報を辞
    書検索テーブルに登録するようになっていることを特徴
    とする辞書サーバー。
  24. 【請求項24】 ユーザの発声により入力した音声デー
    タから音声合成用辞書を作成する辞書作成処理と、該音
    声合成用辞書の特徴情報をユーザに入力させる特徴情報
    入力処理と、作成された音声合成用辞書と入力された音
    声合成用辞書の特徴情報とをネットワークを介して辞書
    サーバーに送信する送信処理とをコンピュータに実行さ
    せるためのプログラムを記録したコンピュータ読み込み
    可能な記録媒体。
  25. 【請求項25】 端末装置において作成された音声合成
    用辞書および音声合成用辞書の特徴情報が端末装置から
    ネットワークを介して送信されるとき、端末装置から送
    信された音声合成用辞書を辞書格納手段に登録するとと
    もに、端末装置から送信された特徴情報を辞書検索テー
    ブルに登録する処理をコンピュータに実行させるための
    プログラムを記録したコンピュータ読み込み可能な記録
    媒体。
  26. 【請求項26】 音声認識機能を備えた端末装置と、少
    なくとも1つの音声認識用辞書が格納されている辞書サ
    ーバーとを備え、前記端末装置が前記辞書サーバーにネ
    ットワークを介して接続されている音声認識システムで
    あって、前記端末装置は、所望の音声認識用辞書を前記
    辞書サーバーからネットワークを介して獲得する辞書獲
    得手段を有していることを特徴とする音声認識システ
    ム。
  27. 【請求項27】 請求項26記載の音声認識システムに
    おいて、前記辞書サーバーは、少なくとも1つの音声認
    識用辞書を格納する辞書格納手段と、辞書格納手段に格
    納されている音声認識用辞書の特徴情報が記述されてい
    る辞書検索テーブルとを有し、前記端末装置の辞書獲得
    手段は、所望の音声認識用辞書の特徴情報をネットワー
    クを介して辞書サーバーに送信し、前記辞書サーバー
    は、音声認識用辞書の特徴情報を前記端末装置から受信
    したときに、受信した音声認識用辞書の特徴情報を前記
    辞書検索テーブルと照合し、照合の結果、最も一致する
    音声認識用辞書を辞書格納手段から取り出して、端末装
    置に送信するようになっていることを特徴とする音声認
    識システム。
  28. 【請求項28】 音声認識機能を備えた端末装置と、少
    なくとも1つの音声認識用辞書が格納される辞書サーバ
    ーとを備え、前記端末装置が前記辞書サーバーにネット
    ワークを介して接続されている音声認識システムであっ
    て、前記端末装置は、音声認識用辞書を作成するための
    辞書作成手段を有し、また、前記辞書サーバーは、少な
    くとも1つの音声認識用辞書を格納する辞書格納手段を
    有しており、前記端末装置が辞書作成手段によって作成
    された音声認識用辞書をネットワークを介して辞書サー
    バーに送信するとき、辞書サーバーは、端末装置から送
    信された音声認識用辞書を辞書格納手段に登録するよう
    になっていることを特徴とする音声認識システム。
  29. 【請求項29】 請求項28記載の音声認識システムに
    おいて、前記端末装置は、さらに、辞書作成手段によっ
    て作成された音声認識用辞書の特徴情報を作成する特徴
    情報作成手段を有し、また、前記辞書サーバーは、前記
    辞書格納手段に格納されている音声認識用辞書の特徴情
    報が記述されている辞書検索テーブルをさらに有し、前
    記端末装置は、辞書作成手段によって作成された音声認
    識用辞書および特徴情報作成手段によって作成された音
    声認識用辞書の特徴情報をネットワークを介して辞書サ
    ーバーに送信するとき、辞書サーバーは、端末装置から
    送信された音声認識用辞書を辞書格納手段に登録すると
    ともに、端末装置から送信された特徴情報を辞書検索テ
    ーブルに登録するようになっていることを特徴とする音
    声認識システム。
  30. 【請求項30】 音声認識機能を備えた端末装置と少な
    くとも1つの音声認識用辞書が格納されている辞書サー
    バーとがネットワークを介して接続されているときに、
    前記端末装置は、所望の音声認識用辞書を前記辞書サー
    バーからネットワークを介して獲得することを特徴とす
    る辞書獲得方法。
  31. 【請求項31】 音声認識機能を備えた端末装置と少な
    くとも1つの音声認識用辞書が格納される辞書サーバー
    とがネットワークを介して接続されているときに、前記
    端末装置において、音声認識用辞書を作成し、作成した
    音声認識用辞書をネットワークを介して辞書サーバーに
    送信すると、辞書サーバーは、端末装置から送信された
    音声認識用辞書を登録することを特徴とする辞書登録方
    法。
  32. 【請求項32】 音声認識用辞書が格納されている辞書
    サーバーにネットワークを介して接続されている端末装
    置であって、前記端末装置は、所望の音声認識用辞書を
    前記辞書サーバーからネットワークを介して獲得する辞
    書獲得手段を有していることを特徴とする端末装置。
  33. 【請求項33】 少なくとも1つの音声認識用辞書を格
    納する辞書格納手段と、辞書格納手段に格納されている
    音声認識用辞書の特徴情報が記述されている辞書検索テ
    ーブルとを有している辞書サーバーであって、該辞書サ
    ーバーは、音声認識用辞書の特徴情報を端末装置からネ
    ットワークを介して受信したときに、受信した音声認識
    用辞書の特徴情報を前記辞書検索テーブルと照合し、照
    合の結果、最も一致する音声認識用辞書を辞書格納手段
    から取り出して、端末装置に送信するようになっている
    ことを特徴とする辞書サーバー。
  34. 【請求項34】 辞書サーバーにネットワークを介して
    接続されている端末装置であって、前記端末装置は、ユ
    ーザの発声により入力した音声データから音声認識用辞
    書を作成する辞書作成手段と、該音声認識用辞書の特徴
    情報をユーザに入力させる特徴情報入力手段と、作成さ
    れた音声認識用辞書と入力された音声認識用辞書の特徴
    情報とをネットワークを介して辞書サーバーに送信する
    送信手段とを有していることを特徴とする端末装置。
  35. 【請求項35】 少なくとも1つの音声認識用辞書を格
    納する辞書格納手段と、辞書格納手段に格納されている
    音声認識用辞書の特徴情報が記述されている辞書検索テ
    ーブルとを有している辞書サーバーであって、端末装置
    において作成された音声認識用辞書および音声認識用辞
    書の特徴情報が端末装置からネットワークを介して送信
    されるとき、辞書サーバーは、端末装置から送信された
    音声認識用辞書を辞書格納手段に登録するとともに、端
    末装置から送信された特徴情報を辞書検索テーブルに登
    録するようになっていることを特徴とする辞書サーバ
    ー。
  36. 【請求項36】 ユーザの発声により入力した音声デー
    タから音声認識用辞書を作成する辞書作成処理と、該音
    声認識用辞書の特徴情報をユーザに入力させる特徴情報
    入力処理と、作成された音声認識用辞書と入力された音
    声認識用辞書の特徴情報とをネットワークを介して辞書
    サーバーに送信する送信処理とをコンピュータに実行さ
    せるためのプログラムを記録したコンピュータ読み込み
    可能な記録媒体。
  37. 【請求項37】 端末装置において作成された音声認識
    用辞書および音声認識用辞書の特徴情報が端末装置から
    ネットワークを介して送信されるとき、端末装置から送
    信された音声認識用辞書を辞書格納手段に登録するとと
    もに、端末装置から送信された特徴情報を辞書検索テー
    ブルに登録する処理をコンピュータに実行させるための
    プログラムを記録したコンピュータ読み込み可能な記録
    媒体。
JP2000090732A 2000-03-27 2000-03-27 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体 Pending JP2001272992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000090732A JP2001272992A (ja) 2000-03-27 2000-03-27 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000090732A JP2001272992A (ja) 2000-03-27 2000-03-27 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2001272992A true JP2001272992A (ja) 2001-10-05

Family

ID=18606303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000090732A Pending JP2001272992A (ja) 2000-03-27 2000-03-27 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2001272992A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040371A (ja) * 2006-08-10 2008-02-21 Hitachi Ltd 音声合成装置
CN106373558A (zh) * 2015-07-24 2017-02-01 科大讯飞股份有限公司 语音识别文本处理方法及系统
WO2017016135A1 (zh) * 2015-07-24 2017-02-02 百度在线网络技术(北京)有限公司 语音合成方法和系统
JP2017107198A (ja) * 2015-12-02 2017-06-15 悠之介 北 音声採取方法および音声移植方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040371A (ja) * 2006-08-10 2008-02-21 Hitachi Ltd 音声合成装置
CN106373558A (zh) * 2015-07-24 2017-02-01 科大讯飞股份有限公司 语音识别文本处理方法及系统
WO2017016135A1 (zh) * 2015-07-24 2017-02-02 百度在线网络技术(北京)有限公司 语音合成方法和系统
CN106373558B (zh) * 2015-07-24 2019-10-18 科大讯飞股份有限公司 语音识别文本处理方法及系统
JP2017107198A (ja) * 2015-12-02 2017-06-15 悠之介 北 音声採取方法および音声移植方法

Similar Documents

Publication Publication Date Title
JP6434948B2 (ja) 名前発音システム及び方法
KR102582291B1 (ko) 감정 정보 기반의 음성 합성 방법 및 장치
US11049493B2 (en) Spoken dialog device, spoken dialog method, and recording medium
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US5680510A (en) System and method for generating and using context dependent sub-syllable models to recognize a tonal language
US6876967B2 (en) Speech complementing apparatus, method and recording medium
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
WO2005034082A1 (en) Method for synthesizing speech
KR20050098839A (ko) 네트워크 환경에서 음성 처리를 위한 중간 처리기
JP6980411B2 (ja) 情報処理装置、対話処理方法、及び対話処理プログラム
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
US20080270128A1 (en) Text Input System and Method Based on Voice Recognition
JP2005249829A (ja) 音声認識を行うコンピュータネットワークシステム
JP6233867B2 (ja) 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム
US20030055642A1 (en) Voice recognition apparatus and method
JP2001272992A (ja) 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP2003099089A (ja) 音声認識・合成装置および方法
JP6289950B2 (ja) 読み上げ装置、読み上げ方法及びプログラム
US20200243092A1 (en) Information processing device, information processing system, and computer program product
JP2003162524A (ja) 言語処理装置
JP3029403B2 (ja) 文章データ音声変換システム
JP2007010995A (ja) 話者認識方法
WO2022168173A1 (ja) 話者埋め込み装置、話者埋め込み方法、および、話者埋め込みプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313