JP2003140674A

JP2003140674A - 音声合成システム及び音声合成方法

Info

Publication number: JP2003140674A
Application number: JP2001337617A
Authority: JP
Inventors: Tokuji Fukusato; 篤司福里
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2001-11-02
Filing date: 2001-11-02
Publication date: 2003-05-16
Anticipated expiration: 2021-11-02
Also published as: GB0224901D0; GB2383502A; CN1416053A; US7313522B2; US20030088419A1; GB2383502B; CN1208714C; JP3589216B2; HK1053221A1

Abstract

(57)【要約】【課題】携帯端末とサーバとからなる音声合成システ
ムにおいて、現実性を向上させる。【解決手段】携帯端末１２は、テキストデータを受信
するテキストデータ受信手段１２１と、テキストデータ
に音声サンプリング名を添付してサーバ１３へ送信する
テキストデータ送信手段１２２と、音声合成データをサ
ーバ１３から受信する音声合成データ受信手段１２３
と、音声合成データを音声に再生する音声再生手段１２
４とを備えている。サーバ１３は、テキストデータ及び
音声サンプリング名を携帯端末１２から受信するテキス
トデータ受信手段１３１と、音声サンプリング名に対応
する音声サンプリングデータを用いてテキストデータを
音声合成データに変換する音声合成手段１３２と、音声
合成データを携帯端末１２へ送信する音声合成データ送
信手段１３３とを備えている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、通信回線を介して
互いに接続可能な携帯端末とサーバとを備えた音声合成
システムに関し、詳しくは、携帯端末からテキストデー
タをサーバへ送信すると、サーバでテキストデータを音
声合成データに変換して携帯端末へ返信する音声合成シ
ステムに関する。

【０００２】

【従来の技術】近年、携帯電話機では、ｉモードに代表
されるインターネット接続サービスが普及することによ
り、テキストデータでの情報配信が行われるようになっ
た。その結果、電子メールの送受信に加え、モバイル・
バンキング、オンライン・トレード、チケット購入など
の各種のサービスが、携帯電話機で利用できるようにな
っている。

【０００３】一方、テキストデータの情報には、次のよ
うな欠点があった。．携帯電話の画面は狭いため、読
みにくい。特に、高齢者にとって、その傾向が著しい。
．視覚障害者の方々にとっては、その情報は全く無意
味である。

【０００４】そのため、テキストデータを読み上げる機
能を備えた携帯電話機も提案されている。例えば特開20
00-339137号公報に記載された携帯電話機では、予め用
意された音声データの複数のカテゴリー（男性、女性、
老人、子供など）の中からユーザが一つを選択すると、
その選択された音声データを用いてテキストデータを音
声に変換する。

【０００５】

【発明が解決しようとする課題】しかしながら、上記公
報に記載された携帯電話機では、テキストデータを送信
した者とは異なる声で音声合成データが再生されるの
で、ユーザにとって違和感が生じていた。

【０００６】

【発明の目的】そこで、本発明の目的は、現実性を向上
させた音声合成システム及び音声合成方法を提供するこ
とにある。

【０００７】

【課題を解決するための手段】請求項１記載の音声合成
システムは、通信回線を介して互いに接続可能な携帯端
末とサーバとを備えた音声合成システムである。そし
て、携帯端末は、テキストデータを受信するテキストデ
ータ受信手段と、受信したテキストデータに音声サンプ
リング名を添付してサーバへ送信するテキストデータ送
信手段と、音声合成データをサーバから受信する音声合
成データ受信手段と、受信した音声合成データを音声に
再生する音声再生手段とを備えている。サーバは、テキ
ストデータ及び音声サンプリング名を携帯端末から受信
するテキストデータ受信手段と、受信した音声サンプリ
ング名に対応する音声サンプリングデータを用いて、受
信したテキストデータを音声合成データに変換する音声
合成手段と、変換した音声合成データを携帯端末へ送信
する音声合成データ送信手段とを備えている。

【０００８】請求項３記載の音声合成システムは、請求
項１記載の音声合成システムにおいて、携帯端末を複数
備えたものである。

【０００９】請求項３記載の音声合成システムは、請求
項２記載の音声合成システムにおいて更に次の構成要素
を備えている。各携帯端末は、それぞれのユーザの音声
サンプリングデータを採取する音声サンプリングデータ
採取手段と、採取した音声サンプリングデータをサーバ
へ送信する音声サンプリングデータ送信手段とを備えて
いる。サーバは、音声サンプリングデータを各携帯端末
から受信する音声サンプリングデータ受信手段と、受信
した音声サンプリングデータに音声サンプリング名を付
してデータベースを構築するデータベース構築手段とを
備えている。

【００１０】本発明に係る音声合成方法は、本発明に係
る音声合成システムに用いられるものである。

【００１１】換言すると、本発明は、ＪＡＶＡ（登録商
標）アプリケーションと通信システムホスト端末とのデ
ータプロトコルを用いて、受信したテキストデータを音
声合成して携帯端末上で再生することを特徴とする。更
に、このデータプロトコル内に音声合成に使用する音声
サンプリングデータを指定することで、任意の音声合成
データを出力することができる。また、携帯端末を使用
してユーザの会話時にそのユーザの音声サンプリングデ
ータを採取することで、ユーザの音声サンプリングデー
タを他のユーザへ配信することができる。

【００１２】更に換言すると、本発明は、携帯端末のＪ
ＡＶＡアプリケーションを用いた音声合成データ再生方
式であって、次の特徴を有する。．携帯端末と通信ホ
スト端末との独自のデータプロトコルを持つ。．音声
合成されたデータを受信し、自動再生する。．通信シ
ステムホスト端末において、音声サンプリングデータを
元にテキストデータを音声合成して、音声合成データを
作成する。．携帯電話でのユーザの会話時の音声サン
プリングデータを採取し、ユーザ固有の音声サンプリン
グデータのデータベースを作成する。．ユーザの作成
したデータベースを他のユーザに公開する手段を提供す
る。

【００１３】

【発明の実施の形態】図１は、本発明に係る音声合成シ
ステムの一実施形態を示す機能ブロック図である。以
下、この図面に基づき説明する。なお、本発明に係る音
声合成方法の実施形態についても同時に説明する。

【００１４】本実施形態の音声合成システム１０は、通
信回線１１を介して互いに接続可能な携帯端末１２とサ
ーバ１３とを備えている。携帯端末１２は、一つのみを
図示しているが、実際は複数設けられている。

【００１５】それぞれの携帯端末１２は、テキストデー
タを受信するテキストデータ受信手段１２１と、受信し
たテキストデータに音声サンプリング名を添付してサー
バ１３へ送信するテキストデータ送信手段１２２と、音
声合成データをサーバ１３から受信する音声合成データ
受信手段１２３と、受信した音声合成データを音声に再
生する音声再生手段１２４と、携帯端末１２のユーザの
音声サンプリングデータを採取する音声サンプリングデ
ータ採取手段１２５と、採取した音声サンプリングデー
タをサーバ１３へ送信する音声サンプリングデータ送信
手段１２６とを備えている。

【００１６】サーバ１３は、テキストデータ及び音声サ
ンプリング名を携帯端末１２から受信するテキストデー
タ受信手段１３１と、受信した音声サンプリング名に対
応する音声サンプリングデータを用いて、受信したテキ
ストデータを音声合成データに変換する音声合成手段１
３２と、変換した音声合成データを携帯端末１２へ送信
する音声合成データ送信手段１３３と、音声サンプリン
グデータを携帯端末１２から受信する音声サンプリング
データ受信手段１３４と、受信した音声サンプリングデ
ータに音声サンプリング名を付してデータベース１３５
を構築するデータベース構築手段１３６とを備えてい
る。

【００１７】通信回線１１は、例えば電話回線及びイン
ターネットである。携帯端末１２は、コンピュータを内
蔵した携帯電話機や携帯情報端末（ＰＤＡ）などであ
る。サーバ１３は、パーソナルコンピュータなどのコン
ピュータである。携帯端末１２及びサーバ１３に具備さ
れた上記各手段は、コンピュータ・プログラムによって
実現されている。また、データの送受信は、送受信回路
（図示せず）及び通信回線１１等のハードウェアを介し
て行なわれる。

【００１８】図２は、音声合成システム１０の動作の一
例を示すシーケンス図である。以下、図１及び図２に基
づき説明する。なお、携帯端末１２Ａ，１２Ｂは、それ
ぞれ携帯端末１２と同一構成である。

【００１９】まず、携帯端末１２Ａにおいて、音声サン
プリングデータ採取手段１２５がユーザＡの音声サンプ
リングデータａを採取し（ステップ１０１）、音声サン
プリングデータ送信手段１２６が音声サンプリングデー
タａをサーバ１３へ送信する（ステップ１０２）。する
と、サーバ１３では、音声サンプリングデータ受信手段
１３４が音声サンプリングデータａを受信し（ステップ
１０３）、データベース構築手段１３６が音声サンプリ
ングデータａに音声サンプリング名Ａ’を付してデータ
ベース１３５を構築する（ステップ１０４）。同様に、
携帯端末１２Ｂにおいて、ユーザＢの音声サンプリング
データｂを採取し（ステップ１０５）、音声サンプリン
グデータｂをサーバ１３へ送信する（ステップ１０
６）。すると、サーバ１３では、音声サンプリングデー
タｂを受信し（ステップ１０７）、音声サンプリングデ
ータｂに音声サンプリング名Ｂ’を付してデータベース
１３５を構築する（ステップ１０８）。

【００２０】ここで、携帯端末１２Ａにおいて、携帯端
末１２Ｂから送信されたテキストデータｂ１をテキスト
データ受信手段１２１が受信すると（ステップ１０９，
１１０）、テキストデータ送信手段１２２がテキストデ
ータｂ１に音声サンプリング名Ｂ’を添付してサーバ１
３へ送信する（ステップ１１１）。すると、サーバ１３
では、テキストデータ受信手段１３１がテキストデータ
ｂ１及び音声サンプリング名Ｂ’を受信し（ステップ１
１２）、音声合成手段１３２が音声サンプリング名Ｂ’
に対応する音声サンプリングデータｂを用いてテキスト
データｂ１を音声合成データｂ２に変換し（ステップ１
１３）、音声合成データ送信手段１３３が音声合成デー
タｂ２を携帯端末１２Ａへ送信する（ステップ１１
４）。すると、携帯端末１２Ａでは、音声合成データ受
信手段１２３が音声合成データｂ２を受信し（ステップ
１１５）、音声再生手段１２４が音声合成データｂ２を
音声ｂ３に再生する（ステップ１１６）。

【００２１】以上のように、音声合成システム１０によ
れば、携帯端末１２Ａ，１２ＢのユーザＡ，Ｂの音声サ
ンプリングデータａ，ｂがサーバ１３内にデータベース
化されている。そのため、携帯端末１２Ａでは、携帯端
末１２Ｂから送られてきたテキストデータｂ１をサーバ
１３へ送ると、携帯端末１２ＢのユーザＢの声からなる
音声合成データｂ２がサーバ１３から返ってくるので、
ユーザＢの声でテキストデータｂ１を読み上げることが
できる。したがって、現実性が向上する。

【００２２】また、各携帯端末１２Ａ，…がユーザＡ，
…の音声サンプリングデータa，…を採取してサーバ１
３へ送信し、サーバ１３が音声サンプリングデータa，
…をデータベース化することにより、自動的かつ容易に
音声合成システム１０が拡張される。例えば、新たな携
帯端末１２ＣのユーザＣが音声合成システム１０に参加
する場合も、即座に前述のサービスが受けられる。

【００２３】なお、音声サンプリングデータ採取手段１
２５、音声サンプリングデータ送信手段１２６、音声サ
ンプリングデータ受信手段１３４、及びデータベース構
築手段１３６は、省略してもよい。この場合は、別の方
法でデータベース１３５を構築しておく必要がある。

【００２４】また、音声の個人性に関する研究は、これ
まで主にスペクトルとピッチ周波数とを中心に行なわれ
ている。例えば、ピッチ周波数の時間変化又は平均ピッ
チ周波数に関する研究として、ピッチ周波数の時間変化
などの韻律情報の言語了解性に対する効果、３モーラ単
語によるピッチ周波数の時間変化の個人性の抽出及びそ
の制御などが報告されている。一方、スペクトルに関す
る研究として、ホルマント周波数とバンド幅による声道
特性と個人性との関係、単母音のスペクトル包絡成分に
注目した個人性の分析などが報告されている。

【００２５】

【実施例】次に、音声合成システム１０を更に具体化し
た一実施例について説明する。

【００２６】図３は、本実施例の音声合成システムを示
す構成図である。以下、この図面に基づき説明する。

【００２７】携帯端末１２は、パケット情報受信端末で
あり、複数あるうちの一つのみを示す。サーバ１３は、
ゲートウェイサーバ１３７及び任意のサーバ１３８から
なる。携帯端末１２とゲートウェイサーバ１３７とは通
信回線１１１を介して接続され、ゲートウェイサーバ１
３７とサーバ１３８とは通信回線１１２を介して接続さ
れている。ここで、携帯端末１２の通信要求をゲートウ
ェイサーバ１３７の中継により任意のサーバ１３８に伝
達し、その応答として、任意のサーバ１３８がゲートウ
ェイサーバ１３７を通して携帯端末１２に情報を伝達す
る。

【００２８】携帯端末１２は、サーバ１３からの情報を
受信するとともに、サーバ１３に対する情報取得要求を
送信する。ゲートウェイサーバ１３７は、携帯端末１２
と任意のサーバ１３８との中継点にあって、携帯端末１
２に応答情報を伝達する。任意のサーバ１３８は、携帯
端末１２から送信されてくる情報要求に対し、その応答
として適当なデータを返すとともに、携帯端末１２に対
してＰＵＳＨ型の自動配信を行う。

【００２９】図４［１］は携帯端末１２のソフトウェア
構成を示すブロック図であり、図４［２］は携帯端末１
２のハードウェア構成を示すブロック図である。以下、
図３及び図４に基づき説明する。

【００３０】図４［１］に示すように、携帯端末１２の
ソフトウェア２０は、ＯＳ２１、通信モジュール２２、
ＪＡＶＡ管理モジュール２３，ＪＡＶＡＶＭ（Virtual
Machine：仮想マシン）２４及びＪＡＶＡアプリケーシ
ョン２５の五層から構成される。「ＪＡＶＡ」とは、オ
ブジェクト指向のプログラミング言語の一種であり、Ｊ
ＡＶＡＶＭというレイヤーが個々のＯＳやＣＰＵの違
いを吸収することにより、一つのバイナリ・アプリケー
ションでどの環境でも実行できるようにしたものであ
る。

【００３１】ＯＳ２１は、プラットフォームを表す。た
だし、ＪＡＶＡがプラットフォームに依存しないという
メリットを持っていることから、ＯＳ２１は特に特定さ
れない。通信モジュール２２は、パケット通信データを
送受信するためのモジュールである。ＪＡＶＡ管理モジ
ュール２３、ＪＡＶＡＶＭ２４及びＪＡＶＡアプリケ
ーション２５は、通信モジュール２２を介してパケット
データを受信したことを関知する。ＪＡＶＡ管理モジュ
ール２３は、ＪＡＶＡＶＭ２４の動作等の制御を管理
する。ＪＡＶＡ管理モジュール２３が、実際の携帯端末
１２上でのＪＡＶＡアプリケーション２５の振る舞いを
制御する。ＪＡＶＡＶＭ２４は、機能として特に規定
はしない。しかし、現在のパーソナルコンピュータ等に
含まれているＪＡＶＡＶＭでは、携帯端末１２に実装
するとメモリ容量が不足する。したがって、ＪＡＶＡ
ＶＭ２４は、携帯端末１２として使用するのに必要な機
能しか持たないものとする。ＪＡＶＡアプリケーション
２５は、通信モジュール２２で受信したデータに基づい
て動作するように作成されたアプリケーション・プログ
ラムである。

【００３２】図４［２］に示すように、携帯端末１２の
ハードウェア３０は、システム制御部３１、記憶メモリ
３２、音声認識部３７、無線制御部３８及びオーディオ
部３９からなる。更に、無線制御部３８は通信データ受
信部３３及び通信データ送信部３４を備え、オーディオ
部３９はスピーカ３５及びマイク３６を備えている。

【００３３】システム制御部３１は、携帯端末１２のメ
イン部分の動作を担い、図１に示す携帯端末１２の各手
段をコンピュータ・プログラムによって実現している。
記憶メモリ３２は、ＪＡＶＡアプリケーション２５によ
って採取した音声サンプリングデータを保存する領域と
して使用したり、サーバ１３から取得した音声合成デー
タを保存する領域として使用する。通信データ受信部３
３は、携帯端末１２に入力される通信データを受信す
る。通信データ送信部３４は、携帯端末１２から通信デ
ータを出力する。スピーカ３５は、受信した音声合成デ
ータを音声として外部に出力する。マイク３６は、ユー
ザが発声した音声を携帯端末１２内に入力する。音声認
識部３７は、マイク３６から入力された音声データを認
識し、ＪＡＶＡアプリケーション２５に対して通知す
る。

【００３４】次に、図５乃至図９に基づき、本実施例の
音声合成システムにおける動作の一例を説明する。以下
の「データベース」は、携帯端末のユーザごとに別々に
サーバ内に設けられ、当該ユーザの許可がない限り、他
のユーザがアクセスできないようになっている。

【００３５】図５は、テキストデータを受信した場合の
携帯端末の動作を示すフローチャートである。以下、こ
の図面に基づき説明する。

【００３６】まず、テキストデータを受信すると（ステ
ップ４１）、音声合成をするか否かを判定する（ステッ
プ４２）。その判定方法としては、ユーザが選択する、
又は設定されたデータ（例えば音声合成をする又はしな
い）に従うなどがある。音声合成をする場合は、音声合
成に使用する音声サンプリングデータを決定する（ステ
ップ４３）。このサンプリングデータの決定は、携帯端
末のユーザ自身のデータベース内の音声サンプリングデ
ータを使用するか、又は他のユーザのデータベース内の
音声サンプリングデータを使用するか、を決定するもの
である。この動作により、ユーザ自身が所有する音声サ
ンプリングデータだけでなく、他のユーザが所有する音
声サンプリングデータを参照して、自己の携帯端末にお
いて音声合成データを再生することが可能になる。サー
バのデータベースにアクセスする時は、自己のアクセス
識別子を使用することによりアクセス許可を取得する。
このとき、他のユーザが所有するデータベースにアクセ
スする時は、後述する図８及び図９に示すように、デー
タベース参照許可を受ける。

【００３７】使用するサンプリングデータを決定した後
は、音声サンプリングデータが保存されているデータベ
ースに対してアクセスを要求する（ステップ４４，４
５）。そのアクセスする際のサーバと携帯端末とのシー
ケンスについては、後述する図６に示す。データベース
に対するアクセス許可が下りた場合は、音声合成をして
もらうためのテキストデータを送信する（ステップ４
６，４７）。サーバから音声合成データが配信される
と、その音声合成データを携帯端末が受信する（ステッ
プ４８）。これにより、受信した音声合成データを再生
することができる（ステップ４９）。

【００３８】図６は、携帯端末からサーバに対してアク
セスする動作を示すシーケンス図である。以下、この図
面に基づき説明する。

【００３９】まず、携帯端末からサーバに対して、携帯
端末自身のアクセス識別子付きでデータベース参照要求
を送信する（ステップ５１〜５３）。サーバ側では、そ
の要求によりサーバ内のデータベースを検索し、アクセ
スできるユーザかどうかを判別する（ステップ５４）。
アクセス可能なユーザの場合はアクセスＩＤを送信し、
次回からは携帯端末から送信されるヘッダ情報内のアク
セスＩＤを確認することで、データベースの参照を許可
する。すなわち、データベースにアクセス許可が下りた
場合は、サーバ側から携帯端末側に対してアクセスＩＤ
を配布する（ステップ５５）。携帯端末側では、サーバ
側からアクセスＩＤをもらうことで、自己のアクセス識
別子とアクセスＩＤとをデータ内のヘッダに入力して、
音声合成をしてもらうためのテキストデータを送信する
（ステップ５６〜６０）。

【００４０】サーバ側では、アクセスＩＤを識別するこ
とによりユーザのアクセス許可をチェックし、その後に
受信したテキストデータの音声合成を開始する（ステッ
プ６１）。このとき、音声合成に使用する音声サンプリ
ングデータは、アクセスＩＤを元に指定のデータベース
から取得する。音声合成終了後、サーバは携帯端末に音
声合成データを配信する（ステップ６２）。すると、携
帯端末側では、ＪＡＶＡアプリケーションに対して受信
通知が行われ、音声合成データをＪＡＶＡアプリケーシ
ョンに引き渡す（ステップ６３）。この動作により、Ｊ
ＡＶＡアプリケーションは、音声合成データの受信を認
知し、受信した音声合成データを再生することができる
（ステップ６４）。

【００４１】図７は、音声サンプリングデータをデータ
ベース化する動作を示すシーケンス図である。以下、こ
の図面に基づき説明する。

【００４２】まず、ＪＡＶＡアプリケーション起動中
に、ユーザが音声通話等で携帯端末のマイクに入力する
音声データを、音声サンプリングデータとしてＪＡＶＡ
アプリケーションに引き渡す（ステップ７１）。この音
声サンプリングデータを携帯端末の記憶メモリに蓄積す
る（ステップ７２）。音声サンプリングデータがある一
定量記憶メモリに蓄積された時点（ステップ７３）で、
ＪＡＶＡアプリケーションは、自動的に図６のサーバア
クセスシーケンスを使用し（図６のステップ５１〜６１
参照）、自己のデータベースへ記憶メモリ内の自己の音
声サンプリングデータを保存する（ステップ７４〜８
４）。この仕組みにより、ユーザは、自己の音声サンプ
リングデータをサーバ内のデータベースとして構築し、
他のユーザに自己の音声サンプリングデータを公開する
ことで、他のユーザの携帯端末で音声合成データを自己
の音声で再生することを可能にする。

【００４３】図８及び図９は、ユーザが所有する音声サ
ンプリングデータのデータベースを他のユーザに公開す
る動作を示すシーケンス図である。以下、この図面に基
づき説明する。

【００４４】まず、携帯端末Ａのユーザが所有するデー
タベースにアクセスを希望する携帯端末Ｂのメールアド
レスを、携帯端末ＡのＪＡＶＡアプリケーション上から
入力する（ステップ１４１）。続いて、そのメールアド
レスをサーバへ送信する（ステップ１４２〜１４４）。
サーバ側では、携帯端末Ａのユーザのデータベースに対
して携帯端末Ａからアクセス要求があった場合に、メー
ルアドレスが付加されていたら、仮のデータベースアク
セス許可ＩＤを発行し、メールアドレス先の携帯端末Ｂ
に仮のデータベースアクセス許可ＩＤとデータベース接
続先（サーバ）とを送付する（ステップ１４５〜１５
３）。

【００４５】メールを受信した携帯端末Ｂ側では、ユー
ザがメール画面にてその仮のデータベースアクセス許可
ＩＤを選択した時に、メーラとＪＡＶＡアプリケーショ
ンとの連動により、ＪＡＶＡアプリケーションにその仮
のデータベースアクセス許可ＩＤとデータベース接続先
（サーバ）とを引き渡す（ステップ１６１〜１６４）。
この動作により、ＪＡＶＡアプリケーションはデータベ
ース接続先（サーバ）に対して、自身のアクセス識別子
と仮のデータベースアクセス許可ＩＤとを送信する（ス
テップ１６５〜１６７）。サーバ側では、アクセス識別
子と仮のデータベースアクセス許可ＩＤとを受信するこ
とにより、次回から携帯端末Ｂのアクセスが許可される
ようにデータベースの更新作業を行う（ステップ１６
８）。

【００４６】

【発明の効果】本発明に係る音声合成システム及び音声
合成方法によれば、複数の携帯端末のユーザの音声サン
プリングデータがサーバ内にデータベース化されている
ことにより、他の携帯端末から送られてきたテキストデ
ータをサーバへ送ると、その携帯端末のユーザの声から
なる音声合成データがサーバから返ってくるので、その
携帯端末のユーザの声でテキストデータを読み上げるこ
とができる。したがって、現実性を向上できる。

【００４７】また、各携帯端末がユーザの音声サンプリ
ングデータを採取してサーバへ送信し、サーバがその音
声サンプリングデータをデータベース化することによ
り、自動的かつ容易に当該音声合成システムを拡張する
ことができる。すなわち、新たな携帯端末のユーザが当
該音声合成システムに参加する場合も、即座に前述のサ
ービスが受けられる。

【００４８】換言すると、本発明によれば、メール等で
送信されてくるテキスト文書をユーザ選択により、任意
の音声データに変換することで、文書の内容を自分で読
まなくても、ユーザの聞きたい音声データで内容を再生
することができるため、視覚的に障害を持つ方々にも便
利な機能を提供することができる。

【図面の簡単な説明】

【図１】本発明に係る音声合成システムの一実施形態を
示す機能ブロック図である。

【図２】図１の音声合成システムにおける動作の一例を
示すシーケンス図である。

【図３】本発明に係る音声合成システムの一実施例を示
す構成図である。

【図４】図３内の携帯端末の構成例を示すブロック図で
あり、図４［１］は携帯端末のソフトウェア構成、図４
［２］は携帯端末のハードウェア構成である。

【図５】図３の音声合成システムにおける、テキストデ
ータを受信した場合の携帯端末の動作を示すフローチャ
ートである。

【図６】図３の音声合成システムにおける、携帯端末か
らサーバに対してアクセスする動作を示すシーケンス図
である。

【図７】図３の音声合成システムにおける、音声サンプ
リングデータをデータベース化する動作を示すシーケン
ス図である。

【図８】図３の音声合成システムにおける、ユーザが所
有する音声サンプリングデータのデータベースを他のユ
ーザに公開する動作を示すシーケンス図である。

【図９】図３の音声合成システムにおける、ユーザが所
有する音声サンプリングデータのデータベースを他のユ
ーザに公開する動作を示すシーケンス図である。

【符号の説明】

１０音声合成システム１１通信回線１３サーバ１２，１２Ａ，１２Ｂ携帯端末１２１テキストデータ受信手段１２２テキストデータ送信手段１２３音声合成データ受信手段１２４音声再生手段１２５音声サンプリングデータ採取手段１２６音声サンプリングデータ送信手段１３１テキストデータ受信手段１３２音声合成手段１３３音声合成データ送信手段１３４音声サンプリングデータ受信手段１３５データベース構築手段

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｑ 7/38 Ｈ０４Ｂ 7/26 １０９ＭＧ１０Ｌ 3/00 ＱＦターム(参考） 5D045 AB04 5K024 AA71 BB03 CC11 DD01 FF06 5K067 AA34 BB04 BB21 DD51 EE02 EE10 EE16 FF02 FF23 FF26 5K101 KK02 LL01 LL12 MM07 NN16 NN23 UU19

Claims

【特許請求の範囲】

【請求項１】通信回線を介して互いに接続可能な携帯
端末とサーバとを備えた音声合成システムであって、前記携帯端末は、テキストデータを受信するテキストデ
ータ受信手段と、受信した前記テキストデータに音声サ
ンプリング名を添付して前記サーバへ送信するテキスト
データ送信手段と、音声合成データを前記サーバから受
信する音声合成データ受信手段と、受信した前記音声合
成データを音声に再生する音声再生手段とを備え、前記サーバは、前記テキストデータ及び音声サンプリン
グ名を前記携帯端末から受信するテキストデータ受信手
段と、受信した前記音声サンプリング名に対応する音声
サンプリングデータを用いて、受信した前記テキストデ
ータを音声合成データに変換する音声合成手段と、変換
した前記音声合成データを前記携帯端末へ送信する音声
合成データ送信手段とを備えた、ことを特徴とする音声合成システム。
【請求項２】前記携帯端末を複数備えた、請求項１記載の音声合成システム。
【請求項３】前記各携帯端末は、それぞれのユーザの
音声サンプリングデータを採取する音声サンプリングデ
ータ採取手段と、採取した前記音声サンプリングデータ
を前記サーバへ送信する音声サンプリングデータ送信手
段とを更に備え、前記サーバは、前記音声サンプリングデータを前記各携
帯端末から受信する音声サンプリングデータ受信手段
と、受信した前記音声サンプリングデータに前記音声サ
ンプリング名を付してデータベースを構築するデータベ
ース構築手段とを更に備えた、請求項２記載の音声合成システム。
【請求項４】通信回線を介して互いに接続可能な携帯
端末とサーバとを備えた音声合成システムに用いられる
音声合成方法であって、前記携帯端末は、テキストデータを受信するテキストデ
ータ受信ステップと、受信した前記テキストデータに音
声サンプリング名を添付して前記サーバへ送信するテキ
ストデータ送信ステップと、音声合成データを前記サー
バから受信する音声合成データ受信ステップと、受信し
た前記音声合成データを音声に再生する音声再生ステッ
プとを備え、前記サーバは、前記テキストデータ及び音声サンプリン
グ名を前記携帯端末から受信するテキストデータ受信ス
テップと、受信した前記音声サンプリング名に対応する
音声サンプリングデータを用いて、受信した前記テキス
トデータを音声合成データに変換する音声合成ステップ
と、変換した前記音声合成データを前記携帯端末へ送信
する音声合成データ送信ステップとを備えた、ことを特徴とする音声合成方法。
【請求項５】前記携帯端末を複数備えた、請求項４記載の音声合成方法。
【請求項６】前記各携帯端末は、それぞれのユーザの
音声サンプリングデータを採取する音声サンプリングデ
ータ採取ステップと、採取した前記音声サンプリングデ
ータを前記サーバへ送信する音声サンプリングデータ送
信ステップとを更に備え、前記サーバは、前記音声サンプリングデータを前記各携
帯端末から受信する音声サンプリングデータ受信ステッ
プと、受信した前記音声サンプリングデータに前記音声
サンプリング名を付してデータベースを構築するデータ
ベース構築ステップとを更に備えた、請求項５記載の音声合成方法。