JP2005055607A - サーバ、情報処理端末、音声合成システム - Google Patents
サーバ、情報処理端末、音声合成システム Download PDFInfo
- Publication number
- JP2005055607A JP2005055607A JP2003285251A JP2003285251A JP2005055607A JP 2005055607 A JP2005055607 A JP 2005055607A JP 2003285251 A JP2003285251 A JP 2003285251A JP 2003285251 A JP2003285251 A JP 2003285251A JP 2005055607 A JP2005055607 A JP 2005055607A
- Authority
- JP
- Japan
- Prior art keywords
- information
- speech synthesis
- speech
- synthesis
- processing terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
【課題】 端末側の処理能力に応じて必要な情報を提供して、適切且つ高品質な音声合成を行う技術を提供する。
【解決手段】 サーバ100は、ユーザ側の情報処理端末200が文字情報に基づいて音声情報を合成する際に、この情報処理端末200による適切且つ高品質な音声合成を行うことができるか否かを判定する。そして、サーバ100は、この判定結果に基づいて、音声合成に必要な音声合成情報、またはサーバ側で合成した音声情報を、情報処理端末200に提供する。
【選択図】 図1
【解決手段】 サーバ100は、ユーザ側の情報処理端末200が文字情報に基づいて音声情報を合成する際に、この情報処理端末200による適切且つ高品質な音声合成を行うことができるか否かを判定する。そして、サーバ100は、この判定結果に基づいて、音声合成に必要な音声合成情報、またはサーバ側で合成した音声情報を、情報処理端末200に提供する。
【選択図】 図1
Description
本発明は、音声合成技術に関する。
一般に、自動車に搭載されるカーナビゲーションシステムなどの、移動体用の情報端末において、ユーザインタフェースの一例として、音声を合成してユーザに情報を提供する、そのような音声合成手段が用いられている。
上記移動体用の情報端末において、音声合成手段が生成した音声による情報提供を行うことで、ユーザは、端末側への指示の復唱、あるいはユーザに対する経路指示等の情報が提供される場合に、ディスプレイ等の視覚情報に依存することなく当該情報端末を利用できた。
上記移動体用の情報端末の音声認識技術では、端末側の処理能力にとらわれることなく処理を行うために、分散型音声認識(Distributed Speech Recognition:以下DSRとする)が用いられていた。
そして、上記移動体用の情報端末の音声合成において、端末とサーバ間の音声情報の通信には、TTS(Text To Speech)が用いられていた。TTSとは、テキストデータで与えられた文字情報を、音声情報に合成する技術である。このTTSにより、端末とサーバ間の通信量を抑えることができた。
なお、上記移動体用の情報端末の音声認識に関して、例えばコンピュータ・ネットワーク・システムにおいて複数の利用者のための話者独立型連続音声認識装置に関する技術(例えば、特許文献1参照。)が開示されている。また、情報端末の音声認識に関する技術(例えば、特許文献2参照。)が開示されている。
特開平7−140998号公報
特開平6−175682号公報
しかしながら、従来のDSRの音声合成では、通信するデータ量を抑えるために、TTSを用いてテキスト形式の文字情報をサーバから端末に提供するか、あるいはサーバが合成した音声情報を送信するかのいずれかの方法で音声合成を行っていた。このため、従来のDSRでは、端末に提供される文字情報に新しい単語が含まれている場合などには、その単語の音声合成に必要なデータベースを有していない端末では、適切な音声情報を出力できなかった。また、従来のDSRでは、サーバが合成した音声情報を送信した場合には、通信に必要な帯域が広く、送信するデータ量も多くなるため、端末などへの負担が大きかった。
本発明は、上記事項に鑑みて為されたものであり、端末側の処理能力に応じて必要な情報を提供することで、適切且つ高品質な音声合成を行う技術を提供することを、その解決すべき課題とする。
本発明は前記課題を解決するために、以下の手段を採用した。
すなわち、本発明は、音声合成情報を用いて、文字情報を音声情報に合成する音声合成手段を有する情報処理端末と接続するサーバである。本発明のサーバは、前記情報処理端末が有する音声合成情報により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成情報判定手段と、前記情報処理端末側の音声合成情報によって音声情報への合成が可能ではない場合に、前記情報処理端末に提供する音声合成情報を選択する、そのような音声合成情報選択手段と、前記音声合成情報が提供された場合に、前記情報処理端末が有する音声合成手段により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成手段判定手段と、前記情報処理端末に提供する音声合成情報を、この情報処理端末に送信する情報送信手段と、前記情報処理端末側の音声合成手段によって音声合成が可能ではない場合に、前記文字情報に基づく音声情報の合成を行う、音声合成手段と、前記音声合成手段が合成した音声情報を送信する音声情報送信手段と、を備えるようにした。
本発明のサーバは、例えば、ユーザ側の情報処理端末が文字情報に基づいて音声情報を合成する際に、この情報処理端末によりその音声合成が可能か否かを判定すればよい。そして、本発明のサーバは、この判定結果に基づいて、音声合成に必要な音声合成情報、またはサーバ側で合成した音声情報を、情報処理端末に提供すればよい。
従って、本発明のサーバによれば、情報処理端末側の処理能力に応じて必要な情報を提供して、適切且つ高品質な音声情報の出力を行うことができる。
また、本発明のサーバは、前記サーバに接続する個々の情報処理端末に関する情報である、端末情報を格納する端末情報データベースをさらに備え、前記音声合成情報判定手段が、前記端末情報データベースを参照して端末側の音声合成情報による音声合成可能であるか否かを判定し、前記音声合成手段判定手段が、前記端末情報データベースを参照して端末側の音声合成手段による音声合成可能であるか否かを判定してもよい。
本発明のサーバは、例えば、個々の情報処理端末側の処理能力に関する情報を、端末情報データベースとして格納し、この端末情報データベースに基づいて、音声合成に関する判定処理を行えばよい。
従って、本発明のサーバによれば、個々の情報処理端末側の処理能力に応じて必要な情報を提供して、適切且つ高品質な音声合成を行うことができる。
さらに、本発明は、情報処理端末であり、文字情報を音声情報に合成するための音声合成情報を格納する音声合成データベースと、音声情報に合成される文字情報、前記音声合成データベースに追加される音声合成情報、または前記文字情報から合成された音声情報を受信する手段と、前記文字情報を受信したときに、前記音声合成データベースを参照し、前記音声合成情報により前記受信した文字情報を音声情報に合成する、そのような音声合成手段と、前記音声合成情報を受信したときに、その音声合成情報を前記音声合成データベースに追加する手段と、前記合成される音声情報、または受信した音声情報を出力する手段と、を備えるようにした。
本発明の情報処理端末は、音声合成に用いる音声合成情報、またはサーバで合成された音声情報を、このサーバ側から受信する。そして、本発明の情報処理端末は、音声合成情報を受信した場合には、この音声合成情報を用いて文字情報を音声情報に合成する。また、本発明の情報処理端末は、音声情報を受信した場合には、この音声情報を出力する。
従って、本発明の情報処理端末によれば、情報処理端末側の処理能力に応じて適切且つ
高品質な音声情報を、ユーザ側に提供することができる。
高品質な音声情報を、ユーザ側に提供することができる。
なお、本発明は、以上の装置及び端末の何れかの機能を実現させるプログラムであってもよい。さらに、本発明は、そのようなプログラムをコンピュータが読み取り可能な記憶媒体に記録してもよい。
以上のように、本発明によれば、端末側の処理能力に応じて必要な情報を提供して、適切且つ高品質な音声合成を行う技術を提供することができる。
以下、図面を参照して、本発明の一実施の形態に係る音声合成システム(以下本システムとも呼ぶ)を説明する。本システムは、本発明のサーバに対応するセンタサーバ及び情報処理端末に対応する車載用情報端末を有する。
〈本システムの概略〉
まず、本システムの概略を説明する。本システムのセンタサーバ及び車載用情報端末は、以下に示す特徴を備える。
まず、本システムの概略を説明する。本システムのセンタサーバ及び車載用情報端末は、以下に示す特徴を備える。
本システムは、その特徴として、音声合成を行う文字情報及び車載用情報端末の音声合成手段の処理能力に基づいて、以下の処理を行う。すなわち、本システムのセンタサーバは、この車載用情報端末によって対象となる文字情報の音声合成が可能である場合には、車載用情報端末によって音声合成を行う。
また、本システムのセンタサーバは、上記音声合成手段の音声合成データベースに必要な情報を提供することによって、音声合成を行う音声合成エンジンで音声合成が可能な場合には、車載用情報端末に音声合成データベースの追加情報を提供する。
また、本システムのセンタサーバは、上記音声合成手段の音声合成データベースに必要な情報を提供したとしてもこの音声合成手段の音声合成エンジンでは音声合成が不可能である場合には、センタサーバの音声合成手段によって音声合成を行う。そして、本システムのセンタサーバは、合成した音声情報を送信する。
従来のセンタサーバ側の音声合成では、文字情報をサーバから端末に提供して端末側で音声合成するか、あるいはサーバが合成した音声情報を端末に送信するかのいずれかの方法で音声合成を行っていた。
本システムによれば、音声合成手段の処理能力に応じて必要な情報を提供することで、通信するデータ量を抑えつつ、適切且つ高品質な音声合成を行うことができる。
〈システム構成〉
図1は、本実施の形態に係る音声合成システムの概略構成図の一例である。図1に示すように、本実施の形態に係る音声合成システムは、本システムのサーバの一例であるセンタサーバ100と、本システムの情報処理端末の一例である車載用情報端末200とを備える。そして、本音声合成システムでは、センタサーバ100と車載用情報端末200とが、既存の通信網を利用したネットワーク300を介して接続している。なお、このネットワーク300としては、公衆の携帯電話網、無線LAN(Local Area Network)用通信網、及びETC(Electronic Toll Collection System)用無線通信網等の、既存の様々な通信網を用いることができる。また、図1において、センタサーバ100に対して、一つの車載用情報端末200が接続されているが、本実施の形態に係る音声合成システムで
は、図示しない複数の車載用情報端末200がネットワーク300を介して接続している。
図1は、本実施の形態に係る音声合成システムの概略構成図の一例である。図1に示すように、本実施の形態に係る音声合成システムは、本システムのサーバの一例であるセンタサーバ100と、本システムの情報処理端末の一例である車載用情報端末200とを備える。そして、本音声合成システムでは、センタサーバ100と車載用情報端末200とが、既存の通信網を利用したネットワーク300を介して接続している。なお、このネットワーク300としては、公衆の携帯電話網、無線LAN(Local Area Network)用通信網、及びETC(Electronic Toll Collection System)用無線通信網等の、既存の様々な通信網を用いることができる。また、図1において、センタサーバ100に対して、一つの車載用情報端末200が接続されているが、本実施の形態に係る音声合成システムで
は、図示しない複数の車載用情報端末200がネットワーク300を介して接続している。
〈装置構成〉
次に、本実施の形態に係る音声合成システムを構成する装置及び端末について説明する。
次に、本実施の形態に係る音声合成システムを構成する装置及び端末について説明する。
センタサーバ100は、サーバ装置などの、既存の情報処理装置によって構成される。本実施の形態において、これら既存の情報処理装置には、本システムのサーバの機能を実現するプログラムが導入(インストール)される。そして、このプログラムをインストールすることによって、既存の情報処理装置は、本実施の形態に係るセンタサーバ100として用いることができる。
図1に示すように、本実施の形態に係るセンタサーバ100は、上記本システムの概略にて説明した本システムのサーバの各機能を実現するために、以下の構成要素を備える。すなわち、本センタサーバ100は、CPU(Central Processing Unit)101、音声合成エンジン103,音声合成データベース104を有する音声合成手段102、クライアント音声合成データベース105、音声認識サーバ106、及び通信手段107を備える。
次に、本センタサーバ100の構成要素について説明する。
CPU101は、ハードディスク装置等の記憶装置(不図示)にインストールされたプログラムを実行して、本音声合成システムに係るセンタサーバの各種機能を実現する。すなわち、CPU101は、上記記憶装置にインストールされたプログラムを実行させることで、本システムのセンタサーバに係る、音声合成情報判定手段,音声合成手段判定手段,音声合成データベース選択手段,音声合成手段の機能を実現する。
音声合成手段102は、音声合成処理に必要な情報である音声合成情報を用いて文字情報に基づいてユーザに発する音声情報を合成する、音声合成エンジン103を備える。また、音声合成手段102は、音声情報を生成するために参照する音声パターン情報等の音声合成情報を格納する、音声合成データベース104を備える。なお、本音声合成システムにおいて、音声合成手段102の音声合成エンジン103は、CPU101によって実行されるプログラムによって実現される。
音声合成エンジン103は、車載用情報端末200の音声情報から、音声パターン情報を抽出する。そして、音声合成エンジン103は、音声合成データベース104に格納されている音声合成情報を参照して、文字情報から音声情報を生成する。なお、センタサーバ100において、音声合成情報としては、文字情報の個々の文字、あるいは単語に対応する音声情報(例えば、文字:「今日」に対応する音声:「きょう」など)が挙げられる。
そして、センタサーバ100には、図示されない複数の音声合成手段102が任意数のセット(例えば、n個の音声合成手段102のセット)が備えられている。
本音声合成システムにおいて、センタサーバ100に複数の音声合成手段を備えるのは、以下の理由による。すなわち、センタサーバ100は、特性の異なる複数の音声合成手段102によって、複数の音声情報を生成する。そして、この複数の音声合成手段102は、音声情報を合成する文字情報の特徴に対する適性がある。このため、複数の音声合成手段102によれば、音声合成の対象である様々な文字情報を高品質な音声情報に合成す
ることができる。
ることができる。
クライアント音声合成データベース105は、本システムのサーバにおける端末情報データベースに対応する。このクライアント音声合成データベース105は、CPUの性能,音声合成エンジン203の性能,音声合成データベース204に格納される音声合成情報の情報量など、個々の車載用情報端末200側の処理能力に関する情報が格納されている。
図2は、上述のクライアント音声合成データベース105のデータテーブルの一例である。クライアント音声合成データベース105には、番号105a、ユーザID105b、車載用情報端末200の機種を特定する端末ナンバー105c、CPUの型番105d、メインメモリ容量105e、ハードディスク装置の有無105f、ハードディスク装置の容量105g、及び音声合成データベース204に格納される音声合成情報のデータベース情報レベル105hなどの、車載用情報端末200の処理能力、記憶容量などの処理能力を示す情報を、個々のユーザの車載用情報端末200毎に関連付けて格納している。なお、上記クライアント音声合成データベース105内の情報のうち、データベース情報レベル105hは、例えば、個々のデータベースに格納される文字情報に対する音声合成情報の格納語数を所定の段階に応じてレベルを分類したものである。すなわち、このデータベース情報レベル105hによって、センタサーバ100は、音声合成の対象となる文字情報に対応した音声合成情報が格納されているか否かを判断可能にするものである。
センタサーバ100は、このクライアント音声合成データベース105の情報に基づいて、個々の車載用情報端末200に提供する音声合成データベースに含まれるデータ量を調整する。
音声認識サーバ106は、音声認識処理を行うための機能を有する。この音声認識を行うための機能としては、例えば、音声認識エンジンや音声認識データベース(ともに不図示)などが挙げられる。
通信手段107は、ネットワーク300を介して、個々のユーザの車載用情報端末200と通信する。この通信手段107は、車載用情報端末200に文字情報(文字テキスト)を送信する。また、通信手段107は、複数のうち、文字情報に対応した音声情報を、当該ユーザの車載用情報端末200に提供する。
本実施の形態に係る車載用情報端末200は、上記本発明の情報処理端末の各機能を実現するために、以下の構成要素を備える。車載用情報端末200は、プログラムに基づいて各種情報処理を行うCPU201、文字情報に基づいて音声情報を合成する音声合成エンジン203,音声合成エンジン203が音声情報を合成する際に参照する音声合成情報を格納する音声合成データベース204を有する音声合成手段202、ユーザの操作指示を音声指示で受け付けるマイク等の音声入力手段205、センタサーバ100からの音声情報と音声合成手段202が合成した音声情報とを切り替えて出力する合成音声生成切換手段206、音声認識処理を行う音声認識クライアント207、及びセンタサーバ100との通信に用いる通信手段208とを備える。
〈処理フローチャート〉
次に、本音声合成システムに係る、センタサーバ100及び車載用情報端末200の処理について、フローチャートを用いて説明する。
次に、本音声合成システムに係る、センタサーバ100及び車載用情報端末200の処理について、フローチャートを用いて説明する。
図3は、本実施の形態に係るセンタサーバ100の処理フローチャートである。
まず、センタサーバ100は、ユーザ側の車載用情報端末200で用いる音声情報の基となる、テキスト形式の文字情報を生成する(図3におけるステップ101、以下S101のように省略する)。
センタサーバ100は、音声合成データベース204でこの文字情報の音声合成が可能か否かを判定する(S102)。具体的には、センタサーバ100は、クライアント音声合成データベース105を参照して、このテキスト形式の文字情報ファイル(以下テキストと省略)を音声情報に合成することができる音声合成情報が、車載用情報端末200の音声合成データベース204にあるか否かを、クライアント音声合成データベース105に基づいて判定する。
このS102によって、車載用情報端末200側の音声合成データベース204で音声合成が可能であると判定した場合には、センタサーバ100は、この車載用情報端末200に音声合成に関するテキストを送信する(S103)。テキスト送信後、センタサーバ100は、本処理を終了する。
また、S102によって、音声合成データベース204で音声合成が不可能であると判定した場合には、センタサーバ100は、送信するテキストがユーザ側の車載用情報端末200の音声合成エンジン203で生成可能であるか否かを、クライアント音声合成データベース105を参照して判定する(S104)。
このS104によって、音声合成エンジン203が送信するテキストから音声情報を生成可能であると判定した場合には、センタサーバ100は、このテキストに基づいて音声合成を行うために必要な音声合成情報を追加する。具体的には、センタサーバ100は、センタサーバ100の音声合成データベース105に含まれる音声合成情報を、音声合成データベース204に提供する(S105)。
そして、センタサーバ100は、この車載用情報端末200に音声合成に関するテキストを送信する(S106)。テキスト送信後、センタサーバ100は、本処理を終了する。
また、S104によって、音声合成エンジン103が送信するテキストから音声情報を生成することが不可能であると判定した場合には、通信手段107の通信モードをテキスト送信から音声情報の送信に切り換える(S107)。
センタサーバ100は、音声情報を合成可能な音声合成手段102によって、テキストに基づいて音声合成を行う。そして、センタサーバ100は、合成された音声情報を送信する。音声情報送信後、センタサーバ100は、本処理を終了する。
次に、本実施の形態の車載用情報端末200の処理について説明する。
図4は、本実施の形態に係る車載用情報端末200の処理フローチャートである。
車載用情報端末200は、センタサーバ100から送信された情報を受信する(図4におけるステップ201、以下S201のように省略する)。
車載用情報端末200は、受信した情報が、音声情報に関するテキスト形式のファイル(以下テキストと省略する)か否かを判定する(S202)。
このS202によって、受信した情報がテキストであった場合には、車載用情報端末2
00は、このテキストに基づいて、音声合成エンジン203が音声合成データベース204を参照して音声合成を行う(S203)。音声合成処理終了後、車載用情報端末200は、本処理を終了する。
00は、このテキストに基づいて、音声合成エンジン203が音声合成データベース204を参照して音声合成を行う(S203)。音声合成処理終了後、車載用情報端末200は、本処理を終了する。
また、S202によって、受信した情報がテキストではなかった場合には、車載用情報端末200は、受信した情報が音声合成データベース204に格納される音声合成情報の追加情報であるか否かを判定する(S204)。
このS204によって、受信した情報が音声合成情報の追加情報であった場合には、車載用情報端末200は、音声合成データベース204にこの音声合成情報の追加情報を格納する(S205)。
音声合成情報の追加情報を格納後、音声合成エンジン203は、音声合成データベース204の音声合成情報の追加情報を用いて音声合成を行い、音声情報を生成する(S206)。そして、音声情報生成後、車載用情報端末200は、本処理を終了する。
また、S204によって、受信した情報が音声合成情報の追加情報ではなかった場合には、車載用情報端末200は、その受信した情報が音声情報であると判定する。音声情報であった場合、車載用情報端末200は、受信した音声情報をそのまま出力する(S207)。音声情報出力後、車載用情報端末200は、本処理を終了する。
〈実施の形態の効果〉
本実施の形態に係る、センタサーバ100及び車載用情報端末200を備える音声合成システムを実現することにより、以下のような効果が得られる。
本実施の形態に係る、センタサーバ100及び車載用情報端末200を備える音声合成システムを実現することにより、以下のような効果が得られる。
本実施の形態に係るセンタサーバ100によれば、ユーザ側の車載用情報端末200の音声合成手段の処理能力が限られる場合であっても、センタサーバ100の複数の音声合成手段によって適切且つ高品質な音声情報を利用することができる。
また、本実施の形態に係るセンタサーバ100によれば、車載用情報端末200の音声合成の処理能力及び音声合成を行う文字情報の内容に応じて、音声合成に必要な音声合成情報をこの車載用情報端末200に提供することができる。
また、本実施の形態に係るセンタサーバ100によれば、車載用情報端末200の音声合成の処理能力及び音声合成を行う文字情報の内容に応じて、センタサーバ100側で合成した音声情報を車載用情報端末200に提供することができる。
〈変形例〉
本実施の形態において、本システムのサーバ及び情報処理端末は、主に車載用情報端末に対する音声認識処理の一例について説明したが、本発明ではこれに限らず、その他の音声合成システムに対して広く実施することができる。
本実施の形態において、本システムのサーバ及び情報処理端末は、主に車載用情報端末に対する音声認識処理の一例について説明したが、本発明ではこれに限らず、その他の音声合成システムに対して広く実施することができる。
例えば、本実施の形態に係る音声合成システムでは、本システムの情報処理端末は車載用情報端末200であったが、本発明ではこれに限定されない。すなわち、本発明の情報処理端末は、車載用以外の他の携帯情報端末(PDA)、各種携帯型電話機、あるいは既存のユーザ向けコンピュータなど、他のあらゆる情報処理装置の音声合成処理に適用することができる。
また、例えば、本実施の形態に係る音声合成システムにおいて、データベースに音声合成情報を追加するか否かの判断は、収録される語数に基づいてデータベース情報レベル1
05hを分類して判断したが、本発明ではこれに限定されない。例えば、本実施の形態の音声合成システムにおいて、スポーツ、政治、経済、あるいは道路情報に関する分野など、個々の音声合成データベースによって得意な(収録される語数が豊富であり、適切且つ高品質な音声合成可能である)文字情報の分野を定め、その分野に応じた音声合成データベースを端末に提供してもよい。
05hを分類して判断したが、本発明ではこれに限定されない。例えば、本実施の形態の音声合成システムにおいて、スポーツ、政治、経済、あるいは道路情報に関する分野など、個々の音声合成データベースによって得意な(収録される語数が豊富であり、適切且つ高品質な音声合成可能である)文字情報の分野を定め、その分野に応じた音声合成データベースを端末に提供してもよい。
本発明は、情報処理端末の音声合成を行う際に分散型音声認識を行う産業に適用可能である。
100 センタサーバ
101 CPU
102 音声合成手段
103 音声合成エンジン
104 音声合成データベース
105 クライアント音声合成データベース
106 音声認識サーバ
107 通信手段
200 車載用情報端末
201 CPU
202 音声合成手段
203 音声合成エンジン
204 音声合成データベース
205 音声入力手段
206 合成音声生成切換手段
207 音声認識クライアント
208 通信手段
300 ネットワーク
101 CPU
102 音声合成手段
103 音声合成エンジン
104 音声合成データベース
105 クライアント音声合成データベース
106 音声認識サーバ
107 通信手段
200 車載用情報端末
201 CPU
202 音声合成手段
203 音声合成エンジン
204 音声合成データベース
205 音声入力手段
206 合成音声生成切換手段
207 音声認識クライアント
208 通信手段
300 ネットワーク
Claims (7)
- 音声合成情報を用いて、文字情報を音声情報に合成する音声合成手段を有する情報処理端末と接続するサーバであり、
前記情報処理端末が有する音声合成情報により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成情報判定手段と、
前記情報処理端末側の音声合成情報によって音声情報への合成が可能ではない場合に、前記情報処理端末に提供する音声合成情報を選択する、そのような音声合成情報選択手段と、
前記音声合成情報が提供された場合に、前記情報処理端末が有する音声合成手段により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成手段判定手段と、
前記情報処理端末に提供する音声合成情報を、この情報処理端末に送信する情報送信手段と、
前記情報処理端末側の音声合成手段によって音声合成が可能ではない場合に、前記文字情報に基づく音声情報の合成を行う、音声合成手段と、
前記音声合成手段が合成した音声情報を送信する音声情報送信手段と、を備えるサーバ。 - 前記サーバに接続する個々の情報処理端末に関する情報である、端末情報を格納する端末情報データベースをさらに備え、
前記音声合成情報判定手段が、前記端末情報データベースを参照して端末側の音声合成情報による音声合成可能であるか否かを判定し、
前記音声合成手段判定手段が、前記端末情報データベースを参照して端末側の音声合成手段による音声合成可能であるか否かを判定する、請求項1に記載のサーバ。 - 文字情報を音声情報に合成するための音声合成情報を格納する音声合成データベースと、
音声情報に合成される文字情報、前記音声合成データベースに追加される音声合成情報、または前記文字情報から合成された音声情報を受信する手段と、
前記文字情報を受信したときに、前記音声合成データベースを参照し、前記音声合成情報により前記受信した文字情報を音声情報に合成する、そのような音声合成手段と、
前記音声合成情報を受信したときに、その音声合成情報を前記音声合成データベースに追加する手段と、
前記合成される音声情報、または受信した音声情報を出力する手段と、を備える情報処理端末。 - 音声合成情報を用いて、文字情報を音声情報に合成する音声合成手段を有する情報処理端末と接続するコンピュータに実行させるプログラムであり、
前記情報処理端末が有する音声合成情報により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成情報判定ステップと、
前記情報処理端末側の音声合成情報によって音声情報への合成が可能ではない場合に、前記情報処理端末に提供する音声合成情報を選択する、そのような音声合成情報選択ステップと、
前記音声合成情報が提供された場合に、前記情報処理端末が有する音声合成手段により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成手段判定ステップと、
前記情報処理端末に提供する音声合成情報を、この情報処理端末に送信する情報送信ステップと、
前記情報処理端末側の音声合成手段によって音声合成が可能ではない場合に、前記文字
情報に基づく音声情報の合成を行う、音声合成ステップと、
前記音声合成手段が合成した音声情報を送信する音声情報送信ステップと、をコンピュータに実行させる音声合成プログラム。 - 前記サーバに接続する個々の情報処理端末に関する情報である、端末情報を格納する端末情報データベースを参照して端末側の音声合成情報による音声合成可能であるか否かを判定するステップと、
前記端末情報データベースを参照して端末側の音声合成手段による音声合成可能であるか否かを判定するステップと、をさらにコンピュータに実行させる、請求項4に記載の音声合成プログラム。 - 音声情報に合成される文字情報、文字情報を音声情報に合成するための音声合成情報を格納する音声合成データベースに追加される音声合成情報、または前記文字情報から合成された音声情報を受信するステップと、
前記文字情報を受信したときに、前記音声合成データベースを参照し、前記音声合成情報により前記受信した文字情報を音声情報に合成する、そのような音声合成ステップと、
前記音声合成情報を受信したときに、その音声合成情報を前記音声合成データベースに追加するステップと、
前記合成される音声情報、または受信した音声情報を出力するステップと、をコンピュータに実行させる、音声合成プログラム。 - 音声合成情報を用いて、文字情報を音声情報に合成する音声合成手段を有する情報処理端末と、その情報処理端末と接続するサーバとを有する音声合成システムであり、
前記サーバが、
前記情報処理端末が有する音声合成情報により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成情報判定手段と、
前記情報処理端末側の音声合成情報によって音声情報への合成が可能ではない場合に、前記情報処理端末に提供する音声合成情報を選択する、そのような音声合成情報選択手段と、
前記音声合成情報が提供された場合に、前記情報処理端末が有する音声合成手段により、前記文字情報の音声情報への合成が可能であるか否かを判定する、そのような音声合成手段判定手段と、
前記情報処理端末に提供する音声合成情報を、この情報処理端末に送信する情報送信手段と、
前記情報処理端末側の音声合成手段によって音声合成が可能ではない場合に、前記文字情報に基づく音声情報の合成を行う、音声合成手段と、
前記音声合成手段が合成した音声情報を送信する音声情報送信手段と、を備え、
前記情報処理端末が、
文字情報を音声情報に合成するための音声合成情報を格納する音声合成データベースと、
音声情報に合成される文字情報、前記音声合成データベースに追加される音声合成情報、または前記文字情報から合成された音声情報を受信する手段と、
前記文字情報を受信したときに、前記音声合成データベースを参照し、前記音声合成情報により前記受信した文字情報を音声情報に合成する、そのような音声合成手段と、
前記音声合成情報を受信したときに、その音声合成情報を前記音声合成データベースに追加する手段と、
前記合成される音声情報、または受信した音声情報を出力する手段と、を備える音声合成システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003285251A JP2005055607A (ja) | 2003-08-01 | 2003-08-01 | サーバ、情報処理端末、音声合成システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003285251A JP2005055607A (ja) | 2003-08-01 | 2003-08-01 | サーバ、情報処理端末、音声合成システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005055607A true JP2005055607A (ja) | 2005-03-03 |
Family
ID=34364940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003285251A Withdrawn JP2005055607A (ja) | 2003-08-01 | 2003-08-01 | サーバ、情報処理端末、音声合成システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005055607A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009520224A (ja) * | 2005-12-20 | 2009-05-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声アプリケーションを処理する方法、サーバー、クライアント装置、コンピュータ読み取り可能な記録媒体(マークアップを介する音声アプリケーションの処理の共有) |
JP2010048959A (ja) * | 2008-08-20 | 2010-03-04 | Denso Corp | 音声出力システム及び車載装置 |
JP2011022813A (ja) * | 2009-07-16 | 2011-02-03 | National Institute Of Information & Communication Technology | 音声翻訳システム、辞書サーバ装置、およびプログラム |
JP2012173702A (ja) * | 2011-02-24 | 2012-09-10 | Denso Corp | 音声案内システム |
WO2015111256A1 (ja) * | 2014-01-24 | 2015-07-30 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
WO2017008426A1 (zh) * | 2015-07-15 | 2017-01-19 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
-
2003
- 2003-08-01 JP JP2003285251A patent/JP2005055607A/ja not_active Withdrawn
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009520224A (ja) * | 2005-12-20 | 2009-05-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声アプリケーションを処理する方法、サーバー、クライアント装置、コンピュータ読み取り可能な記録媒体(マークアップを介する音声アプリケーションの処理の共有) |
US9330668B2 (en) | 2005-12-20 | 2016-05-03 | International Business Machines Corporation | Sharing voice application processing via markup |
JP2010048959A (ja) * | 2008-08-20 | 2010-03-04 | Denso Corp | 音声出力システム及び車載装置 |
JP2011022813A (ja) * | 2009-07-16 | 2011-02-03 | National Institute Of Information & Communication Technology | 音声翻訳システム、辞書サーバ装置、およびプログラム |
US9442920B2 (en) | 2009-07-16 | 2016-09-13 | National Institute Of Information And Communications Technology | Speech translation system, dictionary server, and program |
JP2012173702A (ja) * | 2011-02-24 | 2012-09-10 | Denso Corp | 音声案内システム |
WO2015111256A1 (ja) * | 2014-01-24 | 2015-07-30 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
JPWO2015111256A1 (ja) * | 2014-01-24 | 2017-03-23 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
WO2017008426A1 (zh) * | 2015-07-15 | 2017-01-19 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
US10115389B2 (en) | 2015-07-15 | 2018-10-30 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech synthesis method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7848924B2 (en) | Method, apparatus and computer program product for providing voice conversion using temporal dynamic features | |
KR100385925B1 (ko) | 멀티미디어 데이터 처리를 위한 디지털 휴대 전화 단말기 및 멀티미디어 데이터 콘텐츠의 실행 방법과 멀티미디어 데이터 콘텐츠 제공 방법 | |
RU2490821C2 (ru) | Портативное устройство связи и способ для медийно-расширенных сообщений | |
US8751239B2 (en) | Method, apparatus and computer program product for providing text independent voice conversion | |
JP2008211805A (ja) | 端末装置 | |
US8494497B2 (en) | Method for transmitting a haptic function in a mobile communication system | |
JP2001358602A (ja) | 文字情報受信装置 | |
CN112784112B (zh) | 报文校验方法及装置 | |
WO2007008050A1 (en) | System, apparatus and method for providing a flashcon in a instant messenger of a mobile device | |
JP2002291035A (ja) | 移動通信端末装置 | |
JP2005055607A (ja) | サーバ、情報処理端末、音声合成システム | |
CN103581857A (zh) | 一种语音提示的方法、语音合成服务器及终端 | |
CN102883016A (zh) | 车载消息传递 | |
CN108595141A (zh) | 语音输入方法及装置、计算机装置和计算机可读存储介质 | |
JP2003233386A (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP2006033817A (ja) | 携帯端末機のデータ伝送および出力装置、並びにその方法 | |
CN110931014A (zh) | 基于正则匹配规则的语音识别方法及装置 | |
US20060217982A1 (en) | Semiconductor chip having a text-to-speech system and a communication enabled device | |
US20110153194A1 (en) | Navigational gps voice directions via wirelessly delivered data audio files | |
KR100549757B1 (ko) | 텍스트 음성화 장치 및 그 방법과 이를 이용한 정보 제공시스템 | |
JP2007057571A (ja) | コンテンツリスト生成システム、コンテンツサーバ、車載装置 | |
JP4049456B2 (ja) | 音声情報利用システム | |
JPH11101652A (ja) | 電子メールデータ受信装置、電子メールホスト装置、これらのためのプログラムを記録した媒体、及び電子メールシステム | |
JP2004325688A (ja) | 音声認識システム | |
CN113159752A (zh) | 转账交易凭证生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20061003 |