JP2002032098A - 音声出力装置、音声出力システム、音声出力方法及び記憶媒体 - Google Patents

音声出力装置、音声出力システム、音声出力方法及び記憶媒体

Info

Publication number
JP2002032098A
JP2002032098A JP2000214140A JP2000214140A JP2002032098A JP 2002032098 A JP2002032098 A JP 2002032098A JP 2000214140 A JP2000214140 A JP 2000214140A JP 2000214140 A JP2000214140 A JP 2000214140A JP 2002032098 A JP2002032098 A JP 2002032098A
Authority
JP
Japan
Prior art keywords
voice
audio
output
text data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000214140A
Other languages
English (en)
Inventor
Hironori Goto
裕典 後藤
Hiroyuki Kimura
裕行 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000214140A priority Critical patent/JP2002032098A/ja
Priority to US09/891,389 priority patent/US7031924B2/en
Publication of JP2002032098A publication Critical patent/JP2002032098A/ja
Priority to US11/357,021 priority patent/US20060143012A1/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数のテキストデータの合成音声を重ね合わ
せて発声する場合、複数のテキストデータをそれぞれ異
なる種類の音声で音声合成し出力させることで、容易に
複数のテキストデータの音声を聞き分けることができる
音声出力装置、音声出力システム、音声出力方法及び記
憶媒体を提供する。 【解決手段】 テキストデータの音声波形を生成する音
声波形生成部209と、複数のテキストデータの音声出
力が重なり合うことを検知した場合は、それぞれのテキ
ストデータを違う性別(主性別、副性別)の音声で、或
いは別のスピーカから、或いは違う種類の音声で、或い
は違う高さの音声で出力させる音声出力部210とを具
備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声出力装置、音
声出力システム、音声出力方法及び記憶媒体に関し、特
に、テキストデータを合成音声に変換して出力する場合
に好適な音声出力装置、音声出力システム、音声出力方
法及び記憶媒体に関する。
【0002】
【従来の技術】従来、文字情報を音声出力する機能を有
する音声合成装置がある。従来の音声合成装置におい
て、音声出力するデータは、予め電子化されたテキスト
データとして準備されたものでなければならなかった。
即ち、そのテキストデータは、パーソナルコンピュータ
上におけるエディタやワードプロセッサなどで作成した
文章や、インターネット上のHTML(HyperText Mark
up Language)文章である。
【0003】また、音声合成装置から上記のようなテキ
ストデータを音声で出力する場合、1入力からのテキス
トデータを、音声合成装置に予め設定されている1種類
の音声で出力していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成装置においては、同時に複数のテキストデ
ータの入力を受け付け、更にそれらの合成音声出力を重
ね合わせて出力し、それらを聞き分けられるように出力
することができないという問題があった。
【0005】本発明は、上述した点に鑑みなされたもの
であり、複数のテキストデータの合成音声を重ね合わせ
て発声する場合、複数のテキストデータをそれぞれ異な
る種類の音声で音声合成し出力させることで、容易に複
数のテキストデータの音声を聞き分けることができる音
声出力装置、音声出力システム、音声出力方法及び記憶
媒体を提供することを第一の目的とする。
【0006】また、本発明は、複数のテキストデータの
合成音声を重ね合わせて発声する場合、複数のテキスト
データの音声をそれぞれ異なる発声手段で発声させるこ
とで、容易に複数のテキストデータの音声を聞き分ける
ことができる音声出力装置、音声出力システム、音声出
力方法及び記憶媒体を提供することを第二の目的とす
る。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の発明は、テキストデータを合成音声
に変換して出力する音声出力装置であって、前記テキス
トデータの音声波形を生成する音声波形生成手段と、複
数の前記テキストデータをそれぞれ異なる種類の音声で
音声合成し出力させる音声出力手段とを有することを特
徴とする。
【0008】上記目的を達成するため、請求項2記載の
発明は、前記異なる種類の音声は互いに周波数帯域が異
なることを特徴とする。
【0009】上記目的を達成するため、請求項3記載の
発明は、前記音声出力手段は、前記異なる種類の音声に
対応する複数種類の音声素片データを記憶する音声素片
記憶部と、前記異なる種類の音声に対応する処理パラメ
ータに従って前記音声素片データを処理し、合成音声を
生成する音声波形生成部とを有することを特徴とする。
【0010】上記目的を達成するため、請求項4記載の
発明は、前記処理パラメータは、周波数帯域と、音声レ
ベルと、音声速度のうちの少なくとも1つを含むことを
特徴とする。
【0011】上記目的を達成するため、請求項5記載の
発明は、前記異なる種類の音声は、互いに異なる性別に
対応する音声であることを特徴とする。
【0012】上記目的を達成するため、請求項6記載の
発明は、所定数の複数種類の音声のうち、任意の音声を
選択する選択手段を備え、前記音声出力手段は前記選択
された音声に従い合成音声を生成して出力することを特
徴とする。
【0013】上記目的を達成するため、請求項7記載の
発明は、前記異なる種類の音声は互いに高さが異なるこ
とを特徴とする。
【0014】上記目的を達成するため、請求項8記載の
発明は、前記音声出力手段は、所定数の複数種類の音声
を所定の順序で選択的に出力することを特徴とする。
【0015】上記目的を達成するため、請求項9記載の
発明は、前記異なる種類の音声は、互いに異なる年齢に
対応する音声であることを特徴とする。
【0016】上記目的を達成するため、請求項10記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置であって、前記テキストデータの音声波
形を生成する音声波形生成手段と、複数の前記テキスト
データの音声出力が重なり合うことを検知した場合は、
それぞれの音声を異なる発声手段から出力させる音声出
力手段とを有することを特徴とする。
【0017】上記目的を達成するため、請求項11記載
の発明は、使用する前記発声手段を任意に設定可能な設
定手段を有することを特徴とする。
【0018】上記目的を達成するため、請求項12記載
の発明は、インターネットを介して前記テキストデータ
で会話を行うシステムに適用可能であることを特徴とす
る。
【0019】上記目的を達成するため、請求項13記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置と、該音声出力装置に前記テキストデー
タを送信する外部装置とを具備してなる音声出力システ
ムであって、前記音声出力装置は、前記テキストデータ
の音声波形を生成する音声波形生成手段と、複数の前記
テキストデータをそれぞれ異なる種類の音声で音声合成
し出力させる音声出力手段とを有することを特徴とす
る。
【0020】上記目的を達成するため、請求項14記載
の発明は、前記異なる種類の音声は互いに周波数帯域が
異なることを特徴とする。
【0021】上記目的を達成するため、請求項15記載
の発明は、前記音声出力手段は、前記異なる種類の音声
に対応する複数種類の音声素片データを記憶する音声素
片記憶部と、前記異なる種類の音声に対応する処理パラ
メータに従って前記音声素片データを処理し、合成音声
を生成する音声波形生成部とを有することを特徴とす
る。
【0022】上記目的を達成するため、請求項16記載
の発明は、前記処理パラメータは、周波数帯域と、音声
レベルと、音声速度のうちの少なくとも1つを含むこと
を特徴とする。
【0023】上記目的を達成するため、請求項17記載
の発明は、前記異なる種類の音声は、互いに異なる性別
に対応する音声であることを特徴とする。
【0024】上記目的を達成するため、請求項18記載
の発明は、前記音声出力装置は、所定数の複数種類の音
声のうち、任意の音声を選択する選択手段を備え、前記
音声出力手段は前記選択された音声に従い合成音声を生
成して出力することを特徴とする。
【0025】上記目的を達成するため、請求項19記載
の発明は、前記異なる種類の音声は互いに高さが異なる
ことを特徴とする。
【0026】上記目的を達成するため、請求項20記載
の発明は、前記音声出力手段は、所定数の複数種類の音
声を所定の順序で選択的に出力することを特徴とする。
【0027】上記目的を達成するため、請求項21記載
の発明は、前記異なる種類の音声は、互いに異なる年齢
に対応する音声であることを特徴とする。
【0028】上記目的を達成するため、請求項22記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置と、該音声出力装置に前記テキストデー
タを送信する外部装置とを具備してなる音声出力システ
ムであって、前記音声出力装置は、前記テキストデータ
の音声波形を生成する音声波形生成手段と、複数の前記
テキストデータの音声出力が重なり合うことを検知した
場合は、それぞれの音声を異なる発声手段から出力させ
る音声出力手段とを有することを特徴とする。
【0029】上記目的を達成するため、請求項23記載
の発明は、前記音声出力装置は、使用する前記発声手段
を任意に設定可能な設定手段を有することを特徴とす
る。
【0030】上記目的を達成するため、請求項24記載
の発明は、インターネットを介して前記テキストデータ
で会話を行うシステムに適用可能であることを特徴とす
る。
【0031】上記目的を達成するため、請求項25記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置に適用される音声出力方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータをそれぞれ異なる種類
の音声で音声合成し出力させる音声出力工程とを有する
ことを特徴とする。
【0032】上記目的を達成するため、請求項26記載
の発明は、前記異なる種類の音声は互いに周波数帯域が
異なることを特徴とする。
【0033】上記目的を達成するため、請求項27記載
の発明は、前記音声出力工程は、前記異なる種類の音声
に対応する複数種類の音声素片データを記憶する音声素
片記憶工程と、前記異なる種類の音声に対応する処理パ
ラメータに従って前記音声素片データを処理し、合成音
声を生成する音声波形生成工程とを有することを特徴と
する。
【0034】上記目的を達成するため、請求項28記載
の発明は、前記処理パラメータは、周波数帯域と、音声
レベルと、音声速度のうちの少なくとも1つを含むこと
を特徴とする。
【0035】上記目的を達成するため、請求項29記載
の発明は、前記異なる種類の音声は、互いに異なる性別
に対応する音声であることを特徴とする。
【0036】上記目的を達成するため、請求項30記載
の発明は、所定数の複数種類の音声のうち、任意の音声
を選択する選択工程を有し、前記音声出力工程では前記
選択された音声に従い合成音声を生成して出力すること
を特徴とする。
【0037】上記目的を達成するため、請求項31記載
の発明は、前記異なる種類の音声は互いに高さが異なる
ことを特徴とする。
【0038】上記目的を達成するため、請求項32記載
の発明は、前記音声出力工程では、所定数の複数種類の
音声を所定の順序で選択的に出力することを特徴とす
る。
【0039】上記目的を達成するため、請求項33記載
の発明は、前記異なる種類の音声は、互いに異なる年齢
に対応する音声であることを特徴とする。
【0040】上記目的を達成するため、請求項34記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置に適用される音声出力方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータの音声出力が重なり合
うことを検知した場合は、それぞれの音声を異なる発声
手段から出力させる音声出力工程とを有することを特徴
とする。
【0041】上記目的を達成するため、請求項35記載
の発明は、使用する前記発声手段を任意に設定可能な設
定工程を有することを特徴とする。
【0042】上記目的を達成するため、請求項36記載
の発明は、インターネットを介して前記テキストデータ
で会話を行うシステムに適用可能であることを特徴とす
る。
【0043】上記目的を達成するため、請求項37記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置に適用される音声出力方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声出力方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータをそれぞれ異
なる種類の音声で音声合成し出力させるように制御する
音声出力ステップとを有することを特徴とする。
【0044】上記目的を達成するため、請求項38記載
の発明は、前記異なる種類の音声は互いに周波数帯域が
異なることを特徴とする。
【0045】上記目的を達成するため、請求項39記載
の発明は、前記音声出力ステップは、前記異なる種類の
音声に対応する複数種類の音声素片データを記憶するよ
うに制御する音声素片記憶ステップと、前記異なる種類
の音声に対応する処理パラメータに従って前記音声素片
データを処理し、合成音声を生成するように制御する音
声波形生成ステップとを有することを特徴とする。
【0046】上記目的を達成するため、請求項40記載
の発明は、前記処理パラメータは、周波数帯域と、音声
レベルと、音声速度のうちの少なくとも1つを含むこと
を特徴とする。
【0047】上記目的を達成するため、請求項41記載
の発明は、前記異なる種類の音声は、互いに異なる性別
に対応する音声であることを特徴とする。
【0048】上記目的を達成するため、請求項42記載
の発明は、所定数の複数種類の音声のうち、任意の音声
を選択する選択ステップを有し、前記音声出力ステップ
では前記選択された音声に従い合成音声を生成して出力
するように制御することを特徴とする。
【0049】上記目的を達成するため、請求項43記載
の発明は、前記異なる種類の音声は互いに高さが異なる
ことを特徴とする。
【0050】上記目的を達成するため、請求項44記載
の発明は、前記音声出力ステップでは、所定数の複数種
類の音声を所定の順序で選択的に出力するように制御す
ることを特徴とする。
【0051】上記目的を達成するため、請求項45記載
の発明は、前記異なる種類の音声は、互いに異なる年齢
に対応する音声であることを特徴とする。
【0052】上記目的を達成するため、請求項46記載
の発明は、テキストデータを合成音声に変換して出力す
る音声出力装置に適用される音声出力方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声出力方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータの音声出力が
重なり合うことを検知した場合は、それぞれの音声を異
なる発声手段から出力させるように制御する音声出力ス
テップとを有することを特徴とする。
【0053】上記目的を達成するため、請求項47記載
の発明は、使用する前記発声手段を任意に設定可能な設
定ステップを有することを特徴とする。
【0054】上記目的を達成するため、請求項48記載
の発明は、インターネットを介して前記テキストデータ
で会話を行うシステムに適用可能であることを特徴とす
る。
【0055】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて詳細に説明する。
【0056】[第1の実施の形態]本発明の第1の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきたと
き、先に音声出力中の性別の音声とは別の性別の音声で
次のテキストデータを読み上げるシステムである。
【0057】本実施形態では、音声出力に重なりがない
ときに、通常の性別として使用する性別を主性別と呼
び、音声が重なった場合に、次のテキストデータを読み
上げるために使用される、先に音声出力中の主性別とは
異なる性別を副性別と呼ぶ(図5参照)。但し、副性別
で音声出力中に次のテキストデータの音声出力を行うと
きは主性別で行う。
【0058】図1は本発明の第1の実施の形態に係る音
声合成装置の構成例を示すブロック図である。本発明の
第1の実施の形態に係る音声合成装置は、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、スピーカ112、描画部1
16を備えている。図中150はサーバコンピュータで
ある。
【0059】上記各部の構成を詳述すると、CPU10
1は、本装置全体の制御を行う中央演算処理装置であ
り、後述の図4のフローチャートに示す処理を実行す
る。ハードディスクコントローラ102は、ハードディ
スク103内のデータやプログラムの制御を行う。ハー
ドディスク103内には、プログラム113、音声波形
生成部(後述)において入力された漢字かな混じり文を
解析し読み情報を得る時に参照される漢字等の読みやア
クセント情報が登録されている辞書114、発声する文
字列に従って音声の素片を接続する際に必要になる音声
素片データ115が格納されている。この音声素片デー
タ115には、少なくとも男性の声の出力となる音声素
片データと、女性の声の出力となる音声素片データの2
種類の音声素片データが含まれている。これら2種類の
音声素片データは、性別に応じてその基本周波数が異な
っている。
【0060】キーボード104は、文字・数字・記号等
の入力に用いる。ポインティングデバイス105は、プ
ログラム開始などの指示に用いるものであり、例えばマ
ウスやディジタイザなどから構成されている。RAM1
06は、プログラムやデータを格納する。通信回線イン
ターフェイス107は、外部のサーバコンピュータ15
0との間でデータのやり取りを行う。本実施形態では通
信形態はTCP/IP(Transmission Control Protoco
l/Internet Protocol)を用いている。表示コントロー
ラ109は、VRAM108に格納された映像データを
映像信号としてモニタ110に出力する制御を行う。サ
ウンドカード111は、CPU101で生成されRAM
106に格納された音声波形データをスピーカ112を
通して出力している。116は描画部であり、CPU1
01の制御の下で、RAM106等を用いてモニタ11
0への表示画像データを生成する。
【0061】図2は本発明の第1の実施の形態に係る音
声合成装置のプログラムのモジュール関係を示す説明図
である。本発明の第1の実施の形態に係る音声合成装置
は、辞書114、音声素片データ115、メインルーチ
ン初期化部201、音声処理初期化部202、通信デー
タ処理部204、通信データ格納部206、表示文章デ
ータ格納部207、文章表示部208、音声波形生成部
209(音声波形生成手段)、音声出力部210(音声
出力手段)、初期化部203・受信部205を有する通
信処理部211、音響パラメータ212、出力パラメー
タ213を備えている。
【0062】上記各部の機能を詳述すると、本実施形態
のシステムが起動すると、先ず、メインルーチン220
のメインルーチン初期化部201にてプログラム全体の
初期化が行われる。次に、通信処理部211の初期化部
203にて通信部230の初期化が行われ、音声処理初
期化部202にて音声部240の初期化が行われる。本
実施形態では通信形態はTCP/IPを用いている。
【0063】通信処理部211の初期化部203にて通
信部230の初期化が終了すると、通信処理部211の
受信部205が起動し、サーバコンピュータ150から
音声合成装置に送信されるテキストデータを受信できる
ようになる。通信処理部211の受信部205にてテキ
ストデータを受信すると、受信されたテキストデータは
通信データ格納部206に格納される。
【0064】メインルーチン初期化部201にてメイン
ルーチン220全体の初期化が終了すると、通信データ
処理部204は通信データ格納部206の監視を開始す
る。受信されたテキストデータが通信データ格納部20
6に格納されると、通信データ処理部204はそのテキ
ストデータを読み込み、モニタ110に表示するための
表示文章を格納する表示文章データ格納部207にテキ
ストデータを格納する。
【0065】文章表示部208は、表示文章データ格納
部207にデータがあるのを検知すると、そのデータを
モニタ110に表示できる形態に変換して、VRAM1
08上に置く。この結果、モニタ110に表示文章が表
示されることになる。この際、テキストデータに何らか
の処理を施して表示文章とする場合は、その処理を通信
データ処理部204にて行う。
【0066】また、通信データ処理部204は、受信さ
れたテキストデータを音声波形生成部209に送り、音
声波形生成部209にてテキストデータの音声波形の生
成を行う。その際、テキストデータに何らかの処理を施
して音声波形を生成する場合は、その処理を通信データ
処理部204にて行う。音声波形生成部209にて辞書
114、音声素片データ115、音響パラメータ212
を参照しながら、受信したテキストデータの音声波形を
生成する。その処理の流れは図4を使って後で説明す
る。生成された波形はミキシング機能を持つ音声出力部
210に渡される。
【0067】図3は本発明の第1の実施の形態に係る音
声合成装置の音声出力部210の詳細構成を示す説明図
である。本発明の第1の実施の形態に係る音声合成装置
の音声出力部210は、一時蓄積部601、コントロー
ル部602、音声再生部604、ミキシング部605を
備えている。図中603は音声波形である。
【0068】上記各部の機能を詳述すると、一時蓄積部
601は、音声波形生成部209より送られてきた音声
波形603を一時的に蓄積する。コントロール部602
は、音声出力部210の全体をコントロールするもので
あり、常時、一時蓄積部601に音声波形603が送ら
れてきたかどうかをチェックしており、音声波形603
が送られてきた場合は、音声再生部604に送って音声
再生を開始する。
【0069】音声再生部604は、上記図2の出力パラ
メータ213から、音声出力に必要な予め設定されたパ
ラメータ(サンプリングレート、データのビット数等の
こと)に従って、音声波形603の再生を実行する。
【0070】尚、音声再生部604は少なくとも2つ以
上存在し、コントロール部602は、音声波形603が
送られてきた場合は、その時点で使用されていない音声
再生部604に音声波形603を送って、再生を実行す
る。また、音声再生部604をソフト的なプロセスとし
て構成し、コントロール部602は、音声波形603が
送られてくる毎に音声再生部604のプロセスを生成
し、音声波形603の再生が終わった時点で、その音声
再生部604のプロセスを消滅させるような構成であっ
ても構わない。
【0071】音声再生部604が出力する個々の音声デ
ータは、少なくとも2つ以上の入力部を持つミキシング
部605に送られ、ミキシング部605は音声データを
合成して、最終的な合成音声データを上記図1のスピー
カ112から出力する。この際、コントロール部602
は、ミキシング部605に送られる音声データの数に応
じて、ミキシングのレベル調整をミキシング部605に
対して行う。
【0072】また、コントロール部602は、音声波形
生成部209から、音声出力中かどうかの問い合わせを
受け、音声再生部604やミキシング部605の動作状
況を調べて、音声波形生成部209に結果を返す機能も
持っている。更に、コントロール部602は、音声波形
生成部209から、どの性別で出力中かどうかの問い合
わせを受け、音声再生部604で再生中の音声波形のデ
ータを調べて、音声波形生成部209に結果を返す機能
も持っている。
【0073】図22は本発明の音声出力方法を実行する
プログラム及び関連データが記憶媒体から装置に供給さ
れる概念例を示す説明図である。本発明の音声出力方法
を実行するプログラム及び関連データは、フロッピディ
スクやCD−ROM等の記憶媒体2201を装置220
2に装備された記憶媒体ドライブ挿入口2203に挿入
することで供給される。その後、プログラム及び関連デ
ータを記憶媒体2201から一旦ハードディスクにイン
ストールしハードディスクからRAMにロードするか、
或いはハードディスクにインストールせずに直接RAM
にロードすることで、プログラム及び関連データを実行
することが可能となる。
【0074】この場合、本発明の第1〜第4の実施の形
態に係る音声合成装置において本発明の音声出力方法を
実行するプログラムを実行する場合は、上記図22を参
照して説明したような手順で音声合成装置にプログラム
及び関連データを供給するか、或いは音声合成装置に予
めプログラム及び関連データを格納しておくことで、プ
ログラム実行が可能となる。
【0075】図21は本発明の音声出力方法を実行する
プログラム及び関連データを記憶した記憶媒体の記憶内
容の構成例を示す説明図である。記憶媒体は、例えばボ
リューム情報2101、ディレクトリ情報2102、プ
ログラム実行ファイル2103(図1や後述の図7の、
プログラム113に相当)、プログラム関連データファ
イル2104(図1や後述の図7の、辞書114、音声
素片データ115等に相当)等の記憶内容で構成され
る。本発明の音声出力方法を実行するプログラムは、後
述の図4(第1の実施の形態)、図10(第2の実施の
形態)、図13・図14(第3の実施の形態)、図17
・図18(第4の実施の形態)の各フローチャートに基
づきプログラムコード化されたものである。
【0076】次に、上記の如く構成された本発明の第1
の実施の形態に係る音声合成装置の動作を図4、図6を
参照しながら詳細に説明する。下記の処理は上記図1に
示したCPU101の制御のもとに実行される。
【0077】図4は音声合成装置の通信データ処理部2
04から音声波形生成部209に送られてきたテキスト
データを音声出力する処理を示す流れ図である。先ずス
テップS401で、音声出力部210のコントロール部
602に対して現在音声を出力中か問い合わせる。その
結果、音声を出力中でなければ、ステップS408に
て、音声の性別を主性別(例えば男性)に設定し、ステ
ップS404に進む。
【0078】上記ステップS401で現在音声を出力中
であれば、ステップS402にて、音声出力部210の
コントロール部602に対して現在出力中の音声が主性
別か副性別かを問い合わせ、現在出力中の音声が主性別
(例えば男性)ならば、ステップS403にて、音声の
性別を副性別(例えば女性)に設定する。上記ステップ
S402で現在出力中の音声が副性別(例えば女性)な
らば、ステップS408にて、音声の性別を主性別(例
えば男性)に設定する。
【0079】ステップS404にて、上記ステップS4
03もしくはステップS408で切り替えた音声の性別
の情報に合わせて、音声素片データ115の中から適切
な性別の音声素片データが選択される。ステップS40
5にて、辞書114を使ってテキストデータの言語解析
を行い、テキストデータの読みと音調成分を生成する。
更にステップS406にて、音響パラメータ212に収
納された予め設定された、声の高さ(周波数帯域)・ア
クセント(音声レベル)・発声速度等に関するパラメー
タのうち、ステップS403もしくはS408にて選択
された性別に応じたパラメータに従って、上記ステップ
S404にて選択されていた音声素片データと、上記ス
テップS405にて解析されたテキストデータの読みと
音調成分を使って音声波形を生成する。即ち、主性別が
選択された場合には主性別に対応したパラメータに従っ
て音声波形を生成し、副性別が選択された場合には副性
別に対応したパラメータに従って音声波形を生成する。
【0080】ステップS407にて、上記ステップS4
06で生成した音声波形を音声出力部210に渡して音
声出力を行う。音声波形が音声出力部210に送られる
と、音声再生部604の1つを使って音声の再生が行わ
れるが、音声再生部604にて現在再生中の音声がある
場合は、ミキシング部605にて現在再生中の音声に新
しく渡された音声がミキシングされて音声出力が行われ
ることになる。現在再生中の音声がない場合は、再生さ
れた音声はミキシング部605を通過するが、何の処理
もなされずにそのままの音声出力が行われることにな
る。
【0081】このように、複数の音声出力が重なり合う
ことを検知した時、これらの音声を性別の異なる音声で
出力することによって、複数の音声が重なっても容易に
聞き取れるようになる。
【0082】図5は音声合成装置における主性別での出
力音声と副性別での出力音声の時間的な関係を示す概念
図、図6は音声合成装置における主性別を設定する方法
を示す説明図である。
【0083】キーボード104またはPD105によ
り、音声出力設定画面の指示があると、CPU101は
描画部116を用いて図6に示す設定画面の画像データ
を生成し、表示コントローラ109によりモニタ110
上に表示する。
【0084】そして、ユーザは、PD105を用いて、
図6の設定画面(設定手段)の503で主性別を男性、
女性から選択する。「OK」ボタン501を押下するこ
とにより、上記図1のRAM106上に格納されている
主性別の変数が書き換えられ、選択が完了する。また、
「cancel」ボタン502を押下したときは、RA
M106上に格納されている主性別の変数が書き換えら
れず、選択は破棄されて性別設定モードは終了する。
尚、副性別は自動的に主性別の反対の性別が選択され
る。
【0085】以上説明したように、本発明の第1の実施
の形態に係る音声合成装置によれば、複数の音声出力の
重なり合いを検知し、それぞれの音声を違う性別の音声
で出力することで、聞き取りが容易になるという効果を
奏する。
【0086】本実施形態を用いれば、例えばインターネ
ットで接続された複数のユーザ端末同士がサーバコンピ
ュータを介してテキストデータで会話を行うチャットシ
ステムにおいて、サーバコンピュータから送られてきた
他のユーザの発言であるテキストデータを音声出力する
際に、複数のユーザからのテキストデータの音声出力が
重なり合う場合に聞き取りを容易にすることができると
いう効果を奏する。
【0087】[第2の実施の形態]本発明の第2の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきたと
き、先に出力中の合成音声と、次の合成音声の出力を、
それぞれ異なったスピーカで再生させるシステムであ
る。
【0088】即ち、音声出力に重なりがないときは、通
常、コンピュータに接続されている2つのステレオスピ
ーカの両方を使って出力し(2つのスピーカ両方で同じ
音声が再生される)、音声が重なった場合には、それぞ
れの音声が2つのスピーカの片方を使って出力する(片
方のスピーカから最初の音声が、もう片方のスピーカか
ら次の音声が再生される)(図11参照)。尚、本実施
形態では、2つ以上の音声が重ならない前提で考えてい
るが、3つ以上のスピーカを個別に再生できるシステム
であれば、第3の音声、第4の音声等が重なっても対応
することが可能である。
【0089】図7は本発明の第2の実施の形態に係る音
声合成装置の概略構成を示すブロック図である。本発明
の第2の実施の形態に係る音声合成装置は、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、右用スピーカ112R・左
用スピーカ112Lを有するスピーカ112(発声手
段)、描画部116を備えている。
【0090】第2の実施の形態における上記第1の実施
の形態との相異点を説明すると、CPU101は、後述
の図10のフローチャートに示す処理を実行する。サウ
ンドカード111は、CPU101で生成されRAM1
06に格納された音声波形データを、スピーカ112
(右用スピーカ112R、左用スピーカ112L)を通
して出力している。尚、音声合成装置の他の構成は上記
第1の実施の形態と同様であり、説明を省略する。
【0091】図8は本発明の第2の実施の形態に係る音
声合成装置のプログラムのモジュール関係を示す説明図
である。本発明の第2の実施の形態に係る音声合成装置
のプログラムモジュールは、辞書114、音声素片デー
タ115、メインルーチン初期化部201、音声処理初
期化部202、通信データ処理部204、通信データ格
納部206、表示文章データ格納部207、文章表示部
208、音声波形生成部209(音声波形生成手段)、
音声出力部210(音声出力手段)、初期化部203・
受信部205を有する通信処理部211、音響パラメー
タ212、出力パラメータ213を備えている。
【0092】第2の実施の形態における上記第1の実施
の形態との相異点を説明すると、音声波形生成部209
から音声出力部210へ入力される信号が1つとなって
いる点と、音声出力の重なりを検出し、それに対するア
クションつまりスピーカの出力を変更する制御はすべて
音声出力部210で行われる点である。音声合成装置の
プログラムモジュールの他の構成は上記第1の実施の形
態と同様であり、説明を省略する。
【0093】図9は本発明の第2の実施の形態に係る音
声合成装置のプログラムのモジュールにおける音声出力
部210の詳細構成を示す説明図である。本発明の第2
の実施の形態に係る音声合成装置の音声出力部210
は、一時蓄積部601、コントロール部602、音声再
生部604、ミキシング部605を備えている。
【0094】第2の実施の形態における上記第1の実施
の形態との相異点を説明すると、音声再生部604は2
つ存在し、コントロール部602は、音声波形603が
送られてきた場合は、その時点で使用されていない音声
再生部604に音声波形603を送って、再生を実行す
る。音声再生部604が出力する個々の音声データは、
2つの入力部を持つミキシング部605に送られ、ミキ
シング部605は音声データを合成して、最終的な合成
音声データを上記図7に示したスピーカ112(右用ス
ピーカ112R、左用スピーカ112L)から出力す
る。
【0095】この際、ミキシング部605は、スピーカ
112の2つのスピーカ112R、112Lに出力する
音声をスピーカ毎にコントロールすることが可能であ
り、コントロール部602は、このスピーカ出力のコン
トロールをミキシング部605に対して行えるようにな
っている。音声出力部210の他の構成は上記第1の実
施の形態と同様であり、説明を省略する。
【0096】尚、本システムでは、スピーカを2つ使用
しているので、最大2つの音声を同時に再生できるが、
3つ以上のスピーカを個別にコントロールできるシステ
ムにおいては、その制御できるスピーカの数まで、音声
が重なっても対応することが可能である。
【0097】次に、上記の如く構成された本発明の第2
の実施の形態に係る音声合成装置の動作を図10、図1
2を参照しながら詳細に説明する。下記の処理は上記図
7に示したCPU101の制御のもとに実行される。
【0098】図10は音声合成装置の音声波形生成部2
09より音声波形が音声出力部210に送られてきた時
から音声を出力するまでの処理を示す流れ図である。先
ずステップS1001で、音声出力部210のコントロ
ール部602は音声再生部604の動作状態を調べて、
現在音声を出力中かどうかを確認する。その結果、音声
を出力中でなければ、ステップS1008で、コントロ
ール部602は、この音声を両方のスピーカ112R、
112Lを使って再生することをミキシング部605に
指示して、音声の再生を実行する。
【0099】上記ステップS1001で現在音声1つが
出力中であれば、ステップS1002に進んで、コント
ロール部602は、現在音声再生中の音声を第1のスピ
ーカ(112Rまたは112L)で再生し、次の音声を
第2のスピーカ(112Lまたは112R)で再生する
ように、ミキシング部605に指示して、音声の再生を
実行する。尚、上記ステップS1001で既に2つの音
声再生が実行されている場合は、再度ステップS100
1に戻って、出力中の音声が1つ以下になるまで待つよ
うになっている。
【0100】上記ステップS1002で2つの音声再生
を開始した後は、ステップS1003に進んで、どちら
かの音声再生が終了するのを待つ。どちらかの音声再生
が終了した時は、ステップS1004で、コントロール
部602は、残った再生中の音声を両方のスピーカ11
2R、112Lを使って再生することをミキシング部6
05に指示して、音声の再生を実行する。
【0101】このように、2つの音声出力が重なり合う
ことを検知した時、それぞれの音声を違うスピーカ11
2R、112Lで出力することによって、2つの音声が
重なっても容易に聞き取れるようになる。
【0102】尚、3つ以上のスピーカを個別に再生でき
るシステムであれば、音声出力が重なった条件に応じ
て、スピーカを割り当てるように設定すれば、3種類以
上の音声が重なっても聞き取ることが可能となる。
【0103】図11は音声合成装置における両方のスピ
ーカでの再生音声と別々のスピーカでの再生音声の時間
的な関係を示す概念図、図12は音声合成装置における
スピーカの設定を行う方法を示す説明図である。
【0104】キーボード104またはPD105によ
り、音声出力設定画面の指示があると、CPU101は
描画部116を用いて図12に示す設定画面の画像デー
タを生成し、表示コントローラ109によりモニタ11
0上に表示する。
【0105】そして、ユーザは、PD105を用いて、
図12の設定画面(設定手段)の503で、音声が重な
った時に最初の音声を出力するスピーカを選択し、「O
K」ボタン501を押下することにより、上記図1のR
AM106上に格納されている最初の音声用のスピーカ
の設定の変数が書き換えられ、選択が完了する。
【0106】この時、次の音声を出力するスピーカは、
自動的にもう1つのスピーカに設定される。また、「c
ancel」ボタン502を押下したときは、RAM1
06上に格納されているスピーカの設定の変数が書き換
えられず、選択は破棄されてスピーカ設定モードは終了
する。尚、3つ以上のスピーカを設定できる場合は、上
記503と同じ形式で次の音声用のスピーカ等が選択で
きるようになっていればよい。
【0107】以上説明したように、本発明の第2の実施
の形態に係る音声合成装置によれば、2つの音声出力が
重なり合うのを検知し、それぞれの音声を別のスピーカ
112R、112Lで出力することで、聞き取りが容易
になるという効果を奏する。
【0108】本実施形態を用いれば、例えばインターネ
ットで接続された複数のユーザ端末同士がサーバコンピ
ュータを介してテキストデータで会話を行うチャットシ
ステムにおいて、サーバコンピュータから送られてきた
他のユーザの発言であるテキストデータを音声出力する
際に、複数のユーザからのテキストデータの音声出力が
重なり合う場合に聞き取りを容易にすることができると
いう効果を奏する。
【0109】[第3の実施の形態]本発明の第3の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきたと
き、先に音声出力中の音声とは別の種類の音声で次のテ
キストデータを読み上げるシステムである。
【0110】本実施形態では、音声出力に重なりがない
ときに、通常に使用される音声を第1音声と呼び、音声
が重なった場合に、次のテキストデータを読み上げるた
めに使用される、先に音声出力中の第1音声とは種類が
異なる音声を第2音声と呼ぶ(図15参照)。本実施形
態では、2つ以上の音声が重ならない前提で考えている
が、更に音声が重なることが予想される場合は、第3音
声、第4音声と用意しておけばよい。
【0111】本発明の第3の実施の形態に係る音声合成
装置は、上記第1の実施の形態と同様に、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、スピーカ112、描画部1
16を備えている(上記図1参照)。
【0112】第3の実施の形態における上記第1の実施
の形態との相異点を説明すると、CPU101は、後述
の図13、図14のフローチャートに示す処理を実行す
る。音声素片データ115には、少なくとも声の性質が
異なる2種類の音声素片データ(例えば、子供の声の音
声素片データと、老人の声の音声素片データ)が含まれ
ている。これらの音声素片データも、声の性質に対応し
た基本周波数を持つものである。そして、どちらかの声
(例えば子供の声)が第1音声、他方の声(例えば老人
の声)が第2音声として設定されているものとする。音
声合成装置の他の構成は上記第1の実施の形態と同様で
あり、説明を省略する。
【0113】また、本発明の第3の実施の形態に係る音
声合成装置は、上記第1の実施の形態と同様に、辞書1
14、音声素片データ115、メインルーチン初期化部
201、音声処理初期化部202、通信データ処理部2
04、通信データ格納部206、表示文章データ格納部
207、文章表示部208、音声波形生成部209(音
声波形生成手段)、音声出力部210(音声出力手
段)、初期化部203・受信部205を有する通信処理
部211、音声素片データ115、音響パラメータ21
2、出力パラメータ213を備えている(上記図2参
照)。音声合成装置のプログラムモジュールの各部の構
成は上記第1の実施の形態と同様であり、説明を省略す
る。
【0114】また、本発明の第3の実施の形態に係る音
声合成装置の音声出力部210は、上記第1の実施の形
態と同様に、一時蓄積部601、コントロール部60
2、音声再生部604、ミキシング部605を備えてい
る(上記図3参照)。
【0115】第3の実施の形態における上記第1の実施
の形態との相異点を説明すると、音声再生部604は少
なくとも2つ以上(実際は、同時に合成が予想される数
だけ必要)存在し、コントロール部602は、音声波形
603が送られてきた場合は、その時点で使用されてい
ない音声再生部604に音声波形603を送って、再生
を実行する。音声再生部604が出力する個々の音声デ
ータは、少なくとも2つ以上(実際は、同時に合成が予
想される数だけ必要)の入力部を持つミキシング部60
5に送られ、ミキシング部605は音声データを合成し
て、最終的な合成音声データを上記図1に示したスピー
カ112から出力する。
【0116】また、コントロール部602は、音声波形
生成部209から、どの音声で出力中かどうかの問い合
わせを受け、使用中の全ての音声再生部604で再生中
の音声波形のデータを調べて、音声波形生成部209に
結果を返す機能も持っている。音声出力部210の他の
構成は上記第1の実施の形態と同様であり、説明を省略
する。
【0117】次に、上記の如く構成された本発明の第3
の実施の形態に係る音声合成装置の動作を図13、図1
4、図16を参照しながら詳細に説明する。下記の処理
は上記図1に示したCPU101の制御のもとに実行さ
れる。
【0118】図13は音声合成装置の通信データ処理部
204から音声波形生成部209に送られてきたテキス
トデータを音声出力する処理を示す流れ図である。先ず
ステップS1301で、音声出力部210のコントロー
ル部602に対して現在音声を出力中か問い合わせる。
その結果、音声を出力中でなければ、ステップS130
8にて、音声の種類を第1音声(例えば子供の声)に設
定し、ステップS1304に進む。
【0119】上記ステップS1301で現在音声を出力
中であれば、ステップS1302にて、音声出力部21
0のコントロール部602に対して現在出力中の音声の
種類を問い合わせ、現在出力中の音声に第1音声が含ま
れていないならば、ステップS1308にて、音声の種
類を第1音声(例えば子供の声)に設定する。それ以外
の場合は、ステップS1303にて、音声の種類を第2
音声(例えば老人の声)に設定する。
【0120】ステップS1304にて、上記ステップS
1303もしくはステップS1308で切り替えた音声
の種類の情報に合わせて、音声素片データ115の中か
ら適切な種類の音声素片データが選択される。ステップ
S1305にて、辞書114を使ってテキストデータの
言語解析を行い、テキストデータの読みと音調成分を生
成する。更にステップS1306にて、音響パラメータ
212に収納された予め設定された、声の高さ・アクセ
ント・発声速度等に関するパラメータのうち、選択され
た音声の種類に対応したパラメータに従って、上記ステ
ップS1304にて選択されていた音声素片データと、
上記ステップS1305にて解析されたテキストデータ
の読みと音調成分を使って音声波形を生成する。
【0121】ステップS1307にて、上記ステップS
1306で生成した音声波形を音声出力部210に渡し
て音声出力を行う。音声波形が音声出力部210に送ら
れると、音声再生部604の1つを使って音声の再生が
行われるが、音声再生部604にて現在再生中の音声が
ある場合は、ミキシング部605にて現在再生中の音声
に新しく渡された音声がミキシングされて音声出力が行
われることになる。現在再生中の音声がない場合は、再
生された音声はミキシング部605を通過するが、何の
処理もなされずにそのままの音声出力が行われることに
なる。
【0122】このように、複数の音声出力が重なり合う
ことを検知した時、それぞれの音声を違う種類の音声で
出力することによって、複数の音声が重なっても容易に
聞き取れるようになる。
【0123】尚、3種類以上の音声が重なる可能性があ
るため、第3音声以降の音声も設定している場合は、図
14に示すように、ステップS1403で、出力中でな
い優先順位の高い音声を選択すればよい(図14で、ス
テップS1403以外の部分は上記図13と全く同一の
処理を行うので、繰り返しの説明は省略する)。
【0124】図15は音声合成装置における第1音声で
の出力音声と第2音声での出力音声の時間的な関係を示
す概念図、図16は音声合成装置における音声の種類を
設定する方法を示す説明図である。
【0125】キーボード104またはPD105によ
り、音声出力設定画面の指示があると、CPU101は
描画部116を用いて図16に示す設定画面の画像デー
タを生成し、表示コントローラ109によりモニタ11
0上に表示する。
【0126】そして、ユーザは、PD105を用いて、
図16の設定画面(設定手段)の503で、登録されて
いる音声の中から第1音声とする音声を選択し、設定画
面の504で、登録されている音声の中から第2音声と
する音声を選択する。「OK」ボタン501を押下する
ことにより、上記図1のRAM106上に格納されてい
る第1音声、第2音声設定の変数が書き換えられ、選択
が完了する。
【0127】また、「cancel」ボタン502を押
下したときは、RAM106上に格納されている第1音
声、第2音声設定の変数が書き換えられず、選択は破棄
されて音声の種類の設定モードは終了する。尚、第3音
声以降の音声がある場合は、上記503、504と同じ
形式で第3音声等が選択できるようになっていればよ
い。
【0128】以上説明したように、本発明の第3の実施
の形態に係る音声合成装置によれば、複数の音声出力の
重なり合いを検知し、それぞれの音声を違う種類の音声
で出力することで、聞き取りが容易になるという効果を
奏する。
【0129】本実施形態を用いれば、例えばインターネ
ットで接続された複数のユーザ端末同士がサーバコンピ
ュータを介してテキストデータで会話を行うチャットシ
ステムにおいて、サーバコンピュータから送られてきた
他のユーザの発言であるテキストデータを音声出力する
際に、複数のユーザからのテキストデータが重なり合う
場合に聞き取りを容易にすることができるという効果を
奏する。
【0130】[第4の実施の形態]本発明の第4の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきたと
き、先に音声出力中の音声とは別の声の高さで次のテキ
ストデータを読み上げるシステムである。
【0131】本実施形態では、音声出力に重なりがない
ときに、通常に使用される音声を第1の高さの音声と呼
び、音声が重なった場合に、次のテキストデータを読み
上げるために使用される、先に音声出力中の第1の高さ
の音声とは異なる音声を第2の高さの音声と呼ぶ(図1
9参照)。本実施形態では、2つ以上の音声が重ならな
い前提で考えているが、更に音声が重なることが予想さ
れる場合は、第3の高さの音声、第4の高さの音声等を
用意しておけばよい。
【0132】本発明の第4の実施の形態に係る音声合成
装置は、上記第3の実施の形態と同様に、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、スピーカ112を備えてい
る(上記図1参照)。
【0133】第4の実施の形態における上記第3の実施
の形態との相異点を説明すると、CPU101は、後述
の図17、図18のフローチャートに示す処理を実行す
る。音声合成装置の他の構成は上記第3の実施の形態と
同様であり、説明を省略する。
【0134】また、本発明の第4の実施の形態に係る音
声合成装置は、上記第2の実施の形態と同様に、辞書1
14、音声素片データ115、メインルーチン初期化部
201、音声処理初期化部202、通信データ処理部2
04、通信データ格納部206、表示文章データ格納部
207、文章表示部208、音声波形生成部209(音
声波形生成手段)、音声出力部210(音声出力手
段)、初期化部203・受信部205を有する通信処理
部211、音声素片データ115、音響パラメータ21
2、出力パラメータ213を備えている(上記図8参
照)。音声合成装置のプログラムモジュールの各部の構
成は上記第2の実施の形態と同様であり、説明を省略す
る。
【0135】また、本発明の第4の実施の形態に係る音
声合成装置の音声出力部210は、上記第3の実施の形
態と同様に、一時蓄積部601、コントロール部60
2、音声再生部604、ミキシング部605を備えてい
る(上記図3参照)。
【0136】第4の実施の形態における上記第3の実施
の形態との相異点を説明すると、音声再生部604は、
コントロール部602の指示に従って再生時の声の高さ
を自由に調整できる機能を持っている。声の高さの調整
は、例えば声を高い声にしたい場合は、再生される声の
周波数成分のうち、高い音の周波数領域を強く出し、そ
の他の周波数領域を弱くすることによって可能となる。
また、音声出力の重なりを検出し、それに対するアクシ
ョンつまり声の高さを変更する制御はすべて音声出力部
210で行われる。音声出力部210の他の構成は上記
第3の実施の形態と同様であり、説明を省略する。
【0137】次に、上記の如く構成された本発明の第4
の実施の形態に係る音声合成装置の動作を図17、図1
8、図20を参照しながら詳細に説明する。下記の処理
は上記図1に示したCPU101の制御のもとに実行さ
れる。
【0138】図17は音声合成装置の音声波形生成部2
09より音声波形が音声出力部210に送られてきた時
から音声を出力するまでの処理を示す流れ図である。先
ずステップS1701で、音声出力部210のコントロ
ール部602は、音声再生部604の動作状態を調べ
て、現在音声を出力中かどうかを確認する。その結果、
音声を出力中でなければ、ステップS1708にて、音
声を第1の高さの音声に設定し、ステップS1704に
進む。
【0139】上記ステップS1701で現在音声を出力
中であれば、ステップS1702にて、コントロール部
602は現在音声再生中の音声再生部604に対して現
在出力中の音声の高さを問い合わせ、その結果、現在再
生中の音声に第1の高さの音声が含まれていないなら
ば、ステップS1708にて、音声を第1の高さの音声
に設定する。それ以外の場合は、ステップS1703に
て、音声を第2の高さの音声に設定する。
【0140】ステップS1704では、音声再生部60
4の1つを使って音声波形の再生を行うのであるが、こ
こで上記ステップS1703もしくはステップS170
8で設定した音声の高さの情報に合わせて、音声の高さ
を調整して再生を実行する。再生された音声は、ステッ
プS1705で、音声のミキシングが行われ、最終的な
音声の出力となる。この際、音声再生部604にて現在
再生中の他の音声がある場合は、ミキシング部605
で、現在再生中の音声に新しく再生された音声がミキシ
ングされて音声出力が行われることになる。現在再生中
の音声がない場合は、再生された音声はミキシング部6
05を通過するが、何の処理もなされずにそのままの音
声出力が行われることになる。
【0141】このように、複数の音声出力が重なり合う
ことを検知した時、それぞれの音声を違う高さの音声で
出力することによって、複数の音声が重なっても容易に
聞き取れるようになる。
【0142】尚、3種類以上の音声が重なる可能性があ
るため、第3の高さ以降の音声も設定している場合は、
図18に示すように、ステップS1803で、出力中で
ない優先順位の高い音声を選択すればよい(図18で、
ステップS1803以外の部分は上記図17と全く同一
の処理を行うので、繰り返しの説明は省略する)。
【0143】図19は音声合成装置における第1の高さ
の音声での出力音声と第2の高さの音声での出力音声の
時間的な関係を示す概念図、図20は音声合成装置にお
ける音声の高さを設定する方法を示す説明図である。
【0144】キーボード104またはPD105によ
り、音声出力設定画面の指示があると、CPU101は
描画部116を用いて図20に示す設定画面の画像デー
タを生成し、表示コントローラ109によりモニタ11
0上に表示する。
【0145】そして、ユーザは、PD105を用いて、
図20の設定画面(設定手段)の503で、登録されて
いる音声の中から第1の高さの音声を選択し、設定画面
の504で、登録されている音声の中から第2の高さの
音声を選択する。「OK」ボタン501を押下すること
により、上記図1のRAM106上に格納されている第
1の高さの音声、第2の高さの音声の設定の変数が書き
換えられ、選択が完了する。
【0146】また、「cancel」ボタン502を押
下したときは、RAM106上に格納されている第1の
高さの音声、第2の高さの音声の設定の変数が書き換え
られず、選択は破棄されて音声の高さの設定モードは終
了する。尚、第3の高さ以降の音声がある場合は、上記
503、504と同じ形式で第3の高さの音声等が選択
できるようになっていればよい。
【0147】以上説明したように、本発明の第4の実施
の形態に係る音声合成装置によれば、複数の音声出力の
重なり合いを検知し、それぞれの音声を違う高さの音声
で出力することで、聞き取りが容易になるという効果を
奏する。
【0148】本実施形態を用いれば、例えばインターネ
ットで接続された複数のユーザ端末同士がサーバコンピ
ュータを介してテキストデータで会話を行うチャットシ
ステムにおいて、サーバコンピュータから送られてきた
他のユーザの発言であるテキストデータを音声出力する
際に、複数のユーザからのテキストデータが重なり合う
場合に聞き取りを容易にすることができるという効果を
奏する。
【0149】[他の実施の形態]上述した本発明の実施
の形態においては、インターネットを利用してテキスト
データで会話を行うチャットシステムに本発明を適用し
た例を上げたが、インターネット以外の他の通信媒体を
利用してテキストデータで会話を行うシステムにも本発
明を適用可能である。
【0150】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器からなる装置に適用
してもよい。上述した実施形態の機能を実現するソフト
ウエアのプログラムコードを記憶した記憶媒体を、シス
テム或いは装置に供給し、そのシステム或いは装置のコ
ンピュータ(またはCPUやMPU)が記憶媒体等の媒
体に格納されたプログラムコードを読み出し実行するこ
とによっても、達成されることは言うまでもない。
【0151】この場合、記憶媒体等の媒体から読み出さ
れたプログラムコード自体が上述した実施形態の機能を
実現することになり、そのプログラムコードを記憶した
記憶媒体等の媒体は本発明を構成することになる。プロ
グラムコードを供給するための記憶媒体等の媒体として
は、例えば、フロッピディスク、ハードディスク、光デ
ィスク、光磁気ディスク、CD−ROM、CD−R、磁
気テープ、不揮発性のメモリカード、ROM、或いはネ
ットワークを介してのダウンロードの方法などを用いる
ことができる。
【0152】また、コンピュータが読み出したプログラ
ムコードを実行することにより、上述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているOSなどが
実際の処理の一部または全部を行い、その処理によって
上述した実施形態の機能が実現される場合も含まれるこ
とは言うまでもない。
【0153】更に、記憶媒体等の媒体から読出されたプ
ログラムコードが、コンピュータに挿入された機能拡張
ボードやコンピュータに接続された機能拡張ユニットに
備わるメモリに書込まれた後、そのプログラムコードの
指示に基づき、その機能拡張ボードや機能拡張ユニット
に備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって上述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0154】
【発明の効果】以上説明したように、請求項1〜9記載
の音声出力装置、請求項13〜21記載の音声出力シス
テム、請求項25〜33記載の音声出力方法、請求項3
7〜45記載の記憶媒体によれば、複数のテキストデー
タの合成音声を重ね合わせて発声する場合、複数のテキ
ストデータをそれぞれ異なる種類の音声で音声合成し出
力させるため、容易に複数のテキストデータの音声を聞
き分けることができる音声出力装置を提供できるという
効果を奏する。
【0155】また、請求項10、11記載の音声出力装
置、請求項22、23記載の音声出力システム、請求項
34、35記載の音声出力方法、請求項46、47記載
の記憶媒体によれば、複数のテキストデータの合成音声
を重ね合わせて発声する場合、複数のテキストデータの
音声をそれぞれ異なる発声手段で発声させるため、容易
に複数のテキストデータの音声を聞き分けることができ
る音声出力装置を提供できるという効果を奏する。
【0156】また、請求項12記載の音声出力装置、請
求項24記載の音声出力システム、請求項36記載の音
声出力方法、請求項48記載の記憶媒体によれば、イン
ターネットを介してテキストデータで会話を行うシステ
ムにおいても、上記と同様に、容易に複数のテキストデ
ータの音声を聞き分けることができるという効果を奏す
る。
【図面の簡単な説明】
【図1】本発明の第1、第3、第4の実施の形態に係る
音声合成装置の概略構成を示すブロック図である。
【図2】本発明の第1、第3の実施の形態に係る音声合
成装置のプログラムのモジュール関係を示す説明図であ
る。
【図3】本発明の第1、第3、第4の実施の形態に係る
音声合成装置のプログラムのモジュールにおける音声出
力部の詳細構成を示す説明図である。
【図4】本発明の第1の実施の形態に係る音声合成装置
の音声波形生成部の処理を示す流れ図である。
【図5】本発明の第1の実施の形態に係る音声合成装置
における主性別での出力音声と副性別での出力音声の時
間的な関係を示す概念図である。
【図6】本発明の第1の実施の形態に係る音声合成装置
の性別設定モード画面を示す説明図である。
【図7】本発明の第2の実施の形態に係る音声合成装置
の概略構成を示すブロック図である。
【図8】本発明の第2、第4の実施の形態に係る音声合
成装置のプログラムのモジュール関係を示す説明図であ
る。
【図9】本発明の第2の実施の形態に係る音声合成装置
のプログラムのモジュールにおける音声出力部の詳細構
成を示す説明図である。
【図10】本発明の第2の実施の形態に係る音声合成装
置の音声出力部の処理を示す流れ図である。
【図11】本発明の第2の実施の形態に係る音声合成装
置における両方のスピーカでの再生音声と別々のスピー
カでの再生音声の時間的な関係を示す概念図である。
【図12】本発明の第2の実施の形態に係る音声合成装
置のスピーカ設定モード画面を示す説明図である。
【図13】本発明の第3の実施の形態に係る音声合成装
置の音声波形生成部の処理を示す流れ図である。
【図14】本発明の第3の実施の形態に係る音声合成装
置の音声波形生成部の処理を示す流れ図である。
【図15】本発明の第3の実施の形態に係る音声合成装
置における第1音声での出力音声と第2音声での出力音
声の時間的な関係を示す概念図である。
【図16】本発明の第3の実施の形態に係る音声合成装
置の音声種類設定モード画面を示す説明図である。
【図17】本発明の第4の実施の形態に係る音声合成装
置の音声出力部の処理を示す流れ図である。
【図18】本発明の第4の実施の形態に係る音声合成装
置の音声出力部の処理を示す流れ図である。
【図19】本発明の第4の実施の形態に係る音声合成装
置における第1の高さの音声での出力音声と第2の高さ
の音声での出力音声の時間的な関係を示す概念図であ
る。
【図20】本発明の第4の実施の形態に係る音声合成装
置の声の高さ設定モード画面を示す説明図である。
【図21】本発明の音声出力方法を実行するプログラム
及び関連データを記憶した記憶媒体の記憶内容の構成例
を示す説明図である。
【図22】本発明の音声出力方法を実行するプログラム
及び関連データが記憶媒体から装置に供給される概念例
を示す説明図である。
【符号の説明】
101 CPU 110 モニタ 112R、112L スピーカ 209 音声波形生成部 210 音声出力部

Claims (48)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータを合成音声に変換して出
    力する音声出力装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータをそれぞれ異なる種
    類の音声で音声合成し出力させる音声出力手段とを有す
    ることを特徴とする音声出力装置。
  2. 【請求項2】 前記異なる種類の音声は互いに周波数帯
    域が異なることを特徴とする請求項1記載の音声出力装
    置。
  3. 【請求項3】 前記音声出力手段は、前記異なる種類の
    音声に対応する複数種類の音声素片データを記憶する音
    声素片記憶部と、前記異なる種類の音声に対応する処理
    パラメータに従って前記音声素片データを処理し、合成
    音声を生成する音声波形生成部とを有することを特徴と
    する請求項1記載の音声出力装置。
  4. 【請求項4】 前記処理パラメータは、周波数帯域と、
    音声レベルと、音声速度のうちの少なくとも1つを含む
    ことを特徴とする請求項3記載の音声出力装置。
  5. 【請求項5】 前記異なる種類の音声は、互いに異なる
    性別に対応する音声であることを特徴とする請求項1記
    載の音声出力装置。
  6. 【請求項6】 所定数の複数種類の音声のうち、任意の
    音声を選択する選択手段を備え、前記音声出力手段は前
    記選択された音声に従い合成音声を生成して出力するこ
    とを特徴とする請求項1記載の音声出力装置。
  7. 【請求項7】 前記異なる種類の音声は互いに高さが異
    なることを特徴とする請求項1記載の音声出力装置。
  8. 【請求項8】 前記音声出力手段は、所定数の複数種類
    の音声を所定の順序で選択的に出力することを特徴とす
    る請求項1記載の音声出力装置。
  9. 【請求項9】 前記異なる種類の音声は、互いに異なる
    年齢に対応する音声であることを特徴とする請求項1記
    載の音声出力装置。
  10. 【請求項10】 テキストデータを合成音声に変換して
    出力する音声出力装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータの音声出力が重なり
    合うことを検知した場合は、それぞれの音声を異なる発
    声手段から出力させる音声出力手段とを有することを特
    徴とする音声出力装置。
  11. 【請求項11】 使用する前記発声手段を任意に設定可
    能な設定手段を有することを特徴とする請求項10記載
    の音声出力装置。
  12. 【請求項12】 インターネットを介して前記テキスト
    データで会話を行うシステムに適用可能であることを特
    徴とする請求項1乃至11の何れかに記載の音声出力装
    置。
  13. 【請求項13】 テキストデータを合成音声に変換して
    出力する音声出力装置と、該音声出力装置に前記テキス
    トデータを送信する外部装置とを具備してなる音声出力
    システムであって、 前記音声出力装置は、前記テキストデータの音声波形を
    生成する音声波形生成手段と、複数の前記テキストデー
    タをそれぞれ異なる種類の音声で音声合成し出力させる
    音声出力手段とを有することを特徴とする音声出力シス
    テム。
  14. 【請求項14】 前記異なる種類の音声は互いに周波数
    帯域が異なることを特徴とする請求項13記載の音声出
    力システム。
  15. 【請求項15】 前記音声出力手段は、前記異なる種類
    の音声に対応する複数種類の音声素片データを記憶する
    音声素片記憶部と、前記異なる種類の音声に対応する処
    理パラメータに従って前記音声素片データを処理し、合
    成音声を生成する音声波形生成部とを有することを特徴
    とする請求項13記載の音声出力システム。
  16. 【請求項16】 前記処理パラメータは、周波数帯域
    と、音声レベルと、音声速度のうちの少なくとも1つを
    含むことを特徴とする請求項15記載の音声出力システ
    ム。
  17. 【請求項17】 前記異なる種類の音声は、互いに異な
    る性別に対応する音声であることを特徴とする請求項1
    3記載の音声出力システム。
  18. 【請求項18】 前記音声出力装置は、所定数の複数種
    類の音声のうち、任意の音声を選択する選択手段を備
    え、前記音声出力手段は前記選択された音声に従い合成
    音声を生成して出力することを特徴とする請求項13記
    載の音声出力システム。
  19. 【請求項19】 前記異なる種類の音声は互いに高さが
    異なることを特徴とする請求項13記載の音声出力シス
    テム。
  20. 【請求項20】 前記音声出力手段は、所定数の複数種
    類の音声を所定の順序で選択的に出力することを特徴と
    する請求項13記載の音声出力システム。
  21. 【請求項21】 前記異なる種類の音声は、互いに異な
    る年齢に対応する音声であることを特徴とする請求項1
    3記載の音声出力システム。
  22. 【請求項22】 テキストデータを合成音声に変換して
    出力する音声出力装置と、該音声出力装置に前記テキス
    トデータを送信する外部装置とを具備してなる音声出力
    システムであって、 前記音声出力装置は、前記テキストデータの音声波形を
    生成する音声波形生成手段と、複数の前記テキストデー
    タの音声出力が重なり合うことを検知した場合は、それ
    ぞれの音声を異なる発声手段から出力させる音声出力手
    段とを有することを特徴とする音声出力システム。
  23. 【請求項23】 前記音声出力装置は、使用する前記発
    声手段を任意に設定可能な設定手段を有することを特徴
    とする請求項22記載の音声出力システム。
  24. 【請求項24】 インターネットを介して前記テキスト
    データで会話を行うシステムに適用可能であることを特
    徴とする請求項13乃至23の何れかに記載の音声出力
    システム。
  25. 【請求項25】 テキストデータを合成音声に変換して
    出力する音声出力装置に適用される音声出力方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータをそれぞれ異なる種
    類の音声で音声合成し出力させる音声出力工程とを有す
    ることを特徴とする音声出力方法。
  26. 【請求項26】 前記異なる種類の音声は互いに周波数
    帯域が異なることを特徴とする請求項25記載の音声出
    力方法。
  27. 【請求項27】 前記音声出力工程は、前記異なる種類
    の音声に対応する複数種類の音声素片データを記憶する
    音声素片記憶工程と、前記異なる種類の音声に対応する
    処理パラメータに従って前記音声素片データを処理し、
    合成音声を生成する音声波形生成工程とを有することを
    特徴とする請求項25記載の音声出力方法。
  28. 【請求項28】 前記処理パラメータは、周波数帯域
    と、音声レベルと、音声速度のうちの少なくとも1つを
    含むことを特徴とする請求項27記載の音声出力方法。
  29. 【請求項29】 前記異なる種類の音声は、互いに異な
    る性別に対応する音声であることを特徴とする請求項2
    5記載の音声出力方法。
  30. 【請求項30】 所定数の複数種類の音声のうち、任意
    の音声を選択する選択工程を有し、前記音声出力工程で
    は前記選択された音声に従い合成音声を生成して出力す
    ることを特徴とする請求項25記載の音声出力方法。
  31. 【請求項31】 前記異なる種類の音声は互いに高さが
    異なることを特徴とする請求項25記載の音声出力方
    法。
  32. 【請求項32】 前記音声出力工程では、所定数の複数
    種類の音声を所定の順序で選択的に出力することを特徴
    とする請求項25記載の音声出力方法。
  33. 【請求項33】 前記異なる種類の音声は、互いに異な
    る年齢に対応する音声であることを特徴とする請求項2
    5記載の音声出力方法。
  34. 【請求項34】 テキストデータを合成音声に変換して
    出力する音声出力装置に適用される音声出力方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータの音声出力が重なり
    合うことを検知した場合は、それぞれの音声を異なる発
    声手段から出力させる音声出力工程とを有することを特
    徴とする音声出力方法。
  35. 【請求項35】 使用する前記発声手段を任意に設定可
    能な設定工程を有することを特徴とする請求項34記載
    の音声出力方法。
  36. 【請求項36】 インターネットを介して前記テキスト
    データで会話を行うシステムに適用可能であることを特
    徴とする請求項25乃至35の何れかに記載の音声出力
    方法。
  37. 【請求項37】 テキストデータを合成音声に変換して
    出力する音声出力装置に適用される音声出力方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声出力方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータをそれぞれ異なる種類の音声で音
    声合成し出力させるように制御する音声出力ステップと
    を有することを特徴とする記憶媒体。
  38. 【請求項38】 前記異なる種類の音声は互いに周波数
    帯域が異なることを特徴とする請求項37記載の記憶媒
    体。
  39. 【請求項39】 前記音声出力ステップは、前記異なる
    種類の音声に対応する複数種類の音声素片データを記憶
    するように制御する音声素片記憶ステップと、前記異な
    る種類の音声に対応する処理パラメータに従って前記音
    声素片データを処理し、合成音声を生成するように制御
    する音声波形生成ステップとを有することを特徴とする
    請求項37記載の記憶媒体。
  40. 【請求項40】 前記処理パラメータは、周波数帯域
    と、音声レベルと、音声速度のうちの少なくとも1つを
    含むことを特徴とする請求項39記載の記憶媒体。
  41. 【請求項41】 前記異なる種類の音声は、互いに異な
    る性別に対応する音声であることを特徴とする請求項3
    7記載の記憶媒体。
  42. 【請求項42】 所定数の複数種類の音声のうち、任意
    の音声を選択する選択ステップを有し、前記音声出力ス
    テップでは前記選択された音声に従い合成音声を生成し
    て出力するように制御することを特徴とする請求項37
    記載の記憶媒体。
  43. 【請求項43】 前記異なる種類の音声は互いに高さが
    異なることを特徴とする請求項37記載の記憶媒体。
  44. 【請求項44】 前記音声出力ステップでは、所定数の
    複数種類の音声を所定の順序で選択的に出力するように
    制御することを特徴とする請求項37記載の記憶媒体。
  45. 【請求項45】 前記異なる種類の音声は、互いに異な
    る年齢に対応する音声であることを特徴とする請求項3
    7記載の記憶媒体。
  46. 【請求項46】 テキストデータを合成音声に変換して
    出力する音声出力装置に適用される音声出力方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声出力方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータの音声出力が重なり合うことを検
    知した場合は、それぞれの音声を異なる発声手段から出
    力させるように制御する音声出力ステップとを有するこ
    とを特徴とする記憶媒体。
  47. 【請求項47】 使用する前記発声手段を任意に設定可
    能な設定ステップを有することを特徴とする請求項46
    記載の記憶媒体。
  48. 【請求項48】 インターネットを介して前記テキスト
    データで会話を行うシステムに適用可能であることを特
    徴とする請求項37乃至47の何れかに記載の記憶媒
    体。
JP2000214140A 2000-06-30 2000-07-14 音声出力装置、音声出力システム、音声出力方法及び記憶媒体 Pending JP2002032098A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000214140A JP2002032098A (ja) 2000-07-14 2000-07-14 音声出力装置、音声出力システム、音声出力方法及び記憶媒体
US09/891,389 US7031924B2 (en) 2000-06-30 2001-06-27 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
US11/357,021 US20060143012A1 (en) 2000-06-30 2006-02-21 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000214140A JP2002032098A (ja) 2000-07-14 2000-07-14 音声出力装置、音声出力システム、音声出力方法及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2002032098A true JP2002032098A (ja) 2002-01-31

Family

ID=18709778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000214140A Pending JP2002032098A (ja) 2000-06-30 2000-07-14 音声出力装置、音声出力システム、音声出力方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2002032098A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157678A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
CN111301438A (zh) * 2018-11-27 2020-06-19 丰田自动车株式会社 自动驾驶装置、汽车导航装置以及驾驶辅助系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157678A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
US10129442B2 (en) 2015-03-31 2018-11-13 Sony Corporation Information processing apparatus and information processing method
CN111301438A (zh) * 2018-11-27 2020-06-19 丰田自动车株式会社 自动驾驶装置、汽车导航装置以及驾驶辅助系统

Similar Documents

Publication Publication Date Title
US20060143012A1 (en) Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
KR100682443B1 (ko) 음성 및 악곡 재생 장치 및 방법
US7230177B2 (en) Interchange format of voice data in music file
JPH10326176A (ja) 音声対話制御方法
JP2008046951A (ja) 電子文書生成システム、サーバ装置、端末装置、電子文書生成方法、サーバ装置用プログラム及び端末装置用プログラム
JP2002032098A (ja) 音声出力装置、音声出力システム、音声出力方法及び記憶媒体
JP2002023787A (ja) 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JP7117228B2 (ja) カラオケシステム、カラオケ装置
JP2005037846A (ja) 音楽再生装置の情報設定装置及び情報設定方法
JP2020204683A (ja) 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム
JPH08272388A (ja) 音声合成装置及びその方法
KR100612780B1 (ko) 음성 및 악곡 재생 장치
JP2005037848A (ja) 楽音発生装置及びそのプログラム
JP2016206591A (ja) 語学学習用コンテンツ配信システム、語学学習用コンテンツ生成装置、および、語学学習用コンテンツ再生プログラム
JPH1115488A (ja) 合成音声評価・合成装置
JPH10319977A (ja) カラオケ演奏装置およびカラオケ用携帯型試聴端末
JP2000231396A (ja) セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置
JP2002507772A (ja) 情報再生用または機能実行用の装置
JP2003122384A (ja) 携帯端末装置
JP2005107320A (ja) 音声再生用データ生成装置
JP4153453B2 (ja) 音楽再生装置
JP2004157238A (ja) 携帯端末
JP4244706B2 (ja) 音声再生装置
JP2002259373A (ja) 辞書装置
KR20020074816A (ko) 휴대용 다기능 전자책 및 그 제어방법

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060327

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626