JP2002328694A - 携帯端末装置及び読み上げシステム - Google Patents

携帯端末装置及び読み上げシステム

Info

Publication number
JP2002328694A
JP2002328694A JP2002055631A JP2002055631A JP2002328694A JP 2002328694 A JP2002328694 A JP 2002328694A JP 2002055631 A JP2002055631 A JP 2002055631A JP 2002055631 A JP2002055631 A JP 2002055631A JP 2002328694 A JP2002328694 A JP 2002328694A
Authority
JP
Japan
Prior art keywords
data
voice
terminal device
user
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002055631A
Other languages
English (en)
Inventor
Kazunori Hayashi
和典 林
Masaru Mase
優 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002055631A priority Critical patent/JP2002328694A/ja
Publication of JP2002328694A publication Critical patent/JP2002328694A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本発明は、携帯性に優れ、かつユーザが所望
する声色で音声出力を行い、ユーザに聞く楽しさを与え
る携帯端末装置及び読み上げシステムを提供する。 【解決手段】 音声合成手段として実際の人物の肉声を
サンプリングし、データベース化した音素データベース
を使用して音声合成された音を出力する携帯端末装置に
おいて、ユーザは音声合成処理部や音素データベースや
合成目的データが搭載された記憶装置を携帯端末装置に
挿入し、再生することにより端末装置上で音声合成処理
が行われ合成音声を聴くことができる。あるいは携帯端
末装置をネットワーク上のサーバー装置と通信させ、自
分が所望する音素データベースと合成目的データを選択
することにより、ユーザは所望するキャラクタ音声で合
成目的データである小説やニュース記事等の朗読を聴く
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はテキストデータを音
声変換する携帯端末装置及び読み上げシステムに関す
る。
【0002】
【従来の技術】従来、電子メールやワープロの文章を読
み上げる装置としては、記憶容量の豊富さや処理能力の
高さ、ネットワーク機能の充実度等からパーソナルコン
ピュータにて実現していた。
【0003】しかしながらパーソナルコンピュータを歩
きながら使用するには、大きさ、重量の問題から大変不
便であるし、その操作も容易とは言い難い面がある。ま
たテキストデータを音声変換するのみの機能であれば、
コストパフォーマンスに欠ける等の問題がある。この点
を解決するものとして、例えば特開平6−337774
号公報には、情報処理装置への取り付け取り外しが簡単
で、小型の情報処理装置(小型パーソナルコンピユータ
等)にも内蔵でき、且つ小型軽量で持ち運びができると
共に単体でも文章読み上げ機能を持つICカード形態の
文章読み上げ装置が記載されている。このものは、予め
文章読み上げ装置内のRAMにパーソナルコンピユータ
等から外部インタフエースを介して文書データを転送し
ておき、文章読み上げ装置が単体の時はRAMから文章
データを読み出し、この読み出した文章データに対して
言語処理を施して音声記号列を得、これを音声合成器に
与えて音声データにし、この音声データをアナログ音声
信号化してイヤホンジヤツクに出力する。この文章読み
上げ装置はICカード化されているで、小型軽量且つ着
脱自在である。
【0004】また出力される音声も男性や女性といった
一般的なものであり、必ずしもユーザが所望する声色で
の音声出力ではないので、ユーザが聴いていて楽しさを
感じにくい面があった。
【0005】特開平7−140999号公報には、人間
の発声に近い合成音声を生成することができる音声合成
装置及び音声合成方法が開示されている。すなわち、辞
書の中に読み仮名、アクセント型等の情報をととも、ア
クセント指令値及び又は音韻継続時間長情報を予め用意
しておき、音韻の継続時間長を用いて音素片データのパ
ラメータ列を生成するとともに、算出した音韻の継続時
間長、韻律情報及びアクセント指令値に基づいてピツチ
パターンを生成し、このように生成されたパラメータ列
及びピツチパターンにより音声波形を合成することによ
り、人間の発声に一段と近い合成音声を出力するもので
ある。
【0006】また特開平11−143483号公報に
は、パソコン、ワープロ、ゲーム機、専用機、NC(ネ
ツトワークコンピュータ)、STB(セツト・トツプ・
ボツクス)などを利用する際の合成音声の発生に係わ
り、特にユーザが任意でかつ多様な合成音声を選ぶこと
が可能な手段を実現するシステムが開示されている。す
なわち、人の音声を入力しその音声認識を行い、この認
識した結果を解析し音韻系列作成のための音韻記号列情
報をおよび韻律情報を抽出し、さらに特定の人の音声か
ら作成した音声辞書(音声素片辞書)を準備しておき、
前述の抽出した音韻記号列に基づいて音声素片を接続補
間し音韻系列を作成する。
【0007】
【発明が解決しようとする課題】以上のように、音韻の
継続時間長、韻律情報及びアクセント指令値に基づいて
人間の発声に近い合成音声を出力するものも考えられて
いるが、例えば文学作品を朗読させた場合、真に感動を
与え、ユーザを楽しませるものとは限らない。
【0008】本発明はこれらの問題を解決する為に、携
帯性に優れ、歩行時においても無理無く持ち運べ、かつ
ユーザが所望する声色で音声出力を行い、ユーザに聞く
楽しさを与える携帯端末装置及び読み上げシステムを提
供するものである。
【0009】
【課題を解決するための手段】基本構成(最低限の構
成)として、音声合成の目的データを入力する手段また
は合成音声データを入力する手段と、音声合成された音
を出力する手段を備えた携帯端末装置において、音声合
成手段として実際の人物の肉声をサンプリングし、その
サンプリングデータをデータベース化した音素データベ
ースを使用することを特徴とする携帯端末装置であっ
て、音声合成処理部、音素データベース部、合成目的デ
ータを携帯端末装置あるいは記憶装置またはネットワー
ク上のサーバー装置に備える。ユーザは音声合成処理部
や音素データベースや合成目的データが搭載された記憶
装置を携帯端末装置に挿入して再生することにより端末
装置上で音声合成処理が行われ合成音声を聴くことがで
きる。あるいは携帯端末装置をネットワーク上のサーバ
ー装置と通信させ、自分が所望する音素データベースと
合成目的データを選択することによりサーバー装置上で
音声合成が行われ、合成音声データを端末装置に取り込
むことで、携帯端末装置上から合成音声が出力される。
従ってユーザは所望するキャラクタ音声で合成目的デー
タである小説やニュース記事等の朗読を楽しみながら聴
くことができる。
【0010】
【発明の実施の形態】請求項1記載の発明は、端末装置
と記憶装置とを有し、個性を持つ音素をデータ化した音
素データとテキストデータ等の音声合成目的データとを
処理する携帯端末装置であって、システム制御と音声合
成処理部を有し、音声合成目的データを搭載する記憶装
置は携帯端末装置から切り離し可能であり、ユーザが再
生操作することで、音声合成目的データと記憶装置に搭
載されている特定キャラクタの音素データベースとを前
記携帯端末装置内の音声合成処理部が音声合成処理し、
音声合成された音を出力する事を特徴とする携帯端末装
置であり、ユーザがその記憶装置を携帯端末装置に挿入
して再生操作することで音声合成処理を行い、合成音声
を出力する。従ってユーザは所望するキャラクタ音声で
テキストデータ等の朗読を聴くことができる。
【0011】請求項3記載の発明は、請求項1に記載の
携帯端末装置において、通信処理部はインターネット上
のサーバ装置から音素データまたは音声合成目的データ
をダウンロード可能しとたものであり、音声合成処理プ
ログラムや合成目的データまたは音素データベースをネ
ットワーク経由で入れ替えることができる。
【0012】請求項4記載の発明は、記憶装置には音素
データベースが記録されており、その記憶装置は携帯端
末装置から切り離し可能な携帯端末装置であり、ユーザ
がその記憶装置を端末に挿入して再生することでシステ
ム制御部は携帯端末装置に記憶されている音声合成処理
プログラム及び合成目的データと記憶装置に搭載されて
いる音素データベースより音声合成処理を行い、合成音
声を出力する。従ってユーザは所望するキャラクタ音声
でテキストデータ等の朗読を聴くことができる。
【0013】請求項5に記載の携帯端末装置は、請求項
1に記載の携帯端末装置において、通信処理部は、イン
ターネット上のサーバ装置から音声合成処理プログラム
をダウンロードすることとしたものであり、この構成に
より、インターネット上のサーバ装置から音声合成処理
プログラムを記憶部にダウンロードして音声合成処理プ
ログラムを更新することができるので、必要に応じて適
正な音声合成処理プログラムを使用することができ、適
正な合成音声を送出することができると共に、ダウンロ
ード時に別途パソコンを準備する必要がなく、パソコン
経由で音素データおよび音声合成目的データを記憶装置
に記憶させる手間が省け、また、多くの音声合成目的デ
ータや音素データを記憶装置に記憶させて持ち運ぶこと
ができるので、携帯時における読み上げ対象のテキスト
データやキャラクタ音声データの選択の幅を広げること
ができるという作用を有する。
【0014】請求項7記載の発明は、記憶装置には合成
目的データが記憶されており、その記憶装置は携帯端末
装置から切り離し可能な携帯端末装置であり、ユーザが
その記憶装置を携帯端末装置に挿入して再生することで
システム制御部は携帯端末装置に記憶されている音声合
成処理プログラム及び特定キャラクタの音素データベー
スと記憶装置に記憶されている合成目的データにより音
声合成処理を行い、合成音声を出力する。従ってユーザ
は所望するキャラクタ音声でテキストデータ等の朗読を
聴くことができる。
【0015】請求項8記載の携帯端末装置は、記憶装置
が通信処理部を備えたものである。この構成により、端
末装置においては通信処理部を不要とすることができる
ので、端末装置を簡単な構成にすることができ、端末装
置のコストダウンを図ることができるという作用を有す
る。
【0016】請求項9に記載の携帯端末装置は、記憶装
置が通信処理部を備え、通信処理部を介して、音声合成
処理プログラムと音素データと音声合成目的データとを
インターネット上のサーバ装置からダウンロードし、ダ
ウンロードしたプログラムとデータとを端末装置インタ
フェース部と記憶装置インタフェース部とを介して記憶
部に転送することとしたものである。この構成により、
記憶装置単体でプログラムやデータをダウンロードする
ことができると共に、端末装置を簡単な構成にすること
ができ、端末装置のコストダウンを図ることができると
いう作用を有する。
【0017】請求項10記載の発明は、記憶装置には音
声合成処理部が搭載されており、その記憶装置は携帯端
末装置から切り離し可能な携帯端末装置であり、ユーザ
がその記憶装置を端末に挿入して再生することでシステ
ム制御部は記憶装置に記憶されている音声合成処理プロ
グラム及び特定キャラクタの音素データベースと合成目
的データにより音声合成処理を行い、合成音声を出力す
る。従ってユーザは所望するキャラクタ音声でテキスト
データ等の朗読を聴くことができる。
【0018】請求項12記載の発明は、請求項1に記載
の携帯端末装置において、携帯端末装置上又は記憶装置
上に音声登録処理部を搭載した携帯端末装置であり、ユ
ーザはこれにより所望の音素データベースを登録可能で
ある。前記携帯端末装置内にあるシステム制御部は音声
合成処理プログラムと合成目的データ及びユーザが登録
した音素データベースを用いて、音声合成処理を行い、
合成音声を出力する。従ってユーザはユーザが登録した
キャラクタ音声でテキストデータ等の朗読を聴くことが
できる。
【0019】請求項13記載の発明は、請求項1に記載
の携帯端末装置において、携帯端末装置上又は前記記憶
装置上に翻訳処理部を搭載した携帯端末装置であり、合
成目的データはユーザが所望する翻訳形態に翻訳され、
前記携帯端末装置内にあるシステム制御部は前記翻訳処
理部にて翻訳された合成目的データを音声合成処理プロ
グラムと音素データベースを用いて音声合成処理を行
い、合成音声を出力する。従ってユーザは所望するテキ
ストデータの翻訳結果及びキャラクタ音声にてテキスト
データ等の朗読を聴くことができる。
【0020】請求項14記載の発明は、請求項1に記載
の携帯端末装置において、前記携帯端末装置上又は前記
記憶装置上に音声登録処理部を搭載した携帯端末装置で
あり、合成目的データはユーザが所望する翻訳形態に翻
訳され、前記携帯端末装置内にあるシステム制御部は前
記翻訳処理部にて翻訳された合成目的データを音声合成
処理プログラムとユーザ自身が登録した音素データベー
スを用いて、音声合成処理を行い、合成音声を出力す
る。従ってユーザは所望するテキストデータの翻訳結果
及びユーザ自身が登録したキャラクタ音声にてテキスト
データ等の朗読を聴くことができる。
【0021】請求項15記載の発明は、請求項1に記載
の携帯端末装置において、ネットワーク上のサーバー装
置にダウンロード選択処理部を備える事を特徴とし、そ
の携帯端末装置上、あるいは記憶装置上に合成目的デー
タを記憶する際に、ユーザが所望する合成目的データの
部分のみをネットワーク上のサーバー装置からダウンロ
ード可能とする事ができるのでユーザは自分が所望する
合成目的データ範囲及びキャラクタ音声にてテキストデ
ータの朗読を聴くことができる。
【0022】請求項17記載の発明は、合成目的データ
を楽曲データ(スコアデータ(楽譜)+テキストデータ
(歌詞))とした場合の携帯端末装置であり、ユーザが
携帯端末装置上で音素データと楽曲データを指定するこ
とで、携帯端末装置からは指定された音素で楽曲が出力
される。従ってユーザが所望する特定キャラクタの音声
で楽曲を聴く事ができる。
【0023】請求項18記載の発明は、合成目的データ
中のある特定の文字列(例えばお金の単位や数字等)に
おいてはユーザ所望のキャラクタでの音声合成出力はせ
ず、代替の音声合成出力を行う携帯端末装置であり、そ
の結果、音声認証等を用いる他のシステムにこの装置の
音声出力結果を音声認証データとして使用不可能とする
ことができ、不正な使用を防ぐことができる。
【0024】請求項19記載の発明は、音声出力してい
る文章中に音声合成の出力音であること示す音を強制的
に挿入する事を特徴とする携帯端末装置であり、その結
果、音声認証等を用いる他のシステムにこの装置の音声
出力結果を音声認証データとして使用不可能とすること
ができ、不正な使用を防ぐことができる。
【0025】請求項20記載の発明は、音声合成に用い
る音素データベースを選択する音素データベース選択手
段を備えた携帯端末装置であり、ユーザが音素データベ
ースの種類や朗読対象のテキストデータ等を選択するこ
とにより、ユーザが所望するキャラクタ音声で小説等の
テキストデータの朗読をよりリアルな感覚で聴くことが
できる。
【0026】請求項21記載の発明は、ユーザによって
音声キャラクタが選択されると音素データベース選択手
段は選択された結果を基に音声合成目的のデータの各音
素データベースを適用する部分に対して識別記号を混在
させて記憶部に記憶させ、音声合成処理中に前記音声合
成処理部は前記識別記号を基に適用する音声キャラクタ
の音素データベースを判別するように構成したものであ
り、音声合成目的データの中で部分毎に識別記号によっ
て音素データベースが切り換えられ、音声合成処理時に
は部分ごとに適切な音声キャラクタで音声合成がなされ
る。
【0027】請求項22記載の発明は、音声合成目的の
データを楽譜と歌詞から成る楽曲データとし、ユーザが
音素データベースと楽曲データを指定することで、ユー
ザが所望する特定キャラクタの音声で楽曲を提供可能に
構成したものであり、携帯端末装置からは指定された音
素で楽曲が出力され、ユーザが所望する特定キャラクタ
の音声で楽曲を聴く事ができる。
【0028】請求項23記載の発明は、合成音声出力中
の音声合成目的データに関する視覚表示を行う視覚表示
処理手段と、音声合成された音を出力する音声出力処理
部を備えた携帯端末装置であり、視覚を通じてユーザの
理解を助けることができる。
【0029】請求項24記載の発明は、視覚表示処理手
段は、合成音声出力中の音声合成目的データの表示を行
う文字データ表示処理部及び/又は合成音声出力中の箇
所の内容に合った挿絵や画像の表示を行う画像データ表
示処理部を含むものであり、合成音声出力中の音声合成
目的データの文字や内容にあった挿絵等を表示可能であ
り、音声だけではわかりづらい同音異義語や内容の理解
を助けることができる。
【0030】請求項31記載の発明は前記携帯端末装置
にシステム制御部を備えた読み上げシステムであり、ネ
ットワークで結ばれたシステムにおいて、音声合成処理
部及び合成目的データと音素データベースをインターネ
ット上のサーバー装置に備え、ユーザが携帯端末装置を
通じて音素データベースの種類や朗読対象の合成目的デ
ータを選択することにより、サーバー装置は音声合成処
理プログラムにて指定された音素データベースと合成目
的データより音声合成処理を行い、その結果である特定
キャラクタの合成音声データをネットワーク経由で携帯
端末装置に配信し、携帯端末装置では受信した音声デー
タを音声出力する。従ってユーザは所望するキャラクタ
音声でテキストデータ等の朗読を聴くことができる。
【0031】請求項32記載の発明は請求項31に記載
した読み上げシステムにおいて、インターネット上のサ
ーバー装置に音声登録処理部を備え、これによりユーザ
はサーバー装置に携帯端末装置を通じて所望の音素デー
タベースを登録可能である。ユーザが携帯端末装置を通
じて登録した音素データベース及び朗読対象の合成目的
データを選択することにより、サーバー装置は指定され
た音素データベースと合成目的データより音声合成処理
を行い、その結果、ユーザ登録した特定キャラクタの合
成音声データをネットワーク経由で携帯端末装置に配信
し、携帯端末装置では受信した音声データを音声出力す
る。従ってユーザはユーザが登録したキャラクタ音声で
テキストデータ等の朗読を聴くことができる。
【0032】請求項33記載の発明は請求項31に記載
した読み上げシステムにおいて、インターネット上のサ
ーバー装置に翻訳処理部を備え、ユーザが携帯端末装置
を通じて音素データベースや翻訳の種類及び朗読対象の
合成目的データを選択することにより、サーバー装置は
合成目的データをユーザが所望する翻訳形態に翻訳し、
その翻訳データを音声合成処理プログラムにて音素デー
タベースを用い、音声合成処理を行い、合成音声データ
をネットワーク経由で携帯端末装置に配信し、携帯端末
装置では受信した音声データを音声出力する。従ってユ
ーザは所望するテキストデータ等の翻訳結果及びキャラ
クタ音声にてテキストデータ等の朗読を聴くことができ
る。
【0033】請求項34記載の発明は請求項33に記載
した読み上げシステムにおいて、インターネット上のサ
ーバー装置に音声登録処理部を備え、これによりユーザ
はサーバー装置に携帯端末装置を通じて所望の音素デー
タベースを登録可能である。ユーザが携帯端末装置を通
じて登録した音素データベース及び翻訳の種類と朗読対
象の合成目的データを選択することにより、サーバー装
置は合成目的データをユーザが所望する翻訳形態に翻訳
し、その翻訳データを音声合成処理プログラムにてユー
ザ登録の音素データベースを用いて、音声合成処理を行
い、その結果をネットワーク経由で携帯端末装置に配信
し、携帯端末装置では受信した音声データを音声出力す
る。従ってユーザは所望するテキストデータ等の翻訳結
果及びユーザが登録したキャラクタ音声でテキストデー
タ等の朗読を聴くことができる。
【0034】請求項35記載の発明は請求項31に記載
した読み上げシステムにおいて、前記朗読対象の合成目
的データを小説等のテキストデータ等のみでなく、楽曲
データ(スコアデータ(楽譜)+テキストデータ(歌
詞))とした場合の読み上げシステムであり、ユーザが
携帯端末装置上で音素データベースと楽曲データを指定
することで、携帯端末装置からは指定された音素で楽曲
が出力される。従ってユーザは所望する特定キャラクタ
の音声で楽曲を聴く事ができる。
【0035】請求項36記載の発明は請求項31に記載
した読み上げシステムにおいて、合成目的データ中のあ
る特定の文字列(例えばお金の単位や数字等)において
はユーザ所望のキャラクタでの音声合成出力はせず、代
替の音声合成出力を行う読み上げシステムであり、その
結果、音声認証等を用いる他のシステムにこの装置の音
声出力結果を音声認証データとして使用不可能とするこ
とができ、不正な使用を防ぐことができる。
【0036】請求項37記載の発明は請求項31で記載
している読み上げシステムにおいて、音声出力している
文章中に音声合成の出力音であること示す音を強制的に
挿入する事を特徴とする読み上げシステムであり、その
結果、音声認証等を用いる他のシステムにこの装置の音
声出力結果を音声認証データとして使用不可能とするこ
とができ、不正な使用を防ぐことができる。
【0037】請求項39記載の発明は音声の最小構成要
素を音素と定め、その個性を持つ音素をデータ化した音
素データベースと音声合成目的のデータ、例えば文章が
記述されたテキストデータと、ユーザから送られてくる
音声合成目的データとユーザ情報を対応付けして管理す
るデータ登録処理部と、音声合成目的のデータを解析
し、そのデータ毎に最適な音素を抽出して繋ぎあわせる
音声合成処理部と、音声合成処理部が作成した合成音声
データをユーザに配信する通信処理部から構成されるサ
ーバー手段と、音声合成済みの合成音声データを入力す
る合成音データ入力手段と合成音声を出力する音声出力
手段から構成される端末装置から成る読み上げシステム
であり、ユーザは音声合成させたい文章、例えば自分史
やドラマ等を作成し、その文章を所望の音声キャラクタ
にて朗読させるという新たな楽しみを享受できる。以
下、本発明の実施の形態について、図1〜図74を用い
て説明する。
【0038】(実施の形態1)図1は本発明の実施の形
態1の携帯端末装置を有する通信システムを示す構成図
である。実施の形態1および以下の各実施の形態におい
て、携帯端末装置とは、端末装置と記憶装置とから構成
される装置である。
【0039】図1において、201は表示部や操作部、
ヘッドフォン・スピーカ等の音声出力部などを備えた端
末装置、202はテキストデータ等の音声合成目的デー
タ203および音素データ204を記憶するメモリカー
ド等の記憶装置である。記憶装置202は端末装置20
1とは脱着可能である。205は音声合成目的データ2
03や音素データ204、音声合成処理プログラム20
6を提供するインターネット上のサーバ装置である。こ
こでは一つのサーバ装置しか記載してないが、複数のサ
ーバ装置で音声合成目的データと音素データとを分けて
提供する場合もある。ユーザは、キャラクタ音声の音素
データと読み上げ対象の音声合成目的データとが格納さ
れた記憶装置202を端末装置201に挿入し操作する
ことで、自分の所望のキャラクタ音声にて合成音声を聴
くことができる。
【0040】図2は、図1の端末装置201と記憶装置
202とを詳細に示すブロック図である。図2におい
て、101は装置201内の各処理部とデータのやり取
りを行い、装置全体の制御を行うシステム制御部、10
2は音声合成目的データの解析を行って各データに最適
な音素データを抽出及び連結し、後述の音声出力処理部
104に渡せるようにデータ変換する音声合成処理部、
103はシステム制御部101から指示を受け、記憶装
置202に対してデータの読み書きを行う記憶装置イン
タフェース部(記憶装置I/F部)、104は音声合成
処理部102からデータを受け、データのフォーマット
変換を行い、スピーカまたはヘッドフォン108に出力
する音声出力処理部、105は装置201を制御するプ
ログラムの保管やデータ処理の際の作業領域として用い
られる記憶部、106は操作部である。
【0041】ユーザは、操作部106を通じ、装置20
1に自分の指示を与える。107は装置201の動作状
態等をユーザに表示する表示部、109は装置201、
202に電源を供給する為の電源部、110は公衆回線
と接続して、インターネット上でのデータのやり取りを
実現する通信処理部、120は記憶装置インタフェース
部103と共に端末装置201とデータのやり取りを行
う端末装置インタフェース部(端末装置I/F部)、1
21は音素データを保存する音素データベース、122
は音声合成目的データを保存する音声合成目的データで
ある。
【0042】このように構成された携帯端末装置につい
て、その動作を図3を用いて説明する。図3は図2の端
末装置201の動作を示すフローチャートである。
【0043】ユーザが操作部106にて装置201の電
源をオンすると、システム制御部101は記憶装置イン
タフェース部103に指令を出し、記憶装置202が端
末装置201に接続されているか否かを判定する(S3
01)。接続されていない場合は、記憶部105からフ
ォントデータを取り出し、表示部107に「メモリカー
ドを挿入してください」等のようなメッセージを表示
し、ユーザに対して端末装置201に記憶装置202の
接続を行うように促す(S302)。接続されている場
合は、「操作メニュー1、再生2、プログラムアップデ
ート3、読み上げ対象データダウンロード4、キャラク
タ音声データダウンロード・・」等のメッセージを表示
部107に表示する(S303)。ユーザがプログラム
アップデートを選択すると(S304)、システム制御
部101は、通信処理部110を通じて、端末装置20
1が公衆回線と接続されているか否かを判定し(S30
6)、接続されていない場合は、「回線と接続してくだ
さい」等の接続を促すメッセージを表示部107に表示
する(S307)。接続されている場合は、通信処理部
110を通じ、インターネット上のサーバ装置205
(図1参照)と接続する(S308)。
【0044】接続が完了したら、端末装置201のシス
テム制御部101は、サーバ装置205に最新の音声合
成処理プログラムのダウンロードを要求し、サーバ装置
205から音声合成処理プログラムが送られてくると、
音声合成処理プログラムを記憶部105に記憶して更新
し(S309)、ダウンロード完了のメッセージを表示
して、サーバ装置205との呼を切断する(S31
1)。
【0045】読み上げ対象データ(音声合成目的デー
タ)やキャラクタ音声データ(音素データ)のダウンロ
ードが選択された場合(S305)にサーバ装置205
に接続してデータをダウンロードするまでの手順は、上
述のプログラムアップデートと同じ手順であるが、読み
上げ対象データやキャラクタ音声データのダウンロード
時において、システム制御部101は、ダウンロードし
たデータを、記憶装置インタフェース部103、記憶装
置202内の端末装置インタフェース部120を通じ
て、記憶装置202に記憶する(S310)。そして、
ダウンロード完了のメッセージを表示し、サーバ装置2
05との呼を切断する(S311)。
【0046】操作部106から再生が選択されると(S
312)、システム制御部101は、表示部107に読
み上げ対象データとキャラクタ音声のリストを表示し
(S313)、ユーザに読み上げ対象データとキャラク
タ音声データとを選択させる。ユーザが選択したら、記
憶装置インタフェース部103に、記憶装置202内に
ある該当の音声合成目的データを読み出す指令を出し、
記憶装置インタフェース部103は記憶装置202内に
ある端末装置インタフェース部120とやり取りをしな
がら音声合成目的データを読み出し、端末装置201内
の記憶部105に記録する(S314)。次に、システ
ム制御部101は、音声合成処理部102に指令を出
し、処理を開始させる。音声合成処理部102は、記憶
部105から音声合成目的データを順次読み出しながら
解析を行い、データに最も適する音素データを記憶装置
202から読み出して繋ぎ合わせ、合成音声データを作
成し(S315)、その合成音声データを音声出力処理
部104が処理できるデータに変換して音声出力処理部
104に渡す。音声合成処理部102は、ユーザが操作
部106で停止のボタンを押して、システム制御部10
1から処理中止の指示があるまで、この処理を繰り返
す。音声出力処理部104は、音声合成処理部102か
ら受け取ったデータをフォーマット変換し、スピーカま
たはヘッドフォン108に出力する(S316)。
【0047】以上のように本実施の形態によれば、端末
装置201は、全体を制御するシステム制御部101
と、音声合成目的データと音素データとから音声合成処
理プログラムに基づいて音声合成を行う音声合成処理部
102と、音声合成処理プログラムを記憶する記憶部1
05と、記憶装置202との間でデータの送受信を行う
ための記憶装置インタフェース部103と、公衆回線に
接続するための通信処理部110とを有し、記憶装置2
02は、音素データを格納する音素データベース121
と、音声合成目的データを格納する音声合成目的データ
122と、端末装置との間でデータの送受信を行うため
の端末装置インタフェース部120とを有することによ
り、ユーザは所望するキャラクタ音声にてテキストデー
タ等の朗読を聴くことができる。
【0048】(実施の形態2)図4は本発明の実施の形
態2における携帯端末装置を有する通信システムを示す
構成図である。図4において、401は表示部や操作
部、ヘッドフォン・スピーカ等の音声出力部などを備え
た端末装置、402はテキストデータ等の音声合成目的
データ403を記憶するメモリカード等の記憶装置であ
る。記憶装置402は端末装置401とは脱着可能であ
る。405は音声合成目的データ403や音素データ4
04、音声合成処理プログラム406を提供するインタ
ーネット上のサーバ装置である。
【0049】図4の携帯端末装置401、402におい
ては、キャラクタ音声の音素データは端末装置401内
の記憶部に搭載されている。ユーザは、インターネット
上にあるサーバ装置405から自分の所望するキャラク
タ音声の音素データを端末装置401内の記憶部に記憶
させることもできる。また、最新の音声合成処理プログ
ラムをダウンロードして、記憶部にあるプログラムを更
新することも可能である。ユーザは、読み上げ対象の音
声合成目的データが格納された記憶装置402を端末装
置401に挿入して操作することで、自分の所望のキャ
ラクタ音声にて合成音声を聴くことができる。
【0050】図5は、図4の端末装置401と記憶装置
402とを詳細に示すブロック図である。図5におい
て、システム制御部501〜通信処理部510、端末装
置インタフェース部520、音声合成目的データ521
は、図2のシステム制御部101〜通信処理部110、
端末装置インタフェース部120、音声合成目的データ
122と同様のものであるので、その説明は省略する。
【0051】このように構成された携帯端末装置につい
て、その動作を図6を用いて説明する。図6は図5の端
末装置401の動作を示すフローチャートである。ユー
ザが操作部506にて装置401の電源をオンすると、
システム制御部501は記憶装置インタフェース部50
3に指令を出し、記憶装置402が端末装置401に接
続されているか否かを判定する(S601)。接続され
ていない場合は、記憶部505からフォントデータを取
り出し、表示部507に「メモリカードを挿入してくだ
さい」等のようなメッセージを表示し、ユーザに対して
端末装置401に記憶装置402の接続を行うように促
す(S602)。接続されている場合は、「操作メニュ
ー1、再生2、プログラムアップデート3、読み上げ対
象データダウンロード4、キャラクタ音声データダウン
ロード・・」等のメッセージを表示部507に表示する
(S603)。ユーザがプログラムアップデートまたは
キャラクタ音声データダウンロードを選択すると(S6
04)、システム制御部501は、通信処理部510を
通じて、端末装置401が公衆回線と接続されているか
否かを判定し(S606)、接続されていない場合は、
「回線と接続してください」等の接続を促すメッセージ
を表示部507に表示する(S607)。接続されてい
る場合は、通信処理部510を通じ、インターネット上
のサーバ装置405(図4参照)と接続する(S60
8)。
【0052】接続が完了したら、端末装置401のシス
テム制御部501は、サーバ装置405に最新の音声合
成処理プログラムまたはキャラクタ音声データ(該当す
る音素データ)のダウンロードを要求し、サーバ装置4
05から音声合成処理プログラムが送られてくると、音
声合成処理プログラムを記憶部505に記憶し、音声合
成処理プログラムを更新する(S609)。音素データ
が送られてきた場合も同様な手順で行われ、記憶部50
5に記憶される(S609)。そして、ダウンロード完
了のメッセージを表示して、サーバ装置405との呼を
切断する(S611)。
【0053】読み上げ対象データ(音声合成目的デー
タ)のダウンロードが選択された場合(S605)にサ
ーバ装置405に接続してデータをダウンロードするま
での手順は、上述のプログラムアップデートやキャラク
タ音声ダウンロードと同じ手順であるが、読み上げ対象
データのダウンロード時において、システム制御部50
1は、ダウンロードしたデータを、記憶装置インタフェ
ース部503、記憶装置402内の端末装置インタフェ
ース部520を通じて、記憶装置402に記憶する(S
610)。そして、ダウンロード完了のメッセージを表
示し、サーバ装置405との呼を切断する(S61
1)。
【0054】操作部506から再生が選択されると(S
612)、システム制御部501は、表示部507に読
み上げ対象データとキャラクタ音声データのリストを表
示し(S613)、ユーザに読み上げ対象データとキャ
ラクタ音声データとを選択させる。ユーザが選択した
ら、記憶装置インタフェース部503に、記憶装置40
2内にあるユーザが選択した音声合成目的データを読み
出す指令を出す。記憶装置インタフェース部503は、
記憶装置402内にある端末装置インタフェース部52
0とやり取りをしながら音声合成目的データを読み出
し、端末装置401内の記憶部505に記録する(S6
14)。
【0055】次に、システム制御部501は、音声合成
処理部502に指令を出し、処理を開始させる。音声合
成処理部502は、記憶部505から音声合成目的デー
タを順次読み出しながら解析を行い、各データに最も適
する音素データを記憶部505から読み出して繋ぎ合わ
せ、合成音声データを作成し(S615)、その合成音
声データを音声出力処理部504が処理できるデータに
変換して音声出力処理部504に渡す。音声合成処理部
502は、ユーザが操作部506で停止のボタンを押し
て、システム制御部501から処理中止の指示があるま
で、この処理を繰り返す。音声出力処理部504は、音
声合成処理部502から受け取ったデータをフォーマッ
ト変換し、スピーカまたはヘッドフォン508に出力す
る(S616)。
【0056】以上のように本実施の形態によれば、端末
装置401は、全体を制御するシステム制御部501
と、音声合成目的データと音素データとから音声合成処
理プログラムに基づいて音声合成を行う音声合成処理部
502と、音声合成処理プログラムと音素データとを記
憶する記憶部505と、記憶装置402との間でデータ
の送受信を行うための記憶装置インタフェース部503
と、公衆回線に接続するための通信処理部510とを有
し、記憶装置402は、音声合成目的データを格納する
音声合成目的データ521と、端末装置との間でデータ
の送受信を行うための端末装置インタフェース部520
とを有することにより、ユーザは所望するキャラクタ音
声にてテキストデータ等の朗読を聴くことができる。
【0057】(実施の形態3)図7は本発明の実施の形
態3における携帯端末装置を有する通信システムを示す
構成図である。図7において、701は表示部や操作
部、ヘッドフォン・スピーカ等の音声出力部などを備え
た端末装置、702はキャラクタ音声の音素データ70
4を記憶するメモリカード等の記憶装置である。記憶装
置702は端末装置701とは脱着可能である。705
は読み上げ対象の音声合成目的データ703や音素デー
タ704、音声合成処理プログラム706を提供するイ
ンターネット上のサーバ装置である。
【0058】図7の携帯端末装置701、702におい
ては、読み上げ対象データである音声合成目的データは
端末装置701内の記憶部に搭載されている。ユーザ
は、インターネット上にあるサーバ装置705から自分
の所望する音声合成目的データを端末装置701内の記
憶部に記憶させることもできる。また、最新の音声合成
処理プログラムをダウンロードして記憶部にある音声合
成処理プログラムの更新も可能である。ユーザは、キャ
ラクタ音声の音素データが格納された記憶装置702を
端末装置701に挿入して操作することで、自分の所望
のキャラクタ音声にて合成音声を聴くことができる。
【0059】図8は、図7の端末装置701と記憶装置
702とを詳細に示すブロック図である。図8におい
て、システム制御部801〜通信処理部810、端末装
置インタフェース部820、音素データベース821
は、図2のシステム制御部101〜通信処理部110、
端末装置インタフェース部120、音素データベース1
21と同様のものであるので、その説明は省略する。こ
のように構成された携帯端末装置について、その動作を
図9を用いて説明する。図9は図8の端末装置701の
動作を示すフローチャートである。
【0060】ユーザが操作部806にて装置701の電
源をオンすると、システム制御部801は記憶装置イン
タフェース部803に指令を出し、記憶装置702が端
末装置701に接続されているか否かを判定する(S9
01)。接続されていない場合は、記憶部805からフ
ォントデータを取り出し、表示部807に「メモリカー
ドを挿入してください」等のようなメッセージを表示
し、ユーザに対して端末装置701に記憶装置702の
接続を行うように促す(S902)。接続されている場
合は、「操作メニュー1、再生2、プログラムアップデ
ート3、読み上げ対象データダウンロード4、キャラク
タ音声データダウンロード・・」等のメッセージを表示
部807に表示する(S903)。ユーザがプログラム
アップデートまたは読み上げ対象データダウンロードを
選択すると(S904)、システム制御部801は、通
信処理部810を通じて、端末装置701が公衆回線と
接続されているか否かを判定し(S906)、接続され
ていない場合は、「回線と接続してください」等の接続
を促すメッセージを表示部807に表示する(S90
7)。接続されている場合は、通信処理部810を通
じ、インターネット上のサーバ装置705(図7参照)
と接続する(S38)。
【0061】接続が完了すると、端末装置701のシス
テム制御部801は、サーバ装置705に最新の音声合
成処理プログラムまたは読み上げ対象データ(該当する
音声合成目的データ)のダウンロードを要求し、サーバ
装置705から音声合成処理プログラムが送られてくる
と、音声合成処理プログラムを記憶部805に記憶し、
音声合成処理プログラムを更新する(S909)。音声
合成目的データが送られてきた場合も同様な手順で行わ
れ、記憶部805に記憶される(S909)。そして、
ダウンロード完了のメッセージを表示して、サーバ装置
705との呼を切断する(S911)。
【0062】キャラクタ音声データ(該当する音素デー
タ)のダウンロードが選択された場合(S905)にサ
ーバ装置705に接続してデータをダウンロードするま
での手順は、上述のプログラムアップデートや読み上げ
対象データダウンロードと同じ手順であるが、キャラク
タ音声データのダウンロード時において、システム制御
部801は、ダウンロードしたデータを、記憶装置イン
タフェース部803、記憶装置702内の端末装置イン
タフェース部820を通じて、記憶装置702に記憶す
る(S910)。そして、ダウンロード完了のメッセー
ジを表示し、サーバ装置705との呼を切断する(S9
11)。
【0063】操作部806から再生が選択されると(S
912)、システム制御部801は、表示部807に読
み上げ対象データとキャラクタ音声データのリストを表
示し(S913)、ユーザに読み上げ対象データとキャ
ラクタ音声データとを選択させる。ユーザが選択した
ら、システム制御部801は、音声合成処理部802に
指令を出し、処理を開始させる。音声合成処理部802
は、記憶部805から音声合成目的データを順次読み出
しながら解析を行い、各データに最も適する音素データ
を記憶装置702から読み出して繋ぎ合わせ、合成音声
データを作成し(S914)、その合成音声データを音
声出力処理部804が処理できるデータに変換して音声
出力処理部804に渡す。音声合成処理部802は、ユ
ーザが操作部806で停止のボタンを押して、システム
制御部801から処理中止の指示があるまで、この処理
を繰り返す。音声出力処理部804は、音声合成処理部
802から受け取ったデータをフォーマット変換し、ス
ピーカまたはヘッドフォン508に出力する(S91
5)。
【0064】以上のように本実施の形態によれば、端末
装置701は、全体を制御するシステム制御部801
と、音声合成目的データと音素データとから音声合成処
理プログラムに基づいて音声合成を行う音声合成処理部
802と、音声合成処理プログラムと音声合成目的デー
タとを記憶する記憶部805と、記憶装置702との間
でデータの送受信を行うための記憶装置インタフェース
部803と、公衆回線に接続するための通信処理部81
0とを有し、記憶装置702は、音素データを格納する
音素データベース821と、端末装置701との間でデ
ータの送受信を行うための端末装置インタフェース部8
20とを有することにより、ユーザは所望するキャラク
タ音声にてテキストデータ等の朗読を聴くことができ
る。
【0065】(実施の形態4)図10は本発明の実施の
形態4における携帯端末装置を有する通信システムを示
す構成図である。図10において、1001は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、1002は読み上げ対象の音声合成目
的データ1003とキャラクタ音声の音素データ100
4と音声合成処理プログラム1006とを記憶するメモ
リカード等の記憶装置である。記憶装置1002は端末
装置1001とは脱着可能である。1005は読み上げ
対象の音声合成目的データ1003や音素データ100
4、音声合成処理プログラム1006を提供するインタ
ーネット上のサーバ装置である。
【0066】図10の携帯端末装置1001、1002
において、ユーザは、音声合成処理プログラムと読み上
げ対象の音声合成目的データとキャラクタ音声の音素デ
ータとを格納する記憶装置1002を端末装置1001
に挿入して操作することで、自分の所望のキャラクタ音
声にてテキストの朗読を聴くことができる。
【0067】図11は、図10の端末装置1001と記
憶装置1002とを詳細に示すブロック図である。図1
1において、システム制御部1101、記憶装置インタ
フェース部1103、音声出力処理部1104〜通信処
理部1110、端末装置インタフェース部1120、音
素データベース1122、音声合成目的データ1123
は、図2のシステム制御部101、記憶装置インタフェ
ース部103、音声出力処理部104〜通信処理部11
0、端末装置インタフェース部120、音素データベー
ス121、音声合成目的データ122と同様のものであ
るので、その説明は省略する。1121は音声合成処理
プログラムを保持する音声合成処理部である。
【0068】このように構成された携帯端末装置につい
て、その動作を図12を用いて説明する。図12は端末
装置1001の動作を示すフローチャートである。
【0069】ユーザが操作部1106にて装置1001
の電源をオンすると、システム制御部1101は記憶装
置インタフェース部1103に指令を出し、記憶装置1
002が端末装置1001に接続されているか否かを判
定する(S1201)。接続されていない場合は、記憶
部1105からフォントデータを取り出し、表示部11
07に「メモリカードを挿入してください」等のような
メッセージを表示し、ユーザに対して端末装置1001
に記憶装置1002の接続を行うように促す(S120
2)。接続されている場合は、「操作メニュー1、再生
2、プログラムアップデート3、読み上げ対象データダ
ウンロード4、キャラクタ音声データダウンロード・
・」等のメッセージを表示部1107に表示する(S1
203)。ユーザが再生以外を選択すると(S120
5)、システム制御部1101は、通信処理部1110
を通じて、端末装置1001が公衆回線と接続されてい
るか否かを判定し(S1206)、接続されていない場
合は、「回線と接続してください」等の接続を促すメッ
セージを表示部1107に表示する(S1207)。接
続されている場合は、通信処理部1110を通じ、イン
ターネット上のサーバ装置1005(図10参照)と接
続する(S1208)。
【0070】接続が完了すると、端末装置1001のシ
ステム制御部1101は、選択された操作内容に従い、
サーバ装置1005に最新の音声合成処理プログラム、
キャラクタ音声データ(該当する音素データ)または読
み上げ対象データ(音声合成目的データ)のダウンロー
ドを要求する。そして、サーバ装置1005から音声合
成処理プログラムが送られてくると、音声合成処理プロ
グラムを記憶部1105に記憶し、音声合成処理プログ
ラムを更新する(S1209)。音素データや読み上げ
対象データが送られてきた場合も同様な手順で行われ、
記憶部1105に記憶される(S1210)。そして、
ダウンロード完了のメッセージを表示して、サーバ装置
1005との呼を切断する(S1211)。
【0071】操作部1106から再生が選択されると
(S1212)、システム制御部1101は、表示部1
107に読み上げ対象データとキャラクタ音声データの
リストを表示し(S1213)、ユーザに読み上げ対象
データとキャラクタ音声データとを選択させる。ユーザ
が選択したら、記憶装置インタフェース部1103に、
記憶装置1002内にある音声合成処理プログラムとユ
ーザが選択した音声合成目的データとを読み出す指令を
出す。記憶装置インタフェース部1103は、記憶装置
1002内にある端末装置インタフェース部1120と
やり取りをしながら音声合成処理プログラムと音声合成
目的データとを読み出し、端末装置1001内の記憶部
1105に記録する(S1214)。
【0072】次に、システム制御部1101は、音声合
成処理部1102に指令を出し、処理を開始させる。音
声合成処理部1102は、記憶部1105から音声合成
目的データを順次読み出しながら解析を行い、各データ
に最も適する音素データを記憶装置1002から読み出
して繋ぎ合わせ、合成音声データを作成し(S121
5)、その合成音声データを音声出力処理部1104が
処理できるデータに変換して音声出力処理部1104に
渡す。音声合成処理部1102は、ユーザが操作部11
06で停止のボタンを押して、システム制御部1101
から処理中止の指示があるまで、この処理を繰り返す。
音声出力処理部1104は、音声合成処理部1102か
ら受け取ったデータをフォーマット変換し、スピーカま
たはヘッドフォン1108に出力する(S1216)。
【0073】以上のように本実施の形態によれば、端末
装置1001は、全体を制御するシステム制御部110
1と、音声合成処理プログラムを記憶する記憶部110
5と、記憶装置1002との間でデータの送受信を行う
ための記憶装置インタフェース部1103と、公衆回線
に接続するための通信処理部1110とを有し、記憶装
置1002は、音声合成目的データと音素データとから
音声合成処理プログラムに基づいて音声合成を行うと共
に音声合成処理プログラムを格納する音声合成処理部1
121と、音素データを格納する音素データベース11
22と、音声合成目的データを格納する音声合成目的デ
ータ1123と、端末装置1001との間でデータの送
受信を行うための端末装置インタフェース部1120と
を有することにより、ユーザは所望するキャラクタ音声
にてテキストデータ等の朗読を聴くことができる。
【0074】(実施の形態5)図13は本発明の実施の
形態5における携帯端末装置を有する通信システムを示
す構成図である。図13において、1301は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、1302は読み上げ対象の音声合成目
的データ1303と音声合成処理プログラム1306と
を記憶するメモリカード等の記憶装置である。記憶装置
1302は端末装置1301とは脱着可能である。13
05は読み上げ対象の音声合成目的データ1303や音
素データ1304、音声合成処理プログラム1306を
提供するインターネット上のサーバ装置である。
【0075】図13の携帯端末装置1301、1302
においては、キャラクタ音声の音素データは端末装置1
301内の記憶部に搭載されている。ユーザは、インタ
ーネット上にあるサーバ装置1305から自分の所望す
るキャラクタ音声の音素データを端末装置1301内の
記憶部に記憶させることもできる。また、最新の音声合
成処理プログラム1306をダウンロードして、記憶装
置1302にある音声合成処理プログラムの更新も可能
である。ユーザは、読み上げ対象の音声合成目的データ
が格納された記憶装置1302を端末装置1301に挿
入して操作することで、自分の所望のキャラクタ音声に
て合成音声を聴くことができる。
【0076】図14は、図13の端末装置1301と記
憶装置1302とを詳細に示すブロック図である。図1
4において、システム制御部1401、記憶装置インタ
フェース部1403、音声出力処理部1404〜通信処
理部1410、端末装置インタフェース部1420、音
声合成目的データ1423は、図2のシステム制御部1
01、記憶装置インタフェース部103、音声出力処理
部104〜通信処理部110、端末装置インタフェース
部120、音声合成目的データ122と同様のものであ
るので、その説明は省略する。1421は音声合成処理
プログラムを保持する音声合成処理部である。
【0077】このように構成された携帯端末装置につい
て、その動作を図15を用いて説明する。図15は端末
装置1301の動作を示すフローチャートである。
【0078】ユーザが操作部1406にて装置1301
の電源をオンすると、システム制御部1401は記憶装
置インタフェース部1403に指令を出し、記憶装置1
302が端末装置1301に接続されているか否かを判
定する(S1501)。接続されていない場合は、記憶
部1405からフォントデータを取り出し、表示部14
07に「メモリカードを挿入してください」等のような
メッセージを表示し、ユーザに対して端末装置1301
に記憶装置1302の接続を行うように促す(S150
2)。接続されている場合は、「操作メニュー1、再生
2、プログラムアップデート3、読み上げ対象データダ
ウンロード4、キャラクタ音声データダウンロード・
・」等のメッセージを表示部1407に表示する(S1
503)。ユーザがキャラクタ音声データダウンロード
を選択すると(S1504)、システム制御部1401
は、通信処理部1410を通じて、端末装置1301が
公衆回線と接続されているか否かを判定し(S150
6)、接続されていない場合は、「回線と接続してくだ
さい」等の接続を促すメッセージを表示部1407に表
示する(S1507)。接続されている場合は、通信処
理部1410を通じ、インターネット上のサーバ装置1
305(図13参照)と接続する(S1508)。
【0079】接続が完了すると、端末装置1301のシ
ステム制御部1401は、サーバ装置1305にキャラ
クタ音声データ(該当する音素データ)のダウンロード
を要求し、サーバ装置1305からキャラクタ音声デー
タが送られてくると、キャラクタ音声データを記憶部1
405に記憶する(S1509)。そして、ダウンロー
ド完了のメッセージを表示して、サーバ装置1305と
の呼を切断する(S1511)。
【0080】プログラムアップデートまたは読み上げ対
象データ(音声合成目的データ)のダウンロードが選択
された場合(S1505)にサーバ装置1305に接続
してデータをダウンロードするまでの手順は、上述のキ
ャラクタ音声ダウンロードと同じ手順であるが、この場
合、システム制御部1401は、ダウンロードしたデー
タを、記憶装置インタフェース部1403、記憶装置1
302内の端末装置インタフェース部1420を通じ
て、記憶装置1302に記憶する(S1510)。そし
て、ダウンロード完了のメッセージを表示し、サーバ装
置1305との呼を切断する(S1511)。
【0081】操作部1406から再生が選択されると
(S1512)、システム制御部1401は、表示部1
407に読み上げ対象データとキャラクタ音声データの
リストを表示し(S1513)、ユーザに読み上げ対象
データとキャラクタ音声データとを選択させる。ユーザ
が選択したら、記憶装置インタフェース部1403に、
記憶装置1302内にあるユーザが選択した音声合成目
的データを読み出す指令を出す。記憶装置インタフェー
ス部1403は、記憶装置1302内にある端末装置イ
ンタフェース部1420とやり取りをしながら音声合成
目的データを読み出し、端末装置1301内の記憶部1
405に記録する(S1514)。次に、システム制御
部1401は、音声合成処理部1402に指令を出し、
処理を開始させる。音声合成処理部1402は、記憶部
1405から音声合成目的データを順次読み出しながら
解析を行い、各データに最も適する音素データを記憶部
1405から読み出して繋ぎ合わせ、合成音声データを
作成し(S1515)、その合成音声データを音声出力
処理部1404が処理できるデータに変換して音声出力
処理部1404に渡す。音声合成処理部1402は、ユ
ーザが操作部1406で停止のボタンを押して、システ
ム制御部1401から処理中止の指示があるまで、この
処理を繰り返す。音声出力処理部1404は、音声合成
処理部1402から受け取ったデータをフォーマット変
換し、スピーカまたはヘッドフォン1408に出力する
(S1516)。
【0082】以上のように本実施の形態によれば、端末
装置1301は、全体を制御するシステム制御部140
1と、音声合成処理プログラムと音素データとを記憶す
る記憶部1405と、記憶装置1302との間でデータ
の送受信を行うための記憶装置インタフェース部140
3と、公衆回線に接続するための通信処理部1410と
を有し、記憶装置1302は、音声合成目的データと音
素データとから音声合成処理プログラムに基づいて音声
合成を行うと共に音声合成処理プログラムを格納する音
声合成処理部1421と、音声合成目的データを格納す
る音声合成目的データ1423と、端末装置との間でデ
ータの送受信を行うための端末装置インタフェース部1
420とを有することにより、ユーザは所望するキャラ
クタ音声にてテキストデータ等の朗読を聴くことができ
る。
【0083】(実施の形態6)図16は本発明の実施の
形態6における携帯端末装置を有する通信システムを示
す構成図である。図16において、1601は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、1602は音素データ1604と音声
合成処理プログラム1606とを記憶するメモリカード
等の記憶装置である。記憶装置1602は端末装置16
01とは脱着可能である。1605は読み上げ対象の音
声合成目的データ1603や音素データ1604、音声
合成処理プログラム1606を提供するインターネット
上のサーバ装置である。
【0084】図16の携帯端末装置1601、1602
においては、読み上げ対象データの音声合成目的データ
は端末装置1601内の記憶部に搭載されている。ユー
ザは、インターネット上にあるサーバ装置1605から
自分の所望する音声合成目的データを端末装置1601
内の記憶部に記憶させることもできる。また、最新の音
声合成処理プログラムをダウンロードして記憶装置にあ
る音声合成処理プログラムの更新も可能である。ユーザ
は、音声キャラクタの音素データが格納された記憶装置
1602を端末装置1601に挿入して操作すること
で、自分の所望のキャラクタ音声にて合成音声を聴くこ
とができる。
【0085】図17は、図16の端末装置1601と記
憶装置1602とを詳細に示すブロック図である。図1
7において、システム制御部1701、記憶装置インタ
フェース部1703、音声出力処理部1704〜通信処
理部1710、端末装置インタフェース部1720、音
素データベース1722は、図2のシステム制御部10
1、記憶装置インタフェース部103、音声出力処理部
104〜通信処理部110、端末装置インタフェース部
120、音素データベース121と同様のものであるの
で、その説明は省略する。1721は音声合成処理プロ
グラムを保持する音声合成処理部である。
【0086】このように構成された携帯端末装置につい
て、その動作を図18を用いて説明する。図18は端末
装置1601の動作を示すフローチャートである。ユー
ザが操作部1706にて装置1601の電源をオンする
と、システム制御部1701は記憶装置インタフェース
部1703に指令を出し、記憶装置1602が端末装置
1601に接続されているか否かを判定する(S180
1)。接続されていない場合は、記憶部1705からフ
ォントデータを取り出し、表示部1707に「メモリカ
ードを挿入してください」等のようなメッセージを表示
し、ユーザに対して端末装置1601に記憶装置160
2の接続を行うように促す(S1802)。接続されて
いる場合は、「操作メニュー1、再生2、プログラムア
ップデート3、読み上げ対象データダウンロード4、キ
ャラクタ音声データダウンロード・・」等のメッセージ
を表示部1707に表示する(S1803)。
【0087】ユーザが読み上げ対象データダウンロード
を選択すると(S1804)、システム制御部1701
は、通信処理部1710を通じて、端末装置1601が
公衆回線と接続されているか否かを判定し(S180
6)、接続されていない場合は、「回線と接続してくだ
さい」等の接続を促すメッセージを表示部1707に表
示する(S1807)。接続されている場合は、通信処
理部1710を通じ、インターネット上のサーバ装置1
605(図16参照)と接続する(S1808)。
【0088】接続が完了すると、端末装置1601のシ
ステム制御部1701は、サーバ装置1605に読み上
げ対象データ(該当する音声合成目的データ)のダウン
ロードを要求し、サーバ装置1605から読み上げ対象
データが送られてくると、読み上げ対象データを記憶部
1705に記憶する(S1809)。そして、ダウンロ
ード完了のメッセージを表示して、サーバ装置1605
との呼を切断する(S1811)。
【0089】プログラムアップデートまたはキャラクタ
音声データ(該当する音素データ)のダウンロードが選
択された場合(S1805)にサーバ装置1605に接
続してデータをダウンロードするまでの手順は、上述の
読み上げ対象データダウンロードと同じ手順であるが、
この場合、システム制御部1701は、ダウンロードし
たデータを、記憶装置インタフェース部1703、記憶
装置1602内の端末装置インタフェース部1720を
通じて、記憶装置1602に記憶する(S1810)。
そして、ダウンロード完了のメッセージを表示し、サー
バ装置1605との呼を切断する(S1811)。
【0090】操作部1706から再生が選択されると
(S1812)、システム制御部1701は、表示部1
707に読み上げ対象データとキャラクタ音声データの
リストを表示し(S1813)、ユーザに読み上げ対象
データとキャラクタ音声データとを選択させる。ユーザ
が選択したら、システム制御部1701は、音声合成処
理部1721に指令を出し、処理を開始させる。音声合
成処理部1702は、記憶部1705から音声合成目的
データを順次読み出しながら解析を行い、各データに最
も適する音素データを記憶装置1602から読み出して
繋ぎ合わせ、合成音声データを作成し(S1814)、
その合成音声データを音声出力処理部1704が処理で
きるデータに変換して音声出力処理部1704に渡す。
音声合成処理部1702は、ユーザが操作部1706で
停止のボタンを押して、システム制御部1701から処
理中止の指示があるまで、この処理を繰り返す。音声出
力処理部1704は、音声合成処理部1702から受け
取ったデータをフォーマット変換し、スピーカまたはヘ
ッドフォン1708に出力する(S1815)。
【0091】以上のように本実施の形態によれば、端末
装置1601は、全体を制御するシステム制御部170
1と、音声合成処理プログラムと音声合成目的データと
を記憶する記憶部1705と、記憶装置1602との間
でデータの送受信を行うための記憶装置インタフェース
部1703と、公衆回線に接続するための通信処理部1
710とを有し、記憶装置1602は、音声合成目的デ
ータと音素データとから音声合成処理プログラムに基づ
いて音声合成を行うと共に音声合成処理プログラムを格
納する音声合成処理部1721と、音素データを格納す
る音素データベース1722と、端末装置1601との
間でデータの送受信を行うための端末装置インタフェー
ス部1720とを有することにより、ユーザは所望する
キャラクタ音声にてテキストデータ等の朗読を聴くこと
ができる。
【0092】(実施の形態7)図19は本発明の実施の
形態7における携帯端末装置を有する通信システムを示
す構成図である。図19において、1901は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、1902は音声合成処理プログラム1
906を記憶するメモリカード等の記憶装置である。記
憶装置1902は端末装置1901とは脱着可能であ
る。1905は読み上げ対象の音声合成目的データ19
03や音素データ1904、音声合成処理プログラム1
906を提供するインターネット上のサーバ装置であ
る。
【0093】図19の携帯端末装置1901、1902
においては、読み上げ対象データの音声合成目的データ
およびキャラクタ音声の音素データは端末装置1901
内の記憶部に搭載されている。ユーザは、インターネッ
ト上にあるサーバ装置1905から自分の所望する音声
合成目的データや音素データをダウンロードして端末装
置1901内の記憶部に記憶させることもできる。ま
た、最新の音声合成処理プログラムをダウンロードして
記憶装置1902にある音声合成処理プログラムの更新
も可能である。ユーザは、音声合成処理プログラムが搭
載された記憶装置1902を端末装置1901に挿入し
て操作することで、自分の所望のキャラクタ音声にて合
成音声を聴くことができる。
【0094】図20は、図19の端末装置1901と記
憶装置1902とを詳細に示すブロック図である。図2
0において、システム制御部2001、記憶装置インタ
フェース部2003、音声出力処理部2004〜通信処
理部2010、端末装置インタフェース部2020は、
図2のシステム制御部101、記憶装置インタフェース
部103、音声出力処理部104〜通信処理部110、
端末装置インタフェース部120と同様のものであるの
で、その説明は省略する。2021は音声合成処理プロ
グラムを保持する音声合成処理部である。
【0095】このように構成された携帯端末装置につい
て、その動作を図21を用いて説明する。図21は端末
装置1901の動作を示すフローチャートである。ユー
ザが操作部2006にて装置1901の電源をオンする
と、システム制御部2001は記憶装置インタフェース
部2003に指令を出し、記憶装置1902が端末装置
1901に接続されているか否かを判定する(S210
1)。接続されていない場合は、記憶部2005からフ
ォントデータを取り出し、表示部2007に「メモリカ
ードを挿入してください」等のようなメッセージを表示
し、ユーザに対して端末装置1901に記憶装置190
2の接続を行うように促す(S2102)。
【0096】接続されている場合は、「操作メニュー
1、再生2、プログラムアップデート3、読み上げ対象
データダウンロード4、キャラクタ音声データダウンロ
ード・・」等のメッセージを表示部2007に表示する
(S2103)。ユーザが読み上げ対象データやキャラ
クタ音声データのダウンロードを選択すると(S210
4)、システム制御部2001は、通信処理部2010
を通じて、端末装置1901が公衆回線と接続されてい
るか否かを判定し(S2106)、接続されていない場
合は、「回線と接続してください」等の接続を促すメッ
セージを表示部2007に表示する(S2107)。接
続されている場合は、通信処理部2010を通じ、イン
ターネット上のサーバ装置1905(図19参照)と接
続する(S2108)。
【0097】接続が完了すると、端末装置1901のシ
ステム制御部2001は、操作の選択に従い、サーバ装
置1905に読み上げ対象データ(該当する音声合成目
的データ)やキャラクタ音声データ(該当する音素デー
タ)のダウンロードを要求し、サーバ装置1905から
読み上げ対象データやキャラクタ音声データが送られて
くると、読み上げ対象データやキャラクタ音声データを
記憶部2005に記憶する(S2109)。そして、ダ
ウンロード完了のメッセージを表示して、サーバ装置1
905との呼を切断する(S2111)。
【0098】プログラムアップデートが選択された場合
(S2105)にサーバ装置1905に接続してデータ
をダウンロードするまでの手順は、上述の読み上げ対象
データやキャラクタ音声データのダウンロードと同じ手
順であるが、この場合、システム制御部2001は、ダ
ウンロードしたデータを、記憶装置インタフェース部2
003、記憶装置1902内の端末装置インタフェース
部2020を通じて、記憶装置1902に記憶し、音声
合成処理プログラムを更新する(S2110)。そし
て、ダウンロード完了のメッセージを表示し、サーバ装
置1905との呼を切断する(S2111)。
【0099】操作部2006から再生が選択されると
(S2112)、システム制御部2001は、表示部2
007に読み上げ対象データとキャラクタ音声データの
リストを表示し(S2113)、ユーザに読み上げ対象
データとキャラクタ音声データとを選択させる。ユーザ
が選択したら、システム制御部2001は、記憶装置1
902から音声合成処理プログラムを読み出し、記憶部
2005に記憶する(S2114)。次に、システム制
御部2001は、音声合成処理部2021に指令を出
し、処理を開始させる。音声合成処理部2021は、記
憶部2005から音声合成目的データを順次読み出しな
がら解析を行い、各データに最も適する音素データを記
憶部2005から読み出して繋ぎ合わせ、合成音声デー
タを作成し(S2115)、その合成音声データを音声
出力処理部2004が処理できるデータに変換して音声
出力処理部2004に渡す。音声合成処理部2021
は、ユーザが操作部2006で停止のボタンを押して、
システム制御部2001から処理中止の指示があるま
で、この処理を繰り返す。音声出力処理部2004は、
音声合成処理部2021から受け取ったデータをフォー
マット変換し、スピーカまたはヘッドフォン2008に
出力する(S2116)。
【0100】以上のように本実施の形態によれば、端末
装置1901は、全体を制御するシステム制御部200
1と、音声合成処理プログラムと音声合成目的データと
音素データとを記憶する記憶部2005と、記憶装置1
902との間でデータの送受信を行うための記憶装置イ
ンタフェース部2003と、公衆回線に接続するための
通信処理部2010とを有し、記憶装置1902は、音
声合成目的データと音素データとから音声合成処理プロ
グラムに基づいて音声合成を行うと共に音声合成処理プ
ログラムを格納する音声合成処理部2021と、端末装
置1901との間でデータの送受信を行うための端末装
置インタフェース部2020とを有することにより、ユ
ーザは所望するキャラクタ音声にてテキスト等の朗読を
聴くことができる。
【0101】(実施の形態8)図22は本発明の実施の
形態8における携帯端末装置を有する通信システムを示
す構成図である。図22において、2201は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、2202はメモリカード等の記憶装置
である。記憶装置2202は端末装置2201とは脱着
可能である。2205は読み上げ対象の音声合成目的デ
ータ2203や音素データ2204、音声合成処理プロ
グラム2206を提供するインターネット上のサーバ装
置である。
【0102】図22の携帯端末装置2201、2202
においては、読み上げ対象データの音声合成目的データ
およびキャラクタ音声の音素データは端末装置1901
内の記憶部に搭載されている。ユーザは、インターネッ
ト上にあるサーバ装置1905から自分の所望する音声
合成目的データや音素データをダウンロードして端末装
置1901内の記憶部に記憶させることもできる。ま
た、最新の音声合成処理プログラムをダウンロードして
端末装置1901にある音声合成処理プログラムの更新
も可能である。ユーザは、端末装置を操作し、自分の所
望のキャラクタ音声にて合成音声を聴くことができる。
【0103】図23は、図22の端末装置2201と記
憶装置2202とを詳細に示すブロック図である。図2
3において、システム制御部2301、記憶装置インタ
フェース部2303、音声出力処理部2304〜通信処
理部2310、端末装置インタフェース部2320は、
図2のシステム制御部101、記憶装置インタフェース
部103、音声出力処理部104〜通信処理部110、
端末装置インタフェース部120と同様のものであるの
で、その説明は省略する。
【0104】このように構成された携帯端末装置につい
て、その動作を図24を用いて説明する。図24は端末
装置2201の動作を示すフローチャートである。ユー
ザが操作部2306にて装置2201の電源をオンする
と、システム制御部2301は「操作メニュー1、再生
2、プログラムアップデート3、読み上げ対象データダ
ウンロード4、キャラクタ音声データダウンロード・
・」等のメッセージを表示部2307に表示する(S2
401)。ユーザが読み上げ対象データやキャラクタ音
声データのダウンロードまたはプログラムアップデート
を選択すると(S2402)、システム制御部2301
は、通信処理部2310を通じて、端末装置2201が
公衆回線と接続されているか否かを判定し(S240
3)、接続されていない場合は、「回線と接続してくだ
さい」等の接続を促すメッセージを表示部2307に表
示する(S2404)。接続されている場合は、通信処
理部2310を通じ、インターネット上のサーバ装置2
205(図22参照)と接続する(S2405)。
【0105】接続が完了すると、端末装置2201のシ
ステム制御部2301は、操作の選択に従い、サーバ装
置2205に読み上げ対象データ(該当する音声合成目
的データ)やキャラクタ音声データ(該当する音素デー
タ)や最新の音声合成処理プログラムのダウンロードを
要求し、サーバ装置2205から読み上げ対象データや
キャラクタ音声データまたはプログラムが送られてくる
と、記憶部2305に記憶する(S2406)。そし
て、ダウンロード完了のメッセージを表示して、サーバ
装置2205との呼を切断する(S2407)。
【0106】操作部2306から再生が選択されると
(S2408)、システム制御部2301は、表示部2
307に読み上げ対象データとキャラクタ音声データの
リストを表示し(S2409)、ユーザに読み上げ対象
データとキャラクタ音声データとを選択させる。ユーザ
が選択したら、システム制御部2301は、音声合成処
理部2302に指令を出し、処理を開始させる。音声合
成処理部2302は、記憶部2305から音声合成目的
データを順次読み出しながら解析を行い、各データに最
も適する音素データを記憶部2305から読み出して繋
ぎ合わせ、合成音声データを作成し(S2410)、そ
の合成音声データを音声出力処理部2304が処理でき
るデータに変換して音声出力処理部2304に渡す。音
声合成処理部2302は、ユーザが操作部2306で停
止のボタンを押して、システム制御部2301から処理
中止の指示があるまで、この処理を繰り返す。音声出力
処理部2304は、音声合成処理部2302から受け取
ったデータをフォーマット変換し、スピーカまたはヘッ
ドフォン2308に出力する(S2411)。
【0107】以上のように本実施の形態によれば、端末
装置2201は、全体を制御するシステム制御部230
1と、音声合成処理プログラムと音声合成目的データと
音素データとを記憶する記憶部2305と、記憶装置2
202との間でデータの送受信を行うための記憶装置イ
ンタフェース部2203と、公衆回線に接続するための
通信処理部2210と音声合成目的データと音素データ
とから音声合成処理プログラムに基づいて音声合成を行
う音声合成処理部2302を有し、記憶装置2202
は、端末装置2201との間でデータの送受信を行うた
めの端末装置インタフェース部2320とを有すること
により、ユーザは所望するキャラクタ音声にてテキスト
データの朗読を聴くことができる。
【0108】(実施の形態9)図25は本発明の実施の
形態9における携帯端末装置を有する通信システムを示
す構成図である。図25において、2501は表示部や
操作部、ヘッドフォン・スピーカ等の音声出力部などを
備えた端末装置、2502はキャラクタ音声の音素デー
タや読み上げ対象である音声合成目的データ、音声合成
処理プログラムを記憶することが可能で、かつインター
ネット上の通信を実現する通信処理部を内蔵したメモリ
カード等の記憶装置である。記憶装置2502は端末装
置2501とは脱着可能である。2505は読み上げ対
象の音声合成目的データ2503や音素データ250
4、音声合成処理プログラム2506を提供するインタ
ーネット上のサーバ装置である。
【0109】図25の携帯端末装置2501、2502
においては、通信処理部が内蔵された記憶装置2502
を端末装置2501に挿入して記憶装置2502の通信
処理部を通じてインターネット上のサーバ装置2505
から音声合成処理プログラムや音声合成目的データ、音
素データを記憶装置2502上あるいは端末装置250
1の記憶部に取り込んで操作することで、自分の所望の
キャラクタ音声にて読み上げ対象の合成音声を聴くこと
ができる。
【0110】図26は、図25の端末装置2501と記
憶装置2502とを詳細に示すブロック図である。図2
6において、システム制御部2601、記憶装置インタ
フェース部2603、音声合成処理部2602〜電源部
2609、端末装置インタフェース部2620は、図2
のシステム制御部101、記憶装置インタフェース部1
03、音声出力処理部104〜電源部109、端末装置
インタフェース部120と同様のものであるので、その
説明は省略する。2610はインターネット上のサーバ
装置との通信を実現する記憶装置内蔵の通信処理部であ
る。
【0111】このように構成された携帯端末装置につい
て、その動作を説明する。ユーザが操作部2606にて
装置2501の電源をオンすると、システム制御部26
01は記憶装置インタフェース部2603に指令を出
し、記憶装置2502が端末装置2501に接続されて
いるか否かを判定する。接続されていない場合は、記憶
部2605からフォントデータを取り出し、表示部26
07に「メモリカードを挿入してください」等のような
メッセージを表示し、ユーザに対して端末装置2501
に記憶装置2502の接続を行うように促す。接続され
ている場合は、「操作メニュー1、再生2、プログラム
アップデート3、読み上げ対象データダウンロード4、
キャラクタ音声データダウンロード・・」等のメッセー
ジを表示部2607に表示する。ユーザが再生以外を選
択すると、システム制御部2601は、通信処理部26
10を通じて、端末装置2501が公衆回線と接続され
ているか否かを判定し、接続されていない場合は、「回
線と接続してください」等の接続を促すメッセージを表
示部2607に表示する。接続されている場合は、通信
処理部2610を通じ、インターネット上のサーバ装置
2505(図25参照)と接続する。
【0112】接続が完了すると、端末装置2501のシ
ステム制御部2601は、操作の選択に従い、サーバ装
置2505に読み上げ対象データ(該当する音声合成目
的データ)やキャラクタ音声データ(該当する音素デー
タ)、音声合成処理プログラムのダウンロードを要求
し、サーバ装置2505から読み上げ対象データやキャ
ラクタ音声データ、音声合成処理プログラムが送られて
くると、各データを記憶部2605や記憶装置2502
に記憶する。そして、ダウンロード完了のメッセージを
表示して、サーバ装置2505との呼を切断する。
【0113】操作部2606から再生が選択された場
合、音声合成音が出力されるまでの内部の動作は、音声
合成処理プログラムや音声合成目的データ、音素データ
の各々が記憶装置2502および端末装置2501の記
憶部2605のどちらに記録されたかで異なってくる
が、その記録形態は実施の形態1〜実施の形態7(図
3、図6、図9、図12、図15、図18、図21)の
どれかに合致するので、その説明は省略する。
【0114】以上のように本実施の形態によれば、端末
装置2501の通信処理部を無くして、記憶装置250
2に通信処理部2610を備えたことにより、端末装置
2501においては通信処理部を不要とすることができ
るので、端末装置2501を簡単な構成にすることがで
き、端末装置2501のコストダウンを図ることができ
る。
【0115】(実施の形態10)図27は本発明の実施
の形態10における携帯端末装置を有する通信システム
を示す構成図である。図27において、2701は表示
部や操作部、ヘッドフォン・スピーカ等の音声出力部な
どを備えた端末装置、2702はキャラクタ音声の音素
データや読み上げ対象である音声合成目的データ、音声
合成処理プログラムを記憶することが可能で、かつイン
ターネット上の通信を実現する通信処理部と通信処理部
を制御する記憶制御部を内蔵したメモリカード等の記憶
装置である。記憶装置2702は端末装置2701とは
脱着可能である。2705は読み上げ対象の音声合成目
的データ2703や音素データ2704、音声合成処理
プログラム2706を提供するインターネット上のサー
バ装置である。
【0116】図27の携帯端末装置2701、記憶装置
2702においては、通信処理部と通信処理部を制御す
る記憶制御部が搭載され、記憶装置2702単体でイン
ターネット上のサーバ装置2705から音声合成処理プ
ログラムや音声合成目的データ、音素データがダウンロ
ード可能であり、これらデータを記憶装置2702上あ
るいは端末装置2701の記憶部に取り込んで操作する
ことで、自分の所望のキャラクタ音声にて読み上げ対象
の合成音声を聴くことができる。
【0117】図28は、図27の端末装置2701と記
憶装置2702とを詳細に示すブロック図である。図2
8において、システム制御部2801、記憶装置インタ
フェース部2803、音声合成処理部2802〜電源部
2809、端末装置インタフェース部2820は、図2
のシステム制御部101、記憶装置インタフェース部1
03、音声出力処理部104〜電源部109、端末装置
インタフェース部120と同様のものであるので、その
説明は省略する。2810はインターネット上のサーバ
装置2705との通信を実現する記憶装置内蔵の通信処
理部、2821は通信処理部2810を制御する記憶制
御部、2822は記憶装置単体で通信を行う際の情報を
表示し、ユーザインターフェースを実現する記憶装置2
702上にある記憶表示部、2823は記憶装置単体で
のユーザインターフェースを実現する記憶操作部であ
る。
【0118】このように構成された携帯端末装置につい
て、その動作を説明する。ユーザが記憶操作部2823
にて記憶装置2702の電源をオンすると、記憶制御部
2821は記憶表示部2822に、「操作メニュー1、
再生2、プログラムアップデート3、読み上げ対象デー
タダウンロード4、キャラクタ音声データダウンロード
・・」等のメッセージを表示する。ユーザが各操作を選
択すると、記憶制御部2821は、通信処理部2810
を通じて、記憶装置2702が公衆回線と接続されてい
るか否かを判定し、接続されていない場合は、「回線と
接続してください」等の接続を促すメッセージを記憶表
示部2822に表示する。接続されている場合は、通信
処理部2810を通じ、インターネット上のサーバ装置
2705(図27参照)と接続する。
【0119】接続が完了すると、端末装置2701のシ
ステム制御部2801は、操作の選択に従い、サーバ装
置2705に読み上げ対象データ(該当する音声合成目
的データ)やキャラクタ音声データ(該当する音素デー
タ)、音声合成処理プログラムのダウンロードを要求
し、サーバ装置2705から読み上げ対象データやキャ
ラクタ音声データ、音声合成処理プログラムが送られて
くると、各データを記憶装置2702に記憶する。そし
て、ダウンロード完了のメッセージを表示して、サーバ
装置2705との呼を切断する。
【0120】なお、ユーザが記憶装置2702を端末装
置2701に挿入して再生操作した場合の動作は、実施
の形態4(図12)で述べているので、その説明は省略
する。
【0121】以上のように本実施の形態によれば、通信
処理部2810を制御する記憶制御部2821を備え、
記憶制御部2821は、通信処理部2810を介して、
音声合成処理プログラムと音素データと音声合成目的デ
ータとをインターネット上のサーバ装置2705からダ
ウンロードし、ダウンロードしたプログラムとデータと
を端末装置インタフェース部2820と記憶装置インタ
フェース部2803とを介して記憶部2805に転送す
ることにより、記憶装置単体でプログラムやデータをダ
ウンロードすることができると共に、端末装置2701
を簡単な構成にすることができ、端末装置2701のコ
ストダウンを図ることができる。
【0122】(実施の形態11)図29は本発明の実施
の形態11における携帯端末装置を有する通信システム
を示す構成図である。図29において、2901〜29
06は図201〜206と同一であり、説明は割愛す
る。2907はユーザーが本携帯端末装置に音声登録す
る肉声である。ユーザ独自で音声登録した音声で所望の
テキストデータ等が朗読可能である。
【0123】図30は、図29の端末装置2901と記
憶装置2902とを詳細に示すブロック図である。30
01〜3010、3020と3022に関しては図1記
載の101〜110、120と122と同一であり、説
明は割愛する。
【0124】3011はマイクであり、音声登録する対
象の肉声を入力する。3012は音声入力処理部であ
り、アナログの肉声データをサンプリングしデジタルデ
ータに変換する。3013は音声登録処理部であり、音
声入力処理部3012が変換したデジタル音声データを
分析し、音素データベースを作成する。3021は記憶
装置2902内に記憶されたユーザ登録の音素データベ
ースである。
【0125】このように構成された携帯端末装置につい
て、その動作を説明する。
【0126】なお音声合成処理の動作については(実施
の形態1)で述べているのでここでは割愛し、音声登録
についての説明のみ行う。
【0127】図31は実施の形態11における携帯端末
装置の音声登録処理部分のフローチャートである。ユー
ザが操作部3006から音声登録の操作を行うと(S3
101)、システム制御部3001は音声入力処理部3
012と音声登録処理部3013をアクティブにし、音
声入力処理部3012はマイク3011から入力される
アナログの音声データをサンプリングしてデジタルデー
タに変換し、記憶部3005に記憶する(S310
2)。
【0128】音声登録処理部3013は記憶部3005
に記憶されている音声データを順次読み出し分析して、
各音素毎に音の継続時間長や基本周波数、パワー等の音
に関する情報やその音素が属するデータファイル名及び
ファイル中におけるその音素の開始位置や終了位置の情
報等をラベル付けして、任意のフォーマットに沿った形
でデータベース化して記憶装置2902に記録し、ユー
ザが端末装置を通じて入力した音声を登録する(S31
03)。その後ユーザは音声キャラクタとして自分が登
録した音声を選択し、所望の合成目的データを選択し再
生操作することで合成音声が出力される。この部分の動
作は既に(実施の形態1)で述べているので割愛する。
【0129】このようにしてユーザは所望の音声キャラ
クタを自ら装置に登録でき、その音声キャラクタの音声
にてテキストデータの朗読を聴くことができる。
【0130】(実施の形態12)図32は本発明の実施
の形態12における携帯端末装置の詳細ブロック図であ
る。3230は端末装置、3240は記憶装置である。
3201〜3210、3020〜3022に関しては図
1記載の101〜110、120〜122と同一であ
り、説明は割愛する。3214は元の合成目的データを
ユーザが所望する言語の合成目的データに変換する翻訳
処理部である。
【0131】音声キャラクタの音素データベース及びテ
キストデータ等の合成目的データが記録された記憶装置
3240を端末装置3230に挿入し、携帯端末装置上
で翻訳の形態(例えば英語から日本語へ翻訳等)を選択
し再生の操作を行うと携帯端末装置上からユーザが所望
する翻訳形態及びキャラクタの音声でテキストデータの
音声合成処理がなされ、音声合成音が出力される。
【0132】この携帯端末装置においてはユーザが再生
操作を行うとまず合成目的データの翻訳処理が行われ、
その翻訳データに関して音声合成処理が行われる。翻訳
処理以外の動作は既に(実施の形態1)で述べているの
で割愛する。
【0133】図33は実施の形態12における携帯端末
装置の翻訳処理部分のフローチャートである。ユーザが
操作部3206から再生の操作を行うと(S330
1)、システム制御部3001は表示部3207に「朗
読する言語を選択してください」等のようなメッセージ
と共に翻訳可能な言語を表示する。ユーザが操作部32
06を用いて朗読言語を選択する(S3302)と、記
憶装置I/F部3203に記憶装置3240内にあると
合成目的データ3222を読み出す指令を出す。
【0134】記憶装置I/F部3203は記憶装置32
40内にある携帯端末装置I/F部3220とやり取り
をしながら合成目的データ3222を読み出し、携帯端
末装置3230内の記憶部3205に保存する。
【0135】次にシステム制御部3201は、翻訳処理
部3214に処理を開始させる。翻訳処理部3214は
データを解析し、ユーザが選択した言語の合成目的デー
タに変換しながら、その変換データを記憶部3205に
記録する。その後音声合成処理部3202が変換データ
を読み出し、(実施の形態1)と同様な方法で合成処理
を行い、合成音声が出力される。
【0136】このようにしてユーザは所望する言語及び
キャラクタ音声にてテキストデータ等の朗読を聴くこと
ができる。
【0137】(実施の形態13)図34は本発明の実施
の形態13における携帯端末装置の詳細ブロック図であ
る。3430は端末装置、3440は記憶装置である。
3401〜3410、3420と3422に関しては
(実施の形態1)図1記載の101〜110、120と
122と同一であり、説明は割愛する。3411〜34
13及び3421は(実施の形態11)の図30記載3
011〜3013及び3021と、3414は(実施の
形態12)図32記載3214と同一であり、説明は割
愛する。
【0138】この携帯端末装置においてはユーザが登録
した音声キャラクタの音素データベース及びテキストデ
ータ等の合成目的データが記録された記憶装置3240
を端末装置3230に挿入し、携帯端末装置上で翻訳の
形態(例えば英語から日本語へ翻訳等)を選択し再生の
操作を行うと携帯端末装置上からユーザが所望する翻訳
形態及びユーザが登録したキャラクタの音声での合成音
声が出力される。
【0139】音声登録処理の動作は(実施の形態11)
図31にて説明しているので割愛する。また翻訳処理の
動作は(実施の形態12)図33にて説明しているので
割愛する。またその他の動作は(実施の形態1)図3に
て説明しているので割愛する。
【0140】ユーザは自身が登録した音声キャラクタ及
び所望の言語にてテキストデータ等の朗読を聴くことが
できる。
【0141】(実施の形態14)図35は本発明の実施
の形態14における携帯端末装置を有する通信システム
を示す構成図及びサーバ装置内のブロック図である。3
510は合成目的データを供給するサーバー装置、35
20は端末装置、3530は記憶装置である。なお説明
の都合上、端末装置及び記憶装置の内部構成は実施の形
態1図1と同様な構成とする。
【0142】ユーザは端末装置3520を通じ、自分が
所望する小説等の合成目的データをダウンロードするこ
とができる。その際合成目的データに関してはダウンロ
ードするデータの範囲を選択可能である。
【0143】例えば小説等のデータであれば、その小説
が書かれた日付や出版社名等が記述されたヘッダー情報
や目次、及び本文等から構成され、ユーザは必ずしもヘ
ッダー情報や目次まで朗読させようとは思わない可能性
がある。このような場合に例えば「本文のみ」とかの選
択が可能である。
【0144】サーバー装置3510ではユーザからのデ
ータ範囲選択情報に基づき、合成目的データの構成分析
を行い、指定範囲を抽出後その抽出した合成目的データ
をユーザに送る。送られた合成目的データは記憶装置3
530内に記録され、ユーザが再生の操作を行うと携帯
端末装置上からユーザが所望する合成目的データ範囲及
びキャラクタの音声でテキストデータの音声合成処理が
なされ、音声合成音が出力される。
【0145】次にサーバー装置内の詳細説明を行う。3
501はサーバー装置のシステム制御部であり装置内の
各処理部とデータのやり取りを行い、装置全体の制御を
行う。またネットワーク通信機能も含みインターネット
上の通信も行う。3502はサーバー装置の記憶部であ
りサーバー装置の制御プログラムの記憶や様々な処理の
作業領域等として用いられる。3503はユーザから選
択させたテキストデータの構成を分析し、ユーザが指定
した部分のみ(例えば本文のみ等)のテキストデータを
抽出する構文解析処理部である。3504は合成目的デ
ータ保存部であり、複数の小説等テキストデータが保存
されている。3505は音素データベース保存部であり
複数のキャラクタの音素データベースが記憶されてい
る。
【0146】次に動作の説明を行う。図36は実施の形
態14におけるサーバー装置の動作フローチャートであ
る。サーバー装置は先ず、ユーザからの接続要求を待つ
(S3601)。ユーザがユーザIDやパスワード等を
用いて接続要求を行うと、サーバー装置のシステム制御
部は接続要求を行ったユーザが正規ユーザかどうか判断
する(S3602)。正規ユーザでなかった場合は接続
拒否をユーザに通知する(S3603)。正規ユーザで
あった場合は接続許可および合成目的データ保存部35
04にある合成目的データのリスト情報を送信する。ユ
ーザはこのリスト情報から合成目的データを選択、さら
に選択した合成目的データのダウンロード選択部分(例
えば本文のみ等)を選択する。サーバー装置はユーザか
らの合成目的データ及びダウンロード選択部分を示すデ
ータの受信を待ち(S3605)、受信したら構文解析
処理部3503が該当の合成目的データを合成目的デー
タ保存部3504から読み出し、その構文を解析してユ
ーザが選択したデータ部分を抽出する(S3606)。
そして抽出したデータをユーザに配信する(S360
7)。
【0147】ユーザは記憶装置に配信されたデータを記
録し、端末装置に挿入、再生を行うことで合成音声が出
力される。このようにしてユーザは所望の音声キャラク
タにて所望の範囲のテキスト等の朗読を聴くことができ
る。
【0148】(実施の形態15)図37は本発明の実施
の形態15における携帯端末装置を有する通信システム
を示す構成図である。図37において、3701〜37
06は(実施の形態1)に記載した図2の201〜20
6と同一である。3708はサーバー装置3705から
携帯端末装置3701に提供される楽譜データである。
【0149】ユーザは端末装置3701を通じインター
ネットを経由してサーバー装置3705と接続し、聴き
たい楽曲とその楽曲を歌わせたいキャラクタを選択す
る。するとサーバー装置3705からはユーザが選択し
た楽曲の歌詞に相当するテキスト等の合成目的データ3
703と楽譜データ3708及び歌唱キャラクタの音素
データベース3704が送られてくる。られてきたデー
タは端末装置装置経由で記憶装置に記憶され、ユーザが
再生を行うとユーザが選択したキャラクタ音声で楽曲が
再生される。
【0150】図38は携帯端末装置3701と記憶装置
3702の詳細ブロック図である。図38において、3
801〜3810及び3820〜3822は(実施の形
態1)の101〜110及び120〜122と同じであ
り説明は割愛する。3815は楽譜データを解析し、楽
曲を構成する各音の高さや長さといった情報を解析する
楽曲合成処理部である。3823は記憶装置内部に記憶
された楽譜データである。
【0151】図39は実施の形態15における図38の
携帯端末装置の動作フローチャートである。なお再生の
動作以外は実施の形態1でのべた携帯端末装置と動作は
同じであり、説明は割愛する。
【0152】操作部3806から再生が選択されると
(S3901)、システム制御部3801は、表示部3
807に楽曲データとキャラクタ音声のリストを表示し
(S3902)、ユーザに楽曲データとキャラクタ音声
データとを選択させる。ユーザが選択したら、記憶装置
インタフェース部3803に、記憶装置3702内にあ
る該当する楽曲データの楽譜データを読み出す指令を出
し、記憶装置インタフェース部3803は記憶装置37
02内にある端末装置インタフェース部3820とやり
取りをしながら楽譜データを読み出し、端末装置内の記
憶部3805に記録する。次に楽曲合成処理部3815
は楽譜データを順次読み出し解析して楽曲を構成する各
音の高さや長さといった音に関する情報を抽出する(S
3803)。次にシステム制御部3801は記憶装置イ
ンタフェース部3803に、記憶装置3702内にある
該当する楽曲データの歌詞データである合成目的データ
を読み出す指令を出し、データは記憶部3805に記録
される。次に、システム制御部3801は、音声合成処
理部3802に指令を出し、処理を開始させる。音声合
成処理部3802は、記憶部3705から音声合成目的
データを順次読み出しながら解析を行い、また楽曲合成
処理部が抽出した音に関するデータを基に最も適する音
素データを記憶装置3702から読み出して繋ぎ合わ
せ、楽曲データを作成し(S3904)、データを音声
出力処理部3804が処理できるデータに変換して音声
出力処理部3804に渡す。音声合成処理部3802
は、ユーザが操作部3806で停止のボタンを押して、
システム制御部3801から処理中止の指示があるま
で、この処理を繰り返す。音声出力処理部3804は、
音声合成処理部3802から受け取ったデータをフォー
マット変換し、スピーカまたはヘッドフォン3808に
出力する(S3905)。このようにしてユーザは所望
のキャラクタ音声にて楽曲を聴くことができる。
【0153】(実施の形態16)図40は本発明の実施
の形態16における携帯端末装置のブロック図である。
この装置は音声認証等での不正使用を防止するために合
成目的データ中のある特定の文字列においてはユーザ所
望のキャラクタ音声ではなく代替の音声で朗読する携帯
端末装置である。
【0154】図40において、4030は端末装置、4
040は記憶装置である。4001〜4010、402
0〜4022については(実施の形態1)の101〜1
10及び120〜122と同じであり説明は割愛する。
016は合成目的データの中にお金の単位や数字等の特
定の文字列が含まれていないか検索を行うテキスト解析
処理部である。
【0155】図41は実施の形態16における図40の
携帯端末装置の動作フローチャートである。なお再生の
動作以外は実施の形態1でのべた携帯端末装置と動作は
同じであり、説明は割愛する。
【0156】操作部4006から再生が選択されると
(S4101)、システム制御部4001は、表示部4
007に合成目的データとキャラクタ音声のリストを表
示し(S4102)、ユーザに合成対象データとキャラ
クタ音声データとを選択させる。ユーザが選択したら、
記憶装置インタフェース部4003に、記憶装置404
0内にある該当する合成目的データを読み出す指令を出
し、記憶装置インタフェース部4003は記憶装置40
40内にある端末装置インタフェース部4020とやり
取りをしながら合成目的データを読み出し、端末装置内
の記憶部4005に記録する。次にテキスト解析処理部
4016は合成目的データを順次読み出しながら文章の
解析を行う。もしお金や数字等の特定文字列を発見した
場合は、その文字列の先頭と最後に音声合成処理に影響
の無い識別子を挿入しながら、記憶装置4040に記録
する(S4103)。
【0157】次に、システム制御部4001は、音声合
成処理部4002に指令を出し、処理を開始させる。音
声合成処理部4002は、記憶部4005から音声合成
目的データを順次読み出しながら解析を行う。その際読
み込んだデータが識別子で囲まれている場合はユーザ所
望の音声キャラクタでない音素データベースを用い、そ
うでない場合はユーザ所望の音声キャラクタの音素デー
タベースを用いる。
【0158】音声合成処理部4002はデータを解析し
ながらそのデータに最も適する音素データを記憶装置4
040から読み出して繋ぎ合わせ、合成音声データを作
成し(S4104)、データを音声出力処理部4004
が処理できるデータに変換して音声出力処理部4004
に渡す。音声合成処理部4002は、ユーザが操作部4
006で停止のボタンを押して、システム制御部400
1から処理中止の指示があるまで、この処理を繰り返
す。音声出力処理部4004は、音声合成処理部400
2から受け取ったデータをフォーマット変換し、スピー
カまたはヘッドフォン4008に出力する(S410
5)。
【0159】このようにこの装置においては音声認証等
での不正使用を防止するために合成目的データ中のある
特定の文字列においてはユーザ所望のキャラクタ音声で
はなく代替の音声で朗読することができる。
【0160】(実施の形態17)本実施の形態17の携
帯端末装置は、音声認証等での不正使用を防止するため
に音声出力している文章の句点や句読点毎又は決められ
た文字数毎に音声合成の出力音であること示す音を強制
的に挿入する携帯端末装置である。内部構成は(実施の
形態1)図1と同じであり、説明は割愛する。
【0161】図42は実施の形態17における端末装置
の動作フローチャートである。
【0162】なお再生の動作以外は実施の形態1でのべ
た携帯端末装置と動作は同じであり、説明は割愛する。
【0163】操作部から再生が選択されると(S420
1)、システム制御部は、表示部に合成目的データとキ
ャラクタ音声のリストを表示し(S4202)、ユーザ
に合成対象データとキャラクタ音声データとを選択させ
る。ユーザが選択したら、記憶装置インタフェース部
に、記憶装置内にある該当する合成目的データを読み出
す指令を出し、記憶装置インタフェース部は記憶装置内
にある端末装置インタフェース部とやり取りをしながら
合成目的データを読み出し、端末装置内の記憶部に記録
する。
【0164】次に、システム制御部は、音声合成処理部
に指令を出し、処理を開始させる。音声合成処理部は、
記憶部から音声合成目的データを順次読み出しながら解
析を行う。まず音声合成処理部は合成処理済の文字数を
格納する変数nを初期化し(S4204)、次に処理済
みの文字数が識別音声を挿入する文字数Tになったかを
判断し(S4205)、そうである場合はnを0にして
(S4206)、識別音データを合成音声データとして
挿入する(S4207)。処理済みの文字数が識別音声
を挿入する文字数Tに達していない場合は、処理を行お
うとしている文字が句読点または句点を示すデータかを
判断し(S4208)、そうである場合は識別音データ
を合成音声データとして挿入する(S4207)。そう
でない場合はユーザが選択した音声キャラクタの音素デ
ータベースから最適な音素を抽出する(S4209)。
【0165】そして識別音データ及び音素データベース
から抽出された音素データは順次接続され、合成音声デ
ータが作成される(S4210)。音声合成処理部は合
成処理を行った文字数の変数をカウントアップし(S4
211)、操作部から停止の指示があるまで(S420
5)〜(S4211)の処理が繰り返される。合成音声
データはフォーマット変換され、スピーカやヘッドフォ
ンに出力される(S4212)。
【0166】このようにこの装置においては音声認証等
での不正使用を防止するために音声出力している文章の
句点や句読点毎又は決められた文字数毎に音声合成の出
力音であること示す音を強制的に挿入することができ
る。
【0167】(実施の形態18)図43は本発明の実施
の形態18における携帯端末装置を有する通信システム
を示す構成図である。4301は表示部や操作部、及び
アンプやヘッドフォン、スピーカ等の音声出力手段を備
えた携帯端末装置である。4302は音声合成目的のデ
ータや音声キャラクタの音素データベース及び音声合成
プログラムを格納し、携帯端末装置とは着脱可能なメモ
リーカードや光ディスク及び磁気ディスク等の記憶装置
である。
【0168】4303は携帯端末装置における音声合成
目的のデータであり、例えば小説等のテキストデータ等
である。4304は音素データベースである。これは実
在の人物の肉声をサンプリングし、そのサンプリングデ
ータをデータベース化したものであり、この装置から出
力される音声合成音の音色を決定する重要な要素とな
る。
【0169】4305はインターネット上のサーバー装
置である。サーバー装置4305は音声合成目的のデー
タ、例えば小説等のテキストデータや音素データベース
及び音声合成プログラムを提供する。ここでは、一つの
サーバー装置しか記載していないが、複数のサーバー装
置で音声合成目的のデータと音素データベースを分けて
提供する場合もある。4306はインターネット上のサ
ーバー装置4305から提供され、携帯端末装置上で実
行される音声合成処理プログラムである。
【0170】ユーザはまず音声キャラクタの音素データ
ベースや音声合成目的のデータ及び音声合成処理プログ
ラムを記憶している記憶装置4302を端末装置本体4
301に挿入し、再生操作をすることにより、自分が所
望するキャラクタの音素データベースを用いて音声合成
処理を行い、あたかも当該キャラクタが発音したような
音声にて音声合成目的のデータの朗読を聴くことができ
る。
【0171】または、ユーザはインターネット上のサー
バー装置4305と接続し、自分が所望する小説等のテ
キストデータやキャラクタ音声を選択し、それらデータ
をサーバー装置4305からダウンロードして上で再生
操作をすることにより、当該キャラクタが発音したよう
な音声にて音声合成目的のデータの朗読を聴くことがで
きる。この場合、サービス業者は音素提供者が発音した
音声のサンプリングデータを分析して、音の強弱や音の
高低等の音に関するデータの抽出を行い、データベース
化してサーバー装置4305に保存している。
【0172】図44は本携帯端末装置のブロック図であ
り、図44において、4301は端末装置本体、430
2は端末装置本体4301に接続可能な記憶装置であ
る。端末装置本体4301において、4401は端末装
置本体4301に設けられたステム制御部であり、装置
内の各処理部とデータのやり取りを行い、装置全体の制
御を行う。4302は音声合成処理部であり、音声合成
目的のデータの解析を行って、合成目的のデータ(各文
字データまたは単語のデータ)に最適な音素データを抽
出及び連結する。4403は記憶装置I/F部であり、
記憶装置4302へのデータの書き込み,データの読み
出しをする。
【0173】4404は音声出力手段であり、音声合成
処理部4402からのデータを受け、データのフォーマ
ット変換等の処理を行い、デジタルデータをアナログデ
ータに変換し、不要なノイズをカットしてスピーカまた
はヘッドフォン等よりに出力する。4405は携帯端末
装置の記憶部であり、携帯端末装置を制御するプログラ
ムや表示部に表示するフォントデータの記憶、音声合成
音データの保存及び様々なデータ処理の際の作業領域等
として用いられる。
【0174】4406は操作部であり、これを通じユー
ザは装置に自分の指示を与える。は表示部であり、装置
の動作状態等をユーザに表示する。4408は装置に電
源を供給する為の電源部である。4409は通信処理部
であり、公衆回線と接続して、インターネット上でのデ
ータのやり取りを実現する。
【0175】4410は音声合成目的のデータの解析
し、音声合成処理に用いる音素データベースを選択する
音素データベース選択手段である。4420は端末装置
I/F部であり、記憶装置I/F部4403と共に端末
装置4301とのデータのやり取りを行う。
【0176】次に記憶装置4302において、4421
は記憶装置4302内に保存された音素データベースで
あり、4422は記憶装置4302内に保存された音声
合成目的のデータである。なお、記憶装置4302内及
び端末装置の記憶部に保存されるのは、音声合成目的の
データや音素データベース及び音声合成処理プログラム
のどのような組み合わせであっても良い。
【0177】次に、本発明の携帯端末装置の動作につい
て図45の動作フローチャートを用いて説明する。ユー
ザが操作部にて装置の電源をオンすると、システム制御
部4401は記憶装置I/F部4403に指令を出し、
記憶装置4302が端末装置本体4401に接続してい
るか調べる(S4501)。接続していない場合は表示
部4407に「メモリーカードを挿入してください。」
等のユーザに対して端末装置本体4301に記憶装置4
302の接続を行うように促すメッセージを表示する
(S4502)。
【0178】記憶装置4302が端末装置本体4301
に接続している場合は「操作メニュー 1.朗読 2.
プログラムアップデート 3.音声合成目的データのダ
ウンロード 4.キャラクタ音声データダウンロード・
・」等のユーザに端末の操作を促す操作メニューを表示
部4407に表示する(S4503)。
【0179】ユーザーが操作部4406を操作し、朗読
以外の操作が選ばれたら(S4504)、システム制御
部4401は通信処理部を通じて端末装置本体4301
が公衆回線と接続されているかを調べ(S4505)、
接続していない場合は「回線と接続してください」等の
回線の接続を促すメッセージを表示部4307に表示す
る(S4506)。
【0180】端末装置本体4301が公衆回線に接続し
ている場合は、通信処理部4409を介し、インターネ
ット上のサーバー装置4305に接続する(S450
7)。端末装置本体4301のシステム制御部4401
はサーバー装置4305に音声合成プログラムや音声合
成目的のデータや音素データデータベースのダウンロー
ドを要求し(S4508)、サーバー装置4305から
前記データが送られてくると、データを記憶部4405
や記憶装置4302に記憶する(S4509)。それが
完了すると、サーバー装置4305との呼を切断する。
【0181】前述の操作メニューが表示されている状態
でユーザーが操作部4406を操作して朗読が選択され
ると(S4504)、システム制御部4401は表示部
4407に装置内に存在する音声合成目的のデータのリ
スト、および音声キャラクタのリストを表示する。ユー
ザは操作部4406を操作して音声合成目的のデータを
決定する(S4510)と、音素データベース選択手段
4410は音声合成目的のデータを解析して、各々の音
素データベースを適用するデータの範囲を抽出する(S
4511)。例えば音声合成目的のデータが小説のテキ
ストデータの場合は、登場人物のセリフ部分やナレーシ
ョン部分等にデータ範囲を分け、その結果をシステム制
御部に伝える。
【0182】システム制御部4401は音素データベー
ス選択手段4410からの結果を基に表示部4407に
「次の部分に適用する音声キャラクタを選択してくださ
い。1.登場人物Aセリフ 2.登場人物Cセリフ
3.ナレーション」等のような音声合成目的データの前
記各部分の読み上げに割り当てる音声キャラクタを選択
させるメッセージを表示させる。
【0183】ユーザは操作部4406を操作して音声キ
ャラクタを決定する(S4512)。ユーザは場合によ
っては複数の人物を指定することが可能であり、例えば
小説の中の複数の登場人物毎に音声キャラクタを変えて
指定することもある。
【0184】システム制御部4401は選択された結果
を音素データベース選択手段4410に伝える。音素デ
ータベース選択手段4410はこの結果を基に音声合成
目的データの各音素データベースを適用する部分に対し
て識別記号を混在させ(S4513)、音声合成処理部
4402が音声合成目的データ中のどの部分でどの音声
キャラクタの音素データベースを使用すればよいのかを
判別できるようにして結果を記憶部4405に記憶す
る。すなわち、音声合成目的データの中で部分毎に適切
な音声キャラクタを示す識別記号が加えられる。
【0185】これにより、音声合成処理時には、音声合
成処理部4402は音声合成目的データの中の部分ごと
に適切な音声キャラクタの音素データベースを使用して
音声合成を行い、例えば小説であれば登場人物のセリフ
毎にキャラクタを変えて音声合成することができ、より
リアルな読み上げを実現することができる。なおこの音
素データベース選択手段において、各音素データベース
を適用させるデータ範囲の分け方は前記のような登場人
物のセリフ毎であったり、章毎であったり、行毎であっ
たりしても良く、その分け方は音声合成目的のデータ内
容にも依存するので限定はしない。
【0186】次にシステム制御部4401は音声合成処
理部4402に処理を開始させる。音声合成処理部44
02は記憶部4405から音素データベース選択手段が
処理したデータを順次読み出し、識別記号に基づき使用
する音声キャラクタの音素データベースを選択する。そ
して音声合成目的のデータを分析し、各データに最も適
する音素データを記憶部4405または記憶装置430
2から読み出して、繋ぎ合わせ合成音声データを作成す
る(S4514)。
【0187】音声出力手段4404は音声合成処理部4
402から合成音声データを受け取り、データをフォー
マット変換して、スピーカまたはヘッドフォンに出力す
る(S4515)。
【0188】なお、データ入力手段としてメモリーカー
ドや光ディスク等の記憶装置4302を用いたものであ
るが、データ入力手段がモデム等のネットワークインタ
ーフェース及びキーボードであっても良い。また通信処
理部4409が端末装置本体201に搭載されたもので
あるが、通信処理部を記憶装置4302に搭載し、ネッ
トワーク上にあるサーバー装置から音素データベースや
音声合成目的のデータ及び音声合成処理プログラムをダ
ウンロードして記憶装置に記憶するようにしても良い。
【0189】また、音声合成目的のデータとして、小説
等のテキストデータのみでなく、スコアデータ(楽譜)
+テキストデータ(歌詞)の楽曲データとし、ユーザが
端末装置本体4301を操作して所望のキャラクタと楽
曲データを指定することで、当該キャラクタの音素デー
タベースと前述の楽曲データを基に音声合成処理を行
い、ユーザが所望する特定キャラクタの音声で楽曲を聴
くこともできる。
【0190】(実施の形態19)図46は本発明の実施
の形態19における携帯端末装置を有する通信システム
を示す構成図である。4601は表示部や操作部、及び
アンプやヘッドフォン、スピーカ等の音声出力手段を備
えた携帯端末装置である。4602は音声合成目的のデ
ータや音声キャラクタの音素データベース及び音声合成
プログラムや挿絵等の画像データを格納し、携帯端末装
置とは着脱可能なメモリーカードや光ディスク及び磁気
ディスク等の記憶装置である。
【0191】4603は携帯端末装置における音声合成
目的のデータであり、例えば小説等のテキストデータ等
である。4604は音素データベースである。これは実
在の人物の肉声をサンプリングし、そのサンプリングデ
ータをデータベース化したものであり、この装置から出
力される音声合成音の音色を決定する重要な要素とな
る。
【0192】4605はインターネット上のサーバー装
置である。サーバー装置205は音声合成目的のデー
タ、例えば小説等のテキストデータや音素データベース
及び音声合成プログラムや画像データを提供する。ここ
では、一つのサーバー装置しか記載していないが、複数
のサーバー装置で各データを分けて提供する場合もあ
る。
【0193】4606はインターネット上のサーバー装
置4605から提供され、携帯端末装置上で実行される
音声合成処理プログラムである。4607は音声合成目
的データに関連する挿絵等の画像データである。
【0194】ユーザはまず音声キャラクタの音素データ
ベースや音声合成目的のデータ及び音声合成処理プログ
ラム及び画像データを記憶している記憶装置4602を
端末装置本体4601挿入し、再生操作をすることによ
り、自分が所望するキャラクタの音素データベースを用
いて音声合成処理を行い、あたかも当該キャラクタが発
音したような音声にて音声合成目的のデータの朗読を聴
くことができる。
【0195】または、ユーザはインターネット上のサー
バー装置4605と接続し、自分が所望する小説等のテ
キストデータやキャラクタ音声を選択し、それらデータ
をサーバー装置4605からダウンロードして上で再生
操作をすることにより、当該キャラクタが発音したよう
な音声にて音声合成目的のデータの朗読を聴くことがで
きる。この場合、サービス業者は音素提供者が発音した
音声のサンプリングデータを分析して、音の強弱や音の
高低等の音に関するデータの抽出を行い、データベース
化してサーバー装置4605に保存している。
【0196】図47は本携帯端末装置のブロック図であ
り、図47において、4601は端末装置本体、460
2は端末装置本体4601に接続可能な記憶装置であ
る。
【0197】端末装置本体4601において、4701
は端末装置本体4601に設けられたシステム制御部で
あり、装置内の各処理部とデータのやり取りを行い、装
置全体の制御を行う。4702は音声合成処理部であ
り、音声合成目的のデータの解析を行って、合成目的の
データ(各文字データまたは単語のデータ)に最適な音
素データを抽出及び連結する。4703は記憶装置I/
F部であり、記憶装置4602へのデータの書き込み,
データの読み出しをする。
【0198】4704は音声出力手段であり、音声合成
処理部4702からのデータを受け、データのフォーマ
ット変換等の処理を行い、デジタルデータをアナログデ
ータに変換し、不要なノイズをカットしてスピーカまた
はヘッドフォン等よりに出力する。4705は携帯端末
装置の記憶部であり、携帯端末装置を制御するプログラ
ムや表示部4707に表示するフォントデータの記憶、
音声合成音データの保存及び様々なデータ処理の際の作
業領域等として用いられる。
【0199】4706は操作部であり、これを通じユー
ザは装置に自分の指示を与える。4707で表示部であ
り、装置の動作状態や読み上げ中の音声合成目的データ
及び挿絵等の画像データ等をユーザに表示する。470
8は装置に電源を供給する為の電源部である。4709
は通信処理部であり、公衆回線と接続して、インターネ
ット上でのデータのやり取りを実現する。
【0200】4710は、合成音声出力中の音声合成目
的データの表示を行う文字データ表示処理部である。4
711は、合成音声出力中の箇所の内容に合った挿絵や
画像の表示を行う画像データ表示処理部である。472
0は端末装置I/F部であり、記憶装置I/F部470
3と共に端末装置4602とのデータのやり取りを行
う。
【0201】次に記憶装置4602において、4721
は記憶装置4602内に保存された音素データベースで
あり、4722は記憶装置4602内に保存された音声
合成目的のデータである。4723は、音声合成目的デ
ータに関連する挿絵等の画像データである。なお、記憶
装置4602内及び端末装置の記憶部に保存されるの
は、音声合成目的のデータや音素データベース及び音声
合成処理プログラム及び画像データのどのような組み合
わせであっても良い。
【0202】次に、本発明の携帯端末装置の動作につい
て図48の動作フローチャートを用いて説明する。ユー
ザが操作部にて装置の電源をオンすると、システム制御
部4701は記憶装置I/F部4703に指令を出し、
記憶装置4602が端末装置本体4601に接続してい
るか調べる(S4801)。接続していない場合は表示
部4707に「メモリーカードを挿入してください。」
等のユーザに対して端末装置本体4601に記憶装置4
602の接続を行うように促すメッセージを表示する
(S4802)。
【0203】記憶装置4602が端末装置本体4601
に接続している場合は「操作メニュー 1.朗読 2.
プログラムアップデート 3.音声合成目的データのダ
ウンロード 4.キャラクタ音声データダウンロード
5.画像データダウンロード・・」等のユーザに端末の
操作を促す操作メニューを表示部4707に表示する
(S4803)。システム制御部4701は操作部47
06からの操作状況を監視している。
【0204】ユーザーが操作部4706を操作し、朗読
以外の操作が選ばれたら(S4804)、システム制御
部4701は通信処理部を通じて端末装置本体4601
が公衆回線と接続されているかを調べ(S4805)、
接続していない場合は「回線と接続してください」等の
回線の接続を促すメッセージを表示部4707に表示す
る(S4806)。
【0205】端末装置本体4601が公衆回線に接続し
ている場合は、通信処理部4709を介し、インターネ
ット上のサーバー装置4605に接続する(S480
7)。端末装置本体4601のシステム制御部4701
はサーバー装置4605に音声合成プログラムや音声合
成目的のデータや音素データデータベースや画像データ
のダウンロードを要求し(S4808)、サーバー装置
4605から前記データが送られてくると、データを記
憶部4705や記憶装置4602に記憶する(S480
9)。それが完了すると、サーバー装置4605との呼
を切断する。
【0206】操作部4706から朗読が選択されると
(S4804)、システム制御部4701は表示部47
07に装置内に存在する音声合成目的データのリスト、
および音声キャラクタのリストを表示する。ユーザは操
作部4706を操作して音声合成目的のデータを決定す
る(S4810)と、文字データ表示処理部4710は
音声合成目的データ4722を記憶部4705または記
憶装置4602から読み出し、表示部4707の表示領
域内に表示可能な文字数の範囲内で文字表示識別符号を
合成目的のデータに混在して記憶部4705または記憶
装置4602に記録する(S4810)。この文字表示
識別符号は合成音声出力中の合成目的データ、例えば文
字を表示部4707に表示させる為のものである。
【0207】文字表示識別符号の合成目的データへの混
在の方法は複数あり、表示する文字列の最初の文字デー
タから最後の文字データを囲んで混在させたり、表示す
る文字列の先頭の文字のみに混在させる方法等があり、
限定はしない。
【0208】次に音声合成処理部4702は文字データ
表示処理部が処理したデータを読み出し、場合によって
は音声合成対象のデータを音声合成が可能なデータに変
換する。そして合成解析対象のデータが画像表示識別符
号かをチェックする(S4811)。この画像表示識別
符号は合成音声出力中の合成目的データの内容に合致し
た、或いはその内容理解を助ける為の画像データを表示
する為のものである。画像表示識別符号は合成目的デー
タに予め混在されても良いし、画像データ表示処理部4
711が合成目的データを解析して、合成目的データの
内容に合う画像データの識別符号を混在させても良い。
【0209】もし画像表示識別符号であった場合は、そ
の符号内容を画像データ表示処理部4711に伝え、画
像データ表示処理部4711は記憶部4705または記
憶装置4602から符号内容に対応する画像データ読み
出し、表示部4707に表示する(S4812)。
【0210】画像表示識別符号でなかった場合、音声合
成処理部4702は解析対象データが文字表示識別符号
かをチェックする(S4813)。文字表示識別符号で
あった場合は、その符号を文字データ表示処理部471
0に伝え、文字データ表示処理部4710は伝えられた
符号で囲まれた部分の文字列データを表示部4707に
表示したり、あるいは同じ符号がついた先頭の文字から
表示領域に表示可能な範囲での決められた文字数分の文
字を表示部4707に表示する(S4814)。
【0211】そして解析対象データが文字表示識別符号
でなかった場合、音声合成処理部4702の解析対象は
実際の音声合成対象データとなり、そのデータに最も適
する音素データを記憶部4705または記憶装置470
2から読み出して、繋ぎ合わせ合成音声データを作成す
る(S4715)。
【0212】音声出力手段は音声合成処理部4702が
作成した合成音声データを受け取り、データをフォーマ
ット変換して、スピーカ又はヘッドフォンから合成音声
を出力する(S4816)。
【0213】なお、データ入力手段としてメモリーカー
ドや光ディスク等の記憶装置4602を用いたものであ
るが、データ入力手段がモデム等のネットワークインタ
ーフェース及びキーボードであっても良い。また通信処
理部4709が端末装置本体4601に搭載されたもの
であるが、通信処理部を記憶装置4702に搭載し、ネ
ットワーク上にあるサーバー装置から音素データベース
や音声合成目的のデータ及び音声合成処理プログラムや
画像データをダウンロードして記憶装置4602に記憶
するようにしても良い。
【0214】(実施の形態20)図49は本発明の実施
の形態49における読み上げシステムを示す構成図であ
る。4901は表示部や操作部及びヘッドフォン、スピ
ーカ等の音声出力手段を備えた携帯端末装置である。4
902はユーザが選択したキャラクタ音声、及び合成目
的データでの合成音声データであり、サーバー装置49
03からユーザに提供される。
【0215】ユーザはまず携帯端末装置4901を通じ
てインターネット上のサーバー装置4903と接続し、
自分が所望する小説のテキストデータ等である合成目的
データやキャラクタ音声を選択する。サーバー装置49
03は選択された合成目的データ及びキャラクタの音素
データベースを用いて音声合成処理を行い、合成音声デ
ータをインターネット経由でユーザに送信し、ユーザは
携帯端末装置内にそのデータを記憶する。そして再生の
処理を行うと携帯端末装置からユーザが所望するキャラ
クタの音声でテキストデータの音声合成音が出力され
る。
【0216】図50は携帯端末装置4901とサーバー
装置4903の詳細説明図である。図50において、5
001は携帯端末装置のシステム制御部であり装置内の
各処理部とデータのやり取りを行い、装置全体の制御を
行う。またネットワーク通信機能も含みインターネット
上の通信も行う。5002は携帯端末装置の記憶部であ
り、携帯端末装置の制御プログラムや表示部に表示する
フォントデータの記憶また、サーバー装置4903から
送られる音声合成音データの保存及び様々な処理の作業
領域等として用いられる。5003は音声出力処理部で
あり、デジタル音声データをアナログデータに変換し、
不要なノイズをカットしてまたスピーカ5004に出力
する。5005は操作部であり、これを通じユーザは装
置に自分の指示を与える。5006は表示部であり、装
置の動作状態等をユーザに表示する。5007は装置に
電源を供給する為の電源部である。
【0217】5021はサーバー装置のシステム制御部
であり装置内の各処理部とデータのやり取りを行い、装
置全体の制御を行う。またネットワーク通信機能も含み
インターネット上の通信も行う。5022はサーバー装
置の記憶部でありサーバー装置の制御プログラムの記憶
や様々な処理の作業領域等として用いられる。5023
は音声合成処理部であり、合成目的データの解析を行っ
て、各文字データに最適な音素データを抽出及び連結し
てそのデータを携帯端末装置内にある音声出力処理部5
003に渡せるようにデータ変換する。5024は合成
目的データ保存部であり、複数の合成目的データ、例え
ば小説等の文章データが保存されている。5025は音
素データベース保存部であり複数のキャラクタの音素デ
ータベースが記憶されている。
【0218】以下に本読み上げシステムにおける詳細な
動作説明を行う。まずユーザがサーバー装置から合成音
声データをダウンロードする場合の内部動作の説明を行
う。図51は本読み上げシステムの動作フローチャート
である。サーバー装置は先ず、ユーザからの接続要求を
待つ(S5101)。ユーザがユーザIDやパスワード
等を用いて接続要求を行うと、サーバー装置のシステム
制御部5021は接続要求を行ったユーザが正規ユーザ
かどうか判断する(S5102)。正規ユーザでなかっ
た場合は接続拒否をユーザに通知する(S5103)。
正規ユーザであった場合は接続許可および合成目的デー
タ保存部5024にある合成目的データと音素データベ
ース保存部5025にある音声キャラクタのリスト情報
を送信する(S5104)。次にユーザが選択した所望
の合成目的データと音声キャラクタデータのリクエスト
データを受信すると(S5105)、サーバー装置のシ
ステム制御部5021は音声合成処理部5023に処理
を開始させる。音声合成処理部5023はサーバー装置
の記憶部5022から合成目的データを順次読み出しな
がら解析を行い、各文字データに最も適する音素データ
を記憶部5022から読み出して、繋ぎ合わせ、合成音
声データを作成する(S5106)。そして合成音声デ
ータをユーザに送信する(S5107)。このようにし
てユーザは所望する合成目的及びキャラクタ音声の合成
音データを得ることができる。
【0219】次に携帯端末装置側での合成音の再生につ
いて述べる。合成音声データがすべて携帯端末装置の記
憶部5002に記憶されると、システム制御部5001
は操作部5005から再生ボタンが押されるのを待ち、
押されたら、音声出力処理部5003をアクティブにす
る。音声出力処理部5003は記憶部5002から次々
と合成音声データを読み出し、アナログ音声に変換して
スピーカ5004に音声出力する。
【0220】このようにしてユーザは所望するキャラク
タ音声にてテキストデータ等の朗読を聴くことができ
る。
【0221】(実施の形態21)図52は本発明の実施
の形態21における読み上げシステムを示す構成図であ
る。5201〜5203は(実施の形態20)に記載し
た図49の4901〜4903と同一である。5204
はユーザが音声登録する肉声、5205は携帯端末装置
内に取り込んだ肉声サンプリングデータである。
【0222】ユーザはまず携帯端末装置5201を用い
て、サーバー装置5203に登録したい肉声5204を
携帯端末装置5201に取り込む。次にサーバー装置5
203とインターネット経由で接続し、肉声サンプリン
グデータ5205をサーバー装置5203に送る。サー
バー装置内部では音声登録処理が行われ、肉声サンプリ
ングデータ5205が音素データベースとして登録され
る。そして、携帯端末装置5201を通じて所望の合成
目的データとキャラクタ音声として先に登録したものを
選択する。サーバー装置5203からはユーザの選択に
基づき、処理を行い合成音声データ5202をユーザの
携帯端末装置5201に送信する。ユーザは携帯端末装
置5201に合成音声データ5202を取り込み、再生
を行うことにより、携帯端末装置からはユーザが選択し
た合成目的データ及び、自ら登録したキャラクタ音声で
テキストデータ等の朗読を聴くことができる。
【0223】図53は携帯端末装置5201とサーバー
装置5203の詳細説明図である。図53において、5
301〜5307は(実施の形態20)に記載した図5
0の5301〜5307と同一である。5309はユー
ザが音声登録するための肉声を入力するためのマイク、
5308はマイクから取り込まれた肉声のアナログデー
タをサンプリングし、デジタルデータに変換する音声入
力処理部である。5321〜5325は(実施の形態2
0)に記載した図50の5021〜5025と同一であ
る。5326は携帯端末装置5201の音声入力処理部
5308が変換したデジタル音声データを分析し、音素
データベースを作成する音声登録処理部である。
【0224】以下に本実施の形態の読み上げシステムに
おける詳細な動作説明を行う。図54は同読み上げシス
テムの動作フローチャートである。ここでは音声の登録
処理までの動作について述べる。ユーザが合成音声デー
タをサーバー装置から得るまでの動作及び端末装置にお
ける音声データの再生は実施の形態20の図51で述べ
たとうりであり、割愛する。
【0225】ユーザが携帯端末装置5201の操作部5
305から音声登録の操作を行うと(S5401)、携
帯端末装置内のシステム制御部5301は音声入力処理
部5308をアクティブにし、マイク5309から入力
されるアナログの音声データをサンプリングしてデジタ
ルデータに変換し(S5402)、携帯端末装置内の記
憶部5302に記憶する。サーバー装置5203はユー
ザからの接続要求を待ち(S5121)、ユーザがユー
ザIDやパスワード等を用いて接続要求を行うと(S5
403)、サーバー装置5203のシステム制御部53
01は接続要求を行ったユーザが正規ユーザかどうか判
断する(S5422)正規ユーザでなかった場合は接続
拒否をユーザに通知する(S5423)。正規ユーザで
あった場合は接続許可を通知する(S5424)。
【0226】端末装置5201はサーバー装置5203
から接続許可のメッセージを受けると(S5404)、
音声登録の依頼をする為に肉声のサンプリングデータを
記憶部5302から読み出し、サーバー装置5203に
送信する(S5405)。サーバー装置5203はユー
ザからのデータを受信すると(S5425)、受信デー
タを記憶部5322に記憶する。次に音声登録処理部5
326は記憶部5322に記憶されている音声データを
順次読み出し分析して、各音素毎に音の継続時間長や基
本周波数、パワー等の音に関する情報やその音素が属す
るデータファイル名及びファイル中におけるその音素の
開始位置や終了位置の情報等をラベル付けして、任意の
フォーマットに沿った形でデータベース化して記憶装置
2902に記録し、ユーザが端末装置を通じて入力した
音声を登録する(S5426)。そしてユーザに登録完
了通知を送信する(S5427)。端末装置ではサーバ
ー装置からの音声登録の完了通知を待ち、待っている
間、表示部5306に「音声登録処理中です。」等のメ
ッセージを表示する(S5406、S5407)。サー
バー装置から登録の完了通知がくると端末装置のシステ
ム制御部5301は登録の完了メッセージを表示部53
06に表示する(S5408)。
【0227】ユーザは登録した音声を朗読をさせるキャ
ラクタ音声として選択すれば、前記実施の形態20で述
べたような同様の動作にて、携帯端末装置から音声合成
音が出力される。このようにしてユーザは所望するテキ
ストデータを自ら登録したキャラクタ音声で聴くことが
できる。
【0228】(実施の形態22)図55は本発明の実施
の形態22における読み上げシステムを示す構成図であ
る。5501〜5503は(実施の形態20)に記載し
た図49の4901〜4903と同一である。
【0229】ユーザは携帯端末装置5501を通じてイ
ンターネット上のサーバー装置5503と接続し、自分
が所望する小説等の合成目的データや朗読の言語及びキ
ャラクタ音声を選択する。サーバー装置5503は選択
された言語と合成目的データ及びキャラクタの音素デー
タベースを用いて音声合成処理を行い、合成音声をイン
ターネット経由でユーザに送信し、ユーザは携帯端末装
置内にそのデータを記憶する。そして再生の処理を行う
と携帯端末装置からユーザが指定した言語及びキャラク
タの音声で合成目的データの合成音声が出力される。こ
のようにしてユーザは所望する言語及びキャラクタ音声
にてテキストデータ等の朗読を聴くことができる。
【0230】図56は携帯端末装置5501とサーバー
装置5503の詳細説明図である。図56において、5
601〜5607は(実施の形態20)の図50の50
01〜5007と同一である。また5621〜5625
は(実施の形態20)の図50の5021〜5025と
同一である。また5627は元の合成目的データをユー
ザが所望する言語のデータに変換する翻訳処理部であ
る。
【0231】以下に本実施の形態の読み上げシステムに
おける詳細な動作説明を行う。図57は同読み上げシス
テムの動作フローチャートである。サーバー装置は先
ず、ユーザからの接続要求を待つ(S5701)。ユー
ザがユーザIDやパスワード等を用いて接続要求を行う
と、サーバー装置のシステム制御部5621は接続要求
を行ったユーザが正規ユーザかどうか判断する(S57
02)。正規ユーザでなかった場合は接続拒否をユーザ
に通知する(S5703)。正規ユーザであった場合は
接続許可および合成目的データ保存部5624にある合
成目的データと音素データベース保存部5625にある
音声キャラクタ及び翻訳可能な言語のリスト情報を送信
する(S5704)。次にユーザが選択した所望の合成
目的データと音声キャラクタデータ及び翻訳言語のリク
エストデータを受信すると(S5705)、サーバー装
置のシステム制御部5621は、翻訳処理部5627に
処理を開始させる。翻訳処理部5627はデータを解析
し、ユーザが選択した言語の合成目的データに変換しな
がら、その変換データを記憶部5622に記録する(S
5706)。その後サーバー装置のシステム制御部56
21は、音声合成処理部5623に処理を開始させる。
音声合成処理部5623はサーバー装置の記憶部562
2から合成目的データを順次読み出しながら解析を行
い、各文字データに最も適する音素データを記憶部56
22から読み出して、繋ぎ合わせ、合成音声データを作
成する(S5707)。そして合成音声データをユーザ
に送信する(S5108)。このようにしてユーザは所
望する合成目的及びキャラクタ音声の合成音データを得
ることができる。
【0232】ユーザは送られた合成音声データを端末装
置に取りこみ再生することで端末装置からは合成音声が
出力される。
【0233】このようにしてユーザは所望の音声キャラ
クタ及び言語にてテキストデータ等の朗読を聴く事がで
きる。
【0234】(実施の形態23)図58は本発明の実施
の形態23における読み上げシステムを示す構成図であ
る。(5801)〜(5804)は(実施の形態21)
に記載した図52の(5201)〜(5204)と同一
である。
【0235】ユーザは(実施の形態21)に述べたよう
にして登録したいキャラクタの音声を登録する。次に
(実施の形態22)に述べたような方法で自分が所望す
る小説等の合成目的データや朗読の言語及びユーザが登
録したキャラクタ音声を選択する。サーバー装置520
3は選択された言語と合成目的データ及びユーザ登録の
キャラクタの音素データベースを用いて音声合成処理を
行い、その出力結果をインターネット経由でユーザに送
信し、ユーザは携帯端末装置内にそのデータを記憶す
る。そして再生の処理を行うと携帯端末装置からユーザ
が指定した言語及びユーザ登録のキャラクタの音声で合
成目的データの合成音声が出力される。このようにして
ユーザは所望する言語及び登録したキャラクタ音声にて
テキストデータ等の朗読を聴くことができる。
【0236】図59は携帯端末装置5801とサーバー
装置5803の詳細説明図である。図59において、5
901〜5909は(実施の形態21)の図53の53
01〜5309と同一である。また5921〜5926
は(実施の形態21)の図53の5321〜5326と
同一である。また5927は(実施の形態22)の図5
6の5627と同一である。
【0237】携帯端末装置5801とサーバー装置58
03における音声登録の内部動作は(実施の形態22)
に記載したものと同一であり、また翻訳処理の内部動作
は(実施の形態23)に記載したものと同一であるので
説明は割愛する。ユーザは所望する言語及び登録したキ
ャラクタ音声にてテキストデータ等の朗読を聴くことが
できる。
【0238】(実施の形態24)図60は本発明の実施
の形態24における読み上げシステムを示す構成図であ
る。図60において、6001、6003は(実施の形
態20)に記載した図49の4901、4903と同一
である。6002はサーバー装置6003から携帯端末
装置6001に提供される楽曲データである。
【0239】ユーザはまずインターネットを経由してサ
ーバー装置6003と接続し、聴きたい楽曲とその楽曲
を歌わせたい音声キャラクタを選択する。サーバー装置
6003ではユーザの指示に従い、楽譜データを解析
し、解析された音に関するデータを基に選択された楽曲
の歌詞データと選択されたキャラクタの音素データベー
スを用いて音声合成処理し、そのデータをインターネッ
トを経由してユーザに提供する。ユーザは携帯端末装置
6001にその楽曲データを取り込み再生することで、
ユーザが所望するキャラクタ音声にて楽曲を聴く事がで
きる。
【0240】図61は携帯端末装置6001とサーバー
装置6003の詳細説明図である。図60において、携
帯端末装置側の6101〜6107は(実施の形態2
1)の図50の5001〜5007と同一である。また
サーバー装置側の6121〜6125は図50の502
1〜5025と同一である。6126は楽曲の楽譜デー
タを保存する楽譜データ保存部である。6127は楽譜
データを解析し、楽曲を構成する各音の高さや長さとい
った情報を解析する楽曲合成処理部である。
【0241】図62は本実施の形態の読み上げシステム
の動作フローチャートである。サーバー装置は先ず、ユ
ーザからの接続要求を待つ(S6201)。ユーザがユ
ーザIDやパスワード等を用いて接続要求を行うと、サ
ーバー装置のシステム制御部6121は接続要求を行っ
たユーザが正規ユーザかどうか判断する(S620
2)。正規ユーザでなかった場合は接続拒否をユーザに
通知する(S6203)。正規ユーザであった場合は接
続許可および合成目的データ保存部6124にある合成
目的データ(歌詞データ)と音素データベース保存部6
125にある音声キャラクタのリスト情報を送信する
(S6204)。次にユーザが選択した所望の楽曲デー
タと音声キャラクタデータのリクエストデータを受信す
ると(S6205)、サーバー装置のシステム制御部6
121は該当の楽譜データを楽譜データ保存部6126
から読み出し、サーバー装置内の記憶部6122に記録
する。次に楽曲合成処理部6127は楽譜データを順次
読み出し解析して楽曲を構成する各音の高さや長さとい
った音に関する情報を抽出する(S6206)。次にシ
ステム制御部6121は該当する楽曲データの歌詞デー
タである合成目的データを読み出す指令を出し、データ
は記憶部6122に記録される。次に、システム制御部
6121は、音声合成処理部6123に指令を出し、処
理を開始させる。音声合成処理部6123は、記憶部6
122から音声合成目的データを順次読み出しながら解
析を行い、また楽曲合成処理部が抽出した音に関するデ
ータを基に最も適する音素データを音素データベース保
存部6125から読み出して繋ぎ合わせ、合成音声デー
タ(楽曲データ)を作成する(S6207)。そしてこ
の合成音声データをユーザに送信する(S6208)。
【0242】このようにしてユーザは所望する合成目的
及びキャラクタ音声の合成音データを得ることができ
る。そしてこの合成音声データを端末装置に取りこみ再
生することで、合成音声(楽曲データ)が再生される。
このようにしてユーザは所望のキャラクタ音声で楽曲を
聴く事ができる。
【0243】(実施の形態25)図63は本発明の実施
の形態25における読み上げシステムを示す構成図であ
る。図63において6301〜6303は(実施の形態
20)における図49の4901、4903と同一であ
る。この読み上げシステムにおける携帯端末装置は出力
される音声が音声認証等での不正使用を防止するために
合成目的データ中のある特定の文字列においてはユーザ
所望のキャラクタ音声ではなく代替の音声で出力され
る。
【0244】図64は携帯端末装置6301とサーバー
装置6303の詳細説明図である。6401〜6407
は(実施の形態20)の図49の4901〜4907と
同一である。またサーバー装置側の6421〜6425
は図49の4921〜4925と同一である。6426
は合成目的データの中にお金の単位や数字が含まれてい
ないか検索を行うテキスト解析処理部である。
【0245】次に本実施の形態の読み上げシステムの動
作説明を行う。図65は同読み上げシステムの動作フロ
ーチャートである。サーバー装置は先ず、ユーザからの
接続要求を待つ(S6501)。ユーザがユーザIDや
パスワード等を用いて接続要求を行うと、サーバー装置
のシステム制御部6421は接続要求を行ったユーザが
正規ユーザかどうか判断する(S6502)。正規ユー
ザでなかった場合は接続拒否をユーザに通知する(S6
503)。正規ユーザであった場合は接続許可および合
成目的データ保存部6424にある合成目的データと音
素データベース保存部6425にある音声キャラクタの
リスト情報を送信する(S6504)。次にユーザが選
択した所望の合成目的データと音声キャラクタデータの
リクエストデータを受信すると(S6505)、サーバ
ー装置のシステム制御部6421は該当の合成目的デー
タを合成目的データベース6424から読み出し、サー
バー装置の記憶部6422に記憶する。
【0246】次にテキスト解析処理部6426は合成目
的データを記憶部6422から順次読み出して文章の解
析を行う。もしお金や数字等の特定文字列を発見した場
合は、その文字列の先頭と最後に音声合成処理に影響の
無い識別子を挿入しながら、記憶部6422に記録する
(S6506)。次に、サーバー装置のシステム制御部
6421は、音声合成処理部6423に指令を出し、処
理を開始させる。音声合成処理部6423は、記憶部6
422から音声合成目的データを順次読み出しながら解
析を行う。その際読み込んだデータが識別子で囲まれて
いる場合はユーザ所望の音声キャラクタでない音素デー
タベースを用い、そうでない場合はユーザ所望の音声キ
ャラクタの音素データベースを用いる。
【0247】音声合成処理部6423はデータを解析し
ながらそのデータに最も適する音素データを音素データ
ベース保存部6425から読み出して繋ぎ合わせ、合成
音声データを作成し(S6507)、ユーザに送信する
(S6508)。そしてユーザは合成音声データを端末
装置に取りこみ再生することで端末装置からは合成音声
データが出力される。
【0248】このようにこのシステムにおいては音声認
証等での不正使用を防止するために合成目的データ中の
ある特定の文字列においてはユーザ所望のキャラクタ音
声ではなく代替の音声で朗読することができる。
【0249】(実施の形態26)図66は本発明の実施
の形態26における読み上げシステムを示す構成図であ
る。図66において6601〜6603は(実施の形態
20)における図49の4901、4903と同一であ
る。
【0250】この読み上げシステムにおける携帯端末装
置から出力される音声は音声認証等での不正使用を防止
するために音声出力している文章の句点や句読点毎又は
決められた文字数毎に音声合成の出力音であること示す
音を強制的に挿入される。
【0251】図67は携帯端末装置6601とサーバー
装置6603の詳細説明図である。6701〜6707
は(実施の形態20)の図49の4901〜4907と
同一である。またサーバー装置側の6721〜6725
は図49の4921〜4925と同一である。
【0252】図68は同実施の形態の読み上げシステム
の動作フローチャートである。サーバー装置は先ず、ユ
ーザからの接続要求を待つ(S6801)。ユーザがユ
ーザIDやパスワード等を用いて接続要求を行うと、サ
ーバー装置のシステム制御部6721は接続要求を行っ
たユーザが正規ユーザかどうか判断する(S680
2)。正規ユーザでなかった場合は接続拒否をユーザに
通知する(S6803)。正規ユーザであった場合は接
続許可および合成目的データ保存部6724にある合成
目的データと音素データベース保存部6725にある音
声キャラクタのリスト情報を送信する(S6804)。
次にユーザが選択した所望の合成目的データと音声キャ
ラクタデータのリクエストデータを受信すると(S68
05)、サーバー装置のシステム制御部6721は該当
の合成目的データを合成目的データベース6724から
読み出し、サーバー装置の記憶部6722に記憶する。
【0253】次に、サーバー装置のシステム制御部67
21は、音声合成処理部6723に指令を出し、処理を
開始させる。音声合成処理部6723は、記憶部672
2から音声合成目的データを順次読み出しながら解析を
行う。まず音声合成処理部6723は合成処理済の文字
数を格納する変数nを初期化し(S6806)、次に処
理済みの文字数が識別音声を挿入する文字数Tになった
かを判断し(S6807)、そうである場合はnを0に
して(S6808)、識別音データを合成音声データと
して挿入する(S6809)。処理済みの文字数が識別
音声を挿入する文字数Tに達していない場合は、処理を
行おうとしている文字が句読点または句点を示すデータ
かを判断し(S6810)、そうである場合は識別音デ
ータを合成音声データとして挿入する(S6809)。
そうでない場合はユーザが選択した音声キャラクタの音
素データベースから最適な音素を抽出する(S681
1)。
【0254】そして識別音データ及び音素データベース
から抽出された音素データは順次接続され、合成音声デ
ータが作成される(S6812)。音声合成処理部は合
成処理を行った文字数の変数をカウントアップし(S6
813)、合成目的データを全て音声合成処理したか判
断し(S6814)、合成処理が終了している場合に
は、合成音声データをユーザに送信する(S681
5)。そしてユーザは合成音声データを端末装置に取り
こみ再生することで端末装置からは合成音声データが出
力される。
【0255】このようにこのシステムにおいては音声認
証等での不正使用を防止するために携帯端末装置から音
声出力している文章の句点や句読点毎又は決められた文
字数毎に音声合成の出力音であること示す音を強制的に
挿入することができる。
【0256】(実施の形態27)図69は本発明の実施
の形態27における読み上げシステムの概略説明図であ
る。図69および図70において、6901は合成音デ
ータ入力手段とアンプ、スピーカ等を含んだ音声出力手
段を備えた端末装置本体である。ここでの合成音データ
入力手段とは、モデム等のネットワークインターフェー
スや光ディスク、磁気ディスク、メモリーカード等であ
る記録媒体のデータ入力が可能な記憶装置のインターフ
ェースである。6902は合成音データ等を格納し、端
末装置本体6901とは脱着可能なメモリーカードや光
ディスク及び磁気ディスク等の記憶装置である。690
3はサーバー手段から配信される合成音声データであ
る。6904はユーザから指定された音声合成目的デー
タと音声キャラクタの音素データベースを用いて音声合
成を行い、合成音声データをユーザに配信するインター
ネット上のサーバー手段である。
【0257】例えばユーザは端末装置本体6901を通
じて、インターネット上のサーバー手段6904と通信
し、サーバー手段6904に登録されている音声合成目
的データを選択して、さらに選択した音声合成目的デー
タの各データ範囲、例えば音声合成目的データが小説等
であれば各登場人物のセリフ部分の音声合成に用いる音
声キャラクタを選択する。サーバー手段6904は選択
された音声キャラクタの音素データベースを用いて、音
声合成目的データの音声合成を行い、その合成音声デー
タを通信手段を用いて、ユーザに配信する。ユーザはサ
ーバー手段6904から配信された合成音声データを合
成音データ入力手段を用いて端末装置本体6901に取
り込み、再生することで所望の音声キャラクタでの合成
音声を聴くことができる。
【0258】なお、サーバー手段6904は必ずしもイ
ンターネット上に無くてもよく、オフラインにてユーザ
からの要求を電話やFAX、郵便や人手で受け付け、合成
音声データを光ディスクや磁気ディスク、メモリーカー
ド等の記憶媒体に記録してユーザに配信してもよい。
【0259】図70は同読み上げシステムのブロック図
である。6901は端末装置本体、6902は記憶装置
である。6904はサーバー手段である。まずサーバー
手段6904の各ブロックの説明を行う。
【0260】サーバー手段6904において、7000
はサーバー制御部であり、サーバー手段全体の制御を行
う。7001は音声合成処理部であり、音声合成目的の
データの解析を行って、各データに最適な音素データを
抽出し連結する。7002は音素データベース選択処理
部であり、音声合成目的のデータを解析し、音声キャラ
クタを適用するデータ範囲を抽出して、各データ範囲の
音声合成に用いる音素データベースを選択する。700
3はサーバー通信処理部であり、音声合成された合成音
データをユーザに配信したり、ユーザとのインターフェ
ースを行う。7004はサーバー記憶部であり、サーバ
ー手段全体の制御を行うプログラムの保管やデータ処理
の際の作業領域として用いられる。7005は音声合成
目的のデータを記録する合成目的データ記録部であり、
7006は音声キャラクタの音素データベースを記録す
る音素データベース記録部である。音素データベース
は、実在の人物の肉声をサンプリングし、そのサンプリ
ングデータをデータベース化したものであり、出力され
る音声合成音の音色を決定する重要な要素となる。
【0261】次に端末装置本体6901の各ブロックの
説明を行う。端末装置本体6901において、7007
は端末制御部であり装置内の各部とデータのやり取りを
行い、装置全体の制御を行う。7008は音声出力部で
あり、合成音データのフォーマット変換を行い、スピー
カまたはヘッドフォンに出力する。7009は合成音デ
ータ入力手段の一つである記憶装置I/F部であり、記
憶装置へのデータを読み書きする。7010は端末記憶
部であり、装置全体のプログラムの格納や様々な処理の
作業領域として用いられる。7011は操作部であり、
これを通じユーザは装置に自分の指示を与える。701
2は表示部であり、装置の動作状態等をユーザに表示す
る。7013は合成音データ入力手段の一つである端末
通信処理部であり、サーバー装置から送られてくる合成
音データを受信したり、サーバー手段6904と端末装
置本体6901のインターフェースを行う。7014は
装置に電源を供給する為の電源部である。
【0262】次に合成音データ入力手段の一つである記
憶装置6902の各ブロックの説明を行う。7020は
端末装置I/F部であり、記憶装置I/F7009と共
に端末装置本体6901とデータのやり取りを行う。7
021は記憶装置内部に記憶された合成音データであ
る。
【0263】次に本システムの詳細な動作説明を行う。
【0264】図71は本発明の読み上げシステムにおけ
る動作フローチャートである。ユーザが端末装置本体6
901の操作部7011を用いてサーバー手段6904
との接続操作を行うと、端末通信処理部7013はサー
バー手段6904と接続を行う。そしてユーザは小説等
の音声合成目的データの選択要求を行う(S710
1)。端末装置本体6901からの選択要求はサーバー
通信処理部7003を通じ、サーバー手段6904に取
り込まれ、サーバー制御部7000は端末装置本体69
01からの音声合成目的データの要求を認識する(S7
102)。
【0265】次にサーバー制御部7000は合成目的デ
ータ記録部内にある音声合成可能な合成目的データのリ
スト情報作成し、その情報を選択要求してきた端末装置
本体6901に送る(S7103)。端末装置本体69
01の端末制御部7007はサーバー手段6904から
送られてきたリスト情報を認識して、その表示部701
2に表示する(S7104)。そしてユーザは端末装置
本体6901の操作部7011を用いて所望する音声合
成目的データを選択決定する(S7105)。次にサー
バー制御部(7000)はユーザから選択決定された音
声合成目的データを認識し(S7106)、該当のデー
タを合成目的データ記録部7005から読み出して、サ
ーバー記憶部7004に記録する。次に音素データベー
ス選択手段7002は音声合成目的のデータをサーバー
記憶部7004から読み出しながら解析を行い、各々の
音素データベースを適用するデータの範囲を抽出する
(S7107)。例えば音声合成目的のデータが小説の
テキストデータの場合は、登場人物のセリフ部分やナレ
ーション部分等にデータ範囲を分け、その結果をサーバ
ー制御部7000に伝える。次にサーバー制御部700
0は音素データベース記録部内にある音声キャラクタの
リスト情報を作成し、そのデータと共に音素データベー
ス選択処理部7002から受け取った結果を端末装置本
体6901に送信する(S7108)。
【0266】端末制御部7007はサーバー手段690
4から受け取ったデータ範囲情報を認識(S7109)
し、例えば「次の部分に適用する音声キャラクタを選択
してください。1.登場人物Aセリフ 2.登場人物Bセ
リフ 3.登場人物Cセリフ4.ナレーション」等のよ
うに表示部7012に表示する。また同時に音声キャラ
クタのリスト情報も表示する。そしてユーザは操作部7
011を用いて、各データ範囲に適用する音声キャラク
タを選択決定する(S7110)。ユーザは場合によっ
ては複数の人物を指定することが可能であり、例えば小
説の中の複数の登場人物毎に音声キャラクタを変えて指
定することもある。次にサーバー制御部7000はユー
ザから選択決定された各データ範囲に適用する音声キャ
ラクタを認識(S7111)し、音素データベース選択
処理部7002に結果を伝える。
【0267】音素データベース選択処理部7002はこ
の結果を基に音声合成目的データの各音素データベース
を適用する部分に対して、識別記号を混在させ(S71
12)、音声合成処理部7001がどの音声キャラクタ
の音素データベースを使用すればよいのかを判別できる
ようにして結果をサーバー記憶部7004に記録する。
すなわち、音声合成目的データの中で部分毎に適切な音
声キャラクタを示す識別記号が加えられる。
【0268】これにより、音声合成処理時には、音声合
成処理部7001は音声合成目的データの中の部分ごと
に適切な音声キャラクタの音素データベースを使用して
音声合成を行い、例えば小説であれば登場人物のセリフ
毎にキャラクタを変えて音声合成することができ、より
リアルな読み上げを実現することができる。
【0269】もちろん音素データベース選択処理部にお
いての各音素データベースを適用させるデータ範囲の分
け方は前記のような登場人物のセリフ毎であったり、あ
るいは章毎や行毎であったりしても良く、その分け方は
音声合成目的のデータ内容にも依存するので限定はしな
い。
【0270】次にサーバー制御部7000は音声合成処
理部7001に処理を開始させる。音声合成処理部70
01はサーバー記憶部7004から音素データベース選
択処理部7002が処理したデータを順次読み出し、識
別記号に基づき使用する音声キャラクタの音素データベ
ースを選択し、同時に音声合成目的のデータを分析し
て、各データに最も適する音素データをサーバー記憶部
7004または音素データベース記録部から読み出し
て、繋ぎ合わせ合成音データを作成する(S711
3)。サーバー制御部7000は音声合成処理部700
1が作成した合成音データをサーバー通信処理部700
3を通じて、ユーザに配信する(S7114)。サーバ
ー手段6904から配信された合成音データは端末通信
処理部7013を通じて、端末装置本体6901内の端
末記憶部7010または記憶装置6902に記録され
る。そしてユーザが操作部7011を通じて再生の操作
を行うと、合成音データが端末記憶部7010または記
憶装置から読み出されて音声出力部7008に渡され
る。音声出力部7008はデータのフォーマット変換を
行い、合成音声をスピーカーまたはヘッドフォンに出力
する(S7115)。
【0271】なお、端末通信処理部7013が端末装置
本体6901に搭載されたものであるが、通信処理部を
記憶装置6902に搭載し、ネットワーク上にあるサー
バー装置からデータをダウンロードして記憶装置に記憶
するようにしても良い。
【0272】(実施の形態28)図72は本発明の実施
の形態28の読み上げシステムを示す構成図である。7
201はユーザが音声合成を希望する音声合成目的デー
タと音声キャラクタの音素データベースを用いて音声合
成を行い、合成音声データをユーザに配信するインター
ネット上のサーバー手段である。7202は合成音デー
タ入力手段と、アンプ,スピーカ等を含んだ音声出力手
段を備えた端末装置本体である。
【0273】ここでの合成音データ入力手段は、モデム
等のネットワークインターフェースや光ディスク、磁気
ディスク、メモリーカード等である記録媒体のデータ入
力が可能な記憶装置のインターフェースである。720
3はサーバー手段7201から配信される合成音声デー
タである。7204はユーザがサーバー手段7201に
送信する音声合成目的のデータである。
【0274】ユーザはまず端末装置本体7202を通じ
て音声合成目的の文章が記述されたデータをサーバー手
段7201に送信すると共に、自分が所望する音声キャ
ラクタを選択する。サーバー手段7201は選択された
音声キャラクタの音素データベースを用いてユーザから
送信された音声合成目的データの音声合成を行い、合成
音声データをインターネット経由でユーザに返信する。
ユーザは端末装置本体7202内にそのデータを取り込
み、再生操作を行うことで端末装置本体7202からユ
ーザが所望するキャラクタの音声でユーザが送信した文
章データの合成音声が出力される。
【0275】7205は合成音データ等を格納し、端末
装置本体7202とは脱着可能なメモリーカードや光デ
ィスク及び磁気ディスク等の記憶装置である。なおユー
ザからの音声合成の依頼やその受け付けはインターネッ
ト経由だけでなく、電話やファックス及び郵便や人手に
て行われても良い。またサーバー手段7201からの合
成音声データのユーザへの配信はインターネット経由だ
けではなく、光ディスクや磁気ディスク及びメモリーカ
ード等の記憶媒体に合成音声データを記録し、それをユ
ーザに配達してもよい。
【0276】図73は本実施の形態の読み上げシステム
のブロック図である。図73において、7201はサー
バー手段、7202は端末装置本体、7203は記憶装
置である。まずサーバー手段7201の各ブロックの説
明を行う。
【0277】サーバー手段7201において、7300
はサーバー制御部であり、サーバー手段全体の制御を行
う。7301は音声合成処理部であり、音声合成目的の
データの解析を行って、各データに最適な音素データを
抽出し連結する。7302はデータ登録処理部であり、
ユーザから送られてくる音声合成目的のデータとユーザ
情報を対応づけたデータを作成し、管理する。
【0278】7303はサーバー通信処理部であり、音
声合成された合成音データをユーザに配信したり、ユー
ザとのインターフェースを行う。7304はサーバー記
憶部であり、サーバー手段全体の制御を行うプログラム
の保管やデータ処理の際の作業領域として用いられる。
7305は音声合成目的のデータを記録する合成目的デ
ータ記録部であり、7306は音声キャラクタの音素デ
ータベースを記録する音素データベース記録部である。
【0279】次に端末装置本体7202の各ブロックの
説明を行う。端末装置本体7202において、7307
は端末制御部であり装置内の各部とデータのやり取りを
行い、装置全体の制御を行う。7308は音声出力部で
あり、合成音データのフォーマット変換を行い、スピー
カまたはヘッドフォンに出力する。7309は合成音デ
ータ入力手段の一つである記憶装置I/F部であり、記
憶装置へのデータを読み書きする。7310は端末記憶
部であり、装置全体のプログラムの格納や様々な処理の
作業領域として用いられる。7311は操作部であり、
これを通じユーザは装置に自分の指示を与える。731
2は表示部であり、装置の動作状態等をユーザに表示す
る。7313は合成音データ入力手段の一つである端末
通信処理部であり、サーバー装置から送られてくる合成
音データを受信したり、サーバー手段7201と端末装
置本体7202のインターフェースを行う。7314は
装置に電源を供給する為の電源部である。7315はユ
ーザが音声合成目的のデータを入力するデータ入力処理
部である。
【0280】7320は端末装置I/F部であり、記憶
装置I/F部7309とともに端末装置本体7202と
データのやり取りを行う。7321は記憶装置内部に記
憶された合成音データである。
【0281】図74は本実施の形態の読み上げシステム
のフローチャートである。ユーザが端末装置本体720
2の操作部7211を用いてサーバー手段7201との
接続操作を行うと、端末通信処理部7213はサーバー
手段7201と接続を行う。そしてユーザはサーバー手
段7201に対して音声合成の要求を行う(S740
1)。端末装置本体7202からの要求はサーバー通信
処理部7303を通じ、サーバー手段7201に取り込
まれ、サーバー制御部7300はユーザからの音声合成
要求を認識する(S7402)。次にサーバー制御部7
300は音素データベース記録部7306内にある音声
キャラクタのリスト情報を作成し、そのデータを端末装
置本体7202に提供する(S7403)。
【0282】端末装置本体7202の端末制御部730
7はサーバー手段7201から送られてきたリスト情報
を認識して、その表示部7312に表示する(S740
4)。そしてユーザは端末装置本体7202の操作部7
311を用いて所望する音声キャラクタを選択決定す
る。またデータ入力処理部を用いて音声合成目的のデー
タを端末装置本体7202に入力する。さらに操作部7
311を用いてユーザの名前や住所、電話番号やE−M
AILアドレス、クレジット番号等のユーザ情報を入力
する。そして端末制御部7307はこれらのデータをサ
ーバー手段7201に伝える(S7405)。なおこの
ユーザ情報はユーザを特定出来、さらにサーバー手段7
201がサービスに対する報酬を得る場合において、ユ
ーザから料金を徴収する為に必要なデータである限り限
定はしない。
【0283】次にサーバー制御部7300はユーザから
選択決定された音声キャラクタと合成目的データ及びユ
ーザ情報データを認識し(S7406)、合成目的デー
タは合成目的データ記録部7305に記録し、ユーザ情
報はサーバー記憶部7304に記録を行う。そしてデー
タ登録処理部7302は両データを対応づけるととも
に、ユーザから受信した音声合成目的データのデータ量
や音声キャラクタ名等のデータもサーバー記憶部730
4に記録する(S7407)。そしてこの対応付けした
データに基づき、サーバー手段7201がサービスに見
合った報酬をユーザから徴収しても良い。
【0284】次にサーバー制御部7300は合成目的デ
ータ記憶部からユーザが合成依頼したデータを読み出し
てサーバー記憶部7304に記録し、音声合成処理部に
処理を開始させる。順次読み出し、音声合成目的のデー
タを分析して、各データに最も適する音素データをサー
バー記憶部7304または音素データベース記録部から
読み出して、繋ぎ合わせ、合成音データを作成する(S
7408)。サーバー制御部7300は音声合成処理部
7301が作成した合成音データをサーバー通信処理部
7303を通じて、ユーザに配信する(S7409)。
【0285】サーバー手段7201から配信された合成
音データは端末通信処理部7313を通じて、端末装置
本体内の端末記憶部7310または記憶装置に記録され
る。そしてユーザが操作部7311を通じて再生の操作
を行うと、合成音データが端末記憶部7310または記
憶装置から読み出されて音声出力部に渡される。音声出
力部7308はデータのフォーマット変換を行い、合成
音声をスピーカーまたはヘッドフォンに出力する(S7
410)。
【0286】
【発明の効果】以上説明したように本発明は、であり、
ユーザがその記憶装置を携帯端末装置に挿入して再生す
ることで携帯端末装置に記憶されている音声合成処理プ
ログラムと、記憶装置に記憶されている特定キャラクタ
の音素データベースおよび合成目的データにより音声合
成処理を行い、合成音声を出力する。従ってユーザは所
望するキャラクタ音声でテキストデータ等の朗読を聴く
ことができるという有利な効果が得られる。
【0287】またインターネット上のサーバ装置から音
素データおよび音声合成目的データをダウンロードし、
端末装置インタフェース部と記憶装置インタフェース部
とを介してサーバ装置からの音素データおよび音声合成
目的データを記憶装置に記憶させるようにしたことによ
り、インターネット上のサーバ装置から音声合成処理プ
ログラムを記憶部にダウンロードして音声合成処理プロ
グラムを更新することができるので、必要に応じて適正
な音声合成処理プログラムを使用することができ、適正
な合成音声を送出することができると共に、ダウンロー
ド時に別途パソコンを準備する必要がなく、パソコン経
由で音素データおよび音声合成目的データを記憶装置に
記憶させる手間が省け、また、多くの音声合成目的デー
タや音素データを記憶装置に記憶させて持ち運ぶことが
できるので、携帯時における読み上げ対象のテキストデ
ータやキャラクタ音声データの選択の幅を広げることが
できるという有利な効果が得られる。
【0288】また携帯端末装置において、端末装置の有
する通信処理部に代えて記憶装置の有する通信処理部を
備える構成としたことにより、端末装置においては通信
処理部を不要とすることができるので、端末装置を簡単
な構成にすることができ、端末装置のコストダウンを図
ることができるという有利な効果が得られる。
【0289】また携帯端末装置上又は記憶装置上に翻訳
処理部を搭載したことにより、合成目的データはユーザ
が所望する翻訳形態に翻訳され、前記携帯端末装置内に
あるシステム制御部は前記翻訳処理部にて翻訳された合
成目的データを音声合成処理プログラムと音素データベ
ースを用いて音声合成処理を行い、合成音声を出力する
ので、ユーザは所望するテキストデータの翻訳結果及び
キャラクタ音声にてテキストデータ等の朗読を聴くこと
ができるという有利な効果が得られる。
【0290】また朗読対象のテキストみでなく、楽曲デ
ータ(スコアデータ(楽譜)+テキストデータ(歌
詞))とした場合には、ユーザが携帯端末装置上で音素
データと楽曲データを指定することで、携帯端末装置か
らは指定された音素で楽曲が出力される。従ってユーザ
が所望する特定キャラクタの音声で楽曲を聴く事ができ
るという有利な効果が得られる。
【0291】また合成目的データ中のある特定の文字列
(例えばお金の単位や数字等)においてはユーザ所望の
キャラクタでの音声合成出力はせず、代替の音声合成出
力を行う携帯端末装置であり、その結果、音声認証等を
用いる他のシステムにこの装置の音声出力結果を音声認
証データとして使用不可能とすることができ、不正な使
用を防ぐことができるという有利な効果が得られる。
【0292】また音声出力している文章中に音声合成の
出力音であること示す音を強制的に挿入する事を特徴と
する携帯端末装置であり、その結果、音声認証等を用い
る他のシステムにこの装置の音声出力結果を音声認証デ
ータとして使用不可能とすることができ、不正な使用を
防ぐことができるという有利な効果が得られる。
【0293】また、合成音声出力中の音声合成目的デー
タに関する視覚表示を行う視覚表示処理手段を設けたこ
とにより、視覚を通じてユーザの理解を助けることがで
きるという有利な効果が得られる。
【0294】また読み上げシステムにおいて、合成目的
データ中のある特定の文字列(例えばお金の単位や数字
等)においてはユーザ所望のキャラクタでの音声合成出
力はせず、代替の音声合成出力を行う読み上げシステム
であり、その結果、音声認証等を用いる他のシステムに
この装置の音声出力結果を音声認証データとして使用不
可能とすることができ、不正な使用を防ぐことができる
という有利な効果が得られる。
【0295】また読み上げシステムにおいて、サーバー
手段はユーザから送られてくる音声合成目的データとユ
ーザ情報を対応付けして管理するデータ登録処理部と、
音声合成目的のデータを解析し、そのデータ毎に最適な
音素を抽出して繋ぎあわせる音声合成処理部と、音声合
成処理部が作成した合成音声データをユーザに配信する
通信処理部を備えたものとすることにより、ユーザは音
声合成させたい文章、例えば自分史やドラマ等を作成
し、その文章を所望の音声キャラクタにて朗読させると
いう新たな楽しみを享受できる。
【図面の簡単な説明】
【図1】本発明の実施の形態1による携帯端末装置を有
する通信システムを示す構成図
【図2】同実施の形態における端末装置と記憶装置とを
詳細に示すブロック図
【図3】同実施の形態における端末装置の動作を示すフ
ローチャート
【図4】本発明の実施の形態2における携帯端末装置を
有する通信システムを示す構成図
【図5】同実施の形態における端末装置と記憶装置とを
詳細に示すブロック図
【図6】同実施の形態における端末装置の動作を示すフ
ローチャート
【図7】本発明の実施の形態3における携帯端末装置を
有する通信システムを示す構成図
【図8】同実施の形態における端末装置と記憶装置とを
詳細に示すブロック図
【図9】同実施の形態における端末装置の動作を示すフ
ローチャート
【図10】本発明の実施の形態4による携帯端末装置を
有する通信システムを示す構成図
【図11】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図12】同実施の形態における端末装置の動作を示す
フローチャート
【図13】本発明の実施の形態5による携帯端末装置を
有する通信システムを示す構成図
【図14】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図15】同実施の形態における端末装置の動作を示す
フローチャート
【図16】本発明の実施の形態6による携帯端末装置を
有する通信システムを示す構成図
【図17】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図18】同実施の形態における端末装置の動作を示す
フローチャート
【図19】本発明の実施の形態7による携帯端末装置を
有する通信システムを示す構成図
【図20】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図21】同実施の形態における端末装置の動作を示す
フローチャート
【図22】本発明の実施の形態8による携帯端末装置を
有する通信システムを示す構成図
【図23】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図24】同実施の形態における端末装置の動作を示す
フローチャート
【図25】本発明の実施の形態9による携帯端末装置を
有する通信システムを示す構成図
【図26】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図27】本発明の実施の形態10による携帯端末装置
を有する通信システムを示す構成図
【図28】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図29】本発明の実施の形態11による携帯端末装置
を有する通信システムを示す構成図
【図30】同実施の形態における端末装置と記憶装置と
を詳細に示すブロック図
【図31】同実施の形態における端末装置の動作を示す
フローチャート
【図32】本発明の実施の形態12による端末装置と記
憶装置とを詳細に示すブロック図
【図33】同実施の形態における携帯端末装置の翻訳処
理部分のフローチャート
【図34】本発明の実施の形態13における携帯端末装
置の詳細に示すブロック図
【図35】本発明の実施の形態14における通信システ
ムを示す構成図及びサーバ装置内のブロック図
【図36】本発明の実施の形態14におけるサーバー装
置の動作フローチャート
【図37】本発明の実施の形態15における通信システ
ムを示す構成図
【図38】同実施の形態における携帯端末装置と記憶装
置とを詳細に示すブロック図
【図39】同実施の形態における携帯端末装置の動作フ
ローチャート
【図40】本発明の実施の形態16における携帯端末装
置のブロック図
【図41】同実施の形態における携帯端末装置の動作フ
ローチャート
【図42】本発明の実施の形態17における携帯端末装
置の動作フローチャート
【図43】本発明の実施の形態18における携帯端末装
置を有する通信システムを示す構成図
【図44】同実施の形態における携帯端末装置のブロッ
ク図
【図45】同実施の形態における携帯端末装置の動作フ
ローチャート
【図46】本発明の実施の形態19における通信システ
ムを示す構成図
【図47】同実施の形態の読み上げシステムにおける携
帯端末装置のブロック図
【図48】同実施の形態の読み上げシステムにおける携
帯端末装置の動作フローチャート
【図49】本発明の実施の形態20における読み上げシ
ステムを示す構成図
【図50】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図51】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図52】本発明の実施の形態21における読み上げシ
ステムを示す構成図
【図53】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図54】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図55】本発明の実施の形態22における読み上げシ
ステムを示す構成図
【図56】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図57】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図58】本発明の実施の形態23における読み上げシ
ステムを示す構成図
【図59】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図60】本発明の実施の形態24における読み上げシ
ステムを示す構成図
【図61】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図62】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図63】本発明の実施の形態25における読み上げシ
ステムを示す構成図
【図64】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図65】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図66】本発明の実施の形態26における読み上げシ
ステムを示す構成図
【図67】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図68】同実施の形態の読み上げシステムにおける動
作フローチャート
【図69】本発明の実施の形態27における読み上げシ
ステムの概略説明図
【図70】同実施の形態の読み上げシステムにおけるサ
ーバー装置の詳細ブロック図
【図71】同実施の形態の読み上げシステムの動作フロ
ーチャート
【図72】本発明の実施の形態28の読み上げシステム
の概略説明図
【図73】同実施の形態の読み上げシステムにおける携
帯端末装置とサーバー装置の詳細ブロック図
【図74】同実施の形態の読み上げシステムの動作フロ
ーチャート
【符号の説明】
101 システム制御部 102 音声合成処理部 103 記憶装置インタフェース部(記憶装置I/F
部) 104 音声出力処理部 105 記憶部 106 操作部 107 表示部 108 ヘッドフォンまたはスピーカー 109 電源部 110 通信処理部 120 端末装置インタフェース部(端末装置I/F
部) 121 音素データベース 122 音声合成目的データ 201 端末装置 202 記憶装置 205 サーバ装置 206 音声合成処理プログラム 405 サーバー制御部 4901 携帯端末装置 4903 サーバー装置 5001 システム制御部 5002 記憶部 5003 音声出力処理部 5004 スピーカ 5005 操作部 5006 表示部 5007 電源部 5021 システム制御部 5022 記憶部 5023 音声合成処理部 5024 合成目的データ保存部 5025 音素データベース保存部

Claims (40)

    【特許請求の範囲】
  1. 【請求項1】端末装置と記憶装置とを有し、個性を持つ
    音素をデータ化した音素データとテキストデータ等の音
    声合成目的データとを処理する携帯端末装置であって、
    システム制御と、音声合成処理部を有し、音声合成目的
    データを搭載する記憶装置は携帯端末装置から切り離し
    可能であり、ユーザが再生操作することで、音声合成目
    的データと記憶装置に搭載されている特定キャラクタの
    音素データベースとを前記携帯端末装置内の音声合成処
    理部が音声合成処理し、音声合成された音を出力する事
    を特徴とする携帯端末装置。
  2. 【請求項2】音素データベースは、実際の人物の肉声を
    サンプリングし、そのサンプリングデータをデータベー
    ス化したものである請求項1記載の携帯端末装置。
  3. 【請求項3】デジタル音声データをアナログに変換し、
    不要なノイズをカットしてスピーカに出力する音声出力
    処理部と、ユーザが装置に指示を与えるための操作部
    と、公衆回線を介してサーバー装置と接続可能にする通
    信処理部とを備え、音素データベースは実際の人物の肉
    声をサンプリングし、そのサンプリングデータをデータ
    ベース化したものであり、ユーザが操作部により音素デ
    ータベースの種類や朗読対象のテキストデータを選択す
    ると、その情報をサーバー装置へ送り、サーバー装置よ
    りネットワーク経由で送られた音素データベースとテキ
    ストデータより音声合成処理を行ない、前記音声出力処
    理部により音声再生することを特徴とする請求項1記載
    の携帯端末装置。
  4. 【請求項4】端末装置と記憶装置とを有し、個性を持つ
    音素をデータ化した音素データとテキストデータ等の音
    声合成目的データとを処理する携帯端末装置であって、
    前記端末装置は、全体を制御するシステム制御部と、前
    記音声合成目的データと前記音素データとから前記音声
    合成処理プログラムに基づいて音声合成を行う音声合成
    処理部と、前記音声合成処理プログラムと前記音声合成
    目的データとを記憶する記憶部と、前記記憶装置との間
    でデータの送受信を行うための記憶装置インタフェース
    部と、公衆回線に接続するための通信処理部とを有し、 前記記憶装置は、前記音素データを格納する音素データ
    ベースと、前記端末装置との間でデータの送受信を行う
    ための端末装置インタフェース部とを有することを特徴
    とする携帯端末装置。
  5. 【請求項5】前記通信処理部は、インターネット上のサ
    ーバ装置から音声合成処理プログラムや音素データまた
    は音声合成目的データをダウンロード可能であることを
    特徴とする請求項1に記載の携帯端末装置。
  6. 【請求項6】端末装置と記憶装置とを有し、個性を持つ
    音素をデータ化した音素データとテキストデータ等の音
    声合成目的データとを処理する携帯端末装置であって、 前記端末装置は、全体を制御するシステム制御部と、前
    記音声合成目的データと前記音素データとから前記音声
    合成処理プログラムに基づいて音声合成を行う音声合成
    処理部と、前記音声合成処理プログラムを記憶する記憶
    部と、前記記憶装置との間でデータの送受信を行うため
    の記憶装置インタフェース部と、公衆回線に接続するた
    めの通信処理部とを有し、 前記記憶装置は、前記音素データを格納する音素データ
    ベースと、前記音声合成目的データを格納する音声合成
    目的データと、前記端末装置との間でデータの送受信を
    行うための端末装置インタフェース部とを有し、ユーザ
    が再生操作することで、音声合成目的データと特定キャ
    ラクタの音素データベースとを前記携帯端末装置内の音
    声合成処理部が音声合成処理し、音声合成された音を出
    力する事を特徴とする携帯端末装置。
  7. 【請求項7】端末装置と記憶装置とを有し、個性を持つ
    音素をデータ化した音素データとテキストデータ等の音
    声合成目的データとを処理する携帯端末装置であって、 前記端末装置は、全体を制御するシステム制御部と、前
    記音声合成目的データと前記音素データとから前記音声
    合成処理プログラムに基づいて音声合成を行う音声合成
    処理部と、前記音声合成処理プログラムと前記音素デー
    タとを記憶する記憶部と、前記記憶装置との間でデータ
    の送受信を行うための記憶装置インタフェース部と、公
    衆回線に接続するための通信処理部とを有し、 前記記憶装置は、前記音声合成目的データを格納する音
    声合成目的データと、前記端末装置との間でデータの送
    受信を行うための端末装置インタフェース部とを有し、
    ユーザが再生操作することで、音声合成目的データと特
    定キャラクタの音素データベースとを前記携帯端末装置
    内の音声合成処理部が音声合成処理し、音声合成された
    音を出力する事を特徴とする携帯端末装置。
  8. 【請求項8】端末装置と記憶装置とを有し、個性を持つ
    音素をデータ化した音素データとテキストデータ等の音
    声合成目的データとを処理する携帯端末装置であって、 前記端末装置は、全体を制御するシステム制御部と、前
    記音声合成目的データと前記音素データとから前記音声
    合成処理プログラムに基づいて音声合成を行う音声合成
    処理部と、前記音声合成処理プログラムを記憶する記憶
    部と、前記記憶装置との間でデータの送受信を行うため
    の記憶装置インタフェース部とを有し、 前記記憶装置は、前記音素データを格納する音素データ
    ベースと、前記音声合成目的データを格納する音声合成
    目的データと、前記端末装置との間でデータの送受信を
    行うための端末装置インタフェース部と、公衆回線に接
    続するための通信処理部を有することを特徴とする携帯
    端末装置。
  9. 【請求項9】記憶装置上の通信処理部を制御する記憶制
    御部を備え、前記記憶制御部は、前記通信処理部を介し
    て、前記音声合成処理プログラムと前記音素データと前
    記音声合成目的データとをインターネット上のサーバ装
    置からダウンロードし、前記ダウンロードした前記プロ
    グラムと前記データとを前記端末装置インタフェース部
    と前記記憶装置インタフェース部とを介して前記記憶部
    に転送することを特徴とする請求項8に記載の携帯端末
    装置。
  10. 【請求項10】端末装置と記憶装置とを有し、個性を持
    つ音素をデータ化した音素データとテキストデータ等の
    音声合成目的データとを処理する携帯端末装置であっ
    て、 前記端末装置は、全体を制御するシステム制御部と、前
    記音声合成処理プログラムを記憶する記憶部と、前記記
    憶装置との間でデータの送受信を行うための記憶装置イ
    ンタフェース部と、公衆回線に接続するための通信処理
    部とを有し、 前記記憶装置は、前記音声合成目的データと前記音素デ
    ータとから前記音声合成処理プログラムに基づいて音声
    合成を行うと共に前記音声合成処理プログラムを格納す
    る音声合成処理部と、前記端末装置との間でデータの送
    受信を行うための端末装置インタフェース部とを有し、
    ユーザが再生操作することで、音声合成目的データと特
    定キャラクタの音素データベースとを前記音声合成処理
    部が音声合成処理し、音声合成された音を出力する事を
    特徴とする携帯端末装置。
  11. 【請求項11】記憶装置は、音声合成目的データを格納
    する音声合成目的データベースまたは音素データを格納
    する音素データベースを有することを特徴とする請求項
    10記載の携帯端末装置。
  12. 【請求項12】携帯端末装置上又は前記記憶装置上に音
    声登録処理部を搭載し、ユーザ自身が登録したキャラク
    タ音声での合成音声を聴くことを可能にした請求項1記
    載の携帯端末装置。
  13. 【請求項13】携帯端末装置上又は前記記憶装置上に翻
    訳処理部を搭載し、ユーザが所望する合成目的データの
    翻訳結果を合成音声を聴くことを可能にした請求項1記
    載の携帯端末装置。
  14. 【請求項14】携帯端末装置上又は前記記憶装置上に音
    声登録処理部を搭載し、ユーザが所望する合成目的デー
    タの翻訳結果をユーザ自身が登録したキャラクタ音声で
    の合成音声を聴くことを可能にした請求項13記載の携
    帯端末装置。
  15. 【請求項15】ネットワーク上のサーバー装置にダウン
    ロード選択処理部を備えたネットワーク上のサーバー装
    置に接続し場合に、携帯端末装置上あるいは記憶装置上
    に合成目的データを記憶する際にユーザが所望する合成
    目的データの部分のみをダウンロード可能とした請求項
    1記載の携帯端末装置。
  16. 【請求項16】合成目的データは小説等のテキストデー
    タとした請求項1記載の携帯端末装置。
  17. 【請求項17】合成目的データは、スコアデータ(楽
    譜)とテキストデータ(歌詞)から成る楽曲データと
    し、ユーザが音素データベースと楽曲データを指定する
    ことで、ユーザが所望する特定キャラクタの音声で楽曲
    を提供可能な請求項1記載の携帯端末装置。
  18. 【請求項18】音声認証等での不正使用を回避する為、
    合成目的データ中のある特定の文字列(例えばお金の単
    位や数字等)においてはユーザ所望のキャラクタでの音
    声合成出力はせず、代替の音声合成出力を行う請求項1
    記載の携帯端末装置。
  19. 【請求項19】音声認証等での不正使用を回避する為、
    強制的に音声合成の出力音であること示す音を音声出力
    している文章中(決められた文字数毎、句読点毎、句点
    毎等)に挿入する事を特徴とする請求項1記載の携帯端
    末装置。
  20. 【請求項20】前記端末装置上又は記憶装置上に音声合
    成に用いる音素データベースを選択する音素データベー
    ス選択手段を搭載し、合成目的データの各部分毎にユー
    ザが所望するキャラクタ音声での音声出力が可能な請求
    項1記載の携帯端末装置。
  21. 【請求項21】ユーザによって音声キャラクタが選択さ
    れると、前記音素データベース選択手段は選択された結
    果を基に音声合成目的のデータの各音素データベースを
    適用する部分に対して識別記号を混在させて記憶部に記
    憶させ、音声合成処理中に前記音声合成処理部は前記識
    別記号を基に適用する音声キャラクタの音素データベー
    スを判別する請求項20記載の携帯端末装置。
  22. 【請求項22】音声合成目的のデータを楽譜と歌詞から
    成る楽曲データとし、ユーザが音素データベースと楽曲
    データを指定することで、ユーザが所望する特定キャラ
    クタの音声で楽曲を提供可能な請求項20記載の携帯端
    末装置。
  23. 【請求項23】前記端末装置上又は記憶装置上に合成音
    声出力中の音声合成目的データに関する視覚表示を行う
    視覚表示処理手段を搭載し、合成音声出力中の箇所の内
    容に合った挿絵や画像の表示を行う事を特徴とした請求
    項1記載の携帯端末装置。
  24. 【請求項24】視覚表示処理手段は、合成音声出力中の
    音声合成目的データの表示を行う文字データ表示処理部
    及び/又は合成音声出力中の箇所の内容に合った挿絵や
    画像の表示を行う画像データ表示処理部を含む請求項2
    3記載の携帯端末装置。
  25. 【請求項25】合成目的データを入力する手段としては
    メモリーカードや光ディスク等の記憶装置、ネットワー
    ク、キーボード等であり、音声合成された音を出力する
    手段としては、スピーカまたはイヤフォン等である事を
    特徴とする請求項1記載の携帯端末装置。
  26. 【請求項26】記憶装置は、携帯端末装置に対して脱着
    可能なメモリーカードまたは光ディスクや磁気ディスク
    等である事を特徴とする請求項1記載の携帯端末装置。
  27. 【請求項27】ネットワーク通信機能を備えた制御部
    と、様々な処理の作業領域等として用いられる記憶部
    と、 合成目的データの解析を行って、各文字データに最適な
    音素データを抽出及び連結してそのデータを携帯端末装
    置内にある音声出力処理部に渡せるようにデータ変換す
    る音声合成処理部と、複数の小説等の合成目的データが
    保存されるテキストデータ保存部と、実在の人物の肉声
    をサンプリングし、そのサンプリングデータをデータベ
    ース化した音素データベースを保存する音素データベー
    ス保存部と、ユーザ側携帯端末装置より音素データベー
    スの種類や合成対象のデータを示す情報が送られると、
    その音素データベースと合成目的データより音声合成処
    理を行ない、合成音声データをネットワーク経由でユー
    ザ側携帯端末装置へ送る機能を有することを特徴とする
    サーバー装置。
  28. 【請求項28】楽譜データを保存する楽譜データ保存部
    と、複数の歌詞等の合成目的データが保存されるテキス
    トデータ保存部と、前記楽譜データ保存部から楽譜デー
    タを読み出し、さらに音声合成データを順次読み出し、
    楽譜と音声合成された音を一つづつ対にして繋ぎ合わ
    せ、携帯端末装置にて再生可能なフォーマットに合わせ
    た形でデータ変換を行なう楽曲合成処理部とを備えたこ
    とを特徴とする請求項27記載のサーバー装置。
  29. 【請求項29】請求項27に記載のサーバー装置内に音
    声合成に用いる音素データベースを選択する音素データ
    ベース選択処理部を設け、合成目的データの各部分毎に
    ユーザが所望するキャラクタの音素データベースを用い
    て音声合成を行い、合成音声データをネットワーク経由
    で携帯端末装置に配信し、携帯端末装置では受信した音
    声データを音声再生する事を特徴とする読み上げシステ
    ム。
  30. 【請求項30】請求項27に記載のサーバー装置内にユ
    ーザから送られてくる音声合成目的データとユーザ情報
    を対応付けして管理するデータ登録処理部を搭載し、ユ
    ーザから送られた合成目的データの音声合成処理を行
    い、合成音声データをネットワーク経由で携帯端末装置
    に配信し、携帯端末装置では受信した音声データを音声
    再生する事を特徴とする読み上げシステム。
  31. 【請求項31】ネットワークで結ばれたシステムにおい
    て、音声合成処理部及び合成目的データと音素データベ
    ースはインターネット上のサーバー装置に搭載され、携
    帯端末装置は音声合成された音を出力する手段とシステ
    ム制御部を備え、ユーザが携帯端末装置を通じて音素デ
    ータベースの種類や合成対象のデータを選択すると、そ
    れに従ってサーバー装置は指定された音素データベース
    と合成目的データより音声合成処理を行い、合成音声デ
    ータをネットワーク経由で携帯端末装置に配信し、携帯
    端末装置では受信した音声データを音声再生することを
    特徴とする読み上げシステム。
  32. 【請求項32】インターネット上のサーバー装置に音声
    登録処理部を搭載し、ユーザ自身が登録したキャラクタ
    音声で文章の朗読を聴くことが可能な請求項31記載の
    読み上げシステム。
  33. 【請求項33】インターネット上のサーバー装置に翻訳
    処理部を搭載し、ユーザが携帯端末装置を通じて音素デ
    ータベースや翻訳の種類及び合成対象のデータを選択す
    ることで、サーバー装置は指定した翻訳処理を実行し、
    その結果を指定された音素データベースと合成目的デー
    タより音声合成処理を行い、合成音声データをネットワ
    ーク経由で、携帯端末装置に配信し、携帯端末装置では
    受信した音声データを音声再生する事を特徴とする請求
    項31記載の読み上げシステム。
  34. 【請求項34】インターネット上のサーバー装置に音声
    登録処理部を搭載し、ユーザが所望する合成目的データ
    の翻訳結果をユーザ自身が登録したキャラクタ音声で文
    章の朗読を聴くことが可能な請求項33記載の読み上げ
    システム。
  35. 【請求項35】合成目的データを小説等のテキストデー
    タのみでなく、スコアデータ(楽譜)とテキストデータ
    (歌詞)から成る楽曲データとし、ユーザが音素データ
    ベースと楽曲データを指定することで、ユーザが所望す
    る特定キャラクタの音声で楽曲を提供可能な請求項31
    記載の読み上げシステム。
  36. 【請求項36】音声認証等での不正使用を回避する為、
    合成目的データ中のある特定の文字列(例えばお金の単
    位や数字等)においてはユーザ所望のキャラクタでの音
    声合成出力はせず、代替の音声合成出力を行う請求項3
    1記載の読み上げシステム。
  37. 【請求項37】音声認証等での不正使用を回避する為、
    強制的に音声合成の出力音であること示す音を音声出力
    している文章中(決められた文字数毎、句読点毎、句点
    毎等)に挿入する事を特徴とする請求項31記載の読み
    上げシステム。
  38. 【請求項38】ネットワーク上のサーバー装置にダウン
    ロード選択処理部を備え、携帯端末装へ合成済みデータ
    をダウンロードする際に、ユーザが所望する部分のみを
    ダウンロード可能とした請求項31記載の読み上げシス
    テム。
  39. 【請求項39】音声の最小構成要素を音素と定め、その
    個性を持つ音素をデータ化した音素データベースと音声
    合成目的のデータ、例えば文章が記述されたテキストデ
    ータと、ユーザから送られてくる音声合成目的データと
    ユーザ情報を対応付けして管理するデータ登録処理部
    と、音声合成目的のデータを解析し、そのデータ毎に最
    適な音素を抽出して繋ぎあわせる音声合成処理部と、音
    声合成処理部が作成した合成音声データをユーザに配信
    する通信処理部から構成されるサーバー手段と、前記サ
    ーバー装置内にユーザから送られてくる音声合成目的デ
    ータとユーザ情報を対応付けして管理するデータ登録処
    理部を搭載し、ユーザから送られた合成目的データの音
    声合成処理を行い、合成音声データをネットワーク経由
    で携帯端末装置に配信し、携帯端末装置では受信した音
    声データを音声再生する事を特徴とする読み上げシステ
    ム。
  40. 【請求項40】デジタル音声データをアナログに変換
    し、不要なノイズをカットしてスピーカに出力する音声
    出力処理部と、ユーザが装置に指示を与えるための操作
    部と、システム制御部とを備え、音素データベースは実
    際の人物の肉声をサンプリングし、そのサンプリングデ
    ータをデータベース化したものであり、ユーザが操作部
    により音素データベースの種類や朗読対象のテキストデ
    ータを選択すると、その情報をサーバー装置へ送り、サ
    ーバー装置が指定された音素データベースとテキストデ
    ータより音声合成処理を行ない、サーバー装置から合成
    音の音声データがネットワーク経由で送られると、受信
    した音声データを音声再生することを特徴とする携帯端
    末装置。
JP2002055631A 2001-03-02 2002-03-01 携帯端末装置及び読み上げシステム Withdrawn JP2002328694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002055631A JP2002328694A (ja) 2001-03-02 2002-03-01 携帯端末装置及び読み上げシステム

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2001057774 2001-03-02
JP2001-57774 2001-03-02
JP2001-57773 2001-03-02
JP2001057773 2001-03-02
JP2002055631A JP2002328694A (ja) 2001-03-02 2002-03-01 携帯端末装置及び読み上げシステム

Publications (1)

Publication Number Publication Date
JP2002328694A true JP2002328694A (ja) 2002-11-15

Family

ID=27346148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002055631A Withdrawn JP2002328694A (ja) 2001-03-02 2002-03-01 携帯端末装置及び読み上げシステム

Country Status (1)

Country Link
JP (1) JP2002328694A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005062420A (ja) * 2003-08-11 2005-03-10 Nec Corp コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム
JP2006330442A (ja) * 2005-05-27 2006-12-07 Kenwood Corp 音声案内システム、キャラクタ人形、携帯端末装置、音声案内装置及びプログラム
JP2006330486A (ja) * 2005-05-27 2006-12-07 Kenwood Corp 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体
JPWO2005093713A1 (ja) * 2004-03-29 2008-07-31 株式会社エーアイ 音声合成装置
WO2013150874A1 (ja) * 2012-04-02 2013-10-10 ヤマハ株式会社 コンテンツ配信システム、サーバ装置及び端末装置
JP2018072509A (ja) * 2016-10-27 2018-05-10 トッパン・フォームズ株式会社 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム
JP2022534824A (ja) * 2019-09-18 2022-08-04 ヨプ リ,ジョン 多重音声システムが装着されたオンラインメディアサービス具現方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005062420A (ja) * 2003-08-11 2005-03-10 Nec Corp コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム
JPWO2005093713A1 (ja) * 2004-03-29 2008-07-31 株式会社エーアイ 音声合成装置
JP4884212B2 (ja) * 2004-03-29 2012-02-29 株式会社エーアイ 音声合成装置
JP2006330442A (ja) * 2005-05-27 2006-12-07 Kenwood Corp 音声案内システム、キャラクタ人形、携帯端末装置、音声案内装置及びプログラム
JP2006330486A (ja) * 2005-05-27 2006-12-07 Kenwood Corp 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体
WO2013150874A1 (ja) * 2012-04-02 2013-10-10 ヤマハ株式会社 コンテンツ配信システム、サーバ装置及び端末装置
JP2018072509A (ja) * 2016-10-27 2018-05-10 トッパン・フォームズ株式会社 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム
JP2022534824A (ja) * 2019-09-18 2022-08-04 ヨプ リ,ジョン 多重音声システムが装着されたオンラインメディアサービス具現方法
JP7262142B2 (ja) 2019-09-18 2023-04-21 ヨプ リ,ジョン 複数の音声システムが装着されたオンラインメディアサービス具現方法

Similar Documents

Publication Publication Date Title
US10720145B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US7027568B1 (en) Personal message service with enhanced text to speech synthesis
US7289798B2 (en) Methods and apparatuses for programming user-defined information into electronic devices
US7295864B2 (en) Methods and apparatuses for programming user-defined information into electronic devices
JP2000066688A (ja) 移動通信網を用いたカラオケサービス方法及びそのシステム
JPH1173192A (ja) 情報処理装置及び情報配信システム
US20020178137A1 (en) Electronic mail system, method of sending and receiving electronic mail, and storage medium
WO2001086986A1 (en) A method for storing, retrieving multi-media data in digital mobile telephones and a digital mobile telephone therefor
US8224394B2 (en) Methods and apparatuses for programming user-defined information into electronic devices
WO2006043929A1 (en) Systems and methods for music remixing
JP2002328694A (ja) 携帯端末装置及び読み上げシステム
EP1073036B1 (en) Parsing of downloaded documents for a speech synthesis enabled browser
EP1954048A2 (en) Viewing/hearing device
US20020156630A1 (en) Reading system and information terminal
JP2006091680A (ja) 移動体通信端末、および、プログラム
JP2005274979A (ja) カラオケ処理装置、カラオケ演奏処理装置、サーバー装置、通信システム、カラオケ処理装置の制御方法、サーバー装置の制御方法、制御プログラムおよび記録媒体
CN114762357A (zh) 信息处理系统、信息处理方法以及存储介质
JP2002244681A (ja) カラオケ楽曲データ再生機能付電話装置、カラオケ楽曲データ再生機能付デジタルテレビ装置及びカラオケ楽曲データ配信装置
JP2008046738A (ja) 生活記録作成システムおよびその制御方法
JPWO2003015075A1 (ja) 楽曲データ送受信システム
JP2003345351A (ja) デジタルコンテンツ編集システムおよびデジタルコンテンツ編集方法
KR100432938B1 (ko) 개인별로 구분된 음성 사서함 배경 음악 구성 방법 및 장치
KR20050119041A (ko) 사용자가 지정한 부분으로 가공된 멀티미디어 콘텐츠의 제공 시스템 및 방법
JPH09282278A (ja) 端末装置および情報配信システム
KR20050071451A (ko) 음원을 편집하여 벨소리를 생성하는 웹 기반 벨소리 저작시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050117

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050706

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20061101