JP2005300783A

JP2005300783A - 音声変換装置

Info

Publication number: JP2005300783A
Application number: JP2004114725A
Authority: JP
Inventors: Yukio Kimura; 幸夫木村; Shigeru Yoshida; 茂吉田
Original assignee: ZYYX KK
Current assignee: ZYYX KK
Priority date: 2004-04-08
Filing date: 2004-04-08
Publication date: 2005-10-27

Abstract

【課題】携帯電話装置において、所望のメッセージを再生する音声ファイルを取得することができなかった。
【解決手段】携帯電話装置２０は、所望のメッセージを含むテキストデータ２２を音声変換装置１００に送信する。音声変換装置１００は、音声提供者の音声パラメータを利用してテキストデータ２２を音声データに変換し、携帯電話装置２０の性能に応じた音声ファイル２４を生成する。そして、音声変換装置１００は生成した音声ファイル２４を携帯電話装置２０に提供する。これにより、音声変換装置１００は所望のメッセージを再生する音声ファイルを取得することができる。
【選択図】図１

Description

この発明は、文字列を音声に変換する技術に関し、とくに入力したテキストデータを音声データに変換して再生装置に提供する装置に関する。

文字データを音声データに変換して、音声を合成する技術がある。こうした音声合成技術は、例えば電子メールを自動的に読み上げるソフトウエアや、ＣＴＩ（Computer Telephony Integration）などで利用され、より自然に、より人間らしく発音できるように、日々研究が行われている（例えば、特許文献１参照）。

音声合成技術が発達する一方で、通信技術、情報処理技術、製造技術など各種技術も発達し、携帯電話を初めとする様々な携帯端末の小型化が進んでいる。こうした携帯端末の機能は年々高度化し、例えば携帯電話は、通話機能だけでなく、留守番電話機能、着信音やアラーム音を例えば音楽や音声メッセージなど様々な種類のメロディーで出力する機能などを搭載している。携帯電話は、ネットワークを介してそうしたメロディーを再生するための音声ファイルをダウンロードすることができる。
特開平１０−１１０８３号公報

音声ファイルは、音声信号を例えばＰＣＭ（Pulse Code Modulation）などを利用してデジタルデータに変換したものである。したがって、音楽も音声メッセージも同様のファイル形式で取り扱うことができる。しかしながら、携帯電話で再生できる音声ファイルは、予め用意されているものに限られている。

本発明はこうした点に鑑みてなされたもので、その目的は、任意の音声メッセージの再生を可能にする装置の提供にある。

本発明のある態様は、文字列を音声情報に変換する装置である。この装置は、第１文字列を受け付ける受付部と、第１文字列に第２文字列が含まれているか否かを検出する検出部と、第１文字列に第２文字列が含まれている場合、第２文字列を発音しないように第１文字列を音声情報に変換する変換部とを備える。これにより、第２文字列が発音されることを防止できる。

この装置は、音声情報を生成するために必要なパラメータを、音声種類に対応付けて保持する音声パラメータ格納部と、音声種類に対応付けて、第２文字列を保持する文字列格納部とを備え、受付部は、第１文字列とともに音声種類を受け付け、検出部は、受付部が受け付けた音声種類に対応付けられた第２文字列が第１文字列に含まれているか否かを検出してもよい。これにより、発音を禁止する第２文字列を、音声種類毎に設定できる。

この装置は、第２文字列が第１文字列に含まれている場合、その旨を通知する通知部を更に備えてもよい。これにより、第１文字列に第２文字列が含まれていることを、利用者に通知し、第１文字列の変更などを促すことができる。

第２文字列が第１文字列に含まれている場合、変換部は、第１文字列に含まれる第２文字列を他の文字列に置き換えた後、音声情報に変換してもよい。これにより、第２文字列の発音を防止できる。

本発明の別の態様は、文字情報を音声情報に変換する装置である。この装置は、文字情報と音声情報を再生する再生装置に関する機種情報とを受け付ける受付部と、文字情報と機種情報とに基づいて、その機種情報で特定される再生装置で利用可能なデータ形式の音声情報を生成する変換部と、生成した音声情報を再生装置に提供する提供部とを備える。これにより、この装置は、文字情報に基づいて再生装置に応じた音声情報を生成することができる。

この装置は、機種情報に対応付けて、再生装置における音声情報の再生条件を保持する装置情報格納部を更に備え、変換部は、受け付けた機種情報に対応付けられた再生条件を満たすように音声情報を生成してもよい。これにより、再生装置の機種毎に音声情報を生成することができる。

再生条件を満たすように生成した音声情報の音質が所定の音質より悪くなる場合、その旨を通知する通知部を更に備えてもよい。これにより、音声情報による音質の品質を、常に一定以上に保つことができる。

この装置の装置情報格納部は、機種情報に対応付けて、再生条件を満たすための最大文字数を更に保持し、文字情報に含まれる文字の文字数が最大文字数より多いか否かを判定し、文字情報の文字数が最大文字数より大きい場合に、文字数を減らすことを促す通知を行うことを通知部に指示する判定部を更に備えてもよい。

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、任意の音声メッセージを携帯電話で再生可能にし、実用的な音声変換装置を提供できる。

図１は、実施の形態に係る音声変換システム１０の構成図である。音声変換装置１００は、ネットワーク１２を介して基地局１４と接続している。また、携帯電話装置２０は、基地局１４と無線回線を形成し、ネットワーク１２に接続している。音声パラメータ入力装置１０２は、第１音声提供者Ａおよび第２音声提供者Ｂ（以下、単に「音声提供者」という）の音声を入力し、音声を合成する際に利用する音声パラメータを生成する。音声パラメータ入力装置１０２は、例えばマイクを介して入力したアナログの音声信号をＰＣＭなどでデジタル化し、ＦＦＴ（Fast Fourier Transform）などの処理を施すことにより音声パラメータを生成する。そして、音声パラメータ入力装置１０２は、音声パラメータを音声変換装置１００に出力する。詳細は後述するが、音声変換装置１００は、音声提供者毎に音声パラメータを対応付けて保持し、指定された音声提供者の音声パラメータを利用して音声ファイルを生成する。

利用者Ｃ（以下、単に「利用者」という）は、携帯電話装置２０を操作し、所望の音声メッセージを再生するための音声ファイルを音声変換装置１００から取得する。まず、携帯電話装置２０は、任意のテキストデータ２２、機種情報２６、および音声提供者識別情報２８を、例えばウェブページや電子メールなどを利用して音声変換装置１００に送信する（Ｓ１０）。音声変換装置１００は、そのテキストデータ２２を利用者に指定された音声提供者の音声パラメータを利用して音声データに変換して、音声ファイル２４を生成し、携帯電話装置２０に送信する（Ｓ１２）。携帯電話装置２０は、取得した音声ファイル２４を格納し、留守番電話機能におけるメッセージや、着信時のメロディーとして利用する。これにより、利用者は、例えば好きな女優など所望の音声提供者の声で、所望のメッセージを再生させることができる。

詳細は後述するが、音声変換装置１００は、例えば公序良俗に係るワードを禁止ワードとして予め保持する。そして、テキストデータ２２に禁止ワードが含まれている場合、音声変換装置１００は禁止ワードを発音しないように処理を行う。例えば、音声変換装置１００は、禁止ワードをメッセージ中から取り除くことを利用者に要求するエラーメッセージを携帯電話装置２０に送信してもよいし、禁止ワードを他の文字に置き換えて音声データを生成してもよいし、禁止ワードを自動的に削除して音声データを生成してもよい。これにより、音声変換装置１００が生成した音声ファイル２４により、公序良俗に係る禁止ワードが再生されることを防止できる。また、禁止ワードを音声提供者ごとに保持することにより、音声提供者が望まない言葉の再生を防止でき、例えばセクシャルな言葉などが再生されることにより音声提供者のプライドや名誉が傷つけられることを防止できる。つまり、音声変換装置１００は、単にテキストデータ２２を音声データに変換するだけでなく、音声提供者を保護する機能を備える。

また、携帯電話装置２０は、機種や通信事業者により機種性能が異なり、再生可能なファイル形式、ファイルサイズなども異なる。そこで、音声変換装置１００は、音声ファイル２４を再生する携帯電話装置２０の機種性能に応じて、音声ファイル２４を生成する機能を備える。これにより、利用者は携帯電話装置２０の機種性能を意識せずに、所望するメッセージを再生するための音声ファイル２４を取得することができる。このような音声変換システム１０により、携帯電話装置２０の機能を十分に活用し、ユーザニーズに応えることができる。

図２は、図１の音声変換装置１００の内部構成図である。音声変換装置１００の各構成要素は、ハードウエアコンポーネントで言えば、任意のコンピュータのＣＰＵ、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インターフェース等を中心に実現されるが、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。これから説明する各図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。

登録部１２６は、音声パラメータ入力装置１０２から音声提供者ごとに音声パラメータと禁止ワードとを受け付け、それぞれ音声パラメータ格納部１３２ならびに禁止ワード格納部１３０に格納する。他の例では、登録部１２６は、図１のネットワーク１２を介して、音声パラメータおよび禁止ワードを受け付けてもよいし、例えばフレキシブルディスクなどの記録媒体からそれらのデータを読み込んでもよい。要は、登録部１２６は、音声提供者ごとに音声パラメータおよび禁止ワードを受け付け、それぞれ音声パラメータ格納部１３２ならびに禁止ワード格納部１３０に登録すればよい。

図３は、図２の禁止ワード格納部１３０のデータ構造の一例を示す図である。提供者ＩＤ欄１７０は、音声提供者を識別する情報（以下、単に「提供者ＩＤ」という）を保持する。禁止ワード欄１７２は、禁止ワードを保持する。例えば、本図で、提供者ＩＤ「Ａ」で特定される音声提供者は、「○○○」と「×××××」が禁止ワードとして登録されている。このように、提供者ＩＤと、禁止ワードとを対応付けて保持することにより、図２の音声変換装置１００は、音声提供者毎に音声に変換しない言葉を判断することができる。更に、禁止ワード格納部１３０は、例えば放送禁止用語など一般的に公序良俗に反する言葉を共通の禁止ワードとして保持してもよい。本図では、提供者ＩＤ欄１７０に「共通」が保持されている禁止ワードが共通の禁止ワードである。他の例では、共通の禁止ワードは、禁止ワード格納部１３０とは別の格納部に保持されてもよい。このように、禁止ワード格納部１３０が共通の禁止ワードと音声提供者毎の禁止ワードとを保持することにより、図２の音声変換装置１００は、公序良俗に係る最低限守るべき秩序を保ち、更に音声提供者の意志に基づいた禁止ワードの発音を避け、音声提供者のプライドや品格などを保護することができる。

図２に戻り、受付部１１０は、図１の携帯電話装置２０からテキストデータ２２、機種情報２６、および音声提供者識別情報２８を受け付け、判定部１１１に出力する。受付部１１０は、テキストデータ２２を例えばＨＴＴＰ（Hyper Text Transfer Protocol）などのリアルタイム性の高い所定の通信規定に準じた形式で受け付けてもよいし、電子メールなどのリアルタイム性の低い所定の通信規定に準じた形式で受け付けてもよい。本実施の形態では、受付部１１０は、ＨＴＴＰに準じてテキストデータ２２、および音声提供者識別情報２８を受け付けるとともに、ＨＴＴＰヘッダなどの利用者が容易に変更できないデータ部分から機種情報２６を取得する。これにより、受付部１１０は確実に携帯電話装置２０の機種情報２６を取得できる。

そして、受付部１１０は、それぞれのデータを判定部１１１に出力する。電子メールによりテキストデータ２２を受け付ける場合、テキストデータ２２、機種情報２６、および音声提供者識別情報２８は電子メールの本文に含まれてよく、受付部１１０は本文部分からテキストデータ２２と機種情報２６と音声提供者識別情報２８とを抽出し、判定部１１１に出力する。要は、受付部１１０は、通信対象となる携帯電話装置２０が有する通信機能のいずれかを利用して送信されたテキストデータ２２、機種情報２６、および音声提供者識別情報２８を受け付け、それらを判定部１１１に出力すればよい。

判定部１１１は、テキストデータ２２と機種情報２６とに基づいて、テキストデータ２２に含まれる文字列に基づいて音声ファイルを生成した場合のサイズを推定し、そのサイズの音声ファイルを利用して図１の携帯電話装置２０が再生できるか否かを判定する。そして、再生できる場合、判定部１１１はテキストデータ２２、機種情報２６、および音声提供者識別情報２８を検出部１１２に出力する。また、音声ファイルのサイズが所定のサイズより大きくなり、携帯電話装置２０において再生できない場合、判定部１１１は、その旨を通知するメッセージの送信を通知部１１８に指示する。これにより、音声データへの変換前に、再生の有無を判断することができるので、無駄を無くし、効率的に音声ファイルを生成することができる。

また、一般に、音声ファイルのサイズは、サンプリング周波数を低くすることで、言い換えれば品質を下げることにより小さくすることができる。しかしながら、利用者が認識できなければ意味がない。そこで、本実施の形態では、携帯電話装置２０の機種毎にデフォルトのサンプリング周波数が設定されており、そのサンプリング周波数と再生可能な音声ファイルのサイズとに基づいて、機種毎に変換可能な文字数（以下、単に「最大文字数」という）が算出される。その最大文字数を利用して、判定部１１１は、前述の判定処理を行う。つまり、判定部１１１は、再生時の音声の品質と、音声ファイルのサイズとのバランスを考慮して、機種毎の再生条件に適合するように、テキストデータ２２に含まれる文字数の制限を行う。

装置情報格納部１３４は、機種情報に対応付けて、例えば音声ファイルのファイル形式、再生可能な音声ファイルの最大サイズ、サンプリング周波数、最大文字数などの再生条件を保持する。判定部１１１は、機種情報２６で特定される装置の最大文字数を装置情報格納部１３４から読み込み、読み込んだ最大文字数と、テキストデータ２２に含まれる文字の文字数（以下、単に「実文字数」という）とを比較する。実文字数が最大文字数以上の場合、判定部１１１は、文字数を減らすことを指示する内容のメッセージを通知部１１８に通知させる。また、実文字数が最大文字数より少ない場合、判定部１１１は、テキストデータ２２、機種情報２６、および音声提供者識別情報２８を検出部１１２に出力する。

図４は、図２の装置情報格納部１３４のデータ構造の一例を示す図である。装置ＩＤ欄１８０は、図１の携帯電話装置２０を識別する情報（以下、単に「装置ＩＤ」という）を保持する。この装置ＩＤは、図２の受付部１１０が携帯電話装置２０から通常のプロトコルに準じて取得可能な機種情報２６であることが好ましく、例えばＨＴＴＰヘッダに含まれる機種名などであってよい。要は、装置ＩＤ欄１８０は、受付部１１０が携帯電話装置２０から取得可能な情報であって、かつ携帯電話装置２０を特定可能な情報を保持すればよい。

データ形式欄１８２は、再生可能な音声ファイルのデータ形式を保持する。データサイズ欄１８４は、再生可能な音声ファイルの最大のデータサイズ、つまり最大サイズを保持する。周波数欄１８６は、再生可能なサンプリング周波数を保持する。デフォルト周波数欄１８８は、デフォルトで利用するサンプリング周波数を保持する。文字数欄１９０は、デフォルト周波数欄１８８に保持されているサンプリング周波数に基づいて、音声ファイルを生成した場合に、音声ファイルのデータサイズが最大サイズより小さくなるおおよその文字数、つまり最大文字数を保持する。図２の判定部１１１および変換部１１６は、装置情報格納部１３４に保持されている各種のデータを適宜利用して、それぞれ所定の処理を実現する。

図２に戻り、検出部１１２は、テキストデータ２２に禁止ワードが含まれているか否かを検出する。検出部１１２は、禁止ワード格納部１３０に保持されている共通の禁止ワードおよび音声提供者識別情報２８で特定される提供者ＩＤに対応付けられた禁止ワードのいずれかがテキストデータ２２に含まれているか否かを検出する。そして、検出した禁止ワードの情報とともにテキストデータ２２を指示部１１４に出力する。

テキストデータ２２に禁止ワードが含まれている場合、指示部１１４は、その禁止ワードを発音しないようにテキストデータ２２に対して所定の処理を施す。例えば、指示部１１４は、テキストデータ２２に含まれている禁止ワードを取り除くことを促すメッセージを通知部１１８に通知させてもよいし、テキストデータ２２に含まれる禁止ワードを例えば擬音などの所定の言葉に置き換えてもよいし、テキストデータ２２に含まれる禁止ワードを取り除いてもよい。これにより、テキストデータ２２から禁止ワードを排除することができるので、音声変換装置１００は生成した音声ファイル２４により禁止ワードが発音されることを防止できる。本実施の形態では、指示部１１４は、禁止ワードを取り除いた別のテキストデータ２２を作成することを利用者に促すメッセージの送信を通知部１１８に指示する。テキストデータ２２に禁止ワードが含まれていない場合、指示部１１４はテキストデータ２２を変換部１１６に出力する。

変換部１１６は、音声パラメータ格納部１３２に保持されている音声提供者毎の音声パラメータを利用して、テキストデータ２２を音声データに変換する。そして、変換部１１６は、機種毎のファイル形式で音声ファイル２４を生成し、提供部１２０に出力する。また、変換部１１６は、音声ファイル２４を生成したことを課金部１２２に通知する。具体的には、変換部１１６は、音声提供者識別情報２８をキーに音声パラメータ格納部１３２を参照し、該当する音声提供者の音声パラメータを読み込み、既知の変換手法を利用してテキストデータ２２を音声データに変換する。つまり音声合成処理を行う。そして、変換部１１６は、機種情報２６をキーに装置情報格納部１３４を参照し、該当するファイル形式を読み込み、音声ファイル２４を生成する。

そして、変換部１１６は生成した音声ファイル２４のデータサイズを検出し、装置情報格納部１３４に保持されている最大サイズより小さいか否かを判定し、最終的に生成した音声ファイル２４が携帯電話装置２０において再生可能か否かを判断する。音声ファイル２４のデータサイズが最大サイズより小さい場合、変換部１１６は、その音声ファイル２４を提供部１２０に出力する。また、音声ファイル２４のデータサイズが最大サイズより大きい場合、変換部１１６は通知部１１８に文字数を減らすことを促すメッセージを送信させる。例えばテキストデータ２２に含まれる文字が漢字など、一文字で多くの発音が必要な文字が含まれる場合、前述の判定部１１１が行う文字数に基づいて推定したサイズと、実際に生成した音声ファイル２４のデータサイズには誤差が生じる。そこで、変換部１１６は、最終的に生成した音声ファイル２４が携帯電話装置２０の再生条件を満たすか否かを判定し、再生条件を満たす音声ファイル２４だけを提供部１２０に出力する。これにより、音声変換装置１００は、再生条件を満たす音声ファイル２４だけを携帯電話装置２０に提供することができる。

提供部１２０は、変換部１１６から供給された音声ファイル２４を音声データ格納部１２４に格納する。そして、提供部１２０は、音声ファイル２４を提供する準備が完了したことを伝えるメッセージと、その音声ファイル２４を取得するための情報とを含むファイル（以下、単に「提供可能通知ファイル」という）を携帯電話装置２０に送信する。そして、提供部１２０は、その提供可能ファイルに応じて携帯電話装置２０から音声ファイル２４の送信を要求された場合、携帯電話装置２０に音声ファイル２４を送信する。例えば、提供部１２０は、ＨＴＭＬ（Hyper Text Markup Language）などの文書記述言語に準じて、提供可能通知ファイルを生成する。そして、そのファイルには、音声ファイル２４の格納場所を特定するアドレス情報が含まれている。これにより、携帯電話装置２０は、提供可能通知ファイルに基づいて、音声ファイル２４をダウンロードするためのウェブページを表示することができる。

他の例では、提供部１２０は、音声ファイル２４を電子メールなどに添付して、携帯電話装置２０に送信してもよい。要は、提供部１２０は、変換部１１６から供給された音声ファイル２４を、その音声ファイル２４の生成を要求した携帯電話装置２０に提供すればよい。

課金部１２２は、音声ファイル２４を生成したことを契機に、利用者に対する課金処理を行うとともに、その一部を音声提供者に還元する処理を行う。こうした課金、還元処理は、ビジネスの形態に応じて任意に設定される。通知部１１８は、前述した判定部１１１、指示部１１４、および変換部１１６の指示に応じて、例えばウェブページや電子メールなどを利用して各種の通知を行う。

図５は、図１の音声変換装置１００および携帯電話装置２０における処理のシーケンスの一例を示す図である。携帯電話装置２０は、音声変換装置１００に図１のテキストデータ２２を音声データに変換することを要求する（Ｓ５０）。音声変換装置１００は、図１のテキストデータ２２、機種情報２６、および音声提供者識別情報２８を受け付ける（Ｓ５２）。そして、音声変換装置１００は、テキストデータ２２に含まれる文字数が最大文字数以内か否かを判定する（Ｓ５４）。最大文字数以上の場合（Ｓ５４のＮ）、音声変換装置１００は、携帯電話装置２０に文字数の変更を要求する（Ｓ７２）。また、最大文字数より少ない場合（Ｓ５４のＹ）、音声変換装置１００は、テキストデータ２２に禁止ワードが含まれているか否かを判定する（Ｓ５６）。

禁止ワードが含まれている場合（Ｓ５６のＮ）、音声変換装置１００は、禁止ワードを取り除くことを音声変換装置１００に要求する（Ｓ７４）。音声変換装置１００からの情報が、文字数変更要求または文字列変更要求の場合（Ｓ７６のＹ）、携帯電話装置２０はその要求に対応するメッセージを表示する（Ｓ７８）。また、文字数変更要求または文字列変更要求でない場合（Ｓ７６のＮ）、携帯電話装置２０は待機する。

ステップ５６で、テキストデータ２２に禁止ワードが含まれていない場合（Ｓ５６のＹ）、音声変換装置１００は、そのテキストデータ２２を音声データに変換し（Ｓ５８）、所定のファイル形式の音声ファイル２４を生成する（Ｓ６０）。そして、音声変換装置１００は、その音声ファイル２４を格納し（Ｓ６２）、取得要求を携帯電話装置２０に送信する（Ｓ６４）。その取得要求に応じて、携帯電話装置２０は、音声ファイル２４の提供を音声変換装置１００に要求する（Ｓ６６）。音声変換装置１００は、その要求で指定された音声ファイル２４を携帯電話装置２０に送信する（Ｓ６８）。また、音声変換装置１００は、生成した音声ファイル２４に応じて、課金処理および還元処理を行う（Ｓ７０）。

以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

実施の形態に係る音声変換システムの構成図である。図１の音声変換装置の内部構成図である。図２の禁止ワード格納部のデータ構造の一例を示す図である。図２の装置情報格納部のデータ構造の一例を示す図である。図１の音声変換装置および携帯電話装置における処理のシーケンスの一例を示す図である。

符号の説明

１０音声変換システム、１２ネットワーク、１４基地局、２０携帯電話装置、２２テキストデータ、２４音声ファイル、２６機種情報、２８音声提供者識別情報、１００音声変換装置、１０２音声パラメータ入力装置、１１０受付部、１１１判定部、１１２検出部、１１４指示部、１１６変換部、１１８通知部、１２０提供部、１２２課金部、１２４音声データ格納部、１２６登録部、１３０禁止ワード格納部、１３２音声パラメータ格納部、１３４装置情報格納部。

Claims

第１文字列を受け付ける受付部と、
前記第１文字列に第２文字列が含まれているか否かを検出する検出部と、
前記第１文字列に前記第２文字列が含まれている場合、前記第２文字列を発音しないように前記第１文字列を音声情報に変換する変換部と、
を備えることを特徴とする音声変換装置。
前記音声情報を生成するために必要なパラメータを、音声種類に対応付けて保持する音声パラメータ格納部と、
前記音声種類に対応付けて、前記第２文字列を保持する文字列格納部と、
を備え、
前記受付部は、前記第１文字列とともに音声種類を受け付け、前記検出部は、前記受付部が受け付けた音声種類に対応付けられた第２文字列が前記第１文字列に含まれているか否かを検出することを特徴とする請求項１に記載の音声変換装置。
前記第２文字列が前記第１文字列に含まれている場合、その旨を通知する通知部を更に備えることを特徴とする請求項１または２に記載の音声変換装置。
前記第２文字列が前記第１文字列に含まれている場合、前記変換部は、前記第１文字列に含まれる前記第２文字列を他の文字列に置き換えた後、音声情報に変換することを特徴とする請求項１から３のいずれかに記載の音声変換装置。
文字情報を音声情報に変換する装置であって、
前記文字情報と前記音声情報を再生する再生装置に関する機種情報とを受け付ける受付部と、
前記文字情報と前記機種情報とに基づいて、その機種情報で特定される再生装置で利用可能なデータ形式の音声情報を生成する変換部と、
生成した音声情報を前記再生装置に提供する提供部と、
を備えることを特徴とする音声変換装置。
前記機種情報に対応付けて、前記再生装置における音声情報の再生条件を保持する装置情報格納部を更に備え、
前記変換部は、受け付けた前記機種情報に対応付けられた再生条件を満たすように前記音声情報を生成することを特徴とする請求項５に記載の音声変換装置。
前記再生条件を満たすように生成した音声情報の音質が所定の音質より悪くなる場合、その旨を通知する通知部を更に備えることを特徴とする請求項６に記載の音声変換装置。
前記装置情報格納部は、前記機種情報に対応付けて、前記再生条件を満たすための最大文字数を更に保持し、前記文字情報に含まれる文字の文字数が前記最大文字数より多いか否かを判定し、前記文字情報の文字数が前記最大文字数より大きい場合に、文字数を減らすことを促す通知を行うことを前記通知部に指示する判定部を更に備えることを特徴とする請求項７に記載の音声変換装置。
音声種類に対応付けて、その音声種類の音声情報を生成するために必要なパラメータを保持する音声パラメータ格納部を更に備え、
前記受付部は、前記文字情報の変換に利用する音声種類を更に受け付け、
前記変換部は、前記受付部が受け付けた音声種類に対応付けられたパラメータを利用して音声情報を生成することを特徴とする請求項５から８のいずれかに記載の音声変換装置。
所定の文字列を保持する文字列格納部と、
前記文字情報に前記文字列が含まれているか否かを判定する検出部と、
前記文字情報に前記文字列が含まれている場合、前記文字列を発音しないように所定の処理の実行を指示する指示部と、
を更に備えることを特徴とする請求項５から９のいずれかに記載の音声変換装置。
前記文字列格納部は、前記文字列を前記音声種類に対応付けて保持し、
前記検出部は、前記受付部が受け付けた音声種類に対応付けられた文字列が前記文字情報に含まれているか否かを判定することを特徴とする請求項１０に記載の音声変換装置。