JP2005300783A - 音声変換装置 - Google Patents

音声変換装置 Download PDF

Info

Publication number
JP2005300783A
JP2005300783A JP2004114725A JP2004114725A JP2005300783A JP 2005300783 A JP2005300783 A JP 2005300783A JP 2004114725 A JP2004114725 A JP 2004114725A JP 2004114725 A JP2004114725 A JP 2004114725A JP 2005300783 A JP2005300783 A JP 2005300783A
Authority
JP
Japan
Prior art keywords
voice
character string
information
unit
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004114725A
Other languages
English (en)
Inventor
Yukio Kimura
幸夫 木村
Shigeru Yoshida
茂 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZYYX KK
Original Assignee
ZYYX KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZYYX KK filed Critical ZYYX KK
Priority to JP2004114725A priority Critical patent/JP2005300783A/ja
Publication of JP2005300783A publication Critical patent/JP2005300783A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】携帯電話装置において、所望のメッセージを再生する音声ファイルを取得することができなかった。
【解決手段】携帯電話装置20は、所望のメッセージを含むテキストデータ22を音声変換装置100に送信する。音声変換装置100は、音声提供者の音声パラメータを利用してテキストデータ22を音声データに変換し、携帯電話装置20の性能に応じた音声ファイル24を生成する。そして、音声変換装置100は生成した音声ファイル24を携帯電話装置20に提供する。これにより、音声変換装置100は所望のメッセージを再生する音声ファイルを取得することができる。
【選択図】図1

Description

この発明は、文字列を音声に変換する技術に関し、とくに入力したテキストデータを音声データに変換して再生装置に提供する装置に関する。
文字データを音声データに変換して、音声を合成する技術がある。こうした音声合成技術は、例えば電子メールを自動的に読み上げるソフトウエアや、CTI(Computer Telephony Integration)などで利用され、より自然に、より人間らしく発音できるように、日々研究が行われている(例えば、特許文献1参照)。
音声合成技術が発達する一方で、通信技術、情報処理技術、製造技術など各種技術も発達し、携帯電話を初めとする様々な携帯端末の小型化が進んでいる。こうした携帯端末の機能は年々高度化し、例えば携帯電話は、通話機能だけでなく、留守番電話機能、着信音やアラーム音を例えば音楽や音声メッセージなど様々な種類のメロディーで出力する機能などを搭載している。携帯電話は、ネットワークを介してそうしたメロディーを再生するための音声ファイルをダウンロードすることができる。
特開平10−11083号公報
音声ファイルは、音声信号を例えばPCM(Pulse Code Modulation)などを利用してデジタルデータに変換したものである。したがって、音楽も音声メッセージも同様のファイル形式で取り扱うことができる。しかしながら、携帯電話で再生できる音声ファイルは、予め用意されているものに限られている。
本発明はこうした点に鑑みてなされたもので、その目的は、任意の音声メッセージの再生を可能にする装置の提供にある。
本発明のある態様は、文字列を音声情報に変換する装置である。この装置は、第1文字列を受け付ける受付部と、第1文字列に第2文字列が含まれているか否かを検出する検出部と、第1文字列に第2文字列が含まれている場合、第2文字列を発音しないように第1文字列を音声情報に変換する変換部とを備える。これにより、第2文字列が発音されることを防止できる。
この装置は、音声情報を生成するために必要なパラメータを、音声種類に対応付けて保持する音声パラメータ格納部と、音声種類に対応付けて、第2文字列を保持する文字列格納部とを備え、受付部は、第1文字列とともに音声種類を受け付け、検出部は、受付部が受け付けた音声種類に対応付けられた第2文字列が第1文字列に含まれているか否かを検出してもよい。これにより、発音を禁止する第2文字列を、音声種類毎に設定できる。
この装置は、第2文字列が第1文字列に含まれている場合、その旨を通知する通知部を更に備えてもよい。これにより、第1文字列に第2文字列が含まれていることを、利用者に通知し、第1文字列の変更などを促すことができる。
第2文字列が第1文字列に含まれている場合、変換部は、第1文字列に含まれる第2文字列を他の文字列に置き換えた後、音声情報に変換してもよい。これにより、第2文字列の発音を防止できる。
本発明の別の態様は、文字情報を音声情報に変換する装置である。この装置は、文字情報と音声情報を再生する再生装置に関する機種情報とを受け付ける受付部と、文字情報と機種情報とに基づいて、その機種情報で特定される再生装置で利用可能なデータ形式の音声情報を生成する変換部と、生成した音声情報を再生装置に提供する提供部とを備える。これにより、この装置は、文字情報に基づいて再生装置に応じた音声情報を生成することができる。
この装置は、機種情報に対応付けて、再生装置における音声情報の再生条件を保持する装置情報格納部を更に備え、変換部は、受け付けた機種情報に対応付けられた再生条件を満たすように音声情報を生成してもよい。これにより、再生装置の機種毎に音声情報を生成することができる。
再生条件を満たすように生成した音声情報の音質が所定の音質より悪くなる場合、その旨を通知する通知部を更に備えてもよい。これにより、音声情報による音質の品質を、常に一定以上に保つことができる。
この装置の装置情報格納部は、機種情報に対応付けて、再生条件を満たすための最大文字数を更に保持し、文字情報に含まれる文字の文字数が最大文字数より多いか否かを判定し、文字情報の文字数が最大文字数より大きい場合に、文字数を減らすことを促す通知を行うことを通知部に指示する判定部を更に備えてもよい。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、任意の音声メッセージを携帯電話で再生可能にし、実用的な音声変換装置を提供できる。
図1は、実施の形態に係る音声変換システム10の構成図である。音声変換装置100は、ネットワーク12を介して基地局14と接続している。また、携帯電話装置20は、基地局14と無線回線を形成し、ネットワーク12に接続している。音声パラメータ入力装置102は、第1音声提供者Aおよび第2音声提供者B(以下、単に「音声提供者」という)の音声を入力し、音声を合成する際に利用する音声パラメータを生成する。音声パラメータ入力装置102は、例えばマイクを介して入力したアナログの音声信号をPCMなどでデジタル化し、FFT(Fast Fourier Transform)などの処理を施すことにより音声パラメータを生成する。そして、音声パラメータ入力装置102は、音声パラメータを音声変換装置100に出力する。詳細は後述するが、音声変換装置100は、音声提供者毎に音声パラメータを対応付けて保持し、指定された音声提供者の音声パラメータを利用して音声ファイルを生成する。
利用者C(以下、単に「利用者」という)は、携帯電話装置20を操作し、所望の音声メッセージを再生するための音声ファイルを音声変換装置100から取得する。まず、携帯電話装置20は、任意のテキストデータ22、機種情報26、および音声提供者識別情報28を、例えばウェブページや電子メールなどを利用して音声変換装置100に送信する(S10)。音声変換装置100は、そのテキストデータ22を利用者に指定された音声提供者の音声パラメータを利用して音声データに変換して、音声ファイル24を生成し、携帯電話装置20に送信する(S12)。携帯電話装置20は、取得した音声ファイル24を格納し、留守番電話機能におけるメッセージや、着信時のメロディーとして利用する。これにより、利用者は、例えば好きな女優など所望の音声提供者の声で、所望のメッセージを再生させることができる。
詳細は後述するが、音声変換装置100は、例えば公序良俗に係るワードを禁止ワードとして予め保持する。そして、テキストデータ22に禁止ワードが含まれている場合、音声変換装置100は禁止ワードを発音しないように処理を行う。例えば、音声変換装置100は、禁止ワードをメッセージ中から取り除くことを利用者に要求するエラーメッセージを携帯電話装置20に送信してもよいし、禁止ワードを他の文字に置き換えて音声データを生成してもよいし、禁止ワードを自動的に削除して音声データを生成してもよい。これにより、音声変換装置100が生成した音声ファイル24により、公序良俗に係る禁止ワードが再生されることを防止できる。また、禁止ワードを音声提供者ごとに保持することにより、音声提供者が望まない言葉の再生を防止でき、例えばセクシャルな言葉などが再生されることにより音声提供者のプライドや名誉が傷つけられることを防止できる。つまり、音声変換装置100は、単にテキストデータ22を音声データに変換するだけでなく、音声提供者を保護する機能を備える。
また、携帯電話装置20は、機種や通信事業者により機種性能が異なり、再生可能なファイル形式、ファイルサイズなども異なる。そこで、音声変換装置100は、音声ファイル24を再生する携帯電話装置20の機種性能に応じて、音声ファイル24を生成する機能を備える。これにより、利用者は携帯電話装置20の機種性能を意識せずに、所望するメッセージを再生するための音声ファイル24を取得することができる。このような音声変換システム10により、携帯電話装置20の機能を十分に活用し、ユーザニーズに応えることができる。
図2は、図1の音声変換装置100の内部構成図である。音声変換装置100の各構成要素は、ハードウエアコンポーネントで言えば、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インターフェース等を中心に実現されるが、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。これから説明する各図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。
登録部126は、音声パラメータ入力装置102から音声提供者ごとに音声パラメータと禁止ワードとを受け付け、それぞれ音声パラメータ格納部132ならびに禁止ワード格納部130に格納する。他の例では、登録部126は、図1のネットワーク12を介して、音声パラメータおよび禁止ワードを受け付けてもよいし、例えばフレキシブルディスクなどの記録媒体からそれらのデータを読み込んでもよい。要は、登録部126は、音声提供者ごとに音声パラメータおよび禁止ワードを受け付け、それぞれ音声パラメータ格納部132ならびに禁止ワード格納部130に登録すればよい。
図3は、図2の禁止ワード格納部130のデータ構造の一例を示す図である。提供者ID欄170は、音声提供者を識別する情報(以下、単に「提供者ID」という)を保持する。禁止ワード欄172は、禁止ワードを保持する。例えば、本図で、提供者ID「A」で特定される音声提供者は、「○○○」と「×××××」が禁止ワードとして登録されている。このように、提供者IDと、禁止ワードとを対応付けて保持することにより、図2の音声変換装置100は、音声提供者毎に音声に変換しない言葉を判断することができる。更に、禁止ワード格納部130は、例えば放送禁止用語など一般的に公序良俗に反する言葉を共通の禁止ワードとして保持してもよい。本図では、提供者ID欄170に「共通」が保持されている禁止ワードが共通の禁止ワードである。他の例では、共通の禁止ワードは、禁止ワード格納部130とは別の格納部に保持されてもよい。このように、禁止ワード格納部130が共通の禁止ワードと音声提供者毎の禁止ワードとを保持することにより、図2の音声変換装置100は、公序良俗に係る最低限守るべき秩序を保ち、更に音声提供者の意志に基づいた禁止ワードの発音を避け、音声提供者のプライドや品格などを保護することができる。
図2に戻り、受付部110は、図1の携帯電話装置20からテキストデータ22、機種情報26、および音声提供者識別情報28を受け付け、判定部111に出力する。受付部110は、テキストデータ22を例えばHTTP(Hyper Text Transfer Protocol)などのリアルタイム性の高い所定の通信規定に準じた形式で受け付けてもよいし、電子メールなどのリアルタイム性の低い所定の通信規定に準じた形式で受け付けてもよい。本実施の形態では、受付部110は、HTTPに準じてテキストデータ22、および音声提供者識別情報28を受け付けるとともに、HTTPヘッダなどの利用者が容易に変更できないデータ部分から機種情報26を取得する。これにより、受付部110は確実に携帯電話装置20の機種情報26を取得できる。
そして、受付部110は、それぞれのデータを判定部111に出力する。電子メールによりテキストデータ22を受け付ける場合、テキストデータ22、機種情報26、および音声提供者識別情報28は電子メールの本文に含まれてよく、受付部110は本文部分からテキストデータ22と機種情報26と音声提供者識別情報28とを抽出し、判定部111に出力する。要は、受付部110は、通信対象となる携帯電話装置20が有する通信機能のいずれかを利用して送信されたテキストデータ22、機種情報26、および音声提供者識別情報28を受け付け、それらを判定部111に出力すればよい。
判定部111は、テキストデータ22と機種情報26とに基づいて、テキストデータ22に含まれる文字列に基づいて音声ファイルを生成した場合のサイズを推定し、そのサイズの音声ファイルを利用して図1の携帯電話装置20が再生できるか否かを判定する。そして、再生できる場合、判定部111はテキストデータ22、機種情報26、および音声提供者識別情報28を検出部112に出力する。また、音声ファイルのサイズが所定のサイズより大きくなり、携帯電話装置20において再生できない場合、判定部111は、その旨を通知するメッセージの送信を通知部118に指示する。これにより、音声データへの変換前に、再生の有無を判断することができるので、無駄を無くし、効率的に音声ファイルを生成することができる。
また、一般に、音声ファイルのサイズは、サンプリング周波数を低くすることで、言い換えれば品質を下げることにより小さくすることができる。しかしながら、利用者が認識できなければ意味がない。そこで、本実施の形態では、携帯電話装置20の機種毎にデフォルトのサンプリング周波数が設定されており、そのサンプリング周波数と再生可能な音声ファイルのサイズとに基づいて、機種毎に変換可能な文字数(以下、単に「最大文字数」という)が算出される。その最大文字数を利用して、判定部111は、前述の判定処理を行う。つまり、判定部111は、再生時の音声の品質と、音声ファイルのサイズとのバランスを考慮して、機種毎の再生条件に適合するように、テキストデータ22に含まれる文字数の制限を行う。
装置情報格納部134は、機種情報に対応付けて、例えば音声ファイルのファイル形式、再生可能な音声ファイルの最大サイズ、サンプリング周波数、最大文字数などの再生条件を保持する。判定部111は、機種情報26で特定される装置の最大文字数を装置情報格納部134から読み込み、読み込んだ最大文字数と、テキストデータ22に含まれる文字の文字数(以下、単に「実文字数」という)とを比較する。実文字数が最大文字数以上の場合、判定部111は、文字数を減らすことを指示する内容のメッセージを通知部118に通知させる。また、実文字数が最大文字数より少ない場合、判定部111は、テキストデータ22、機種情報26、および音声提供者識別情報28を検出部112に出力する。
図4は、図2の装置情報格納部134のデータ構造の一例を示す図である。装置ID欄180は、図1の携帯電話装置20を識別する情報(以下、単に「装置ID」という)を保持する。この装置IDは、図2の受付部110が携帯電話装置20から通常のプロトコルに準じて取得可能な機種情報26であることが好ましく、例えばHTTPヘッダに含まれる機種名などであってよい。要は、装置ID欄180は、受付部110が携帯電話装置20から取得可能な情報であって、かつ携帯電話装置20を特定可能な情報を保持すればよい。
データ形式欄182は、再生可能な音声ファイルのデータ形式を保持する。データサイズ欄184は、再生可能な音声ファイルの最大のデータサイズ、つまり最大サイズを保持する。周波数欄186は、再生可能なサンプリング周波数を保持する。デフォルト周波数欄188は、デフォルトで利用するサンプリング周波数を保持する。文字数欄190は、デフォルト周波数欄188に保持されているサンプリング周波数に基づいて、音声ファイルを生成した場合に、音声ファイルのデータサイズが最大サイズより小さくなるおおよその文字数、つまり最大文字数を保持する。図2の判定部111および変換部116は、装置情報格納部134に保持されている各種のデータを適宜利用して、それぞれ所定の処理を実現する。
図2に戻り、検出部112は、テキストデータ22に禁止ワードが含まれているか否かを検出する。検出部112は、禁止ワード格納部130に保持されている共通の禁止ワードおよび音声提供者識別情報28で特定される提供者IDに対応付けられた禁止ワードのいずれかがテキストデータ22に含まれているか否かを検出する。そして、検出した禁止ワードの情報とともにテキストデータ22を指示部114に出力する。
テキストデータ22に禁止ワードが含まれている場合、指示部114は、その禁止ワードを発音しないようにテキストデータ22に対して所定の処理を施す。例えば、指示部114は、テキストデータ22に含まれている禁止ワードを取り除くことを促すメッセージを通知部118に通知させてもよいし、テキストデータ22に含まれる禁止ワードを例えば擬音などの所定の言葉に置き換えてもよいし、テキストデータ22に含まれる禁止ワードを取り除いてもよい。これにより、テキストデータ22から禁止ワードを排除することができるので、音声変換装置100は生成した音声ファイル24により禁止ワードが発音されることを防止できる。本実施の形態では、指示部114は、禁止ワードを取り除いた別のテキストデータ22を作成することを利用者に促すメッセージの送信を通知部118に指示する。テキストデータ22に禁止ワードが含まれていない場合、指示部114はテキストデータ22を変換部116に出力する。
変換部116は、音声パラメータ格納部132に保持されている音声提供者毎の音声パラメータを利用して、テキストデータ22を音声データに変換する。そして、変換部116は、機種毎のファイル形式で音声ファイル24を生成し、提供部120に出力する。また、変換部116は、音声ファイル24を生成したことを課金部122に通知する。具体的には、変換部116は、音声提供者識別情報28をキーに音声パラメータ格納部132を参照し、該当する音声提供者の音声パラメータを読み込み、既知の変換手法を利用してテキストデータ22を音声データに変換する。つまり音声合成処理を行う。そして、変換部116は、機種情報26をキーに装置情報格納部134を参照し、該当するファイル形式を読み込み、音声ファイル24を生成する。
そして、変換部116は生成した音声ファイル24のデータサイズを検出し、装置情報格納部134に保持されている最大サイズより小さいか否かを判定し、最終的に生成した音声ファイル24が携帯電話装置20において再生可能か否かを判断する。音声ファイル24のデータサイズが最大サイズより小さい場合、変換部116は、その音声ファイル24を提供部120に出力する。また、音声ファイル24のデータサイズが最大サイズより大きい場合、変換部116は通知部118に文字数を減らすことを促すメッセージを送信させる。例えばテキストデータ22に含まれる文字が漢字など、一文字で多くの発音が必要な文字が含まれる場合、前述の判定部111が行う文字数に基づいて推定したサイズと、実際に生成した音声ファイル24のデータサイズには誤差が生じる。そこで、変換部116は、最終的に生成した音声ファイル24が携帯電話装置20の再生条件を満たすか否かを判定し、再生条件を満たす音声ファイル24だけを提供部120に出力する。これにより、音声変換装置100は、再生条件を満たす音声ファイル24だけを携帯電話装置20に提供することができる。
提供部120は、変換部116から供給された音声ファイル24を音声データ格納部124に格納する。そして、提供部120は、音声ファイル24を提供する準備が完了したことを伝えるメッセージと、その音声ファイル24を取得するための情報とを含むファイル(以下、単に「提供可能通知ファイル」という)を携帯電話装置20に送信する。そして、提供部120は、その提供可能ファイルに応じて携帯電話装置20から音声ファイル24の送信を要求された場合、携帯電話装置20に音声ファイル24を送信する。例えば、提供部120は、HTML(Hyper Text Markup Language)などの文書記述言語に準じて、提供可能通知ファイルを生成する。そして、そのファイルには、音声ファイル24の格納場所を特定するアドレス情報が含まれている。これにより、携帯電話装置20は、提供可能通知ファイルに基づいて、音声ファイル24をダウンロードするためのウェブページを表示することができる。
他の例では、提供部120は、音声ファイル24を電子メールなどに添付して、携帯電話装置20に送信してもよい。要は、提供部120は、変換部116から供給された音声ファイル24を、その音声ファイル24の生成を要求した携帯電話装置20に提供すればよい。
課金部122は、音声ファイル24を生成したことを契機に、利用者に対する課金処理を行うとともに、その一部を音声提供者に還元する処理を行う。こうした課金、還元処理は、ビジネスの形態に応じて任意に設定される。通知部118は、前述した判定部111、指示部114、および変換部116の指示に応じて、例えばウェブページや電子メールなどを利用して各種の通知を行う。
図5は、図1の音声変換装置100および携帯電話装置20における処理のシーケンスの一例を示す図である。携帯電話装置20は、音声変換装置100に図1のテキストデータ22を音声データに変換することを要求する(S50)。音声変換装置100は、図1のテキストデータ22、機種情報26、および音声提供者識別情報28を受け付ける(S52)。そして、音声変換装置100は、テキストデータ22に含まれる文字数が最大文字数以内か否かを判定する(S54)。最大文字数以上の場合(S54のN)、音声変換装置100は、携帯電話装置20に文字数の変更を要求する(S72)。また、最大文字数より少ない場合(S54のY)、音声変換装置100は、テキストデータ22に禁止ワードが含まれているか否かを判定する(S56)。
禁止ワードが含まれている場合(S56のN)、音声変換装置100は、禁止ワードを取り除くことを音声変換装置100に要求する(S74)。音声変換装置100からの情報が、文字数変更要求または文字列変更要求の場合(S76のY)、携帯電話装置20はその要求に対応するメッセージを表示する(S78)。また、文字数変更要求または文字列変更要求でない場合(S76のN)、携帯電話装置20は待機する。
ステップ56で、テキストデータ22に禁止ワードが含まれていない場合(S56のY)、音声変換装置100は、そのテキストデータ22を音声データに変換し(S58)、所定のファイル形式の音声ファイル24を生成する(S60)。そして、音声変換装置100は、その音声ファイル24を格納し(S62)、取得要求を携帯電話装置20に送信する(S64)。その取得要求に応じて、携帯電話装置20は、音声ファイル24の提供を音声変換装置100に要求する(S66)。音声変換装置100は、その要求で指定された音声ファイル24を携帯電話装置20に送信する(S68)。また、音声変換装置100は、生成した音声ファイル24に応じて、課金処理および還元処理を行う(S70)。
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
実施の形態に係る音声変換システムの構成図である。 図1の音声変換装置の内部構成図である。 図2の禁止ワード格納部のデータ構造の一例を示す図である。 図2の装置情報格納部のデータ構造の一例を示す図である。 図1の音声変換装置および携帯電話装置における処理のシーケンスの一例を示す図である。
符号の説明
10 音声変換システム、12 ネットワーク、14 基地局、20 携帯電話装置、22 テキストデータ、24 音声ファイル、26 機種情報、28 音声提供者識別情報、100 音声変換装置、102 音声パラメータ入力装置、110 受付部、111 判定部、112 検出部、114 指示部、116 変換部、118 通知部、120 提供部、122 課金部、124 音声データ格納部、126 登録部、130 禁止ワード格納部、132 音声パラメータ格納部、134 装置情報格納部。

Claims (11)

  1. 第1文字列を受け付ける受付部と、
    前記第1文字列に第2文字列が含まれているか否かを検出する検出部と、
    前記第1文字列に前記第2文字列が含まれている場合、前記第2文字列を発音しないように前記第1文字列を音声情報に変換する変換部と、
    を備えることを特徴とする音声変換装置。
  2. 前記音声情報を生成するために必要なパラメータを、音声種類に対応付けて保持する音声パラメータ格納部と、
    前記音声種類に対応付けて、前記第2文字列を保持する文字列格納部と、
    を備え、
    前記受付部は、前記第1文字列とともに音声種類を受け付け、前記検出部は、前記受付部が受け付けた音声種類に対応付けられた第2文字列が前記第1文字列に含まれているか否かを検出することを特徴とする請求項1に記載の音声変換装置。
  3. 前記第2文字列が前記第1文字列に含まれている場合、その旨を通知する通知部を更に備えることを特徴とする請求項1または2に記載の音声変換装置。
  4. 前記第2文字列が前記第1文字列に含まれている場合、前記変換部は、前記第1文字列に含まれる前記第2文字列を他の文字列に置き換えた後、音声情報に変換することを特徴とする請求項1から3のいずれかに記載の音声変換装置。
  5. 文字情報を音声情報に変換する装置であって、
    前記文字情報と前記音声情報を再生する再生装置に関する機種情報とを受け付ける受付部と、
    前記文字情報と前記機種情報とに基づいて、その機種情報で特定される再生装置で利用可能なデータ形式の音声情報を生成する変換部と、
    生成した音声情報を前記再生装置に提供する提供部と、
    を備えることを特徴とする音声変換装置。
  6. 前記機種情報に対応付けて、前記再生装置における音声情報の再生条件を保持する装置情報格納部を更に備え、
    前記変換部は、受け付けた前記機種情報に対応付けられた再生条件を満たすように前記音声情報を生成することを特徴とする請求項5に記載の音声変換装置。
  7. 前記再生条件を満たすように生成した音声情報の音質が所定の音質より悪くなる場合、その旨を通知する通知部を更に備えることを特徴とする請求項6に記載の音声変換装置。
  8. 前記装置情報格納部は、前記機種情報に対応付けて、前記再生条件を満たすための最大文字数を更に保持し、前記文字情報に含まれる文字の文字数が前記最大文字数より多いか否かを判定し、前記文字情報の文字数が前記最大文字数より大きい場合に、文字数を減らすことを促す通知を行うことを前記通知部に指示する判定部を更に備えることを特徴とする請求項7に記載の音声変換装置。
  9. 音声種類に対応付けて、その音声種類の音声情報を生成するために必要なパラメータを保持する音声パラメータ格納部を更に備え、
    前記受付部は、前記文字情報の変換に利用する音声種類を更に受け付け、
    前記変換部は、前記受付部が受け付けた音声種類に対応付けられたパラメータを利用して音声情報を生成することを特徴とする請求項5から8のいずれかに記載の音声変換装置。
  10. 所定の文字列を保持する文字列格納部と、
    前記文字情報に前記文字列が含まれているか否かを判定する検出部と、
    前記文字情報に前記文字列が含まれている場合、前記文字列を発音しないように所定の処理の実行を指示する指示部と、
    を更に備えることを特徴とする請求項5から9のいずれかに記載の音声変換装置。
  11. 前記文字列格納部は、前記文字列を前記音声種類に対応付けて保持し、
    前記検出部は、前記受付部が受け付けた音声種類に対応付けられた文字列が前記文字情報に含まれているか否かを判定することを特徴とする請求項10に記載の音声変換装置。
JP2004114725A 2004-04-08 2004-04-08 音声変換装置 Pending JP2005300783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004114725A JP2005300783A (ja) 2004-04-08 2004-04-08 音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004114725A JP2005300783A (ja) 2004-04-08 2004-04-08 音声変換装置

Publications (1)

Publication Number Publication Date
JP2005300783A true JP2005300783A (ja) 2005-10-27

Family

ID=35332410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004114725A Pending JP2005300783A (ja) 2004-04-08 2004-04-08 音声変換装置

Country Status (1)

Country Link
JP (1) JP2005300783A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007316303A (ja) * 2006-05-25 2007-12-06 Nippon Telegr & Teleph Corp <Ntt> 話者選択機能付き音声合成方法、装置、話者選択機能付き音声合成プログラム
JP2007333851A (ja) * 2006-06-13 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置、音声合成プログラム、音声合成配信システム
JP2007334144A (ja) * 2006-06-16 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置及び音声合成プログラム
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム
JPWO2012104952A1 (ja) * 2011-02-03 2014-07-03 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
JP2017191390A (ja) * 2016-04-12 2017-10-19 ロボットスタート株式会社 コミュニケーションシステム、会話ログ収集システム、サーバ及びコミュニケーション方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007316303A (ja) * 2006-05-25 2007-12-06 Nippon Telegr & Teleph Corp <Ntt> 話者選択機能付き音声合成方法、装置、話者選択機能付き音声合成プログラム
JP2007333851A (ja) * 2006-06-13 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置、音声合成プログラム、音声合成配信システム
JP2007334144A (ja) * 2006-06-16 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置及び音声合成プログラム
JPWO2012104952A1 (ja) * 2011-02-03 2014-07-03 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
JP5677470B2 (ja) * 2011-02-03 2015-02-25 パナソニックIpマネジメント株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
US9472181B2 (en) 2011-02-03 2016-10-18 Panasonic Intellectual Property Management Co., Ltd. Text-to-speech device, speech output device, speech output system, text-to-speech methods, and speech output method
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム
JP2017191390A (ja) * 2016-04-12 2017-10-19 ロボットスタート株式会社 コミュニケーションシステム、会話ログ収集システム、サーバ及びコミュニケーション方法

Similar Documents

Publication Publication Date Title
US7391300B2 (en) System for providing alert notifications for a communication device
RU2407211C2 (ru) Заданные сегменты рингтона в источнике аудиосигнала
US6845379B2 (en) Sound data processing system and processing method
EP2127353B1 (en) Method for using an alert file by converting the alert file to a lower complexity file format and related electronic device
JP2005300783A (ja) 音声変換装置
JP2001236205A (ja) 情報処理装置および情報処理方法、ならびに情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003218999A (ja) 音声認識機能付き携帯電話装置及びその制御プログラム
JP4229058B2 (ja) 端末装置および記録媒体
JP2004282609A (ja) 音情報提供システム
JP3998606B2 (ja) 移動通信端末
JP4514343B2 (ja) 録音情報転送システム、録音情報送信装置、記録媒体及びプログラム
JP5326539B2 (ja) 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法
JP2007508760A (ja) 携帯通信装置におけるmmsを利用したイベント通知
JP2003023486A (ja) 電話機、情報管理サーバ、発信者情報通知方法、及び発信者情報通知プログラム
JP4015500B2 (ja) コードデータ生成サーバ、データ処理サーバ、及び音データ変換システム
JP2005217614A (ja) 電話端末装置及び楽曲再生方法
JP2007013523A (ja) 音声録音再生装置および音声録音再生方法
JP2004080258A (ja) 通信端末、着信通知方法およびプログラム
JP2001209592A (ja) 音声応答サービスシステムと音声応答サービス方法、及びこの方法を記録した記録媒体
JP4514510B2 (ja) 音楽メール出力方法、音楽メール出力システム、及び楽曲提供装置
JP3687608B2 (ja) 携帯電話機、制御局及び携帯電話機を利用するネットワーク録音システム
JP4651294B2 (ja) 携帯端末装置
JPH11163971A (ja) 無線電話端末の着信通知方式
JP2001177653A (ja) 携帯電話機の録音サービス装置及び無線情報伝送装置
JPH11346262A (ja) 着信報知装置