JP2005107136A - 音声および楽曲再生装置 - Google Patents

音声および楽曲再生装置 Download PDF

Info

Publication number
JP2005107136A
JP2005107136A JP2003340171A JP2003340171A JP2005107136A JP 2005107136 A JP2005107136 A JP 2005107136A JP 2003340171 A JP2003340171 A JP 2003340171A JP 2003340171 A JP2003340171 A JP 2003340171A JP 2005107136 A JP2005107136 A JP 2005107136A
Authority
JP
Japan
Prior art keywords
data
sound
music
script
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003340171A
Other languages
English (en)
Inventor
Takahiro Kawashima
隆宏 川嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003340171A priority Critical patent/JP2005107136A/ja
Priority to TW093115132A priority patent/TWI265718B/zh
Priority to CNB2004100474146A priority patent/CN1310209C/zh
Priority to KR1020040038415A priority patent/KR100612780B1/ko
Priority to HK05101981A priority patent/HK1069433A1/xx
Publication of JP2005107136A publication Critical patent/JP2005107136A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract


【課題】 ユーザが音声再生や、波形データ再生、楽曲データ再生の組み合わせを手軽に行うことができる音声および楽曲再生装置を提供する。
【解決手段】 HV−Scriptプレイヤー1はHV−Scriptに記述されるイベントを解釈する。イベントの種別が波形データの場合、波形再生プレイヤー4は波形データを波形データ用RAM5から読み出し、波形再生器6へ出力する。イベントの種別が楽曲フレーズであった場合、HV−Scriptプレイヤー1はフレーズ再生プレイヤー7に処理を行わせる。フレーズ再生プレイヤー7は楽曲フレーズデータを楽曲フレーズデータ用RAM8から読み出し、この楽曲フレーズデータ中の時間情報に基づいて、楽曲フレーズデータ中の音符情報をフレーズ音源9へ出力する。その他の場合、HVドライバ2は合成辞書を用いて文字列をフォルマントフレーム列へコンバートし、HV音源3へ出力する。
【選択図】 図1

Description

この発明は、文字情報を音声および楽曲に変換して再生する音声および楽曲再生装置に関する。
従来、電子メールなどの文字情報を音声に変換して出力する方法が知られていた。また、楽曲フレーズや音声フレーズをサンプリングして作成した波形データ(サンプリングデータ)を再生する方法や、SMF(Standard MIDI File)あるいはSMAF(Synthetic music Mobile Application File)などの音符情報列で一つの楽曲フレーズを構成し、この楽曲フレーズを再生する方法が知られていた。
特許文献1には、電子メール中の文字情報と楽音情報とを分離し、それぞれを発音させることのできる電子メール読み上げ装置が記載されている。
特開2001−51688号公報
しかし、楽曲や音声をサンプリングして作成した波形データを再生する従来の方法や、SMFあるいはSMAFなどの音符情報列で一つの楽曲データを構成し、この楽曲データを再生する従来の方法においては、それらの再生タイミングをテキストファイルで記述する方法がなかった。したがって、ユーザが文字情報に基づいた音声再生と波形データ再生あるいは楽曲データ再生との組み合わせをユーザの思い通りに行うことができなかった。
本発明は上述した問題点に鑑みてなされたものであって、ユーザが音声再生や、波形データ再生、楽曲データ再生の組み合わせを手軽に行うことができる音声および楽曲再生装置を提供することを目的とする。
本発明は上記の課題を解決するためになされたもので、請求項1に記載の発明は、発音用データを記憶する第1の記憶手段と、文字の発音または前記発音用データの再生を指定する指定データが記述されたスクリプトを記憶する第2の記憶手段と、前記第2の記憶手段から前記スクリプトを読み出し、該スクリプト中の前記指定データに基づいて前記文字の発音または前記発音用データの再生の指示を出力する指示手段と、前記指示手段からの前記文字の発音指示を受け、前記指定データに基づいて音声信号を生成する音声信号生成手段と、前記指示手段によって前記発音用データの再生指示を受け、前記指定データに基づいて前記発音用データを前記第1の記憶手段から読み出し、該発音用データに基づいて発音信号を生成する発音信号生成手段と、前記音声信号生成手段によって生成された前記音声信号に基づいて音声を発生し、前記発音信号生成手段によって生成された前記発音信号に基づいて音声または楽音を発生する発生手段とを具備することを特徴とする音声および楽曲再生装置である。
請求項2に記載の発明は、請求項1に記載の音声および楽曲再生装置において、前記発音用データは音声または楽曲のサンプリングにより生成される波形データであり、前記発音信号生成手段は、前記指示手段によって前記波形データの再生が指示された場合に、前記指定データに基づいて前記波形データを前記第1の記憶手段から読み出し、該波形データに基づいて発音信号を生成することを特徴とする。
請求項3に記載の発明は、請求項1に記載の音声および楽曲再生装置において、前記発音用データは音符情報列を含む楽曲データであり、前記発音信号生成手段は、前記指示手段によって前記楽曲データの再生が指示された場合に、前記指定データに基づいて前記楽曲データを前記第1の記憶手段から読み出し、前記音符情報列に基づいて発音信号を生成することを特徴とする。
請求項4に記載の発明は、請求項1〜請求項3のいずれかの項に記載の音声および楽曲再生装置において、前記音声信号生成手段はさらに、前記文字の発音を特徴付けるフォルマント制御パラメータを記憶し、前記指示手段からの前記文字の発音の指示を受け、前記指定データおよび前記フォルマント制御パラメータに基づいて音声信号を生成することを特徴とする。
請求項5に記載の発明は、請求項1〜請求項4のいずれかの項に記載の音声および楽曲再生装置において、ユーザによる操作を受け付け、該操作の結果を操作信号として出力する操作手段と、前記操作信号に基づいて前記スクリプトを生成する生成手段と、前記生成手段によって生成された前記スクリプトを前記第2の記憶手段に書き込む書込手段とをさらに具備することを特徴とする。
請求項6に記載の発明は、請求項1〜請求項5のいずれかの項に記載の音声および楽曲再生装置において、前記スクリプトはテキスト入力によって作成される形式のファイルであることを特徴とする。
請求項7に記載の発明は、請求項1〜請求項6のいずれかの項に記載の音声および楽曲再生装置において、前記指定データは前記文字の発音態様を指定するデータを含むことを特徴とする。
請求項8に記載の発明は、請求項1〜請求項7のいずれかの項に記載の音声および楽曲再生装置を具備し、前記音声および楽曲再生装置によって、前記スクリプトに基づいた音声または楽曲を生成することを特徴とする携帯端末である。
この発明によれば、HV−Scriptの記述に応じて、音声合成による音声の発生、波形データの再生、および楽曲データの再生が行われるようにしたので、ユーザがこれらの再生を手軽に行うことができるという効果が得られる。
以下、図面を参照し、この発明を実施するための最良の形態について説明する。図1はこの発明の一実施形態による音声および楽曲再生装置の構成を示す図である。図において、HV−Script(HV:Human Voice)は音声を再生するためのフォーマットを定義するファイルである。HV−Scriptは、韻律記号(アクセントなどの発音態様を指定するための記号)を含んだ発音文字列、発音する音の設定、再生アプリケーション等へのメッセージからなる音声合成を行うためのデータを定義するファイルであり、ユーザによる作成を容易にするため、テキスト入力により作成される。
HV−Scriptは、テキストエディタなどのアプリケーションソフトウェアが読み込んで、テキストによる編集が可能であるファイル形式であればよく、一例としてテキストエディタによって作成されるテキストファイルが挙げられる。HV−Scriptには言語依存性があり、様々な言語による定義が考えられるが、本実施形態においてはHV−Scriptは日本語によって定義されているものとする。
1はHV−Scriptプレイヤーであり、HV−Scriptの再生や停止などを制御する。HV−Scriptが登録され、その再生指示を受けた場合、HV−Scriptプレイヤー1はHV−Scriptの解釈を開始する。そして、HV−Scriptに記述されているイベントの種類に応じて、HVドライバ2、波形再生プレイヤー4、フレーズ再生プレイヤー7のいずれかに対して処理を行わせる。
HVドライバ2は図示しないROM(Read Only Memory)から合成辞書を読み出して参照する。人間の音声は人体の構造(例えば声帯や口腔などの形状)に依存する所定のフォルマント(固有の周波数スペクトル)を有しており、合成辞書は音声のフォルマントに係るパラメータを保持している。合成辞書は、実際の音が発音文字単位で(例えば「あ」・「い」など)サンプリングおよび分析された結果によって得られたパラメータをフォルマントフレームデータとして発音文字単位で予め保持しているデータベースである。
例えばCSM(複合正弦波モデル)音声合成方式の場合、合成辞書は8組のフォルマント周波数、フォルマントレベルおよびピッチなどをパラメータとして保持している。このような音声合成方式は、音声のサンプリングによって作成される波形データの再生方式と比較して、データ量が大幅に少ないという利点を有している。なお、合成辞書が、再生される音声の声質を制御するパラメータ(例えば8組のフォルマント周波数およびフォルマントレベルの変更の指定を行うためのパラメータなど)をさらに保持していてもよい。
HVドライバ2は、HV−Script中の韻律記号を含んだ合成文字列などを解釈し、合成辞書を用いてフォルマントフレーム列へコンバートし、HV音源3へ出力する。HV音源3はHVドライバ2によって出力されたフォルマントフレーム列に基づいて発音信号を生成し、加算器10へ出力する。
波形再生プレイヤー4は音声や楽曲、擬似音などが予めサンプリングされた波形データの再生や停止などを制御する。5は波形データ用RAM(Random Access Memory)であり、デフォルト波形データを予め記憶している。ユーザはユーザデータ用RAM12中のユーザ波形データを登録API(Application Program Interface)13を経由して波形データ用RAM5に格納することができる。波形再生プレイヤー4はHV−Scriptプレイヤー1から再生指示を受けると、波形データ用RAM5から波形データを読み出し、波形再生器6へ出力する。波形再生器6は波形再生プレイヤー4によって出力された波形データに基づいて発音信号を生成し、加算器10へ出力する。
フレーズ再生プレイヤー7は楽曲フレーズデータの再生や停止などを制御する。楽曲フレーズデータはSMFフォーマットなどの形式であり、発音する音の音高や音量などを示す音符情報列と、発音時間を示す時間情報とで構成される。8は楽曲フレーズデータ用RAMであり、デフォルト楽曲フレーズデータを予め記憶している。ユーザはユーザデータ用RAM12中のユーザ楽曲フレーズデータを、登録API13を経由して楽曲フレーズデータ用RAM8に格納することができる。
フレーズ再生プレイヤー7はHV−Scriptプレイヤー1から再生指示を受けると、楽曲フレーズデータ用RAM8から楽曲フレーズデータを読み出し、この楽曲フレーズデータ中の音符情報の時間管理を行い、楽曲フレーズデータに記述されている時間情報に基づいて、音符情報をフレーズ音源9へ出力する。フレーズ音源9はフレーズ再生プレイヤー7によって出力された音符情報に基づいて楽音信号を生成し、加算器10へ出力する。フレーズ音源9としてFM(Frequency Modulation Sound)方式やPCM(Pulse Coded Module Sound Source)方式などの種類の音源があるが、楽曲フレーズデータの再生が行えればよく、その方式は限定されない。
加算器10はHV音源3によって出力される発音信号、波形再生器6によって出力される音声信号、およびフレーズ音源9によって出力される楽音信号を合成し、合成された信号をスピーカ11へ出力する。スピーカ11は加算器10によって合成された信号に基づいて音声または楽音を発生する。
なお、HVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7が同時に処理を行い、発音信号、音声信号、および楽音信号のそれぞれの信号に基づいた音声および楽曲が同時に発生するようにしてもよいし、HV−Scriptプレイヤー1がHVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7の処理タイミングを管理し、それぞれの処理に基づいた音声および楽曲が同時には発生しないようにしてもよい。本実施形態においては、HVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7による同時処理が禁止されているものとする。また、上述した構成においては説明の都合上、波形データ用RAM5、楽曲フレーズデータ用RAM8、およびユーザデータ用RAM12という別個のRAMを設けているが、それらの機能を同じRAMの異なる記憶領域に割り当ててもよい。
図2はHV−Scriptに記述される、波形データや楽曲フレーズデータを再生するためのイベントを定義した一例である。イベントの頭文字であるDはデフォルト定義を意味し、Oはユーザ定義を意味している。また、それぞれのイベントには種別として波形またはフレーズが割り当てられる。デフォルト定義(D0〜D63)には、予め波形データ用RAM5が保持するデフォルト波形データや、楽曲フレーズデータ用RAM8が保持するデフォルト楽曲フレーズデータが割り当てられる。デフォルト定義には64個分のデフォルト波形データおよびデフォルト楽曲フレーズデータを割り当てることができる。ユーザ定義(0〜63)には、ユーザが任意に作成したサンプリング波形データや楽曲フレーズデータが割り当てられる。ユーザ定義には64個分のサンプリング波形データおよび楽曲フレーズデータを割り当てることができる。
図2中の種別が波形データであるイベントと、そのイベントが示す波形データとの関係を示すデータが波形データ用RAM5に予め記憶されている。また、種別がフレーズであるイベントと、そのイベントが示す楽曲フレーズデータとの関係を示すデータが楽曲フレーズデータ用RAM8に記憶されている。これらのデータは、ユーザによってユーザデータ用RAM12中の波形データあるいは楽曲フレーズデータの登録が行われた場合に更新される。
HV−Scriptには例えば、「TJK12みなさんO0です。D20」と記述される。先頭に記述される「TJK12」のうち、TはHV−Scriptの開始を示す。Jは国・文字コードであり、HV−Scriptが日本語であることを示す。K12は声質設定であり、12番目の声質であることを示す。「みなさん」および「です。」はHVドライバ2によって解釈され、スピーカ11から“みなさん”および“です”という音声が発生する。「みなさん」および「です。」のような発音文字列中にアクセント(あるいは強弱)などの発音態様を示す韻律記号がある場合には、アクセントをつけた(あるいは強弱をつけた)音声が発生する。
イベント「O0」には例えば、“鈴木”と発音される音声がサンプリングされた波形データが登録されているとする。「O0」は波形再生プレイヤー4によって解釈され、スピーカ11から“鈴木”という音声が発生する。また、イベント「D20」には例えば、賑やかなショート楽曲フレーズが登録されているとする。「D20」はフレーズ再生プレイヤー7によって解釈され、スピーカ11から賑やかな楽曲が発生する。この場合、再生音声は“みなさん 鈴木です (楽曲フレーズ再生)”となり、“鈴木”の部分だけ波形データが再生される。波形データの再生による音声の発生は、“みなさん”や“です”のような発音単位の音声合成による音声の発生と比較し、発音単位のつなぎ目の再生がより自然な再生となる。また、“鈴木”を特徴的な波形にすることによって、ユーザに対して音声を効果的に聞かせることができる。以上のように、波形データや楽曲フレーズデータの再生を指定するイベントをHV−Scriptに記述することにより、波形データや楽曲フレーズデータの再生タイミングを指定することができる。なお、HV−Scriptの記述に関する設定は設計事項であり、上述した記述に限定されない。
次に、上述した構成の音声および楽曲再生装置の動作を図3のフローチャートを用いて説明する。まず、ユーザによってHV−Scriptがテキストエディタなどにより作成され、HV−Scriptプレイヤー1に登録される(ステップS1)。このとき、ユーザ定義の波形データや楽曲フレーズデータがあれば、登録API13がユーザデータ用RAM12から波形データや楽曲フレーズデータを読み込む。登録API13は波形データを波形データ用RAM5に格納し、楽曲フレーズデータを楽曲フレーズデータ用RAM8に格納する。
ユーザによってスタート指示がなされる(ステップS3)と、HV−Scriptプレイヤー1はHV−Scriptの解釈を開始する。HV−Scriptプレイヤー1はHV−Script中の記述が「D」または「O」で始まるイベントであるかどうか判定し(ステップS4)、「D」または「O」で始まるイベントの場合はその種別が波形データであるかどうか判定する(ステップS5)。種別が波形データの場合、HV−Scriptプレイヤー1は波形再生プレイヤー4に処理を指示する。波形再生プレイヤー4は「D」または「O」に続く番号の波形データを波形データ用RAM5から読み出し、波形再生器6へ出力する(ステップS6)。波形再生器6はこの波形データに基づいて音声信号を生成し、加算器10を介してスピーカ11へ出力する(ステップS7)。これにより、スピーカ11から音声が発生する。
また、ステップS5において種別が波形データでなかった場合、HV−Scriptプレイヤー1はイベントの種別が楽曲フレーズであるかどうか判定する(ステップS8)。イベントの種別が楽曲フレーズであった場合、HV−Scriptプレイヤー1はフレーズ再生プレイヤー7に処理を指示する。フレーズ再生プレイヤー7は「D」または「O」に続く番号の楽曲フレーズデータを楽曲フレーズデータ用RAM8から読み出し、この楽曲フレーズデータ中の時間情報に基づいて、楽曲フレーズデータ中の音符情報をフレーズ音源9へ出力する(ステップS9)。フレーズ音源9はこの音符情報に基づいて楽音信号を生成し、加算器10を介してスピーカ11へ出力する(ステップS10)。これにより、スピーカ11から楽曲が発生する。なお、ステップS8においてイベントの種別が楽曲フレーズでもなかった場合は、楽曲再生装置では処理できない種別のデータであるとして、何もせずにステップS13へ進む。
また、ステップS4において、HV−Script中の記述が「D」で始まるイベントでも「O」で始まるイベントでもなかった場合、HV−Scriptプレイヤー1はHVドライバ2に処理を指示する。HVドライバ2は合成辞書を用いて文字列をフォルマントフレーム列へコンバートし、HV音源3へ出力する(ステップS11)。HV音源3はこのフォルマントフレーム列に基づいて発音信号を生成し、加算器10を介してスピーカ11へ出力する(ステップS12)。これにより、スピーカ11から音声が発生する。
HV−Scriptプレイヤー1はイベントの終了ごとにHV−Scriptの最後の記述まで解釈を終えたかどうか判定する(ステップS13)。まだ解釈すべき記述が残っている場合は、ステップS4へ戻り、全ての記述の解釈が終了した場合は処理が終了する。
本実施形態におけるHV−Scriptの記述例として示した「TJK12みなさんO0です。D20」の場合、イベント“O0”として定義された波形データの発音が終了してから次の“です”が発音されなければならない。例えば、HV−Scriptプレイヤー1が波形データ(または楽曲フレーズデータ)のイベントの解釈に到達した場合には、その次のイベントの再生を待たせ、波形再生プレイヤー4(またはフレーズ再生プレイヤー7)による発音が終了したときに、波形再生プレイヤー4からHV−Scriptプレイヤー1に発音の終了を示す信号が出力されるようにする。
また、HVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7が同時に再生を行うことを許容した上で、HV−Scriptの記述によってそれらの再生を制御するようにしてもよい。例えば、HV−Script中に「TJK12みなさんO0 3です。D20」と記述されており、「O0」の次の「 」(スペース)と「3」が所定時間無音を続けるというイベントを示し、「O0」が示す“鈴木”が発音されている間、HVドライバ2によって再生される音声が無音となるようにすればよい。また、HV−Script中に「TJK12こんにちは。D20みなさんO0 3です。」と記述することによって、「D20」として定義される楽曲と“みなさん鈴木です”が同時に発音されるようにすることもできる。
図4は本実施形態による音声および楽曲再生装置を具備する携帯電話の構成例を示すブロック図である。図において41は各部を制御するCPUである。42はデータ送受信用のアンテナである。43は通信部であり、送信用データを変調してアンテナ42へ出力すると共に、アンテナ42によって受信された受信用データを復調する。44は音声処理部であり、通話時に通信部43から出力される通話相手の音声データを音声信号に変換してイヤスピーカ(図示せず)へ出力し、マイク(図示せず)から出力される音声信号を音声データに変換して通信部43へ出力する。
45は音源であり、図1で示したHV音源3、波形再生器6、およびフレーズ音源9と同様の機能を有している。46はスピーカであり、音声や楽音を発生する。47はユーザによる操作を受け付ける操作部である。48はHV−Scriptや、ユーザが定義する波形データおよび楽曲フレーズデータなどを記憶するRAMである。49はCPU41が実行するプログラムや、合成辞書、デフォルト波形データ、デフォルト楽曲フレーズデータなどが格納されたROMである。50は表示部であり、ユーザによる操作結果や携帯電話の状態などを表示する。51はバイブレータであり、着信時などにCPU41から指示を受け、振動を発生する。上記各部はバスBを介して接続されている。
携帯電話は音声から波形データを生成する機能を備えており、マイクから入力された音声が音声処理部44によって波形データに変換され、この波形データがRAM48に格納される。また、通信部43によってWebサーバから楽曲フレーズデータがダウンロードされた場合、この楽曲フレーズデータがRAM48に格納される。
CPU41はROM49に格納されたプログラムに従って、図1で示したHV−Scriptプレイヤー1、HVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7等と同様の動作を行う。CPU41はRAM48からHV−Scriptを読み出し、HV−Scriptに記述されているイベントの解釈を行う。イベントが音声合成による発音を示している場合、CPU41はROM49から合成辞書を読み出して参照し、HV−Scriptに記述される文字列をフォルマントフレーム列へコンバートし、音源45へ出力する。
また、イベントが波形データの再生を示している場合、CPU41はHV−Script中の「D」または「O」に続く番号の波形データをRAM48またはROM49から読み出し、音源45へ出力する。イベントが楽曲データの再生を示している場合、CPU41は「D」または「O」に続く番号の楽曲フレーズデータをRAM48またはROM49から読み出し、この楽曲フレーズデータ中の時間情報に基づいて、楽曲フレーズデータ中の音符情報を音源45へ出力する。
音源45は、CPU41からフォルマントフレーム列が出力された場合、そのフォルマントフレーム列に基づいて音声信号を生成し、スピーカ46へ出力する。また、CPU41から波形データが出力された場合、その波形データに基づいて発音信号を生成し、スピーカ46へ出力する。CPU41から楽曲フレーズデータが出力された場合、その楽曲フレーズデータに基づいて楽音信号を生成し、スピーカ46へ出力する。スピーカ46は発音信号、音声信号、または楽音信号に基づいて音声または楽音を発生する。
ユーザは操作部47を操作することによって、テキスト編集に対応したソフトウェアを起動し、表示部50に表示される内容を確認しながらHV−Scriptを作成することができ、作成したHV−ScriptをRAM48に保存することができる。
さらに、作成したHV−Scriptを着信メロディに応用することもできる。この場合の動作は以下のようになる。なお、着信時にHV−Scriptを用いることが設定情報としてRAM48に予め格納されているとする。通信部43がアンテナ42を介して、他の携帯電話等から送信された発呼情報を受信すると、通信部43はCPU41へ着信を通知する。通知を受けたCPU41はRAM48から設定情報を読み出し、設定情報が示すHV−ScriptをRAM48から読み出し、その解釈を開始する。以下の動作は前述した通りであり、HV−Scriptに記述されているイベントの種別に従って、スピーカ46から音声または楽音が発生する。
ユーザは電子メールにHV−Scriptを添付して他の端末に送信することもできる。また、CPU41が電子メールの本文自体をHV−Scriptとして解釈し、ユーザによって指示がなされたときに電子メール中の記述に従って音声処理部44へ再生指示を出力するようにしてもよい。なお、HV−Scriptプレイヤー1、HVドライバ2、波形再生プレイヤー4、およびフレーズ再生プレイヤー7の機能は必ずしもCPU41が具備する必要はない。音源45が前記機能のいずれかを具備するようにしてもよい。
なお、携帯電話に限らず、PHS(登録商標)、PDA(Personal Digital Assistance)などの携帯端末が本実施形態による音声および楽曲再生装置と同様の構成を備えていてもよい。
本発明の活用例を以下に示す。携帯電話等の携帯移動端末からユーザがHV−Scriptを入力することを可能とすれば、一般ユーザが音声合成用の文字だけでなく、定型のサンプリング波形データや楽曲フレーズデータを再生するためのHV−Scriptデータを作成することができる。また、送信元および受信元の携帯移動端末に同様の音声および楽曲再生装置を設け、ユーザがHV−Scriptを携帯移動端末から電子メールで送受信することができるようにすれば、受信した電子メールを用いて、音声合成用の文字だけでなく、定型のサンプリングデータや楽曲フレーズを再生することができる。さらに、HV−Scriptを用いた音声および楽曲の再生を着信メロディとして用いることもできる。
この発明の一実施形態による音声および楽曲再生装置の構成を示すブロック図である。 同実施形態における波形データおよび楽曲フレーズデータとイベントとの割り当て例を示す図である。 同実施形態における動作を示すフローチャートである。 同実施形態による音声および楽曲再生装置を備えた携帯電話の例である。
符号の説明
1・・・HV−Scriptプレイヤー、2・・・HVドライバ、3・・・HV音源、4・・・波形再生プレイヤー、5・・・波形データ用RAM、6・・・波形再生器、7・・・フレーズ再生プレイヤー、8・・・楽曲フレーズデータ用RAM、9・・・フレーズ音源、10・・・加算器、11・・・スピーカ、12・・・ユーザデータ用RAM、13・・・登録API、41・・・CPU、42・・・アンテナ、43・・・通信部、44・・・音声処理部、45・・・音源、46・・・スピーカ、47・・・操作部、48・・・RAM、49・・・ROM、50・・・表示部、51・・・バイブレータ

Claims (8)

  1. 発音用データを記憶する第1の記憶手段と、
    文字の発音または前記発音用データの再生を指定する指定データが記述されたスクリプトを記憶する第2の記憶手段と、
    前記第2の記憶手段から前記スクリプトを読み出し、該スクリプト中の前記指定データに基づいて前記文字の発音または前記発音用データの再生の指示を出力する指示手段と、
    前記指示手段からの前記文字の発音指示を受け、前記指定データに基づいて音声信号を生成する音声信号生成手段と、
    前記指示手段によって前記発音用データの再生指示を受け、前記指定データに基づいて前記発音用データを前記第1の記憶手段から読み出し、該発音用データに基づいて発音信号を生成する発音信号生成手段と、
    前記音声信号生成手段によって生成された前記音声信号に基づいて音声を発生し、前記発音信号生成手段によって生成された前記発音信号に基づいて音声または楽音を発生する発生手段と、
    を具備することを特徴とする音声および楽曲再生装置。
  2. 前記発音用データは音声または楽曲のサンプリングにより生成される波形データであり、
    前記発音信号生成手段は、前記指示手段によって前記波形データの再生が指示された場合に、前記指定データに基づいて前記波形データを前記第1の記憶手段から読み出し、該波形データに基づいて発音信号を生成する
    ことを特徴とする請求項1に記載の音声および楽曲再生装置。
  3. 前記発音用データは音符情報列を含む楽曲データであり、
    前記発音信号生成手段は、前記指示手段によって前記楽曲データの再生が指示された場合に、前記指定データに基づいて前記楽曲データを前記第1の記憶手段から読み出し、前記音符情報列に基づいて発音信号を生成する
    ことを特徴とする請求項1に記載の音声および楽曲再生装置。
  4. 前記音声信号生成手段はさらに、前記文字の発音を特徴付けるフォルマント制御パラメータを記憶し、前記指示手段からの前記文字の発音の指示を受け、前記指定データおよび前記フォルマント制御パラメータに基づいて音声信号を生成する
    ことを特徴とする請求項1〜請求項3のいずれかの項に記載の音声および楽曲再生装置。
  5. ユーザによる操作を受け付け、該操作の結果を操作信号として出力する操作手段と、
    前記操作信号に基づいて前記スクリプトを生成する生成手段と、
    前記生成手段によって生成された前記スクリプトを前記第2の記憶手段に書き込む書込手段と、
    をさらに具備することを特徴とする請求項1〜請求項4のいずれかの項に記載の音声および楽曲再生装置
  6. 前記スクリプトはテキスト入力によって作成される形式のファイルであることを特徴とする請求項1〜請求項5のいずれかの項に記載の音声および楽曲再生装置。
  7. 前記指定データは前記文字の発音態様を指定するデータを含むことを特徴とする請求項1〜請求項6のいずれかの項に記載の音声および楽曲再生装置。
  8. 請求項1〜請求項7のいずれかの項に記載の音声および楽曲再生装置を具備し、前記音声および楽曲再生装置によって、前記スクリプトに基づいた音声または楽曲を生成することを特徴とする携帯端末。

JP2003340171A 2003-05-29 2003-09-30 音声および楽曲再生装置 Pending JP2005107136A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2003340171A JP2005107136A (ja) 2003-09-30 2003-09-30 音声および楽曲再生装置
TW093115132A TWI265718B (en) 2003-05-29 2004-05-27 Speech and music reproduction apparatus
CNB2004100474146A CN1310209C (zh) 2003-05-29 2004-05-28 语音和乐曲再生装置
KR1020040038415A KR100612780B1 (ko) 2003-05-29 2004-05-28 음성 및 악곡 재생 장치
HK05101981A HK1069433A1 (en) 2003-05-29 2005-03-08 Speech and music reproduction apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003340171A JP2005107136A (ja) 2003-09-30 2003-09-30 音声および楽曲再生装置

Publications (1)

Publication Number Publication Date
JP2005107136A true JP2005107136A (ja) 2005-04-21

Family

ID=34535147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003340171A Pending JP2005107136A (ja) 2003-05-29 2003-09-30 音声および楽曲再生装置

Country Status (1)

Country Link
JP (1) JP2005107136A (ja)

Similar Documents

Publication Publication Date Title
US7487093B2 (en) Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
EP1618558B1 (en) System and method for text-to-speech processing in a portable device
CN101295504B (zh) 用于仅文本的应用的娱乐音频
KR20040058034A (ko) 음성 및 악곡 재생 장치 및 방법
JP2004170618A (ja) シーケンスデータのデータ交換フォーマット、音声再生装置及びサーバー装置
JP2002196779A (ja) 音声信号の楽音変更のための方法と装置
KR100509126B1 (ko) 음성 멜로디 악곡 생성 장치 및 그것을 이용한 휴대 단말장치
JP2005208394A (ja) 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末
JP2001051688A (ja) 音声合成を用いた電子メール読み上げ装置
JP2005107136A (ja) 音声および楽曲再生装置
KR100612780B1 (ko) 음성 및 악곡 재생 장치
JP3729074B2 (ja) 通信装置及び記憶媒体
JP2005156946A (ja) 楽曲再生装置、音声再生装置、楽曲及び音声を再生する方法及びそのプログラム
JP2006127443A (ja) 電子メール送信端末および電子メールシステム
JP4366918B2 (ja) 携帯端末
KR20050087368A (ko) 무선 단말기의 벨소리 처리 장치
JP2004271620A (ja) 携帯端末
JP3945351B2 (ja) 携帯端末装置
KR20010088951A (ko) 데이터 합성을 통한 노래 구현 시스템 및 그 응용
KR20080080013A (ko) 휴대 단말 장치
JP2004282545A (ja) 携帯端末装置
JP4244706B2 (ja) 音声再生装置
JP2005266671A (ja) ロボット及び音声再生方法
JPH1188211A (ja) 携帯無線装置及びその着信音作成方法
JP2005229511A (ja) 楽音生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091201