JP6089496B2 - 音響生成装置および音響生成方法 - Google Patents

音響生成装置および音響生成方法 Download PDF

Info

Publication number
JP6089496B2
JP6089496B2 JP2012184938A JP2012184938A JP6089496B2 JP 6089496 B2 JP6089496 B2 JP 6089496B2 JP 2012184938 A JP2012184938 A JP 2012184938A JP 2012184938 A JP2012184938 A JP 2012184938A JP 6089496 B2 JP6089496 B2 JP 6089496B2
Authority
JP
Japan
Prior art keywords
operation mode
sound
user
information
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012184938A
Other languages
English (en)
Other versions
JP2014044230A (ja
Inventor
英治 赤澤
英治 赤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2012184938A priority Critical patent/JP6089496B2/ja
Publication of JP2014044230A publication Critical patent/JP2014044230A/ja
Application granted granted Critical
Publication of JP6089496B2 publication Critical patent/JP6089496B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、利用者からの指示に応じた音響信号を生成する技術に関する。
利用者からの指示に応じた音響信号を生成する技術が従来から提案されている。例えば特許文献1には、利用者からの指示に応じて合成された低音質の試聴用の音声データを利用者に提供し、所定の課金処理の実行を条件として高音質の購入用の音声データを利用者に提供する技術が開示されている。
特開2004−295645号公報
特許文献1の技術では、課金処理の実行前に利用者に提供される音声データが低音質の音声データに制限され、課金処理の実行を条件として制限が解除される。しかし、例えば高音質な音声データを必要としない利用者にとっては試聴用の音声データで充分であるから、課金処理を実行する充分な誘因を利用者に付与する(ひいては効果的な収益化を実現する)ことは実際には困難である。他方、極端に低音質の音声データを試聴用に提供すれば、購入手続を実行しようとする利用者の意欲をかえって減殺しかねない。以上の事情を考慮して、本発明は、音響信号の生成機能の制限を解除する誘因を有効に維持しながら音響信号の生成機能を効果的に制限することを目的とする。
以上の課題を解決するために、本発明の第1態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の発音内容が第1動作モードと比較して制限されるから、低音質の音声データを試聴のために利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。
なお、発音内容の設定の自由度とは、利用者からの指示に応じて発音内容が変更され得る度合(利用者が発音内容を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が発音内容に反映される度合は大きく、自由度が低いほど、利用者からの指示が発音内容に反映される度合は小さい。利用者からの指示とは無関係に発音内容が設定される状態(発音内容が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を発音内容に反映させる動作モードと、利用者からの指示を発音内容に反映させない動作モードとを包含する。
本発明の好適な態様において、音響生成手段は、第2動作モードにおいて、第1動作モードと比較して音声符号(発音文字や音素記号)の種類数が少ない発音内容の音響信号を生成する。以上の態様の具体例は、例えば第1実施形態から第3実施形態として後述される。例えば、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第2実施形態)や、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第3実施形態)が好適である。
また、音響生成手段が、第2動作モードにおいて、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号を生成する構成(例えば後述の第4実施形態)や、音響生成手段が、第2動作モードにおいて、利用者からの指示に応じた音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号を生成する構成(例えば後述の第1実施形態や第5実施形態)も採用され得る。また、音響生成手段が、第2動作モードにおいて、音声符号の総数が第1動作モードと比較して制限された発音内容の音響信号を生成することも可能である。
本発明の第2態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。
なお、音高の設定の自由度とは、利用者からの指示に応じて音高が変更され得る度合(利用者が音高を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が音高に反映される度合は大きく、自由度が低いほど、利用者からの指示が音高に反映される度合は小さい。利用者からの指示とは無関係に音高が設定される状態(音高が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を音高に反映させる動作モードと、利用者からの指示を音高に反映させない動作モードとを包含する。
具体的には、第2動作モードにおいて、音響生成手段が、第1動作モードと比較して音高の種類数が少ない音響信号を生成する構成(例えば後述の第7実施形態)や、利用者からの指示に対して非依存に設定された音高の音響信号を生成する構成(例えば後述の第8実施形態)が好適である。例えば、自動作曲処理で生成された旋律の音響信号を生成する構成や、事前に用意された旋律の音響信号を生成する構成が採用される。
第1態様または第2態様に係る音響生成装置の好適例において、音響生成手段は、第2動作モードにおける音響信号の生成に対する制限の度合を、相異なる第1期間と第2期間とで相違させる。以上の態様によれば、第1動作モードに移行する誘因を利用者に効果的に付与することが可能である。
以上の各態様に係る音響生成装置は、音響信号の生成に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)で実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働でも実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
本発明の第1態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。また、本発明の第2態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。
本発明の第1実施形態に係る音響生成装置のブロック図である。 制御情報の模式図である。 音響生成部のブロック図である。 第3実施形態の音響生成装置のブロック図である。
<第1実施形態>
図1は、本発明の第1実施形態に係る音響生成装置100のブロック図である。第1実施形態の音響生成装置100は、素片接続型の音声合成で歌唱音の音響信号Vを生成する音声合成装置であり、図1に示すように、演算処理装置10と記憶装置12と通信装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。例えば据置型の情報処理装置(パーソナルコンピュータ)や携帯型の情報処理装置(例えば携帯電話機やスマートフォン等)で音響生成装置100は実現される。
通信装置14は、通信網(例えばインターネット)を介して通信する。通信装置14と課金処理装置(図示略)とが通信網を介して通信することで利用者に対する課金処理が実行される。入力装置16は、利用者からの指示を受付ける機器であり、例えば利用者が操作する複数の操作子を含んで構成される。放音装置18(例えばヘッドホンやスピーカ)は、演算処理装置10が生成した音響信号Vに応じた音波を放射する。
記憶装置12は、演算処理装置10が実行する音響生成プログラム(アプリケーションソフトウェア)PGMや演算処理装置10が使用する各種のデータ(音声素片群G,制御情報C)を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数の記録媒体の組合せが記憶装置12として採用される。
音声素片群Gは、音響信号Vの素材として利用される複数の音声素片の集合(音声合成ライブラリ)である。音声素片は、言語的な意味の区別の最小単位である音素(例えば母音や子音)や複数の音素を連結した音素連鎖(例えばダイフォンやトライフォン)である。
制御情報Cは、複数の音符の時系列で表現される旋律を指定する。図2に示すように、第1実施形態の制御情報Cは、楽曲内の各音符に各々が対応する複数の音符情報Nの時系列である。各音符情報Nは、音高情報X1と期間情報X2と発音情報X3とを含んで構成される。音高情報X1は、各音符の音高(各音高に対応する番号)を指定する。期間情報X2は、音符の発音期間を例えば音符の開始時刻と継続長とで指定する。なお、音符の開始時刻と終了時刻とで発音期間を規定することも可能である。発音情報X3は、音符の音声符号を指定する。例えば発音文字(書記素)や音素記号等の音声符号が発音情報X3で指定される。
演算処理装置10は、記憶装置12に記憶された音響生成プログラムPGMを実行することで、音響信号Vを生成するための複数の機能(動作制御部22,音響生成部24)を実現する。なお、演算処理装置10の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が演算処理装置10の一部の機能を実現する構成も採用され得る。
動作制御部22は、音響生成装置100の動作モードを制御する。具体的には、動作制御部22は、第1動作モードと第2動作モードとの一方を選択することが可能である。第1動作モードは、利用者が音響生成装置100(音響生成プログラムPGM)を正規に利用するための動作モードである。他方、第2動作モードは、利用者が音響生成装置100を試用するための動作モード(試用モード,体験モード)である。動作制御部22は、音響生成プログラムPGMが記憶装置12に記憶された直後の初期状態では第2動作モードを選択する。そして、入力装置16に対する利用者からの指示を契機として認証処理や課金処理等の所定の購入処理が通信装置14と課金処理装置(課金サーバ装置)との間で実行され、購入処理が適正に完了した場合に、動作制御部22は動作モードを第2動作モードから第1動作モードに移行する。なお、購入処理の内容は任意である。例えば課金処理装置との間で通信せずに音響生成装置100の単体で購入処理を実行することも可能である。
音響生成部24は、記憶装置12に記憶された音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。図3は、第1実施形態の音響生成部24のブロック図である。図3に示すように、音響生成部24は、情報編集部32と合成処理部34とを含んで構成される。
利用者は、入力装置16を適宜に操作することで音高情報X1と期間情報X2と発音情報X3とを音符毎に指示することが可能である。図3の情報編集部32は、入力装置16に対する利用者からの指示に応じて制御情報C(音高情報X1,期間情報X2,発音情報X3)を生成および編集する。
第1実施形態の情報編集部32は、発音情報X3に指定可能な音声符号(発音文字や音素記号)の範囲を第1動作モードと第2動作モードとで相違させる。具体的には、情報編集部32は、第2動作モードで発音情報X3に設定可能な音声符号を、第1動作モードで発音情報X3に設定可能な音声符号と比較して制限する。すなわち、第2動作モードでは、音声素片群Gの複数の音声素片のうち特定の音声素片の集合に対応する範囲(以下「発音制限範囲」という)QA内の音声符号のみが発音情報X3の候補として利用者に許可され、第1動作モードでは、利用者が発音情報X3として指示可能な候補が音声素片群G内の全部の音声素片に対応する音声符号まで拡張される。例えば、音名に対応する音声符号(ドレミファソラシド)の範囲が発音制限範囲QAとして好適である。なお、音高情報X1および期間情報X2について利用者が指示可能な範囲は第1動作モードと第2動作モードとで共通する。
具体的には、情報編集部32は、利用者が指示した音声符号が発音制限範囲QA内の音声符号に該当するか否かを判定し、発音制限範囲QA内の音声符号に該当する場合にはその音声符号を発音情報X3に設定する一方、発音制限範囲QA内の音声符号に該当しない場合には、利用者が指示した音声符号を特定の音声符号(以下「代替符号」という)に置換する。代替符号は、利用者からの指示とは無関係に事前に選定された音声符号である。代替符号に対応する音声素片は音声素片群Gに包含される。例えば楽曲の歌詞として一般的な「ラ」等の音声符号や「ピー」等の擬声語の音声符号が代替符号として好適である。また、無音の音声符号を代替符号として利用することも可能である。
合成処理部34は、記憶装置12内の音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。具体的には、合成処理部34は、音高情報X1が指定する音高と期間情報X2が指定する発音期間とに対応する各音符を、制御情報Cの発音情報X3に対応する音声符号で発声した音声(歌唱音)の音響信号Vを生成する。具体的には、合成処理部34は、制御情報Cの各音符情報Nの発音情報X3に対応する音声素片を音声素片群Gから順次に選択したうえで音高情報X1の音高と期間情報X2の発音期間とに調整し、調整後の各音声素片を相互に連結することで音響信号Vを生成する。合成処理部34が生成した音響信号Vが放音装置18に供給されて音波として再生される。なお、制御情報Cに応じた音響信号Vの生成には公知の音声合成技術が任意に採用される。
第1動作モードでは音声素片群G内の全部の音声素片に対応する音声符号を候補として発音情報X3が指定され、第2動作モードで発音情報X3の候補となる音声符号は発音制限範囲QA内に制限される。したがって、第1実施形態の音響生成部24は、第1動作モードと比較して音声符号(発音記号や音素記号)の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音声符号の制限(発音制限範囲QA)が第1動作モードでは解除されると換言することも可能である。
以上に説明した通り、第1実施形態では、第2動作モードでの音響信号Vの発音内容(音声符号の種類数)が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
<第2実施形態>
本発明の第2実施形態を以下に説明する。第1実施形態では、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを事前に設定した。第2実施形態では発音制限範囲QAが可変に設定される。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態で参照した符号を流用して各々の詳細な説明を適宜に省略する。
第2実施形態の記憶装置12は、利用者の属性情報を記憶する。属性情報は、例えば利用者の氏名等の個人情報や利用者の趣味や嗜好を指定する情報を含んで構成される。情報編集部32は、記憶装置12に記憶された利用者の属性情報に応じて発音制限範囲QAを可変に設定する。例えば、属性情報が示す利用者の氏名の音声符号(発音文字や音素記号)を包含するように発音制限範囲QAを設定する構成や、属性情報が示す利用者の趣味や嗜好に関連する単語の音声符号を包含するように発音制限範囲QAを設定する構成が好適に採用される。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第2実施形態の音響生成部24は、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第2実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第2実施形態では、利用者の属性情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の属性情報を反映した発音内容の音響信号Vを生成できるという利点がある。
<第3実施形態>
図4は、第3実施形態の音響生成装置100のブロック図である。図4に示すように、第3実施形態の音響生成装置100は、位置検出装置40を第1実施形態に追加した構成である。位置検出装置40は、音響生成装置100の位置(利用者の位置)を検出する。例えば、位置検出装置40は、複数のGPS(Global Positioning System)衛星からの電波を受信して位置情報を生成する。
第3実施形態の情報編集部32は、第2実施形態と同様に、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを可変に設定する。具体的には、情報編集部32は、位置検出装置40が生成した位置情報に応じて発音制限範囲QAを可変に設定する。例えば、位置情報が示す位置に関連する単語(例えば地名等や施設名等)の音声符号を包含するように発音制限範囲QAを設定する構成が好適である。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第3実施形態の音響生成部24は、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第3実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第3実施形態では、利用者の位置情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の位置情報を反映した発音内容の音響信号Vを生成できるという利点がある。また、利用者の位置に応じて相異なる発音内容の音響信号Vを生成できるという興趣性を利用者に提供することも可能である。
<第4実施形態>
第1実施形態から第3実施形態では、発音制限範囲QA内で利用者からの指示に応じて発音情報X3を設定した。第4実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音声符号(発音文字や音素記号)を発音情報X3として指定する。
具体的には、情報編集部32は、制御情報C内の各音符情報Nの発音情報X3をランダムに設定する。例えば、情報編集部32は、事前に用意された複数の候補から単語を順次にランダムに選択し、各単語に対応する音声符号を順番に各発音情報X3に割当てる。発音情報X3の候補を発音制限範囲QA内の音声符号に制限するか否かは不問である。また、事前に用意された文章に対応する音声符号を順番に各発音情報X3に割当てる構成も採用され得る。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定され得る。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第4実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第4実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
<第5実施形態>
第5実施形態の情報編集部32は、第1動作モードおよび第2動作モードの双方において、利用者が任意の音声符号を発音情報X3として指定することが可能である。ただし、第2動作モードでは、情報編集部32は、利用者からの指示に応じて設定された発音情報X3の一部を、利用者からの指示に非依存な代替符号(例えば第1実施形態で例示した「ラ」や「ピー」等の音声符号)に置換する。例えば、利用者が指示した複数の発音情報X3の時系列からランダムに選択された各発音情報X3が代替符号に置換される。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定される。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第5実施形態の音響生成部24は、第2動作モードにおいて、利用者が指示した音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第5実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
<第6実施形態>
第6実施形態の情報編集部32は、制御情報Cで指定可能な音符数の最大値(以下「最大音符数」という)Mを第1動作モードと第2動作モードとで相違させる。具体的には、第2動作モードでの最大音符数M2は第1動作モードでの最大音符数M1を下回る。すなわち、第2動作モードでは第1動作モードと比較して音響信号Vの最大音符数Mが制限される。音高情報X1と期間情報X2と発音情報X3とは音符毎に設定されるから、音高情報X1で指定される音高の総数や発音情報X3で指定される音声符号の総数も第2動作モードでは第1動作モードと比較して制限される。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第6実施形態の音響生成部24は、第2動作モードにおいて、音声符号の総数(最大音符数M)が第1動作モードと比較して制限された発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第6実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
<第7実施形態>
第1実施形態から第6実施形態では、制御情報C内の各音符情報Nの音高情報X1を利用者が任意に指示できる構成を例示した。第7実施形態では、音高情報X1に設定可能な音高の範囲を第1動作モードと第2動作モードとで相違させる。
具体的には、情報編集部32は、第2動作モードで音高情報X1に設定可能な音高の範囲を、第1動作モードで音高情報X1に設定可能な音高の範囲と比較して制限する。すなわち、第2動作モードでは、第1動作モードで設定可能な複数の音高から選択された特定の範囲(以下「音高制限範囲」という)QB内の音高のみが音高情報X1の候補として利用者に許可され、第1動作モードでは、利用者が音高情報X1として指示可能な候補が全種類の音高に拡張される。例えば、鍵盤楽器の白鍵に対応する7個の幹音(黒鍵に対応する派生音以外の音高)を音高制限範囲QBに設定した構成や、所定の3個の音高(例えばドレミ)のみを音高制限範囲QBに設定した構成が採用される。また、特定のスケール(例えばアイオニアンスケールや琉球スケール)や特定の音域(オクターブ)に属する各音高を音高制限範囲QBに設定することも可能である。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第7実施形態の音響生成部24は、第1動作モードと比較して音高の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音高の制限(音高制限範囲QB)が第1動作モードでは解除されると換言することも可能である。なお、以上の説明では発音情報X3が指定する音高の制限のみに着目したが、発音情報X3が指定する音声符号の制限については第1実施形態から第6実施形態の何れかの構成が任意に採用される。
以上に説明した通り、第7実施形態では、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
<第8実施形態>
第7実施形態では、音高制限範囲QB内で利用者からの指示に応じて音高情報X1を設定した。第8実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音高(すなわち、利用者からの指示とは無関係に選定された音高)を制御情報C内の各音高情報X1として指定する。
具体的には、情報編集部32は、第2動作モードにおいて、自動作曲処理で生成した旋律の各音高を順番に各音高情報X1に割当てる。自動作曲処理には公知の技術が任意に採用される。なお、利用者が指示した単語や文章(例えば利用者が発音情報X3として指示した各音声符号の配列)に応じた旋律を生成することも可能である。また、事前に用意された旋律の各音高を各音高情報X1に割当てる構成も採用され得る。第1動作モードでは、音高の制限が解除され、利用者からの指示に応じた音高の音響信号Vが生成される。
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第8実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された音高の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第7実施形態においても、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、第7実施形態と同様の効果が実現される。
<第9実施形態>
第9実施形態の音響生成部24は、第2動作モードでの音響信号Vの生成に対する制限の度合を、購入処理の実行前の複数の期間の各々で個別に設定する。例えば、音響生成プログラムPGMが記憶装置12に記憶された直後の所定長(例えば3日間)にわたる第1期間A1では、発音制限範囲QAがサ行(サシスセソ)に設定され、音高制限範囲QBがCメジャースケールに設定される。第1期間A1の経過後の所定長(例えば7日間)にわたる第2期間A2では、発音制限範囲QAが音名に対応する音声符号(ドレミファソラシド)に設定され、音高情報X1が第8実施形態における自動作曲処理の旋律に制限される。第2期間A2の経過から購入処理の完了(第1動作モードへの移行)までの第3期間A3では、発音制限範囲QAが「ラ」に設定され、音高情報X1が所定の旋律の各音高に制限される。なお、音響信号Vの生成機能の制限(発音内容や音高の制限)を経時的に強化する構成と生成機能の制限を経時的に緩和する構成の双方が想定され得る。
第9実施形態においても前述の各形態と同様の効果が実現される。また、第9実施形態では、音響信号Vの生成に対する制限が可変に制御されるから、購入処理の実行で第1動作モードに移行する誘因を利用者に対して効果的に付与することが可能である。なお、以上の例示では、発音情報X3に指定される音声符号の制限と音高情報X1に指定される音高の制限との双方を経時的に変化させたが、音声符号および音高の一方の制限のみを経時的に変化させることも可能である。
<変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
(1)第2動作モードで発音情報X3に指定される音声符号(発音文字や音素記号)を第1動作モードと比較して制限する方法は前述の例示に限定されない。第1実施形態から第6実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた発音内容(発音情報X3)の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号Vを生成する要素として包括される。
また、前述の各形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが音高情報X1および期間情報X2を含む構成を例示したが、音高情報X1や期間情報X2は第1実施形態から第6実施形態から省略され得る。すなわち、音高の経時的な変化を要件としない会話音等の音声の音響信号Vの生成にも第1実施形態から第6実施形態は適用され得る。
(2)第2動作モードで音高情報X1に指定される音高を第1動作モードと比較して制限する方法は前述の例示に限定されない。第7実施形態および第8実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた音高の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号Vを生成する要素として包括される。また、発音情報X3に指定される音声符号を第2動作モードで制限する構成は第7実施形態や第8実施形態から省略され得る。
また、第7実施形態および第8実施形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが発音情報X3を含む構成を例示したが、発音情報X3は第7実施形態や第8実施形態から省略され得る。すなわち、音高情報X1が指定する音高と期間情報X2が指定する発音期間とで規定される音符の楽音(例えば楽器の演奏音)の音響信号Vを生成する場合にも第7実施形態や第8実施形態は適用され得る。
(3)前述の各形態では、記憶装置12に記憶された音声素片群Gのうち発音制限範囲QA内の音声符号に対応する音声素片を第2動作モードで選択的に利用して音響信号Vを生成したが、第1動作モードで利用される音声素片群G1と第2動作モードで利用される音声素片群G2とを個別に用意することも可能である。音声素片群G1は、利用者が音響生成装置100を正規に利用する(音響生成装置100の全部の機能を利用する)ための音声合成ライブラリであり、音声素片群G2は、利用者が音響生成装置100を試用するための試用版(特定の機能を制限して音響生成装置100の利用を許可する体験版)の音声合成ライブラリである。各音声素片の発声者は音声素片群G1と音声素片群G2とで共通するが、音声素片群G1内の音声素片の種類数は音声素片群G2内の音声素片の種類数を上回る。すなわち、音声素片群G2は音声素片群G1のうち発音制限範囲QA内の音声符号に対応する音声素片の部分集合に相当する。したがって、音声素片群G2のデータ量は音声素片群G1のデータ量を下回る。
音響生成プログラムPGMの導入直後の初期状態では音声素片群G2が記憶装置12に記憶され、購入処理が適正に完了することを条件に音声素片群G1が配信装置から通信装置14に配信されて記憶装置12に記憶される。以上の構成によれば、購入処理を実行しない場合には音声素片群G1を記憶装置12に格納する必要がないから、音声素片群G1の送受信時の通信量や音声素片群G1の記憶容量が削減されるという利点がある。
(4)第2動作モードでは音響信号Vの生成に利用される音声素片の種類数が第1動作モードと比較して少ないという事情を考慮すると、第2動作モードにおいて音響信号Vの生成に必要な音声素片を動作毎に配信装置から通信装置14が取得する構成も好適である。すなわち、動作モードが第2動作モードから第1動作モードに移行するまでは記憶装置12に音声素片(音声素片群G)が記憶されない。
(5)第7実施形態における音高制限範囲QBの設定に第2実施形態の属性情報や第3実施形態の位置情報を利用することも可能である。すなわち、情報編集部32は、利用者の属性情報や位置情報に応じて音高制限範囲QBを可変に設定する。
(6)前述の各形態では、購入処理の実行を条件として第2動作モードから第1動作モードに移行する場合を例示したが、動作モードの移行の方向や条件は適宜に変更される。例えば、音響生成プログラムPGMの導入の直後の初期状態では第1動作モードを選択し、購入処理が実行されずに所定の期間が経過した場合に第1動作モードから第2動作モードに移行する構成も採用され得る。また、音響信号Vの生成に対する制限の度合が相違する3種類以上の動作モードから何れかの動作モードを選択する構成も採用され得る。例えば、利用者が支払う金額に応じて段階的に動作モード(音響信号Vの生成に対する制限の度合)を変更することも可能である。音響信号Vの生成に対する制限の度合を利用者に通知する構成も採用され得る。例えば、動作モードを利用者に通知する画像(ポップアップ方式のダイアログ)を表示装置に表示する構成や、動作モードを通知する電子メールを利用者の登録アドレスに送信する構成が好適である。
また、例えば利用者がプレイするゲームで特定の条件(例えば所定のステージのクリア)を充足することや音響生成プログラムPGMに関するアンケートに回答すること等の各種の条件を、動作モード(音響信号Vの生成に対する制限の度合)の変更の条件とすることも可能である。
以上の説明から理解される通り、前述の各形態における動作制御部22は、音響信号Vの生成に対する制限の度合が相違する第1動作モードまたは第2動作モードを選択する要素として包括され、動作モードの移行の方向や条件および動作モードの総数は本発明において任意である。
100……音響生成装置、10……演算処理装置、12……記憶装置、14……通信装置、16……入力装置、18……放音装置、22……動作制御部、24……音響生成部、32……情報編集部、34……合成処理部、40……位置検出装置。

Claims (4)

  1. 第1動作モードまたは第2動作モードを選択する動作制御手段と、
    前記第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、前記第2動作モードでは、前記第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成手段とを具備し、
    前記音響生成手段は、前記第1動作モードにおいて、利用者からの指示に応じた音高の音響信号を生成し、前記第2動作モードにおいて、前記第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する
    音響生成装置。
  2. 前記音響生成手段は、前記第2動作モードにおいて、前記第1動作モードと比較して音高の種類数が少ない音響信号を生成する
    請求項の音響生成装置。
  3. 前記音響生成手段は、前記第2動作モードにおける前記音響信号の生成に対する制限の度合を、相異なる第1期間と第2期間とで相違させる
    請求項1または請求項2の音響生成装置。
  4. コンピュータが、
    第1動作モードまたは第2動作モードを選択し、
    前記第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、前記第2動作モードでは、前記第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成し、
    前記音響信号の生成では、前記第1動作モードにおいて、利用者からの指示に応じた音高の音響信号を生成し、前記第2動作モードにおいて、前記第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する
    音響生成方法。
JP2012184938A 2012-08-24 2012-08-24 音響生成装置および音響生成方法 Active JP6089496B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012184938A JP6089496B2 (ja) 2012-08-24 2012-08-24 音響生成装置および音響生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012184938A JP6089496B2 (ja) 2012-08-24 2012-08-24 音響生成装置および音響生成方法

Publications (2)

Publication Number Publication Date
JP2014044230A JP2014044230A (ja) 2014-03-13
JP6089496B2 true JP6089496B2 (ja) 2017-03-08

Family

ID=50395560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012184938A Active JP6089496B2 (ja) 2012-08-24 2012-08-24 音響生成装置および音響生成方法

Country Status (1)

Country Link
JP (1) JP6089496B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3439840B2 (ja) * 1994-09-19 2003-08-25 富士通株式会社 音声規則合成装置
JP2006184730A (ja) * 2004-12-28 2006-07-13 Canon Inc 音声合成方法
JP5372843B2 (ja) * 2010-06-18 2013-12-18 武史 藤田 コンテンツ利用装置及びプログラム

Also Published As

Publication number Publication date
JP2014044230A (ja) 2014-03-13

Similar Documents

Publication Publication Date Title
JP6784022B2 (ja) 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム
US9711123B2 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon
JP6561499B2 (ja) 音声合成装置および音声合成方法
US20070245375A1 (en) Method, apparatus and computer program product for providing content dependent media content mixing
CN107430849B (zh) 声音控制装置、声音控制方法和存储声音控制程序的计算机可读记录介质
CN111418006B (zh) 声音合成方法、声音合成装置及记录介质
JP6127371B2 (ja) 音声合成装置および音声合成方法
JP2011048335A (ja) 歌声合成システム、歌声合成方法及び歌声合成装置
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2019066649A (ja) 歌唱音声の編集支援方法、および歌唱音声の編集支援装置
US8614388B2 (en) System and method for generating customized chords
US11875777B2 (en) Information processing method, estimation model construction method, information processing device, and estimation model constructing device
JP2013148864A (ja) 音楽データ編集装置
JP6089496B2 (ja) 音響生成装置および音響生成方法
JP6044284B2 (ja) 音声合成装置
JP5157922B2 (ja) 音声合成装置、およびプログラム
JP2005208394A (ja) 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末
JP2014098802A (ja) 音声合成装置
JP2022065554A (ja) 音声合成方法およびプログラム
JP2022065566A (ja) 音声合成方法およびプログラム
WO2019239971A1 (ja) 情報処理方法、情報処理装置およびプログラム
JP5106437B2 (ja) カラオケ装置及びその制御方法並びにその制御プログラム
JP2010169889A (ja) 音声合成装置、およびプログラム
US20240005896A1 (en) Music generation method and apparatus
WO2023171522A1 (ja) 音響生成方法、音響生成システムおよびプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170123

R151 Written notification of patent or utility model registration

Ref document number: 6089496

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151