JP6089496B2 - Sound generation apparatus and sound generation method - Google Patents
Sound generation apparatus and sound generation method Download PDFInfo
- Publication number
- JP6089496B2 JP6089496B2 JP2012184938A JP2012184938A JP6089496B2 JP 6089496 B2 JP6089496 B2 JP 6089496B2 JP 2012184938 A JP2012184938 A JP 2012184938A JP 2012184938 A JP2012184938 A JP 2012184938A JP 6089496 B2 JP6089496 B2 JP 6089496B2
- Authority
- JP
- Japan
- Prior art keywords
- operation mode
- sound
- user
- information
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
本発明は、利用者からの指示に応じた音響信号を生成する技術に関する。 The present invention relates to a technique for generating an acoustic signal in accordance with an instruction from a user.
利用者からの指示に応じた音響信号を生成する技術が従来から提案されている。例えば特許文献1には、利用者からの指示に応じて合成された低音質の試聴用の音声データを利用者に提供し、所定の課金処理の実行を条件として高音質の購入用の音声データを利用者に提供する技術が開示されている。 Conventionally, a technique for generating an acoustic signal according to an instruction from a user has been proposed. For example, Patent Document 1 provides a user with low sound quality audio data synthesized in response to an instruction from a user, and purchases high sound quality audio data on condition that a predetermined charging process is executed. A technology for providing the user with the information is disclosed.
特許文献1の技術では、課金処理の実行前に利用者に提供される音声データが低音質の音声データに制限され、課金処理の実行を条件として制限が解除される。しかし、例えば高音質な音声データを必要としない利用者にとっては試聴用の音声データで充分であるから、課金処理を実行する充分な誘因を利用者に付与する(ひいては効果的な収益化を実現する)ことは実際には困難である。他方、極端に低音質の音声データを試聴用に提供すれば、購入手続を実行しようとする利用者の意欲をかえって減殺しかねない。以上の事情を考慮して、本発明は、音響信号の生成機能の制限を解除する誘因を有効に維持しながら音響信号の生成機能を効果的に制限することを目的とする。 In the technique of Patent Document 1, the audio data provided to the user before execution of the accounting process is limited to low-quality audio data, and the restriction is released on condition that the accounting process is executed. However, for users who do not need high-quality audio data, for example, audio data for audition is sufficient, so the user is given sufficient incentive to execute billing processing (and realize effective monetization). To do) is actually difficult. On the other hand, if extremely low-quality audio data is provided for trial listening, the user's willingness to execute the purchase procedure may be reduced. In view of the above circumstances, an object of the present invention is to effectively limit an acoustic signal generation function while effectively maintaining an incentive to cancel the limitation of the acoustic signal generation function.
以上の課題を解決するために、本発明の第1態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の発音内容が第1動作モードと比較して制限されるから、低音質の音声データを試聴のために利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。 In order to solve the above-described problems, the sound generation device according to the first aspect of the present invention includes a control unit that selects the first operation mode or the second operation mode, and an instruction from the user in the first operation mode. According to the second operation mode, an acoustic signal generation unit configured to generate an acoustic signal in which the pronunciation content is set with a lower degree of freedom than the first operation mode is provided. According to the above configuration, since the sound content of the acoustic signal in the second operation mode is limited as compared with the first operation mode, the low-quality sound data is provided to the user for auditioning. Compared with the technique, it is possible to effectively limit the function of generating an acoustic signal in the second operation mode while giving the user an incentive to shift to the first operation mode.
なお、発音内容の設定の自由度とは、利用者からの指示に応じて発音内容が変更され得る度合(利用者が発音内容を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が発音内容に反映される度合は大きく、自由度が低いほど、利用者からの指示が発音内容に反映される度合は小さい。利用者からの指示とは無関係に発音内容が設定される状態(発音内容が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を発音内容に反映させる動作モードと、利用者からの指示を発音内容に反映させない動作モードとを包含する。 Note that the degree of freedom in setting the pronunciation content means the degree to which the pronunciation content can be changed in accordance with an instruction from the user (the degree to which the user can freely set the pronunciation content). The higher the degree of freedom, the greater the degree to which the instruction from the user is reflected in the pronunciation content, and the lower the degree of freedom, the smaller the degree to which the instruction from the user is reflected in the pronunciation content. A state where the pronunciation content is set regardless of the instruction from the user (a state where the pronunciation content does not depend on the instruction from the user) corresponds to a state where the degree of freedom is the lowest. As understood from the above description, the second operation mode is an operation mode in which the instruction from the user is reflected in the pronunciation content to a lesser degree than the first operation mode, and the instruction from the user is used as the pronunciation content. Operation modes that are not reflected.
本発明の好適な態様において、音響生成手段は、第2動作モードにおいて、第1動作モードと比較して音声符号(発音文字や音素記号)の種類数が少ない発音内容の音響信号を生成する。以上の態様の具体例は、例えば第1実施形態から第3実施形態として後述される。例えば、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第2実施形態)や、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第3実施形態)が好適である。 In a preferred aspect of the present invention, the sound generation means generates a sound signal of the pronunciation content in the second operation mode with a smaller number of types of phonetic codes (phonetic characters and phoneme symbols) than in the first operation mode. Specific examples of the above aspects will be described later as, for example, the first to third embodiments. For example, a configuration (for example, a second embodiment described later) that generates a sound signal having a pronunciation content limited to a voice code corresponding to user attribute information, or a voice code corresponding to user position information is used. A configuration (for example, a third embodiment to be described later) that generates sound signals of pronunciation content is suitable.
また、音響生成手段が、第2動作モードにおいて、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号を生成する構成(例えば後述の第4実施形態)や、音響生成手段が、第2動作モードにおいて、利用者からの指示に応じた音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号を生成する構成(例えば後述の第1実施形態や第5実施形態)も採用され得る。また、音響生成手段が、第2動作モードにおいて、音声符号の総数が第1動作モードと比較して制限された発音内容の音響信号を生成することも可能である。 In addition, the sound generation means outputs the sound signal of the sound production content that is set independent of the instruction from the user (that is, the sound production content selected regardless of the instruction from the user) in the second operation mode. The sound generation content (for example, a fourth embodiment to be described later) or the sound generation unit in which the sound generation unit replaces the sound code according to the instruction from the user with a specific sound code (alternative code) in the second operation mode. A configuration for generating an acoustic signal (for example, a first embodiment or a fifth embodiment described later) may be employed. The sound generation means can also generate a sound signal having a pronunciation content in which the total number of voice codes is limited in comparison with the first operation mode in the second operation mode.
本発明の第2態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。 The sound generation device according to the second aspect of the present invention generates a sound signal having a pitch according to an instruction from a user in the first operation mode and a control unit that selects the first operation mode or the second operation mode. The second operation mode includes sound generation means for generating an acoustic signal in which the pitch is set with a lower degree of freedom compared to the first operation mode. According to the above configuration, since the pitch of the acoustic signal in the second operation mode is limited as compared with the first operation mode, the low-quality audio data is provided to the user for audition. Compared with technology, it is possible to effectively limit the function of generating an acoustic signal in the second operation mode while giving the user an incentive to move to the first operation mode.
なお、音高の設定の自由度とは、利用者からの指示に応じて音高が変更され得る度合(利用者が音高を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が音高に反映される度合は大きく、自由度が低いほど、利用者からの指示が音高に反映される度合は小さい。利用者からの指示とは無関係に音高が設定される状態(音高が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を音高に反映させる動作モードと、利用者からの指示を音高に反映させない動作モードとを包含する。 The degree of freedom in setting the pitch means the degree to which the pitch can be changed according to an instruction from the user (the degree to which the user can set the pitch freely). The higher the degree of freedom, the greater the degree to which the instruction from the user is reflected in the pitch, and the lower the degree of freedom, the smaller the degree to which the instruction from the user is reflected in the pitch. A state in which the pitch is set regardless of the instruction from the user (a state in which the pitch does not depend on the instruction from the user) corresponds to a state in which the degree of freedom is the lowest. As understood from the above description, in the second operation mode, the operation mode in which the instruction from the user is reflected in the pitch and the instruction from the user in the pitch is smaller than the first operation mode. Operation modes that are not reflected.
具体的には、第2動作モードにおいて、音響生成手段が、第1動作モードと比較して音高の種類数が少ない音響信号を生成する構成(例えば後述の第7実施形態)や、利用者からの指示に対して非依存に設定された音高の音響信号を生成する構成(例えば後述の第8実施形態)が好適である。例えば、自動作曲処理で生成された旋律の音響信号を生成する構成や、事前に用意された旋律の音響信号を生成する構成が採用される。 Specifically, in the second operation mode, the sound generation means generates a sound signal with a smaller number of types of pitches compared to the first operation mode (for example, a seventh embodiment described later), or a user A configuration (for example, an eighth embodiment described later) that generates a sound signal having a pitch that is set to be independent of the instruction from is preferable. For example, a configuration for generating a melody acoustic signal generated by the automatic song processing or a configuration for generating a melody acoustic signal prepared in advance is adopted.
第1態様または第2態様に係る音響生成装置の好適例において、音響生成手段は、第2動作モードにおける音響信号の生成に対する制限の度合を、相異なる第1期間と第2期間とで相違させる。以上の態様によれば、第1動作モードに移行する誘因を利用者に効果的に付与することが可能である。 In a preferred example of the sound generation device according to the first aspect or the second aspect, the sound generation means makes the degree of restriction on the generation of the sound signal in the second operation mode different between the different first period and second period. . According to the above aspect, it is possible to effectively give the user an incentive to shift to the first operation mode.
以上の各態様に係る音響生成装置は、音響信号の生成に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)で実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働でも実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。 The sound generation device according to each aspect described above is realized by hardware (electronic circuit) such as DSP (Digital Signal Processor) dedicated to generation of sound signals, and general-purpose arithmetic such as CPU (Central Processing Unit). This is also realized by cooperation between the processing device and the program. The program of the present invention is provided in a form stored in a computer-readable recording medium and installed in the computer, or is provided in a form distributed via a communication network and installed in the computer.
本発明の第1態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。また、本発明の第2態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。 The program according to the first aspect of the present invention generates a sound signal having a pronunciation content according to an instruction from a user in the control process for selecting the first operation mode or the second operation mode, and in the first operation mode, In the second operation mode, the computer is caused to execute an acoustic generation process for generating an acoustic signal in which the pronunciation content is set with a lower degree of freedom than in the first operation mode. The program according to the second aspect of the present invention generates a sound signal having a pitch according to an instruction from a user in the control process for selecting the first operation mode or the second operation mode, and in the first operation mode. In the second operation mode, the computer is caused to execute an acoustic generation process for generating an acoustic signal in which the pitch is set with a lower degree of freedom than in the first operation mode.
<第1実施形態>
図1は、本発明の第1実施形態に係る音響生成装置100のブロック図である。第1実施形態の音響生成装置100は、素片接続型の音声合成で歌唱音の音響信号Vを生成する音声合成装置であり、図1に示すように、演算処理装置10と記憶装置12と通信装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。例えば据置型の情報処理装置(パーソナルコンピュータ)や携帯型の情報処理装置(例えば携帯電話機やスマートフォン等)で音響生成装置100は実現される。
<First Embodiment>
FIG. 1 is a block diagram of a
通信装置14は、通信網(例えばインターネット)を介して通信する。通信装置14と課金処理装置(図示略)とが通信網を介して通信することで利用者に対する課金処理が実行される。入力装置16は、利用者からの指示を受付ける機器であり、例えば利用者が操作する複数の操作子を含んで構成される。放音装置18(例えばヘッドホンやスピーカ)は、演算処理装置10が生成した音響信号Vに応じた音波を放射する。
The
記憶装置12は、演算処理装置10が実行する音響生成プログラム(アプリケーションソフトウェア)PGMや演算処理装置10が使用する各種のデータ(音声素片群G,制御情報C)を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数の記録媒体の組合せが記憶装置12として採用される。
The
音声素片群Gは、音響信号Vの素材として利用される複数の音声素片の集合(音声合成ライブラリ)である。音声素片は、言語的な意味の区別の最小単位である音素(例えば母音や子音)や複数の音素を連結した音素連鎖(例えばダイフォンやトライフォン)である。 The speech unit group G is a set (speech synthesis library) of a plurality of speech units used as a material of the acoustic signal V. A phoneme segment is a phoneme (for example, a vowel or a consonant) that is the minimum unit of distinction of linguistic meaning, or a phoneme chain (for example, a diphone or a triphone) that connects a plurality of phonemes.
制御情報Cは、複数の音符の時系列で表現される旋律を指定する。図2に示すように、第1実施形態の制御情報Cは、楽曲内の各音符に各々が対応する複数の音符情報Nの時系列である。各音符情報Nは、音高情報X1と期間情報X2と発音情報X3とを含んで構成される。音高情報X1は、各音符の音高(各音高に対応する番号)を指定する。期間情報X2は、音符の発音期間を例えば音符の開始時刻と継続長とで指定する。なお、音符の開始時刻と終了時刻とで発音期間を規定することも可能である。発音情報X3は、音符の音声符号を指定する。例えば発音文字(書記素)や音素記号等の音声符号が発音情報X3で指定される。 The control information C designates a melody expressed by a time series of a plurality of notes. As shown in FIG. 2, the control information C of the first embodiment is a time series of a plurality of note information N each corresponding to each note in the music. Each note information N includes pitch information X1, period information X2, and pronunciation information X3. The pitch information X1 designates the pitch of each note (number corresponding to each pitch). The period information X2 specifies the sound generation period of the note by, for example, the start time and duration of the note. It is also possible to define the pronunciation period by the start time and end time of the notes. The pronunciation information X3 designates the voice code of the note. For example, a phonetic code such as a phonetic character (grapheme) or a phoneme symbol is specified by the phonetic information X3.
演算処理装置10は、記憶装置12に記憶された音響生成プログラムPGMを実行することで、音響信号Vを生成するための複数の機能(動作制御部22,音響生成部24)を実現する。なお、演算処理装置10の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が演算処理装置10の一部の機能を実現する構成も採用され得る。
The
動作制御部22は、音響生成装置100の動作モードを制御する。具体的には、動作制御部22は、第1動作モードと第2動作モードとの一方を選択することが可能である。第1動作モードは、利用者が音響生成装置100(音響生成プログラムPGM)を正規に利用するための動作モードである。他方、第2動作モードは、利用者が音響生成装置100を試用するための動作モード(試用モード,体験モード)である。動作制御部22は、音響生成プログラムPGMが記憶装置12に記憶された直後の初期状態では第2動作モードを選択する。そして、入力装置16に対する利用者からの指示を契機として認証処理や課金処理等の所定の購入処理が通信装置14と課金処理装置(課金サーバ装置)との間で実行され、購入処理が適正に完了した場合に、動作制御部22は動作モードを第2動作モードから第1動作モードに移行する。なお、購入処理の内容は任意である。例えば課金処理装置との間で通信せずに音響生成装置100の単体で購入処理を実行することも可能である。
The
音響生成部24は、記憶装置12に記憶された音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。図3は、第1実施形態の音響生成部24のブロック図である。図3に示すように、音響生成部24は、情報編集部32と合成処理部34とを含んで構成される。
The
利用者は、入力装置16を適宜に操作することで音高情報X1と期間情報X2と発音情報X3とを音符毎に指示することが可能である。図3の情報編集部32は、入力装置16に対する利用者からの指示に応じて制御情報C(音高情報X1,期間情報X2,発音情報X3)を生成および編集する。
The user can instruct the pitch information X1, the period information X2, and the pronunciation information X3 for each note by appropriately operating the
第1実施形態の情報編集部32は、発音情報X3に指定可能な音声符号(発音文字や音素記号)の範囲を第1動作モードと第2動作モードとで相違させる。具体的には、情報編集部32は、第2動作モードで発音情報X3に設定可能な音声符号を、第1動作モードで発音情報X3に設定可能な音声符号と比較して制限する。すなわち、第2動作モードでは、音声素片群Gの複数の音声素片のうち特定の音声素片の集合に対応する範囲(以下「発音制限範囲」という)QA内の音声符号のみが発音情報X3の候補として利用者に許可され、第1動作モードでは、利用者が発音情報X3として指示可能な候補が音声素片群G内の全部の音声素片に対応する音声符号まで拡張される。例えば、音名に対応する音声符号(ドレミファソラシド)の範囲が発音制限範囲QAとして好適である。なお、音高情報X1および期間情報X2について利用者が指示可能な範囲は第1動作モードと第2動作モードとで共通する。
The
具体的には、情報編集部32は、利用者が指示した音声符号が発音制限範囲QA内の音声符号に該当するか否かを判定し、発音制限範囲QA内の音声符号に該当する場合にはその音声符号を発音情報X3に設定する一方、発音制限範囲QA内の音声符号に該当しない場合には、利用者が指示した音声符号を特定の音声符号(以下「代替符号」という)に置換する。代替符号は、利用者からの指示とは無関係に事前に選定された音声符号である。代替符号に対応する音声素片は音声素片群Gに包含される。例えば楽曲の歌詞として一般的な「ラ」等の音声符号や「ピー」等の擬声語の音声符号が代替符号として好適である。また、無音の音声符号を代替符号として利用することも可能である。
Specifically, the
合成処理部34は、記憶装置12内の音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。具体的には、合成処理部34は、音高情報X1が指定する音高と期間情報X2が指定する発音期間とに対応する各音符を、制御情報Cの発音情報X3に対応する音声符号で発声した音声(歌唱音)の音響信号Vを生成する。具体的には、合成処理部34は、制御情報Cの各音符情報Nの発音情報X3に対応する音声素片を音声素片群Gから順次に選択したうえで音高情報X1の音高と期間情報X2の発音期間とに調整し、調整後の各音声素片を相互に連結することで音響信号Vを生成する。合成処理部34が生成した音響信号Vが放音装置18に供給されて音波として再生される。なお、制御情報Cに応じた音響信号Vの生成には公知の音声合成技術が任意に採用される。
The
第1動作モードでは音声素片群G内の全部の音声素片に対応する音声符号を候補として発音情報X3が指定され、第2動作モードで発音情報X3の候補となる音声符号は発音制限範囲QA内に制限される。したがって、第1実施形態の音響生成部24は、第1動作モードと比較して音声符号(発音記号や音素記号)の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音声符号の制限(発音制限範囲QA)が第1動作モードでは解除されると換言することも可能である。
In the first operation mode, the pronunciation information X3 is designated by using the speech codes corresponding to all the speech units in the speech unit group G as candidates, and the speech code that is a candidate for the pronunciation information X3 in the second operation mode is the pronunciation restriction range. Limited within QA. Therefore, the
以上に説明した通り、第1実施形態では、第2動作モードでの音響信号Vの発音内容(音声符号の種類数)が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
As described above, in the first embodiment, the sound content (number of types of speech codes) of the acoustic signal V in the second operation mode is limited as compared with the first operation mode. The function of the
<第2実施形態>
本発明の第2実施形態を以下に説明する。第1実施形態では、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを事前に設定した。第2実施形態では発音制限範囲QAが可変に設定される。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態で参照した符号を流用して各々の詳細な説明を適宜に省略する。
Second Embodiment
A second embodiment of the present invention will be described below. In the first embodiment, the pronunciation restriction range QA of the speech code that is a candidate for the pronunciation information X3 in the second operation mode is set in advance. In the second embodiment, the sound generation restriction range QA is variably set. In addition, about the element which an effect | action and function are equivalent to 1st Embodiment in each form illustrated below, the detailed description of each is abbreviate | omitted suitably using the code | symbol referred in 1st Embodiment.
第2実施形態の記憶装置12は、利用者の属性情報を記憶する。属性情報は、例えば利用者の氏名等の個人情報や利用者の趣味や嗜好を指定する情報を含んで構成される。情報編集部32は、記憶装置12に記憶された利用者の属性情報に応じて発音制限範囲QAを可変に設定する。例えば、属性情報が示す利用者の氏名の音声符号(発音文字や音素記号)を包含するように発音制限範囲QAを設定する構成や、属性情報が示す利用者の趣味や嗜好に関連する単語の音声符号を包含するように発音制限範囲QAを設定する構成が好適に採用される。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
The
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第2実施形態の音響生成部24は、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第2実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第2実施形態では、利用者の属性情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の属性情報を反映した発音内容の音響信号Vを生成できるという利点がある。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
<第3実施形態>
図4は、第3実施形態の音響生成装置100のブロック図である。図4に示すように、第3実施形態の音響生成装置100は、位置検出装置40を第1実施形態に追加した構成である。位置検出装置40は、音響生成装置100の位置(利用者の位置)を検出する。例えば、位置検出装置40は、複数のGPS(Global Positioning System)衛星からの電波を受信して位置情報を生成する。
<Third Embodiment>
FIG. 4 is a block diagram of the
第3実施形態の情報編集部32は、第2実施形態と同様に、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを可変に設定する。具体的には、情報編集部32は、位置検出装置40が生成した位置情報に応じて発音制限範囲QAを可変に設定する。例えば、位置情報が示す位置に関連する単語(例えば地名等や施設名等)の音声符号を包含するように発音制限範囲QAを設定する構成が好適である。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
As in the second embodiment, the
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第3実施形態の音響生成部24は、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第3実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第3実施形態では、利用者の位置情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の位置情報を反映した発音内容の音響信号Vを生成できるという利点がある。また、利用者の位置に応じて相異なる発音内容の音響信号Vを生成できるという興趣性を利用者に提供することも可能である。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
<第4実施形態>
第1実施形態から第3実施形態では、発音制限範囲QA内で利用者からの指示に応じて発音情報X3を設定した。第4実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音声符号(発音文字や音素記号)を発音情報X3として指定する。
<Fourth embodiment>
In the first to third embodiments, the pronunciation information X3 is set in response to an instruction from the user within the pronunciation restriction range QA. In the second operation mode, the
具体的には、情報編集部32は、制御情報C内の各音符情報Nの発音情報X3をランダムに設定する。例えば、情報編集部32は、事前に用意された複数の候補から単語を順次にランダムに選択し、各単語に対応する音声符号を順番に各発音情報X3に割当てる。発音情報X3の候補を発音制限範囲QA内の音声符号に制限するか否かは不問である。また、事前に用意された文章に対応する音声符号を順番に各発音情報X3に割当てる構成も採用され得る。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定され得る。
Specifically, the
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第4実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第4実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
<第5実施形態>
第5実施形態の情報編集部32は、第1動作モードおよび第2動作モードの双方において、利用者が任意の音声符号を発音情報X3として指定することが可能である。ただし、第2動作モードでは、情報編集部32は、利用者からの指示に応じて設定された発音情報X3の一部を、利用者からの指示に非依存な代替符号(例えば第1実施形態で例示した「ラ」や「ピー」等の音声符号)に置換する。例えば、利用者が指示した複数の発音情報X3の時系列からランダムに選択された各発音情報X3が代替符号に置換される。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定される。
<Fifth Embodiment>
The
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第5実施形態の音響生成部24は、第2動作モードにおいて、利用者が指示した音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第5実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
<第6実施形態>
第6実施形態の情報編集部32は、制御情報Cで指定可能な音符数の最大値(以下「最大音符数」という)Mを第1動作モードと第2動作モードとで相違させる。具体的には、第2動作モードでの最大音符数M2は第1動作モードでの最大音符数M1を下回る。すなわち、第2動作モードでは第1動作モードと比較して音響信号Vの最大音符数Mが制限される。音高情報X1と期間情報X2と発音情報X3とは音符毎に設定されるから、音高情報X1で指定される音高の総数や発音情報X3で指定される音声符号の総数も第2動作モードでは第1動作モードと比較して制限される。
<Sixth Embodiment>
The
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第6実施形態の音響生成部24は、第2動作モードにおいて、音声符号の総数(最大音符数M)が第1動作モードと比較して制限された発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第6実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, in the second operation mode, the
<第7実施形態>
第1実施形態から第6実施形態では、制御情報C内の各音符情報Nの音高情報X1を利用者が任意に指示できる構成を例示した。第7実施形態では、音高情報X1に設定可能な音高の範囲を第1動作モードと第2動作モードとで相違させる。
<Seventh embodiment>
In the first to sixth embodiments, the configuration in which the user can arbitrarily specify the pitch information X1 of each note information N in the control information C has been exemplified. In the seventh embodiment, the range of pitches that can be set in the pitch information X1 is made different between the first operation mode and the second operation mode.
具体的には、情報編集部32は、第2動作モードで音高情報X1に設定可能な音高の範囲を、第1動作モードで音高情報X1に設定可能な音高の範囲と比較して制限する。すなわち、第2動作モードでは、第1動作モードで設定可能な複数の音高から選択された特定の範囲(以下「音高制限範囲」という)QB内の音高のみが音高情報X1の候補として利用者に許可され、第1動作モードでは、利用者が音高情報X1として指示可能な候補が全種類の音高に拡張される。例えば、鍵盤楽器の白鍵に対応する7個の幹音(黒鍵に対応する派生音以外の音高)を音高制限範囲QBに設定した構成や、所定の3個の音高(例えばドレミ)のみを音高制限範囲QBに設定した構成が採用される。また、特定のスケール(例えばアイオニアンスケールや琉球スケール)や特定の音域(オクターブ)に属する各音高を音高制限範囲QBに設定することも可能である。
Specifically, the
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第7実施形態の音響生成部24は、第1動作モードと比較して音高の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音高の制限(音高制限範囲QB)が第1動作モードでは解除されると換言することも可能である。なお、以上の説明では発音情報X3が指定する音高の制限のみに着目したが、発音情報X3が指定する音声符号の制限については第1実施形態から第6実施形態の何れかの構成が任意に採用される。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
以上に説明した通り、第7実施形態では、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
As described above, in the seventh embodiment, since the pitch of the acoustic signal V in the second operation mode is limited as compared with the first operation mode, low-quality sound data is provided to the user for listening. Compared with the technology of Patent Document 1 to be provided, the function of the
<第8実施形態>
第7実施形態では、音高制限範囲QB内で利用者からの指示に応じて音高情報X1を設定した。第8実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音高(すなわち、利用者からの指示とは無関係に選定された音高)を制御情報C内の各音高情報X1として指定する。
<Eighth Embodiment>
In the seventh embodiment, the pitch information X1 is set in response to an instruction from the user within the pitch limit range QB. In the second operation mode, the
具体的には、情報編集部32は、第2動作モードにおいて、自動作曲処理で生成した旋律の各音高を順番に各音高情報X1に割当てる。自動作曲処理には公知の技術が任意に採用される。なお、利用者が指示した単語や文章(例えば利用者が発音情報X3として指示した各音声符号の配列)に応じた旋律を生成することも可能である。また、事前に用意された旋律の各音高を各音高情報X1に割当てる構成も採用され得る。第1動作モードでは、音高の制限が解除され、利用者からの指示に応じた音高の音響信号Vが生成される。
Specifically, in the second operation mode, the
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第8実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された音高の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第7実施形態においても、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、第7実施形態と同様の効果が実現される。
The generation of the acoustic signal V using the speech element group G and the control information C is the same as in the first embodiment. Therefore, the
<第9実施形態>
第9実施形態の音響生成部24は、第2動作モードでの音響信号Vの生成に対する制限の度合を、購入処理の実行前の複数の期間の各々で個別に設定する。例えば、音響生成プログラムPGMが記憶装置12に記憶された直後の所定長(例えば3日間)にわたる第1期間A1では、発音制限範囲QAがサ行(サシスセソ)に設定され、音高制限範囲QBがCメジャースケールに設定される。第1期間A1の経過後の所定長(例えば7日間)にわたる第2期間A2では、発音制限範囲QAが音名に対応する音声符号(ドレミファソラシド)に設定され、音高情報X1が第8実施形態における自動作曲処理の旋律に制限される。第2期間A2の経過から購入処理の完了(第1動作モードへの移行)までの第3期間A3では、発音制限範囲QAが「ラ」に設定され、音高情報X1が所定の旋律の各音高に制限される。なお、音響信号Vの生成機能の制限(発音内容や音高の制限)を経時的に強化する構成と生成機能の制限を経時的に緩和する構成の双方が想定され得る。
<Ninth Embodiment>
The
第9実施形態においても前述の各形態と同様の効果が実現される。また、第9実施形態では、音響信号Vの生成に対する制限が可変に制御されるから、購入処理の実行で第1動作モードに移行する誘因を利用者に対して効果的に付与することが可能である。なお、以上の例示では、発音情報X3に指定される音声符号の制限と音高情報X1に指定される音高の制限との双方を経時的に変化させたが、音声符号および音高の一方の制限のみを経時的に変化させることも可能である。 In the ninth embodiment, the same effects as those of the above-described embodiments are realized. Moreover, in 9th Embodiment, since the restriction | limiting with respect to the production | generation of the acoustic signal V is controlled variably, the incentive to transfer to 1st operation mode by execution of a purchase process can be given effectively to a user. It is. In the above example, both the restriction of the voice code specified in the pronunciation information X3 and the restriction of the pitch specified in the pitch information X1 are changed over time, but one of the voice code and the pitch is changed. It is also possible to change only the limitation of the time course.
<変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
<Modification>
Each of the above forms can be variously modified. Specific modifications are exemplified below. Two or more modes arbitrarily selected from the following examples can be appropriately combined.
(1)第2動作モードで発音情報X3に指定される音声符号(発音文字や音素記号)を第1動作モードと比較して制限する方法は前述の例示に限定されない。第1実施形態から第6実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた発音内容(発音情報X3)の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号Vを生成する要素として包括される。
(1) The method of restricting the phonetic code (phonetic character or phoneme symbol) specified in the pronunciation information X3 in the second operation mode as compared with the first operation mode is not limited to the above example. In the first operation mode, the
また、前述の各形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが音高情報X1および期間情報X2を含む構成を例示したが、音高情報X1や期間情報X2は第1実施形態から第6実施形態から省略され得る。すなわち、音高の経時的な変化を要件としない会話音等の音声の音響信号Vの生成にも第1実施形態から第6実施形態は適用され得る。 Further, in each of the above embodiments, since it is assumed that the acoustic signal V of the singing sound is generated, the configuration in which the control information C includes the pitch information X1 and the period information X2 is exemplified. However, the pitch information X1 and the period information X2 are exemplified. Can be omitted from the first to sixth embodiments. That is, the first to sixth embodiments can be applied to the generation of a sound signal V of a voice such as a conversation sound that does not require a change in pitch over time.
(2)第2動作モードで音高情報X1に指定される音高を第1動作モードと比較して制限する方法は前述の例示に限定されない。第7実施形態および第8実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた音高の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号Vを生成する要素として包括される。また、発音情報X3に指定される音声符号を第2動作モードで制限する構成は第7実施形態や第8実施形態から省略され得る。
(2) The method of limiting the pitch specified in the pitch information X1 in the second operation mode as compared with the first operation mode is not limited to the above example. The
また、第7実施形態および第8実施形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが発音情報X3を含む構成を例示したが、発音情報X3は第7実施形態や第8実施形態から省略され得る。すなわち、音高情報X1が指定する音高と期間情報X2が指定する発音期間とで規定される音符の楽音(例えば楽器の演奏音)の音響信号Vを生成する場合にも第7実施形態や第8実施形態は適用され得る。 In the seventh embodiment and the eighth embodiment, since it is assumed that the acoustic signal V of the singing sound is generated, the configuration in which the control information C includes the pronunciation information X3 is exemplified. However, the pronunciation information X3 is the seventh embodiment. And may be omitted from the eighth embodiment. That is, the seventh embodiment also applies to the case where the acoustic signal V of the musical tone of a note (for example, the performance sound of a musical instrument) defined by the pitch specified by the pitch information X1 and the sound generation period specified by the period information X2 is generated. The eighth embodiment can be applied.
(3)前述の各形態では、記憶装置12に記憶された音声素片群Gのうち発音制限範囲QA内の音声符号に対応する音声素片を第2動作モードで選択的に利用して音響信号Vを生成したが、第1動作モードで利用される音声素片群G1と第2動作モードで利用される音声素片群G2とを個別に用意することも可能である。音声素片群G1は、利用者が音響生成装置100を正規に利用する(音響生成装置100の全部の機能を利用する)ための音声合成ライブラリであり、音声素片群G2は、利用者が音響生成装置100を試用するための試用版(特定の機能を制限して音響生成装置100の利用を許可する体験版)の音声合成ライブラリである。各音声素片の発声者は音声素片群G1と音声素片群G2とで共通するが、音声素片群G1内の音声素片の種類数は音声素片群G2内の音声素片の種類数を上回る。すなわち、音声素片群G2は音声素片群G1のうち発音制限範囲QA内の音声符号に対応する音声素片の部分集合に相当する。したがって、音声素片群G2のデータ量は音声素片群G1のデータ量を下回る。
(3) In each of the above-described embodiments, the speech unit corresponding to the speech code within the pronunciation restriction range QA out of the speech unit group G stored in the
音響生成プログラムPGMの導入直後の初期状態では音声素片群G2が記憶装置12に記憶され、購入処理が適正に完了することを条件に音声素片群G1が配信装置から通信装置14に配信されて記憶装置12に記憶される。以上の構成によれば、購入処理を実行しない場合には音声素片群G1を記憶装置12に格納する必要がないから、音声素片群G1の送受信時の通信量や音声素片群G1の記憶容量が削減されるという利点がある。
In the initial state immediately after the introduction of the sound generation program PGM, the speech unit group G2 is stored in the
(4)第2動作モードでは音響信号Vの生成に利用される音声素片の種類数が第1動作モードと比較して少ないという事情を考慮すると、第2動作モードにおいて音響信号Vの生成に必要な音声素片を動作毎に配信装置から通信装置14が取得する構成も好適である。すなわち、動作モードが第2動作モードから第1動作モードに移行するまでは記憶装置12に音声素片(音声素片群G)が記憶されない。
(4) Considering the fact that the number of types of speech elements used for generating the acoustic signal V in the second operation mode is smaller than that in the first operation mode, the acoustic signal V is generated in the second operation mode. A configuration in which the
(5)第7実施形態における音高制限範囲QBの設定に第2実施形態の属性情報や第3実施形態の位置情報を利用することも可能である。すなわち、情報編集部32は、利用者の属性情報や位置情報に応じて音高制限範囲QBを可変に設定する。
(5) It is also possible to use the attribute information of the second embodiment and the position information of the third embodiment for setting the pitch limit range QB in the seventh embodiment. That is, the
(6)前述の各形態では、購入処理の実行を条件として第2動作モードから第1動作モードに移行する場合を例示したが、動作モードの移行の方向や条件は適宜に変更される。例えば、音響生成プログラムPGMの導入の直後の初期状態では第1動作モードを選択し、購入処理が実行されずに所定の期間が経過した場合に第1動作モードから第2動作モードに移行する構成も採用され得る。また、音響信号Vの生成に対する制限の度合が相違する3種類以上の動作モードから何れかの動作モードを選択する構成も採用され得る。例えば、利用者が支払う金額に応じて段階的に動作モード(音響信号Vの生成に対する制限の度合)を変更することも可能である。音響信号Vの生成に対する制限の度合を利用者に通知する構成も採用され得る。例えば、動作モードを利用者に通知する画像(ポップアップ方式のダイアログ)を表示装置に表示する構成や、動作モードを通知する電子メールを利用者の登録アドレスに送信する構成が好適である。 (6) In each of the above-described embodiments, the case of shifting from the second operation mode to the first operation mode on the condition that the purchase process is executed has been illustrated, but the direction and conditions of the transition of the operation mode are appropriately changed. For example, a configuration in which the first operation mode is selected in the initial state immediately after the introduction of the sound generation program PGM and the first operation mode is shifted to the second operation mode when a predetermined period elapses without performing the purchase process. Can also be employed. In addition, a configuration in which any one operation mode is selected from three or more operation modes with different degrees of restriction on the generation of the acoustic signal V may be employed. For example, it is possible to change the operation mode (the degree of restriction on the generation of the acoustic signal V) step by step according to the amount paid by the user. A configuration for notifying the user of the degree of restriction on the generation of the acoustic signal V can also be employed. For example, a configuration in which an image (pop-up dialog) for notifying the user of the operation mode is displayed on the display device or a configuration in which an e-mail for notifying the operation mode is transmitted to the registered address of the user is suitable.
また、例えば利用者がプレイするゲームで特定の条件(例えば所定のステージのクリア)を充足することや音響生成プログラムPGMに関するアンケートに回答すること等の各種の条件を、動作モード(音響信号Vの生成に対する制限の度合)の変更の条件とすることも可能である。 Also, for example, various conditions such as satisfying a specific condition (for example, clearing a predetermined stage) in a game played by the user or answering a questionnaire regarding the sound generation program PGM are set in the operation mode (acoustic signal V). It is also possible to set a condition for changing the degree of restriction on generation.
以上の説明から理解される通り、前述の各形態における動作制御部22は、音響信号Vの生成に対する制限の度合が相違する第1動作モードまたは第2動作モードを選択する要素として包括され、動作モードの移行の方向や条件および動作モードの総数は本発明において任意である。
As understood from the above description, the
100……音響生成装置、10……演算処理装置、12……記憶装置、14……通信装置、16……入力装置、18……放音装置、22……動作制御部、24……音響生成部、32……情報編集部、34……合成処理部、40……位置検出装置。
DESCRIPTION OF
Claims (4)
前記第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、前記第2動作モードでは、前記第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成手段とを具備し、
前記音響生成手段は、前記第1動作モードにおいて、利用者からの指示に応じた音高の音響信号を生成し、前記第2動作モードにおいて、前記第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する
音響生成装置。 An operation control means for selecting the first operation mode or the second operation mode;
In the first operation mode, a sound signal having a pronunciation content corresponding to an instruction from the user is generated, and in the second operation mode, the pronunciation content is set with a lower degree of freedom compared to the first operation mode. Sound generating means for generating an acoustic signal,
The sound generation means generates a sound signal having a pitch according to an instruction from a user in the first operation mode, and has a lower degree of freedom in the second operation mode than in the first operation mode. A sound generator that generates a sound signal with a set pitch.
請求項1の音響生成装置。 The sound generation device according to claim 1 , wherein the sound generation unit generates a sound signal having a smaller number of types of pitches in the second operation mode than in the first operation mode.
請求項1または請求項2の音響生成装置。 It said sound generating means, the degree of restriction to the generation of the acoustic signal in the second operation mode, different first period and sound generating apparatus according to claim 1 or claim 2 is different in the second period.
第1動作モードまたは第2動作モードを選択し、Select the first operation mode or the second operation mode,
前記第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、前記第2動作モードでは、前記第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成し、In the first operation mode, a sound signal having a pronunciation content corresponding to an instruction from the user is generated, and in the second operation mode, the pronunciation content is set with a lower degree of freedom compared to the first operation mode. Generate an acoustic signal,
前記音響信号の生成では、前記第1動作モードにおいて、利用者からの指示に応じた音高の音響信号を生成し、前記第2動作モードにおいて、前記第1動作モードと比較して低い自由度で音高が設定された音響信号を生成するIn the generation of the acoustic signal, an acoustic signal having a pitch according to an instruction from a user is generated in the first operation mode, and the second operation mode has a low degree of freedom compared to the first operation mode. Generate an acoustic signal with the pitch set by
音響生成方法。Sound generation method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012184938A JP6089496B2 (en) | 2012-08-24 | 2012-08-24 | Sound generation apparatus and sound generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012184938A JP6089496B2 (en) | 2012-08-24 | 2012-08-24 | Sound generation apparatus and sound generation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044230A JP2014044230A (en) | 2014-03-13 |
JP6089496B2 true JP6089496B2 (en) | 2017-03-08 |
Family
ID=50395560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012184938A Active JP6089496B2 (en) | 2012-08-24 | 2012-08-24 | Sound generation apparatus and sound generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6089496B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3439840B2 (en) * | 1994-09-19 | 2003-08-25 | 富士通株式会社 | Voice rule synthesizer |
JP2006184730A (en) * | 2004-12-28 | 2006-07-13 | Canon Inc | Voice synthesis method |
JP5372843B2 (en) * | 2010-06-18 | 2013-12-18 | 武史 藤田 | Content utilization apparatus and program |
-
2012
- 2012-08-24 JP JP2012184938A patent/JP6089496B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014044230A (en) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6784022B2 (en) | Speech synthesis method, speech synthesis control method, speech synthesis device, speech synthesis control device and program | |
US9711123B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP6561499B2 (en) | Speech synthesis apparatus and speech synthesis method | |
US20070245375A1 (en) | Method, apparatus and computer program product for providing content dependent media content mixing | |
CN107430849B (en) | Sound control device, sound control method, and computer-readable recording medium storing sound control program | |
CN111418006B (en) | Speech synthesis method, speech synthesis device, and recording medium | |
JP6127371B2 (en) | Speech synthesis apparatus and speech synthesis method | |
JP2011048335A (en) | Singing voice synthesis system, singing voice synthesis method and singing voice synthesis device | |
JP2007086316A (en) | Speech synthesizer, speech synthesizing method, speech synthesizing program, and computer readable recording medium with speech synthesizing program stored therein | |
JP2019066649A (en) | Method for assisting in editing singing voice and device for assisting in editing singing voice | |
US8614388B2 (en) | System and method for generating customized chords | |
US11875777B2 (en) | Information processing method, estimation model construction method, information processing device, and estimation model constructing device | |
JP2013148864A (en) | Music data editing device | |
JP6089496B2 (en) | Sound generation apparatus and sound generation method | |
JP6044284B2 (en) | Speech synthesizer | |
JP5157922B2 (en) | Speech synthesizer and program | |
JP2005208394A (en) | Singing voice generating unit, its program and portable communication equipment having singing voice generating function | |
JP2014098802A (en) | Voice synthesizing apparatus | |
JP2022065554A (en) | Method for synthesizing voice and program | |
JP2022065566A (en) | Method for synthesizing voice and program | |
WO2019239971A1 (en) | Information processing method, information processing device and program | |
JP5106437B2 (en) | Karaoke apparatus, control method therefor, and control program therefor | |
JP2010169889A (en) | Voice synthesis device and program | |
US20240005896A1 (en) | Music generation method and apparatus | |
WO2023171522A1 (en) | Sound generation method, sound generation system, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150622 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160621 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6089496 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |