JP6255744B2 - Music display device and music display method - Google Patents
Music display device and music display method Download PDFInfo
- Publication number
- JP6255744B2 JP6255744B2 JP2013135810A JP2013135810A JP6255744B2 JP 6255744 B2 JP6255744 B2 JP 6255744B2 JP 2013135810 A JP2013135810 A JP 2013135810A JP 2013135810 A JP2013135810 A JP 2013135810A JP 6255744 B2 JP6255744 B2 JP 6255744B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- note
- musical
- user
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 description 62
- 239000000463 material Substances 0.000 description 35
- 230000008901 benefit Effects 0.000 description 19
- 238000003860 storage Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 239000008186 active pharmaceutical agent Substances 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000010365 information processing Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
本発明は、音楽に関連する情報を表示する技術に関し、音声合成等の音響処理に関連する情報を利用者が確認または編集するための画像の表示に特に好適に利用される。 The present invention relates to a technique for displaying information related to music, and is particularly preferably used for displaying an image for a user to confirm or edit information related to acoustic processing such as speech synthesis.
利用者が音高や歌詞を任意に指定した楽曲の歌唱音の音響信号を生成する技術が従来から提案されている。例えば特許文献1には、音高軸と時間軸とが設定された楽譜領域内に、利用者が指示した音符を表象する図像と各音符の歌詞とを表示し、各音符で構成される楽曲を各音符の歌詞で歌唱した歌唱音の音響信号を生成する音声合成技術が開示されている。 Conventionally, a technique for generating an acoustic signal of a singing sound of a music in which a user arbitrarily designates a pitch and lyrics has been proposed. For example, in Patent Document 1, a musical image composed of each note is displayed in a musical score area in which a pitch axis and a time axis are set, and an image representing a note designated by the user and the lyrics of each note are displayed. A speech synthesis technique for generating an acoustic signal of a singing sound sung with the lyrics of each note is disclosed.
しかし、特許文献1の技術では、音高軸と時間軸とが設定された楽譜領域の全域にわたり楽曲の各音符の図像が分散的に配置され得る。したがって、楽譜領域の表示に充分な面積を確保する必要があり、例えば楽譜領域以外の編集用の画像等を表示する領域が制限される可能性がある。携帯電話機等の可搬型の情報処理装置では表示画面が小さいから、楽譜領域の表示用の面積の問題は特に顕在化する。以上の事情を考慮して、本発明は、楽曲の各音符の表示に必要な面積を削減することを目的とする。 However, in the technique of Patent Document 1, the image of each musical note of music can be distributed in a distributed manner over the entire score area in which the pitch axis and the time axis are set. Therefore, it is necessary to secure a sufficient area for displaying the score area. For example, there is a possibility that an area for displaying an image for editing other than the score area may be limited. In a portable information processing apparatus such as a mobile phone, the display screen is small, so that the problem of the area for displaying the score area becomes particularly obvious. In view of the above circumstances, an object of the present invention is to reduce an area necessary for displaying each note of a music piece.
以上の課題を解決するために、本発明の楽曲表示装置は、楽曲を構成する各音符を表象する複数の音符図像を、時間軸と音高軸とが設定された領域内に配置した第1楽譜画像(例えば楽譜画像62)と、第1楽譜画像における複数の音符図像を、各々の時間軸上の位置を維持したまま時間軸に沿う直線状に配列した第2楽譜画像(例えば楽譜画像80)とを、表示装置に選択的に表示させる表示制御手段を具備する。以上の構成では、楽曲を構成する各音符を表象する複数の音符図像を時間軸と音高軸とのもとで表示する第1楽譜画像と、各音符図像の時間軸上の位置を維持したまま第1楽譜画像の複数の音符図像を時間軸に沿う直線状に配列した第2楽譜画像とが選択的に表示される。したがって、第1楽譜画像では、各音符の音高も含めて楽曲の各音符の内容を利用者が詳細に確認できる一方、第2楽譜画像では、複数の音符図像が時間軸の方向に直線状に配列されるから、第1楽譜画像と比較して対象楽曲の各音符の表示に必要な面積が削減されるという利点がある。なお、第1楽譜画像と第2楽譜画像とが「選択的に表示される」とは、第1楽譜画像と第2楽譜画像とを含む複数の画像の何れかが表示装置に表示されることを意味し、第1楽譜画像と第2楽譜画像とが二者択一的に表示される構成には限定されない。
In order to solve the above problems, the music display device of the present invention is a first in which a plurality of musical note images representing each musical note constituting a musical piece are arranged in a region in which a time axis and a pitch axis are set. A score image (for example, score image 62) and a plurality of note images in the first score image are arranged in a straight line along the time axis while maintaining the position on each time axis (for example, score
本発明の好適な態様において、表示制御手段は、楽曲を構成する各音符の音声符号を利用者が指示するための歌詞編集画像を第2楽譜画像とともに表示装置に表示させる。以上の構成では、各音符の音声符号を利用者が指示するための歌詞編集画像が第2楽譜画像とともに表示装置に表示される。本発明によれば、第2楽譜画像の表示に必要な面積が削減されるから、歌詞編集画像の表示面積の確保が容易であるという利点がある。 In a preferred aspect of the present invention, the display control means causes the display device to display a lyrics-edited image for the user to instruct the voice code of each note constituting the music together with the second score image. In the above configuration, the lyrics edited image for the user to specify the voice code of each note is displayed on the display device together with the second score image. According to the present invention, since the area required for displaying the second musical score image is reduced, there is an advantage that it is easy to secure the display area of the lyrics edited image.
本発明の好適な態様において、表示制御手段は、楽曲を構成する各音符の音声符号を利用者が指定可能な第1歌詞編集画像(例えば歌詞編集画像84)と、楽曲を構成する複数の音符にわたる音声符号を、複数の候補単語から利用者が選択可能な第2歌詞編集画像(例えば歌詞編集画像86)とを、歌詞編集画像として表示装置に選択的に表示させる。以上の態様では、各音符の音声符号を利用者が指定可能な第1歌詞編集画像と各音符の音声符号を複数の候補単語から利用者が選択可能な第2歌詞編集画像とが選択的に表示される。したがって、第1歌詞編集画像では、利用者による音声符号の指定で利用者の意図や嗜好を充分に反映した音声符号を設定できるほか、第2歌詞編集画像では、候補単語の選択により各音符の音声符号を容易に設定できるという利点がある。 In a preferred aspect of the present invention, the display control means includes a first lyrics-edited image (for example, the lyrics-edited image 84) that allows the user to specify the audio code of each note constituting the song, and a plurality of notes constituting the song. The second lyric edit image (for example, the lyric edit image 86) that can be selected by the user from a plurality of candidate words is selectively displayed as a lyric edit image on the display device. In the above aspect, the first lyric edit image in which the user can specify the audio code of each note and the second lyric edit image in which the user can select the audio code of each note from a plurality of candidate words are selectively used. Is displayed. Therefore, in the first lyric edited image, a voice code that sufficiently reflects the user's intention and preference can be set by designating the voice code by the user. In the second lyric edited image, each note is selected by selecting a candidate word. There is an advantage that the voice code can be easily set.
本発明の好適な態様に係る楽曲表示装置は、利用者による1個以上の音符図像の選択を受付ける指示受付手段を具備し、表示制御手段は、指示受付手段が1個の音符図像の選択を受付けた場合には第1歌詞編集画像を表示させ、指示受付手段が複数の音符図像の選択を受付けた場合には第2歌詞編集画像を表示させる。以上の態様では、利用者が選択した音符図像の個数に応じて第1歌詞編集画像と第2歌詞編集画像とが切替えられるから、利用者が各音符の音声符号を編集する作業の負荷が軽減されるという利点がある。 The music display device according to a preferred aspect of the present invention comprises an instruction receiving means for accepting selection of one or more musical note images by a user, and the display control means allows the instruction receiving means to select one musical note image. When accepted, the first lyrics edited image is displayed, and when the instruction receiving means accepts selection of a plurality of musical note graphic images, the second lyrics edited image is displayed. In the above aspect, since the first lyric edited image and the second lyric edited image are switched according to the number of note images selected by the user, the workload of the user to edit the voice code of each note is reduced. There is an advantage of being.
更に好適な態様において、表示制御手段は、第2歌詞編集画像において、指示受付手段が選択を受付けた音符図像の個数に応じた個数の分節単位(例えば文字や音節)で構成される複数の候補単語を利用者による選択の候補として表示装置に表示させる。以上の態様では、利用者が選択した音符図像の個数と同数の文字で構成される複数の候補単語が第2歌詞編集画像にて表示されるから、楽曲の所望の個数の音符に対して音声符号を割当てようとする利用者の作業の負荷が軽減されるという利点がある。 In a more preferred aspect, the display control means includes a plurality of candidates composed of a number of segment units (for example, characters and syllables) corresponding to the number of musical note images received by the instruction receiving means in the second lyrics edited image. The word is displayed on the display device as a candidate for selection by the user. In the above aspect, since a plurality of candidate words composed of the same number of characters as the number of note images selected by the user are displayed in the second lyric editing image, the desired number of notes of the music is sounded. There is an advantage that the workload of the user who tries to assign the code is reduced.
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。 The sound processing apparatus according to each of the above aspects is realized by hardware (electronic circuit) such as a DSP (Digital Signal Processor) dedicated to processing of an acoustic signal, or a general-purpose operation such as a CPU (Central Processing Unit). This is also realized by cooperation between the processing device and the program. The program of the present invention can be provided in a form stored in a computer-readable recording medium and installed in the computer. The recording medium is, for example, a non-transitory recording medium, and an optical recording medium (optical disk) such as a CD-ROM is a good example, but a known arbitrary one such as a semiconductor recording medium or a magnetic recording medium This type of recording medium can be included. For example, the program of the present invention can be provided in the form of distribution via a communication network and installed in a computer.
本発明は、以上に説明した楽曲表示装置の動作方法(楽曲表示方法)としても特定される。本発明の楽曲表示方法は、楽曲を構成する各音符を表象する複数の音符図像を、時間軸と音高軸とが設定された領域内に配置した第1楽譜画像と、第1楽譜画像における複数の音符図像を、各々の時間軸上の位置を維持したまま時間軸に沿う直線状に配列した第2楽譜画像とを、表示装置に選択的に表示させる。以上の方法によれば、本発明の楽曲表示装置と同様の効果が実現される。 The present invention is also specified as an operation method (music display method) of the music display device described above. The music display method of the present invention includes a first musical score image in which a plurality of musical note images representing each musical note constituting a musical piece are arranged in a region in which a time axis and a pitch axis are set, and the first musical score image A second musical score image in which a plurality of musical note graphic images are arranged linearly along the time axis while maintaining the position on each time axis is selectively displayed on the display device. According to the above method, the same effect as the music display device of the present invention is realized.
<第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。音響処理装置100は、楽曲を歌唱した音声の音響信号Sを生成する信号処理装置(音声合成装置)である。第1実施形態では、事前に用意された複数の旋律(以下「フレーズ」という)を利用者からの指示に応じて時間軸上に配列することで合成対象の楽曲(以下「対象楽曲」という)が構成され、対象楽曲の各フレーズの歌詞が利用者からの指示に応じて設定または変更される。フレーズは、複数の音符で構成された旋律(楽句)である。音響処理装置100は、対象楽曲を歌唱した歌唱音の音響信号Sを生成する。
<First Embodiment>
FIG. 1 is a block diagram of a
図1に例示される通り、音響処理装置100は、演算処理装置12と記憶装置14と表示装置22と入力装置24と放音装置26とを具備するコンピュータシステムで実現される。例えば携帯電話機または携帯情報端末等の可搬型の情報処理装置や据置型の情報処理装置(パーソナルコンピュータ)で音響処理装置100は実現される。
As illustrated in FIG. 1, the
表示装置22(例えば液晶表示パネル)は、演算処理装置12から指示された画像を表示する。入力装置24は、利用者により操作される機器である。第1実施形態では、表示装置22と一体に構成されて操作面(表示装置22の表示面)の任意の位置に対する接触を検知するタッチパネルを入力装置24として例示する。ただし、利用者が操作可能な複数の操作子を含む操作機器を入力装置24として利用することも可能である。放音装置26は、演算処理装置12が生成した音響信号Sに応じた音波を放射する。なお、音響信号Sをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
The display device 22 (for example, a liquid crystal display panel) displays an image instructed from the
記憶装置14は、演算処理装置12が音響信号Sの生成のために実行するアプリケーションプログラム(以下「音響処理プログラム」という)PGMや演算処理装置12が使用する各種のデータ(音楽データM,素材データQ,系列データDS)を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置14として任意に採用され得る。音響処理プログラムPGMは、例えば、移動通信網やインターネット等の通信網を介して配信装置(例えばウェブサーバ等のサーバ装置)から音響処理装置100に配信されたうえで記憶装置14に格納される。
The
第1実施形態の記憶装置14は、音楽データMと複数の素材データQと系列データDSとを記憶する。音楽データMは、対象楽曲を構成する音符の時系列を指定する時系列データである。図2に例示される通り、第1実施形態の音楽データMは、音高X1と発音期間X2と音声符号X3とを対象楽曲内の音符毎に指定する。音高X1は音符の音高(実際には各音高に付与されたノートナンバ)である。発音期間X2は、音符の発音が継続される区間であり、例えば発音の開始点と継続長(音価)とで規定される。なお、発音の開始点と終了点とで発音期間X2を指定することも可能である。音声符号X3は、音符の発音内容(例えば歌詞の音節)を指定する符号である。
The
記憶装置14に記憶される複数の素材データQは、対象楽曲(音楽データM)の編集や音響信号Sの生成に利用される。対象楽曲の題材(テーマ)毎に素材データQが用意される。具体的には、素材データQを利用して構成可能な対象楽曲の曲調や合成可能な音響信号Sの音響特性(例えば声質)は素材データQ毎に相違する。素材データQの流通経路は任意であるが、例えば移動通信網やインターネット等の通信網を介して配信装置から素材データQが音響処理装置100に提供される構成が好適である。具体的には、配信装置に蓄積された複数の素材データQのうち音響処理装置100の利用者が選択した素材データQが、例えば所定の課金処理の完了を条件として音響処理装置100に配信されたうえで記憶装置14に格納される。
The plurality of material data Q stored in the
図3は、記憶装置14に記憶される任意の1個の素材データQの説明図である。図3に例示される通り、素材データQは、楽曲編集データQAと伴奏音データQBと音声素片データQCと候補単語データQDとを含んで構成される。
FIG. 3 is an explanatory diagram of an arbitrary piece of material data Q stored in the
楽曲編集データQAは、音楽データM(対象楽曲)の編集に利用されるデータであり、相異なるフレーズに対応する複数の単位データUの集合である。任意の1個の単位データUは、関連データQA1と旋律データQA2と画像データQA3と再生データQA4とを含んで構成される。関連データQA1は、フレーズの識別符号や表示名(名称)を指定する。 The music edit data QA is data used for editing the music data M (target music), and is a set of a plurality of unit data U corresponding to different phrases. One arbitrary unit data U includes related data QA1, melody data QA2, image data QA3, and reproduction data QA4. The related data QA1 specifies a phrase identification code and a display name (name).
旋律データQA2は、1個のフレーズを構成する複数の音符の時系列(すなわち旋律)を表す。所定の時間長(例えば2小節分)にわたるフレーズが旋律データQA2で指定される。具体的には、図3に例示される通り、旋律データQA2は、音楽データMと同様に、音高X1と発音期間X2と音声符号X3とをフレーズ内の音符毎に指定する。第1実施形態における旋律データQA2の各音符の音声符号X3は、例えば歌声に好適な「ラ」等の初期的な歌詞に設定される。概略的には、利用者からの指示に応じた複数の旋律データQA2を時間軸上に配列し、各旋律データQA2の音声符号X3(歌詞)を利用者からの指示に応じて変更することで対象楽曲の音楽データMが生成される。再生データQA4は、旋律データQA2で指定されるフレーズの音響(例えば時間波形)を表す音響データである。 The melody data QA2 represents a time series (that is, a melody) of a plurality of notes constituting one phrase. A phrase extending over a predetermined time length (for example, two bars) is designated by melody data QA2. Specifically, as illustrated in FIG. 3, the melody data QA2 specifies the pitch X1, the pronunciation period X2, and the phonetic code X3 for each note in the phrase, as with the music data M. The voice code X3 of each note of the melody data QA2 in the first embodiment is set to an initial lyrics such as “La” suitable for singing voice, for example. Schematically, a plurality of melodic data QA2 corresponding to an instruction from the user are arranged on the time axis, and the voice code X3 (lyrics) of each melodic data QA2 is changed according to the instruction from the user. Music data M of the target song is generated. The reproduction data QA4 is sound data representing the sound (for example, time waveform) of the phrase specified by the melody data QA2.
画像データQA3は、旋律データQA2が指定するフレーズを表象する画像(以下「フレーズ画像」という)Gを表すデータである。図4は、1個のフレーズ画像Gを例示する模式図である。図4に例示される通り、フレーズ画像Gは、旋律データQA2が指定するフレーズの各音符を表象する音符図像Zを、相互に交差する時間軸と音高軸とが設定された領域内に配置したピアノロール型の画像(サムネイル画像)である。すなわち、各音符の音符図像Zの音高軸上の位置は、旋律データQA2が当該音符に指定する音高X1に応じて設定され、音符図像Zの時間軸上の位置および表示長は、旋律データQA2が当該音符に指定する発音期間X2に応じて設定される。ただし、第1実施形態のフレーズ画像Gは、旋律データQA2が示すフレーズの内容を表象するように事前に作成された固定の画像である。 The image data QA3 is data representing an image (hereinafter referred to as “phrase image”) G representing a phrase designated by the melody data QA2. FIG. 4 is a schematic diagram illustrating one phrase image G. As illustrated in FIG. 4, the phrase image G arranges a musical note image Z representing each note of the phrase specified by the melody data QA2 in a region where a time axis and a pitch axis intersect with each other are set. This is a piano roll type image (thumbnail image). That is, the position on the pitch axis of the note image Z of each note is set according to the pitch X1 specified by the melody data QA2 for the note, and the position and display length of the note image Z on the time axis are determined by the melody. The data QA2 is set according to the sound generation period X2 designated for the note. However, the phrase image G of the first embodiment is a fixed image created in advance so as to represent the contents of the phrase indicated by the melody data QA2.
第1実施形態の対象楽曲は、時間軸上の複数のブロックBで構成され、複数のブロックB(B1,B2,……)の各々について利用者からの指示に応じた1個のフレーズが選択される。図3から理解される通り、楽曲編集データQA内の複数の単位データUは、ブロックB毎に区分される。利用者による選択候補となる各フレーズの内容や組合せはブロックB毎に相違する。具体的には、任意の1個のブロックBに属する各単位データUの旋律データQA2は、楽曲内の当該ブロックBにとって音楽的に好適なフレーズを指定する。例えば、先頭のブロックBに属する各単位データUの旋律データQA2は、楽曲の開始部の旋律として音楽的に好適なフレーズを指定し、末尾のブロックBに属する各単位データUの旋律データQA2は、楽曲の終了部の旋律として音楽的に好適なフレーズを指定する。図1の系列データDSは、時間軸上のブロックB毎に選択された各フレーズの識別符号を時系列に指定する。 The target music of the first embodiment is composed of a plurality of blocks B on the time axis, and one phrase is selected for each of the plurality of blocks B (B1, B2,...) According to an instruction from the user. Is done. As understood from FIG. 3, the plurality of unit data U in the music edit data QA is divided into blocks B. The contents and combinations of phrases that are candidates for selection by the user are different for each block B. Specifically, the melody data QA2 of each unit data U belonging to any one block B designates a musically suitable phrase for the block B in the music. For example, the melody data QA2 of each unit data U belonging to the first block B designates a musically suitable phrase as the melody at the beginning of the music, and the melody data QA2 of each unit data U belonging to the last block B is A musically suitable phrase is designated as the melody at the end of the music. The series data DS of FIG. 1 designates the identification code of each phrase selected for each block B on the time axis in time series.
図3の素材データQ内の伴奏音データQBは、各フレーズの伴奏音(例えば時間波形)を表す音響データである。具体的には、楽曲編集データQAの各旋律データQA2が指定するフレーズの伴奏音として好適な音響(例えば打楽器の演奏音で構成されるリズム音やギター等の楽器の和音で構成されるバッキング音)の時系列が伴奏音データQBで指定される。なお、素材データQがブロックB毎またはフレーズ毎に別個の伴奏音データQBを含む構成も採用される。伴奏音データQBが表す伴奏音は素材データQ毎に相違し得る。 The accompaniment sound data QB in the material data Q of FIG. 3 is acoustic data representing the accompaniment sound (for example, time waveform) of each phrase. Specifically, sound suitable as an accompaniment sound of a phrase specified by each melody data QA2 of the music editing data QA (for example, a backing sound composed of a rhythm sound composed of a percussion instrument performance sound or a chord of an instrument such as a guitar) ) Is specified by the accompaniment sound data QB. A configuration in which the material data Q includes separate accompaniment sound data QB for each block B or phrase is also employed. The accompaniment sound represented by the accompaniment sound data QB can be different for each material data Q.
音声素片データQCは、特定の発声者の音声から事前に採取された複数の音声素片の集合(音声合成ライブラリ)である。各音声素片は、言語的な意味の区別の最小単位である音素(例えば母音や子音)、または複数の音素を連結した音素連鎖(例えばダイフォンやトライフォン)であり、例えば時間波形のサンプル系列で表現される。音声素片データQCが表す各音声素片の音響特性(例えば音声素片の発声者)は素材データQ毎に相違する。 The speech segment data QC is a set (speech synthesis library) of a plurality of speech segments collected in advance from the speech of a specific speaker. Each speech segment is a phoneme (for example, a vowel or consonant) that is the minimum unit of distinction of linguistic meaning, or a phoneme chain (for example, a diphone or a triphone) in which a plurality of phonemes are connected. It is expressed by The acoustic characteristics of each speech unit represented by the speech unit data QC (for example, the speaker of the speech unit) are different for each material data Q.
候補単語データQDは、対象楽曲の歌詞として利用者が選択可能な複数の単語(以下「候補単語」という)WCを指定する。図3に例示される通り、文字数n(nは2以上の自然数)が相違する複数の候補単語WCが候補単語データQDで指定される。候補単語データQDが表す候補単語の内容や組合せは素材データQ毎に相違する。 The candidate word data QD designates a plurality of words (hereinafter referred to as “candidate words”) WC that can be selected by the user as the lyrics of the target music. As illustrated in FIG. 3, a plurality of candidate words WC having different numbers of characters n (n is a natural number of 2 or more) are designated by candidate word data QD. The contents and combinations of candidate words represented by the candidate word data QD are different for each material data Q.
図1の演算処理装置12は、記憶装置14に記憶されたプログラムを実行することで複数の機能(指示受付部32,表示制御部34,情報管理部36,信号処理部38)を実現する。なお、演算処理装置12の機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が一部の機能を実現する構成も採用され得る。
The
指示受付部32は、入力装置24に対する操作に応じた利用者からの指示を受付ける。具体的には、指示受付部32は、入力装置24の操作面に対する接触の位置に応じて利用者からの指示の内容を特定する。表示制御部34は、各種の画像を表示装置22に表示させる。例えば、表示制御部34は、対象楽曲の内容を利用者が確認または編集するための画像(以下「編集画像」という)を生成して表示装置22に表示させ、指示受付部32が利用者から受付けた指示に応じて編集画像を更新する。情報管理部36は、指示受付部32が利用者から受付けた指示に応じて音楽データMや系列データDSを生成または更新する。
The
信号処理部38は、素材データQを利用して編集された音楽データMと素材データQの伴奏音データQBおよび音声素片データQCとを利用して対象楽曲の歌唱音の音響信号Sを生成する。具体的には、信号処理部38は、音楽データMが音符毎に指定する音声符号X3に対応する音声素片を音声素片データQCから順次に選択し、音楽データMが指定する音高X1および発音期間X2に各音声素片を調整する。そして、信号処理部38は、調整後の各音声素片を時間軸上で相互に連結するとともに伴奏音データQBを混合することで音響信号Sを生成する。信号処理部38が生成した音響信号Sが放音装置26に供給されることで音波として再生される。以上の説明から理解される通り、利用者からの指示に応じてフレーズと歌詞とが設定された対象楽曲を伴奏音データQBの伴奏音のもとで歌唱した歌唱音が放音装置26から再生される。
The
図5は、音響処理装置100(演算処理装置12)の動作のフローチャートである。例えば入力装置24に対する操作で利用者が音響処理プログラムPGMの起動を指示した場合に図5の処理が開始される。音響処理プログラムPGMが起動されると、演算処理装置12(指示受付部32)は、利用者からの指示を受付けたか否かを判定する(SA1)。利用者からの指示を受付けた場合(SA1:YES)、演算処理装置12(表示制御部34)は、利用者からの指示の内容に応じて表示装置22の表示画像を更新する(SA2)。また、演算処理装置12(情報管理部36)は、利用者からの指示に応じて記憶装置14内の音楽データMや系列データDSを更新する(SA3)。利用者の指示を受付けていない場合(SA1:NO)にはステップSA2およびステップSA3の処理は実行されない。
FIG. 5 is a flowchart of the operation of the sound processing apparatus 100 (arithmetic processing apparatus 12). For example, when the user instructs activation of the sound processing program PGM by an operation on the
演算処理装置12(指示受付部32)は、音響信号Sの生成の指示を利用者から受付けたか否かを判定する(SA4)。音響信号Sの生成の指示を受付けた場合(SA4:YES)、演算処理装置12(信号処理部38)は、記憶装置14に記憶された音楽データMと素材データQの伴奏音データQBおよび音声素片データQCとを利用して対象楽曲の歌唱音の音響信号Sを生成する(SA5)。音響信号Sの生成の指示を受付けていない場合(SA4:NO)には音響信号Sの生成(SA5)は実行されない。演算処理装置12(指示受付部32)は、音響処理プログラムPGMの終了が利用者から指示されたか否かを判定する(SA6)。終了指示を受付けていない場合(SA6:NO)、演算処理装置12は、処理をステップSA1に移行して前述の処理を反復する。他方、利用者から終了の指示を受付けた場合(SA6:YES)、演算処理装置12は、音響処理プログラムPGMを終了する。
The arithmetic processing unit 12 (instruction receiving unit 32) determines whether or not an instruction to generate the acoustic signal S has been received from the user (SA4). When an instruction to generate the acoustic signal S is received (SA4: YES), the arithmetic processing unit 12 (signal processing unit 38) performs the accompaniment sound data QB and sound of the music data M and the material data Q stored in the
図6は、表示制御部34が表示装置22に表示させる画像の模式図である。音響処理プログラムPGMが起動されると、表示制御部34は、図6の初期画像40を表示装置22に表示させる。初期画像40は、記憶装置14に記憶された複数の素材データQ(テーマ)の何れかを利用者に選択させる画面であり、具体的には複数の素材データQの表示名を配列したリスト画像である。利用者は、入力装置24を適宜に操作することで、初期画像40に提示された複数の素材データQのうち所望の素材データQを選択することが可能である。
FIG. 6 is a schematic diagram of an image displayed on the
利用者による素材データQの選択(すなわち対象楽曲のテーマの選択)の指示を指示受付部32が受付けると、表示制御部34は、利用者が対象楽曲を編集するための図6の編集画像50を表示装置22に表示させる。編集画像50は、時間軸上のブロックB毎に利用者がフレーズを選択して対象楽曲を構成するための画面であり、楽譜画像52と選択画像54とを含んで構成される。
When the
選択画像54は、利用者が初期画像40にて選択した素材データQ内の各画像データQA3が表象する複数のフレーズ画像Gを配列した画面である。具体的には、表示制御部34は、時間軸上の1個のブロックB(以下「対象ブロックB」という)を選択し、素材データQの楽曲編集データQAに包含される複数の単位データUのうち対象ブロックBに属する各単位データUの画像データQA3が示す複数のフレーズ画像Gを配列する。対象ブロックBの選択の条件は任意であるが、例えば、対象楽曲の編集を開始した直後には先頭のブロックBを対象ブロックBとして選択し、1個の対象ブロックBのフレーズが確定されると直後のブロックBを対象ブロックBとして選択する構成が好適である。また、利用者が入力装置24に対する操作で対象ブロックBを選択することも可能である。
The selected
前述の通り各ブロックBについて選択候補となるフレーズの内容や組合せはブロックB毎に相違する。したがって、選択画像54で表示対象となる複数のフレーズ画像GはブロックB毎に相違する。例えば、相異なる任意のブロックBa(第1ブロック)およびブロックBb(第2ブロック)に着目すると、選択画像54に表示される複数のフレーズ画像G(利用者による選択候補となる複数のフレーズ)はブロックBaとブロックBbとで相違する。また、表示制御部34は、図6に例示される通り、関連データQA1が指定するフレーズの表示名(フレーズA1,フレーズA2,……)を各フレーズ画像Gの近傍に配置する。選択画像54に対する利用者からの操作(例えば操作面に対するドラッグ操作やスワイプ操作)に応じて、表示制御部34は、複数のフレーズ画像Gの配列を横方向にスクロールする。
As described above, the contents and combinations of phrases that are selection candidates for each block B are different for each block B. Therefore, the plurality of phrase images G to be displayed in the selected
利用者は、入力装置24を適宜に操作することで、選択画像54の複数のフレーズ画像Gのうち所望の1個のフレーズのフレーズ画像Gを選択することが可能である。指示受付部32は、利用者によるフレーズ画像Gの選択(対象ブロックBに割当てられるべきフレーズの選択)の指示を受付ける。表示制御部34は、入力装置24の操作面のうち特定のフレーズ画像Gに対する操作(例えばタップ操作)を指示受付部32が受付けた場合に当該フレーズ画像Gを暫定的な選択状態に設定する。図6の編集画像50に例示される通り、選択状態にあるフレーズ画像G(図6の例示では左端の1個のフレーズ画像G)と非選択のフレーズ画像Gとは相異なる態様(例えば選択状態のフレーズ画像Gの枠線を強調した態様)で表示される。また、1個のフレーズ画像Gが選択状態に遷移すると、信号処理部38は、利用者が選択したフレーズの再生データQA4を放音装置26に供給することで当該フレーズを再生する。したがって、利用者は、各フレーズ画像Gに対応するフレーズの再生音を実際に聴取して内容を確認しながら所望のフレーズ画像Gを選択画像54から選択することが可能である。なお、以上の例示では、事前に用意された再生データQA4を再生する構成を例示したが、信号処理部38が旋律データQA2と音声素片データQCの各音声素片とからフレーズの音響信号Sを生成して放音装置26に供給する構成(したがって再生データQA4は省略される)も好適である。
The user can select the phrase image G of one desired phrase among the plurality of phrase images G of the
選択状態にあるフレーズ画像Gに対する操作(例えばタップ操作)を指示受付部32が受付けた場合に当該フレーズ画像Gの選択が確定される。フレーズ画像Gの選択が確定すると、情報管理部36は、当該フレーズ画像Gに対応するフレーズの識別符号を系列データDSに追加する。したがって、以上に説明したフレーズの選択が時間軸上の複数のブロックBにわたり反復された段階では、各ブロックBについて選択された複数のフレーズの時系列が系列データDSで指定される。
When the
図6の編集画像50の楽譜画像52は、選択画像54において選択状態にある1個のフレーズ画像Gのフレーズを利用者に提示する画像である。具体的には、楽譜画像52は、利用者が選択したフレーズの旋律データQA2(選択状態にあるフレーズ画像Gの画像データQA3と同じ単位データU内の旋律データQA2)が指定する各音符を表象する音符図像Zを、相互に交差する時間軸と音高軸とが設定された領域内に配置したピアノロール型の画像である。すなわち、各音符の音符図像Zの音高軸上の位置は、旋律データQA2が当該音符に指定する音高X1に応じて設定され、音符図像Zの時間軸上の位置および表示長は、旋律データQA2が当該音符に指定する発音期間X2に応じて設定される。また、各音符の音符図像Zには、旋律データQA2が当該音符に指定する音声符号X3が付加される。具体的には、音声符号X3は、音符図像Zの内側に配置される。なお、音声符号X3を音符図像Zの近傍(外側)に配置することも可能である。
The
図6から理解される通り、楽譜画像52は、概略的には、選択画像54にて利用者が選択した1個のフレーズ画像Gを拡大した関係にある。したがって、利用者は、選択画像54内の各フレーズ画像Gを視認することで複数のフレーズを対比しながら所望のフレーズを選択し、楽譜画像52を視認することで選択状態のフレーズの詳細な内容を確認することが可能である。表示制御部34は、楽譜画像52に対する利用者からの指示に応じて複数の音符図像Zの配列のスクロールや表示倍率の変更を実行する。したがって、各フレーズのうち楽譜画像52での表示対象となる音高軸上および時間軸上の範囲は利用者からの指示に応じて変更される。
As can be understood from FIG. 6, the
時間軸上の所望の個数のブロックの各々についてフレーズを選択すると、利用者は、編集画像50の操作図像56を操作する。操作図像56に対する操作(フレーズの選択の終了指示)を指示受付部32が受付けると、表示制御部34は、編集画像50で選択された各フレーズの各音符を利用者からの指示に応じて個別に編集するための編集画像60を表示装置22に表示させ、情報管理部36は、ブロックB毎のフレーズに応じた音楽データMを生成して記憶装置14に格納する。具体的には、情報管理部36は、図7に例示される通り、初期画像40にて利用者が選択した素材データQ内の複数の旋律データQA2のうち系列データDSがブロックB毎に指定する各フレーズの旋律データQA2を、ブロックBの順番で時系列に配列することで音楽データMを生成する。すなわち、音楽データMは、利用者が選択した複数のフレーズを時系列に配列した対象楽曲を指定する。
When a phrase is selected for each of a desired number of blocks on the time axis, the user operates the operation
図6の編集画像60は、楽譜画像62と操作画像64とを含んで構成される。楽譜画像62は、音楽データMが指定する各音符を表象する音符図像Zを、時間軸と音高軸とが設定された領域内に配置したピアノロール型の画像である。編集画像50の楽譜画像52と同様に、音高軸の方向における各音符の音符図像Zの位置は、音楽データMが当該音符に指定する音高X1に応じて設定され、時間軸の方向における各音符の音符図像Zの位置および表示長は、音楽データMが当該音符に指定する発音期間X2に応じて設定される。また、各音符の音符図像Zには、音楽データMが当該音符に指定する音声符号X3が付加される。具体的には、音声符号X3は、音符図像Zの内側に配置される。表示制御部34は、楽譜画像62に対する利用者からの指示に応じて複数の音符図像Zの配列のスクロールや表示倍率の変更を実行する。すなわち、対象楽曲の各フレーズのうち楽譜画像62での表示対象となる音高軸上および時間軸上の範囲は利用者からの指示に応じて変更される。
The edited
利用者は、入力装置24を適宜に操作することで、楽譜画像62内の1個以上の音符図像Zを任意に選択することが可能である。具体的には、利用者は、操作面に対する1回のタップ操作で任意の1個の音符図像Zを選択することが可能である。また、利用者は、図8に鎖線の矢印で図示される通り、所望の複数の音符図像Zの系列をなぞるように操作面に対するドラッグ操作を実行することで、複数の音符図像Zを選択することが可能である。指示受付部32は、利用者による音符図像Zの選択を受付ける。信号処理部38は、利用者が選択した音符図像Zに対応する音符の音響信号Sを生成して放音装置26に供給する。具体的には、信号処理部38は、利用者が選択した音符図像Zに対応する音符の音声符号X3に応じた音声素片を当該音符の音高X1に調整することで音響信号Sを生成する。したがって、楽譜画像62内の1個の音符図像Zの選択毎に、当該音符図像Zに対応する音符の歌唱音が順次に再生される。
The user can arbitrarily select one or more note graphic images Z in the
図9は、指示受付部32が楽譜画像62内の音符図像Zの選択を受付けた場合に実行される処理の説明図である。表示制御部34は、指示受付部32が選択を受付けた音符図像Zの個数が1であるか否かを判定する(SB1)。表示制御部34は、指示受付部32が1個の音符図像Zの選択を受付けた場合(SB1:YES)には表示装置22による表示画像を編集画像60から編集画像81に変更し、指示受付部32が複数の音符図像Zの選択を受付けた場合(SB1:NO)には表示画像を編集画像60から編集画像82に変更する。他方、各音符図像Zの選択の解除が利用者から指示されると、表示制御部34は、表示画像を編集画像81または編集画像82から編集画像60に変更する。
FIG. 9 is an explanatory diagram of processing executed when the
図9の編集画像81は、楽譜画像80と歌詞編集画像84とを含んで構成され、編集画像82は、楽譜画像80と歌詞編集画像86とを含んで構成される。編集画像81および編集画像82の各々の楽譜画像80は、編集画像60の楽譜画像62(または編集画像50の楽譜画像52)にて表示されていた複数の音符図像Zを、時間軸の方向における各音符図像Zの位置および表示長を維持したまま、時間軸に沿う直線状(時間軸に平行な基準線L0の線上)に配列した画像である。
The edited
すなわち、音符図像Zの選択前の楽譜画像62では時間軸および音高軸の2次元で各音符図像Zの時系列が表示されるが、音符図像Zの選択後の楽譜画像80では、音高軸が省略された(すなわち各音符の音高の相違を無視した)1次元で各音符図像Zが表示される。複数の音符図像Zの縦方向の分布範囲が、楽譜画像80では楽譜画像62と比較して縮小されるとも換言され得る。したがって、楽譜画像80の縦方向のサイズLB1は、楽譜画像62の縦方向のサイズLA1を下回る。すなわち、楽譜画像62から楽譜画像80への変更で画像の縦方向のサイズが縮小される(LA1→LB1)。なお、編集画像60から編集画像81または編集画像82への変更時に、楽譜画像62における各音符図像Zの音高軸上の位置から楽譜画像80における基準線L0上の位置まで各音符図像Zが連続的に移動する様子を示す動画像(アニメーション)を表示することも可能である。図9に例示される通り、楽譜画像80内の各音符図像Zには、楽譜画像52や楽譜画像62と同様に音声符号X3が付加される。また、楽譜画像80内の複数の音符図像Zのうち利用者が選択した各音符図像Zは強調表示される。
That is, in the
編集画像81の歌詞編集画像84および編集画像82の歌詞編集画像86は、利用者が各音符の歌詞を編集するための画像であり、表示装置22の表示領域のうち、楽譜画像62から楽譜画像80への変更による画像の縮小で確保された領域(楽譜画像62の下方の領域)に配置される。したがって、歌詞編集画像84および歌詞編集画像86の各々の縦方向のサイズLB2は、編集画像60の操作画像64の縦方向のサイズLA2を上回る。また、編集画像81および編集画像82の各々において、楽譜画像80の縦方向のサイズLB1は、歌詞編集画像84や歌詞編集画像86の縦方向のサイズLB2を下回る。
The lyrics edited
利用者が1個の音符図像Zを選択した場合(SB1:YES)に表示される歌詞編集画像84は、各音符の歌詞を利用者が1文字ずつ任意に指定するための画面である。具体的には、歌詞編集画像84は、利用者が1個の文字を任意に指定するための複数の操作図像842を包含する。表示制御部34は、利用者が各操作図像842の操作で順次に指定した各文字を領域844に表示させる。そして、文字の確定を指示する操作図像846の操作を指示受付部32が受付けた場合、楽譜画像80内の各音符図像Zの音符の音声符号X3が、領域844内の各文字に変更される。例えば、歌詞編集画像84に対する操作で利用者がn文字を指定した場合、選択状態にある1個の音符図像Zの音符を先頭とするn個の音符の各々に、利用者が指定したn文字の各々が順番に割当てられる。具体的には、表示制御部34は、編集画像81の楽譜画像80における各音符図像Zの音声符号X3(例えば旋律データQA2が指定する初期的な文字「ら」)を利用者が指定した各文字に変更し、情報管理部36は、音楽データMの各音符の音声符号X3を利用者が指定した文字に変更する。
When the user selects one note image Z (SB1: YES), the
また、利用者は、入力装置24を適宜に操作することで、編集画像81の楽譜画像80内の複数の音符図像Zのうち選択状態にある1個の音符図像Zを先頭とする複数の音符図像Zを選択することが可能である。すなわち、選択状態の音符図像Zの個数が単数から複数に変更される。編集画像81が表示されている状態で指示受付部32が複数の音符図像Zの選択(音符図像Zの選択数の変更)を受付けると、表示制御部34は、表示装置22による表示画像を編集画像81から編集画像82に変更する。
In addition, the user appropriately operates the
複数(m個)の音符図像Zの選択時(SB1:NO)に表示される歌詞編集画像86は、事前に用意された複数の候補単語WCの何れかを利用者が選択するための画面である。具体的には、第1実施形態の歌詞編集画像86は、候補リスト862を包含する。表示制御部34は、初期画像40で利用者が選択した素材データQ内の候補単語データQDを記憶装置14から取得し、候補単語データQDが指定する複数の候補単語WCを利用者による選択候補として候補リスト862に配列する。第1実施形態の表示制御部34は、候補単語データQDが指定する複数の候補単語WCのうち音符図像Zの選択数mと同数の文字数nの候補単語WCを抽出して候補リスト862に配列する。例えば、図9の例示のように3個(m=3)の音符図像Zが選択された状態では、3文字(n=m=3)で構成される複数の候補単語WCが選択候補として抽出されて候補リスト862に表示される。
The lyrics-edited
候補リスト862における候補単語WCの選択の確定を指示する操作図像864の操作を指示受付部32が受付けた場合、楽譜画像80にて選択状態にあるm個の音符図像Zの各音符の音声符号X3が、利用者により選択された候補単語WCの各文字に変更される。すなわち、選択状態にあるm個の音符図像Zの各々に、利用者が選択した候補単語WCのn個(n=m)の文字が順番に割当てられる。具体的には、表示制御部34は、編集画像82の楽譜画像80における各音符図像Zの音声符号X3(例えば旋律データQA2が指定する初期的な文字「ら」)を、利用者が選択した候補単語WCの各文字に変更し、情報管理部36は、音楽データMの各音符の音声符号X3を、利用者が選択した候補単語WCの各文字に変更する。以上の説明から理解される通り、編集画像81および編集画像82の各々の楽譜画像80では、各音符図像Zの音声符号X3も時間軸の方向に直線状に配列される。したがって、音高軸上の広範囲に各音符図像Zの音声符号X3が分布する楽譜画像62と比較して、利用者が歌詞(音声符号X3の時系列)を容易に確認できるという利点がある。
When the
利用者は、入力装置24を適宜に操作することで、編集画像81または編集画像82の楽譜画像80内の任意の音符図像Zを選択することが可能である。信号処理部38は、楽譜画像80にて利用者が選択した音符図像Zに対応する音符の音響信号Sを生成して放音装置26に供給する。具体的には、信号処理部38は、楽譜画像62内の音符図像Zの選択時と同様に、利用者が選択した音符図像Zに対応する音符の音声符号X3に応じた音声素片を当該音符の音高X1に調整することで音響信号Sを生成する。したがって、楽譜画像62内の1個の音符図像Zの選択毎に、当該音符図像Zに対応する音符の歌唱音が順次に再生される。以上の説明から理解される通り、楽譜画像80では各音符の音高X1の表示が省略される(したがって楽譜画像80のみからでは各音符の音高を確認できない)が、楽譜画像80内の各音符図像Zの選択により再生される音響を聴取することで利用者は任意の音符の音高を聴感的に確認することが可能である。
The user can select an arbitrary musical note graphic image Z in the
編集画像81または編集画像82において歌詞編集の終了を指示する操作図像802の操作を指示受付部32が受付けると、表示制御部34は、表示装置22による表示画像を編集画像81または編集画像82から編集画像60に変更する。すなわち、編集画像81や編集画像82の楽譜画像80では時間軸に沿う直線状に配列していた複数の音符図像Zが、編集画像60への変更により、各音符の音高X1に応じた音高軸上の位置に移動する。なお、編集画像81または編集画像82から編集画像60への変更時に、楽譜画像80における基準線L0上から楽譜画像62における各音符図像Zの音高軸上の位置まで各音符図像Zが連続的に移動する様子を示す動画像を表示することも可能である。
When the
図9に例示される通り、編集画像60の操作画像64は、利用者からの操作を受付ける複数の操作図像(642,644,646,648)を含んで構成される。音響信号Sの再生を指示する操作図像642の操作を指示受付部32が受付けると、信号処理部38は、現時点の音楽データMに応じた音響信号Sを生成して放音装置26に供給する。すなわち、対象楽曲の歌唱音が再生される。したがって、利用者は、対象楽曲を実際に聴取して旋律や歌詞を確認しながら、編集画像81または編集画像82に随時に移行して歌詞を編集することが可能である。表示制御部34は、対象楽曲の再生の進行に連動するように楽譜画像62内の各音符図像Zの時系列を時間軸の方向にスクロールさせる。また、表示制御部34は、操作図像644に対する操作を指示受付部32が受付けると、楽譜画像62による表示範囲を対象楽曲の先頭に変更し、操作図像646に対する操作を指示受付部32が受付けると、楽譜画像62による表示範囲を対象楽曲の末尾に変更する。
As illustrated in FIG. 9, the
操作画像64の操作図像648に対する操作を指示受付部32が受付けると、表示制御部34は、図6に例示される通り、表示装置22による表示画像を編集画像60から編集画像70に変更する。編集画像50の楽譜画像52や編集画像60の楽譜画像62では対象楽曲の一部の音符が表示されるのに対し、編集画像70は、対象楽曲の全体にわたる複数のフレーズの時系列を利用者が確認するための画面である。
When the
図6に例示される通り、編集画像70では、編集画像50にて利用者が選択した複数のフレーズ画像Gが時系列に表示される。具体的には、複数のフレーズ画像Gが複数行にわたり配列される。すなわち、各行の末尾のフレーズ画像Gの直後のフレーズ画像Gは、次行の先頭に配置される。表示制御部34は、記憶装置14内の系列データDSが指定する識別情報に対応したフレーズの画像データQA3を、系列データDSで指定される順番に配列することで編集画像70を生成して表示装置22に表示させる。また、表示制御部34は、関連データQA1が指定するフレーズの表示名(フレーズA1等)を各フレーズ画像Gの近傍に配置する。
As illustrated in FIG. 6, in the edited
利用者は、入力装置24を適宜に操作することで、編集画像70の複数のフレーズ画像Gのうち所望の1個のフレーズ画像Gを選択することが可能である。指示受付部32は、利用者によるフレーズ画像Gの選択を受付ける。表示制御部34は、入力装置24の操作面のうち特定のフレーズ画像Gに対する操作(例えばタップ操作)を指示受付部32が受付けた場合に当該フレーズ画像Gを選択状態に設定する。表示制御部34は、図6の編集画像70に例示される通り、選択状態にあるフレーズ図像Gと非選択のフレーズ画像Gとを相異なる態様(例えば選択状態のフレーズ画像Gの枠線を強調した態様)で表示するとともに、選択状態のフレーズ図像Gの近傍に操作図像72を配置する。
The user can select one desired phrase image G among the plurality of phrase images G of the edited
1個のフレーズ画像Gが選択状態に設定されると、信号処理部38は、当該フレーズ画像Gに対応するフレーズの音響信号Sを生成して放音装置26に供給する。具体的には、音楽データMのうち選択状態のフレーズに対応した区間を参照して音声素片データQCの音声素片を調整および連結するともに伴奏音データQBを混合することで音響信号Sを生成する。また、選択状態にあるフレーズ画像Gに対する操作(例えばタップ操作)を指示受付部32が受付けた場合、表示制御部34は、表示装置22による表示画像を編集画像70から編集画像60に変更し、選択状態にあるフレーズ画像Gに対応するフレーズを楽譜画像62に表示する。したがって、利用者は、対象楽曲の全体の構成(フレーズの時系列)を編集画像70で確認しながら、編集画像60に随時に移行して所望のフレーズの確認や歌詞の編集を実行することが可能である。
When one phrase image G is set to the selected state, the
利用者は、入力装置24を利用して操作図像72を操作することが可能である。操作図像72は、選択状態にあるフレーズの変更(入替)を指示するための画像である。操作図像72に対する操作を指示受付部32が受付けた場合、表示制御部34は、表示装置22による表示画像を編集画像70から編集画像50に変更し、選択状態にあるフレーズ画像Gに対応するフレーズを楽譜画像52に表示する。そして、選択画像54の任意の1個のフレーズ画像Gの選択を指示受付部32が受付けると、対象楽曲のうち編集画像70で選択された1個のフレーズ画像Gのフレーズが、選択画像54で選択されたフレーズ画像Gのフレーズに置換される。具体的には、情報管理部36は、音楽データMのうち編集画像70で選択されたフレーズに対応する区間を、選択画像54で選択されたフレーズの旋律データQA2に変更し、系列データDSにフレーズの変更を反映させる。したがって、利用者は、対象楽曲の全体の構成を編集画像70で確認しながら、随時に編集画像50に移行して任意のフレーズの各音符の確認やフレーズの変更を実行することが可能である。なお、以上の例示ではフレーズの変更を例示したが、相前後する2個のフレームの間に利用者が選択した任意のフレームを挿入することも可能である。
The user can operate the operation
図6に例示される通り、表示制御部34は、編集画像70のうち対象楽曲の末尾のフレーズのフレーズ画像Gの直後に操作図像74を配置する。操作図像74は、現段階の対象楽曲の末尾に対するフレーズの追加を指示するための画像である。操作図像74に対する操作を指示受付部32が受付けた場合、表示制御部34は、表示装置22による表示画像を編集画像70から編集画像50に変更する。そして、選択画像54内の任意の1個のフレーズ画像Gの選択を指示受付部32が受付けると、当該フレーズ画像Gに対応するフレーズが対象楽曲の末尾に追加される。具体的には、情報管理部36は、選択画像54で選択されたフレーズの旋律データQA2を音楽データMの末尾に追加し、当該フレーズの識別符号を系列データDSに追加する。なお、対象楽曲を構成するブロックの総数に上限を設定し、利用者が選択したフレーズの総数がブロックの上限数に到達した場合には操作図像74を表示しない構成(更なるフレーズの追加を禁止する構成)も採用され得る。
As illustrated in FIG. 6, the display control unit 34 arranges the operation
利用者は、入力装置24を利用して編集画像70の操作図像76(ゴミ箱)を操作することが可能である。操作図像76は、フレーズの削除を指示するための画像である。操作図像76は、編集画像70内の何れのフレーズ画像Gも選択されていない状態では操作を受付けない無効状態に維持され、編集画像70内の何れかのフレーズ画像Gが選択された場合に操作可能な有効状態に遷移する。有効状態の操作図像76に対する操作を指示受付部32が受付けた場合、選択状態にある1個のフレーズ画像Gに対応するフレーズ以降の各フレーズが対象楽曲から削除される。具体的には、表示制御部34は、選択状態にあるフレーズ画像G以降の各フレーズ画像Gを編集画像70から削除する。また、情報管理部36は、音楽データMのうち選択状態のフレーズ以降の区間を削除し、系列データDSのうち選択状態にあるフレーズ以降の各フレーズの識別符号を削除する。なお、以上の説明では、利用者が選択したフレーズ以降の各フレーズを削除したが、利用者が選択した1個のフレーズのみを対象楽曲から削除する構成(例えば以降の各フレーズを前方に繰上げる構成)も採用され得る。
The user can operate the operation iconic image 76 (trash can) of the edited
以上に説明した第1実施形態では、利用者が選択した各フレーズ画像Gに対応する複数のフレーズを時系列に配列した楽曲の音楽データMが生成されるから、対象楽曲を構成する複数の音符の各々を利用者が指定する必要はない。したがって、例えば音楽的な知識が充分でない初心者でも音楽的に適切な対象楽曲を容易に作成できるという利点がある。また、複数の音符で構成される各フレーズの選択で対象楽曲が構成されるから、楽曲の音符を1個ずつ指定する場合と比較して対象楽曲の生成の作業が簡素化されるという利点もある。 In the first embodiment described above, music data M of a song in which a plurality of phrases corresponding to each phrase image G selected by the user are arranged in time series is generated, so that a plurality of musical notes constituting the target song are generated. It is not necessary for the user to specify each of these. Therefore, for example, there is an advantage that even a beginner who does not have sufficient musical knowledge can easily create a musically appropriate target musical piece. In addition, since the target music is configured by selecting each phrase composed of a plurality of notes, there is an advantage that the work of generating the target music is simplified as compared with the case where the notes of the music are specified one by one. is there.
第1実施形態では、利用者による選択候補として表示される複数のフレーズ画像GがブロックB毎に相違する。したがって、例えば音楽的な知識が充分でない初心者でも、対象楽曲の各ブロックにとって好適なフレーズを選択できるという利点がある。また、第1実施形態では、複数の素材データQのうち利用者が選択した1個の素材データQが音楽データMや音響信号Sの生成に利用されるから、1種類の素材データQが固定的に利用される構成と比較して、利用者の意図や嗜好に合致した対象楽曲を容易に生成できるという利点がある。 In the first embodiment, a plurality of phrase images G displayed as selection candidates by the user are different for each block B. Therefore, for example, there is an advantage that even a beginner with insufficient musical knowledge can select a phrase suitable for each block of the target music. In the first embodiment, since one piece of material data Q selected by the user from among the plurality of pieces of material data Q is used for generating the music data M and the sound signal S, one type of material data Q is fixed. There is an advantage that it is possible to easily generate a target musical piece that matches the user's intention and preference as compared to a configuration that is used in general.
第1実施形態では、対象楽曲の各音符を表象する複数の音符図像Zを時間軸および音高軸のもとで配置した楽譜画像62を含む編集画像60と、楽譜画像62内の複数の音符図像Zを時間軸上に沿う直線状に配列した楽譜画像80を含む編集画像(81,82)とが選択的に表示装置22に表示される。楽譜画像62では、各音符の音高X1も含めて対象楽曲の詳細な内容を利用者が確認できる一方、楽譜画像80では、複数の音符図像Zが時間軸の方向に直線状に配列されるから、楽譜画像62と比較して対象楽曲の各音符の表示に必要な面積が削減されるという利点がある。そして、編集画像(81,82)では、楽譜画像62と比較した楽譜画像80のサイズの縮小により歌詞編集画像(84,86)のサイズが充分に確保される。したがって、歌詞編集画像(84,86)の内容の確認や操作が容易化されるという利点がある。他方、第1実施形態では、各音符図像Zの時間軸上の位置および表示長は楽譜画像80でも楽譜画像62と同様に維持されるから、各音符の発音期間X2については楽譜画像62および楽譜画像80の双方で確認することが可能である。
In the first embodiment, an edited
第1実施形態では、対象楽曲の各音符の音声符号X3を利用者が任意に指定可能な歌詞編集画像84と、楽曲の各音符の音声符号を複数の候補単語WCから利用者が選択可能な歌詞編集画像86とが選択的に表示装置22に表示される。したがって、歌詞編集画像84における任意の文字の指定で利用者の意図や嗜好を充分に反映した音声符号X3を設定できるほか、歌詞編集画像86では、所望の候補単語WCの選択により音声符号X3を容易に設定できる。第1実施形態では特に、利用者が選択した音符図像Zの個数(単数/複数)に応じて自動的に歌詞編集画像84と歌詞編集画像86とが切替えられるから、対象楽曲の歌詞を編集する利用者の負荷が軽減されるという効果は格別に顕著である。
In the first embodiment, the user can select from the plurality of candidate words WC the lyrics-edited
なお、例えば音符図像Zの選択数mとは無関係に選択された複数の候補単語WCが利用者に提示される構成では、音符図像Zの選択数mに相当する文字数の候補単語WCを利用者が自分で抽出する必要がある。第1実施形態では、音符図像Zの選択数mと同数の文字で構成される複数の候補単語WCが利用者による選択の候補として候補リスト862にて表示されるから、音符図像Zの選択数mとは無関係に複数の候補単語WCを利用者に提示する構成と比較して、対象楽曲の歌詞を編集する利用者の負荷が軽減されるという利点がある。
For example, in a configuration in which a plurality of candidate words WC selected regardless of the selection number m of the note image Z are presented to the user, the candidate words WC having the number of characters corresponding to the selection number m of the note image Z are selected by the user. Need to extract by yourself. In the first embodiment, since a plurality of candidate words WC composed of the same number of characters as the number m selected for the note image Z are displayed in the
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
Second Embodiment
A second embodiment of the present invention will be described below. In addition, about the element in which an effect | action and a function are the same as that of 1st Embodiment in each aspect illustrated below, the detailed description of each is abbreviate | omitted suitably using the code | symbol referred by description of 1st Embodiment.
第2実施形態では、編集画像60内の楽譜画像62の各音符図像Zを、利用者が入力装置24を利用して音高軸の方向に移動させることが可能である。例えば、表示制御部34は、音符図像Zに対するロングタップ操作を指示受付部32が受付けた場合に音符図像Zを移動可能な状態に遷移させ、音符図像Zに対する音高軸の方向のドラッグ操作を指示受付部32が受付けた場合に当該音符図像Zを音高軸の方向に移動させる。情報管理部36は、音楽データMのうち利用者が移動させた音符図像Zに対応する音符の音高X1を、音符図像Zの移動方向(高域側/低域側)および移動量に応じて変更する。
In the second embodiment, each musical note image Z of the
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、対象楽曲の各フレーズの音符の音高を利用者が変更できるから、利用者の意図や嗜好に合致した多様な対象楽曲を生成できるという利点がある。なお、以上の説明では、編集画像60の楽譜画像62に表示された音符図像Zの移動を例示したが、編集画像50の楽譜画像52に表示された音符図像Zを同様に移動させることも可能である。
In the second embodiment, the same effect as in the first embodiment is realized. Moreover, in 2nd Embodiment, since the user can change the pitch of the note of each phrase of an object music, there exists an advantage that the various object music corresponding to a user's intention and preference can be produced | generated. In the above description, the movement of the musical note image Z displayed on the
<第3実施形態>
図10は、第3実施形態における編集画像60内の楽譜画像62の各音符図像Zの模式図である。第3実施形態では、利用者が入力装置24の操作(例えばドラッグ操作)で複数の音符図像Zを選択する場合に、表示制御部34が、音符図像Zの選択数mを表す選択数画像66を楽譜画像62に配置する。選択数画像66は、利用者による音符図像Zの選択毎に順次に追加される。具体的には、図10に例示される通り、利用者が1個の音符図像Zを選択した状態では選択数「1」を意味する選択数画像66が音符図像Zの近傍に配置され、利用者が引続き第2個目の音符図像Zを選択すると、選択数「2」を意味する選択数画像66が第2個目の音符図像Zの近傍に配置される。また、利用者が第3個目の音符図像Zを選択すると、選択数「3」を意味する選択数画像66が第3個目の音符図像Zの近傍に配置される。音符図像Zの選択後の動作は第1実施形態と同様である。例えば、歌詞編集画像86では、音符図像Zの選択数mと同数の文字で構成される複数の候補単語WCが候補リスト862に配列される。
<Third Embodiment>
FIG. 10 is a schematic diagram of each musical note image Z of the
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、利用者による音符図像Zの選択数mを表す選択数画像66が表示装置22に表示されるから、選択状態にある音符図像Zの個数を利用者が容易に確認できるという利点がある。音符図像Zの選択数mと同数の文字で構成される候補単語WCが利用者による選択候補となる前述の構成では、音符図像Zの個数を利用者が正確に確認する必要があるから、選択数画像66を表示する第3実施形態は格別に好適である。また、タッチパネルを入力装置24として利用する構成では、利用者の指の背後に各音符図像Zが隠れ、各音符図像Zの選択/非選択を充分に確認できない場合がある。第3実施形態では、音符図像Zの選択数を示す選択数画像66が音符図像Zとは別個に表示されるから、音符図像Zを充分に視認できない状況でも利用者が音符図像Zの選択数mを把握できるという利点がある。
In the third embodiment, the same effect as in the first embodiment is realized. In the third embodiment, since the
<第4実施形態>
第1実施形態では、編集画像60の表示中に対象楽曲の再生が指示(操作図像642が操作)された場合に、対象楽曲の音響信号Sを再生するとともに再生の進行に連動するように楽譜画像62内の各音符図像Zの時系列を時間軸の方向にスクロールさせた。第4実施形態では、各音符図像Zの時間軸の方向のスクロールに加え、対象楽曲の再生に連動して楽譜画像62内の各音符図像Zの時系列を音高軸の方向にもスクロールさせる。
<Fourth embodiment>
In the first embodiment, when the reproduction of the target music is instructed while the edited
図11は、対象楽曲の再生中における楽譜画像62の遷移の説明図である。図11では、3個の音符図像Z(Z1〜Z3)で表象される旋律が例示されている。楽譜画像62の複数の音符図像Zの時系列のうち再生中の時点が再生点Pで指示されるように、複数の音符図像Zの時系列は対象楽曲の再生とともに時間軸の方向にスクロールされる。図11の基準位置Rは、表示装置22の表示面における縦方向(音高軸に平行な方向)の所定の位置である。
FIG. 11 is an explanatory diagram of the transition of the
図11に例示される通り、音符図像Z1の音符の再生中(音符図像Z1と再生点Pとが時間軸上で重複する期間内)では、当該音符図像Z1が基準位置Rに位置するように複数の音符図像Zの音高軸の方向の表示位置が選定される。また、音符図像Z2の音符の再生中には音符図像Z2が基準位置Rに位置し、音符図像Z3の音符の再生中には音符図像Z3が基準位置Rに位置する。以上の説明から理解される通り、再生中の音符の音符図像Zが音高軸の方向で基準位置Rに位置するように、対象楽曲の再生の進行に連動して各音符図像Zが音高軸の方向にスクロールされる。 As illustrated in FIG. 11, during the reproduction of the musical note of the musical note image Z1 (within the period in which the musical note graphic image Z1 and the reproduction point P overlap on the time axis), the musical note graphic image Z1 is positioned at the reference position R. A display position in the direction of the pitch axis of the plurality of musical note graphic images Z is selected. Further, the note image Z2 is positioned at the reference position R during the reproduction of the note image Z2, and the note image Z3 is positioned at the reference position R during the reproduction of the note image Z3. As understood from the above description, each musical note image Z is pitched in conjunction with the progress of the reproduction of the target music so that the musical note image Z of the note being played is positioned at the reference position R in the direction of the pitch axis. Scroll in the direction of the axis.
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、再生中の音符の音符図像Zが基準位置Rに位置するから、楽譜画像62内の複数の音符図像Zのうち再生中の音符に対応する1個の音符図像Zを利用者が容易に把握できるという利点がある。なお、以上の例示では楽譜画像62を例示したが、楽譜画像52内の各音符図像Zについても同様の構成が採用される。
In the fourth embodiment, the same effect as in the first embodiment is realized. In the fourth embodiment, since the musical note image Z of the note being played is located at the reference position R, one musical note image Z corresponding to the musical note being played out of the plurality of musical note images Z in the
<変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
<Modification>
Each of the above forms can be variously modified. Specific modifications are exemplified below. Two or more modes arbitrarily selected from the following examples can be appropriately combined.
(1)前述の各形態では、編集画像50の選択画像54内や編集画像70内の各フレーズ画像Gの近傍にフレーズの表示名を配置したが、フレーズ画像Gとともに表示される情報(以下「フレーズ情報」という)はフレーズの表示名に限定されない。例えば、「はじまりのフレーズ」「つなぎのフレーズ」「おわりのフレーズ」等の言葉(楽曲内での各フレーズの音楽的な意義)や、各フレーズのコード進行、フレーズの各音符に設定された音声符号X3(歌詞)を、フレーズ情報としてフレーズ画像Gの近傍に表示する構成も採用され得る。また、前述の各形態では、編集画像50の選択画像54内や編集画像70内の各フレーズ画像Gの近傍にフレーズ情報を固定的に表示したが、選択状態にあるフレーズ画像Gについてフレーズ情報を一時的に表示(ポップアップ表示)する構成も採用される。
(1) In each of the above-described embodiments, the phrase display name is arranged in the vicinity of each phrase image G in the selected
(2)前述の各形態では、1個のフレーズの全体にわたる音符の時系列を表象するフレーズ画像Gを例示したが(図4)、フレーズ画像Gの内容は以上の例示に限定されない。例えば、1個のフレーズの特定の区間(例えば先頭部分)の音符の時系列を表象するフレーズ画像Gを表示することも可能である。また、前述の各形態では、事前に用意された固定の画像をフレーズ画像Gとして利用したが、例えば音楽データMの内容に応じてフレーズ画像Gを動的に変更することも可能である。具体的には、第2実施形態の例示のように利用者からの指示に応じて各音符の音高X1が変更される構成では、各音符の音高X1の変更がフレーズ画像Gに反映される。すなわち、フレーズ画像Gの各音符に対応する音符図像Zの音高軸上の位置が、当該音符の音高X1に応じて変更される。 (2) In each of the above-described embodiments, the phrase image G that represents the time series of musical notes over one phrase is illustrated (FIG. 4), but the content of the phrase image G is not limited to the above examples. For example, it is also possible to display a phrase image G that represents a time series of notes in a specific section (for example, the head portion) of one phrase. In each of the above-described embodiments, a fixed image prepared in advance is used as the phrase image G. However, for example, the phrase image G can be dynamically changed according to the contents of the music data M. Specifically, in the configuration in which the pitch X1 of each note is changed according to an instruction from the user as illustrated in the second embodiment, the change in the pitch X1 of each note is reflected in the phrase image G. The That is, the position on the pitch axis of the note image Z corresponding to each note of the phrase image G is changed according to the pitch X1 of the note.
(3)編集画像の表示に利用される画像(例えばアニメキャラクタ等の画像)の画像データ(以下「演出画像データ」という)を素材データQに包含させることも可能である。具体的には、編集画像50の楽譜画像52や編集画像60の楽譜画像62において各音符図像Zの背景画像が演出画像データで指定される。また、編集画像50の選択画像54や編集画像70に表示される各フレーズ画像Gにおける音符図像Zの背景画像が演出画像データで指定される。
(3) Image data (hereinafter referred to as “effect image data”) of an image (for example, an image such as an animation character) used for displaying an edited image can be included in the material data Q. Specifically, in the
(4)前述の各形態では、相異なるフレーズに対応する複数の単位データUが事前に複数のブロックBに区分された構成を例示したが、各ブロックBに属する単位データUを動的に変更することも可能である。具体的には、任意の1個のブロックBについて利用者が選択したフレーズに応じて直後のブロックBの選択候補となるフレーズを変化させる構成が採用される。例えば、1個のブロックについて利用者が選択したフレーズに対して音楽的に調和し得るフレーズが直後のブロックにおける選択候補のフレーズとして抽出(絞込)される。また、編集画像50の選択画像54における複数のフレーズ画像Gの配列の順序を適宜に変更することも可能である。例えば、1個のブロックについて利用者が選択したフレーズに対する音楽的な調和の度合に応じた順序で、直後のブロックのフレーズの選択候補となる複数のフレーズ画像Gが選択画像54に配列される。
(4) In each of the above-described embodiments, the configuration in which a plurality of unit data U corresponding to different phrases is divided into a plurality of blocks B in advance is exemplified, but the unit data U belonging to each block B is dynamically changed. It is also possible to do. Specifically, a configuration is adopted in which a phrase that is a selection candidate of the immediately following block B is changed according to a phrase selected by the user for any one block B. For example, a phrase that can be musically harmonized with a phrase selected by the user for one block is extracted (squeezed) as a selection candidate phrase in the immediately following block. It is also possible to appropriately change the order of arrangement of the plurality of phrase images G in the selected
(5)編集画像81または編集画像82において、楽譜画像80に表示された音符図像Zが各音符の前後の音符の音声符号X3を表示(例えばポップアップ表示)することも可能である。例えば、図12に例示される通り、「あるはれたひに(或る晴れた日に)」という歌詞のうち「はれた」に対応する3個の音符の音符図像Zを楽譜画像80に表示した状況を想定する。表示制御部34は、楽譜画像80内に表示された音符図像Zの音符の直前に位置する各音符の音声符号「ある」を含む補助画像88と、直後の各音符の音声符号「ひに」を含む補助画像88とを楽譜画像80内に表示する。以上の構成によれば、前後の音符の音声符号X3を各補助画像88で確認しながら楽譜画像80内の各音符の音声符号X3を指定できるという利点がある。なお、補助画像88で音声符号X3が表示される音符の範囲は任意である。例えば、前後の所定個の音符にわたる音声符号X3を補助画像88で表示する構成や、対象楽曲の全部にわたる音声符号X3を補助画像88で表示する構成が採用される。
(5) In the edited
(6)前述の各形態では、音符図像Zの選択数mと同数の文字で構成される複数の候補単語WCを候補リスト862に配列したが、候補リスト862に配列される候補単語WCの条件は以上の例示に限定されない。例えば、複数の候補単語WCのうち各音符の音高X1の遷移に類似する抑揚で発音される候補単語WCを優先的に候補リスト862に配置する構成が採用される。具体的には、候補単語WCの抑揚のデータを候補単語WC毎に候補単語データQDに設定し、楽譜画像80にて選択された各音符図像Zの音符の音高X1の遷移に類似する抑揚の候補単語WCを優先的に候補リスト862に配置する構成が採用される。また、楽譜画像80にて利用者が選択した各音符図像Zの前後の歌詞に関連する候補単語WCを優先的に候補リスト862に配置することも可能である。過去の文字入力の履歴から利用者が入力する単語を予測する入力予測機能(予測変換機能)が搭載された携帯電話機等の情報処理装置で音響処理装置100を実現する場合には、利用者による入力の頻度が高い単語を候補単語WCとして候補リスト862に配列する構成も採用される。また、前述の各形態では、音符図像Zの選択数mと文字数nが共通する1個の候補単語WCを抽出して利用者に提示したが、文字数nの合計が音符図像Zの選択数mとなるように複数の候補単語WCの組合せを抽出して利用者に提示することも可能である。例えば、利用者が10個の音符図像Zを選択した場合には、6文字の1個の候補単語WCと4文字の1個の候補単語WCとの組合せや、3文字の2個の候補単語WCと4文字の1個の候補単語WCとの組合せが利用者に提示される。
(6) In each of the above embodiments, a plurality of candidate words WC composed of the same number of characters as the selected number m of the musical note images Z are arranged in the
(7)複数の音符図像Zを楽譜画像80にて時間軸の方向に直線状に配列することで確保された領域に配置される画像は歌詞編集画像(84,86)に限定されない。例えば図13に例示される通り、歌詞編集画像84や歌詞編集画像86に代えて(または歌詞編集画像84や歌詞編集画像86とともに)、各音符の制御変数XCを利用者が編集するための変数編集画像89を楽譜画像80とともに表示装置22に表示させることも可能である。制御変数XCは、音楽データMにて音符毎に指定され、例えば音響信号Sの再生音に付与される音楽的な表情を制御するための変数である。具体的には、発音の強弱(ベロシティ)、音量(ダイナミクス)、発音後の音高の微小変化(ピッチベンド)、ビブラート、音色(例えば明瞭度等)等の変数が制御変数XCとして好適である。
(7) Images arranged in a region secured by arranging a plurality of musical note graphic images Z linearly in the direction of the time axis in the
図13に例示された変数編集画像89は、各音符の制御変数XCの時間変化を棒グラフで表現した画像である。変数編集画像89に対する利用者からの操作を指示受付部32が受付けると、表示制御部34は利用者からの指示に応じて変数編集画像89を更新し、情報管理部36は利用者からの指示に応じて音楽データMの制御変数XCを更新する。なお、図13では制御変数XCの時間変化を棒グラフで表現したが、制御変数XCの時間変化を折線グラフで表現することも可能である。前述の各形態で例示した歌詞編集画像(84,86)や図13に例示した変数編集画像89は、対象楽曲の各音符の属性(音声符号X3や制御変数XC)を利用者が編集するための画像(属性編集画像)として包括的に表現される。
The variable
以上の例示から理解される通り、楽譜画像80とともに表示される画像の内容は任意である。また、楽譜画像80とともに特定の画像を表示する構成を想定しなくても、楽譜画像62の複数の音符図像Zを時間軸に沿う直線状に配列するという構成さえ採用すれば、対象楽曲の各音符の表示に必要な面積を削減するという前述の効果は実現される。
As understood from the above examples, the content of the image displayed together with the
(8)編集画像70の表示態様は以上の例示に限定されない。具体的には、対象楽曲の各フレーズの状態(編集済/未編集)に応じて各フレーズ画像Gの表示態様(色彩や形状等の視覚的に知覚可能な性状)を相違させる構成が採用される。例えば、編集画像70内の複数のフレーズ画像Gのうち利用者が各音符の音声符号X3(歌詞)を変更したフレーズと他のフレーズとでフレーズ画像Gの表示態様を相違させる構成が好適である。また、第2実施形態では、利用者が各音符の音高X1を変更したフレーズと他のフレーズとでフレーズ画像Gの表示態様を相違させることも可能である。
(8) The display mode of the edited
編集画像70に対する所定の操作を指示受付部32が受付けた場合に信号処理部38が対象楽曲の音響信号Sを生成することも可能である。以上の構成において、表示制御部34は、音響信号Sによる再生中のフレーズと他のフレーズとでフレーズ画像Gの表示態様が相違するように、各フレーズ画像Gの表示態様を音響信号Sの再生の進行とともに順次に変更する。
When the
(9)前述の各形態では、音高軸の方向における各音符図像Zの分布範囲を楽譜画像62と比較して縮小した楽譜画像80を例示したが(図9)、時間軸の方向における各音符図像Zの分布範囲を縮小することも可能である。例えば、図14に例示される通り、音高軸および時間軸が設定された領域内に複数の音符図像Zを配置した楽譜画像62を想定する。入力装置24に対する所定の操作(楽譜画像62の縮小の指示)を指示受付部32が受付けると、表示制御部34は、表示装置22による表示画像を、楽譜画像62から図14の楽譜画像90に変更する。
(9) In each of the above embodiments, the
楽譜画像90では、音高軸の方向における各音符図像Zの位置を維持したまま、時間軸上の各音符図像Zの位置を無視して各音符図像を横方向に移動させることで、複数の音符図像Zの横方向の分布範囲が楽譜画像62と比較して縮小される。すなわち、楽譜画像62から楽譜画像90への変更で画像の横方向のサイズが縮小される。楽譜画像62から楽譜画像90への変更による画像の縮小で確保された領域92には、例えば、各音符図像Zで表象される音符の音響特性を調整するための画像等の各種の画像が表示される。楽譜画像90では、楽譜画像62内の各音符図像Zが、時間軸上の位置を無視して相互に近接した位置に移動されるから、複数の音符図像Zが時間軸上の広範囲に分布する構成と比較して、特定の音高X1(または音高軸上の範囲)に属する複数の音符図像Zを利用者が一括的に選択できるという利点がある。なお、図14では、各音符図像Zが横方向に重複しない楽譜画像90を例示したが、例えば図15に例示される通り、音高X1が共通する複数の音符の音符図像Zを相互に重複して表示することも可能である。
In the
(10)前述の各形態では、信号処理部38が、複数の音声素片を時間軸上で連結する素片接続型の音声合成で音響信号Sを生成する構成を例示したが、音響信号Sの生成方法は以上の例示に限定されない。例えば、隠れマルコフモデル等の確率モデルを利用した音声合成で信号処理部38が音響信号Sを生成することも可能である。したがって、素材データQの音声素片データQCは省略され得る。また、信号処理部38による生成対象は歌唱音の音響信号Sには限定されない。具体的には、対象楽曲を各種の楽器で演奏した演奏音の音響信号Sを生成することも可能である。例えば、信号処理部38は、楽器の演奏音の時間波形を音楽データMに応じて時間軸上で相互に連結することで音響信号Sを生成する。
(10) In each of the above-described embodiments, the
(11)前述の各形態では、日本語の音声の合成を例示したが、合成対象となる音声の言語は任意であり、日本語には限定されない。例えば、英語,スペイン語,中国語,韓国語等の任意の言語の音声を生成する場合にも以上の各形態を同様に適用することが可能である。前述の各形態では日本語の歌詞の1文字を1個の音符(音符図像Z)に割当てたが、音声単位(分節単位)と音符との対応関係は以上の例示に限定されず、例えば言語体系に応じて適宜に変更される。例えば、英語の単語“September”を3個の音節“Sep-tem-ber”に区分して3個の音符に割当てることが可能である。複数の音節が1個の音符に割当てられる場合や1個の音節が複数の音符に割当てられる場合もあり得る。 (11) In the above-described embodiments, the synthesis of Japanese speech has been exemplified, but the language of speech to be synthesized is arbitrary and is not limited to Japanese. For example, the above embodiments can be similarly applied to the case of generating speech in an arbitrary language such as English, Spanish, Chinese, or Korean. In each of the above-described embodiments, one character of Japanese lyrics is assigned to one note (note image Z). However, the correspondence between a voice unit (segment unit) and a note is not limited to the above examples. It is changed appropriately according to the system. For example, the English word “September” can be divided into three syllables “Sep-tem-ber” and assigned to three notes. There may be a case where a plurality of syllables are assigned to one note, or a syllable is assigned to a plurality of notes.
また、前述の各形態では、利用者による音符図像Zの選択数mと同数の文字で構成される候補単語WCを利用者に提示したが、利用者に提示される候補単語WCの選定の基準は文字数に限定されず、例えば言語体系等の事情に応じて適宜に変更される。例えば、音符図像Zの選択数mと同数の音節で構成された候補単語WCを利用者に提示することも可能である。以上の説明から理解される通り、選択数mと同数の文字で構成される候補単語WCを利用者に提示する構成は、選択数mに応じた個数の分節単位(典型的には文字や音節)で構成される候補単語WCを利用者に提示する構成として包括的に表現される。 In each of the above-described embodiments, the candidate word WC composed of the same number of characters as the number m of the musical note image Z selected by the user is presented to the user. Is not limited to the number of characters, and may be changed as appropriate according to circumstances such as language system. For example, it is possible to present to the user the candidate word WC composed of the same number of syllables as the selected number m of the musical note image Z. As understood from the above description, the configuration in which the candidate word WC composed of the same number of letters as the selected number m is presented to the user is the number of segment units (typically letters and syllables) corresponding to the selected number m. ) Is comprehensively expressed as a configuration in which the candidate word WC is configured to be presented to the user.
100……音響処理装置、12……演算処理装置、14……記憶装置、22……表示装置、24……入力装置、26……放音装置、32……指示受付部、34……表示制御部、36……情報管理部、38……信号処理部。
DESCRIPTION OF
Claims (7)
前記第1楽譜画像と前記第2楽譜画像との各々に表示される前記各音符図像には、音声符号が付加される
楽曲表示装置。 A first musical score image in which a plurality of musical note images representing each musical note constituting a musical piece are arranged in a region in which a time axis and a pitch axis are set, and a plurality of musical note graphic images in the first musical score image, respectively and a second score image arranged in a straight line along the time axis while maintaining the position on the time axis, comprising a display control means for selectively displayed on the display device,
A music display device in which a sound code is added to each musical note graphic image displayed on each of the first musical score image and the second musical score image .
前記表示制御手段は、楽曲を構成する各音符の音声符号を利用者が指示するための歌詞編集画像を前記第2楽譜画像とともに前記表示装置に表示させる
楽曲表示装置。 A first musical score image in which a plurality of musical note images representing each musical note constituting a musical piece are arranged in a region in which a time axis and a pitch axis are set, and a plurality of musical note graphic images in the first musical score image, respectively Display control means for selectively displaying on the display device the second musical score image arranged linearly along the time axis while maintaining the position on the time axis of
The display control means causes the display device to display a lyrics-edited image for the user to specify the voice code of each note constituting the music together with the second score image
Easy music display apparatus.
請求項2の楽曲表示装置。 The display control means allows the user to select a first lyrics-edited image that allows the user to specify the voice code of each note constituting the music and a voice code across a plurality of notes constituting the music from a plurality of candidate words. The music display device according to claim 2, wherein a possible second lyrics edited image is selectively displayed on the display device as the lyrics edited image.
前記表示制御手段は、前記指示受付手段が1個の音符図像の選択を受付けた場合には前記第1歌詞編集画像を表示させ、前記指示受付手段が複数の音符図像の選択を受付けた場合には前記第2歌詞編集画像を表示させる
請求項3の楽曲表示装置。 Comprising an instruction accepting means for accepting selection of one or more of the musical note graphic images by a user;
The display control means displays the first lyrics-edited image when the instruction accepting means accepts selection of one note graphic image, and displays when the instruction accepting means accepts selection of a plurality of note graphic images. The music display device according to claim 3, wherein the second lyrics edited image is displayed.
請求項4の楽曲表示装置。 In the second lyric editing image, the display control means sets a plurality of candidate words composed of a number of segment units corresponding to the number of note images received by the instruction receiving means as candidates for selection by the user. The music display device according to claim 4, which is displayed on the display device.
前記第1楽譜画像と前記第2楽譜画像との各々に表示される前記各音符図像には、音声符号が付加される A voice code is added to each musical note graphic image displayed in each of the first musical score image and the second musical score image.
楽曲表示方法。 Music display method.
前記表示制御ステップでは、楽曲を構成する各音符の音声符号を利用者が指示するための歌詞編集画像を前記第2楽譜画像とともに前記表示装置に表示させる In the display control step, a lyrics-edited image for the user to specify the voice code of each note constituting the music is displayed on the display device together with the second score image.
楽曲表示方法。 Music display method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013135810A JP6255744B2 (en) | 2013-06-28 | 2013-06-28 | Music display device and music display method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013135810A JP6255744B2 (en) | 2013-06-28 | 2013-06-28 | Music display device and music display method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015011147A JP2015011147A (en) | 2015-01-19 |
JP6255744B2 true JP6255744B2 (en) | 2018-01-10 |
Family
ID=52304370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013135810A Active JP6255744B2 (en) | 2013-06-28 | 2013-06-28 | Music display device and music display method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6255744B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017139433A (en) * | 2016-02-05 | 2017-08-10 | 大日本印刷株式会社 | Through electrode substrate and method for manufacturing the same |
JP2019066649A (en) | 2017-09-29 | 2019-04-25 | ヤマハ株式会社 | Method for assisting in editing singing voice and device for assisting in editing singing voice |
JP7243418B2 (en) * | 2019-04-26 | 2023-03-22 | ヤマハ株式会社 | Lyrics input method and program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3250559B2 (en) * | 2000-04-25 | 2002-01-28 | ヤマハ株式会社 | Lyric creating apparatus, lyrics creating method, and recording medium storing lyrics creating program |
JP3620409B2 (en) * | 2000-05-25 | 2005-02-16 | ヤマハ株式会社 | Mobile communication terminal device |
JP2002149156A (en) * | 2000-11-14 | 2002-05-24 | Sankyo Seiki Mfg Co Ltd | Music score for simple player and notation method of music |
JP4099651B2 (en) * | 2002-09-20 | 2008-06-11 | ヤマハ株式会社 | Facial expression parameter editing device and program for realizing facial expression parameter editing method |
JP4501417B2 (en) * | 2003-11-18 | 2010-07-14 | ヤマハ株式会社 | Music score display apparatus and program for realizing music score display method |
JP6070010B2 (en) * | 2011-11-04 | 2017-02-01 | ヤマハ株式会社 | Music data display device and music data display method |
-
2013
- 2013-06-28 JP JP2013135810A patent/JP6255744B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015011147A (en) | 2015-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6070010B2 (en) | Music data display device and music data display method | |
JP6236765B2 (en) | Music data editing apparatus and music data editing method | |
JP4735544B2 (en) | Apparatus and program for singing synthesis | |
JP6465136B2 (en) | Electronic musical instrument, method, and program | |
EP3273441B1 (en) | Sound control device, sound control method, and sound control program | |
JPH0944171A (en) | Karaoke device | |
CN111696498B (en) | Keyboard musical instrument and computer-implemented method of keyboard musical instrument | |
JP6507579B2 (en) | Speech synthesis method | |
JP5625321B2 (en) | Speech synthesis apparatus and program | |
JP5423375B2 (en) | Speech synthesizer | |
JP6255744B2 (en) | Music display device and music display method | |
JP6179221B2 (en) | Sound processing apparatus and sound processing method | |
JP6136202B2 (en) | Music data editing apparatus and music data editing method | |
JP2000315081A (en) | Device and method for automatically composing music and storage medium therefor | |
JP2008039833A (en) | Voice evaluation apparatus | |
JP6044284B2 (en) | Speech synthesizer | |
JP5157922B2 (en) | Speech synthesizer and program | |
JP5176981B2 (en) | Speech synthesizer and program | |
JP6992894B2 (en) | Display control method, display control device and program | |
JP5552797B2 (en) | Speech synthesis apparatus and speech synthesis method | |
JP5790860B2 (en) | Speech synthesizer | |
JP7456430B2 (en) | Information processing device, electronic musical instrument system, electronic musical instrument, syllable progression control method and program | |
US20230244646A1 (en) | Information processing method and information processing system | |
JP4432834B2 (en) | Singing composition device and singing composition program | |
JP4508196B2 (en) | Song editing apparatus and song editing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171120 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6255744 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |