JP2023067363A - Information processing apparatus, retrieval method, and program - Google Patents

Information processing apparatus, retrieval method, and program Download PDF

Info

Publication number
JP2023067363A
JP2023067363A JP2021178518A JP2021178518A JP2023067363A JP 2023067363 A JP2023067363 A JP 2023067363A JP 2021178518 A JP2021178518 A JP 2021178518A JP 2021178518 A JP2021178518 A JP 2021178518A JP 2023067363 A JP2023067363 A JP 2023067363A
Authority
JP
Japan
Prior art keywords
phrase
music
lyrics
query
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021178518A
Other languages
Japanese (ja)
Inventor
浩之 菅家
Hiroyuki Sugaya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AlphaTheta Corp
Original Assignee
AlphaTheta Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AlphaTheta Corp filed Critical AlphaTheta Corp
Priority to JP2021178518A priority Critical patent/JP2023067363A/en
Publication of JP2023067363A publication Critical patent/JP2023067363A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide an information processing apparatus which retrieves desired music in accordance with a purpose of retrieval, a retrieval method, and a program.SOLUTION: In an information processing apparatus 100, a control unit includes: an input unit which inputs a phrase to be retrieved, and a query related to lyric of music; and a retrieval unit which refers to a database in which music, a lyric of the music, and time information related to the lyric are stored in association with each other, to retrieve, from the database, music including the phrase to be retrieved in a lyric, in accordance with the query. The query includes at least one of information indicating a length of sound-producing time of a phrase and BPM of music. The time information includes at least one of time information for each element of a lyric, information indicating a beat position or bar position of a phrase, and information indicating a breath position regarding the phrase. The query includes information on a genre of music. The retrieval unit retrieves music in accordance with the genre.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置、検索方法、およびプログラムに関する。 The present invention relates to an information processing device, a search method, and a program.

近年、インターネットを利用した楽曲配信が一般的になり、様々な関連技術が考えられている。例えば、特許文献1には、歌詞に含まれるワードを用いて所望の楽曲を検索することのできる楽曲検索装置が開示されている。 In recent years, music distribution using the Internet has become common, and various related techniques have been considered. For example, Patent Literature 1 discloses a music search device capable of searching for desired music using words included in lyrics.

特開2002-123270号公報Japanese Patent Application Laid-Open No. 2002-123270

楽曲の検索に関しては、単純に所望の楽曲を検索するだけでなく、リコメンドの用途での検索、様々な目的に応じた検索等、多岐にわたる要望がある。
そこで、本発明は、検索の目的に応じて、所望の楽曲を検索することが可能な情報処理装置、検索方法、およびプログラムを提供することを目的とする。
Regarding music searches, there are a wide variety of demands, such as not only searching for desired music, but also searching for recommendations, searching for various purposes, and the like.
SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide an information processing apparatus, a search method, and a program capable of searching for a desired piece of music according to the purpose of the search.

[1]検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、楽曲と、楽曲の歌詞と、歌詞に関する時間情報 とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する検索部とを備える情報処理装置。
[2]クエリは、フレーズの発音時間の長さを示す情報と、楽曲のBPMとの少なくとも一方を含む、[1]に記載の情報処理装置。
[3]時間情報は、歌詞の要素ごとの時間情報 、フレーズに関する拍位置または小節位置を示す情報 、フレーズに関するブレス位置を示す情報のうち、少なくとも1つを含む、[1]または[2]に記載の情報処理装置。
[4]クエリは、楽曲のジャンルに関する情報を含み、検索部は、ジャンルに応じて楽曲を検索する、[1]から[3]のいずれかに記載の情報処理装置。
[5]検索対象のフレーズは、複数の品詞を含み、検索部は、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を検索する、[1]から[4]のいずれかに記載の情報処理装置。
[6]検索部により検索した楽曲を出力する出力部をさらに備える、[1]から[5]のいずれかに記載の情報処理装置。
[7]クエリに応じて、検索部により検索した楽曲を加工する加工部をさらに備える、[1]から[5]のいずれに記載の情報処理装置。
[8]加工部は、クエリに応じて、検索部により検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す、[7]に記載の情報処理装置。
[9]加工部は、クエリに応じて、検索部により検索した楽曲のBPMを変更する、[7]または[8]に記載の情報処理装置。
[10]加工部により加工した楽曲を出力する出力部をさらに備える、[7]から[9]のいずれかに記載の情報処理装置。
[11]データベースから楽曲を検索する検索方法であって、データベースは、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶され、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力するステップと、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索するステップとを含む検索方法。
[12]検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する検索部としてコンピュータを機能させるためのプログラム。
[1] An input unit for inputting a phrase to be searched and a query related to the lyrics of a song, and referring to a database in which the song, the lyrics of the song, and time information related to the lyrics are stored in association with each other. an information processing apparatus comprising: a search unit that searches for songs containing a search target phrase in lyrics in response to a query.
[2] The information processing device according to [1], wherein the query includes at least one of information indicating the length of pronunciation time of the phrase and the BPM of the music.
[3] The time information includes at least one of time information for each element of the lyrics, information indicating the beat position or bar position regarding the phrase, and information indicating the breath position regarding the phrase. The information processing device described.
[4] The information processing device according to any one of [1] to [3], wherein the query includes information about the genre of music, and the search unit searches for music according to the genre.
[5] Any of [1] to [4], wherein the phrase to be searched includes multiple parts of speech, and the search unit searches for songs containing lyrics for each part of speech or at least part of a plurality of parts of speech. The information processing device according to .
[6] The information processing apparatus according to any one of [1] to [5], further comprising an output unit that outputs songs searched by the search unit.
[7] The information processing device according to any one of [1] to [5], further comprising a processing unit that processes the music searched by the search unit according to the query.
[8] The information processing device according to [7], wherein the processing unit cuts out, in response to the query, a portion containing the search target phrase from the music searched by the search unit.
[9] The information processing device according to [7] or [8], wherein the processing unit changes the BPM of the music searched by the search unit according to the query.
[10] The information processing apparatus according to any one of [7] to [9], further comprising an output unit that outputs music processed by the processing unit.
[11] A search method for searching for a song from a database, wherein the database stores songs, lyrics of the songs, and time information about the lyrics in association with each other, phrases to be searched, and queries related to the lyrics of the songs. and searching a database for songs whose lyrics include the phrase to be searched according to the query.
[12] By referring to an input unit for inputting a phrase to be searched and a query related to the lyrics of a song, and a database in which the song, the lyrics of the song, and time information related to the lyrics are stored in association with each other; , a program for causing a computer to function as a search unit that searches for songs that include a search target phrase in the lyrics in response to a query.

本発明の一実施形態に係る情報処理装置の概略的な機能構成を示すブロック図である。1 is a block diagram showing a schematic functional configuration of an information processing device according to one embodiment of the present invention; FIG. 楽曲の歌詞に関する時間情報を説明するための図である。FIG. 4 is a diagram for explaining time information related to lyrics of music; 本発明の一実施形態に係る検索方法を示すフローチャートである。4 is a flow chart illustrating a search method according to an embodiment of the present invention; 本発明の一実施形態に係る検索方法を示すフローチャート(続き)である。FIG. 5 is a flowchart (continued) showing a search method according to an embodiment of the present invention; FIG. クエリに含まれる区切り位置の解析について説明するための図である。FIG. 10 is a diagram for explaining analysis of delimiter positions included in a query; 検索対象のフレーズが複数の品詞を含む場合の検索について説明するための図である。FIG. 10 is a diagram for explaining retrieval when a phrase to be retrieved includes multiple parts of speech;

以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Preferred embodiments of the present invention will be described in detail below with reference to the accompanying drawings. In the present specification and drawings, constituent elements having substantially the same functional configuration are denoted by the same reference numerals, thereby omitting redundant description.

図1は、本発明の一実施形態に係る情報処理装置の概略的な機能構成を示すブロック図である。本発明の一実施形態に係る情報処理装置は、コンピュータにより構成される情報処理装置である。
図1に示されるように、情報処理装置100は、ディスプレイ110と、操作部120と、制御部130と、データベース140とを含む。上記の各部の機能は、例えばコンピュータのハードウェア構成を備える情報処理装置100において、プロセッサがプログラムに従って動作することによって実現される。本発明の一実施形態に係る情報処理装置100は、ユーザー操作に基づいて、ユーザーの所望のフレーズを含む楽曲を検索する。
以下、各部の機能についてさらに説明する。
FIG. 1 is a block diagram showing a schematic functional configuration of an information processing apparatus according to one embodiment of the present invention. An information processing apparatus according to an embodiment of the present invention is an information processing apparatus configured by a computer.
As shown in FIG. 1 , information processing apparatus 100 includes display 110 , operation unit 120 , control unit 130 , and database 140 . The functions of the respective units described above are realized, for example, by the processor operating according to a program in the information processing apparatus 100 having a computer hardware configuration. The information processing apparatus 100 according to one embodiment of the present invention searches for songs containing phrases desired by the user based on user operations.
The function of each unit will be further described below.

ディスプレイ110は、情報処理装置100における各種の情報を含む画面を表示する表示装置である。ディスプレイ110としては、液晶表示装置、有機EL表示装置等、各種方式の表示装置を採用できる。
操作部120は、キーボードやマウス等の入力装置を備える。
The display 110 is a display device that displays a screen including various types of information in the information processing device 100 . As the display 110, various types of display devices such as a liquid crystal display device and an organic EL display device can be used.
The operation unit 120 includes input devices such as a keyboard and a mouse.

制御部130は、例えば通信インターフェース、CPU(Central Processing Unit)等のプロセッサ、及び、作業領域となるメモリーによって情報処理装置100に実装され、情報処理装置100の動作を制御する。制御部130は、プロセッサがメモリーに格納された、又は通信インターフェースを介して受信されたプログラムに従って動作することによって実現される入力部131と、検索部132と、加工部133と、出力部134とを含む。 The control unit 130 is implemented in the information processing apparatus 100 by, for example, a communication interface, a processor such as a CPU (Central Processing Unit), and a memory serving as a work area, and controls the operation of the information processing apparatus 100 . The control unit 130 includes an input unit 131, a search unit 132, a processing unit 133, and an output unit 134, which are implemented by the processor operating according to a program stored in a memory or received via a communication interface. including.

入力部131は、操作部120を介したユーザー操作に基づいて、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する。
検索対象のフレーズは、ユーザーが所望する歌詞を示すフレーズである。また、楽曲の歌詞に関連するクエリは、上述した検索対象のフレーズに関する付帯的な検索条件であり、フレーズの発音時間の長さ(以下、「フレーズ長」と称する)を示す情報、楽曲のBPM、および検索した楽曲の加工の要否のいずれかを含む。なお、クエリには、フレーズの発音時間の長さを示す情報、および、楽曲のBPM以外の情報が含まれてもよい。例えば、楽曲のジャンルに関する情報、アーティスト名、制作された年代の情報、トピック等が含まれてもよい。トピックとは、例えば「スポーツ」、「恋愛」、「旅行」、「本」、「ゲーム」、「映画」など、楽曲に関し、予めカテゴリ化されたメタ情報を示す。また、トピックは楽曲のジャンルと紐づけられていてもよい。
The input unit 131 inputs a search target phrase and a query related to the lyrics of a song based on a user's operation via the operation unit 120 .
A phrase to be searched is a phrase indicating lyrics desired by the user. In addition, the query related to the lyrics of the song is ancillary search condition related to the phrase to be searched as described above. , and whether or not the retrieved music needs to be processed. Note that the query may include information other than the length of the pronunciation time of the phrase and the BPM of the song. For example, it may include information about the genre of the song, the name of the artist, information about the year in which it was produced, topic, and the like. Topics refer to pre-categorized meta-information related to music, such as "sports", "romance", "travel", "books", "games", and "movies". Also, the topic may be associated with the genre of the music.

入力部131は、操作部120を介したユーザー操作に基づいて、以下の情報を入力する。
(1)検索対象のフレーズ
所望の歌詞の一部をテキストで指定されることにより、「どのようなフレーズを含む」楽曲を検索するかが入力される。
(2)フレーズ長
(1)で入力されたフレーズの発音時間が指定されることにより、「どのような長さで発音されるフレーズを含む」楽曲を検索するかが入力される。
ここで、発音時間とは、検索対象のフレーズが発音される所要時間を示す。例えば、検索対象のフレーズが、「グッドモーニング」であった場合、「グッドモーニング」が歌詞に含まれる楽曲ごとにその発音時間は異なる。「グッドモーニング」が発音される所要時間は、楽曲のBPM、ジャンル、曲への歌詞の載せ方等様々な要因により異なる。
そこで、ユーザーが、例えば、「1秒程度で発音される」等、フレーズ長を指定することにより、目的に応じた検索条件が入力される。例えば、テンポよく「グッドモーニング」と発音している楽曲を所望するのか、ゆっくりと明確に聴きとれるように「グッドモーニング」と発音している楽曲を所望するのか等に応じて、フレーズ長が入力される。
なお、フレーズ長は、秒数により指定されてもよいし、拍数または小節数により指定されてもよいし、その他の単位で指定されてもよい。また、フレーズ長は、上限および下限の少なくとも一方が指定されてもよいし、「1秒前後」等、所定の幅を持たせて指定されてもよい。さらに、フレーズ長は、予め定められる複数の選択肢から何れかを選択する形で指定されてもよい。
The input unit 131 inputs the following information based on user's operation via the operation unit 120 .
(1) Phrases to be Searched By designating part of the desired lyrics as text, it is possible to input "what phrases are included" in which songs are to be searched.
(2) Phrase length By designating the pronunciation time of the phrase input in (1), it is input whether to search for songs that "include what length of phrase to be pronounced".
Here, the pronunciation time indicates the time required for the phrase to be searched to be pronounced. For example, if the search target phrase is "good morning", the pronunciation time differs for each song containing "good morning" in the lyrics. The time required to pronounce "Good Morning" varies depending on various factors such as the BPM of the song, the genre, and how the lyrics are written to the song.
Therefore, the user inputs a search condition according to the purpose by designating a phrase length such as "pronounced in about one second". For example, whether you want a song that pronounces "Good Morning" at a good tempo, or a song that pronounces "Good Morning" so that you can hear it slowly and clearly, etc., the phrase length is input. be done.
Note that the phrase length may be specified by the number of seconds, the number of beats or the number of bars, or may be specified by other units. At least one of an upper limit and a lower limit may be designated for the phrase length, or a predetermined width such as "around 1 second" may be designated for the phrase length. Furthermore, the phrase length may be designated by selecting one from a plurality of predetermined options.

さらに、フレーズ長に関連して、フレーズの区切り位置が指定されてもよい。一般に、楽曲は拍位置または小節位置で区切られる場合が多く、その位置を区切り位置とすることにより、検索対象のフレーズが、ユーザーにとって心地よく発音されている可能性の高い楽曲を検索することが可能である。また、歌手による呼吸位置であるブレス位置は楽曲の区切りである場合が多く、その位置を区切り位置とすることにより、同様の効果が期待できる。このようなフレーズの区切り位置は、拍位置または小節位置を区切り位置とするか否か、また、ブレス位置を区切り位置とするか否かの形で指定されるとよい。 Furthermore, a phrase delimiter position may be specified in relation to the phrase length. In general, songs are often separated by beat positions or bar positions. is. In addition, the breath position, which is the breathing position of a singer, is often the division of a piece of music. Such a phrase delimiter position may be specified in the form of whether or not the beat position or bar position is the delimiter position, or whether the breath position is the delimiter position.

(3)楽曲のBPM
入力される楽曲のBPMは、原曲のBPMであってもよいし、後述する加工部133により加工(調整)され、出力部134から出力される楽曲のBPMであってもよい。ユーザーが、例えば、「原曲のBPMが100BPMである」と指定することにより、ユーザーが所望する楽曲の原曲のBPMが入力される。また、ユーザーが、例えば、「原曲のBPMは問わず、加工後の楽曲のBPMが100BPMである」と指定することにより、ユーザーが所望する「出力される楽曲のBPM」が入力される。なお、加工部133による加工をふまえたBPMの指定においては、BPMが大きく変わるのを防ぐために、例えば、「原曲のBPMは90から110で、加工後の楽曲のBPMが100BPMである」等、原曲とのBPMの差も指定可能とすると良い。
例えば、DJ演奏などにおいて、次曲とのつながりを鑑みた楽曲を所望するのか否か等に応じて、楽曲のBPMが入力される。
(4)楽曲の加工の要否
検索の目的等に応じて、後述する加工部133による加工の要否が入力される。加工の詳細については、後述する。
(5)その他
クエリには、上述したように、楽曲のジャンルに関する情報、アーティスト名、制作された年代の情報、トピック等が含まれてもよい。このような情報は、後述する検索部132による楽曲の検索時に検索条件として利用される。
これらの情報は、予め定められる複数の選択肢から何れかを選択する形で指定されてもよいし、ユーザーのSNS(Social Networking Service)における行動履歴や検索履歴など、ユーザーの個人情報(ID情報)に基づいて、好適な情報を利用、あるいはリコメンドする形で指定されてもよい。
なお、(1)から(4)で説明した各要件のすべてか入力されてもよいし、一部のみが入力されてもよい。
(3) BPM of music
The BPM of the input music may be the BPM of the original music, or the BPM of the music processed (adjusted) by the processing unit 133 described later and output from the output unit 134 . By the user specifying, for example, "the BPM of the original music is 100 BPM", the BPM of the original music desired by the user is input. In addition, when the user designates, for example, "The BPM of the processed music is 100 BPM regardless of the BPM of the original music", the "BPM of the output music" desired by the user is input. In specifying the BPM based on the processing by the processing unit 133, in order to prevent the BPM from changing significantly, for example, "the BPM of the original song is 90 to 110, and the BPM of the post-processed song is 100 BPM." , the difference in BPM from the original song should also be designated.
For example, in a DJ performance or the like, the BPM of a piece of music is input depending on whether or not a piece of music is desired in consideration of the connection with the next piece of music.
(4) Necessity of music processing Necessity or non-necessity of processing by the processing unit 133, which will be described later, is input according to the purpose of the search. Details of the processing will be described later.
(5) Others As described above, the query may include information about the genre of the song, the name of the artist, the year in which the song was produced, the topic, and the like. Such information is used as a search condition when searching for music by the search unit 132, which will be described later.
These information may be specified by selecting one from a plurality of predetermined options, or the user's personal information (ID information) such as the action history and search history on the user's SNS (Social Networking Service) Based on this, it may be specified in the form of using or recommending suitable information.
All or part of the requirements described in (1) to (4) may be entered.

検索部132は、データベース140から、入力部131に入力されたクエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する。検索部132の詳細については、後述する。 The search unit 132 searches the database 140 for songs whose lyrics include the search target phrase according to the query input to the input unit 131 . Details of the search unit 132 will be described later.

加工部133は、入力部131で入力されたクエリに応じて、検索部132により検索した楽曲を加工する。ここで、楽曲の加工とは、例えば、検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す処理、および、検索した楽曲のBPMを変更する処理を含む。入力部131においては、切り出し処理およびBPM調整処理の要否がクエリとして入力される。なお、切り出し処理については、常に行う設定としても良い。また、加工部133による処理の詳細については、後述する。
出力部134は、検索部132により検索した楽曲、あるいは、加工部133により加工した楽曲を出力する。
The processing unit 133 processes the music searched by the search unit 132 according to the query input by the input unit 131 . Here, processing of the music includes, for example, a process of cutting out a portion of the searched music containing the phrase to be searched, and a process of changing the BPM of the searched music. In the input unit 131, whether or not the clipping process and the BPM adjustment process are necessary is input as a query. Note that the clipping process may be set to always be performed. Further, details of processing by the processing unit 133 will be described later.
The output unit 134 outputs the music searched by the search unit 132 or the music processed by the processing unit 133 .

データベース140は、HDD(Hard Disk Drive)またはフラッシュメモリー等により、楽曲の音声データを格納可能に構成されている。データベース140には、複数の楽曲の音声データがMP3形式等の所定の形式で格納されている。音声データは、音声情報に加えて、例えば、楽曲の歌詞、歌詞に関する時間情報、楽曲のBPM、アートワーク、タイトル、アーティスト名、アルバム名、キー、DJプレイ回数及びジャンル、トピック等の情報をタグ情報として含む。
図2は、楽曲の歌詞に関する時間情報を説明するための図である。図2に示すように、楽曲の歌詞に関する時間情報は、歌詞の要素ごとの時間情報を示す歌詞時間データ141、フレーズに関する拍位置または小節位置を示す情報である拍小節位置データ142、フレーズに関するブレス位置を示す情報であるブレス位置データ143からなる。
歌詞時間データ141には、例えば、「abcdefg」という歌詞の部分については、「a」、「b」、「c」、「d」、「e」、「f」、「g」の各テキストの発音時間に対応する再生時間が記憶される。そのため、各テキストの再生時間に着目することにより、例えば、あるフレーズが発音される所要時間を把握することが可能である。
また、歌詞時間データ141には、例えば、「hij」、「klm」、「nоp」という複数のフレーズからなる歌詞の部分については、「hij」、「klm」、「nоp」の各フレーズを代表する発音時間(フレーズの先頭、中央、後尾等の発音時間)に対応する再生時間が記憶されてもよい。この場合、各フレーズが発音される所要時間をより直接的に把握することが可能である。
また、拍小節位置データ142には、楽曲内の各拍位置および小節位置に対応する再生時間が記憶される。そのため、各拍位置または各小節位置の再生時間を把握することが可能である。
また、ブレス位置データ143には、楽曲内の各ブレス位置に対応する再生時間が記憶される。そのため、各ブレス位置の再生時間を把握することが可能である。
そして、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143における時間(s)は互いに対応付けられている。そのため、相互のデータの再生時間を比較することにより、フレーズの発音時間と拍位置または小節位置との関係、あるいは、フレーズの発音時間とブレス位置との関係等を把握することが可能である。
The database 140 is configured so as to be able to store audio data of songs using a HDD (Hard Disk Drive), flash memory, or the like. The database 140 stores audio data of a plurality of songs in a predetermined format such as MP3 format. In addition to audio information, audio data includes information such as song lyrics, time information related to lyrics, song BPM, artwork, title, artist name, album name, key, number of DJ plays, genre, and topic. Including as information.
FIG. 2 is a diagram for explaining time information related to lyrics of music. As shown in FIG. 2, the time information about the lyrics of a song includes: lyrics time data 141 indicating time information for each element of lyrics; It consists of breath position data 143 which is information indicating a position.
In the lyrics time data 141, for example, for the part of the lyrics "abcdefg", the texts "a", "b", "c", "d", "e", "f", and "g" are displayed. A playback time corresponding to the pronunciation time is stored. Therefore, by paying attention to the playback time of each text, it is possible to grasp the time required for a certain phrase to be pronounced, for example.
In addition, the lyrics time data 141 includes, for example, the phrases "hij", "klm", and "nop" representing the phrases "hij", "klm", and "nop". The reproduction time corresponding to the pronunciation time (the pronunciation time of the beginning, middle, end, etc. of the phrase) may be stored. In this case, it is possible to more directly grasp the time required for each phrase to be pronounced.
Also, the beat/bar position data 142 stores the playback time corresponding to each beat position and bar position in the music. Therefore, it is possible to grasp the reproduction time of each beat position or each bar position.
The breath position data 143 stores the playback time corresponding to each breath position in the music. Therefore, it is possible to grasp the reproduction time of each breath position.
The time (s) in the lyric time data 141, the beat bar position data 142, and the breath position data 143 are associated with each other. Therefore, by comparing the reproduction times of the mutual data, it is possible to grasp the relationship between the pronunciation time of the phrase and the beat position or bar position, or the relationship between the pronunciation time of the phrase and the breath position.

なお、情報処理装置100は、通信インターフェースを備え、外部記憶装置およびコンピュータ等に記憶された音声データを、図示しない通信インターフェースを介して取得し、データベース140に格納する構成としてもよい。この場合、情報処理装置100にはデータベース140が含まれず、外部記憶装置がデータベース140として機能する。 The information processing apparatus 100 may be configured to have a communication interface, acquire voice data stored in an external storage device, a computer, or the like via a communication interface (not shown) and store the data in the database 140 . In this case, the information processing apparatus 100 does not include the database 140 and the external storage device functions as the database 140 .

次に、以上説明した情報処理装置100において、ユーザー操作に基づいて、ユーザーの所望のフレーズを含む楽曲を検索する際の各部の動作について説明する。
図3および図4は、楽曲検索時の各部の動作を示すフローチャートである。
図3および図4に示された例では、まず、操作部120を介したユーザー操作に基づいて、検索対象のフレーズ、および楽曲の歌詞に関連するクエリが入力されると(ステップS101YES)、検索部132が、検索条件を決定する(ステップS102)。
検索部132は、入力された検索対象のフレーズ、および楽曲の歌詞に関連するクエリに基づいて、データベース140から楽曲を検索する際の検索条件を決定する。
検索部132は、入力された検索対象のフレーズについて、類似語などを検索条件に追加してもよい。例えば、検索対象のフレーズが、「グッドモーニング」であった場合、類似の表現である「モーニング」や「ハイ」、また、別の言語における「おはよう」や「グーテン モルゲン」などを検索対象のフレーズとして追加しても良い。類似語の検索においては、例えば公知の技術であるフレーズの意味ベクトルを利用して、近似するフレーズを検索してもよい。また、例えば各種辞書のデータベースを利用して、近似するフレーズを検索してもよい。いずれの場合においても、検索結果に対してユーザーが所望のフレーズを選択可能とするとよい。
また、上述したように、入力されたクエリに含まれる楽曲のBPMは、原曲のBPM、または加工部133による加工(調整)され、出力部134から出力される楽曲のBPMである。そこで、検索部132は、入力されたクエリに含まれる楽曲のBPMに応じて、BPMに関する検索条件を決定する。
また、上述したように、入力されたクエリに楽曲のジャンルに関する情報が含まれる場合、あるいはユーザーの個人情報(ID情報)に基づいて、ジャンル等を指定する場合、検索部132は、このような情報を検索条件に追加する。この結果、例えば、「ラブソング」のジャンルで「グッドモーニング」というフレーズを含む楽曲、などの検索条件が決定される。
また、上述したように、入力されたクエリにトピックに関する情報が含まれる場合、あるいはユーザーの個人情報(ID情報)に基づいて、トピックを指定する場合、検索部132は、このような情報を検索条件に追加する。この結果、例えば、「スポーツ」のトピックに関連し「グッド」という歌詞を含む楽曲、などの検索条件が決定される。
Next, the operation of each unit in the information processing apparatus 100 described above when searching for a song containing a phrase desired by the user based on the user's operation will be described.
3 and 4 are flow charts showing the operation of each section during music search.
In the example shown in FIGS. 3 and 4, first, based on the user's operation via the operation unit 120, when a phrase to be searched and a query related to the lyrics of a song are input (step S101 YES), the search is performed. The unit 132 determines search conditions (step S102).
The search unit 132 determines search conditions for searching for songs from the database 140 based on the input phrase to be searched and the query related to the lyrics of the song.
The search unit 132 may add a similar word or the like to the search condition for the input phrase to be searched. For example, if the search target phrase is "good morning", similar expressions such as "morning" and "hi", as well as phrases such as "good morning" and "guten morgen" in other languages are also searched. can be added as In searching for similar words, similar phrases may be searched using, for example, a well-known technique of semantic vectors of phrases. Also, similar phrases may be retrieved using, for example, databases of various dictionaries. In either case, the user should be able to select a desired phrase from the search results.
Also, as described above, the BPM of the music included in the input query is the BPM of the original music or the BPM of the music processed (adjusted) by the processing unit 133 and output from the output unit 134 . Therefore, the search unit 132 determines a search condition regarding BPM according to the BPM of the music included in the input query.
Further, as described above, if the input query includes information about the genre of music, or if the genre or the like is specified based on the user's personal information (ID information), the search unit 132 Add information to your search criteria. As a result, for example, a search condition such as songs containing the phrase "good morning" in the "love song" genre is determined.
Further, as described above, if the input query includes information about a topic, or if a topic is specified based on the user's personal information (ID information), the search unit 132 searches for such information. Add to conditions. As a result, search conditions such as, for example, songs related to the topic of "sports" and containing the lyrics of "good" are determined.

次に、検索部132が、ステップS102で決定した検索条件に従って、データベース140から、入力部131に検索対象のフレーズを歌詞に含む楽曲を検索する(ステップS103)。このとき、上述した類似語が検索対象のフレーズに追加されている場合、検索部132は、それぞれの検索対象のフレーズについて、データベースを参照し、検索対象のフレーズを歌詞に含む楽曲を検索する。
次に、検索部132が、入力部131に入力されたクエリに区切り位置の指定が含まれるか否かを判定し(ステップS104)、区切り位置の指定が含まれると判定すると(ステップS104YES)、検索部132が、指定された区切り位置の解析を行う(ステップS105)。
入力されたクエリに区切り位置の指定が含まれる場合、検索部132は、ステップS103で検索した各楽曲について、上述した歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれる区切り位置の解析を行う。
例えば、図5に示すように、検索対象のフレーズが、「グッドモーニング」であり、クエリに区切り位置をしてブレス位置が指定されている場合、検索部132は、「グッドモーニング」の歌詞時間データ141を参照し、矢印Aに示す「グッドモーニング」の発音時間に対応する再生時間を求め、ブレス位置データ143を参照し、その時間よりも後でかつ、最も早いブレス位置を求める。矢印Aに示す時間は、単純に「グッドモーニング」の発音時間に対応する再生時間であるが、矢印Bに示す時間は、ブレス位置を考慮し、ユーザーにとって心地よく発音されている可能性の高い時間となる。
なお、入力されたクエリに区切り位置として拍位置および小節位置の指定が含まれる場合も同様に考えることができる。いずれの場合も、検索部132は、検索対象のフレーズの前後に延長しつつ、内容的にユーザーにとって違和感が少ない部分を抜き出すために、検索対象のフレーズを含み、その先頭または後尾が区切り位置とするように、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれる区切り位置の解析を行う。
Next, the search unit 132 searches the database 140 for songs containing the search target phrase in the lyrics in the input unit 131 according to the search conditions determined in step S102 (step S103). At this time, if the above-described similar words are added to the search target phrase, the search unit 132 refers to the database for each search target phrase, and searches for songs containing the search target phrase in the lyrics.
Next, the search unit 132 determines whether or not the query input to the input unit 131 includes specification of the delimiter position (step S104). The search unit 132 analyzes the specified delimiter position (step S105).
If the input query includes designation of a break position, the search unit 132 refers to the lyrics time data 141, the beat/bar position data 142, and the breath position data 143 for each song searched in step S103, and searches for the query. Analyze the delimiter position contained in .
For example, as shown in FIG. 5, when the phrase to be searched is "good morning" and the query specifies a break position and a breath position, the search unit 132 retrieves the lyric time of "good morning". By referring to the data 141, the reproduction time corresponding to the sounding time of "Good Morning" indicated by the arrow A is obtained, and by referring to the breath position data 143, the later and earliest breath position is obtained. The time indicated by arrow A is simply the playback time corresponding to the pronunciation time of "Good Morning", but the time indicated by arrow B is the time when the breath position is taken into account and the user is likely to be comfortable with the pronunciation. becomes.
It should be noted that the same can be considered when the input query includes specification of beat positions and bar positions as break positions. In either case, the search unit 132 includes the phrase to be searched, and the beginning or end of the phrase is used as a delimiter in order to extract a portion that is less uncomfortable for the user in terms of content while extending before and after the phrase to be searched. The lyric time data 141, the beat bar position data 142, and the breath position data 143 are referred to analyze the break positions included in the query.

次に、検索部132が、入力部131に入力されたクエリにフレーズ長の指定が含まれるか否かを判定し(ステップS106)、フレーズ長の指定が含まれると判定すると(ステップS106YES)、検索部132が、指定されたフレーズ長に応じて、楽曲の絞り込みを行う(ステップS107)。
入力されたクエリにフレーズ長の指定が含まれる場合、検索部132は、ステップS103で検索した各楽曲について、指定されたフレーズ長に応じて、楽曲の絞り込みを行う。検索部132は、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれるフレーズ長の条件に適合しない楽曲を除外する、あるいは、クエリに含まれるフレーズ長の条件に適合しない楽曲の検索結果における優先度を下げる。
このとき、ステップS104YESにおいて区切り位置の指定が含まれると判定され、ステップS105において指定された区切り位置の解析を行った場合には、検索部132は、解析結果に基づいてフレーズ長に応じた絞り込みを行う。つまり、単純に検索対象のフレーズのフレーズ長をクエリにおいて指定されたフレーズ長と比較するのではなく、区切り位置をふまえた検索対象のフレーズのフレーズ長をクエリにおいて指定されたフレーズ長と比較する。
このような処理を行うことにより、ステップS103で検索した各楽曲について、クエリに応じた絞り込み(フィルタリング)および並び替え(ソート)を行うことができる。なお、絞り込みおよび並び替えにおいては、各楽曲に固有の情報を加味してもよい。例えば、その楽曲やアーティスト名の知名度および人気度、楽曲が制作された年代などを考慮して絞り込みおよび並び替えを行ってもよい。
Next, the search unit 132 determines whether the query input to the input unit 131 includes phrase length specification (step S106), and if it determines that phrase length specification is included (step S106 YES), The search unit 132 narrows down the songs according to the specified phrase length (step S107).
If the input query includes phrase length specification, the search unit 132 narrows down the songs searched in step S103 according to the specified phrase length. The search unit 132 refers to the lyric time data 141, the beat/bar position data 142, and the breath position data 143, and excludes songs that do not meet the phrase length condition included in the query. Lower the priority in the search results of songs that do not match
At this time, if it is determined in step S104 YES that the specification of the delimiter position is included, and if the specified delimiter position is analyzed in step S105, the search unit 132 performs narrowing down according to the phrase length based on the analysis result. I do. In other words, instead of simply comparing the phrase length of the phrase to be searched with the phrase length specified in the query, the phrase length of the phrase to be searched based on the delimiter position is compared with the phrase length specified in the query.
By performing such processing, it is possible to narrow down (filtering) and rearrange (sort) the songs searched in step S103 according to the query. It should be noted that in narrowing down and rearranging, information unique to each song may be added. For example, narrowing down and rearrangement may be performed in consideration of the degree of name recognition and popularity of the song or artist name, the year in which the song was produced, and the like.

次に、入力部131に入力されたクエリに楽曲の加工の指定が含まれるか否かを判定し(ステップS108)、楽曲の加工の指定が含まれると判定すると(ステップS108YES)、加工部133が、楽曲の加工処理を行う(ステップS109)。
楽曲の加工に際しては、図4に示すように、入力部131に入力されたクエリに楽曲の切り出しの指定が含まれるか否かを判定し(ステップS201)、楽曲の切り出しの指定が含まれると判定すると(ステップS201YES)、加工部133が、楽曲の切り出し処理を行う(ステップS202)。
入力されたクエリに楽曲の加工の指定が含まれる場合、加工部133は、ステップS103で検索した各楽曲について、指定された内容に応じて、楽曲の加工を行う。
このとき、ステップS104において区切り位置の指定が含まれると判定され、ステップS105において指定された区切り位置の解析を行った場合には、加工部133は、解析結果に基づいて楽曲の加工を行う。つまり、単純に検索対象のフレーズを切り出すのではなく、区切り位置をふまえて検索対象のフレーズを切り出す。
また、ステップS107において楽曲の絞り込みを行った場合には、加工部133は、絞り込み後の各楽曲について、検索対象のフレーズの切り出し処理を行う。
このような処理を行うことにより、クエリに応じたフレーズの切り出し処理を行い、所望のフレーズを抜き出すことができる。
Next, it is determined whether or not the query input to the input unit 131 includes designation of music processing (step S108). performs music processing (step S109).
When processing the music, as shown in FIG. 4, it is determined whether or not the query input to the input unit 131 includes a specification for clipping a song (step S201). When determined (step S201 YES), the processing unit 133 performs music clipping processing (step S202).
If the input query includes a designation for music processing, the processing unit 133 processes each piece of music retrieved in step S103 according to the designated content.
At this time, if it is determined in step S104 that the specification of the delimiter position is included and the specified delimiter position is analyzed in step S105, the processing unit 133 processes the music based on the analysis result. In other words, instead of simply cutting out the search target phrase, the search target phrase is cut out based on the delimiter positions.
Further, when the songs are narrowed down in step S107, the processing unit 133 performs extraction processing of phrases to be searched for each song after the narrowing down.
By performing such processing, it is possible to extract a desired phrase by performing the phrase extraction processing according to the query.

次に、入力部131に入力されたクエリに楽曲のBPMの調整の指定が含まれるか否かを判定し(ステップS203)、楽曲のBPMの調整の指定が含まれると判定すると(ステップS203YES)、加工部133が、楽曲のBPMを調整する処理を行う(ステップS204)。
入力されたクエリに楽曲のBPMの調整の指定が含まれる場合、加工部133は、ステップS103で検索した各楽曲について、指定された内容に応じて、楽曲のBPMの調整を行う。
このとき、ステップS107において楽曲の絞り込みを行った場合には、加工部133は、絞り込み後の各楽曲について、楽曲のBPMを調整する処理を行う。
このような処理を行うことにより、クエリに応じたBPMの調整処理を行い、所望のBPMの楽曲を生成することができる。
Next, it is determined whether or not the query input to the input unit 131 includes a specification for adjusting the BPM of the music (step S203). , the processing unit 133 performs processing for adjusting the BPM of the music (step S204).
If the input query includes a specification for adjusting the BPM of a song, the processing unit 133 adjusts the BPM of each song retrieved in step S103 according to the specified content.
At this time, if the songs have been narrowed down in step S107, the processing unit 133 performs a process of adjusting the BPM of each song after the narrowing down.
By performing such processing, it is possible to perform the BPM adjustment processing according to the query and generate music with a desired BPM.

最後に、出力部134が、楽曲を出力する(ステップS110)。なお、出力部134に出力される楽曲は、入力されたクエリに応じて、区切り位置の解析の有無、フレーズ長による絞り込みの有無、および加工処理の有無が異なる。
また、出力された楽曲は、楽曲の少なくとも一部のフレーズを抽出した歌詞サンプルであり、各種用途に活用することができる。用途の例については後述する。
Finally, the output unit 134 outputs the music (step S110). The music output to the output unit 134 differs depending on the input query in terms of whether segment position analysis is performed, whether phrase length narrowing is performed, and whether processing is performed.
Also, the output music is a lyric sample obtained by extracting at least part of the phrase of the music, and can be used for various purposes. Examples of uses are described later.

なお、図3および図4を参照して説明した一連の処理は一例であり、本発明はこの例に限定されない。
例えば、ステップS103において説明した楽曲の検索において、検索対象のフレーズ以外の検索条件、例えば、フレーズ長等を検索条件として検索を行ってもよい。また、ステップS105において説明した楽曲の絞り込みにおいて、区切り位置に関する情報以外の情報、例えば、楽曲のジャンル、トピック等を絞り込みの条件として楽曲の絞り込みを行ってもよい。
また、処理の順番についても、図3および図4を参照して説明した例に限定されない。例えば、ステップS107で説明したフレーズ長に基づく楽曲の絞り込みを行った後に、ステップS105で説明した区切り位置の解析を行っても良い。つまり、検索対象のフレーズ、および楽曲の歌詞に関連するクエリに基づいて、楽曲の検索、解析、絞り込み、加工の一部または全部を順不同に行う構成としても良い。
Note that the series of processes described with reference to FIGS. 3 and 4 is an example, and the present invention is not limited to this example.
For example, in the music search described in step S103, the search may be performed using a search condition other than the phrase to be searched, such as the length of the phrase. In narrowing down the songs described in step S105, the songs may be narrowed down by using information other than the information on the division position, such as the genre of the song, the topic, etc., as a condition for narrowing down the songs.
Also, the order of processing is not limited to the examples described with reference to FIGS. For example, after narrowing down the songs based on the phrase length described in step S107, the analysis of the division positions described in step S105 may be performed. In other words, based on a phrase to be searched and a query related to the lyrics of a song, a part or all of the song search, analysis, narrowing down, and processing may be performed in random order.

また、上述した例において、検索対象のフレーズは複数の品詞からなる構成されてもよい。このような場合、検索部132が、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を独立に検索し、加工部133が、検索された楽曲ごとに加工処理を行い、出力部134が、それぞれの品詞を含む楽曲を出力する。
例えば、図6に示すように、検索対象のフレーズが、「ドリームズカムトゥルー」である場合、矢印Aに示すように、「ドリームズカムトゥルー」全体を検索対象のフレーズとして一連の処理を行ってもよいし、矢印Bに示すように、「ドリームズ」、「カム」、「トゥルー」のそれぞれについて、独立に一連の処理を行ってもよいし、両方を実行してもよい。
なお、矢印Bに示すように、品詞ごとに一連の処理を行う際には、フレーズ長を分配しても良い。例えば、「ドリームズカムトゥルー」全体に対して指定されたフレーズ長を、「ドリームズ」、「カム」、「トゥルー」のそれぞれに分配し、3つの品詞のフレーズ長の合計が、「ドリームズカムトゥルー」全体に対して指定されたフレーズ長となるようにしても良い。また、矢印Bに示すように、品詞ごとに一連の処理を行う際には、出力部134による出力時に、出力内容を互いに関連付けることが好ましい。また、検索対象のフレーズをどのように分割するかは、公知の解析技術を利用して決定してもよいし、ユーザー操作に基づいて決定しても良い。
Further, in the above example, a phrase to be searched may be composed of a plurality of parts of speech. In such a case, the search unit 132 independently searches for songs containing lyrics for each part of speech or at least part of a plurality of parts of speech, and the processing unit 133 processes and outputs each searched song. A section 134 outputs a piece of music containing each part of speech.
For example, as shown in FIG. 6, if the search target phrase is "Dreams Come True", as indicated by arrow A, even if the entire "Dreams Come True" is used as the search target phrase, a series of processing may be performed. Alternatively, as indicated by arrow B, a series of processes may be performed independently for each of "Dreams", "Come", and "True", or both may be performed.
As indicated by arrow B, when performing a series of processes for each part of speech, the phrase length may be distributed. For example, the phrase length specified for the entire "dreams come true" is distributed to each of "dreams", "come", and "true", and the sum of the phrase lengths of the three parts of speech is "dreams come true". The phrase length may be specified for the entirety. Moreover, as indicated by an arrow B, when performing a series of processes for each part of speech, it is preferable to associate the output contents with each other when output by the output unit 134 . Also, how to divide the search target phrase may be determined using a known analysis technique, or may be determined based on a user's operation.

ここまで説明した楽曲の検索について、応用例を説明する。
(1)DJ、楽曲制作、映像制作の用途
DJ、楽曲制作、映像制作の用途では、フレーズ長について精度の高い楽曲の検索のニーズがある。
例えば、「「XXX」という歌詞が2拍で歌われているフレーズを含む楽曲の検索」との要望がある場合には、検索対象のフレーズとして「XXX」を入力し、クエリとして「フレーズ長=2拍」を入力することにより、所望のフレーズを含む楽曲を精度良く検索することができる。また、例えば、「1小節で歌われている文章や単語として区切りの良いフレーズを含む楽曲の検索」との要望がある場合には、検索対象のフレーズの入力しはせず、クエリとして例えば「フレーズ長=1小節」かつ「区切り位置=小節位置」あるいは「区切り位置=ブレス位置」等の入力を行うことにより、任意のフレーズを含み、所望のフレーズ長を有する楽曲を精度良く検索することができる。
また、楽曲制作、映像制作の用途では、前後の楽曲とのつながりやタイミング等をふまえ、BPMについて精度の高い楽曲の検索のニーズがある。このような場合にも、クエリとして原曲または加工後の楽曲のBPMを入力することにより、ユーザーの所望のBPMのフレーズを精度良く出力することができる。
An application example of the music search described so far will be described.
(1) Applications for DJ, music production, and video production In applications for DJ, music production, and video production, there is a need to search for songs with high accuracy in terms of phrase length.
For example, if there is a request to "search for songs containing a phrase in which the lyrics 'XXX' are sung on two beats," enter 'XXX' as the phrase to be searched, and query 'phrase length = By inputting "2 beats", it is possible to accurately search for songs containing a desired phrase. Also, for example, if there is a request to "search songs that contain sentences that are sung in one bar or phrases that are well separated as words", the phrase to be searched is not entered, and the query is for example " By inputting "phrase length = 1 measure" and "breaking position = bar position" or "breaking position = breath position", it is possible to accurately search for a song containing an arbitrary phrase and having a desired phrase length. can.
In addition, in the use of music production and video production, there is a need to search for music with high accuracy regarding BPM, based on connections with preceding and succeeding music, timing, and the like. Even in such a case, by inputting the BPM of the original song or the processed song as a query, it is possible to accurately output a phrase of the user's desired BPM.

(2)ソーシャルサービスの用途
SNSやSMS(Social Media Service)に代表されるソーシャルサービスの用途では音楽を使ったコミュニケーション、および自己表現のニーズがある。本発明をこのような用途に応用することにより、例えば、入力テキストと同じ歌詞を持つ配信楽曲のフレーズを抽出し、抽出した歌詞をサンプルとして自動生成するサービス等を実現することができる。
例えば、「メッセージサービスにおいて入力したテキストと同じ歌詞を含む楽曲を検索し、フレーズを抽出する」との要望がある場合には、検索対象のフレーズとして「入力テキスト」を入力し、クエリとして例えば「フレーズ長>2秒」「区切り位置=小節位置」あるいは「区切り位置=ブレス位置」等の入力を行うことにより、短すぎてフレーズが聞き取れない等の問題がなく、音楽的に区切りの良いフレーズを含む楽曲を精度良く検索することができる。
(2) Uses of Social Services In the uses of social services represented by SNS and SMS (Social Media Service), there are needs for communication and self-expression using music. By applying the present invention to such uses, for example, it is possible to realize a service that extracts phrases of distributed music that have the same lyrics as the input text and automatically generates samples of the extracted lyrics.
For example, if there is a request to ``search for songs containing the same lyrics as the text entered in the message service and extract the phrase'', enter ``input text'' as the phrase to be searched and use the query as `` By inputting phrase length > 2 seconds, "Break position = bar position" or "Break position = breath position", there is no problem that the phrase is too short to be heard, and musically well-separated phrases can be generated. It is possible to accurately search for songs that include.

(3)ダンス、モーション、アニメーションの映像に関する用途
ダンスやモーションの映像に関する用途では、(1)で説明したDJ、楽曲制作、映像制作の用途と同様に、ダンス、モーション、アニメーション等における動きに適合したフレーズ長について精度の高い楽曲の検索のニーズがある。
例えば、無音あるいはある楽曲に合わせてダンスを踊り、その映像に新たに、あるいは別の楽曲を適用する編集を行う場合には、「「XXX」という歌詞を含み、10秒で歌われているフレーズを含む楽曲の検索」との要望が考えられる。この場合、例えば、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長=10秒」を入力し、加工することにより、ユーザーの所望のフレーズを精度良く出力することができる。
(3) Applications related to dance, motion, and animation videos Applications related to dance and motion videos are suitable for movements in dance, motion, animation, etc., similar to the DJ, music production, and video production applications described in (1). There is a need to search for songs with high accuracy regarding phrase lengths.
For example, in the case of silence or dancing to a certain piece of music, and then editing the video by applying a new or different piece of music, a phrase that contains the lyrics "XXX" and is sung in 10 seconds Search for songs containing ". In this case, for example, by inputting "XXX" as a phrase to be searched and, for example, "phrase length=10 seconds" as a query, and processing them, the user's desired phrase can be accurately output.

(4)語学学習の用途
語学学習の用途では、外国語の学習において所望の単語や文章例を特定のフレーズ長の楽曲を使って学習したい等のニーズがある。
例えば、「「XXX」という歌詞を含む楽曲の検索」との要望がある場合には、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長>3秒」かつ「区切り位置=ブレス位置」を入力することにより、聴き取り学習に十分なフレーズ長を有し、前後の単語も含めた語学学習にふさわしい所望のフレーズを含む楽曲を精度良く検索することができる。
(4) Application for language learning In the application for language learning, there are needs such as learning desired words and example sentences using music of a specific phrase length in learning a foreign language.
For example, if there is a request to "search for songs containing the lyrics "XXX"", enter "XXX" as the phrase to be searched, and for example, "phrase length > 3 seconds" and "delimiter position = By inputting the "breath position", it is possible to accurately search for songs that have a phrase length sufficient for listening learning and that include a desired phrase suitable for language learning, including words before and after the song.

(5)スポーツおよびエクササイズの用途
スポーツおよびエクササイズの用途では、反復練習および動作タイミングの練習などの目的で、特定のフレーズ長およびテンポの楽曲の検索のニーズがある。
例えば、「ホップ、ステップ、ジャンプ」等の動作タイミングの練習を行う場合には、「「XXX」という歌詞を含み、10秒で歌われているフレーズを含む楽曲の検索」との要望が考えられる。この場合、例えば、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長=8拍」かつ「BPM=YY」を入力することにより、所望のフレーズを含む楽曲を精度良く検索することができる。
なお、(1)から(5)で説明した応用例は一例であり、本発明はこれらの例に限定されない。また、(1)から(5)で説明した各要素の一部を組み合わせて実行する構成としても良い。
(5) Sports and Exercise Applications In sports and exercise applications, there is a need to search for songs of specific phrase lengths and tempos for purposes such as repetition practice and movement timing practice.
For example, when practicing movement timing such as "hop, step, jump", the request may be "search for music that includes the lyrics 'XXX' and a phrase that is sung in 10 seconds". . In this case, for example, by inputting "XXX" as a phrase to be searched and, for example, "phrase length=8 beats" and "BPM=YY" as a query, a song containing a desired phrase can be searched with high accuracy. be able to.
The application examples described in (1) to (5) are examples, and the present invention is not limited to these examples. Also, a configuration may be employed in which some of the elements described in (1) to (5) are combined and executed.

以上で説明したような本発明の一実施形態によれば、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力し、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する。したがって、検索の目的に応じて、所望の楽曲を検索することできる。 According to one embodiment of the present invention as described above, a phrase to be searched and a query related to the lyrics of a song are input, and the song, the lyrics of the song, and the time information related to the lyrics are associated with each other. The stored database is referred to, and a song whose lyrics include the search target phrase is retrieved from the database according to the query. Therefore, desired music can be searched according to the purpose of the search.

また、本発明の一実施形態によれば、クエリは、フレーズの発音時間の長さを示す情報と、楽曲のBPMとの少なくとも一方を含む。したがって、検索の目的に応じたフレーズ長、あるいは、BPMの楽曲を検索することができる。 Also, according to one embodiment of the present invention, the query includes at least one of information indicating the length of pronunciation time of the phrase and the BPM of the song. Therefore, it is possible to search for a piece of music with a phrase length or BPM according to the purpose of the search.

また、本発明の一実施形態によれば、時間情報は、歌詞の要素ごとの時間情報、フレーズに関する拍位置または小節位置を示す情報、フレーズに関するブレス位置を示す情報 のうち、少なくとも1つを含む。したがって、単純に検索対象のフレーズを含む楽曲を検索するのではなく、楽曲の内容、好ましい区切り位置などをふまえて、所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、クエリは、楽曲のジャンルに関する情報を含み、ジャンルに応じて楽曲を検索する。したがって、より簡便に、ユーザーの所望の楽曲を検索することできる。
Also, according to an embodiment of the present invention, the time information includes at least one of the following: time information for each lyric element, information indicating the beat position or bar position regarding the phrase, and information indicating the breath position regarding the phrase. . Therefore, it is possible to search for a desired piece of music based on the content of the piece of music, the preferred delimiter positions, etc., rather than simply searching for pieces of music containing the search target phrase.
Also, according to one embodiment of the present invention, the query includes information about the genre of the song, and searches for songs according to the genre. Therefore, the user's desired music can be searched more easily.

また、本発明の一実施形態によれば、検索対象のフレーズは、複数の品詞を含み、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を検索する。したがって、検索対象のフレーズが複数の品詞を含む場合であっても、検索の目的に応じて、所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、検索した楽曲を出力する。したがって、楽曲の少なくとも一部のフレーズを抽出した楽曲を、ユーザーが目的に応じて利用することができる。
Moreover, according to one embodiment of the present invention, a phrase to be searched includes a plurality of parts of speech, and a song containing lyrics for each part of speech or at least a part of the plurality of parts of speech is searched. Therefore, even when a phrase to be searched includes a plurality of parts of speech, it is possible to search for a desired piece of music according to the purpose of the search.
Also, according to one embodiment of the present invention, the retrieved music is output. Therefore, the user can use the music obtained by extracting at least part of the phrase of the music according to the purpose.

また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲を加工する。したがって、ユーザーの要望に応じて、楽曲をより好適に加工することができる。
また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す。したがって、所望のフレーズを抜き出し、新たな音声データとして各種用途に活用することができる。
Also, according to one embodiment of the present invention, the retrieved music is processed according to the query. Therefore, it is possible to process music more appropriately according to the user's request.
Further, according to one embodiment of the present invention, a portion containing a phrase to be searched is cut out from the searched music according to the query. Therefore, desired phrases can be extracted and used as new voice data for various purposes.

また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲のBPMを変更する。したがって、ユーザーの要望に応じて、楽曲のBPMをより好適に調整することができる。
また、本発明の一実施形態によれば、加工した楽曲を出力する。したがって、楽曲の少なくとも一部のフレーズを抽出し、ユーザーの所望の加工を施した楽曲を、ユーザーが目的に応じて利用することができる。
Also, according to one embodiment of the present invention, the BPM of the searched song is changed according to the query. Therefore, it is possible to more preferably adjust the BPM of the music according to the user's request.
Further, according to one embodiment of the present invention, the processed music is output. Therefore, the user can use the music obtained by extracting at least part of the phrase from the music and processing the music as desired by the user.

なお、上記実施形態で説明した情報処理装置における処理の一部または全部は、インターネット通信網や、無線によって通信可能に接続されたサーバにより実行されてもよい。
また、上記実施形態では、楽曲を対象とした検索を例示して説明したが、例えば、スピーチ、朗読、会話等の楽曲に分類されないスクリプト等についても、本発明を同様に適用することができる。このような場合、検索対象のフレーズと、スクリプトに関連するクエリとを入力し、スクリプトと、スクリプトに関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズをスクリプトに含む楽曲を検索することができる。このような構成は、特に、上述した語学学習の用途において有用である。
A part or all of the processing in the information processing apparatus described in the above embodiments may be executed by an Internet communication network or a server communicably connected wirelessly.
Further, in the above embodiment, the search for music was exemplified and explained, but the present invention can be applied in the same manner to scripts that are not classified as music, such as speech, reading, conversation, and the like. In such a case, a phrase to be searched for and a query related to the script are entered, a database in which the script and time information related to the script are associated and stored is referenced, and a search target is retrieved according to the query from the database. You can search for songs that contain phrases in their scripts. Such a configuration is particularly useful for language learning as described above.

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範囲内において、各種の変形例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。 Although the preferred embodiments of the present invention have been described in detail above with reference to the accompanying drawings, the present invention is not limited to such examples. It is obvious that a person having ordinary knowledge in the technical field to which the present invention belongs can conceive of various modifications or modifications within the scope of the technical idea described in the claims. It is understood that these also naturally belong to the technical scope of the present invention.

100…情報処理装置、110…ディスプレイ、120…操作部、130…制御部、131…入力部、132…検索部、133…加工部、134…出力部、140…データベース。 DESCRIPTION OF SYMBOLS 100... Information processing apparatus, 110... Display, 120... Operation part, 130... Control part, 131... Input part, 132... Search part, 133... Processing part, 134... Output part, 140... Database.

Claims (12)

検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、
楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索する検索部と
を備える情報処理装置。
an input unit for inputting a phrase to be searched for and a query related to lyrics of a song;
a search unit that refers to a database in which songs, lyrics of the songs, and time information related to the lyrics are stored in association with each other, and searches the database for songs containing the search target phrase in the lyrics according to the query; Information processing device.
前記クエリは、前記フレーズの発音時間の長さを示す情報と、前記楽曲のBPMとの少なくとも一方を含む、請求項1に記載の情報処理装置。 2. The information processing apparatus according to claim 1, wherein said query includes at least one of information indicating length of pronunciation time of said phrase and BPM of said music. 前記時間情報は、前記歌詞の要素ごとの時間情報、前記フレーズに関する拍位置または小節位置を示す情報、前記フレーズに関するブレス位置を示す情報のうち、少なくとも1つを含む、請求項1または請求項2に記載の情報処理装置。 Claim 1 or Claim 2, wherein the time information includes at least one of time information for each element of the lyrics, information indicating a beat position or bar position regarding the phrase, and information indicating a breath position regarding the phrase. The information processing device according to . 前記クエリは、前記楽曲のジャンルに関する情報を含み、
前記検索部は、前記ジャンルに応じて前記楽曲を検索する、請求項1から請求項3のいずれか一項に記載の情報処理装置。
The query includes information about the genre of the song,
The information processing apparatus according to any one of claims 1 to 3, wherein the search unit searches for the music according to the genre.
前記検索対象のフレーズは、複数の品詞を含み、
前記検索部は、前記品詞ごと、または、前記複数の品詞の少なくとも一部の歌詞を含む前記楽曲を検索する、請求項1から請求項4のいずれか一項に記載の情報処理装置。
The search target phrase includes a plurality of parts of speech,
The information processing apparatus according to any one of claims 1 to 4, wherein the search unit searches for the song containing lyrics for each part of speech or at least part of the plurality of parts of speech.
前記検索部により検索した楽曲を出力する出力部をさらに備える、請求項1から請求項5のいずれか一項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 5, further comprising an output unit that outputs songs searched by the search unit. 前記クエリに応じて、前記検索部により検索した楽曲を加工する加工部をさらに備える、請求項1から請求項5のいずれか一項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 5, further comprising a processing unit that processes the music searched by the search unit according to the query. 前記加工部は、前記クエリに応じて、前記検索部により検索した楽曲のうち、前記検索対象のフレーズを含む部分を切り出す、請求項7に記載の情報処理装置。 8. The information processing apparatus according to claim 7, wherein said processing unit cuts out a portion including said search target phrase from the music searched by said search unit according to said query. 前記加工部は、前記クエリに応じて、前記検索部により検索した楽曲のBPMを変更する、請求項7または請求項8に記載の情報処理装置。 9. The information processing apparatus according to claim 7, wherein said processing unit changes BPM of music searched by said search unit according to said query. 前記加工部により加工した楽曲を出力する出力部をさらに備える、請求項7から請求項9のいずれか一項に記載の情報処理装置。 10. The information processing apparatus according to any one of claims 7 to 9, further comprising an output unit that outputs music processed by said processing unit. データベースから楽曲を検索する検索方法であって、
前記データベースは、楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶され、
検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力するステップと、
前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索するステップと
を含む検索方法。
A search method for searching songs from a database, comprising:
the database stores music, lyrics of the music, and time information related to the lyrics in association with each other;
entering a phrase to search for and a query related to song lyrics;
and searching the database for songs containing the search target phrase in lyrics in accordance with the query.
検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、
楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索する検索部としてコンピュータを機能させるためのプログラム。
an input unit for inputting a phrase to be searched for and a query related to lyrics of a song;
A search unit that refers to a database in which songs, lyrics of songs, and time information related to the lyrics are stored in association with each other, and searches the database for songs that include the search target phrase in the lyrics in response to the query. A program that makes a computer work.
JP2021178518A 2021-11-01 2021-11-01 Information processing apparatus, retrieval method, and program Pending JP2023067363A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021178518A JP2023067363A (en) 2021-11-01 2021-11-01 Information processing apparatus, retrieval method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021178518A JP2023067363A (en) 2021-11-01 2021-11-01 Information processing apparatus, retrieval method, and program

Publications (1)

Publication Number Publication Date
JP2023067363A true JP2023067363A (en) 2023-05-16

Family

ID=86326321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021178518A Pending JP2023067363A (en) 2021-11-01 2021-11-01 Information processing apparatus, retrieval method, and program

Country Status (1)

Country Link
JP (1) JP2023067363A (en)

Similar Documents

Publication Publication Date Title
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US11710474B2 (en) Text-to-speech from media content item snippets
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8352272B2 (en) Systems and methods for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
CN102549652B (en) Information retrieving apparatus
US9659572B2 (en) Apparatus, process, and program for combining speech and audio data
US20100082348A1 (en) Systems and methods for text normalization for text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US11636835B2 (en) Spoken words analyzer
WO2010036486A2 (en) Systems and methods for speech preprocessing in text to speech synthesis
JP2000081892A (en) Device and method of adding sound effect
Pudaruth et al. Automated generation of song lyrics using CFGs
CN110619673A (en) Method for generating and playing sound chart, method, system and equipment for processing data
JP4697432B2 (en) Music playback apparatus, music playback method, and music playback program
JP3963112B2 (en) Music search apparatus and music search method
JP2023067363A (en) Information processing apparatus, retrieval method, and program
US20060248105A1 (en) Interactive system for building and sharing databank
JP2006178104A (en) Method, apparatus and system for musical piece generation
JP2008097232A (en) Voice information retrieval program, recording medium thereof, voice information retrieval system, and method for retrieving voice information
Ring et al. Finding ‘Lucy in Disguise’: the misheard lyric matching problem
Choi et al. Spoken content-based audio navigation (SCAN)
Schotanus Comparing word affect and tone affect: Comment on Sun and Cuthbert 2017
Liu et al. Linguistic tone in Chinese rap: an interdisciplinary approach