JP6114980B2 - 楽曲処理装置および楽曲処理方法 - Google Patents
楽曲処理装置および楽曲処理方法 Download PDFInfo
- Publication number
- JP6114980B2 JP6114980B2 JP2012229033A JP2012229033A JP6114980B2 JP 6114980 B2 JP6114980 B2 JP 6114980B2 JP 2012229033 A JP2012229033 A JP 2012229033A JP 2012229033 A JP2012229033 A JP 2012229033A JP 6114980 B2 JP6114980 B2 JP 6114980B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- music
- word
- feature amount
- lyrics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1は、楽曲処理装置100の構成を示すブロック図である。図1に示すように、楽曲処理装置100は、楽曲DB110、分割管理部120、第2の特徴量抽出部130、確率モデル構築部140、第1の特徴量抽出部150、単語推定部160、全体印象生成部170、画像検索部180および再生部190を備えている。楽曲処理装置100は、例えば楽曲に画像を合わせたスライドショーを提供するサーバに用いられ、ユーザ端末においてスライドショーのストリーミング再生が可能になる。
図3は、楽曲処理装置100の動作を示すフローチャートである。図3に示すように、楽曲処理装置100は、まず、入力された楽曲データを分割管理処理する(ステップS1)。次に、歌詞データが付帯する楽曲データを用いて確率モデルを構築する(ステップS2)。そして、入力された歌詞データが付帯しない楽曲データから音響特徴量を抽出し、抽出された音響特徴量および確率モデルを用いて、入力された楽曲データに対して単語データを推定する(ステップS3)。
図4は、分割管理処理を示すフローチャートである。まず、入力された楽曲データに歌詞データ(同期したテキストデータ)が付帯しているか否かを判定する(ステップT1)。歌詞データが付帯していないと判定された場合には、あらかじめ定められた分割パラメータを設定し(ステップT2)、その分割パラメータに基づいて、楽曲を分割管理する。例えば、3秒を基準に部分区間に分割管理できる(ステップT3)。
図5は、確率モデル構築処理を示すフローチャートである。まず、歌詞データが付帯する楽曲データを学習データとして入力する(ステップP1)。次に、歌詞の一行の再生時間に対応する区間の楽曲データを抽出し、その楽曲データの音響特徴量を抽出する(ステップP2)。
図6は、単語推定処理を示すフローチャートである。まず、歌詞データが付帯しない楽曲データを入力する(ステップQ1)。次に、入力された歌詞データが付帯しない楽曲データから音響特徴量を抽出する(ステップQ2)。そして、抽出した音響特徴量をPLSAによって得られた潜在確率マトリクスを参照し、対応する音響特徴量に該当する上位M件の歌詞に含まれる単語を分割区間に対応する単語として推定し(ステップQ3)、単語推定処理を終了する。これにより歌詞データが付帯していない楽曲データに対して、歌詞データに相当する単語データを付与することができる。
図7は、全体印象生成処理を示すフローチャートである。まず、事前に歌詞に対して全体印象のラベルが付与された教師データを準備する(ステップR1)。次に、楽曲データに付帯する歌詞データを形態素解析して得られた単語または楽曲データに対応付けて推定された単語データを特徴ベクトルの要素として抽出する(ステップR2)。抽出した特徴ベクトルにより、候補語ごとに正、負の2クラス識別器を用いて評価し、新たに入力された歌詞に対してすべての候補語の正負を判定する(ステップR3)。識別器により正として判定されたすべての候補語を、その楽曲の全体印象語に決定し(ステップR4)、全体印象生成処理を終了する。
図8は、画像検索処理を示すフローチャートである。画像検索処理は入力された楽曲データに付帯する歌詞データまたは推定された単語データを抽出する(ステップL1)。その際には、形態素解析により品詞分解を適用し、単語を品詞ごとに選別できる。そして、抽出された単語データを用いて画像データを検索する(ステップL2)。画像検索対象としては、FLICKR(登録商標)などのWEBサービスや、個人の写真コレクションなどを利用することができる。検索して得られた画像群から、表示するための1枚を抽出することで各行または分割単位で表示する画像を選定する(ステップL3)。
110 楽曲DB
120 分割管理部
130 第2の特徴量抽出部
140 確率モデル構築部
150 第1の特徴量抽出部
160 単語推定部
170 全体印象生成部
180 画像検索部
190 再生部
Claims (6)
- 楽曲データを処理して単語データを付与する楽曲処理装置であって、
入力された楽曲データに付帯する歌詞データの有無を判定し、歌詞データの有無に応じた部分区間で前記入力された楽曲データを分割管理する分割管理部と、
前記入力された楽曲データから音響特徴量を抽出する第1の特徴量抽出部と、
予め楽曲の音響特徴量と単語データとを共起確率で関連付けて構築された確率モデルを用いて、前記抽出された音響特徴量に関連する単語データを推定する単語推定部と、を備えることを特徴とする楽曲処理装置。 - 前記第1の特徴量抽出部は、前記部分区間の音響特徴量を抽出し、
前記単語推定部は、前記部分区間ごとに単語データを推定することを特徴とする請求項1記載の楽曲処理装置。 - 前記推定された単語データを用いて全体印象ラベルを付与する全体印象ラベル付与部と、
前記推定された単語データに関連する画像データを検索する画像データ検索部と、を更に備え、
前記画像データ検索部は、前記付与された全体印象ラベルを参照して画像データを選定することを特徴とする請求項1または請求項2記載の楽曲処理装置。 - 歌詞データが付帯された楽曲データから音響特徴量を抽出する第2の特徴量抽出部と、
前記歌詞データから重要語データを抽出し、前記抽出された音響特徴量と重要語データとを共起確率で関連付ける確率モデルを構築する確率モデル構築部と、を更に備え、
前記単語推定部は、前記確率モデル構築部で構築された確率モデルを用いることを特徴とする請求項1から請求項3のいずれかに記載の楽曲処理装置。 - 楽曲データを処理して単語データを付与する楽曲処理プログラムであって、
入力された楽曲データに付帯する歌詞データの有無を判定し、歌詞データの有無に応じた部分区間で前記入力された楽曲データを分割管理する処理と、
前記入力された楽曲データから音響特徴量を抽出する処理と、
予め楽曲の音響特徴量と単語データとを共起確率で関連付けて構築された確率モデルを用いて、前記抽出された音響特徴量に関連する単語データを推定する処理と、をコンピュータに実行させることを特徴とする楽曲処理プログラム。 - 楽曲データを処理して単語データを付与する楽曲処理方法であって、
入力された楽曲データに付帯する歌詞データの有無を判定し、歌詞データの有無に応じた部分区間で前記入力された楽曲データを分割管理するステップと、
前記入力された楽曲データから音響特徴量を抽出するステップと、
予め楽曲の音響特徴量と単語データとを共起確率で関連付けて構築された確率モデルを用いて、前記抽出された音響特徴量に関連する単語データを推定するステップと、を含むことを特徴とする楽曲処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012229033A JP6114980B2 (ja) | 2012-10-16 | 2012-10-16 | 楽曲処理装置および楽曲処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012229033A JP6114980B2 (ja) | 2012-10-16 | 2012-10-16 | 楽曲処理装置および楽曲処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014081478A JP2014081478A (ja) | 2014-05-08 |
JP6114980B2 true JP6114980B2 (ja) | 2017-04-19 |
Family
ID=50785718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012229033A Active JP6114980B2 (ja) | 2012-10-16 | 2012-10-16 | 楽曲処理装置および楽曲処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6114980B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016057571A (ja) * | 2014-09-12 | 2016-04-21 | ヤマハ株式会社 | 音響解析装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5306114B2 (ja) * | 2009-08-28 | 2013-10-02 | Kddi株式会社 | クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム |
JP2011250100A (ja) * | 2010-05-26 | 2011-12-08 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP5195879B2 (ja) * | 2010-11-24 | 2013-05-15 | 株式会社Jvcケンウッド | 楽曲検索再生装置、楽曲検索再生方法、及び楽曲検索再生プログラム |
-
2012
- 2012-10-16 JP JP2012229033A patent/JP6114980B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014081478A (ja) | 2014-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kaminskas et al. | Location-aware music recommendation using auto-tagging and hybrid matching | |
CN109165302B (zh) | 多媒体文件推荐方法及装置 | |
TWI553494B (zh) | 基於多模態融合之智能高容錯視頻識別系統及其識別方法 | |
US7707162B2 (en) | Method and apparatus for classifying multimedia artifacts using ontology selection and semantic classification | |
US20100082653A1 (en) | Event media search | |
US9965726B1 (en) | Adding to a knowledge base using an ontological analysis of unstructured text | |
KR20080058356A (ko) | 시맨틱 토픽의 자동화된 리치 프레젠테이션을 위한컴퓨터-구현 방법 및 컴퓨팅 장치 | |
JP2011175362A (ja) | 情報処理装置、重要度算出方法及びプログラム | |
Cheng et al. | On effective personalized music retrieval by exploring online user behaviors | |
US20200394988A1 (en) | Spoken words analyzer | |
JP2007241888A (ja) | 情報処理装置および方法、並びにプログラム | |
JP6123143B1 (ja) | 特許要件適否予測装置および特許要件適否予測プログラム | |
CN111506794A (zh) | 一种基于机器学习的谣言管理方法和装置 | |
Tatli et al. | A tag-based hybrid music recommendation system using semantic relations and multi-domain information | |
JP2015097026A (ja) | トレンド分析装置、トレンド分析方法およびトレンド分析プログラム | |
Álvarez et al. | Riada: a machine-learning based infrastructure for recognising the emotions of Spotify songs | |
CN111241380B (zh) | 用于生成推荐的方法和设备 | |
JP6114980B2 (ja) | 楽曲処理装置および楽曲処理方法 | |
CN110019921B (zh) | 音频与属性的关联方法及装置、音频搜索方法及装置 | |
JP3692416B2 (ja) | 情報フィルタリング方法および装置 | |
JP5474591B2 (ja) | 画像選定装置、画像選定方法および画像選定プログラム | |
Rimaz et al. | Audiolens: Audio-aware video recommendation for mitigating new item problem | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
Celma et al. | Zempod: A semantic web approach to podcasting | |
JPH09245046A (ja) | 情報検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161011 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6114980 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |