JP5516720B2 - カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 - Google Patents
カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 Download PDFInfo
- Publication number
- JP5516720B2 JP5516720B2 JP2012506747A JP2012506747A JP5516720B2 JP 5516720 B2 JP5516720 B2 JP 5516720B2 JP 2012506747 A JP2012506747 A JP 2012506747A JP 2012506747 A JP2012506747 A JP 2012506747A JP 5516720 B2 JP5516720 B2 JP 5516720B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- category
- feature
- word
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 64
- 238000000605 extraction Methods 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 18
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 230000010365 information processing Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 82
- 238000004364 calculation method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 22
- 238000001514 detection method Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、図2を用いて、実施例2に係るカテゴリ生成装置の構成を説明する。図2は、実施例2に係るカテゴリ生成装置の構成を示すブロック図である。図2に示すように、カテゴリ生成装置10は、通信制御I/F部11と入力部12と表示部13と記憶部14と制御部20とを有する。
次に、図11〜図13を用いて、カテゴリ生成装置による処理の流れを説明する。図11は、実施例2に係るカテゴリ生成装置の処理の流れを示すフローチャートであり、図12は、単語解析処理の流れを示すフローチャートであり、図13は、映像解析処理の流れを示すフローチャートである。
図11に示すように、カテゴリ生成装置10の楽曲検出部21は、映像データを受け付けると(ステップS101肯定)、映像データから楽曲部分を抽出する(ステップS102)。
次に、図11のステップS103で実行される単語解析処理について説明する。図12に示すように、カテゴリ生成装置10の単語解析部24は、楽曲から文字情報を抽出し(ステップS201)、抽出した文字情報を単語に分解する(ステップS202)。なお、単語解析対象の文字情報が文字情報抽出部23によって抽出されている場合には、ステップS201を実行する必要はない。
次に、図11のステップS104で実行される映像解析処理について説明する。図13に示すように、カテゴリ生成装置10の映像解析部22は、楽曲から映像情報を抽出し(ステップS301)、楽曲の総時間を取得する(ステップS302)。続いて、映像解析部22は、抽出した映像情報を特徴ごと(シーンごと)に分解する(ステップS303)。
このように、実施例2によれば、楽曲にメタ情報が乏しい場合でも、映像情報を持っている場合は、その映像の特徴から楽曲のイメージを表すカテゴリを作成し、そのメタデータを使うことにより楽曲を分類することができる。さらに、ユーザがあらかじめメタデータを楽曲に付与するという手間を省くことができる。
例えば、単語DB14bやシーンDB14aに記憶されるカテゴリに重み付けを行ってもよい。具体的には、単語=雪、カテゴリ1=雪×1.2、カテゴリ2=冬×1.0、カテゴリ3=白×0.8とする。そうして、登場回数を計算するときに、この重みを用いる。つまり、カテゴリ雪の登場回数が1.2倍、カテゴリ白の登場回数が0.8倍として計算される。なお、上述した実施例等のカテゴリの数はあくまで例であり、これに限定されるものではない。また、実施例では楽曲の映像データの検出を自動で行ったが、手動で任意の映像データを指定してから楽曲部分を検出して追加することもできることが望ましい。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
ところで、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムの一例を説明する。
11 通信制御I/F部
12 入力部
13 表示部
14 記憶部
14a シーンDB
14b 単語DB
14c カウント用DB
14d 楽曲情報DB
20 制御部
21 楽曲検出部
22 映像解析部
23 文字情報抽出部
24 単語解析部
25 番組情報抽出部
26 出現率計算部
27 曲リスト表示部
Claims (7)
- 楽曲を受け付ける楽曲受付手順と、
前記楽曲受付手順により受け付けられた楽曲が有する映像情報を抽出し、抽出した映像情報を特徴ごとに分解する映像分解手順と、
前記映像情報の特徴と当該特徴を表す複数のカテゴリとを対応付ける特徴記憶部を参照し、前記映像分解手順によって分解された各特徴が前記楽曲で登場する登場時間を計測して、前記特徴記憶部において各特徴に対応付けられるカテゴリに当該計測した登場時間を対応付け、前記カテゴリごとに前記登場時間の合計を算出するカテゴリ生成手順と
をコンピュータに実行させるためのカテゴリ生成プログラム。 - 前記楽曲受付手順により受け付けられた楽曲の映像情報から文字情報を抽出する文字情報抽出手順と、
前記文字情報抽出手順により抽出された文字情報を単語に分解する単語分解手順とを前記コンピュータにさらに実行させ、
前記カテゴリ生成手順は、前記特徴記憶部に記憶される各カテゴリと当該カテゴリから連想される単語とを対応付けて記憶する単語記憶部を参照し、前記単語分解手順により得られた単語それぞれについて、当該単語に対応付けられるカテゴリを特定することを特徴とする請求項1に記載のカテゴリ生成プログラム。 - 前記カテゴリ生成手順は、前記カテゴリそれぞれについて、当該カテゴリに対応付けられた前記単語が前記楽曲で登場する登場回数を計測し、前記カテゴリと登場回数とを対応付けることを特徴とする請求項2に記載のカテゴリ生成プログラム。
- 前記カテゴリ生成手順は、前記カテゴリそれぞれと前記登場時間と前記登場回数とを対応付けることを特徴とする請求項3に記載のカテゴリ生成プログラム。
- 前記カテゴリ生成手順は、前記カテゴリそれぞれについて、前記登場時間と前記登場回数とを加算した値を、前記文字情報に含まれる総単語数と前記楽曲の総時間とを加算した値で除算した出現率を算出し、前記カテゴリと出現率とを対応付けることを特徴とする請求項4に記載のカテゴリ生成プログラム。
- 楽曲を受け付ける楽曲受付部と、
前記楽曲が有する映像情報の特徴と当該特徴を表す複数のカテゴリとを対応付ける特徴記憶部と、
前記楽曲受付部により受け付けられた楽曲が有する映像情報を抽出し、抽出した映像情報を特徴ごとに分解する映像分解部と、
前記映像分解部によって分解された各特徴が前記楽曲で登場する登場時間を計測して、前記特徴記憶部において各特徴に対応付けられるカテゴリに当該計測した登場時間を対応付け、前記カテゴリごとに前記登場時間の合計を算出するカテゴリ生成部と
を有することを特徴とするカテゴリ生成装置。 - 情報処理装置により実行される方法において、
楽曲を受け付ける楽曲受付ステップと、
前記楽曲受付ステップにより受け付けられた楽曲が有する映像情報を抽出し、抽出した映像情報を特徴ごとに分解する映像分解ステップと、
前記映像情報の特徴と当該特徴を表す複数のカテゴリとを対応付ける特徴記憶部を参照し、前記映像分解ステップによって分解された各特徴が前記楽曲で登場する登場時間を計測して、前記特徴記憶部において各特徴に対応付けられるカテゴリに当該計測した登場時間を対応付け、前記カテゴリごとに前記登場時間の合計を算出するカテゴリ生成ステップと
を含んだことを特徴とするカテゴリ生成方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/055451 WO2011118037A1 (ja) | 2010-03-26 | 2010-03-26 | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011118037A1 JPWO2011118037A1 (ja) | 2013-07-04 |
JP5516720B2 true JP5516720B2 (ja) | 2014-06-11 |
Family
ID=44672626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012506747A Expired - Fee Related JP5516720B2 (ja) | 2010-03-26 | 2010-03-26 | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9047916B2 (ja) |
EP (1) | EP2551780A4 (ja) |
JP (1) | JP5516720B2 (ja) |
KR (1) | KR101469021B1 (ja) |
CN (1) | CN102870109B (ja) |
WO (1) | WO2011118037A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10002136B2 (en) * | 2015-07-27 | 2018-06-19 | Qualcomm Incorporated | Media label propagation in an ad hoc network |
US10127943B1 (en) | 2017-03-02 | 2018-11-13 | Gopro, Inc. | Systems and methods for modifying videos based on music |
US11017811B1 (en) * | 2020-01-09 | 2021-05-25 | Lenovo (Singapore) Pte. Ltd. | Playback speed optimization |
US11797548B2 (en) * | 2021-09-22 | 2023-10-24 | Entres LLC | Achievement based rating system and methods with a dynamic taxonomy |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265396A (ja) * | 1998-03-18 | 1999-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 |
JP2006190010A (ja) * | 2005-01-05 | 2006-07-20 | Brother Ind Ltd | コンテンツ配信装置、コンテンツ配信方法、コンテンツ配信プログラム及びそれを記憶した記憶媒体 |
JP2010015588A (ja) * | 2009-08-27 | 2010-01-21 | Kddi R & D Laboratories Inc | 動画像データの分類装置 |
JP2010066870A (ja) * | 2008-09-09 | 2010-03-25 | Toshiba Corp | 情報推薦装置および情報推薦方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6690391B1 (en) * | 2000-07-13 | 2004-02-10 | Sony Corporation | Modal display, smooth scroll graphic user interface and remote command device suitable for efficient navigation and selection of dynamic data/options presented within an audio/visual system |
US7640563B2 (en) * | 2002-04-16 | 2009-12-29 | Microsoft Corporation | Describing media content in terms of degrees |
US7191193B2 (en) | 2003-01-02 | 2007-03-13 | Catch Media | Automatic digital music library builder |
JP4752623B2 (ja) | 2005-06-16 | 2011-08-17 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US7921116B2 (en) * | 2006-06-16 | 2011-04-05 | Microsoft Corporation | Highly meaningful multimedia metadata creation and associations |
KR100925256B1 (ko) * | 2007-05-03 | 2009-11-05 | 인하대학교 산학협력단 | 음성 및 음악을 실시간으로 분류하는 방법 |
JP4788810B2 (ja) * | 2009-08-17 | 2011-10-05 | ソニー株式会社 | 楽曲同定装置及び方法、楽曲同定配信装置及び方法 |
-
2010
- 2010-03-26 EP EP10848430.4A patent/EP2551780A4/en not_active Ceased
- 2010-03-26 WO PCT/JP2010/055451 patent/WO2011118037A1/ja active Application Filing
- 2010-03-26 KR KR1020127024744A patent/KR101469021B1/ko active IP Right Grant
- 2010-03-26 CN CN201080065677.3A patent/CN102870109B/zh not_active Expired - Fee Related
- 2010-03-26 JP JP2012506747A patent/JP5516720B2/ja not_active Expired - Fee Related
-
2012
- 2012-09-13 US US13/614,143 patent/US9047916B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265396A (ja) * | 1998-03-18 | 1999-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 |
JP2006190010A (ja) * | 2005-01-05 | 2006-07-20 | Brother Ind Ltd | コンテンツ配信装置、コンテンツ配信方法、コンテンツ配信プログラム及びそれを記憶した記憶媒体 |
JP2010066870A (ja) * | 2008-09-09 | 2010-03-25 | Toshiba Corp | 情報推薦装置および情報推薦方法 |
JP2010015588A (ja) * | 2009-08-27 | 2010-01-21 | Kddi R & D Laboratories Inc | 動画像データの分類装置 |
Non-Patent Citations (2)
Title |
---|
CSNG201000339002; 江端 佑介: 'ユーザコメントのtf-idf法による分析を用いたインタラクティブな関連動画の提示' 電子情報通信学会技術研究報告 第109巻,第439号, 20100222, p.7〜10, 社団法人電子情報通信学会 * |
JPN6013031749; 江端 佑介: 'ユーザコメントのtf-idf法による分析を用いたインタラクティブな関連動画の提示' 電子情報通信学会技術研究報告 第109巻,第439号, 20100222, p.7〜10, 社団法人電子情報通信学会 * |
Also Published As
Publication number | Publication date |
---|---|
KR20120137376A (ko) | 2012-12-20 |
CN102870109A (zh) | 2013-01-09 |
JPWO2011118037A1 (ja) | 2013-07-04 |
EP2551780A4 (en) | 2013-09-04 |
WO2011118037A1 (ja) | 2011-09-29 |
US9047916B2 (en) | 2015-06-02 |
KR101469021B1 (ko) | 2014-12-04 |
CN102870109B (zh) | 2016-03-02 |
US20130071089A1 (en) | 2013-03-21 |
EP2551780A1 (en) | 2013-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9671859B2 (en) | Information processing device, client device, server device, list generation method, list acquisition method, list providing method and program | |
JP4469891B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2008217254A (ja) | プレイリスト作成装置、およびプレイリスト作成方法 | |
JP5706718B2 (ja) | 動画合成システム及び方法並びに動画合成プログラム及びその記憶媒体 | |
EP1900207A2 (en) | Creating standardized playlists and maintaining coherency | |
JP2002278547A (ja) | 楽曲検索方法、楽曲検索用データ登録方法、楽曲検索装置及び楽曲検索用データ登録装置 | |
US11271993B2 (en) | Streaming music categorization using rhythm, texture and pitch | |
JP4560544B2 (ja) | 楽曲検索装置、楽曲検索方法および楽曲検索プログラム | |
JP2012247957A (ja) | データ処理装置およびプログラム | |
JP5516720B2 (ja) | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 | |
JP4898272B2 (ja) | プレイリスト検索装置およびプレイリスト検索方法 | |
WO2006048988A1 (ja) | コンテンツデータ検索装置 | |
JP2003242164A (ja) | 楽曲検索再生装置、及びそのシステム用プログラムを記録した媒体 | |
CN106775567B (zh) | 一种音效匹配方法及系统 | |
JP2010044756A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20090144253A1 (en) | Method of processing a set of content items, and data- processing device | |
JP5085577B2 (ja) | プレイリスト作成装置、楽曲再生装置、プレイリスト作成方法およびプレイリスト作成プログラム | |
CN111753127B (zh) | 音乐信息处理、推荐方法及装置 | |
JP2010165160A (ja) | 楽曲分類装置、楽曲検索システム及びコンピュータプログラム | |
JP2012159717A (ja) | 楽曲データの変化点検出装置、楽曲データの変化点検出方法及び楽曲データの変化点検出プログラム | |
JP5153451B2 (ja) | 類似アイテム検索装置及び類似アイテム検索方法並びにそのプログラムと記録媒体 | |
US20240325907A1 (en) | Method For Generating A Sound Effect | |
JP4447540B2 (ja) | カラオケ唱歌録音作品の鑑賞システム | |
JP2008210382A (ja) | 楽曲データ処理装置 | |
JP5521094B2 (ja) | 楽曲分類装置および楽曲検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140317 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5516720 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |