JP2019003270A - 学習装置、映像検索装置、方法、及びプログラム - Google Patents
学習装置、映像検索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2019003270A JP2019003270A JP2017115218A JP2017115218A JP2019003270A JP 2019003270 A JP2019003270 A JP 2019003270A JP 2017115218 A JP2017115218 A JP 2017115218A JP 2017115218 A JP2017115218 A JP 2017115218A JP 2019003270 A JP2019003270 A JP 2019003270A
- Authority
- JP
- Japan
- Prior art keywords
- data
- lyrics
- keyword
- tag
- lyric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
今すぐにでも会いたいの
・・・
・場所キーワード:映像中の場所を表す単語や表現
・季節キーワード:映像中の季節を表す単語や表現
・イベントキーワード:映像中のイベントを表す単語や表現
・行動キーワード:映像中の行動や動作を表す単語や表現
・感情キーワード:映像中の感情を表す単語や表現
・場所キーワード:「場所」、「建造物」、「乗り物」、「仕事場」、および、これらの下位の意味属性に対応する単語
・季節キーワード:「季節」、および、これらの下位の意味属性に対応する単語
・イベントキーワード:「式・行事等」、「生活」、および、これらの下位の意味属性に対応する単語
少年が公園に行く
場所キーワード「公園」
季節キーワード「夏」
イベントキーワードなし
概要テキストのキーワードリスト:[カジュアル(2回),二人(2回),楽しい(1回),...]
概要テキストのトピックリスト:[33,2,27]
まず、各ジャンルで、概要テキストごとに下記のようなクロス集計と呼ばれる表を作成する。
・・・(1)
・・・(2)
32、232 歌詞用キーワード抽出部
34 各歌詞のキーワードリスト
38 概要テキスト用キーワード抽出部
40、240 各概要テキストのキーワードリスト
42 歌詞用トピックモデル作成部
44、244 歌詞用トピックモデル
46、246 歌詞用トピック抽出部
48 各歌詞のトピックリスト
50 概要テキスト用トピックモデル作成部
52 概要テキスト用トピックモデル
54 概要テキスト用トピック抽出部
56、256 各概要テキストのトピックリスト
58 歌詞・概要テキストペア正解データ
60 不正解データ作成部
62 歌詞・概要テキストペア不正解データ
64 歌詞フィルタ学習部
66 歌詞フィルタ記憶部
70 タグ付き楽曲映像ペアデータ記憶部
72 ジャンルフィルタ学習部
74 テンポフィルタ学習部
76 タグフィルタ記憶部
100 学習装置
200 映像検索装置
210 入力部
264 歌詞フィルタ適用部
266 歌詞フィルタ記憶部
272 ジャンルフィルタ適用部
274 テンポフィルタ適用部
276 タグフィルタ記憶部
278 映像検索部
290 出力部
Claims (8)
- 概要テキストデータが付与された複数の映像から、楽曲に適した映像を検索する映像検索装置であって、
入力された、楽曲の付加情報を表す1種類以上のタグが付与された楽曲の歌詞データから、歌詞用キーワードを抽出する歌詞用キーワード抽出部と、
楽曲の歌詞データと、前記楽曲の歌詞データに適した映像に付与された概要テキストデータとのペアである正解データの前記歌詞データから抽出された歌詞用キーワード及び前記正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、楽曲の歌詞データと、前記楽曲の歌詞データに適していない映像に付与された概要テキストデータとのペアである不正解データの前記歌詞データから抽出された歌詞用キーワード及び前記不正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量とに基づいて予め学習された、楽曲の歌詞データに適した映像を検索するための歌詞に関するフィルタを記憶する歌詞フィルタ記憶部と、
前記複数の映像の各々に対する、前記歌詞用キーワード抽出部によって抽出された歌詞用キーワード及び前記映像に付与された概要テキストデータから抽出される概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、前記歌詞に関するフィルタとに基づいて、前記入力された楽曲の歌詞データに対する前記映像の各々のスコアを算出する歌詞フィルタ適用部と、
前記タグが付与された学習用の楽曲の各々と、前記複数の映像の各々との予め求められた対応付けに基づいて予め学習された、前記タグの種類毎の、前記タグの種類が表す付加情報と前記複数の映像の各々との結び付きの強さを測るための前記タグに関するフィルタを記憶するタグフィルタ記憶部と、
前記タグの種類毎に、前記入力された楽曲の前記タグの前記付加情報と、前記タグに関するフィルタとに基づいて、前記入力された楽曲の前記タグの前記付加情報に対する前記映像の各々のスコアを算出するタグフィルタ適用部と、
前記算出された前記入力された楽曲の歌詞データに対する前記映像の各々のスコアと、前記算出された前記入力された楽曲の前記タグの前記付加情報に対する前記映像の各々のスコアとに基づいて、前記入力された楽曲に適した映像を検索する映像検索部と、
を含む映像検索装置。 - 前記タグの種類は、前記楽曲のジャンル、及び前記楽曲のテンポを含み、
前記タグフィルタ適用部は、前記入力された楽曲の前記ジャンルに関する前記付加情報に対する前記映像の各々のスコアと、前記入力された楽曲の前記テンポに関する前記付加情報に対する前記映像の各々のスコアとを算出し、
前記映像検索部は、前記算出された前記入力された楽曲の歌詞データに対する前記映像の各々のスコアと、前記ジャンルに関する前記付加情報に対する前記映像の各々のスコアと、前記テンポに関する前記付加情報に対する前記映像の各々のスコアとに基づいて、映像を検索する請求項1に記載の映像検索装置。 - 概要テキストデータが付与された複数の映像から、楽曲の歌詞データに適した映像を検索するためのフィルタを学習する学習装置であって、
楽曲の付加情報を表す1種類以上のタグが付与された楽曲の歌詞データと、前記楽曲の歌詞データに適した映像に付与された概要テキストデータとのペアである正解データ、及び楽曲の歌詞データと、前記楽曲の歌詞データに適していない映像に付与された概要テキストデータとのペアである不正解データに含まれる歌詞データの各々から、歌詞用キーワードを抽出する歌詞用キーワード抽出部と、
前記正解データ及び前記不正解データに含まれる概要テキストデータの各々から、概要テキスト用キーワードを抽出する概要テキスト用キーワード抽出部と、
前記正解データの前記歌詞データから抽出された歌詞用キーワード及び前記正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、前記不正解データの前記歌詞データから抽出された歌詞用キーワード及び前記不正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量とに基づいて、歌詞に関するフィルタを学習する歌詞フィルタ学習部と、
前記タグが付与された学習用の楽曲の各々と、前記複数の映像の各々との予め求められた対応付けとに基づいて、前記タグの種類毎の、前記タグの種類が表す付加情報と前記複数の映像の各々との結び付きの強さを測るための前記タグに関するフィルタを学習するタグフィルタ学習部と、
を含む学習装置。 - 前記タグの種類は、前記楽曲のジャンル、及び前記楽曲のテンポを含み、
前記タグフィルタ学習部は、前記ジャンル、及び前記テンポの各々のタグに関するフィルタを学習する請求項3に記載の学習装置。 - 概要テキストデータが付与された複数の映像から、楽曲に適した映像を検索する映像検索装置における映像検索方法であって、
歌詞用キーワード抽出部が、入力された、楽曲の付加情報を表す1種類以上のタグが付与された楽曲の歌詞データから、歌詞用キーワードを抽出するステップと、
歌詞フィルタ適用部が、前記複数の映像の各々に対する、前記歌詞用キーワード抽出部によって抽出された歌詞用キーワード及び前記映像に付与された概要テキストデータから抽出される概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、歌詞フィルタ記憶部に記憶された、楽曲の歌詞データと、前記楽曲の歌詞データに適した映像に付与された概要テキストデータとのペアである正解データの前記歌詞データから抽出された歌詞用キーワード及び前記正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、楽曲の歌詞データと、前記楽曲の歌詞データに適していない映像に付与された概要テキストデータとのペアである不正解データの前記歌詞データから抽出された歌詞用キーワード及び前記不正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量とに基づいて予め学習された、楽曲の歌詞データに適した映像を検索するための歌詞に関するフィルタとに基づいて、前記入力された楽曲の歌詞データに対する前記映像の各々のスコアを算出するステップと、
タグフィルタ適用部が、前記タグの種類毎に、前記入力された楽曲の前記タグの前記付加情報と、タグフィルタ記憶部に記憶された、前記タグが付与された学習用の楽曲の各々と、前記複数の映像の各々との予め求められた対応付けに基づいて予め学習された、前記タグの種類毎の、前記タグの種類が表す付加情報と前記複数の映像の各々との結び付きの強さを測るための前記タグに関するフィルタとに基づいて、前記入力された楽曲の前記タグの前記付加情報に対する前記映像の各々のスコアを算出するステップと、
映像検索部が、前記算出された前記入力された楽曲の歌詞データに対する前記映像の各々のスコアと、前記算出された前記入力された楽曲の前記タグの前記付加情報に対する前記映像の各々のスコアとに基づいて、前記入力された楽曲に適した映像を検索するステップと、
を含む映像検索方法。 - 概要テキストデータが付与された複数の映像から、楽曲の歌詞データに適した映像を検索するためのフィルタを学習する学習装置における学習方法であって、
歌詞用キーワード抽出部が、楽曲の付加情報を表す1種類以上のタグが付与された楽曲の歌詞データと、前記楽曲の歌詞データに適した映像に付与された概要テキストデータとのペアである正解データ、及び楽曲の歌詞データと、前記楽曲の歌詞データに適していない映像に付与された概要テキストデータとのペアである不正解データに含まれる歌詞データの各々から、歌詞用キーワードを抽出するステップと、
概要テキスト用キーワード抽出部が、前記正解データ及び前記不正解データに含まれる概要テキストデータの各々から、概要テキスト用キーワードを抽出するステップと、
歌詞フィルタ学習部が、前記正解データの前記歌詞データから抽出された歌詞用キーワード及び前記正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量と、前記不正解データの前記歌詞データから抽出された歌詞用キーワード及び前記不正解データの前記概要テキストデータから抽出された概要テキスト用キーワードの組み合わせを表すキーワードペア特徴量とに基づいて、歌詞に関するフィルタを学習するステップと、
タグフィルタ学習部が、前記タグが付与された学習用の楽曲の各々と、前記複数の映像の各々との予め求められた対応付けとに基づいて、前記タグの種類毎の、前記タグの種類が表す付加情報と前記複数の映像の各々との結び付きの強さを測るための前記タグに関するフィルタを学習するステップと、
を含む学習方法。 - コンピュータを、請求項1又は請求項2に記載の映像検索装置の各部として機能させるためのプログラム。
- コンピュータを、請求項3又は請求項4に記載の学習装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017115218A JP6735711B2 (ja) | 2017-06-12 | 2017-06-12 | 学習装置、映像検索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017115218A JP6735711B2 (ja) | 2017-06-12 | 2017-06-12 | 学習装置、映像検索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019003270A true JP2019003270A (ja) | 2019-01-10 |
JP6735711B2 JP6735711B2 (ja) | 2020-08-05 |
Family
ID=65007854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017115218A Active JP6735711B2 (ja) | 2017-06-12 | 2017-06-12 | 学習装置、映像検索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6735711B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977318A (zh) * | 2019-04-04 | 2019-07-05 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
JP2022104310A (ja) * | 2020-12-28 | 2022-07-08 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09288681A (ja) * | 1996-04-23 | 1997-11-04 | Toshiba Corp | 背景映像検索表示装置および背景映像検索方法 |
JP2013020462A (ja) * | 2011-07-12 | 2013-01-31 | Yahoo Japan Corp | 関連度算出装置及び方法 |
JP2013254420A (ja) * | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
WO2014208581A1 (ja) * | 2013-06-26 | 2014-12-31 | Kddi株式会社 | シナリオ生成システム、シナリオ生成方法およびシナリオ生成プログラム |
JP2016081265A (ja) * | 2014-10-16 | 2016-05-16 | 日本電気株式会社 | 映像選択装置、映像選択方法、映像選択プログラム、特徴量生成装置、特徴量生成方法及び特徴量生成プログラム |
-
2017
- 2017-06-12 JP JP2017115218A patent/JP6735711B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09288681A (ja) * | 1996-04-23 | 1997-11-04 | Toshiba Corp | 背景映像検索表示装置および背景映像検索方法 |
JP2013020462A (ja) * | 2011-07-12 | 2013-01-31 | Yahoo Japan Corp | 関連度算出装置及び方法 |
JP2013254420A (ja) * | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
WO2014208581A1 (ja) * | 2013-06-26 | 2014-12-31 | Kddi株式会社 | シナリオ生成システム、シナリオ生成方法およびシナリオ生成プログラム |
JP2016081265A (ja) * | 2014-10-16 | 2016-05-16 | 日本電気株式会社 | 映像選択装置、映像選択方法、映像選択プログラム、特徴量生成装置、特徴量生成方法及び特徴量生成プログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977318A (zh) * | 2019-04-04 | 2019-07-05 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
CN109977318B (zh) * | 2019-04-04 | 2021-06-29 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
JP2022104310A (ja) * | 2020-12-28 | 2022-07-08 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
JP7190479B2 (ja) | 2020-12-28 | 2022-12-15 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6735711B2 (ja) | 2020-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tahmasebi et al. | Survey of computational approaches to lexical semantic change detection | |
Bonet-Jover et al. | Exploiting discourse structure of traditional digital media to enhance automatic fake news detection | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
KR20120054986A (ko) | 디지털 콘텐츠 검색 장치 및 방법 | |
AU2020103004A4 (en) | Method to build a document semantic and entity relationship model | |
WO2009123260A1 (ja) | 共起辞書作成システムおよびスコアリングシステム | |
JP2011118689A (ja) | 検索方法及びシステム | |
US11087087B1 (en) | Comparative expression processing | |
JP6735711B2 (ja) | 学習装置、映像検索装置、方法、及びプログラム | |
Chifu et al. | A system for detecting professional skills from resumes written in natural language | |
Jha et al. | Hsas: Hindi subjectivity analysis system | |
Wattiheluw et al. | Developing word sense disambiguation corpuses using Word2vec and Wu Palmer for disambiguation | |
Ullah et al. | Pattern and semantic analysis to improve unsupervised techniques for opinion target identification | |
Malandrakis et al. | Emotiword: Affective lexicon creation with application to interaction and multimedia data | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
JP6553557B2 (ja) | 学習装置、映像検索装置、方法、及びプログラム | |
JP2002278982A (ja) | 情報抽出方法および情報検索方法 | |
Garrido et al. | NEREA: Named entity recognition and disambiguation exploiting local document repositories | |
JP6375367B2 (ja) | 反論生成方法,反論生成システム | |
Vu et al. | Building a vietnamese sentiwordnet using vietnamese electronic dictionary and string kernel | |
CN112732885A (zh) | 用于问答系统的答案扩展方法、装置及电子设备 | |
Prasad et al. | Lexicon based extraction and opinion classification of associations in text from Hindi weblogs | |
Martín-Rodilla | Adding Temporal Dimension to Ontology Learning Models for Depression Signs Detection from Social Media Texts. | |
O'Hara et al. | Inferring Chord Sequence Meanings via Lyrics: Process and Evaluation. | |
WO2017138057A1 (ja) | 文章生成システム及び文章生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190827 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6735711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |