JP5474591B2 - Image selection apparatus, image selection method, and image selection program - Google Patents
Image selection apparatus, image selection method, and image selection program Download PDFInfo
- Publication number
- JP5474591B2 JP5474591B2 JP2010025933A JP2010025933A JP5474591B2 JP 5474591 B2 JP5474591 B2 JP 5474591B2 JP 2010025933 A JP2010025933 A JP 2010025933A JP 2010025933 A JP2010025933 A JP 2010025933A JP 5474591 B2 JP5474591 B2 JP 5474591B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- phrase
- content
- tag
- image selection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010187 selection method Methods 0.000 title claims description 6
- 238000000605 extraction Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 description 18
- 230000000007 visual effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010048909 Boredom Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、コンテンツに関連する画像を選定する画像選定装置、画像選定方法および画像選定プログラムに関する。 The present invention relates to an image selection device, an image selection method, and an image selection program for selecting an image related to content.
従来、画像表示に合せてBGM等の楽曲を再生する装置が知られている。たとえば特許文献1記載の情報再生装置は、デジタルカメラで撮影した画像のスライドショー再生時に、その再生する画像の撮影時期に見合うBGMを再生することで映像鑑賞効果を高めている。画像を主体として、音楽を検索して自動でBGMを付与させる方法を採用し、曲の発売日、または、曲の人気ランキングの最高となった期間などの日付と、撮影時期をマッチングさせて音楽を検索している。
2. Description of the Related Art Conventionally, an apparatus that reproduces music such as BGM in accordance with image display is known. For example, the information playback apparatus described in
特許文献2記載の音楽配信サーバは、楽曲を再生させる際に、データベースに記憶されている楽曲を選択し、該当楽曲に同期させて表示させるべき歌詞・解説・画像などの項目を指定する。そして、該当楽曲と、該当楽曲のヘッダに同期再生のための時間間隔を書き込んで端末に送信し、楽曲とその他情報を同期させて再生させている。
The music distribution server described in
特許文献3記載の携帯情報端末は、楽曲再生時に、音声認識によって歌詞を抽出し、その抽出された歌詞から所定のルールに基づいてキーワードを抽出し、キーワードに基づいて、ローカルストレージやインターネット上のWebページから画像を検索し、楽曲再生時に画像を表示させている。 The portable information terminal described in Patent Literature 3 extracts lyrics by voice recognition during music reproduction, extracts keywords from the extracted lyrics based on a predetermined rule, and uses local storage or the Internet on the basis of the keywords. Images are retrieved from a web page and displayed when music is played.
所定のルールとは、たとえば、ある設定期間内の歌詞単語の中で最も多く使用された単語を抽出キーワードとするようなルールや、ある設定期間内の歌詞単語の中で最も大きく発声された単語を抽出キーワードとするようなルール、ある設定期間内の複数の単語の中からランダムに選択した単語をキーワードとするようなルールである。 The predetermined rule is, for example, a rule that uses the most frequently used words in a lyric word within a certain setting period as an extraction keyword, or a word that is uttered most among lyric words within a certain setting period. Are extracted keywords, and a word randomly selected from a plurality of words within a certain setting period is used as a keyword.
インターネット上のウェブページを検索先として画像検索を行う場合、キーワードを用いてインターネット上の検索エンジンなどを用いて画像を検索する。また、上記インターネット上のウェブページを検索先とする場合、好ましくない画像が検索されるのを防ぐためのフィルタリング処理、あるいは、たとえば所望のジャンル等の画像のみが検索されるようなフィルタリング処理を行うことも可能にしている。 When an image search is performed using a web page on the Internet as a search destination, an image is searched using a search engine on the Internet using a keyword. In addition, when the web page on the Internet is a search destination, a filtering process for preventing an undesired image from being searched or a filtering process for searching only an image of a desired genre, for example, is performed. It also makes it possible.
なお、フィルタリング処理は、上記インターネットを経由して画像検索を行う際だけでなく、たとえば、上記キーワード抽出部にてキーワードを抽出する際に行っても良いとしている。その結果、上記キーワード抽出部では、好ましくない画像が検索されてしまう可能性が高いキーワードを抽出しないようなフィルタリング処理や、逆に、たとえば所望のジャンル等の画像が検索される可能性が高いキーワードのみを抽出するようなフィルタリング処理も可能にしている。 Note that the filtering process may be performed not only when the image search is performed via the Internet but also when the keyword extraction unit extracts a keyword, for example. As a result, in the keyword extraction unit, a filtering process that does not extract a keyword that is likely to cause an undesired image to be searched, and conversely, a keyword that is highly likely to search for an image of a desired genre, for example. Filtering processing that extracts only this is also possible.
特許文献4記載の画像提示装置は、楽曲から歌詞を抽出し、抽出された歌詞の出現時間を特定し、あらかじめ複数の視覚効果と視覚効果の表示に要する時間情報を対応させておき、抽出された歌詞に基づいて視覚効果を決定し、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付与している。 The image presentation device described in Patent Document 4 extracts lyrics from music, specifies the appearance time of the extracted lyrics, associates a plurality of visual effects with time information required to display the visual effects in advance, and extracts them. The visual effect is determined based on the lyrics, and the visual effect with movement is given according to the contents of the lyrics of the music.
視覚効果データベースは、単語と視覚効果とを対応づけて保持している。視覚効果は、抽出された歌詞中の単語が視覚効果データベースに存在するか探索し、もし単語が存在した場合には、その単語に対応する視覚効果とその視覚効果の所要時間とを視覚効果データベースから取得している。 The visual effect database stores words and visual effects in association with each other. The visual effect is searched for whether or not the word in the extracted lyrics exists in the visual effect database. If the word exists, the visual effect corresponding to the word and the time required for the visual effect are displayed in the visual effect database. Is getting from.
また、楽曲の再生に同期させてWeb画像を表示させるシステムや歌詞の印象に基づく楽曲検索のための楽曲自動分類技術について研究開発がなされている(たとえば非特許文献1〜5)。
In addition, research and development have been conducted on a system for displaying a Web image in synchronization with the reproduction of music and an automatic music classification technique for searching music based on the impression of lyrics (for example, Non-Patent
上記のように、楽曲等に合せてWeb上の画像を利用する技術は存在するが、基本的に利用する画像はユーザが選択しなければならない。そして、ユーザ自身がWeb画像から画像を選び、コンテンツに付与しようとすれば、その作業に膨大な労力を要し、たとえばスライドショーなどを生成する際の画像選択の労力には膨大な作業が必要となる。また、従来技術を利用した場合には共有サイトのランキングに基づいて画像を選定する場合には、必ずしもコンテンツに適した画像を選定できていない。 As described above, there is a technique for using an image on the Web in accordance with a music piece or the like, but the user must basically select an image to be used. If the user himself selects an image from a Web image and tries to add it to the content, the work requires an enormous amount of work. For example, the work of selecting an image when generating a slide show or the like requires an enormous amount of work. Become. In addition, when the conventional technology is used, when an image is selected based on the ranking of the shared site, an image suitable for the content cannot always be selected.
本発明は、このような事情に鑑みてなされたものであり、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる画像選定装置、画像選定方法および画像選定プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and an image selection apparatus, an image selection method, and an image selection apparatus that can automatically select an image suitable for content and eliminate the effort of the user himself to select an image on the Web. The purpose is to provide an image selection program.
(1)上記の目的を達成するため、本発明の画像選定装置は、コンテンツに関連する画像を選定する画像選定装置であって、特定のコンテンツから1または複数のキーワードを抽出するキーワード抽出部と、ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出するタグ抽出部と、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する語句関連度算出部と、前記算出された語句の関連度を用いて前記コンテンツと適合度の高い画像を選定する選定部とを備えることを特徴としている。 (1) In order to achieve the above object, an image selection device according to the present invention is an image selection device that selects an image related to content, and includes a keyword extraction unit that extracts one or a plurality of keywords from specific content; A tag extraction unit that extracts one or a plurality of tags attached to an image that can be acquired on the network, and a phrase relevance calculation unit that calculates the relevance of the phrase between the extracted keyword and the acquired tag And a selection unit that selects an image having a high degree of matching with the content using the calculated degree of association of the phrases.
このように、コンテンツに関するキーワードと画像に付与されたタグとの語句の関連度を用いて、画像を選定するため、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。 In this way, since the image is selected using the degree of association between the keyword related to the content and the tag attached to the image, an image suitable for the content can be automatically selected, and the user himself has the effort to select an image on the WEB. Can be eliminated.
(2)また、本発明の画像選定装置は、前記キーワード抽出部は、特定の楽曲から1または複数のキーワードを抽出することを特徴としている。これにより、楽曲に適した画像を選定することができ、楽曲再生時の画像表示に利用することができる。 (2) Further, the image selection device of the present invention is characterized in that the keyword extraction unit extracts one or a plurality of keywords from a specific music piece. Thereby, an image suitable for music can be selected, and can be used for image display during music reproduction.
(3)また、本発明の画像選定装置は、前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と前記取得されたタグのうちの1語句との共起確率を用いて前記語句の関連度を算出することを特徴としている。このように共起確率を利用することで、画像選定に適した語句の関連度を算出できる。 (3) Further, in the image selection device according to the present invention, the phrase relevance calculation unit uses a co-occurrence probability between one phrase of the extracted keywords and one phrase of the acquired tags. The degree of relevance of the word is calculated. In this way, by using the co-occurrence probability, it is possible to calculate the degree of association of words suitable for image selection.
(4)また、本発明の画像選定装置は、前記語句関連度算出部は、前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記語句の関連度を算出することを特徴徴としている。このように同じカテゴリの別の語句の寄与を差し引くことで、キーワードとタグの関連度を正確に評価することができ、画像選定に適した語句の関連度を算出できる。 (4) Further, in the image selection device according to the present invention, the phrase relevance calculation unit is configured so that, for other phrases belonging to the same category as the one phrase among the extracted keywords, The relevance of the phrase is calculated by subtracting the contribution of the co-occurrence probability with the phrase. In this way, by subtracting the contribution of another phrase in the same category, the degree of association between the keyword and the tag can be accurately evaluated, and the degree of association of the phrase suitable for image selection can be calculated.
(5)また、本発明の画像選定方法は、コンテンツに関連する画像を選定する画像選定方法であって、特定のコンテンツから1または複数のキーワードを抽出するステップと、ネットワーク上で取得可能な画像に付与された1または複数のタグを取得するステップと、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出するステップと、前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定するステップとを含むことを特徴としている。これにより、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。 (5) The image selection method of the present invention is an image selection method for selecting an image related to content, the step of extracting one or a plurality of keywords from specific content, and an image obtainable on a network. Using the step of acquiring one or more tags attached to the tag, calculating the relevance level of the phrase between the extracted keyword and the acquired tag, and using the calculated relevance level of the phrase And a step of selecting an image highly related to the content. As a result, an image suitable for the content can be automatically selected, and the user can eliminate the labor of selecting an image by WEB.
(6)また、本発明の画像選定プログラムは、コンテンツに関連する画像を選定させる画像選定プログラムであって、特定のコンテンツから1または複数のキーワードを抽出する処理と、ネットワーク上で取得可能な画像に付与された1または複数のタグを取得する処理と、前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する処理と、前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定する処理とをコンピュータに実行させることを特徴としている。これにより、自動でコンテンツに適した画像を選定でき、ユーザ自身がWEBで画像を選ぶ労力を無くすことができる。 (6) The image selection program according to the present invention is an image selection program for selecting an image related to content, and includes a process for extracting one or a plurality of keywords from specific content and an image that can be acquired on a network. Using the processing for acquiring one or more tags assigned to, the processing for calculating the degree of association between the extracted keyword and the acquired tag, and the degree of association between the calculated words It is characterized by having a computer execute processing for selecting an image highly related to content. As a result, an image suitable for the content can be automatically selected, and the user can eliminate the labor of selecting an image by WEB.
本発明によれば、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる。 According to the present invention, it is possible to automatically select an image suitable for content, and it is possible to eliminate the effort of the user himself to select an image on the Web.
以下に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。 Embodiments of the present invention will be described below with reference to the drawings. In order to facilitate understanding of the description, the same reference numerals are given to the same components in the respective drawings, and duplicate descriptions are omitted.
[第1の実施形態]
(画像選定装置の構成)
図1は、画像選定装置の構成を示すブロック図である。画像選定装置100は、ユーザUが指定する楽曲等のコンテンツに関連する画像を選定する。コンテンツには、楽曲以外にもブログや、映像が含まれる。画像選定装置100には、たとえばPCまたは携帯電話機が用いられる。図1に示すように、画像選定装置100は、リクエスト受付部111、データベース112、画像検索モジュール120、語句関連度辞書生成モジュール130、画像選定モジュール140、画像管理部151、表示時間管理モジュール160、再生制御部171、再生部172、歌詞表示部173および画像表示部174を備えている。
[First Embodiment]
(Configuration of image selection device)
FIG. 1 is a block diagram showing the configuration of the image selection apparatus. The
リクエスト受付部111は、ユーザUによる楽曲や画像のリクエストの入力を受け付ける。データベース112は、コンテンツ及び、コンテンツに対するキーワードを格納する。たとえば、コンテンツを楽曲とすると、楽曲の音源、歌詞情報、楽曲と歌詞の同期情報などを格納する。また、該当コンテンツに対するキーワードを格納し、たとえば、コンテンツを表現するキーワードを印象情報として格納する。
The
たとえば、「季節」のカテゴリに、「春」、「夏」、「秋」、「冬」の印象情報を格納する。「時間帯」のカテゴリに、「朝」、「昼」、「夕方」、「夜」の印象情報を格納してもよい。また、「天候」のカテゴリに、「晴れ」、「曇り」、「雨」、「雪」、「虹」の印象情報を格納してもよい。 For example, impression information of “spring”, “summer”, “autumn”, and “winter” is stored in the “season” category. Impression information of “morning”, “daytime”, “evening”, and “night” may be stored in the “time zone” category. Further, impression information of “sunny”, “cloudy”, “rain”, “snow”, and “rainbow” may be stored in the “weather” category.
画像検索モジュール120は、たとえばコンテンツを楽曲とすると、ユーザにより入力された楽曲の歌詞情報をもとに、スライドショーを構成する候補となる画像(以下、候補画像)をWebから検索する。具体的には、歌詞に出現する名詞と、キーワードとして歌詞全体の印象を表現する単語を用いて最適なクエリを選定する。そして、そのクエリでWeb画像検索を行い、歌詞の各行に対して最大1500枚程度の候補画像を取得する。なお、Web上で公開されている日本語形態素解析エンジンを用いて歌詞情報から名詞抽出を行うことができる。また、検索対象となる画像データベースとして、Flickr(登録商標)等の画像共有サイト400を用い、画像データに付与されているソーシャルタグをもとに画像検索を行うことができる。
For example, if the content is music, the
語句関連度辞書生成モジュール130は、コンテンツに付与されたキーワードに基づいて、キーワードと候補画像のタグとの語句の関連度を計算する。また、計算された語句の関連度を辞書として保管する。
The word / phrase relevance
画像選定モジュール140は、画像検索モジュール120によって得られた画像群から、コンテンツに付与されたキーワードに適した画像を選定する。各候補画像に対して、コンテンツの全体印象語との適合度を表現するscoreを算出し、その値が最も高い画像を選定することで、候補画像の中から最終的に用いる画像を選択する。
The
たとえば、適合度のscoreは、画像に付与されているすべてのソーシャルタグと全体印象語との関連強さをもとに算出する。これにより、全体印象語が直接タグとして付与されていない画像でも、”全体印象語らしさ”を表現することができる。そして、それをもとに画像を選定することで、スライドショー全体の統一感を生み出すことができる。また、楽曲に付与されている全体印象語の組み合わせによりscore算出の指標が変化するため、別々の楽曲に同じ画像が選定されるケースが少なくなり、より多様性のあるスライドショーを作成できる。 For example, the score of fitness is calculated based on the strength of association between all social tags attached to the image and the overall impression word. This makes it possible to express “likeness of the overall impression word” even in an image in which the overall impression word is not directly assigned as a tag. Then, by selecting images based on that, it is possible to create a unified feeling for the entire slide show. In addition, since the score calculation index changes depending on the combination of the overall impression words assigned to the music, the same image is not selected for different music, and a more diverse slide show can be created.
語句関連度辞書生成モジュール130および画像選定モジュール140の詳細は、後述する。画像管理部151は、楽曲の各管理区分と選定された画像とを対応付けて管理する。画像管理部151は、再生時に楽曲の各区分と画像との対応により、各区分の歌詞表示に対応させて画像を表示することができる。
Details of the phrase relevance
表示時間管理モジュール160は、スライドショーにおいて、各画像を表示する時間を適切にするために、画像切り替えタイミングの再構成を行う。その際には、ネットワーク上の楽曲データベース500や歌詞データベース600を利用する。
The display
単純に歌詞の行単位で歌詞とともに表示する画像を切り替えると、その歌詞の行の長さに画像の表示時間が依存し、適切な表示時間とならない事態が生じる。これを防止するため、画像の内容を十分に把握できるように表示時間を十分にとり、退屈感を生じさせない程度に表示時間を短くする。すなわち、表示時間の短い行は周辺の行と結合し、結合した区間では1枚の画像を表示し続け、一方表示時間の長い行は分割を行い、1行の中でも複数の画像を表示する。さらに、楽曲の画像表示時間の最頻値を基準に、間奏区間における画像切り替えタイミングも設定する。 If the image to be displayed together with the lyrics is simply switched in units of lyrics, the display time of the image depends on the length of the line of the lyrics, and an appropriate display time does not occur. In order to prevent this, a sufficient display time is taken so that the contents of the image can be sufficiently grasped, and the display time is shortened to such an extent that a feeling of boredom does not occur. That is, a line with a short display time is combined with surrounding lines, and one image is continuously displayed in the combined section, while a line with a long display time is divided, and a plurality of images are displayed in one line. Furthermore, the image switching timing in the interlude section is also set based on the mode value of the music image display time.
再生制御部171は、歌詞データベース600と通信し、楽曲の再生とそれに同期させた歌詞表示および画像表示を制御する。再生部172は、スピーカやヘッドホン等の出力装置を介して楽曲の音声を再生する。歌詞表示部173は、楽曲の再生に合せて画面上に歌詞を表示する。画像表示部174は、楽曲の再生に合せて、算出された画像表示時間にわたり選定された画像を表示する。画像表示部174は、連続する行に対応する歌詞表示時間同士の間隔が所定時間を超える場合には、間隔に対応する画像を表示してもよい。
The
図2は、モジュールの構成を示すブロック図である。図2に示すように、語句関連度辞書生成モジュール130は、カテゴリ抽出部131、キーワード抽出部132、タグ抽出部133、語句関連度算出部134を備えている。
FIG. 2 is a block diagram showing the configuration of the module. As shown in FIG. 2, the phrase relevance level
カテゴリ抽出部131は、ユーザUにより指定されたコンテンツ(特定のコンテンツ)から関連するカテゴリを抽出する。キーワード抽出部132は、カテゴリから1または複数のキーワードを抽出する。すなわち、コンテンツが楽曲である場合には、その楽曲の歌詞や全体の印象語から1または複数のキーワードを抽出する。このようにして、楽曲のキーワードを画像のタグとの語句関連度の算出に利用し、画像選定に利用する。なお、カテゴリはユーザにより手動で付与してもよいし、上記のように何らかのプログラムによりコンテンツから抽出してもよい。
The
タグ抽出部133は、ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出する。画像共有サイト400を利用することで、多数の画像および画像に付与されたタグを抽出できる。
The
語句関連度算出部134は、コンテンツから抽出されたキーワードと画像から抽出されたタグとの語句の関連度を算出する。このように、コンテンツに付与されたカテゴリ情報を利用し、コンテンツに関するキーワードと画像に付与されたタグとの語句の関連度を用いて、コンテンツに適合した画像を選定する。その結果、自動でコンテンツに適した画像を選定でき、ユーザ自身がWebで画像を選ぶ労力を無くすことができる。なお、スライドショーや、ブログ、などマルチメディアコンテンツに対して画像を付与する場合にも利用できる。
The phrase
語句関連度算出部134は、抽出されたキーワードのうちの1語句と取得されたタグのうちの1語句との共起確率を用いて語句の関連度を算出する。このように共起確率を利用することで、画像選定に適した語句の関連度を適正かつ容易に算出できる。
The phrase
その際には、抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、取得されたタグのうちの語句との共起確率分の寄与を差し引いて語句の関連度を算出してもよい。このように同じカテゴリの別の語句の寄与を差し引くことで、キーワードとタグの語句関連度を正確に評価することができ、画像選定に適した語句の関連度を算出できる。 In that case, the degree of relevance of the phrase is obtained by subtracting the contribution of the co-occurrence probability with the phrase in the acquired tag from another phrase belonging to the same category as the one of the extracted keywords. It may be calculated. Thus, by subtracting the contribution of another phrase in the same category, the phrase relevance of the keyword and the tag can be accurately evaluated, and the relevance of the phrase suitable for image selection can be calculated.
また、画像選定モジュール140は、タグ取得部141、画像適合度算出部142および選定部143を備えている。タグ取得部141は、候補として抽出された画像から画像に付与されたタグを取得する。
The
画像適合度算出部142は、ユーザUにより指定されたコンテンツ(特定のコンテンツ)と候補画像との適合度を算出する。このとき、画像に付与されたタグとコンテンツに関連するキーワードとの関連度を累積的に加算することが好ましく、これにより妥当な関連度を算出することができる。具体例は後述する。
The image
選定部143は、算出された語句の適合度の高い画像を選定する。コンテンツのキーワードと画像のタグとの語句の適合度を用いて画像を選定する。これにより、楽曲に適した画像を選定することができ、楽曲再生時の画像表示に利用することができる。
The
(画像選定装置の動作)
次に、画像選定装置100の動作を説明する。図3は、画像選定装置の動作の一例を示すフローチャートである。まず、ユーザUによるコンテンツの指定を受け付け(ステップS1)、キーワードの指定を受け付ける(ステップS2)。
(Operation of image selection device)
Next, the operation of the
次に、ネットワーク上で画像検索を行う(ステップS3)。検索結果に応じてキーワードとタグとの語句関連度を算出し(ステップS4)、算出された語句の関連度に応じて画像を選定する(ステップS5)。そして、選定された画像や歌詞の表示時間を決定し(ステップS6)、楽曲を再生し、再生に伴い歌詞および画像を表示して(ステップS7)終了する。以下に、各処理の詳細を説明する。 Next, an image search is performed on the network (step S3). The word / phrase relevance between the keyword and the tag is calculated according to the search result (step S4), and an image is selected according to the calculated relevance of the word / phrase (step S5). Then, the display time of the selected image or lyrics is determined (step S6), the music is reproduced, the lyrics and the image are displayed along with the reproduction (step S7), and the process ends. Details of each process will be described below.
(語句関連度算出)
語句関連度算出の動作を説明する。図4は、語句関連度算出の動作を示すフローチャートである。図4に示すように、まず、指定した楽曲からカテゴリ情報を抽出する(ステップT1)。楽曲から得られたカテゴリに関連するキーワードを抽出する(ステップT2)。
(Phrase relevance calculation)
The operation of the word relevance calculation will be described. FIG. 4 is a flowchart showing the operation of calculating the word association degree. As shown in FIG. 4, first, category information is extracted from the designated music (step T1). A keyword related to the category obtained from the music is extracted (step T2).
次に、Web上で検索された候補画像に付与されているタグ群を抽出し(ステップT3)、抽出されたタグ群からタグを抽出する(ステップT4)。そして、抽出された各タグについてユーザ数が閾値以上か否かを判定する(ステップT5)。ユーザ数が閾値未満である場合には、ステップT4に戻る。ユーザ数が閾値以上である場合には、そのタグと楽曲のキーワードとの語句の関連度を算出する(ステップT6)。 Next, a tag group attached to the candidate image searched on the Web is extracted (step T3), and a tag is extracted from the extracted tag group (step T4). And it is determined whether the number of users is more than a threshold value about each extracted tag (step T5). If the number of users is less than the threshold, the process returns to step T4. If the number of users is greater than or equal to the threshold, the degree of association between the tag and the keyword of the music is calculated (step T6).
関連度の算出後、すべてのタグについて判定が終了したか否かを判定する(ステップT7)。すべてのタグについて判定が終了していない場合には、ステップT4に戻る。すべてのタグについて判定が終了した場合には、すべてのキーワードについて処理が終了したか否かを判定する(ステップT8)。すべてのキーワードについて処理が終了していない場合にはステップT2に戻る。 After the relevance is calculated, it is determined whether or not the determination has been completed for all tags (step T7). If the determination is not completed for all tags, the process returns to step T4. If the determination is completed for all tags, it is determined whether the processing is completed for all keywords (step T8). If processing has not been completed for all keywords, the process returns to step T2.
すべてのキーワードについて処理が終了した場合には、すべてのカテゴリについて処理が終了したか否かを判定する(ステップT9)。すべてのカテゴリについて処理が終了していない場合にはステップT1に戻る。すべてのカテゴリについて処理が終了した場合には、カテゴリ毎の語句関連度辞書を作成する(ステップT10)。カテゴリ毎の語句関連度辞書の例については後述する。 When the process is completed for all keywords, it is determined whether the process is completed for all categories (step T9). If the processing has not been completed for all categories, the process returns to step T1. When the processing is completed for all categories, a phrase relevance dictionary for each category is created (step T10). An example of the phrase relevance dictionary for each category will be described later.
(画像選定の動作)
次に、画像選定の動作を説明する。図5は、画像選定の動作を示すフローチャートである。まず、ユーザによる入力画像を取得する(ステップP1)。そして、画像におけるタグ集合を取得する(ステップP2)。
(Image selection operation)
Next, an image selection operation will be described. FIG. 5 is a flowchart showing an image selection operation. First, an input image by the user is acquired (step P1). Then, a tag set in the image is acquired (step P2).
次に、入力画像について画像の適合度としてscoreを算出する(ステップP3)。そして、すべての画像について処理が終了したか否かを判定する(ステップP4)。すべての画像について処理が終了していないときにはステップP1に戻る。すべての画像について処理が終了したときには、画像の適合度のランキングを算出する(ステップP5)。そして、ランキングに基づいて画像を選定する(ステップP6)。 Next, a score is calculated as the image suitability for the input image (step P3). Then, it is determined whether or not the processing has been completed for all images (step P4). When the processing has not been completed for all the images, the process returns to Step P1. When the processing has been completed for all the images, the ranking of the suitability of the images is calculated (step P5). Then, an image is selected based on the ranking (step P6).
(画像選定の具体例)
以下に、画像選定処理の具体例を説明する。まず、カテゴリやキーワード等の数式による定義について説明する。コンテンツに付与されるキーワードのカテゴリCxの集合Wは次の数式で表すことができる。Ncはカテゴリの数である。
A specific example of the image selection process will be described below. First, definitions using mathematical formulas such as categories and keywords will be described. A set W of keyword categories Cx given to content can be expressed by the following mathematical formula. Nc is the number of categories.
また、カテゴリCxは次の数式で表すことができる。Nxはカテゴリに属するキーワードの数である。
一方、画像に付与されるタグ集合は、次の数式で表すことができる。NTwyはキーワードwyによって検索されたタグの数であり、NTiはコンテンツiに付与されているタグの総数である。
また、ユーザ集合は、以下の数式で表すことができる。NUwyはキーワードwyによって検索された画像の投稿ユーザ数である。
このような定義のもとで画像選定の処理を行う。まず、あるキーワードwyを抽出し、キーワードに基づいて、Web検索などの結果からタグ集合Twy及び、ユーザ集合Uwyを計算する。次に、タグ群Twyに存在する全てのタグに足して、該当タグを付与したユーザ数UFを計算する。UFに対しては、たとえば閾値THを設定することでノイズを削減することもできる。たとえばTH=5とすることができる。 Image selection processing is performed under such a definition. First, a certain keyword wy is extracted, and based on the keyword, a tag set Twy and a user set Uwy are calculated from the result of Web search or the like. Next, the number of users UF given the corresponding tag is calculated by adding all the tags existing in the tag group Twy. For UF, for example, noise can be reduced by setting a threshold value TH. For example, TH = 5 can be set.
その後、タグ集合Twyの各要素に対してwyとの語句の関連度Rを計算する。語句の関連度Rは以下のような式で計算することができる。Pは共起確率である。共起確率とは、キーワードとタグが一つの同じ画像に付与されている確率であり、キーワードとタグの関連の強さを表す指標として利用することができる。UF(t|wy)は、wyによって検索された画像のうちtというタグを持つ画像を投稿したユーザ数である。また、UF(wy)は、wyによって検索された画像を投稿したユーザ数である。Weightは、重み係数であり、任意に設定することができる。 Thereafter, the degree of association R of the word with wy is calculated for each element of the tag set Twy. The relevance level R of a phrase can be calculated by the following formula. P is the co-occurrence probability. The co-occurrence probability is a probability that a keyword and a tag are assigned to one and the same image, and can be used as an index representing the strength of association between the keyword and the tag. UF (t | wy) is the number of users who have posted images with the tag t among images searched by wy. Further, UF (wy) is the number of users who have posted images searched by wy. Weight is a weight coefficient and can be set arbitrarily.
式(6)はキーワードとタグとの関連の強さを示す語句の関連度Rを表現しており、式(5)などの共起確率をもとに算出することができる。最終的にキーワード毎に語句の関連度Rの高いタグを関連タグ集合と定義し、それをもとに各キーワードに対する語句の関連度Rおよび重要語を辞書として保持することができる。たとえば、キーワードが“春”の場合、“春”は“季節”という概念の印象語であるため、Cx={“春”、“夏”、“秋”、“冬”}を保持できる。 Equation (6) expresses the degree of association R of the phrase indicating the strength of the association between the keyword and the tag, and can be calculated based on the co-occurrence probability such as equation (5). Finally, a tag having a high degree of relevance R of words for each keyword is defined as a related tag set, and based on this, the relevance degree R of words and important words for each keyword can be held as a dictionary. For example, when the keyword is “spring”, since “spring” is an impression word of the concept of “season”, Cx = {“spring”, “summer”, “autumn”, “winter”} can be held.
図6は、語句関連度辞書の一例を示すテーブルである。図6では、各カテゴリCx={w1、w2、w3、w4}の語句と、各カテゴリに関連する各画像のタグとの語句の関連度Rが対応している。t_w1_1は、画像1に付与され、w1のカテゴリに属するタグである。R(t_w1_1|w1)は、キーワードw1と画像1に付与され、w1のカテゴリに属するタグt_w1_1との語句の関連度Rである。
FIG. 6 is a table showing an example of the phrase relevance dictionary. In FIG. 6, the degree of association R between the words of each category Cx = {w1, w2, w3, w4} and the tag of each image related to each category corresponds. t_w1_1 is a tag attached to the
このように定義した語句の関連度Rを、それぞれの全体印象語と共起するUF(t)≧THを満たすタグtを対象に算出し、たとえば語句の関連度Rが0.024以上のタグを関連タグとして判定することができる。 The relevance level R of the words and phrases defined in this way is calculated for the tag t that satisfies UF (t) ≧ TH that co-occurs with each overall impression word, for example, a tag whose relevance level R is 0.024 or more. Can be determined as related tags.
図7は、関連タグと語句の関連度の抽出結果の一例を示すテーブルである。図7では、“春”、“夏”、“朝”、“雨”に対しての関連語(tag)と語句関連度(value)を示しており、語句関連度の高い順にソートしてある。 FIG. 7 is a table showing an example of a result of extracting the degree of association between a related tag and a phrase. FIG. 7 shows related words (tags) and word relevance levels (value) for “spring”, “summer”, “morning”, and “rain”, sorted in descending order of word relevance levels. .
共起確率はFlickr(登録商標)におけるUF(User Frequency)をもとに算出することができ、UF(W)とは、単語集合Wの要素全てをクエリとしてAND検索した際の、検索結果におけるユニークな画像投稿者数を示す。単純に画像ヒット数ではなくUFを用いるのは、Flickr(登録商標)では一定のユーザが同一のタグを付与した画像を大量にアップロードすることで、画像ヒット数が不当に高い値になることがあるため、その影響を緩和するためである。 The co-occurrence probability can be calculated based on UF (User Frequency) in Flickr (registered trademark), and UF (W) is the result of AND search using all the elements of word set W as a query. Indicates the number of unique image contributors. The reason for simply using UF instead of image hits is that in Flickr (registered trademark), if a certain user uploads a large number of images with the same tag, the number of image hits can be unreasonably high. This is to mitigate the effect.
そして、キーワードwyに対するタグtの語句の関連度Rは、それらの共起確率Pから、wyと同じカテゴリに属する他のキーワードにおけるタグtとの共起確率Pの差分により算出することができる。キーワードとタグ間の共起確率だけでなく、同じカテゴリに属する他のキーワードPにおける共起確率Pも考慮することで、1つのキーワードに対してのみ共起確率の高いタグを重要視することができる。 Then, the degree of association R of the phrase of tag t with keyword wy can be calculated from the co-occurrence probability P based on the difference in co-occurrence probability P with tag t in another keyword belonging to the same category as wy. Considering not only the co-occurrence probability between keywords and tags, but also the co-occurrence probability P of other keywords P belonging to the same category, the tag with a high co-occurrence probability only for one keyword can be regarded as important. it can.
次に、画像検索モジュール120によって得られた画像群の中から画像Iiを抽出する。次に、Iiにおけるタグ集合Tiを取得し、式(7)などにより、コンテンツに付与されたキーワードと、画像のタグ情報からスコアを計算することができる。式(7)において関連辞書生成モジュールによって得られた関連辞書を利用することや、利用しなくとも画像の適合度としてscoreを計算することができる。
たとえば、画像の適合度のscoreとして、式(7)を利用することで、キーワードとの語句関連度が高く、かつ、ノイズタグが少ない画像を選定することができる。たとえば、コンテンツを楽曲とした場合、楽曲におけるキーワードとの関連の強いタグが多く付与されている画像ほど、大きい値をとるように設定することができる。このscoreに基づいて画像をランキング表示することや、ランキング上位Nまでの画像を自動で選定することができる。 For example, by using Equation (7) as the score of the degree of matching of an image, an image having a high degree of word relevance with a keyword and a small number of noise tags can be selected. For example, when the content is music, it can be set to take a larger value for an image to which more tags that are strongly related to the keyword in the music are assigned. Based on this score, images can be displayed in a ranking, and images up to the top N can be selected automatically.
[第2の実施形態]
上記の実施形態では、語句関連度辞書を画像選定が必要なときに動的に作成するが、事前に作成しておき、画像選定時に利用してもよい。図8は、語句関連度辞書を事前に作成する画像選定装置200の構成を示すブロック図である。図9は、モジュールの構成を示すブロック図である。画像選定装置200では、語句関連度辞書生成モジュール130を事前に機能させ、その後、画像選定モジュール140により、画像選定を行う。ただし、各部の機能は、実施形態1と同様なので省略する。
[Second Embodiment]
In the above embodiment, the phrase relevance dictionary is dynamically created when image selection is necessary. However, it may be created in advance and used at the time of image selection. FIG. 8 is a block diagram illustrating a configuration of the
100 画像選定装置
111 リクエスト受付部
112 データベース
120 画像検索モジュール
130 語句関連度辞書生成モジュール
131 カテゴリ抽出部
132 キーワード抽出部
133 タグ抽出部
134 語句関連度算出部
140 画像選定モジュール
141 タグ取得部
142 画像適合度算出部
143 選定部
151 画像管理部
160 表示時間管理モジュール
171 再生制御部
172 再生部
173 歌詞表示部
174 画像表示部
200 画像選定装置
400 画像共有サイト
500 楽曲データベース
600 歌詞データベース
U ユーザ
DESCRIPTION OF
Claims (5)
特定のコンテンツから1または複数のキーワードを抽出するキーワード抽出部と、
ネットワーク上で取得可能な画像に付与された1または複数のタグを抽出するタグ抽出部と、
前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する語句関連度算出部と、
前記算出された語句の関連度を用いて前記コンテンツと適合度の高い画像を選定する選定部とを備えることを特徴とする画像選定装置。 An image selection device for selecting an image related to content,
A keyword extractor that extracts one or more keywords from specific content;
A tag extraction unit that extracts one or more tags attached to an image obtainable on the network;
The extracted keyword and the acquisition by subtracting the contribution of the co-occurrence probability with the phrase in the acquired tag from another phrase belonging to the same category as the one of the extracted keywords A phrase relevance calculator that calculates the relevance of the phrase with the tagged tag,
An image selection apparatus comprising: a selection unit that selects an image having a high degree of matching with the content by using the calculated degree of association of words and phrases.
特定のコンテンツから1または複数のキーワードを抽出するステップと、
ネットワーク上で取得可能な画像に付与された1または複数のタグを取得するステップと、
前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出するステップと、
前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定するステップとを含むことを特徴とする画像選定方法。 An image selection method for selecting an image related to content,
Extracting one or more keywords from specific content;
Obtaining one or more tags attached to an image obtainable on a network;
The extracted keyword and the acquisition by subtracting the contribution of the co-occurrence probability with the phrase in the acquired tag from another phrase belonging to the same category as the one of the extracted keywords Calculating the relevance of the term to the tagged tag;
Selecting an image highly related to the content using the calculated degree of association of words.
特定のコンテンツから1または複数のキーワードを抽出する処理と、
ネットワーク上で取得可能な画像に付与された1または複数のタグを取得する処理と、
前記抽出されたキーワードのうちの1語句と同じカテゴリに属する他の語句に対して、前記取得されたタグのうちの語句との共起確率分の寄与を差し引いて前記抽出されたキーワードと前記取得されたタグとの語句の関連度を算出する処理と、
前記算出された語句の関連度を用いて前記コンテンツと関連の高い画像を選定する処理とをコンピュータに実行させることを特徴とする画像選定プログラム。
An image selection program for selecting images related to content,
Extracting one or more keywords from specific content;
Processing to acquire one or more tags attached to images that can be acquired on the network;
The extracted keyword and the acquisition by subtracting the contribution of the co-occurrence probability with the phrase in the acquired tag from another phrase belonging to the same category as the one of the extracted keywords Calculating the degree of relevance of the word to the tagged tag,
An image selection program that causes a computer to execute processing for selecting an image highly related to the content by using the calculated degree of association of words.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010025933A JP5474591B2 (en) | 2010-02-08 | 2010-02-08 | Image selection apparatus, image selection method, and image selection program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010025933A JP5474591B2 (en) | 2010-02-08 | 2010-02-08 | Image selection apparatus, image selection method, and image selection program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011164865A JP2011164865A (en) | 2011-08-25 |
JP5474591B2 true JP5474591B2 (en) | 2014-04-16 |
Family
ID=44595484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010025933A Expired - Fee Related JP5474591B2 (en) | 2010-02-08 | 2010-02-08 | Image selection apparatus, image selection method, and image selection program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5474591B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6317609B2 (en) * | 2014-03-31 | 2018-04-25 | 株式会社エクシング | COMMUNICATION TERMINAL DEVICE, SERVER DEVICE, PROGRAM, DATA PROVIDING METHOD, AND KARAOKE SYSTEM |
US10289700B2 (en) * | 2016-03-01 | 2019-05-14 | Baidu Usa Llc | Method for dynamically matching images with content items based on keywords in response to search queries |
CN115983199B (en) * | 2023-03-16 | 2023-05-30 | 山东天成书业有限公司 | Mobile digital publishing system and method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728823A (en) * | 1993-07-09 | 1995-01-31 | Matsushita Electric Ind Co Ltd | Coocurrence word extracting method and device therefor |
JPH09288681A (en) * | 1996-04-23 | 1997-11-04 | Toshiba Corp | Background video retrieval, and display device, and background video retrieval method |
JP2006228059A (en) * | 2005-02-18 | 2006-08-31 | Tokyo Institute Of Technology | System and method for presentation content search using positional information of pointer and computer-readable storage medium |
JP2006244002A (en) * | 2005-03-02 | 2006-09-14 | Sony Corp | Content reproduction device and content reproduction method |
JP4447552B2 (en) * | 2005-12-20 | 2010-04-07 | 日本電信電話株式会社 | Information providing method and apparatus, program, and computer-readable recording medium |
JP2008226061A (en) * | 2007-03-15 | 2008-09-25 | Fujifilm Corp | Image tag designating device, image searching device, operation control method therefor and program for controlling those computers |
-
2010
- 2010-02-08 JP JP2010025933A patent/JP5474591B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011164865A (en) | 2011-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210294833A1 (en) | System and method for rich media annotation | |
US10146869B2 (en) | Systems and methods for organizing and analyzing audio content derived from media files | |
US7818329B2 (en) | Method and apparatus for automatic multimedia narrative enrichment | |
US8156114B2 (en) | System and method for searching and analyzing media content | |
US20090259623A1 (en) | Systems and Methods for Associating Metadata with Media | |
JP5306114B2 (en) | Query extraction device, query extraction method, and query extraction program | |
CN105224581B (en) | The method and apparatus of picture are presented when playing music | |
CN111046225B (en) | Audio resource processing method, device, equipment and storage medium | |
JP6337183B1 (en) | Text extraction device, comment posting device, comment posting support device, playback terminal, and context vector calculation device | |
US10104356B2 (en) | Scenario generation system, scenario generation method and scenario generation program | |
CN106888154B (en) | Music sharing method and system | |
US10114891B2 (en) | Method and system of audio retrieval and source separation | |
JP5474591B2 (en) | Image selection apparatus, image selection method, and image selection program | |
JP2014153977A (en) | Content analysis device, content analysis method, content analysis program, and content reproduction system | |
KR102252522B1 (en) | Method and system for automatic creating contents list of video based on information | |
CN113407775B (en) | Video searching method and device and electronic equipment | |
JP2019008779A (en) | Text extraction apparatus, comment posting apparatus, comment posting support apparatus, reproduction terminal, and context vector calculation apparatus | |
US11410706B2 (en) | Content pushing method for display device, pushing device and display device | |
WO2007029207A2 (en) | Method, device and system for providing search results | |
JP2005236546A (en) | Method, apparatus, and program for partial content creation | |
JP6114980B2 (en) | Music processing apparatus and music processing method | |
JP2007293602A (en) | System and method for retrieving image and program | |
TWI780333B (en) | Method for dynamically processing and playing multimedia files and multimedia play apparatus | |
KR101575819B1 (en) | Video search and offering method | |
JP6621437B2 (en) | Illegal content search device, illegal content search method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5474591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |