JP6137960B2 - Content search apparatus, method, and program - Google Patents

Content search apparatus, method, and program Download PDF

Info

Publication number
JP6137960B2
JP6137960B2 JP2013130518A JP2013130518A JP6137960B2 JP 6137960 B2 JP6137960 B2 JP 6137960B2 JP 2013130518 A JP2013130518 A JP 2013130518A JP 2013130518 A JP2013130518 A JP 2013130518A JP 6137960 B2 JP6137960 B2 JP 6137960B2
Authority
JP
Japan
Prior art keywords
word
content
map
user
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013130518A
Other languages
Japanese (ja)
Other versions
JP2015005174A (en
Inventor
宮崎 勝
勝 宮崎
山田 一郎
一郎 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2013130518A priority Critical patent/JP6137960B2/en
Publication of JP2015005174A publication Critical patent/JP2015005174A/en
Application granted granted Critical
Publication of JP6137960B2 publication Critical patent/JP6137960B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、推薦コンテンツを検索する装置、方法及びプログラムに関する。   The present invention relates to an apparatus, a method, and a program for searching for recommended content.

近年、文書、音声、画像及び映像等、様々な種類の膨大なコンテンツがインターネット上で閲覧可能となっている。これらを効率よく検索するために、キーワード等で高速にコンテンツを検索する技術はもとより、より高度な、ユーザの嗜好を反映したコンテンツ検索技術等が求められている。   In recent years, enormous contents of various types such as documents, sounds, images, and videos can be browsed on the Internet. In order to efficiently search for these, not only a technique for searching for contents at high speed using keywords or the like, but also a more advanced contents search technique that reflects user preferences is required.

個人の嗜好を利用した情報検索を拡張する試みとして、ソーシャルメディアを利用し、他者の視点で情報を検索する技術も提案されている。例えば、インターネット上のショッピングサイトでは、他のユーザのレビューや購買履歴を利用した商品の推薦方法が用いられている。この推薦方法によれば、「この商品を買ったユーザは、こんな商品も買っています」といった「協調フィルタリング」と呼ばれる機能を利用することで、ユーザが暗黙的に好む商品等の検索、推薦等を行うことができる。   As an attempt to expand information retrieval using personal preferences, a technology for retrieving information from the perspective of others using social media has also been proposed. For example, in a shopping site on the Internet, a product recommendation method using reviews and purchase histories of other users is used. According to this recommendation method, a function called “collaborative filtering” such as “the user who bought this product also bought such a product” is used to search for, recommend, etc. the product implicitly liked by the user. It can be performed.

さらに、SNS(Social Networking Service)上での人と人との繋がりを利用し、SNS上での友人が閲覧した(興味を持った)コンテンツを自動抽出する技術が提案されている(例えば、特許文献1参照)。また、不特定多数の人々が記録したコメント情報を用いて注目度の高いコンテンツを抽出して自動的にそのコンテンツを録画する技術が提案されている(例えば、特許文献2参照)。   Furthermore, a technique for automatically extracting contents viewed (interested) by a friend on the SNS using a connection between people on an SNS (Social Networking Service) has been proposed (for example, patents). Reference 1). In addition, a technique has been proposed in which content with a high degree of attention is extracted using comment information recorded by an unspecified number of people and the content is automatically recorded (see, for example, Patent Document 2).

特開2012−256252号公報JP 2012-256252 A 特開2012−049995号公報JP 2012-049995 A

ところで、コンテンツには、ある1つのテーマについて様々な観点から作られたものが多数含まれていると考えられる。例えば、テレビ放送等の「番組」を例にとると、「消費税増税」という事柄に対して、その「デメリット(例:景気の落ち込み)」という観点から作られた番組もあれば、逆にその「メリット(例:福祉の充実)」の観点から作られたものもある。したがって、ユーザは、これらの様々な観点に基づく情報をバランス良く閲覧することを望む場合が多い。   By the way, it is considered that the content includes many items created from various viewpoints with respect to a certain theme. For example, in the case of “programs” such as TV broadcasts, there are some programs that were created from the perspective of “demerits (eg: economic downturn)” against the “consumption tax increase”. Some were created from the perspective of its “merits (eg, enhancement of welfare)”. Therefore, the user often desires to browse information based on these various viewpoints in a balanced manner.

しかしながら、これらの様々な番組を検索する場合、ユーザの「経済情報を好む」という嗜好情報を用いると、消費税に対してはデメリットに関係する番組を多く検索及び推薦していくことになっていた。
また、前述の技術によっても、他者の行動履歴等を利用することで、個人の嗜好に囚われないコンテンツへの接触が可能となるが、様々な観点からバランス良く情報を得ることは難しかった。
However, when searching for these various programs, if the user's preference information “prefers economic information” is used, many consumption related programs are searched and recommended for consumption tax. It was.
In addition, even with the above-described technology, it is possible to contact content that is not trapped by individual preference by using the action history of others, but it is difficult to obtain information in a balanced manner from various viewpoints.

本発明は、ユーザが今まで接してこなかった概念を含むコンテンツを抽出できるコンテンツ検索装置、方法及びプログラムを提供することを目的とする。   An object of this invention is to provide the content search apparatus, method, and program which can extract the content containing the concept which the user has not touched until now.

本発明に係るコンテンツ検索装置は、複数の単語の関係を記述した単語関係データを記憶する単語ネットワーク蓄積部と、コンテンツ情報を記憶するコンテンツ蓄積部と、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得部と、コンテンツ毎に、前記単語情報獲得部により抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成部と、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較部と、を備える。   A content search apparatus according to the present invention includes a word network storage unit that stores word relationship data describing a relationship between a plurality of words, a content storage unit that stores content information, and a word that extracts a word included in the content information An information acquisition unit, a word map generation unit that generates a word map with the word relation data added to the words extracted by the word information acquisition unit for each content, and a word map for the content selected by the user A word map comparison unit that preferentially extracts content with a small number of common parts of the word map from the other content compared to the word map for the other content.

この構成によれば、コンテンツ検索装置は、事前に用意した単語同士の関係を記述した単語関係データを利用して、ユーザが視聴したコンテンツの情報から生成した単語マップと、他のコンテンツの情報から生成した単語マップとを比較し、互いに共通部分が少ないコンテンツを優先的に抽出する。したがって、視聴したコンテンツと関連しつつも、ユーザが今まで接してこなかった概念を含むコンテンツが推薦される。
この結果、ユーザは、視聴したコンテンツのテーマに関連しつつも、多数の観点が含まれたコンテンツ群が網羅的に推薦されることにより、知識や思考の範囲を拡大させることができる。
According to this configuration, the content search device uses a word map generated from information on content viewed by the user and information on other content using word relationship data describing a relationship between words prepared in advance. The generated word maps are compared, and contents with few common parts are preferentially extracted. Therefore, the content including the concept that the user has not touched until now is recommended while being related to the viewed content.
As a result, the user can expand the range of knowledge and thought by comprehensively recommending a content group including many viewpoints while being related to the theme of the viewed content.

前記単語マップ比較部は、前記ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出してもよい。   The word map comparison unit includes at least a part of important words determined to be relatively high among words included in the word map for the content selected by the user, and the word maps Content with a long distance may be preferentially extracted.

この構成によれば、コンテンツ検索装置は、重要単語が共通しているため関連性が高く、かつ、単語マップ間の距離が遠いため視点が異なるコンテンツを優先して推薦できる。この結果、コンテンツ検索装置は、ユーザに適切なコンテンツを推薦できる。   According to this configuration, the content search apparatus is highly relevant because important words are common, and can recommend content with different viewpoints preferentially because the distance between word maps is long. As a result, the content search device can recommend appropriate content to the user.

前記単語マップ比較部は、前記単語関係データにおける関係リンクの種類に基づいて、前記単語マップ同士の距離に重み付けを行ってもよい。   The word map comparison unit may weight the distance between the word maps based on the type of relation link in the word relation data.

この構成によれば、コンテンツ検索装置は、関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行うので、コンテンツ間の概念の相違をより正確に判定し、ユーザへコンテンツを適切に推薦できる。   According to this configuration, the content search device weights the distance between the word maps based on the type of relational link, so it is possible to more accurately determine the conceptual difference between the content and appropriately recommend the content to the user. it can.

前記単語マップ生成部は、前記単語情報獲得部により抽出された単語のうち、所定の重要度に満たない単語を除外して、前記単語マップを生成してもよい。   The word map generation unit may generate the word map by excluding words that are less than a predetermined importance from the words extracted by the word information acquisition unit.

この構成によれば、コンテンツ検索装置は、単語マップを生成する際に、所定の重要度に満たない単語を除外する。したがって、コンテンツ検索装置は、コンテンツの内容とは関係の薄いノイズとなる単語を排除して、コンテンツ内容をより正確に表した単語マップを生成できる。   According to this configuration, the content search apparatus excludes words that do not satisfy the predetermined importance when generating the word map. Therefore, the content search apparatus can generate a word map that more accurately represents the content content by eliminating words that cause noise that is not closely related to the content content.

前記重要度は、前記単語情報獲得部により抽出された単語に対するTF−IDFに基づく指標であってもよい。   The importance may be an index based on TF-IDF for the word extracted by the word information acquisition unit.

この構成によれば、コンテンツ検索装置は、TF−IDFに基づく指標を用いて、精度良く容易に単語の重要度を算出できる。   According to this configuration, the content search apparatus can easily calculate the importance of words with high accuracy using an index based on TF-IDF.

前記重要度は、前記単語情報獲得部により抽出された単語に対する前記単語関係データにおける関係リンクの数に基づく指標であってもよい。   The importance may be an index based on the number of related links in the word relationship data for the word extracted by the word information acquisition unit.

この構成によれば、コンテンツ検索装置は、関係リンクの数に基づく指標を用いて、精度良く容易に単語の重要度を算出できる。   According to this configuration, the content search apparatus can easily calculate the importance of a word with high accuracy using an index based on the number of related links.

本発明に係るコンテンツ検索装置は、ユーザ毎のコンテンツの選択履歴を記憶する履歴蓄積部を備え、前記単語マップ比較部は、前記選択履歴に含まれないコンテンツを優先的に抽出してもよい。   The content search device according to the present invention may include a history storage unit that stores a content selection history for each user, and the word map comparison unit may preferentially extract content that is not included in the selection history.

この構成によれば、コンテンツ検索装置は、ユーザがコンテンツを視聴した選択履歴に含まれないコンテンツを優先的に推薦するので、ユーザが視聴したことのない、すなわちユーザが今まで接してこなかった概念を含むコンテンツを優先して推薦できる。   According to this configuration, the content search apparatus preferentially recommends content that is not included in the selection history of the user viewing the content. Priority can be given to content including

本発明に係るコンテンツ検索装置は、前記単語関係データのうち、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、当該ユーザと関連付けて記憶する選択マップ蓄積部を備え、前記単語マップ比較部は、前記選択マップ蓄積部に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出してもよい。   The content search device according to the present invention includes a selection map storage unit that stores, in association with the user, a word that matches a word map for the content selected by the user in the word relation data, and the word map comparison unit May preferentially extract content corresponding to a word map having few common parts with the word group stored in the selection map storage unit.

この構成によれば、コンテンツ検索装置は、ユーザが視聴したことのあるコンテンツに関する単語群との共通部分が少ない単語マップを抽出してコンテンツを推薦する。したがって、コンテンツ検索装置は、単語ネットワーク上でユーザが今まで接してこなかった単語を含む、すなわち概念の異なるコンテンツを優先して推薦できる。   According to this configuration, the content search apparatus extracts a word map with few common parts with a word group related to content that the user has viewed and recommends the content. Therefore, the content search apparatus can preferentially recommend content that includes words that the user has not touched on the word network, that is, has a different concept.

前記選択マップ蓄積部は、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、選択回数と共に記憶し、前記単語マップ比較部は、前記選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出してもよい。   The selection map storage unit stores words that match a word map for the content selected by the user together with the number of selections, and the word map comparison unit stores content corresponding to a word map including words with a low number of selections. You may extract preferentially.

この構成によれば、コンテンツ検索装置は、視聴したコンテンツに関する単語を選択回数と共に記憶し、この選択回数を平準化するように単語マップを選択するので、様々な概念のコンテンツを効率よく選択できる。   According to this configuration, the content search apparatus stores the words related to the viewed content together with the number of selections, and selects the word map so as to equalize the number of selections. Therefore, it is possible to efficiently select contents of various concepts.

本発明に係るコンテンツ検索装置は、前記単語関係データと、前記選択マップ蓄積部における前記ユーザ毎の単語データとの比較情報を生成する比較情報生成部を備えてもよい。   The content search apparatus according to the present invention may include a comparison information generation unit that generates comparison information between the word relation data and the word data for each user in the selection map storage unit.

この構成によれば、コンテンツ検索装置は、単語ネットワークとユーザが視聴したコンテンツから得られる単語群又は単語マップとの比較情報を生成し、出力できる。したがって、コンテンツ検索装置は、ユーザが頻繁に視聴している領域、及び視聴頻度の低い領域等をユーザに容易に把握させることができる。   According to this configuration, the content search apparatus can generate and output comparison information between the word network and the word group or the word map obtained from the content viewed by the user. Therefore, the content search device can make the user easily grasp the areas that the user frequently views, the areas where the viewing frequency is low, and the like.

前記コンテンツ情報は、コンテンツに対するユーザの投稿文であってもよい。   The content information may be a user's posted text for the content.

この構成によれば、コンテンツ検索装置は、コンテンツ情報として、ユーザの投稿文を採用できるので、情報量が増えると共に、投稿文にはユーザの思考が反映されるため、ユーザ毎にそれぞれ適したコンテンツが推薦される。   According to this configuration, since the content search apparatus can adopt the user's posted text as the content information, the amount of information increases and the thought of the user is reflected in the posted text. Is recommended.

本発明に係るコンテンツ検索方法は、複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータが、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行する。   A content search method according to the present invention includes a word network including word relationship data describing a relationship between a plurality of words, and a word information acquisition step in which a computer capable of referring to the content information extracts words included in the content information; For each content, a word map generation step for generating a word map in which the word relation data is added to the word extracted in the word information acquisition step; and a word map for the content selected by the user, And a word map comparison step that preferentially extracts contents with a small number of common parts of the word map from the other contents.

本発明に係るコンテンツ検索プログラムは、複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータに、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行させる。   A content search program according to the present invention includes a word network including word relationship data describing a relationship between a plurality of words, and a word information acquisition step of extracting a word included in the content information to a computer capable of referring to the content information. For each content, a word map generation step for generating a word map in which the word relation data is added to the word extracted in the word information acquisition step; and a word map for the content selected by the user, And a word map comparison step for preferentially extracting contents with a small number of common parts of the word map from the other contents.

本発明によれば、ユーザが今まで接してこなかった概念を含むコンテンツが抽出される。   According to the present invention, content including a concept that the user has not touched until now is extracted.

実施形態に係るコンテンツ推薦システムの構成を示すブロック図である。It is a block diagram which shows the structure of the content recommendation system which concerns on embodiment. 実施形態に係る単語ネットワークの一例を示す図である。It is a figure which shows an example of the word network which concerns on embodiment. 実施形態に係る単語マップの生成処理を示す図である。It is a figure which shows the production | generation process of the word map which concerns on embodiment. 実施形態に係る単語マップの比較処理例を示す図である。It is a figure which shows the example of a comparison process of the word map which concerns on embodiment. 実施形態に係る番組推薦の一例を示す図である。It is a figure which shows an example of the program recommendation which concerns on embodiment.

以下、本発明の実施形態の一例について説明する。
本実施形態のコンテンツ推薦システム1は、コンテンツ視聴装置20によりユーザが視聴したコンテンツ(例えば、番組)と関連し、かつ、視聴したコンテンツとは異なる観点のコンテンツを、コンテンツ検索装置10(コンテンツ検索装置)が検索し、ユーザに対して推薦する。
Hereinafter, an example of an embodiment of the present invention will be described.
The content recommendation system 1 of the present embodiment relates to content (for example, a program) viewed by the user with the content viewing device 20 and content from a different viewpoint from the content viewed by the content search device 10 (content search device). ) Searches and recommends to users.

図1は、本実施形態に係るコンテンツ推薦システム1の構成を示すブロック図である。
コンテンツ推薦システム1を構成するコンテンツ検索装置10は、記憶部11と、制御部12とを備える。また、コンテンツ検索装置10は、コンテンツ視聴装置20と所定のネットワーク(例えば、インターネット)を介して接続されている。
FIG. 1 is a block diagram showing a configuration of a content recommendation system 1 according to the present embodiment.
The content search device 10 constituting the content recommendation system 1 includes a storage unit 11 and a control unit 12. Further, the content search device 10 is connected to the content viewing device 20 via a predetermined network (for example, the Internet).

コンテンツ検索装置10は、ユーザのコンテンツ視聴履歴、及びコンテンツに対して行うレビュー等の投稿データを含むコンテンツ情報を用いて、新たにユーザに提示すべきコンテンツを抽出する。   The content search apparatus 10 extracts content to be presented to the user anew using content information including the user's content viewing history and post data such as reviews performed on the content.

記憶部11は、ハードウェア群をコンテンツ検索装置10として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ROM、RAM、フラッシュメモリ又はハードディスク(HDD)等であってよい。具体的には、記憶部11は、本実施形態の各機能を制御部12に実行させるコンテンツ検索プログラムを記憶する他、単語ネットワーク蓄積部111と、コンテンツ蓄積部112と、履歴蓄積部113と、選択マップ蓄積部114とを備える。   The storage unit 11 is a storage area for various programs and various data for causing the hardware group to function as the content search device 10, and may be a ROM, a RAM, a flash memory, a hard disk (HDD), or the like. Specifically, the storage unit 11 stores a content search program that causes the control unit 12 to execute each function of the present embodiment, a word network storage unit 111, a content storage unit 112, a history storage unit 113, A selection map storage unit 114.

単語ネットワーク蓄積部111は、複数の単語の関係を記述した単語関係データを記憶する。この単語関係データは、既存のコーパスから作成される大規模データであり、自動で作成されてもよいし、管理者等により手動で作成されてもよい。   The word network storage unit 111 stores word relationship data describing a relationship between a plurality of words. This word relation data is large-scale data created from an existing corpus, and may be created automatically or manually by an administrator or the like.

図2は、本実施形態に係る単語ネットワークの一例を示す図である。
単語関係データは、単語間が関係リンクで結ばれた単語ネットワークを形成している。関係リンクには、単語同士が文書中で同時に出現する共起関係、一方の単語が他方の単語の原因又は結果を表す因果関係、一方の単語が他方の単語の上位又は下位概念である関係、同義語、類義語、対義語等が設定される。
なお、本実施形態において使用される単語ネットワークは、単語関係全てから構成されたものであってもよいし、一部のみを用いて構成されたものであってもよい。
FIG. 2 is a diagram illustrating an example of a word network according to the present embodiment.
The word relation data forms a word network in which words are connected by relation links. The relationship link includes a co-occurrence relationship in which words appear in the document at the same time, a causal relationship in which one word represents the cause or result of the other word, a relationship in which one word is a higher or lower concept of the other word, Synonyms, synonyms, synonyms, etc. are set.
Note that the word network used in the present embodiment may be configured from all word relationships or may be configured using only a part thereof.

コンテンツ蓄積部112は、ユーザへ提供して視聴可能なコンテンツ、及びこれらのコンテンツに付随するコンテンツ情報を記憶する。コンテンツ情報は、コンテンツの内容を示すテキストデータであり、例えば、番組表データ、番組紹介データ、字幕又は文字放送データ等を含む。   The content storage unit 112 stores content that can be provided to the user for viewing and content information associated with the content. The content information is text data indicating the content, and includes, for example, program guide data, program introduction data, subtitles or text broadcast data.

履歴蓄積部113は、ユーザ毎のコンテンツの選択履歴、すなわちユーザが視聴したコンテンツの履歴を記憶する。この履歴には、コンテンツを視聴した日時情報が含まれる。   The history storage unit 113 stores content selection history for each user, that is, history of content viewed by the user. This history includes date and time information of viewing the content.

選択マップ蓄積部114は、単語関係データのうち、ユーザが視聴(選択)したコンテンツに対して生成された単語マップに合致する単語を、視聴したユーザと関連付けて、選択回数と共に記憶する。   The selection map accumulation unit 114 stores, in the word relation data, a word that matches the word map generated for the content viewed (selected) by the user, in association with the viewed user, together with the number of selections.

制御部12は、コンテンツ検索装置10の全体を制御する部分であり、記憶部11に記憶された各種プログラムを適宜読み出して実行することにより、本実施形態における各種機能を実現している。制御部12は、CPU(Central Processing Unit)であってよい。   The control unit 12 is a part that controls the entire content search apparatus 10, and implements various functions in the present embodiment by appropriately reading and executing various programs stored in the storage unit 11. The control unit 12 may be a CPU (Central Processing Unit).

また、制御部12は、単語情報獲得部121と、単語マップ生成部122と、単語マップ比較部123と、コンテンツ提供部124と、比較情報生成部125とを備える。   The control unit 12 includes a word information acquisition unit 121, a word map generation unit 122, a word map comparison unit 123, a content provision unit 124, and a comparison information generation unit 125.

単語情報獲得部121は、コンテンツ視聴装置20又はコンテンツ蓄積部112から取得したコンテンツ情報に含まれる単語を抽出する。
ここで、コンテンツ視聴装置20は、ユーザ(U)がコンテンツ(C0)を選択して視聴・閲覧した際に、コンテンツ(C0)がユーザ(U)に視聴されたという情報と共に、コンテンツ(C0)に付与されているコンテンツ情報(CI0)を、コンテンツ検索装置10へ送信する。
The word information acquisition unit 121 extracts words included in the content information acquired from the content viewing apparatus 20 or the content storage unit 112.
Here, when the user (U) selects the content (C0) for viewing / browsing, the content viewing apparatus 20 includes the content (C0) together with information that the content (C0) is viewed by the user (U). The content information (CI0) given to is transmitted to the content search apparatus 10.

単語情報獲得部121は、コンテンツ視聴装置20から受信したコンテンツ情報(CI0)、及びコンテンツ蓄積部112から受け取ったコンテンツ情報(CI1〜n)のそれぞれに対して、単語分割して重要語を抽出する。
具体的には、単語情報獲得部121は、コンテンツ情報に含まれるテキストに対して形態素解析処理を行い、単語に分割する。さらに、単語情報獲得部121は、分割された単語それぞれに関して重要度算出処理を行い、各単語に重要度の値を付与する。単語情報獲得部121は、所定の重要度に満たない単語を除外して、重要語を抽出する。
The word information acquisition unit 121 divides a word into each of the content information (CI0) received from the content viewing apparatus 20 and the content information (CI1 to n) received from the content storage unit 112, and extracts an important word. .
Specifically, the word information acquisition unit 121 performs a morphological analysis process on the text included in the content information and divides it into words. Furthermore, the word information acquisition unit 121 performs importance calculation processing for each of the divided words, and assigns importance values to the words. The word information acquisition unit 121 extracts important words by excluding words that do not satisfy a predetermined importance level.

ここで、重要度は、例えば、単語分割により抽出された単語それぞれに対して、出現頻度に基づいて算出される指標(例えば、TF−IDF)である。
また、重要度は、例えば、単語分割により抽出された単語に対する単語関係データにおける関係リンクの数に基づく指標である。
Here, the importance is, for example, an index (for example, TF-IDF) calculated based on the appearance frequency for each word extracted by word division.
The importance is an index based on the number of relation links in word relation data for words extracted by word division, for example.

単語マップ生成部122は、単語ネットワーク蓄積部111に蓄積された単語ネットワークの情報を用いて、コンテンツ毎に、単語情報獲得部121により抽出された単語群に対して、単語関係データを付加した単語マップ(M0、M1〜n)を生成する。   The word map generation unit 122 uses the word network information stored in the word network storage unit 111 to add words related data to the word group extracted by the word information acquisition unit 121 for each content. A map (M0, M1-n) is generated.

図3は、本実施形態に係る単語マップの生成処理を示す図である。
単語マップ生成部122は、単語情報獲得部121から得られた各単語が、単語ネットワーク上に存在するかどうかを検索する。単語ネットワーク上に存在した場合は、単語マップ生成部122は、これらの単語を取り出す。さらに、単語マップ生成部122は、単語ネットワーク上にこれらの単語間の関係リンクが存在した場合、これらの関係リンクも抽出する。
FIG. 3 is a diagram showing word map generation processing according to the present embodiment.
The word map generation unit 122 searches whether each word obtained from the word information acquisition unit 121 exists on the word network. If it exists on the word network, the word map generator 122 extracts these words. Further, when there are related links between these words on the word network, the word map generating unit 122 also extracts these related links.

例えば、単語情報獲得部121から得られた単語群がA,E,F,G,Jだった場合、単語マップ生成部122は、単語ネットワークから、これらの単語及び単語間に存在する関係リンクを抽出し、単語マップM0とする。
また、単語情報獲得部121から得られた単語群にはそれぞれ重要度が付与されているため、単語マップ生成部122は、この重要度を利用してフィルタリングし、重要度の高い単語A,E,Fのみを利用した単語マップM0’を生成してもよい。
For example, when the word group obtained from the word information acquisition unit 121 is A, E, F, G, and J, the word map generation unit 122 extracts the relationship link existing between these words and words from the word network. The extracted word map is M0.
Further, since the importance level is assigned to each word group obtained from the word information acquisition unit 121, the word map generation unit 122 performs filtering using this importance level, and the words A and E having high importance levels. , F may be used to generate a word map M0 ′.

単語マップ比較部123は、ユーザが選択したコンテンツに対する単語マップを、コンテンツ蓄積部112に蓄積されている他のコンテンツに対する単語マップと比較し、これらのコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する。
具体的には、単語マップ比較部123は、ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出する。
The word map comparison unit 123 compares the word map for the content selected by the user with the word map for the other content stored in the content storage unit 112, and from these contents, there are few common parts of the word map. Extract content preferentially.
Specifically, the word map comparison unit 123 shares at least some of the important words determined to have a relatively high importance among the words included in the word map for the content selected by the user, and Content with a long distance between word maps is preferentially extracted.

このとき、単語マップ比較部123は、単語関係データにおける関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行う。例えば、同義語又は類義語に比べて、対義語の関係にある単語間の距離は遠いと判定される。   At this time, the word map comparison unit 123 weights the distance between the word maps based on the type of relation link in the word relation data. For example, compared to synonyms or synonyms, it is determined that the distance between words in the synonym relationship is far.

また、単語マップ比較部123は、履歴蓄積部113の視聴履歴に含まれないコンテンツを優先的に抽出する。さらに、単語マップ比較部123は、選択マップ蓄積部114に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出する。また、選択マップ蓄積部114に選択回数も記憶されている場合、単語マップ比較部123は、選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出する。   In addition, the word map comparison unit 123 preferentially extracts content that is not included in the viewing history of the history storage unit 113. Furthermore, the word map comparison unit 123 preferentially extracts content corresponding to a word map having few common parts with the word group stored in the selection map accumulation unit 114. When the selection map storage unit 114 also stores the number of selections, the word map comparison unit 123 preferentially extracts content corresponding to a word map including a word with a small number of selections.

そして、単語マップ比較部123は、ユーザが視聴したコンテンツに対する単語マップM0に関し、コンテンツ蓄積部112に記憶されている他のコンテンツに対する単語マップM1〜Mnのそれぞれとのマップの比較を行い、距離が最も遠いものから順にランキングし、ランキングデータをコンテンツ提供部124に渡す。   Then, the word map comparison unit 123 compares the map with each of the word maps M1 to Mn for the other content stored in the content storage unit 112 with respect to the word map M0 for the content viewed by the user. Ranking is performed in order from the farthest, and the ranking data is passed to the content providing unit 124.

図4は、本実施形態に係る単語マップの比較処理例を示す図である。
まず、単語マップ比較部123は、コンテンツ情報CI0から生成された単語マップM0に含まれる1又は複数の重要単語を選択する。この重要単語は、例えば、単語情報獲得部121によって重要度が最も高く判定された単語、又は所定以上の重要度が付与された単語、あるいは、多数のユーザに視聴されたコンテンツに関する単語等である。
FIG. 4 is a diagram illustrating an example of word map comparison processing according to the present embodiment.
First, the word map comparison unit 123 selects one or more important words included in the word map M0 generated from the content information CI0. This important word is, for example, a word that has been determined to have the highest importance by the word information acquisition unit 121, a word that has been given a certain degree of importance, or a word related to content that has been viewed by many users. .

この例では、重要単語として単語Aが選択されている。単語マップ比較部123は、コンテンツ蓄積部112のコンテンツ情報CI1〜CInから生成された単語マップM1〜Mnの中から、単語Aを含む単語マップを抽出する。この結果、単語マップM1及びM2が抽出された。   In this example, the word A is selected as the important word. The word map comparison unit 123 extracts a word map including the word A from the word maps M1 to Mn generated from the content information CI1 to CIn of the content storage unit 112. As a result, word maps M1 and M2 were extracted.

ここで、M0とM1とでは、単語4つ(A,E,F,G)及び関係リンク3つ(a,g,h)が共通しており、M0とM2とでは、単語2つ(A,D)及び関係リンク1つ(b)が共通している。このことから、コンテンツ情報CI0とCI1とは共通する単語及び関係の数が多いので内容が近く、コンテンツ情報CI0とCI2とは共通する単語及び関係の数が少ないので内容が遠いと判定される。すなわち、コンテンツC1は、既に視聴されたコンテンツC0と類似した内容であり、コンテンツC2は異なった内容であると判定される。   Here, M0 and M1 share four words (A, E, F, G) and three related links (a, g, h), and M0 and M2 share two words (A , D) and one related link (b). Therefore, the content information CI0 and CI1 are close in content because there are many common words and relationships, and the content information CI0 and CI2 are determined as being far from each other because the number of common words and relationships is small. That is, the content C1 is similar to the content C0 that has already been viewed, and the content C2 is determined to be different.

重要単語Aを共通して含んでいることから、C1及びC2は共通の話題に関したコンテンツであるが、C2はC0とは違った観点を多く含むコンテンツである可能性が高い。つまり、ユーザに対しては、C1に代えて、又はC1と共にC2を推薦することにより、視聴したコンテンツC0とは違った観点の内容を含んだコンテンツを提供し、ユーザの視点を広げることができる。   Since the important word A is included in common, C1 and C2 are content related to a common topic, but C2 is likely to be content including many viewpoints different from C0. In other words, by recommending C2 to C1 instead of C1 or together with C1, the user can be provided with content that includes a different viewpoint from the viewed content C0, and the user's viewpoint can be expanded. .

コンテンツ提供部124は、単語マップ比較部123から取得したランキングデータに基づいて、単語マップM0との距離が遠い単語マップMxを選択し、この単語マップに対応するコンテンツCxを、ユーザへ提供又は推薦する。   The content providing unit 124 selects a word map Mx that is far from the word map M0 based on the ranking data acquired from the word map comparison unit 123, and provides or recommends the content Cx corresponding to the word map to the user. To do.

また、単語マップ比較部123は、履歴蓄積部113又は選択マップ蓄積部114を参照し、ユーザがまだ触れていない単語領域を効率的に埋めるためのコンテンツを優先的に抽出する。これにより、コンテンツ検索装置10は、様々な観点に基づいたコンテンツをユーザにバランス良く視聴させることができる。   In addition, the word map comparison unit 123 refers to the history storage unit 113 or the selection map storage unit 114 and preferentially extracts content for efficiently filling a word region that has not yet been touched by the user. Thereby, the content search apparatus 10 can make a user view the content based on various viewpoints with sufficient balance.

比較情報生成部125は、単語関係データと、選択マップ蓄積部114におけるユーザ毎の単語データとの比較情報を生成する。この比較情報を出力することにより、単語ネットワークにおけるユーザ毎の視聴範囲及び頻度が把握される。   The comparison information generation unit 125 generates comparison information between the word relationship data and the word data for each user in the selection map storage unit 114. By outputting this comparison information, the viewing range and frequency for each user in the word network can be grasped.

また、コンテンツ検索装置10は、ユーザがコンテンツを視聴する度に単語ネットワーク上の単語に対して重みを加算し、選択マップ蓄積部114に記憶していくことで、このユーザが視聴した領域、及び未知の領域が明確になる。比較情報生成部125は、これらの情報をユーザへ提示できる。   In addition, the content search device 10 adds weights to words on the word network each time the user views the content, and stores the weights in the selection map storage unit 114, so that the region viewed by the user, and An unknown area becomes clear. The comparison information generation unit 125 can present such information to the user.

図5は、本実施形態に係るコンテンツ推薦システム1を番組推薦に適用した一例を示す図である。
コンテンツ検索装置10は、例えば、VOD(Video On Demand)機能及び番組レビュー機能を備えたWebサイトの形態により実現される。
FIG. 5 is a diagram showing an example in which the content recommendation system 1 according to the present embodiment is applied to program recommendation.
The content search device 10 is realized, for example, in the form of a website having a VOD (Video On Demand) function and a program review function.

ユーザは、自分の好みに合った番組C0を検索して視聴する。この際、ユーザは、視聴した番組C0に関してレビューを投稿する。また、各番組には、番組の概要等を示す番組関連情報が付与されている。コンテンツ検索装置10は、ユーザの視聴履歴、投稿データ及び番組関連情報を蓄積する。   The user searches and views the program C0 that suits his / her preference. At this time, the user posts a review regarding the viewed program C0. Each program is given program-related information indicating an outline of the program. The content search apparatus 10 accumulates user viewing history, post data, and program related information.

コンテンツ検索装置10は、大規模な言語資源(コーパス)から生成された単語ネットワークを蓄積している。コンテンツ検索装置10は、ユーザへ提供するための番組(C0〜Cn)が登録される際には、各番組の番組関連情報又は投稿データから抽出された単語を単語ネットワークと照合し、単語マップ(M0〜Mn)を生成する。   The content search apparatus 10 stores a word network generated from a large-scale language resource (corpus). When the program (C0 to Cn) to be provided to the user is registered, the content search device 10 collates words extracted from program-related information or posted data of each program with a word network, and a word map ( M0 to Mn).

ユーザが番組C0を視聴すると、コンテンツ検索装置10は、この番組C0に対応した単語マップM0の重要単語Kをキーとして、同一の重要単語Kを含む他の番組の単語マップを検索する。そして、コンテンツ検索装置10は、M0と検索の結果得られた単語マップとの比較を行い、共通する単語や関係リンクの数が少ないものから順に単語マップをランキングする。   When the user views the program C0, the content search device 10 searches for a word map of another program including the same important word K using the important word K of the word map M0 corresponding to the program C0 as a key. Then, the content search apparatus 10 compares M0 with the word map obtained as a result of the search, and ranks the word maps in descending order of the number of common words and related links.

コンテンツ検索装置10は、ランキングの結果、最も共通単語及び関係リンクの数が少ない単語マップMxが抽出されると、この単語マップMxに対応した番組Cxをユーザに推薦する。コンテンツ検索装置10は、例えば、あるテーマ「増税」に関しての課題的側面(例えば、人件費削減、買い控え等)を扱った番組を視聴したユーザに対し、別の側面(例えば、福祉の向上等)を扱った番組を推薦することができ、ユーザの知識の幅を広げることが可能となる。   When the word map Mx having the smallest number of common words and related links is extracted as a result of ranking, the content search apparatus 10 recommends a program Cx corresponding to the word map Mx to the user. For example, the content search apparatus 10 may provide another aspect (for example, improvement of welfare) to a user who has watched a program dealing with a subject aspect (for example, labor cost reduction, purchase refusal) regarding a certain theme “tax increase”. Can be recommended, and the range of knowledge of the user can be expanded.

また、コンテンツ検索装置10は、番組関連情報のみではなく、複数のユーザが番組C0に対して投稿したレビュー又はコメント等の投稿文を利用して単語マップを生成できる。これにより、ユーザの考えに含まれない新しい視点の番組を提供することが可能となる。   Further, the content search apparatus 10 can generate a word map using not only program related information but also posted sentences such as reviews or comments posted by a plurality of users on the program C0. Thereby, it is possible to provide a program with a new viewpoint that is not included in the user's idea.

なお、ユーザの投稿文を対象とする場合、コンテンツ蓄積部112には、各コンテンツに対してユーザが投稿したテキスト文が蓄積される。単語の抽出及び単語マップの生成に用いられる投稿データは、コンテンツ視聴中のユーザとは別のユーザのものであってよい。
このとき、多くのユーザに視聴されているコンテンツに関する単語マップは、単語間の重みが大きく設定されてもよい。これにより、多数のユーザが興味を持った領域の優先度が調整されるので、コンテンツ検索装置10は、他のユーザの嗜好に合わせる又は合わせないといった要求に従って、コンテンツの推薦順を制御できる。
When the user's posted text is targeted, the content storage unit 112 stores text posted by the user for each content. Post data used for word extraction and word map generation may be for a user other than the user who is viewing the content.
At this time, in the word map related to the content viewed by many users, the weight between words may be set large. Thereby, since the priority of the area in which many users are interested is adjusted, the content search apparatus 10 can control the recommendation order of the content in accordance with a request such that it matches or does not match other users' preferences.

以上のように、本実施形態によれば、コンテンツ推薦システム1は、ユーザが視聴したコンテンツの情報から生成した単語マップと、他のコンテンツの情報から生成した単語マップとを比較し、互いに共通部分が少ないコンテンツを優先的に抽出する。したがって、視聴したコンテンツと関連しつつも、ユーザが今まで接してこなかった概念を含むコンテンツが推薦される。
このとき、コンテンツ推薦システム1は、重要単語が共通しているため関連性が高く、かつ、単語マップ間の距離が遠いため視点が異なるコンテンツを優先して推薦できる。
As described above, according to the present embodiment, the content recommendation system 1 compares the word map generated from the information of the content viewed by the user with the word map generated from the information of the other content, and the common part Extract content with less priority. Therefore, the content including the concept that the user has not touched until now is recommended while being related to the viewed content.
At this time, the content recommendation system 1 can preferentially recommend content having different viewpoints because the important words are common and highly relevant and the distance between the word maps is long.

また、コンテンツ推薦システム1は、関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行うので、コンテンツ間の概念の相違をより正確に判定し、ユーザへコンテンツを適切に推薦できる。   Moreover, since the content recommendation system 1 weights the distance between the word maps based on the type of the related link, the content recommendation system 1 can more accurately determine the conceptual difference between the contents and appropriately recommend the content to the user.

また、コンテンツ推薦システム1は、単語マップを生成する際に、所定の重要度に満たない単語を除外する。したがって、コンテンツ推薦システム1は、コンテンツの内容とは関係の薄いノイズとなる単語を排除して、コンテンツ内容をより正確に表した単語マップを生成できる。
このとき、コンテンツ推薦システム1は、例えば、TF−IDF又は関係リンクの数等に基づく指標を用いて、精度良く容易に重要度を算出できる。
Further, the content recommendation system 1 excludes words that do not satisfy a predetermined importance when generating a word map. Therefore, the content recommendation system 1 can generate a word map that more accurately represents the content content by eliminating words that are noises that are not closely related to the content content.
At this time, the content recommendation system 1 can calculate the importance level easily and accurately using, for example, an index based on the number of TF-IDFs or related links.

また、コンテンツ推薦システム1は、ユーザがコンテンツを視聴した選択履歴を記憶し、選択履歴に含まれないコンテンツを優先的に推薦する。したがって、コンテンツ推薦システム1は、ユーザが視聴したことのない、すなわちユーザが今まで接してこなかった概念を含むコンテンツを優先して推薦できる。   Further, the content recommendation system 1 stores a selection history in which the user has viewed the content, and preferentially recommends content not included in the selection history. Therefore, the content recommendation system 1 can preferentially recommend content including a concept that has not been viewed by the user, that is, the user has not touched until now.

また、コンテンツ推薦システム1は、ユーザが視聴したコンテンツに対する単語マップに合致する単語を記憶し、これらの単語群との共通部分が少ない単語マップを抽出してコンテンツを推薦する。したがって、コンテンツ推薦システム1は、単語ネットワーク上でユーザが今まで接してこなかった単語を含む、すなわち概念の異なるコンテンツを優先して推薦できる。
さらに、コンテンツ推薦システム1は、視聴したコンテンツに関する単語を選択回数と共に記憶し、この選択回数を平準化するように単語マップを選択するので、様々な概念のコンテンツを効率よく選択できる。
Also, the content recommendation system 1 stores words that match the word map for the content viewed by the user, extracts a word map that has few common parts with these word groups, and recommends the content. Therefore, the content recommendation system 1 can preferentially recommend content that includes words that the user has not touched on the word network, that is, has a different concept.
Furthermore, since the content recommendation system 1 stores the words related to the viewed content together with the number of selections and selects the word map so as to equalize the number of selections, it is possible to efficiently select contents of various concepts.

また、コンテンツ推薦システム1は、単語ネットワークとユーザが視聴したコンテンツから得られる単語群又は単語マップとの比較情報を生成し、出力できる。したがって、コンテンツ推薦システム1は、ユーザが頻繁に視聴している領域、及び視聴頻度の低い領域等をユーザに容易に把握させることができる。   Further, the content recommendation system 1 can generate and output comparison information between a word network and a word group or a word map obtained from content viewed by the user. Therefore, the content recommendation system 1 can allow the user to easily grasp the area that the user frequently views, the area where the viewing frequency is low, and the like.

また、コンテンツ推薦システム1は、コンテンツ情報として、ユーザの投稿文を採用できる。これにより、情報量が増えると共に、投稿文にはユーザの思考が反映されるため、ユーザ毎にそれぞれ適したコンテンツが推薦される。   In addition, the content recommendation system 1 can employ a user's posted text as the content information. As a result, the amount of information increases and the thought of the user is reflected in the posted text, so that suitable content is recommended for each user.

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。   As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. Further, the effects described in the present embodiment are merely a list of the most preferable effects resulting from the present invention, and the effects of the present invention are not limited to those described in the present embodiment.

選択マップ蓄積部114には、前回若しくは所定回数の視聴履歴、特定期間(例えば、過去1週間)の視聴履歴、又は蓄積されている全期間の視聴履歴等を用いて、それぞれに対応した単語マップが生成され蓄積されてもよい。
このように、ユーザがコンテンツを視聴していく過程において、所定の期間に見たコンテンツに関連した単語が記録されることにより、比較情報生成部125は、単語ネットワーク上で所定の期間にユーザが既に視聴したコンテンツに関する領域、及び視聴されていない領域を出力できる。
The selection map storage unit 114 uses the previous or predetermined number of viewing histories, the viewing history of a specific period (for example, the past one week), or the accumulated viewing history of the entire period, etc. May be generated and stored.
As described above, in the process of viewing the content, the words related to the content viewed in the predetermined period are recorded, so that the comparison information generating unit 125 allows the user to perform the comparison on the word network during the predetermined period. An area related to content that has already been viewed and an area that has not been viewed can be output.

本実施形態において、単語マップを生成する際に使用するコンテンツ情報は、番組関連情報、番組に関する投稿文、又はこれらの組み合わせであってよい。
また、ユーザの視聴履歴を利用する場合、及びユーザの投稿文を利用する場合のいずれにおいても、コンテンツ推薦システム1は、ユーザが過去に視聴したコンテンツに関する単語マップと近い単語マップ及び遠い単語マップそれぞれに対応するコンテンツを提示してもよい。これにより、コンテンツ推薦システム1は、ユーザの関心が高い領域に近いコンテンツと、関心が低い領域のコンテンツとの双方を提示でき、ユーザの選択に合わせていずれかを提供できる。
In the present embodiment, the content information used when generating the word map may be program related information, posted text related to the program, or a combination thereof.
Further, in both cases of using the user's viewing history and using the user's posted sentence, the content recommendation system 1 has a word map that is close to a word map related to content that the user has viewed in the past and a distant word map, respectively. You may present the content corresponding to. Thereby, the content recommendation system 1 can present both the content close to the region where the user's interest is high and the content of the region where the interest is low, and can provide either one according to the user's selection.

また、本発明に係るコンテンツ検索方法は、前述のWebサイトにより実現されるコンテンツ推薦システム1には限られず、例えば、スマートテレビ等における番組推薦機能として実装されてもよい。
さらに、本実施形態では、コンテンツとして、番組等の映像コンテンツを想定して説明したが、対象のコンテンツはこれには限られず、本発明は、コンテンツプロバイダによるコンテンツサービス全般の他、情報サービス全般及び実商品の小売サービス全般等で扱われる無形コンテンツ又は有形コンテンツに適用可能である。
In addition, the content search method according to the present invention is not limited to the content recommendation system 1 realized by the above-described website, and may be implemented as a program recommendation function in a smart TV, for example.
Furthermore, although the present embodiment has been described assuming video content such as a program as content, the target content is not limited to this, and the present invention is not limited to content services provided by content providers, The present invention can be applied to intangible contents or tangible contents that are handled in general retail services for actual products.

例えば、対象のコンテンツを「旅行ツアーの情報」とすると、コンテンツ推薦システム1は、ユーザが過去に選択した旅行ツアーの情報(概要、地名等)から単語マップを生成し、この単語マップと距離が離れている他の単語マップに対応したツアーを推薦してもよい。これにより、過去に行ったことのない、ユーザが新しいと思える旅行ツアーが推薦される。
また、例えば、対象コンテンツが有形の商品である場合、コンテンツ推薦システム1は、過去に購入した商品とは異なる視点の商品を推薦できる。
For example, when the target content is “travel tour information”, the content recommendation system 1 generates a word map from travel tour information (summary, place name, etc.) selected by the user in the past, and the distance from this word map is A tour corresponding to another distant word map may be recommended. As a result, a travel tour that has never been performed in the past and seems to be new to the user is recommended.
For example, when the target content is a tangible product, the content recommendation system 1 can recommend a product with a different viewpoint from the product purchased in the past.

本実施形態において、コンテンツ検索装置10が備える各部は、複数の装置に分散されてもよい。例えば、コンテンツ提供部124に相当するコンテンツ提供装置は、コンテンツ検索装置10からコンテンツのランキング情報を受信し、コンテンツ視聴装置20へ推薦コンテンツを提示する構成であってもよい。また、履歴蓄積部113は、コンテンツ提供装置又はコンテンツ視聴装置20等が備えてもよい。   In this embodiment, each part with which the content search device 10 is provided may be distributed to a plurality of devices. For example, the content providing device corresponding to the content providing unit 124 may be configured to receive content ranking information from the content search device 10 and present recommended content to the content viewing device 20. The history storage unit 113 may be included in the content providing device or the content viewing device 20.

本実施形態では、主にコンテンツ検索装置の構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、ユーザに適切なコンテンツを推薦するための方法、又はプログラムとして構成されてもよい。   In the present embodiment, the configuration and operation of the content search apparatus have been mainly described. However, the present invention is not limited to this, and includes each component and is configured as a method or program for recommending appropriate content to the user. May be.

さらに、コンテンツ検索装置の機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。   Further, it may be realized by recording a program for realizing the function of the content search apparatus on a computer-readable recording medium, causing the computer system to read and execute the program recorded on the recording medium. .

ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。   The “computer system” here includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a portable medium such as a flexible disk, a magneto-optical disk, a ROM, and a CD-ROM, and a hard disk built in the computer system.

さらに「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。   Furthermore, “computer-readable recording medium” means that a program is dynamically held for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. It is also possible to include one that holds a program for a certain time, such as a volatile memory inside a computer system that becomes a server or client in that case. Further, the program may be for realizing a part of the above-described functions, and may be capable of realizing the above-described functions in combination with a program already recorded in the computer system. .

1 コンテンツ推薦システム
10 コンテンツ検索装置
20 コンテンツ視聴装置
111 単語ネットワーク蓄積部
112 コンテンツ蓄積部
113 履歴蓄積部
114 選択マップ蓄積部
121 単語情報獲得部
122 単語マップ生成部
123 単語マップ比較部
124 コンテンツ提供部
125 比較情報生成部
DESCRIPTION OF SYMBOLS 1 Content recommendation system 10 Content search apparatus 20 Content viewing apparatus 111 Word network storage part 112 Content storage part 113 History storage part 114 Selection map storage part 121 Word information acquisition part 122 Word map generation part 123 Word map comparison part 124 Content provision part 125 Comparison information generator

Claims (13)

複数の単語の関係を記述した単語関係データを記憶する単語ネットワーク蓄積部と、
コンテンツ情報を記憶するコンテンツ蓄積部と、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得部と、
コンテンツ毎に、前記単語情報獲得部により抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成部と、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較部と、を備えるコンテンツ検索装置。
A word network storage unit for storing word relationship data describing a relationship between a plurality of words;
A content storage unit for storing content information;
A word information acquisition unit that extracts words included in the content information;
For each content, a word map generation unit that generates a word map with the word relation data added to the words extracted by the word information acquisition unit;
A word map comparison unit that compares a word map with respect to content selected by the user with a word map with respect to other content, and preferentially extracts content with few common parts of the word map from the other content. Content search device.
前記単語マップ比較部は、前記ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出する請求項1に記載のコンテンツ検索装置。   The word map comparison unit includes at least a part of important words determined to be relatively high among words included in the word map for the content selected by the user, and the word maps The content search apparatus according to claim 1, wherein content with a long distance is preferentially extracted. 前記単語マップ比較部は、前記単語関係データにおける関係リンクの種類に基づいて、前記単語マップ同士の距離に重み付けを行う請求項2に記載のコンテンツ検索装置。   The content search device according to claim 2, wherein the word map comparison unit weights the distance between the word maps based on a type of relation link in the word relation data. 前記単語マップ生成部は、前記単語情報獲得部により抽出された単語のうち、所定の重要度に満たない単語を除外して、前記単語マップを生成する請求項1から請求項3のいずれかに記載のコンテンツ検索装置。   The said word map production | generation part excludes the word which is less than predetermined | prescribed importance among the words extracted by the said word information acquisition part, The said word map is produced | generated in any one of Claims 1-3. The content search device described. 前記重要度は、前記単語情報獲得部により抽出された単語に対するTF−IDFに基づく指標である請求項4に記載のコンテンツ検索装置。   The content search apparatus according to claim 4, wherein the importance is an index based on a TF-IDF for a word extracted by the word information acquisition unit. 前記重要度は、前記単語情報獲得部により抽出された単語に対する前記単語関係データにおける関係リンクの数に基づく指標である請求項4に記載のコンテンツ検索装置。   The content search apparatus according to claim 4, wherein the importance is an index based on the number of related links in the word relationship data for the word extracted by the word information acquisition unit. ユーザ毎のコンテンツの選択履歴を記憶する履歴蓄積部を備え、
前記単語マップ比較部は、前記選択履歴に含まれないコンテンツを優先的に抽出する請求項1から請求項6のいずれかに記載のコンテンツ検索装置。
A history storage unit for storing a selection history of content for each user;
The content search device according to any one of claims 1 to 6, wherein the word map comparison unit preferentially extracts content not included in the selection history.
前記単語関係データのうち、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、当該ユーザと関連付けて記憶する選択マップ蓄積部を備え、
前記単語マップ比較部は、前記選択マップ蓄積部に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出する請求項1から請求項7のいずれかに記載のコンテンツ検索装置。
A selection map storage unit that stores words that match the word map for the content selected by the user in the word relation data in association with the user;
The content according to any one of claims 1 to 7, wherein the word map comparison unit preferentially extracts content corresponding to a word map having few common parts with the word group stored in the selection map storage unit. Search device.
前記選択マップ蓄積部は、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、選択回数と共に記憶し、
前記単語マップ比較部は、前記選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出する請求項8に記載のコンテンツ検索装置。
The selection map storage unit stores words that match the word map for the content selected by the user, together with the number of selections,
The content search apparatus according to claim 8, wherein the word map comparison unit preferentially extracts content corresponding to a word map including a word with a small number of selections.
前記単語関係データと、前記選択マップ蓄積部における前記ユーザ毎の単語データとの比較情報を生成する比較情報生成部を備える請求項8又は請求項9に記載のコンテンツ検索装置。   The content search apparatus according to claim 8 or 9, further comprising a comparison information generation unit that generates comparison information between the word relation data and the word data for each user in the selection map storage unit. 前記コンテンツ情報は、コンテンツに対するユーザの投稿文である請求項1から請求項10のいずれかに記載のコンテンツ検索装置。   The content search apparatus according to any one of claims 1 to 10, wherein the content information is a posted message of a user with respect to the content. 複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータが、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、
コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行するコンテンツ検索方法。
A word network including word relationship data describing a relationship between a plurality of words, and a computer capable of referencing content information;
A word information acquisition step of extracting words contained in the content information;
For each content, a word map generation step for generating a word map with the word relation data added to the words extracted in the word information acquisition step;
A word map comparison step that compares the word map for the content selected by the user with the word map for the other content, and preferentially extracts content with a small number of common parts of the word map from the other content. To search for content.
複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータに、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、
コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行させるためのコンテンツ検索プログラム。
A word network including word relationship data describing a relationship between a plurality of words, and a computer capable of referencing content information;
A word information acquisition step of extracting words contained in the content information;
For each content, a word map generation step for generating a word map with the word relation data added to the words extracted in the word information acquisition step;
A word map comparison step that compares the word map for the content selected by the user with the word map for the other content, and preferentially extracts content with a small number of common parts of the word map from the other content. Content search program to let you.
JP2013130518A 2013-06-21 2013-06-21 Content search apparatus, method, and program Active JP6137960B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013130518A JP6137960B2 (en) 2013-06-21 2013-06-21 Content search apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013130518A JP6137960B2 (en) 2013-06-21 2013-06-21 Content search apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2015005174A JP2015005174A (en) 2015-01-08
JP6137960B2 true JP6137960B2 (en) 2017-05-31

Family

ID=52301005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013130518A Active JP6137960B2 (en) 2013-06-21 2013-06-21 Content search apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6137960B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6638260B2 (en) * 2015-08-24 2020-01-29 富士電機株式会社 Information providing apparatus, information providing method, and program
KR101856636B1 (en) * 2017-05-18 2018-05-14 주식회사 태광이앤비 Anion generating module for agricultural and marine products storage
JP2019211808A (en) * 2018-05-31 2019-12-12 日本電信電話株式会社 Similarity evaluation apparatus, method thereof and program
CN109933691B (en) * 2019-02-11 2023-06-09 北京百度网讯科技有限公司 Method, apparatus, device and storage medium for content retrieval
JP2020140468A (en) * 2019-02-28 2020-09-03 富士ゼロックス株式会社 Information processing device and program
JP2020140467A (en) * 2019-02-28 2020-09-03 富士ゼロックス株式会社 Information processing apparatus and program
KR102363577B1 (en) * 2021-05-21 2022-02-16 주식회사 글루리 Method and apparatus for recommending learning words based on lyrics through word-embedding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3139658B2 (en) * 1993-05-06 2001-03-05 シャープ株式会社 Document display method
JP4617015B2 (en) * 2001-03-26 2011-01-19 株式会社MetaMoJi Document display device, document display method, and program
JP4672578B2 (en) * 2006-03-09 2011-04-20 日本電信電話株式会社 Interest information providing apparatus, interest information providing method, and interest information providing program

Also Published As

Publication number Publication date
JP2015005174A (en) 2015-01-08

Similar Documents

Publication Publication Date Title
JP6137960B2 (en) Content search apparatus, method, and program
Zhao et al. We know what you want to buy: a demographic-based system for product recommendation on microblogs
US10180967B2 (en) Performing application searches
US10706100B2 (en) Method of and system for recommending media objects
US9467744B2 (en) Comment-based media classification
US11042590B2 (en) Methods, systems and techniques for personalized search query suggestions
CN112074857A (en) Combining machine learning and social data to generate personalized recommendations
US20090006368A1 (en) Automatic Video Recommendation
US11080287B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
KR20160057475A (en) System and method for actively obtaining social data
JP2008293211A (en) Item recommendation system
JP2011175362A (en) Information processing apparatus, importance level calculation method, and program
US10417294B2 (en) Selecting content objects for recommendation based on content object collections
US20140229487A1 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
US20140188927A1 (en) Presenting recommended content in search pages
KR20160082168A (en) Apparatus and Method for recommending a content based on emotion
JP6767342B2 (en) Search device, search method and search program
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
KR101647087B1 (en) Server and method for goods providing based on natural language processing
KR101758695B1 (en) Multi korean wave contents search and recommendation system based on social taste anaysis
US20140214548A1 (en) User Profiling Using Submitted Review Content
JP6434954B2 (en) Information processing apparatus, information processing method, and program
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
JP6639040B2 (en) Information retrieval device and program
KR20170042889A (en) Contents recommendation method, server and computing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170425

R150 Certificate of patent or registration of utility model

Ref document number: 6137960

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250