JP6429382B2 - コンテンツ推薦装置、及びプログラム - Google Patents
コンテンツ推薦装置、及びプログラム Download PDFInfo
- Publication number
- JP6429382B2 JP6429382B2 JP2015000334A JP2015000334A JP6429382B2 JP 6429382 B2 JP6429382 B2 JP 6429382B2 JP 2015000334 A JP2015000334 A JP 2015000334A JP 2015000334 A JP2015000334 A JP 2015000334A JP 6429382 B2 JP6429382 B2 JP 6429382B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- query
- search
- data
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明によれば、コンテンツ推薦装置は、同一の話題が異なる表記により記述され得る複数のコーパスデータから検索語候補となる語句を取得する。コンテンツ推薦装置は、検索語候補の語句の中から、元の検索語との類似度が所定条件よりも高く、かつ、類似度が所定条件よりも高いと判断したときに用いた元の検索語とは異なる元の検索語とコーパスデータにおいて共起する語句を、検索語に追加する。コンテンツ推薦装置は、元の検索語と追加した検索語とを用いてコンテンツを検索する。
これにより、コンテンツ推薦装置は、元となる検索語に、その検索語と意味的な関連が深い他の表記の語句を加えてコンテンツを検索し、推薦することができる。
この発明によれば、コンテンツ推薦装置は、所定期間のコーパスデータから抽出した検索語候補の語句の中から検索語として追加する語句を選択する。
これにより、コンテンツ推薦装置は、元となる検索語に、その検索語と意味的な関連が深く、時事性を反映した他の表記の語句を加えてコンテンツを検索し、推薦することができる。
この発明によれば、コンテンツ推薦装置は、ユーザが視聴したコンテンツの履歴に基づいて、ユーザの嗜好を表す元の検索語を取得する。
これにより、コンテンツ推薦装置は、ユーザが視聴したコンテンツの履歴から、ユーザの嗜好に合った他のコンテンツを検索し、提示することができる。
この発明によれば、コンテンツ推薦装置は、ユーザが再生したコンテンツの部分の内容を表すテキスト情報から検索語を取得する。
これにより、コンテンツ推薦装置は、ユーザの嗜好をよく表した検索語を取得することができるため、ユーザの求める内容により則したコンテンツを推薦することができる。
この発明によれば、コンテンツ推薦装置は、コーパスデータのタグまたは本文から検索語候補となる語句を抽出する。
これにより、コンテンツ推薦装置は、コーパスデータに含まれるタグを利用することにより、処理の負荷を抑えつつ、コーパスデータの本文の内容を良く表した語句を検索語候補として抽出することができる。また、コンテンツ推薦装置は、タグが利用できない場合でも、コーパスデータの本文の内容から検索語候補の語句を抽出することができる。
本実施形態のコンテンツ推薦装置は、ユーザの嗜好をキーワードなどの言語的手段によって記述した検索語の集合を一次クエリとし、一次クエリと内容が関連する他の表記の語句の集合である二次クエリを新たに一次クエリに追加して拡張クエリを生成する。二次クエリは、元の検索語と意味的な関連が深い語句の集合である。すなわち、二次クエリは、ユーザの嗜好を間接的に表現した補助的な検索語の集合である。本実施形態のコンテンツ推薦装置は、生成した拡張クエリを用いて、ユーザに推薦するコンテンツ(以下、「推薦コンテンツ」とも記載する。)を検索する。
このように、本実施形態のコンテンツ推薦装置は、ユーザの嗜好を表す元の検索語と、元の検索語に意味的な関連が深い他の検索語とを併用してユーザに推薦すべきコンテンツを検索する。従って、本実施形態のコンテンツ推薦装置は、ユーザの潜在的な嗜好や話題の関連性を考慮した高度なコンテンツ推薦を可能にする。
視聴履歴記録部11は、各々のユーザが過去に視聴したコンテンツの履歴を示すユーザ視聴履歴情報を、ユーザの識別情報であるユーザIDと対応付けて記録している。具体的には、視聴履歴記録部11は、コンテンツ表示装置3の通知部34からユーザが視聴したコンテンツの情報と、ユーザを特定する情報とを設定したコンテンツ視聴情報を受信する。ユーザが視聴したコンテンツは、コンテンツ表示装置3の操作部31が受けたユーザの操作に基づいて取得部32が取得し、出力部33により出力したコンテンツである。視聴履歴記録部11は、受信したコンテンツ視聴情報に基づいて、ユーザが視聴したコンテンツのコンテンツIDと、そのコンテンツの内容を記述したテキスト情報とを含むユーザ視聴履歴情報を、ユーザIDと対応付けて記録する。テキスト情報は、例えば、番組概要文などである。記憶部19は、コンテンツ推薦装置1が受信した放送波から取得した番組概要文を記憶しており、視聴履歴記録部11は、番組概要文を記憶部19から読み出す。
具体的には、視聴履歴解析部13は、ユーザ視聴履歴情報に記述されている番組概要文などのテキスト情報を、公知の形態素解析技術を用いて単語単位に分割する。視聴履歴解析部13は、分割されたそれらの単語の中から、形態素解析の結果として各単語に付与された品詞などの情報に基づいて、検索語となる語句(単語)を選定する。例えば、視聴履歴解析部13は、固有名詞(例えば、人名)などの意味的に重要な語句(単語)を検索語として選択する。視聴履歴解析部13は、選択した語句をリストの形式で記述して一次クエリデータとする。
視聴履歴解析部13は、視聴履歴記録部11からユーザ視聴履歴情報を受信する(ステップS205)。基本の方法では、視聴履歴解析部13は、ユーザ視聴履歴情報から視聴済みコンテンツの内容を表す番組概要などのテキスト情報を取り出す(ステップS210)。別の方法としては、視聴履歴解析部13は、特許文献2に記載された方法のように、ユーザ視聴履歴情報に設定されている視聴コンテンツの再生区間に対応する字幕テキストなどのテキスト情報を記憶部19から取得する。
まず、クエリ拡張部16は、視聴履歴解析部13から一次クエリデータを受信し、ソーシャルデータ解析部15から二次クエリ候補リストデータを受信する(ステップS305)。次に、クエリ拡張部16は、二次クエリ候補リストデータに記述されたそれぞれの語句について、当該語句が一次クエリデータに記述されている語句であるか否かを判断する。クエリ拡張部16は、二次クエリ候補リストデータに記述されている二次クエリ候補の語句の中から、一次クエリデータに記述されているいずれかの語句と一致する語句を除外する(ステップS310)。
クエリ拡張部16は、二次クエリ候補の語句Aのそれぞれについて、語句Aが共起する一次クエリの語句Bと、語句Aとの類似度が所定の閾値を超える一次クエリの語句Cとが同一であるか否かを判断する。クエリ拡張部16は、語句Bと語句Cとが同一である二次クエリ候補の語句Aについては、二次クエリの語句として選択せず、二次クエリ候補リストデータからその語句Aに付加されている補足情報及び語句Cと共に除外する。クエリ拡張部16は、語句Bと語句Cとが異なる二次クエリ候補の語句Aについては、二次クエリ候補リストデータにそのまま残す(ステップS330)。
拡張クエリデータには、後述する図11の拡張クエリデータの具体例に示すように、先の類似度計算で得られた値(二次クエリの語句と一次クエリの語句との間の類似度)を各々の語句に併記してもよいが、これは必須の処理ではない。
まず、推薦リスト生成部17は、未視聴コンテンツ情報記録部12から未視聴コンテンツ情報を受信し、クエリ拡張部16から拡張クエリデータを受信する(ステップS405)。推薦リスト生成部17は、拡張クエリデータの部分集合である一次クエリデータを取得する。推薦リスト生成部17は、未視聴コンテンツ情報のリストに記述されている各コンテンツについて、そのコンテンツのテキスト情報と一次クエリデータに属する一次クエリの語句とのマッチングスコアを計算し、一次スコアとする(ステップS410)。一次スコアを計算する具体的な処理としては、例えば、表記レベルで一次クエリの語句と一致する語句の出現頻度を単純に足し上げ、その出現頻度の合計値をそのまま利用する方法が考えられるが、その限りではない。
図6は、視聴履歴記録部11が出力するユーザ視聴履歴情報の具体例を示す図である。ユーザ視聴履歴情報には、ユーザが視聴したコンテンツを特定する情報と、コンテンツの内容を示すテキスト情報とが、コンテンツごとに記述される。解析対象のコンテンツが放送番組である場合、同図に示すように、ユーザ視聴履歴情報には、ユーザが視聴した番組の放送チャンネル名、放送日時、番組名、及び番組概要文が、リスト形式で記述される。なお、これら放送番組に関する各種情報は、SKNET社のMonsterTVなどの商用ソフトウェアを用いることによって、放送波から計算機可読な状態で取得可能である。
また、クエリ拡張部16は、二次クエリ候補リストデータから二次クエリ候補の語句「住民投票」と、その語句の補足情報(スコットランド)と、類似度が所定以上の相手の一次クエリの語句「政治」を読み出す。クエリ拡張部16は、補足情報に、類似度が所定以上の相手の一次クエリの語句「政治」以外の一次クエリの語句「スコットランド」が設定されているため、二次クエリ候補の語句「住民投票」を二次クエリの語句として選択する。クエリ拡張部16は、二次クエリ候補の語句「住民投票」を二次クエリ候補リストデータにそのまま残す。
同図に示す拡張クエリデータに設定されている語句のリストのうち前半の語句「建築」、「スコットランド」、「政治」は、一次クエリデータから引き継がれた語句である。拡張クエリデータに設定されている語句のリストのうち後半の語句「グラスゴー」及び「住民投票」は、ステップS335において二次クエリ候補の語句の中からクエリ拡張部16が二次クエリとして採択した語句である。
(2)語句Aと共起関係にある一次クエリの語句Bが、(1)の一次クエリの語句Cと異なること。
また、上記実施形態においては、ソーシャルデータを利用して二次クエリ候補の語句を取得しているが、他のデータを利用して二次クエリの語句を取得してもよい。ソーシャルデータのように、同じ話題に対して多様な表記が用いられ、話題の対象をタイムスタンプなどの時刻により特定することができる計算機利用可能なコーパスデータであれば、任意のデータを利用することができる。
また、本実施形態のコンテンツ推薦装置1によれば、元の検索語と意味的な関係が深い語句(拡張クエリ)に基づいた多様性に富んだコンテンツ推薦が可能となる。その結果、元の検索語だけからは見つけ出すことが難しい、ユーザの新たな興味の発掘や発見につながる可能性(セレンディピティ)に富んだコンテンツを推薦することができる。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
11 視聴履歴記録部
12 未視聴コンテンツ情報記録部
13 視聴履歴解析部
14 ソーシャルデータ記録部
15 ソーシャルデータ解析部
16 クエリ拡張部
17 推薦リスト生成部
18 推薦コンテンツ提示部
19 記憶部
3 コンテンツ表示装置
31 操作部
32 取得部
33 出力部
34 通知部
35 受信部
5 ソーシャルメディアサービス提供装置
9 ネットワーク
Claims (6)
- 検索に用いる語句である検索語のリストを示す一次クエリデータを取得する取得部と、
同一の話題が異なる表記により記述され得る複数のコーパスデータから検索語候補の語句を抽出する検索語候補抽出部と、
前記検索語候補の語句の中から、前記一次クエリデータに含まれるいずれかの前記検索語との類似度が所定条件よりも高く、かつ、前記所定条件よりも高い前記類似度を得た前記検索語とは異なる前記検索語のいずれかと前記コーパスデータにおいて共起する検索語候補の語句を選択して前記検索語に追加するクエリ拡張部と、
前記一次クエリデータに含まれる前記検索語と、前記クエリ拡張部が追加した前記検索語とを用いてコンテンツを検索する検索部と、
を備えることを特徴とするコンテンツ推薦装置。 - 前記検索語候補抽出部は、所定期間内の前記コーパスデータから前記検索語候補の語句を抽出する、
ことを特徴とする請求項1に記載のコンテンツ推薦装置。 - 前記取得部は、ユーザが視聴したコンテンツに関するテキスト情報から抽出した語句からなる一次クエリデータを取得する、
ことを特徴とする請求項1または請求項2に記載のコンテンツ推薦装置。 - 前記取得部は、ユーザが再生したコンテンツの部分に関するテキスト情報から抽出した語句からなる一次クエリデータを取得する、
ことを特徴とする請求項1から請求項3のいずれか1項に記載のコンテンツ推薦装置。 - 前記検索語候補抽出部は、前記コーパスデータのタグまたは本文から前記検索語候補の語句を抽出する、
ことを特徴とする請求項1から請求項4のいずれか1項に記載のコンテンツ推薦装置。 - コンピュータを、
検索に用いる語句である検索語のリストを示す一次クエリデータを取得する取得手段と、
同一の話題が異なる表記により記述され得る複数のコーパスデータから検索語候補の語句を抽出する検索語候補抽出手段と、
前記検索語候補の語句の中から、前記一次クエリデータに含まれるいずれかの前記検索語との類似度が所定条件よりも高く、かつ、前記所定条件よりも高い前記類似度を得た前記検索語とは異なる前記検索語のいずれかと前記コーパスデータにおいて共起する検索語候補の語句を選択して前記検索語に追加するクエリ拡張手段と、
前記一次クエリデータに含まれる前記検索語と、前記クエリ拡張手段が追加した前記検索語とを用いてコンテンツを検索する検索手段と、
を具備するコンテンツ推薦装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015000334A JP6429382B2 (ja) | 2015-01-05 | 2015-01-05 | コンテンツ推薦装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015000334A JP6429382B2 (ja) | 2015-01-05 | 2015-01-05 | コンテンツ推薦装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016126567A JP2016126567A (ja) | 2016-07-11 |
JP6429382B2 true JP6429382B2 (ja) | 2018-11-28 |
Family
ID=56359541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015000334A Expired - Fee Related JP6429382B2 (ja) | 2015-01-05 | 2015-01-05 | コンテンツ推薦装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6429382B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6653669B2 (ja) * | 2017-01-17 | 2020-02-26 | 株式会社LIGHTz | 情報提供装置、情報提供システム、情報提供方法及びプログラム |
CN108052554B (zh) * | 2017-11-29 | 2019-04-30 | 有米科技股份有限公司 | 多维度拓展关键词的方法和装置 |
JP6788637B2 (ja) * | 2018-02-27 | 2020-11-25 | 株式会社 ミックウェア | 情報検索装置及び情報検索システム |
JP7134698B2 (ja) * | 2018-05-11 | 2022-09-12 | 株式会社Nttドコモ | 情報処理装置及びプログラム |
TWI730539B (zh) * | 2019-10-09 | 2021-06-11 | 開曼群島商粉迷科技股份有限公司 | 動態數位內容的顯示方法、圖形使用者介面與系統 |
US11354721B2 (en) * | 2019-10-16 | 2022-06-07 | Coupang Corp. | Computerized systems and methods for providing product recommendations |
KR102418953B1 (ko) * | 2020-05-11 | 2022-07-11 | 네이버 주식회사 | 쇼핑 검색 결과 확장 방법 및 시스템 |
JP7297084B2 (ja) * | 2020-06-28 | 2023-06-23 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | インターネットミームの生成方法及び装置、電子装置並びに媒体 |
JP7434125B2 (ja) | 2020-09-16 | 2024-02-20 | 株式会社東芝 | 文書検索装置、文書検索方法、及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4065346B2 (ja) * | 1997-07-28 | 2008-03-26 | 株式会社ジャストシステム | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4452527B2 (ja) * | 2004-03-05 | 2010-04-21 | 株式会社ジャストシステム | 文書検索装置、文書検索方法、および文書検索プログラム |
US9081852B2 (en) * | 2007-10-05 | 2015-07-14 | Fujitsu Limited | Recommending terms to specify ontology space |
JP5181926B2 (ja) * | 2008-08-21 | 2013-04-10 | 富士通株式会社 | 情報検索装置、情報検索方法及び情報検索プログラム |
JP5300068B2 (ja) * | 2009-06-10 | 2013-09-25 | 国立大学法人電気通信大学 | 動画推薦装置 |
US10198431B2 (en) * | 2010-09-28 | 2019-02-05 | Siemens Corporation | Information relation generation |
JP5130340B2 (ja) * | 2010-10-26 | 2013-01-30 | ヤフー株式会社 | 情報選択装置、方法及びプログラム |
GB2486257B (en) * | 2010-12-09 | 2015-05-27 | Samsung Electronics Co Ltd | Multimedia system and method of recommending multimedia content |
JP5768492B2 (ja) * | 2011-05-18 | 2015-08-26 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2015
- 2015-01-05 JP JP2015000334A patent/JP6429382B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016126567A (ja) | 2016-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
US11978439B2 (en) | Generating topic-specific language models | |
US11197036B2 (en) | Multimedia stream analysis and retrieval | |
US9008489B2 (en) | Keyword-tagging of scenes of interest within video content | |
CN101267518B (zh) | 从内容元数据提取相关信息的方法和装置 | |
US20080235209A1 (en) | Method and apparatus for search result snippet analysis for query expansion and result filtering | |
US20100274667A1 (en) | Multimedia access | |
US20100262599A1 (en) | Content processing systems and methods | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP2011529600A (ja) | 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置 | |
JP5952711B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
Kunneman et al. | Open-domain extraction of future events from Twitter | |
JP6876649B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6760987B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6762678B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6830917B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP5478146B2 (ja) | 番組検索装置および番組検索プログラム | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP2018180913A (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 | |
Godfrey Winster et al. | Ontology-based blog collection and profile-based personalised ranking | |
Goto et al. | A TV agent system that integrates knowledge and answers users' questions | |
Sabhnani et al. | Real-time Topic Detection and Tracking in Microblog: Towards A Comprehensive Tweet Recommendation System | |
Cao et al. | Known-Item Search by MCG-ICT-CAS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181002 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6429382 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |