JP5346991B2 - コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム - Google Patents

コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム Download PDF

Info

Publication number
JP5346991B2
JP5346991B2 JP2011134070A JP2011134070A JP5346991B2 JP 5346991 B2 JP5346991 B2 JP 5346991B2 JP 2011134070 A JP2011134070 A JP 2011134070A JP 2011134070 A JP2011134070 A JP 2011134070A JP 5346991 B2 JP5346991 B2 JP 5346991B2
Authority
JP
Japan
Prior art keywords
keyword
content
score
data
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011134070A
Other languages
English (en)
Other versions
JP2013003830A (ja
Inventor
大我 吉田
彰 中山
篤信 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011134070A priority Critical patent/JP5346991B2/ja
Publication of JP2013003830A publication Critical patent/JP2013003830A/ja
Application granted granted Critical
Publication of JP5346991B2 publication Critical patent/JP5346991B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラムに関する。
情報機器および通信ネットワークの発達に伴い、ユーザは、通信ネットワーク上の大量のコンテンツにアクセスすることができるようになった。それに伴い、大量のコンテンツから所望のコンテンツを検索するために、検索技術の重要性が高まっている。検索技術として、ユーザがキーワードのリストを入力し、入力されたキーワードと関連の強いコンテンツのリストを検索結果として提示することが一般的である。
例えば、ユーザが入力したキーワードとの一致度が高く、かつ、重要度の高いコンテンツが上位になるよう、コンテンツのランキングを作成する技術がある(例えば、特許文献1参照。)。特許文献1に記載の技術では、各コンテンツに含まれるキーワードの重要度に基づいて、コンテンツの重要度が予め算出される。このような技術により、ユーザは、入力したキーワードと関連の強いコンテンツを検索することができる。
特開2010−61322号公報
しかしながら、上記特許文献1に記載の技術では、ユーザが複数のキーワードを入力した際、そのキーワードは均等に扱われる問題がある。
例えば、「京都 紅葉」と入力したユーザは、京都と紅葉に関連するコンテンツの検索を希望していると考えられる。しかし、このような検索条件を入力したユーザには、「京都に旅行したいと思っており、紅葉の情報を探しているユーザ」や、「紅葉を見に行きたいと思っており、中でも京都で見たいと思っているユーザ」が含まれる。このとき、前者のユーザは「京都」という条件を重視したいと考え、後者のユーザは「紅葉」という条件を重視したいと考えている。
このように従来の検索技術では、検索条件として複数のキーワードが入力されても、両者を区別して検索することなく、均等な重みで検索することしかできなかった。
従って本発明の目的は、複数のクエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラムを提供することである。
上記課題を解決するために、本発明の第1の特徴は、クエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力方法に関する。すなわち本発明の第1の特徴に係るコンテンツ出力方法は、順序が付された複数のクエリキーワードを含むキーワードリストが入力されると、順序に基づいて、キーワードリストにおける個々のクエリキーワードのユーザキーワードスコアを算出し、クエリキーワードおよび当該クエリキーワードのユーザキーワードスコアを対応づけたユーザキーワードスコアデータを出力するステップと、コンテンツデータに対応づけられた個々のキーワードの共起頻度に基づいて、当該コンテンツデータにおける個々のキーワードの重要度に基づいたコンテンツキーワードスコアを算出し、コンテンツデータの識別子、キーワードおよび当該コンテンツデータおよびキーワードに対応するコンテンツキーワードスコアを対応づけたコンテンツキーワードスコアデータを出力するステップと、クエリキーワードに一致するキーワードが対応づけられ、当該クエリキーワードのユーザキーワードスコアが高く、当該クエリキーワードに対応するコンテンツキーワードスコアが高いコンテンツデータについて、コンテンツスコアが高くなるようにコンテンツスコアを算出するステップと、コンテンツスコアの高いコンテンツデータの識別子を出力するステップを備え、コンテンツキーワードスコアデータを算出するステップは、共起頻度に基づいて、2つのキーワードの関係性の強さRを算出するステップと、関係性の強さRに基づいて、重要度を算出するステップをさらに備え、2つのキーワードの関係性の強さRは、任意の2つのキーワードiおよびキーワードjについて、請求項1に記載の式(1)および式(2)に基づいて、算出される。
本発明の第2の特徴は、クエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力装置に関する。すなわち本発明の第2の特徴に係るコンテンツ出力装置は、順序が付された複数のクエリキーワードを含むキーワードリストが入力されると、順序に基づいて、キーワードリストにおける個々のクエリキーワードのユーザキーワードスコアを算出し、クエリキーワードおよび当該クエリキーワードのユーザキーワードスコアを対応づけたユーザキーワードスコアデータを出力するユーザキーワードスコア算出手段と、コンテンツデータに対応づけられた個々のキーワードの共起頻度に基づいて、当該コンテンツデータにおける個々のキーワードの重要度に基づいたコンテンツキーワードスコアを算出し、コンテンツデータの識別子、キーワードおよび当該コンテンツデータおよびキーワードに対応するコンテンツキーワードスコアを対応づけたコンテンツキーワードスコアデータを出力するコンテンツキーワードスコア算出手段と、クエリキーワードに一致するキーワードが対応づけられ、当該クエリキーワードのユーザキーワードスコアが高く、当該クエリキーワードに対応するコンテンツキーワードスコアが高いコンテンツデータについて、コンテンツスコアが高くなるようにコンテンツスコアを算出するコンテンツスコア算出手段と、コンテンツスコアの高いコンテンツデータの識別子を出力するコンテンツ出力手段を備え、コンテンツキーワードスコア算出手段は、共起頻度に基づいて、2つのキーワードの関係性の強さRを算出するとともに、関係性の強さRに基づいて、重要度を算出し、2つのキーワードの関係性の強さRは、任意の2つのキーワードiおよびキーワードjについて、請求項1に記載の式(1)および式(2)に基づいて、算出される。
本発明の第3の特徴は、コンピュータに本発明の第1の特徴に記載のステップを実行させるためのコンテンツ出力プログラムに関する。
本発明によれば、複数のクエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラムを提供することができる。
本発明の実施の形態に係るコンテンツ出力方法を説明するフローチャートである。 本発明の実施の形態に係るコンテンツ出力方法におけるクエリキーワード入力の一例を説明する図である。 本発明の実施の形態に係るコンテンツ出力装置の機能ブロックを説明する図である。 本発明の実施の形態に係るコンテンツキーワードスコアデータのデータ構造とデータの一例を説明する図である。 本発明の実施の形態に係るユーザキーワードスコアデータのデータ構造とデータの一例を説明する図である。 本発明の実施の形態に係るコンテンツスコアデータのデータ構造とデータの一例を説明する図である。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。
(実施の形態)
本発明の実施の形態に係るコンテンツ出力方法は、ユーザが入力したクエリキーワードに基づいてコンテンツデータを出力する。コンテンツデータに、コンテンツデータを意味するキーワードが対応づけられ、ユーザが入力したキーワードの一致度の高いコンテンツが出力される。本発明の実施の形態においては、コンテンツデータとして、文書データを例に挙げて説明するが、これに限られない。例えばコンテンツデータは、動画データ、音楽データ、画像データなどであっても良い。また、本発明の実施の形態においては、ユーザが、入力装置を介してクエリキーワードを入力してコンテンツを検索する場合について説明するがこの実装方法には限られない。本発明の実施の形態に係るコンテンツ出力方法は、他のコンピュータやシステムが、通信制御装置および通信ネットワークを介してクエリキーワードを入力してコンテンツを検索する場合にも適用することができる。
図1に示すように本発明の実施の形態に係るコンテンツ出力方法は、まずステップS1において、コンテンツキーワードスコアが算出される。このコンテンツキーワードスコアは、コンテンツに付与されるそれぞれのキーワードについて、そのコンテンツにおけるキーワードの重要度に基づいて算出される。コンテンツキーワードスコアは、コンテンツおよびキーワードごとに、算出される。本発明の実施の形態においては、ユーザが検索するのに先立ち、全てのコンテンツについて、全てのキーワードのコンテンツキーワードスコアが算出される。このコンテンツキーワードスコアは、コンテンツの内容と強く関連している重要キーワードであるか否かを示す指標である。コンテンツキーワードスコアは例えば、全コンテンツ集合におけるキーワードの共起関係に基づいて算出される。
ステップS2においてユーザからキーワードリストが入力されると、後述する処理で、コンテンツが検索される。ここで、本発明の実施の形態においてユーザが入力するキーワードリストは、複数のクエリキーワードを含む。例えばユーザは、図2に示すようなコンテンツ検索画面P101のキーワードリスト入力部に、「京都」および「紅葉」と複数のクエリキーワードを、入力する。図2に示す例では、クエリキーワードをスペースで区切る場合を説明したが、カンマなどの他の区切り文字が用いられても良い。
ここでユーザが検索ボタンが押下すると、ステップS3において、入力された複数のクエリキーワードのそれぞれについて、ユーザキーワードスコアが算出される。ユーザキーワードスコアは、ユーザがより上位に入力した場合ほど、大きい値をとる。
さらにステップS4において、ステップS1で算出したコンテンツキーワードスコアと、ステップS3で算出したユーザキーワードスコアに基づいて、コンテンツスコアが算出される。コンテンツスコアは、各コンテンツに付与されたキーワードの重要度と、ユーザが入力したクエリキーワードのユーザキーワードスコアに基づいて、各コンテンツについて算出される。ここで、ユーザが入力したクエリキーワードと共通するキーワードが付与されたコンテンツの集合が取得され、各コンテンツについてコンテンツスコアが算出される。コンテンツスコアは、共通するキーワードのユーザキーワードスコアが高く、共通するキーワードのコンテンツキーワードスコアが高く、共通するキーワードの数が多い場合ほど、大きい値をとる。
コンテンツスコアが算出されると、ステップS5において、コンテンツスコアの高いコンテンツが、出力される。本発明の実施の形態においては、入力したキーワードのいずれかを含むコンテンツが出力される。このとき、コンテンツスコアの高い順に、ソートされてコンテンツの識別子が表示される。
図2に示すコンテンツ検索画面P101のように、キーワード「京都」および「紅葉」に対応づけられたコンテンツ、「京都」または「紅葉」に対応づけられたコンテンツが検索される。また、コンテンツスコアの高い順にソートされて出力される。キーワード「京都」および「紅葉」に対応づけられたコンテンツは、上位に検索されやすく、いずれかのみを含むコンテンツは、比較的下位に検索されやすい。また、図2に示す例では、「京都」が、「紅葉」より先に入力されていることにより、ユーザは「京都」を重視して検索していると考えられる。従って、「紅葉」にのみ対応づけられたコンテンツより、「京都」にのみ対応づけられたコンテンツの方が、上位に検索されやすい。
図3を参照して、本発明の実施の形態に係るコンテンツ出力装置1を説明する。本発明の実施の形態に係るコンテンツ出力装置1は、記憶装置10、中央処理制御装置20、入力装置30、通信制御装置40および表示装置50を備える。コンテンツ出力装置1は、一般的なコンピュータに、所定の処理を実行するコンテンツ出力プログラムがインストールされ、実行されることによって実現される。
記憶装置10には、コンテンツ出力プログラムが記憶されるとともに、コンテンツキーワードスコアデータ11、キーワードリストデータ12、ユーザキーワードスコアデータ12、コンテンツスコアデータ13およびコンテンツ蓄積データ15が記憶される。コンテンツキーワードスコアデータ11、キーワードリストデータ12、ユーザキーワードスコアデータ12およびコンテンツスコアデータ13は、後述する処理によって記憶装置10に記憶される。
コンテンツ蓄積データ15は、コンテンツ出力装置1が出力可能なコンテンツデータを蓄積するデータである。例えば、ユーザから指定されたコンテンツデータが、コンテンツ蓄積データ15から抽出され、表示装置50に表示される。
中央処理制御装置20は、コンテンツキーワードスコア算出手段21、キーワードリスト取得手段22、ユーザキーワードスコア算出手段23、コンテンツスコア算出手段24およびコンテンツ出力手段25を備える。
コンテンツキーワードスコア算出手段21は、コンテンツデータに対応づけられた個々のキーワードの共起頻度に基づいて、当該コンテンツデータにおける個々のキーワードの重要度に基づいたコンテンツキーワードスコアを算出する。コンテンツキーワードスコア算出手段21は、コンテンツデータの識別子、キーワードおよび当該コンテンツデータおよびキーワードに対応するコンテンツキーワードスコアを対応づけたコンテンツキーワードスコアデータ11を出力し、記憶装置10に記憶する。
ここで、コンテンツキーワードスコアデータ11は、図4に示すようなデータ構造を備える。コンテンツキーワードスコアデータ11は、コンテンツ識別子およびキーワードをキーに、コンテンツキーワードスコアが対応づけられる。コンテンツ識別子には、複数のキーワードが付与されている場合、コンテンツキーワードスコアは、それぞれのキーワードについて算出される。
コンテンツキーワードスコア算出手段21の処理を説明する。コンテンツキーワードスコア算出手段21は、まず、それぞれのコンテンツにおけるキーワードの重要度を算出する。コンテンツにおけるキーワードの重要度は、例えば、同一コンテンツに付与された他のキーワードとの共起頻度に基づいて算出することができる。コンテンツに付与されたキーワードとしては、コンテンツのタイトルや概要文などのメタデータ、タグ、コンテンツ自体に含まれるテキスト情報、コンテンツに対するコメント、およびそれらのテキストから形態素解析などによって抽出した単語などである。
ここで、コンテンツaに付与されたキーワードの集合を、式(1)のように表現すると、コンテンツaにおけるキーワードKiの重要度I(K,K)は、式(2)により算出される。
Figure 0005346991
Figure 0005346991
ここで、|Ka|は、コンテンツaのキーワードの集合Kaの要素数である。また、R(k,k)は、キーワードkと、キーワードkの関係性の強さを表す関数である。ここで、コンテンツにおけるキーワードの重要度を、コンテンツ間で比較できるようにするため、算出した重要度を|Ka|−1で割り、正規化しても良い。
キーワードkがコンテンツaに付与されたより多くの他のキーワードとより強い共起関係にあるほど、I(K,K)の値は大きくなる。
R(k,k)は、例えば、式(3)により算出される。
Figure 0005346991
ただし、Nは、はコンテンツ蓄積データ15において蓄積されているコンテンツ集合に存在するコンテンツの総数である。式(4)は、キーワードk,kが共に付与されたコンテンツ数である。式(5)は、キーワードk,kのどちらも付与されていないコンテンツ数である。式(6)は、キーワードkは付与されキーワードkは付与されていないコンテンツ数である。式(7)は、キーワードkは付与されキーワードkは付与されていないコンテンツ数である。
Figure 0005346991

また、式(8)は、キーワードk が付与されているコンテンツ数である。式(9)は、キーワードk が付与されていないコンテンツ数である。式(10)は、キーワードkが付与されているコンテンツ数である。式(11)は、キーワードkが付与されていないコンテンツ数である。
Figure 0005346991
ここで、全コンテンツにおいて、kとkが一つのコンテンツに同時に付与されることが多い場合、R(k,k)は、プラスの大きい値をとる。例えば、kとkとが、同一ジャンルに関連するキーワードの場合、R(k,k)は、プラスの大きい値をとる。一方、kとkが一つのコンテンツに同時に付与されないことが多い場合、R(k,k)は、マイナスの小さい値をとる。kとkとが、例えば反対語などであって、kがでることでkがでにくくなる関係のキーワードの場合、R(k,k)は、マイナス方向に大きい値をとる。kとkが全く関係のないキーワード場合、R(k,k)は、0に近い値をとる。
コンテンツaにおけるキーワードkのコンテンツキーワードスコアの値は、例えば、コンテンツaにおけるキーワードkの重要度Iを用いることができる。このとき、コンテンツaにおけるキーワードkのコンテンツキーワードスコアを式(12)で表現すると、コンテンツキーワードスコアは、以下の式(13)により算出される。
Figure 0005346991
ここで、コンテンツaにおけるキーワードkのコンテンツキーワードスコアの値は、コンテンツaにおけるキーワードkの重要度のランキングに基づく値でも良い。例えば、コンテンツaにおけるキーワードkのコンテンツキーワードスコアの値は、Kのうち何番目に高い値であるかに基づいて算出されても良い。この場合、コンテンツaにおけるキーワードkのコンテンツキーワードスコアを式(14)で表現すると、コンテンツキーワードスコアは、以下の式(15)により算出される。
Figure 0005346991
ここで、IKa,kiは、コンテンツaにおけるキーワードkの重要度が、Kのうち何番目に高い値であるかを示す値である。
このように、式(13)または式(15)によって、コンテンツキーワードスコア算出手段21は、各コンテンツにおける各キーワードのコンテンツキーワードスコアを算出することができる。
キーワードリスト取得手段22は、ユーザから入力されるキーワードリストデータ12を取得して、記憶装置10に記憶する。本発明の実施の形態においてキーワードリストデータ12は、図2を参照して説明した通り、順序づけされた複数のクエリキーワードを含む。図2に示す例では、クエリキーワードの記載の順番に基づいてクエリキーワードを順序づけたがこれに限られない。例えば、スライドバーやテキスト形式の入力などを用いて、ユーザが、各クエリキーワードについて明示的に順序を示しても良い。
ユーザキーワードスコア算出手段23は、キーワードリストデータ12の順序に基づいて、キーワードリストデータ12における個々のクエリキーワードデータのユーザキーワードスコアを算出する。ユーザキーワードスコア算出手段23は、クエリキーワードおよび当該クエリキーワードのユーザキーワードスコアを対応づけたユーザキーワードスコアデータ12を出力し、記憶装置10に記憶する。
ここで、ユーザキーワードスコアデータ12は、図5に示すようなデータ構造を備える。ユーザキーワードスコアデータ12は、クエリキーワードをキーに、ユーザキーワードスコアが対応づけられる。
ユーザキーワードスコア算出手段23の処理を説明する。ユーザが入力した順序つきキーワードリストデータ12をKとする。ここでキーワードkのユーザキーワードスコアデータK(K,k)は、キーワードリストデータ12において、ユーザが何番目に入力したキーワードであるかに基づいて算出されても良い。このときユーザキーワードスコアデータK(K,k)は、式(16)により算出される。
Figure 0005346991
ここで、IK,kは、キーワードkが、Kにおいて何番目のキーワードであるかを示す値である。ユーザがクエリキーワードの順序を明示的に示した場合、K(K,k)の値は、そのユーザが示した順序を用いても良い。
このように、ユーザキーワードスコア算出手段23は、ユーザが入力した複数のクエリキーワードの順序に基づいてユーザキーワードスコアを決定することにより、ユーザがより重視したいキーワードを明確にすることができる。
コンテンツスコア算出手段24は、クエリキーワードに一致するキーワードが対応づけられ、当該クエリキーワードのユーザキーワードスコアが高いコンテンツデータについて、コンテンツスコアが高くなるようにコンテンツスコアを算出する。コンテンツスコア算出手段24は、コンテンツの識別子と、このコンテンツのコンテンツスコアを対応づけたコンテンツスコアデータ13を出力し、記憶装置10に記憶する。ここで、コンテンツキーワードスコアが高いほど、また、キーワードリストの複数のクエリキーワードと一致するキーワードの数が多いほど、コンテンツスコアは高くなる。

ここで、コンテンツスコアデータ13は、図6に示すようなデータ構造を備える。コンテンツスコアデータ13は、コンテンツ識別子をキーに、コンテンツスコアが対応づけられる。
コンテンツスコア算出手段24の処理を説明する。ユーザがキーワードリストKを入力したときの、コンテンツaのコンテンツスコアS(K,K)は、例えば、式(17)により算出される。
Figure 0005346991
ただし、δ(k,k)は、kとkとが等しい場合に1を、それ以外の場合に0となる関数である。また、コンテンツキーワードスコアK(K,k)の値は、式(13)または式(15)の値である。ユーザキーワードスコアK(K,k)の値は、式(16)の値である。
コンテンツスコア算出手段24は、キーワードリストデータ12に含まれるそれぞれのクエリキーワードに対して、全コンテンツについてコンテンツスコアを算出する。
このようにコンテンツスコア算出手段24は、ユーザが入力したキーワードリストデータ12のクエリキーワードの集合と、コンテンツに付与されたキーワードの集合で共通するキーワードの集合に含まれるキーワード数が多いほど、また、各キーワードのコンテンツキーワードスコアおよびユーザキーワードスコアが大きいほど、コンテンツスコアの値が大きくなるように、コンテンツスコアを算出することができる。
コンテンツ出力手段25は、コンテンツスコアの高い順にコンテンツ識別子をソートし、コンテンツスコアの高いコンテンツデータの識別子を出力する。ここでコンテンツ出力手段25は、コンテンツ蓄積データ15のコンテンツデータから抽出したコンテンツスコアの高いコンテンツデータを表示装置50や通信制御装置40に出力しても良い。
コンテンツ出力手段25は、図2に示すように、コンテンツスコアの高いコンテンツデータについて、コンテンツデータの識別子と説明文を表示装置50や通信制御装置40に出力しても良い。ユーザから所定のコンテンツデータの識別子が選択されると、コンテンツ出力手段25は、指定されたコンテンツデータを、表示装置50や通信制御装置40に出力する。
ここでコンテンツ出力手段25は、コンテンツスコアの高いコンテンツデータの識別子に、当該コンテンツデータに対応づけられたキーワードのうち、クエリキーワードと一致するキーワードを対応づけて出力しても良い。コンテンツ出力手段25は、例えば図2に示すように、コンテンツスコアに寄与したキーワードのリストを出力する。これによりユーザは、各コンテンツがどのようなキーワードに関連しているのかを把握しやすくなる。
具体的には、コンテンツ出力手段25は、式(16)において、δ(k,k)が1となるキーワードの集合を特定する。さらにコンテンツ出力手段25は、各コンテンツについて、K(K,k)×K(K,k)の値が大きい順にキーワードを並べ替えたリストを、出力しても良い。例えば図2に示す例では、「京都の紅葉スポット」のコンテンツは、クエリキーワードとして入力された「京都」および「紅葉」のそれぞれがキーワードとして対応づけられている。ここで、キーワード「京都」は、K(K,k)×K(K,k)の値が高く、キーワード「紅葉」は低い。従って図2では、キーワード「京都」は、キーワード「紅葉」より前方に記載されている。一方「京都府の観光情報」のコンテンツは、クエリキーワードとして入力された「京都」および「紅葉」のうち、「京都」がキーワードとして対応づけられている。従って、図2では、キーワード「京都」のみが記載されている。
このように、コンテンツに対応づけられたキーワードと、キーワードリストのクエリキーワードが一致する場合、そのコンテンツの識別子とともに、その一致したキーワードを表示することにより、ユーザは、どのキーワードに一致するコンテンツなのかを把握しやすい。
このように本発明の実施の形態に係るコンテンツ出力装置1は、各コンテンツについて、コンテンツに付与されたキーワード群を重要度順に並べ替え、ユーザが入力した順序つきキーワードのリストに対し、ユーザが入力した上位のキーワードが、コンテンツにおける重要度の高いキーワードと一致するコンテンツを提示する。
これにより、ユーザが重視したいと思っているキーワードとより強く関連するコンテンツを、適切に検索することができる。また、共通キーワードのユーザキーワードスコアおよび共通キーワードのコンテンツキーワードスコアが高いキーワードを、提示する各コンテンツと共に提示することにより、各コンテンツがユーザが入力したどのキーワードと強く関連しているコンテンツなのかをユーザが把握しやすくすることができる。
(その他の実施の形態)
上記のように、本発明の実施の形態によって記載したが、この開示の一部をなす論述および図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例および運用技術が明らかとなる。
例えば、本発明の実施の形態に記載したコンテンツ出力装置は、図3に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。また、既存の情報処理システム上に実現されても良い。
本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
1 コンテンツ出力装置
10 記憶装置
11 コンテンツキーワードスコアデータ
12 キーワードリストデータ
13 ユーザキーワードスコアデータ
14 コンテンツスコアデータ
15 コンテンツ蓄積データ
20 中央処理制御装置
21 コンテンツキーワードスコア算出手段
22 キーワードリスト取得手段
23 ユーザキーワードスコア算出手段
24 コンテンツスコア算出手段
25 コンテンツ出力手段
30 入力装置
40 通信制御装置
50 表示装置

Claims (3)

  1. クエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力方法であって、
    順序が付された複数のクエリキーワードを含むキーワードリストが入力されると、前記順序に基づいて、前記キーワードリストにおける個々のクエリキーワードのユーザキーワードスコアを算出し、前記クエリキーワードおよび当該クエリキーワードのユーザキーワードスコアを対応づけたユーザキーワードスコアデータを出力するステップと、
    コンテンツデータに対応づけられた個々のキーワードの共起頻度に基づいて、当該コンテンツデータにおける個々のキーワードの重要度に基づいたコンテンツキーワードスコアを算出し、コンテンツデータの識別子、キーワードおよび当該コンテンツデータおよびキーワードに対応するコンテンツキーワードスコアを対応づけたコンテンツキーワードスコアデータを出力するステップと、
    クエリキーワードに一致するキーワードが対応づけられ、当該クエリキーワードのユーザキーワードスコアが高く、当該クエリキーワードに対応するコンテンツキーワードスコアが高いコンテンツデータについて、コンテンツスコアが高くなるようにコンテンツスコアを算出するステップと、
    前記コンテンツスコアの高いコンテンツデータの識別子を出力するステップ
    を備え、
    前記コンテンツキーワードスコアデータを算出するステップは、
    前記共起頻度に基づいて、2つのキーワードの関係性の強さRを算出するステップと、
    前記関係性の強さRに基づいて、前記重要度を算出するステップをさらに備え、
    前記2つのキーワードの関係性の強さRは、
    任意の2つのキーワードiおよびキーワードjについて、
    Figure 0005346991
    および
    Figure 0005346991
    に基づいて、算出される
    ことを特徴とするコンテンツ出力方法。
  2. クエリキーワードに基づいてコンテンツデータを出力するコンテンツ出力装置であって、
    順序が付された複数のクエリキーワードを含むキーワードリストが入力されると、前記順序に基づいて、前記キーワードリストにおける個々のクエリキーワードのユーザキーワードスコアを算出し、前記クエリキーワードおよび当該クエリキーワードのユーザキーワードスコアを対応づけたユーザキーワードスコアデータを出力するユーザキーワードスコア算出手段と、
    コンテンツデータに対応づけられた個々のキーワードの共起頻度に基づいて、当該コンテンツデータにおける個々のキーワードの重要度に基づいたコンテンツキーワードスコアを算出し、コンテンツデータの識別子、キーワードおよび当該コンテンツデータおよびキーワードに対応するコンテンツキーワードスコアを対応づけたコンテンツキーワードスコアデータを出力するコンテンツキーワードスコア算出手段と、
    クエリキーワードに一致するキーワードが対応づけられ、当該クエリキーワードのユーザキーワードスコアが高く、当該クエリキーワードに対応するコンテンツキーワードスコアが高いコンテンツデータについて、コンテンツスコアが高くなるようにコンテンツスコアを算出するコンテンツスコア算出手段と、
    前記コンテンツスコアの高いコンテンツデータの識別子を出力するコンテンツ出力手段
    を備え、
    前記コンテンツキーワードスコア算出手段は、
    前記共起頻度に基づいて、2つのキーワードの関係性の強さRを算出するとともに、前記関係性の強さRに基づいて、前記重要度を算出し、
    前記2つのキーワードの関係性の強さRは、任意の2つのキーワードiおよびキーワードjについて、請求項1に記載の式(1)および式(2)に基づいて、算出される
    ことを特徴とするコンテンツ出力装置。
  3. コンピュータに、請求項1に記載のステップを実行させるためのコンテンツ出力プログラム。
JP2011134070A 2011-06-16 2011-06-16 コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム Active JP5346991B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011134070A JP5346991B2 (ja) 2011-06-16 2011-06-16 コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011134070A JP5346991B2 (ja) 2011-06-16 2011-06-16 コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム

Publications (2)

Publication Number Publication Date
JP2013003830A JP2013003830A (ja) 2013-01-07
JP5346991B2 true JP5346991B2 (ja) 2013-11-20

Family

ID=47672337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011134070A Active JP5346991B2 (ja) 2011-06-16 2011-06-16 コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム

Country Status (1)

Country Link
JP (1) JP5346991B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679848B (zh) * 2015-02-13 2019-05-03 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
JP2018055605A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
CN112182404B (zh) * 2020-10-23 2023-08-11 网易(杭州)网络有限公司 问题查询方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3225909B2 (ja) * 1997-12-08 2001-11-05 日本電気株式会社 情報検索装置、方法及び記録媒体
JP5483269B2 (ja) * 2006-12-25 2014-05-07 株式会社ジャム 情報検索装置、情報検索方法
JP5158766B2 (ja) * 2007-10-23 2013-03-06 シャープ株式会社 コンテンツ選択装置、テレビジョン、コンテンツ選択プログラム及び記憶媒体
JP4512163B2 (ja) * 2008-11-27 2010-07-28 株式会社アイ・ビジネスセンター 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム

Also Published As

Publication number Publication date
JP2013003830A (ja) 2013-01-07

Similar Documents

Publication Publication Date Title
JP5540079B2 (ja) 知識ベース構築の方法および装置
US9372929B2 (en) Methods and systems for node and link identification
JP6966158B2 (ja) 検索データを処理するための方法、装置及びプログラム
CN102163228A (zh) 用于确定资源候选项的排序结果的方法、装置及设备
JP5952711B2 (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP2009193171A5 (ja)
JP4631795B2 (ja) 情報検索支援システム、情報検索支援方法および情報検索支援プログラム
US20120179709A1 (en) Apparatus, method and program product for searching document
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
KR20220101326A (ko) 오픈마켓 상품판매 증대 및 효율적인 운영을 위한 시스템
JP5346991B2 (ja) コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム
JP5802924B2 (ja) 文書検索システムおよび文書検索プログラム
US9135335B2 (en) Filmstrip-based query suggestions
US8341170B2 (en) Apparatus and method for visualizing technology change
US10474700B2 (en) Robust stream filtering based on reference document
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
KR20100113421A (ko) 키워드 추천방법 및 그 장치
JP2012104051A (ja) 文書インデックス作成装置
CN108255885B (zh) 一种歌曲的推荐方法及系统
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
CN104915408B (zh) 一种社交化搜索结果展示的方法及装置
Hoxha et al. Towards a modular recommender system for research papers written in albanian
JP2009070210A (ja) カテゴリ別ランキング作成装置
JP2012003729A (ja) 作品推薦装置及び方法及びプログラム
JP7078244B2 (ja) データ処理装置、データ処理方法、データ処理システム及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5346991

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350