JP2008198139A - 付加情報検索装置 - Google Patents

付加情報検索装置 Download PDF

Info

Publication number
JP2008198139A
JP2008198139A JP2007035528A JP2007035528A JP2008198139A JP 2008198139 A JP2008198139 A JP 2008198139A JP 2007035528 A JP2007035528 A JP 2007035528A JP 2007035528 A JP2007035528 A JP 2007035528A JP 2008198139 A JP2008198139 A JP 2008198139A
Authority
JP
Japan
Prior art keywords
information
additional information
unit
update
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007035528A
Other languages
English (en)
Inventor
Yoshitaka Hamaguchi
佳孝 濱口
Keiji Ikada
恵志 伊加田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2007035528A priority Critical patent/JP2008198139A/ja
Publication of JP2008198139A publication Critical patent/JP2008198139A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】任意の情報の内容に沿った付加情報を付加することの可能な付加情報検索装置を提供する。
【解決手段】付加情報検索装置100は、付加情報を記憶する付加情報記憶部161と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部111と、更新部分について、情報から語句を抽出する語句抽出部120と、抽出された語句を用いて、付加情報記憶部から付加情報を検索する付加情報検索部130と、抽出された語句の履歴を情報源ごとに記憶する更新情報蓄積部150とを備え、付加情報検索部130は、付加情報記憶部から付加情報が検索できなかった場合、該情報の情報源について更新情報蓄積部に蓄積された語句を用いて、付加情報記憶部の検索を再度行うことを特徴とする。過去の更新情報も用いることで、比較的最近の記事にマッチした付加情報を得ることができる。
【選択図】図1

Description

本発明は、任意の情報に対して、予め用意された複数の付加情報のうちいずれかを追加するための付加情報検索装置にかかり、特に、Webページに広告を付加する等の目的で用いられる付加情報検索装置に関する。本発明は、Webページや、RSS等のその更新情報のコンテンツを提供するシステムにおいて、コンテンツにマッチした広告などの付加情報をコンテンツに付加するときに、よりコンテンツにマッチした付加情報を選択するために用いられる。
従来、Webページに効果的に広告を出すために、ページ内のキーワードを抽出し、そのキーワードにマッチする広告を表示することが行われている(例えば、特許文献1参照。)。
特開2005−242711号公報
しかしながら、ページ内のキーワードを用いた広告表示では、以下のようないくつか問題がある。
まずWebページは、記事のほかにタイトルやメニュー、項目名、フッタなど各種のテキスト情報が含まれたレイアウトになっていることが多い。これらテキスト情報に含まれる文言は記事とは関連の無い情報、例えばページ開設者の連絡先や著作権表示等であることも多い。キーワードはこれらの部分からも得られるため、これらのキーワードを用いると、閲覧者の興味を引く広告が効率良く選ばれないという問題がある。
また、記事以外のタイトルやメニュー、項目名、フッタなどの部分は、記事と異なり変化しないため、これらから得られるキーワードは常に一定である。このため、同じ広告が継続して掲載されやすい。このため、閲覧者は繰り返し同じ広告を見ることになり、興味も薄れ易く、広告としての効果が薄くなるという問題もある。
また近年、RSS(RDF(Resource Description Framework) Site Summary)等、個々の記事部分のみを配信するサイトも増加している。この場合、1つの記事が短かったり概要のみであったりするため、そこから得られるキーワードが少なくなる。そのため、その少ないキーワードとマッチした広告が得られない場合が増加する。そのような場合、例えば無作為に選ばれた広告等が挿入されることになる。このように、Webページの内容に沿った広告を出せないことが増え、広告効果が充分には得られないという問題がある。
本発明は、従来の付加情報検索装置が有する上記問題点に鑑みてなされたものであり、本発明の目的は、任意の情報の内容に沿った付加情報を付加することができ、例えば、Webページの内容に沿った広告を出すことができ、広告効果を充分に得ることの可能な、新規かつ改良された付加情報検索装置を提供することである。
上記課題を解決するため、本発明によれば、任意の情報に予め用意された付加情報を追加するための付加情報検索装置が提供される。本発明の付加情報検索装置(100)は、付加情報を記憶する付加情報記憶部(161)と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部(111)と、前記更新部分について、前記情報から語句を抽出する語句抽出部(120)と、前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部(130)と、前記抽出された語句の履歴を情報源ごとに記憶する更新情報蓄積部(150)と、を備える。そして、前記付加情報検索部(130)は、前記付加情報記憶部から付加情報が検索できなかった場合、該情報の情報源について前記更新情報蓄積部に蓄積された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする(請求項1)。
かかる本発明では、例えば、Webページの最近更新された部分に基づく広告を付加することなどを想定している。すなわち、Webページにおいてタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、更新情報蓄積部(150)に記憶された過去の更新情報も用いることで、比較的最近の記事にマッチした付加情報を得ることができる。このようにして、適切な広告を付与することが可能である。
なお上記において、構成要素に付随して括弧書きで記した参照符号は、説明の便宜のために、後述の実施形態および図面における対応する構成要素を一例として記したに過ぎず、本発明がこれに限定されるものではない。以下も同様である。
上記付加情報検索装置において、さらに、前記更新情報蓄積部に更新情報が記憶された時間に基づき重み付けを決定する重み制御部(151)を備え、前記付加情報検索部は、前記更新情報蓄積部に蓄積された語句を用いて前記付加情報記憶部の検索を行うときに、前記重み制御部で決定された重み付けに基づき検索結果の優先度を変えるようにしてもよい(請求項2)。重み制御部により、もっとも最近の更新部分から得られた語句は高い重みを、より以前の更新部分から得られた語句は小さい重みを与えられることで、最近現われた語句による広告が検索されやすくなる。これにより広告効果の劣化を最小限に抑えることができる。
本発明の他の付加情報検索装置は、付加情報を記憶する付加情報記憶部(261)と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部(211)と、前記更新部分について、前記情報から語句を抽出する語句抽出部(220)と、前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部(230)と、前記更新部分に関する前記更新情報を記憶する更新情報蓄積部(250)と、前記語句抽出部で抽出された語句を用いて前記更新情報蓄積部に蓄積された更新情報を検索する類似更新情報検索部(270)と、を備える。そして、前記付加情報検索部(230)は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似更新情報検索部により得られた更新情報から抽出された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする(請求項3)。
かかる本発明では、例えば、Webページの最近更新された部分に基づく広告を付加することなどを想定している。すなわち、Webページにおいてタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、更新情報蓄積部に蓄積された更新情報を検索する類似更新情報検索部(270)を備え、更新情報蓄積部に記憶された他のページの更新情報で類似したものに含まれた語句を用いることで解決している。
本発明の他の付加情報検索装置は、付加情報を記憶する付加情報記憶部(261)と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部(211)と、前記更新部分について、前記情報から語句を抽出する語句抽出部(220)と、前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部(230)と、前記更新部分に関する前記更新情報を記憶する更新情報蓄積部(250)と、前記付加情報検索部により検索された付加情報を情報源ごとに記憶する付加履歴記憶部(231)と、前記語句抽出部で抽出された語句を用いて前記更新情報蓄積部に蓄積された更新情報を検索する類似更新情報検索部(270)と、を備える。そして、前記付加情報検索部(230)は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似更新情報検索部より得られた更新情報について前記付加履歴記憶部に記憶された付加情報を検索結果とすることを特徴とする(請求項4)。
かかる本発明では、例えば、Webページの最近更新された部分に基づく広告を付加することなどを想定している。すなわち、Webページにおいてタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、類似した更新情報に付加した付加情報を用いることで解決している。
本発明の他の付加情報検索装置は、付加情報を記憶する付加情報記憶部(361)と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部(311)と、前記更新部分について、前記情報から語句を抽出する語句抽出部(320)と、前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部(330)と、前記取得した情報を記憶する情報蓄積部(352)と、前記語句抽出部で抽出された語句を用いて前記情報蓄積部に蓄積された情報を検索する類似更新情報検索部(370)と、を備える。そして、前記付加情報検索部(330)は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似更新情報検索部により得られた情報から抽出された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする(請求項5)。
かかる本発明では、例えば、Webページの最近更新された部分に基づく広告を付加することなどを想定している。すなわち、Webページにおいてタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、語句抽出部で抽出された語句を用いて情報蓄積部に蓄積された情報を検索する類似更新情報検索部(370)を備え、情報蓄積部に記憶された他のページの情報で類似したものに含まれた語句を用いることで解決している。
本発明の他の付加情報検索装置は、付加情報を記憶する付加情報記憶部(361)と、任意の情報源から取得した情報から更新部分を抽出する更新情報取得部(311)と、前記更新部分について、前記情報から語句を抽出する語句抽出部(320)と、前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部(330)と、前記取得した情報を記憶する情報蓄積部(352)と、前記語句抽出部で抽出された語句を用いて前記情報蓄積部に蓄積された情報を検索する類似情報検索部(370)と、を備える。そして、前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似情報検索部により得られた情報について前記付加履歴記憶部に記憶された付加情報を検索結果とすることを特徴とする(請求項6)。
かかる本発明では、例えば、Webページの最近更新された部分に基づく広告を付加することなどを想定している。すなわち、Webページにおいてタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、情報蓄積部に記憶された他のページの情報(類似した情報)に付加した付加情報を用いることで解決している。
また、本発明の他の観点によれば、コンピュータを上記付加情報検索装置として機能させるためのプログラムと、そのプログラムを記録した、コンピュータにより読み取り可能な記録媒体が提供される。ここで、プログラムはいかなるプログラム言語により記述されていてもよい。また、記録媒体としては、例えば、CD−ROM、DVD−ROM、フレキシブルディスク、フラッシュメモリ、携帯端末装置の内蔵メモリなど、プログラムを記録可能な記録媒体として現在一般に用いられている記録媒体、あるいは将来用いられるいかなる記録媒体をも採用することができる。
以上のように、本発明によれば、任意の情報の内容に沿った付加情報を付加することができる。例えば、本発明をWebページに適用することにより、Webページの内容に沿った広告を出すことができ、広告効果を充分に得ることが可能である。その他の本発明の優れた効果については、以下の発明を実施するための最良の形態の説明においても説明する。
以下に添付図面を参照しながら、本発明にかかる付加情報検索装置の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
(第1の実施形態)
図1は、第1の実施形態にかかる付加情報検索装置の構成を示す説明図である。
本実施形態にかかる付加情報検索装置100は、図1に示したように、更新情報取得部111と、語句抽出部120と、付加情報検索部130と、情報付加部140と、更新情報蓄積部150と、重み制御部151と、付加情報入力部160と、付加情報DB161とを含んで構成される。なお、本実施形態の説明に関係のない構成については、説明および図示を省略する。以下、各構成要素について詳細に説明する。
更新情報取得部111は、Webページ等の情報源から、その新着記事等の更新部分を取得する。これは、RSS配信されているページであれば、前回取得日付以後のRSS内の記事を取得してもよい。RSS配信されているページでない場合も、前回取得時の情報を記憶し、前回取得時の情報との差分を得ることで、更新部分を取得できる。
語句抽出部120は、更新情報取得部111で得られた更新部分の文字列から、キーワードとして適当な語句を抽出する。これは形態素解析を行い、名詞等特定の品詞の語句を選ぶ等の一般的な手法で実現できる。
付加情報検索部130は、語句抽出部120で得られた語句を用い、付加情報DB161に記憶された広告等の付加情報を検索する。もし語句抽出部120で得られた語句にマッチする付加情報が得られなかった場合、更新情報蓄積部150に記憶された、過去に同じ情報源について得られた語句とその重みを用いて、再度、付加情報DB161を検索する。これにより、今回ではないが比較的最近の記事にマッチした付加情報を得ることができる。なお、語句の重みについてはさらに後述する。
また、付加情報DB161を再度検索してもなおマッチする付加情報が得られなかった場合は、更新部分ではなく情報全体とのマッチを行う等の従来の手法を用いて、付加情報を決定する。
情報付加部140は、情報の配信方法に応じて、検索された付加情報を付加する。例えばWebページであれば、Webページ内の広告領域にその広告を表示する。また、電子メールであれば、電子メールの本文に広告を挿入する。
更新情報蓄積部150は、情報源ごとに、語句抽出部120で抽出された語句を、重み制御部151により決定される重みと共に記憶する。
重み制御部151は、更新情報蓄積部150に記憶される語句の重みを、最近記憶された語句ほど重みが高くなるように制御する。例えば、更新情報を取得するごとに、それまでに更新情報蓄積部150に記憶されていた語句の重みを一定割合減らすなどで実現できる。また、重みが一定以下になるか、記憶されて一定期間がすぎた語句を削除する。これにより、比較的最近、情報源で使用された語句ほど重みが高くなり、付加情報検索部130でこれらの語句が使われる場合に、情報源で最近使われた語句にマッチした付加情報が検索されやすくなる。
付加情報入力部160は、広告等、情報に付加したい情報を付加情報DB161に加えることと、掲載期間が終わった広告等の付加情報を付加情報DB161から削除することを行う。
付加情報DB161は、付加情報入力部160により形態素解析等で自動的にキーワードが付与されるか、もしくは広告主・オペレータなどにより付加されたキーワードと共に、付加情報を検索可能な形で記憶する。
本実施形態は以上のように構成されている。次に、本実施形態の動作について、図3のフローチャートを参照しながら説明する。
(第1の実施形態の動作)
まず更新情報取得部111は、例えば図2に示したようなWebページを取得する。図2は一般的なWebページの一例を示す説明図であり、タイトル、メニュー、広告、項目名1と記事1,項目名2と記事2、フッタなどからなる。そして、前回同じページを取得したときと異なる部分を抽出する(ステップS102)。図2のような構造のページであれば、一般的にタイトルやメニュー等は変わることは少ないので、記事1、記事2の部分で新たに更新された部分が得られる。これにより、タイトルやメニューなど変化しない部分の情報は取り除かれる。本実施形態では、『防水型のデジタルカメラが発売された』という更新情報が得られたものとする。
次に語句抽出部120は、得られた更新情報からキーワードとなる語句を抽出する(ステップS104)。これは形態素解析など一般的な手法で名詞等特定の品詞を抽出すればいい。ここでは、『防水型のデジタルカメラが発売された』という更新情報から「防水型」「デジタルカメラ」「発売」が得られたものとする。この3つの語句は、更新情報蓄積部150に、このページより取得された情報として記憶される。
重み制御部151は、過去に更新情報蓄積部150に該ページから得られた語句として記憶された語句の重みを減ずるが、この段階では更新情報蓄積部150に記憶された語句はまだ無かったものとする。そして、新たに記憶された「防水型」「デジタルカメラ」「発売」の重みを1とする(ステップS106)。
次に付加情報検索部130は、語句抽出部120により得られた「防水型」「デジタルカメラ」「発売」を用いて、付加情報DB161より付加情報を検索する(ステップS108)。
あらかじめ付加情報入力部160により「デジタルカメラ」に関する広告が入力されていたとすると、その「デジタルカメラ」に関する広告が得られる(ステップS110)。
そして、付加情報DB161から「デジタルカメラ」に関する広告が得られたので、そのまま情報付加部140により、該ページに「デジタルカメラ」に関する広告が付加される(ステップS112)。
その後ある時間が経過した後に(ステップS114)、同様の動作で、同じページから更新情報取得部111により『新型のCCDが開発された』という更新情報が得られたとする(ステップS116)。
語句抽出部120により「新型」「CCD」「開発」の語句が得られ、更新情報蓄積部150に記憶される(ステップS118)。
重み制御部151は、更新情報蓄積部150にすでに記憶されていた「防水型」「デジタルカメラ」「発売」の重みを1から、例えば0.2を減ずることで、0.8とし、新たに記憶された「新型」「CCD」「開発」の重みを1とする(ステップS120)。
付加情報検索部130は語句抽出部120より得られた「新型」「CCD」「開発」により付加情報DB161を検索するが、いずれの語に対応する付加情報も無かったものとする。このとき、付加情報検索部130は、該ページに関して更新情報蓄積部150に記憶されている、重み1の「新型」「CCD」「開発」と重み0.8の「防水型」「デジタルカメラ」「発売」の語句を取得し、この語句と重みを用いて再度付加情報DB161を検索する(ステップS122)。
このようにして、例えば「デジタルカメラ」に関する広告等、今回の更新情報から得られた語句には無かった語句に関する付加情報を得ることができる(ステップS124)。
そして、付加情報DB161から「デジタルカメラ」に関する広告が得られたので、情報付加部140により、該ページに「デジタルカメラ」に関する広告が付加される(ステップS126)。
(第1の実施形態の効果)
以上のように、本実施形態では、最近更新された部分に基づく広告を付加することを特徴とする。すなわち、図2におけるタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。そのうえで、以上説明したように、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、更新情報蓄積部150に記憶された過去の更新情報も用いることで解決している。
また、本実施形態では、重み制御部151により、もっとも最近の更新部分から得られた語句には高い重みを、より以前の更新部分から得られた語句には小さい重みを与えることで、最近現われた語句による広告が検索されやすくなっている。これにより広告効果の劣化を最小限に抑えることができる。
(第2の実施形態)
図4は、第2の実施形態にかかる付加情報検索装置の構成を示す説明図である。
本実施形態にかかる付加情報検索装置200は、図4に示したように、更新情報取得部211と、語句抽出部220と、付加情報検索部230と、付加履歴記憶部231と、情報付加部240と、更新情報蓄積部250と、付加情報入力部260と、付加情報DB261と、類似更新情報検索部270と、を含んで構成される。なお、本実施形態の説明に関係のない構成については、説明および図示を省略する。
以下、各構成要素について詳細に説明する。ただし、本実施形態にかかる更新情報取得部211、語句抽出部220、情報付加部240、付加情報入力部260、付加情報DB261は、それぞれ第1の実施形態の更新情報取得部111、語句抽出部120、情報付加部140、付加情報入力部160、付加情報DB161と実質的に同様であるため、重複説明を省略する。
付加情報検索部230は、語句抽出部220で得られた語句を用い、付加情報DB261に記憶された広告等の付加情報を検索する。そして付加情報が得られた場合は、付加履歴記憶部231に、その情報に付加された付加情報として、その付加情報を記憶する。
もし語句抽出部220で得られた語句にマッチする付加情報が得られなかった場合、類似更新情報検索部270により得られる類似した他の更新情報を用いて、付加情報を決定する。これは例えば、更新情報蓄積部250に記憶された語句を用い、付加情報DB261より付加情報の検索を行うことで実現される。もしくは、類似更新情報が得られた情報に付加された付加情報が付加履歴記憶部231に記憶されている場合で且つその付加情報が付加情報DB261に記憶されている場合は、その付加情報を付加することでも実現できる。上記の両方の方法を行っても良い。
上記の方法を実行してもなおマッチする付加情報が得られなかった場合は、更新部分ではなく情報全体とのマッチを行う等の従来の手法を用いて、付加情報を決定する。
付加履歴記憶部231は、付加情報検索部230により情報に付加された付加情報を識別する識別子を、その付加情報を付加した情報と対応付けて記憶する。
更新情報蓄積部250は、情報源ごとに、最近、語句抽出部220で抽出された語句を記憶する。
類似更新情報検索部270は、語句抽出部220で得られた語句と、各更新情報に対応付けて更新情報蓄積部250に記憶されている語句とのマッチングにより、今回処理対象となっている更新情報と類似した更新情報を取得し、その更新情報から抽出された語句を更新情報蓄積部250から取得する。このとき、複数の更新情報についての語句を取得しても良く、更新情報とのマッチングの度合いに応じて語句の重みを変えるなどの、一般的な検索処理上の工夫を行うことで、全体の精度を上げることができる。
本実施形態は以上のように構成されている。次に、本実施形態の動作について、図5のフローチャートを参照しながら説明する。
(第2の実施形態の動作)
まず更新情報取得部211は、第1の実施形態の場合と同様に、図2のようなページを取得する。ここで取得されたページを「第1のページ」とする。そして、この第1のページから更新部分を取得し、例えば『新型のCCDを搭載したデジタルカメラが発売された』という更新情報が得られたものとする(ステップS202)。
次に語句抽出部220は、この更新情報からキーワードとなる語句を抽出し、「新型」「CCD」「搭載」「デジタルカメラ」「発売」が得られたものとする(ステップS204)。この5つの語句は、更新情報蓄積部250に、第1のページより取得された情報として記憶される。
次に付加情報検索部230は、語句抽出部220により得られた「新型」「CCD」「搭載」「デジタルカメラ」「発売」を用いて、付加情報DB261より付加情報を検索する(ステップS206)。
あらかじめ付加情報入力部260により「デジタルカメラ」に関する広告が入力されていたとすると、その「デジタルカメラ」に関する広告が得られる(ステップS208)。そして、第1のページについて付加した情報が「デジタルカメラ」に関する広告であることを、付加履歴記憶部231に記憶する。
付加情報DB261から「デジタルカメラ」に関する広告が得られたので、情報付加部240により、第1のページに「デジタルカメラ」に関する広告が付加される(ステップS210)。
その後ある時間が経過した後に(ステップS212)、同様の動作で、別のページを取得する。ここで取得されたページを「第2のページ」とする。そして、この第2のページから更新情報取得部211により『新型のCCDが開発された』という更新情報が得られたとする(ステップS214)。
そして語句抽出部220により「新型」「CCD」「開発」の語句が得られ(ステップS216)、第2のページに関する更新情報として更新情報蓄積部250に記憶される。
付加情報検索部230は語句抽出部220より得られた「新型」「CCD」「開発」により付加情報DB261を検索するが、いずれの語に対応する付加情報も無かったものとする(ステップS218)。
このとき、付加情報検索部230は、第2のページから得られた更新部分と類似した、他のページの更新部分を、類似更新情報検索部270より得る。
類似更新情報検索部270は付加情報検索部230からの要求により、語句抽出部220から得られた語句「新型」「CCD」「開発」を用いて、更新情報蓄積部250を検索する(ステップS220)。すでに第1のページより取得された更新情報として記憶された語句に「新型」「CCD」が含まれるため、これが検索される。この結果、第1のページの更新情報として記憶された語句「新型」「CCD」「搭載」「デジタルカメラ」「発売」が得られる(ステップS222)。
付加情報検索部230では、この得られた「新型」「CCD」「搭載」「デジタルカメラ」「発売」で再度付加情報DB261を検索することで(ステップS224)、「デジタルカメラ」に関する広告を得ることができる(ステップS226)。
あるいは、ステップS222〜S326の代わりに以下のような方法で適切な広告を得ることもできる。すなわち、類似更新情報検索部270が検索したものが第1のページの情報の更新情報であるので、付加履歴記憶部231に記憶された第1のページに付加された情報が「デジタルカメラ」に関する広告であることを検索し、「デジタルカメラ」に関する広告を得ることもできる。
そして、情報付加部240により、第2のページに「デジタルカメラ」に関する広告を付加することができる(ステップS228)。
(第2の実施形態の効果)
以上のように、本実施形態では、最近更新された部分に基づく広告を付加することを特徴とする。すなわち、図2におけるタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。
そのうえで、以上説明したように、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、更新情報蓄積部250に記憶された他のページの更新情報で類似したものに含まれた語句か、もしくは類似した更新情報に付加した付加情報を用いることで解決している。
(第3の実施形態)
図6は、第3の実施形態にかかる付加情報検索装置の構成を示す説明図である。
本実施形態にかかる付加情報検索装置300は、図6に示したように、情報取得部310と、更新情報取得部311と、語句抽出部320と、付加情報検索部330と、付加履歴記憶部331と、情報付加部340と、更新情報蓄積部352と、付加情報入力部360と、付加情報DB361と、類似情報検索部370と、を含んで構成される。なお、本実施形態の説明に関係のない構成については、説明および図示を省略する。
以下、各構成要素について詳細に説明する。ただし、本実施形態にかかる更新情報取得部311、語句抽出部320、情報付加部340、付加情報入力部360、付加情報DB361は、それぞれ第1の実施形態の更新情報取得部111、語句抽出部120、情報付加部140、付加情報入力部160、付加情報DB161と実質的に同様であり、また、付加履歴記憶部331は、第2の実施形態の付加履歴記憶部231と同様であるため、重複説明を省略する。
情報取得部310は、付加情報を付加する対象である情報を取得する。そして、取得した情報を情報蓄積部352に記憶する。情報そのものではなく、語句抽出部320同等の処理を施して得られた語句を記憶してもよい。更新情報取得部311が情報の差分により更新情報を得るような場合は、更新情報取得部311は独自に情報を取得するのではなく、情報取得部310が取得した情報を利用してもよい。
付加情報検索部330は、語句抽出部320で得られた語句を用い、付加情報DB361に記憶された広告等の付加情報を検索する。そして付加情報が得られた場合は、付加履歴記憶部331に、その情報に付加された付加情報として、その付加情報を記憶する。
もしここで適した付加情報が得られなかった場合、類似情報検索部370により得られる類似した他の情報を用いて、付加情報を決定する。これは例えば、類似情報検索部370により検索された情報に対応して更新情報蓄積部350に記憶された語句を用い、付加情報DB361より付加情報の検索を行うことで実現される。もしくは、類似情報に付加された付加情報が付加履歴記憶部331に記憶されている場合で且つその付加情報が付加情報DB361に記憶されている場合は、該付加情報を付加することでも実現できる。上記の両方の方法を行っても良い。
上記の方法を実行してもなおマッチする付加情報が得られなかった場合は、更新部分ではなく情報全体とのマッチを行う等の従来の手法を用いて、付加情報を決定する。
情報蓄積部352は、情報源ごとに、情報取得部310が最近取得した情報を記憶する。原文のままでなくてもよく、類似情報検索部370により検索可能な形であれば、抽出された語句の情報などでもよい。
類似情報検索部370は、情報取得部310により取得されて今処理をしている情報について、類似した情報を情報蓄積部352から検索する。この検索処理は、一般的な全文検索や類似文検索の手法を用いることができる。
本実施形態は以上のように構成されている。次に、本実施形態の動作について、図7のフローチャートを参照しながら説明する。
(第3の実施形態の動作)
まず情報取得部310は、第1の実施形態の場合と同様に、図2のようなページを取得する(ステップS302)。ここで取得されたページを「第1のページ」とする。そして、例えば図2のタイトルに『デジカメ情報』と書かれていて、記事1に『○○社からデジタルカメラが発売された』と書かれていた場合は、これらから形態素解析などで得られる語句「デジカメ」「情報」「○○社」「デジタルカメラ」「発売」を情報蓄積部352に記憶する(ステップS304)。
更新情報取得部311は、情報取得部310により得られた第1のページについて、第1の実施形態と同様に更新部分を取得し、例えば『○○社からデジタルカメラが発売された』という更新情報が得られたものとする。語句抽出部320は、この更新情報からキーワードとなる語句を抽出し、「○○社」「デジタルカメラ」「発売」が得られたものとする(ステップS306)。
次に付加情報検索部330は、語句抽出部320により得られた「○○社」「デジタルカメラ」「発売」を用いて、付加情報DB361より付加情報を検索する(ステップS308)。
あらかじめ付加情報入力部360により「デジタルカメラ」に関する広告が入力されていたとすると、その「デジタルカメラ」に関する広告が得られる(ステップS310)。そして、第1のページについて付加した情報が「デジタルカメラ」に関する広告であることを、付加履歴記憶部331に記憶する。
付加情報DB361から「デジタルカメラ」に関する広告が得られたので、情報付加部340により、第1のページに「デジタルカメラ」に関する広告が付加される(ステップS312)。
さらに情報取得部310は、上記と同様に図2のような構造の別のページを取得する(ステップS314)。ここで取得されたページを「第2のページ」とする。そして、例えば図2のタイトルに『デジカメ・ニュース』と書かれていて、記事1に『新型のCCDが開発された』と書かれていた場合は、これらから形態素解析などで得られる語句「デジカメ」「ニュース」「新型」「CCD」「開発」を第2のページについての情報として情報蓄積部352に記憶する(ステップS316)。
更新情報取得部311でも上記と同様の動作で『新型のCCDが開発された』という更新情報が得られたとする。
付加情報検索部330は語句抽出部320より得られた「新型」「CCD」「開発」により付加情報DB361を検索するが、いずれの語に対応する付加情報も無かったものとする(ステップS318)。
このとき、付加情報検索部330は、第2のページと類似した他のページを、類似情報検索部370より得る(ステップS320)。具体的には、類似情報検索部370は、付加情報検索部330からの要求により、情報取得部310で得られた第2のページの情報の語句「デジカメ」「ニュース」「新型」「CCD」「開発」を用いて、情報蓄積部352を検索する。すでに第1のページより取得された更新情報として記憶された語句に「デジカメ」が含まれるため、これが検索される。
この結果、第1のページの情報として記憶された語句「デジカメ」「情報」「○○社」「デジタルカメラ」「発売」が得られる(ステップS322)。
付加情報検索部330では、この得られた「デジカメ」「情報」「○○社」「デジタルカメラ」「発売」で再度付加情報DB361を検索することで(ステップS324)、「デジタルカメラ」で検索できる広告を得ることができる(ステップS326)。
あるいは、ステップS322〜S326の代わりに以下のような方法で適切な広告を得ることもできる。すなわち、類似更新情報検索部370が検索したものが第1のページに関する情報であるので、付加履歴記憶部331に記憶された第1のページに付加された情報が「デジタルカメラ」に関する広告であることを検索し、「デジタルカメラ」に関する広告を得ることもできる。
そして、情報付加部340により、第2のページに「デジタルカメラ」に関する広告を付加することができる(ステップS328)。
(第3の実施形態の効果)
本実施形態では、最近更新された部分に基づく広告を付加しようとしている。すなわち、図2におけるタイトルやメニュー等変化しない部分にマッチする広告が継続的に表示されることにより、同一の広告が閲覧者に長期間にわたり提示されることを回避している。
そのうえで、以上説明したように、更新部分が短いことによりマッチする広告が得られない可能性が高くなるという問題に対して、情報蓄積部352に記憶された他のページの情報で類似したものに含まれた語句か、もしくは類似した情報に付加した付加情報を用いることで解決している。
以上、添付図面を参照しながら本発明にかかる付加情報検索装置の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された技術的思想の範疇内において各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、Webページに対して広告を付加する場合を例に挙げて説明したが、本発明はこれに限定されない。本発明は任意の情報に対して付加情報を付加することができ、付加情報の内容も任意の情報とすることができる。
また、上記実施形態で説明した付加情報検索装置は、コンピュータに上記機能を実現するためのコンピュータプログラムを組み込むことで、コンピュータを付加情報検索装置として機能させることが可能である。かかるコンピュータプログラムは、所定の記録媒体(例えば、CD−ROM)に記録された形で、あるいは、電子ネットワークを介したダウンロードの形で市場を流通させることが可能である。
本発明は、任意の情報に対して、予め用意された複数の付加情報のうちいずれかを追加するための付加情報検索装置に利用可能であり、特に、Webページに広告を付加する等の目的で用いられる付加情報検索装置に利用可能である。本発明は、Webページや、RSS等のその更新情報のコンテンツを提供するシステムにおいて、コンテンツにマッチした広告などの付加情報をコンテンツに付加するときに、よりコンテンツにマッチした付加情報を選択するために用いられる。
第1の実施形態の構成を示す説明図である。 処理対象のWebページの一例を示す説明図である。 第1の実施形態の動作を示す説明図である。 第2の実施形態の構成を示す説明図である。 第2の実施形態の動作を示す説明図である。 第3の実施形態の構成を示す説明図である。 第3の実施形態の動作を示す説明図である。
符号の説明
100 付加情報検索装置(第1の実施形態)
111 更新情報取得部
120 語句抽出部
130 付加情報検索部
140 情報付加部
150 更新情報蓄積部
151 重み制御部
160 付加情報入力部
161 付加情報DB
200 付加情報検索装置(第2の実施形態)
211 更新情報取得部
220 語句抽出部
230 付加情報検索部
231 付加履歴記憶部
240 情報付加部
250 更新情報蓄積部
260 付加情報入力部
261 付加情報DB
270 類似更新情報検索部
300 付加情報検索装置(第3の実施形態)
310 情報取得部
311 更新情報取得部
320 語句抽出部
330 付加情報検索部
331 付加履歴記憶部
340 情報付加部
352 情報蓄積部
360 付加情報入力部
361 付加情報DB
370 類似情報検索部

Claims (6)

  1. 任意の情報に予め用意された付加情報を追加するための付加情報検索装置において、
    付加情報を記憶する付加情報記憶部と、
    任意の情報源から取得した情報から更新部分を抽出する更新情報取得部と、
    前記更新部分について、前記情報から語句を抽出する語句抽出部と、
    前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部と、
    前記抽出された語句の履歴を情報源ごとに記憶する更新情報蓄積部と、
    を備え、
    前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、該情報の情報源について前記更新情報蓄積部に蓄積された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする、付加情報検索装置。
  2. さらに、前記更新情報蓄積部に更新情報が記憶された時間に基づき重み付けを決定する重み制御部を備え、
    前記付加情報検索部は、前記更新情報蓄積部に蓄積された語句を用いて前記付加情報記憶部の検索を行うときに、前記重み制御部で決定された重み付けに基づき検索結果の優先度を変えることを特徴とする、請求項1に記載の付加情報検索装置。
  3. 任意の情報に予め用意された付加情報を追加するための付加情報検索装置において、
    付加情報を記憶する付加情報記憶部と、
    任意の情報源から取得した情報から更新部分を抽出する更新情報取得部と、
    前記更新部分について、前記情報から語句を抽出する語句抽出部と、
    前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部と、
    前記更新部分に関する前記更新情報を記憶する更新情報蓄積部と、
    前記語句抽出部で抽出された語句を用いて前記更新情報蓄積部に蓄積された更新情報を検索する類似更新情報検索部と、
    を備え、
    前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似更新情報検索部により得られた更新情報から抽出された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする、付加情報検索装置。
  4. 任意の情報に予め用意された付加情報を追加するための付加情報検索装置において、
    付加情報を記憶する付加情報記憶部と、
    任意の情報源から取得した情報から更新部分を抽出する更新情報取得部と、
    前記更新部分について、前記情報から語句を抽出する語句抽出部と、
    前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部と、
    前記更新部分に関する前記更新情報を記憶する更新情報蓄積部と、
    前記付加情報検索部により検索された付加情報を情報源ごとに記憶する付加履歴記憶部と、
    前記語句抽出部で抽出された語句を用いて前記更新情報蓄積部に蓄積された更新情報を検索する類似更新情報検索部と、
    を備え、
    前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似更新情報検索部より得られた更新情報について前記付加履歴記憶部に記憶された付加情報を検索結果とすることを特徴とする、付加情報検索装置。
  5. 任意の情報に予め用意された付加情報を追加するための付加情報検索装置において、
    付加情報を記憶する付加情報記憶部と、
    任意の情報源から取得した情報から更新部分を抽出する更新情報取得部と、
    前記更新部分について、前記情報から語句を抽出する語句抽出部と、
    前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部と、
    前記取得した情報を記憶する情報蓄積部と、
    前記語句抽出部で抽出された語句を用いて前記情報蓄積部に蓄積された情報を検索する類似情報検索部と、
    を備え、
    前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似情報検索部により得られた情報から抽出された語句を用いて、前記付加情報記憶部の検索を再度行うことを特徴とする、付加情報検索装置。
  6. 任意の情報に予め用意された付加情報を追加するための付加情報検索装置において、
    付加情報を記憶する付加情報記憶部と、
    任意の情報源から取得した情報から更新部分を抽出する更新情報取得部と、
    前記更新部分について、前記情報から語句を抽出する語句抽出部と、
    前記抽出された語句を用いて、前記付加情報記憶部から付加情報を検索する付加情報検索部と、
    前記取得した情報を記憶する情報蓄積部と、
    前記語句抽出部で抽出された語句を用いて前記情報蓄積部に蓄積された情報を検索する類似情報検索部と、
    を備え、
    前記付加情報検索部は、前記付加情報記憶部から付加情報が検索できなかった場合、前記類似情報検索部により得られた情報について前記付加履歴記憶部に記憶された付加情報を検索結果とすることを特徴とする、付加情報検索装置。
JP2007035528A 2007-02-15 2007-02-15 付加情報検索装置 Pending JP2008198139A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007035528A JP2008198139A (ja) 2007-02-15 2007-02-15 付加情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007035528A JP2008198139A (ja) 2007-02-15 2007-02-15 付加情報検索装置

Publications (1)

Publication Number Publication Date
JP2008198139A true JP2008198139A (ja) 2008-08-28

Family

ID=39756987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007035528A Pending JP2008198139A (ja) 2007-02-15 2007-02-15 付加情報検索装置

Country Status (1)

Country Link
JP (1) JP2008198139A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018160126A (ja) * 2017-03-23 2018-10-11 Necパーソナルコンピュータ株式会社 広告付与装置、広告付与方法、及び広告付与プログラム

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272809A (ja) * 1995-03-29 1996-10-18 Hitachi Ltd 検索最適化方法
JPH1074207A (ja) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk 情報検索装置及び情報検索方法
JPH1153392A (ja) * 1997-08-08 1999-02-26 Toshiba Corp 情報フィルタリング装置および同装置に適用される関連情報提供方法
JP2000194728A (ja) * 1998-10-19 2000-07-14 Sony Corp 情報提供装置および方法、並びにプログラム格納媒体
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2005182298A (ja) * 2003-12-17 2005-07-07 Oki Electric Ind Co Ltd フィルタリングシステム
US20050165615A1 (en) * 2003-12-31 2005-07-28 Nelson Minar Embedding advertisements in syndicated content
JP2005216289A (ja) * 2003-12-30 2005-08-11 Microsoft Corp 記事の履歴に基づくテキスト広告の割り当て
JP2005242711A (ja) * 2004-02-26 2005-09-08 Value Commerce Co Ltd 広告配信管理ネットワークシステム
JP2006185006A (ja) * 2004-12-27 2006-07-13 Quin Land Co Ltd 情報表示管理システム
JP2006277318A (ja) * 2005-03-29 2006-10-12 Nifty Corp 自動広告装置及び自動広告プログラム
JP2006285656A (ja) * 2005-03-31 2006-10-19 Seiko Epson Corp 文書検索システム、記録媒体、プログラム、および文書検索方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272809A (ja) * 1995-03-29 1996-10-18 Hitachi Ltd 検索最適化方法
JPH1074207A (ja) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk 情報検索装置及び情報検索方法
JPH1153392A (ja) * 1997-08-08 1999-02-26 Toshiba Corp 情報フィルタリング装置および同装置に適用される関連情報提供方法
JP2000194728A (ja) * 1998-10-19 2000-07-14 Sony Corp 情報提供装置および方法、並びにプログラム格納媒体
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2005182298A (ja) * 2003-12-17 2005-07-07 Oki Electric Ind Co Ltd フィルタリングシステム
JP2005216289A (ja) * 2003-12-30 2005-08-11 Microsoft Corp 記事の履歴に基づくテキスト広告の割り当て
US20050165615A1 (en) * 2003-12-31 2005-07-28 Nelson Minar Embedding advertisements in syndicated content
JP2007526554A (ja) * 2003-12-31 2007-09-13 グーグル、インコーポレイテッド シンジケート化されたコンテンツの中に広告を埋め込むこと
JP2005242711A (ja) * 2004-02-26 2005-09-08 Value Commerce Co Ltd 広告配信管理ネットワークシステム
JP2006185006A (ja) * 2004-12-27 2006-07-13 Quin Land Co Ltd 情報表示管理システム
JP2006277318A (ja) * 2005-03-29 2006-10-12 Nifty Corp 自動広告装置及び自動広告プログラム
JP2006285656A (ja) * 2005-03-31 2006-10-19 Seiko Epson Corp 文書検索システム、記録媒体、プログラム、および文書検索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018160126A (ja) * 2017-03-23 2018-10-11 Necパーソナルコンピュータ株式会社 広告付与装置、広告付与方法、及び広告付与プログラム

Similar Documents

Publication Publication Date Title
JP5256293B2 (ja) 検索結果ページ上に対話要素を含めるためのシステム及び方法
US8832058B1 (en) Systems and methods for syndicating and hosting customized news content
US10565255B2 (en) Method and system for selecting images based on user contextual information in response to search queries
US10503803B2 (en) Animated snippets for search results
TW201224976A (en) Display of search ads in local language
JP2012141682A (ja) 広告情報提供装置
CN102789453A (zh) 广告信息投放方法及装置
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN101477557A (zh) 一种理解用户互联网浏览行为的媒体展现平台
CN107766398B (zh) 用于使图像与内容项目匹配的方法、装置和数据处理系统
JP2007114942A (ja) メタデータ生成装置およびメタデータ生成方法
JP2001076001A (ja) イベント情報提供方法
JP2010044585A (ja) 広告配信装置、広告配信方法、及び広告配信制御プログラム
JP2006277318A (ja) 自動広告装置及び自動広告プログラム
JP2009015495A (ja) キーワード分類装置
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
JP2009075757A (ja) 情報処理装置、およびプログラム
JP2009037604A (ja) 情報処理装置、情報処理方法およびプログラム
JP2010026996A (ja) タグ付け支援方法とその装置、プログラム及び記録媒体
JP2008198139A (ja) 付加情報検索装置
JP2011217106A (ja) 関連情報提供サーバ、関連情報提供システム及び関連情報提供方法
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007257625A (ja) 配信システム、配信方法、及びプログラム
JP2009205253A (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2009193202A (ja) 情報検索方法、検索装置及び検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111122