JP4023273B2 - Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium - Google Patents
Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium Download PDFInfo
- Publication number
- JP4023273B2 JP4023273B2 JP2002283870A JP2002283870A JP4023273B2 JP 4023273 B2 JP4023273 B2 JP 4023273B2 JP 2002283870 A JP2002283870 A JP 2002283870A JP 2002283870 A JP2002283870 A JP 2002283870A JP 4023273 B2 JP4023273 B2 JP 4023273B2
- Authority
- JP
- Japan
- Prior art keywords
- advertisement
- document
- vector
- user
- preference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 claims description 195
- 238000000034 method Methods 0.000 claims description 61
- 238000011156 evaluation Methods 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 17
- 238000013500 data storage Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体に係り、特に、HTML等の構造化文書のページの一部をスクラップしたり、ページ全体をブックマークすることで、ユーザから指定された文書を登録するシステムにおいて、個人化した広告を提示するための個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体に関する。
【0002】
【従来の技術】
従来のインタンーネット上で普及しているバナー広告は、任意のトピックスに関するページに広告枠を設け、広告主を募集することで、広告を提示している。広告主は、ページのトピックスから想定されるユーザ層を連想し、自分の商品をターゲットユーザと合致している場合に、広告枠に投資するというのが一般的である(例えば、非特許文献1参照)。
【0003】
しかし、昨今のインターネットの広告市場は低迷を続け、広告は出したが、誰も見ないといった問題があちこちで生じている。これには、ユーザの嗜好と合致していない広告が出されていたり、嗜好が合致していても、その合致の度合が低いことが考えられる。
【0004】
また、検索エンジンにおけるバナー広告の中には、検索キーワードに関連した広告を提示する方法が存在する。例えば、「NTT」というキーワードで検索すると、検索結果のページに「“NTT”に関する本を、このサイトで検索」といったような広告が提示される。この手法は、ユーザの嗜好と、広告の内容の合致度合を向上させる試みである(例えば、非特許文献2参照)。
【0005】
【非特許文献1】
岸晃司、坂本啓、坂本泰久、(1998)、“インターネット広告効果にユーザ行動が与える影響に関する研究”、情報処理学会研究報告、HI-77-1,pp1-6.
【非特許文献2】
http://www.goo.ne.jp/help/info/ad/result.html。
【0006】
【発明が解決しようとする課題】
しかしながら、上記のように、一般的なインターネット上のバナー広告は、ページのトピックスからユーザ層を連想するしかなく、ユーザの嗜好を間接的にしか取得できない。
【0007】
また、検索エンジンにおける投入キーワードに関連した広告は、ユーザの要求が、明示的にキーワードで表現できる場合に適している。しかし、ユーザの要求には、自分の欲しい情報を明示的に表現できないような曖昧な場合が存在し、そのような暗黙的な要求を考慮した広告の提示方法が要求されている。
【0008】
本発明は、上記の点に鑑みなされたもので、Webページ等のページの一部をスクラップしたり、ページ全体をブックマークすることで、ユーザから指定された文書を、個人の嗜好情報を抽出するための情報源とすることに着眼した。Web上では情報は大量にあり、その中で興味のあるものをスクラップしたり、ブックマークするため、非常に細かい単位の嗜好情報が取得可能である。また、スクラップやブックマークするときの、ユーザの要求を明示的に言葉で表現するのは難しく、スクラップやブックマークした文書の情報を利用することで、暗黙的なユーザの興味を反映することが可能になることを利用し、当該ユーザが指定した情報をもとに、よりきめの細かく、暗黙的な要求を反映した個人のプロファイルを導出し、このプロファイルに合致した広告を優先的に提示することが可能な個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0010】
本発明(請求項1)は、コンピュータを、指定文書収集手段、テキストベクトル化手段、嗜好ベクトル生成手段、上昇度計算手段、広告評価手段、広告表示手段を有する装置として機能させる個人化広告の提供方法であって、
指定文書収集手段が、ユーザから指定された文書を定期的に収集する過程(ステップ1)と、
テキストベクトル化手段が、文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に文書のベクトルを文書ベクトルとして蓄積する過程(ステップ2)と、
嗜好ベクトル生成手段が、ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する過程(ステップ3)と、
上昇度計算手段が、ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する過程(ステップ4)と、
広告評価手段が、嗜好ベクトル蓄積手段に記録された各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する過程(ステップ5)と、
広告表示手段において、広告蓄積手段に記述された、類似度が高い広告を優先的にて表示する過程(ステップ6)と、を行う。
【0011】
また、本発明(請求項2)は、ユーザから指定された文書にテキストが存在する場合や、広告の特徴を表現したテキストが存在する場合に、
指定された文書内のテキスト、あるいは、広告の特徴を表現したテキスト中の重要な単語を抽出する過程と、
抽出された単語を、指定された文書あるいは、広告の特徴を示すベクトルの属性とする過程と、
抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、指定された文書あるいは、広告の特徴ベクトルとする過程と、を行う。
【0012】
本発明(請求項3)は、ユーザから指定された文書を提供する個人化広告提供装置であって、
ユーザから指定された文書を定期的に収集する指定文書収集手段と、
指定文書収集手段で収集された文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に文書のベクトルを文書ベクトルとして蓄積するテキストベクトル化手段と、
ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する嗜好ベクトル生成手段と、
ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する上昇度計算手段と、
嗜好ベクトル蓄積手段に記録された各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する広告評価手段と、
広告蓄積手段に記述された、類似度が高い広告を優先的に表示する広告表示手段と、
を有する。
【0013】
本発明(請求項4)は、ユーザから指定された文書にテキストが存在する場合や、広告の特徴を表現したテキストが存在する場合に、
指定された文書内のテキスト、あるいは、広告の特徴を表現したテキスト中の重要な単語を抽出する手段と、
抽出された単語を、指定された文書あるいは、広告の特徴を示すベクトルの属性とする手段と、
抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、指定された文書あるいは、広告の特徴ベクトルとする手段と、
を有する。
【0014】
本発明(請求項5)は、コンピュータを、請求項3または4の個人化広告提供装置の各手段として機能させるプログラムである。
【0015】
本発明(請求項6)は、請求項5記載のプログラムを格納したコンピュータ読み取り可能な記録媒体である。
【0017】
上記のように、本発明では、ユーザから指定された文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報の関連度が高い広告を、優先的に提示することが可能になる。
【0018】
また、本発明では、ユーザから指定された文書、及び広告の特徴を示すベクトルを自動的に生成可能となる。
【0019】
さらに、本発明では、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示可能となる。
【発明の実施の形態】
以下、図面と共に本発明の実施の形態について説明する。
【0020】
[第1の実施の形態]
図2は、本発明の第1の実施の形態における個人化広告の提示方法に対応するシステム構成を示す。
【0021】
同図に示すシステムは、ユーザから指定された文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報に関連度が高い広告を、優先的に指示することが可能な構成を示す。
【0022】
同図に示すシステムは、表示部10、広告表示制御部20、広告管理部30、文書管理部40、嗜好管理部50から構成される。
【0023】
表示部10は、広告表示部11及び指定文書表示部12から構成される。
【0024】
広告表示制御部20は、広告評価部21、及び広告評価データ蓄積部22から構成される。
【0025】
広告管理部30は、広告蓄積部31を有する。
【0026】
文書管理部40は、文書定部41、及び指定文書蓄積部42から構成される。
嗜好管理部50は、嗜好ベクトル生成部51、及び嗜好ベクトル蓄積部52から構成される。
【0027】
表示部10の広告表示部11は、認証されたユーザのユーザIDを、広告評価データ蓄積部22に渡し、ユーザの嗜好と広告の類似度を問い合わせ、類似度が高い広告を広告蓄積部31に問い合わせ、優先的に提示する。提示の方法は、類似度が高い順番に適当な時間間隔で広告を提示する場合や、広告提示エリアを分割し、類似度が高い広告ほど面積を大きくしたり、目立つ位置に配置することで、優先的に提示する場合もある。広告は、例えば、図3のように認証されたユーザの自分専用のページにおける広告表示エリアに表示される。
【0028】
表示部10の指定文書表示部12は、指定文書蓄積部42を参照し、認証されたユーザが事前に指定した文書を図3のように表示する。
【0029】
広告表示制御部20の広告評価部21は、認証されたユーザの嗜好ベクトルを生成するように、嗜好ベクトル生成部51に要求する。生成された嗜好ベクトルを、嗜好ベクトル蓄積部52から取得し、広告蓄積部31に蓄積されている各広告ベクトルとの類似度を計算し、図4のように少なくとも認証されたユーザのユーザID、広告IDと広告の嗜好の類似度を広告評価データ蓄積部22に記録する。
【0030】
広告表示制御部20の広告評価データ蓄積部22は、広告評価部21で計算された各広告ベクトルの類似度を、図4のように、少なくとも認証されたユーザのユーザID、広告IDと広告と嗜好の類似度を記録する。また、広告表示部11より、ユーザIDを渡されると、ユーザIDに対応する広告IDと類似度を返す。
【0031】
広告管理部30の広告蓄積部31は、図5に示すように少なくとも広告ID、広告の内容、広告ベクトルを記録する。広告の内容は、一般的なWebページのバナー広告のように、HTMLのような記述言語で記述されている。また、広告ベクトルは、広告の特徴を示す複数の属性に対応する特徴量により構成されており、これらは手動で入力されたり、あるいは自動で生成される場合がある。
【0032】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図5のように広告ベクトルを構成する属性は、「スポーツ」「映画」といった対象の分野を表現した属性をとる場合が考えられる。各広告が属性を示す分野に関連する度合を連続値で表現し、属性値とする場合もある。また、各広告が、属性と対応する分野に関連するか否かの2値情報を属性値とする場合もある。
【0033】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図6のように、広告ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。この場合、行列の行と列が両方とも広告となり、その対応関係を示した行列となるため、行列の対角成分が全て「1」で、その他の成分が全て「0」の単位行列となる。
【0034】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図7のように、広告ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。この場合、各広告が、属性である文書を指定した場合に出現するか否かの2値情報を属性値とする場合がある。また、2値情報ではなく、属性である文書を指定した場合に出現する可能性を連続値で表現する場合もある。
【0035】
そして、広告蓄積部31は、広告表示部11より広告IDと共に内容参照要求が渡されると、広告IDに対応する広告の内容を返す。また、広告評価部21より広告IDと共に広告ベクトル参照要求が渡されると、広告IDに対応する広告ベクトルを返す。
【0036】
文書管理部40の文書指定部41は、図3の下部に示すように、Webページの一部分を指定する方法や、一般的なブックマークのように、WebページのURLをユーザに提供する。ここで、ユーザが指定するページの一部や、ページ全体には、テキスト、画像、動画などの情報が組み合わされて表現されている。ユーザが指定した文書は、指定文書蓄積部42に蓄積される。
【0037】
文書管理部40の指定文書蓄積部42は、文書指定部41で指定された文書に対して、少なくともユーザID、文書ID、文書の内容、文書ベクトルを図8に示すように記憶する。文書の内容は、文書指定部41で指定したWebページの一部あるいは全体をHTMLのような記述形式で記録する。また、文書ベクトルは、文書の特徴を示す複数の属性に対応する特徴量により構成されており、これらは手動で入力されたり、あるいは自動で生成される場合もある。
【0038】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図8に示すように、文書ベクトルを構成する属性は、「スポーツ」、「映画」といった対象の分野を表現した属性をとる場合が考えられる。各文書が属性が示す分野に関連する度合を、連続値で表現し、属性値とする場合もある。また、各文書が、属性と対応する分野に関連するか否かを、2値の属性値とする場合もある。
【0039】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図9のように、文書ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。この場合、各文書を指定した場合に、属性である広告が出現するか否かの2値情報を属性値とする場合がある。また、各文書を指定した場合に属性である広告が出現する可能性を連続値で表現する場合もある。
【0040】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図10のように、文書ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。この場合、行列の行と列が両方とも文書となり、その対応関係を示した行列になるため、行列の対角成分が全て「1」で、その他の成分が全て「0」の単位行列となる。
【0041】
また、指定文書蓄積部42は、嗜好ベクトル生成部51よりユーザIDと共に広告ベクトル参照要求が渡されると、ユーザIDに対応する複数の文書ベクトルを返す。
【0042】
嗜好管理部50の嗜好ベクトル生成部51は、認証されたユーザに対応するユーザIDを、指定文書蓄積部42に渡し、当該ユーザIDに対応する複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとし、嗜好ベクトル蓄積部52に記憶する。
【0043】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図11のように、嗜好ベクトルを構成する属性は、「スポーツ」、「映画」といった対象の分野を表現した属性をとる場合が考えられる。図8に示す各ユーザが指定している文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、選択した文書群の各分野への関連度を統合的に網羅したような嗜好ベクトルが合成される。
【0044】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図12に示すように、嗜好ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。図9に示す各ユーザが指定している文書の文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、選択した文書群が対応する広告を網羅した嗜好ベクトルが合成される。
【0045】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図13のように、嗜好ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。図10に示すユーザが指定している文書の文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、どの文書を選択したのかを示す嗜好ベクトルが合成される。
【0046】
また、合成の仕方は、文書ベクトルの各属性の総和だけでなく、平均値をとる場合や、その他の総計量を利用する場合もある。
【0047】
嗜好管理部50の嗜好ベクトル蓄積部52は、嗜好ベクトル生成部51で生成された嗜好ベクトルを、図11のように少なくともユーザID、嗜好ベクトルで構成されるデータとして記録する。また、広告評価部21よりユーザIDが渡されると、ユーザIDに対応する嗜好ベクトルを返す。
【0048】
以下に、上記の構成における動作を説明する。
【0049】
図14は、本発明の第1の実施の形態における個人化広告の提示方法を示すフローチャートである。
【0050】
ステップ101) ユーザIDとパスワードによって管理されるようなユーザ認証システムを用いて、ユーザを認証し、ステップ102に移行する。
【0051】
ステップ102) 広告評価部21が、嗜好ベクトル生成部51で認証されたユーザに対する嗜好ベクトルを生成するように要求する。嗜好ベクトル生成部51は、認証されたユーザのユーザIDを、指定文書蓄積部42に渡し、当該ユーザが指定した文書の文書ID群を取得する。図6の例では、ユーザIDが“1000”のユーザが指定している文書の文書ID“100”、“101”、“102”等を取得し、ステップ103に移行する。
【0052】
ステップ103) 嗜好ベクトル生成部51が、ステップ102にて取得した文書ID群に対応する文書ベクトルを、指定文書蓄積部42から逐次取得する。図8の例では、文書IDが、“100”の場合、この文書に対応する文書ベクトル(0.80,0.50,…)を取得し、ステップ104に移行する。
【0053】
ステップ104) ステップ103の処理を、ステップ102で取得した文書ID群全てに対して取得したら、ステップ105に移行し、そうでない場合には、ステップ103に戻る。
【0054】
ステップ105) 嗜好ベクトル生成部51が取得した、認証されたユーザが指定した文書の文書ベクトル群を合成し、当該ユーザの嗜好ベクトルとし、図11に示すように、嗜好ベクトル蓄積部52に蓄積する。合成の仕方は、文書ベクトルの各属性値の総和を、嗜好ベクトルの各属性値にする場合や、総和以外にも、平均値などの他の統計量を利用する場合もある。その後、ステップ106に移行する。
【0055】
ステップ106) 広告評価部21が広告蓄積部31から蓄積されている広告の広告ID群を取得し、ステップ107に移行する。
【0056】
ステップ107) 広告評価部21が、ステップ106で取得した広告ID群に対応する広告ベクトルを、広告蓄積部31から逐次取得する。図5の例では、広告IDが、“10”の場合、この広告に対応する広告ベクトル(0.40,0.60,…)を取得する。次に、ステップ101で認証されたユーザの嗜好ベクトルを嗜好ベクトル蓄積部52から取得する。図11の例では、ユーザIDが、“1000”の場合、このユーザIDに対応する嗜好ベクトル(1.66,1.59,…)を取得する。この嗜好ベクトルは、ステップ105で生成された値に相当する。さらに現在取得している広告ベクトルと嗜好ベクトルの類似度を求める。類似度の求め方の例としては、広告ベクトルと嗜好ベクトルの、各属性の対応がとれる場合、即ち、両ベクトルの属性1、属性2がそれぞれ同じ特徴、例えば、「分野」、「広告」、「文書」などを表現している場合、両ベクトルの内積を類似度とするような方法が想定される。算出された類似度は、図4のように、認証されたユーザID、評価対象である広告の広告ID、類似度の対を一つのレコードとして、広告評価蓄積部22に記録される。その後、ステップ108に移行する。
【0057】
ステップ108) ステップ107の処理を、ステップ106で取得した広告ID群全てに対して取得したら、ステップ109に移行し、そうでない場合、ステップ107に戻る。
【0058】
ステップ109) 広告表示部11が、認証されたユーザのユーザIDを、広告評価データ蓄積部22に渡し、ユーザの嗜好と広告の類似度を問い合わせ、類似度が高い広告を優先的に提示する。提示の方法は、類似度が高い順番に適当な時間間隔で広告を提示する場合や、広告提示エリアを分割し、類似度が高い広告ほど面積を大きくしたり、目立つ位置に配置することで、優先的に提示する場合もある。広告は、例えば、図3のように認証されたユーザの自分専用のページにおける広告表示エリアに表示される。
【0059】
[第2の実施の形態]
図15は、本発明の第2の実施の形態における個人広告の提示方法に対応するシステム構成を示す。
【0060】
同図に示すシステムは、指定した文書及び広告の特徴を示すベクトルを、自動的に生成可能な構成を示す。
【0061】
同図における特徴テキスト蓄積部32、ベクトル管理部60以外は、前述の図2と同様の構成であるので、同一符号を付し、その説明を省略する。
【0062】
特徴テキスト蓄積部32は、各広告の特徴を示すテキストデータを、少なくとも広告IDと対にして記憶しておく。図16の広告IDが“10”の広告の例では、「NTT、新商品、インターネット、光ファイバ」など、広告の特徴を表現したテキストデータを蓄積しておく。
【0063】
ベクトル管理部60は、テキストベクトル化部61、重要単語抽出部62、属性データ蓄積部63から構成される。
【0064】
テキストベクトル化部61は、特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)、あるいは、指定文書蓄積部42に蓄積されている指定文書の内容(図8)を入力として、これらのテキストをベクトル化し、広告の場合は、広告蓄積部31の広告ベクトル、指定文書の場合は、指定文書蓄積部42の文書ベクトルに記録する。入力として受け取ったテキストを、重要単語抽出部62に渡し、重要単語を受け取る。受け取った重要単語に対応する属性IDを属性データ蓄積部63から取得する。広告の場合は、広告蓄積部31の広告ベクトルの取得した属性IDに対応する値、また、指定文書の場合は、指定文書蓄積部42の文書ベクトルの取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図17、図18)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。これにより、当該重要単語が、当該広告の特徴テキスト、あるいは、当該指定文書に存在することを表現する。
【0065】
重要単語抽出部62は、テキストベクトル化部61から渡されるテキストから重要なテキストを抽出し、返す。重要単語の抽出方法は、入力されたテキストを形態素解析し、すべての自立語を抽出する方法や、入力されたテキストが文章である場合には、文脈上、強調されていると判断された単語を抽出する方法などがある。また、入力されたテキストがHTMLのような構造化文書の場合、強調された書式で表現された単語や、リンクが張られている単語を抽出する方法などがある。
【0066】
属性データ蓄積部63は、図19に示すように、重要単語に対応する属性とその属性IDを蓄積している。テキストベクトル化部61から重要単語を受け取ると、その重要単語に対応する属性を検索し、対応する属性IDを返す。また、入力された重要単語に対応する属性が存在しない場合、新たに属性IDを新規作成し、その属性IDを返す。
【0067】
次に、上記の構成における動作を説明する。
【0068】
図20は、本発明の第2の実施の形態における個人化広告の提示方法のフローチャートである。
【0069】
同図において、ステップ201からステップ211以外は、前述の第1の実施の形態と同様であるため、その説明を省略する。また、ステップ201からステップ205までの処理は、前述のステップ101からステップ109までのフローを実行する前に、事前に処理するフローを示している。
【0070】
ステップ201) 広告評価部21が、広告蓄積部31から、蓄積されている広告の広告ID群を取得し、ステップ202に移行する。
【0071】
ステップ202) 特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)を、重要単語抽出部62に渡し、重要単語を受け取り、ステップ203に移行する。
【0072】
ステップ203) テキストベクトル化部61では、重要単語抽出部62から受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。
【0073】
ステップ204) 広告蓄積部31の広告ベクトルのステップ203で取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図17)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用してもよい。
【0074】
ステップ205) ステップ204の処理を、ステップ202で取得した全重要単語に対して処理した場合はステップ206へ移行し、そうでない場合は、ステップ203に戻る。
【0075】
ステップ206) ステップ205までの処理を、ステップ201で取得した全広告に対して処理した場合は処理を終了し、そうでない場合は、ステップ202に戻る。
【0076】
ステップ207) 指定文書蓄積部42に蓄積されている指定文書の内容(図8)を、重要単語抽出部62に渡し、重要単語を受け取り、ステップ208に移行する。
【0077】
ステップ208) テキストベクトル化部61は、重要単語抽出部62から受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。
ステップ209) 指定文書蓄積部42の文書ベクトルのステップ208で取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図18)。また、ここで属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。
【0078】
ステップ210) ステップ209の処理を、ステップ207で取得した全重要単語に対して処理した場合はステップ211に移行し、そうでない場合には、ステップ208へ戻る。
【0079】
ステップ211) ステップ210までの処理を、ステップ102で取得した全指定文書に対して処理した場合はステップ105に移行し、そうでない場合にはステップ207に戻る。
【0080】
[第3の実施の形態]
図21は、本発明の第3の実施の形態における個人化広告の提示方法に対応するシステム構成を示す。
【0081】
同図に示すシステムは、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示可能な構成を示す。
【0082】
同図において、指定文書収集部43、文書履歴蓄積部44、テキストベクトル化部63’、嗜好ベクトル生成部51’、嗜好履歴蓄積部53、上昇度計算部54以外は、前述の第2の実施の形態と同様であるため、同一符号を付し、その説明を省略する。
【0083】
指定文書収集部43は、文書蓄積部42に記録されている認証されたユーザが指定した文書群を、ある一定の時間間隔、例えば、1時間おきに収集し、文書履歴蓄積部44の指定文書の内容に、ユーザID、文書ID、収集時刻と共に記録する。また、指定文書の内容をテキストベクトル化部61’に渡し、ベクトル化した値を、文書履歴蓄積部44の文書ベクトルの項目に記録する。
【0084】
テキストベクトル化部61’は、特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)、あるいは、指定文書蓄積部42に蓄積されている指定文書の内容(図8)を入力として、これらのテキストをベクトル化し、広告の場合は、広告蓄積部31の広告ベクトル、指定文書の場合は、文書履歴蓄積部44の文書ベクトルに記録する。入力として受け取ったテキストを重要単語抽出部62に渡し、重要単語を受け取る。受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。広告の場合は、広告蓄積部31の広告ベクトルの取得した属性IDに対応する値に、当該重要単語の存在を示す2値情報を記録する(図17)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。また、指定文書の場合は、図22に示すように、文書履歴蓄積部44の文書ベクトルの取得した属性IDに対応する値に、当該単語の出現頻度を記録する。これにより、当該重要単語が、指定文書にどれだけ多く存在するかを表現する。また、文書ベクトルの属性値は、当該重要単語の存在を示す2値情報を記録しても構わない。
【0085】
文書履歴蓄積部44は、指定文書収集部43で収集された文書を、少なくとも、ユーザID、文書ID、収集時刻、指定文書の内容、文書ベクトルの項目で記録しておく。
【0086】
嗜好ベクトル生成部51’は、認証されたユーザに対応するユーザID、収集時刻を、文書履歴蓄積部42に渡し、当該ユーザIDに対応する当該収集時刻における複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとして、嗜好履歴蓄積部53に記録する。ベクトルの合成方法は、第1の実施の形態に準ずる。
【0087】
嗜好履歴蓄積部53は、図23に示すように、少なくと、ユーザID、収集時刻、嗜好ベクトルを記録する。
【0088】
上昇度計算部54は、認証されたユーザIDに対応する、複数の収集時刻に対応する嗜好ベクトルを取得し、これらから、ベクトルを構成する属性値の、最近の上昇度を計算し、嗜好ベクトル蓄積部52の嗜好ベクトルの各属性値に、各属性値の上昇度を記録する。上昇度の計算方法は、現在時刻から過去一定期間に、当該属性に対応する属性値の上昇率を用いる方法等が考えられる。また、各属性値の時系列による変動曲線の現在時刻における傾きを用いる場合などもある。
【0089】
図24は、本発明の第3の実施の形態における個人化広告の提示方法のフローチャートである。このフローチャートは、ステップ301からステップ305、ステップ105’以外は、前述の第2の実施の形態と同様であるのでその説明を省略する。また、ステップ301からステップ305は、定期的に実行される処理である。
【0090】
ステップ301) 指定文書収集部43が、時刻を監視し、ある一定の時間間隔が経過したかを判定する。時間が経過したらステップ302へ移行し、そうでない場合は、再帰的にステップ301に戻る。
【0091】
ステップ302) 指定文書収集部43が、文書蓄積部42に記録されている任意のユーザが指定した文書群を収集し、文書履歴蓄積部44の指定文書の内容に、ユーザID、文書ID、収集時刻と共に記録し、ステップ303に移行する。
【0092】
ステップ303) 指定文書収集部43が、指定文書の内容をテキストベクトル化部61’に渡し、ベクトル化した値を、文書履歴蓄積部44(図22)の文書履歴ベクトルの項目に記録し、ステップ304に移行する。
【0093】
ステップ304) 嗜好ベクトル生成部51’が、処理対象のユーザに対応するユーザID、収集時刻を、文書履歴蓄積部42に渡し、当該ユーザIDに対応する当該収集時刻における複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとし、嗜好履歴蓄積部53(図23)に記録し、ステップ305に移行する。
【0094】
ステップ305) ステップ302からステップ304までの処理を、全ユーザに対して処理した場合は、ステップ301に戻り、そうでない場合には、ステップ302に戻る。
【0095】
ステップ105’) 上昇度計算部54が、認証されたユーザIDに対応する、複数の収集時刻に対応する嗜好ベクトルを取得し、これらから、ベクトルを構成する属性の値の、最近の上昇度を計算し、嗜好ベクトル蓄積部52の嗜好ベクトルの各属性値に、各属性の上昇度を代入する。
【0096】
上記の第1の実施の形態における図14、第2の実施の形態における図20、及び第3の実施の形態における図24に示すフローチャートの動作をプログラムとして構築し、提示装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることも可能である。
【0097】
また、構築されたプログラムを提示装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。
【0098】
なお、本発明は、上記の実施の形態の例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【0099】
【発明の効果】
上述のように、本発明によれば、個人が指定した文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報に関連度が高い広告を、優先的に提示することができる。
【0100】
また、本発明では、指定した文書、及び広告の特徴を示すベクトルを自動的に生成できる。
【0101】
さらに、本発明では、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示することができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の第1の実施の形態における個人化広告の提示方法に対応するシステム構成図である。
【図3】本発明の第1の実施の形態における表示例である。
【図4】本発明の第1の実施の形態における広告評価データ蓄積部の記憶例である。
【図5】本発明の第1の実施の形態における広告蓄積部の記憶例(その1)である。
【図6】本発明の第1の実施の形態における広告蓄積部の記憶例(その2)である。
【図7】本発明の第1の実施の形態における広告蓄積部の記憶例(その3)である。
【図8】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その1)である。
【図9】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その2)である。
【図10】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その3)である。
【図11】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その1)である。
【図12】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その2)である。
【図13】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その3)である。
【図14】本発明の第1の実施の形態における個人化広告の提示方法を示すフローチャートである。
【図15】本発明の第2の実施の形態における個人広告の提示方法に対応するシステム構成図である。
【図16】本発明の第2の実施の形態における特徴テキストの記憶例である。
【図17】本発明の第2の実施の形態における広告文書蓄積部の記憶例である。
【図18】本発明の第2の実施の形態における指定文書蓄積部の記憶例である。
【図19】本発明の第2の実施の形態における属性データ蓄積部の記憶例である。
【図20】本発明の第2の実施の形態における個人化広告の提示方法のフローチャートである。
【図21】本発明の第3の実施の形態における個人化広告の提示方法に対応するシステム構成図である。
【図22】本発明の第3の実施の形態における文書履歴蓄積部の記憶例である。
【図23】本発明の第3の実施の形態における嗜好履歴蓄積部の記憶例である。
【図24】本発明の第3の実施の形態における個人化広告の提示方法のフローチャートである。
【符号の説明】
10 表示部
11 広告表示部
12 指定文書表示部
20 広告表示制御部
21 広告評価部
22 広告評価データ蓄積部
30 広告管理部
31 広告蓄積部
32 特徴テキスト蓄積部
40 文書管理部
41 文書指定部
42 指定文書蓄積部
43 指定文書収集部
44 文書履歴蓄積部
50 嗜好管理部
51,51’ 嗜好ベクトル生成部
52 嗜好ベクトル蓄積部
53 嗜好履歴蓄積部
54 上昇度計算部
60 ベクトル管理部
61 重要単語抽出部
62 属性データ蓄積部
63,63’ テキストベクトル化部[0001]
BACKGROUND OF THE INVENTION
The present invention provides personalized advertisement provision information andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumIn particular, in order to present a personalized advertisement in a system for registering a document specified by a user by scraping a part of a page of a structured document such as HTML or bookmarking the entire page. Information provided by personalized advertisements andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumAbout.
[0002]
[Prior art]
Conventional banner advertisements that are prevalent on Internnet provide advertisements by providing advertisement frames on pages related to arbitrary topics and recruiting advertisers. It is common for advertisers to associate user groups that are assumed from the topics of the page and invest in advertising space when their products match target users (for example, Non-Patent Document 1). reference).
[0003]
However, the recent Internet advertising market has continued to be sluggish, and although there are advertisements, there are problems that no one sees. For this, even if an advertisement that does not match the user's preference is issued or the preference matches, the degree of the match may be low.
[0004]
In addition, banner advertisements in search engines include a method for presenting advertisements related to search keywords. For example, when a search is performed using the keyword “NTT”, an advertisement such as “search for a book related to“ NTT ”on this site” is presented on the search result page. This method is an attempt to improve the degree of matching between the user's preference and the content of the advertisement (see, for example, Non-Patent Document 2).
[0005]
[Non-Patent Document 1]
Kishi Koji, Sakamoto Kei, Sakamoto Yasuhisa (1998), “Study on the Influence of User Behavior on Internet Advertising Effects”, Information Processing Society of Japan Research Report, HI-77-1, pp1-6.
[Non-Patent Document 2]
http://www.goo.ne.jp/help/info/ad/result.html.
[0006]
[Problems to be solved by the invention]
However, as described above, a general banner advertisement on the Internet associates the user layer with the topic of the page, and can only acquire the user's preference indirectly.
[0007]
Further, the advertisement related to the input keyword in the search engine is suitable when the user's request can be explicitly expressed by the keyword. However, the user's request includes an ambiguous case in which information desired by the user cannot be expressed explicitly, and a method for presenting an advertisement in consideration of such an implicit request is required.
[0008]
The present invention has been made in view of the above points, and by extracting a part of a page such as a Web page or bookmarking the entire page, personal preference information is extracted from a document designated by the user. Focused on making it an information source. There is a large amount of information on the Web, and it is possible to acquire preference information in a very fine unit because scraps and bookmarks are of interest. In addition, it is difficult to express the user's request explicitly in words when scrapping or bookmarking, and it is possible to reflect the implicit user's interest by using the information of the scrapped or bookmarked document Based on the information specified by the user, it is possible to derive a personal profile that reflects a more detailed and implicit request and to preferentially present advertisements that match this profile. Possible personalized advertising information andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumThe purpose is to provide.
[0009]
[Means for Solving the Problems]
FIG. 1 is a diagram for explaining the principle of the present invention.
[0010]
The present invention(Claim 1)IsThe computer is caused to function as a device having a designated document collecting unit, a text vectorizing unit, a preference vector generating unit, a rise degree calculating unit, an advertisement evaluation unit, and an advertisement display unit.How to provide personalized advertisingBecause
The designated document collection meansThe document specified by the userProcess of regular collection (step 1);
Text vectorization meansDescribed as a vector with multiple attribute values indicating document characteristicsStoring a document vector as a document vector in the document history storage means (step 2);
The preference vector generation meansSpecify from userHas beenDocumentsDocument at the time of collectionA vector composed of vectorsAt the time of collectionThe user'sA process (step 3) of recording in the preference history storage means as a preference vector;
At the time when the user browses the information, the degree-of-rise calculating means calculates the degree of increase of each attribute value of the preference vector immediately before the user browses the information, and the vector has the attribute value as the degree of increase of each attribute value. A process of recording the preference vector in the preference vector storage means (step 4),
A vector based on a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage unit and a plurality of attribute values indicating features of advertisements that are presentation candidates recorded in the advertisement storage unit AndThe process of calculating similarity(Step 5)When,
In the advertisement display means, the advertisement storage means described in the advertisement storage means,Give priority to ads with high similaritydisplayProcess(Step 6)When,I do.
[0011]
In addition, the present invention(Claim 2)Is when there is text in the document specified by the user, or there is text that expresses the characteristics of the ad,
Extracting important words in the text in the specified document or in the text representing the characteristics of the advertisement;
Making the extracted word an attribute of a vector indicating the characteristics of the specified document or advertisement;
A process in which binary information indicating the presence of an extracted word or a vector having an appearance frequency as an attribute value is used as a designated document or advertisement feature vector;,I do.
[0012]
The present invention(Claim 3)IsA personalized advertisement providing device that provides a document specified by a user,
A designated document collection means for periodically collecting documents designated by the user;
A text vectorization unit that describes a plurality of attribute values indicating the characteristics of the document collected by the designated document collection unit, and stores the document vector as a document vector in the document history storage unit;
A preference vector generation unit that records a vector obtained by synthesizing a document vector at the time of collection of a document group designated by a user as a preference vector of the user at the time of collection in a preference history storage unit;
The degree of increase of each attribute value of the preference vector immediately before the user browses information is calculated, and the vector having the attribute value as the degree of increase of each attribute value is used as the preference vector at the time when the user browses the information. Ascending degree calculation means for recording in the vector storage means;
Similarity between a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage means, and a vector based on a plurality of attribute values indicating the characteristics of advertisements that are presentation candidates recorded in the advertisement storage means An advertising rating means to calculate,
An advertisement display means for preferentially displaying an advertisement with a high similarity described in the advertisement storage means;
Have
[0013]
Bookinvention(Claim 4)IsIf there is text in the document specified by the user, or if there is text that expresses the characteristics of the advertisement,
A means of extracting important words in the text in the specified document or in the text representing the characteristics of the advertisement;
Means for making the extracted word an attribute of a vector indicating the characteristics of the designated document or advertisement;
A binary information indicating the presence of the extracted word and a vector having an appearance frequency as an attribute value as a designated document or an advertisement feature vector;
Have
[0014]
Bookinvention(Claim 5)IsA program that causes a computer to function as each unit of the personalized advertisement providing device according to
[0015]
The present invention(Claim 6)IsA computer-readable recording medium storing the program according to
[0017]
As described above, in the present invention, personal preference information corresponding to an implicit request can be generated more precisely from a document specified by the user, and an advertisement having a high degree of relevance of the preference information is preferentially presented. It becomes possible to do.
[0018]
Further, according to the present invention, it is possible to automatically generate a document designated by the user and a vector indicating the feature of the advertisement.
[0019]
Furthermore, according to the present invention, it is possible to preferentially present an advertisement related to a topic that reflects the user's preference and that has recently become a hot topic.
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0020]
[First Embodiment]
FIG. 2 shows a system configuration corresponding to the personalized advertisement presentation method according to the first embodiment of the present invention.
[0021]
The system shown in the figure is capable of generating personal preference information corresponding to an implicit request more precisely from a document specified by the user, and giving priority to an advertisement that is highly relevant to the preference information. A possible configuration is shown.
[0022]
The system shown in the figure includes a
[0023]
The
[0024]
The advertisement
[0025]
The
[0026]
The
The
[0027]
The
[0028]
The designated
[0029]
The
[0030]
The advertisement evaluation
[0031]
The
[0032]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 5, the attribute constituting the advertisement vector may be an attribute representing the target field such as “sport” or “movie”. The degree to which each advertisement relates to the field indicating the attribute may be expressed as a continuous value and used as an attribute value. In addition, binary information indicating whether each advertisement is related to a field corresponding to the attribute may be used as the attribute value.
[0033]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 6, the attribute constituting the advertisement vector may be an attribute representing the advertisement itself such as “
[0034]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 7, the attribute constituting the advertisement vector may be an attribute representing the document itself such as “
[0035]
Then, when the content reference request is passed together with the advertisement ID from the
[0036]
As shown in the lower part of FIG. 3, the
[0037]
The designated
[0038]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 8, the attribute constituting the document vector may be an attribute representing the target field such as “sports” or “movie”. The degree to which each document relates to the field indicated by the attribute may be expressed as a continuous value and used as an attribute value. In addition, there is a case where a binary attribute value indicates whether each document is related to a field corresponding to the attribute.
[0039]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 9, the attribute constituting the document vector may be an attribute representing the advertisement itself such as “
[0040]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 10, the attribute constituting the document vector may be an attribute representing the document itself such as “
[0041]
In addition, when the advertisement vector reference request is delivered together with the user ID from the preference
[0042]
When the preference
[0043]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 11, the attribute constituting the preference vector may be an attribute representing the target field such as “sports” or “movie”. The sum of the attribute values of the document vector designated by each user shown in FIG. 8 may be combined as the attribute value of the preference vector. In this case, the preference vector is synthesized such that the degree of association of the selected document group with each field is comprehensively covered.
[0044]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 12, the attribute constituting the preference vector may be an attribute representing the advertisement itself such as “
[0045]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 13, the attribute constituting the preference vector may be an attribute representing the document itself such as “
[0046]
Further, as a method of synthesis, not only the sum of each attribute of the document vector but also an average value or other total metric may be used.
[0047]
The preference
[0048]
The operation in the above configuration will be described below.
[0049]
FIG. 14 is a flowchart showing a personalized advertisement presentation method according to the first embodiment of the present invention.
[0050]
Step 101) A user is authenticated using a user authentication system managed by a user ID and a password, and the process proceeds to Step 102.
[0051]
Step 102) The
[0052]
Step 103) The preference
[0053]
Step 104) If the processing in
[0054]
Step 105) The document vector group of the document designated by the authenticated user acquired by the preference
[0055]
Step 106) The
[0056]
Step 107) The
[0057]
Step 108) If the processing of
[0058]
Step 109) The
[0059]
[Second Embodiment]
FIG. 15 shows a system configuration corresponding to the personal advertisement presentation method in the second embodiment of the present invention.
[0060]
The system shown in the figure shows a configuration that can automatically generate a vector indicating the characteristics of a designated document and advertisement.
[0061]
Except for the feature
[0062]
The feature
[0063]
The
[0064]
The text vectorization unit 61 is a text expressing the feature of each advertisement stored in the feature text storage unit 32 (FIG. 16) or the contents of the specified document stored in the specified document storage unit 42 (FIG. 8). As an input, these texts are vectorized and recorded in the advertisement vector of the
[0065]
The important
[0066]
As shown in FIG. 19, the attribute data storage unit 63 stores attributes corresponding to important words and their attribute IDs. When an important word is received from the text vectorization unit 61, an attribute corresponding to the important word is searched and a corresponding attribute ID is returned. If there is no attribute corresponding to the input important word, a new attribute ID is newly created and the attribute ID is returned.
[0067]
Next, the operation in the above configuration will be described.
[0068]
FIG. 20 is a flowchart of the personalized advertisement presentation method according to the second embodiment of the present invention.
[0069]
In the figure, since steps other than
[0070]
Step 201) The
[0071]
Step 202) The text (FIG. 16) expressing the feature of each advertisement stored in the feature
[0072]
Step 203) The text vectorization unit 61 acquires the attribute ID corresponding to the important word received from the important
[0073]
Step 204) Binary information indicating that the important word exists is recorded in the value corresponding to the attribute ID acquired in Step 203 of the advertisement vector of the advertisement storage unit 31 (FIG. 17). Here, not only binary information indicating whether or not an important word exists in the attribute value, but also a value such as the appearance frequency of the important word may be used.
[0074]
Step 205) If the process of step 204 is processed for all the important words acquired in step 202, the process proceeds to step 206. If not, the process returns to step 203.
[0075]
Step 206) If the processing up to step 205 has been processed for all advertisements acquired in
[0076]
Step 207) The contents (FIG. 8) of the designated document stored in the designated
[0077]
Step 208) The text vectorization unit 61 acquires the attribute ID corresponding to the important word received from the important
Step 209) Binary information indicating that the important word exists is recorded in the value corresponding to the attribute ID acquired in
[0078]
Step 210) If the processing in
[0079]
Step 211) If the processing up to Step 210 has been processed for all the specified documents acquired in
[0080]
[Third Embodiment]
FIG. 21 shows a system configuration corresponding to the personalized advertisement presentation method according to the third embodiment of the present invention.
[0081]
The system shown in the figure shows a configuration that can preferentially present an advertisement related to a topic that reflects a user's preference and that has recently become a hot topic.
[0082]
In the figure, except for the designated
[0083]
The designated
[0084]
The text vectorization unit 61 ′ is a text expressing the characteristics of each advertisement stored in the feature text storage unit 32 (FIG. 16) or the contents of the specified document stored in the specified document storage unit 42 (FIG. 8). ) As an input, and the text is vectorized and recorded in the advertisement vector of the
[0085]
The document
[0086]
When the preference
[0087]
As shown in FIG. 23, the preference
[0088]
The increase
[0089]
FIG. 24 is a flowchart of a personalized advertisement presentation method according to the third embodiment of the present invention. Since this flowchart is the same as the second embodiment described above except for steps 301 to 305 and 105 ', the description thereof will be omitted. Steps 301 to 305 are periodically executed processes.
[0090]
Step 301) The designated
[0091]
Step 302) The designated
[0092]
Step 303) The designated
[0093]
Step 304) When the preference
[0094]
Step 305) If the processing from step 302 to step 304 has been processed for all users, the process returns to step 301. If not, the process returns to step 302.
[0095]
Step 105 ′) The increase
[0096]
A computer that constructs the operations of the flowcharts shown in FIG. 14 in the first embodiment, FIG. 20 in the second embodiment, and FIG. 24 in the third embodiment as a program and that is used as a presentation device. It is also possible to install it on the Internet or distribute it via a network.
[0097]
In addition, the constructed program is stored in a hard disk device connected to a computer used as a presentation device, a portable storage medium such as a flexible disk or a CD-ROM, and installed when the present invention is carried out. Thus, the present invention can be easily realized.
[0098]
The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
[0099]
【The invention's effect】
As described above, according to the present invention, personal preference information corresponding to an implicit request can be generated more finely from a document designated by an individual, and an advertisement having a high degree of relevance to the preference information is given priority. Can be presented.
[0100]
Further, according to the present invention, it is possible to automatically generate a vector indicating the characteristics of the designated document and advertisement.
[0101]
Furthermore, according to the present invention, it is possible to preferentially present an advertisement related to a topic that reflects the user's preference and that has recently become a hot topic.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining the principle of the present invention.
FIG. 2 is a system configuration diagram corresponding to a personalized advertisement presentation method according to the first embodiment of the present invention.
FIG. 3 is a display example in the first embodiment of the present invention.
FIG. 4 is a storage example of an advertisement evaluation data storage unit in the first embodiment of the present invention.
FIG. 5 is a storage example (part 1) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 6 is a storage example (part 2) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 7 is a storage example (part 3) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 8 is a storage example (part 1) of the designated document storage unit according to the first embodiment of the present invention;
FIG. 9 is a storage example (part 2) of the designated document storage unit in the first embodiment of the present invention;
FIG. 10 is a storage example (No. 3) of the designated document storage unit in the first embodiment of the present invention;
FIG. 11 is a storage example (part 1) of the designated document storage unit in the first embodiment of the present invention;
FIG. 12 is a storage example (No. 2) of the designated document storage unit in the first embodiment of the present invention;
FIG. 13 is a storage example (part 3) of the designated document storage unit in the first embodiment of the present invention;
FIG. 14 is a flowchart showing a method for presenting a personalized advertisement in the first embodiment of the present invention.
FIG. 15 is a system configuration diagram corresponding to a personal advertisement presentation method according to a second embodiment of the present invention;
FIG. 16 is a storage example of feature text according to the second embodiment of the present invention;
FIG. 17 is a storage example of an advertisement document storage unit according to the second embodiment of the present invention.
FIG. 18 is a storage example of a designated document storage unit in the second embodiment of the present invention;
FIG. 19 is a storage example of an attribute data storage unit in the second embodiment of the present invention;
FIG. 20 is a flowchart of a personalized advertisement presentation method according to the second embodiment of the present invention.
FIG. 21 is a system configuration diagram corresponding to a method for presenting a personalized advertisement in the third embodiment of the present invention.
FIG. 22 is a storage example of a document history accumulation unit according to the third embodiment of the present invention.
FIG. 23 is a storage example of a preference history accumulation unit according to the third embodiment of the present invention.
FIG. 24 is a flowchart of a method for presenting a personalized advertisement in the third embodiment of the present invention.
[Explanation of symbols]
10 Display section
11 Advertising display
12 Specified document display area
20 Advertising display controller
21 Advertising Evaluation Department
22 Advertising evaluation data storage
30 Advertising Management Department
31 Advertising storage
32 Feature text storage
40 Document Management Department
41 Document specification part
42 Designated document storage
43 Designated Document Collection Department
44 Document history storage
50 Preference Management Department
51, 51 'preference vector generator
52 Preference vector storage
53 Preference History Accumulator
54 Ascension calculator
60 Vector Management Department
61 Important word extractor
62 Attribute data storage unit
63, 63 'Text vectorization unit
Claims (6)
前記指定文書収集手段が、ユーザから指定された文書を定期的に収集する過程と、
前記テキストベクトル化手段が、前記文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に前記文書のベクトルを文書ベクトルとして蓄積する過程と、
前記嗜好ベクトル生成手段が、前記ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する過程と、
前記上昇度計算手段が、前記ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、前記ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する過程と、
前記広告評価手段が、前記嗜好ベクトル蓄積手段に記録された前記各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する過程と、
前記広告表示手段において、前記広告蓄積手段に記述された、前記類似度が高い広告を優先的に表示する過程と、
を行うことを特徴とする個人化広告の提供方法。 A personalized advertisement providing method for causing a computer to function as a device having a designated document collection means, a text vectorization means, a preference vector generation means, a rise calculation means, an advertisement evaluation means, and an advertisement display means ,
The designated document collection means periodically collects a document designated by the user ;
The text vectorization means describes a vector with a plurality of attribute values indicating the characteristics of the document, and stores the document vector as a document vector in the document history storage means;
The preference vector generation means records a vector obtained by synthesizing the document vectors at the time of collection of the document group designated by the user as the user's preference vector at the time of collection in the preference history accumulation means;
The increase degree calculation means calculates the increase degree of each attribute value of the preference vector immediately before the user browses the information, and the user views the information with the vector having the increase degree of each attribute value as the attribute value. As a preference vector at the time of doing, the process of recording in the preference vector storage means,
The advertisement evaluation means has a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage means, and a plurality of attributes indicating features of advertisements that are presentation candidates recorded in the advertisement storage means A process of calculating the similarity between a vector by value and
In the advertisement display means, a process of preferentially displaying the advertisement with the high similarity described in the advertisement storage means ;
A method for providing a personalized advertisement, characterized by:
前記指定された文書内のテキスト、あるいは、前記広告の特徴を表現したテキスト中の重要な単語を抽出する過程と、
抽出された単語を、前記指定された文書あるいは、前記広告の特徴を示すベクトルの属性とする過程と、
前記抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、前記指定された文書あるいは、広告の特徴ベクトルとする過程と、
を行う請求項1記載の個人化広告の提供方法。When there is text in the document specified by the user, or when there is text representing the characteristics of the advertisement,
Extracting important words in the text in the designated document or in the text representing the characteristics of the advertisement;
Making the extracted word an attribute of a vector indicating the characteristics of the designated document or the advertisement;
A process in which binary information indicating the presence of the extracted word or a vector having an appearance frequency as an attribute value is used as the specified document or an advertisement feature vector;
The method for providing a personalized advertisement according to claim 1.
ユーザから指定された文書を定期的に収集する指定文書収集手段と、A designated document collection means for periodically collecting documents designated by the user;
前記指定文書収集手段で収集された前記文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に前記文書のベクトルを文書ベクトルとして蓄積するテキストベクトル化手段と、A text vectorization unit that describes a vector with a plurality of attribute values indicating characteristics of the document collected by the designated document collection unit, and stores the document vector as a document vector in a document history storage unit;
前記ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する嗜好ベクトル生成手段と、A preference vector generation unit that records a vector obtained by synthesizing document vectors at the time of collection of a document group designated by the user as a preference vector of the user at the time of collection in a preference history storage unit;
前記ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、前記ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する上昇度計算手段と、The degree of increase of each attribute value of the preference vector immediately before the user browses the information is calculated, and a vector having the attribute value as the degree of increase of each attribute value is used as the preference vector at the time when the user browses the information. , The degree of increase calculation means for recording in the preference vector storage means,
前記嗜好ベクトル蓄積手段に記録された前記各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する広告評価手段と、A preference vector having an attribute value as the degree of increase of each attribute value recorded in the preference vector storage means, and a vector based on a plurality of attribute values indicating the characteristics of the advertisement as a presentation candidate recorded in the advertisement storage means An advertising evaluation means for calculating similarity,
前記広告蓄積手段に記述された、前記類似度が高い広告を優先的に表示する広告表示手段と、An advertisement display means for preferentially displaying the advertisement with a high similarity described in the advertisement storage means;
を有することを特徴とする個人化広告提供装置。A personalized advertisement providing apparatus characterized by comprising:
前記指定された文書内のテキスト、あるいは、前記広告の特徴を表現したテキスト中の重要な単語を抽出する手段と、Means for extracting important words in the text in the designated document or in the text representing the characteristics of the advertisement;
抽出された単語を、前記指定された文書あるいは、前記広告の特徴を示すベクトルの属性とする手段と、Means for making the extracted word an attribute of a vector indicating the characteristics of the designated document or the advertisement;
前記抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、前記指定された文書あるいは、広告の特徴ベクトルとする手段と、A binary information indicating the presence of the extracted word or a vector having an appearance frequency as an attribute value as the specified document or advertisement feature vector;
を有する請求項3記載の個人化広告提供装置。The personalized advertisement providing apparatus according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002283870A JP4023273B2 (en) | 2002-09-27 | 2002-09-27 | Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002283870A JP4023273B2 (en) | 2002-09-27 | 2002-09-27 | Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004118716A JP2004118716A (en) | 2004-04-15 |
JP4023273B2 true JP4023273B2 (en) | 2007-12-19 |
Family
ID=32277615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002283870A Expired - Fee Related JP4023273B2 (en) | 2002-09-27 | 2002-09-27 | Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4023273B2 (en) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
WO2007001247A2 (en) * | 2004-06-02 | 2007-01-04 | Yahoo! Inc. | Content-management system for user behavior targeting |
US8874570B1 (en) | 2004-11-30 | 2014-10-28 | Google Inc. | Search boost vector based on co-visitation information |
US8611856B2 (en) * | 2005-10-18 | 2013-12-17 | Google Inc. | Identifying spurious requests for information |
JP2008052665A (en) * | 2006-08-28 | 2008-03-06 | Sony Computer Entertainment Inc | Content display device and content display method |
US7827170B1 (en) | 2007-03-13 | 2010-11-02 | Google Inc. | Systems and methods for demoting personalized search results based on personal information |
JP5027082B2 (en) * | 2008-09-02 | 2012-09-19 | ヤフー株式会社 | Action history analysis method, apparatus and program |
US8769434B2 (en) * | 2010-08-11 | 2014-07-01 | Nike, Inc. | Intelligent display of information in a user interface |
US20130080208A1 (en) * | 2011-09-23 | 2013-03-28 | Fujitsu Limited | User-Centric Opinion Analysis for Customer Relationship Management |
JP6135845B2 (en) * | 2013-02-15 | 2017-05-31 | パペルック株式会社 | Digital content system, digital content display method, and digital content display program |
JP2015022561A (en) * | 2013-07-19 | 2015-02-02 | Necパーソナルコンピュータ株式会社 | Terminal device, advertisement distribution system, and program |
JP6635587B2 (en) * | 2015-12-14 | 2020-01-29 | 日本放送協会 | Advertising sentence selection device and program |
-
2002
- 2002-09-27 JP JP2002283870A patent/JP4023273B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004118716A (en) | 2004-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100881832B1 (en) | Method and system for displaying keyword advertisement using searching optimum randing page | |
JP4750814B2 (en) | Advertising method and system for exposing contextual advertising information | |
US20080120328A1 (en) | Method of Performing a Weight-Based Search | |
US20120158693A1 (en) | Method and system for generating web pages for topics unassociated with a dominant url | |
US20090177651A1 (en) | Information processing device and method, program, and recording medium | |
US20080183660A1 (en) | Content identification expansion | |
JP4023273B2 (en) | Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium | |
JP2007524925A (en) | Automatic web-based ad targeting | |
KR20020007742A (en) | Methods of Information Recommendation based on Analysis of User's Information Preferences and Measurement of Information Popularity on the Internet and the System thereof | |
WO2010098178A1 (en) | Information recommendation device, information recommendation method, and information recommendation program | |
KR101355945B1 (en) | On line context aware advertising apparatus and method | |
CN104462336A (en) | Information pushing method and device | |
US9015172B2 (en) | Method and subsystem for searching media content within a content-search service system | |
JP2007241888A (en) | Information processor, processing method, and program | |
JP4896132B2 (en) | Information retrieval method and apparatus reflecting information value | |
WO2011014564A2 (en) | System and method for dynamic targeting advertisement based on content-in-view | |
JP5511782B2 (en) | New advertisement capable URL providing system and new advertisement capable URL providing method | |
KR100954842B1 (en) | Method and System of classifying web page using category tag information and Recording medium using by the same | |
JP4883644B2 (en) | RECOMMENDATION DEVICE, RECOMMENDATION SYSTEM, RECOMMENDATION DEVICE CONTROL METHOD, AND RECOMMENDATION SYSTEM CONTROL METHOD | |
KR101140724B1 (en) | Method and system of configuring user profile based on a concept network and personalized query expansion system using the same | |
KR101178208B1 (en) | Apparatus and method for extracting keywords | |
WO2008063615A2 (en) | Apparatus for and method of performing a weight-based search | |
JP4755834B2 (en) | Attribute evaluation apparatus, attribute evaluation method, and attribute evaluation program | |
KR100851042B1 (en) | Method for recommending extended advertising keyword and system thereof | |
KR102052068B1 (en) | System and method for recommanding contents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070924 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101012 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101012 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111012 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111012 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121012 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |