JP4023273B2 - Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium - Google Patents

Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium Download PDF

Info

Publication number
JP4023273B2
JP4023273B2 JP2002283870A JP2002283870A JP4023273B2 JP 4023273 B2 JP4023273 B2 JP 4023273B2 JP 2002283870 A JP2002283870 A JP 2002283870A JP 2002283870 A JP2002283870 A JP 2002283870A JP 4023273 B2 JP4023273 B2 JP 4023273B2
Authority
JP
Japan
Prior art keywords
advertisement
document
vector
user
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002283870A
Other languages
Japanese (ja)
Other versions
JP2004118716A (en
Inventor
勝 宮本
匡 内山
久 茨木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002283870A priority Critical patent/JP4023273B2/en
Publication of JP2004118716A publication Critical patent/JP2004118716A/en
Application granted granted Critical
Publication of JP4023273B2 publication Critical patent/JP4023273B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体に係り、特に、HTML等の構造化文書のページの一部をスクラップしたり、ページ全体をブックマークすることで、ユーザから指定された文書を登録するシステムにおいて、個人化した広告を提示するための個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体に関する。
【0002】
【従来の技術】
従来のインタンーネット上で普及しているバナー広告は、任意のトピックスに関するページに広告枠を設け、広告主を募集することで、広告を提示している。広告主は、ページのトピックスから想定されるユーザ層を連想し、自分の商品をターゲットユーザと合致している場合に、広告枠に投資するというのが一般的である(例えば、非特許文献1参照)。
【0003】
しかし、昨今のインターネットの広告市場は低迷を続け、広告は出したが、誰も見ないといった問題があちこちで生じている。これには、ユーザの嗜好と合致していない広告が出されていたり、嗜好が合致していても、その合致の度合が低いことが考えられる。
【0004】
また、検索エンジンにおけるバナー広告の中には、検索キーワードに関連した広告を提示する方法が存在する。例えば、「NTT」というキーワードで検索すると、検索結果のページに「“NTT”に関する本を、このサイトで検索」といったような広告が提示される。この手法は、ユーザの嗜好と、広告の内容の合致度合を向上させる試みである(例えば、非特許文献2参照)。
【0005】
【非特許文献1】
岸晃司、坂本啓、坂本泰久、(1998)、“インターネット広告効果にユーザ行動が与える影響に関する研究”、情報処理学会研究報告、HI-77-1,pp1-6.
【非特許文献2】
http://www.goo.ne.jp/help/info/ad/result.html。
【0006】
【発明が解決しようとする課題】
しかしながら、上記のように、一般的なインターネット上のバナー広告は、ページのトピックスからユーザ層を連想するしかなく、ユーザの嗜好を間接的にしか取得できない。
【0007】
また、検索エンジンにおける投入キーワードに関連した広告は、ユーザの要求が、明示的にキーワードで表現できる場合に適している。しかし、ユーザの要求には、自分の欲しい情報を明示的に表現できないような曖昧な場合が存在し、そのような暗黙的な要求を考慮した広告の提示方法が要求されている。
【0008】
本発明は、上記の点に鑑みなされたもので、Webページ等のページの一部をスクラップしたり、ページ全体をブックマークすることで、ユーザから指定された文書を、個人の嗜好情報を抽出するための情報源とすることに着眼した。Web上では情報は大量にあり、その中で興味のあるものをスクラップしたり、ブックマークするため、非常に細かい単位の嗜好情報が取得可能である。また、スクラップやブックマークするときの、ユーザの要求を明示的に言葉で表現するのは難しく、スクラップやブックマークした文書の情報を利用することで、暗黙的なユーザの興味を反映することが可能になることを利用し、当該ユーザが指定した情報をもとに、よりきめの細かく、暗黙的な要求を反映した個人のプロファイルを導出し、このプロファイルに合致した広告を優先的に提示することが可能な個人化広告の提供情報及び個人化広告提供装置及びプログラム及びコンピュータ読取可能な記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0010】
本発明(請求項1)は、コンピュータを、指定文書収集手段、テキストベクトル化手段、嗜好ベクトル生成手段、上昇度計算手段、広告評価手段、広告表示手段を有する装置として機能させる個人化広告の提供方法であって、
指定文書収集手段が、ユーザから指定された文書を定期的に収集する過程(ステップ1)と、
テキストベクトル化手段が、文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に文書のベクトルを文書ベクトルとして蓄積する過程(ステップ2)と、
嗜好ベクトル生成手段が、ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する過程(ステップ3)と、
上昇度計算手段が、ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する過程(ステップ4)と、
広告評価手段が、嗜好ベクトル蓄積手段に記録された各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する過程(ステップ5)と、
広告表示手段において、広告蓄積手段に記述された、類似度が高い広告を優先的にて表示する過程(ステップ6)と、を行う
【0011】
また、本発明(請求項2)は、ユーザから指定された文書にテキストが存在する場合や、広告の特徴を表現したテキストが存在する場合に、
指定された文書内のテキスト、あるいは、広告の特徴を表現したテキスト中の重要な単語を抽出する過程と、
抽出された単語を、指定された文書あるいは、広告の特徴を示すベクトルの属性とする過程と、
抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、指定された文書あるいは、広告の特徴ベクトルとする過程と、を行う。
【0012】
本発明(請求項3)は、ユーザから指定された文書を提供する個人化広告提供装置であって、
ユーザから指定された文書を定期的に収集する指定文書収集手段と、
指定文書収集手段で収集された文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に文書のベクトルを文書ベクトルとして蓄積するテキストベクトル化手段と、
ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する嗜好ベクトル生成手段と、
ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する上昇度計算手段と、
嗜好ベクトル蓄積手段に記録された各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する広告評価手段と、
広告蓄積手段に記述された、類似度が高い広告を優先的に表示する広告表示手段と、
を有する。
【0013】
発明(請求項4)は、ユーザから指定された文書にテキストが存在する場合や、広告の特徴を表現したテキストが存在する場合に、
指定された文書内のテキスト、あるいは、広告の特徴を表現したテキスト中の重要な単語を抽出する手段と、
抽出された単語を、指定された文書あるいは、広告の特徴を示すベクトルの属性とする手段と、
抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、指定された文書あるいは、広告の特徴ベクトルとする手段と、
を有する。
【0014】
発明(請求項5)は、コンピュータを、請求項3または4の個人化広告提供装置の各手段として機能させるプログラムである。
【0015】
本発明(請求項6)は、請求項5記載のプログラムを格納したコンピュータ読み取り可能な記録媒体である。
【0017】
上記のように、本発明では、ユーザから指定された文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報の関連度が高い広告を、優先的に提示することが可能になる。
【0018】
また、本発明では、ユーザから指定された文書、及び広告の特徴を示すベクトルを自動的に生成可能となる。
【0019】
さらに、本発明では、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示可能となる。
【発明の実施の形態】
以下、図面と共に本発明の実施の形態について説明する。
【0020】
[第1の実施の形態]
図2は、本発明の第1の実施の形態における個人化広告の提示方法に対応するシステム構成を示す。
【0021】
同図に示すシステムは、ユーザから指定された文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報に関連度が高い広告を、優先的に指示することが可能な構成を示す。
【0022】
同図に示すシステムは、表示部10、広告表示制御部20、広告管理部30、文書管理部40、嗜好管理部50から構成される。
【0023】
表示部10は、広告表示部11及び指定文書表示部12から構成される。
【0024】
広告表示制御部20は、広告評価部21、及び広告評価データ蓄積部22から構成される。
【0025】
広告管理部30は、広告蓄積部31を有する。
【0026】
文書管理部40は、文書定部41、及び指定文書蓄積部42から構成される。
嗜好管理部50は、嗜好ベクトル生成部51、及び嗜好ベクトル蓄積部52から構成される。
【0027】
表示部10の広告表示部11は、認証されたユーザのユーザIDを、広告評価データ蓄積部22に渡し、ユーザの嗜好と広告の類似度を問い合わせ、類似度が高い広告を広告蓄積部31に問い合わせ、優先的に提示する。提示の方法は、類似度が高い順番に適当な時間間隔で広告を提示する場合や、広告提示エリアを分割し、類似度が高い広告ほど面積を大きくしたり、目立つ位置に配置することで、優先的に提示する場合もある。広告は、例えば、図3のように認証されたユーザの自分専用のページにおける広告表示エリアに表示される。
【0028】
表示部10の指定文書表示部12は、指定文書蓄積部42を参照し、認証されたユーザが事前に指定した文書を図3のように表示する。
【0029】
広告表示制御部20の広告評価部21は、認証されたユーザの嗜好ベクトルを生成するように、嗜好ベクトル生成部51に要求する。生成された嗜好ベクトルを、嗜好ベクトル蓄積部52から取得し、広告蓄積部31に蓄積されている各広告ベクトルとの類似度を計算し、図4のように少なくとも認証されたユーザのユーザID、広告IDと広告の嗜好の類似度を広告評価データ蓄積部22に記録する。
【0030】
広告表示制御部20の広告評価データ蓄積部22は、広告評価部21で計算された各広告ベクトルの類似度を、図4のように、少なくとも認証されたユーザのユーザID、広告IDと広告と嗜好の類似度を記録する。また、広告表示部11より、ユーザIDを渡されると、ユーザIDに対応する広告IDと類似度を返す。
【0031】
広告管理部30の広告蓄積部31は、図5に示すように少なくとも広告ID、広告の内容、広告ベクトルを記録する。広告の内容は、一般的なWebページのバナー広告のように、HTMLのような記述言語で記述されている。また、広告ベクトルは、広告の特徴を示す複数の属性に対応する特徴量により構成されており、これらは手動で入力されたり、あるいは自動で生成される場合がある。
【0032】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図5のように広告ベクトルを構成する属性は、「スポーツ」「映画」といった対象の分野を表現した属性をとる場合が考えられる。各広告が属性を示す分野に関連する度合を連続値で表現し、属性値とする場合もある。また、各広告が、属性と対応する分野に関連するか否かの2値情報を属性値とする場合もある。
【0033】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図6のように、広告ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。この場合、行列の行と列が両方とも広告となり、その対応関係を示した行列となるため、行列の対角成分が全て「1」で、その他の成分が全て「0」の単位行列となる。
【0034】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図7のように、広告ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。この場合、各広告が、属性である文書を指定した場合に出現するか否かの2値情報を属性値とする場合がある。また、2値情報ではなく、属性である文書を指定した場合に出現する可能性を連続値で表現する場合もある。
【0035】
そして、広告蓄積部31は、広告表示部11より広告IDと共に内容参照要求が渡されると、広告IDに対応する広告の内容を返す。また、広告評価部21より広告IDと共に広告ベクトル参照要求が渡されると、広告IDに対応する広告ベクトルを返す。
【0036】
文書管理部40の文書指定部41は、図3の下部に示すように、Webページの一部分を指定する方法や、一般的なブックマークのように、WebページのURLをユーザに提供する。ここで、ユーザが指定するページの一部や、ページ全体には、テキスト、画像、動画などの情報が組み合わされて表現されている。ユーザが指定した文書は、指定文書蓄積部42に蓄積される。
【0037】
文書管理部40の指定文書蓄積部42は、文書指定部41で指定された文書に対して、少なくともユーザID、文書ID、文書の内容、文書ベクトルを図8に示すように記憶する。文書の内容は、文書指定部41で指定したWebページの一部あるいは全体をHTMLのような記述形式で記録する。また、文書ベクトルは、文書の特徴を示す複数の属性に対応する特徴量により構成されており、これらは手動で入力されたり、あるいは自動で生成される場合もある。
【0038】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図8に示すように、文書ベクトルを構成する属性は、「スポーツ」、「映画」といった対象の分野を表現した属性をとる場合が考えられる。各文書が属性が示す分野に関連する度合を、連続値で表現し、属性値とする場合もある。また、各文書が、属性と対応する分野に関連するか否かを、2値の属性値とする場合もある。
【0039】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図9のように、文書ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。この場合、各文書を指定した場合に、属性である広告が出現するか否かの2値情報を属性値とする場合がある。また、各文書を指定した場合に属性である広告が出現する可能性を連続値で表現する場合もある。
【0040】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図10のように、文書ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。この場合、行列の行と列が両方とも文書となり、その対応関係を示した行列になるため、行列の対角成分が全て「1」で、その他の成分が全て「0」の単位行列となる。
【0041】
また、指定文書蓄積部42は、嗜好ベクトル生成部51よりユーザIDと共に広告ベクトル参照要求が渡されると、ユーザIDに対応する複数の文書ベクトルを返す。
【0042】
嗜好管理部50の嗜好ベクトル生成部51は、認証されたユーザに対応するユーザIDを、指定文書蓄積部42に渡し、当該ユーザIDに対応する複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとし、嗜好ベクトル蓄積部52に記憶する。
【0043】
例えば、ベクトルを構成する属性が、ユーザの興味の対象となる「分野」である場合がある。このとき、図11のように、嗜好ベクトルを構成する属性は、「スポーツ」、「映画」といった対象の分野を表現した属性をとる場合が考えられる。図8に示す各ユーザが指定している文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、選択した文書群の各分野への関連度を統合的に網羅したような嗜好ベクトルが合成される。
【0044】
また、例えば、ベクトルを構成する属性が、各広告である場合もある。このとき、図12に示すように、嗜好ベクトルを構成する属性は、「広告10」、「広告11」といった広告そのものを表現した属性をとる場合が考えられる。図9に示す各ユーザが指定している文書の文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、選択した文書群が対応する広告を網羅した嗜好ベクトルが合成される。
【0045】
さらに、例えば、ベクトルを構成する属性が、各文書である場合もある。このとき、図13のように、嗜好ベクトルを構成する属性は、「文書100」、「文書101」といった文書そのものを表現した属性をとる場合が考えられる。図10に示すユーザが指定している文書の文書ベクトルの属性値の総和を、嗜好ベクトルの属性値として合成する場合がある。この場合、嗜好ベクトルは、どの文書を選択したのかを示す嗜好ベクトルが合成される。
【0046】
また、合成の仕方は、文書ベクトルの各属性の総和だけでなく、平均値をとる場合や、その他の総計量を利用する場合もある。
【0047】
嗜好管理部50の嗜好ベクトル蓄積部52は、嗜好ベクトル生成部51で生成された嗜好ベクトルを、図11のように少なくともユーザID、嗜好ベクトルで構成されるデータとして記録する。また、広告評価部21よりユーザIDが渡されると、ユーザIDに対応する嗜好ベクトルを返す。
【0048】
以下に、上記の構成における動作を説明する。
【0049】
図14は、本発明の第1の実施の形態における個人化広告の提示方法を示すフローチャートである。
【0050】
ステップ101) ユーザIDとパスワードによって管理されるようなユーザ認証システムを用いて、ユーザを認証し、ステップ102に移行する。
【0051】
ステップ102) 広告評価部21が、嗜好ベクトル生成部51で認証されたユーザに対する嗜好ベクトルを生成するように要求する。嗜好ベクトル生成部51は、認証されたユーザのユーザIDを、指定文書蓄積部42に渡し、当該ユーザが指定した文書の文書ID群を取得する。図6の例では、ユーザIDが“1000”のユーザが指定している文書の文書ID“100”、“101”、“102”等を取得し、ステップ103に移行する。
【0052】
ステップ103) 嗜好ベクトル生成部51が、ステップ102にて取得した文書ID群に対応する文書ベクトルを、指定文書蓄積部42から逐次取得する。図8の例では、文書IDが、“100”の場合、この文書に対応する文書ベクトル(0.80,0.50,…)を取得し、ステップ104に移行する。
【0053】
ステップ104) ステップ103の処理を、ステップ102で取得した文書ID群全てに対して取得したら、ステップ105に移行し、そうでない場合には、ステップ103に戻る。
【0054】
ステップ105) 嗜好ベクトル生成部51が取得した、認証されたユーザが指定した文書の文書ベクトル群を合成し、当該ユーザの嗜好ベクトルとし、図11に示すように、嗜好ベクトル蓄積部52に蓄積する。合成の仕方は、文書ベクトルの各属性値の総和を、嗜好ベクトルの各属性値にする場合や、総和以外にも、平均値などの他の統計量を利用する場合もある。その後、ステップ106に移行する。
【0055】
ステップ106) 広告評価部21が広告蓄積部31から蓄積されている広告の広告ID群を取得し、ステップ107に移行する。
【0056】
ステップ107) 広告評価部21が、ステップ106で取得した広告ID群に対応する広告ベクトルを、広告蓄積部31から逐次取得する。図5の例では、広告IDが、“10”の場合、この広告に対応する広告ベクトル(0.40,0.60,…)を取得する。次に、ステップ101で認証されたユーザの嗜好ベクトルを嗜好ベクトル蓄積部52から取得する。図11の例では、ユーザIDが、“1000”の場合、このユーザIDに対応する嗜好ベクトル(1.66,1.59,…)を取得する。この嗜好ベクトルは、ステップ105で生成された値に相当する。さらに現在取得している広告ベクトルと嗜好ベクトルの類似度を求める。類似度の求め方の例としては、広告ベクトルと嗜好ベクトルの、各属性の対応がとれる場合、即ち、両ベクトルの属性1、属性2がそれぞれ同じ特徴、例えば、「分野」、「広告」、「文書」などを表現している場合、両ベクトルの内積を類似度とするような方法が想定される。算出された類似度は、図4のように、認証されたユーザID、評価対象である広告の広告ID、類似度の対を一つのレコードとして、広告評価蓄積部22に記録される。その後、ステップ108に移行する。
【0057】
ステップ108) ステップ107の処理を、ステップ106で取得した広告ID群全てに対して取得したら、ステップ109に移行し、そうでない場合、ステップ107に戻る。
【0058】
ステップ109) 広告表示部11が、認証されたユーザのユーザIDを、広告評価データ蓄積部22に渡し、ユーザの嗜好と広告の類似度を問い合わせ、類似度が高い広告を優先的に提示する。提示の方法は、類似度が高い順番に適当な時間間隔で広告を提示する場合や、広告提示エリアを分割し、類似度が高い広告ほど面積を大きくしたり、目立つ位置に配置することで、優先的に提示する場合もある。広告は、例えば、図3のように認証されたユーザの自分専用のページにおける広告表示エリアに表示される。
【0059】
[第2の実施の形態]
図15は、本発明の第2の実施の形態における個人広告の提示方法に対応するシステム構成を示す。
【0060】
同図に示すシステムは、指定した文書及び広告の特徴を示すベクトルを、自動的に生成可能な構成を示す。
【0061】
同図における特徴テキスト蓄積部32、ベクトル管理部60以外は、前述の図2と同様の構成であるので、同一符号を付し、その説明を省略する。
【0062】
特徴テキスト蓄積部32は、各広告の特徴を示すテキストデータを、少なくとも広告IDと対にして記憶しておく。図16の広告IDが“10”の広告の例では、「NTT、新商品、インターネット、光ファイバ」など、広告の特徴を表現したテキストデータを蓄積しておく。
【0063】
ベクトル管理部60は、テキストベクトル化部61、重要単語抽出部62、属性データ蓄積部63から構成される。
【0064】
テキストベクトル化部61は、特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)、あるいは、指定文書蓄積部42に蓄積されている指定文書の内容(図8)を入力として、これらのテキストをベクトル化し、広告の場合は、広告蓄積部31の広告ベクトル、指定文書の場合は、指定文書蓄積部42の文書ベクトルに記録する。入力として受け取ったテキストを、重要単語抽出部62に渡し、重要単語を受け取る。受け取った重要単語に対応する属性IDを属性データ蓄積部63から取得する。広告の場合は、広告蓄積部31の広告ベクトルの取得した属性IDに対応する値、また、指定文書の場合は、指定文書蓄積部42の文書ベクトルの取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図17、図18)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。これにより、当該重要単語が、当該広告の特徴テキスト、あるいは、当該指定文書に存在することを表現する。
【0065】
重要単語抽出部62は、テキストベクトル化部61から渡されるテキストから重要なテキストを抽出し、返す。重要単語の抽出方法は、入力されたテキストを形態素解析し、すべての自立語を抽出する方法や、入力されたテキストが文章である場合には、文脈上、強調されていると判断された単語を抽出する方法などがある。また、入力されたテキストがHTMLのような構造化文書の場合、強調された書式で表現された単語や、リンクが張られている単語を抽出する方法などがある。
【0066】
属性データ蓄積部63は、図19に示すように、重要単語に対応する属性とその属性IDを蓄積している。テキストベクトル化部61から重要単語を受け取ると、その重要単語に対応する属性を検索し、対応する属性IDを返す。また、入力された重要単語に対応する属性が存在しない場合、新たに属性IDを新規作成し、その属性IDを返す。
【0067】
次に、上記の構成における動作を説明する。
【0068】
図20は、本発明の第2の実施の形態における個人化広告の提示方法のフローチャートである。
【0069】
同図において、ステップ201からステップ211以外は、前述の第1の実施の形態と同様であるため、その説明を省略する。また、ステップ201からステップ205までの処理は、前述のステップ101からステップ109までのフローを実行する前に、事前に処理するフローを示している。
【0070】
ステップ201) 広告評価部21が、広告蓄積部31から、蓄積されている広告の広告ID群を取得し、ステップ202に移行する。
【0071】
ステップ202) 特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)を、重要単語抽出部62に渡し、重要単語を受け取り、ステップ203に移行する。
【0072】
ステップ203) テキストベクトル化部61では、重要単語抽出部62から受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。
【0073】
ステップ204) 広告蓄積部31の広告ベクトルのステップ203で取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図17)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用してもよい。
【0074】
ステップ205) ステップ204の処理を、ステップ202で取得した全重要単語に対して処理した場合はステップ206へ移行し、そうでない場合は、ステップ203に戻る。
【0075】
ステップ206) ステップ205までの処理を、ステップ201で取得した全広告に対して処理した場合は処理を終了し、そうでない場合は、ステップ202に戻る。
【0076】
ステップ207) 指定文書蓄積部42に蓄積されている指定文書の内容(図8)を、重要単語抽出部62に渡し、重要単語を受け取り、ステップ208に移行する。
【0077】
ステップ208) テキストベクトル化部61は、重要単語抽出部62から受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。
ステップ209) 指定文書蓄積部42の文書ベクトルのステップ208で取得した属性IDに対応する値に、当該重要単語が存在することを示す2値情報を記録する(図18)。また、ここで属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。
【0078】
ステップ210) ステップ209の処理を、ステップ207で取得した全重要単語に対して処理した場合はステップ211に移行し、そうでない場合には、ステップ208へ戻る。
【0079】
ステップ211) ステップ210までの処理を、ステップ102で取得した全指定文書に対して処理した場合はステップ105に移行し、そうでない場合にはステップ207に戻る。
【0080】
[第3の実施の形態]
図21は、本発明の第3の実施の形態における個人化広告の提示方法に対応するシステム構成を示す。
【0081】
同図に示すシステムは、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示可能な構成を示す。
【0082】
同図において、指定文書収集部43、文書履歴蓄積部44、テキストベクトル化部63’、嗜好ベクトル生成部51’、嗜好履歴蓄積部53、上昇度計算部54以外は、前述の第2の実施の形態と同様であるため、同一符号を付し、その説明を省略する。
【0083】
指定文書収集部43は、文書蓄積部42に記録されている認証されたユーザが指定した文書群を、ある一定の時間間隔、例えば、1時間おきに収集し、文書履歴蓄積部44の指定文書の内容に、ユーザID、文書ID、収集時刻と共に記録する。また、指定文書の内容をテキストベクトル化部61’に渡し、ベクトル化した値を、文書履歴蓄積部44の文書ベクトルの項目に記録する。
【0084】
テキストベクトル化部61’は、特徴テキスト蓄積部32に蓄積されている各広告の特徴を表現したテキスト(図16)、あるいは、指定文書蓄積部42に蓄積されている指定文書の内容(図8)を入力として、これらのテキストをベクトル化し、広告の場合は、広告蓄積部31の広告ベクトル、指定文書の場合は、文書履歴蓄積部44の文書ベクトルに記録する。入力として受け取ったテキストを重要単語抽出部62に渡し、重要単語を受け取る。受け取った重要単語に対応する属性IDを、属性データ蓄積部63から取得する。広告の場合は、広告蓄積部31の広告ベクトルの取得した属性IDに対応する値に、当該重要単語の存在を示す2値情報を記録する(図17)。また、ここで、属性値に重要単語が存在するかしないかの2値情報だけでなく、重要単語の出現頻度などの値を利用しても構わない。また、指定文書の場合は、図22に示すように、文書履歴蓄積部44の文書ベクトルの取得した属性IDに対応する値に、当該単語の出現頻度を記録する。これにより、当該重要単語が、指定文書にどれだけ多く存在するかを表現する。また、文書ベクトルの属性値は、当該重要単語の存在を示す2値情報を記録しても構わない。
【0085】
文書履歴蓄積部44は、指定文書収集部43で収集された文書を、少なくとも、ユーザID、文書ID、収集時刻、指定文書の内容、文書ベクトルの項目で記録しておく。
【0086】
嗜好ベクトル生成部51’は、認証されたユーザに対応するユーザID、収集時刻を、文書履歴蓄積部42に渡し、当該ユーザIDに対応する当該収集時刻における複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとして、嗜好履歴蓄積部53に記録する。ベクトルの合成方法は、第1の実施の形態に準ずる。
【0087】
嗜好履歴蓄積部53は、図23に示すように、少なくと、ユーザID、収集時刻、嗜好ベクトルを記録する。
【0088】
上昇度計算部54は、認証されたユーザIDに対応する、複数の収集時刻に対応する嗜好ベクトルを取得し、これらから、ベクトルを構成する属性値の、最近の上昇度を計算し、嗜好ベクトル蓄積部52の嗜好ベクトルの各属性値に、各属性値の上昇度を記録する。上昇度の計算方法は、現在時刻から過去一定期間に、当該属性に対応する属性値の上昇率を用いる方法等が考えられる。また、各属性値の時系列による変動曲線の現在時刻における傾きを用いる場合などもある。
【0089】
図24は、本発明の第3の実施の形態における個人化広告の提示方法のフローチャートである。このフローチャートは、ステップ301からステップ305、ステップ105’以外は、前述の第2の実施の形態と同様であるのでその説明を省略する。また、ステップ301からステップ305は、定期的に実行される処理である。
【0090】
ステップ301) 指定文書収集部43が、時刻を監視し、ある一定の時間間隔が経過したかを判定する。時間が経過したらステップ302へ移行し、そうでない場合は、再帰的にステップ301に戻る。
【0091】
ステップ302) 指定文書収集部43が、文書蓄積部42に記録されている任意のユーザが指定した文書群を収集し、文書履歴蓄積部44の指定文書の内容に、ユーザID、文書ID、収集時刻と共に記録し、ステップ303に移行する。
【0092】
ステップ303) 指定文書収集部43が、指定文書の内容をテキストベクトル化部61’に渡し、ベクトル化した値を、文書履歴蓄積部44(図22)の文書履歴ベクトルの項目に記録し、ステップ304に移行する。
【0093】
ステップ304) 嗜好ベクトル生成部51’が、処理対象のユーザに対応するユーザID、収集時刻を、文書履歴蓄積部42に渡し、当該ユーザIDに対応する当該収集時刻における複数の文書ベクトルを受け取ると、それらのベクトルを合成したベクトルを、当該ユーザの嗜好ベクトルとし、嗜好履歴蓄積部53(図23)に記録し、ステップ305に移行する。
【0094】
ステップ305) ステップ302からステップ304までの処理を、全ユーザに対して処理した場合は、ステップ301に戻り、そうでない場合には、ステップ302に戻る。
【0095】
ステップ105’) 上昇度計算部54が、認証されたユーザIDに対応する、複数の収集時刻に対応する嗜好ベクトルを取得し、これらから、ベクトルを構成する属性の値の、最近の上昇度を計算し、嗜好ベクトル蓄積部52の嗜好ベクトルの各属性値に、各属性の上昇度を代入する。
【0096】
上記の第1の実施の形態における図14、第2の実施の形態における図20、及び第3の実施の形態における図24に示すフローチャートの動作をプログラムとして構築し、提示装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることも可能である。
【0097】
また、構築されたプログラムを提示装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。
【0098】
なお、本発明は、上記の実施の形態の例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【0099】
【発明の効果】
上述のように、本発明によれば、個人が指定した文書から、よりきめ細かく、暗黙的な要求に対応した個人の嗜好情報を生成でき、当該嗜好情報に関連度が高い広告を、優先的に提示することができる。
【0100】
また、本発明では、指定した文書、及び広告の特徴を示すベクトルを自動的に生成できる。
【0101】
さらに、本発明では、ユーザの嗜好を反映したトピックスで、なおかつ、最近、特に話題になっているトピックスに関連した広告を優先的に提示することができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の第1の実施の形態における個人化広告の提示方法に対応するシステム構成図である。
【図3】本発明の第1の実施の形態における表示例である。
【図4】本発明の第1の実施の形態における広告評価データ蓄積部の記憶例である。
【図5】本発明の第1の実施の形態における広告蓄積部の記憶例(その1)である。
【図6】本発明の第1の実施の形態における広告蓄積部の記憶例(その2)である。
【図7】本発明の第1の実施の形態における広告蓄積部の記憶例(その3)である。
【図8】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その1)である。
【図9】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その2)である。
【図10】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その3)である。
【図11】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その1)である。
【図12】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その2)である。
【図13】本発明の第1の実施の形態における指定文書蓄積部の記憶例(その3)である。
【図14】本発明の第1の実施の形態における個人化広告の提示方法を示すフローチャートである。
【図15】本発明の第2の実施の形態における個人広告の提示方法に対応するシステム構成図である。
【図16】本発明の第2の実施の形態における特徴テキストの記憶例である。
【図17】本発明の第2の実施の形態における広告文書蓄積部の記憶例である。
【図18】本発明の第2の実施の形態における指定文書蓄積部の記憶例である。
【図19】本発明の第2の実施の形態における属性データ蓄積部の記憶例である。
【図20】本発明の第2の実施の形態における個人化広告の提示方法のフローチャートである。
【図21】本発明の第3の実施の形態における個人化広告の提示方法に対応するシステム構成図である。
【図22】本発明の第3の実施の形態における文書履歴蓄積部の記憶例である。
【図23】本発明の第3の実施の形態における嗜好履歴蓄積部の記憶例である。
【図24】本発明の第3の実施の形態における個人化広告の提示方法のフローチャートである。
【符号の説明】
10 表示部
11 広告表示部
12 指定文書表示部
20 広告表示制御部
21 広告評価部
22 広告評価データ蓄積部
30 広告管理部
31 広告蓄積部
32 特徴テキスト蓄積部
40 文書管理部
41 文書指定部
42 指定文書蓄積部
43 指定文書収集部
44 文書履歴蓄積部
50 嗜好管理部
51,51’ 嗜好ベクトル生成部
52 嗜好ベクトル蓄積部
53 嗜好履歴蓄積部
54 上昇度計算部
60 ベクトル管理部
61 重要単語抽出部
62 属性データ蓄積部
63,63’ テキストベクトル化部
[0001]
BACKGROUND OF THE INVENTION
  The present invention provides personalized advertisement provision information andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumIn particular, in order to present a personalized advertisement in a system for registering a document specified by a user by scraping a part of a page of a structured document such as HTML or bookmarking the entire page. Information provided by personalized advertisements andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumAbout.
[0002]
[Prior art]
Conventional banner advertisements that are prevalent on Internnet provide advertisements by providing advertisement frames on pages related to arbitrary topics and recruiting advertisers. It is common for advertisers to associate user groups that are assumed from the topics of the page and invest in advertising space when their products match target users (for example, Non-Patent Document 1). reference).
[0003]
However, the recent Internet advertising market has continued to be sluggish, and although there are advertisements, there are problems that no one sees. For this, even if an advertisement that does not match the user's preference is issued or the preference matches, the degree of the match may be low.
[0004]
In addition, banner advertisements in search engines include a method for presenting advertisements related to search keywords. For example, when a search is performed using the keyword “NTT”, an advertisement such as “search for a book related to“ NTT ”on this site” is presented on the search result page. This method is an attempt to improve the degree of matching between the user's preference and the content of the advertisement (see, for example, Non-Patent Document 2).
[0005]
[Non-Patent Document 1]
Kishi Koji, Sakamoto Kei, Sakamoto Yasuhisa (1998), “Study on the Influence of User Behavior on Internet Advertising Effects”, Information Processing Society of Japan Research Report, HI-77-1, pp1-6.
[Non-Patent Document 2]
http://www.goo.ne.jp/help/info/ad/result.html.
[0006]
[Problems to be solved by the invention]
However, as described above, a general banner advertisement on the Internet associates the user layer with the topic of the page, and can only acquire the user's preference indirectly.
[0007]
Further, the advertisement related to the input keyword in the search engine is suitable when the user's request can be explicitly expressed by the keyword. However, the user's request includes an ambiguous case in which information desired by the user cannot be expressed explicitly, and a method for presenting an advertisement in consideration of such an implicit request is required.
[0008]
  The present invention has been made in view of the above points, and by extracting a part of a page such as a Web page or bookmarking the entire page, personal preference information is extracted from a document designated by the user. Focused on making it an information source. There is a large amount of information on the Web, and it is possible to acquire preference information in a very fine unit because scraps and bookmarks are of interest. In addition, it is difficult to express the user's request explicitly in words when scrapping or bookmarking, and it is possible to reflect the implicit user's interest by using the information of the scrapped or bookmarked document Based on the information specified by the user, it is possible to derive a personal profile that reflects a more detailed and implicit request and to preferentially present advertisements that match this profile. Possible personalized advertising information andPersonalized advertisement providing apparatus, program, and computer-readable recording mediumThe purpose is to provide.
[0009]
[Means for Solving the Problems]
FIG. 1 is a diagram for explaining the principle of the present invention.
[0010]
  The present invention(Claim 1)IsThe computer is caused to function as a device having a designated document collecting unit, a text vectorizing unit, a preference vector generating unit, a rise degree calculating unit, an advertisement evaluation unit, and an advertisement display unit.How to provide personalized advertisingBecause
  The designated document collection meansThe document specified by the userProcess of regular collection (step 1);
  Text vectorization meansDescribed as a vector with multiple attribute values indicating document characteristicsStoring a document vector as a document vector in the document history storage means (step 2);
  The preference vector generation meansSpecify from userHas beenDocumentsDocument at the time of collectionA vector composed of vectorsAt the time of collectionThe user'sA process (step 3) of recording in the preference history storage means as a preference vector;
  At the time when the user browses the information, the degree-of-rise calculating means calculates the degree of increase of each attribute value of the preference vector immediately before the user browses the information, and the vector has the attribute value as the degree of increase of each attribute value. A process of recording the preference vector in the preference vector storage means (step 4),
  A vector based on a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage unit and a plurality of attribute values indicating features of advertisements that are presentation candidates recorded in the advertisement storage unit AndThe process of calculating similarity(Step 5)When,
  In the advertisement display means, the advertisement storage means described in the advertisement storage means,Give priority to ads with high similaritydisplayProcess(Step 6)When,I do.
[0011]
  In addition, the present invention(Claim 2)Is when there is text in the document specified by the user, or there is text that expresses the characteristics of the ad,
  Extracting important words in the text in the specified document or in the text representing the characteristics of the advertisement;
  Making the extracted word an attribute of a vector indicating the characteristics of the specified document or advertisement;
  A process in which binary information indicating the presence of an extracted word or a vector having an appearance frequency as an attribute value is used as a designated document or advertisement feature vector;,I do.
[0012]
  The present invention(Claim 3)IsA personalized advertisement providing device that provides a document specified by a user,
  A designated document collection means for periodically collecting documents designated by the user;
  A text vectorization unit that describes a plurality of attribute values indicating the characteristics of the document collected by the designated document collection unit, and stores the document vector as a document vector in the document history storage unit;
  A preference vector generation unit that records a vector obtained by synthesizing a document vector at the time of collection of a document group designated by a user as a preference vector of the user at the time of collection in a preference history storage unit;
  The degree of increase of each attribute value of the preference vector immediately before the user browses information is calculated, and the vector having the attribute value as the degree of increase of each attribute value is used as the preference vector at the time when the user browses the information. Ascending degree calculation means for recording in the vector storage means;
  Similarity between a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage means, and a vector based on a plurality of attribute values indicating the characteristics of advertisements that are presentation candidates recorded in the advertisement storage means An advertising rating means to calculate,
  An advertisement display means for preferentially displaying an advertisement with a high similarity described in the advertisement storage means;
Have
[0013]
  Bookinvention(Claim 4)IsIf there is text in the document specified by the user, or if there is text that expresses the characteristics of the advertisement,
  A means of extracting important words in the text in the specified document or in the text representing the characteristics of the advertisement;
  Means for making the extracted word an attribute of a vector indicating the characteristics of the designated document or advertisement;
  A binary information indicating the presence of the extracted word and a vector having an appearance frequency as an attribute value as a designated document or an advertisement feature vector;
Have
[0014]
  Bookinvention(Claim 5)IsA program that causes a computer to function as each unit of the personalized advertisement providing device according to claim 3 or 4.
[0015]
  The present invention(Claim 6)IsA computer-readable recording medium storing the program according to claim 5.
[0017]
As described above, in the present invention, personal preference information corresponding to an implicit request can be generated more precisely from a document specified by the user, and an advertisement having a high degree of relevance of the preference information is preferentially presented. It becomes possible to do.
[0018]
Further, according to the present invention, it is possible to automatically generate a document designated by the user and a vector indicating the feature of the advertisement.
[0019]
Furthermore, according to the present invention, it is possible to preferentially present an advertisement related to a topic that reflects the user's preference and that has recently become a hot topic.
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0020]
[First Embodiment]
FIG. 2 shows a system configuration corresponding to the personalized advertisement presentation method according to the first embodiment of the present invention.
[0021]
The system shown in the figure is capable of generating personal preference information corresponding to an implicit request more precisely from a document specified by the user, and giving priority to an advertisement that is highly relevant to the preference information. A possible configuration is shown.
[0022]
The system shown in the figure includes a display unit 10, an advertisement display control unit 20, an advertisement management unit 30, a document management unit 40, and a preference management unit 50.
[0023]
The display unit 10 includes an advertisement display unit 11 and a designated document display unit 12.
[0024]
The advertisement display control unit 20 includes an advertisement evaluation unit 21 and an advertisement evaluation data storage unit 22.
[0025]
The advertisement management unit 30 includes an advertisement storage unit 31.
[0026]
The document management unit 40 includes a document fixing unit 41 and a designated document storage unit 42.
The preference management unit 50 includes a preference vector generation unit 51 and a preference vector storage unit 52.
[0027]
The advertisement display unit 11 of the display unit 10 passes the user ID of the authenticated user to the advertisement evaluation data storage unit 22, inquires about the user's preference and the similarity of the advertisement, and sends an advertisement with a high similarity to the advertisement storage unit 31. Inquiry, give priority. The presentation method can be used when presenting advertisements at appropriate time intervals in the order of high similarity, or by dividing the advertisement presentation area and increasing the area for higher-similarity advertisements or placing them in prominent positions. In some cases, it is given priority. The advertisement is displayed, for example, in an advertisement display area on a page dedicated to the authenticated user as shown in FIG.
[0028]
The designated document display unit 12 of the display unit 10 refers to the designated document storage unit 42 and displays a document designated in advance by the authenticated user as shown in FIG.
[0029]
The advertisement evaluation unit 21 of the advertisement display control unit 20 requests the preference vector generation unit 51 to generate an authenticated user preference vector. The generated preference vector is acquired from the preference vector storage unit 52, the similarity with each advertisement vector stored in the advertisement storage unit 31 is calculated, and at least the user ID of the authenticated user as shown in FIG. The similarity between the advertisement ID and the advertisement preference is recorded in the advertisement evaluation data storage unit 22.
[0030]
The advertisement evaluation data storage unit 22 of the advertisement display control unit 20 determines the similarity of each advertisement vector calculated by the advertisement evaluation unit 21 with at least the user ID, advertisement ID and advertisement of the authenticated user as shown in FIG. Record the preference similarity. When the user ID is passed from the advertisement display unit 11, the advertisement ID corresponding to the user ID and the similarity are returned.
[0031]
The advertisement storage unit 31 of the advertisement management unit 30 records at least an advertisement ID, an advertisement content, and an advertisement vector as shown in FIG. The contents of the advertisement are described in a description language such as HTML like a banner advertisement of a general Web page. The advertisement vector is composed of feature amounts corresponding to a plurality of attributes indicating the features of the advertisement, and these may be input manually or generated automatically.
[0032]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 5, the attribute constituting the advertisement vector may be an attribute representing the target field such as “sport” or “movie”. The degree to which each advertisement relates to the field indicating the attribute may be expressed as a continuous value and used as an attribute value. In addition, binary information indicating whether each advertisement is related to a field corresponding to the attribute may be used as the attribute value.
[0033]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 6, the attribute constituting the advertisement vector may be an attribute representing the advertisement itself such as “advertisement 10” and “advertisement 11”. In this case, since both the rows and columns of the matrix are advertisements and become a matrix indicating the correspondence relationship, the diagonal components of the matrix are all “1” and the other components are all “0”. .
[0034]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 7, the attribute constituting the advertisement vector may be an attribute representing the document itself such as “document 100” and “document 101”. In this case, there is a case where binary information indicating whether or not each advertisement appears when a document that is an attribute is designated is used as an attribute value. In addition, the possibility of appearing when a document that is an attribute is specified instead of binary information may be expressed as a continuous value.
[0035]
Then, when the content reference request is passed together with the advertisement ID from the advertisement display unit 11, the advertisement storage unit 31 returns the content of the advertisement corresponding to the advertisement ID. When an advertisement vector reference request is passed together with the advertisement ID from the advertisement evaluation unit 21, an advertisement vector corresponding to the advertisement ID is returned.
[0036]
As shown in the lower part of FIG. 3, the document specification unit 41 of the document management unit 40 provides the user with the URL of the Web page, such as a method for specifying a part of the Web page or a general bookmark. Here, a part of the page specified by the user or the entire page is expressed by combining information such as text, images, and moving images. The document specified by the user is stored in the specified document storage unit 42.
[0037]
The designated document storage unit 42 of the document management unit 40 stores at least a user ID, a document ID, a document content, and a document vector for the document designated by the document designation unit 41 as shown in FIG. As the contents of the document, a part or the whole of the Web page specified by the document specifying unit 41 is recorded in a description format such as HTML. The document vector is composed of feature amounts corresponding to a plurality of attributes indicating the features of the document, and these may be input manually or generated automatically.
[0038]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 8, the attribute constituting the document vector may be an attribute representing the target field such as “sports” or “movie”. The degree to which each document relates to the field indicated by the attribute may be expressed as a continuous value and used as an attribute value. In addition, there is a case where a binary attribute value indicates whether each document is related to a field corresponding to the attribute.
[0039]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 9, the attribute constituting the document vector may be an attribute representing the advertisement itself such as “advertisement 10” and “advertisement 11”. In this case, when each document is designated, binary information indicating whether or not an attribute advertisement appears may be used as the attribute value. In addition, when each document is designated, the possibility that an advertisement as an attribute appears may be expressed as a continuous value.
[0040]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 10, the attribute constituting the document vector may be an attribute representing the document itself such as “document 100” and “document 101”. In this case, both the rows and columns of the matrix are documents, and the corresponding matrix is shown as a matrix, so that the diagonal components of the matrix are all “1” and the other components are all “0”. .
[0041]
In addition, when the advertisement vector reference request is delivered together with the user ID from the preference vector generation unit 51, the designated document storage unit 42 returns a plurality of document vectors corresponding to the user ID.
[0042]
When the preference vector generation unit 51 of the preference management unit 50 passes the user ID corresponding to the authenticated user to the designated document storage unit 42 and receives a plurality of document vectors corresponding to the user ID, the preference vector generation unit 51 synthesizes the vectors. This vector is stored in the preference vector storage unit 52 as the user's preference vector.
[0043]
For example, the attribute constituting the vector may be a “field” that is the target of the user's interest. At this time, as shown in FIG. 11, the attribute constituting the preference vector may be an attribute representing the target field such as “sports” or “movie”. The sum of the attribute values of the document vector designated by each user shown in FIG. 8 may be combined as the attribute value of the preference vector. In this case, the preference vector is synthesized such that the degree of association of the selected document group with each field is comprehensively covered.
[0044]
Further, for example, there are cases where the attributes constituting the vector are each advertisement. At this time, as shown in FIG. 12, the attribute constituting the preference vector may be an attribute representing the advertisement itself such as “advertisement 10” and “advertisement 11”. In some cases, the sum of the attribute values of the document vector of the document designated by each user shown in FIG. 9 is combined as the attribute value of the preference vector. In this case, as the preference vector, a preference vector covering the advertisement corresponding to the selected document group is synthesized.
[0045]
Furthermore, for example, the attribute constituting the vector may be each document. At this time, as shown in FIG. 13, the attribute constituting the preference vector may be an attribute representing the document itself such as “document 100” and “document 101”. The sum of the attribute values of the document vector of the document specified by the user shown in FIG. 10 may be synthesized as the attribute value of the preference vector. In this case, a preference vector indicating which document is selected is synthesized as the preference vector.
[0046]
Further, as a method of synthesis, not only the sum of each attribute of the document vector but also an average value or other total metric may be used.
[0047]
The preference vector accumulation unit 52 of the preference management unit 50 records the preference vector generated by the preference vector generation unit 51 as data including at least a user ID and a preference vector as shown in FIG. When the user ID is passed from the advertisement evaluation unit 21, a preference vector corresponding to the user ID is returned.
[0048]
The operation in the above configuration will be described below.
[0049]
FIG. 14 is a flowchart showing a personalized advertisement presentation method according to the first embodiment of the present invention.
[0050]
Step 101) A user is authenticated using a user authentication system managed by a user ID and a password, and the process proceeds to Step 102.
[0051]
Step 102) The advertisement evaluation unit 21 requests to generate a preference vector for the user authenticated by the preference vector generation unit 51. The preference vector generation unit 51 passes the user ID of the authenticated user to the designated document storage unit 42, and acquires the document ID group of the document designated by the user. In the example of FIG. 6, the document IDs “100”, “101”, “102”, and the like of the document designated by the user with the user ID “1000” are acquired, and the process proceeds to step 103.
[0052]
Step 103) The preference vector generation unit 51 sequentially acquires the document vector corresponding to the document ID group acquired in Step 102 from the designated document storage unit 42. In the example of FIG. 8, when the document ID is “100”, a document vector (0.80, 0.50,...) Corresponding to this document is acquired, and the process proceeds to step 104.
[0053]
Step 104) If the processing in Step 103 is acquired for all the document ID groups acquired in Step 102, the process proceeds to Step 105. If not, the process returns to Step 103.
[0054]
Step 105) The document vector group of the document designated by the authenticated user acquired by the preference vector generation unit 51 is synthesized and used as the preference vector of the user, and is stored in the preference vector storage unit 52 as shown in FIG. . As a synthesis method, the sum of the attribute values of the document vector may be changed to the attribute values of the preference vector, or other statistics such as an average value may be used in addition to the sum. Thereafter, the process proceeds to step 106.
[0055]
Step 106) The advertisement evaluation unit 21 acquires the advertisement ID group accumulated from the advertisement accumulation unit 31, and proceeds to Step 107.
[0056]
Step 107) The advertisement evaluation unit 21 sequentially acquires the advertisement vector corresponding to the advertisement ID group acquired in Step 106 from the advertisement storage unit 31. In the example of FIG. 5, when the advertisement ID is “10”, advertisement vectors (0.40, 0.60,...) Corresponding to this advertisement are acquired. Next, the preference vector of the user authenticated in step 101 is acquired from the preference vector storage unit 52. In the example of FIG. 11, when the user ID is “1000”, preference vectors (1.66, 1.59,...) Corresponding to this user ID are acquired. This preference vector corresponds to the value generated in step 105. Further, the similarity between the currently acquired advertisement vector and the preference vector is obtained. As an example of how to obtain the similarity, when the correspondence between each attribute of the advertisement vector and the preference vector can be taken, that is, the attribute 1 and attribute 2 of both vectors have the same characteristics, for example, “field”, “advertisement”, When “document” or the like is expressed, a method is assumed in which the inner product of both vectors is used as the similarity. As shown in FIG. 4, the calculated similarity is recorded in the advertisement evaluation storage unit 22 as a record of a pair of the authenticated user ID, the advertisement ID of the advertisement to be evaluated, and the similarity. Thereafter, the process proceeds to step 108.
[0057]
Step 108) If the processing of Step 107 is acquired for all the advertisement ID groups acquired in Step 106, the process proceeds to Step 109. If not, the process returns to Step 107.
[0058]
Step 109) The advertisement display unit 11 passes the authenticated user ID of the user to the advertisement evaluation data storage unit 22, inquires about the preference of the user and the similarity of the advertisement, and preferentially presents an advertisement with a high similarity. The presentation method can be used when presenting advertisements at appropriate time intervals in the order of high similarity, or by dividing the advertisement presentation area and increasing the area for higher-similarity advertisements or placing them in prominent positions. In some cases, it is given priority. The advertisement is displayed, for example, in an advertisement display area on a page dedicated to the authenticated user as shown in FIG.
[0059]
[Second Embodiment]
FIG. 15 shows a system configuration corresponding to the personal advertisement presentation method in the second embodiment of the present invention.
[0060]
The system shown in the figure shows a configuration that can automatically generate a vector indicating the characteristics of a designated document and advertisement.
[0061]
Except for the feature text storage unit 32 and the vector management unit 60 in the figure, the configuration is the same as in FIG. 2 described above.
[0062]
The feature text storage unit 32 stores text data indicating the feature of each advertisement at least in pairs with the advertisement ID. In the example of the advertisement whose advertisement ID is “10” in FIG. 16, text data representing the characteristics of the advertisement, such as “NTT, new product, Internet, optical fiber”, is stored.
[0063]
The vector management unit 60 includes a text vectorization unit 61, an important word extraction unit 62, and an attribute data storage unit 63.
[0064]
The text vectorization unit 61 is a text expressing the feature of each advertisement stored in the feature text storage unit 32 (FIG. 16) or the contents of the specified document stored in the specified document storage unit 42 (FIG. 8). As an input, these texts are vectorized and recorded in the advertisement vector of the advertisement storage unit 31 in the case of an advertisement and in the document vector of the specified document storage unit 42 in the case of a designated document. The text received as input is passed to the important word extraction unit 62 to receive the important word. The attribute ID corresponding to the received important word is acquired from the attribute data storage unit 63. In the case of an advertisement, the value corresponding to the acquired attribute ID of the advertisement vector of the advertisement storage unit 31, and in the case of a specified document, the value corresponding to the acquired attribute ID of the document vector of the specified document storage unit 42 Binary information indicating that an important word exists is recorded (FIGS. 17 and 18). Here, not only binary information indicating whether or not an important word exists in the attribute value, but also a value such as the appearance frequency of the important word may be used. This expresses that the important word is present in the feature text of the advertisement or in the designated document.
[0065]
The important word extraction unit 62 extracts important text from the text passed from the text vectorization unit 61 and returns it. Important word extraction methods include morphological analysis of input text and extraction of all independent words, or words that are determined to be emphasized in context if the input text is a sentence. There is a method to extract. In addition, when the input text is a structured document such as HTML, there is a method of extracting a word expressed in an emphasized format or a word with a link.
[0066]
As shown in FIG. 19, the attribute data storage unit 63 stores attributes corresponding to important words and their attribute IDs. When an important word is received from the text vectorization unit 61, an attribute corresponding to the important word is searched and a corresponding attribute ID is returned. If there is no attribute corresponding to the input important word, a new attribute ID is newly created and the attribute ID is returned.
[0067]
Next, the operation in the above configuration will be described.
[0068]
FIG. 20 is a flowchart of the personalized advertisement presentation method according to the second embodiment of the present invention.
[0069]
In the figure, since steps other than step 201 to step 211 are the same as those in the first embodiment described above, description thereof will be omitted. Further, the processing from step 201 to step 205 shows a flow to be processed in advance before executing the flow from step 101 to step 109 described above.
[0070]
Step 201) The advertisement evaluation unit 21 acquires the advertisement ID group of the accumulated advertisement from the advertisement accumulation unit 31, and proceeds to Step 202.
[0071]
Step 202) The text (FIG. 16) expressing the feature of each advertisement stored in the feature text storage unit 32 is passed to the important word extraction unit 62, the important word is received, and the process proceeds to Step 203.
[0072]
Step 203) The text vectorization unit 61 acquires the attribute ID corresponding to the important word received from the important word extraction unit 62 from the attribute data storage unit 63.
[0073]
Step 204) Binary information indicating that the important word exists is recorded in the value corresponding to the attribute ID acquired in Step 203 of the advertisement vector of the advertisement storage unit 31 (FIG. 17). Here, not only binary information indicating whether or not an important word exists in the attribute value, but also a value such as the appearance frequency of the important word may be used.
[0074]
Step 205) If the process of step 204 is processed for all the important words acquired in step 202, the process proceeds to step 206. If not, the process returns to step 203.
[0075]
Step 206) If the processing up to step 205 has been processed for all advertisements acquired in step 201, the processing ends. Otherwise, the processing returns to step 202.
[0076]
Step 207) The contents (FIG. 8) of the designated document stored in the designated document storage unit 42 are transferred to the important word extracting unit 62, and the important word is received.
[0077]
Step 208) The text vectorization unit 61 acquires the attribute ID corresponding to the important word received from the important word extraction unit 62 from the attribute data storage unit 63.
Step 209) Binary information indicating that the important word exists is recorded in the value corresponding to the attribute ID acquired in Step 208 of the document vector of the designated document storage unit 42 (FIG. 18). Here, not only binary information indicating whether or not an important word exists in the attribute value, but also a value such as the appearance frequency of the important word may be used.
[0078]
Step 210) If the processing in step 209 has been performed for all the important words acquired in step 207, the process proceeds to step 211. If not, the process returns to step 208.
[0079]
Step 211) If the processing up to Step 210 has been processed for all the specified documents acquired in Step 102, the process proceeds to Step 105. If not, the process returns to Step 207.
[0080]
[Third Embodiment]
FIG. 21 shows a system configuration corresponding to the personalized advertisement presentation method according to the third embodiment of the present invention.
[0081]
The system shown in the figure shows a configuration that can preferentially present an advertisement related to a topic that reflects a user's preference and that has recently become a hot topic.
[0082]
In the figure, except for the designated document collection unit 43, the document history storage unit 44, the text vectorization unit 63 ′, the preference vector generation unit 51 ′, the preference history storage unit 53, and the increase degree calculation unit 54, the second implementation described above. Therefore, the same reference numerals are given and description thereof is omitted.
[0083]
The designated document collection unit 43 collects the document group designated by the authenticated user recorded in the document accumulation unit 42 at a certain time interval, for example, every other hour, and designates the designated document in the document history accumulation unit 44. Is recorded together with the user ID, document ID, and collection time. Further, the contents of the designated document are transferred to the text vectorization unit 61 ′, and the vectorized value is recorded in the document vector item of the document history storage unit 44.
[0084]
The text vectorization unit 61 ′ is a text expressing the characteristics of each advertisement stored in the feature text storage unit 32 (FIG. 16) or the contents of the specified document stored in the specified document storage unit 42 (FIG. 8). ) As an input, and the text is vectorized and recorded in the advertisement vector of the advertisement storage unit 31 in the case of an advertisement and in the document vector of the document history storage unit 44 in the case of a designated document. The text received as an input is passed to the important word extraction unit 62 to receive the important word. The attribute ID corresponding to the received important word is acquired from the attribute data storage unit 63. In the case of an advertisement, binary information indicating the presence of the important word is recorded in a value corresponding to the acquired attribute ID of the advertisement vector in the advertisement storage unit 31 (FIG. 17). Here, not only binary information indicating whether or not an important word exists in the attribute value, but also a value such as the appearance frequency of the important word may be used. In the case of a designated document, as shown in FIG. 22, the appearance frequency of the word is recorded in a value corresponding to the acquired attribute ID of the document vector of the document history storage unit 44. This expresses how many important words are present in the designated document. As the attribute value of the document vector, binary information indicating the presence of the important word may be recorded.
[0085]
The document history storage unit 44 records the documents collected by the designated document collection unit 43 at least in the items of user ID, document ID, collection time, designated document content, and document vector.
[0086]
When the preference vector generation unit 51 ′ passes the user ID and the collection time corresponding to the authenticated user to the document history storage unit 42 and receives a plurality of document vectors at the collection time corresponding to the user ID, A vector obtained by combining the vectors is recorded in the preference history storage unit 53 as the user's preference vector. The vector synthesis method is the same as in the first embodiment.
[0087]
As shown in FIG. 23, the preference history storage unit 53 records at least a user ID, a collection time, and a preference vector.
[0088]
The increase degree calculation unit 54 acquires preference vectors corresponding to a plurality of collection times corresponding to the authenticated user ID, calculates a recent increase degree of attribute values constituting the vector from these, and calculates the preference vector The degree of increase of each attribute value is recorded in each attribute value of the preference vector in the storage unit 52. As a method for calculating the degree of increase, a method using an increase rate of the attribute value corresponding to the attribute for a certain period in the past from the current time can be considered. In some cases, the slope at the current time of the variation curve by the time series of each attribute value is used.
[0089]
FIG. 24 is a flowchart of a personalized advertisement presentation method according to the third embodiment of the present invention. Since this flowchart is the same as the second embodiment described above except for steps 301 to 305 and 105 ', the description thereof will be omitted. Steps 301 to 305 are periodically executed processes.
[0090]
Step 301) The designated document collection unit 43 monitors the time and determines whether or not a certain time interval has elapsed. When the time elapses, the process proceeds to step 302. Otherwise, the process returns to step 301 recursively.
[0091]
Step 302) The designated document collection unit 43 collects a document group designated by an arbitrary user recorded in the document accumulation unit 42, and the user ID, document ID, and collection are included in the contents of the designated document in the document history accumulation unit 44. The time is recorded and the process proceeds to step 303.
[0092]
Step 303) The designated document collection unit 43 passes the contents of the designated document to the text vectorization unit 61 ′ and records the vectorized value in the item of the document history vector of the document history storage unit 44 (FIG. 22). Transition to 304.
[0093]
Step 304) When the preference vector generation unit 51 ′ passes the user ID and collection time corresponding to the user to be processed to the document history storage unit 42, and receives a plurality of document vectors at the collection time corresponding to the user ID. Then, a vector obtained by combining these vectors is set as a preference vector of the user, recorded in the preference history storage unit 53 (FIG. 23), and the process proceeds to step 305.
[0094]
Step 305) If the processing from step 302 to step 304 has been processed for all users, the process returns to step 301. If not, the process returns to step 302.
[0095]
Step 105 ′) The increase degree calculation unit 54 acquires preference vectors corresponding to a plurality of collection times corresponding to the authenticated user ID, and from these, the recent increase degree of the attribute value constituting the vector is obtained. Calculation is performed, and the degree of increase of each attribute is substituted for each attribute value of the preference vector in the preference vector storage unit 52.
[0096]
A computer that constructs the operations of the flowcharts shown in FIG. 14 in the first embodiment, FIG. 20 in the second embodiment, and FIG. 24 in the third embodiment as a program and that is used as a presentation device. It is also possible to install it on the Internet or distribute it via a network.
[0097]
In addition, the constructed program is stored in a hard disk device connected to a computer used as a presentation device, a portable storage medium such as a flexible disk or a CD-ROM, and installed when the present invention is carried out. Thus, the present invention can be easily realized.
[0098]
The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
[0099]
【The invention's effect】
As described above, according to the present invention, personal preference information corresponding to an implicit request can be generated more finely from a document designated by an individual, and an advertisement having a high degree of relevance to the preference information is given priority. Can be presented.
[0100]
Further, according to the present invention, it is possible to automatically generate a vector indicating the characteristics of the designated document and advertisement.
[0101]
Furthermore, according to the present invention, it is possible to preferentially present an advertisement related to a topic that reflects the user's preference and that has recently become a hot topic.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining the principle of the present invention.
FIG. 2 is a system configuration diagram corresponding to a personalized advertisement presentation method according to the first embodiment of the present invention.
FIG. 3 is a display example in the first embodiment of the present invention.
FIG. 4 is a storage example of an advertisement evaluation data storage unit in the first embodiment of the present invention.
FIG. 5 is a storage example (part 1) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 6 is a storage example (part 2) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 7 is a storage example (part 3) of the advertisement accumulation unit according to the first embodiment of the present invention.
FIG. 8 is a storage example (part 1) of the designated document storage unit according to the first embodiment of the present invention;
FIG. 9 is a storage example (part 2) of the designated document storage unit in the first embodiment of the present invention;
FIG. 10 is a storage example (No. 3) of the designated document storage unit in the first embodiment of the present invention;
FIG. 11 is a storage example (part 1) of the designated document storage unit in the first embodiment of the present invention;
FIG. 12 is a storage example (No. 2) of the designated document storage unit in the first embodiment of the present invention;
FIG. 13 is a storage example (part 3) of the designated document storage unit in the first embodiment of the present invention;
FIG. 14 is a flowchart showing a method for presenting a personalized advertisement in the first embodiment of the present invention.
FIG. 15 is a system configuration diagram corresponding to a personal advertisement presentation method according to a second embodiment of the present invention;
FIG. 16 is a storage example of feature text according to the second embodiment of the present invention;
FIG. 17 is a storage example of an advertisement document storage unit according to the second embodiment of the present invention.
FIG. 18 is a storage example of a designated document storage unit in the second embodiment of the present invention;
FIG. 19 is a storage example of an attribute data storage unit in the second embodiment of the present invention;
FIG. 20 is a flowchart of a personalized advertisement presentation method according to the second embodiment of the present invention.
FIG. 21 is a system configuration diagram corresponding to a method for presenting a personalized advertisement in the third embodiment of the present invention.
FIG. 22 is a storage example of a document history accumulation unit according to the third embodiment of the present invention.
FIG. 23 is a storage example of a preference history accumulation unit according to the third embodiment of the present invention.
FIG. 24 is a flowchart of a method for presenting a personalized advertisement in the third embodiment of the present invention.
[Explanation of symbols]
10 Display section
11 Advertising display
12 Specified document display area
20 Advertising display controller
21 Advertising Evaluation Department
22 Advertising evaluation data storage
30 Advertising Management Department
31 Advertising storage
32 Feature text storage
40 Document Management Department
41 Document specification part
42 Designated document storage
43 Designated Document Collection Department
44 Document history storage
50 Preference Management Department
51, 51 'preference vector generator
52 Preference vector storage
53 Preference History Accumulator
54 Ascension calculator
60 Vector Management Department
61 Important word extractor
62 Attribute data storage unit
63, 63 'Text vectorization unit

Claims (6)

コンピュータを、指定文書収集手段、テキストベクトル化手段、嗜好ベクトル生成手段、上昇度計算手段、広告評価手段、広告表示手段を有する装置として機能させる個人化広告の提供方法であって、
前記指定文書収集手段が、ユーザから指定された文書を定期的に収集する過程と、
前記テキストベクトル化手段が、前記文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に前記文書のベクトルを文書ベクトルとして蓄積する過程と、
前記嗜好ベクトル生成手段が、前記ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する過程と、
前記上昇度計算手段が、前記ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、前記ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する過程と、
前記広告評価手段が、前記嗜好ベクトル蓄積手段に記録された前記各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する過程と、
前記広告表示手段において、前記広告蓄積手段に記述された、前記類似度が高い広告を優先的に表示する過程と、
を行うことを特徴とする個人化広告の提供方法。
A personalized advertisement providing method for causing a computer to function as a device having a designated document collection means, a text vectorization means, a preference vector generation means, a rise calculation means, an advertisement evaluation means, and an advertisement display means ,
The designated document collection means periodically collects a document designated by the user ;
The text vectorization means describes a vector with a plurality of attribute values indicating the characteristics of the document, and stores the document vector as a document vector in the document history storage means;
The preference vector generation means records a vector obtained by synthesizing the document vectors at the time of collection of the document group designated by the user as the user's preference vector at the time of collection in the preference history accumulation means;
The increase degree calculation means calculates the increase degree of each attribute value of the preference vector immediately before the user browses the information, and the user views the information with the vector having the increase degree of each attribute value as the attribute value. As a preference vector at the time of doing, the process of recording in the preference vector storage means,
The advertisement evaluation means has a preference vector whose attribute value is the degree of increase of each attribute value recorded in the preference vector storage means, and a plurality of attributes indicating features of advertisements that are presentation candidates recorded in the advertisement storage means A process of calculating the similarity between a vector by value and
In the advertisement display means, a process of preferentially displaying the advertisement with the high similarity described in the advertisement storage means ;
A method for providing a personalized advertisement, characterized by:
前記ユーザから指定された文書にテキストが存在する場合や、前記広告の特徴を表現したテキストが存在する場合に、
前記指定された文書内のテキスト、あるいは、前記広告の特徴を表現したテキスト中の重要な単語を抽出する過程と、
抽出された単語を、前記指定された文書あるいは、前記広告の特徴を示すベクトルの属性とする過程と、
前記抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、前記指定された文書あるいは、広告の特徴ベクトルとする過程と、
を行う請求項1記載の個人化広告の提供方法。
When there is text in the document specified by the user, or when there is text representing the characteristics of the advertisement,
Extracting important words in the text in the designated document or in the text representing the characteristics of the advertisement;
Making the extracted word an attribute of a vector indicating the characteristics of the designated document or the advertisement;
A process in which binary information indicating the presence of the extracted word or a vector having an appearance frequency as an attribute value is used as the specified document or an advertisement feature vector;
The method for providing a personalized advertisement according to claim 1.
ユーザから指定された文書を提供する個人化広告提供装置であって、A personalized advertisement providing device that provides a document specified by a user,
ユーザから指定された文書を定期的に収集する指定文書収集手段と、A designated document collection means for periodically collecting documents designated by the user;
前記指定文書収集手段で収集された前記文書の特徴を示す複数の属性値によるベクトルで記述し、文書履歴蓄積手段に前記文書のベクトルを文書ベクトルとして蓄積するテキストベクトル化手段と、A text vectorization unit that describes a vector with a plurality of attribute values indicating characteristics of the document collected by the designated document collection unit, and stores the document vector as a document vector in a document history storage unit;
前記ユーザから指定されている文書群の収集時点での文書ベクトルを合成したベクトルを、収集時点での該ユーザの嗜好ベクトルとして、嗜好履歴蓄積手段に記録する嗜好ベクトル生成手段と、A preference vector generation unit that records a vector obtained by synthesizing document vectors at the time of collection of a document group designated by the user as a preference vector of the user at the time of collection in a preference history storage unit;
前記ユーザが情報を閲覧する直前の嗜好ベクトルの各属性値の上昇度合を算出し、該各属性値の上昇度合を属性値とするベクトルを、前記ユーザが情報を閲覧する時点での嗜好ベクトルとして、嗜好ベクトル蓄積手段に記録する上昇度計算手段と、The degree of increase of each attribute value of the preference vector immediately before the user browses the information is calculated, and a vector having the attribute value as the degree of increase of each attribute value is used as the preference vector at the time when the user browses the information. , The degree of increase calculation means for recording in the preference vector storage means,
前記嗜好ベクトル蓄積手段に記録された前記各属性値の上昇度合を属性値とする嗜好ベクトルと、広告蓄積手段に記録された提示候補である広告の特徴を示す複数の属性値によるベクトルと、の類似度を計算する広告評価手段と、A preference vector having an attribute value as the degree of increase of each attribute value recorded in the preference vector storage means, and a vector based on a plurality of attribute values indicating the characteristics of the advertisement as a presentation candidate recorded in the advertisement storage means An advertising evaluation means for calculating similarity,
前記広告蓄積手段に記述された、前記類似度が高い広告を優先的に表示する広告表示手段と、An advertisement display means for preferentially displaying the advertisement with a high similarity described in the advertisement storage means;
を有することを特徴とする個人化広告提供装置。A personalized advertisement providing apparatus characterized by comprising:
前記ユーザから指定された文書にテキストが存在する場合や、前記広告の特徴を表現しIf there is text in the document specified by the user, or express the characteristics of the advertisement たテキストが存在する場合に、If there is a text
前記指定された文書内のテキスト、あるいは、前記広告の特徴を表現したテキスト中の重要な単語を抽出する手段と、Means for extracting important words in the text in the designated document or in the text representing the characteristics of the advertisement;
抽出された単語を、前記指定された文書あるいは、前記広告の特徴を示すベクトルの属性とする手段と、Means for making the extracted word an attribute of a vector indicating the characteristics of the designated document or the advertisement;
前記抽出された単語の存在を示す2値情報や、出現頻度を属性値として持つベクトルを、前記指定された文書あるいは、広告の特徴ベクトルとする手段と、A binary information indicating the presence of the extracted word or a vector having an appearance frequency as an attribute value as the specified document or advertisement feature vector;
を有する請求項3記載の個人化広告提供装置。The personalized advertisement providing apparatus according to claim 3.
コンピュータを、請求項3または4の個人化広告提供装置の各手段として機能させることを特徴とするプログラム。A program for causing a computer to function as each means of the personalized advertisement providing apparatus according to claim 3 or 4. 請求項5記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。A computer-readable recording medium storing the program according to claim 5.
JP2002283870A 2002-09-27 2002-09-27 Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium Expired - Fee Related JP4023273B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002283870A JP4023273B2 (en) 2002-09-27 2002-09-27 Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002283870A JP4023273B2 (en) 2002-09-27 2002-09-27 Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium

Publications (2)

Publication Number Publication Date
JP2004118716A JP2004118716A (en) 2004-04-15
JP4023273B2 true JP4023273B2 (en) 2007-12-19

Family

ID=32277615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002283870A Expired - Fee Related JP4023273B2 (en) 2002-09-27 2002-09-27 Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP4023273B2 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
WO2007001247A2 (en) * 2004-06-02 2007-01-04 Yahoo! Inc. Content-management system for user behavior targeting
US8874570B1 (en) 2004-11-30 2014-10-28 Google Inc. Search boost vector based on co-visitation information
US8611856B2 (en) * 2005-10-18 2013-12-17 Google Inc. Identifying spurious requests for information
JP2008052665A (en) * 2006-08-28 2008-03-06 Sony Computer Entertainment Inc Content display device and content display method
US7827170B1 (en) 2007-03-13 2010-11-02 Google Inc. Systems and methods for demoting personalized search results based on personal information
JP5027082B2 (en) * 2008-09-02 2012-09-19 ヤフー株式会社 Action history analysis method, apparatus and program
US8769434B2 (en) * 2010-08-11 2014-07-01 Nike, Inc. Intelligent display of information in a user interface
US20130080208A1 (en) * 2011-09-23 2013-03-28 Fujitsu Limited User-Centric Opinion Analysis for Customer Relationship Management
JP6135845B2 (en) * 2013-02-15 2017-05-31 パペルック株式会社 Digital content system, digital content display method, and digital content display program
JP2015022561A (en) * 2013-07-19 2015-02-02 Necパーソナルコンピュータ株式会社 Terminal device, advertisement distribution system, and program
JP6635587B2 (en) * 2015-12-14 2020-01-29 日本放送協会 Advertising sentence selection device and program

Also Published As

Publication number Publication date
JP2004118716A (en) 2004-04-15

Similar Documents

Publication Publication Date Title
KR100881832B1 (en) Method and system for displaying keyword advertisement using searching optimum randing page
JP4750814B2 (en) Advertising method and system for exposing contextual advertising information
US20080120328A1 (en) Method of Performing a Weight-Based Search
US20120158693A1 (en) Method and system for generating web pages for topics unassociated with a dominant url
US20090177651A1 (en) Information processing device and method, program, and recording medium
US20080183660A1 (en) Content identification expansion
JP4023273B2 (en) Personalized advertisement providing information, personalized advertisement providing apparatus and program, and computer-readable recording medium
JP2007524925A (en) Automatic web-based ad targeting
KR20020007742A (en) Methods of Information Recommendation based on Analysis of User's Information Preferences and Measurement of Information Popularity on the Internet and the System thereof
WO2010098178A1 (en) Information recommendation device, information recommendation method, and information recommendation program
KR101355945B1 (en) On line context aware advertising apparatus and method
CN104462336A (en) Information pushing method and device
US9015172B2 (en) Method and subsystem for searching media content within a content-search service system
JP2007241888A (en) Information processor, processing method, and program
JP4896132B2 (en) Information retrieval method and apparatus reflecting information value
WO2011014564A2 (en) System and method for dynamic targeting advertisement based on content-in-view
JP5511782B2 (en) New advertisement capable URL providing system and new advertisement capable URL providing method
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
JP4883644B2 (en) RECOMMENDATION DEVICE, RECOMMENDATION SYSTEM, RECOMMENDATION DEVICE CONTROL METHOD, AND RECOMMENDATION SYSTEM CONTROL METHOD
KR101140724B1 (en) Method and system of configuring user profile based on a concept network and personalized query expansion system using the same
KR101178208B1 (en) Apparatus and method for extracting keywords
WO2008063615A2 (en) Apparatus for and method of performing a weight-based search
JP4755834B2 (en) Attribute evaluation apparatus, attribute evaluation method, and attribute evaluation program
KR100851042B1 (en) Method for recommending extended advertising keyword and system thereof
KR102052068B1 (en) System and method for recommanding contents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees