JP2011028596A - 広告表示方法 - Google Patents

広告表示方法 Download PDF

Info

Publication number
JP2011028596A
JP2011028596A JP2009174914A JP2009174914A JP2011028596A JP 2011028596 A JP2011028596 A JP 2011028596A JP 2009174914 A JP2009174914 A JP 2009174914A JP 2009174914 A JP2009174914 A JP 2009174914A JP 2011028596 A JP2011028596 A JP 2011028596A
Authority
JP
Japan
Prior art keywords
keyword
advertisement
evaluation value
occurrence
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009174914A
Other languages
English (en)
Inventor
Yohei Shiroguchi
洋平 城口
Kohei Tomita
紘平 富田
Yuji Takahata
裕二 高畠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MILOG CO Ltd
Original Assignee
MILOG CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MILOG CO Ltd filed Critical MILOG CO Ltd
Priority to JP2009174914A priority Critical patent/JP2011028596A/ja
Publication of JP2011028596A publication Critical patent/JP2011028596A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ターゲットに最適にアプローチ可能な広告の表示方法を提供する。
【解決手段】広告に割り当てられたキーワードについての素性のスコアを生成するステップと、前記キーワードに対応する共起語についての素性のスコアを生成するステップと、前記「キーワードについての、素性のスコア」及び前記「共起語についての、素性のスコア」から評価値を生成するステップと、前記評価値を有界化し、補正評価値を生成するステップと、記憶されている全ての前記キーワードについての補正評価値の和をとり合計評価値を生成するステップと、前記補正評価値を前記合計評価値で徐することで、前記キーワードに対応する広告の表示確率を生成するステップと、前記表示確率に基づき広告を表示するステップとを含むことを特徴とする、広告表示方法。
【選択図】なし

Description

本発明は、広告表示方法に関する。
インターネットの普及に伴い、Webにおけるバナー広告の重要性が増大しており、近年では新聞広告やテレビ広告といったマスコミに対する広告(いわゆるマス広告)に匹敵する規模となっている。マス広告に対するWeb広告の特徴として、ターゲットに的確にアプローチできる点があげられる。その理由は、ユーザーの嗜好を分析し、それに適した広告を出し分けることができるからである。従来、広告を出し分ける方法としては、例えば、下記特許文献1では、検索エンジンにおける広告は、ユーザーが検索した言葉と同じキーワードを持つ広告を出すことが行われている(検索連動型広告)。また、ウェブページ上にバナー広告領域を用意し、当該ページに含まれる言葉からキーワードを抽出し、同じキーワードを持つ広告を表示することが行われている(コンテンツマッチ広告)。
特開2008−102174
上記のような、キーワードにマッチするかどうかにおける広告は、広告提供者が定めたキーワードを含む時のみ表示され、たとえターゲットである人が検索をしても、広告提供者が定めたキーワードを含まないワードで検索した場合には、広告が表示されることはない。また、掲示板やミニブログなど、くだけた文章や短い文章が書きこまれるページでは適切なキーワードが入力されることが少なく、キーワードマッチ型の広告では最適な広告を表示することが難しい。さらに、より適切なターゲットに表示するような自動学習の仕組みは存在せず、ターゲットに最適にアプローチできているとは言い難い。
そこで、本発明は、ターゲットに最適にアプローチ可能な広告の表示方法を提供することを目的とする。
本発明の広告表示方法は、
広告に割り当てられたキーワードについての素性のスコアを生成するステップと、
前記キーワードに対応する共起語についての素性のスコアを生成するステップと、
前記「キーワードについての、素性のスコア」及び前記「共起語についての、素性のスコア」から評価値を生成するステップと、
前記評価値を有界化し、補正評価値を生成するステップと、
記憶されている全ての前記キーワードについての補正評価値の和をとり合計評価値を生成するステップと、
前記補正評価値を前記合計評価値で徐することで、前記キーワードに対応する広告の表示確率を生成するステップと、
前記表示確率に基づき広告を表示するステップと
を含むことを特徴とする。
このような構成により、本発明では、入力された文が必ずしも広告に割り当てられたキーワードと一致していなくても、キーワードと共起度の高い共起語が含まれていれば、その広告が表示される確率が高くなる。一方、文の中にキーワードと同一の形態素が含まれていたとしても、キーワードと共起度の低い共起語が多く含まれている場合には、そのキーワードとは関連性の低い文であると判断し、対応する広告の表示確率が低くなる。このようにすることによって、よりターゲットに近いユーザーに広告を表示することができ、またターゲットから遠いユーザーに表示されることが減るため、より効果の高い広告を表示することが可能となる。
本発明によれば、広告主が想定したキーワードを直接含まない文が入力されたとしても、文にそのキーワードと関連性の高い言葉が含まれていれば、その文を入力したユーザーが広告のターゲットである可能性が高いと判断され、広告が表示される確率があがる。例えば「アメリカ」というキーワードを指定していても「米国」と入力された文にその広告が表示される可能性がある。一方、例えば「旅行嫌い」と入力された場合、従来であれば「旅行」というキーワードがあるため旅行案内などの広告が表示されるが、これは全く無駄な広告となってしまう。逆に、「期末試験終わった」と入力された場合、休み期間に入るため旅行案内を表示する意味があるが、「期末試験」という言葉を旅行案内というキーワードとしていることは少ない。そこで、適切な重みを設定し、重みの値をユーザーアクションによって学習していくことにより、ユーザーのアクションすなわち広告クリック率が高いような広告を自動的に優先的に表示させることができるようになる。
本発明の好適な実施形態の一例に係る広告配信システム100の全体構成を表すブロック図である。 広告配信システム100を構成する各サーバーの機能ブロックを示す図である。 各サーバーの処理フローを示す図である。
本発明において、
前記広告に割り当てられたキーワードについてのスコアを生成するステップは、
ユーザー端末から入力された文章を形態素に分類するステップと、
文を入力したユーザーの属性群から任意の属性を取得するステップと、
広告にキーワードを割り当てるステップと、
前記形態素又は前記属性と前記キーワードをペアとし、素性とするステップと、
前記素性と同一コードを持つ「重み」の値を取得するステップと、
すべての組み合わせによって生成された前記素性に対応する前記重みの値を合計するステップと
により、「キーワードについての、素性のスコア」を生成する、という形態であってもよい。
このような構成によれば、ある一つのキーワードと入力された文の形態素一つ一つのペアについての素性が列挙され、対応するスコアが生成される。このようにすることによって、形態素とキーワードの関連性の強さが数値として評価できるようになる。
本発明において、
前記キーワードに対応する共起語についての素性のスコアを生成するステップは、
ユーザー端末から入力された文章を形態素に分類するステップと、
文を入力したユーザーの属性群から任意の属性を取得するステップと、
広告にキーワードを割り当てるステップと、
記憶された共起語群から任意の共起語を取得するステップと、
前記形態素又は前記属性と前記共起語をペアとし、素性とするステップと、
前記素性と同一コードを持つ「重み」の値を取得するステップと、
すべての組み合わせによって生成された前記素性に対応する前記重みの値を合計するステップ、
により、「共起語についての、素性のスコア」を生成する、という形態であってもよい。
このような構成によれば、前記形態と同様に、ある一つの共起語と入力された文の形態素一つ一つのペアについての素性が列挙され、対応するスコアが生成される。
このようにすることによって、形態素と共起語の関連性の強さが数値として評価できるようになる。
本発明において、
前記キーワードと、前記共起語との間の共起度を生成するステップは
下記数式(1)により求められる値を前記共起度としても良い。
Figure 2011028596
(1)

前記数式(1)において、Xは前記キーワードであり、Yは前記共起語である。
このような構成によれば、任意の検索エンジンにおいて、X及びYの両方の単語で検索したときにヒットする件数を、Xの単語で検索したときにヒットする件数とYの単語で検索したときにヒットする件数の少ないほうで割ったときに出てくる値を共起度とすることができる。
なお、前記数式(1)により求められる値はシンプソン係数とよばれるが、ヒットする件数が少ない場合共起度が高く出てしまうというシンプソン係数の欠点を補うために、閾値を設けるなどの構成を追加することもできる。
こうすることによって、前記キーワードと前記共起語との相関関係の強さが数値によって評価される。
本発明において、
前記「前記「キーワードについての、素性のスコア」及び前記「共起語についての、素性のスコア」から評価値を生成するステップ」は
前記共起語それぞれについて、前記「共起語についての、素性のスコア」にその共起語についての素性パラメーターの積をとるステップと
前記「キーワードについての、素性のスコア」と、それぞれの前記共起語についての前記積の総和をとり、評価値とするステップ
により評価値を生成しても良い。また、この場合において、前記素性パラメーターを、前記共起語についての前記共起度としても良い。
このような構成によれば、前記キーワードと形態素の関係に加え、前記キーワードに相関関係がある前記共起語との関係も、その関係性の強さを表す前記共起度をかけることによって、適切な強さで加味することができる。
こうすることによって、入力された文が、ある広告に対してどの程度関係があるのかを評価することができる。
本発明において、
前記「前記評価値を有界化し、補正評価値を生成するステップ」は、
前記評価値をe、前記補正評価値をfとして、ロジスティクス関数式(下記数式(2))を適用することにより求められる値を前記補正評価値としても良い。
Figure 2011028596
(2)
こうすることによって、ばらつきのある評価値を有界化でき、より適切な前記広告表示確率を算出することができる。
本発明において、
前記「前記表示確率に基づき広告を表示するステップ」の後に、表示された広告がクリックされた場合に学習し、前記重みを更新しても良い。
こうすることによって、重みを自動的に更新することができ、より適切な前記広告表示確率を算出することができる。
本発明は、
前記「ユーザー端末から入力された文章を形態素に分類するステップ」において、生成された形態素と共起語群を比較した上で、共起語群に含まれていない形態素があった場合には、当該形態素を共起語群に追加しても良い。
こうすることによって、自動的に共起語群に含まれる共起語を増やすことができ、より正確な評価値を生成することが可能となる。
以下、本発明の実施形態についてさらに具体的に説明する。但し、これらはあくまでも例示であって、本発明の技術的範囲はこれらに限定されるものではない。
本発明の広告表示方法は、例えば、下記の全体処理フローにしたがって行うことができる。

[全体処理フロー]
ユーザー過去発言の形態素解析 (ステップSB1)

共起度生成(ステップSB2)

ユーザー属性を分類器により評価(ステップSB3)

評価値の補正(ステップSB4)

表示確率の算出(ステップSB5)

広告の表示(ステップSB6)

ユーザーが広告をクリック(ステップSB7)→no → → ↓
↓yes
ユーザー属性、過去発言を分類器で学習(ステップSB8) ↓
↓ ← ← ←
end
以下、前記全体処理フローについて説明する。すなわち、まず、ユーザー過去発言の形態素解析を行う(ステップSB1)。解析された形態素及び、広告に与えられたキーワードから、共起語及び共起度を生成する(ステップSB2)。次に、ユーザーから新たな発言があったとき、発言を形態素解析し、ユーザー属性、共起度、キーワードを用いて、分類器により発言を評価し評価値を生成する(ステップSB3)。生成された評価値は、確率を算出するために有界化を行い、補正評価値を生成する(ステップSB4)。生成された補正評価値をすべてのキーワードについて合計し、一つのキーワードについての補正評価値を割ることで表示確率を算出する(ステップSB5)。それぞれのキーワードについての表示確率に基づき、表示する広告を選択し、画面に表示する(ステップSB6)。表示後、ユーザーが広告をクリックしなければ、この後の学習は行わない(ステップSB7のN)。広告をクリックしたとき(ステップSB7のY)、クリックされた広告を正例とし、それ以外の広告を負例として分類器で学習する(ステップSB8)。
[システム全体の概要]
次に、本発明の広告表示方法を実施するためのシステムの例について、図面を参照しながら説明する。
図1は、前記システムの好適な実施形態の一例に係る広告配信システム100の全体構成を表すブロック図である。図示の通り、前記広告配信システム100は、インターネット90を介してユーザーの入力端末101及び検索エンジン102及び広告入力端末103と接続される。ユーザーの入力端末101、広告入力端末103は、携帯電話であってもPDAであっても、PCであっても、これ以外のインターネットに接続される端末であってもよい。また検索エンジン102は公知のものを用いてよい。図示の通り、広告配信システム100は、広告サーバー10、属性サーバー20、形態素サーバー30、共起サーバー40、素性サーバー50、評価値サーバー60、広告選択サーバー70、学習サーバー80の各サーバーがネットワーク91に接続されて構成されている。ネットワーク91は、典型的には構内ネットワーク(LAN)または広域ネットワーク(WAN)であるが、インターネットであっても、専用回線による遠隔の通信網であってもよい。この広告配信システムの例は、上記の7つのサーバーで構成されているが、サーバーの物理的な構成はこれに限定されるものではない。
広告サーバー10は、広告出稿者から受け取った広告及び広告に割り当てられるキーワードを関連づけて広告データベース10dに保存する。キーワードは、リクエストがあった時に後述する共起サーバー40又は後述する素性サーバー50に送信される。またリクエストがあった時に後述する広告選択サーバー70にキーワード及び広告データを送信する。
属性サーバー20は、ユーザーが新たに登録されたときに、ユーザーが入力した属性情報(例えば、年齢、在住都道府県、職業など)を属性データベース20dに記憶する。後述する素性サーバー50からリクエストがあったときは、属性データベース20dから属性データを送信する。
形態素サーバー30は、入力端末101から入力された文を形態素に分解し、入力を行ったユーザーと関連付けた形で形態素データベース30dに記憶する。生成された形態素は、後述する共起サーバー40及び後述する素性サーバー50に送信される。
共起サーバー40は、共起語データベース40d及び共起度データベース41dを有する。形態素サーバー30から形態素データを受信したとき、広告サーバー10からキーワードを要求し、共起語及び共起度を生成しデータベースに記憶する。共起度の生成には、インターネット90で接続された検索エンジン102を用いる。共起語は、リクエストがあった時に後述する素性サーバー50に送信される。共起度は、リクエストがあった時に後述する評価値サーバー60に送信される。
素性サーバー50は、素性を添え字とする重みを記憶している重みデータベース50d及び素性データベース51dを有する。形態素サーバー30から形態素を受信したとき、広告サーバー10にキーワードを要求し、共起サーバー40から共起語を要求し素性を作成し素性データベース51dに記憶する。その素性と同一の添え字を持つ重みを重みデータベース50dから抽出する。また、同時に属性サーバー20及び形態素サーバー30から素性を作成し素性データベース51dに記憶する。その素性と同一の添え字を持つ重みを重みデータベース50dから抽出する。抽出された重みは、後述する評価値サーバー60に送信される。また、後述する学習サーバー80から重みを受信した場合には重みデータベース50dを更新する。
評価値サーバー60は、素性サーバー50から重みを受信する。受信したとき共起サーバー40から共起度を要求し、共起度及び重みから評価値を生成する。さらに、評価値を有界化し、補正評価値を生成する。生成された補正評価値は評価値データベース60dに記憶され、要求があるとき後述する広告選択サーバー70に送信される。
広告選択サーバー70は乱数ジェネレーター70gを有する。広告選択サーバー70は、評価値サーバー60から送信された補正評価値から、それぞれのキーワードについて表示確率を生成する。乱数に基づき選択されたキーワードに対応する広告を広告サーバー10に要求する。
学習サーバー80は。広告のクリックを検出し、それに基づき新たな重みを生成し、生成した重みを素性サーバー50に送信する。
以上、本システムのサーバー群とデータベース群の概略を示したが、これらの各サーバーとそれぞれのデータベースの組み合わせは一義的に固定されるものではなく、本広告配信システム100においては、どのサーバーにどのデータベースを備えるかは柔軟に構成されてよい。
[各サーバーの機能ブロック・処理フロー]
図2は、広告配信システム100を構成する各サーバーの機能ブロックを示す図である。図示の通り、広告サーバー10は、広告主から新たな広告データ及びキーワードを受け付ける、キーワード受付部11及び広告データ受付部12を備える。また、要求があったときに共起サーバー40及び共起サーバー50に必要なキーワードを送信するキーワード送信部13、要求があったときに広告選択サーバー70に必要な広告データを送信する広告データ送信部14を備える。
属性サーバー20は、新規ユーザーがユーザー登録をしたときや、既存のユーザー属性を更新したときにユーザー属性を受け付ける属性受付部21、要求があったときに必要な属性データを素性サーバー50に送信する属性送信部22を備える。
形態素サーバー30は、ユーザーが入力した文を受け付ける文章受付部31、受けた文章を形態素解析する形態素解析部32、共起サーバー40及び素性サーバー50に形態素データを送信する形態素送信部33を備える。
共起サーバー40は、形態素サーバー30から形態素を受信する形態素取得部41、受信した形態素と共起語データベース40dとの内容を照合し、受信した形態素のうち共起語データベース40dに含まれないものをデータベースに追加する共起語照合部42、新たな共起語が追加されたときや、広告データベース10dに新たなキーワードが追加されたときにキーワードを受信するキーワード受信部43、キーワードを受信したとき、まだ作られていない共起度を生成する共起度生成部44、要求があったとき素性サーバー50に共起語を送信し、要求があったとき評価値サーバー60に共起度を送信する共起送信部45を備える。
素性サーバー50は、形態素サーバー30から形態素を、広告サーバー10からキーワードを、共起サーバー40から共起語を、属性サーバー20から属性を受信する要素受信部51、受信した各要素から素性を生成する素性生成部52、重みデータベース50dから生成された素性に対応する重みを選択する重み選択部53、選択された重みを送信する重み送信部54、学習サーバー80から重みを受信する重み受信部55を備える。
評価値サーバー60は、素性サーバー50から送信される重みを受信する重み受信部61、共起サーバー40から共起度を受信する共起受信部62、受信した重み及び共起度から評価値を生成する評価値生成部63、評価値を補正評価値に補正する補正評価値生成部64、補正評価値を広告選択サーバー70に送信する補正評価値送信部65を備える。
広告選択サーバー70は、評価値サーバー60から補正評価値を受信する補正評価値受信部71、補正評価値から各キーワードの表示確率を生成する表示確率生成部72、生成された表示確率及び乱数からキーワードを選択する広告選択部73、キーワード及び選択されたキーワードに係る広告を広告サーバー10から受信する広告データ受信部74を備える。また、0から1までの乱数を生成する乱数ジェネレーター70gを備える。
学習サーバー80はクリック検出部81、素性受信部82、重み生成部83を備える。クリック検出部81によって広告のクリックを検出し、このとき素性受信部82で素性サーバー50から素性を受信する。その後重み生成部83で新たな重みを生成し、生成した重みを素性サーバー50に送信する。
以上、サーバー各部の機能ブロックの概略を示したが、このような各部の構成は単に一例であり、サーバー間で様々なバリエーションが存在し得ることは言うまでもない。
図3は、各サーバーの処理フローを示す図である。図示の通り、まず、広告主から広告の出稿があったとき、広告入力端末103から広告データr1及びキーワードp1が入力されると、広告サーバー10に送信される(ステップSA1)。広告サーバーは、広告データ及びキーワードを受信したときはこれらを関連付けた状態で広告データベース10dに記憶する(ステップSA2)。例えば、広告データ及びキーワードに共通IDを与える方法をとる。このとき、キーワードを他サーバーに送信するときは同時にIDを送信してもよい。また、新たに入力されたキーワードp1を共起サーバー40に送信する(ステップSA3)。キーワードを受信した共起サーバー40は、検索エンジン102を使い、共起語データベース40dに記憶されているすべての共起語との間に共起度を生成する(ステップSA4)。詳しい生成方法は後述する。生成された共起度は、共起度サーバー41dに記憶される。
ユーザー入力端末101から入力された文a1は、形態素サーバー30に送信される(ステップS1)。形態素サーバー30は、文a1を受信したとき形態素解析を行い、解析された形態素を形態素データベースに記憶する(ステップS2)。
上記ステップS2は、例えば次のように構成される。まず、ユーザー入力端末101から文a1を取得する。取得した文a1に対し、形態素解析ツールMeCab[工藤ら, 2004]を適用し形態素の集合a1−Tを取得する。形態素解析の集合a1−Tから形態素a1−t1を取得する。形態素a1−t1の品詞が名詞、動詞、形容詞である場合、ユーザー名と関連付けたかたちで形態素データベース30dに、形態素解析の集合Uとして記憶する。これを集合a1−Tに属するすべての形態素について行う。なおMeCabを使用する代わりに、この処理の代替として形態素解析ツールJUMAN[Kurohashiら, 1994]、Chasen[松本, 2000]、その他公知技術を使用してもよい。
次に、集合a1−Tに属する形態素を共起サーバー40に送信する(ステップS3)。共起サーバー40で受信したとき、集合a1−Tに属する形態素のうち共起語データベース40dに記憶されている共起語に含まれないものがあるかを検索する(ステップS4)。共起語データベースに40dに記憶されていない形態素が存在した場合、検索エンジン102を使い、ステップSA3で送信されたキーワードすべてと当該形態素との間に共起度を生成する(ステップ5)。当該形態素は共起語として共起語サーバー40dに記憶され、生成された共起度は、共起度サーバー41dに記憶される(ステップS6)。なお、集合a1−Tに属する形態素がすべて共起語に含まれていれば、ステップS5及びステップS6は省略される。また、共起語をあらかじめ決めたもののみにしたい場合にはステップS3、ステップS4、ステップS5及びステップS6を省略してもよい。
ステップSA4及びステップS5は、次のように構成される。共起語データベース40dから共起語jを取得する。キーワードp1と共起語jのシンプソン係数を計算し、共起度kとする。共起度kが共起度閾値s以上である場合、共起度データベース41dに、共起度連想配列Kに共起語jを添え字として、共起度kを格納する。以上の操作を、ステップSA4では追加されたキーワードとすべての共起語との間で、ステップS5では追加された形態素とすべてのキーワードとの間で行うなお、シンプソン係数の代わりに、共起頻度、ダイス係数、相互情報量、コサイン類似度、Jaccard係数、Overlap係数、その他公知の方法を用いても良い。
また、ステップS2の後、集合a1−Tに属する形態素を素性サーバー50に送信する(ステップS7)。形態素を受信した素性サーバー50は、共起サーバー40に共起度連想配列Kを要求する(ステップS8)。また、広告サーバー10にすべてのキーワードを要求する(ステップS9)。さらに、属性サーバー20に、文を入力したユーザーの属性データを要求する(ステップS10)。素性サーバー50は、形態素、属性、広告名、共起語から素性連想配列Qを作成する(ステップS11)。
ステップS11は次のように構成される。まず素性連想配列Qに形態素の集合a1−Tに含まれる形態素a1−t1及びキーワードp1のペアを添え字として素性パラメーターbに1を代入し素性データベース51dに保存する(ステップS11−1)。ステップS11−1を形態素の集合a1−Tの要素全てに対し適用する(ステップS11−2)。次に、素性連想配列Qに、ユーザー属性の集合Zに含まれるユーザー属性z1及びキーワードp1のペアを添え字として素性パラメーターbに1を代入し素性データベース51dに保存する(ステップS11−3)。ステップS11−3をユーザー属性の集合Zの要素全てに対し適用する(ステップS11−4)。
また、キーワードp1についての共起度連想配列Kの添え字の集合から、共起語j1−p1を取得し、これを添え字とする共起度k1−p1を共起度連想配列Kから取得し、素性連想配列Qに形態素a1−t1及び共起語j1−p1のペアを添え字として素性パラメーターbに共起度k1−p1を代入し保存する(ステップS11−5)。ステップS11−5を、形態素の集合a1−Tの要素全てに対し適用する(ステップS11−6)。次に、素性連想配列Qに、ユーザー属性の集合Zに含まれるユーザー属性z1及び共起語j1−p1のペアを添え字として素性パラメーターbに共起度k1−p1を代入し保存する(ステップS11−7)。ステップS11−7をユーザー属性の集合Zの要素全てに対し適用する(ステップS11−8)。最後に、ステップS11−5からステップS11−8を共起度連想配列Kの添え字集合の要素すべてに対して行う(ステップS11−9)。
評価値サーバー60は、素性サーバー50から素性連想配列Qを取得する。(ステップS12)。素性連想配列Qの添え字集合から素性q1を取得し、素性連想配列Qから素性q1を添え字とする素性パラメーターb−q1を取得し、重みデータベース50dに記憶された重みcから素性q1と同一のコードを持つ重みc−q1を取得する。得られた素性パラメーターb−q1と重みc−q1の積をとり、この乗算を受信した素性連想配列Qすべてについて行い、その総和Pを過去発言の集合の評価値e1とする(ステップS13)。評価値連想配列に、キーワードp1を添え字として評価値e1を評価値データベース60dに保存する(ステップS14)。ステップS12からステップS14をキーワード群Pに属するすべてのキーワードについて行う。
評価値連想配列を保存した後、補正評価値w1を生成する。評価値e1にロジスティクス関数(前記数式(2))を適用し、出た値を補正評価値w1とし、補正評価値連想配列Vにp1を添え字として評価値データベースに記憶する。(ステップS15)ステップ15を、キーワード群Pに属するすべてのキーワードについて行う。
Figure 2011028596
(2)
ページが更新されるなど、広告配信の要求があったとき、広告選択サーバー70は、広告サーバー10にキーワードp1を要求する(ステップS16)。また、評価値サーバー60に記憶された補正評価値連想配列から、取得したキーワードp1と同一コードを持つ補正評価値w1を要求する(ステップS17)。ステップS16及びステップS17を、キーワード群Pに属するすべてのキーワードについて行い、得られた補正評価値を合計し合計補正評価値Wを生成する(ステップS18)。
次に表示確率を算出する。ステップS17で取得したキーワードp1についての補正評価値w1を、合計補正評価値Wで割り、広告表示確率h1を算出し、キーワードp1を添字として広告表示確率h1を広告表示確率連想配列Mに保存する(ステップS19)。なお、表示確率を高めたい広告があるような場合や、不均衡を是正するために広告表示確率h1に定数をかけるなどの補正を行ってもよい。
次に、表示される広告を選択する。乱数ジェネレーター70gから0以上1以下の乱数nを取得する。(ステップS20)次にステップS16で取得したキーワードp1と同一コードをもつ広告表示確率h1を広告表示確率連想配列Mから取得し、qとh1を用いて下記数式(3)を適用する。
Figure 2011028596
(3)

qの値が負であればキーワードp1を表示用キーワードp’とする(ステップS21)。表示用キーワードp’が定まるまで、ステップS21を繰り返す。
最後に、表示用キーワードp’に対応する広告データr’を広告サーバー10に要求する。(ステップS22)
表示された広告がクリックされたとき、クリックされた広告にかかる素性連想配列Qを取得する。(ステップS23)これを正例としてConfidence-Weighted Linear Classification [M Dredze,2008]を適用し、重みを更新するとともに、これ以外を負例としてConfidence-Weighted Linear Classification [M Dredze,2008]を適用し、重みを更新する(ステップS24)。更新された重みを素性サーバー50に送信する。(ステップS25)なお、Confidence-Weighted Linear Classificationの代わりにベイズ推定, ロジスティック回帰, Support Vector Machine[Joachims, 1995], Perceptron [Rosenbaltt, 1958], Averaged, Perceptron [M. Collins, 1998], Passive Aggressive [K. Crammer, 2006]を利用してもよい。
なお、各サーバーのハードウェア構成は、特に制限されず、適宜構成することができる。
以上、本発明の実施形態について説明したが、前述の通り、本発明はこれらの実施形態に限定されるものではない。また、前記実施形態に記載された効果は、本発明から生じる好適な効果を列挙したに過ぎず、前記実施形態に記載された効果によって本発明が限定されるものではない。
10 広告サーバー
10d 広告データベース
11 キーワード受付部
12 広告データ受付部
13 キーワード配信部
14 広告データ配信部
20 属性サーバー
20d 属性データベース
21 属性受付部
22 属性送信部
30 形態素サーバー
30d 形態素データベース
31 文章受付部
32 形態素解析部
33 形態素送信部
40 共起サーバー
40d 共起語データベース
41d 共起度データベース
41 形態素取得部
42 共起語照合部
43 キーワード受信部
44 共起度生成部
45 共起送信部
50 素性サーバー
50d 重みデータベース
51d 素性データベース
51 素性生成部
52 重み選択部
53 重み送信部
60 評価値サーバー
60d 評価値データベース
61 重み受信部
62 共起受信部
63 評価値生成部
64 補正評価値生成部
65 補正評価値送信部
70 広告選択サーバー
70g 乱数ジェネレーター
71 補正評価値受信部
72 表示確率生成部
73 広告選択部
74 広告データ受信部
a1 文
a1−T a1に含まれる形態素の集合
a1−t1 a1に含まれる形態素のひとつ
U 形態素解析の集合
j1 共起語
j1−p1 キーワードp1についての共起語
k 共起度
K 共起度連想配列
s 共起度閾値
R 広告データ群
r1 広告データ
r’ 表示用広告データ
P キーワード群
p1 キーワード一つ
p’ 表示用キーワード
Z ユーザー属性の集合
z1 ユーザー属性のひとつ
Q 素性連想配列
Q1 キーワード素性連想配列
Q2 属性素性連想配列
q1 素性
V 補正評価値連想配列
w 合計補正評価値
w1 補正評価値
e1 評価値
h1 広告表示確率
M 広告表示確率連想配列
n 乱数
b 素性パラメーター
b−q1 q1についての素性パラメーター
c 重み
c−q1 q1についての重み

Claims (9)

  1. 広告に割り当てられたキーワードについての素性のスコアを生成するステップと、
    前記キーワードに対応する共起語についての素性のスコアを生成するステップと、
    前記キーワードと、前記共起語との間の共起度を生成するステップと、
    前記「キーワードについての、素性のスコア」及び前記「共起語についての、素性のスコア」から評価値を生成するステップと、
    前記評価値を有界化し、補正評価値を生成するステップと、
    記憶されている全ての前記キーワードについての補正評価値の和をとり合計評価値を生成するステップと、
    前記補正評価値を前記合計評価値で徐することで、前記キーワードに対応する広告の表示確率を生成するステップと、
    前記表示確率に基づき広告を表示するステップと
    を含むことを特徴とする、広告表示方法。
  2. 前記広告に割り当てられたキーワードについてのスコアを生成するステップは、
    ユーザー端末から入力された文章を形態素に分類するステップと、
    文を入力したユーザーの属性群から任意の属性を取得するステップと、
    広告にキーワードを割り当てるステップと、
    前記形態素又は前記属性と前記キーワードをペアとし、素性とするステップと、
    前記素性と同一コードを持つ「重み」の値を取得するステップと、
    すべての組み合わせによって生成された前記素性に対応する前記重みの値を合計するステップと
    により、「キーワードについての、素性のスコア」を生成する、請求項1記載の広告表示方法。
  3. 前記キーワードに対応する共起語についての素性のスコアを生成するステップは、
    ユーザー端末から入力された文章を形態素に分類するステップと、
    文を入力したユーザーの属性群から任意の属性を取得するステップと、
    広告にキーワードを割り当てるステップと、
    記憶された共起語群から任意の共起語を取得するステップと、
    前記形態素又は前記属性と前記共起語をペアとし、素性とするステップと、
    前記素性と同一コードを持つ「重み」の値を取得するステップと、
    すべての組み合わせによって生成された前記素性に対応する前記重みの値を合計するステップ、
    により、「共起語についての、素性のスコア」を生成する、請求項1または2記載の広告表示方法。
  4. 前記キーワードと、前記共起語との間の共起度を生成するステップは、下記数式(1)により求められる値を前記共起度とする、請求項1から3のいずれか一項に記載の広告表示方法。
    Figure 2011028596
    (1)

    前記数式(1)中、Xは前記キーワードであり、Yは前記共起語である。
  5. 前記「前記「キーワードについての、素性のスコア」及び前記「共起語についての、素性のスコア」から評価値を生成するステップ」は
    前記共起語それぞれについて、前記「共起語についての、素性のスコア」にその共起語についての素性パラメーターの積をとるステップと
    前記「キーワードについての、素性のスコア」と、それぞれの前記共起語についての前記積の総和をとり、評価値とするステップ
    により評価値を生成する、請求項1から4のいずれか一項に記載の広告表示方法。
  6. 前記素性パラメーターは、前記共起語についての前記共起度である、請求項5記載の広告表示方法。
  7. 前記「前記評価値を有界化し、補正評価値を生成するステップ」は
    前記評価値をe、前記補正評価値をfとしてロジスティクス関数式(下記数式(2))を適用することにより求められる値を前記補正評価値とする、請求項1から6のいずれか一項に記載の広告表示方法。
    Figure 2011028596
    (2)
  8. 前記「前記表示確率に基づき広告を表示するステップ」の後に、表示された広告がクリックされた場合に学習し、前記重みを更新する、請求項1から7のいずれか一項に記載の広告表示方法。
  9. 前記「ユーザー端末から入力された文章を形態素に分類するステップ」において、生成された形態素と共起語群を比較した上で、共起語群に含まれていない形態素があった場合には、当該形態素を共起語群に追加する、請求項3から8のいずれか一項に記載の広告表示方法。
JP2009174914A 2009-07-28 2009-07-28 広告表示方法 Withdrawn JP2011028596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009174914A JP2011028596A (ja) 2009-07-28 2009-07-28 広告表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009174914A JP2011028596A (ja) 2009-07-28 2009-07-28 広告表示方法

Publications (1)

Publication Number Publication Date
JP2011028596A true JP2011028596A (ja) 2011-02-10

Family

ID=43637249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009174914A Withdrawn JP2011028596A (ja) 2009-07-28 2009-07-28 広告表示方法

Country Status (1)

Country Link
JP (1) JP2011028596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018536937A (ja) * 2016-01-04 2018-12-13 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018536937A (ja) * 2016-01-04 2018-12-13 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体

Similar Documents

Publication Publication Date Title
US10270791B1 (en) Search entity transition matrix and applications of the transition matrix
US8306962B1 (en) Generating targeted paid search campaigns
US9390144B2 (en) Objective and subjective ranking of comments
WO2016086724A1 (zh) 一种确定候评项的质量信息的方法与装置
JP6462112B2 (ja) オンライン・ソーシャル・ネットワーク上での外部コンテンツのランク付け
US8996550B2 (en) Autocompletion for partially entered query
US8463830B2 (en) Keyword-based content suggestions
US20100250335A1 (en) System and method using text features for click prediction of sponsored search advertisements
US20150379018A1 (en) Computer-generated sentiment-based knowledge base
TW200842632A (en) Related search queries for a webpage and their applications
KR20120091035A (ko) 쿼리 제안들로서 사용자 입력에 관련된 답변 상자들을 선택 및 제시하기 위한 프레임워크
CN106204156A (zh) 一种用于网络论坛的广告投放方法及装置
KR100970335B1 (ko) 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템
US20080065620A1 (en) Recommending advertising key phrases
CN101501630A (zh) 基于相关性对搜索结果列表中的电子文件进行排名和排序的方法
US20110238491A1 (en) Suggesting keyword expansions for advertisement selection
KR20120139715A (ko) 인터넷 검색 결과들 및 광고 컨텐츠의 배포
CN106095766A (zh) 使用选择性重新讲话来校正话音识别
WO2011111038A2 (en) Method and system of providing completion suggestion to a partial linguistic element
JP2014203442A (ja) レコメンド情報生成装置及びレコメンド情報生成方法
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP2001076001A (ja) イベント情報提供方法
KR102368043B1 (ko) 사용자 정의 토픽 모델링을 활용한 사용자 관심 뉴스 추천 장치 및 그 방법
US20110276391A1 (en) Expansion of term sets for use in advertisement selection
JP2011028596A (ja) 広告表示方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20121002