JP4755834B2 - 属性評価装置、属性評価方法および属性評価プログラム - Google Patents

属性評価装置、属性評価方法および属性評価プログラム Download PDF

Info

Publication number
JP4755834B2
JP4755834B2 JP2005014263A JP2005014263A JP4755834B2 JP 4755834 B2 JP4755834 B2 JP 4755834B2 JP 2005014263 A JP2005014263 A JP 2005014263A JP 2005014263 A JP2005014263 A JP 2005014263A JP 4755834 B2 JP4755834 B2 JP 4755834B2
Authority
JP
Japan
Prior art keywords
content
attribute
information
vector
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005014263A
Other languages
English (en)
Other versions
JP2006202118A5 (ja
JP2006202118A (ja
Inventor
ブロディ ジュリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2005014263A priority Critical patent/JP4755834B2/ja
Publication of JP2006202118A publication Critical patent/JP2006202118A/ja
Publication of JP2006202118A5 publication Critical patent/JP2006202118A5/ja
Application granted granted Critical
Publication of JP4755834B2 publication Critical patent/JP4755834B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価装置、属性評価方法および属性評価プログラムに関し、特に、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる属性評価装置、属性評価方法および属性評価プログラムに関する。
従来、インターネットなどのインタラクティブなメディアにおいて、ユーザによりアクセスされるコンテンツの属性を評価することがおこなわれている。コンテンツの属性とは、コンテンツの内容により分類されたコンテンツのカテゴリーなどである。
コンテンツの属性の評価は、インターネットで公開されているコンテンツにインターネット広告を配信する場合などに特に重要となる。すなわち、コンテンツの属性が「スポーツ」である場合には、「スポーツ」に関連したインターネット広告を配信すると効果的であるため、精度よく客観的に属性を判定することが必要とされている。
コンテンツの属性の評価方法には、コンテンツの内容を人がひとつひとつ閲覧し、コンテンツの内容からコンテンツの属性を判定するものがある(たとえば、非特許文献1を参照)。そして、コンテンツが複数の属性を有すると考えられる場合には、複数の属性をコンテンツに割り当てる。
たとえば、コンテンツの内容が「スポーツニュース」に関するものである場合には、そのコンテンツは「スポーツ」という属性と「ニュース」という属性との両方を有すると判定され、当該コンテンツに両方の属性を割り当てる。
ただし、この方法では、人が主観的にコンテンツの属性を評価しているため、コンテンツの属性を正確、客観的かつ効率的に評価することが難しいという問題がある。
たとえば、コンテンツの内容が「スポーツニュース」である場合には、コンテンツの属性が「スポーツ」という属性と「ニュース」という属性との両方であると評価する例を挙げたが、人によっては「ニュース」という属性だけに限定したり、あるいは、「メディア」という属性をさらに付与したりすることもありうる。
このように、人が主観的にコンテンツの属性を評価する場合に、評価が一定しないため、評価された属性をインターネット広告の配信などに用いることが難しかった。
そのため、コンテンツに含まれるテキストからテキストマイニングにより抽出されたキーワードや、語句の出現頻度、フォントサイズ、ウェブサイトのリンク構造などの要因を考慮してコンテンツの属性を客観的に評価し、属性に関連するインターネット広告を当該コンテンツを掲載しているウェブサイトに配信する方法も開発されている(たとえば、非特許文献2を参照。)。
ヤフー株式会社、"カテゴリ検索"、[online]、[平成17年1月5日検索]、インターネット<URL: http://howto.yahoo.co.jp/chapters/8/1.html> グーグル株式会社、"AdSense"、[online]、[平成17年1月18日検索]、インターネット<URL: https://www.google.com/adsense/premium-overview?hl=ja>
しかしながら、上述した特許文献2に代表される従来技術では、コンテンツの属性を柔軟に決定することが難しいという問題があった。すなわち、コンテンツの属性の分類は、言語や文化の変遷とともに変化していくものであるが、コンテンツから抽出したキーワードなどにより属性を決定する方法では、その変化に対応することが難しいという問題があった。
たとえば、インターネット広告の配信を依頼する広告主には、「スポーツ」や「ニュース」などのように直接的に表現された属性だけでなく、「ぬくもりのある」や「シャープな」、「ほのぼのとした」、「あたたかみのある」など、生活シーンに応じた感覚的に表現された属性にコンテンツを分類し、それに関連する広告を配信したいというニーズが近年生まれてきている。
このような場合に、コンテンツに含まれるテキストからキーワードを抽出したりするだけでは、広告主が望む上述したような属性にコンテンツを分類することが容易ではなく、コンテンツの属性評価を柔軟かつ動的におこなうことが難しいという問題があった。
そのため、コンテンツの属性をいかに柔軟に、効率的に、正確に、また、動的に評価することができるかが、インターネット広告の広告効果を高めるために非常に重要な課題となってきている。
本発明は、上述した従来技術による問題点を解消するためになされたものであり、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる属性評価装置、属性評価方法および属性評価プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価装置であって、コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群を複数種類記憶した記憶手段と、ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得手段と、前記記憶手段に記憶された複数種類のデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得手段により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索手段と、前記検索手段により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成手段と、前記生成手段により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記取得手段は、ウェブサーバにより提供され、かつインターネット広告の配信候補となるコンテンツに係る情報として、前記属性を評価するコンテンツに対してハイパーリンクまたはトラックバックにより関連付けられている第2のコンテンツに係る情報を取得し、前記生成手段は、前記第2のコンテンツに係る属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記第2のコンテンツに係る情報の位置の情報を表すベクトルを生成し、前記属性評価手段は、前記生成手段により生成された前記ベクトルに基づいて前記第2のコンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記取得手段により取得される前記コンテンツに係る情報は、ユーザによって入力され、検索エンジンによって当該コンテンツの検索に用いられた検索語であることを特徴とする。
また、本発明は、上記発明において、前記取得手段により取得される前記コンテンツに係る情報は、当該コンテンツに対してハイパーリンクが設定され、ユーザによりクリックされた語であることを特徴とする。
また、本発明は、上記発明において、前記コンテンツは、テキストと画像のメタデータとを含むことを特徴とする。
また、本発明は、上記発明において、前記記憶手段は、コンテンツに係る属性の各候補の重みに係る情報をさらに記憶し、前記生成手段は、前記コンテンツに係る属性の候補の情報および前記重みに係る情報を前記記憶手段から読み出し、読み出した情報に基づいて前記ベクトルを生成することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、所定のコンテンツに対してコンテンツに係る複数の属性と、各属性の優先度とを評価することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、前記コンテンツに係る情報の出現頻度に基づいて、前記ベクトルの重みを設定し、設定した重みに基づいて前記コンテンツに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記生成手段は、コンテンツに係る属性の候補の数が増加した場合に、当該候補の数の増加に応じて次元が増加したベクトル空間における前記ベクトルを生成することを特徴とする。
また、本発明は、上記発明において、コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価方法であって、コンピュータに、ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得工程と、コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群として記憶手段に複数種類記憶されたデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得工程により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索工程と、前記検索工程により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成工程と、前記生成工程により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価工程と、を実行させることを特徴とする。
また、本発明は、コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価プログラムであって、ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得手順と、コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群として記憶手段に複数種類記憶されたデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得手順により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索手順と、前記検索手順により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成手順と、前記生成手順により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価手順とをコンピュータに実行させることを特徴とする。
本発明によれば、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができるという効果を奏する。
以下に添付図面を参照して、本発明に係る属性評価装置、属性評価方法および属性評価プログラムの好適な実施例を詳細に説明する。
まず、本発明にかかる属性評価処理の概念について説明する。図1は、本発明にかかる属性評価処理の概念を説明する図である。図1は、「卒業を控えた僕は、シンセサイザーで作曲することが好きで、専攻は、自然言語処理学である。」というテキストからなるコンテンツに係る属性を評価する場合の例である。
ここで、コンテンツに係る属性とは、コンテンツの内容から判定されるコンテンツが属するカテゴリーや、当該コンテンツにアクセスするユーザの属性などのことである。たとえば、コンテンツが「スポーツ」という属性である場合には、当該コンテンツにアクセスするユーザは「スポーツ」に興味があるユーザであると評価され、「スポーツ」がユーザの興味に係る属性として設定される。
この属性評価処理においては、まず、上記テキストに対して形態素解析がまず実行される。図2は、形態素解析の実行結果の一例を示す図である。図2に示すように、形態素解析においては、テキストが各形態素に分解され、各形態素の品詞を解析する処理がおこなわれる。
続いて、品詞が一般名詞(図2では、「名詞-一般」に対応する。)である形態素が抽出される。図2の例では、「シンセサイザー」および「自然言語処理学」の2つの一般名詞が抽出される。
ここでは、一般名詞のみを抽出することとしたが、「卒業」、「作曲」、「専攻」などのサ変接続名詞(図2では、「名詞-サ変接続」に対応する。)をさらに加えることとしてもよい。
一方、一般名詞に対応する基本属性要素および基本属性要素間の比率の情報を記憶したデータベースをあらかじめ準備しておく。このデータベースを以下ではデジタルシソーラスと呼ぶこととする。図3は、基本属性要素および基本属性要素間の比率の情報を記憶したデジタルシソーラスの一例を示す図である。
図3に示すように、このデジタルシソーラスは、一般名詞、基本属性要素および要素比率の情報を記憶している。一般名詞は、品詞が一般名詞に分類される単語である。基本属性要素は、一般名詞が属するカテゴリーである。
たとえば、図3の例では、「シンセサイザー」は「音楽」および「コンピュータ」の2つの基本属性要素に属し、「自然言語処理学」は、「コンピュータ」および「言語学」の2つの基本属性要素に属している。
要素比率は、基本属性要素間に割り当てられた比率である。たとえば、図3の例では、「シンセサイザー」の2つの基本属性要素である「音楽」および「コンピュータ」の要素比率は1:1に設定され、「自然言語処理学」の2つの基本属性要素である「コンピュータ」および「音楽」の要素比率は3:2に設定されている。この要素比率は、基本属性要素に対する重みとして用いられるものである。
この属性評価処理では、一般名詞がコンテンツから抽出された場合に、その一般名詞に対応する基本属性要素および要素比率の情報をデジタルシソーラスから検索する。そして、それらの情報に基づいて、図1に示すように、各基本属性要素に対応し、互いに直交する基底ベクトルを用いて一般名詞のベクトル空間(ヒルベルト空間)内での位置を表現する。
具体的には、一般名詞は以下のように表現される。
i = Σaj |ej> ... (式1)
Σaj 2 = 1 ... (式2)
ここで、niは、一般名詞iを表す大きさが1の単位ベクトルであり、|ej>は、基本属性要素jに対応する大きさが1の正規直交基底ベクトルであり、ajは、基本属性要素jに対応し、要素比率から算出される|ej>の重みであり、Σaj |ej>は、すべてのjに対するaj |ej>の和であり、Σaj 2は、すべてのjに対するaj 2の和である。
たとえば、「シンセサイザー」という一般名詞に対応する基本属性要素は「音楽」および「コンピュータ」であり、「音楽」および「コンピュータ」の要素比率は1:1であるため、「シンセサイザー」を表す単位ベクトルn1は、
1 = 1/√2 |e1> + 1/√2 |e2> ... (式3)
となる。
ここで、|e1>は、「音楽」に対応する基底ベクトルであり、|e2>は、「コンピュータ」に対応する基底ベクトルである。また、「音楽」および「コンピュータ」の要素比率が1:1であるため、|e1>および|e2>の重みも1:1に設定される。具体的には、式2と要素比率とから、|e1>および|e2>の重みがそれぞれ1/√2および1/√2となる。
また、「自然言語処理学」という一般名詞に対応する基本属性要素は「コンピュータ」および「言語学」であり、「コンピュータ」および「言語学」の要素比率は3:2であるため、「自然言語処理学」を表す単位ベクトルn2は、
2 = 3/√13 |e2> + 2/√13 |e3> ... (式4)
となる。
ここで、|e3>は、「言語学」に対応する基底ベクトルである。また、式2と要素比率3:2とから、|e2>および|e3>の重みがそれぞれ3/√13および2/√13となっている。
そして、コンテンツに係る属性は、各一般名詞に対応するベクトルの和、すなわち、
p = Σni ... (式5)
により評価される。ここで、pは、コンテンツに係る属性を表す属性ベクトルであり、Σniは、すべてのiに対するniの和である。
たとえば、「シンセサイザー」および「自然言語処理学」という一般名詞が抽出されたコンテンツに係る属性を表す属性ベクトルpは、
p = n1 + n2
= 1/√2 |e1> + (1/√2 + 3/√13) |e2> + 2/√13 |e3>
... (式6)
となる。
これにより、コンテンツに係る属性が「音楽」、「コンピュータ」、「言語学」である割合はそれぞれ、
1/√2 : (1/√2 + 3/√13) : 2/√13
≒ 25% : 55% : 20% ... (式7)
と評価される。
ここで、上記割合はコンテンツに係る属性を選択する場合の優先度と考えることができる。すなわち、コンテンツに係る属性を1つに決定する必要がある場合には「コンピュータ」を選択し、コンテンツに係る属性を2つ決定する場合には「コンピュータ」および「音楽」を選択すればよい。
なお、ここでは式7に示したように、各基底ベクトル |ej> に対応する係数の比率を単に比較することとしたが、式5の属性ベクトルを正規化し、正規化した属性ベクトルの各基底ベクトル |ej> に対応する係数の2乗の比率を比較することとしてもよい。
たとえば、式6により示される属性ベクトルpを正規化すると、
p = 0.3967 |e1> + 0.8636 |e2> + 0.3112 |e3>
となる。
この場合には、コンテンツに係る属性が「音楽」、「コンピュータ」、「言語学」である割合はそれぞれ、
0.39672 : 0.86362 : 0.31122
≒ 16% : 74% : 10%
と評価される。
また、コンテンツに係る属性を評価する属性ベクトルの大きさを正規化しておくと、他のコンテンツの属性ベクトルとの間で基底ベクトルに対応する係数の比較ができるようになるという利点も生じる。
つぎに、一般名詞を表すベクトルを互いに直交する基底ベクトルを用いて表す理由を説明する。図4は、互いに直交しない基底ベクトルを用いた場合のコンテンツに係る属性評価方法を説明する図である。たとえば、「音楽を聴きながら量子化暗号について考える」というテキストからなるコンテンツに係る属性を評価する場合を考える。
そして、形態素解析により、「音楽」および「量子化暗号」という一般名詞が抽出され、「音楽」に対応する基本属性要素として「音楽」が、「量子化暗号」に対応する基本属性要素として「物理学」および「コンピュータ」がデジタルシソーラスから検索され、さらに、それぞれの基本属性要素に対応する要素比率が検索されたものとする。
図4には、「音楽」および「量子化暗号」という一般名詞に対応し、基本属性要素および要素比率に基づいて算出されたベクトルn3,n4が示されている。ただし、このベクトルの基底 |e4> 〜 |e7> は互いに直交するものではない。
このような場合、単にベクトルn3,n4の和を式5に基づいて算出すると、その結果得られる属性ベクトルqは「音楽」という要素を持たなくなり、コンテンツが「音楽」とは無関係であるといった誤った判定となることがある。このようなことを防ぐために、ここでは、互いに直交するベクトルを一般名詞を現すベクトルの基底ベクトルとして用いることとしている。
このように、本発明にかかる属性評価処理では、基本属性要素に対応付けられた互いに直交するベクトルを基底とし、かつ、コンテンツから抽出した一般名詞のベクトル空間内での位置を表すベクトルに係る情報を生成し、生成した情報に基づいてコンテンツに係る属性を評価することとした。
ここで、基底となるベクトルには任意の基本属性要素を対応付けることができるため、インターネット広告の広告主が「ぬくもりのある」や「シャープな」、「ほのぼのとした」、「あたたかみのある」など、生活シーンに応じた感覚的に表現された属性などを新たに追加したい場合にも、デジタルシソーラスを更新することにより柔軟に対応することができる。
また、互いに直交するベクトルを用いてコンテンツに係る属性を評価するため、属性を正確に評価することができる。さらに、ベクトル演算によりコンテンツに係る属性を評価するため、効率的に属性を評価することができる。
また、上述したように、基本属性要素がN個ある場合には、一般名詞は、基本属性要素に対応する正規直交ベクトルを基底とするN次元のベクトルで表される。そのため、デジタルシソーラスに一般名詞に対する基本属性要素が追加された場合でも、単にベクトルの次元を増加させることにより、基本属性要素の追加に動的に対応することができる。
つぎに、本実施例に係る属性評価システムの機能構成について説明する。図5は、本実施例に係る属性評価システム20の機能構成を示す図である。以下では、インターネット30を介して公開されているウェブサイトのコンテンツに係る属性を評価する場合について説明する。
図5に示すように、この属性評価システム20は、外部ウェブサーバ10a〜10cとインターネット30を介して接続されている。外部ウェブサーバ10a〜10cは、属性評価システム20の外部でウェブサイトの閲覧サービスを提供しているサーバである。この外部ウェブサーバ10a〜10cは、ウェブサイトを構築するHTML(Hyper Text Markup Language)データおよびウェブサイトに対するユーザのアクセス履歴であるアクセスログを記憶している。
属性評価システム20は、ウェブサイトにおけるコンテンツの閲覧サービスを提供するとともに、閲覧サービスを提供するコンテンツおよび当該コンテンツにアクセスするユーザの属性を評価するシステムである。
この属性評価システム20は、ウェブサーバ40a〜40c、情報収集サーバ50、属性評価サーバ60および広告サーバ70がLAN(Local Area Network)80を介して接続された構成となっている。また、ウェブサーバ40a〜40c、情報収集サーバ50および広告サーバ70は、外部ウェブサーバ10a〜10cとインターネット30を介して接続されている。
ウェブサーバ40a〜40cは、ウェブサイト内のコンテンツの閲覧サービスを提供するサーバである。このウェブサーバ40a〜40cは、ウェブサイトを構築するHTMLデータおよびウェブサイトに対するユーザのアクセス履歴であるアクセスログを記憶している。
情報収集サーバ50は、他のサーバにアクセスし、ウェブサイトのコンテンツ間に設定されたリンクの情報や、ウェブサイト内のコンテンツのメタデータの情報、ウェブサイト内のコンテンツの情報などを収集するサーバである。この情報収集サーバ50は、データ送受信部500、情報収集部501、記憶部502および制御部503を有する。
データ送受信部500は、他のサーバとの間でインターネット30またはLAN80を介してさまざまなデータの授受をおこなうネットワークインターフェースである。情報収集部501は、インターネット30に接続された外部ウェブサーバ10a〜10cやウェブサーバ40a〜40cにアクセスし、ウェブサイトのコンテンツ間に設定されたリンクの情報や、ウェブサイト内のコンテンツのメタデータの情報、ウェブサイト内のコンテンツの情報などを収集して、それらの情報を記憶部502に記憶する。
記憶部502は、ハードディスク装置などの記憶デバイスである。この記憶部502は、リンク情報502a、メタデータ情報502b、コンテンツ情報502cを記憶している。
リンク情報502aは、コンテンツ間に設定されたリンクの情報を記憶したものである。このリンクは、ハイパーリンクまたはトラックバックにより設定されたものである。メタデータ情報502bは、ウェブサイト内のコンテンツに係る情報を記述したメタデータの情報を記憶したものである。コンテンツ情報502cは、ウェブサイト内のテキストや画像データなどのコンテンツの情報を記憶したものである。
制御部503は、情報収集サーバ50を全体制御する制御部であり、各機能部間のデータの授受などを司る。
属性評価サーバ60は、情報収集サーバ50により収集された情報を取得し、評価対象となるコンテンツの属性および当該コンテンツにアクセスするユーザの属性を評価する処理をおこなう。
この属性評価サーバ60は、データ送受信部600、記憶部601、ベクトル情報生成部602、属性評価部603および制御部604を有する。データ送受信部600は、他のサーバとの間でLAN80を介してさまざまなデータの授受をおこなうネットワークインターフェースである。
記憶部601は、ハードディスク装置などの記憶デバイスである。この記憶部601は、デジタルシソーラスデータ601aおよび属性評価情報601bを記憶している。
デジタルシソーラスデータ601aは、図3で説明したデジタルシソーラスに対応するものである。このデジタルシソーラスデータ601aは、一般名詞、基本属性要素および要素比率の情報を記憶している。属性評価情報601bは、評価されたコンテンツの属性および当該コンテンツにアクセスするユーザの属性に係る情報を記憶したものである。
なお、ここでは、デジタルシソーラスデータ601aに一般名詞、基本属性要素および要素比率の間の組み合わせを1つだけ記憶することとしたが、インターネット広告の広告主が希望する属性にコンテンツおよびコンテンツにアクセスするユーザを分類するために、一般名詞、基本属性要素および要素比率の間の異なる組み合わせをデジタルシソーラスデータ601aに複数記憶しておき、使用する組み合わせを広告主に応じて切り替えることとしてもよい。
ここで、使用する組み合わせは、広告主ごとにあらかじめ設定しておくこととしてもよいし、インターネット30に接続された端末装置(図示せず)を用いて広告主により指定された組み合わせをベクトル情報生成部602が受け付けることにより設定することとしてもよい。
これにより、ある広告主は、基本属性要素として「スポーツ」や「ニュース」などのように直接的に表現された要素を用い、別の広告主は、「ぬくもりのある」や「シャープな」、「ほのぼのとした」、「あたたかみのある」など、感覚的に表現された要素を用いたいという要望がある場合でも柔軟に対応することができる。
図5の説明に戻ると、ベクトル情報生成部602は、コンテンツに対して形態素解析を実行し、コンテンツから一般名詞を抽出する。そして、ベクトル情報生成部602は、抽出された一般名詞を互いに直交する基底ベクトルを用いて表現し、ベクトル空間内の位置を算出する処理をおこなう。具体的には、ベクトル情報生成部602は、図1において説明したように、デジタルシソーラスデータ601aを参照し、一般名詞を式1および式2を用いて表現する。
属性評価部603は、コンテンツの属性および当該コンテンツにアクセスするユーザの属性を、互いに直交する基底ベクトルを用いて表現された一般名詞のベクトル空間内での位置の情報に基づいて評価する処理をおこなう。
具体的には、属性評価部603は、図1において説明したように、式5を用いて一般名詞を表すベクトルの和から属性ベクトルを生成し、属性ベクトルにおける各基底ベクトルの係数を、式7のようにして調べることにより属性を評価する処理をおこなう。
広告サーバ70は、属性評価サーバ60により評価されたコンテンツの属性および当該コンテンツにアクセスするユーザの属性に基づいて、各コンテンツおよびユーザに適した広告を配信するサーバである。この広告サーバ70は、データ送受信部700、記憶部701、広告配信処理部702および制御部703を有する。
データ送受信部700は、他の装置との間でインターネット30またはLAN80を介してさまざまなデータの授受をおこなうネットワークインターフェースである。記憶部701は、ハードディスク装置などの記憶デバイスである。この記憶部701は、広告データ701aおよび配信条件データ701bを記憶している。
広告データ701aは、外部ウェブサーバ10a〜10cまたはウェブサーバ40a〜40cが閲覧サービスを提供しているコンテンツに配信するインターネット広告のデータを記憶したものである。配信条件データ701bは、インターネット広告を配信するコンテンツのURI(Uniform Resource Identifier)や配信期間などのインターネット広告の配信条件を記憶したデータである。
広告配信処理部702は、記憶部701に記憶された配信条件データ701bに基づいて、コンテンツに広告データ701aに記憶されたインターネット広告を配信する処理をおこなう。制御部703は、広告サーバ70を全体制御する制御部であり、各機能部間のデータの授受などを司る。
つぎに、本実施例に係る属性評価処理の処理手順について説明する。図6は、本実施例に係る属性評価処理の処理手順を示すフローチャートである。
図6に示すように、まず、属性評価サーバ60のベクトル情報生成部602は、属性を評価する対象であるコンテンツの情報を情報収集サーバ50の記憶部502に記憶されたコンテンツ情報502cから取得する(ステップS101)。
そして、ベクトル情報生成部602は、図2を用いて説明したように、コンテンツの情報に対する形態素解析を実行し(ステップS102)、一般名詞を抽出する(ステップS103)。
続いて、ベクトル情報生成部602は、記憶部601に記憶されたデジタルシソーラスデータ601aを参照することにより、抽出した一般名詞に対応する基本属性要素および要素比率を検索し(ステップS104)、式1および式2を用いて、一般名詞をベクトルに変換する(ステップS105)。
そして、属性評価部603は、式5を用いて、各一般名詞に対応するベクトルの和を算出し(ステップS106)、式7で説明したようにして、ベクトルの和における各基底ベクトルの係数からコンテンツに係る属性を評価し(ステップS107)、評価したコンテンツに係る属性を属性評価情報601bとして記憶部601に記憶し(ステップS108)、この属性評価処理を終了する。
なお、上記実施例では、コンテンツから一般名詞を抽出し、一般名詞を基本属性要素に基づいてベクトルに変換して、コンテンツに係る属性を評価することとしているが、コンテンツから一般名詞を抽出する代わりに、検索エンジンを用いて当該コンテンツを検索する場合にユーザにより入力された検索語や、当該コンテンツに対するハイパーリンクが設定され、ユーザによりマウス等でクリックされた語をベクトルに変換し、コンテンツに係る属性を評価することとしてもよい。
上述してきたように、本実施例では、属性評価サーバ60のベクトル情報生成部602が、各基本属性要素に対応付けられた互いに直交するベクトルを基底とし、かつ、一般名詞のベクトル空間内での位置を表すベクトルに係る情報を生成し、属性評価部603が、ベクトル情報生成部602により生成された情報に基づいて、コンテンツに係る属性を評価することとしたので、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる。
また、本実施例では、ベクトル情報生成部602が、一般名詞とコンテンツに係る属性の候補の情報とを対応付けて記憶したデジタルシソーラスデータ601aから、一般名詞を検索キーとして基本属性要素の情報を検索し、属性評価部603が、検索の結果得られた基本属性要素の情報を基にして、一般名詞のベクトル空間内での位置を表すベクトルに係る情報を生成することとしたので、デジタルシソーラスデータ601aに記憶された基本属性要素の情報を読み出すことにより、効率的にベクトル情報を生成することができる。
また、本実施例では、ベクトル情報生成部602が、一般名詞と基本属性要素との間の異なる組み合わせを複数記憶したデジタルシソーラスデータ601aから、指定された組み合わせにおける基本属性要素の情報を検索し、検索の結果得られた基本属性要素の情報を基にして、ベクトルに係る情報を生成することとしたので、コンテンツに係る属性を柔軟に評価することができる。
また、本実施例では、ベクトル情報生成部602が、基本属性要素の情報および基本属性要素の要素比率に係る情報を記憶したデジタルシソーラスデータ601aから基本属性要素の情報および要素比率に係る情報を読み出し、属性評価部603が、読み出した情報に基づいて一般名詞のベクトル空間内での位置を表すベクトルに係る情報を生成することとしたので、基本属性要素の要素比率を考慮してコンテンツに係る情報の評価をおこなうことにより、より正確にコンテンツに係る属性を評価することができる。
また、本実施例では、属性評価部603が、所定のコンテンツに対してコンテンツに係る複数の属性と、各属性の優先度とを評価することとしたので、コンテンツに係る属性を任意の精度で評価することができる。
また、本実施例では、ベクトル情報生成部602が、コンテンツに係る属性の候補の数が増加した場合に、当該候補の数の増加に応じて次元が増加したベクトル空間における一般名詞の位置を表すベクトルに係る情報を生成することとしたので、コンテンツに係る属性の候補の数の増加に動的に対応することができる。
また、本実施例では、一般名詞は、コンテンツの内容に係る情報を含んだメタデータまたは当該コンテンツから抽出されたものであることとしたので、メタデータまたはコンテンツから抽出された一般名詞を基にして、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる。
また、本実施例では、ベクトル情報生成部602が、基本属性要素に対応付けられた互いに直交するベクトルを基底とし、かつ、コンテンツの検索に用いられた検索語、または、ハイパーリンクが設定された語のベクトル空間内での位置を表すベクトルに係る情報を生成することとしたので、コンテンツの検索に用いられた検索語、または、ハイパーリンクが設定された語を基にして、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる。
(実施例の変形例1)
ところで、上記実施例では、一般名詞に対応する基本属性要素および要素比率を基にしてコンテンツに係る属性を評価することとしているが、さらに一般名詞の出現頻度を考慮して、より精度よくコンテンツに係る属性を評価することとしてもよい。そこで、実施例の変形例1では、一般名詞の出現頻度をさらに考慮する場合について説明する。
ここでは、上記実施例で用いた「卒業を控えた僕は、シンセサイザーで作曲することが好きで、専攻は、自然言語処理学である。」という第1のテキストと、「自然言語処理学は楽しい。」という第2のテキストとからなるコンテンツに係る属性を評価する場合の例を示す。
図7は、変形例1における形態素解析の実行結果の一例を示す図である。図7には、第2のテキストに対して形態素解析を適用した結果が示されている。第1のテキストに対して形態素解析をおこなった結果は、図2に示したものと同様である。
図7に示すように、第2のテキストからは、「自然言語処理学」という一般名詞が1つ抽出される。これにより、第1のテキストおよび第2のテキストから抽出された一般名詞は、「シンセサイザー」および「自然言語処理学」であり、出現頻度はそれぞれ1回および2回となる。
本変形例1における属性評価処理では、コンテンツに係る属性を評価する場合に、一般名詞の出現頻度を当該一般名詞に対応するベクトルの重みとして設定し、ベクトルの和を算出する。
すなわち、本変形例1における属性評価処理では、式5の代わりに、
p = Σwii ... (式8)
を用いてベクトルの和を算出する。ここで、wiは、ベクトルniに対応する一般名詞の出現頻度であり、Σwiiは、すべてのiに対するwiiの和である。
たとえば、「シンセサイザー」および「自然言語処理学」という一般名詞が抽出され、「シンセサイザー」の出現頻度が1回であり、「自然言語処理学」の出現頻度が2回であるコンテンツの属性ベクトルpは、
p = n1 + 2 n2
= 1/√2 |e1> + 1/√2 |e2> + 2 (3/√13 |e2> + 2/√13 |e3>)
= 1/√2 |e1> + (1/√2 + 6/√13) |e2> + 4/√13 |e3>
... (式9)
となる。
これにより、コンテンツに係る属性が「音楽」、「コンピュータ」、「言語学」である割合はそれぞれ、
1/√2 : (1/√2 + 6/√13) : 4/√13
≒ 17% : 57% : 26% ... (式10)
となる。
したがって、コンテンツに係る属性を1つに決定する必要がある場合には「コンピュータ」を選択し、コンテンツに係る属性を2つ決定する場合には「コンピュータ」および「言語学」を選択すればよい。
なお、本変形例1に係る属性評価システムの機能構成については、図5に示した機能構成とほぼ同様である。ただし、本変形例1では、ベクトル情報生成部602が、コンテンツに対して形態素解析を実行し、コンテンツから一般名詞を抽出するとともに、抽出された一般名詞の出現頻度を記憶部601に記憶する。
そして、ベクトル情報生成部602は、図1において説明したように、抽出された一般名詞を互いに直交する基底ベクトルを用いて表現し、一般名詞のベクトル空間内における位置を算出する処理をおこなう。
また、属性評価部603は、一般名詞の出現頻度と、互いに直交する基底ベクトルを用いて表現された一般名詞のベクトル空間内での位置の情報とから、式8を用いて、コンテンツの属性および当該コンテンツにアクセスするユーザの属性を評価する。
また、本変形例1に係る属性評価処理の処理手順は、図6に示した処理手順とほぼ同様である。ただし、本変形例1では、ステップS103において、ベクトル情報生成部602が、コンテンツから一般名詞を抽出するとともに、抽出された一般名詞の出現頻度を記憶部601に記憶する。
そして、ステップS106では、属性評価部603が、式5の代わりに、式8を用いて各一般名詞に対応するベクトルの和を算出する。また、ステップS107では、属性評価部603が、式10で説明したようにして、ベクトルの和における各基底ベクトルの係数からコンテンツに係る属性を評価する。
上述してきたように、本実施例の変形例1では、属性評価部603が、一般名詞の出現頻度に基づいて、ベクトル情報生成部602により生成されたベクトルに係る情報の重みを設定し、設定した重みに基づいてコンテンツに係る属性を評価することとしたので、一般名詞の出現頻度を考慮することにより、より正確にコンテンツに係る属性を評価することができる。
(実施例の変形例2)
ところで、上記実施例および実施例の変形例1では、コンテンツがテキストであることとしたが、コンテンツが画像である場合にも、その画像に対して設定されたメタデータを解析して、コンテンツに係る属性を評価することとしてもよい。そこで、実施例の変形例2では、テキストとともに画像を含むコンテンツに係る属性を評価する場合について説明する。
ここでは、上記変形例1で用いた「卒業を控えた僕は、シンセサイザーで作曲することが好きで、専攻は、自然言語処理学である。自然言語処理学は楽しい。」というテキストと、シンセサイザーおよび楽譜の画像とからなるコンテンツに係る属性を評価する場合の例を示す。
ここで、シンセサイザーの画像のメタデータには、「シンセサイザー」という一般名詞が含まれており、楽譜の画像のメタデータには、「音楽」という一般名詞が含まれているものとする。
この場合、上記テキストおよびメタデータから形態素解析により一般名詞を抽出すると、「シンセサイザー」、「自然言語処理学」および「音楽」という一般名詞が抽出され、それらの一般名詞の出現頻度はそれぞれ2回、2回、1回となる。
この場合、当該コンテンツに係る属性を表す属性ベクトルpは、式8を用いることにより、
p = 2 n1 + 2 n2 + n3
= 2 (1/√2 |e1> + 1/√2 |e2>)
+ 2 (3/√13 |e2> + 2/√13 |e3>) + |e1>
= (√2 + 1) |e1> + (√2 + 6/√13) |e2> + 4/√13 |e3>
... (式11)
となる。ここで、n3は、一般名詞「音楽」に対応する単位ベクトルであり、一般名詞「音楽」に対応する基本属性要素は「音楽」であるため、n3は|e1>に等しくなる。
これにより、コンテンツに係る属性が「音楽」、「コンピュータ」、「言語学」である割合はそれぞれ、
√2 + 1 : (√2 + 6/√13) : 4/√13
≒ 37% : 47% : 16% ... (式12)
となる。
したがって、コンテンツに係る属性を1つに決定する必要がある場合には「コンピュータ」を選択し、コンテンツに係る属性を2つ決定する場合には「音楽」および「コンピュータ」を選択すればよい。
なお、本変形例2に係る属性評価システムの機能構成については、図5に示した機能構成とほぼ同様である。ただし、本変形例2では、ベクトル情報生成部602が、コンテンツに含まれるテキストおよび画像のメタデータに対して形態素解析を実行することにより一般名詞を抽出するとともに、抽出された一般名詞の出現頻度を記憶部601に記憶する。
そして、ベクトル情報生成部602は、図1において説明したように、抽出された一般名詞を互いに直交する基底ベクトルを用いて表現し、ベクトル空間内の位置を算出する処理をおこなう。
また、属性評価部603は、一般名詞の出現頻度と、互いに直交する基底ベクトルを用いて表現された一般名詞のベクトル空間内での位置の情報とから、式8を用いて、コンテンツの属性および当該コンテンツにアクセスするユーザの属性を評価する。
また、本変形例2に係る属性評価処理の処理手順は、図6に示した処理手順とほぼ同様である。ただし、本変形例2では、ステップS103において、ベクトル情報生成部602が、コンテンツに含まれるテキストおよび画像のメタデータから一般名詞を抽出するとともに、抽出された一般名詞の出現頻度を記憶部601に記憶する処理をおこなう。
そして、ステップS106では、属性評価部603が、式5の代わりに、式8を用いて各一般名詞に対応するベクトルの和を算出する。また、ステップS107では、属性評価部603が、式10で説明したようにして、ベクトルの和における各基底ベクトルの係数から、テキストおよび画像を含んだコンテンツに係る属性を評価する。
上述してきたように、本変形例2では、属性評価部603が、コンテンツに含まれるテキストおよび画像のメタデータから抽出された一般名詞に基づいて、コンテンツに係る属性の評価をおこなうこととしたので、画像のメタデータをさらに用いることにより、より正確にコンテンツに係る属性を評価することができる。
(実施例の変形例3)
ところで、上記実施例および実施例の変形例では、属性を評価するコンテンツまたはコンテンツのメタデータから一般名詞を抽出し、抽出した一般名詞に基づいて属性を評価することとしたが、第1のコンテンツにハイパーリンクまたはトラックバックにより関連付けられた第2のコンテンツから一般名詞を抽出して、第1のコンテンツの属性を評価することとしてもよい。
具体的には、上記第2のコンテンツに対して図1で説明したような属性評価処理をおこなって、第2のコンテンツに係る属性を評価し、その評価結果に基づいて第1のコンテンツに係る属性を評価する。ここで、第2のコンテンツは、1つまたは複数のコンテンツである。
たとえば、第2の複数のコンテンツに係る属性が「音楽」、「コンピュータ」、「言語学」と評価され、そのうち「コンピュータ」と属性が評価されたコンテンツが最も多かった場合には、第1のコンテンツに係る属性を「コンピュータ」と評価すればよい。
なお、本変形例3に係る属性評価システムの機能構成については、図5に示した機能構成とほぼ同様である。ただし、本変形例3では、ベクトル情報生成部602が、第2のコンテンツに対して形態素解析を実行し、第2のコンテンツから一般名詞を抽出するとともに、抽出された一般名詞の出現頻度を記憶部601に記憶する。
そして、ベクトル情報生成部602は、図1において説明したように、抽出された一般名詞を互いに直交する基底ベクトルを用いて表現し、ベクトル空間内の位置を算出する処理をおこなう。
また、属性評価部603は、一般名詞の出現頻度と、互いに直交する基底ベクトルを用いて表現された一般名詞のベクトル空間内での位置の情報とから、式8を用いて第2のコンテンツに係る属性を評価し、その第2のコンテンツに係る属性に基づいて、第1のコンテンツに係る属性を評価する。
また、本変形例3に係る属性評価処理の処理手順は、図6に示した処理手順とほぼ同様である。ただし、本変形例3では、ステップS101からステップS108の処理を第2のコンテンツに対して実行し、その後、第2のコンテンツに対して評価された属性の情報に基づいて第1のコンテンツに係る属性を評価する。
上述してきたように、本実施例の変形例3では、ベクトル情報生成部602が、属性を評価する第1のコンテンツに対してハイパーリンクまたはトラックバックにより関連付けられている第2のコンテンツに係る属性の各候補に対応付けられた互いに直交するベクトルを基底とし、かつ、第2のコンテンツに係る一般名詞のベクトル空間内での位置を表すベクトルに係る情報を生成し、属性評価部603が、ベクトル情報生成部602により生成された情報に基づいて第1のコンテンツに係る属性を評価することとしたので、ハイパーリンクまたはトラックバックにより関連付けられた第2のコンテンツから第1のコンテンツの属性を柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することができる。
以上、属性評価処理をコンピュータ上で実現する場合について説明してきたが、属性評価処理を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行することにより属性評価処理を実現してもよい。図8は、属性評価処理を実現するコンピュータ100のハードウェア構成を示すブロック図である。
図8に示すように、このコンピュータ100は、上記プログラムを実行するCPU110と、データを入力する入力装置120と、各種データを記憶するROM130と、演算パラメータ等を記憶するRAM140と、属性評価処理を実現するためのプログラムを記録した記録媒体200からプログラムを読み取る読取装置150と、ディスプレイ等の出力装置160と、ネットワーク300を介して他のコンピュータとの間でデータの授受をおこなうネットワークインターフェース170とが、バス180で接続された構成となっている。
CPU110は、読取装置150を経由して記録媒体200に記録されているプログラムを読み込んだ後、プログラムを実行することにより、属性評価処理を実現する。なお、記録媒体200としては、光ディスク、フレキシブルディスク、CD−ROM、ハードディスク等が挙げられる。また、このプログラムは、ネットワーク300を介してコンピュータ100に導入することとしてもよい。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
さらに、各装置にて行なわれる処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
以上のように、本発明に係る属性評価装置、属性評価方法および属性評価プログラムは、柔軟に、効率的に、正確に、また、動的にコンテンツに係る属性を評価することが必要な属性評価システムに有用である。
本発明にかかる属性評価処理の概念を説明する図である。 形態素解析の実行結果の一例を示す図である。 基本属性要素および基本属性要素間の比率の情報を記憶したデジタルシソーラスの一例を示す図である。 互いに直交しない基底ベクトルを用いた場合のコンテンツに係る属性評価方法を説明する図である。 本実施例に係る属性評価システム20の機能構成を示す図である。 本実施例に係る属性評価処理の処理手順を示すフローチャートである。 変形例1における形態素解析の実行結果の一例を示す図である。 属性評価処理を実現するコンピュータ100のハードウェア構成を示すブロック図である。
符号の説明
10a〜10c 外部ウェブサーバ
20 属性評価システム
30 インターネット
40a〜40c ウェブサーバ
50 情報収集サーバ
500 データ送受信部
501 情報収集部
502 記憶部
502a リンク情報
502b メタデータ情報
502c コンテンツ情報
503 制御部
60 属性評価サーバ
600 データ送受信部
601 記憶部
601a デジタルシソーラスデータ
601b 属性評価情報
602 ベクトル情報生成部
603 属性評価部
604 制御部
70 広告サーバ
700 データ送受信部
701 記憶部
701a 広告データ
701b 広告配信データ
702 広告配信処理部
703 制御部
80 LAN

Claims (11)

  1. コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価装置であって、
    コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群を複数種類記憶した記憶手段と、
    ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得手段と、
    前記記憶手段に記憶された複数種類のデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得手段により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索手段と、
    前記検索手段により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成手段と、
    前記生成手段により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価手段と、
    を備えたことを特徴とする属性評価装置。
  2. 前記取得手段は、ウェブサーバにより提供され、かつインターネット広告の配信候補となるコンテンツに係る情報として、前記属性を評価するコンテンツに対してハイパーリンクまたはトラックバックにより関連付けられている第2のコンテンツに係る情報を取得し、前記生成手段は、前記第2のコンテンツに係る属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記第2のコンテンツに係る情報の位置の情報を表すベクトルを生成し、前記属性評価手段は、前記生成手段により生成された前記ベクトルに基づいて前記第2のコンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価することを特徴とする請求項1に記載の属性評価装置。
  3. 前記取得手段により取得される前記コンテンツに係る情報は、ユーザによって入力され、検索エンジンによって当該コンテンツの検索に用いられた検索語であることを特徴とする請求項1又は2に記載の属性評価装置。
  4. 前記取得手段により取得される前記コンテンツに係る情報は、当該コンテンツに対してハイパーリンクが設定され、ユーザによりクリックされた語であることを特徴とする請求項1〜3のいずれか1つに記載の属性評価装置。
  5. 前記コンテンツは、テキストと画像のメタデータとを含むことを特徴とする請求項1〜4のいずれか1つに記載の属性評価装置。
  6. 前記記憶手段は、コンテンツに係る属性の各候補の重みに係る情報をさらに記憶し、前記生成手段は、前記コンテンツに係る属性の候補の情報および前記重みに係る情報を前記記憶手段から読み出し、読み出した情報に基づいて前記ベクトルを生成することを特徴とする請求項1〜5のいずれか1つに記載の属性評価装置。
  7. 前記属性評価手段は、所定のコンテンツに対してコンテンツに係る複数の属性と、各属性の優先度とを評価することを特徴とする請求項1〜6のいずれか1つに記載の属性評価装置。
  8. 前記属性評価手段は、前記コンテンツに係る情報の出現頻度に基づいて、前記ベクトルの重みを設定し、設定した重みに基づいて前記コンテンツに係る属性を評価することを特徴とする請求項1〜7のいずれか1つに記載の属性評価装置。
  9. 前記生成手段は、コンテンツに係る属性の候補の数が増加した場合に、当該候補の数の増加に応じて次元が増加したベクトル空間における前記ベクトルを生成することを特徴とする請求項1〜8のいずれか1つに記載の属性評価装置。
  10. コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価方法であって、
    コンピュータに、
    ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得工程と、
    コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群として記憶手段に複数種類記憶されたデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得工程により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索工程と、
    前記検索工程により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成工程と、
    前記生成工程により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価工程と、
    を実行させることを特徴とする属性評価方法。
  11. コンテンツに係る情報を基にして当該コンテンツに係る属性を評価する属性評価プログラムであって、
    ウェブサーバにより提供され、かつインターネット広告の配信候補となる一のコンテンツに係る情報を取得する取得手順と、
    コンテンツに係る情報毎にコンテンツに係る情報とコンテンツに係る属性の候補の情報とを対応付けたデータ群として記憶手段に複数種類記憶されたデータ群のうちインターネット広告の広告主に応じたデータ群から、前記取得手順により取得した前記コンテンツに係る情報を検索キーとしてコンテンツに係る属性の候補の情報を検索する検索手順と、
    前記検索手順により検索した前記コンテンツに係る情報に対応する前記属性の各候補に対応付けられた互いに直交するベクトルを基底とし、前記基底としたベクトルを用いて表現されたベクトル空間内での前記コンテンツに係る情報の位置の情報を表すベクトルを生成する生成手順と、
    前記生成手順により生成された前記ベクトルに基づいて前記コンテンツに係る属性を示す属性ベクトルを生成することにより前記コンテンツに係る属性を評価する属性評価手順と、
    をコンピュータに実行させることを特徴とする属性評価プログラム。
JP2005014263A 2005-01-21 2005-01-21 属性評価装置、属性評価方法および属性評価プログラム Active JP4755834B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005014263A JP4755834B2 (ja) 2005-01-21 2005-01-21 属性評価装置、属性評価方法および属性評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005014263A JP4755834B2 (ja) 2005-01-21 2005-01-21 属性評価装置、属性評価方法および属性評価プログラム

Publications (3)

Publication Number Publication Date
JP2006202118A JP2006202118A (ja) 2006-08-03
JP2006202118A5 JP2006202118A5 (ja) 2008-02-28
JP4755834B2 true JP4755834B2 (ja) 2011-08-24

Family

ID=36960053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005014263A Active JP4755834B2 (ja) 2005-01-21 2005-01-21 属性評価装置、属性評価方法および属性評価プログラム

Country Status (1)

Country Link
JP (1) JP4755834B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015560A (ja) * 2007-07-04 2009-01-22 Pioneer Electronic Corp リスト生成装置及び方法、並びにコンピュータプログラム
JP4962986B2 (ja) * 2008-04-01 2012-06-27 ヤフー株式会社 コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
JP5408917B2 (ja) * 2008-07-09 2014-02-05 Jetrunテクノロジ株式会社 広告配信システム
JP5084857B2 (ja) * 2010-03-16 2012-11-28 ヤフー株式会社 分析処理調整装置及び方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281161A (ja) * 2002-03-19 2003-10-03 Seiko Epson Corp 情報分類方法、情報分類装置、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2006202118A (ja) 2006-08-03

Similar Documents

Publication Publication Date Title
JP5662961B2 (ja) レビュー処理方法およびシステム
KR101171405B1 (ko) 검색 결과에서 배치 내용 정렬의 맞춤화
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US8117212B2 (en) Information processing apparatus and method, program and recording medium
US8332208B2 (en) Information processing apparatus, information processing method, and program
JP5066963B2 (ja) データベース構築装置
JP2009282957A (ja) 文書処理装置および文書処理方法
JP5968744B2 (ja) コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体
KR20090017268A (ko) 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템
JP4820147B2 (ja) 属性評価プログラム、属性評価システムおよび属性評価方法
De Nies et al. Bringing Newsworthiness into the 21st Century.
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
JP4755834B2 (ja) 属性評価装置、属性評価方法および属性評価プログラム
KR20080078930A (ko) 관심사를 반영하여 추출한 정보 제공 방법 및 시스템
JP2006318398A (ja) ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP2007334590A (ja) 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR20110023304A (ko) 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템
KR101583073B1 (ko) 기사 요약 서비스 서버 및 방법
KR100851042B1 (ko) 확장 광고 키워드를 추천하는 방법 및 그 시스템
JP4213700B2 (ja) Blogコミュニティ分析装置及びプログラム
JP2007052693A (ja) Webページ情報表示装置,処理方法およびプログラム
JP3967230B2 (ja) 画像情報表示システム
JP2019164438A (ja) レコメンド動画決定装置、レコメンド動画決定方法、およびプログラム
JP5519406B2 (ja) サーバ装置、ジャンルスコア算出方法およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110303

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4755834

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350