JP4825669B2 - 文書の意味を決定して文書とコンテンツを一致させる方法及びシステム - Google Patents

文書の意味を決定して文書とコンテンツを一致させる方法及びシステム Download PDF

Info

Publication number
JP4825669B2
JP4825669B2 JP2006521945A JP2006521945A JP4825669B2 JP 4825669 B2 JP4825669 B2 JP 4825669B2 JP 2006521945 A JP2006521945 A JP 2006521945A JP 2006521945 A JP2006521945 A JP 2006521945A JP 4825669 B2 JP4825669 B2 JP 4825669B2
Authority
JP
Japan
Prior art keywords
web page
concept
document
source
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006521945A
Other languages
English (en)
Other versions
JP2007500900A (ja
JP2007500900A5 (ja
Inventor
アダム ジェイ. ウェイスマン、
ジラッド イスラエル エルバズ、
Original Assignee
グーグル・インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/689,903 external-priority patent/US8914361B2/en
Application filed by グーグル・インク filed Critical グーグル・インク
Publication of JP2007500900A publication Critical patent/JP2007500900A/ja
Publication of JP2007500900A5 publication Critical patent/JP2007500900A5/ja
Application granted granted Critical
Publication of JP4825669B2 publication Critical patent/JP4825669B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Description

【技術分野】
【0001】
本発明は一般的に文書に関する。特に、本発明は文書の意味を決定してその文書とコンテンツをマッチさせる方法及びシステムに関する。
【背景技術】
【0002】
ウェブページ等の文書は、例えば、インターネット上でその他のコンテンツとマッチさせることが可能である。文書には、例えば、HTMLやXMLやXHTMLやポータブルドキュメント書式(PDF)のファイル等の各種書式のウェブページや、ワードプロセッサとアプリケーションプログラムの文書ファイルが含まれる。
【0003】
文書とコンテンツをマッチさせ例としてはインターネット広告がある。例えば、ウェブサイトの発行者は手数料をとってウェブサイトでの広告を許可してもよい。発行者がウェブページにユーザ向けに広告を表示したい場合は、ファシリテータが広告を発行者に提供してウェブページに表示してもよい。ファシリテータは、様々な因子、例えば、ユーザに関する人口統計情報や、スポーツや娯楽等のウェブページのカテゴリや、ウェブページのコンテンツに基づいて広告を選択することができる。また、ファシリテータは、ウェブページのコンテンツとキーワードリストのキーワード等の知識項目をマッチさせることができる。そして、マッチしたキーワードに関連する広告をウェブページに表示させることができる。ユーザは、マウスやその他の入力装置を操作し、広告を「クリック」して、商品やサービスを販売する広告主のウェブサイトのウェブページを見ることができる。
【0004】
インターネット広告の中には、関連リンクやそれと同様のセクションの発行者のウェブページと実際にマッチするキーワードを表示するものがある。上の例と同様に、一つ以上のキーワードにウェブページのコンテンツをマッチさせて、それらのキーワードを、例えば、関連リンクのセクションに表示させる。ユーザが特定のキーワードをクリックすると、ユーザは、広告と通常の検索結果が混在する検索結果ページに導かれる。広告主はキーワードに対して入札することによって、そのキーワードの検索結果ページに広告を出現させることができる。ユーザは、マウスやその他の入力装置を操作し、広告を「クリック」することによって、商品やサービスを販売する広告主のウェブサイトのウェブページを見ることができる。
【0005】
広告主は、ウェブページのコンテンツと広告の関連が大きいことを望んでいる。これは、提供される商品やサービスがユーザが読むウェブページの記述と大きく関連する場合には、そのウェブページを見ているユーザは広告をクリックして、その商品やサービスを購入する可能性が高いからである。また、ウェブページの発行者は、広告のコンテンツがウェブページのコンテンツとマッチしていることを望んでいる。これは、ユーザが広告をクリックすることで、広告主の努力が報いられることが多いからであり、微妙な内容のコンテンツの場合のミスマッチは広告主や発行者のいずれか一方にとって不快なものである。
【発明の開示】
【発明が解決しようとする課題】
【0006】
ウェブページ等の文書は複数の領域、例えば、ウェブページの場合は複数のフレームから構成することができる。それらの領域には、文書の主コンテンツとは無関連の領域が含まれていてもよい。従って、無関連な領域のコンテンツの無関連な主題によって文書全体のコンテンツが薄められてしまう。従って、源文書の意味を決定してその文書とコンテンツをマッチさせる場合は、最も関連のある領域について源文書を分析することが望まれる。
【課題を解決するための手段】
【0007】
(発明の概要)
本発明の実施形態は、文書の意味を決定してその文書とコンテンツをマッチさせるシステムおよび方法を備える。本発明の一実施形態の一態様によれば、源記事をアクセスする工程と、源記事の複数の領域を識別する工程と、各領域に関連する少なくとも一つの局所的概念を決定する工程と、各領域の局所的概念を解析して無関連領域を識別する工程と、無関連領域に関連する局所的概念を削除して関連概念を決定する工程と、関連概念を解析して源記事の源意味を決定する工程と、源意味を項目集合のうちの一つに関連する項目意味とマッチさせる工程とを含む。項目はコンテンツ自体であってもよく、また、コンテンツと関連づけてもよい。
【0008】
本発明の一実施形態は、マッチした項目を源記事に表示する工程をさらに含む。
【0009】
本発明の別の一実施形態は、マッチした項目に関連するコンテンツを源記事に表示する工程をさらに含む。本発明の別の態様は、前述の態様に関連する機能を有するコンピュータシステムとコンピュータ読取可能媒体である。
【0010】
添付の図面を参照して、以下の詳細な説明を読むことによって、これらとそれ以外の本発明の特徴、態様、利点をさらに理解することができる。
【発明を実施するための最良の形態】
【0011】
本発明は、文書の意味を決定してその文書とコンテンツをマッチさせる方法及びシステムに関する。以下、本文と添付の図面に示される本発明の実施形態について詳述する。図面と以下の説明では、同様かもしくは類似の部分には同じ参照番号を用いる。
【0012】
本発明に係る様々なシステムを構築することができる。図1は、本発明の実施形態が動作可能なシステムの一例を示す図である。同様に、本発明は、その他のシステムにおいても同様に動作するように具現化することができる。
【0013】
図1に示すシステム100は、複数のクライアントデバイス102aから102n、サーバデバイス104、140、ネットワーク106を備える。図示されたネットワーク106はインターネットを含むものである。別の実施形態では、イントラネット等のネットワークを用いてもよい。また、本発明に係る方法の実行は1台のコンピュータで行うことができる。図示された本実施形態のクライアントデバイス102aから102nはそれぞれ、プロセッサ110に接続されるランダムアクセスメモリ(RAM)108等のコンピュータ読取可能媒体を備えている。プロセッサ110は、メモリ108に記憶されたコンピュータ実行可能プログラム命令セットを実行する。このプロセッサとしては、マイクロプロセッサやASICやステートマシンがある。このプロセッサは、媒体、例えば、コンピュータ読取可能媒体を備えているかもしくはそれと通信することができる。尚、その媒体には、プロセッサの実行時に本願で説明する工程をプロセッサに実行させるための命令が記憶されている。コンピュータ読取可能媒体の実施形態には、これに限定されることはないが、電子記憶/送信デバイス、光記憶/送信デバイス、磁気記憶/送信デバイス、その他の記憶/送信デバイスが含まれる。尚、これらの装置は、タッチセンシティブ入力装置と通信するプロセッサ等のプロセッサにコンピュータ読取可能な命令を提供することができる。その他の適切な媒体の例としては、これに限定されることはないが、フロッピーディスク、CD−ROM、磁気ディスク、メモリチップ、ROM、RAM、ASIC、構成されているプロセッサ、全ての光媒体、全ての磁気テープもしくはその他の磁気媒体、コンピュータプロセッサが命令を読み出すことができるその他の媒体がある。また、その他の様々な形態のコンピュータ読取可能媒体でもコンピュータに命令を送ることができる。尚、このコンピュータは、ルータ、私用/公共ネットワーク、有線と無線のその他の送信デバイス/チャネルを備える。命令は、C、C++、C#、ビジュアルベーシック、ジャバやジャバスクリプト等のコンピュータプログラミング言語のコードを含んでいてもよい。
【0014】
また、クライアントデバイス102aから102nは、多くの外部/内部デバイス、例えば、マウス、CD−ROM、キーボード、ディスプレイ、その他の入出力デバイスを備えていてもよい。クライアントデバイス102aから102nは、例えば、パーソナルコンピュータ、情報端末、携帯情報端末、携帯電話、自動車電話、スマートフォン、ポケベル、デジタルタブレット、ラップトップコンピュータ、プロセッサベース・デバイスやそれと同様のシステムやデバイスである。一般的に、クライアントデバイス102aから102nは、ネットワーク106に接続されたプロセッサベース・プラットフォームであり、一つ以上のアプリケーションプログラムと情報交換を行うものである。図示されたクライアントデバイス102aから102nはパーソナルコンピュータを含むものであって、ブラウザアプリケーションプログラム、例えば、マイクロソフト社のインターネットエクスプローラ6.0、ネットスケープコミュニケーションズ社のネットスケープナビゲータ7.1、アップルコンピュータ社のサファリ1.0を実行するものである。クライアントデバイス102aから102nによって、ユーザ112aから112nは、ネットワーク106を介して互いに通信したり、ネットワーク106に接続されたその他のシステムやデバイスと通信することができる。
【0015】
図1に示すように、サーバデバイス104、140もネットワーク106に接続されている。図示された文書サーバデバイス104は、文書エンジンアプリケーションプログラムを実行するサーバを備える。コンテンツサーバデバイス140は、コンテンツエンジンアプリケーションプログラムを実行するサーバを備える。システム100は、その他の複数のサーバデバイスを備えていてもよい。クライアントデバイス102aから102nと同様に、サーバデバイス104、140は、コンピュータ読み取り可能メモリ118、144に接続されたプロセッサ116、142をそれぞれ備える。サーバデバイス104、140は各々個別のコンピュータシステムとして示されているが、複数のコンピュータプロセッサを含むネットワークとして実施することもできる。サーバデバイス104、140は、例えば、サーバ、メインフレームコンピュータ、ネットワーク・コンピュータ、プロセッサベース・デバイスやそれと同様のシステムやデバイスである。クライアントプロセッサ110とサーバプロセッサ116、142は、多くの周知のコンピュータプロセッサのうちのいずれかであってもよく、例えば、カリフォルニア州サンタクララのインテル社のプロセッサやイリノイ州ショウンバーグのモトローラ社のプロセッサであってもよい。
【0016】
文書サーバデバイス104のメモリ118は、文書エンジン124として知られる文書エンジンアプリケーションプログラムを記憶するものである。文書エンジン124は、源記事の意味を決定し、別の記事や知識項目等の項目と源記事をマッチさせるものである。項目はコンテンツ自体であってもよく、また、コンテンツと関連づけてもよい。ネットワーク106に接続されているその他のデバイスから源記事を受けとることができる。記事には、様々な書式のウェブページが含まれ、これには、例えば、HTML、XMLやXHTML、ポータブルドキュメント書式(PDF)のファイル、ワードプロセッサ、データベース、アプリケーションプログラム・ドキュメントのファイルや、オーディオ情報、ビデオ情報、その他のネットワーク(インターネット等)やパーソナルコンピュータやその他の演算/記憶手段で利用可能な各種の情報が含まれる。本願に記載の実施形態は一般的な文書に関して説明しているが、どのような種類の記事であってもよい。知識項目は、記号によって表現可能な物質的なものかもしくは非物質的なものであり、例えば、キーワード、ノード、カテゴリ、人、概念、製品、句、文書、その他の知識単位であってよい。知識項目はどのような形でもよく、例えば、単語、用語、短い句、文書、その他の構造化情報かもしくは非構造化情報であってよい。本願に記載の実施形態では一般的なキーワードに関して説明しているが、どのような種類の知識項目でもよい。
【0017】
文書エンジン124は、プリプロセッサ134、意味プロセッサ136、マッチングプロセッサ137を備える。図示された本実施形態では、各々がメモリ118内のコンピュータコードを備える。文書エンジン124は、源文書に掲載するコンテンツのリクエストを受けとる。そのようなリクエストは、ネットワーク162に接続されているデバイスから受けとることができる。コンテンツにはウェブページや広告等の文書とキーワード等の知識項目が含まれる。プリプロセッサ134は源文書を受けとり、その源文書を解析してその文書とその文書内の領域に含まれる概念を決定する。概念は、それに関連する単語や用語のクラスタもしくは集合によって定義することができる。尚、単語、用語は同義語であってもよい。また、一つの概念はその他様々な情報によって定義することもできる。例えば、関連概念との関係、関連概念との関係の強さ、品詞、公共的用途、使用頻度、概念の広さ、概念の言語上の使用法に関する統計データなどである。意味プロセッサ136は概念と領域を解析して、源文書の主概念に無関連な領域を削除する。そして、意味プロセッサ136は残りの領域から源文書の源意味を決定する。マッチングプロセッサ137は、源文書の源意味と項目集合のうちの一つの項目の意味をマッチさせる。
【0018】
コンテンツサーバデバイス140内のメモリ144は、コンテンツエンジン146として知られるコンテンツエンジンアプリケーションプログラムを記憶している。図示された本実施形態のコンテンツエンジンは、メモリ144のコンピュータコードを備える。コンテンツエンジン146は、文書サーバデバイス104からマッチした項目を受けとり、その項目もしくはそれに関連するコンテンツを源文書内に掲載する。一実施形態では、コンテンツエンジン146は、マッチングエンジン137からマッチしたキーワードを受けとり、広告等の文書とそれを関連づける。そして、要求者のウェブサイトにその広告が送られ、源文書内、例えば、ウェブページのフレーム内に掲載される。
【0019】
また、文書サーバデバイス104は、意味データベース120として示されている本例における意味記憶素子等の記憶素子をアクセスする。意味データベースを用いることによって、源文書に関連する意味を記憶することができる。また、コンテンツサーバデバイス140は、コンテンツデータベース148として示されている本例におけるコンテンツ記憶素子等の記憶素子をアクセスする。コンテンツデータベースを用いることによって、キーワードや関連広告等の項目やそれに関連するコンテンツを記憶することができる。データ記憶素子には、これに限定されることはないが、配列、ハッシュテーブル、リスト、ペアを含むデータを記憶する一方法かもしくは複数の方法を組み合わせた方法を備えていてもよい。サーバデバイス104、140は、その他の同様なデータ記憶装置をアクセスすることができる。
【0020】
尚、本発明は図1に示すアーキテクチャとは異なるアーキテクチャを有するシステムを備えていてもよいことに注目されたい。例えば、本発明に係るシステムの中には、プリプロセッサ134や意味プロセッサ136が文書エンジン124の一部分でなくて、それらの動作をオフラインで実行するものもある。一実施形態では、文書エンジンがウェブページ等の文書を巡回する際に、文書の意味が周期的に決定される。別の一実施形態では、文書内に掲載するコンテンツのリクエストを受信したときに文書の意味が決定される。図1に示すシステム100は単なる一例であり、これを用いて図2から図3に示す方法の例を説明する。
【0021】
図1に示す本実施形態によれば、ユーザ112aは、ネットワーク106に接続されたデバイス上の文書、例えば、ウェブサイトのウェブページをアクセスすることができる。例えば、ユーザ112aは、ニュースウェブサイト上のワシントンでの鮭フライフィッシングに関するストーリを含むウェブページをアクセスすることができる。本例では、ウェブページは次の4つの領域を含んでいる。即ち、ストーリのタイトル、著者名、ストーリの一文要旨を含むタイトルセクション、ストーリの本文と写真を含む主ストーリセクション、自動車販売関連のバナー広告、ウェブサイト内の全国ニュースや天気やスポーツ等のその他のウェブページへのリンクを含むリンクセクションである。ニュースウェブサイトの所有者は、源のウェブページの広告スペースの販売を望んでいるため、ウェブページに表示する広告等の項目のリクエストをネットワーク106を介して文書サーバ104に送る。
【0022】
源のウェブページと項目をマッチさせるために、最初に源のウェブページの意味を決定する。文書エンジン124は源のウェブページをアクセスして、ウェブページを受けとる。ウェブページの源意味は既に決定されていてもよく、また、意味データベース120に記憶していてもよい。源意味が既に決定されている場合は、文書エンジン124は源意味を検索する。
【0023】
ウェブページの源意味がまだ決定されていない場合は、プリプロセッサ134は、まずウェブページとウェブページの領域内に含まれる概念を識別する。例えば、プリプロセッサは、ウェブページがタイトル領域、ストーリ領域、バナー広告領域、リンク領域に対応する4つの領域を備えることと、ウェブページが鮭、フライフィッシング、ワシントン、自動車、ニュース、天気、スポーツに関連する概念を含むことを決定する。これらの領域は、必ずしもウェブページのフレームに対応する必要はない。そして、意味エンジンは、領域毎に局所的概念を決定し、局所的概念の全てのランクづけを行う。様々な重み付け因子、例えば、領域の重要性、概念の重要性、概念の頻度、概念が領域に出現する回数、概念の範囲を用いることによって、概念のランクづけを行うことができる。
【0024】
その後、意味エンジン136は主流の概念に関連しない領域を識別し、それらに関連する局所的概念を削除する。本例では、バナー領域とリンク領域はストーリに特に関連する概念を含んでいないため、これらの領域に関連する概念が削除される。そして、意味エンジンは残りの概念に基づいて源を確認する。意味は重み付けられた概念ベクトルであってもよい。例えば、意味は、鮭(40%)、フライフィッシング(40%)、ワシントン(20%)であってもよい。
【0025】
マッチングプロセッサ137によって、この意味を項目とマッチさせることができる。項目には、ウェブページや広告等の文書とキーワード等の知識項目を含めることができ、コンテンツサーバデバイス140から受けとることができる。項目は、コンテンツデータベース148に記憶することができる。例えば、項目がフライフィッシング、バックパッキング、CD、旅行等のキーワードの場合、マッチングエンジンは源意味とこれらのキーワードに関連する意味を比較してマッチ度を調べる。また、各キーワードに関連するクリック単位コストのデータ等のバイアス因子を用いてもよい。例えば、フライフィッシングというキーワードの意味が、旅行というキーワードの意味よりもマッチ度が高くても、旅行というキーワードを現在購入した広告主がより高いクリック単位のコスト・レートをもつ場合、意味エンジンは、源意味と旅行というキーワードをマッチさせる。また、コンテンツフィルタを用いることによって、成人向けコンテンツや微妙な内容のコンテンツにフィルタをかけることができる。
【0026】
コンテンツサーバデバイス140は、マッチしたキーワードを受けとることができる。コンテンツエンジン146はマッチしたキーワードと広告を関連づけ、それを源ウェブページに表示する。例えば、旅行というキーワードがマッチした場合、コンテンツエンジンは、ワシントンでの鮭フライフィッシングに関するストーリを含む源ウェブページに、旅行というキーワードに関連する広告を表示する。ユーザ112aが自分の入力デバイスでその広告を指し示してクリックすると、ユーザは広告に関連するウェブページに導かれる。
【0027】
本発明に係る様々な方法を実行することが可能である。本発明に係る方法の一例は、源記事をアクセスする工程と、源記事内の複数の領域を識別する工程と、各領域に関連する少なくとも一つの局所的概念を決定する工程と、各局所的概念を解析して無関連領域を識別する工程と、無関連領域に関連する局所的概念を削除して関連概念を決定する工程と、関連概念を解析して源記事の源意味を決定する工程と、源意味を項目集合のうちの一つに関連する項目意味とマッチさせる工程とを含む。バイアス因子を用いることによって、源意味と項目意味をマッチさせることもできる。源意味は重み付けられた概念ベクトルであってもよい。
【0028】
実施形態の中には、マッチした項目を源記事に表示する方法もある。これらの実施形態では、源記事はウェブページであってよく、マッチした項目はキーワードであってもよい。また、源記事はウェブページであってもよく、マッチした項目は広告であってもよい。
【0029】
実施形態の中には、マッチした項目に関連するコンテンツを源記事に表示する方法もある。これらの実施形態では、源記事はウェブページであってもよく、マッチした項目はキーワードであってもよく、関連コンテンツは広告であってもよい。さらに、源記事は第一のウェブページであってもよく、マッチした項目は第二のウェブページであってもよく、関連コンテンツは広告であってもよい。また、源記事は第一のウェブページであってもよく、マッチした項目は第二のウェブページであってもよく、関連コンテンツは第二のウェブページへのリンクであってもよい。
【0030】
実施形態の中には、少なくとも一つの局所的概念を決定するには各領域内の局所的概念毎にスコアを決定する必要があるものもある。各領域内で最高スコアの局所的概念は最も関連性のある局所的概念である。さらに、無関連な領域を識別するには、最初に、局所的概念毎に修正後スコアを決定する必要がある。次に、修正後スコアに基づいてランクづけされた全ての局所的概念を含むグローバルリストを決定する。修正後スコアの組み合わせの寄与がグローバルリストの合計スコアの所定量未満である局所的概念を削除して、結果リストを作成する。そして、その結果リスト内で、全く関連しない局所的概念をもつ無関連領域を決定する。続いて、無関連領域に関連する局所的概念を結果リストから削除して、関連概念リストを作成する。さらに、関連概念の修正後スコアを正規化することによって源意味を決定する。
【0031】
本発明に係る別の方法の一例は、源記事をアクセスする工程と、上記源記事の少なくとも第一のコンテンツ領域と第二のコンテンツ領域を識別する工程と、少なくとも第一のコンテンツ領域に関連する第一の局所的概念と第二のコンテンツ領域に関連する第二の局所的概念を決定する工程と、少なくとも第一の局所的概念の一部に基づいて項目集合のうちの第一の項目と第一のコンテンツ領域をマッチさせ少なくとも第二の局所的概念の一部に基づいて項目集合のうちの第二の項目と第二のコンテンツ領域をマッチさせる工程とを含む。
【0032】
図2と図3に本発明に係る一例としての方法200を詳細に示す。この方法は一例として示したものであって、本発明に係る方法を実行するには多くの方法がある。図2に示す方法200は様々なシステムで実行可能であるかもしくは達成可能である。以下、図1に示されるシステム100によって実行される方法200を一例として説明し、システム100の各要素を参照して、図2と図3の方法の例を説明する。図示された方法200は、源文書の意味を決定し、その源文書を項目とマッチさせるものである。
【0033】
図2と図3に示す各ブロックは、一例としての方法200において実行される一つ以上の工程を表わす。図2のブロック202から方法200が開始する。ブロック202に続くブロック204では、文書がアクセスされる。例えば、ネットワーク106上のデバイスやその他の源からその文書にアクセスしたり、受けとることが可能である。
【0034】
ブロック204に続くブロック206では、源文書の意味を決定する。図示された実施形態では、文書を領域に分割し、不要な領域を削除し、文書の残りの領域に含まれる概念を解析することによって源文書の意味を決定する。例えば、図示された本実施形態では、プリプロセッサ134は、まず、源文書に含まれる概念を決定し、その文書内の領域を決定する。意味プロセッサ136は概念をランクづけし、主流の概念に関連しない領域とその領域に関連する概念を削除する。意味プロセッサ136は、意味概念から文書の源意味を決定する。
【0035】
図3は、図2に示した方法200を実行するためのサブルーチン206の一例を示す。サブルーチン206は、受信した源文書の意味を提供するものである。サブルーチンの一例を以下に示す。
【0036】
ブロック300からサブルーチンが開始する。ブロック300では源文書を前処理して、その文書内に含まれる概念を決定する。この処理は、自然言語・テキスト処理によって実行し、文書を解読して単語にして、それらの単語を概念と整合させることによって達成される。一実施形態では、例えば、自然言語・テキスト処理によって単語にマッチするトークンをまず決定し、相関する意味の意味ネットワークに含まれるトークンとマッチさせる。マッチしたトークンに基づいて意味ネットワークから用語が決定される。そして、決定した用語の概念が割り当てられ、用語に関連する確率が与えられる。
【0037】
ブロック300に続くブロック302では、文書の領域を識別する。文書の領域は、例えば、フォーマット情報を含む特定の経験則に基づいて決定することができる。例えば、源文書はHTMLラベルを含むウェブページであり、そのラベルを用いることによって領域を識別することができる。例えば、<title>....</title>に含まれるテキストには、タイトル領域のテキストとしてマークづけすることができる。テキストの70%以上がタグ<a>....</a>に含まれるパラグラフ内のテキストは、リンク領域内のテキストとしてマーク付けすることができる。また、テキストの構造によって領域を識別することもできる。例えば、動詞がない等の文構造がなかったり、単語が余りに少なかったり、文の終りを示す句読点がない短パラグラフのテキストもしくは表の縦列には、リスト領域内に存在しているとしてマーク付けすることができる。動詞や句読点を含む長文のテキストには、テキスト領域の一部としてマーク付けすることができる。領域の型を変更すると、新たな型としてマーク付けされたテキストから始まる新たな領域を作成することができる。一実施形態では、テキスト領域が文書の20%を超える場合は、それをさらに小さく分割することができる。
【0038】
ブロック302に続くブロック304では、領域毎に最も関連する概念を決定する。図示された本実施形態の意味プロセッサ136は、領域毎に識別された概念を処理して、領域毎に小さい局所的概念集合を見つける。概念の範囲、領域内での概念の発生頻度、概念間の関係を用いることによって、局所的概念を決定することができる。
【0039】
一実施形態では、領域毎の各概念がリストに加えられる。様々な因子を用いて概念毎にスコアを決定することによって、リスト内の概念にランクづけすることができる。例えば、第一の概念がその他の概念と強く関連する場合は、これを利用することによって第一の概念とそれに関連する概念のスコアを増加させる。第一の概念の発生頻度と第一の概念の焦点(即ち、範囲)に基づいてこの効果を調整して、非常に一般的な概念とより広い意味での概念を区別することができる。頻度が特定の閾値を上回る概念にはフィルタをかけることができる。また、認識される概念の重要性は概念のスコアに影響を与える。例えば、概念の包摂を引き起こす単語が太字でマーク付けされているかどうかによって、初期の処理段階で概念の重要性を決定することができる。領域毎に概念をランクづけした後で最も関連のない概念を削除する。これは、最高ランクの概念の設定番号を選択するか、特定のスコアよりも低いランクスコアを持つ概念を削除することによって行うことができる。
【0040】
ブロック304に続くブロック306では、領域毎に全ての局所的概念が組み合わされて解析される。図示された本実施形態の意味プロセッサ136は、領域毎の全ての局所的概念を受けとり、例えば、局所的概念毎のスコアに基づいて全ての局所的概念にランクづけしたグローバルリストを作成する。各領域の重要性等のバイアス因子を用いることによってスコアを決定することができる。各領域の重要性は領域の型やその大きさによって決定してもよい。例えば、タイトル領域はリンク領域よりも重要であると考えられる。また、タイトル領域に出現する概念はリンク領域に表示される概念よりも大きな重み付けをしてもよい。また、一つ以上の領域に出現する概念にはさらに大きな重み付けをしてもよい。例えば、概念の類義語をマージしてそれらのスコアを合計してもよい。そして、このグローバルリストをソートして、例えば、スコアの合計の20%未満の部分に寄与する付随概念を削除して、結果的に局所的概念のグローバルリストを作成する。
【0041】
ブロック306に続くブロック308では、主概念と無関連概念が関連する領域が削除される。図示された本実施形態の意味プロセッサ136は、無関連領域、即ち、主流の概念に関連していない概念を含む領域を決定して削除する。ここで、「関連のある」や「無関連」ということは絶対的な基準を用いて決定する必要はないことを理解されたい。「関連のある」は、比較的関連度が高いことや所定の関連度があることを示す。一方、「無関連」は、比較的関連度が低いことや所定の関連度であることを示す。無関連領域を削除することによって、関連づけられた無関連概念を削除することができる。例えば、源文書が様々なフレームからなるウェブページの場合、フレームの中には広告に関連するかもしくはウェブサイト内のその他のページにリンクしているものもあるため、ウェブページの主意味とは関連していない場合がある。
【0042】
一実施形態では、例えば、ブロック306で決定され結果として得られたグローバルリストは文書の意味に近いものであってもよく、また、それを用いて文書の意味に無関連な領域を削除することができる。意味プロセッサ136は、領域毎に最も代表的な局所的概念が、結果として得られたグローバルリストに存在するかどうかを確認することができる。領域で最も代表的な局所的概念がリストに存在しない場合、その領域を無関連としてマーク付けすることができる。領域で最も代表的な局所的概念は、例えばブロック304で決定されたように、その領域で最高スコアを持つ概念であってもよい。
【0043】
ブロック308に続くブロック310では、源文書の意味を決定する。図示された本実施形態の意味プロセッサ136は、削除されなかった領域の局所的概念の代表度を再計算して、概念の関連リストを作成する。そして、関連リストに含まれるこれらの局所的概念は一定の数の概念にまで削減されて意味リストが提供される。次に、それを正規化して一つの源意味を提供する。例えば、関連領域内に含まれる概念のみを用いて意味リストを作成し、25個の最高スコア概念を除く全ての概念が新規リストから削除される。この最高スコア概念のスコアを正規化することによって、源意味を提供することができる。本例では、源意味は重み付けられた関連概念ベクトルであってもよい。
【0044】
再び図2に戻って、ブロック206に続くブロック208では、項目集合が受けとられる。例えば、マッチングプロセッサ137が、この項目集合をコンテンツサーバデバイス140から受けとることができる。この項目集合は、キーワード等の知識項目や広告やウェブページ等の文書を含んでいてもよい。受けとられた各項目はそれに関連する意味を備えていてもよい。例えば、本願の援用文献である米国特許出願番号10/690,328(代理人判決要録53051/288072)の「知識項目に関する情報を用いて知識項目の意味を理解する方法及びシステム」に記載されているように、キーワードに関連する情報を用いてキーワードの意味を決定してもよい。文書の意味は、例えば、図3に関して説明した方法と同様に決定することができる。
【0045】
ブロック208に続くブロック210では、源文書と項目をマッチさせる。マッチング処理ではバイアス因子を用いてもよい。一実施形態では、例えば、源意味と一連のキーワードのうちの一つに関連するキーワードの意味をマッチさせる。マッチングエンジンは源意味とキーワードの意味を比較し、キーワードに関連するクリック単位コストのデータ等のバイアス因子を用いてマッチ度を決定する。そして、マッチしたキーワードをコンテンツサーバデバイス140に送ることができる。コンテンツエンジン146は、マッチしたキーワードとその関連広告をマッチさせ、源文書にその広告を表示することができる。また、コンテンツエンジンはキーワード自体を源文書に表示することができる。別の一実施形態では、広告の意味と源意味をマッチさせる。本実施形態のコンテンツエンジン146は、マッチした広告を源文書に表示することができる。別の一実施形態では、ウェブページの意味と源意味をマッチさせる。本実施形態のコンテンツエンジン146は、ウェブページに関連する広告を表示することができる。ブロック210に続くロック212で本方法は終了する。
【0046】
一実施形態では、源文書がアクセスされると、プリプロセッサ134が源文書を解析して、源文書のコンテンツ領域を決定する。コンテンツ領域はたくさんのテキストを含む領域、例えば、テキスト領域やリンク領域であってもよく、また、比較的重要な領域、例えば、タイトル領域であってもよい。これらの領域は、上述したように経験則に基づいて決定してもよい。また上述したように、プリプロセッサ134は各コンテンツ領域の概念を識別することもできる。意味プロセッサ136はこれらの概念を用いることによってコンテンツ領域毎に意味を決定することができる。マッチングプロセッサ137は各コンテンツ領域の意味とキーワードをマッチさせることができる。コンテンツエンジン146は、マッチしたキーワードとその関連広告をマッチさせて、源文書にその広告を表示することができる。また、コンテンツエンジンはキーワード自体を源文書に表示することができる。別の一実施形態では、広告の意味を領域の意味とマッチさせる。本実施形態のコンテンツエンジン146は、マッチした広告を源文書に表示することができる。別の一実施形態では、ウェブページの意味を領域意味とマッチさせる。本実施形態のコンテンツエンジン146は、ウェブページに関連する広告を表示することができる。一実施形態では、広告やキーワードはそれらが対応するコンテンツ領域に表示される。
【0047】
上の記載には多くの仕様が含まれ、これらの仕様は本発明の範囲に限定されるものではなく、開示された実施形態の例を単に示すものである。当業者であれば、本発明の範囲内でその他の多くの変更が可能であろう。
【図面の簡単な説明】
【0048】
【図1】本発明の一実施形態に係るシステムのブロック図である。
【図2】本発明の一実施形態に係る方法のフロー図である。
【図3】図2に示す方法のサブルーチンのフロー図である。
【符号の説明】
【0049】
102a クライアント
102b クライアント
102n クライアント
104 文書サーバデバイス
106 ネットワーク
110 プロセッサ
114 入力
116 プロセッサ
118 メモリ
120 意味データベース
124 文書エンジン
134 プリプロセッサ
136 意味プロセッサ
137 マッチングプロセッサ
140 コンテンツサーバデバイス
142 プロセッサ
144 メモリ
146 コンテンツエンジン
148 コンテンツデータベース

Claims (28)

  1. ウェブページ文書を項目にマッチさせるべく、複数のコンピュータプロセッサのネットワーク又は一のコンピュータシステムとして実装されて文書エンジンを実行する文書サーバが行う方法であって、
    源ウェブページ文書を他のデバイスから受けとる工程と、
    前記源ウェブページ文書内の複数の領域を識別する工程と、
    前記複数の領域のそれぞれに表現された少なくとも1つの局所的概念を決定する工程であって、当該決定は前記源ウェブページを複数の単語に解読する自然言語及びテキスト処理と、前記単語と概念との整合とを含み、前記局所的概念は前記複数の領域の1つに一以上の単語によって表現された概念である工程と、
    各領域の前記局所的概念を、他の局所的概念との関連性が相対的に低い程度、前記他の局所的概念との関連性が所定の程度、又はその双方である無関連概念を識別することで解析する工程と、
    前記源ウェブページ文書に表現された代表概念ベクトルである前記源ウェブページ文書の源意味の決定により前記無関連概念を削除する工程と、
    前記源ウェブページ文書を一群の項目群から選択された項目にマッチさせる工程であって、当該マッチは前記源意味と前記項目に含まれるキーワードとを比較することによって行われる工程と
    含む方法。
  2. 前記マッチした項目をディスプレイデバイスの前記源ウェブページ文書に表示する工程をさらに含む、請求項1記載の方法。
  3. 前記マッチした項目は広告を含む、請求項2記載の方法。
  4. 前記マッチした項目に関連するコンテンツを前記源ウェブページ文書に表示する工程をさらに含む、請求項1記載の方法。
  5. 前記関連するコンテンツは広告を含む、請求項4記載の方法。
  6. 前記マッチした項目は第二のウェブページを含み、前記関連するコンテンツは広告を含む、請求項4記載の方法。
  7. 前記マッチした項目は第二のウェブページを含み、前記関連するコンテンツは前記第二のウェブページへのリンクを含む、請求項4記載の方法。
  8. 前記源ウェブページ文書を前記項目にマッチさせる工程は、バイアス因子を用いて前記源ウェブページ文書を前記項目にマッチさせる工程を含む、請求項1記載の方法。
  9. 前記源意味は重み付けられた概念ベクトルを含む、請求項1記載の方法。
  10. 前記少なくとも一つの局所的概念を決定する工程は、各局所的概念毎にスコアを決定する工程を含み、
    各領域で最高スコアを持つ前記局所的概念は当該領域に対して最も関連する局所的概念を含む、請求項1記載の方法。
  11. 前記無関連概念を識別する工程は、
    各局所的概念毎に修正後スコアを決定する工程と、
    前記修正後スコアに基づいて全ての局所的概念のランクづけしたグローバルリストを決定する工程と、
    前記修正後スコアの組み合わせの寄与が前記グローバルリストの合計スコアの所定量未満である局所的概念を削除して結果リストを作成する工程と、
    前記結果リストに最も関連性の高い局所的概念を含まない無関連領域を識別する工程と、
    前記無関連領域に表現された局所的概念を前記結果リストから削除して関連概念リストを作成する工程と
    を含む、請求項10記載の方法。
  12. 前記源意味の決定は、前記修正後スコアを前記関連概念に対して正規化する工程を含む、請求項11記載の方法。
  13. ウェブページ文書を項目にマッチさせる文書エンジンプログラムであって、
    前記文書エンジンプログラムは、複数のコンピュータプロセッサのネットワーク又は一のコンピュータシステムとして実装される文書サーバに、請求項1から12のいずれか1項に記載の方法を行わせるべく動作可能である文書エンジンプログラム。
  14. ウェブページ文書内の領域を広告にマッチさせるべく、複数のコンピュータプロセッサのネットワーク又は一のコンピュータシステムとして実装されて文書エンジンを実行する文書サーバが行う方法であって、
    源ウェブページ文書を他のデバイスから受けとる工程と、
    前記源ウェブページ文書内の第一のコンテンツ領域と第二のコンテンツ領域を識別する工程と、
    前記第一のコンテンツ領域に表現された第一の局所的概念を決定し、前記第二のコンテンツ領域に表現された少なくとも第二の局所的概念を決定する工程であって、前記第一及び第二の局所的概念の決定は前記第一及び第二のコンテンツ領域を単語に解読する自然言語及びテキスト処理と、前記単語と概念との整合とを含み、前記局所的概念は前記コンテンツ領域の1つに一以上の単語により表現された概念である工程と、
    前記第一の局所的概念を一群の広告からの第一の広告にマッチさせる工程であって、当該マッチは前記第一の局所的概念と前記第一の広告の意味とを比較することによる工程と、
    前記第二の局所的概念を前記一群の広告からの第二の広告にマッチさせる工程であって、当該マッチは前記第二の局所的概念と前記第二の広告の意味とを比較することによる工程と、
    前記マッチした広告をディスプレイデバイスの前記源ウェブページ文書に表示する工程と
    を含み、
    前記マッチした広告を表示する工程は、
    前記第一のコンテンツ領域に第一の広告を表示する工程と、
    前記第二のコンテンツ領域に第二の広告を表示する工程と
    を含む方法。
  15. ウェブページ文書に対する源意味を決定するべく、複数のコンピュータプロセッサのネットワーク又は一のコンピュータシステムとして実装されて文書エンジンを実行する文書サーバが行う方法であって、
    前記ウェブページ文書を他のデバイスから受けとる工程と、
    前記ウェブページ文書内の複数の異なる領域の集合を識別する工程と、
    前記集合中の前記複数の異なる領域のそれぞれに表現された概念を決定する工程であって、当該決定は前記異なる領域を複数の単語に解読する自然言語及びテキスト処理と、前記単語と前記概念との整合とを含む工程と、
    第一の領域に表示された第一の概念を識別する工程であって、前記第一の概念は、前記集合中の他の領域に表現された概念との関連性が相対的に低い程度、前記他の領域に表現された前記概念との関連性が所定の程度、又はその双方である無関連概念である工程と、
    前記ウェブページ文書に対する前記源意味の決定から前記第一の概念を除外する工程と、
    前記ウェブページ文書に対する前記源意味を決定する工程と、
    前記源意味を利用可能とする工程と
    を含む方法。
  16. 前記ウェブページ文書内の前記異なる領域の集合を識別する工程は、前記ウェブページ文書内のフレームを識別することを含む、請求項15記載の方法。
  17. 前記ウェブページ文書内の前記異なる領域の集合を識別する工程は、前記異なる領域を前記ウェブページ文書内のマークアップに基づいて識別する工程を含む、請求項15記載の方法。
  18. 前記概念を決定する工程は、前記集合中の前記異なる領域のそれぞれにおいて関連する単語の集合を識別する工程を含む、請求項15記載の方法。
  19. 前記集合中の前記異なる領域のそれぞれに表現された前記概念に基づいて一以上の広告を選択する工程をさらに含む、請求項15記載の方法。
  20. 前記第一の概念を識別する工程は、
    前記概念のそれぞれに対してスコアを決定する工程と、
    前記スコアに基づいて前記概念の全てを含むランクづけされたグローバルリストを決定する工程と
    を含み、
    前記第一の概念を除外する工程は、前記スコアの組み合わせの寄与が前記グローバルリストの合計スコアの所定量未満である局所的概念を除外する工程を含む、請求項19に記載の方法。
  21. 前記源ウェブページ文書内の前記複数の領域を識別する工程は、前記複数の領域を識別するときにマークアップ言語のラベルを使用することを含む、請求項1に記載の方法。
  22. 前記源ウェブページ文書内の前記複数の領域を識別する工程は、前記ウェブページ内のフレームに対応する領域を識別することを含む、請求項1に記載の方法。
  23. 前記源ウェブページ文書内の前記複数の領域を識別する工程は、前記複数の領域を識別するときに前記源ウェブページ文書内のテキスト構造を使用することを含む、請求項1に記載の方法。
  24. 前記テキスト構造を使用することは、動詞及び句読点をテキスト領域の一部として有する文のテキストを識別することを含む、請求項23に記載の方法。
  25. 前記テキスト構造を使用することは、文の構造を有しないテキストをリスト領域内に存在するとして識別することを含む、請求項23に記載の方法。
  26. 前記源ウェブページ文書内の第一及び第二のコンテンツ領域を識別する工程は、前記第一及び第二のコンテンツ領域を識別するときにマークアップ言語のラベルを使用することを含む、請求項14に記載の方法。
  27. 前記源ウェブページ文書内の第一及び第二のコンテンツ領域を識別する工程は、前記ウェブページ内のフレームに対応する前記第一及び第二のコンテンツ領域を識別することを含む、請求項14に記載の方法。
  28. 前記源ウェブページ文書内の第一及び第二のコンテンツ領域を識別する工程は、前記第一及び第二のコンテンツ領域を識別するときに前記源ウェブページ文書内のテキスト構造を使用することを含む、請求項14に記載の方法。
JP2006521945A 2003-07-30 2004-07-23 文書の意味を決定して文書とコンテンツを一致させる方法及びシステム Expired - Fee Related JP4825669B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US49142203P 2003-07-30 2003-07-30
US60/491,422 2003-07-30
US10/689,903 US8914361B2 (en) 1999-09-22 2003-10-21 Methods and systems for determining a meaning of a document to match the document to content
US10/689,903 2003-10-21
PCT/US2004/023827 WO2005013150A1 (en) 2003-07-30 2004-07-23 Methods and systems for determining a meaning of a document to match the document to content

Publications (3)

Publication Number Publication Date
JP2007500900A JP2007500900A (ja) 2007-01-18
JP2007500900A5 JP2007500900A5 (ja) 2010-06-24
JP4825669B2 true JP4825669B2 (ja) 2011-11-30

Family

ID=36947555

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006521945A Expired - Fee Related JP4825669B2 (ja) 2003-07-30 2004-07-23 文書の意味を決定して文書とコンテンツを一致させる方法及びシステム
JP2006521944A Active JP4829789B2 (ja) 2003-07-30 2004-07-23 キーワードの翻訳方法及びコンピュータ読取可能媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006521944A Active JP4829789B2 (ja) 2003-07-30 2004-07-23 キーワードの翻訳方法及びコンピュータ読取可能媒体

Country Status (2)

Country Link
JP (2) JP4825669B2 (ja)
CN (3) CN101482881B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4740630B2 (ja) * 2005-04-14 2011-08-03 株式会社リコー 流行創出型広告方法及びプログラム
US7958126B2 (en) * 2006-12-19 2011-06-07 Yahoo! Inc. Techniques for including collection items in search results
CN101004753B (zh) * 2007-01-25 2010-08-11 北京搜狗科技发展有限公司 一种概念型文档的识别方法和系统
CN101404031B (zh) * 2008-11-12 2012-05-30 北京搜狗科技发展有限公司 识别概念型网页的方法与系统
JP2010237779A (ja) * 2009-03-30 2010-10-21 Mitsubishi Space Software Kk 広告選択サーバ及び広告選択方法及びプログラム
AU2010201495B2 (en) 2009-04-16 2012-04-12 Accenture Global Services Limited Touchpoint customization system
US9177057B2 (en) 2010-06-08 2015-11-03 Microsoft Technology Licensing, Llc Re-ranking search results based on lexical and ontological concepts
US9779385B2 (en) * 2011-06-24 2017-10-03 Facebook, Inc. Inferring topics from social networking system communications
CN105335163A (zh) * 2015-11-30 2016-02-17 上海斐讯数据通信技术有限公司 软件代码解读方法与系统
CN108363696A (zh) * 2018-02-24 2018-08-03 李小明 一种文本信息的处理方法及装置
CN111507813B (zh) * 2020-04-21 2023-05-12 江西省机电设备招标有限公司 一种投标人身份的认定方法及招投标方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2002334106A (ja) * 2001-05-11 2002-11-22 Fujitsu Ltd 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
JP2003044517A (ja) * 2001-07-27 2003-02-14 Univ Nihon インターネット検索結果修飾方法及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960383A (en) * 1997-02-25 1999-09-28 Digital Equipment Corporation Extraction of key sections from texts using automatic indexing techniques
US6473730B1 (en) * 1999-04-12 2002-10-29 The Trustees Of Columbia University In The City Of New York Method and system for topical segmentation, segment significance and segment function
CN1185595C (zh) * 2001-09-05 2005-01-19 联想(北京)有限公司 主题词抗干扰提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2002334106A (ja) * 2001-05-11 2002-11-22 Fujitsu Ltd 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
JP2003044517A (ja) * 2001-07-27 2003-02-14 Univ Nihon インターネット検索結果修飾方法及びプログラム

Also Published As

Publication number Publication date
JP2007500899A (ja) 2007-01-18
CN101482881A (zh) 2009-07-15
CN1829989A (zh) 2006-09-06
CN100470541C (zh) 2009-03-18
JP2007500900A (ja) 2007-01-18
CN1829990A (zh) 2006-09-06
CN101482881B (zh) 2013-12-11
JP4829789B2 (ja) 2011-12-07

Similar Documents

Publication Publication Date Title
AU2010241249B2 (en) Methods and systems for determining a meaning of a document to match the document to content
AU2004262302B2 (en) Methods and systems for understanding a meaning of a knowledge item using information associated with the knowledge item
Savov et al. Identifying breakthrough scientific papers
US8306962B1 (en) Generating targeted paid search campaigns
JP4647623B2 (ja) ユニバーサル・サーチエンジンのインターフェイス
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US20100235311A1 (en) Question and answer search
US20100235343A1 (en) Predicting Interestingness of Questions in Community Question Answering
US20050091106A1 (en) Selecting ads for a web page based on keywords located on the web page
US20130191391A1 (en) Personalization engine for building a dynamic classification dictionary
BRPI0809485A2 (pt) Identificação de conteúdo de perfil aberto
US20090313227A1 (en) Searching Using Patterns of Usage
US20120254149A1 (en) Brand results ranking process based on degree of positive or negative comments about brands related to search request terms
US20130110594A1 (en) Ad copy determination
JP4825669B2 (ja) 文書の意味を決定して文書とコンテンツを一致させる方法及びシステム
US8843536B1 (en) Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries
JP2020057188A (ja) 提供装置、提供方法及び提供プログラム
US20080306931A1 (en) Event Weighting Method and System
US8046350B1 (en) Systems and methods for detecting commercial queries
AU2011235994A1 (en) Methods and systems for determining a meaning of a document to match the document to content
WO2024074760A1 (en) Content management arrangement
Spink et al. Commerce related Web search: Current trends

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100409

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100416

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20100510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110427

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110531

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110630

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110912

R150 Certificate of patent or registration of utility model

Ref document number: 4825669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees