JP4783476B2 - 広告イメージまたは非広告イメージとしてのイメージの分類 - Google Patents

広告イメージまたは非広告イメージとしてのイメージの分類 Download PDF

Info

Publication number
JP4783476B2
JP4783476B2 JP2010512411A JP2010512411A JP4783476B2 JP 4783476 B2 JP4783476 B2 JP 4783476B2 JP 2010512411 A JP2010512411 A JP 2010512411A JP 2010512411 A JP2010512411 A JP 2010512411A JP 4783476 B2 JP4783476 B2 JP 4783476B2
Authority
JP
Japan
Prior art keywords
image
advertising
features
feature
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010512411A
Other languages
English (en)
Other versions
JP2010537263A5 (ja
JP2010537263A (ja
Inventor
リー ミンジン
リー チーウェイ
リー ドンファン
ワン ビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010537263A publication Critical patent/JP2010537263A/ja
Publication of JP2010537263A5 publication Critical patent/JP2010537263A5/ja
Application granted granted Critical
Publication of JP4783476B2 publication Critical patent/JP4783476B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、広告イメージまたは非広告イメージとしてのイメージを分類する方法およびシステムに関する。
多くのWebサイトのプロバイダは収入源としてオンライン広告に頼っている。プロバイダは、自身のWebサイトのWebページに組み込まれている広告を提供するためにサードパーティの広告サーバに頼ることがある。Webページが生成されるとき、広告スペースは、広告サーバを参照するハイパーリンクでもってWebページ上に割り振られることがある。Webページがブラウザによって表示されるとき、ブラウザはリクエストを広告サーバに送ることによってハイパーリンクを解決している。広告サーバは該当する広告を特定し、その広告をブラウザに返しているが、その広告には広告される内容に関係するWebページへのリンクが含まれていることがある。そのあと、ブラウザは広告をWebページの一部として表示している。Webページのプロバイダには、ユーザが広告のハイパーリンクを選択したときその広告についての報酬が支払われることがある。
収入増加の可能性を向上させるために、Webページのプロバイダは、Webページを広告で一杯にすることがある。しかし、Webページが広告で一杯になると、負の結果が生じるおそれがある。例えば、ハンドヘルドパーソナルコンピュータやセルフォン、PDA(personal digital assistant)などのモバイルデバイスがインターネットにアクセスする方法としてますます普及している。残念ながら、これらのモバイルデバイスを使用してユーザが多数の広告を含むWebページにアクセスするときの経験は満足されるものではなかった。第一に、これらのモバイルデバイスは表示域が小さいため、多数の広告を含むWebページをこのような小さな表示域に効果的に表示することが困難になっている。第二に、これらのモバイルデバイスは、通信リンク(例えば、セルフォンネットワーク経由の)が比較的低速であるのが代表的であるため、アクセスしたWebページが広告で一杯なっているときそのWebページをダウンロードするのに容認し得ない程の長時間を要することがある。第三に、モバイルデバイスはコンピューティングパワーに制約があるため、広告で一杯になったWebページをレンダリングすることも、容認し得ない程の長時間を要することがある。
別の例として、多くの検索エンジンサービス(search engine service)は、Webページを介してアクセス可能なイメージを検索する機能を備えている。これらの検索エンジンサービスは、ユーザに関心のある可能性のあるイメージをユーザが検索するのを可能にしている。検索語(search term)を含む検索リクエスト(すなわち、クエリ)をユーザがサブミットしたあと、検索エンジンサービスは、これらの検索語に関係する可能性のあるイメージを特定する。関連するイメージの特定を高速化するために、検索エンジンサービスは、キーワードとイメージとを対応付けたマッピングまたはインデックスを維持していることがある。このマッピングは、イメージを収めているWebページのキーワードを特定するためにWeb(すなわち、ワールドワイドウェブをクローリング(crawling)することによって生成されることがある。Webをクローリングするために、検索エンジンサービスはルートWebページのリストを使用して、これらのルートWebページを通してアクセス可能であるすべてのWebページを特定することがある。検索エンジンサービスはWebページ上のあるイメージを特定すると、そのイメージをマッピングに追加する。Webページのイメージの多くは広告の一部であるイメージであるので、マッピングは広告のイメージを収めているが、これらの広告は、イメージを検索するユーザにとって関心がないのが一般的である。広告のイメージが非常に多数存在するときは、検索エンジンサービスがマッピングを生成するのに長い時間を要し、マッピングはより多くのシステムリソースを消費し、マッピングにアクセスするのに長い時間を要するため、検索結果にはユーザにとって関心のない広告のイメージが多数含まれていることがある。
表示ページのイメージを広告イメージまたは非広告イメージとして特定することが提供されている。広告イメージ分類システム(advertisement image classification system)は、イメージを広告イメージまたは非広告イメージとして分類するようにバイナリクラシファイア(binary classifier)をトレーニングし、そのあと、そのバイナリクラシファイアを使用してWebページなどの表示ページのイメージを広告イメージまたは非広告イメージとして分類する。トレーニングフェーズ期間に、分類システムはイメージを含むWebページを収集し、Webページのイメージを特定する。そのあと、分類システムは、各々のイメージについてそのイメージが広告イメージであるか、非広告イメージであるかを示すラベルを入力する。そのあと、分類システムは、各々のイメージについてイメージとそのWebページから導き出されたフィーチャを収めている特徴ベクトル(feature vector)を生成する。分類システムはイメージの特徴ベクトルとラベルを含むトレーニングデータを使用してイメージを分類するようにバイナリクラシファイアをトレーニングする。分類フェーズ期間に、分類システムはイメージを含むWebページを入力し、そのイメージの特徴ベクトルを生成する。そのあと、分類システムはトレーニングしたバイナリクラシファイアを特徴ベクトルに適用して、そのイメージが広告イメージであるか、または非広告イメージであるかを示すスコア(得点)を生成する。
この要約説明は、以下の「発明を実施するための形態」にて詳述される概念のいくつかを選んで簡単に紹介したものである。この要約説明は特許請求の範囲に記載の主題のキーとなる特徴または基本的特徴を特定するものでもなく、特許請求の範囲に記載の主題の範囲を判断する際の一助として使用されるものでもない。
一実施形態における分類システムのコンポーネントを示すブロック図である。 いくつかの実施形態におけるビジュアルレイアウトフィーチャを生成する際に使用されるファクタを示すブロック図である。 いくつかの実施形態における分類システムのクラシファイア生成コンポーネントの処理を示すフロー図である。 いくつかの実施形態における分類システムの特徴ベクトル生成コンポーネントの処理を示すフロー図である。 いくつかの実施形態における分類システムのイメージに対する特徴ベクトル生成コンポーネントの処理を示すフロー図である。 いくつかの実施形態における分類システムの関連フィーチャ学習コンポーネントの処理を示すフロー図である。 いくつかの実施形態における分類システムのイメージ分類コンポーネントの処理を示すフロー図である。 いくつかの実施形態における分類システムのフィーチャ生成コンポーネントの処理を示すフロー図である。
表示ページのイメージを広告イメージまたは非広告イメージとして特定することが提供されている。いくつかの実施形態において、広告イメージ分類システムは、イメージを広告イメージまたは非広告イメージとして分類するようにバイナリクラシファイア(binary classifier)をトレーニングし、そのあと、そのバイナリクラシファイアを使用してWebページなどの表示ページのイメージを広告イメージまたは非広告イメージとして分類する。トレーニングフェーズ期間に、分類システムはイメージを含むWebページを収集し、Webページのイメージを特定する。そのあと、分類システムは各々のイメージについて、そのイメージが広告イメージであるか、非広告イメージであるかを示すラベルを入力する。そのあと、分類システムは各々のイメージについて、そのイメージとそのWebページから導き出されたフィーチャを収めている特徴ベクトルを生成する。例えば、フィーチャには、イメージのサイズ、そのWebページ上のイメージの左側座標と上部座標、同じ左側座標をもつそのWebページ上のイメージの数、イメージの高さなどが含まれていることがある。分類システムは、イメージの特徴ベクトルとラベルを含んでいるトレーニングデータを使用してイメージを分類するようにバイナリクラシファイアをトレーニングする。分類システムは、サポートベクターマシン(SVM)手法、ニューラルネットワーク手法、ベイジアン(Bayesian)手法などの、種々の手法を用いてバイナリクラシファイアをトレーニングすることができる。バイナリクラシファイアは、イメージを分類するとき各フィーチャに付与されるウエイトを示すフィーチャ・ウエイト(特徴重み)で表されることがある。分類フェーズ期間に、分類システムはイメージを含むWebページを入力し、そのイメージの特徴ベクトルを生成する。そのあと、分類システムはバイナリクラシファイアのウエイトを特徴ベクトルに適用して、そのイメージが広告イメージであるか、または非広告イメージであるかを示すスコア(得点)を生成する。バイナリクラシファイアは、広告イメージを特定し、そのイメージを破棄してからイメージがイメージのマッピングに追加されるようにイメージ検索エンジンサービスによって使用されることができる。また、バイナリクラシファイアは、広告イメージを特定し、その広告イメージをWebページから破棄してからそのWebページがモバイルデバイスに提供されるように、モバイルデバイスをサポートするサーバによって使用されることもできる。
いくつかの実施形態において、分類システムは、フィーチャ特定フェーズ期間にイメージを広告イメージまたは非広告イメージとして分類することに関連するフィーチャを特定する。そのあと、分類システムは、トレーニングフェーズ期間に関連フィーチャ(relevant feature)を使用することがある。関連フィーチャを特定するために、分類システムは候補フィーチャ(candidate feature)を選択し、その候補フィーチャから関連フィーチャが特定される。分類システムは、トレーニングフェーズの場合に上述したのと同じように、フィーチャ特定フェーズの場合も、特徴ベクトルとそのラベルを含むトレーニングデータを生成する。なお、1つの相違点は、フィーチャ特定フェーズで使用される特徴ベクトルはすべての候補ベクトルを含んでいるのに対し、トレーニングフェーズで使用される特徴ベクトルは関連があると判断された候補フィーチャだけを含んでいることである。例えば、候補フィーチャは、イメージのメタデータが単語「広告」を含んでいるかどうかを示すフィーチャおよびイメージのサイズを示す別のフィーチャを含んでいることがある。フィーチャ特定フェーズ期間に、分類システムは、メタデータに関係するフィーチャは関連性がないが、サイズに関係するフィーチャは関連性があると判断することがある。従って、関連フィーチャは候補フィーチャのサブセットになっている。分類システムがフィーチャ特定フェーズとトレーニングフェーズの両方で同じWebページを使用する場合は、分類システムは、フィーチャ特定フェーズ期間に生成された特徴ベクトルから関連フィーチャをコピーすることによって、トレーニングフェーズの場合の特徴ベクトルを生成することができる。
そのあと、分類システムは、イメージを広告イメージまたは非広告イメージとして分類するように、候補フィーチャの特徴ベクトルとラベルを使用してクラシファイアをトレーニングするためにアダプティブブースティング(adaptive boosting)手法を使用する。アダプティブブースティング手法では、各々の候補フィーチャについて弱いクラシファイア(weak classifier)が生成され、各々の弱いクラシファイアのウエイトが学習される。アダプティブブースティング手法では、トレーニングデータの誤った分類に基づいてウエイトが学習される。そのあと、分類システムは、イメージを広告イメージまたは非広告イメージとして分類することに関連しているとそのウエイトが示している弱いクラシファイアの候補フィーチャを関連フィーチャとして選択する。例えば、分類システムは、最も重く重み付けされた弱いクラシファイアの候補フィーチャを選択することがある。
いくつかの実施形態において、分類システムは、候補フィーチャをテキストフィーチャ、リンクフィーチャ、ビジュアルレイアウトフィーチャまたはコンテンツフィーチャとしてカテゴライズする。テキストフィーチャはWebページ(例えば、イメージのURL、イメージのALTストリング、またはイメージの周囲のテキスト)から導き出された単語であり、そのWebページはその単語が広告であることを示していることがある。このような単語には、「ポップアップ」と「広告」が含まれていることがある。
リンクフィーチャ(link feature)は、イメージと関連付けられたリンクがポイントしているサイトから導き出されたものである。あるリンクフィーチャは、イメージを特定するハイパーリンクがWebページを提供した同じWebサイトをポイントしているか、別のロケーションをポイントしているかを示しており、その別のロケーションは広告サーバであることがある。別のロケーションをポイントしているこのようなハイパーリンクは広告サーバをポイントしていることがあるので、そのイメージが広告であることを示していることがある。別のリンクフィーチャは、イメージと関連付けられたハイパーリンクがWebページを提供した同じWebサイトをポイントしているか、別のロケーションをポイントしているかを示しており、その別のロケーションは、そこを通して広告アイテムの購入が可能であるWebページであることがある。別のロケーションをポイントするこのようなハイパーリンクは、広告主のWebページをポイントしていることがあるので、そのイメージが広告であることを示していることがある。
ビジュアルレイアウトフィーチャ(visual layout feature)は、イメージがそのWebページ内でどのようにビジュアル的にレイアウトされているかに関係している。ビジュアルレイアウトフィーチャとしては、イメージの左端座標、イメージの高さ、同じ左端座標をもつWebページのイメージの数などがある。種々のフィーチャはWebページの幅と高さに正規化することができる。例えば、X座標とY座標は0と1の範囲にすることができる。
コンテンツフィーチャ(content feature)は、イメージ自体のコンテンツに関係している。コンテンツフィーチャは、イメージのアスペクト比、イメージフォーマット、イメージがフォトグラフであるかグラフィックであるか、イメージのサイズ、イメージの異なるカラーの数、イメージのグレイエリアが占める割合(パーセンテージ)、およびイメージがハイコントラストであるかどうかの表示などを含む。アスペクト比フィーチャは、ショートでワイドなバナー広告を特定するときに利用すると便利なことがある。イメージフォーマットフィーチャは、複数のフレームをもつフォーマットになっている広告イメージを特定するときに利用すると便利なことがある。フォトグラフ/グラフィックフィーチャは、多くの広告イメージが広告の情報と一体になったグラフィックであるので利用すると便利なことがある。サイズフィーチャは、広告イメージが注目されるだけの十分な大きさにする必要があるので利用すると便利なことがある。カラーの数フィーチャは、広告イメージが非広告イメージよりも異種カラーの数が少ないのが一般であるので利用すると便利なことがある。グレイが占める割合(パーセンテージ)フィーチャは、広告イメージは変化する階調(shades of gray)が背景になっていることがよくあるので利用すると便利なことがある。コントラストフィーチャは、広告イメージがシャープなコントラストをもつように手作業で作成されるので利用すると便利なことがある。
以下の表は、一実施形態において関連があると特定された候補フィーチャをリストしたものである。ランクは、フィーチャ特定フェーズ期間にフィーチャに対して弱いクラシファイアに割り当てられたウエイトのランキングを示している。C1はテキストフィーチャを表し、C2はリンクフィーチャを表し、C3はビジュアルレイアウトフィーチャを表し、C4はコンテンツフィーチャを表している。
Figure 0004783476
上述のように、アダプティブブースティング手法を使用すると、イメージを広告イメージまたは非広告イメージとして分類することに関連する候補フィーチャを特定することができる。アダプティブブースティングは、例を有するトレーニングデータのコレクションについて複数のテストを実行する繰り返し(iterative)プロセスである。アダプティブブースティングは弱い学習アルゴリズム(実行効率が見込みよりもわずかだけ良好であるアルゴリズム)を強い学習アルゴリズム(低エラー発生率で表示するアルゴリズム)に変換する。弱い学習アルゴリズムは、トレーニングデータの異なるサブセットで実行されることがある。このアルゴリズムは、以前のアルゴリズムが誤りを示す傾向にあった例にますます集中している。このアルゴリズムは以前の弱い学習アルゴリズムが行なっていたエラーを訂正している。このアルゴリズムがアダプティブであるのは、以前のアルゴリズムのエラー発生率に適応するからである。アダプティブブースティングは、おおざっぱでほどほどに不正確である経験則(rule of thumb)を結合してハイパフォーマンスのアルゴリズムを作成している。アダプティブブースティングは別々に実行した各テストの結果を結合して、単一で非常に正確なクラシファイアまたはランキング関数にしている。
上述のように、分類では、関連があると特定されたフィーチャを使用してバイナリクラシファイアをトレーニングするためにサポートベクターマシンが使用されることがある。サポートベクターマシンは動作すると、起り得る入力のスペースにハイパ面(hyper-surface)を見つける。ハイパ面では、正の例(例えば、広告イメージラベルの特徴ベクトル)と負の例(例えば、非広告ラベルをもつ特徴ベクトル)の最寄り(nearest)からハイパ面までの間の距離を最大限にすることによって正の例を負の例から分割することを試みている。このようにすると、トレーニングデータに類似しているが同一でないデータを正確に分類することが可能になる。サポートベクターマシンをトレーニングするには様々な手法が使用できる。ある手法では、大きな2次プログラミング(quadratic programming)問題を、解析的に解決できる一連の小さな2次プログラミング問題に細分化する順次最小最適化アルゴリズムを使用している。(順次最小最適化については、
(http://www.research.microsoft.com/~jplatt/smo.htmlを参照のこと)
図1は、一実施形態における分類システムのコンポーネントを示すブロック図である。分類システム110は、通信リンク130を介してWebサーバ140、検索エンジンクローラ(crawler)150、モバイルデバイスサーバ160、およびユーザコンピューティングデバイス170に接続されている。Webサーバは、検索エンジンクローラによってクローリングされ、ユーザコンピューティングデバイスによってアクセスされるWebページにサービスを提供している。モバイルデバイスサーバ160はモバイルデバイスへWebページのサービスを提供している。分類システム110は、トレーニングイメージストア111、トレーニングデータストア112、関連フィーチャストア113、および分類ウエイトストア114を備えている。トレーニングイメージストア111は、バイナリクラシファイアをトレーニングするために使用されるイメージを含むWebページを収めている。トレーニングデータストア112は、トレーニングイメージストア111のイメージに対する特徴ベクトルとラベルを収めている。特徴ベクトルはすべての候補フィーチャを含んでいることがある。関連フィーチャストア113は、フィーチャ特定フェーズ期間に関連があると判断された候補フィーチャの表示を収めている。分類ウエイトストア114は、トレーニングされたバイナリクラシファイアを表すウエイトを収めている。
分類システム110は、クラシファイア生成(generate classifier)コンポーネント121、特徴ベクトル生成(generate feature vector)コンポーネント122、イメージに対する特徴ベクトル生成(generate feature vectors for image)コンポーネント123、関連フィーチャ学習(learn relevant feature)コンポーネント124、および種々のフィーチャ生成コンポーネント125も備えている。クラシファイア生成コンポーネント121は、特徴ベクトル生成コンポーネント122を起動してトレーニングイメージストア111のイメージに対する特徴ベクトルを生成する。特徴ベクトル生成コンポーネント122は、イメージに対する特徴ベクトル生成コンポーネント123を起動してイメージに対する特徴ベクトルを生成する。イメージに対する特徴ベクトル生成コンポーネント123は、フィーチャ生成コンポーネント125を起動して特徴ベクトルのフィーチャを生成する。そのあと、クラシファイア生成コンポーネント121は、分類ウエイトを学習するようにバイナリクラシファイアをトレーニングする。クラシファイア生成コンポーネント121は、関連フィーチャ学習コンポーネント124を起動して、アダプティブブースティング手法を使用して候補フィーチャから関連フィーチャを特定することもある。
分類システム110は、Webページのイメージを広告イメージまたは非広告イメージであると分類するイメージ分類(classify image)コンポーネント126も備えている。イメージ分類コンポーネント126は、イメージに対する特徴ベクトル生成コンポーネント123を起動して、分類されるイメージに対する特徴ベクトルを生成する。そのあと、イメージ分類コンポーネント126は、分類ウエイトを特徴ベクトルに適用してイメージを分類する。
分類システム110が実現されているコンピューティングデバイスは、中央処理ユニット、メモリ、入力デバイス(例えば、キーボードおよびポインティングデバイス)、出力デバイス(例えば、ディスプレイデバイス)、およびストレージデバイス(例えば、ディスクドライブ)を装備することが可能である。メモリとストレージデバイスは、システムを実現するコンピュータ実行可能命令でコーディングが可能であるコンピュータ可読媒体である。つまり、命令を収めているコンピュータ可読媒体を意味している。さらに、命令、データ構造、およびメッセージ構造は、通信リンク上の信号といったデータ伝送媒体を介してストアまたは伝送されることもある。種々の通信リンクが使用可能であり、そのようなものとして、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、ポイントツーポイントダイヤルアップコネクション、セルフォンネットワークなどがある。
分類システム110の実施形態は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラマブルコンシューマエレクトロニクス、デジタルカメラ、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、セルフォン、パーソナルデジタルアシスタント、スマートフォン、上記に挙げたシステムまたはデバイスのいずれかを含む分散コンピューティング環境などを含んでいる種々の動作環境で実現されることも、その動作環境と関連して使用されることもある。
分類システム110は、プログラムモジュールのように、1または2以上のコンピュータまたは他のデバイスによって実行されるコンピュータ実行命令の一般的コンテキストの中で説明することができる。一般的に、プログラムモジュールの中には、特定のタスクを実行し、または特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれている。代表例として、プログラムモジュールの機能は、種々の実施形態で望まれるように組み合わされていることも、分散されていることもある。例えば、フィーチャ特定フェーズ、トレーニングフェーズおよび分類フェーズは異なるコンピュータシステム上で実行されることがある。バイナリクラシファイアは、広告イメージを特定することを必要とする種々の検索エンジンサービス、モバイルデバイスサーバ、またはその他のコンピューティングデバイスに分散されていることがある。
図2は、いくつかの実施形態においてビジュアルレイアウトフィーチャを生成する際に使用されるファクタを例示するブロック図である。Webページ200はイメージ201を含んでいる。Webページ200は、正規化されたWebページ幅202が1に、正規化されたWebページ高さ202が1になっている。X座標とY座標は0と1の間で変化している。イメージの位置204は、イメージの左上隅のX座標とY座標によって表されている。イメージ中心205は、イメージの中心点のX座標とY座標によって表されている。イメージ幅206とイメージ高さ207はWebページの幅と高さに正規化されている。
図3は、いくつかの実施形態における分類システムのクラシファイア生成コンポーネントの処理を示すフロー図である。クラシファイア生成コンポーネントは、オプションとして、フィーチャ特定フェーズ期間に候補フィーチャから関連フィーチャを学習してからトレーニングフェーズを実行することがある。トレーニングフェーズ期間に、コンポーネントは、関連フィーチャの特徴ベクトルとラベルを含むトレーニングデータを使用してバイナリクラシファイアをトレーニングする。ブロック301において、コンポーネントはトレーニングイメージストアのイメージに広告イメージであるか、非広告イメージであるかのラベルを付ける。ブロック302において、コンポーネントは候補フィーチャを渡して特徴ベクトル生成コンポーネントを起動してすべてのイメージに対する特徴ベクトルを生成する。ブロック303において、コンポーネントは関連フィーチャ学習コンポーネントを起動して、候補フィーチャのどれが関連フィーチャであるかを学習する。ブロック304において、コンポーネントは特徴ベクトル生成コンポーネントを起動して、イメージに対する関連フィーチャの特徴ベクトルを生成する。この分野の精通者ならば理解されるように、候補フィーチャを含む特徴ベクトルから関連フィーチャを抽出できるのは関連フィーチャが候補フィーチャのサブセットであるからである(ただし、候補特定フェーズ期間とトレーニングフェーズ期間に同じイメージが使用されることを想定する)。ブロック305において、コンポーネントは、サポートベクターマシンアルゴリズムまたはその他のなんらかのマシン学習アルゴリズムの使用によって、関連フィーチャの特徴ベクトルとラベルを使用してバイナリクラシファイアをトレーニングする。ブロック306において、コンポーネントは、フィーチャの学習したウエイトを分類ウエイトストアにストアし、そのあと完了する。
図4は、いくつかの実施形態における分類システムの特徴ベクトル生成コンポーネントの処理を示すフロー図である。コンポーネントにフィーチャ(例えば、候補フィーチャまたは関連フィーチャ)のリストが渡され、これらのフィーチャを含む各イメージに対する特徴ベクトルを生成する。ブロック401において、コンポーネントはトレーニングイメージストアの次のイメージを選択する。判定ブロック402において、すべてのイメージがすでに選択されていれば、コンポーネントはリターンし、そうでなければ、コンポーネントはブロック403から継続する。ブロック403において、コンポーネントは、選択したイメージとフィーチャを渡してイメージに対する特徴ベクトル生成コンポーネントを起動し、選択したイメージに対する特徴ベクトルを生成する。ブロック404において、コンポーネントはイメージに対する特徴ベクトルをトレーニングデータストアにストアし、そのあと、ブロック401にループして次のイメージを選択する。
図5は、いくつかの実施形態における分類システムのイメージに対する特徴ベクトル生成コンポーネントの処理を示すフロー図である。コンポーネントにはイメージおよびフィーチャのリストが渡される。コンポーネントは、渡されたフィーチャを含んでいるイメージに対する特徴ベクトルを生成する。ブロック501において、コンポーネントは渡された次のフィーチャを選択する。判定ブロック502において、すべてのフィーチャがすでに選択されていれば、コンポーネントは特徴ベクトルを返し、そうでなければ、コンポーネントはブロック503から継続する。ブロック503において、コンポーネントは、該当のフィーチャ生成コンポーネントを起動することによってイメージに対する選択したフィーチャを生成する。ブロック504において、コンポーネントは生成したフィーチャをイメージに対する特徴ベクトルに追加し、そのあと、ブロック501にループして次のフィーチャを選択する。
図6は、いくつかの実施形態における分類システムの関連フィーチャ学習コンポーネントの処理を示すフロー図である。コンポーネントは、トレーニングデータストアのトレーニングデータを使用して関連フィーチャを特定し、関連フィーチャであるとの表示を関連フィーチャストアにストアする。コンポーネントは、イメージを広告イメージまたは非広告イメージとして分類することに関連する候補フィーチャを特定する。ブロック601において、コンポーネントはイメージに同等ウエイトを割り当てる。アダプティブブースティングプロセス期間に、イメージのウエイトは、弱いクラシファイアのウエイトに基づいて誤分類されたイメージにトレーニングが集中するように調整される。ブロック602〜608において、コンポーネントはループして弱いクラシファイアのウエイトを判断し、誤分類されたイメージのウエイトを調整する。ブロック602において、コンポーネントは次の繰り返し(iteration)にインクリメントする。判定ブロック603において、すべての繰り返しが完了していれば、コンポーネントはブロック609から継続し、そうでなければコンポーネントはブロック604から継続する。ブロック604〜606において、コンポーネントはループして各々のフィーチャについて弱いクラシファイアをトレーニングする。ブロック604において、コンポーネントは次のフィーチャを選択する。判定ブロック605において、すべてのフィーチャがすでに選択されていれば、コンポーネントはブロック607から継続し、そうでなければ、コンポーネントはブロック606から継続する。ブロック606において、コンポーネントは選択したフィーチャについての弱いクラシファイアを、イメージのウエイトを使用してトレーニングする。そのあと、コンポーネントはブロック604にループして次のフィーチャを選択する。ブロック607において、コンポーネントは最良の弱いクラシファイア、すなわち、誤分類が最も少ない弱いクラシファイアを選択する。ブロック608において、コンポーネントは、選択した弱いクラシファイアの誤分類に基づいてイメージのウエイトを調整する。誤分類されたイメージのウエイトは、正しく分類されたイメージのウエイトに対して増加される。そのあと、コンポーネントはブロック602にループして次の繰り返しにインクリメントする。ブロック609において、コンポーネントは最良の弱いクラシファイアのフィーチャを選択し、そのあと、選択したフィーチャを関連フィーチャとしてリターンする。
図7は、いくつかの実施形態における分類システムのイメージ分類コンポーネントの処理を示すフロー図である。コンポーネントにはイメージを含んでいるWebページが渡され、そのイメージが広告イメージであるか、非広告イメージであるかの通知を返す。ブロック701において、コンポーネントはイメージに対する特徴ベクトル生成コンポーネントを起動してそのイメージに対する特徴ベクトルを生成する。ブロック702において、コンポーネントは、分類ウエイトストアのウエイトを特徴ベクトルのフィーチャに適用することによって分類のスコア(得点)を生成する。判定ブロック703において、そのイメージが広告であることをスコア(得点)が示していれば、コンポーネントは広告イメージであるとの通知を返し、そうでなければ、コンポーネントは非広告イメージであるとの通知を返却する。
図8は、いくつかの実施形態における分類システムのフィーチャ生成コンポーネントの処理を示すフロー図である。この例では、フィーチャ生成コンポーネントは、イメージと同じ左端X座標をもつ数のWebページのイメージを生成する。ブロック801において、コンポーネントはイメージの左端X座標をリトリーブする。ブロック802において、コンポーネントはカウントを初期化する。ブロック803〜807において、コンポーネントはループしてWebページの他のイメージの各々が同じ左端X座標をもっているかどうかを判断する。ブロック803において、コンポーネントはWebページの次の他のイメージを選択する。判定ブロック804において、他のイメージすべてがすでに選択されていれば、コンポーネントはカウントをリターンし、そうでなければ、コンポーネントはブロック805から継続する。ブロック805において、コンポーネントは選択した他のイメージの左端X座標をリトリーブする。判定ブロック806において、X座標が同じであれば、コンポーネントはブロック807から継続し、そうでなければ、コンポーネントはブロック803にループして次の他のイメージを選択する。ブロック807において、コンポーネントはカウントをインクリメントし、そのあと、ブロック803にループして次の他のメッセージを選択する。
構造上の特徴および/または方法上のアクトに特有の表現で主題を説明してきたが、当然に理解されるように、特許請求の範囲に明確されている主題は必ずしも上述した特定の特徴またはアクトに限定されない。むしろ、上述した特定の特徴およびアクトは、特許請求の範囲を実現する形態の例として開示されたものである。従って、本発明は特許請求の範囲による場合を除き限定されない。

Claims (20)

  1. コンピューティングデバイスによって実行される、Webページの広告イメージを識別する方法であって、
    前記方法は、
    Webページのトレーニングイメージを提供するステップであって、該提供されたそれぞれのトレーニングイメージはWebページによって参照される、ステップと、
    前記イメージに広告イメージまたは非広告イメージのラベルを付けるステップと、
    前記トレーニングイメージの各々についての特徴ベクトルを生成するステップであって、前記特徴ベクトルは、前記イメージのWebページから導き出されたビジュアルレイアウトフィーチャおよび前記イメージのコンテンツから導き出されたコンテンツフィーチャを含み、該コンテンツフィーチャは、前記イメージのコンテンツの異なるカラーの数、前記イメージがハイコントラストであるか否かの表示、および前記イメージがフォトグラフであるか否かの表示を含むグループから選択される、ステップと、
    前記特徴ベクトルおよび前記イメージのラベルを使用してバイナリクラシファイアをトレーニングするステップと、
    前記イメージについての特徴ベクトルを生成し、トレーニングしたバイナリクラシファイアを前記イメージの前記生成された特徴ベクトルに適用することによって前記イメージを広告イメージまたは非広告イメージとして分類するステップと
    を含むことを特徴とする方法。
  2. イメージを広告イメージおよび非広告イメージとして分類するために関連フィーチャを学習するステップをさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記学習するステップは、アダプティブブースティング手法を適用して、各々の弱いクラシファイアがフィーチャに対応している弱いクラシファイアのウエイトを学習すること、およびそのウエイトが広告イメージを非広告イメージから区別するのに有効であることを示しているフィーチャを関連フィーチャとして選択することをさらに含むことを特徴とする請求項2に記載の方法。
  4. イメージのフィーチャは、ビジュアルレイアウトフィーチャおよびコンテンツフィーチャを含むことを特徴とする請求項1に記載の方法。
  5. 前記ビジュアルレイアウトフィーチャは、イメージの上部、右側および左側の座標、イメージの中心の座標、イメージの幅、イメージと同じ右座標をもつWebページのイメージの数、イメージと同じ上部座標をもつWebページのイメージの数、イメージと同じ右座標および同じ幅をもつWebページのイメージの数、およびイメージと同じ上部座標および同じ高さをもつWebページのイメージの数を含むグループから選択されたフィーチャを含むことを特徴とする請求項4に記載の方法。
  6. 前記コンテンツフィーチャは、イメージのサイズ、およびイメージのグレイが占める割合を含むグループから選択されたフィーチャを含むことを特徴とする請求項4に記載の方法。
  7. イメージのフィーチャは、ハイパーリンクから導き出されたフィーチャをさらに含むことを特徴とする請求項4に記載の方法。
  8. バイナリクラシファイアは、サポートベクターマシンを使用してトレーニングされることを特徴とする請求項1に記載の方法。
  9. アダプティブブースティング手法を適用して、各々の弱いクラシファイアがフィーチャに対応している弱いクラシファイアのウエイトを学習し、そのウエイトが広告イメージを非広告イメージから区別するのに有効であることを示しているフィーチャを関連フィーチャとして選択することによってイメージを広告イメージおよび非広告イメージとして分類するために関連フィーチャを学習することをさらに含み、
    イメージのフィーチャは、ビジュアルレイアウトフィーチャおよびコンテンツフィーチャを含むことを特徴とする請求項8に記載の方法。
  10. 特徴ベクトルに含められるイメージのフィーチャは、候補フィーチャを使用してクラシファイアをトレーニングし、前記クラシファイアによって最も重く重み付けされたフィーチャを関連フィーチャとして選択することによって学習されることを特徴とする請求項1に記載の方法。
  11. Webページのイメージを広告イメージまたは非広告イメージとして分類するバイナリクラシファイアを生成する方法をコンピュータに実行させるためのコンピュータ実行可能命令を格納したコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ実行可能命令は、実行される時に、
    トレーニングWebページを提供するステップと、
    前記トレーニングWebページのイメージを識別するステップと、
    イメージが広告イメージであるのか、または非広告イメージであるのかを示す、前記イメージについてのラベルを受信するステップと、
    前記識別されたイメージの各々についての特徴ベクトルを生成するステップであって、前記特徴ベクトルは、前記Webページ上のイメージのビジュアルレイアウトフィーチャおよび前記イメージのコンテンツにアクセスすることによって前記イメージのコンテンツから導き出されたコンテンツフィーチャを含み、前記コンテンツフィーチャは、前記イメージのアスペクト比、イメージフォーマット、前記イメージがフォトグラフであるかグラフィックであるかの表示、前記イメージのサイズ、前記イメージの異なるカラーの数、前記イメージのグレイエリアが占める割合、および前記イメージがハイコントラストであるかどうかの表示を含むグループから選択される、ステップと、
    前記特徴ベクトルおよび前記イメージのラベルを使用してバイナリクラシファイアをトレーニングするステップであって、該トレーニングするステップは、イメージを分類する際に使用されるフィーチャのウエイトを識別する、ステップと
    を含む方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能な記憶媒体。
  12. イメージについての特徴ベクトルを生成し、トレーニングしたバイナリクラシファイアを前記イメージの前記生成された特徴ベクトルに適用することによってイメージを広告イメージまたは非広告イメージとして分類するステップをさらに含むことを特徴とする請求項11に記載のコンピュータ読み取り可能な記憶媒体。
  13. イメージを広告イメージおよび非広告イメージとして分類する関連フィーチャを学習するステップをさらに含むことを特徴とする請求項11に記載のコンピュータ読み取り可能な記憶媒体。
  14. 前記学習するステップは、アダプティブブースティング手法を適用して、フィーチャに固有の弱いクラシファイアのウエイトを学習すること、およびそのウエイトが広告イメージを非広告イメージと区別するのに有効であることを示している弱いクラシファイアのフィーチャを関連フィーチャとして選択することを含むことを特徴とする請求項13に記載のコンピュータ読み取り可能な記憶媒体。
  15. イメージのフィーチャは、コンテンツフィーチャを含むことを特徴とする請求項11に記載のコンピュータ読み取り可能な記憶媒体。
  16. バイナリクラシファイアは、サポートベクターマシンを使用してトレーニングされることを特徴とする請求項11に記載のコンピュータ読み取り可能な記憶媒体。
  17. イメージを広告イメージまたは非広告イメージとして分類する際に使用されるWebページのイメージのフィーチャを識別するコンピューティングデバイスであって、
    Webページのイメージを検索し、前記Webページの検索されたイメージについての特徴ベクトルをトレーニングデータストアに格納するコンポーネントであって、前記検索されたイメージは、広告イメージまたは非広告イメージとラベル付けされ、前記特徴ベクトルは、前記イメージのWebページから導き出されたビジュアルレイアウトコンテンツおよび前記検索されたイメージのコンテンツにアクセスすることによって前記検索されたイメージのコンテンツから導き出されたコンテンツフィーチャを含む候補フィーチャを含み、前記コンテンツフィーチャは、前記イメージのアスペクト比、イメージフォーマット、前記イメージがフォトグラフであるかグラフィックであるかの表示、前記イメージのサイズ、前記イメージの異なるカラーの数、前記イメージのグレイエリアが占める割合、および前記イメージがハイコントラストであるかどうかの表示を含むグループから選択される、コンポーネントと、
    前記トレーニングデータストアの候補フィーチャおよびラベルをもつ前記特徴ベクトルを使用してバイナリクラシファイアをトレーニングするコンポーネントと、
    そのウエイトが広告イメージと非広告イメージとを区別するのに有効であると示している候補フィーチャを、イメージを分類する際に使用するフィーチャとして選択するコンポーネントと
    を備えたことを特徴とするコンピューティングデバイス。
  18. 選択したフィーチャを使用してイメージを広告イメージおよび非広告イメージとして分類するようにバイナリクラシファイアをトレーニングするコンポーネントをさらに含むことを特徴とする請求項17に記載のコンピューティングデバイス。
  19. 候補フィーチャを使用してトレーニングされるクラシファイアは、アダプティブブースティング手法を使用してトレーニングされ、選択したフィーチャを使用してトレーニングされるバイナリクラシファイアはサポートベクターマシン手法を使用してトレーニングされることを特徴とする請求項18に記載のコンピューティングデバイス。
  20. イメージについての選択したフィーチャの特徴ベクトルを生成し、トレーニングしたバイナリクラシファイアを前記イメージの前記生成した特徴ベクトルに適用することによってイメージを広告イメージまたは非広告イメージとして分類するコンポーネントをさらに含むことを特徴とする請求項19に記載のコンピューティングデバイス。
JP2010512411A 2007-06-13 2008-06-13 広告イメージまたは非広告イメージとしてのイメージの分類 Expired - Fee Related JP4783476B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/762,553 US7840502B2 (en) 2007-06-13 2007-06-13 Classification of images as advertisement images or non-advertisement images of web pages
US11/762,553 2007-06-13
PCT/US2008/067032 WO2008157440A2 (en) 2007-06-13 2008-06-13 Classification of images as advertisement images or non-advertisement images

Publications (3)

Publication Number Publication Date
JP2010537263A JP2010537263A (ja) 2010-12-02
JP2010537263A5 JP2010537263A5 (ja) 2011-07-07
JP4783476B2 true JP4783476B2 (ja) 2011-09-28

Family

ID=40133212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010512411A Expired - Fee Related JP4783476B2 (ja) 2007-06-13 2008-06-13 広告イメージまたは非広告イメージとしてのイメージの分類

Country Status (5)

Country Link
US (2) US7840502B2 (ja)
EP (1) EP2203870A4 (ja)
JP (1) JP4783476B2 (ja)
CN (1) CN102138151B (ja)
WO (1) WO2008157440A2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169157A1 (en) * 2008-12-30 2010-07-01 Nokia Corporation Methods, apparatuses, and computer program products for providing targeted advertising
US8156119B2 (en) * 2009-01-19 2012-04-10 Microsoft Corporation Smart attribute classification (SAC) for online reviews
JP2011013732A (ja) * 2009-06-30 2011-01-20 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US9729352B1 (en) 2010-02-08 2017-08-08 Google Inc. Assisting participation in a social network
US8825759B1 (en) 2010-02-08 2014-09-02 Google Inc. Recommending posts to non-subscribing users
US8582801B2 (en) * 2010-02-08 2013-11-12 Google Inc. Assisting the authoring of posts to an asymmetric social network
US20110251897A1 (en) * 2010-04-12 2011-10-13 The Associated Press Online Shopping Circulars
US8527597B2 (en) 2010-12-07 2013-09-03 Google Inc. Determining message prominence
US9384408B2 (en) 2011-01-12 2016-07-05 Yahoo! Inc. Image analysis system and method using image recognition and text search
WO2012145912A1 (en) * 2011-04-28 2012-11-01 Google Inc. Presenting search results for gallery web pages
US8813111B2 (en) * 2011-08-22 2014-08-19 Xerox Corporation Photograph-based game
US8635519B2 (en) 2011-08-26 2014-01-21 Luminate, Inc. System and method for sharing content based on positional tagging
US20130086112A1 (en) 2011-10-03 2013-04-04 James R. Everingham Image browsing system and method for a digital content platform
US8737678B2 (en) 2011-10-05 2014-05-27 Luminate, Inc. Platform for providing interactive applications on a digital content platform
USD737290S1 (en) 2011-10-10 2015-08-25 Yahoo! Inc. Portion of a display screen with a graphical user interface
USD736224S1 (en) 2011-10-10 2015-08-11 Yahoo! Inc. Portion of a display screen with a graphical user interface
CN102591983A (zh) * 2012-01-10 2012-07-18 凤凰在线(北京)信息技术有限公司 一种广告过滤系统及其过滤方法
US8255495B1 (en) 2012-03-22 2012-08-28 Luminate, Inc. Digital image and content display systems and methods
US8234168B1 (en) * 2012-04-19 2012-07-31 Luminate, Inc. Image content and quality assurance system and method
US8626585B1 (en) 2012-05-14 2014-01-07 Google Inc. Selection of images to display next to textual content
US8495489B1 (en) 2012-05-16 2013-07-23 Luminate, Inc. System and method for creating and displaying image annotations
US10776833B2 (en) * 2012-11-27 2020-09-15 Synqy Corporation Method and system for managing content of digital brand assets on the internet
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
CN103530645B (zh) * 2013-09-25 2016-06-15 北京工商大学 基于局部二值模式和Zernike矩的纹理图像分类方法及系统
CN103854030A (zh) * 2014-03-20 2014-06-11 武汉大学 基于形状共生模式的纹理图像分类方法
US9811352B1 (en) 2014-07-11 2017-11-07 Google Inc. Replaying user input actions using screen capture images
US9965559B2 (en) 2014-08-21 2018-05-08 Google Llc Providing automatic actions for mobile onscreen content
CN105868768A (zh) * 2015-01-20 2016-08-17 阿里巴巴集团控股有限公司 一种识别图片是否带有特定标记的方法及系统
CN104794183A (zh) * 2015-04-10 2015-07-22 浙江大学 一种基于多视图多标签的图片标注方法
CN106874279B (zh) * 2015-12-11 2021-01-15 腾讯科技(深圳)有限公司 生成应用类别标签的方法及装置
CN106354836A (zh) * 2016-08-31 2017-01-25 南威软件股份有限公司 一种广告页面的预测方法和装置
EP3306528B1 (en) * 2016-10-04 2019-12-25 Axis AB Using image analysis algorithms for providing traning data to neural networks
US10535005B1 (en) 2016-10-26 2020-01-14 Google Llc Providing contextual actions for mobile onscreen content
US11367150B2 (en) * 2017-01-23 2022-06-21 Meta Platforms, Inc. Demographic-based targeting of electronic media content items
US10565444B2 (en) * 2017-09-07 2020-02-18 International Business Machines Corporation Using visual features to identify document sections
AU2018271424A1 (en) * 2017-12-13 2019-06-27 Playable Pty Ltd System and Method for Algorithmic Editing of Video Content
US10223616B1 (en) * 2018-06-30 2019-03-05 Figleaf Limited System and method identification and classification of internet advertising
US10296552B1 (en) * 2018-06-30 2019-05-21 FiaLEAF LIMITED System and method for automated identification of internet advertising and creating rules for blocking of internet advertising
KR102076275B1 (ko) * 2018-08-22 2020-02-11 강운식 디지털 미디어 콘텐츠 재생 제어 방법 및 그 장치
CN112597828A (zh) * 2020-12-11 2021-04-02 京东数字科技控股股份有限公司 网页识别模型的训练方法、装置、网页识别的方法
US11640705B1 (en) * 2021-12-17 2023-05-02 Lodestar Software Inc. Active learning with human feedback loop to optimize future sampling priority

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022727A (ja) * 1999-07-05 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> テキスト分類学習方法及び装置及びテキスト分類学習プログラムを格納した記憶媒体
US20040161154A1 (en) * 2003-02-18 2004-08-19 Xian-Sheng Hua Learning-based automatic commercial content detection
JP2007133659A (ja) * 2005-11-10 2007-05-31 Nippon Telegr & Teleph Corp <Ntt> 文書発行者分類方法及び装置及びプログラム
WO2007064640A2 (en) * 2005-11-29 2007-06-07 Google Inc. Detecting repeating content in broadcast media

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3563072B2 (ja) * 1993-08-31 2004-09-08 インテレッセンゲマインシャフト フュア ルントフンクシュッツレヒテ ゲゼルシャフト ミット ベシュレンクテル ハフツング シュッツレヒツフェルヴェルツング ウント コンパニー コマンディートゲゼルシャ 不所望なビデオシーンの検出方法及び装置
DE4421536A1 (de) * 1994-06-20 1995-12-21 Hoechst Ag Perfluoralkylgruppen tragende phenylsubstituierte Alkenylcarbonsäure-guanidine, Verfahren zu ihrer Herstellung, ihre Verwendung als Medikament oder Diagnostikum sowie sie enthaltendes Medikament
US6813395B1 (en) * 1999-07-14 2004-11-02 Fuji Photo Film Co., Ltd. Image searching method and image processing method
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US20050165642A1 (en) * 2002-05-07 2005-07-28 Gabriel-Antoine Brouze Method and system for processing classified advertisements
US7194114B2 (en) * 2002-10-07 2007-03-20 Carnegie Mellon University Object finder for two-dimensional images, and system for determining a set of sub-classifiers composing an object finder
US7609893B2 (en) * 2004-03-03 2009-10-27 Trw Automotive U.S. Llc Method and apparatus for producing classifier training images via construction and manipulation of a three-dimensional image model
GB0405741D0 (en) * 2004-03-15 2004-04-21 Bae Systems Plc Apparatus for enhancing a signal and related method
US7729538B2 (en) * 2004-08-26 2010-06-01 Microsoft Corporation Spatial recognition and grouping of text and graphics
US7809722B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US7542610B2 (en) * 2005-05-09 2009-06-02 Like.Com System and method for use of images with recognition analysis
US7433895B2 (en) * 2005-06-24 2008-10-07 Microsoft Corporation Adding dominant media elements to search results
WO2007028166A2 (en) 2005-09-02 2007-03-08 Blindsight, Inc. A system and method for detecting text in real-world color images
WO2007038491A2 (en) * 2005-09-26 2007-04-05 Novarra, Inc. System and method for web navigation using images
US7865492B2 (en) * 2005-09-28 2011-01-04 Nokia Corporation Semantic visual search engine
US20080019661A1 (en) * 2006-07-18 2008-01-24 Pere Obrador Producing output video from multiple media sources including multiple video sources
US20080107341A1 (en) * 2006-11-02 2008-05-08 Juwei Lu Method And Apparatus For Detecting Faces In Digital Images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022727A (ja) * 1999-07-05 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> テキスト分類学習方法及び装置及びテキスト分類学習プログラムを格納した記憶媒体
US20040161154A1 (en) * 2003-02-18 2004-08-19 Xian-Sheng Hua Learning-based automatic commercial content detection
JP2007133659A (ja) * 2005-11-10 2007-05-31 Nippon Telegr & Teleph Corp <Ntt> 文書発行者分類方法及び装置及びプログラム
WO2007064640A2 (en) * 2005-11-29 2007-06-07 Google Inc. Detecting repeating content in broadcast media

Also Published As

Publication number Publication date
EP2203870A2 (en) 2010-07-07
US7840502B2 (en) 2010-11-23
EP2203870A4 (en) 2012-07-25
US8027940B2 (en) 2011-09-27
WO2008157440A2 (en) 2008-12-24
JP2010537263A (ja) 2010-12-02
WO2008157440A3 (en) 2011-07-14
CN102138151A (zh) 2011-07-27
CN102138151B (zh) 2013-05-29
US20110058734A1 (en) 2011-03-10
US20080313031A1 (en) 2008-12-18

Similar Documents

Publication Publication Date Title
JP4783476B2 (ja) 広告イメージまたは非広告イメージとしてのイメージの分類
US10223616B1 (en) System and method identification and classification of internet advertising
US20180322201A1 (en) Interest Keyword Identification
US9576251B2 (en) Method and system for processing web activity data
US20170371967A1 (en) Relevancy-based domain classification
US9798820B1 (en) Classification of keywords
EP2565839A1 (en) Multimode online advertisements and online advertisement exchanges
US8645288B2 (en) Page selection for indexing
CN106204165A (zh) 一种广告投放方法及装置
US20080300971A1 (en) Advertisement approval based on training data
US20080270334A1 (en) Classifying functions of web blocks based on linguistic features
JP2005317018A (ja) 表示ページ内のブロックの重要度を計算するための方法およびシステム
US9922129B2 (en) Systems and methods for cluster augmentation of search results
TWI526962B (zh) 提供使用者關聯用詞以選擇廣告之具使用者特徵文字內容廣告之方法、裝置與電腦可讀儲存媒體
US7974957B2 (en) Assessing mobile readiness of a page using a trained scorer
US20080147669A1 (en) Detecting web spam from changes to links of web sites
US20190155934A1 (en) Search query enhancement with context analysis
US9183577B2 (en) Selection of images to display next to textual content
US20110131093A1 (en) System and method for optimizing selection of online advertisements
US20120271806A1 (en) Generating domain-based training data for tail queries
Asad et al. An In-ad contents-based viewability prediction framework using Artificial Intelligence for Web Ads
Assi et al. FeatCompare: Feature comparison for competing mobile apps leveraging user reviews
US11941073B2 (en) Generating and implementing keyword clusters
Hossain et al. Software process metrics in agile software development: A systematic mapping study
CN112182414A (zh) 文章推荐方法、装置及电子设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110520

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110520

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20110615

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20110621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110708

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4783476

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees