JP5165021B2 - カテゴリ処理装置及び方法 - Google Patents
カテゴリ処理装置及び方法 Download PDFInfo
- Publication number
- JP5165021B2 JP5165021B2 JP2010108852A JP2010108852A JP5165021B2 JP 5165021 B2 JP5165021 B2 JP 5165021B2 JP 2010108852 A JP2010108852 A JP 2010108852A JP 2010108852 A JP2010108852 A JP 2010108852A JP 5165021 B2 JP5165021 B2 JP 5165021B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- individual
- prototype
- storage means
- related word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本実施形態の構成を示す図であり、本実施形態は、与えられる文章に対応する関連語又はカテゴリを判定するカテゴリ処理装置1(以下「本装置1」又は「本装置」とも呼ぶ)と、その応用例を示すものである。本装置1は、一般的なコンピュータの構成、例えば、CPUなどの演算制御部6と、外部記憶装置(HDD等)や主メモリ等の記憶装置7と、通信ネットワークN(インターネット、携帯電話網、社内ネットワークなど)との通信手段8(LANアダプタなど)などを有する。他の装置3及び4、ウェブサーバW及び端末Tについても、図示は省略するが同様である。
上記のように構成した本実施形態は、本発明によるカテゴリ構造改善の処理を行っている時以外の通常時は、カテゴリ等の判定に基づく広告配信の処理を、以下のように行う。まず、広告配信装置3の広告処理手段33は、連携先のウェブサーバWもしくは端末Tから、広告を組み込んで表示すべきウェブページ内容を表すHTMLデータなどの文字列データ(単に「文章」とも呼ぶ)を受信すると、その文章をカテゴリ処理装置1に渡す。
〔3−1.改善の概要〕
概要としては、改善手段10は、カテゴリ記憶手段22に記憶されているカテゴリ構造について、関連語を含むウェブ検索要求に基づく検索結果に対し判定手段21で判定したカテゴリの適否に基づき、遺伝的アルゴリズムの原理を用いて前記関連語の組合せを変化させることによって、そのカテゴリ構造を改善する。より具体的には、改善手段10は、交叉又は突然変異の少なくとも一方と、自然淘汰と、を用いて、カテゴリ構造の新しい試作個体を探索点として生成し多点探索により適切な解に到達する遺伝的アルゴリズムを、図3のフローチャートに例示する以下のような処理手順により実行する。
このうち、交叉手段12は、個体記憶手段11に記憶されている複数の試作個体を祖先とし、それぞれの部分要素を組み合わせて新たな試作個体を子孫として作成する。例えば、図4(1)に例示するように、あるカテゴリXに対し、関連語A1,A2,A3,A4を組み合わせた試作個体X1と、同じカテゴリXの関連語B1,B2,B3,B4を組み合わせた試作個体X2と、が親として存在するとする。
また、突然変異手段13は、周期的又は不定期の適宜なタイミングで、試作個体の一部を変化させることで突然変異を実現する。具体的には、突然変異手段13は、個体記憶手段11に記憶されている試作個体に含まれるカテゴリ又は関連語に基づいて新たな関連語を取得しその試作個体の関連語に追加する処理、又は、試作個体に含まれる関連語の一部を削除する処理、の少なくとも一方により試作個体を変化させる。
以上のような交叉や突然変異によって作成したり変化した新たな試作個体については、次のような自然淘汰の対象となる。すなわち、まず、検索実施手段14が、個体記憶手段11に記憶されている試作個体のうち、少なくとも新たに作成され又は変化した試作個体を対象として、それら試作個体に含まれる関連語を用いたウェブ検索を、検索サーバ装置4にAPIなどでアクセスして行う(ステップS12)。このウェブ検索は、対象となる試作個体であるカテゴリ構造に含まれる全部又は一部の関連語について、関連語ごとに行い、関連語ごとの検索クエリは、関連語の単独でもよいし、複数の関連語や関連語とカテゴリ(実際にはカテゴリ名などの代表語)を論理演算で組み合わせてもよい。
以上のような改善の処理を繰り返す中で、終了確定手段17は、予め定められた終了条件に基づいて、改善手段10の動作について終了を判定するとともに(ステップS16)、その時点において個体記憶手段11に記憶されている試作個体を新たなカテゴリ構造としてカテゴリ記憶手段22に記憶させる(ステップS17)。
本実施形態では、以上のように、広告選択などに用いるカテゴリ構造について、関連語によるウェブ検索結果が正しいカテゴリに判定されるかに応じて前記関連語の組合せを取捨選択しながら変化させてゆく遺伝的アルゴリズムの原理を用いることにより、カテゴリ構造を適切かつ効率よく改善することができる。
上記実施形態(第1実施形態とも呼ぶこととする)では、関連語などの判定手段21と、カテゴリ構造を記憶しているカテゴリ記憶手段22と、カテゴリ構造の改善手段10と、を本発明のカテゴリ処理装置1が有する例を示したが(図1)、本発明は、判定手段及びカテゴリ記憶手段を構成要素とする必要はない。即ち、判定手段及びカテゴリ記憶手段を備えた既存のカテゴリ等取得装置がある場合に、それに装着するなどにより組合せてカテゴリ構造を改善するためのカテゴリ構造改善装置は、装着前の単体でも、本発明の一態様として把握することができる。
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、上記各実施形態は、応用分野として広告配信を例示したが、本発明によるカテゴリ構造改善の技術は、ニュース記事の自動カテゴリ分類や電子商取引における商品検索など、任意の分野に応用してもよい。また、遺伝的アルゴリズムの具体的内容は自由で、交叉と突然変異の併用は必須ではない。
2 カテゴリ等取得装置
3 広告配信装置
4 検索サーバ装置
6 演算制御部
7 記憶装置
8 通信手段
10 改善手段
111 カテゴリ構造改善装置
11 個体記憶手段
12 交叉手段
13 突然変異手段
14 検索実施手段
15 サンプル生成手段
16 自然淘汰手段
17 終了確定手段
21 判定手段
22 カテゴリ記憶手段
31 広告記憶手段
32 取得手段
33 広告処理手段
41 検索関連データ記憶手段
42 検索処理手段
A1,A2,A3,A4,B1,B2,B3,B4 関連語
N 通信ネットワーク
T 端末
W ウェブサーバ
X カテゴリ
X1,X2,X12,X21 試作個体
Claims (7)
- 与えられる文章に対応する関連語又はカテゴリを判定する判定手段と、
カテゴリごとに、一又は二以上の関連語を対応付けた情報であるカテゴリ構造を記憶しているカテゴリ記憶手段と、
前記カテゴリ記憶手段に記憶されている前記カテゴリ構造について、前記関連語を含むウェブ検索要求に基づく検索結果に対し前記判定手段で判定したカテゴリの適否に基づき、遺伝的アルゴリズムの原理を用いて変化させることによって改善する改善手段と、
を有し、
前記改善手段は、
カテゴリの前記カテゴリ構造について一又は二以上の試作個体を記憶する個体記憶手段と、
前記個体記憶手段に記憶されている複数の試作個体を祖先とし、それぞれの部分要素を組み合わせて新たな試作個体を子孫として作成する交叉手段と、又は、前記個体記憶手段に記憶されている試作個体に含まれるカテゴリ又は関連語に基づいて新たな関連語を取得しその試作個体の関連語に追加する処理、又は、試作個体に含まれる関連語の一部を削除する処理、の少なくとも一方により試作個体を変化させる突然変異手段、の少なくとも一方と、
前記個体記憶手段に記憶されている試作個体に含まれる関連語を用いたウェブ検索を行う検索実施手段と、
前記ウェブ検索の検索結果に含まれる各ウェブページに基づく文字列を複数連結してサンプル文字列を生成するサンプル生成手段と、
生成された前記サンプル文字列について前記判定手段にカテゴリを判定させ、判定されたカテゴリと、そのサンプル文字列の基となった前記試作個体のカテゴリとの異同に基づいて、その試作個体又はその試作個体の祖先もしくは子孫となる試作個体を削除して自然淘汰する自然淘汰手段と、
を有することを特徴とするカテゴリ処理装置。 - 前記改善手段は、交叉又は突然変異の少なくとも一方と、自然淘汰と、を用いて、カテゴリ構造の新しい試作個体を探索点として生成し多点探索により適切な解に到達する遺伝的アルゴリズムを用いることを特徴とする請求項1記載のカテゴリ処理装置。
- 前記突然変異手段は、カテゴリ構造の試作個体におけるカテゴリ又は関連語を用いてウェブ検索を行い、その検索結果に含まれるウェブページに基づく文字列から新たな関連語を取得する
ことを特徴とする請求項1又は2に記載のカテゴリ処理装置。 - 予め定められた終了条件に基づいて、前記改善手段の動作について終了を判定するとともに、その時点において前記個体記憶手段に記憶されている試作個体を新たなカテゴリ構造として前記カテゴリ記憶手段に記憶させる終了確定手段を有する
ことを特徴とする請求項1から3のいずれか一項に記載のカテゴリ処理装置。 - 与えられる文章に対応する関連語又はカテゴリを判定する判定手段と、
カテゴリごとに、一又は二以上の関連語を対応付けた情報であるカテゴリ構造を記憶しているカテゴリ記憶手段と、
を有するカテゴリ等取得装置、のためのカテゴリ構造改善装置であって、
前記カテゴリ記憶手段に記憶されている前記カテゴリ構造について、前記関連語を含むウェブ検索要求に基づく検索結果に対し前記判定手段で判定したカテゴリの適否に基づき、遺伝的アルゴリズムの原理を用いて変化させることによって改善する改善手段と、
を有し、
前記改善手段は、
カテゴリの前記カテゴリ構造について一又は二以上の試作個体を記憶する個体記憶手段と、
前記個体記憶手段に記憶されている複数の試作個体を祖先とし、それぞれの部分要素を組み合わせて新たな試作個体を子孫として作成する交叉手段と、又は、前記個体記憶手段に記憶されている試作個体に含まれるカテゴリ又は関連語に基づいて新たな関連語を取得しその試作個体の関連語に追加する処理、又は、試作個体に含まれる関連語の一部を削除する処理、の少なくとも一方により試作個体を変化させる突然変異手段、の少なくとも一方と、
前記個体記憶手段に記憶されている試作個体に含まれる関連語を用いたウェブ検索を行う検索実施手段と、
前記ウェブ検索の検索結果に含まれる各ウェブページに基づく文字列を複数連結してサンプル文字列を生成するサンプル生成手段と、
生成された前記サンプル文字列について前記判定手段にカテゴリを判定させ、判定されたカテゴリと、そのサンプル文字列の基となった前記試作個体のカテゴリとの異同に基づいて、その試作個体又はその試作個体の祖先もしくは子孫となる試作個体を削除して自然淘汰する自然淘汰手段と、
を有することを特徴とするカテゴリ構造改善装置。 - カテゴリごとに、一又は二以上の関連語を対応付けた情報であるカテゴリ構造を記憶しているカテゴリ記憶手段を有するコンピュータが実行するカテゴリ処理方法であって、
コンピュータが、与えられる文章に対応する関連語又はカテゴリを判定する判定ステップと、
コンピュータが、前記カテゴリ記憶手段に記憶されている前記カテゴリ構造について、
前記関連語を含むウェブ検索要求に基づく検索結果に対し前記判定ステップで判定したカテゴリの適否に基づき、遺伝的アルゴリズムの原理を用いて変化させることによって改善する改善ステップと、
を含み、
前記コンピュータは、さらに、
カテゴリの前記カテゴリ構造について一又は二以上の試作個体を記憶する個体記憶手段
を有し、
前記改善ステップは、
前記個体記憶手段に記憶されている複数の試作個体を祖先とし、それぞれの部分要素を組み合わせて新たな試作個体を子孫として作成する交叉ステップと、又は、前記個体記憶手段に記憶されている試作個体に含まれるカテゴリ又は関連語に基づいて新たな関連語を取得しその試作個体の関連語に追加する処理、又は、試作個体に含まれる関連語の一部を削除する処理、の少なくとも一方により試作個体を変化させる突然変異ステップ、の少なくとも一方と、
前記個体記憶手段に記憶されている試作個体に含まれる関連語を用いたウェブ検索を行う検索実施ステップと、
前記ウェブ検索の検索結果に含まれる各ウェブページに基づく文字列を複数連結してサンプル文字列を生成するサンプル生成ステップと、
生成された前記サンプル文字列について前記判定ステップによりカテゴリを判定させ、判定されたカテゴリと、そのサンプル文字列の基となった前記試作個体のカテゴリとの異同に基づいて、その試作個体又はその試作個体の祖先もしくは子孫となる試作個体を削除して自然淘汰する自然淘汰ステップと、
を含むことを特徴とするカテゴリ処理方法。 - カテゴリごとに、一又は二以上の関連語を対応付けた情報であるカテゴリ構造を記憶しているカテゴリ記憶手段を有するコンピュータを制御するコンピュータ・プログラムであって、
コンピュータに、与えられる文章に対応する関連語又はカテゴリを判定させる判定ステップ、
コンピュータに、前記カテゴリ記憶手段に記憶されている前記カテゴリ構造について、前記関連語を含むウェブ検索要求に基づく検索結果に対し該判定したカテゴリの適否に基づき、遺伝的アルゴリズムの原理を用いて変化させることによって改善させる改善ステップ、
を実行させ、
前記コンピュータは、さらに、
カテゴリの前記カテゴリ構造について一又は二以上の試作個体を記憶する個体記憶手段
を有し、
前記改善ステップは、
コンピュータに、前記個体記憶手段に記憶されている複数の試作個体を祖先とし、それぞれの部分要素を組み合わせて新たな試作個体を子孫として作成させる交叉ステップと、又は、コンピュータに、前記個体記憶手段に記憶されている試作個体に含まれるカテゴリ又は関連語に基づいて新たな関連語を取得しその試作個体の関連語に追加する処理、又は、試作個体に含まれる関連語の一部を削除させる処理、の少なくとも一方により試作個体を変化させる突然変異ステップ、の少なくとも一方と、
コンピュータに、前記個体記憶手段に記憶されている試作個体に含まれる関連語を用いたウェブ検索を行わせる検索実施ステップと、
コンピュータに、前記ウェブ検索の検索結果に含まれる各ウェブページに基づく文字列を複数連結してサンプル文字列を生成させるサンプル生成ステップと、
コンピュータに、生成された前記サンプル文字列について前記判定ステップによりカテゴリを判定させ、判定されたカテゴリと、そのサンプル文字列の基となった前記試作個体のカテゴリとの異同に基づいて、その試作個体又はその試作個体の祖先もしくは子孫となる試作個体を削除して自然淘汰させる自然淘汰ステップと、
を含むことを特徴とするカテゴリ処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010108852A JP5165021B2 (ja) | 2010-05-11 | 2010-05-11 | カテゴリ処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010108852A JP5165021B2 (ja) | 2010-05-11 | 2010-05-11 | カテゴリ処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011238019A JP2011238019A (ja) | 2011-11-24 |
JP5165021B2 true JP5165021B2 (ja) | 2013-03-21 |
Family
ID=45325922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010108852A Expired - Fee Related JP5165021B2 (ja) | 2010-05-11 | 2010-05-11 | カテゴリ処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5165021B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101377695B1 (ko) * | 2013-01-18 | 2014-03-26 | 김수현 | 콘텐츠 인지시간을 이용한 광고 시스템 및 광고 방법 |
KR101712588B1 (ko) * | 2015-09-10 | 2017-03-06 | 주식회사 디케이아이테크놀로지 | 광고 카테고리 생성 장치 및 방법 |
WO2017086108A1 (ja) * | 2015-11-16 | 2017-05-26 | 大日本印刷株式会社 | 情報提示装置、情報提示方法、プログラム、情報処理装置及び案内ロボット制御システム |
CN108268488B (zh) | 2016-12-30 | 2022-04-19 | 百度在线网络技术(北京)有限公司 | 网页主图识别方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001099043A1 (en) * | 2000-06-19 | 2001-12-27 | Correlogic Systems, Inc. | Heuristic method of classification |
US20070061319A1 (en) * | 2005-09-09 | 2007-03-15 | Xerox Corporation | Method for document clustering based on page layout attributes |
JP5115059B2 (ja) * | 2007-07-03 | 2013-01-09 | 大日本印刷株式会社 | キーワード分類装置 |
JP4962986B2 (ja) * | 2008-04-01 | 2012-06-27 | ヤフー株式会社 | コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム |
-
2010
- 2010-05-11 JP JP2010108852A patent/JP5165021B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011238019A (ja) | 2011-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5458181B2 (ja) | 高度な検索結果ページコンテンツを提供するためのシステム及び方法 | |
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
CN102246167B (zh) | 提供搜索结果 | |
JP5522743B2 (ja) | 重複する文書の検出および表示機能 | |
CN101124609B (zh) | 使用内联上下文查询的搜索系统及方法 | |
US7475074B2 (en) | Web search system and method thereof | |
KR101215791B1 (ko) | 검색 쿼리 결과로부터 관련성을 추론하는 컴퓨터로 구현되는 방법 및 컴퓨터 판독가능한 매체 | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
CA3183941A1 (en) | Machine learning based webinterface generation and testing system | |
US20130151497A1 (en) | Providing information relating to a document | |
US20150215271A1 (en) | Generating suggested domain names by locking slds, tokens and tlds | |
CN102073725A (zh) | 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统 | |
CN102043833A (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
WO2011060231A2 (en) | Method and system for grouping chunks extracted from a document, highlighting the location of a document chunk within a document, and ranking hyperlinks within a document | |
JP2016505178A (ja) | ユーザ参加による検索エンジンソーティング方法 | |
US20150154294A1 (en) | Suggested domain names positioning based on term frequency or term co-occurrence | |
JP2009026195A (ja) | 商品分類装置、商品分類方法及びプログラム | |
CN108647276A (zh) | 一种搜索方法 | |
US20150347423A1 (en) | Methods for completing a user search | |
JP5480058B2 (ja) | 広告マッチング装置、方法及びプログラム | |
WO2008049360A1 (fr) | Procede et systeme correspondant de fourniture de service provenant d'une tierce partie | |
JP5165021B2 (ja) | カテゴリ処理装置及び方法 | |
CN108520007A (zh) | 万维网网页信息提取方法、存储介质及计算机设备 | |
CN106202146B (zh) | 一种搜索引擎终端用户输入参考文件搜索提示信息的处理方法 | |
CN107622125B (zh) | 一种信息爬取方法和装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20121001 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5165021 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |