JP2009230227A - Advertisement server and advertisement keyword retrieval method - Google Patents

Advertisement server and advertisement keyword retrieval method Download PDF

Info

Publication number
JP2009230227A
JP2009230227A JP2008071885A JP2008071885A JP2009230227A JP 2009230227 A JP2009230227 A JP 2009230227A JP 2008071885 A JP2008071885 A JP 2008071885A JP 2008071885 A JP2008071885 A JP 2008071885A JP 2009230227 A JP2009230227 A JP 2009230227A
Authority
JP
Japan
Prior art keywords
keyword
character code
web page
advertisement
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008071885A
Other languages
Japanese (ja)
Other versions
JP5014219B2 (en
Inventor
Atsushi Otake
敦 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008071885A priority Critical patent/JP5014219B2/en
Publication of JP2009230227A publication Critical patent/JP2009230227A/en
Application granted granted Critical
Publication of JP5014219B2 publication Critical patent/JP5014219B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for retrieving a keyword without interpreting characters when character codes with the content of a Web page and the keyword of the advertisement respectively recorded therein are coincident. <P>SOLUTION: An advertisement server includes: a keyword recording means for recording the keyword concerning the advertisement with the use of one or more character codes; a character code recognizing means for recognizing the character code with the information concerning the Web page recorded therein; a keyword reading means for reading the keyword recorded in the keyword recording means with the use of the character code being the same as that which is recognized by the character code recognizing means; and a keyword determining means for determining whether the keyword is included in the Web page or not by comparing the information concerning the Web page with the keyword through the use of the character codes. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、広告サーバ及び広告キーワード検索方法に関する。   The present invention relates to an advertisement server and an advertisement keyword search method.

Webページに広告掲載を行うとき、コンテンツの内容を分析し、コンテンツ中に記載されているキーワードに沿った広告を表示するコンテンツマッチング方式と呼ばれているものがある(例えば、特許文献1)。その際、広告について定めたキーワードが、当該Webページに含まれるか否かの検索が行われる。   When an advertisement is placed on a Web page, there is a so-called content matching method that analyzes the content of the content and displays an advertisement in accordance with a keyword described in the content (for example, Patent Document 1). At that time, a search is performed to determine whether or not the keyword defined for the advertisement is included in the Web page.

一方、Webページはいろいろな文字コードで記録されており、また広告のキーワードも所定の文字コードで記録されていることから、両社の文字コードが必ずしも一致しない場合がある。文字コードとしては代表的なものだけでも、ISO−2022−JP(JIS)、Shift_JIS、EUC−JP、UTF−7(Unicode)、UTF−8(Unicode)等がある。   On the other hand, since web pages are recorded with various character codes, and advertisement keywords are also recorded with predetermined character codes, the character codes of both companies may not necessarily match. As representative character codes, there are ISO-2022-JP (JIS), Shift_JIS, EUC-JP, UTF-7 (Unicode), UTF-8 (Unicode), and the like.

特開2005−242753号公報JP 2005-242753 A

したがって、広告のキーワードがWebページに含まれているか否かの検索を行うときには、Webページが記録されている文字コードに基づいてコンテンツの内容の文字を解釈し、一方、広告のキーワードについても同様に文字を解釈して、文字に基づいて検索を行う必要がある。   Therefore, when searching for whether or not an advertisement keyword is included in the web page, the content character is interpreted based on the character code recorded in the web page, while the advertisement keyword is the same. It is necessary to interpret characters and to search based on the characters.

この方法によれば、両者の文字コードが一致しなくても、文字を解釈して比較を行うので検索が可能というメリットがあるが、一方、両者の文字を解釈するという処理を行う必要があった。そこで、本発明は、Webページのコンテンツと広告のキーワードがそれぞれ記録される文字コードが一致する場合には、文字を解釈することなくキーワードの検索を行うという手法を提供することを目的とする。   According to this method, even if the character codes of both do not match, there is an advantage that the search is possible because the characters are interpreted and compared, but on the other hand, it is necessary to perform a process of interpreting both characters. It was. Therefore, an object of the present invention is to provide a technique of searching for a keyword without interpreting characters when the character code in which the content of the Web page and the keyword of the advertisement are recorded matches.

本発明者は、Webページのコンテンツと広告のキーワードがそれぞれ記録される文字コードが一致する場合には、両者の文字を解釈することなく、文字コードのままで比較するという仕組みを見出し、本発明を完成するに至った。本発明は、具体的には次のようなものを提供する。   The present inventor has found a mechanism that, when the character code recorded in the Web page content and the advertisement keyword respectively matches, the character code is compared without interpreting both characters. It came to complete. Specifically, the present invention provides the following.

(1)広告に係るキーワードを1以上の文字コードで記録したキーワード記録手段と、Webページに係る情報が記録された文字コードを認識する文字コード認識手段と、前記文字コード認識手段により認識された文字コードと同一の文字コードで前記キーワード記録手段に記録された前記キーワードを読み出すキーワード読み出し手段と、前記キーワードが前記Webページに含まれるか否かを前記Webページに係る情報と前記キーワードを文字コードで比較することにより判定するキーワード判定手段と、を備える広告サーバ。   (1) Keyword recording means for recording a keyword related to an advertisement with one or more character codes, character code recognizing means for recognizing a character code recorded with information related to a web page, and the character code recognizing means Keyword reading means for reading out the keyword recorded in the keyword recording means with the same character code as the character code, information on the Web page and whether or not the keyword is included in the Web page and the keyword as the character code An advertisement server comprising: keyword determination means for determining by comparing with each other.

本発明のこのような構成によれば、広告に係るキーワードがWebページに含まれるか否かを、Webページに係る情報が記録された文字コードと同一の文字コードで記録されたキーワードを、予め記録されたキーワード情報の中から選んで比較することができるので、両者の文字を解釈する必要がなく、文字コードのままで高速で比較を行うことができる。また、サーバの処理負荷が少なくて済む。   According to such a configuration of the present invention, whether or not a keyword related to an advertisement is included in a Web page is determined based on whether or not a keyword recorded in the same character code as the information related to the Web page is recorded in advance. Since it is possible to select and compare the recorded keyword information, it is not necessary to interpret both characters, and the comparison can be performed at high speed without changing the character code. Also, the processing load on the server can be reduced.

(2)広告に係るキーワードを所定の文字コードで記録したキーワード記録手段と、Webページに係る情報が記録された文字コードを認識する文字コード認識手段と、前記キーワード記録手段に記録された前記キーワードを読み出すキーワード読み出し手段と、前記キーワードを記録した所定の文字コードと前記文字コード認識手段により認識された文字コードとが一致するか否かを判定する文字コード判定手段と、前記文字コード判定手段で前記2つの文字コードが一致しないと判定された場合に、前記キーワードを前記文字コード認識手段により認識された文字コードに変換する文字コード変換手段と、前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定手段と、を備える広告サーバ。   (2) Keyword recording means for recording a keyword relating to an advertisement with a predetermined character code, character code recognizing means for recognizing a character code in which information relating to a Web page is recorded, and the keyword recorded in the keyword recording means A keyword reading means for reading out, a character code determining means for determining whether or not a predetermined character code recorded with the keyword matches a character code recognized by the character code recognizing means, and the character code determining means Character code conversion means for converting the keyword into a character code recognized by the character code recognition means when it is determined that the two character codes do not match, and whether or not the keyword is included in the Web page To compare the information related to the Web page and the keyword with the character code The ad server, which includes a keyword determining means for determining, the Ri.

本発明のこのような構成によれば、広告に係るキーワードが記録された文字コードとWebページに係る情報が記録された文字コードとが一致するか否かを判定し、両者が一致しない場合は、広告に係るキーワードをWebページに係る情報が記録された文字コードに変換して、広告に係るキーワードがWebページに含まれるか否かを文字コードのまま比較することができるので、広告に係るキーワードを予め何種類かの文字コードで記録しておかなくても(1)の発明と同様の効果を発揮することができる。   According to such a configuration of the present invention, it is determined whether or not the character code in which the keyword related to the advertisement is recorded matches the character code in which the information related to the Web page is recorded. Since the keyword related to the advertisement is converted into the character code in which the information related to the web page is recorded, whether the keyword related to the advertisement is included in the web page or not can be compared with the character code. The effect similar to that of the invention of (1) can be exhibited even if the keyword is not recorded in advance with several kinds of character codes.

(3)前記キーワード判定手段は、前記キーワードと前記Webページに係る情報とを、前記Webに係る情報の比較をする部分を、前記キーワードの長さで、1バイトずつずらしながら比較することを特徴とする(1)または(2)に記載の広告サーバ。   (3) The keyword determination unit compares the keyword and the information related to the Web page while shifting a part for comparing the information related to the Web by shifting the length of the keyword by 1 byte. The advertisement server according to (1) or (2).

本発明のこのような構成によれば、広告に係るキーワードがWebページに含まれるか否かを、キーワードと前記Webページに係る情報とを、Webページに係る情報の比較をする部分を、キーワードの長さで、1バイトずつずらしながら比較するので、検索漏れが生じない。   According to such a configuration of the present invention, whether a keyword related to an advertisement is included in a Web page, whether the keyword and the information related to the Web page are compared with information related to the Web page, Since the comparison is performed while shifting by 1 byte at a length, the search omission is not caused.

(4)前記Webページに係る情報について、1バイトずつずらしながら前記キーワードの長さの文字コードを抽出してそれぞれ異なるインデックスデータを作成するインデックスデータ作成手段をさらに備え、前記キーワード判定手段は、前記インデックスデータと前記キーワードを比較することを特徴とする(1)または(2)に記載の広告サーバ。   (4) The information on the Web page further includes index data creating means for creating different index data by extracting the character code of the keyword length while shifting by 1 byte, and the keyword determining means The advertisement server according to (1) or (2), wherein index data is compared with the keyword.

本発明のこのような構成によれば、Webページの内容とキーワードを直接比較するのではなく、Webページの内容を1バイトずつずらしながらキーワードの長さの文字コードを抽出してそれぞれ異なるインデックスデータを作成するので、重複する部分についてはWebページの参照部分が圧縮され、処理時間を短縮することができる。特に、キーワードの長さが同一の複数個のキーワードについて比較の処理を行う場合には、一旦作成したインデックスデータが利用できるので処理時間の短縮効果は大きい。   According to such a configuration of the present invention, instead of directly comparing the content of the Web page and the keyword, the character code of the keyword length is extracted while shifting the content of the Web page by 1 byte, and the different index data Therefore, the reference part of the Web page is compressed for the overlapping part, and the processing time can be shortened. In particular, when a comparison process is performed for a plurality of keywords having the same keyword length, since the index data once created can be used, the effect of shortening the processing time is great.

(5)前記キーワード判定手段は、前記インデックスデータを所定の順番に並べ替えて前記インデックスデータと前記キーワードを比較することを特徴とする(4)に記載の広告サーバ。   (5) The advertisement server according to (4), wherein the keyword determination unit rearranges the index data in a predetermined order and compares the index data with the keyword.

本発明のこのような構成によれば、インデックスデータを例えば文字コードが昇順等になるように並べ替えてキーワードと比較することができるので、二分探索法等の高速な比較処理が可能となる。その結果、比較に係る処理時間を大幅に短縮することができる。   According to such a configuration of the present invention, the index data can be rearranged so that, for example, the character codes are in ascending order and compared with the keyword, so that high-speed comparison processing such as a binary search method can be performed. As a result, the processing time for comparison can be greatly shortened.

(6)前記キーワード判定手段により前記Webページに前記キーワードが含まれると判定された広告が複数ある場合には、所定のルールに基づき1の広告を選択する広告選択手段をさらに備えることを特徴とする(1)から(5)のいずれかに記載の広告サーバ。   (6) When there are a plurality of advertisements for which the keyword is determined to be included in the Web page by the keyword determination means, the advertisement selection means for selecting one advertisement based on a predetermined rule is further provided. The advertisement server according to any one of (1) to (5).

本発明のこのような構成によれば、Webページにキーワードが含まれる広告が複数ある場合に、所定のルールに基づき1つの広告を選択することができるので、キーワードの検索方法の変更にかかわらず、従来の広告選択方法を利用することができる。   According to such a configuration of the present invention, when there are a plurality of advertisements that include a keyword in a Web page, one advertisement can be selected based on a predetermined rule. A conventional advertisement selection method can be used.

(7)広告に係るキーワードが1以上の文字コードで記録されており、サーバが、Webページに係る情報が記録された文字コードを認識する文字コード認識ステップと、サーバが、前記認識された文字コードと同一の文字コードで記録された前記キーワードを読み出すキーワード読み出しステップと、サーバが、前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定ステップと、を備えた広告キーワード検索方法。   (7) A character code recognition step in which the keyword related to the advertisement is recorded with one or more character codes, and the server recognizes the character code in which the information related to the Web page is recorded, and the server recognizes the recognized character A keyword reading step for reading the keyword recorded with the same character code as the code, and the server compares the information on the Web page with the keyword based on the character code to determine whether the keyword is included in the Web page. And a keyword determination step for determining the advertisement keyword.

本発明のこのような構成によれば、(1)に記載した発明をサーバを用いて実現することができるので、(1)と同様の効果を発揮することができる。   According to such a configuration of the present invention, since the invention described in (1) can be realized using a server, the same effect as in (1) can be exhibited.

(8)広告に係るキーワードが所定の文字コードで記録されており、サーバが、Webページに係る情報が記録された文字コードを認識する文字コード認識ステップと、サーバが、記録された前記キーワードを読み出すキーワード読み出しステップと、サーバが、前記広告に係るキーワードが記録された文字コードと前記Webページに係る情報が記録された文字コードとが一致するか否かを判定する文字コード判定ステップと、前記広告に係るキーワードが記録された文字コードと前記Webページに係る情報が記録された文字コードとが一致しないと判定された場合に、サーバが、前記キーワードを前記Webページに係る情報が記録された文字コードに変換する文字コード変換ステップと、サーバが、前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定ステップと、を備えた広告キーワード検索方法。   (8) The keyword related to the advertisement is recorded in a predetermined character code, and the server recognizes the character code in which the information related to the Web page is recorded, and the server stores the recorded keyword. A keyword reading step for reading, a character code determining step for determining whether or not the character code in which the keyword related to the advertisement is recorded matches the character code in which the information related to the Web page is recorded, and When it is determined that the character code in which the keyword related to the advertisement is recorded does not match the character code in which the information related to the Web page is recorded, the server records the information related to the Web page as the keyword. A character code conversion step for converting to a character code; Advertisement keyword search method and a keyword determining step of determining by whether the compared character code and the information relating to the Web page keyword included in the.

本発明のこのような構成によれば、(2)に記載した発明をサーバを用いて実現することができるので、(2)と同様の効果を発揮することができる。   According to such a configuration of the present invention, since the invention described in (2) can be realized using a server, the same effect as in (2) can be exhibited.

この発明によれば、Webページのコンテンツ中に記載されているキーワードに沿った広告を表示するコンテンツマッチング方式において、広告に係るキーワードがWebページに含まれるか否かを、文字を解釈することなく文字コードのままで比較し判定することができるので、処理負荷の軽減と処理速度の高速化を図ることができる。また、キーワードの長さで1バイトずつずらして比較する、いわゆるNグラム方式を、文字コードレベルで用いることにより検索漏れがなくなり、精度の高い検索を行うことができる。   According to the present invention, in a content matching method for displaying an advertisement in accordance with a keyword described in content of a Web page, whether or not the keyword related to the advertisement is included in the Web page is not interpreted. Since the comparison can be made with the character code as it is, the processing load can be reduced and the processing speed can be increased. Further, by using a so-called N-gram method in which the comparison is performed by shifting the length of the keyword by one byte at a time, at the character code level, there is no omission of search and a highly accurate search can be performed.

以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(第1の実施形態)
Hereinafter, the best mode for carrying out the present invention will be described with reference to the drawings. This is merely an example, and the technical scope of the present invention is not limited to this.
(First embodiment)

[広告サーバの全体構成図]
図1は、広告サーバとWebページに係る情報が記録されているWebページDBの全体構成を示す図である。
[Overall configuration of ad server]
FIG. 1 is a diagram illustrating an entire configuration of a Web page DB in which information related to an advertisement server and a Web page is recorded.

広告サーバ1は、ユーザからWebページの読み出し要求を受けてWebページDB15からWebページに係る情報を読み出すWebページ読み出し手段2と、読み出したWebページが記録されている文字コードを認識する文字コード認識手段3と、キーワードを含む広告管理テーブルが1以上の文字コードでそれぞれ記録されているキーワード記録手段10と、指定する文字コードに応じた広告管理テーブルをキーワード記録手段10から読み出すキーワード読み出し手段4と、Webページに当該キーワードが含まれているか否かを文字コードレベルで比較判定するキーワード判定手段8と、当該Webページにキーワードが含まれる広告が複数あったときに掲載すべき広告を選択する広告選択手段9とから構成される。   The advertisement server 1 receives a web page read request from the user, reads web page reading means 2 from the web page DB 15, and character code recognition that recognizes the character code in which the read web page is recorded. Means 3, keyword recording means 10 in which an advertisement management table including keywords is recorded in one or more character codes, and keyword reading means 4 for reading out an advertisement management table corresponding to a designated character code from the keyword recording means 10; , Keyword determining means 8 for comparing and determining whether or not the keyword is included in the Web page at the character code level, and an advertisement for selecting an advertisement to be posted when there are a plurality of advertisements including the keyword in the Web page And selecting means 9.

WebページDB15は、各Webページに係る情報が記録されているデータベースである。WebページDB15からのWebページに係る情報の読み出しは、広告サーバ1以外のサーバで行ってもよいが、本実施形態では広告サーバ1で行うこととしている。   The web page DB 15 is a database in which information related to each web page is recorded. Reading of information related to the web page from the web page DB 15 may be performed by a server other than the advertisement server 1, but in the present embodiment, it is performed by the advertisement server 1.

[広告サーバのハードウェア構成図]
図2は、本実施形態に係る広告サーバ1のハードウェア構成を示す図である。広告サーバ1は、制御部30を構成するCPU(Central Processing Unit)31(マルチプロセッサ構成ではCPU32等複数のCPUが追加されてもよい)、バスライン20、通信I/F(I/F:インターフェイス)33、メインメモリ34、BIOS(Basic Input Output System)35、表示装置36、I/Oコントローラ37、並びにキーボード及びマウス等の入力装置38を備える。
[Advertising server hardware configuration]
FIG. 2 is a diagram illustrating a hardware configuration of the advertisement server 1 according to the present embodiment. The advertisement server 1 includes a CPU (Central Processing Unit) 31 (a plurality of CPUs such as a CPU 32 may be added in a multiprocessor configuration), a bus line 20, a communication I / F (I / F: interface) that configure the control unit 30. ) 33, a main memory 34, a BIOS (Basic Input Output System) 35, a display device 36, an I / O controller 37, and an input device 38 such as a keyboard and a mouse.

制御部30は、広告サーバ1を統括的に制御する部分であり、ハードディスク40(後述)に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。   The control unit 30 is a part that controls the advertisement server 1 in an integrated manner. By appropriately reading and executing various programs stored in the hard disk 40 (described later), the control unit 30 cooperates with the hardware described above, and Various functions are realized.

通信I/F33は、広告サーバ1が、インターネット(図示せず)を介してブラウザ(図示せず)からWebページの読み出し要求を受け取ったり、また読み出したWebページに広告を挿入して送信したりする場合のネットワーク・アダプタである。通信I/F33は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。   In the communication I / F 33, the advertisement server 1 receives a web page read request from a browser (not shown) via the Internet (not shown), or inserts an advertisement into the read web page and transmits it. If it is a network adapter. The communication I / F 33 may include a modem, a cable modem, and an Ethernet (registered trademark) adapter.

BIOS35は、広告サーバ1の起動時にCPU31が実行するブートプログラムや、広告サーバ1のハードウェアに依存するプログラム等を記録する。   The BIOS 35 records a boot program executed by the CPU 31 when the advertisement server 1 is started up, a program depending on the hardware of the advertisement server 1, and the like.

表示装置36は、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。   The display device 36 includes a display device such as a cathode ray tube display device (CRT) or a liquid crystal display device (LCD).

I/Oコントローラ37には、ハードディスク40、及び半導体メモリ41等の記憶装置42を接続することができる。   A storage device 42 such as a hard disk 40 and a semiconductor memory 41 can be connected to the I / O controller 37.

入力装置38は、広告サーバ1の管理者による入力の受け付けを行うものである。   The input device 38 accepts input by the administrator of the advertisement server 1.

ハードディスク40は、本ハードウェアを広告サーバ1として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブルを記憶する。なお、広告サーバ1は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。図1で説明したWebページDB15は、外部に設けたハードディスクに記録されている。   The hard disk 40 stores various programs for causing the hardware to function as the advertisement server 1, a program for executing the functions of the present invention, and a table to be described later. The advertisement server 1 can also use an external hard disk (not shown) as an external storage device. The web page DB 15 described in FIG. 1 is recorded on an external hard disk.

以上、広告サーバ1のハードウェア構成について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータを広告サーバ1として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した広告サーバ1により実現される機能は、上述の方法を当該コンピュータにより実行することによって、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。   Although the hardware configuration of the advertisement server 1 has been mainly described above, the functions described above can be realized by installing a program in a computer and causing the computer to operate as the advertisement server 1. Therefore, the function realized by the advertisement server 1 described as an embodiment in the present invention can be realized by executing the above-described method by the computer, or by introducing the above-described program into the computer and executing it. It is feasible.

なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、広告サーバ1は、記憶装置42、制御部30等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。   The computer in the present invention refers to an information processing device including a storage device, a control unit, and the like, and the advertisement server 1 includes an information processing device including a storage device 42, a control unit 30, and the like. The processing device is included in the concept of the computer of the present invention.

Webページ読み出し手段2、文字コード認識手段3、キーワード読み出し手段4、キーワード判定手段8、広告選択手段9には主に制御部30が、キーワード記録手段10には記憶装置42がそれぞれ対応する。   The control unit 30 mainly corresponds to the Web page reading unit 2, the character code recognition unit 3, the keyword reading unit 4, the keyword determination unit 8, and the advertisement selection unit 9, and the storage unit 42 corresponds to the keyword recording unit 10.

[文字コード別のキーワード情報の記録]
図3は、文字コードキーワード対応テーブルを示す図である。これは、文字コードとキーワード記録手段10上に文字コード別に記録されている広告管理テーブル(後述)のファイル名との対応関係を表す。文字コードは、例えば、Shift_JISやEUC−JPというものであるが、ここではcode1、code2というように表示している。広告管理テーブルがキーワード記録手段10上にcode1の文字コードでad0001というファイル名で、code2の文字コードでad0002というファイル名でそれぞれ記録されていることを示している。
[Record keyword information by character code]
FIG. 3 is a diagram showing a character code keyword correspondence table. This represents the correspondence between the character code and the file name of an advertisement management table (described later) recorded on the keyword recording means 10 for each character code. The character code is, for example, Shift_JIS or EUC-JP, but is displayed as code1 and code2 here. It shows that the advertisement management table is recorded on the keyword recording means 10 with a file name of ad0001 with the code code of code1 and with a file name of ad0002 with the character code of code2.

[広告管理テーブル]
図4は、広告管理テーブルを示す図である。図4(a)は、文字コードcode1で記録されたもの(ファイル名はad0001)である。図4(b)は、文字コードcode2で記録されたもの(ファイル名はad0002)である。両者は記録されている文字コードが異なるだけで内容は同一である。
[Ad management table]
FIG. 4 is a diagram illustrating an advertisement management table. FIG. 4A shows the data recorded with the character code code1 (file name is ad0001). FIG. 4B shows the data recorded with the character code code2 (file name is ad0002). Both have the same content, except that the recorded character codes are different.

例えば、広告IDがAの広告は、「車」がキーワードとなっているが、文字コードcode1では、「8A5C6B」と3バイトで表されている。一方、文字コードcode2では、「013F6BF0」と4バイトで表されている。ここで、A〜Fは10〜15を16進数表示したものである。   For example, an advertisement with an advertisement ID A has “car” as a keyword, but the character code “code1” is represented by 3 bytes as “8A5C6B”. On the other hand, the character code code2 is represented by 4 bytes as “013F6BF0”. Here, A to F are 10 to 15 in hexadecimal notation.

広告管理テーブルのその他の情報も同様にそれぞれの文字コードで記録されているが、文字コードレベルでの表示は省略する。以下、広告管理テーブルについて説明する。   Other information in the advertisement management table is similarly recorded in the respective character codes, but display at the character code level is omitted. Hereinafter, the advertisement management table will be described.

各広告は、広告IDにより識別される。この例においては、広告IDがA、B、Cの3つの広告が登録されている。   Each advertisement is identified by an advertisement ID. In this example, three advertisements with advertisement IDs A, B, and C are registered.

各広告について、掲載の優先度を決めるための優先度指標が保有されている。優先度指標は何であってもよいが、この例では、契約額が優先度指標として用いられている。契約額に応じて、掲載確率が配分される。したがって、他の条件が同じであれば、契約額が2倍になれば掲載確率も2倍となる。   For each advertisement, there is a priority index for determining the priority of placement. The priority index may be anything, but in this example, the contract amount is used as the priority index. Depending on the contract amount, the publication probability is allocated. Therefore, if other conditions are the same, if the contract amount is doubled, the publication probability is also doubled.

ポジションは、Webページ内の広告を掲載する場所を表す。   The position represents a place where an advertisement in the web page is to be posted.

キーワードは、当該広告が掲載されるための条件となる、Webページに含まれるべき言葉を表す。つまり、Aの広告は、掲載の条件として、そのWebページにキーワードで指定されている「車」の言葉が含まれている必要がある。「車」の言葉が含まれていないときは、Aの広告は掲載されない。同様に、Cの広告も、掲載の条件として、そのWebページに「車」の言葉が含まれている必要がある。なお、本例では、キーワードは1つとしているが、2以上であってもよい。   The keyword represents a word that should be included in the Web page, which is a condition for placing the advertisement. That is, the advertisement of A needs to include the word “car” specified by the keyword on the Web page as a condition for posting. If the word “car” is not included, the advertisement for A will not be posted. Similarly, the advertisement of C needs to include the word “car” on its Web page as a condition for posting. In this example, the number of keywords is one, but may be two or more.

リンクは、Webページに掲載された広告がクリックされたときにアクセスするURLを表す。広告のコンテンツのある場所を示す。HTMLに記述される。   The link represents a URL that is accessed when an advertisement posted on a Web page is clicked. Indicates where the ad content is located. Described in HTML.

表示内容は、広告をバナー広告として表示するための表示内容を表す。   The display content represents display content for displaying the advertisement as a banner advertisement.

[キーワードの検索]
ここで、あるWebページの読み出し要求があったとき、当該Webページに広告を掲載するためのキーワード検索の仕方について説明する。
[Keyword search]
Here, a description will be given of how to perform a keyword search for placing an advertisement on a Web page when there is a request to read a Web page.

まず、広告サーバ1は、ユーザから要求があったWebページをWebページDB15から読み出す。ここで、広告サーバ1はWebページ読み出し手段2として機能する。   First, the advertisement server 1 reads the web page requested by the user from the web page DB 15. Here, the advertisement server 1 functions as Web page reading means 2.

次に、広告サーバ1は、そのWebページで使用されている文字コードを認識する。文字コードはHTML文書におけるhead要素の中のmetaタグの中に記載されている。ここで、広告サーバ1は文字コード認識手段3として機能する。   Next, the advertisement server 1 recognizes the character code used in the web page. The character code is described in the meta tag in the head element in the HTML document. Here, the advertisement server 1 functions as the character code recognition means 3.

文字コードを認識すると、広告サーバ1は、文字コードキーワード対応テーブル(図3)を参照してその文字コードで記載されている広告管理テーブルのファイル名を把握する。そして、キーワード記録手段10上に当該ファイル名で記録されている広告管理テーブル(図4)を読み出す。ここで、広告サーバ1はキーワード読み出し手段4として機能する。いま、Webページの文字コードがcode1であったとすると、ファイル名がad0001の広告管理テーブルが読み出される。以下、Webページの文字コードがcode1であったと仮定して説明する。   When recognizing the character code, the advertisement server 1 refers to the character code keyword correspondence table (FIG. 3) and grasps the file name of the advertisement management table described in the character code. Then, the advertisement management table (FIG. 4) recorded on the keyword recording means 10 with the file name is read out. Here, the advertisement server 1 functions as the keyword reading means 4. Now, assuming that the character code of the Web page is code1, the advertisement management table with the file name ad0001 is read. In the following description, it is assumed that the character code of the Web page is code1.

次に、広告サーバ1は、Webページに係る情報の中にキーワードが含まれているかを、文字コードレベルで順に比較する。文字コードレベルで比較をするのは、どのような文字コードであっても、同一の文字コードで表現された情報同士であれば文字を解釈することなく比較することが可能だからである。そのため、文字コードにかかわらず、同一のアルゴリズムで処理が可能であり、高速で比較を行うことができる。   Next, the advertisement server 1 compares in order at the character code level whether or not the keyword is included in the information related to the Web page. The comparison at the character code level is because any character code can be compared without interpreting the characters if the information is expressed by the same character code. Therefore, processing can be performed with the same algorithm regardless of the character code, and comparison can be performed at high speed.

図5は、当該Webページの検索の対象とする情報を文字コードで表した図である。これは、Webページを記述するHTML文書から、タグ等を除き、実質的な内容を示す部分を抽出したものである。文字コードレベルでは0〜9またはA〜Fで16進数表示されている。   FIG. 5 is a diagram showing information to be searched for the Web page in character codes. This is an HTML document that describes a Web page, excluding tags and the like, and extracting a portion showing substantial contents. In the character code level, 0 to 9 or A to F is displayed in hexadecimal.

今、広告管理テーブルの先頭に登録されている広告レコードのキーワードは、文字コードで表すと「8A5C6B」(3バイト)である。そこで、当該Webページの比較の対象である文字コード「E35B948A5C6B7C94985C9D9F5B・・・」を文字コードのままで、先頭から1バイトずつずらしながら比較していく。   The keyword of the advertisement record registered at the top of the advertisement management table is “8A5C6B” (3 bytes) in character code. Therefore, the character code “E35B948A5C6B7C94985C9D9F5B...” That is a comparison target of the Web page is compared with the character code being shifted one byte at a time from the head.

図6は、比較の様子を示した図である。この図を見るとわかるように、先頭から3バイトずらしたところで、「8A5C6B」が一致する。これは、広告IDがAの広告のキーワードが当該Webページに含まれていたことを意味する。以下、同様に広告IDがB、C等の広告のキーワードについても比較する。ここで、広告サーバ1はキーワード判定手段8として機能する。   FIG. 6 is a diagram showing a state of comparison. As can be seen from this figure, “8A5C6B” matches at a position shifted by 3 bytes from the head. This means that the keyword of the advertisement with the advertisement ID A is included in the web page. Hereinafter, similarly, the keywords of advertisements with advertisement IDs B, C, etc. are compared. Here, the advertisement server 1 functions as the keyword determination means 8.

ここで、キーワードがヒットした広告が1つであればその広告を当該Webページに掲載すればよいが、同一のポジションに掲載すべき広告が2つ以上ヒットした場合には、いずれの広告を掲載すべきか選択をしなければならない。   Here, if there is one ad that has a keyword hit, the ad may be posted on the web page. However, if more than one ad that should be placed in the same position is hit, any ad is posted. You have to make a choice.

この例では、広告IDがAとCの広告でいずれもキーワードがヒットする。この場合、AとCのいずれにするかの選択は、優先度指標(契約額)に基づいて行う。Aは契約額が400万円、Cは契約額が100万円であるので、掲載確率は、Aが0.8、Cが0.2となる。そこで、0から1の間の乱数を発生させて0.8以下ならAを、0.8超ならCを選択するようにすればよい。ここで、広告サーバ1は広告選択手段9として機能する。このようにしてWebページへの広告掲載が行われる。   In this example, the keyword is hit in both advertisements with advertisement IDs A and C. In this case, the selection between A and C is made based on the priority index (contract amount). Since A has a contract amount of 4 million yen and C has a contract amount of 1 million yen, the posting probabilities are 0.8 for A and 0.2 for C. Therefore, a random number between 0 and 1 is generated, and if it is 0.8 or less, A may be selected, and if it exceeds 0.8, C may be selected. Here, the advertisement server 1 functions as the advertisement selection means 9. In this way, advertisement is posted on the web page.

(第2の実施形態)
第1の実施形態では、Webページの情報と広告のキーワードを同一の文字コードレベルで比較をするために、広告のキーワードを複数の文字コードで予め記録しておき、読み出し要求のあったWebページの文字コードに応じて対応する文字コードで記録されたキーワードを把握して比較処理を行った。
(Second Embodiment)
In the first embodiment, in order to compare the Web page information and the advertisement keyword at the same character code level, the advertisement keyword is recorded in advance with a plurality of character codes, and the read web page is requested. Based on the character code, the keyword recorded with the corresponding character code was grasped and compared.

しかし、第2の実施形態では、そのように複数の文字コードで予めキーワードを記録しておくのではなく、いずれか所定の文字コードでのみキーワード(つまり、広告管理テーブル)を記録しておき、読み出し要求のあったWebページの文字コードとキーワードの文字コードが異なる場合は、キーワードの文字コードをWebページの文字コードと同じ文字コードに変換して比較する方法を説明する。   However, in the second embodiment, the keyword (that is, the advertisement management table) is recorded only with any predetermined character code, instead of recording the keyword with a plurality of character codes in advance. When the character code of the web page requested to be read is different from the character code of the keyword, a method of comparing the character code of the keyword into the same character code as the character code of the web page will be described.

また、比較の方法も、第1の実施形態では、キーワードの文字コードをWebページの対象部分の文字コードと直接比較したが、第2の実施形態では、Webページの対象部分の文字コードからキーワードの長さの文字コードをインデックスデータとして抽出し、そのインデックスデータを用いて比較をする方法を説明する。   In addition, in the first embodiment, the comparison method directly compares the character code of the keyword with the character code of the target portion of the Web page. However, in the second embodiment, the keyword code is calculated from the character code of the target portion of the Web page. A method of extracting a character code having a length of 1 as index data and performing comparison using the index data will be described.

なお、以下の説明及び図面において、前述した第1実施形態と同様の機能を果たす部分には、同一の符号を付して、重複する説明を適宜省略する。   Note that, in the following description and drawings, the same reference numerals are given to portions that perform the same functions as those in the first embodiment described above, and redundant descriptions are omitted as appropriate.

[広告サーバの全体構成図]
図7は、広告サーバとWebページに係る情報が記録されているWebページDBの全体構成を示す図である。
[Overall configuration of ad server]
FIG. 7 is a diagram showing an overall configuration of the Web page DB in which information related to the advertisement server and the Web page is recorded.

広告サーバ1は、キーワード記録手段10を有するが、図1と異なり、ここには広告管理テーブルが所定の文字コードで1種類のみ記録されている。したがって、キーワード読み出し手段4は、文字コードに対応して決まるファイル名で読み出すのではなく、最初から決まったファイル名で読み出す。文字コード判定手段5は、広告管理テーブルが記録された所定の文字コードと、文字コード認識手段3で認識したWebページが記録されていた文字コードとの一致不一致を判定する。そして、もし一致していなければ、文字コード変換手段6が、キーワードをWebページの文字コードに変換する。一致していれば、変換を行う必要はない。インデックスデータ作成手段7は、Webページの対象部分からキーワードの長さの文字コードベースのインデックスデータを抽出生成し、インデックスDB11に記録する。キーワード判定手段8は、インデックスDB11に記録されたインデックスデータとキーワードを比較する。そして、比較の結果に応じ、広告選択手段9が、当該Webページに掲載すべき広告を選択する。   The advertisement server 1 has the keyword recording means 10, but unlike FIG. 1, only one type of advertisement management table is recorded here with a predetermined character code. Therefore, the keyword reading means 4 does not read with the file name determined according to the character code, but with the file name determined from the beginning. The character code determination unit 5 determines whether or not the predetermined character code in which the advertisement management table is recorded matches the character code in which the Web page recognized by the character code recognition unit 3 is recorded. If they do not match, the character code conversion means 6 converts the keyword into the character code of the Web page. If they match, no conversion is necessary. The index data creation means 7 extracts and generates character code-based index data of the keyword length from the target portion of the Web page, and records it in the index DB 11. The keyword determination means 8 compares the index data recorded in the index DB 11 with the keyword. Then, according to the comparison result, the advertisement selection means 9 selects an advertisement to be posted on the Web page.

[キーワードの文字コード変換]
図8は、文字コードcode1で「8A5C6B」という内容で記録されていた「車」というキーワードを文字コードcode2の表現内容に変換した例を示している。これは、キーワードが予め文字コードcode1で記録されているところ、読み出されたWebページが文字コードcode2で作成されていたので、そのままでは文字コードレベルの比較ができないため、キーワードを文字コードcode2の内容に変換するものである。しかし、いずれも「車」を表すことには変わりはない。文字コードの変換は、文字コード表(図示せず)を用いれば容易に行うことができる。
[Keyword character code conversion]
FIG. 8 shows an example in which the keyword “car” recorded with the content “8A5C6B” in the character code code1 is converted into the expression content of the character code code2. This is because the keyword is recorded in advance with the character code code1, and since the read web page is created with the character code code2, the character code level cannot be compared as it is. The content is converted. However, in any case, there is no change in representing "car". Conversion of the character code can be easily performed by using a character code table (not shown).

[Webページの内容のインデックス化]
Webページの比較の対象部分の内容が文字コードレベルで「E35B948A5C6B7C94985C9D9F5B・・・」であった場合、これから任意の長さのインデックスデータを抽出することができる。一般的にNグラム方式と言われている方法で、対象データの先頭から1バイトずつずらしながら所定の長さのデータを抽出していくものである。
[Web page content indexing]
When the content of the comparison target part of the Web page is “E35B948A5C6B7C94985C9D9F5B...” At the character code level, index data of an arbitrary length can be extracted from this. In a method generally called the N-gram method, data of a predetermined length is extracted while shifting one byte at a time from the head of the target data.

図9は、インデックスデータの抽出方法を示す図である。図9(a)は、Webページの対象部分の内容を文字コードレベルで表したものである。図9(b)は、その内容を1バイト単位で表示したものである。図9(c)は、ここから1バイトのインデックスデータを抽出したものである。データの抽出は、先頭から始めて1バイトずつずらしながら抽出していく。ここで、左側は、抽出したデータそのもの、右側はそれをデータ内容の昇順に並べなおしたものである。同様に、図9(d)は、2バイトのインデックスデータを抽出したもの、図9(e)は、3バイトのインデックスデータを抽出したもの、図9(f)は、4バイトのインデックスデータを抽出したものである。いずれの場合も、同一のインデックスデータが抽出された場合は、1つを残し、他は削除するものとする。比較のためのインデックスとしては1つあれば十分だからである。   FIG. 9 is a diagram illustrating an index data extraction method. FIG. 9A shows the contents of the target portion of the Web page at the character code level. FIG. 9B shows the contents in units of 1 byte. FIG. 9C shows a 1-byte index data extracted therefrom. Data extraction starts from the beginning and shifts by 1 byte. Here, the left side is the extracted data itself, and the right side is the rearranged data in ascending order. Similarly, FIG. 9 (d) shows an example in which 2-byte index data is extracted, FIG. 9 (e) shows an example in which 3-byte index data is extracted, and FIG. 9 (f) shows an example in which 4-byte index data is extracted. Extracted. In any case, when the same index data is extracted, one is left and the other is deleted. This is because one index is sufficient for comparison.

文字コードを変換した後のキーワードの内容は、「013F6BF0」(4バイト)であるから、4バイトインデックスデータ(図9(f))を抽出し、これを並べ直したものと比較する。直接比較してもよいが、並べ直したものと比較する方が、二分探索法等が利用できるため高速に処理できるからである。   Since the content of the keyword after converting the character code is “013F6BF0” (4 bytes), 4-byte index data (FIG. 9F) is extracted and compared with the rearranged data. The comparison may be performed directly, but the comparison with the rearranged one can be performed at high speed because the binary search method or the like can be used.

このようにインデックス化して比較すると、重複する部分については同じインデックスデータを抽出する必要がないためインデックスデータの数を圧縮することができるので、直接比較する場合と異なり、効率的に比較することができる。また、一旦インデックス化すると、キーワードの長さが同じ他のキーワードについても利用できるため効率的である。したがって、本実施形態では、キーワードの長さに合わせてインデックスデータの抽出を行うこととしたが、複数のキーワードとの比較を行うことを考慮すると、まず最初に、適宜、長さを変えてインデックスデータを複数種類抽出しておくようにしてもよい。なお、広告の選択については第1の実施形態と同様であるので省略する。   In this way, when indexing and comparing, it is not necessary to extract the same index data for overlapping parts, so the number of index data can be compressed. it can. Also, once indexed, it is efficient because other keywords having the same keyword length can be used. Therefore, in this embodiment, the index data is extracted according to the length of the keyword. However, considering the comparison with a plurality of keywords, first, the index is appropriately changed by changing the length. A plurality of types of data may be extracted. Note that the selection of advertisements is the same as in the first embodiment, and is therefore omitted.

[フローチャート]
最後に、図10に本実施形態の処理フローを示す。
[flowchart]
Finally, FIG. 10 shows a processing flow of this embodiment.

S1:広告サーバ1の制御部は、ユーザから読み出し要求を受けたWebページをWebページDB15から読み出す。ここで、広告サーバ1はWebページ読み出し手段2として機能する。   S1: The control unit of the advertisement server 1 reads a web page that has received a read request from the user from the web page DB 15. Here, the advertisement server 1 functions as Web page reading means 2.

S2:広告サーバ1の制御部は、読み出したWebページで使用されている文字コードを認識する。ここで、広告サーバ1は文字コード認識手段3として機能する。   S2: The control unit of the advertisement server 1 recognizes the character code used in the read web page. Here, the advertisement server 1 functions as the character code recognition means 3.

S3:広告サーバ1の制御部は、キーワード記録手段10から広告管理テーブルを読み出す。ここで、広告サーバ1はキーワード読み出し手段4として機能する。   S3: The control unit of the advertisement server 1 reads the advertisement management table from the keyword recording means 10. Here, the advertisement server 1 functions as the keyword reading means 4.

S4:広告サーバ1の制御部は、キーワードを記録していた文字コードとステップ2(S2)で認識した文字コードが一致するか否か判定する。ここで、広告サーバ1は文字コード判定手段5として機能する。そして両者が一致する場合(S4:Yes)は、ステップ6(S6)に進む。   S4: The control unit of the advertisement server 1 determines whether or not the character code recorded with the keyword matches the character code recognized in step 2 (S2). Here, the advertisement server 1 functions as the character code determination means 5. And when both correspond (S4: Yes), it progresses to step 6 (S6).

S5:両者が一致しない場合(S4:No)は、広告サーバ1の制御部は、キーワードの文字コードをWebページの文字コードに変換する。ここで、広告サーバ1は文字コード変換手段6として機能する。   S5: When the two do not match (S4: No), the control unit of the advertisement server 1 converts the character code of the keyword into the character code of the Web page. Here, the advertisement server 1 functions as the character code conversion means 6.

S6:広告サーバ1の制御部は、Webページの対象部分からキーワードの長さの文字コードベースのインデックスデータを抽出する。ここで、広告サーバ1はインデックスデータ作成手段7として機能する。必要に応じて、抽出したインデックスデータを昇順等に並べ替えてもよい。   S6: The control unit of the advertisement server 1 extracts the character code based index data of the keyword length from the target portion of the Web page. Here, the advertisement server 1 functions as index data creation means 7. If necessary, the extracted index data may be rearranged in ascending order.

S7:広告サーバ1の制御部は、インデックスデータとキーワードとを比較する。ここで、広告サーバ1はキーワード判定手段8として機能する。   S7: The control unit of the advertisement server 1 compares the index data with the keyword. Here, the advertisement server 1 functions as the keyword determination means 8.

S8:広告サーバ1の制御部は、上記の比較の結果に応じて掲載すべき広告を選択する。ここで、広告サーバ1は広告選択手段9として機能する。   S8: The control unit of the advertisement server 1 selects an advertisement to be posted according to the result of the comparison. Here, the advertisement server 1 functions as the advertisement selection means 9.

以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。   As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.

第1実施形態に係る広告サーバとWebページに係る情報が記録されているWebページDBの全体構成を示す図である。It is a figure which shows the whole structure of Web page DB in which the information which concerns on the advertisement server which concerns on 1st Embodiment, and a Web page is recorded. 第1実施形態に係る広告サーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the advertisement server which concerns on 1st Embodiment. 第1実施形態に係る文字コードキーワード対応テーブルを示す図である。It is a figure which shows the character code keyword corresponding | compatible table which concerns on 1st Embodiment. 第1実施形態に係る広告管理テーブルを示す図である。It is a figure which shows the advertisement management table which concerns on 1st Embodiment. 第1実施形態に係るWebページの検索の対象とする情報を文字コードで表した図である。It is the figure which represented the information used as the search object of the web page which concerns on 1st Embodiment with the character code. 第1実施形態に係るWebページとキーワードとの比較の様子を示した図である。It is the figure which showed the mode of the comparison with the web page and keyword which concern on 1st Embodiment. 第2実施形態に係る広告サーバとWebページに係る情報が記録されているWebページDBの全体構成を示す図である。It is a figure which shows the whole structure of Web page DB in which the information which concerns on the advertisement server which concerns on 2nd Embodiment, and a Web page is recorded. 第2実施形態に係るキーワードの文字コードを変換した例を示す図である。It is a figure which shows the example which converted the character code of the keyword which concerns on 2nd Embodiment. 第2実施形態に係るインデックスデータの抽出方法を示す図である。It is a figure which shows the extraction method of the index data which concerns on 2nd Embodiment. 第2実施形態に係る処理フローを示す図である。It is a figure which shows the processing flow which concerns on 2nd Embodiment.

符号の説明Explanation of symbols

1 広告サーバ
20 バス
30 制御部
42 記憶装置
1 advertising server 20 bus 30 control unit 42 storage device

Claims (8)

広告に係るキーワードを1以上の文字コードで記録したキーワード記録手段と、
Webページに係る情報が記録された文字コードを認識する文字コード認識手段と、
前記文字コード認識手段により認識された文字コードと同一の文字コードで前記キーワード記録手段に記録された前記キーワードを読み出すキーワード読み出し手段と、
前記キーワードが前記Webページに含まれるか否かを前記Webページに係る情報と前記キーワードを文字コードで比較することにより判定するキーワード判定手段と、
を備える広告サーバ。
A keyword recording means for recording a keyword related to an advertisement with one or more character codes;
A character code recognizing means for recognizing a character code in which information relating to the web page is recorded;
Keyword reading means for reading out the keyword recorded in the keyword recording means with the same character code as the character code recognized by the character code recognition means;
Keyword determining means for determining whether or not the keyword is included in the Web page by comparing the information related to the Web page with the keyword using a character code;
An advertising server comprising:
広告に係るキーワードを所定の文字コードで記録したキーワード記録手段と、
Webページに係る情報が記録された文字コードを認識する文字コード認識手段と、
前記キーワード記録手段に記録された前記キーワードを読み出すキーワード読み出し手段と、
前記キーワードを記録した所定の文字コードと前記文字コード認識手段により認識された文字コードとが一致するか否かを判定する文字コード判定手段と、
前記文字コード判定手段で前記2つの文字コードが一致しないと判定された場合に、前記キーワードを前記文字コード認識手段により認識された文字コードに変換する文字コード変換手段と、
前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定手段と、
を備える広告サーバ。
A keyword recording means for recording a keyword related to the advertisement in a predetermined character code;
A character code recognizing means for recognizing a character code in which information relating to the web page is recorded;
Keyword reading means for reading out the keyword recorded in the keyword recording means;
Character code determination means for determining whether or not the predetermined character code recorded with the keyword matches the character code recognized by the character code recognition means;
A character code conversion unit that converts the keyword into a character code recognized by the character code recognition unit when the character code determination unit determines that the two character codes do not match;
Keyword determination means for determining whether or not the keyword is included in the Web page by comparing information related to the Web page and the keyword with a character code;
An advertising server comprising:
前記キーワード判定手段は、前記キーワードと前記Webページに係る情報とを、前記Webに係る情報の比較をする部分を、前記キーワードの長さで、1バイトずつずらしながら比較することを特徴とする請求項1または請求項2に記載の広告サーバ。   The keyword determination unit compares the keyword and the information related to the Web page while shifting the portion for comparing the information related to the Web by shifting the length of the keyword by 1 byte. The advertisement server according to claim 1 or claim 2. 前記Webページに係る情報について、1バイトずつずらしながら前記キーワードの長さの文字コードを抽出してそれぞれ異なるインデックスデータを作成するインデックスデータ作成手段をさらに備え、
前記キーワード判定手段は、前記インデックスデータと前記キーワードを比較することを特徴とする請求項1または請求項2に記載の広告サーバ。
Index information creating means for extracting the character code of the length of the keyword while shifting the information about the web page by 1 byte and creating different index data, respectively.
The advertisement server according to claim 1, wherein the keyword determination unit compares the index data with the keyword.
前記キーワード判定手段は、前記インデックスデータを所定の順番に並べ替えて前記インデックスデータと前記キーワードを比較することを特徴とする請求項4に記載の広告サーバ。   The advertisement server according to claim 4, wherein the keyword determination unit rearranges the index data in a predetermined order and compares the index data with the keyword. 前記キーワード判定手段により前記Webページに前記キーワードが含まれると判定された広告が複数ある場合には、所定のルールに基づき1の広告を選択する広告選択手段をさらに備えることを特徴とする請求項1から請求項5のいずれかに記載の広告サーバ。   The advertisement selecting means for selecting one advertisement based on a predetermined rule when there are a plurality of advertisements determined by the keyword determining means to include the keyword in the Web page. The advertisement server according to any one of claims 1 to 5. 広告に係るキーワードが1以上の文字コードで記録されており、
サーバが、Webページに係る情報が記録された文字コードを認識する文字コード認識ステップと、
サーバが、前記認識された文字コードと同一の文字コードで記録された前記キーワードを読み出すキーワード読み出しステップと、
サーバが、前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定ステップと、
を備えた広告キーワード検索方法。
The keyword related to the advertisement is recorded with one or more character codes,
A character code recognition step in which the server recognizes a character code in which information on the web page is recorded;
A keyword reading step for the server to read the keyword recorded with the same character code as the recognized character code;
A keyword determination step in which the server determines whether the keyword is included in the Web page by comparing the information related to the Web page with the keyword using a character code;
Advertising keyword search method with
広告に係るキーワードが所定の文字コードで記録されており、
サーバが、Webページに係る情報が記録された文字コードを認識する文字コード認識ステップと、
サーバが、記録された前記キーワードを読み出すキーワード読み出しステップと、
サーバが、前記広告に係るキーワードが記録された文字コードと前記Webページに係る情報が記録された文字コードとが一致するか否かを判定する文字コード判定ステップと、
前記広告に係るキーワードが記録された文字コードと前記Webページに係る情報が記録された文字コードとが一致しないと判定された場合に、サーバが、前記キーワードを前記Webページに係る情報が記録された文字コードに変換する文字コード変換ステップと、
サーバが、前記キーワードが前記Webページに含まれるか否かをWebページに係る情報と前記キーワードとを文字コードで比較することにより判定するキーワード判定ステップと、
を備えた広告キーワード検索方法。
The keyword related to the advertisement is recorded with the specified character code.
A character code recognition step in which the server recognizes a character code in which information on the web page is recorded;
A keyword reading step for the server to read the recorded keyword;
A character code determining step in which the server determines whether or not the character code in which the keyword related to the advertisement is recorded matches the character code in which the information related to the Web page is recorded;
When it is determined that the character code in which the keyword related to the advertisement is recorded does not match the character code in which the information related to the web page is recorded, the server records the information related to the web page as the keyword. A character code conversion step to convert the character code to
A keyword determination step in which the server determines whether the keyword is included in the Web page by comparing the information related to the Web page with the keyword using a character code;
Advertising keyword search method with
JP2008071885A 2008-03-19 2008-03-19 Advertisement server and advertisement keyword search method Active JP5014219B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008071885A JP5014219B2 (en) 2008-03-19 2008-03-19 Advertisement server and advertisement keyword search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008071885A JP5014219B2 (en) 2008-03-19 2008-03-19 Advertisement server and advertisement keyword search method

Publications (2)

Publication Number Publication Date
JP2009230227A true JP2009230227A (en) 2009-10-08
JP5014219B2 JP5014219B2 (en) 2012-08-29

Family

ID=41245589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008071885A Active JP5014219B2 (en) 2008-03-19 2008-03-19 Advertisement server and advertisement keyword search method

Country Status (1)

Country Link
JP (1) JP5014219B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6435627A (en) * 1987-07-31 1989-02-06 Fujitsu Ltd Data retrieving system
JPH0756945A (en) * 1993-08-18 1995-03-03 Toppan Printing Co Ltd Whole sensitive data base system
JPH07334400A (en) * 1994-06-08 1995-12-22 Hitachi Ltd Data base access system and control method for the same
JP2002132836A (en) * 2000-10-24 2002-05-10 Sony Corp Device and method for file generation, data managing method, and information communication terminal device
JP2006277318A (en) * 2005-03-29 2006-10-12 Nifty Corp Automatic advertising device and automatic advertising program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6435627A (en) * 1987-07-31 1989-02-06 Fujitsu Ltd Data retrieving system
JPH0756945A (en) * 1993-08-18 1995-03-03 Toppan Printing Co Ltd Whole sensitive data base system
JPH07334400A (en) * 1994-06-08 1995-12-22 Hitachi Ltd Data base access system and control method for the same
JP2002132836A (en) * 2000-10-24 2002-05-10 Sony Corp Device and method for file generation, data managing method, and information communication terminal device
JP2006277318A (en) * 2005-03-29 2006-10-12 Nifty Corp Automatic advertising device and automatic advertising program

Also Published As

Publication number Publication date
JP5014219B2 (en) 2012-08-29

Similar Documents

Publication Publication Date Title
US7739588B2 (en) Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
US8442998B2 (en) Storage of a document using multiple representations
US7480858B2 (en) Analyzing webpages using function-based object models for web page display in a mobile device
JP5138046B2 (en) Search system, search method and program
CN102460432B (en) Selective content extraction
CN110377884A (en) Document analytic method, device, computer equipment and storage medium
JP4502615B2 (en) Similar sentence search device, similar sentence search method, and program
US7742048B1 (en) Method, system, and apparatus for converting numbers based upon semantically labeled strings
WO2011106197A2 (en) Rule-based system and method to associate attributes to text strings
JP5185402B2 (en) Document search apparatus, document search method, and document search program
JP5321777B2 (en) Product search device and product search method having function of presenting reference keyword
JP5137024B2 (en) Development support apparatus, method, and program
JP2004220176A (en) Database search system and search method, method for forming data file used for search, and storage medium storing data file
JP5014219B2 (en) Advertisement server and advertisement keyword search method
JP2016018279A (en) Document file search program, document file search device, document file search method, document information output program, document information output device, and document information output method
JP2000148754A (en) Multilingual system, multilingual processing method, and medium storing program for multilingual processing
US6357002B1 (en) Automated extraction of BIOS identification information for a computer system from any of a plurality of vendors
JP5564442B2 (en) Text search device
TWI244041B (en) Multilingual software setup method and system
JP2010191851A (en) Article feature word extraction device, article feature word extraction method and program
JP5068356B2 (en) Blog body identification device and blog body identification method
JP2009230210A (en) Computer software program executing text retrieval processing and method of processing the same
JP4294386B2 (en) Different notation normalization processing apparatus, different notation normalization processing program, and storage medium
JP3972309B2 (en) Information conversion apparatus and program
JP2002099558A (en) Information retrieval system and method, and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110811

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111220

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120309

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120316

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120605

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5014219

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350