JP5482512B2 - Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program - Google Patents

Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program Download PDF

Info

Publication number
JP5482512B2
JP5482512B2 JP2010149496A JP2010149496A JP5482512B2 JP 5482512 B2 JP5482512 B2 JP 5482512B2 JP 2010149496 A JP2010149496 A JP 2010149496A JP 2010149496 A JP2010149496 A JP 2010149496A JP 5482512 B2 JP5482512 B2 JP 5482512B2
Authority
JP
Japan
Prior art keywords
link
address
destination
dictionary
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010149496A
Other languages
Japanese (ja)
Other versions
JP2012014363A (en
Inventor
聡子 志賀
剛寿 安藤
友哉 岩倉
青史 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010149496A priority Critical patent/JP5482512B2/en
Publication of JP2012014363A publication Critical patent/JP2012014363A/en
Application granted granted Critical
Publication of JP5482512B2 publication Critical patent/JP5482512B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は,Webページ(以下「ページ」とする)の内容に含まれる単語や語句等(以下「単語」とする)に自動的にリンクを設定するリンク処理(以下,「オートリンク処理」とする)で使用されるリンク辞書を生成する処理,および前記リンク辞書を用いたリンク処理に関する。   The present invention relates to a link process (hereinafter referred to as “auto link process”) that automatically sets a link to a word or phrase (hereinafter referred to as “word”) included in the content of a Web page (hereinafter referred to as “page”). And a link process using the link dictionary.

図20は,オートリンク処理の1手法である,辞書式リンク処理を説明するための図である。   FIG. 20 is a diagram for explaining lexicographic link processing, which is one method of autolink processing.

オートリンク処理は,図20(A)に示すように,ユーザから閲覧要求のあったページ90を表示する際,ページ内の単語「クローラー」に自動でリンクを設定する。ユーザが必要に応じてこのリンクをクリックすると,「クローラー」についての解説ページ等を表示する。これにより,ユーザの理解を助けるものである。   In the auto link process, as shown in FIG. 20A, when displaying a page 90 requested by the user, a link is automatically set to the word “crawler” in the page. When the user clicks this link as necessary, an explanation page about the “crawler” is displayed. This helps users understand.

図20(B)に示すように,辞書式リンク処理では,予め単語「クローラー」とリンク先のURL(Uniform Resource Locator)との対応を登録したリンク処理用の辞書92と,辞書92を参照しページ内のリンクを貼るべき箇所を検出して対応するリンク先を設定する処理部(オートリンクエンジン)93とにより処理が行われる。   As shown in FIG. 20B, in the lexicographic link processing, a dictionary 92 for link processing in which correspondence between the word “crawler” and a URL (Uniform Resource Locator) linked in advance is registered, and the dictionary 92 is referred to. The processing is performed by a processing unit (auto link engine) 93 that detects a portion where a link in the page is to be pasted and sets a corresponding link destination.

オートリンクエンジン93は,閲覧されるページ90のHTMLデータ内のテキストを解析する。   The auto link engine 93 analyzes the text in the HTML data of the page 90 to be browsed.

そして,図20(C)に示すように,辞書92に登録されている単語「クローラー」がテキスト内に含まれている場合には,単語「クローラー」に対応するURL(http://crowler.com/)を得て,ページ90のテキストの単語「クローラー」を,単語に対応するURLへリンクするアンカータグで書き換える。   As shown in FIG. 20C, when the word “crawler” registered in the dictionary 92 is included in the text, the URL (http://crawler.com) corresponding to the word “crawler” is included. com /) and the word “crawler” of the text on page 90 is rewritten with an anchor tag linked to the URL corresponding to the word.

ページ90のテキスト「検索エンジンのクローラーは,…」が「検索エンジンの<a href=”http://crowler.com/”>クローラー</a>は,…」へ書き換えられたHTML(ページ)が出力され,ブラウザで閲覧されることになる。   The text “Search engine crawler is ...” on page 90 is “Search engine <a href =” http: // crawler. com / "> crawler </a> is output HTML (page) rewritten to" ... "and is viewed by the browser.

ここで,リンク処理用の辞書92に登録される単語とURLとの対応が1対1ではない場合,例えば,1つの単語に異なる解説が存在して解説毎のページのURL(リンク先)が複数ある場合に,複数のリンクを貼るのではなく,ページや閲覧者等の状況に応じて,最適な1つのURLを選択してリンクを貼りたいことがある。   Here, if the correspondence between the word registered in the link processing dictionary 92 and the URL is not one-to-one, for example, there is a different explanation for one word, and the URL (link destination) of the page for each explanation is the same. When there are a plurality of links, instead of pasting a plurality of links, there is a case where it is desired to paste a link by selecting an optimum URL according to the situation of the page or the viewer.

従来手法として,リンク元と複数のリンク先との間で,ページ間の類似性に基づいて1つのページを決定する処理が知られている。例えば,リンク元ページでのアンカー文字内の単語がリンク先ページに含まれる割合をもとに,ページ間の関連性を求め,リンク元ページでのリンク数の多少に基づいて各リンクの重みを求めて,ページ間の関連度を設定する手法が知られている。   As a conventional method, a process of determining one page based on the similarity between pages between a link source and a plurality of link destinations is known. For example, the relationship between pages is calculated based on the ratio of words in anchor characters in the link source page to the link destination page, and the weight of each link is calculated based on the number of links in the link source page. There is a known method for determining the degree of association between pages.

また,あるページ内に設定されているリンクについて,リンク毎にジャンプ回数をカウントしておき,ユーザの次の行動(ジャンプ確率)を予測して,ジャンプ確率が高いリンク先を定めて,予めキャッシュする手法が知られている。   In addition, for links set in a page, the number of jumps is counted for each link, the next action (jump probability) of the user is predicted, a link destination with a high jump probability is determined, and cached in advance. There is a known technique to do this.

また,メッセージ内に含まれるリンク先の出現頻度を集計して,出現頻度が閾値以上かつ所定の禁止用語を含むリンク先であれば,そのリンク先を含むメッセージをスパムメッセージと判断する手法が知られている。   Also, a technique is known in which the frequency of occurrence of link destinations included in a message is aggregated, and if the frequency of occurrence is a link destination that exceeds a threshold and includes a predetermined prohibited term, the message including the link destination is determined as a spam message. It has been.

特開2004−164290号公報JP 2004-164290 A 特開2000−250803号公報JP 2000-250803 A 特開2007−265368号公報JP 2007-265368 A 特開2002−132769号公報JP 2002-132769 A

リンク用辞書の単語に対応付けられた複数のリンク先から1つを選択する場合,または,対応するリンク先へのリンク処理を行うか否かを選択する場合に,従来のような,ページ間に貼られたリンクを前提とした方法では,十分でない場合がある。   When selecting one of a plurality of link destinations associated with words in the link dictionary, or when selecting whether or not to perform link processing to the corresponding link destination, the conventional interpage The method based on the link attached to may not be sufficient.

例えば,複数のリンク先候補があった場合に,元のページと一番関連度の高いリンク先候補を選択したいとする。しかし,あらかじめ,元のページとリンク先候補の間にリンクが存在していないと,リンク先候補の選択に必要な「ページ間の関連度」を算出できない。また,リンク処理を行うか否かを選択する場合,元のページとリンク先候補の関連度を算出し,閾値以上のときにのみリンク処理を行えばよい。しかし,あらかじめ元のページとリンク先候補の間にリンクがなかった場合には,選択に必要な関連度が算出できない。   For example, when there are a plurality of link destination candidates, it is desired to select a link destination candidate having the highest degree of association with the original page. However, if there is no link between the original page and the link destination candidate in advance, the “relationship between pages” necessary for selecting the link destination candidate cannot be calculated. Further, when selecting whether or not to perform link processing, the degree of association between the original page and the link destination candidate is calculated, and link processing only needs to be performed when it is equal to or greater than a threshold value. However, if there is no link between the original page and the link destination candidate in advance, the relevance necessary for selection cannot be calculated.

本発明の目的は,ページ間にリンクが貼られていることを前提とせずに,ページ内の単語に対して,複数リンク先から適切なリンク先を自動的に選択またはリンク先へのリンク処理の可否を自動的に選択できるリンク処理を実現するためのリンク辞書の生成処理を行う装置を提供することである。   An object of the present invention is to automatically select an appropriate link destination from a plurality of link destinations or link processing to a link destination for a word in a page without assuming that links are pasted between pages. It is an object of the present invention to provide an apparatus for performing a link dictionary generation process for realizing a link process capable of automatically selecting whether or not the link is possible.

さらに,本発明の目的は,前記生成処理により生成されたリンク辞書を用いたリンク処理を行う装置を提供することである。   Furthermore, the objective of this invention is providing the apparatus which performs the link process using the link dictionary produced | generated by the said production | generation process.

さらに,本発明の目的は,前記リンク辞書生成処理,および前記リンク辞書を用いたリンク処理を,コンピュータに実行させるためのプログラムを提供することである。   Furthermore, an object of the present invention is to provide a program for causing a computer to execute the link dictionary generation process and the link process using the link dictionary.

本発明の一態様として開示されるリンク辞書生成処理装置は,1)単語または語句毎にリンク先を対応付けたリンク辞書を記憶するリンク辞書記憶部と,2)組織内ネットワークにおいて実行されたリソースへのアクセスに関して,アクセス元のIPアドレスとアクセス先のIPアドレスとを含むログ情報を収集するログ収集部と,3)前記収集したログ情報をもとに,前記アクセス先のIPアドレスを含むIPアドレス範囲に対する,前記アクセス元のIPアドレスを含むIPアドレス範囲からのアクセス数を集計するログ集計部と,4)前記集計したアクセス数が任意の閾値以上である場合に,前記アクセス先とアクセス元とのIPアドレス範囲の対を関連IPアドレス範囲として保持する関連アドレス検出部と,5)前記リンク辞書に設定されたリンク先のIPアドレスが前記関連IPアドレス範囲の一方のIPアドレス範囲に含まれる場合に,前記関連IPアドレス範囲の他方のIPアドレス範囲を,前記リンク先に対応するリンク条件として付加する処理と,前記リンク条件が付加されたリンク辞書を前記リンク辞書記憶部に格納する処理とを行う辞書出力部とを有する。   A link dictionary generation processing device disclosed as one aspect of the present invention includes: 1) a link dictionary storage unit that stores a link dictionary in which a link destination is associated with each word or phrase; and 2) a resource that is executed in an intra-organization network. A log collection unit that collects log information including an access source IP address and an access destination IP address, and 3) an IP including the access destination IP address based on the collected log information A log totaling unit that counts the number of accesses from the IP address range including the IP address of the access source to the address range; and 4) the access destination and the access source when the total number of accesses is equal to or greater than an arbitrary threshold value. A related address detection unit that holds a pair of IP address ranges as a related IP address range, and 5) in the link dictionary When the IP address of the specified link destination is included in one IP address range of the related IP address range, the other IP address range of the related IP address range is added as a link condition corresponding to the link destination A dictionary output unit that performs processing and processing for storing the link dictionary to which the link condition is added in the link dictionary storage unit.

また,本発明の一態様として開示されるリンク処理装置は,1)単語または語句毎に,リンク先と前記リンク先へのリンク設定の対象となる組織内ネットワークの機器のIPアドレス範囲を設定するリンク条件とを対応付けたリンク辞書を記憶するリンク辞書記憶部と,2)組織内ネットワークにおいて,アクセスされたウェブページと,前記ウェブページを提供する機器または前記ウェブページへアクセスした機器のいずれかのIPアドレスとを取得する入力取得部と,3)前記ウェブページの内容から前記リンク辞書に含まれる単語または語句を取り出す処理と,前記取得した機器のIPアドレスが前記リンク辞書の前記取り出した単語または語句に対応付けられたリンク条件のIPアドレス範囲に含まれる場合に,前記単語または語句に対応付けられ,かつ前記取得した機器のIPアドレスを含むリンク条件に対応するリンク先を選択する処理とを行うリンク先選択部と,4)前記ウェブページの該当する単語または語句に前記選択されたリンク先へのリンクを設定する処理と,前記リンク先を設定したウェブページを出力する処理とを行うページ出力生成部とを有する。   In addition, the link processing device disclosed as one aspect of the present invention 1) sets, for each word or phrase, a link destination and an IP address range of a device in the organization network that is a target of link setting to the link destination. A link dictionary storage unit that stores a link dictionary that associates link conditions with each other; 2) any of the accessed web page, the device that provides the web page, or the device that accesses the web page in the in-house network An input acquisition unit that acquires the IP address of the device; 3) a process of extracting a word or phrase included in the link dictionary from the content of the web page; and an IP address of the acquired device is the extracted word of the link dictionary Or the word or phrase when included in the IP address range of the link condition associated with the phrase A link destination selection unit that performs a process of selecting a link destination corresponding to a link condition including an IP address of the acquired device, and 4) the selected word or phrase in the web page A page output generation unit that performs a process of setting a link to a link destination and a process of outputting a web page in which the link destination is set.

開示されるリンク辞書生成処理装置によれば,ページ間のリンク関係を前提とせずに,ページを保持するアクセス先(サーバ)またはページを要求したアクセス元(クライアント)のIPアドレスとリンク先のIPアドレスとの関連性から,適したリンク先またはリンク処理の可否が選択できるリンク処理を実現するためのリンク辞書を生成することができる。また,ページの閲覧者に依存しない画一的なリンク辞書ではなく,ページを閲覧するユーザの違いを踏まえたリンク辞書を生成することができる。   According to the disclosed link dictionary generation processing device, the IP address of the access destination (server) that holds the page or the access source (client) that requested the page and the IP of the link destination without assuming the link relationship between the pages. It is possible to generate a link dictionary for realizing link processing in which a suitable link destination or link processing can be selected based on the association with the address. Also, instead of a uniform link dictionary that does not depend on the page viewer, it is possible to generate a link dictionary that takes into account differences between users browsing the page.

また,開示されるリンク処理装置によれば,前記リンク辞書生成処理装置により生成されたリンク辞書により,ページを保持するサーバまたはページへアクセスしたクライアントに適したリンク先またはリンク処理の可否を選択してリンク処理を行うことができる。   Further, according to the disclosed link processing device, the link dictionary generated by the link dictionary generation processing device is used to select a link destination suitable for the server that holds the page or the client that accesses the page or whether or not link processing is possible. Link processing.

本発明の一実施態様として開示される,リンク辞書生成処理装置およびリンク処理装置の構成例を示す図である。It is a figure which shows the structural example of the link dictionary production | generation processing apparatus and link processing apparatus which are disclosed as one embodiment of this invention. リンク辞書の例を示す図である。It is a figure which shows the example of a link dictionary. リンク処理装置の処理の概要を説明する図(その1)である。It is FIG. (1) explaining the outline | summary of a process of a link processing apparatus. リンク処理装置の処理の概要を説明する図(その2)である。It is FIG. (2) explaining the outline | summary of a process of a link processing apparatus. リンク辞書生成処理の処理フローを示す図である。It is a figure which shows the processing flow of a link dictionary production | generation process. ステップS1のログ収集処理のより詳細な処理フロー図である。It is a more detailed process flowchart of the log collection process of step S1. ログ収集テーブルの例を示す図である。It is a figure which shows the example of a log collection table. ログ情報の例およびログ情報記憶部の例を示す図である。It is a figure which shows the example of log information, and the example of a log information storage part. ステップS2のログ集計処理のより詳細な処理フロー図である。It is a more detailed process flowchart of the log total process of step S2. 全桁におけるアクセス数の集計テーブル(全桁)の例を示す図である。It is a figure which shows the example of the total table (all digits) of the access count in all the digits. ステップS21の処理のより詳細な処理フロー図である。It is a more detailed process flowchart of the process of step S21. 上位3桁でまとめられた範囲のアクセス数の集計テーブル(3桁)の例を示す図である。It is a figure which shows the example of the total table (3 digits) of the number of accesses of the range put together by upper 3 digits. ステップS22の処理のより詳細な処理フローを示す図である。It is a figure which shows the more detailed process flow of the process of step S22. 関連IP検出処理の検出結果テーブルの例を示す図である。It is a figure which shows the example of the detection result table of a related IP detection process. ステップS3の関連IP検出処理のより詳細な処理フロー図である。It is a more detailed process flowchart of the related IP detection process of step S3. ステップS33およびステップS36の処理のより詳細な処理フロー図である。It is a more detailed process flowchart of the process of step S33 and step S36. 辞書生成処理前後のリンク辞書の例を示す図である。It is a figure which shows the example of the link dictionary before and behind a dictionary production | generation process. ステップS4の辞書生成処理のより詳細な処理フロー図である。It is a more detailed process flow figure of the dictionary production | generation process of step S4. リンク処理の処理フローを示す図である。It is a figure which shows the processing flow of a link process. 辞書式リンク処理を説明するための図である。It is a figure for demonstrating a lexicographic link process.

図1は,本発明の一実施態様として開示される,リンク辞書生成処理装置およびリンク処理装置の構成例を示す図である。   FIG. 1 is a diagram illustrating a configuration example of a link dictionary generation processing device and a link processing device disclosed as an embodiment of the present invention.

図1に示す構成例において,オートリンクシステム1,クライアント5,各種サーバ6(6a,6b,…),DNSサーバ7等はネットワーク8に接続する。   In the configuration example shown in FIG. 1, an auto link system 1, a client 5, various servers 6 (6 a, 6 b,...), A DNS server 7, etc. are connected to a network 8.

オートリンクシステム1は,ネットワーク8内のサーバで提供されるページに対するオートリンク処理を提供するシステムであり,リンク辞書生成処理装置2,リンク辞書記憶部3,リンク処理装置4を有する。   The auto link system 1 is a system that provides an auto link process for a page provided by a server in the network 8, and includes a link dictionary generation processing device 2, a link dictionary storage unit 3, and a link processing device 4.

クライアント5は,ネットワーク8に接続するコンピュータであり,ユーザが使用するものである。   The client 5 is a computer connected to the network 8 and is used by the user.

クライアントは,入力変換部51,表示部52を備える。入力変換部51は,ページ閲覧のためにユーザが入力したURLを,オートリンクシステム1のURLに書き換えて出力する。表示部52は,オートリンクシステム1から出力されたページ(リンク処理済みのHTML)を得て閲覧のためにページを表示させる。   The client includes an input conversion unit 51 and a display unit 52. The input conversion unit 51 rewrites and outputs the URL input by the user for page browsing to the URL of the auto link system 1. The display unit 52 obtains the page (HTML after link processing) output from the auto link system 1 and displays the page for viewing.

サーバ6(6a,6b,…)は,各種ページを提供するコンピュータであり,ドメインネームシステム(DNS)サーバ7は,ドメインネームとIPアドレスとの対応付けを保持・管理するコンピュータである。   The server 6 (6a, 6b,...) Is a computer that provides various pages, and the domain name system (DNS) server 7 is a computer that holds and manages the association between domain names and IP addresses.

図1に示すネットワークとしては,例えば企業内ネットワーク等の組織内ネットワークが想定される。そして,組織内ネットワークにおいては,通常,数字上近いIPアドレス群が,部署単位などに割り当てられる。そのIPアドレス群の中に,同じ部署のページ(サーバ)と閲覧者のクライアントPCのIPアドレスがまとまっている。たとえば,A研究部の持つページ(サーバ)や,A研究部の部員であるユーザのクライアントPCは,「10.25.181.1」や「10.25.181.28」など,「10.25.181.*」(*は任意)のIPアドレスを有する。   As the network shown in FIG. 1, for example, an in-house network such as an in-company network is assumed. In an intra-organizational network, a group of IP addresses that are close in number are usually assigned to each department. In the IP address group, the IP address of the page (server) of the same department and the client PC of the viewer are collected. For example, the pages (servers) owned by the research department A and the client PC of the user who is a member of the research department A are “10.25.181.1” and “10.25.181.28”. 25.181. * "(* Is optional).

したがって,ページもユーザも,IPアドレスに対応付けることができる。そして,IPアドレスの上位桁(上位オクテット)が共通のものでまとめることで,同じA研究部所属という類似性を持ったページ/ユーザ群をまとめることができる。   Therefore, both pages and users can be associated with IP addresses. Then, by combining the upper digits (upper octets) of the IP address with a common one, it is possible to group pages / users having similarities belonging to the same A research department.

また,同一部署に割り当てられたIPアドレス群が複数ある場合もある。たとえば,「10.25.181.*」の他に,少し数字が離れた「10.25.136.*」もA研究部の所属となっている場合である。また,類似したページやユーザが,必ずしも部署の範囲だけではないこともある。そこで,類似したページ/ユーザ群の抽出方法として,IPアドレスを上位桁でまとめる他に,上位桁でまとめたIPアドレス群同士の相互アクセス関係を見ることもできる。これにより,数字上は必ずしも類似していないが,利用用途上,関連を持っているIPアドレスの範囲を発見することができる。   There may be a plurality of IP addresses assigned to the same department. For example, in addition to “10.25.181. *”, “10.25.136. *”, Which is a little apart from the number, belongs to the A research department. Also, similar pages and users may not always be within the scope of a department. Therefore, as a similar page / user group extraction method, in addition to collecting IP addresses by upper digits, it is also possible to see the mutual access relationship between IP address groups compiled by upper digits. This makes it possible to find a range of IP addresses that are not necessarily similar in terms of numbers, but that are relevant for use purposes.

オートリンク処理のための判定情報として,これらの関連するIPアドレス範囲を使った条件を設定することで,ページに応じて適切なリンク先を切り替えるリンク処理,閲覧するユーザに応じて適切なリンク先を切り替えるリンク処理の両方が,同じ枠組みで可能となる。   By setting conditions using these related IP address ranges as judgment information for auto-link processing, link processing that switches the appropriate link destination according to the page, and appropriate link destination according to the browsing user Both of the link processings that switch are possible in the same framework.

オートリンクシステム1のリンク辞書記憶部3は,リンク辞書を記憶する。   The link dictionary storage unit 3 of the auto link system 1 stores a link dictionary.

図2は,リンク辞書の例を示す図である。   FIG. 2 is a diagram illustrating an example of a link dictionary.

リンク辞書は,「単語/語句,リンク先,リンク条件」の項目を含む。   The link dictionary includes items of “word / phrase, link destination, link condition”.

「単語/語句」は,ページのテキストからリンク貼付が設定されるリンク箇所(文字列)を示す。   “Word / phrase” indicates a link location (character string) where link pasting is set from the text of the page.

「リンク先」は,対応する単語/語句に対して設定されるリンク先を示す。ここでは,リンク先のネーム情報(リンク先URL)が登録される。   “Link destination” indicates a link destination set for the corresponding word / phrase. Here, name information (link destination URL) of the link destination is registered.

「リンク条件」は,対応するリンク先へのリンク設定を実行する対象の範囲,すなわちリンク貼付の処理を行うネットワーク8内の機器(クライアント5,サーバ6等)であるかを示す範囲を,IPアドレスの範囲により設定した判定情報である。   The “link condition” is a range of a target for executing a link setting to a corresponding link destination, that is, a range indicating whether the device is a device (client 5, server 6 or the like) in the network 8 that performs link pasting processing. This is judgment information set according to the address range.

図2に示すリンク辞書を用いた場合,ページのテキスト内に含まれる「稟議システム」に対して,ページのサーバ6またはアクセスしたクライアント5のIPアドレスが満たすリンク条件に対応するリンク先URL1〜URL3のいずれかが設定される。   When the link dictionary shown in FIG. 2 is used, the link destination URLs 1 to 3 corresponding to the link conditions satisfied by the IP address of the server 6 of the page or the client 5 that accesses the “approval system” included in the text of the page. Is set.

また,「リンク条件」は,単語/語句へ対応するリンク先へのリンク設定を行うか否かの判定情報であってもよい。例えば,ページのサーバ6またはアクセスしたクライアント5のIPアドレスが,設定されたリンク条件を満たさない場合には,リンク辞書に単語/語句とリンク先との対応が設定されていても,リンク処理が抑止される。   Further, the “link condition” may be information for determining whether to set a link to a link destination corresponding to a word / phrase. For example, if the IP address of the page server 6 or the accessed client 5 does not satisfy the set link condition, the link process is performed even if the correspondence between the word / phrase and the link destination is set in the link dictionary. Deterred.

オートリンクシステム1のリンク辞書生成処理装置2は,リンク辞書を生成する装置であり,ログ情報記憶部20,ログ収集部21,ログ集計部22,関連アドレス検出部23,辞書出力部24を備える。   The link dictionary generation processing device 2 of the auto link system 1 is a device that generates a link dictionary, and includes a log information storage unit 20, a log collection unit 21, a log totaling unit 22, a related address detection unit 23, and a dictionary output unit 24. .

ログ情報記憶部20は,ログ収集部21が収集した,ページへのアクセスに関するログ情報を記憶する記憶部である。   The log information storage unit 20 is a storage unit that stores log information collected by the log collection unit 21 and related to access to pages.

ログ収集部21は,ネットワーク8内の各サーバ6から,ページへのアクセスに関するログ情報を収集して,ログ情報記憶部20に格納する。   The log collection unit 21 collects log information related to page access from each server 6 in the network 8 and stores it in the log information storage unit 20.

ログ情報は,アクセス日時,アクセス先のURL,アクセス先のサーバ6のIPアドレス,アクセス元のクライアント5のIPアドレス等を含む。   The log information includes an access date and time, an access destination URL, an IP address of the access destination server 6, an IP address of the access source client 5, and the like.

ログ集計部22は,収集したログ情報をもとに,アクセス先のIPアドレス各々について,アクセス元のIPアドレス毎のアクセス数を集計し,さらに,アクセス先のIPアドレスを上位から任意の桁数で示したIPアドレス範囲に対する,アクセス元のIPアドレスを上位から任意の桁数で示したIPアドレス範囲からのアクセス数を集計する。   Based on the collected log information, the log totaling unit 22 totals the number of accesses for each IP address of the access destination for each IP address of the access destination, and further determines the IP address of the access destination from any number of digits. The number of accesses from the IP address range in which the IP address of the access source is indicated by an arbitrary number of digits from the top is counted.

なお,ログ集計部22は,アクセス先およびアクセス元のIPアドレス範囲でのユニークなIPアドレスの数を集計してもよい。   In addition, the log totaling unit 22 may total the number of unique IP addresses in the IP address range of the access destination and the access source.

関連アドレス検出部23は,ログ集計部22が集計した,アクセス先のIPアドレス範囲に対するアクセス元のIPアドレス範囲からのアクセス数が任意の閾値以上である場合に,そのアクセス先とアクセス元の2つのIPアドレス範囲の対を関連IPアドレス範囲として保持する。   When the number of accesses from the IP address range of the access source with respect to the IP address range of the access destination calculated by the log totaling unit 22 is equal to or greater than an arbitrary threshold, the related address detection unit 23 calculates the access destination and access source 2 One IP address range pair is retained as an associated IP address range.

ここで,アクセス先およびアクセス元のIPアドレス範囲は,IPアドレスの上位から任意の桁数またはビット数によって定められる範囲である。本形態では,例えば,上位3桁の範囲を用いてIPアドレス範囲が設定されているが,この設定に限定されるものではない。   Here, the IP address range of the access destination and the access source is a range determined by an arbitrary number of digits or bits from the top of the IP address. In this embodiment, for example, the IP address range is set using the upper three-digit range, but the present invention is not limited to this setting.

関連アドレス検出部23は,具体的には,アクセス先のIPアドレス各々に対するアクセス元のIPアドレス毎のアクセス数をまとめて,上位3桁の範囲にまとめたアクセス先のIPアドレス範囲(例えば,IPアドレス範囲X「10.25.136.*」)に対する上位3桁の範囲のIPアドレス範囲(IPアドレス群,例えば,IPアドレス範囲P「10.25.181.*」,IPアドレス範囲Q「10.25.192.*」等の範囲)毎からのアクセス数(P→X,Q→X)を集計する。   Specifically, the related address detection unit 23 collects the number of accesses for each IP address of the access source for each IP address of the access destination, and collects the IP address range of the access destination (for example, IP IP address range (IP address group, for example, IP address range P “10.25.181. *”, IP address range Q “10”) in the upper 3 digits range with respect to address range X “10.25.136. *”) .25.192. * ”) And the number of accesses (P → X, Q → X).

さらに,関連アドレス検出部23は,逆の関係についてもアクセスを集計する。すなわち,関連アドレス検出部23は,アクセス先のIPアドレス範囲P「10.25.181.*」に対するアクセス元のIPアドレス範囲X「10.25.136.*」からのアクセス数(X→P),IPアドレス範囲Q「10.25.192.*」に対するIPアドレス範囲X「10.25.136.*」からのアクセス数(X→Q)等を集計する。   Further, the related address detector 23 counts accesses for the reverse relationship. That is, the related address detection unit 23 accesses the access destination IP address range P “10.25.181. *” From the access source IP address range X “10.25.136. *” (X → P ), The number of accesses from the IP address range X “10.25.136. *” To the IP address range Q “10.25.192. *” (X → Q) and the like are tabulated.

そして,関連アドレス検出部23は,双方向でのアクセス数が閾値以上である場合に,その2つのIPアドレス範囲の対を関連IPアドレス範囲とする。   Then, when the number of bidirectional accesses is equal to or greater than the threshold, the related address detection unit 23 sets the pair of the two IP address ranges as the related IP address range.

さらに,関連アドレス検出部23は,さらに,上位3桁にまとめたIPアドレス範囲に含まれるIPアドレスのユニーク数が所定数以上であるかを,関連IPアドレス範囲の検出条件としてもよい。   Further, the related address detection unit 23 may further determine whether the unique number of IP addresses included in the IP address range grouped in the upper three digits is a predetermined number or more as a detection condition for the related IP address range.

ここで,ログ集計部22および関連アドレス検出部23は,上記のようにIPアドレスの上位桁が共通のものでまとめる以外に,別途,組織内で「このIPアドレス群とこのIPアドレス群は同じ部署が管轄している」という明示的な情報がある場合,それを利用してIPアドレス範囲をまとめ、その範囲内で集計を実施してもよい。たとえば,「10.25.121.1」〜「10.25.121.5」と「10.25.181.40」〜「10.25.181.50」とが同一部署など,細かい管理情報が別途ある場合,その範囲内で集計を実施できる。   Here, the log totaling unit 22 and the related address detecting unit 23 are different from each other in the organization except that the upper digits of the IP address are the same, as described above. If there is explicit information that “the department is in charge”, the IP address range may be collected using the information and the aggregation may be performed within the range. For example, detailed management information such as “10.25.121.1” to “10.25.121.5” and “10.25.181.40” to “10.25.181.50” are the same department. If there is a separate item, aggregation can be performed within that range.

辞書出力部24は,リンク辞書記憶部3に記憶されているリンク辞書の単語や語句に対応付けられたリンク先(リンク先URL)を1つずつ取り出し,DNSサーバ7を参照してリンク先URLに対応するIPアドレスを得る。そして,辞書出力部24は,そのリンク先のIPアドレスが,関連アドレス検出部23が保持する関連IPアドレス範囲のいずれかのIPアドレス範囲に含まれる場合に,該当する関連IPアドレス範囲の他方のIPアドレス範囲を取得する。辞書出力部24は,そのIPアドレス範囲を,リンク辞書の該当するリンク先に対応するリンク条件として付加したリンク辞書をリンク辞書記憶部3に格納する。   The dictionary output unit 24 extracts link destinations (link destination URLs) associated with the words and phrases of the link dictionary stored in the link dictionary storage unit 3 one by one, and refers to the DNS server 7 to link destination URLs. An IP address corresponding to is obtained. Then, when the IP address of the link destination is included in one of the IP address ranges of the related IP address range held by the related address detection unit 23, the dictionary output unit 24 selects the other of the corresponding related IP address ranges. Get IP address range. The dictionary output unit 24 stores, in the link dictionary storage unit 3, a link dictionary to which the IP address range is added as a link condition corresponding to the corresponding link destination of the link dictionary.

リンク処理装置4は,リンク処理を行う装置であり,入力取得部41,リンク先選択部42,出力生成部43を備える。   The link processing device 4 is a device that performs link processing, and includes an input acquisition unit 41, a link destination selection unit 42, and an output generation unit 43.

入力取得部41は,クライアント5の入力変換部51から,アクセス要求したURLを受け付け,アクセスされたページの内容と,ページを提供するサーバ6またはページへアクセスしたクライアント5のいずれかのIPアドレスとを取得する。   The input acquisition unit 41 receives the URL requested for access from the input conversion unit 51 of the client 5, the contents of the accessed page, the IP address of either the server 6 that provides the page or the client 5 that has accessed the page, To get.

リンク先選択部42は,ページ内のテキストとリンク辞書とのマッチングを行って,ページからリンク辞書記憶部3のリンク辞書に含まれる単語を取り出す。そして,リンク先選択部42は,リンク辞書から取り出した単語に対応付けられたリンク条件のIPアドレス範囲に,取得したサーバ6またはクライアント5のIPアドレスが含まれる場合に,単語に対応付けられた,サーバ6またはクライアント5のIPアドレスを含むリンク条件に対応するリンク先を選択する。   The link destination selection unit 42 performs matching between the text in the page and the link dictionary, and extracts words included in the link dictionary of the link dictionary storage unit 3 from the page. Then, the link destination selection unit 42 associates the IP address range of the link condition associated with the word extracted from the link dictionary with the acquired server 6 or client 5 in association with the word. , The link destination corresponding to the link condition including the IP address of the server 6 or the client 5 is selected.

また,リンク先選択部42は,リンク辞書から取り出した単語/語句に対応付けられたリンク条件のIPアドレスの範囲に,取得したサーバ6またはクライアント5のIPアドレスが含まれない場合に,単語/語句に対応付けられた所定のリンク先(例えば1つめのリンク先)を選択してもよい。   Further, the link destination selection unit 42, when the acquired IP address of the server 6 or the client 5 is not included in the IP address range of the link condition associated with the word / phrase extracted from the link dictionary, A predetermined link destination (for example, the first link destination) associated with the phrase may be selected.

または,リンク先選択部42は,リンク条件のIPアドレスの範囲に,取得したサーバ6またはクライアント5のIPアドレスが含まれない場合に,リンク先によるリンク設定の処理を抑止してもよい。   Alternatively, the link destination selection unit 42 may suppress the link setting process by the link destination when the acquired IP address of the server 6 or the client 5 is not included in the IP address range of the link condition.

さらに,リンク先選択部42は,複数のリンク先候補がある場合であって,どの候補のリンク条件にも直接合わない場合には,リンク条件のIPアドレス群のうちで最も数字の近いものを選んでもよい。例えば,IPアドレスの上位3桁(たとえば「10.25.181.*」)でマッチするものがなければ,上位2桁(たとえば「10.25.*.*」)が共通のものを選んでもよい。また,上位2桁が共通のもののうちで,3桁目の数字がより近いものを選んでもよい。   Further, when there are a plurality of link destination candidates, and the link destination selection unit 42 does not directly meet any of the link conditions of any candidate, the link destination selection unit 42 selects the IP address group with the closest number in the link condition. You may choose. For example, if there is no match in the upper 3 digits (eg “10.25.181. *”) Of the IP address, even if the upper 2 digits (eg “10.25. *. *”) Are selected in common Good. Moreover, you may select the thing with the closer number of the 3rd digit among the things with the upper 2 digits in common.

出力生成部43は,ページの該当する単語を,選択されたリンク先へのリンクを設定したリンクタグで書き換え,リンクタグに書き換えたページのHTMLデータをクライアント5へ出力する。出力されたページは,クライアント5の表示部52で解析,表示される。ユーザは,単語にリンクが貼られたページを閲覧して,必要があれば,リンクが貼られた単語を選択して,別のページへジャンプすることができる。   The output generation unit 43 rewrites the corresponding word of the page with the link tag in which the link to the selected link destination is set, and outputs the HTML data of the page rewritten to the link tag to the client 5. The output page is analyzed and displayed on the display unit 52 of the client 5. The user can browse a page with a link to a word, and if necessary, select the word with the link and jump to another page.

以上のように,上記の構成を備えるリンク処理装置4により,サーバ6aが提供するページのテキスト内にリンク辞書に登録された単語/語句が含まれている場合に,サーバ6aまたはクライアント5のIPアドレスに応じて選択されたリンク先への自動的なリンク設定が実現される。   As described above, when the link processing device 4 having the above configuration includes a word / phrase registered in the link dictionary in the text of the page provided by the server 6a, the IP of the server 6a or the client 5 is used. Automatic link setting to the link destination selected according to the address is realized.

図3および図4は,リンク処理装置4の処理の概要を説明する図である。   3 and 4 are diagrams for explaining the outline of the processing of the link processing device 4.

図3に示すように,サーバ6aが提供する営業部のページaのテキスト内にリンク辞書に登録された「稟議システム」が含まれている場合に,アクセス先であるサーバ6aのIPアドレスがリンク条件と照合される。そして,リンク先「URL3」に対応するリンク条件のIPアドレスの範囲に含まれる場合には,テキストの「稟議システム」にURL3(営業用稟議システムのページ)へのリンクが設定される。   As shown in FIG. 3, when the “approval system” registered in the link dictionary is included in the text of the page “a” of the sales department provided by the server 6 a, the IP address of the server 6 a as the access destination is linked. Matched with a condition. If it is included in the range of the IP address of the link condition corresponding to the link destination “URL3”, a link to URL3 (a page of the business deliberation system) is set in the text “Deliberation System”.

また,サーバ6bが提供する研究所のページbのテキスト内にリンク辞書に登録された「稟議システム」が含まれている場合に,アクセス先であるサーバ6bのIPアドレスが,リンク先「URL1」に対応するリンク条件のIPアドレスの範囲に含まれる場合には,テキストの「稟議システム」にURL1(研究所用稟議システムのページ)へのリンクが設定される。   In addition, when the “approval system” registered in the link dictionary is included in the text of the laboratory page b provided by the server 6b, the IP address of the server 6b as the access destination is the link destination “URL1”. If it is included in the range of the IP address of the link condition corresponding to, a link to URL1 (page of the laboratory deliberation system) is set in the text “Deliberation System”.

このように,アクセス要求されたページを提供するサーバ(アクセス先)のIPアドレスと,リンク先のIPアドレスとの関連性にもとづいてリンク先を選択することが可能となる。   In this way, it is possible to select a link destination based on the relationship between the IP address of the server (access destination) that provides the requested access page and the IP address of the link destination.

さらに,図4に示すように,研究所所属のユーザaのクライアント5aから別のサーバ6cが提供する共通のページcにアクセスし,ページcのテキスト内にリンク辞書に登録された「稟議システム」が含まれているとする。クライアント5aのIPアドレスが,リンク先「URL1」に対応するリンク条件のIPアドレスの範囲に含まれる場合には,テキストの「稟議システム」にURL1(研究所用稟議システムのページ)へのリンクが設定される。   Further, as shown in FIG. 4, a common page c provided by another server 6c is accessed from the client 5a of the user a belonging to the laboratory, and the “approval system” registered in the link dictionary in the text of the page c Is included. When the IP address of the client 5a is included in the range of the IP address of the link condition corresponding to the link destination “URL1”, a link to URL1 (research system page for laboratory) is set in the text “approval system” Is done.

また,営業部所属のユーザbのクライアント5bから同じサーバ6cが提供するページcにアクセスしたとする。クライアントbのIPアドレスが,リンク先「URL3」に対応するリンク条件のIPアドレスの範囲に含まれる場合には,テキストの「稟議システム」にURL3(営業部用稟議システムのページ)へのリンクが設定される。   Further, it is assumed that the page c provided by the same server 6c is accessed from the client 5b of the user b belonging to the sales department. When the IP address of the client b is included in the range of the IP address of the link condition corresponding to the link destination “URL3”, a link to URL3 (the page of the sales department deliberation system) is displayed in the text “Deliberation System”. Is set.

このように,アクセス要求したクライアント(アクセス元)のIPアドレスと,リンク先のIPアドレスとの関連性にもとづいてリンク先を選択することが可能となる。   In this way, it is possible to select a link destination based on the relationship between the IP address of the client (access source) that requested access and the IP address of the link destination.

前述したように,図1に示すネットワーク8のような組織内ネットワークにおいて,IPアドレスの割り当ては,一定の範囲内のまとまったIPアドレス群が,同一管轄(部署)等の機器(クライアントやサーバ)に割り当てられる。   As described above, in an intra-organizational network such as the network 8 shown in FIG. 1, IP addresses are allocated within a certain range by a group of IP addresses, such as devices (clients and servers) in the same jurisdiction (department). Assigned to.

リンク処理装置4は,リンク先となるURLに対応するIPアドレスに対して一定の関連性を有するIPアドレス群を,リンク先の判定情報として用いる。よって,リンク処理装置4により,同一管轄内等の任意の範囲のサーバやクライアント(ユーザ)群毎にリンク先をまとめて設定することが可能となる。   The link processing device 4 uses, as link destination determination information, an IP address group having a certain relevance to the IP address corresponding to the URL that is the link destination. Therefore, the link processing device 4 can collectively set link destinations for each server or client (user) group in an arbitrary range within the same jurisdiction.

さらに,リンク辞書生成処理装置2は,ネットワーク8で実行されたアクセスのログ情報から,一定のアクセス数があったアクセス元とアクセス先のIPアドレス群の範囲同士を関連IPアドレス範囲として検出し,検出した関連IPアドレス範囲をリンク先の判定情報として用いたリンク辞書を生成する。   Further, the link dictionary generation processing device 2 detects the range of the access source and the access destination IP address groups having a certain number of accesses as the related IP address range from the log information of the access executed in the network 8, A link dictionary using the detected related IP address range as link destination determination information is generated.

これにより,リンク辞書生成処理装置2は,割り当てられたIPアドレスの値に類似性がない場合でも,過去のアクセス傾向から,リンク先と関連性がある一定範囲のサーバやクライアント群毎にリンク先をまとめて設定することが可能となる。   As a result, the link dictionary generation processing device 2 can link the link destinations for each server or client group within a certain range related to the link destination based on the past access tendency even if the assigned IP address values are not similar. Can be set together.

また,リンク処理装置4は,ページやユーザが含まれる一定の範囲と,リンク先との関連性にもとづいてリンク先を選択することが可能となる。   Further, the link processing device 4 can select a link destination based on the relationship between a certain range including pages and users and the link destination.

次に,リンク辞書生成処理装置2の処理の流れを説明する。   Next, the processing flow of the link dictionary generation processing device 2 will be described.

リンク辞書生成処理装置2は,任意の契機または期間毎に,バッチ処理によりリンク辞書を生成してリンク辞書記憶部3に格納する。   The link dictionary generation processing device 2 generates a link dictionary by batch processing and stores the link dictionary in the link dictionary storage unit 3 every arbitrary trigger or period.

図5は,リンク辞書生成処理の処理フローを示す図である。   FIG. 5 is a diagram showing a processing flow of link dictionary generation processing.

リンク辞書生成処理装置2のログ収集部21は,ログ収集処理を行う(ステップS1)。ログ集計部22は,ログ収集部21が収集したログ情報をもとにログ集計処理を行う(ステップS2)。関連アドレス検出部23は,ログ集計結果をもとに,関連IP検出処理を行う(ステップS3)。辞書出力部24は,関連IP検出処理の結果をもとに,リンク辞書のリンク条件を付加し,リンク辞書をリンク辞書記憶部3に格納する(ステップS4)。   The log collection unit 21 of the link dictionary generation processing device 2 performs log collection processing (step S1). The log totaling unit 22 performs log totaling processing based on the log information collected by the log collecting unit 21 (step S2). The related address detection unit 23 performs related IP detection processing based on the log total result (step S3). The dictionary output unit 24 adds a link condition of the link dictionary based on the result of the related IP detection process, and stores the link dictionary in the link dictionary storage unit 3 (step S4).

各ステップSの処理の詳細は,後述する。   Details of the processing of each step S will be described later.

〔ステップS1:ログ収集処理〕
図6は,ステップS1のログ収集処理のより詳細な処理フロー図である。
[Step S1: Log collection processing]
FIG. 6 is a more detailed process flow diagram of the log collection process in step S1.

ステップS11: ログ収集部21は,予め用意されたログ収集テーブルの1行(データ)を読み込む。   Step S11: The log collection unit 21 reads one line (data) of a log collection table prepared in advance.

図7は,ログ収集テーブルの例を示す図である。   FIG. 7 is a diagram illustrating an example of a log collection table.

ログ収集テーブルは,ネットワーク8の各サーバのIPアドレスを示す「サーバIP」,ログファイルの格納場所を示す「ログ取得元」が記録されている。   In the log collection table, “server IP” indicating the IP address of each server in the network 8 and “log acquisition source” indicating the storage location of the log file are recorded.

ログ収集部21は,読み込んだデータのサーバIPをもとに全サーバ6にアクセスして,「ログ取得元」からログファイルを取得する。   The log collection unit 21 accesses all the servers 6 based on the server IP of the read data, and acquires the log file from the “log acquisition source”.

ステップS12: ログ収集部21は,取得したログファイルの内容を,ログ情報記憶部20に格納する。   Step S12: The log collection unit 21 stores the acquired contents of the log file in the log information storage unit 20.

図8は,ログ情報の例およびログ情報記憶部20の例を示す図である。   FIG. 8 is a diagram illustrating an example of log information and an example of the log information storage unit 20.

ログ収集部21は,図8(A)に示すような,ページへのアクセスに関するログ情報(アクセスログ)をネットワーク8の全てのサーバから収集して,ログ情報記憶部20に相当するアクセルログテーブルに格納する。   The log collection unit 21 collects log information (access log) regarding access to a page from all servers in the network 8 as shown in FIG. 8A, and an accelerator log table corresponding to the log information storage unit 20 To store.

図8(B)は,ログ情報記憶部20に相当するアクセスログテーブルのデータ構成例である。   FIG. 8B is a data configuration example of an access log table corresponding to the log information storage unit 20.

アクセスログテーブルは,「アクセス先サーバIP,アクセス元ユーザIP,アクセス日時,アクセス先URL」の項目を含む。   The access log table includes items of “access destination server IP, access source user IP, access date and time, access destination URL”.

「アクセス先サーバIP」は,ログファイルを取得したサーバのIPアドレスである。「アクセス元ユーザIP,アクセス日時,アクセス先URL」の各項目は,ログファイルの内容をもとに,フォーマットを統一して格納したものである。「アクセス元ユーザIP」は,アクセス先サーバIPのサーバへアクセスしてきたクライアントのIPアドレスである。「アクセス日時」はアクセスがあった日時を示す。「アクセス先URL」は,アクセス元から実際にアクセスされたURLを絶対パスに書き換えて示す。   “Access destination server IP” is the IP address of the server that acquired the log file. Each item of “access source user IP, access date and time, access destination URL” is stored in a unified format based on the contents of the log file. “Access source user IP” is the IP address of the client that has accessed the server of the access destination server IP. “Access date and time” indicates the date and time of access. The “access destination URL” indicates a URL actually accessed from the access source by rewriting it with an absolute path.

ステップS13: ログ収集部21は,ログ収集テーブルに次の行(データ)があれば(S13のY),ステップS11の処理へ戻り,次の行(データ)がなければ(S13のN),処理を終了して,ステップS2へ進む。   Step S13: If there is a next line (data) in the log collection table (Y in S13), the log collecting unit 21 returns to the processing in step S11, and if there is no next line (data) (N in S13), The process ends, and the process proceeds to step S2.

〔ステップS2:ログ集計処理〕
図9は,ステップS2のログ集計処理のより詳細な処理フロー図である。
[Step S2: Log tabulation process]
FIG. 9 is a more detailed process flow diagram of the log tabulation process in step S2.

ステップS21: ログ集計部22は,ログ情報記憶部20(アクセスログテーブル)のデータ(ログ情報)について,全桁でのアクセス先IP毎に,アクセス元ユーザIPからのアクセス数を集計する。   Step S21: The log totaling unit 22 totals the number of accesses from the access source user IP for each access destination IP in all digits of the data (log information) in the log information storage unit 20 (access log table).

図10は,全桁におけるアクセス数の集計テーブル(全桁)の例を示す図である。   FIG. 10 is a diagram showing an example of the access count total table (all digits) in all digits.

集計テーブル(全桁)は,アクセス先のサーバのIPアドレスを示す「アクセス先サーバIP」,アクセス元のクライアントのIPアドレスを示す「アクセス元ユーザIP」,アクセス元ユーザIPからのアクセス数を示す「回数」,後述するステップS22のログ集計処理が行われたかを示す「チェック」の項目を含み,集計結果が記録される。   The aggregation table (all digits) indicates “access destination server IP” indicating the IP address of the access destination server, “access source user IP” indicating the IP address of the access source client, and the number of accesses from the access source user IP. The “count” and “check” items indicating whether log aggregation processing in step S22 described later has been performed are recorded, and the aggregation results are recorded.

図11は,ステップS21の処理のより詳細な処理フロー図である。   FIG. 11 is a more detailed process flow diagram of the process of step S21.

ログ集計部22は,ログ情報記憶部20のアクセスログテーブルから1行(データ)を取り出し(ステップS211),アクセス先サーバIP,アクセス元ユーザIPを抽出する(ステップS212)。   The log totaling unit 22 extracts one row (data) from the access log table of the log information storage unit 20 (step S211), and extracts the access destination server IP and the access source user IP (step S212).

ログ集計部22は,抽出したアクセス先IPとアクセス元IPの組み合わせについての行が,集計テーブル(全桁)に既存でない場合のみ(ステップS213のN),新規に該当アクセス先IPとアクセス元IPの行を作成する(ステップS214)。そして,ログ集計部22は,該当するアクセス先IP・アクセス元IPの行の回数欄のカウンタを1増加する(ステップS215)。   The log totaling unit 22 newly creates the corresponding access destination IP and access source IP only when the row for the combination of the extracted access destination IP and access source IP does not exist in the total table (all digits) (N in step S213). Is created (step S214). Then, the log totaling unit 22 increments the counter in the number of times column of the corresponding access destination IP / access source IP by 1 (step S215).

ログ集計部22は,アクセスログテーブルに次の行(データ)があれば(ステップS216のY),ステップS211の処理へ戻り,アクセスログテーブルに次の行(データ)がなければ(ステップS216のN),処理を終了して,ステップS22へ進む。   If there is a next line (data) in the access log table (Y in step S216), the log totaling unit 22 returns to the process in step S211 and if there is no next line (data) in the access log table (in step S216). N), terminates the process and proceeds to step S22.

ステップS22: ログ集計部22は,図10の集計テーブル(全桁)の内容を,上位3桁の範囲にまとめて集計する。   Step S22: The log totaling unit 22 totals the contents of the totaling table (all digits) in FIG. 10 in the upper three-digit range.

図12は,上位3桁でまとめられた範囲のアクセス数の集計テーブル(3桁)の例を示す図である。   FIG. 12 is a diagram illustrating an example of a count table (three digits) of the number of accesses in a range summarized in the upper three digits.

集計テーブル(3桁)は,「アクセス先上位IP」,「アクセス元上位IP」,「アクセス回数」,「アクセス先ユニークIP数」,「アクセス元ユニークIP数」の項目を含み,集計結果が記録される。   The tabulation table (three digits) includes items of “access destination upper IP”, “access source upper IP”, “access count”, “access destination unique IP count”, and “access source unique IP count”, and the tabulation result is To be recorded.

「アクセス先上位IP」は,アクセス先のIPアドレスのうち,上位3桁を抽出し,4桁目を任意としたもので,アクセス先IPアドレスの集計の範囲を示す。例えば,アクセス先IPアドレスが「10.25.136.1」の場合,アクセス先上位IPは「10.25.136.*」となる。「アクセス元上位IP」も同様に,アクセス元のIPアドレスの上位3桁で,アクセス元IPアドレスの集計の範囲を示す。例えば,「10.25.181.*」,「10.25.192.*」等である。「アクセス回数」は,IPアドレス毎のアクセス回数を,上位IPの単位で集計した値である。   The “access destination upper IP” is the upper three digits extracted from the IP address of the access destination, and the fourth digit is optional, and indicates the range of tabulation of the access destination IP address. For example, when the access destination IP address is “10.25.136.1”, the access destination upper IP is “10.25.136. *”. Similarly, the “access source upper IP” is the upper three digits of the IP address of the access source and indicates the range of aggregation of the access source IP address. For example, “10.25.181. *”, “10.25.192. *”, And the like. “Number of accesses” is a value obtained by counting the number of accesses for each IP address in units of upper IP.

「アクセス先ユニークIP数」は,アクセス先上位IPとしてまとめた範囲内に出現したユニークなIPアドレス数,すなわち異なるIPアドレスの数を示す。「アクセス元ユニークIP数」は,アクセス元上位IPとしてまとめた範囲でのユニークなIPアドレス数を示す。   The “number of access destination unique IPs” indicates the number of unique IP addresses that appear within the range summarized as the access destination upper IP, that is, the number of different IP addresses. The “number of access source unique IPs” indicates the number of unique IP addresses in a range collected as the access source upper IP.

図13は,ステップS22の処理のより詳細な処理フローを示す図である。   FIG. 13 is a diagram showing a more detailed processing flow of the processing in step S22.

ログ集計部22は,集計テーブル(全桁)からチェック欄が「済」でない1行(データ)を取り出し(ステップS221),取り出した行(データ)のアクセス先IP,アクセス元IP,回数を抽出する(ステップS222)。ログ集計部22は,抽出したアクセス先IP,アクセス元IPの上位3桁をそれぞれ抽出し(ステップS223),抽出したアクセス先IP(3桁),アクセス元IP(3桁)の組合せに対応する行(データ)を集計テーブル(3桁)に作成する(ステップS224)。   The log totaling unit 22 extracts one line (data) whose check column is not “completed” from the totaling table (all digits) (step S221), and extracts the access destination IP, access source IP, and number of times of the extracted line (data) (Step S222). The log totaling unit 22 extracts the upper 3 digits of the extracted access destination IP and access source IP (step S223), and corresponds to the combination of the extracted access destination IP (3 digits) and access source IP (3 digits). A row (data) is created in the tabulation table (3 digits) (step S224).

そして,ログ集計部22は,集計テーブル(全桁)のうちでアクセス先IP,アクセス元IPのそれぞれ上位3桁の組合せが,ステップS224の処理で作成した行(データ)のアクセス先IP(3桁),アクセス元IP(3桁)の組合せと同一である行(データ)を全て抽出し(ステップS225),ステップS221およびS225で抽出した各行について,集計テーブル(全桁)のチェック欄を「済」とする(ステップS226)。   Then, the log totaling unit 22 sets the access destination IP (3) of the row (data) created by the processing of step S224 in which the combination of the upper three digits of the access destination IP and the access source IP in the total table (all digits) is created. All the rows (data) that are the same as the combination of the access source IP (three digits) are extracted (step S225). For each row extracted in steps S221 and S225, the check column of the tabulation table (all digits) is set to “ "Completed" (step S226).

ログ集計部22は,S225で抽出した全ての行(データ)のアクセス先IP,アクセス元IP,回数を抽出する(ステップS227)。そして,ログ集計部22は,ステップS222およびS227で抽出した全てのアクセス先IPのユニークを取り,そのユニーク数をS224で作成した行(データ)の「アクセス先ユニークIP数」に格納する(ステップS228)。また,ログ集計部22は,ステップS222およびS227で抽出した全てのアクセス元IPのユニークを取り,そのユニーク数をS224で作成した行(データ)の「アクセス元ユニークIP数」に格納する(ステップS229)。さらに,ログ集計部22は,ステップS222およびS227で抽出した全ての回数を集計し,S224で作成した行(データ)の「アクセス回数」に格納する(ステップS2210)。   The log totaling unit 22 extracts the access destination IP, access source IP, and number of times of all rows (data) extracted in S225 (step S227). Then, the log totaling unit 22 takes the uniqueness of all access destination IPs extracted in steps S222 and S227, and stores the unique number in the “access destination unique IP number” of the row (data) created in S224 (step S22). S228). Further, the log totaling unit 22 takes the uniqueness of all the access source IPs extracted in steps S222 and S227, and stores the unique number in the “access source unique IP number” of the row (data) created in S224 (step S22). S229). Further, the log totaling unit 22 totals all the numbers extracted in steps S222 and S227, and stores the total number of accesses in the “access count” of the row (data) created in S224 (step S2210).

ログ集計部22は,集計テーブル(全桁)に「チェック」が「済」でない行(データ)があれば(ステップS2211のY),ステップS221の処理へ戻り,「チェック」が「済」でない行(データ)がなければ(ステップS2211のN),処理を終了する。   If there is a row (data) in which “check” is not “done” in the aggregation table (all digits) (Y in step S2211), the log totaling unit 22 returns to the process in step S221, and “check” is not “done”. If there is no row (data) (N in step S2211), the process is terminated.

〔ステップS3:関連IP検出処理〕
図14は,関連IP検出処理の検出結果テーブルの例を示す図である。
[Step S3: Related IP Detection Processing]
FIG. 14 is a diagram illustrating an example of a detection result table of related IP detection processing.

検出結果テーブルは,図12に示す集計テーブル(3桁)に,「条件,逆関係の条件,チェック」の項目を付加したテーブルである。   The detection result table is a table in which items of “condition, inverse relation condition, check” are added to the aggregation table (three digits) shown in FIG.

「条件」は,アクセス先上位IPとアクセス元上位IPと間に関連性を満たす条件が成立するかを示す。「逆関係の条件」は,アクセス先上位IPがアクセス元,かつ,アクセス元上位IPがアクセス先となる逆の関係の場合について,関連性を満たす条件が成立するかを示す。図14に示す例では,「条件」,「逆関係の条件」の丸印(○)は,関連性があることを示す。「チェック」は,関連IP検出処理が行われたかを示す。「済」は,処理が行われたことを示す。   “Condition” indicates whether a condition satisfying the relationship between the access-destination upper IP and the access-source upper IP is satisfied. The “reverse relationship condition” indicates whether a condition satisfying the relevance is satisfied in the reverse relationship in which the access destination upper IP is the access source and the access source upper IP is the access destination. In the example shown in FIG. 14, circles (◯) of “condition” and “reverse relationship condition” indicate that there is a relationship. “Check” indicates whether the related IP detection processing has been performed. “Done” indicates that processing has been performed.

図15は,ステップS3の関連IP検出処理のより詳細な処理フロー図である。   FIG. 15 is a more detailed process flow diagram of the related IP detection process in step S3.

関連アドレス検出部23は,集計テーブル(3桁)の1行を読み込み,行R1とする(ステップS31)。関連アドレス検出部23は,チェック欄が「済」でなければ(ステップS32のN),ステップS33の処理へ進み,チェック欄が「済」であれば(ステップS32のY),ステップS312の処理へ進む。   The related address detection unit 23 reads one line of the tabulation table (three digits) and sets it as a line R1 (step S31). If the check field is not “completed” (N in step S32), the related address detection unit 23 proceeds to the process of step S33, and if the check field is “completed” (Y in step S32), the process of step S312 is performed. Proceed to

関連アドレス検出部23は,所定の条件が成立するかを調べる(ステップS33)。なお,条件成立の判定処理は後述する。   The related address detector 23 checks whether a predetermined condition is satisfied (step S33). Note that the condition establishment determination process will be described later.

関連アドレス検出部23は,条件が成立する場合に(ステップS33のY),行R1の条件欄に「○」を記入し(ステップS34),集計テーブル(3桁)から,アクセス元IPとアクセス先IPの値が行R1と逆になった値を持つ行R2を検索する(ステップS35)。   When the condition is satisfied (Y in step S33), the related address detection unit 23 enters “O” in the condition column of the row R1 (step S34), and accesses the access source IP and the access from the total table (three digits). A row R2 having a value obtained by reversing the value of the destination IP from the row R1 is searched (step S35).

関連アドレス検出部23は,行R2について,ステップS33の処理と同様の条件が成立するかを調べ(ステップS36),条件が成立する場合に(ステップS36のY),行R2の条件欄と行R1の逆関係の条件欄とに「○」を記入し(ステップS37),条件が成立しない場合に(ステップS36のN),行R2の条件欄と行R1の逆関係の条件欄とに「×」を記入する(ステップS38)。   The related address detection unit 23 checks whether or not the same condition as in step S33 is satisfied for the line R2 (step S36), and if the condition is satisfied (Y in step S36), the condition column and the line in the line R2 “○” is entered in the condition column of the inverse relationship of R1 (step S37), and if the condition is not satisfied (N in step S36), “conditional column of the row R2 and condition column of the inverse relationship of the row R1 are“ X "is entered (step S38).

また,関連アドレス検出部23は,ステップS33の処理で,条件が成立しない場合に(ステップS33のN),行R1の条件欄に「×」を記入し(ステップS39),集計テーブル(3桁)から,アクセス元IPとアクセス先IPの値が行R1と逆になった値を持つ行R2を検索する(ステップS310)。   Further, when the condition is not satisfied in the process of step S33 (N in step S33), the related address detection unit 23 enters “x” in the condition column of the row R1 (step S39), and the aggregation table (three digits) ) To search for a row R2 having values obtained by reversing the values of the access source IP and the access destination IP from those of the row R1 (step S310).

そして,関連アドレス検出部23は,行R1,R2のチェック欄に「済」を記入する(ステップS311)。さらに,関連アドレス検出部23は,集計テーブル(3桁)に次の行(データ)があれば(ステップS312のY),ステップS31の処理へ戻り,次の行(データ)がなければ(ステップS312のN),処理を終了する。   Then, the related address detection unit 23 enters “Done” in the check column of the rows R1 and R2 (step S311). Furthermore, if there is a next line (data) in the tabulation table (3 digits) (Y in step S312), the related address detection unit 23 returns to the process in step S31, and if there is no next line (data) (step S31). N in S312), the process ends.

図16は,ステップS33およびステップS36の処理のより詳細な処理フロー図である。   FIG. 16 is a more detailed process flow diagram of the processes in steps S33 and S36.

関連アドレス検出部23は,行R1,R2において,アクセス回数が閾値以上であるかを調べ(ステップS331),アクセス回数が閾値以上である場合に(ステップS331のY),アクセス先ユニークIP数が閾値以上であるかを調べる(ステップS332)。さらに,関連アドレス検出部23は,アクセス先ユニークIP数が閾値以上である場合に(ステップS332のY),アクセス元ユニークIP数が閾値以上であるかを調べ(ステップS333),アクセス元ユニークIP数が閾値以上である場合に(ステップS333のY),条件が成立と判定する(ステップS334)。   The related address detection unit 23 checks whether the number of accesses is greater than or equal to the threshold in rows R1 and R2 (step S331), and if the number of accesses is greater than or equal to the threshold (Y in step S331), the number of access destination unique IPs is It is checked whether or not the threshold value is exceeded (step S332). Furthermore, when the number of access destination unique IPs is equal to or greater than the threshold (Y in step S332), the related address detection unit 23 checks whether the number of access source unique IPs is equal to or greater than the threshold (step S333). When the number is equal to or greater than the threshold value (Y in step S333), it is determined that the condition is satisfied (step S334).

関連アドレス検出部23は,アクセス回数が閾値以上でない場合(ステップS331のN),アクセス先ユニークIP数が閾値以上でない場合(ステップS332のN),またはアクセス元ユニークIP数が閾値以上でない場合に(ステップS333のN),条件が不成立と判定する(ステップS335)。   When the number of accesses is not greater than or equal to the threshold (N in Step S331), the related address detection unit 23 is not greater than or equal to the threshold (N in Step S332), or the number of access-source unique IPs is not greater than or equal to the threshold. (N in step S333), it is determined that the condition is not satisfied (step S335).

〔ステップS4:辞書生成処理〕
図17は,辞書生成処理前後のリンク辞書の例を示す図である。
[Step S4: Dictionary Generation Processing]
FIG. 17 is a diagram illustrating an example of a link dictionary before and after the dictionary generation process.

図17(A)は,辞書生成処理前のリンク辞書の例を示す図である。   FIG. 17A is a diagram illustrating an example of a link dictionary before dictionary generation processing.

リンク辞書に相当する辞書テーブルは,リンクが設定される単語,語句を示す「単語」,リンク先のURLを示す「リンク先」の項目を有する。   A dictionary table corresponding to a link dictionary has items of a word to which a link is set, a “word” indicating a phrase, and a “link destination” indicating a URL of a link destination.

ここでは,リンク辞書に登録された単語「会議室予約」に複数のリンク先が対応付けられていることが分かる。   Here, it can be seen that a plurality of link destinations are associated with the word “conference room reservation” registered in the link dictionary.

図17(B)は,辞書生成処理されたリンク辞書(辞書テーブル)の例を示す図である。   FIG. 17B is a diagram illustrating an example of a link dictionary (dictionary table) subjected to dictionary generation processing.

辞書テーブルには,「リンク先」のURLに対応するIPアドレスを示す「リンク先IP」,リンク先IPに関連するIPアドレスの範囲を示す「条件」の項目が付加されている。   In the dictionary table, “link destination IP” indicating the IP address corresponding to the “link destination” URL and “condition” indicating the range of IP addresses related to the link destination IP are added.

図18は,ステップS4の辞書生成処理のより詳細な処理フロー図である。   FIG. 18 is a more detailed process flow diagram of the dictionary generation process in step S4.

辞書出力部24は,リンク辞書(辞書テーブル)から1行(データ)を読み込み(ステップS41),DNSサーバ7を用いて,URL欄の値をもとにIPアドレスを検索する(ステップS42)。辞書出力部24は,例えば,URLの欄からホスト名「http://aaa.iias.f2.com/」を取り出して,ホスト名のIPアドレス「10.25.136.1」を得て,辞書テーブルのリンク先IPに書き込む。   The dictionary output unit 24 reads one line (data) from the link dictionary (dictionary table) (step S41), and searches for an IP address based on the value in the URL field using the DNS server 7 (step S42). For example, the dictionary output unit 24 extracts the host name “http://aaa.iaias.f2.com/” from the URL field, obtains the IP address “10.25.136.1” of the host name, Write to the link destination IP of the dictionary table.

そして,辞書出力部24は,ステップS42の処理で得たIPアドレスをキーにして,集計テーブル(3桁)のアクセス先上位IPを検索し,「逆関係の条件」の値が「○(成立)」の行を取得する(ステップS43)。そして,辞書出力部24は,取得した行の,アクセス元上位IPの値を,辞書テーブルの「条件」に書き込む(ステップS44)。   Then, using the IP address obtained in step S42 as a key, the dictionary output unit 24 searches the access destination upper IP in the aggregation table (three digits), and the value of “reverse relationship condition” is “O (established) ) "Line is acquired (step S43). Then, the dictionary output unit 24 writes the value of the access source upper IP in the acquired row in the “condition” of the dictionary table (step S44).

さらに,辞書出力部24は,辞書テーブルに次の行(データ)があれば(ステップS45のY),ステップS41の処理へ進み,次の行(データ)がなければ(ステップS45のN),辞書テーブルの単語,リンク先,条件の欄をリンク辞書としてリンク辞書記憶部3に格納する(ステップS46)。   Furthermore, if there is a next line (data) in the dictionary table (Y in step S45), the dictionary output unit 24 proceeds to the process of step S41, and if there is no next line (data) (N in step S45), The word, link destination, and condition fields in the dictionary table are stored in the link dictionary storage unit 3 as a link dictionary (step S46).

次に,リンク処理装置4の処理の流れを説明する。ここでは,リンク処理装置4は,ユーザがページを閲覧する時に,リアルタイムにリンク処理を行い,アクセス元のクライアント5のIPアドレスをもとにリンク先を選択するものとする。   Next, the processing flow of the link processing device 4 will be described. Here, it is assumed that the link processing device 4 performs link processing in real time when the user browses a page, and selects a link destination based on the IP address of the client 5 of the access source.

図19は,リンク処理の処理フローを示す図である。   FIG. 19 is a diagram illustrating a processing flow of link processing.

ステップS51: クライアント5の入力変換部51は,ユーザが入力した閲覧したいページのURLを取得し,ページのURLを含むオートリンクシステム1へのURLに変換して出力する。   Step S51: The input conversion unit 51 of the client 5 acquires the URL of the page that the user wants to browse, converts the URL to the auto link system 1 including the page URL, and outputs the URL.

入力取得部41は,クライアント5での入力(ページのアクセス要求)を受け付けて,アクセス先のURL,ユーザIPアドレス(クライアント5のIPアドレス)を受け取る。   The input acquisition unit 41 receives an input (page access request) from the client 5 and receives an access destination URL and a user IP address (IP address of the client 5).

ステップS52: 入力取得部41は,受け取ったURLをもとに該当するサーバ6から,ページの内容(テキスト)を取得する。   Step S52: The input acquisition unit 41 acquires the contents (text) of the page from the corresponding server 6 based on the received URL.

ステップS53: リンク先選択部42は,ページの内容(テキスト)とリンク辞書の「単語」とをマッチングして,リンク処理の候補となるリンク箇所(単語)を検出する。   Step S53: The link destination selection unit 42 matches the content (text) of the page with the “word” of the link dictionary, and detects a link location (word) that is a candidate for the link process.

ステップS54: リンク先選択部42は,マッチングした「単語」について,対応するリンク先(URL)が複数あるかを判定する。リンク先(URL)が複数あれば(ステップS54のY),ステップS55の処理へ進み,リンク先(URL)が1つであれば(ステップS54のN),ステップS16の処理へ進む。   Step S54: The link destination selection unit 42 determines whether there are a plurality of corresponding link destinations (URLs) for the matched “word”. If there are a plurality of link destinations (URLs) (Y in step S54), the process proceeds to step S55. If there is one link destination (URL) (N in step S54), the process proceeds to step S16.

ステップS55: リンク先選択部42は,ユーザIPアドレスと「単語」の各リンク先に対応する「条件」を照合して,ユーザIPアドレスが含まれるIPアドレスの範囲が設定された「条件」のリンク先を選択する。   Step S55: The link destination selection unit 42 collates the “condition” corresponding to each link destination of the user IP address and “word”, and sets the range of the IP address including the user IP address. Select the link destination.

ステップS56: 出力生成部43は,該当のリンク箇所(単語)を,選択したリンク先を設定したリンクタグに書き換えて,HTMLにリンクを設定する。   Step S56: The output generation unit 43 rewrites the corresponding link location (word) to a link tag in which the selected link destination is set, and sets a link in HTML.

ステップS57: 取得したページの内容(テキスト)の最後までリンク辞書とマッチングされていれば(ステップS57のY),ステップS58の処理へ進み,最後までリンク辞書とマッチングされていなければ(ステップS57のN),ステップS13の処理へ戻る。   Step S57: If it is matched with the link dictionary until the end of the content (text) of the acquired page (Y of step S57), the process proceeds to step S58, and if it is not matched with the link dictionary until the end (in step S57) N), the process returns to step S13.

ステップS58: 出力生成部は,リンク設定済みのHTMLを出力する。クライアント5の表示部52は,リンク設定済みのHTMLをもとにページを表示する。   Step S58: The output generation unit outputs HTML for which the link has been set. The display unit 52 of the client 5 displays a page based on the HTML for which the link has been set.

以上説明したように,開示されたリンク辞書生成処理装置2によれば,アクセス元のIPアドレスに対応するユーザ,または,アクセス先のサーバのIPアドレスに対応するページのどちらの場合にも対応して,アクセスされたページ(サーバ)またはアクセスしたユーザと関連性が高いリンク先を選択できるリンク辞書を提供することができる。   As described above, according to the disclosed link dictionary generation processing device 2, it corresponds to either a user corresponding to the IP address of the access source or a page corresponding to the IP address of the access destination server. Thus, it is possible to provide a link dictionary that can select a link destination that is highly related to the accessed page (server) or the accessed user.

また,リンク辞書生成処理装置2によれば,関連性を判断するIPアドレスの範囲を,任意の範囲としてIPアドレスの関連性を検出することができるため,組織内ネットワークの規模に対応したリンク辞書を提供することができる。   Further, according to the link dictionary generation processing device 2, since the IP address range for determining the relevance can be detected as an arbitrary range, the relevance of the IP address can be detected. Can be provided.

また,リンク辞書生成処理装置2によれば,組織内でのアクセス傾向にもとづいてIPアドレス間の関連性を検出するため,割り当てられるIPアドレスの値の類似性に依存することなく,ページまたはユーザと実際に関連性があるリンク先を設定できるリンク辞書を提供することができる。   Further, according to the link dictionary generation processing device 2, since the relevance between IP addresses is detected based on the access tendency in the organization, the page or user is not dependent on the similarity of assigned IP address values. It is possible to provide a link dictionary that can set link destinations that are actually related to the.

以上の実施の形態について説明してきたが,その変形例として,リンク辞書にスコアの概念を導入しても良い。以上の実施の形態では,閾値以上のアクセス数などの条件で○×を付け,○のついた上位IPアドレスのみをリンク辞書に入れている。しかし,アクセス数などに基づいてスコアを算出しておき,上位IPアドレスとそのスコア値を辞書に入れておいてもよい。このようにすれば,複数の条件にマッチしたときに,最もスコアの高い,適切なリンク先を選ぶことができる。すなわち,リンク先の選択がより柔軟に行えるという利点がある。   Although the above embodiment has been described, as a modification thereof, the concept of score may be introduced into the link dictionary. In the above embodiment, “X” is given under conditions such as the number of accesses equal to or greater than the threshold, and only the upper IP addresses with “O” are entered in the link dictionary. However, the score may be calculated based on the number of accesses and the higher IP address and its score value may be entered in the dictionary. In this way, when a plurality of conditions are matched, an appropriate link destination with the highest score can be selected. That is, there is an advantage that the link destination can be selected more flexibly.

以上の実施態様の説明では,各クライアント5が入力変換部51を備える構成例を示した。しかし,ネットワーク8に接続されたプロキシサーバ(不図示)が入力変換部を備えるようにしてもよい。   In the above description of the embodiment, the configuration example in which each client 5 includes the input conversion unit 51 is shown. However, a proxy server (not shown) connected to the network 8 may include an input conversion unit.

また,以上の実施態様の説明では,リンク辞書生成処理装置2とリンク処理装置4がオートリンクシステム1に備えられる構成例を説明した。しかし,リンク辞書生成処理装置2とリンク処理装置4とは,異なるシステムとして備えられるようにしてもよい。   In the above description of the embodiment, the configuration example in which the link dictionary generation processing device 2 and the link processing device 4 are provided in the auto link system 1 has been described. However, the link dictionary generation processing device 2 and the link processing device 4 may be provided as different systems.

リンク辞書生成処理装置2とリンク処理装置4は,それぞれ,演算装置(CPU),一時記憶装置(DRAM,フラッシュメモリ等),永続性記憶装置(HDD,フラッシュメモリ等),およびネットワーク8とのネットワークインターフェースを有するコンピュータによって実施することができる。また,リンク辞書記憶部3は永続性記憶装置等で実施することができる。   The link dictionary generation processing device 2 and the link processing device 4 are respectively a computing device (CPU), a temporary storage device (DRAM, flash memory, etc.), a permanent storage device (HDD, flash memory, etc.), and a network with the network 8. It can be implemented by a computer having an interface. The link dictionary storage unit 3 can be implemented by a permanent storage device or the like.

さらに,リンク辞書生成処理装置2,リンク処理装置4は,それぞれ,コンピュータが実行可能なプログラムによって実施することができる。この場合に,リンク辞書生成処理装置2,リンク処理装置4の各々が有すべき機能の処理内容を記述したプログラムが提供される。提供されたプログラムをコンピュータが実行することによって,上記説明したようなリンク辞書生成処理装置2,リンク処理装置4の処理機能がコンピュータ上で実現される。すなわち,リンク辞書生成処理装置2,リンク処理装置4の各処理部は,プログラムで構成することができ,これらのプログラムが一時記憶装置にロードされて実行されることにより,各処理部の機能が実現される。   Further, each of the link dictionary generation processing device 2 and the link processing device 4 can be implemented by a program executable by a computer. In this case, a program describing the processing contents of the functions that each of the link dictionary generation processing device 2 and the link processing device 4 should have is provided. When the provided program is executed by the computer, the processing functions of the link dictionary generation processing device 2 and the link processing device 4 as described above are realized on the computer. That is, each processing unit of the link dictionary generation processing device 2 and the link processing device 4 can be configured by a program, and the functions of each processing unit can be performed by loading these programs into a temporary storage device and executing them. Realized.

なお,このコンピュータは,可搬型記録媒体から直接プログラムを読み取り,そのプログラムに従った処理を実行することもでき,サーバコンピュータからプログラムが転送されるごとに,逐次,受け取ったプログラムに従った処理を実行することもできる。さらに,コンピュータは,このプログラムを,読み取り可能な記録媒体に記録させておくことができる。   The computer can also read a program directly from a portable recording medium and execute processing according to the program. Each time the program is transferred from the server computer, the computer sequentially executes processing according to the received program. It can also be executed. Furthermore, the computer can record this program on a readable recording medium.

1 オートリンクシステム
2 リンク辞書生成処理装置
20 ログ情報記憶部
21 ログ収集部
22 ログ集計部
23 関連アドレス検出部
24 辞書出力部
3 リンク辞書記憶部
4 リンク処理装置
41 入力取得部
42 リンク先選択部
43 出力生成部
5 クライアント
51 入力変換部
52 表示部
6(6a,6b,…) サーバ
7 DNSサーバ
8 ネットワーク
DESCRIPTION OF SYMBOLS 1 Autolink system 2 Link dictionary production | generation apparatus 20 Log information storage part 21 Log collection part 22 Log totaling part 23 Related address detection part 24 Dictionary output part 3 Link dictionary storage part 4 Link processing apparatus 41 Input acquisition part 42 Link destination selection part 43 output generation unit 5 client 51 input conversion unit 52 display unit 6 (6a, 6b,...) Server 7 DNS server 8 network

Claims (8)

ウェブページのテキスト内の単語または語句にリンクを設定するリンク処理用のリンク辞書を生成するリンク辞書生成装置であって,
単語または語句毎にリンク先を対応付けたリンク辞書を記憶するリンク辞書記憶部と,
組織内ネットワークにおいて実行されたリソースへのアクセスに関して,アクセス元のIPアドレスとアクセス先のIPアドレスとを含むログ情報を収集するログ収集部と,
前記収集したログ情報をもとに,前記アクセス先のIPアドレスを含むIPアドレス範囲に対する,前記アクセス元のIPアドレスを含むIPアドレス範囲からのアクセス数を集計するログ集計部と,
前記集計したアクセス数が任意の閾値以上である場合に,前記アクセス先とアクセス元とのIPアドレス範囲の対を関連IPアドレス範囲として保持する関連アドレス検出部と,
前記リンク辞書に設定されたリンク先のIPアドレスが前記関連IPアドレス範囲の一方のIPアドレス範囲に含まれる場合に,前記関連IPアドレス範囲の他方のIPアドレス範囲を,前記リンク先に対応するリンク条件として付加する処理と,
前記リンク条件が付加されたリンク辞書を前記リンク辞書記憶部に格納する処理とを行う辞書出力部とを備える
ことを特徴とするリンク辞書生成処理装置。
A link dictionary generation device for generating a link dictionary for link processing for setting a link to a word or phrase in a text of a web page,
A link dictionary storage unit for storing a link dictionary in which a link destination is associated with each word or phrase;
A log collection unit that collects log information including an IP address of an access source and an IP address of an access destination with respect to access to a resource executed in an organization network;
A log totaling unit that counts the number of accesses from the IP address range including the access source IP address to the IP address range including the access destination IP address based on the collected log information;
A related address detection unit that holds a pair of IP address ranges of the access destination and the access source as a related IP address range when the total number of accesses is equal to or greater than an arbitrary threshold;
When the IP address of the link destination set in the link dictionary is included in one IP address range of the related IP address range, the other IP address range of the related IP address range is changed to a link corresponding to the link destination. Processing to be added as a condition,
A link dictionary generation processing device comprising: a dictionary output unit that performs a process of storing the link dictionary to which the link condition is added in the link dictionary storage unit.
前記関連アドレス検出部は,前記アクセス先と前記アクセス元とのIPアドレス範囲間について双方向でのアクセス数が前記閾値以上である場合に,前記アクセス先と前記アクセス元のIPアドレス範囲の対を関連IPアドレス範囲として保持する
ことを特徴とする請求項1に記載のリンク辞書生成処理装置。
The related address detection unit determines a pair of the IP address range of the access destination and the access source when the number of bidirectional accesses between the access destination and the IP address range of the access source is equal to or greater than the threshold. The link dictionary generation processing device according to claim 1, wherein the link dictionary generation processing device is held as a related IP address range.
前記アクセス先と前記アクセス元のIPアドレス範囲は,前記組織内ネットワークで割り当てられるIPアドレスの上位から任意の桁数またはビット数によって定められる範囲である
ことを特徴とする請求項1または請求項2のいずれか一項に記載のリンク辞書生成処理装置。
3. The IP address range of the access destination and the access source is a range determined by an arbitrary number of digits or bits from the top of an IP address assigned in the intra-organization network. The link dictionary generation processing apparatus according to any one of the above.
ウェブページのテキスト内の単語または語句にリンクを設定するリンク処理で使用されるリンク辞書を生成する処理を,コンピュータに実行させるためのリンク辞書生成処理プログラムであって,
リンク辞書記憶部を備える前記コンピュータに,
組織内ネットワークにおいて実行されたリソースへのアクセスに関して,アクセス元のIPアドレスとアクセス先のIPアドレスとを含むログ情報を収集する処理と,
前記収集したログ情報をもとに,前記アクセス先のIPアドレスを含むIPアドレス範囲に対する,前記アクセス元のIPアドレスを含むIPアドレス範囲からのアクセス数を集計する処理と,
前記集計したアクセス数が任意の閾値以上である場合に,前記アクセス先とアクセス元のIPアドレス範囲の対を関連IPアドレス範囲として保持する処理と,
前記リンク辞書に設定されたリンク先のIPアドレスが前記関連IPアドレス範囲の一方のIPアドレス範囲に含まれる場合に,前記関連IPアドレス範囲の他方のIPアドレス範囲を,前記リンク先に対応するリンク条件として付加する処理と,
前記リンク条件が付加されたリンク辞書を前記リンク辞書記憶部に格納する処理とを,実行させる
ことを特徴とするリンク辞書生成処理プログラム。
A link dictionary generation processing program for causing a computer to execute a process of generating a link dictionary used in a link process for setting a link to a word or phrase in a text of a web page,
In the computer comprising the link dictionary storage unit,
A process of collecting log information including an IP address of an access source and an IP address of an access destination regarding access to resources executed in an organization network;
A process of counting the number of accesses from the IP address range including the access source IP address with respect to the IP address range including the access destination IP address based on the collected log information;
A process of holding a pair of the IP address range of the access destination and the access source as a related IP address range when the total number of accesses is an arbitrary threshold or more;
When the IP address of the link destination set in the link dictionary is included in one IP address range of the related IP address range, the other IP address range of the related IP address range is changed to a link corresponding to the link destination. Processing to be added as a condition,
A link dictionary generation processing program for executing a process of storing the link dictionary to which the link condition is added in the link dictionary storage unit.
ウェブページのテキスト内の単語または語句にリンクを設定するリンク処理装置であって,
単語または語句毎に,リンク先と前記リンク先へのリンク設定の対象となるIPアドレス範囲を設定するリンク条件とを対応付けたリンク辞書を記憶するリンク辞書記憶部と,
組織内ネットワークにおいて,アクセスされたリソースと,前記リソースを提供する機器または前記リソースへアクセスした機器のいずれかのIPアドレスとを取得する入力取得部と,
前記ウェブページの内容から前記リンク辞書に含まれる単語または語句を取り出す処理と,
前記取得した機器のIPアドレスが,前記リンク辞書の前記取り出した単語または語句に対応付けられたリンク条件のIPアドレス範囲に含まれる場合に,前記単語または語句に対応付けられ,かつ,前記取得した機器のIPアドレスを含むリンク条件に対応するリンク先を選択する処理とを行うリンク先選択部と,
前記ウェブページの該当する単語または語句に前記選択されたリンク先へのリンクを設定する処理と,前記リンク先を設定したウェブページを出力する処理とを行うページ出力生成部とを備える
ことを特徴とするリンク処理装置。
A link processing device for setting a link to a word or phrase in a text of a web page,
A link dictionary storage unit that stores a link dictionary in which a link destination and a link condition for setting an IP address range that is a target for link setting to the link destination are stored for each word or phrase;
An input acquisition unit that acquires an accessed resource and an IP address of either the device that provides the resource or the device that accesses the resource in the organization network;
Processing to extract words or phrases included in the link dictionary from the contents of the web page;
When the acquired IP address of the device is included in the IP address range of the link condition associated with the extracted word or phrase in the link dictionary, it is associated with the word or phrase and the acquired A link destination selection unit that performs a process of selecting a link destination corresponding to a link condition including the IP address of the device;
A page output generation unit that performs a process of setting a link to the selected link destination in a corresponding word or phrase of the web page, and a process of outputting the web page in which the link destination is set. Link processing device.
前記ページ出力部は,前記リンク辞書の前記取り出した単語または語句に対応付けられたリンク条件のIPアドレスの範囲に,前記取得した機器のIPアドレスが含まれない場合に,前記ウェブページの前記単語または語句へ前記リンク先情報によるリンクの設定を抑止する
ことを特徴とする請求項5に記載のリンク処理装置。
The page output unit, when the IP address of the acquired device is not included in the IP address range of the link condition associated with the extracted word or phrase of the link dictionary, the word of the web page Alternatively, the link processing apparatus according to claim 5, wherein setting of a link based on the link destination information is suppressed for a phrase.
前記リンク条件のIPアドレス範囲は,前記組織内ネットワークで割り当てられるIPアドレスの上位から任意の桁数またはビット数によって定められる範囲である
ことを特徴とする請求項5または請求項6のいずれか一項に記載のリンク処理装置。
7. The IP address range of the link condition is a range determined by an arbitrary number of digits or bits from the top of an IP address assigned in the intra-organization network. The link processing device according to item.
ウェブページのテキスト内の単語または語句にリンクを設定する処理を,コンピュータに実行させるためのリンク処理プログラムであって,
リンク辞書記憶部を備える前記コンピュータに,
組織内ネットワークにおいて,アクセスされたリソースと,前記リソースを提供する機器または前記リソースへアクセスした機器のいずれかのIPアドレスとを取得する処理と,
前記リンク辞書記憶部に記憶された情報であって,単語または語句毎に,リンク先と,前記リンク先へのリンク貼付処理の対象となる組織内ネットワークを構成する機器のIPアドレスの範囲を設定するリンク条件とを対応付けたリンク辞書を参照して,前記ウェブページの内容から前記リンク辞書に含まれる単語または語句を取り出す処理と,
前記取得した機器のIPアドレスが,前記リンク辞書の前記取り出した単語または語句に対応付けられたリンク条件のIPアドレスの範囲に含まれる場合に,前記単語または語句に対応付けられ,かつ,前記取得した機器のIPアドレスを含むリンク条件に対応するリンク先を選択する処理と,
前記ウェブページの該当する単語または語句に前記選択されたリンク先へのリンクを設定する処理と,
前記リンク先を設定したウェブページを出力する処理とを,実行させる
ことを特徴とするリンク処理プログラム。
A link processing program for causing a computer to execute a process of setting a link to a word or phrase in a text of a web page,
In the computer comprising the link dictionary storage unit,
A process of obtaining an accessed resource and an IP address of either the device providing the resource or the device accessing the resource in the organization network;
Information stored in the link dictionary storage unit, for each word or phrase, sets a link destination and a range of IP addresses of devices constituting an intra-organization network that is a target of link pasting processing to the link destination A process of referring to a link dictionary that associates a link condition with a word or phrase included in the link dictionary from the content of the web page;
The IP address of the acquired device is associated with the word or phrase when the IP address of the link condition associated with the extracted word or phrase of the link dictionary is included, and the acquisition Processing for selecting a link destination corresponding to the link condition including the IP address of the selected device;
A process of setting a link to the selected link destination in the corresponding word or phrase of the web page;
A link processing program for executing a process of outputting a web page in which the link destination is set.
JP2010149496A 2010-06-30 2010-06-30 Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program Active JP5482512B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010149496A JP5482512B2 (en) 2010-06-30 2010-06-30 Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010149496A JP5482512B2 (en) 2010-06-30 2010-06-30 Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program

Publications (2)

Publication Number Publication Date
JP2012014363A JP2012014363A (en) 2012-01-19
JP5482512B2 true JP5482512B2 (en) 2014-05-07

Family

ID=45600732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010149496A Active JP5482512B2 (en) 2010-06-30 2010-06-30 Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program

Country Status (1)

Country Link
JP (1) JP5482512B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100688098B1 (en) * 1999-10-01 2007-02-28 아이신에이더블류 가부시키가이샤 Hybrid vehicle driving device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100688098B1 (en) * 1999-10-01 2007-02-28 아이신에이더블류 가부시키가이샤 Hybrid vehicle driving device

Also Published As

Publication number Publication date
JP2012014363A (en) 2012-01-19

Similar Documents

Publication Publication Date Title
US11188604B2 (en) Auto-refinement of search results based on monitored search activities of users
KR101063364B1 (en) System and method for prioritizing websites during the web crawling process
CN101263493B (en) Systems and methods for providing search results
Koshman et al. Web searching on the Vivisimo search engine
US6983282B2 (en) Computer method and apparatus for collecting people and organization information from Web sites
US20080162506A1 (en) Device and method for world wide web organization
CN102037464A (en) Search results with most clicked next objects
JP2000105739A (en) Method and device for forming subject map and providing internet data corresponding to the subject map
WO2008141295A1 (en) Keyword generation system and method for online activity
CN101097578A (en) Network resource searching method and system
Gupta et al. A review on search engine optimization: Basics
CN102298621A (en) System for obtaining page user focus degree PageFocus by method for aggregating and displaying same source information search engine based on focus degree
JP5482512B2 (en) Link dictionary generation processing device, link dictionary generation processing program, link processing device, and link processing program
KR101180371B1 (en) Folksonomy-based personalized web search method and system for performing the method
Israel et al. The impact of search engines in the world today
KR101277300B1 (en) Method and apparatus for presenting personalized advertisements
Do et al. MyWebSteps: aiding revisiting with a visual web history
Klein Using the web infrastructure for real time recovery of missing web pages
Coppin Finding science and engineering specific data set usage or funding acknowledgements
Jatowt et al. Towards mining past content of Web pages
JP2013037493A (en) Keyword extraction device, method, and program
KR20120107891A (en) Method and apparatus for presenting personalized advertisements
Nicholas Employing deep log analysis to evaluate the information-seeking behaviour of users of digital libraries
Yousef et al. Search Engine Optimization (SEO): Universities Platforms Review in Gaza Strip
Siting et al. Topic-special information extraction of online store

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140203

R150 Certificate of patent or registration of utility model

Ref document number: 5482512

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150