JP2008538021A - Information retrieval service providing server, method and system using web pages divided into a plurality of information blocks - Google Patents

Information retrieval service providing server, method and system using web pages divided into a plurality of information blocks Download PDF

Info

Publication number
JP2008538021A
JP2008538021A JP2007557936A JP2007557936A JP2008538021A JP 2008538021 A JP2008538021 A JP 2008538021A JP 2007557936 A JP2007557936 A JP 2007557936A JP 2007557936 A JP2007557936 A JP 2007557936A JP 2008538021 A JP2008538021 A JP 2008538021A
Authority
JP
Japan
Prior art keywords
information
web page
sorting
search
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007557936A
Other languages
Japanese (ja)
Inventor
ナム、セ‐ドン
シン、ジュン‐ホ
Original Assignee
チョンヌン インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by チョンヌン インコーポレイテッド filed Critical チョンヌン インコーポレイテッド
Priority claimed from PCT/KR2006/000745 external-priority patent/WO2006093394A1/en
Publication of JP2008538021A publication Critical patent/JP2008538021A/en
Pending legal-status Critical Current

Links

Images

Abstract

複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステムを提供する。本発明の仕分け検索サービス提供方法は、(a)収集されたデータを分析してそれぞれのデータを複数個の情報ブロックに区分する段階と、(b)区分された情報ブロック別に索引語を生成する段階と、(c)任意のキーワードと索引語とを比較し、その関連性によってキーワードに対する仕分け検索結果情報を生成して提供する段階とを含む
【選択図】図2
Provided are an information search service providing server, method and system using a web page divided into a plurality of information blocks. The sorting search service providing method of the present invention includes (a) analyzing collected data and dividing each data into a plurality of information blocks, and (b) generating an index word for each divided information block. And (c) comparing an arbitrary keyword with an index word, and generating and providing sorting search result information for the keyword based on the relevance thereof.

Description

本発明は、情報検索サービスに係り、より詳細には、複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステムに関する。   The present invention relates to an information search service, and more particularly to an information search service providing server, method and system using a web page divided into a plurality of information blocks.

インターネットの発達に伴い、インターネット上の膨大な量の情報をコンピュータを用いて適切に加工し体系的に蓄積し、ユーザがその情報を迅速にかつ正確に探すことができるインターネット情報検索技術が発展されてきている。   Along with the development of the Internet, Internet information retrieval technology has been developed that allows a huge amount of information on the Internet to be appropriately processed and systematically stored using a computer so that users can quickly and accurately find that information. It is coming.

インターネット情報検索技術は、インターネット上のイメージ、音声、動映像などの様々な形態の情報をウェブブラウザ(Web Browser)を用いて容易で迅速に検索できるようにするが、幾何級数的に増加する数多くのウェブサイト(Web Site)のうち、どのウェブサイトに必要な情報があるかが確認し難いという欠点がある。このような欠点を克服するために工夫された方法の中で最も一般的なものは、検索エンジン(Search Engine)を利用する方法である。   Internet information search technology enables various types of information such as images, sounds, and moving images on the Internet to be easily and quickly searched using a web browser, but the number of geometric information increases. There is a drawback that it is difficult to confirm which website has necessary information among the websites (Web Sites). The most common method devised to overcome such drawbacks is a method using a search engine.

検索エンジンとは、WWW(World Wide Web)のように、企業や独自のネットワーク又はパーソナルコンピュータ内のコンピュータシステムに格納された情報の検索を手助けするためにデザインされたソフトウェア(プログラム)のことを総称する。検索エンジンは、通常、検索ロボット(Search Robot)やウェブスパイダー(Web Spider)プログラムと呼ばれる検索プログラムが収集したウェブサイトの情報に対する索引(インデックス)作業を行い、データベース(Database)に保存する。そして、インターネット使用者に、予め与えられたワードやフレーズを含む特定の基準に対応したコンテンツに対する問い合わせを許容し、上記基準と一致する参照リストを検索する。   A search engine is a general term for software (programs) designed to help users search for information stored in a computer system in a company, their own network, or a personal computer, such as the World Wide Web. To do. The search engine normally performs an indexing operation on website information collected by a search program called a search robot or a web spider (Web Spider) program, and stores it in a database. Then, the Internet user is allowed to inquire about contents corresponding to a specific standard including a word or phrase given in advance, and a reference list that matches the standard is searched.

このような検索エンジンは、通常、使用者が入力した質疑語と一致する単語を含むウェブページを検索する。そして、検索結果を内部的な基準に基づいて決定された正確度や重要度によって再び整列(ソート)し、その結果を使用者に提供する。一方、検索エンジンは、索引しているウェブページが非常に多いため、通常、数万乃至数十億個のウェブページを検索結果として提供するが、検索結果として提供されるウェブページのうち、ユーザーの希望する情報を含むウェブページはごく一部に過ぎない。   Such search engines typically search for web pages that contain words that match the question input by the user. Then, the search results are sorted (sorted) again according to the accuracy and importance determined based on internal criteria, and the results are provided to the user. On the other hand, search engines usually provide tens of thousands to billions of web pages as search results because there are so many web pages that are indexed. Of the web pages provided as search results, There are only a few web pages that contain the information you want.

したがって、検索エンジンは、使用者に必要な情報を検索結果の上位に出力できる順位体系(Ranking System)を導入して使用している。順位体系とは、ウェブページ内部に存在する情報と、ウェブページの外部に存在するがウェブページと関連付けられている情報とを分析し、分析した情報に基づいて内部的な基準にしたがってウェブページの順位を算出できる一連の論理的な体系のことをいう。   Therefore, the search engine introduces and uses a ranking system that can output information necessary for the user to the top of the search results. The ranking system is an analysis of information that exists inside the web page and information that is outside the web page but is associated with the web page. A series of logical systems that can calculate the ranking.

このような順位体系を正確に具現するために、検索エンジンは、質疑語の出現頻度、逆参照頻度、スパムフィルタリング(Spam Filtering)などを考慮している。すなわち、検索エンジンは、ウェブページ内の質疑語出現頻度によって検索結果を整列する、逆参照頻度によって検索結果を整列する、または、スパムフィルタリングによって検索結果を整列する等、順位体系を合理的に具現するための手段を備えて検索に活用する。   In order to accurately implement such a ranking system, the search engine considers the appearance frequency of query words, the frequency of reverse reference, spam filtering, and the like. In other words, the search engine can rationalize the ranking system, such as sorting search results according to the appearance frequency of questions in web pages, sorting search results according to dereference frequency, or sorting search results by spam filtering. It is used for searching with means to do.

このような通常の検索エンジンを用いた情報検索方法は、一つ一つのウェブページに対してその内部に質疑語が含まれているか否か、質疑語の出現頻度、リンクの出現頻度、リンクテキストの反映有無、スパムフィルタリングなどを考慮して情報を検索する。すなわち、通常の情報検索方法は、質疑語を含むウェブページを、ウェブページ単位に検索し、検索したウェブページを順位体系に従って使用者に提供する。   The information search method using such a normal search engine includes whether or not a question word is included in each web page, the appearance frequency of the question word, the appearance frequency of the link, and the link text. Search for information taking into account the presence or absence of spam and spam filtering. That is, a normal information search method searches a web page including a question word for each web page, and provides the searched web page to a user according to a ranking system.

一方、ウェブページは、通常、HTML(Hypertext Markup Language)のようなマークアップ文書の文法によって作成されたHTMLタグ(Tag)と本文テキストで構成される。また、ウェブページは、基本情報を表すためのタグとテキストを含む。すなわち、ウェブページは、題名、作成者、ヒット数、本文などに区分された情報ブロックを含んでおり、情報ブロックはタグによって区分される。   On the other hand, a web page is usually composed of an HTML tag (Tag) created by a grammar of a markup document such as HTML (Hypertext Markup Language) and a body text. The web page includes a tag and text for representing basic information. That is, the web page includes information blocks divided into a title, a creator, the number of hits, a text, and the like, and the information blocks are classified by tags.

そして、ユーザーの希望する情報は、その種類(type)又は属性(attribute)によって情報ブロックのうちの特定の情報ブロックに含まれていることができる。例えば、使用者が、“キム・チョルス”という作成者によって作成された“株式話”という題名のウェブページを探そうとする場合、ウェブページ内の複数の情報ブロックのうち、“題名”、“本文”、“ヒット数”などの情報ブロックに“キム・チョルス”という単語が含まれたウェブページよりは、“作成者”の情報ブロックに“キム・チョルス”という単語を含んでいるウェブページが、ユーザーの希望する情報を含むウェブページである可能性が高い。   The information desired by the user can be included in a specific information block among the information blocks according to the type or attribute. For example, when a user tries to find a web page titled “Stock Story” created by the creator “Kim Chul Sul”, among the plurality of information blocks in the web page, “Title”, “ Rather than a web page that contains the word “Kim Chuls” in the information block such as “Body” and “Hit Count”, there is a web page that contains the word “Kim Chuls” in the “author” information block. It is likely that the web page contains the information that the user wants.

したがって、使用者から質疑語が打ち込まれ、この質疑語に対する情報検索を行う時に、質疑語を情報ブロック別に選択して該当する情報ブロックのみを検索する、または、情報ブロック別に異なる重み値を付けて評価値を計算し、該評価値を用いて順位を決定して該決定された順位にしたがって検索結果を提供することによって、ユーザーの希望する情報に近接した情報を提供することができる。   Therefore, when a question is entered by the user and information is searched for this question, the question is selected for each information block and only the corresponding information block is searched, or a different weight value is assigned to each information block. By calculating an evaluation value, determining a rank using the evaluation value, and providing a search result according to the determined rank, information close to information desired by the user can be provided.

しかしながら、通常の検索方法は、未だウェブページ単位にしか検索できず、ウェブページの含む情報を情報ブロックに区分して情報ブロック別に検索する、または、各情報ブロック別に異なる重み値を付けて評価値を計算したのち検索結果を提供することはできなかった。   However, the normal search method can still search only in web page units, and the information contained in the web page is divided into information blocks and searched for each information block, or an evaluation value with a different weight value for each information block. After calculating, we were unable to provide search results.

一方、特定サーバーから提供するウェブページでは、使用者に項目別の検索ができるようにしている。しかし、このような方式の検索サービスも同様に、特定ウェブサーバーで管理する特定データベースを用いた検索方法に過ぎず、インターネット全体のウェブページを対象にした全体検索サービスにおいてはウェブページを情報ブロックに区分して検索できないという問題があった。   On the other hand, the web page provided from a specific server allows the user to search by item. However, this type of search service is also just a search method using a specific database managed by a specific web server. In the overall search service for the entire Internet web page, the web page is used as an information block. There was a problem that it could not be searched separately.

本発明は上記の問題点を解決するためのもので、その目的は、インターネット上の情報検索において、検索しようとする情報と最も一致する情報を検索するために、ウェブページを該ウェブページが含む情報の属性によって複数の情報ブロックに区分し、区分された情報ブロック別に索引した後、検索の際に情報ブロック別に選択的に検索したり、検索結果を、情報ブロック別に異なる重み値を付けて計算された評価値を用いて決定された順位によって整列したのちに提供する情報検索サービス提供サーバー、方法及びシステムを提供することにある。   The present invention is intended to solve the above-described problems, and its purpose is to include a web page in order to search for information that most closely matches information to be searched in information search on the Internet. After dividing into multiple information blocks according to information attributes and indexing by each divided information block, the search is selectively performed by information block at the time of search, and the search result is calculated with different weight values for each information block It is an object of the present invention to provide an information search service providing server, method and system which are provided after being arranged according to the order determined using the evaluated values.

上記の目的を達成するために、本発明は、(a)収集されたデータを分析してそれぞれのデータを複数個の情報ブロックに区分する段階と、(b)区分された情報ブロック別に索引語を生成する段階と、(c)任意のキーワードと索引語とを比較し、キーワードと索引語との間の関連性によってキーワードに対する仕分け検索結果情報を生成して提供する段階と、を含む仕分け検索サービス提供方法を提供する。   To achieve the above object, the present invention includes (a) a step of analyzing collected data and dividing each data into a plurality of information blocks, and (b) an index word for each divided information block. And (c) comparing an arbitrary keyword with an index word, and generating and providing sorting search result information for the keyword according to the relationship between the keyword and the index word. Provide service delivery methods.

また、上記の目的を達成するために、本発明は、質疑語を送信し、検索結果を出力する使用者端末機、複数のウェブページ(Web Page)を提供するウェブサーバー及び使用者端末機から質疑語を受信して検索結果を生成し、使用者端末機に送信する仕分け検索サーバーを含むシステムにおける情報を検索するサービスを提供する方法であって、(a)使用者端末機から質疑語及び仕分け検索要請信号を受信する段階と、(b)ウェブサーバーからウェブページを受信する段階と、(c)ウェブページを複数の情報ブロックに区分する段階と、(d)区分されたウェブページから情報ブロック別に索引語を抽出し、該索引語情報及び索引語が参照するウェブページである参照ページのURL情報を生成する段階と、(e)質疑語と同一または関連した索引語を検索して仕分け検索結果情報を生成し、使用者端末機に送信する段階と、を含む仕分け検索サービス提供方法を提供する。   In order to achieve the above object, the present invention provides a user terminal that transmits a query and outputs a search result, a web server that provides a plurality of web pages, and a user terminal. A method for providing a service for retrieving information in a system including a sorting search server that receives a question word, generates a search result, and transmits the search result to the user terminal, comprising: (a) a question word from the user terminal and Receiving a sorting search request signal; (b) receiving a web page from a web server; (c) dividing the web page into a plurality of information blocks; and (d) information from the divided web pages. An index word is extracted for each block, and the index word information and the URL information of the reference page, which is a web page referred to by the index word, are generated, and (e) the same as the question word Other generates division search result information by searching the index word associated to provide division search service providing method comprising the steps of transmitting to the user terminal, the.

また、本発明の目的を達成するために、本発明は、有無線通信網上の複数のウェブページ内の情報を検索して検索結果を提供するシステムであって、有無線通信網を用いてウェブサーフィン(Web Surfing)を行い、質疑語及び検索要請信号を送信して仕分け検索結果情報を受信し、備えられた画面に出力する使用者端末機と、情報を複数のウェブページとして生成して提供するウェブサーバーと、ウェブページを複数の情報ブロックに区分し、区分されたウェブページを用いて情報を検索することによって仕分け検索結果情報を生成した後、使用者端末機に送信する仕分け検索サーバーと、を備える仕分け検索サービス提供システムを提供する。   In order to achieve the object of the present invention, the present invention is a system for searching information in a plurality of web pages on a wired / wireless communication network and providing a search result using the wired / wireless communication network. Web surfing (Web Surfing), sending a question word and search request signal, receiving sorting search result information, and outputting it to the provided screen, and generating information as a plurality of web pages A web server to be provided and a web search server that divides a web page into a plurality of information blocks, generates sorting search result information by searching for information using the sorted web pages, and transmits the result to the user terminal. And providing a sorting search service providing system.

また、本発明の目的を達成するために、本発明は、収集されたデータを分析してそれぞれのデータを複数個の情報ブロックに区分するページ仕分けモジュールと、区分された情報ブロック別に索引語を生成する索引管理モジュールと、任意のキーワードと索引語とを比較し、キーワードと索引語との間の関連性によってキーワードに対する仕分け検索結果情報を生成して提供する制御部と、を備える仕分け検索サービス提供サーバーを提供する。   In order to achieve the object of the present invention, the present invention analyzes a collected data and divides each data into a plurality of information blocks, and an index word for each divided information block. Sorting search service comprising: an index management module to be generated; and a control unit that compares an arbitrary keyword with an index word and generates and provides sorting search result information for the keyword according to the relationship between the keyword and the index word Provide a provision server.

また、本発明の目的を達成するために、本発明は、有無線通信網を介してウェブサーフィンを行う使用者端末機から質疑語及び検索要請信号を受信し、ウェブサーバーによって提供されるウェブページ上の情報を検索し、該検索結果を使用者端末機に送信する検索サービスを提供するサーバーであって、ウェブページ収集プログラムを実行し、有無線通信網に接続したウェブサーバーによって提供されるウェブページを保存するウェブページ収集モジュールと、ウェブページ収集モジュールによって受信したウェブページを分析してURL形式を生成するURL形式生成モジュールと、URL形式を用いてウェブページからHTMLテンプレートを抽出し、HTMLテンプレートを用いてウェブページを複数の情報ブロックに区分するページ仕分けモジュールと、区分されたウェブページ内の情報ブロック別に索引語を抽出し、索引語情報及び索引語が参照するウェブページである参照ページのURL情報を生成して保存する索引管理モジュールと、使用者端末機から質疑語と一緒に情報検索要請信号を受信して質疑語と同一または関連した索引語を検索して仕分け検索結果情報を生成し、使用者端末機に送信する質疑管理モジュールと、仕分け検索サーバーが区分されたウェブページを用いて検索を行うように、ウェブページ収集モジュール、URL形式生成モジュール、ページ仕分けモジュール、索引管理モジュール及び質疑管理モジュールを制御し、仕分け検索サーバーが有無線通信網を用いて使用者端末機及びウェブサーバーと通信を行うように制御する制御部と、を備える仕分け検索サービス提供サーバーを提供する。   In order to achieve the object of the present invention, the present invention provides a web page provided by a web server that receives a query and a search request signal from a user terminal that surfs the web via a wired / wireless communication network. A server providing a search service for searching the above information and transmitting the search result to a user terminal, which is provided by a web server that executes a web page collection program and is connected to a wired / wireless communication network A web page collection module for storing pages, a URL format generation module for analyzing a web page received by the web page collection module and generating a URL format, an HTML template is extracted from the web page using the URL format, and an HTML template A page that divides a web page into multiple information blocks using An index management module that extracts index words for each information block in the classified web page, generates index word information and URL information of a reference page that is a web page to which the index word refers, and uses the index management module A query management module that receives an information search request signal together with a question word from a user terminal, searches for an index word that is the same as or related to the question word, generates sorting search result information, and transmits the result to the user terminal; The sort search server controls the web page collection module, URL format generation module, page sort module, index management module, and question management module so that the sort search server performs a search using the sorted web pages, and the sort search server is connected via wireless communication. A control unit that controls to communicate with a user terminal and a web server using a network. To provide a sorting search service providing server.

本発明によれば、情報別ブロックでインターネット上の情報に対する利便性(便宜)を提供でき、さらには、個々の情報別ブロックに異なる重み値を付けて評価値を計算することによって順位を決定し、該順位にしたがって出力するため、正確な検索結果を提供することが可能になる。   According to the present invention, it is possible to provide convenience (convenience) for information on the Internet by the block by information, and furthermore, the ranking is determined by calculating the evaluation value by assigning different weight values to each block by information. , Output according to the ranking, it is possible to provide an accurate search result.

以下、本発明の好適な実施例を、添付の図面を参照しつつ詳細に説明する。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

図1は、本発明の好適な実施例による複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供システムを示すブロック図である。   FIG. 1 is a block diagram showing an information search service providing system using a web page divided into a plurality of information blocks according to a preferred embodiment of the present invention.

本発明の好適な実施例による複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供システムは、使用者端末機110、有無線通信網120、ウェブサーバー130、仕分け検索サーバー140及び仕分け検索データベース(Database:以下、DBと称する)141、索引サーバー150及び索引DB151と、を備える。   An information search service providing system using a web page divided into a plurality of information blocks according to a preferred embodiment of the present invention includes a user terminal 110, a wired / wireless communication network 120, a web server 130, a sort search server 140, and a sort. A search database (hereinafter referred to as DB) 141, an index server 150, and an index DB 151 are provided.

使用者端末機110は、インターネット使用者の操作によって有無線通信網120を介して仕分け検索サーバー140に接続し、質疑語と一緒に検索要請信号を送信し、仕分け検索サーバー140から提供される仕分け検索結果情報を受信して自身の画面に出力するコンピュータである。   The user terminal 110 is connected to the sorting search server 140 via the wired / wireless communication network 120 according to an operation of the Internet user, transmits a search request signal together with a question word, and the sorting provided from the sorting search server 140. It is a computer that receives search result information and outputs it to its own screen.

したがって、使用者端末機110は、有無線通信網120を介して仕分け検索サーバー140に接続するためにVDSL(Very High Data Rate Digital Subscriber Line)モデム、ケーブルモデムなどのようなインターネットモデムを含む有線通信手段及び/またはCDMA(Code Division Multiple Access)2000モデム、WCDMA(Wide Band CDMA)モデムなどのような移動通信モデムを含む移動通信手段を備え、使用者から質疑語を受けて情報の検索を要請し、検索結果を画面に出力するためのウェブブラウザ(Web Browser)プログラムを保存したメモリー(Memory)と使用者端末機110の全体的な動作を制御するための演算を行うマイクロプロセッサを有する制御部を備える。   Accordingly, the user terminal 110 is connected to the sorting search server 140 via the wired / wireless communication network 120 to perform wired communication including an Internet modem such as a VDSL (Very High Data Rate Digital Subscriber Line) modem, a cable modem, and the like. And / or mobile communication means including a mobile communication modem such as a CDMA (Code Division Multiple Access) 2000 modem, a WCDMA (Wide Band CDMA) modem, etc., and requests a search for information in response to a question from a user. In order to control the overall operation of the user terminal 110 and a memory (Memory) that stores a Web browser program for outputting search results to the screen A control unit having a microprocessor for performing operations.

このような使用者端末機110は、デスクトップ(Desktop)コンピュータまたはラップトップ(Lap Top)やノートブックなどの移動コンピュータのような個人用コンピュータ(PC:Personal Computer)などを使用しても良く、PDA(Personal Digital Assistant)、セルラーフォン、PCS(Personal Communication Service)フォン、ハンドヘルドPC(Hand−Held PC)、GSM(Global System for Mobile)フォン、W−CDMA(Wide Band CDMA)フォン、CDMA−2000フォン、MBS(Mobile Broadband System)フォンなどのような移動通信端末機を使用してもよい。   The user terminal 110 may use a personal computer (PC) such as a desktop computer or a mobile computer such as a laptop (Lap Top) or a notebook. (Personal Digital Assistant), Cellular Phone, PCS (Personal Communication Service) Phone, Handheld PC (Hand-Held PC), GSM (Global System for Mobile, Phone), W-CDMA (DMA Phone, CDMA) A mobile communication terminal such as an MBS (Mobile Broadband System) phone May be used.

有無線通信網120は、使用者端末機110、ウェブサーバー130、仕分け検索サーバー140、索引サーバー150を有線又は無線で連結し、各構成要素相互間に送受信されるデータを中継する。   The wired / wireless communication network 120 connects the user terminal 110, the web server 130, the sorting search server 140, and the index server 150 by wire or wireless, and relays data transmitted / received between the components.

ウェブサーバー130は、一般的なネットワークサーバーで具現される複数のコンピュータシステム又はコンピュータソフトウェアを含み、様々な情報をウェブページ(Web Page)として提供する。ここで、ネットワークサーバーとは、通常、私設イントラネット又はインターネットのようなコンピューターネットワークを介して他のネットワークサーバーと通信できる下位装置と連結されて作業(オペレーション)要請を受け取り、この作業を遂行してその結果を提供するコンピュータシステム及びコンピュータソフトウェア(ネットワークサーバープログラム)のことを意味する。ただし、このようなネットワークサーバープログラムの他にも、ネットワークサーバー上で動作する一連の応用プログラムと、場合によっては内部に構築されている各種データベースを含む広い概念として理解されるべきである。このようなネットワークサーバーは、DOS、Windows(登録商標)、Linux、UNIX(登録商標)またはMac OSなどの運営体制によって様々に提供されているネットワークサーバープログラムを用いて具現することができる。   The web server 130 includes a plurality of computer systems or computer software implemented by a general network server, and provides various information as a web page. Here, the network server is usually connected to a lower-level device that can communicate with other network servers via a computer network such as a private intranet or the Internet, receives a request for operation, and performs this task to It means a computer system and computer software (network server program) that provide results. However, in addition to such a network server program, it should be understood as a broad concept including a series of application programs operating on the network server and, in some cases, various databases built inside. Such a network server can be implemented using network server programs provided in various ways according to an operating system such as DOS, Windows (registered trademark), Linux, UNIX (registered trademark), or Mac OS.

索引サーバー150は、通常、ウェブロボット(web robot)と呼ばれるデータ収集プログラムを行い、有無線通信網120に連結されたウェブサーバー130からデータを収集する。索引サーバー150は周期的に収集データを更新し、索引DB151は、収集されたデータを転置ファイル(inverted file)などを用いて保存する。   The index server 150 typically performs a data collection program called a web robot and collects data from the web server 130 connected to the wired / wireless communication network 120. The index server 150 periodically updates the collected data, and the index DB 151 stores the collected data using an inverted file or the like.

仕分け検索サーバー140は、索引サーバー150及び索引DB151との通信によって読み込んだウェブデータの位置情報を分析し、複数の位置情報形式を生成する。ここで、位置情報は、収集されたウェブデータのインターネット上における経路を含む位置情報を意味するもので、好ましくは、ウェブデータのURL(Uniform Resource Locator)を含む。このように生成したURL形式を用いて、収集したウェブページからHTMLテンプレート(HTML Template:Hypertext Markup Language Template)を抽出し、抽出したHTMLテンプレートを用いてウェブページを複数の情報ブロックに区分する。また、処理速度の改善などを目的であらかじめ定義されたテンプレート形式を使用する方法も活用することができる。ここで、情報ブロックは、題名、作成者、ヒット数、本文などのウェブページの基本情報と本文内容などを、その情報の種類または属性によってウェブページ内において一定の部分に区分されたものをいう。   The sorting search server 140 analyzes position information of web data read by communication with the index server 150 and the index DB 151, and generates a plurality of position information formats. Here, the location information means location information including a route of the collected web data on the Internet, and preferably includes a URL (Uniform Resource Locator) of the web data. Using the URL format generated in this way, an HTML template (HTML Text Markup Language Template) is extracted from the collected web page, and the web page is divided into a plurality of information blocks using the extracted HTML template. Also, a method of using a template format defined in advance for the purpose of improving the processing speed can be used. Here, the information block refers to the basic information of the web page such as the title, creator, number of hits, text, etc. and the text content, etc., divided into certain parts in the web page according to the type or attribute of the information. .

また、仕分け検索サーバー140は、前述したように、ウェブページを複数の情報ブロックに区分した後、ウェブページを情報ブロック別に索引し、情報ブロック別索引語情報と該索引語が参照するウェブページ(以下、‘参照ページ’と称する。)のURL情報を生成して仕分け検索DB141に保存する。その後、使用者端末機110から質疑語と一緒に検索要請信号を受信すると、質疑語と索引語を比較し、仕分け検索結果情報を生成して使用者端末機110に送信する。生成された仕分け検索結果情報は、質疑語と関連した他の検索結果と一緒に使用者端末機110に転送されることができる。仕分け検索サーバー140に関する詳細は、図2で説明するものとする。   In addition, as described above, the sorting search server 140 divides a web page into a plurality of information blocks, and then indexes the web page by information block. The index word information by information block and the web page (referred to by the index word) (Hereinafter referred to as “reference page”) is generated and stored in the sorting search DB 141. Thereafter, when the search request signal is received together with the query word from the user terminal 110, the query word and the index word are compared, and sorting search result information is generated and transmitted to the user terminal 110. The generated sorting search result information can be transferred to the user terminal 110 together with other search results related to the question words. Details regarding the sorting search server 140 will be described with reference to FIG.

一方、仕分け検索サーバー140は、使用者からの質疑語と検索要請信号無しに、任意のキーワードと関連した仕分け検索結果情報を、仕分け検索DB141を検索して出力することができる。例えば、仕分け検索結果は、使用者が閲覧しているウェブ文書に対して所定の方法で抽出されたキーワードなどに対する推奨情報として提供されることができる。   On the other hand, the sort search server 140 can search the sort search DB 141 and output sort search result information related to an arbitrary keyword without a query from the user and a search request signal. For example, the sorting search result can be provided as recommended information for a keyword or the like extracted by a predetermined method with respect to a web document viewed by the user.

仕分け検索DB141は、仕分け検索サーバー140から受信した索引語情報と参照ページの位置情報(URL情報を含む)を保存する。また、仕分け検索DB141は、仕分け検索サーバー140から索引語情報と参照ページのURL情報を受信し、索引語情報を情報ブロック別に保存し、参照ページのURL情報を仕分け検索DB141に保存する。また、仕分け検索DB141と索引DB151は、個別的にまたは統合的に運営されることができる。   The sort search DB 141 stores index word information received from the sort search server 140 and reference page position information (including URL information). Further, the sorting search DB 141 receives the index word information and the URL information of the reference page from the sorting search server 140, stores the index word information for each information block, and stores the URL information of the reference page in the sorting search DB 141. The sorting search DB 141 and the index DB 151 can be operated individually or in an integrated manner.

ここで、DBは、データベース管理システム(DBMS:Database Management System)プログラムなどを用いてコンピュータシステムの保存空間に具現されたデータ構造を意味するもので、データの検索、削除、編集及び追加などを自由に行えるデータ保存形態を意味する。このようなデータベースは、Oracle、informix、Sybase、MSSQL(Microsoft Structured Query Language)またはDB2のような関係型データベース管理システム(RDBMS:Relational Database Management System)などを用いて本発明の目的に合うように具現することができ、データの保存、検索、削除、編集及び追加などの機能を行うための適切なフィールド(Field)又は構成要素を持っている。   Here, the DB means a data structure embodied in a storage space of a computer system using a database management system (DBMS) program and the like, and can freely search, delete, edit, and add data. This means a data storage form that can be performed. Such a database may be used for an invention such as Oracle, informix, Sybase, MSSQL (Microsoft Structured Query Language) or a relational database management system (RDBMS: Relational Database Management System) such as DB2. And have appropriate fields or components for performing functions such as saving, searching, deleting, editing and adding data.

図2は、本発明の好適な実施例による仕分け検索サーバー140を示すブロック図である。   FIG. 2 is a block diagram illustrating a sort search server 140 according to a preferred embodiment of the present invention.

本発明の好適な実施例による仕分け検索サーバー140は、ウェブページ収集モジュール210、URL形式生成モジュール220、ページ仕分けモジュール230、索引管理モジュール240、質疑管理モジュール250及び制御部260を備えるネットワークサーバーである。   The sorting search server 140 according to a preferred embodiment of the present invention is a network server including a web page collection module 210, a URL format generation module 220, a page sorting module 230, an index management module 240, a question management module 250, and a control unit 260. .

ウェブページ収集モジュール210は、有無線通信網120を介してウェブサーバー130に接続してデータを収集する機能を担うもので、索引サーバー150が収集して索引DB151に保存した位置情報によって参照されるデータの変更などを反映するために仕分け検索サーバー140に選択的に備えられる。   The web page collection module 210 has a function of collecting data by connecting to the web server 130 via the wired / wireless communication network 120, and is referred to by position information collected by the index server 150 and stored in the index DB 151. A sorting search server 140 is selectively provided to reflect data changes and the like.

URL形式生成モジュール220は、制御部260又はウェブページ収集モジュール210によって獲得されたウェブページのURLを分析し、URL形式を生成する。本発明でいうURL形式は、複数のウェブページのうち類似な形式を持つ、すなわち、同じ基本骨格を持つウェブページを一般化する所定の形式である。本発明ではHTMLテンプレートを共有するウェブページをHTMLテンプレート単位に複数の情報ブロックに分け、区分された情報ブロック別に情報を検索する。このとき、HTMLテンプレートを共有するウェブページを選定する基準が必要とされ、この基準として用いられるのがURL形式である。   The URL format generation module 220 analyzes the URL of the web page acquired by the control unit 260 or the web page collection module 210 and generates a URL format. The URL format referred to in the present invention is a predetermined format that generalizes web pages having a similar format among a plurality of web pages, that is, having the same basic skeleton. In the present invention, a web page sharing an HTML template is divided into a plurality of information blocks for each HTML template, and information is searched for each divided information block. At this time, a criterion for selecting a web page sharing the HTML template is required, and the URL format is used as this criterion.

すなわち、同じHTMLテンプレートを共有する複数のウェブページは、同じ管理者によって生成される可能性が高く、かつウェブページに含まれる内容も類似な事項を含む可能性が高い。また、同じ管理者によって生成されたウェブページは、掲示板(Board)サービス、ブログ(Blog)サービス、マイページ(Mini Hompy)サービスなどを提供する特定ウェブサーバーによって管理される複数のページに含まれることができる。   That is, a plurality of web pages sharing the same HTML template are likely to be generated by the same administrator, and the contents included in the web pages are likely to include similar matters. In addition, web pages generated by the same administrator are included in a plurality of pages managed by a specific web server that provides a bulletin board (Board) service, a blog (Blog) service, a My Page (Mini Home) service, and the like. Can do.

本発明のHTMLテンプレートは、ウェブページの作成を容易にするために、よく使用される部分を一定の構造で作成した基本骨格であり、HTMLで作成されたウェブページの内容を分析するのに用いられる。例えば、<Table...><TD>[文番号]</TD><TD>[題名]</TD>...</TABLE>のようにウェブページを作成する際によく使用されるタグ(Tag)の形式である。通常、ウェブページとして作成されるHTML文書は、HTML文法(構文)に合わせたHTMLタグとテキストとの組合せで構成されるが、HTML文書は、表現しようとする機能によって複数の機能ブロック、すなわち、例えば、メニューを構成するためのメニューブロック、他のポータルサイトと連結するためのリンクブロック、本文内容を含めるためのメッセージブロックなどで構成される。これらの機能ブロックはウェブページ内でよく使用されることからHTMLテンプレートで作成され、使用者の便宜を図っている。   The HTML template of the present invention is a basic skeleton in which a frequently used part is created with a certain structure in order to facilitate the creation of a web page, and is used to analyze the contents of a web page created with HTML. It is done. For example, <Table. . . > <TD> [sentence number] </ TD> <TD> [title] </ TD>. . . It is a tag (Tag) format often used when creating a web page such as </ TABLE>. Normally, an HTML document created as a web page is composed of a combination of an HTML tag and text in accordance with an HTML grammar (syntax), but an HTML document has a plurality of functional blocks depending on the function to be expressed, that is, For example, it is composed of a menu block for configuring a menu, a link block for connecting to another portal site, a message block for including the text content, and the like. Since these function blocks are often used in a web page, they are created with an HTML template for the convenience of the user.

掲示板サービス、ブログサービス、マイページサービスなどのサービスを提供する特定ウェブサーバー130は、自身の管理する大部分のウェブページをHTMLテンプレートを用いて作成することから、一つのウェブサーバー130によって管理されるウェブページは、いずれもHTMLテンプレートを共有するようになる。したがって、同じURL形式を持つウェブページからHTMLテンプレートを抽出でき、抽出したHTMLテンプレートを用いれば、ウェブページを複数の情報ブロックに区分することが可能になる。   A specific web server 130 that provides services such as a bulletin board service, a blog service, and a my page service is managed by one web server 130 because most web pages managed by the specific web server 130 are created using an HTML template. All web pages will share the HTML template. Therefore, an HTML template can be extracted from a web page having the same URL format, and the extracted HTML template can be used to divide the web page into a plurality of information blocks.

ページ仕分けモジュール230は、URL形式生成モジュール220によって生成されたURL形式を用いてウェブページからHTMLテンプレートを抽出し、抽出したHTMLテンプレートを用いてウェブページを複数の情報ブロックに区分する。   The page sorting module 230 extracts an HTML template from a web page using the URL format generated by the URL format generation module 220, and classifies the web page into a plurality of information blocks using the extracted HTML template.

索引管理モジュール240は、ページ仕分けモジュール230によって複数の情報ブロックに区分されたウェブページから情報ブロック別に索引語を抽出し、該索引語が参照するURL情報を仕分け検索DB141に保存する。すなわち、索引管理モジュール240は、ウェブページの区分された各情報ブロック別に索引語を抽出し、抽出した索引語を各情報ブロック別に索引DB151に保存し、各情報ブロック別に生成された索引語が参照するウェブページである参照ページのURL情報を仕分け検索DB141に保存する。   The index management module 240 extracts an index word for each information block from the web page divided into a plurality of information blocks by the page sorting module 230, and stores URL information referred to by the index word in the sorting search DB 141. That is, the index management module 240 extracts an index word for each divided information block of the web page, stores the extracted index word in the index DB 151 for each information block, and the index word generated for each information block is referred to URL information of a reference page that is a web page to be stored is stored in the sorting search DB 141.

質疑管理モジュール250は、使用者端末機110から質疑語と一緒に情報検索要請信号を受信すると、質疑語と同一である、または、関連した意味を持つ索引語が参照する参照ページのURL情報を仕分け検索DB141から受信し、仕分け検索結果情報を生成して使用者端末機110に送信する。   When the query management module 250 receives the information search request signal together with the query word from the user terminal 110, the query management module 250 obtains the URL information of the reference page referred to by the index word having the same or related meaning as the query word. It receives from the sorting search DB 141, generates sorting search result information, and transmits it to the user terminal 110.

また、質疑管理モジュール250は、仕分け検索結果情報の生成において、情報ブロック別に索引された索引語を検索し、情報ブロック別仕分け検索結果情報及び全体仕分け検索結果情報を生成する。   In addition, the question management module 250 searches the index word indexed for each information block in the generation of sorting search result information, and generates sorting search result information for each information block and overall sorting search result information.

本発明の情報ブロック別仕分け検索結果情報は、情報ブロック別に区分され、各情報ブロック別に質疑語と同一である、または、関連した索引語と、該索引語が参照する参照ページのURL情報とを含む。すなわち、例えば、情報ブロックが題名、作成者、本文のみに区分され、索引管理モジュール240によってそれぞれのブロックに索引され、それぞれの索引語が索引DB151にそれぞれのブロック別に保存された場合、質疑管理モジュール250は、質疑語と一致または関連した索引語が参照する参照ページのURL情報を含む情報ブロック別仕分け検索結果情報を生成する。したがって、情報ブロック別仕分け検索結果情報は、題名、作成者、本文ごとに参照ページのURL情報をそれぞれ持つようになる。   The search result information classified by information block according to the present invention is classified by information block, and each information block is identical to a question word or related index word, and URL information of a reference page referred to by the index word. Including. That is, for example, when an information block is divided into only a title, a creator, and a text, and is indexed to each block by the index management module 240, and each index word is stored in the index DB 151 for each block, the question management module 250 generates sorting search result information by information block including URL information of a reference page referred to by an index word that matches or is related to a question word. Accordingly, the sorting search result information for each information block has URL information of the reference page for each title, creator, and text.

前記質疑語と索引語の関連性を判断する際は、必ずしも質疑語と索引語が物理的に同一な場合のみを要求するのではなく、形態素分析またはn−gram等によって質疑語と索引語が部分的に一致する場合も含む。また、あらかじめ定義された用語分類辞書などを用いて分類が一致するとか、辞書的に類義語である場合にまで検索結果を拡張することができる。   When determining the relevance between the question word and the index word, it is not always required to ask only when the question word and the index word are physically identical, but the question word and the index word are determined by morphological analysis or n-gram. Including the case of partial matching. In addition, the search result can be extended to the case where the classifications match using a predefined term classification dictionary or the like, or the dictionary is a synonym.

また、本発明における全体仕分け検索結果情報は、質疑語と同一または関連した索引語と、該索引語が参照する参照ページのURL情報を含むが、参照ページのURL情報は、質疑管理モジュール250によって情報ブロック別に異なる重み値を付けて計算された評価値によって順位が決定され、該順位にしたがって整列(ソート)される。すなわち、前述したように、例えば、情報ブロックが題名、作成者、本文のみに区分され、索引管理モジュール240によってそれぞれのブロックに索引され、それぞれの索引語が索引DB151にそれぞれのブロック別に保存された場合、質疑管理モジュール250は、索引DB151でそれぞれ情報ブロック別に質疑語と一致または関連した索引語を検索し、検索の結果、索引DB151から質疑語と一致または関連した索引語が検索されると、情報ブロック別に検索された索引語に、該情報ブロック別に異なる重み値を付けて評価値を計算することによって、該索引語が参照する参照ページのURL情報の順位を決定し、決定された順位によって参照ページのURL情報を整列することによって全体仕分け検索結果情報を生成する。   The overall sorting search result information in the present invention includes an index word that is the same as or related to a question word and URL information of a reference page that is referred to by the index word. The rank is determined based on the evaluation values calculated by assigning different weight values to each information block, and is sorted (sorted) according to the rank. That is, as described above, for example, an information block is divided into only a title, a creator, and a text, and is indexed to each block by the index management module 240, and each index word is stored in the index DB 151 for each block. In this case, the question management module 250 searches the index DB 151 for an index word that matches or relates to the question word for each information block, and when the index word that matches or relates to the question word is searched from the index DB 151 as a result of the search, By calculating an evaluation value by assigning a different weight value to each index block for the index word searched for each information block, the ranking of the URL information of the reference page referred to by the index term is determined, and according to the determined ranking The entire sorting search result information is generated by arranging the URL information of the reference pages.

制御部260は、仕分け検索サーバー140が仕分けされたページを用いて検索を行うように、前述のウェブページ収集モジュール210、URL形式生成モジュール220、ページ仕分けモジュール230、索引管理モジュール240、質疑管理モジュール250などを制御し、仕分け検索サーバー140が有無線通信網120、仕分け検索DB141、索引サーバー150及び索引DB151と通信を行うようにする。   The control unit 260 performs the search using the sorted pages by the sorting search server 140, the web page collection module 210, the URL format generation module 220, the page sorting module 230, the index management module 240, and the question management module. 250 and the like, and the sorting search server 140 communicates with the wired / wireless communication network 120, the sorting search DB 141, the index server 150, and the index DB 151.

図3及び図4は、本発明の好適な実施例による順位決定方法を説明するための図である。   3 and 4 are diagrams for explaining a ranking determination method according to a preferred embodiment of the present invention.

より具体的に、図3は、既存(従来)の検索における順位決定方法を説明する図である。使用者が入力した質疑語を含む“イ”と“ロ”の二つのウェブページがある場合、これら両ウェブページ間の順位を決定するに当たり、既存の検索では、ウェブページを‘題名'、‘作成者'、‘本文'などの情報ブロックに区分できないため、各情報ブロック別に重み値を付けず、単に質疑語の言及された回数を数えて評価値を計算するため、“イ”ウェブページの順位決定のための評価値は、(1×1=1)+(2×1=2)+(30×1=30)=33となり、“ロ”ウェブページの順位決定のための評価値は(3×1=3)+(3×1=3)+(20×1=20)=26となる。したがって、“イ”ウェブページで質疑語の言及された回数が、“ロ”ウェブページで質疑語の言及された回数よりも多く、したがって、“イ”ウェブページの順位が“ロ”ウェブページの順位よりも高い。   More specifically, FIG. 3 is a diagram for explaining a ranking determination method in an existing (conventional) search. If there are two web pages “a” and “b” that contain a question entered by the user, in order to determine the ranking between the two web pages, the existing search uses the “title” and “ Since it cannot be classified into information blocks such as “creator” and “text”, the weight value is not assigned to each information block, and the evaluation value is calculated simply by counting the number of times the question words are referred to. The evaluation value for determining the ranking is (1 × 1 = 1) + (2 × 1 = 2) + (30 × 1 = 30) = 33, and the evaluation value for determining the ranking of the “b” web page is (3 × 1 = 3) + (3 × 1 = 3) + (20 × 1 = 20) = 26. Therefore, the number of questions mentioned in the “I” web page is higher than the number of times the question was mentioned in the “B” web page, and therefore the ranking of the “B” web page is higher than that of the “B” web page. Higher than ranking.

図4は、本発明の好適な実施例による順位決定方法を説明するため図である。本発明では、“イ”と“ロ”の二つのウェブページの順位を決定するに当たり、それぞれのウェブページを‘題名'、‘作成者'、‘本文'などの情報ブロックに区分し、使用者の選好度によってまたは検索サービス提供のための政策によって各情報ブロック別に重み値(0を含む)を付けて評価値を計算し、該評価値によって順位を決定する。図4に示すように、‘題名'、‘作成者'、‘本文'のそれぞれに、‘×20'、‘×5'、‘×2'の重み値が付けられると、“イ”ウェブページの順位決定のための評価値は、(1×20=20)+(2×5=10)+(30×2=60)=90となり、“ロ”ウェブページの順位決定のための評価値は、(3×20)=(60+3×5=15)+(20×2=40)=115となる。したがって、本発明によれば、“イ”ウェブページで質疑語の言及された回数が“ロ”ウェブページで質疑語の言及された回数よりも多いにもかかわらず、既存検索とは違い、評価値は“ロ”ウェブページが“イ”ウェブページよりも大きく、したがって、“ロ”ウェブページの順位が“イ”ウェブページの順位よりも高くなる。   FIG. 4 is a diagram for explaining a ranking determination method according to a preferred embodiment of the present invention. In the present invention, in order to determine the order of the two web pages “I” and “B”, each web page is divided into information blocks such as “title”, “creator”, “text”, etc. The evaluation value is calculated by assigning a weight value (including 0) to each information block according to the preference level of the information or according to the policy for providing the search service, and the ranking is determined based on the evaluation value. As shown in FIG. 4, when “x20”, “x5”, and “x2” are given weight values to “title”, “creator”, and “text”, respectively, The evaluation value for determining the ranking of (1 × 20 = 20) + (2 × 5 = 10) + (30 × 2 = 60) = 90, and the evaluation value for determining the ranking of the “b” web page (3 × 20) = (60 + 3 × 5 = 15) + (20 × 2 = 40) = 115. Therefore, according to the present invention, although the number of times a question word is referred to on the “b” web page is larger than the number of times a question word is referred to on the “b” web page, the evaluation is different from the existing search. The value of “B” web page is higher than that of “B” web page, and therefore the ranking of “B” web page is higher than that of “B” web page.

したがって、使用者の検索しようとする情報の種類または属性が‘題名'である場合、すなわち、使用者の探そうとする情報が特定ウェブページの題名であれば、本発明による検索方法を用いることによってより信頼高い検索結果を提供できる。   Therefore, when the type or attribute of information to be searched by the user is 'title', that is, when the information to be searched by the user is the title of a specific web page, the search method according to the present invention is used. Can provide more reliable search results.

ただし、参照ページのURL情報の順位を決定において、索引した情報ブロックだけでなく索引していない情報ブロックも順位決定のための重要な判断基準となる。すなわち、例えば、ウェブページがヒット数を表すための情報ブロックを含んでいると、ヒット数情報ブロックの内容が索引されなくても、前述のように参照ページのURL情報の順位を決定した後に、ヒット数を参照して決定された順位を変更してもよい。   However, in determining the rank of the URL information of the reference page, not only the indexed information block but also the unindexed information block is an important judgment criterion for determining the rank. That is, for example, if the web page includes an information block for representing the number of hits, even if the contents of the hit number information block are not indexed, after determining the rank of the URL information of the reference page as described above, The order determined with reference to the number of hits may be changed.

図5は、本発明の好適な実施例による複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法を示すフローチャートである。   FIG. 5 is a flowchart illustrating an information search service providing method using a web page divided into a plurality of information blocks according to a preferred embodiment of the present invention.

インターネットを利用するインターネット使用者は、使用者端末機110を用いて質疑語を入力し、質疑語と一緒に検索要請信号を有無線通信網120を介して仕分け検索サーバー140に送信する(S410)。このS410段階は、場合によっては省略してもよい。すなわち、使用者からの質疑語入力や検索要請信号の入力無しに、保存されたデータを分析して仕分け検索サービスを行ってもよい。   An Internet user who uses the Internet inputs a question word using the user terminal 110 and transmits a search request signal together with the question word to the sorting search server 140 via the wired / wireless communication network 120 (S410). . This step S410 may be omitted depending on circumstances. That is, the classified search service may be performed by analyzing the stored data without inputting a question word or a search request signal from the user.

使用者端末機から質疑語と一緒に検索要請信号を受信した仕分け検索サーバー140は、ウェブロボット(Web Robot)プログラムを実行し、有無線通信網120に接続したウェブサーバー130からウェブページを受信する(S420)。または、仕分け検索サーバー140は、使用者からの質疑語や検索要請信号無しに、あらかじめ設定された方法によってウェブロボットプログラムが実行されることによってウェブページを受信し、データを保存してもよい。   The sort search server 140 that has received the search request signal together with the query from the user terminal executes a web robot program and receives a web page from the web server 130 connected to the wired / wireless communication network 120. (S420). Alternatively, the sorting search server 140 may receive a web page and store data by executing a web robot program according to a preset method without a query or a search request signal from a user.

ウェブサーバー130からウェブページを受信した仕分け検索サーバー140は、受信したウェブページを分析してURL形式を生成する(S430)。   The sorting search server 140 that has received the web page from the web server 130 analyzes the received web page and generates a URL format (S430).

URL形式を生成した仕分け検索サーバー140は、生成したURL形式を用いてウェブページからHTMLテンプレートを検索HTMLテンプレートを抽出し(S440)、抽出したHTMLテンプレートを用いてウェブページを複数の情報ブロックに区分する(S450)。   The sort search server 140 that generated the URL format searches the HTML template from the web page using the generated URL format, extracts the HTML template (S440), and classifies the web page into a plurality of information blocks using the extracted HTML template. (S450).

ウェブページを複数の情報ブロックに区分した仕分け検索サーバー140は、ウェブページに区分された各情報ブロック別に、各情報ブロックが含む情報から索引語を抽出して索引語情報を生成し、索引語が参照する参照ページのURL情報を生成する(S460)。   The sorting search server 140 that divides a web page into a plurality of information blocks generates index word information by extracting index words from information included in each information block for each information block divided into web pages. URL information of a reference page to be referred to is generated (S460).

索引語情報と参照ページのURL情報を生成した仕分け検索サーバー140は、抽出した索引語を各情報ブロック別に索引DB151に保存し、各情報ブロック別に生成された索引語が参照する参照ページのURL情報を仕分け検索DB141に保存する(S470)。   The sort search server 140 that has generated the index word information and the URL information of the reference page stores the extracted index word in the index DB 151 for each information block, and the URL information of the reference page to which the index word generated for each information block refers. Is stored in the sorting search DB 141 (S470).

索引作業を行った仕分け検索サーバー140は、使用者端末機110から受信した質疑語を索引DB151から検索し、仕分け検索結果情報を生成した後に、使用者端末機110に送信する(S480)。すなわち、仕分け検索サーバー140は、質疑語を索引DB151に保存された情報ブロック別索引語と比較して情報ブロック別仕分け検索結果情報を生成する、または、索引DB151に保存された索引語情報のうち全体の索引語を検索して全体仕分け検索結果情報を生成し、使用者端末機110に送信する。   The sorting search server 140 that has performed the indexing work searches the index DB 151 for the question words received from the user terminal 110, generates sorting search result information, and transmits it to the user terminal 110 (S480). That is, the sorting search server 140 generates the sorting search result information by information block by comparing the question word with the index word by information block stored in the index DB 151, or among the index word information stored in the index DB 151. The entire index word is searched to generate overall sorting search result information, and is transmitted to the user terminal 110.

仕分け検索結果情報を受信した使用者端末機110は、備えられた画面に受信した仕分け検索結果情報を出力する(S490)。一方、使用者から入力された質疑語無しにも本発明のサービスは提供されることができる。   The user terminal 110 having received the sorting search result information outputs the received sorting search result information on the provided screen (S490). On the other hand, the service of the present invention can be provided without a question input from a user.

図6は、本発明の好適な実施例による仕分け検索結果画面の一例を示す図である。   FIG. 6 is a diagram showing an example of a sorting search result screen according to a preferred embodiment of the present invention.

仕分け検索サービスは、インターネット全体のウェブページに収録された掲示文を検索するのに利用されることができる。使用者は、使用者端末機110に出力された仕分け検索サービスを提供するウェブページにおいて入力窓510に質疑語の“(公序良俗違反につき、不掲載)”を入力し、‘検索’を選択して検索を要請する。このとき、使用者は、検索しようとする情報の種類や属性によって、検索設定窓520に区分された‘題名'、‘本文'、‘作成者'項目のいずれか一項目を選択し、選択された項目に重み値を付けて検索することができる。図6では、‘題名'の項目を選択したので、題名に質疑語をより多く含むウェブページが優先的に出力される。  The sorting search service can be used to search for bulletins posted on web pages on the entire Internet. The user inputs the question word “(not shown for violation of public order and morals)” in the input window 510 on the web page that provides the sorting search service output to the user terminal 110, and selects “search”. Request a search. At this time, the user selects and selects one of the “title”, “text”, and “creator” items classified in the search setting window 520 according to the type and attribute of information to be searched. You can search by adding a weight value to the selected item. In FIG. 6, since the “title” item is selected, a web page including more questions in the title is output preferentially.

入力窓510に質疑語を入力し、検索設定窓520から検索項目を選択して検索すると、図6に示すように、仕分け検索結果540が出力される。表示された仕分け検索結果540は、整列方式メニュー530中の‘ネオランキング順'に整列された結果である。使用者は、仕分け検索結果540を確認する途中で必要によって整列方式メニュー530を‘日付順'、‘ヒット数順'に変えて選択することによって、仕分け検索結果540の整列基準を変更することができる。   When a question word is input to the input window 510 and a search item is selected from the search setting window 520 for searching, a sorting search result 540 is output as shown in FIG. The displayed sorting search result 540 is a result of sorting in the “neo ranking order” in the sorting method menu 530. The user can change the sorting criteria of the sorting search result 540 by selecting the sorting method menu 530 as “date order” and “hit number order” if necessary while checking the sorting search result 540. it can.

以上の実施例は、本発明の技術的思想を例示するためのもので、本発明の技術的思想を限定するためのものではない。したがって、本発明の属する技術分野における通常の知識を持つ者にとっては、本発明の本質的な特性を逸脱しない範囲で様々な修正及び変形が可能である。したがって、本発明の技術的範囲は、添付の請求範囲の解釈によって定められるべきであり、これと同等な範囲内における全ての技術的思想は本発明の権利範囲に含まれることは自明である。   The above embodiments are for illustrating the technical idea of the present invention, and are not intended to limit the technical idea of the present invention. Accordingly, various modifications and variations can be made by those having ordinary knowledge in the technical field to which the present invention pertains without departing from the essential characteristics of the present invention. Therefore, the technical scope of the present invention should be determined by the interpretation of the appended claims, and it is obvious that all technical ideas within the equivalent scope are included in the scope of the right of the present invention.

本発明の好適な実施例による複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供システムを示すブロック図である。1 is a block diagram illustrating an information search service providing system using a web page divided into a plurality of information blocks according to a preferred embodiment of the present invention. 本発明の好適な実施例による仕分け検索サーバーを示すブロック図である。FIG. 3 is a block diagram illustrating a sorting search server according to a preferred embodiment of the present invention. 本発明の好適な実施例による順位決定方法を説明するための図である。It is a figure for demonstrating the order | rank determination method by the preferable Example of this invention. 本発明の好適な実施例による順位決定方法を説明するための図である。It is a figure for demonstrating the order | rank determination method by the preferable Example of this invention. 本発明の好適な実施例による複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法を示すフローチャートである。3 is a flowchart illustrating an information search service providing method using a web page divided into a plurality of information blocks according to a preferred embodiment of the present invention. 本発明の好適な実施例による仕分け検索結果画面の一例を示す図である。It is a figure which shows an example of the sorting search result screen by the preferable Example of this invention.

Claims (28)

(a)収集されたデータを分析してそれぞれのデータを複数個の情報ブロックに区分する段階と、
(b)前記区分された情報ブロック別に索引語を生成する段階と、
(c)任意のキーワードと前記索引語とを比較し、前記キーワードと前記索引語との間の関連性によって前記キーワードに対する仕分け検索結果情報を生成して提供する段階と、を含むことを特徴とする仕分け検索サービス提供方法。
(A) analyzing the collected data and dividing each data into a plurality of information blocks;
(B) generating an index word for each of the divided information blocks;
(C) comparing an arbitrary keyword with the index word, and generating and providing sorting search result information for the keyword according to the relationship between the keyword and the index word. Sorting search service provision method.
前記データの位置情報は、収集されたデータのURL(Uniform Resource Locator)情報を含み、前記位置情報の形式は、複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準であることを特徴とする請求項1に記載の仕分け検索サービス提供方法。   The location information of the data includes URL (Uniform Resource Locator) information of the collected data, and the format of the location information is a predetermined format that generalizes a web page having the same basic structure among a plurality of web pages. The method for providing a sort search service according to claim 1, wherein the method is a criterion for selecting a web page sharing a markup language template. 前記(a)段階は、
(a1)前記収集されたデータを分析し、該データの位置情報形式を生成する段階と、
(a2)前記生成された位置情報形式を基準にして、関連性があると把握されたデータセット(data set)を分析段階と、
(a3)前記マークアップ言語テンプレートを用いて前記データを複数個の情報ブロックに区分する段階と、を含むことを特徴とする請求項1又は2に記載の仕分け検索サービス提供方法。
The step (a) includes:
(A1) analyzing the collected data and generating a position information format of the data;
(A2) Analyzing a data set (data set) grasped as related with the generated position information format as a reference;
The method according to claim 1 or 2, further comprising: (a3) dividing the data into a plurality of information blocks using the markup language template.
前記(a3)段階での前記情報ブロックは、前記データが含む情報の種類または属性による情報を含み、前記マークアップ言語テンプレートで作成されていることを特徴とする請求項3に記載の仕分け検索サービス提供方法。   4. The sorting search service according to claim 3, wherein the information block in the step (a3) includes information based on a type or attribute of information included in the data, and is created using the markup language template. How to provide. 前記(c)段階の仕分け検索結果は、所定の方法によって計算された評価値によって整列されることを特徴とする請求項1又は4に記載の仕分け検索サービス提供方法。   5. The sorting search service providing method according to claim 1, wherein the sorting search results in the step (c) are sorted by evaluation values calculated by a predetermined method. 前記(a)段階の前に、インターネット上のデータを収集して索引化する段階をさらに含むことを特徴とする請求項1に記載の仕分け検索サービス提供方法。   The method according to claim 1, further comprising a step of collecting and indexing data on the Internet before the step (a). 質疑語を送信し、検索結果を出力する使用者端末機、複数のウェブページ(Web Page)を提供するウェブサーバー及び前記使用者端末機から前記質疑語を受信して前記検索結果を生成し、前記使用者端末機に送信する仕分け検索サーバーを含むシステムにおける仕分け検索サービス提供方法であって、
(a)前記使用者端末機から前記質疑語及び仕分け検索要請信号を受信する段階と、
(b)前記ウェブサーバーからウェブページを受信する段階と、
(c)前記ウェブページを複数の情報ブロックに区分する段階と、
(d)前記区分されたウェブページから前記情報ブロック別に索引語を抽出し、該索引語情報及び前記索引語が参照するウェブページである参照ページのURL情報を生成する段階と、
(e)前記質疑語と同一または関連した索引語を検索して仕分け検索結果情報を生成し、前記使用者端末機に送信する段階と、を含むことを特徴とする仕分け検索サービス提供方法。
A user terminal that transmits a query and outputs a search result; a web server that provides a plurality of web pages (Web Pages); and receives the question from the user terminal to generate the search result; A method for providing a sort search service in a system including a sort search server to be transmitted to the user terminal,
(A) receiving the question and sort search request signal from the user terminal;
(B) receiving a web page from the web server;
(C) dividing the web page into a plurality of information blocks;
(D) extracting an index word for each information block from the classified web page, and generating the index word information and URL information of a reference page which is a web page referred to by the index word;
(E) Searching for an index word that is the same as or related to the question word, generating sorting search result information, and transmitting it to the user terminal, and providing a sorting search service providing method.
前記(c)段階は、
(c1)前記ウェブページを分析してURL形式を生成する段階と、
(c2)前記ウェブページのURLを前記URL形式に変換する段階と、
(c3)前記URL形式を用いて前記ウェブページからHTMLテンプレート(Hypertext Markup Language Template)を抽出する段階と、
(c4)前記HTMLテンプレートを用いて前記ウェブページを複数の情報ブロックに区分する段階と、を含むことを特徴とする請求項7に記載の仕分け検索サービス提供方法。
In step (c),
(C1) analyzing the web page to generate a URL format;
(C2) converting the URL of the web page into the URL format;
(C3) extracting an HTML template (Hypertext Markup Language Template) from the web page using the URL format;
The method according to claim 7, further comprising: (c4) dividing the web page into a plurality of information blocks using the HTML template.
前記URL形式は、前記ウェブページと同じ基本骨格を持つウェブページを一般化する所定の形式であり、かつ前記HTMLテンプレートを共有するウェブページを選定する基準であることを特徴とする請求項8に記載の仕分け検索サービス提供方法。   9. The URL format according to claim 8, wherein the URL format is a predetermined format for generalizing a web page having the same basic skeleton as the web page, and is a criterion for selecting a web page sharing the HTML template. A method for providing a classified search service as described. 前記(c4)段階で前記情報ブロックは、前記ウェブページが含む情報の種類または属性による情報を含み、前記HTMLテンプレートで作成されることを特徴とする請求項8に記載の仕分け検索サービス提供方法。   The method according to claim 8, wherein the information block in the step (c4) includes information based on a type or attribute of information included in the web page, and is created using the HTML template. 前記(d)段階は、
(d1)前記区分されたウェブページから前記情報ブロック別に前記索引語を抽出し索引語情報を生成し、仕分け検索DB(Database)に保存する段階と、
(d2)前記索引語が参照する前記参照ページのURL情報を生成して前記仕分け検索DBに保存する段階と、を含むことを特徴とする請求項7に記載の仕分け検索サービス提供方法。
In step (d),
(D1) extracting the index word for each information block from the classified web page, generating index word information, and storing the index word information in a sorting search DB (Database);
The method for providing a sort search service according to claim 7, further comprising: (d2) generating URL information of the reference page referred to by the index word and storing the URL information in the sort search DB.
前記(e)段階は、
(e1)前記情報ブロック別に前記質疑語と同一または関連した前記索引語を検索する段階と、
(e2)前記段階(e1)で前記情報ブロック別に検索した前記索引語が参照する前記参照ページのURL情報を検索する段階と、
(e3)前記段階(e2)で前記情報ブロック別に検索した前記参照ページのURL情報を前記仕分け検索結果情報として生成し、前記使用者端末機に送信する段階と、を含むことを特徴とする請求項7に記載の仕分け検索サービス提供方法。
In step (e),
(E1) searching for the index word that is the same as or related to the question word for each information block;
(E2) searching for URL information of the reference page referred to by the index word searched by the information block in the step (e1);
And (e3) generating URL information of the reference page searched for by each information block in the step (e2) as the sorting search result information and transmitting it to the user terminal. Item 8. The sorting search service providing method according to Item 7.
前記(e3)段階は、
全体仕分け検索結果情報または情報ブロック別仕分け検索結果情報を含む前記仕分け検索結果情報を生成し、ここで、前記情報ブロック別に異なる重み値を付けて評価値を計算することによって順位体系(Ranking System)による順位を決定し、前記順位によって前記参照ページのURL情報を整列した前記全体仕分け検索結果情報を生成し、前記情報ブロック別に前記質疑語と同一または関連した前記索引語と前記参照ページのURL情報を含む前記情報ブロック別仕分け検索結果情報を生成することを特徴とする請求項12に記載の仕分け検索サービス提供方法。
The step (e3) includes
The sorting search result information including the entire sorting search result information or the sorting search result information for each information block is generated, and a ranking system is calculated by calculating evaluation values with different weight values for each information block. The overall sort search result information in which the URL information of the reference page is arranged according to the order is generated, and the index word that is the same as or related to the question word and the URL information of the reference page for each information block 13. The method for providing a sorting search service according to claim 12, wherein the sorting search result information for each information block including the information is generated.
前記(e3)段階は、
前記全体仕分け検索結果情報を生成するときに、索引した情報ブロックだけでなく索引していない情報ブロックをも用いて前記順位を決定することを特徴とする請求項13に記載の仕分け検索サービス提供方法。
The step (e3) includes
14. The method for providing a sort search service according to claim 13, wherein, when generating the entire sort search result information, the rank is determined using not only the indexed information block but also the unindexed information block. .
有無線通信網上の複数のウェブページ内の情報を検索して検索結果を提供するシステムであって、
前記有無線通信網を用いてウェブサーフィン(Web Surfing)を行い、質疑語及び検索要請信号を送信して検索を要請し、前記検索の要請に対する仕分け検索結果情報を受信し、備えられた画面に出力する使用者端末機と、
前記情報を前記複数のウェブページとして生成して提供するウェブサーバーと、
前記ウェブページを複数の情報ブロックに区分し、前記区分されたウェブページを用いて前記情報を検索することによって前記仕分け検索結果情報を生成した後、前記使用者端末機に送信する仕分け検索サーバーと、を備えることを特徴とする仕分け検索サービス提供システム。
A system for searching for information in a plurality of web pages on a wired / wireless communication network and providing a search result,
Perform web surfing using the wired and wireless communication network, send a query and a search request signal to request a search, receive sorting search result information for the search request, and display on a screen provided A user terminal to output,
A web server that generates and provides the information as the plurality of web pages;
A sorting search server that divides the web page into a plurality of information blocks, generates the sorting search result information by searching the information using the sorted web page, and transmits the sorting search result information to the user terminal; A sorting search service providing system characterized by comprising:
前記仕分け検索サーバーは、
ウェブページ収集プログラムを実行し、前記有無線通信網に接続した前記ウェブサーバーから提供される前記ウェブページを受信して保存するウェブページ収集モジュールと、
前記ウェブページ収集モジュールによって受信した前記ウェブページを分析して前記URL形式を生成するURL形式生成モジュールと、
前記URL形式を用いて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数の情報ブロックに区分するページ仕分けモジュールと、
前記区分されたウェブページ内の前記情報ブロック別に索引語を抽出し、索引語情報及び前記索引語が参照するウェブページである参照ページのURL情報を生成して保存する索引管理モジュールと、
前記使用者端末機から前記質疑語とともに前記情報検索要請信号を受信して前記質疑語と同一または関連した索引語を検索して仕分け検索結果情報を生成し、前記使用者端末機に送信する質疑管理モジュールと、
前記仕分け検索サーバーが前記区分されたウェブページを用いて検索を行うように、前記ウェブページ収集モジュール、前記URL形式生成モジュール、前記ページ仕分けモジュール、前記索引管理モジュール及び前記質疑管理モジュールを制御し、前記仕分け検索サーバーが前記有無線通信網を介して前記使用者端末機及び前記ウェブサーバーと通信を行うように制御する制御部と、を備えることを特徴とする請求項15に記載の仕分け検索サービス提供システム。
The sorting search server is
A web page collection module that executes a web page collection program and receives and stores the web page provided from the web server connected to the wired / wireless communication network;
A URL format generation module that analyzes the web page received by the web page collection module and generates the URL format;
A page sorting module that extracts an HTML template from the web page using the URL format and divides the web page into a plurality of information blocks using the HTML template;
An index management module that extracts an index word for each information block in the classified web page, generates index word information and URL information of a reference page that is a web page referred to by the index word, and stores the index word information;
The information search request signal is received from the user terminal together with the question word, the index word that is the same as or related to the question word is searched to generate sorting search result information, and the question is transmitted to the user terminal A management module;
Controlling the web page collection module, the URL format generation module, the page sorting module, the index management module, and the question management module so that the sorting search server performs a search using the sorted web pages; The sorting search service according to claim 15, further comprising a control unit that controls the sorting search server to communicate with the user terminal and the web server via the wired / wireless communication network. Offer system.
前記URL形式生成モジュールは、前記ウェブページと同じ基本骨格を持つウェブページを一般化する所定の形式として前記URL形式を生成し、ここで、前記URL形式は、前記HTMLテンプレートを共有するウェブページを選定する基準であることを特徴とする請求項16に記載の仕分け検索サービス提供システム。   The URL format generation module generates the URL format as a predetermined format for generalizing a web page having the same basic skeleton as the web page, wherein the URL format is a web page sharing the HTML template. The sorting search service providing system according to claim 16, which is a criterion for selection. 前記情報ブロックは、
前記ウェブページが含む情報の種類又は属性による情報を含み、前記HTMLテンプレートで作成されることを特徴とする請求項16に記載の仕分け検索サービス提供システム。
The information block is
The system according to claim 16, wherein the system includes information based on a type or attribute of information included in the web page, and is created using the HTML template.
前記質疑管理モジュールは、
前記質疑語と同一または関連した前記索引語を前記情報ブロック別に検索し、前記情報ブロック別に検索した前記索引語が参照する前記参照ページのURL情報を検索し、前記情報ブロック別に検索した前記参照ページのURL情報を前記仕分け検索結果情報として生成して前記使用者端末機に送信することを特徴とする請求項16に記載の仕分け検索サービス提供システム。
The question management module
The index word that is the same as or related to the question word is searched for each information block, the URL information of the reference page referenced by the index word searched for the information block is searched, and the reference page searched for the information block is searched The system according to claim 16, wherein the URL information is generated as the sorting search result information and transmitted to the user terminal.
前記質疑管理モジュールは、
全体仕分け検索結果情報又は情報ブロック別仕分け検索結果情報を含む前記仕分け検索結果情報を生成し、ここで、前記情報ブロック別に異なる重み値を付けて評価値を計算することによって順位体系による順位を決定した後、前記順位にしたがって前記参照ページのURL情報を整列することによって前記全体仕分け検索結果情報を生成し、前記情報ブロック別に前記質疑語と同一または関連した索引語と前記参照ページのURL情報を含む前記情報ブロック別仕分け検索結果情報を生成することを特徴とする請求項16に記載の仕分け検索サービス提供システム。
The question management module
The sorting search result information including the entire sorting search result information or the sorting search result information for each information block is generated, and the ranking according to the ranking system is determined by calculating an evaluation value with different weight values for each information block. After that, the entire sorting search result information is generated by arranging the URL information of the reference pages according to the order, and the index word that is the same as or related to the question word and the URL information of the reference page for each information block. The sorting search service providing system according to claim 16, wherein the sorting search result information by information block is generated.
前記質疑管理モジュールは、
前記全体仕分け検索結果情報を生成するときに、索引した情報ブロックだけでなく索引していない情報ブロックをも用いて前記順位を決定することを特徴とする請求項20に記載の仕分け検索サービス提供方法。
The question management module
21. The method for providing a sort search service according to claim 20, wherein, when generating the entire sort search result information, the rank is determined using not only the indexed information block but also an unindexed information block. .
前記仕分け検索サービス提供システムは、
前記仕分け検索サーバーから受信した前記索引語情報を保存する索引DB及び前記参照ページのURL情報を保存するURL DBを含む仕分け検索DBをさらに備えることを特徴とする請求項15に記載の仕分け検索サービス提供システム。
The sorting search service providing system includes:
16. The sorting search service according to claim 15, further comprising a sorting search DB including an index DB that stores the index word information received from the sorting search server and a URL DB that stores URL information of the reference page. Offer system.
収集されたデータを分析してそれぞれのデータを複数個の情報ブロックに区分するページ仕分けモジュールと、
前記区分された情報ブロック別に索引語を生成する索引管理モジュールと、
任意のキーワードと前記索引語とを比較し、前記キーワードと前記索引語の間の関連性によって前記キーワードに対する仕分け検索結果情報を生成して提供する制御部と、を備えることを特徴とする仕分け検索サービス提供サーバー。
A page sorting module that analyzes the collected data and divides each data into multiple information blocks;
An index management module for generating an index word for each of the partitioned information blocks;
A sorting search comprising: a control unit that compares an arbitrary keyword with the index word, and generates and provides sorting search result information for the keyword based on a relationship between the keyword and the index word. Service provider server.
前記ページ仕分けモジュールは、
前記収集されたデータを分析して該データの位置情報を生成し、前記生成された位置情報の形式を用いてマークアップ言語テンプレートを抽出した後、このテンプレートを用いて前記データを複数個の情報ブロックに区分することを特徴とする請求項23に記載の仕分け検索サービス提供サーバー。
The page sorting module
The collected data is analyzed to generate position information of the data, a markup language template is extracted using the generated position information format, and the data is then used to generate a plurality of information. The sorting search service providing server according to claim 23, wherein the server is divided into blocks.
前記位置情報は、前記収集されたデータの位置しているウェブページのURLを含むことを特徴とする請求項23又は24に記載の仕分け検索サービス提供サーバー。   The server according to claim 23 or 24, wherein the location information includes a URL of a web page where the collected data is located. インターネット上のウェブページからデータをあらかじめ収集するウェブページ収集モジュールをさらに備えることを特徴とする請求項23に記載の仕分け検索サービス提供サーバー。   The server according to claim 23, further comprising a web page collection module that collects data from web pages on the Internet in advance. 有無線通信網を介してウェブサーフィンを行う使用者端末機から質疑語及び検索要請信号を受信すると、ウェブサーバーによって提供されるウェブページ上の情報を検索し、該検索結果を前記使用者端末機に送信する仕分け検索を提供するサーバーであって、
ウェブページ収集プログラムを実行し、前記有無線通信網に接続した前記ウェブサーバーによって提供される前記ウェブページを受信するウェブページ収集モジュールと、
前記ウェブページ収集モジュールによって受信した前記ウェブページを分析してURL形式を生成するURL形式生成モジュールと、
前記URL形式を用いて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数の情報ブロックに区分するページ仕分けモジュールと、
前記区分されたウェブページ内の前記情報ブロック別に索引語を抽出し、索引語情報及び前記索引語が参照するウェブページである参照ページのURL情報を生成して保存する索引管理モジュールと、
前記使用者端末機から前記質疑語とともに前記情報検索要請信号を受信して前記質疑語と同一または関連した索引語を検索して仕分け検索結果情報を生成し、前記使用者端末機に送信する質疑管理モジュールと、
前記仕分け検索サーバーが前記区分されたウェブページを用いて検索を行うように、前記ウェブページ収集モジュール、前記URL形式生成モジュール、前記ページ仕分けモジュール、前記索引管理モジュール及び前記質疑管理モジュールを制御し、前記仕分け検索サーバーが前記有無線通信網を用いて前記使用者端末機及び前記ウェブサーバーと通信を行うように制御する制御部と、を備えることを特徴とする仕分け検索サービス提供サーバー。
When a question word and a search request signal are received from a user terminal that surfs the web via a wired / wireless communication network, information on a web page provided by a web server is searched, and the search result is retrieved from the user terminal. A server that provides a sort search to send to
A web page collection module that executes a web page collection program and receives the web page provided by the web server connected to the wired / wireless communication network;
A URL format generation module that analyzes the web page received by the web page collection module and generates a URL format;
A page sorting module that extracts an HTML template from the web page using the URL format and divides the web page into a plurality of information blocks using the HTML template;
An index management module that extracts an index word for each information block in the classified web page, generates index word information and URL information of a reference page that is a web page referred to by the index word, and stores the index word information;
The information search request signal is received from the user terminal together with the question word, the index word that is the same as or related to the question word is searched to generate sorting search result information, and the question is transmitted to the user terminal A management module;
Controlling the web page collection module, the URL format generation module, the page sorting module, the index management module, and the question management module so that the sorting search server performs a search using the sorted web pages; A sorting search service providing server, comprising: a control unit that controls the sort search server to communicate with the user terminal and the web server using the wired / wireless communication network.
前記仕分け検索サービス提供サーバーは、
前記索引語情報を保存する索引DB及び前記参照ページのURL情報を保存するURLDBを含む仕分け検索DBをさらに備えることを特徴とする請求項27に記載の仕分け検索サービス提供サーバー。
The sorting search service providing server includes:
28. The sort search service providing server according to claim 27, further comprising a sort search DB including an index DB that stores the index word information and a URL DB that stores URL information of the reference page.
JP2007557936A 2005-03-04 2006-03-03 Information retrieval service providing server, method and system using web pages divided into a plurality of information blocks Pending JP2008538021A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20050018310 2005-03-04
PCT/KR2006/000745 WO2006093394A1 (en) 2005-03-04 2006-03-03 Server, method and system for providing information search service by using web page segmented into several information blocks
KR1020060020349A KR100645711B1 (en) 2005-03-04 2006-03-03 Server, Method and System for Providing Information Search Service by Using Web Page Segmented into Several Information Blocks

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011042894A Division JP5559725B2 (en) 2005-03-04 2011-02-28 Information retrieval service providing method using web page divided into a plurality of information blocks

Publications (1)

Publication Number Publication Date
JP2008538021A true JP2008538021A (en) 2008-10-02

Family

ID=37623991

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007557936A Pending JP2008538021A (en) 2005-03-04 2006-03-03 Information retrieval service providing server, method and system using web pages divided into a plurality of information blocks
JP2011042894A Active JP5559725B2 (en) 2005-03-04 2011-02-28 Information retrieval service providing method using web page divided into a plurality of information blocks

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011042894A Active JP5559725B2 (en) 2005-03-04 2011-02-28 Information retrieval service providing method using web page divided into a plurality of information blocks

Country Status (2)

Country Link
JP (2) JP2008538021A (en)
KR (1) KR100645711B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069235A (en) * 2013-09-26 2015-04-13 大日本印刷株式会社 Information processing device and information processing method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297627A (en) * 2001-03-29 2002-10-11 Tokyo Electric Power Co Inc:The System and terminal for information gathering and database server
JP2004220251A (en) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> Information extraction rule creation system, information extraction rule creation method, and information extraction rule creation program
JP2004341942A (en) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> Content classification method, content classification device, content classification program, and storage medium storing content classification program
JP2006163723A (en) * 2004-12-06 2006-06-22 Hitachi Software Eng Co Ltd Document search method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309365A (en) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd Document processor
JP3598742B2 (en) * 1996-11-25 2004-12-08 富士ゼロックス株式会社 Document search device and document search method
JP4463925B2 (en) * 1999-03-02 2010-05-19 キヤノン株式会社 Index generating apparatus and method, and storage medium
KR100643979B1 (en) * 2000-05-18 2006-11-13 엘지전자 주식회사 Information providing method for information searching result in an internet
JP2001344254A (en) * 2000-05-31 2001-12-14 Fuji Xerox Co Ltd Document management system
JP3895955B2 (en) * 2001-08-24 2007-03-22 株式会社東芝 Information search method and information search system
JP2004070376A (en) * 2002-06-10 2004-03-04 Fuji Xerox Co Ltd Document display device and method therefor
JP4226862B2 (en) * 2002-08-29 2009-02-18 株式会社リコー Document search device
JP3929418B2 (en) * 2003-05-19 2007-06-13 アルトリサーチ株式会社 Information search program and medium on which information search program is recorded

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297627A (en) * 2001-03-29 2002-10-11 Tokyo Electric Power Co Inc:The System and terminal for information gathering and database server
JP2004220251A (en) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> Information extraction rule creation system, information extraction rule creation method, and information extraction rule creation program
JP2004341942A (en) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> Content classification method, content classification device, content classification program, and storage medium storing content classification program
JP2006163723A (en) * 2004-12-06 2006-06-22 Hitachi Software Eng Co Ltd Document search method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200900341031; 波多野賢治 外3名: '統計量を用いたXML部分文書検索システムの実装' 第15回データ工学ワークショップ(DEWS2004)論文集 ISSN 1347-4413, 20040618, 電子情報通信学会 *
JPN6013014055; 波多野賢治 外3名: '統計量を用いたXML部分文書検索システムの実装' 第15回データ工学ワークショップ(DEWS2004)論文集 ISSN 1347-4413, 20040618, 電子情報通信学会

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069235A (en) * 2013-09-26 2015-04-13 大日本印刷株式会社 Information processing device and information processing method

Also Published As

Publication number Publication date
JP2011146059A (en) 2011-07-28
KR100645711B1 (en) 2006-11-15
KR20060096357A (en) 2006-09-11
JP5559725B2 (en) 2014-07-23

Similar Documents

Publication Publication Date Title
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
US8498984B1 (en) Categorization of search results
US7809716B2 (en) Method and apparatus for establishing relationship between documents
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US9268873B2 (en) Landing page identification, tagging and host matching for a mobile application
JP5106045B2 (en) Search engine linkage file sharing system
US9619571B2 (en) Method for searching related entities through entity co-occurrence
CN101986306B (en) Method and equipment for acquiring yellow page information based on query sequence
CN110597981A (en) Network news summary system for automatically generating summary by adopting multiple strategies
CN111008265A (en) Enterprise information searching method and device
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
KR20160124079A (en) Systems and methods for in-memory database search
JP4769822B2 (en) Information search service providing server, method and system using page group
KR20100112512A (en) Apparatus for searching contents and method for searching contents
JP3501799B2 (en) Information search support device, computer program, and program storage medium
JP5221664B2 (en) Information map management system and information map management method
Li [Retracted] Internet Tourism Resource Retrieval Using PageRank Search Ranking Algorithm
JP2008299842A (en) Reaction information providing method by advertisement execution, computer readable recording medium, and reaction information providing system by advertisement execution
CN109948015B (en) Meta search list result extraction method and system
JP5559725B2 (en) Information retrieval service providing method using web page divided into a plurality of information blocks
JP5688754B2 (en) Information retrieval apparatus and computer program
JP2006277061A (en) Knowledge retrieval system, method and program
KR101347123B1 (en) Apparatus and Method for Searching Information, Computer Readable Recording Medium
KR100942902B1 (en) A method of searching web page and computer readable recording media for recording the method program
US9754030B2 (en) Free text search engine system and method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100622

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101026

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110419

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110520

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130813

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130913