JP2006031108A - System for retrieving merchandise/service on web - Google Patents

System for retrieving merchandise/service on web Download PDF

Info

Publication number
JP2006031108A
JP2006031108A JP2004204961A JP2004204961A JP2006031108A JP 2006031108 A JP2006031108 A JP 2006031108A JP 2004204961 A JP2004204961 A JP 2004204961A JP 2004204961 A JP2004204961 A JP 2004204961A JP 2006031108 A JP2006031108 A JP 2006031108A
Authority
JP
Japan
Prior art keywords
page
search
price
web
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004204961A
Other languages
Japanese (ja)
Inventor
Shinichiro Fujitani
伸一郎 藤谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004204961A priority Critical patent/JP2006031108A/en
Priority to PCT/JP2005/007163 priority patent/WO2006006287A1/en
Publication of JP2006031108A publication Critical patent/JP2006031108A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To easily retrieve information such as paid merchandise to be provided on a Web. <P>SOLUTION: A robot 1 retrieves a Web, and acquires the source code of a page, and a price character string retrieval engine 3 extracts a page including a price by retrieving the source code of the acquired page. A keyword retrieval engine 5 retrieves a merchandise sales (E commerce and auction) page from the extracted page, and an index retrieving means 7 extracts the merchandise name or the service name and the price as indexes from the pertinent page, and makes an index data base 8 store them by associating them with URL to the page. A user retrieval service engine 9 provides a retrieval page on a Web, and provides the merchandise name or the service name and the price in such a state that they are linked to the pertinent page in accordance with input information. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、ウエブ上の商品・サービス検索システムに関し、特に、ユーザに有償で提供される商品及びサービスをウエブ上で検索するシステムに関する。   The present invention relates to a product / service search system on the web, and more particularly to a system for searching for products and services provided for a fee to users on the web.

今日、ウエブ上で種々のコンテンツが提供されており、そのコンテンツの中には、ユーザに有償で提供される商品及びサービスが含まれている。ウエブ上のEコマース又はオークション用のページにアクセスすることにより、ユーザは、商品・サービスの詳細な情報を入手しているが、ある統計によれば、このようなウエブページへのアクセスの動機として、約70〜80%が、商品・サービスをすでに入手した友人等から、その商品・サービスの情報及びウエブサイトのURL等を得たことであり、他は、ユーザ自らのウエブページのサーフィングによるものである。   Today, various contents are provided on the web, and the contents include goods and services provided for a fee to users. By accessing a page for e-commerce or auction on the web, the user obtains detailed information on goods and services. According to some statistics, the motivation for accessing such a web page is as follows. About 70-80% obtained information on the product / service, URL of the website, etc. from a friend who had already obtained the product / service, etc. Is.

このように、ユーザ自らのウエブページへのアクセスが少ないことの一因として、ユーザが購入したい商品・サービスの情報を簡単かつ適切に検索できる検索システムが未だ提案されていない点を挙げることができる。
例えば、代表的な検索サイトであっても、ユーザが付帯的な商品名を検索キー/クエリとして入力しても、入力キーに相当するすべてのページの情報が表示され、商品・サービスの販売及びオークションのためのページのみを、ユーザに提供することができない。
したがって、ユーザが、自分が購入したい商品・サービスを販売する意志がある販売店等のウエブページを、簡単に訪問することができれば、ウエブ上のEコマース及びオークションがより活発になると考えられる。
本発明は、このような状況に鑑みてなされたものであり、その目的は、ユーザが、有償で提供される商品・サービスの情報をウエブ上で簡単に検索し、かつ商品・サービスを有償で提供するサイトを簡単に訪問することができるようにするための商品・サービス検索システムを提供することである。
As described above, one of the reasons for the low access to the user's own web page is that a search system that can easily and appropriately search for information on products and services that the user wants to purchase has not been proposed yet. .
For example, even if it is a representative search site, even if a user inputs an incidental product name as a search key / query, information on all pages corresponding to the input key is displayed, and sales of products and services and Only a page for auction cannot be provided to the user.
Therefore, if a user can easily visit a web page of a store or the like that intends to sell a product / service that he / she wants to purchase, it is considered that e-commerce and auction on the web will become more active.
The present invention has been made in view of such a situation, and an object of the present invention is to enable a user to easily search for information on goods and services provided for a fee on the web and to pay for the goods and services for a fee. The object of the present invention is to provide a product / service search system that makes it possible to easily visit a site to be provided.

上記した目的を達成するために、第1の観点の本発明は、ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットと、
取得されたそれぞれのページのソースコードを検索することにより、価格を含んでいるページのみを抽出する価格含有ページ検索手段と、
抽出されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページへのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システムを提供する。
In order to achieve the above object, the first aspect of the present invention provides a product / service search system provided for a fee on the web.
A robot that searches the web and obtains the source code of the page on the web;
A price-containing page search means for extracting only pages containing prices by searching the source code of each acquired page;
Index search means for extracting the product name or service name and price from the extracted page as an index, and storing the extracted product name or service name and price in the database in association with the URL to the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or There is provided a search system characterized by comprising search result providing means for providing a service name and its price in a state where a link to a corresponding page is pasted.

上記した目的を達成するために、第2の観点の本発明は、ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットであって、それぞれのページのソースコードを検索することにより、価格を含んでいるページのみを取得する価格含有ページ検索手段を備えているロボットと、
取得されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システムを提供する。
In order to achieve the above object, the second aspect of the present invention provides a product / service search system provided for a fee on the web.
A robot that searches the web and obtains the source code of the page on the web, and includes a price-containing page search unit that acquires only the page including the price by searching the source code of each page. Robot
Index search means for extracting the product name or service name and price as an index from the acquired page, and storing the extracted product name or service name and price in the database in association with the URL of the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or There is provided a search system characterized by comprising search result providing means for providing a service name and its price in a state where a link to a corresponding page is pasted.

上記した第1及び第2の観点の本発明に係る検索システムにおいて、価格含有ページ検索手段は、通貨記号の前又は後に整数が配置されている価格文字列を含んでいるページのみを抽出するよう構成されていることが好ましい。
また、ウエブ上のページがXMLで作成されている場合、価格含有ページ検索手段は、価格を表す定義タグを含んでいるページのみを抽出するよう構成されていることが好ましい。
さらに、検索システムはさらに、価格含有ページ検索手段により取得されたページから、購買意志を表す用語を含んだページを削除する購買意志ページ削除手段を備え、インデックス検索手段は、購買意志ページ削除手段によって削除されなかったページから、商品名又はサービス名及び価格をインデックスとして抽出するよう構成されていることが好ましい。
さらにまた、検索システムはさらに、価格含有ページ検索手段によって抽出されたページから、キーワード検索により、商品購入の意志を表している購入意志ページを検索し削除して、商品販売ページを抽出する手段と、抽出された商品販売ページを、キーワード検索により、Eコマース用ページとオークション用ページとに分別する手段とからなるキーワード検索手段を備え、インデックス検索手段が、商品販売ページのみからインデックスを抽出するよう構成されていることが好ましい。
In the above-described search system according to the first and second aspects of the present invention, the price-containing page search means extracts only pages including a price character string in which an integer is arranged before or after a currency symbol. It is preferable to be configured.
In addition, when a page on the web is created in XML, it is preferable that the price-containing page search means is configured to extract only a page including a definition tag representing a price.
Further, the search system further includes a purchase intention page deletion unit that deletes a page including a term indicating purchase intention from the page acquired by the price-containing page search unit, and the index search unit includes the purchase intention page deletion unit. It is preferable that a product name or a service name and a price are extracted as an index from a page that has not been deleted.
Furthermore, the search system further includes a means for extracting a product sales page by searching for and deleting a purchase intention page representing a product purchase intention by a keyword search from the page extracted by the price-containing page search means. And a keyword search means comprising means for separating the extracted product sales page into an e-commerce page and an auction page by keyword search, and the index search means extracts the index only from the product sales page. It is preferable to be configured.

本発明は、上記したように構成され、全世界で普遍的に用いられている価格に特化したキーワードでページを検索しデータベース化し、かつ該ページ上の商品名・サービス名及び価格をインデックス化するので、従来例に対比して、サーバに対する負荷が飛躍的に軽減される。また、ロボット自体への負荷が少なく、従来例に対比して新規ページや更新ページを発見するのに要する時間が大幅に短縮される。
さらに、ユーザに対して、商品・サービスの販売ページ及びオークションページのみを提供することができるので、ユーザの商品・サービス購入の意図に沿った適切な検索結果を提供することができる。
The present invention is configured as described above, searches a page with a keyword specializing in a price universally used in the world, creates a database, and indexes product names, service names and prices on the page. Therefore, the load on the server is drastically reduced as compared with the conventional example. Further, the load on the robot itself is small, and the time required to find a new page or an updated page is significantly shortened as compared with the conventional example.
Furthermore, since only the product / service sales page and auction page can be provided to the user, it is possible to provide an appropriate search result in accordance with the user's intention to purchase the product / service.

本発明に係るウエブ上の商品・サービス検索システムは、ウエブサイトが提供するコンテンツの中に各国の通貨記号の前又は後に整数を伴う文字列がある場合には、それに相当する商品・サービスの提供があることに着目して開発されたものである。すなわち、ウエブページ上のコンテンツに通貨記号の前後に整数を伴っている文字列が含まれている場合には、このような文字列は価格を表しているので、そのページを提供しているウエブサイトがEコマースモール又はオークションモールである可能性が極めて高いことに着目したものである。   The product / service search system on the web according to the present invention provides a product / service corresponding to the content provided by the website if there is a character string with an integer before or after the currency symbol of each country. It was developed focusing on the fact that there is. That is, if the content on the web page contains a character string with integers before and after the currency symbol, such a character string represents the price, so the web page providing the page is displayed. This is because the possibility that the site is an e-commerce mall or an auction mall is extremely high.

そして、本発明は、このような価格文字列(連続する通貨記号及び整数)を含むウエブページを検索し、該ページから価格に対応する商品・サービス名を検索し、商品・サービス名及びその価格を、それぞれのページへのリンクが貼られた該ページのURLとともに、ユーザが検索しやすい状態で提供するものである。
なお、以下の説明においては、有償で提供される「商品」及び「サービス」を代表して、「商品」と称することにする。また、通貨記号の前又は後に整数を伴っている文字列を、「価格文字列」と称することにする。
Then, the present invention searches for a web page including such price character strings (continuous currency symbols and integers), searches for a product / service name corresponding to the price from the page, and searches for the product / service name and its price. Are provided in a state where the user can easily search, together with the URL of the page to which the link to each page is attached.
In the following description, “product” and “service” provided for a fee will be referred to as “product”. A character string accompanied by an integer before or after a currency symbol is referred to as a “price character string”.

図1は、本発明に係るウエブ上の商品・サービス検索システム(以下、単に「検索システム」)の基本的構成を示している。図1において、10は検索システムを提供する検索サービスサイト、20はインターネットである。検索サービスサイト10は、ロボット1、ウエブ情報データベース(DB)2、価格文字列検索エンジン3、価格文字列含有ページDB4、キーワード検索エンジン5、商品販売ページDB6、インデックス検索エンジン7、インデックスDB8、ユーザ検索サービスエンジン9を備えている。   FIG. 1 shows a basic configuration of a product / service search system on the web (hereinafter simply referred to as “search system”) according to the present invention. In FIG. 1, 10 is a search service site that provides a search system, and 20 is the Internet. The search service site 10 includes a robot 1, a web information database (DB) 2, a price character string search engine 3, a price character string containing page DB 4, a keyword search engine 5, a product sales page DB 6, an index search engine 7, an index DB 8, and a user. A search service engine 9 is provided.

図1に示した検索システムにおいて、ロボット1は、インターネット20上を探索すなわち泳ぎ回り、インターネット20上の新規ページ及び更新ページを検索する。該ロボットの検索により得られたページ全体のソースコードは、ウエブ情報DB2に蓄積される。当然ながら、本検索システムの立ち上げ持には、ウエブ上の全てのページが新規ページとなり、ロボット1の探索により得られたページのソースコードが準じページ情報DB2に格納される。
そして、価格文字列検索エンジン3は、ウエブ情報DB2に新規に蓄積された又は更新されたページのソースコードを全文検索して、価格文字列を含んだページのみのソースコードを抽出する。抽出されたページのソースコードは、価格文字列含有ページDB4に記憶される。例えば、図2に示すようなソースコードのページでは、「¥6,930」が価格文字列であるとして検索されるので、このページのソースコードが、価格文字列含有ページDB4に格納される。
なお、ロボット1に価格文字列検索機能を持たせてもよく、この場合には、ウエブ情報DB2が不要となる。
In the search system shown in FIG. 1, the robot 1 searches the Internet 20, swims, and searches for new pages and updated pages on the Internet 20. The source code of the entire page obtained by the robot search is stored in the web information DB 2. Of course, when the search system is started up, all pages on the web become new pages, and the source code of the page obtained by the search of the robot 1 is stored in the page information DB 2 according to the search.
Then, the price character string search engine 3 searches the source code of the page newly stored or updated in the web information DB 2 and extracts the source code of only the page including the price character string. The source code of the extracted page is stored in the price character string containing page DB4. For example, in the page of the source code as shown in FIG. 2, “¥ 6,930” is searched as a price character string, so the source code of this page is stored in the price character string containing page DB4.
The robot 1 may be provided with a price character string search function. In this case, the web information DB 2 is not necessary.

次いで、キーワード検索エンジン5は、価格文字列含有ページDB4に記憶されたページのソースコードを、キーワードを用いて全文検索することにより、商品購入意志を表している購入意志ページ(例えば、逆オークション用のページ)を判別する。そのためのキーワードとして、例えば、「求む」、「欲しい」、及び「いかが」等の商品購入の意志を表す用語が用いられ、これら用語のいずれかを含んでいるページが検索される。このようなキーワード検索により抽出された購入意志ページのソースコードは削除され、残りのページのソースコードが、商品販売ページDB6に格納される。その結果、商品販売ページDB6に蓄積されたページは、そのほとんどがEコマース及びオークションに直接的に関連するページとなる。   Next, the keyword search engine 5 searches the source code of the page stored in the price character string-containing page DB 4 using a keyword for a full-text search, thereby indicating a purchase intention page (for example, a reverse auction). Page). As a keyword for that purpose, for example, terms indicating the intention of purchasing a product such as “Want”, “Want”, and “Ikaga” are used, and a page including any of these terms is searched. The source code of the purchase intention page extracted by such keyword search is deleted, and the source codes of the remaining pages are stored in the product sales page DB 6. As a result, most of the pages stored in the product sales page DB 6 are directly related to e-commerce and auction.

キーワード検索エンジン5はさらに、商品販売ページDB6に記憶されたページがEコマース用であるか又はオークション用であるかを識別する。この識別のために、「現在の価格」等のオークションを連想させるキーワードがページに含まれているかどうか、若しくは、「auction」又は「auctions」がURLに含まれているかどうかを判定し、この判定が肯定である場合に、オークション用ページであると決定する。そして、商品販売ページDB6に格納された該当するページに、販売形態がオークションであることを示すマークをつける。マークが付けられていないページは、Eコマース用となる。   The keyword search engine 5 further identifies whether the page stored in the product sales page DB 6 is for e-commerce or auction. For this identification, it is determined whether or not a keyword associated with an auction such as “current price” is included in the page, or whether “auction” or “auctions” is included in the URL. If is affirmative, it is determined to be an auction page. And the mark which shows that a sales form is an auction is attached to the applicable page stored in merchandise sales page DB6. Pages that are not marked are for e-commerce.

なお、購入意志ページのソースコードを、Eコマース及びオークション用ページとは別のデータベースに記憶して、Eコマース及びオークション用ページのコンテンツに、購入意志ページのコンテンツとマッチングしているものがあるかどうかを判定し、マッチングしているページが存在する場合に、それを双方のページのプロバイダに通知するように構成してもよい。
また、商品販売ページDB6を格別に設けずに、価格文字列含有ページDB4内のページに対応させてフラグを付加することにより、商品販売ページであることを示してもよい。
Whether the source code of the purchase intention page is stored in a database separate from the e-commerce and auction pages, and the contents of the e-commerce and auction pages match the contents of the purchase will page It may be configured to determine whether there is a matching page and notify the provider of both pages when there is a matching page.
In addition, the product sales page DB6 may not be specially provided, and a flag may be added corresponding to the page in the price character string containing page DB4 to indicate the product sales page.

インデックス検索エンジン7は、このようにして抽出され商品販売ページDB6に記憶されたEコマース及びオークション用ページのソースコードを解析して、それぞれのページから、「商品名」、「金額」に対応する情報を抽出し、これら情報と当該ページのURLとをインデックス情報として、インデックスDB8に記憶する。インデックスDB8にも、オークション用であるかEコマース用であるかの販売形態が記憶される。
例えば、図2の例においては、インデックス情報は、以下の通りである。
商品名:オレンジキーボード
金額:¥6930
URL:http://store.orange.com
販売形態:Eコマース
The index search engine 7 analyzes the source code of the e-commerce and auction pages extracted and stored in the product sales page DB 6 in this way, and corresponds to “product name” and “amount” from each page. Information is extracted, and these information and the URL of the page are stored in the index DB 8 as index information. The index DB 8 also stores a sales form as to whether it is for auction or e-commerce.
For example, in the example of FIG. 2, the index information is as follows.
Product Name: Orange Keyboard Amount: ¥ 6930
URL: http://store.orange.com
Sales form: E-commerce

本発明の検索システムにおいては、このようにして、「価格文字列」を含みかつ「商品購入意志用語」を含んでいないページを検索して、Eコマース又はオークション用のページであると推定する。そして、そのページのURL、商品名及びその金額をインデックスとして抽出することにより、インデックスDB8を構築する。   In this way, the search system of the present invention searches for a page that includes a “price character string” and does not include a “product purchase intention term”, and presumes that the page is for E-commerce or auction. Then, the index DB 8 is constructed by extracting the URL of the page, the product name, and the amount of money as an index.

ユーザ検索サービスエンジン9は、インデックスDB8に蓄積されたインデックス情報を、ユーザが検索しやすい形態でウエブ上に提供する機能を有している。そのため、ウエブ上でユーザに対して、例えば図3の(A)に示すようなユーザ検索入力ページを提供する。ユーザ検索入力ページには、例えば、「商品名」、「金額」、「販売方法」、及び「支払い方法」の入力欄が設けられる。「販売方法」の入力欄は、Eコマースであるかオークションであるかの販売形態を入力するためのものである。   The user search service engine 9 has a function of providing index information stored in the index DB 8 on the web in a form that is easy for a user to search. Therefore, for example, a user search input page as shown in FIG. 3A is provided to the user on the web. In the user search input page, for example, input fields for “product name”, “amount”, “sales method”, and “payment method” are provided. The “Sales method” input field is for inputting a sales form, which is E-commerce or auction.

ユーザが、ユーザ検索入力ページ上で所定の検索キー/クエリを入力すると、ユーザ検索サービスエンジン9は、検索アルゴリズムにしたがってインデックスDB8を検索し、これら検索キー/クエリに対する指定された表示方法で検索結果を表示する。例えば、ユーザが、商品名の欄に「オレンジキーボード」を入力し、かつ、金額の欄に「¥6800」〜「¥7300」を入力すると、ユーザ検索サービスエンジン9は、入力された条件に合致する情報をインデックスDB8から検索し、図3の(B)に示すような商品情報表示ページを提供する。図3の(B)の例では、価格の低い方から順に、オレンジキーボードの販売店をリストアップしている。ユーザ検索入力ページ上で金額が入力されなかった場合には、商品情報ページには、入力された商品名「オレンジキーボード」を販売している販売店のすべてが、適宜の順番でその商品価格とともに表示される。対応するURLも表示してもよい。   When the user inputs a predetermined search key / query on the user search input page, the user search service engine 9 searches the index DB 8 according to the search algorithm, and the search result is displayed in the designated display method for these search keys / queries. Is displayed. For example, when the user inputs “Orange Keyboard” in the product name column and “¥ 6800” to “¥ 7300” in the amount column, the user search service engine 9 matches the input conditions. Information to be searched is retrieved from the index DB 8, and a product information display page as shown in FIG. 3B is provided. In the example of FIG. 3B, orange keyboard dealers are listed in order from the lowest price. If the amount is not entered on the user search input page, the merchandise information page will show all the stores selling the entered product name “Orange Keyboard” along with the product price in the appropriate order. Is displayed. The corresponding URL may also be displayed.

なお、図3の(A)のユーザ検索入力ページにおける「販売方法」及び「支払い方法」は、プルダウンメニューから適宜1つを選択する形式である。プルダウンメニューとして、販売方法には、通常の販売方法及びオークションが含まれ、支払い方法には、クレジットカード払い、商品引き換え、及び振り込み等が含まれる。
「販売方法」及び「支払い方法」の入力欄は必ずしも設ける必要が無い。また、これら入力欄を設けた場合でも、これら入力欄へのユーザ入力がなくても商品情報表示ページに検索結果を表示するよう構成されている。
Note that “sales method” and “payment method” in the user search input page of FIG. 3A are in a form in which one is appropriately selected from the pull-down menu. As a pull-down menu, the sales method includes a normal sales method and an auction, and the payment method includes credit card payment, merchandise exchange, transfer, and the like.
It is not always necessary to provide input fields for “sales method” and “payment method”. Even when these input fields are provided, the search result is displayed on the product information display page without any user input in these input fields.

商品情報表示ページ上の販売店及び価格の組には、それぞれ該販売店のURLへのリンクが張られており、ユーザが、例えば、最も低価格のオレンジハウスの組を選択すると、オレンジハウスのオレンジキーボードの販売ページにセッションが切り替わる。これにより、ユーザは、当該販売ページ上でオレンジキーボードの詳細な情報を入手し、そして購入を決定した場合には、その購入手続をウエブページ上で行うことができる。   Each store and price group on the product information display page has a link to the URL of the store. For example, when the user selects the lowest price orange house group, The session switches to the orange keyboard sales page. As a result, the user can obtain detailed information on the orange keyboard on the sales page and, when the purchase is decided, can perform the purchase procedure on the web page.

なお、価格文字列検索エンジン3及びキーワード検索エンジン5によって、商品販売ページのみを抽出使用としているが、これら検索エンジンによっても、抽出ページに商品販売ページ以外のページが含まれてしまうことがある。このような可能性が極めて低いと考えられるが、非商品販売ページであることが明白になった時点で、当該ページに対応するインデックス情報をインデックスDB8から適宜削除すればよい。   Note that only the product sales page is extracted and used by the price character string search engine 3 and the keyword search engine 5, but even with these search engines, pages other than the product sales page may be included in the extracted page. Although it is considered that such a possibility is very low, when it becomes clear that the page is a non-commodity sales page, the index information corresponding to the page may be appropriately deleted from the index DB 8.

上記においては、ロボットがウエブ上を泳ぎ回ってウエブ上のページのソースコードを取得し、その中から、価格文字列検索エンジンが価格文字列を含んでいるページを抽出する例、及び、ロボットが価格文字列検索機能を備えていることによって、ロボットが価格文字列を含んでいるページのみを取得する例について説明した。
これらの例において、ウエブ上のページがXMLで生成されている場合には、該ページには価格を示す定義タグ<retail price>が含まれているので、前者の例の価格文字列検索エンジンの機能、及び後者の例のロボットの価格文字列検索機能は、価格定義タグを含んだページを検出する機能に置き換えられる。
In the above example, the robot swims around the web to acquire the source code of the page on the web, and the price string search engine extracts the page containing the price string from the example, and the robot The example in which the robot acquires only the page including the price character string by providing the price character string search function has been described.
In these examples, if a page on the web is generated in XML, the page includes a definition tag <retail indicating the price. Since price> is included, the function of the price string search engine in the former example and the price string search function of the robot in the latter example are replaced with a function of detecting a page including a price definition tag.

本発明に係る検索システムの構成を表すブロック図である。It is a block diagram showing the structure of the search system which concerns on this invention. 本発明に係る検索システムの動作を説明するための説明図である。It is explanatory drawing for demonstrating operation | movement of the search system which concerns on this invention. 本発明に係る検索システムが提供するユーザ検索入力ページ及び検索結果表示ページを例示する説明図である。It is explanatory drawing which illustrates the user search input page and search result display page which the search system which concerns on this invention provides.

Claims (6)

ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットと、
取得されたそれぞれのページのソースコードを検索することにより、価格を含んでいるページのみを抽出する価格含有ページ検索手段と、
抽出されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページへのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システム。
In the search system for goods and services offered on the web for a fee,
A robot that searches the web and obtains the source code of the page on the web;
A price-containing page search means for extracting only pages containing prices by searching the source code of each acquired page;
Index search means for extracting the product name or service name and price from the extracted page as an index, and storing the extracted product name or service name and price in the database in association with the URL to the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or A search system comprising search result providing means for providing a service name and its price in a state where a link to the corresponding page is pasted.
ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットであって、それぞれのページのソースコードを検索することにより、価格を含んでいるページのみを取得する価格含有ページ検索手段を備えているロボットと、
取得されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システム。
In the search system for goods and services offered on the web for a fee,
A robot that searches the web and obtains the source code of the page on the web, and includes a price-containing page search unit that acquires only the page including the price by searching the source code of each page. Robot
Index search means for extracting the product name or service name and price as an index from the acquired page, and storing the extracted product name or service name and price in the database in association with the URL of the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or A search system comprising search result providing means for providing a service name and its price in a state where a link to the corresponding page is pasted.
請求項1又は2記載の検索システムにおいて、価格含有ページ検索手段は、通貨記号の前又は後に整数が配置されている価格文字列を含んでいるページのみを抽出するよう構成されていることを特徴とする検索システム。 3. The search system according to claim 1, wherein the price-containing page search means is configured to extract only a page including a price character string in which an integer is arranged before or after a currency symbol. Search system. 請求項1〜3いずれかに記載の検索システムにおいて、ウエブ上のページがXMLで作成されている場合、価格含有ページ検索手段は、価格を表す定義タグを含んでいるページのみを抽出するよう構成されていることを特徴とする検索システム。 4. The search system according to claim 1, wherein, when a page on the web is created in XML, the price-containing page search means is configured to extract only a page including a definition tag representing a price. Search system characterized by being. 請求項1〜4いずれかに記載の検索システムにおいて、
該システムはさらに、価格含有ページ検索手段により取得されたページから、購買意志を表す用語を含んだページを削除する購買意志ページ削除手段を備え、
インデックス検索手段は、購買意志ページ削除手段によって削除されなかったページから、商品名又はサービス名及び価格をインデックスとして抽出するよう構成されている
ことを特徴とする検索システム。
The search system according to any one of claims 1 to 4,
The system further comprises purchase intention page deletion means for deleting a page including a term indicating purchase intention from the page acquired by the price-containing page search means,
The index search means is configured to extract a product name or a service name and a price as an index from a page that has not been deleted by the purchase will page deletion means.
請求項1〜5いずれかに記載の検索システムにおいて、該システムはさらに、キーワード検索手段を備え、該キーワード検索手段は、
価格含有ページ検索手段によって抽出されたページから、キーワード検索により、商品購入の意志を表している購入意志ページを検索し削除して、商品販売ページを抽出する手段と、
抽出された商品販売ページを、キーワード検索により、Eコマース用ページとオークション用ページとに分別する手段と
を備え、インデックス検索手段が、商品販売ページのみからインデックスを抽出するよう構成されていることを特徴とする検索システム。

The search system according to any one of claims 1 to 5, wherein the system further includes a keyword search unit, and the keyword search unit includes:
A means for searching for and deleting a purchase intention page representing the intention of purchasing a product by a keyword search from the pages extracted by the price-containing page search means, and extracting a product sales page;
A means for separating the extracted product sales page into an e-commerce page and an auction page by keyword search, and the index search means is configured to extract an index only from the product sales page. Feature search system.

JP2004204961A 2004-07-12 2004-07-12 System for retrieving merchandise/service on web Pending JP2006031108A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004204961A JP2006031108A (en) 2004-07-12 2004-07-12 System for retrieving merchandise/service on web
PCT/JP2005/007163 WO2006006287A1 (en) 2004-07-12 2005-04-13 System for searching for commodity/service on web

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004204961A JP2006031108A (en) 2004-07-12 2004-07-12 System for retrieving merchandise/service on web

Publications (1)

Publication Number Publication Date
JP2006031108A true JP2006031108A (en) 2006-02-02

Family

ID=35783648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004204961A Pending JP2006031108A (en) 2004-07-12 2004-07-12 System for retrieving merchandise/service on web

Country Status (2)

Country Link
JP (1) JP2006031108A (en)
WO (1) WO2006006287A1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241993A (en) * 2006-02-08 2007-09-20 Mieko Tsuyusaki Information update system and information acquisition system
JP2008123423A (en) * 2006-11-15 2008-05-29 Hitachi Ltd Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data
JP2011008428A (en) * 2009-06-24 2011-01-13 Fujitsu Ltd Price investigation method and information processor for shopping site
JP2014500541A (en) * 2010-11-01 2014-01-09 アリババ・グループ・ホールディング・リミテッド Search method, apparatus and server for online trading platform

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405371C (en) * 2006-07-25 2008-07-23 北京搜狗科技发展有限公司 Method and system for abstracting new word
CN103186618B (en) * 2011-12-30 2016-06-29 北京新媒传信科技有限公司 The acquisition methods of just data and device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3597370B2 (en) * 1998-03-10 2004-12-08 富士通株式会社 Document processing device and recording medium
KR100283103B1 (en) * 1998-12-01 2001-05-02 정선종 Method and system of automatic indexing of product information in online store
JP2002133290A (en) * 2000-10-20 2002-05-10 Matsushita Electric Works Ltd Method for supporting electronic commercial transaction and system for supporting electronic commercial transaction
JP4579443B2 (en) * 2001-04-19 2010-11-10 正 五井野 Product search method, product search device, and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241993A (en) * 2006-02-08 2007-09-20 Mieko Tsuyusaki Information update system and information acquisition system
JP2008123423A (en) * 2006-11-15 2008-05-29 Hitachi Ltd Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data
JP2011008428A (en) * 2009-06-24 2011-01-13 Fujitsu Ltd Price investigation method and information processor for shopping site
JP2014500541A (en) * 2010-11-01 2014-01-09 アリババ・グループ・ホールディング・リミテッド Search method, apparatus and server for online trading platform
JP2016131045A (en) * 2010-11-01 2016-07-21 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Search method, apparatus and server for online trading platform

Also Published As

Publication number Publication date
WO2006006287A1 (en) 2006-01-19

Similar Documents

Publication Publication Date Title
US6611814B1 (en) System and method for using virtual wish lists for assisting shopping over computer networks
JP5480389B2 (en) Specialized for dynamic search suggestions and classification
KR100834360B1 (en) Adaptive catalog page display
US7406437B2 (en) System and method for directing customers to product locations within a store
US8793239B2 (en) Method and system for form-filling crawl and associating rich keywords
JP5241903B2 (en) Review text output system, review text output method, program, and computer-readable information storage medium
CN105164710A (en) Entity bidding
KR20100128321A (en) Advertisement display method, advertisement display system, and advertisement display program
JP2007286701A (en) Electronic shopping mall system and computer device for electronic shopping mall system
WO2006006287A1 (en) System for searching for commodity/service on web
JP2002007450A (en) Retrieval support system
JP2008210209A (en) Content registration and retrieval system, and content registration and retrieval method
JP5749876B1 (en) Information processing apparatus, information processing method, program, and storage medium
JP5596101B2 (en) Product search support server, product search support method, product search support program, and computer-readable recording medium storing the program
KR101043267B1 (en) Electronic commerce system and method therefor
US20020046094A1 (en) Method and system for delivering electronic advertisement via network
JP2002133290A (en) Method for supporting electronic commercial transaction and system for supporting electronic commercial transaction
WO2017033265A1 (en) Information processing device, information processing method, and information processing program
JP2005222154A (en) Information distribution system
JP2010176444A (en) System, apparatus, method and program for processing information
JP4773379B2 (en) Event search system, event search device, event search result output method and program
KR20010078839A (en) GSINET(Global Shoppingmall Integration Network Technology)
JP2002269451A (en) Net commodity retrieval system
JP2003058776A (en) Information processing method and information processing system
Rowley Shopping bots: intelligent shopper or virtual department store?