JP2006031108A - System for retrieving merchandise/service on web - Google Patents
System for retrieving merchandise/service on web Download PDFInfo
- Publication number
- JP2006031108A JP2006031108A JP2004204961A JP2004204961A JP2006031108A JP 2006031108 A JP2006031108 A JP 2006031108A JP 2004204961 A JP2004204961 A JP 2004204961A JP 2004204961 A JP2004204961 A JP 2004204961A JP 2006031108 A JP2006031108 A JP 2006031108A
- Authority
- JP
- Japan
- Prior art keywords
- page
- search
- price
- web
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 6
- 238000000034 method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、ウエブ上の商品・サービス検索システムに関し、特に、ユーザに有償で提供される商品及びサービスをウエブ上で検索するシステムに関する。 The present invention relates to a product / service search system on the web, and more particularly to a system for searching for products and services provided for a fee to users on the web.
今日、ウエブ上で種々のコンテンツが提供されており、そのコンテンツの中には、ユーザに有償で提供される商品及びサービスが含まれている。ウエブ上のEコマース又はオークション用のページにアクセスすることにより、ユーザは、商品・サービスの詳細な情報を入手しているが、ある統計によれば、このようなウエブページへのアクセスの動機として、約70〜80%が、商品・サービスをすでに入手した友人等から、その商品・サービスの情報及びウエブサイトのURL等を得たことであり、他は、ユーザ自らのウエブページのサーフィングによるものである。 Today, various contents are provided on the web, and the contents include goods and services provided for a fee to users. By accessing a page for e-commerce or auction on the web, the user obtains detailed information on goods and services. According to some statistics, the motivation for accessing such a web page is as follows. About 70-80% obtained information on the product / service, URL of the website, etc. from a friend who had already obtained the product / service, etc. Is.
このように、ユーザ自らのウエブページへのアクセスが少ないことの一因として、ユーザが購入したい商品・サービスの情報を簡単かつ適切に検索できる検索システムが未だ提案されていない点を挙げることができる。
例えば、代表的な検索サイトであっても、ユーザが付帯的な商品名を検索キー/クエリとして入力しても、入力キーに相当するすべてのページの情報が表示され、商品・サービスの販売及びオークションのためのページのみを、ユーザに提供することができない。
したがって、ユーザが、自分が購入したい商品・サービスを販売する意志がある販売店等のウエブページを、簡単に訪問することができれば、ウエブ上のEコマース及びオークションがより活発になると考えられる。
本発明は、このような状況に鑑みてなされたものであり、その目的は、ユーザが、有償で提供される商品・サービスの情報をウエブ上で簡単に検索し、かつ商品・サービスを有償で提供するサイトを簡単に訪問することができるようにするための商品・サービス検索システムを提供することである。
As described above, one of the reasons for the low access to the user's own web page is that a search system that can easily and appropriately search for information on products and services that the user wants to purchase has not been proposed yet. .
For example, even if it is a representative search site, even if a user inputs an incidental product name as a search key / query, information on all pages corresponding to the input key is displayed, and sales of products and services and Only a page for auction cannot be provided to the user.
Therefore, if a user can easily visit a web page of a store or the like that intends to sell a product / service that he / she wants to purchase, it is considered that e-commerce and auction on the web will become more active.
The present invention has been made in view of such a situation, and an object of the present invention is to enable a user to easily search for information on goods and services provided for a fee on the web and to pay for the goods and services for a fee. The object of the present invention is to provide a product / service search system that makes it possible to easily visit a site to be provided.
上記した目的を達成するために、第1の観点の本発明は、ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットと、
取得されたそれぞれのページのソースコードを検索することにより、価格を含んでいるページのみを抽出する価格含有ページ検索手段と、
抽出されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページへのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システムを提供する。
In order to achieve the above object, the first aspect of the present invention provides a product / service search system provided for a fee on the web.
A robot that searches the web and obtains the source code of the page on the web;
A price-containing page search means for extracting only pages containing prices by searching the source code of each acquired page;
Index search means for extracting the product name or service name and price from the extracted page as an index, and storing the extracted product name or service name and price in the database in association with the URL to the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or There is provided a search system characterized by comprising search result providing means for providing a service name and its price in a state where a link to a corresponding page is pasted.
上記した目的を達成するために、第2の観点の本発明は、ウエブ上で有償で提供されている商品・サービスの検索システムにおいて、
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットであって、それぞれのページのソースコードを検索することにより、価格を含んでいるページのみを取得する価格含有ページ検索手段を備えているロボットと、
取得されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システムを提供する。
In order to achieve the above object, the second aspect of the present invention provides a product / service search system provided for a fee on the web.
A robot that searches the web and obtains the source code of the page on the web, and includes a price-containing page search unit that acquires only the page including the price by searching the source code of each page. Robot
Index search means for extracting the product name or service name and price as an index from the acquired page, and storing the extracted product name or service name and price in the database in association with the URL of the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or There is provided a search system characterized by comprising search result providing means for providing a service name and its price in a state where a link to a corresponding page is pasted.
上記した第1及び第2の観点の本発明に係る検索システムにおいて、価格含有ページ検索手段は、通貨記号の前又は後に整数が配置されている価格文字列を含んでいるページのみを抽出するよう構成されていることが好ましい。
また、ウエブ上のページがXMLで作成されている場合、価格含有ページ検索手段は、価格を表す定義タグを含んでいるページのみを抽出するよう構成されていることが好ましい。
さらに、検索システムはさらに、価格含有ページ検索手段により取得されたページから、購買意志を表す用語を含んだページを削除する購買意志ページ削除手段を備え、インデックス検索手段は、購買意志ページ削除手段によって削除されなかったページから、商品名又はサービス名及び価格をインデックスとして抽出するよう構成されていることが好ましい。
さらにまた、検索システムはさらに、価格含有ページ検索手段によって抽出されたページから、キーワード検索により、商品購入の意志を表している購入意志ページを検索し削除して、商品販売ページを抽出する手段と、抽出された商品販売ページを、キーワード検索により、Eコマース用ページとオークション用ページとに分別する手段とからなるキーワード検索手段を備え、インデックス検索手段が、商品販売ページのみからインデックスを抽出するよう構成されていることが好ましい。
In the above-described search system according to the first and second aspects of the present invention, the price-containing page search means extracts only pages including a price character string in which an integer is arranged before or after a currency symbol. It is preferable to be configured.
In addition, when a page on the web is created in XML, it is preferable that the price-containing page search means is configured to extract only a page including a definition tag representing a price.
Further, the search system further includes a purchase intention page deletion unit that deletes a page including a term indicating purchase intention from the page acquired by the price-containing page search unit, and the index search unit includes the purchase intention page deletion unit. It is preferable that a product name or a service name and a price are extracted as an index from a page that has not been deleted.
Furthermore, the search system further includes a means for extracting a product sales page by searching for and deleting a purchase intention page representing a product purchase intention by a keyword search from the page extracted by the price-containing page search means. And a keyword search means comprising means for separating the extracted product sales page into an e-commerce page and an auction page by keyword search, and the index search means extracts the index only from the product sales page. It is preferable to be configured.
本発明は、上記したように構成され、全世界で普遍的に用いられている価格に特化したキーワードでページを検索しデータベース化し、かつ該ページ上の商品名・サービス名及び価格をインデックス化するので、従来例に対比して、サーバに対する負荷が飛躍的に軽減される。また、ロボット自体への負荷が少なく、従来例に対比して新規ページや更新ページを発見するのに要する時間が大幅に短縮される。
さらに、ユーザに対して、商品・サービスの販売ページ及びオークションページのみを提供することができるので、ユーザの商品・サービス購入の意図に沿った適切な検索結果を提供することができる。
The present invention is configured as described above, searches a page with a keyword specializing in a price universally used in the world, creates a database, and indexes product names, service names and prices on the page. Therefore, the load on the server is drastically reduced as compared with the conventional example. Further, the load on the robot itself is small, and the time required to find a new page or an updated page is significantly shortened as compared with the conventional example.
Furthermore, since only the product / service sales page and auction page can be provided to the user, it is possible to provide an appropriate search result in accordance with the user's intention to purchase the product / service.
本発明に係るウエブ上の商品・サービス検索システムは、ウエブサイトが提供するコンテンツの中に各国の通貨記号の前又は後に整数を伴う文字列がある場合には、それに相当する商品・サービスの提供があることに着目して開発されたものである。すなわち、ウエブページ上のコンテンツに通貨記号の前後に整数を伴っている文字列が含まれている場合には、このような文字列は価格を表しているので、そのページを提供しているウエブサイトがEコマースモール又はオークションモールである可能性が極めて高いことに着目したものである。 The product / service search system on the web according to the present invention provides a product / service corresponding to the content provided by the website if there is a character string with an integer before or after the currency symbol of each country. It was developed focusing on the fact that there is. That is, if the content on the web page contains a character string with integers before and after the currency symbol, such a character string represents the price, so the web page providing the page is displayed. This is because the possibility that the site is an e-commerce mall or an auction mall is extremely high.
そして、本発明は、このような価格文字列(連続する通貨記号及び整数)を含むウエブページを検索し、該ページから価格に対応する商品・サービス名を検索し、商品・サービス名及びその価格を、それぞれのページへのリンクが貼られた該ページのURLとともに、ユーザが検索しやすい状態で提供するものである。
なお、以下の説明においては、有償で提供される「商品」及び「サービス」を代表して、「商品」と称することにする。また、通貨記号の前又は後に整数を伴っている文字列を、「価格文字列」と称することにする。
Then, the present invention searches for a web page including such price character strings (continuous currency symbols and integers), searches for a product / service name corresponding to the price from the page, and searches for the product / service name and its price. Are provided in a state where the user can easily search, together with the URL of the page to which the link to each page is attached.
In the following description, “product” and “service” provided for a fee will be referred to as “product”. A character string accompanied by an integer before or after a currency symbol is referred to as a “price character string”.
図1は、本発明に係るウエブ上の商品・サービス検索システム(以下、単に「検索システム」)の基本的構成を示している。図1において、10は検索システムを提供する検索サービスサイト、20はインターネットである。検索サービスサイト10は、ロボット1、ウエブ情報データベース(DB)2、価格文字列検索エンジン3、価格文字列含有ページDB4、キーワード検索エンジン5、商品販売ページDB6、インデックス検索エンジン7、インデックスDB8、ユーザ検索サービスエンジン9を備えている。
FIG. 1 shows a basic configuration of a product / service search system on the web (hereinafter simply referred to as “search system”) according to the present invention. In FIG. 1, 10 is a search service site that provides a search system, and 20 is the Internet. The search service site 10 includes a robot 1, a web information database (DB) 2, a price character string search engine 3, a price character string containing
図1に示した検索システムにおいて、ロボット1は、インターネット20上を探索すなわち泳ぎ回り、インターネット20上の新規ページ及び更新ページを検索する。該ロボットの検索により得られたページ全体のソースコードは、ウエブ情報DB2に蓄積される。当然ながら、本検索システムの立ち上げ持には、ウエブ上の全てのページが新規ページとなり、ロボット1の探索により得られたページのソースコードが準じページ情報DB2に格納される。
そして、価格文字列検索エンジン3は、ウエブ情報DB2に新規に蓄積された又は更新されたページのソースコードを全文検索して、価格文字列を含んだページのみのソースコードを抽出する。抽出されたページのソースコードは、価格文字列含有ページDB4に記憶される。例えば、図2に示すようなソースコードのページでは、「¥6,930」が価格文字列であるとして検索されるので、このページのソースコードが、価格文字列含有ページDB4に格納される。
なお、ロボット1に価格文字列検索機能を持たせてもよく、この場合には、ウエブ情報DB2が不要となる。
In the search system shown in FIG. 1, the robot 1 searches the Internet 20, swims, and searches for new pages and updated pages on the Internet 20. The source code of the entire page obtained by the robot search is stored in the
Then, the price character string search engine 3 searches the source code of the page newly stored or updated in the
The robot 1 may be provided with a price character string search function. In this case, the
次いで、キーワード検索エンジン5は、価格文字列含有ページDB4に記憶されたページのソースコードを、キーワードを用いて全文検索することにより、商品購入意志を表している購入意志ページ(例えば、逆オークション用のページ)を判別する。そのためのキーワードとして、例えば、「求む」、「欲しい」、及び「いかが」等の商品購入の意志を表す用語が用いられ、これら用語のいずれかを含んでいるページが検索される。このようなキーワード検索により抽出された購入意志ページのソースコードは削除され、残りのページのソースコードが、商品販売ページDB6に格納される。その結果、商品販売ページDB6に蓄積されたページは、そのほとんどがEコマース及びオークションに直接的に関連するページとなる。
Next, the keyword search engine 5 searches the source code of the page stored in the price character string-containing
キーワード検索エンジン5はさらに、商品販売ページDB6に記憶されたページがEコマース用であるか又はオークション用であるかを識別する。この識別のために、「現在の価格」等のオークションを連想させるキーワードがページに含まれているかどうか、若しくは、「auction」又は「auctions」がURLに含まれているかどうかを判定し、この判定が肯定である場合に、オークション用ページであると決定する。そして、商品販売ページDB6に格納された該当するページに、販売形態がオークションであることを示すマークをつける。マークが付けられていないページは、Eコマース用となる。 The keyword search engine 5 further identifies whether the page stored in the product sales page DB 6 is for e-commerce or auction. For this identification, it is determined whether or not a keyword associated with an auction such as “current price” is included in the page, or whether “auction” or “auctions” is included in the URL. If is affirmative, it is determined to be an auction page. And the mark which shows that a sales form is an auction is attached to the applicable page stored in merchandise sales page DB6. Pages that are not marked are for e-commerce.
なお、購入意志ページのソースコードを、Eコマース及びオークション用ページとは別のデータベースに記憶して、Eコマース及びオークション用ページのコンテンツに、購入意志ページのコンテンツとマッチングしているものがあるかどうかを判定し、マッチングしているページが存在する場合に、それを双方のページのプロバイダに通知するように構成してもよい。
また、商品販売ページDB6を格別に設けずに、価格文字列含有ページDB4内のページに対応させてフラグを付加することにより、商品販売ページであることを示してもよい。
Whether the source code of the purchase intention page is stored in a database separate from the e-commerce and auction pages, and the contents of the e-commerce and auction pages match the contents of the purchase will page It may be configured to determine whether there is a matching page and notify the provider of both pages when there is a matching page.
In addition, the product sales page DB6 may not be specially provided, and a flag may be added corresponding to the page in the price character string containing page DB4 to indicate the product sales page.
インデックス検索エンジン7は、このようにして抽出され商品販売ページDB6に記憶されたEコマース及びオークション用ページのソースコードを解析して、それぞれのページから、「商品名」、「金額」に対応する情報を抽出し、これら情報と当該ページのURLとをインデックス情報として、インデックスDB8に記憶する。インデックスDB8にも、オークション用であるかEコマース用であるかの販売形態が記憶される。
例えば、図2の例においては、インデックス情報は、以下の通りである。
商品名:オレンジキーボード
金額:¥6930
URL:http://store.orange.com
販売形態:Eコマース
The index search engine 7 analyzes the source code of the e-commerce and auction pages extracted and stored in the product sales page DB 6 in this way, and corresponds to “product name” and “amount” from each page. Information is extracted, and these information and the URL of the page are stored in the
For example, in the example of FIG. 2, the index information is as follows.
Product Name: Orange Keyboard Amount: ¥ 6930
URL: http://store.orange.com
Sales form: E-commerce
本発明の検索システムにおいては、このようにして、「価格文字列」を含みかつ「商品購入意志用語」を含んでいないページを検索して、Eコマース又はオークション用のページであると推定する。そして、そのページのURL、商品名及びその金額をインデックスとして抽出することにより、インデックスDB8を構築する。
In this way, the search system of the present invention searches for a page that includes a “price character string” and does not include a “product purchase intention term”, and presumes that the page is for E-commerce or auction. Then, the
ユーザ検索サービスエンジン9は、インデックスDB8に蓄積されたインデックス情報を、ユーザが検索しやすい形態でウエブ上に提供する機能を有している。そのため、ウエブ上でユーザに対して、例えば図3の(A)に示すようなユーザ検索入力ページを提供する。ユーザ検索入力ページには、例えば、「商品名」、「金額」、「販売方法」、及び「支払い方法」の入力欄が設けられる。「販売方法」の入力欄は、Eコマースであるかオークションであるかの販売形態を入力するためのものである。
The user search service engine 9 has a function of providing index information stored in the
ユーザが、ユーザ検索入力ページ上で所定の検索キー/クエリを入力すると、ユーザ検索サービスエンジン9は、検索アルゴリズムにしたがってインデックスDB8を検索し、これら検索キー/クエリに対する指定された表示方法で検索結果を表示する。例えば、ユーザが、商品名の欄に「オレンジキーボード」を入力し、かつ、金額の欄に「¥6800」〜「¥7300」を入力すると、ユーザ検索サービスエンジン9は、入力された条件に合致する情報をインデックスDB8から検索し、図3の(B)に示すような商品情報表示ページを提供する。図3の(B)の例では、価格の低い方から順に、オレンジキーボードの販売店をリストアップしている。ユーザ検索入力ページ上で金額が入力されなかった場合には、商品情報ページには、入力された商品名「オレンジキーボード」を販売している販売店のすべてが、適宜の順番でその商品価格とともに表示される。対応するURLも表示してもよい。
When the user inputs a predetermined search key / query on the user search input page, the user search service engine 9 searches the
なお、図3の(A)のユーザ検索入力ページにおける「販売方法」及び「支払い方法」は、プルダウンメニューから適宜1つを選択する形式である。プルダウンメニューとして、販売方法には、通常の販売方法及びオークションが含まれ、支払い方法には、クレジットカード払い、商品引き換え、及び振り込み等が含まれる。
「販売方法」及び「支払い方法」の入力欄は必ずしも設ける必要が無い。また、これら入力欄を設けた場合でも、これら入力欄へのユーザ入力がなくても商品情報表示ページに検索結果を表示するよう構成されている。
Note that “sales method” and “payment method” in the user search input page of FIG. 3A are in a form in which one is appropriately selected from the pull-down menu. As a pull-down menu, the sales method includes a normal sales method and an auction, and the payment method includes credit card payment, merchandise exchange, transfer, and the like.
It is not always necessary to provide input fields for “sales method” and “payment method”. Even when these input fields are provided, the search result is displayed on the product information display page without any user input in these input fields.
商品情報表示ページ上の販売店及び価格の組には、それぞれ該販売店のURLへのリンクが張られており、ユーザが、例えば、最も低価格のオレンジハウスの組を選択すると、オレンジハウスのオレンジキーボードの販売ページにセッションが切り替わる。これにより、ユーザは、当該販売ページ上でオレンジキーボードの詳細な情報を入手し、そして購入を決定した場合には、その購入手続をウエブページ上で行うことができる。 Each store and price group on the product information display page has a link to the URL of the store. For example, when the user selects the lowest price orange house group, The session switches to the orange keyboard sales page. As a result, the user can obtain detailed information on the orange keyboard on the sales page and, when the purchase is decided, can perform the purchase procedure on the web page.
なお、価格文字列検索エンジン3及びキーワード検索エンジン5によって、商品販売ページのみを抽出使用としているが、これら検索エンジンによっても、抽出ページに商品販売ページ以外のページが含まれてしまうことがある。このような可能性が極めて低いと考えられるが、非商品販売ページであることが明白になった時点で、当該ページに対応するインデックス情報をインデックスDB8から適宜削除すればよい。
Note that only the product sales page is extracted and used by the price character string search engine 3 and the keyword search engine 5, but even with these search engines, pages other than the product sales page may be included in the extracted page. Although it is considered that such a possibility is very low, when it becomes clear that the page is a non-commodity sales page, the index information corresponding to the page may be appropriately deleted from the
上記においては、ロボットがウエブ上を泳ぎ回ってウエブ上のページのソースコードを取得し、その中から、価格文字列検索エンジンが価格文字列を含んでいるページを抽出する例、及び、ロボットが価格文字列検索機能を備えていることによって、ロボットが価格文字列を含んでいるページのみを取得する例について説明した。
これらの例において、ウエブ上のページがXMLで生成されている場合には、該ページには価格を示す定義タグ<retail price>が含まれているので、前者の例の価格文字列検索エンジンの機能、及び後者の例のロボットの価格文字列検索機能は、価格定義タグを含んだページを検出する機能に置き換えられる。
In the above example, the robot swims around the web to acquire the source code of the page on the web, and the price string search engine extracts the page containing the price string from the example, and the robot The example in which the robot acquires only the page including the price character string by providing the price character string search function has been described.
In these examples, if a page on the web is generated in XML, the page includes a definition tag <retail indicating the price. Since price> is included, the function of the price string search engine in the former example and the price string search function of the robot in the latter example are replaced with a function of detecting a page including a price definition tag.
Claims (6)
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットと、
取得されたそれぞれのページのソースコードを検索することにより、価格を含んでいるページのみを抽出する価格含有ページ検索手段と、
抽出されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページへのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システム。 In the search system for goods and services offered on the web for a fee,
A robot that searches the web and obtains the source code of the page on the web;
A price-containing page search means for extracting only pages containing prices by searching the source code of each acquired page;
Index search means for extracting the product name or service name and price from the extracted page as an index, and storing the extracted product name or service name and price in the database in association with the URL to the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or A search system comprising search result providing means for providing a service name and its price in a state where a link to the corresponding page is pasted.
ウエブ上を探索してウエブ上のページのソースコードを取得するロボットであって、それぞれのページのソースコードを検索することにより、価格を含んでいるページのみを取得する価格含有ページ検索手段を備えているロボットと、
取得されたページから、商品名又はサービス名及び価格をインデックスとして抽出し、抽出された商品名又はサービス名及び価格を、当該ページのURLに対応付けてデータベースに記憶させるインデックス検索手段と、
ウエブ上に検索ページを提供する手段と、
検索ページ上で入力された情報に対応して、商品名又はサービス名、その価格、及びURLをデータベースから読み出し、かつ、検索ページ上で情報を入力した端末上に、読み出された商品名又はサービス名及びその価格を、該当ページへのリンクが貼られた状態で提供する検索結果提供手段と
からなることを特徴とする検索システム。 In the search system for goods and services offered on the web for a fee,
A robot that searches the web and obtains the source code of the page on the web, and includes a price-containing page search unit that acquires only the page including the price by searching the source code of each page. Robot
Index search means for extracting the product name or service name and price as an index from the acquired page, and storing the extracted product name or service name and price in the database in association with the URL of the page;
Means for providing a search page on the web;
Corresponding to the information entered on the search page, the product name or service name, its price, and URL are read from the database, and on the terminal where the information is entered on the search page, the read product name or A search system comprising search result providing means for providing a service name and its price in a state where a link to the corresponding page is pasted.
該システムはさらに、価格含有ページ検索手段により取得されたページから、購買意志を表す用語を含んだページを削除する購買意志ページ削除手段を備え、
インデックス検索手段は、購買意志ページ削除手段によって削除されなかったページから、商品名又はサービス名及び価格をインデックスとして抽出するよう構成されている
ことを特徴とする検索システム。 The search system according to any one of claims 1 to 4,
The system further comprises purchase intention page deletion means for deleting a page including a term indicating purchase intention from the page acquired by the price-containing page search means,
The index search means is configured to extract a product name or a service name and a price as an index from a page that has not been deleted by the purchase will page deletion means.
価格含有ページ検索手段によって抽出されたページから、キーワード検索により、商品購入の意志を表している購入意志ページを検索し削除して、商品販売ページを抽出する手段と、
抽出された商品販売ページを、キーワード検索により、Eコマース用ページとオークション用ページとに分別する手段と
を備え、インデックス検索手段が、商品販売ページのみからインデックスを抽出するよう構成されていることを特徴とする検索システム。
The search system according to any one of claims 1 to 5, wherein the system further includes a keyword search unit, and the keyword search unit includes:
A means for searching for and deleting a purchase intention page representing the intention of purchasing a product by a keyword search from the pages extracted by the price-containing page search means, and extracting a product sales page;
A means for separating the extracted product sales page into an e-commerce page and an auction page by keyword search, and the index search means is configured to extract an index only from the product sales page. Feature search system.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004204961A JP2006031108A (en) | 2004-07-12 | 2004-07-12 | System for retrieving merchandise/service on web |
PCT/JP2005/007163 WO2006006287A1 (en) | 2004-07-12 | 2005-04-13 | System for searching for commodity/service on web |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004204961A JP2006031108A (en) | 2004-07-12 | 2004-07-12 | System for retrieving merchandise/service on web |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006031108A true JP2006031108A (en) | 2006-02-02 |
Family
ID=35783648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004204961A Pending JP2006031108A (en) | 2004-07-12 | 2004-07-12 | System for retrieving merchandise/service on web |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2006031108A (en) |
WO (1) | WO2006006287A1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007241993A (en) * | 2006-02-08 | 2007-09-20 | Mieko Tsuyusaki | Information update system and information acquisition system |
JP2008123423A (en) * | 2006-11-15 | 2008-05-29 | Hitachi Ltd | Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data |
JP2011008428A (en) * | 2009-06-24 | 2011-01-13 | Fujitsu Ltd | Price investigation method and information processor for shopping site |
JP2014500541A (en) * | 2010-11-01 | 2014-01-09 | アリババ・グループ・ホールディング・リミテッド | Search method, apparatus and server for online trading platform |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100405371C (en) * | 2006-07-25 | 2008-07-23 | 北京搜狗科技发展有限公司 | Method and system for abstracting new word |
CN103186618B (en) * | 2011-12-30 | 2016-06-29 | 北京新媒传信科技有限公司 | The acquisition methods of just data and device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3597370B2 (en) * | 1998-03-10 | 2004-12-08 | 富士通株式会社 | Document processing device and recording medium |
KR100283103B1 (en) * | 1998-12-01 | 2001-05-02 | 정선종 | Method and system of automatic indexing of product information in online store |
JP2002133290A (en) * | 2000-10-20 | 2002-05-10 | Matsushita Electric Works Ltd | Method for supporting electronic commercial transaction and system for supporting electronic commercial transaction |
JP4579443B2 (en) * | 2001-04-19 | 2010-11-10 | 正 五井野 | Product search method, product search device, and program |
-
2004
- 2004-07-12 JP JP2004204961A patent/JP2006031108A/en active Pending
-
2005
- 2005-04-13 WO PCT/JP2005/007163 patent/WO2006006287A1/en active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007241993A (en) * | 2006-02-08 | 2007-09-20 | Mieko Tsuyusaki | Information update system and information acquisition system |
JP2008123423A (en) * | 2006-11-15 | 2008-05-29 | Hitachi Ltd | Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data |
JP2011008428A (en) * | 2009-06-24 | 2011-01-13 | Fujitsu Ltd | Price investigation method and information processor for shopping site |
JP2014500541A (en) * | 2010-11-01 | 2014-01-09 | アリババ・グループ・ホールディング・リミテッド | Search method, apparatus and server for online trading platform |
JP2016131045A (en) * | 2010-11-01 | 2016-07-21 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Search method, apparatus and server for online trading platform |
Also Published As
Publication number | Publication date |
---|---|
WO2006006287A1 (en) | 2006-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6611814B1 (en) | System and method for using virtual wish lists for assisting shopping over computer networks | |
JP5480389B2 (en) | Specialized for dynamic search suggestions and classification | |
KR100834360B1 (en) | Adaptive catalog page display | |
US7406437B2 (en) | System and method for directing customers to product locations within a store | |
US8793239B2 (en) | Method and system for form-filling crawl and associating rich keywords | |
JP5241903B2 (en) | Review text output system, review text output method, program, and computer-readable information storage medium | |
CN105164710A (en) | Entity bidding | |
KR20100128321A (en) | Advertisement display method, advertisement display system, and advertisement display program | |
JP2007286701A (en) | Electronic shopping mall system and computer device for electronic shopping mall system | |
WO2006006287A1 (en) | System for searching for commodity/service on web | |
JP2002007450A (en) | Retrieval support system | |
JP2008210209A (en) | Content registration and retrieval system, and content registration and retrieval method | |
JP5749876B1 (en) | Information processing apparatus, information processing method, program, and storage medium | |
JP5596101B2 (en) | Product search support server, product search support method, product search support program, and computer-readable recording medium storing the program | |
KR101043267B1 (en) | Electronic commerce system and method therefor | |
US20020046094A1 (en) | Method and system for delivering electronic advertisement via network | |
JP2002133290A (en) | Method for supporting electronic commercial transaction and system for supporting electronic commercial transaction | |
WO2017033265A1 (en) | Information processing device, information processing method, and information processing program | |
JP2005222154A (en) | Information distribution system | |
JP2010176444A (en) | System, apparatus, method and program for processing information | |
JP4773379B2 (en) | Event search system, event search device, event search result output method and program | |
KR20010078839A (en) | GSINET(Global Shoppingmall Integration Network Technology) | |
JP2002269451A (en) | Net commodity retrieval system | |
JP2003058776A (en) | Information processing method and information processing system | |
Rowley | Shopping bots: intelligent shopper or virtual department store? |