KR19990031784A - Natural Language Query Processing Method for E-Commerce Product Information Retrieval - Google Patents

Natural Language Query Processing Method for E-Commerce Product Information Retrieval Download PDF

Info

Publication number
KR19990031784A
KR19990031784A KR1019970052617A KR19970052617A KR19990031784A KR 19990031784 A KR19990031784 A KR 19990031784A KR 1019970052617 A KR1019970052617 A KR 1019970052617A KR 19970052617 A KR19970052617 A KR 19970052617A KR 19990031784 A KR19990031784 A KR 19990031784A
Authority
KR
South Korea
Prior art keywords
product
query
term
natural language
search
Prior art date
Application number
KR1019970052617A
Other languages
Korean (ko)
Other versions
KR100289065B1 (en
Inventor
김중배
함호상
강대기
손주찬
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019970052617A priority Critical patent/KR100289065B1/en
Publication of KR19990031784A publication Critical patent/KR19990031784A/en
Application granted granted Critical
Publication of KR100289065B1 publication Critical patent/KR100289065B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Abstract

본 발명은 전자상거래 상품정보 검색용 자연언어 질의어 처리방법에 관한 것으로서, 사용자의 웹브라우저와 전자상거래정보 서비스 시스템내의 웹서버를 통하여 전달된 자연언어 질의어를 추출하고 토큰을 분리하며, 상품 가격을 나타내는 구간명시형, 구간추략형, 최소최대형의 용어가 존재하는지 조사하여 존재할 경우 기억장소 배열에 저장한 후 해당 토큰을 제거하고, 각 토큰에서 조사를 제거한 후 불용어 토큰을 제거하는 검색대상 용어 추출단계와, 추출된 각각의 용어에 대하여 전자상거래정보 서비스 용어 테이블을 검색하여 각 용어의 특성을 파악하고, 제조회사명, 상품분류명, 상품명, 주요사양에 대하여 동의어/유사어/외래어를 확장한 후, 질의어에 대한 정규식을 생성하는 단계와, 생성된 정규식을 관계형데이터베이스관리시스템의 질의어인 구조적 질의어로 변환하여, 전자상거래정보 서비스 상품 테이블을 검색하여 제조회사명, 상품분류명, 상품명, 주요사양, 모델번호, 가격, 문서위치와 같은 7가지 상품정보를 가져오고, 문서위치로부터 홈페이지 문서위치를 추출하여 검색결과에 덮붙인 후 HTML 문서를 동적 생성하여 웹서버를 통하여 사용자에게 제공하는 검색결과 생성단계로 구성함으로써, 자연언어 질의어에 대한 정확한 상품정보 추출 및 빠른 처리시간을 통하여 고품질의 검색서비스를 제공하는 효과가 있다.The present invention relates to a natural language query processing method for e-commerce product information retrieval, extracting a natural language query transmitted through a user's web browser and a web server in an e-commerce information service system, separating tokens, and indicating a product price. Searching for the term of section description, section summary type and minimum maximum type, and if it exists, store it in the storage array and remove the corresponding token, remove the investigation from each token, and then remove the stopword token. Then, search the e-commerce information service term table for each extracted term to grasp the characteristics of each term, expand synonyms / similar words / foreign words for manufacturer name, product classification name, product name, and main specifications, and then Generating a regular expression for the relational database management system; Converted into a structured query word, retrieves the product table of the e-commerce information service, and retrieves 7 kinds of product information such as the manufacturer name, product classification name, product name, main specification, model number, price, and document location, and the homepage document from the document location. After extracting the location and covering it to the search result, the HTML document is dynamically generated and provided to the user through the web server. The search result is generated. It is effective to provide services.

Description

전자상거래 상품정보 검색용 자연언어 질의어 처리방법Natural Language Query Processing Method for E-Commerce Product Information Retrieval

본 발명은 전자상거래(Electronic Commerce)에서 상품을 구입하고자 하는 구매자가 자연언어 질의어로 자신이 원하는 상품정보에 대한 검색을 요청하면, 이를 관계형데이터베이스(Relational DataBase, 이하 RDB라 칭함)에서 추출하여 제공하는 방법에 관한 것이다.According to the present invention, when a purchaser who wants to purchase a product in an electronic commerce request a search for product information desired by a natural language query, it is extracted and provided from a relational database (hereinafter referred to as RDB). It is about a method.

종래에는 이 분야의 검색서비스가 인터넷 월드와이드웹(Internet World-Wide -Web)상에서 이루어지므로 자연언어 질의어에 대한 검색서비스를 수행할 경우, 자연언어 질의어에 대한 구문 분석의 복잡성으로 인하여 검색속도의 저하가 수반되므로 자연언어 질의어에 의한 검색서비스를 수행하지 못하고, ‘하이퍼텍스트 형성 언어(Hyper Text Markup Language, 이하 HTML라 칭함) 양식 태그(Form Tag)’에 검색하고자 하는 상품정보를 일일이 구분하여 입력하는 방식을 사용해 왔다.In the past, since the search service of this field is performed on the Internet World Web, when the search service for the natural language query is performed, the search speed is reduced due to the complexity of parsing the natural language query. Is not able to perform a search service using a natural language query, and inputs the product information to be searched separately in the 'Hyper Text Markup Language' (form HTML) form tag. Method has been used.

따라서 사용자 인터페이스가 자연스럽지 않으므로 사용의 불편을 초래하여, 일반 국민이 널리 손쉽게 사용하기가 어려운 문제점이 있었다.Therefore, the user interface is not natural, causing inconvenience in use, and it is difficult for the general public to easily use it.

상기 문제점을 해결하기 위해 본 발명은, 사용자가 자연언어를 이용하여 원하는 상품에 대한 검색을 요청하면, 신속 정확하게 제공할 수 있도록 자연언어 질의어에서 상품정보 검색용어를 추출하여 관계형데이터베이스 관리시스템(Relational DataBase Management System, 이하 RDBMS라 칭함)의 질의어인 구조적질의어(Structured Query Language, 이하 SQL라 칭함)로 변환하여 가는 방법을 제공하는 것을 목적을 한다.In order to solve the above problems, the present invention, when a user requests a search for a desired product using a natural language, a relational database management system by extracting a product information search term from a natural language query language so that it can be provided quickly and accurately. An object of the present invention is to provide a method of converting a structured query language (hereinafter referred to as SQL) that is a query word of a management system (hereinafter referred to as RDBMS).

도 1은 본 발명에 따른 전자상거래정보 서비스 시스템의 전체 구성도,1 is an overall configuration diagram of an electronic commerce information service system according to the present invention;

도 2는 본 발명이 적용되는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법의 처리 흐름도.Figure 2 is a flow chart of a natural language query processing method for e-commerce product information search to which the present invention is applied.

<도면의 주요부분에 대한 부호의 설명><Description of Symbols for Main Parts of Drawings>

10 : 구매자 웹브라우저 20 : 판매자 웹브라우저10: Buyer web browser 20: Seller web browser

30 : 머천트 시스템 40 : 웹서버30: Merchant System 40: Web Server

50 : 고성능 웹-데이터베이스 게이트웨이 응용서버50: high performance web-database gateway application server

51 : 전자상거래정보 검색 시스템51: Electronic Commerce Information Search System

52 : 전자상거래정보 디렉토리관리 시스템52: Electronic Commerce Information Directory Management System

53 : 전자상거래정보 색인 시스템53: e-commerce information indexing system

60 : 관계형데이터베이스 관리시스템60: relational database management system

70 : 전자상거래정보 데이터베이스 80 : 검색대상 용어 추출기70: e-commerce information database 80: search term extractor

90 : 질의어 정규식 생성기 91 : 용어 데이터베이스90: query regular expression generator 91: term database

92 : 동의어 데이터베이스 100 : 검색결과 생성기92: Synonym Database 100: Search Result Generator

101 : 상품 데이터베이스101: commodity database

상기 목적을 달성하기 위해 본 발명은, 검색대상 용어를 추출하고, 추출된 각각의 용어의 질의어에 대한 정규식을 생성하며, 생성된 정규식을 관계형데이터베이스관리시스템(RDBMS)의 질의어인 구조적질의어(SQL)로 변환하여 검색결과를 생성하는 것을 특징으로 한다.In order to achieve the above object, the present invention extracts a search target term, generates a regular expression for a query of each extracted term, and uses the generated regular expression as a structural query (SQL) that is a query word of a relational database management system (RDBMS). It is characterized by generating a search result by converting to.

이하 첨부된 도면을 참조하여 본 발명을 상세히 설명하면 다음과 같다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 전자상거래정보 서비스 시스템의 전체 구성도로서, 구매자 웹브라우저(10), 판매자 웹브라우저(20), 머천트 시스템(30), 웹서버(40), 전자상거래정보 검색시스템(51), 전자상거래정보 디렉토리관리 시스템(52), 전자상거래정보 색인 시스템(53)의 3부분으로 구성된 고성능 웹-데이터베이스 게이트웨이 응용서버(50), 관계형데이터베이스 관리시스템(60), 전자상거래정보 데이터베이스(70)으로 이루어져 있다.1 is an overall configuration diagram of an e-commerce information service system according to the present invention, a buyer web browser 10, a seller web browser 20, a merchant system 30, a web server 40, an e-commerce information search system ( 51), a high performance web-database gateway application server 50 consisting of three parts of the e-commerce information directory management system 52 and the e-commerce information indexing system 53, the relational database management system 60, and the e-commerce information database ( 70).

상기 도 1은 인터넷 가상상점(Internet virtual stores)을 통하여 상품을 구입하고자 하는 구매자는 자신이 구입하고자 하는 상품의 정보를 웹브라우저(10)를 이용하여 자연언어 질의어로 요청하면, 전자상거래정보 서비스 시스템내의 웹서버인 하이퍼텍스트 전송 프로토콜 데몬(HyperText Transfer Protocol Daemon, 이하 HTTPd라 칭함)(40)의 빠른 공통 게이트웨이 인터페이스(Fast Common Gateway Interface, 이하 FastCGI라 칭함)를 통하여 전자상거래정보 검색시스템(51)에 전달되고, SQL로 변환되어, 관계형데이터베이스 관리시스템(RDBMS)(60)에 전달 되면 전자상거래정보 데이터베이스(70)에서 해당 상품정보를 추출하여, 다시 전자상거래정보 검색시스템(51)에게 전달되어 검색결과를 HTML 문서로 동적변환하여 HTTPd(40)을 통하여 구매자의 웹브라우저(10)에 전달된다.1 is a purchaser who wants to purchase a product through an Internet virtual store, and requests information of a product he / she wants to purchase using a natural language query using a web browser 10, an e-commerce information service system. Through the fast common gateway interface (hereinafter referred to as FastCGI) of the hypertext transfer protocol daemon (hereinafter referred to as HTTPd) 40, which is a web server within the web server, the e-commerce information retrieval system 51 When delivered, converted to SQL, and delivered to the relational database management system (RDBMS) 60, the product information is extracted from the e-commerce information database 70, and then passed back to the e-commerce information search system 51 to search results Is converted into an HTML document and transmitted to the buyer's web browser 10 through the HTTPd 40.

인터넷 가상상점을 구축하여 상품을 팔고자 하는 판매자는 자신의 웹브라우저(20)를 이용하여 홈페이지(Home Page) 문서위치(Uniform Resource Locator, 이하 URL라 칭함)와 판매자 정보를 입력하면, HTTPd(40)의 FastCGI를 통하여 전자상거래정보 디렉토리관리시스템(52)에 전달되고 판매자 인증절차를 통과하면 SQL이 생성되어, RDBMS(60)에 전달되고 전자상거래정보 데이터베이스(70)에 판매자의 디렉토리가 등록되어 다시 등록정보가 전자상거래정보 디렉토리관리시스템(60)에게 전달되어 등록결과를 HTML 문서로 동적변환하여 HTTPd(40)을 통하여 판매자의 웹브라우저(20)에게 전달된다.A seller who wants to sell a product by building an internet virtual store enters a home page document location (hereinafter referred to as a URL) and seller information using his web browser 20, and then uses HTTPd (40). After passing through the FastCGI to the e-commerce information directory management system 52 and passing the seller authentication process, SQL is generated, passed to the RDBMS 60, and the seller's directory is registered in the e-commerce information database 70 and again. The registration information is transmitted to the electronic commerce information directory management system 60, and the registration result is dynamically converted into an HTML document and transmitted to the web browser 20 of the seller through the HTTPd 40.

전자상거래정보 데이터베이스(70)에 등록된 가상상점은 전자상거래정보 색인시스템(53)내의 색인용 웹에이전트에 의하여 주기적으로 HTTPd(40)을 통하여 판매자의 머천트시스템(Merchant System)(30)으로 가서 상품정보가 있는 HTML 문서를 찾아서 다시 HTTPd(40)을 통하여 전자상거래정보 색인시스템(53)에 모아지면 상품정보 색인기에 의하여 상품정보를 추출하여 이에 대한 SQL이 생성되어 RDBMS(60)에 전달되면 전자상거래정보 데이터베이스(70)에 해당 상품정보를 등록한다.The virtual store registered in the e-commerce information database 70 goes to the merchant's merchant system 30 through the HTTPd 40 periodically by the indexing web agent in the e-commerce information indexing system 53. When the HTML document with information is found and collected again in the e-commerce information indexing system 53 through the HTTPd 40, the product information is extracted by the product information indexer, and the SQL for this is generated and transmitted to the RDBMS 60. The product information is registered in the information database 70.

다음 표 1, 표 2, 표 3은 전자상거래 상품정보 검색용 자연언어 질의어 처리방법에서 이용되는 데이터베이스의 구성도이다.Table 1, Table 2, and Table 3 show the configuration of the database used in the natural language query processing method for e-commerce product information search.

사용자의 자연언어 질의어로부터 상품정보 검색용 SQL를 생성하는 과정에서 사용되는 데이터베이스는 표 1의 전자상거래정보 서비스 용어 테이블, 표 2의 전자상거래정보 서비스 동의어 테이블, 그리고 표 3의 전자상거래정보 서비스 상품정보 테이블로 구성된다.The database used in the process of generating SQL for product information retrieval from the user's natural language query language includes the e-commerce information service term table of Table 1, the e-commerce information service synonym table of Table 2, and the e-commerce information service product information of Table 3 It consists of a table.

상기 용어 테이블과 동의어 테이블은 전자상거래정보 색인시스템(53)과 전자상거래정보 서비스 시스템 관리자인 사람의 협동에 의하여 데이터베이스가 구축되며, 상품정보 테이블은 전자상거래정보 색인시스템(53)에 의하여 자동으로 구축된다.The term table and the synonym table are constructed by the cooperation of the e-commerce information indexing system 53 and the person who is the e-commerce information service system administrator, and the product information table is automatically constructed by the e-commerce information indexing system 53. do.

상기 용어 테이블은 용어, 통제필드, 그리고 등록일자를 나타내는 필드로 구성되며, 동의어 테이블은 대표용어, 동의어, 그리고 등록일자로 구성되며, 상품정보 테이블은 제조회사명, 상품분류명, 주요사양, 상품명, 모델번호, 가격, 문서 위치, 그리고 등록일자로 구성된다.The term table consists of terms, control fields, and fields indicating registration dates. The synonyms table consists of representative terms, synonyms, and registration dates. The product information table includes the manufacturer's name, product classification name, main specifications, product name, and model number. , Price, document location, and date of registration.

전자상거래정보 서비스 용어 테이블E-commerce information service term table 필드(컬럼) 명칭Field (column) name 필드(컬럼) 사양Field (Column) Specifications 용어(TERM)Terminology (TERM) variable Charactervariable Character 통제필드(CFIELD)Control Field (CFIELD) Variable CharacterVariable Character 등록일자(RDATE)Registration date (RDATE) DATEDATE

전자상거래정보 서비스 동의어 테이블E-Commerce Information Service Synonyms Table 필드(컬럼) 명칭Field (column) name 필드(컬럼) 사양Field (Column) Specifications 대표용어(RTERM)Representative term (RTERM) Variable CharacterVariable Character 동의어(SYNONYM)Synonyms (SYNONYM) Variable CharacterVariable Character 등록일자(RDATE)Registration date (RDATE) DATEDATE

전자상거래정보 서비스 상품정보 테이블E-commerce information service product information table 필드(컬럼) 명칭Field (column) name 필드(컬럼) 사양Field (Column) Specifications 제조회사명(CIC)Manufacturer Name (CIC) Variable CharacterVariable Character 상품분류명(PCC)Product Classification Name (PCC) Variable CharacterVariable Character 상품명(BN)Brand name (BN) Variable CharacterVariable Character 주요사양(CFC)Main Specifications (CFC) Variable CharacterVariable Character 모델번호(MN)Model Number (MN) Variable CharacterVariable Character 가격(PRICE)PRICE IntegerInteger 문서위치(URL)Document location (URL) Variable CharacterVariable Character 등록일자(RDATE)Registration date (RDATE) DATEDATE

도 2는 본 발명이 적용되는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법의 처리 흐름도로서, 인터넷 가상상점(Virtual Stores)을 통하여 상품을 구입하고자 하는 구매자가 자신이 구입하고자 하는 상품의 정보를 웹브라우저(10)를 이용하여 자연언어 질의어로 검색을 요청하면(S1), 전자상거래정보 서비스 시스템내의 웹서버인 HTTPd(40)를 거쳐서(S2) 사용자 자연언어 질의어 추출기에 의하여 질의어가 추출되어(S3) 기억장소 배열에 저장된다.2 is a flowchart of a natural language query processing method for e-commerce product information retrieval to which the present invention is applied, and a buyer who wants to purchase a product through an Internet virtual store stores the information of a product he / she wants to purchase. When the user requests a search using the natural language query using the browser 10 (S1), the query is extracted by the user natural language query extractor through the HTTPd 40 which is a web server in the e-commerce information service system (S2). ) Is stored in the storage array.

저장된 자연언어 질의어는 질의어 토큰(Token) 분리기에 의하여 공백, 쉼표, 마침표, 그리고 기호 등의 여러 가지 조건들을 절단기호(Delimitors)로 하여 토큰이 분리된다(S4).The stored natural language query words are separated by a query token separator using various conditions such as spaces, commas, periods, and symbols as delimiters (S4).

분리된 토큰에서 상품가격을 나타내는 용어가 존재하는지 조사하여 존재할 경우 기억장소 배열에 저장한 후 해당 토큰을 제거하며(S5), 각 토큰에서 조사가 제거된 후(S6) 불용어 토큰이 제거된다(S7).Investigate whether there is a term representing commodity prices in the separated tokens, if any, store them in a storage array and remove the corresponding tokens (S5), and after the investigation is removed from each token (S6), stopwords are removed (S7). ).

본 발명에서 처리대상으로 하는 상품가격을 나타내는 용어는 한 예를 들어 '50만원에서 100만원 사이'인 구간명시형, '100만원대'인 구간추략형, '가장 싼 것'인 최소최대형의 3가지이다.In the present invention, the term indicating the commodity price to be processed is, for example, a section specification type of 'between 500,000 won and 1 million won', a section tracking type of '1 million won', and a 'smallest' 3 It is eggplant.

이상의 처리절차가 완료되면 최초의 사용자 자연언어 질의어로부터 검색대상이 되는 용어가 추출된 것이다(80).When the above processing is completed, the search term is extracted from the first user's natural language query (80).

본 발명에서 처리대상으로 하는 질의어에 관한 상품정보는 제조회사명(Company Identification Code, 이하 CIC라 칭함), 상품분류명(Product Classification Code, 이하 PCC라 칭함), 상품명(Brand Name, 이하 BN라 칭함), 주요사양(Chief Function Code, 이하 CFC라 칭함) 그리고 가격(PRICE)이다.The product information on the query subject to be processed in the present invention includes a company name (Company Identification Code, hereinafter referred to as CIC), a product classification code (hereinafter referred to as PCC), a brand name (Brand Name, hereinafter referred to as BN). , Chief function code (CFC) and price (PRICE).

구매자는 상기 5가지 상품정보를 조합하여 일상생활에서 사용하는 언어를 이용하여 검색을 요청한다.The buyer requests the search using the language used in everyday life by combining the five product information.

상기 추출된 각각의 용어에 대하여 삽입구조적질의어(Embedded SQL, 이하 ESQL라 칭함)을 생성하여 전자상거래정보 서비스 용어 테이블(91)을 검색하면 통제필드로부터 각 용어의 특성(CIC, PCC, BN, CFC)을 파악할 수 있다(S8).For each extracted term, an embedded structural query (hereinafter referred to as ESQL) is generated and the E-commerce information service term table 91 is searched for the characteristics of each term (CIC, PCC, BN, CFC) from the control field. ) Can be grasped (S8).

상기 5가지 범주에 속하지 않는 용어는 처리대상에서 제외시키고, 가격을 제외한 4가지 용어에 대하여 ESQL을 생성하여, 전자상거래정보 서비스 동의어 테이블(92)을 검색하면 각각에 대한 동의어/유사어/외래어를 가져올 수 있다(S9).Terms not belonging to the above five categories are excluded from processing, and ESQL is generated for four terms excluding price, and the e-commerce information service synonym table 92 is searched to obtain synonyms, similar words, and foreign words for each. It may be (S9).

한 용어에 대하여 검색된 동의어/유사어/외래어는 그 용어에 대한 한 개의 용어집합으로 처리되며, 질의어에 대한 정규식 생성시에는 고려되지 않는다(S10).A synonym / similar word / foreign word searched for a term is treated as one term set for that term and is not considered when generating a regular expression for the query word (S10).

본 발명에서 생성되는 질의어 정규식은 아래 식 1과 같다.The query regular expression generated in the present invention is shown in Equation 1 below.

((CIC)) * ((PCC)) * ((BN)) * ((CFC)) * (PRICE)) …… 식(1)((CIC)) * ((PCC)) * ((BN)) * ((CFC)) * (PRICE)). … Formula (1)

상기 식 1의 '*'는 논리연산자 AND, '(( ))'는 발생가능개수로서 0개 이상을 나타낸다.'*' In Formula 1 represents a logical operator AND, and '(())' represents zero or more as possible numbers.

한 예를 들어 구매자가 '삼성과 대우의 TV와 냉장고 100만원대를 사고 싶어요'라는 질의어로 검색을 요청하면, 상기 식 1로부터 생성되는 정규식은 다음과 같다.For example, when a buyer requests a search with the query 'I want to buy a TV and a refrigerator 1 million won for Samsung and Daewoo,' the regular expression generated from Equation 1 is as follows.

(삼성) * (TV) * (100만원대)(Samsung) * (TV) * (1 million won)

(삼성) * (냉장고) * (100만원대)(Samsung) * (Refrigerator) * (Million KRW)

(대우) * (TV) * (100만원대)(Daewoo) * (TV) * (1 million won)

(대우) * (냉장고) * (100만원대)(Daewoo) * (Fridge) * (1 million won)

상기 처리 절차가 완료되면 검색대상이 되는 용어로부터 질의어 정규식이 생성된 것이다(90).When the processing procedure is completed, the query regular expression is generated from the term to be searched (90).

다음은 생성된 질의어 정규식으로부터 RDBMS의 질의어인 SQL을 생성하는 것이다(S11).The following is to generate the SQL that is a query of the RDBMS from the generated query regular expression (S11).

이때 생성되는 SQL은 정적(Static) SQL로서, 질의어 정규식으로 생성가능한 모든 경우의 수를 미리 고려하여 단 1번의 수행으로 관련 정보를 모두 가져올 수 있도록 구성되어진 1개의 SQL 문장에 호스트 변수(Host Variable)를 대입하는 방법으로 생성된다.At this time, the generated SQL is static SQL. In consideration of the number of cases that can be generated by the query regular expression, the host variable is included in one SQL statement configured to retrieve all related information in one execution. Is created by substituting

물론 그때그때 생성되는 질의어 정규식에 대응하는 동적(Dynamic) SQL를 생성하여 대응할 수도 있으나, 불특정 다수가 이용하는 인터넷 월드와이드웹상의 검색서비스 환경에서 동적 SQL를 생성하여 검색하는 것은 처리시간이 길어질 뿐만 아니라 RDBMS의 질의어 최적화 기능을 효과적으로 이용하지 못하므로 본 발명에서는 배제시켰다.Of course, it is possible to generate and respond to dynamic SQL corresponding to the query regular expression generated at that time, but generating and searching dynamic SQL in the search service environment on the Internet World Wide Web used by the unspecified majority not only takes a long processing time but also an RDBMS. Since the query optimization function of is not used effectively, it is excluded in the present invention.

생성된 구조적 질의어를 이용하여 전자상거래정보 서비스 상품 테이블(101)을 검색하여 관련 정보를 가져온다(S12).The e-commerce information service product table 101 is searched using the generated structured query word to obtain related information (S12).

본 발명에서 처리대상으로 하는 질의어에 관한 상품정보는 CIC, PCC, BN, CFC 그리고 PRICE이지만, 검색결과로서 구매자에게 제공되는 상품정보는 이 5가지 정보에 덮붙여서 모델번호, 해당 상품을 판매하는 가상상점내의 URL, 그리고 URL로부터 추출한 가상상점의 홈 페이지 URL이 부가적으로 제공된다.The product information on the query subject to be processed in the present invention is CIC, PCC, BN, CFC and PRICE, but the product information provided to the buyer as a search result is superimposed on these five pieces of information to sell the model number and the corresponding product. The URL in the store and the home page URL of the virtual store extracted from the URL are additionally provided.

상기 8가지 정보에 관한 검색결과는 HTML 문서 형태로 동적으로 생성되어(S13), HTTPd(40)을 통하여 구매자의 웹브라우저(10)에 전달된다(S14).The search results for the eight pieces of information are dynamically generated in the form of an HTML document (S13) and transmitted to the buyer's web browser 10 through the HTTPd 40 (S14).

상술한 바와 같이 본 발명은 사용자가 일상적으로 사용하는 자연언어 질의어로 원하는 상품정보를 요청하므로 편리한 사용자 인터페이스를 제공하며, 자연언어 질의어에 대한 정확한 상품정보 추출 및 빠른 처리시간을 통하여 고품질의 검색서비스를 제공하는 효과가 있다.As described above, the present invention provides a convenient user interface because the user requests the desired product information in the natural language query used by the user everyday, and provides a high-quality search service through accurate product information extraction and fast processing time for the natural language query. It is effective to provide.

Claims (4)

전자상거래 상품정보 검색용 자연언어 질의어 처리방법에 있어서,In the natural language query processing method for e-commerce product information search, 검색대상 용어를 추출하는 제 1 과정과;A first process of extracting a search term; 추출된 각각의 용어에 대하여 질의어 정규식을 생성하는 제 2 과정과;Generating a query regular expression for each extracted term; 생성된 정규식을 관계형데이터베이스관리시스템(RDBMS)의 질의어인 구조적질의어(SQL)로 변환하여 검색결과를 생성하는 제 3 과정을 포함하는 것을 특징으로 하는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법.And a third step of converting the generated regular expression into a structural query (SQL), which is a query of a relational database management system (RDBMS), to generate a search result. 제 1 항에 있어서, 상기 제 1 과정은The method of claim 1, wherein the first process is 인터넷 가상상점을 통해 상품을 구입하고자 하는 구매자가 상품의 정보를 웹브라우저를 이용하여 자연언어 질의어로 검색을 요청하는 제 1 단계와;A first step of requesting a purchaser to purchase a product through an internet virtual shop by using a web browser to search information of the product using a natural language query; 자연언어 질의어로 검색을 요청한 후 전자상거래정보 서비스 시스템내의 웹서버를 거쳐 사용자 자연언어 질의어 추출기를 통해 질의어를 추출하여 기억장소 배열에 저장하는 제 2 단계와;A second step of requesting a search using a natural language query and extracting the query word through a user natural language query extractor through a web server in an e-commerce information service system and storing the query in a storage arrangement; 저장된 자연언어 질의어를 질의어 토큰 분리기를 통해 공백, 쉼표, 마침표 및 기호와 같은 여러 조건들을 절단기호로 하여 토큰을 분리시키는 제 3 단계와;A third step of separating the token from the stored natural language query word using various conditions such as spaces, commas, periods, and symbols as cutters; 분리된 토큰에서 상품가격 용어가 존재할 경우 기억장소 배열에 저장한 후 해당 토큰을 제거하고, 각 토큰에서 조사를 제거한 후 불용어 토큰을 제거하는 제 4 단계를 포함하여 구성된 것을 특징으로 하는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법.If there is a commodity price term in the separated token, the e-commerce product information comprising the fourth step of storing the token in the storage array and removing the corresponding token, removing the investigation from each token and removing the stopword token. Natural language query processing method for search. 제 1 항에 있어서, 상기 제 2 과정은The method of claim 1, wherein the second process 전자상거래정보 서비스 용어 테이블을 검색하여 통제필드로부터 각 용어의 특성을 파악하는 제 1 단계와;A first step of retrieving an e-commerce information service term table to identify characteristics of each term from a control field; 상기 각 용어에 대하여 동의어/유사어/외래어를 확장한 후, 질의어에 대한 정규식을 생성하는 제 2 단계를 포함하는 것을 특징으로 하는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법.And expanding a synonym / similar word / foreign word for each term, and generating a regular expression for the query word. 제 1 항에 있어서, 상기 제 3 과정은The method of claim 1, wherein the third process is 생성된 정규식을 RDBMS의 질의어인 SQL로 변환하는 제 1 단계와;A first step of converting the generated regular expression into SQL which is a query word of an RDBMS; 전자상거래정보 서비스 상품 테이블을 검색하여 제조회사명(CIC), 상품분류명(PCC), 상품명(BN), 주요사양(CFC), 모델번호(MN), 가격(PRICE), 문서위치(URL)의 상품정보를 가져오는 제 2 단계와;E-Commerce Information Service Search the product table to find the manufacturer name (CIC), product classification name (PCC), product name (BN), main specifications (CFC), model number (MN), price (PRICE), and document location (URL). A second step of obtaining product information; 상기 URL로부터 홈페이지 URL를 추출하여 검색결과에 덮붙인 후 HTML 문서를 동적 생성하여 웹서버를 통해 사용자에게 제공하는 제 3 단계를 포함하는 것을 특징으로 하는 전자상거래 상품정보 검색용 자연언어 질의어 처리방법.And extracting a homepage URL from the URL, attaching it to a search result, and dynamically generating an HTML document and providing the same to a user through a web server.
KR1019970052617A 1997-10-14 1997-10-14 Method for processing natural query language for searching commodity information of electronic commerce KR100289065B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970052617A KR100289065B1 (en) 1997-10-14 1997-10-14 Method for processing natural query language for searching commodity information of electronic commerce

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970052617A KR100289065B1 (en) 1997-10-14 1997-10-14 Method for processing natural query language for searching commodity information of electronic commerce

Publications (2)

Publication Number Publication Date
KR19990031784A true KR19990031784A (en) 1999-05-06
KR100289065B1 KR100289065B1 (en) 2001-05-02

Family

ID=37517601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970052617A KR100289065B1 (en) 1997-10-14 1997-10-14 Method for processing natural query language for searching commodity information of electronic commerce

Country Status (1)

Country Link
KR (1) KR100289065B1 (en)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990078925A (en) * 1999-08-20 1999-11-05 강준모 Internet Browsing System For Searching with Usual Words
KR20010085071A (en) * 2001-07-30 2001-09-07 이준정 Exchanging method of goods information in electronic commerce on computer network
KR20020030545A (en) * 2000-10-18 2002-04-25 남 데이비드 이 Automatic answer and search method - based on artificial intelligence and natural languane process technology - for natural and sentencial questions.
KR20030026006A (en) * 2001-09-24 2003-03-31 한국신용평가정보주식회사 Product information input and searching method using standard product code
KR20030085314A (en) * 2002-04-30 2003-11-05 (주)메타웨이브 System for providing goods information using Internet and operating method thereof
KR100433584B1 (en) * 2000-12-12 2004-06-04 한국전자통신연구원 Method for product detailed information extraction of internet shopping mall with ontology and wrapper data
KR100490442B1 (en) * 2002-03-16 2005-05-17 삼성에스디에스 주식회사 Apparatus for clustering same and similar product using vector space model and method thereof
KR20050107200A (en) * 2004-05-08 2005-11-11 (주) 맥스무비 Method and apparatus for extracting the information for booking up movie ticket from user query
KR100623628B1 (en) * 2005-05-20 2006-09-19 엔에이치엔(주) Query matching system and method, and computer readable recording medium recording program for implementing the method
WO2006123918A1 (en) * 2005-05-20 2006-11-23 Nhn Corporation Query matching system and method, and computer readable recording medium recording program for implementing the method
KR100709984B1 (en) * 2005-05-20 2007-04-23 엔에이치엔(주) Query matching method and system for outputting results matched to query by processing the query according to various logics
KR100740978B1 (en) * 2004-12-08 2007-07-19 한국전자통신연구원 System and method for processing natural language request
KR100969447B1 (en) * 2004-03-18 2010-07-14 마이크로소프트 코포레이션 Rendering tables with natural language commands
US7949576B2 (en) 2005-05-26 2011-05-24 Nhn Business Platform Corporation Method of providing product database
KR101137056B1 (en) * 2005-06-03 2012-04-20 엔에이치엔비즈니스플랫폼 주식회사 Commodity information registering method and system which uses automatic commodity model suggesting logic
KR20210030808A (en) * 2019-09-10 2021-03-18 한국과학기술정보연구원 Estimating apparatus for market size, and control method thereof

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736903B1 (en) * 2000-07-06 2007-07-10 제이씨비 캄파니 리미티드 Search system for goods
KR20030054958A (en) * 2001-12-26 2003-07-02 (주)오비씨소프트 Method for providing information and apparatus for the same
US7693860B2 (en) 2005-03-18 2010-04-06 Microsoft Corporation Method and system to associate cell and item metadata
US8234293B2 (en) 2005-09-08 2012-07-31 Microsoft Corporation Autocompleting with queries to a database
US7792847B2 (en) 2005-09-09 2010-09-07 Microsoft Corporation Converting structured reports to formulas
US7805433B2 (en) 2005-10-14 2010-09-28 Microsoft Corporation Multidimensional cube functions
KR102289408B1 (en) 2019-09-03 2021-08-12 국민대학교산학협력단 Search device and search method based on hash code

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990078925A (en) * 1999-08-20 1999-11-05 강준모 Internet Browsing System For Searching with Usual Words
KR20020030545A (en) * 2000-10-18 2002-04-25 남 데이비드 이 Automatic answer and search method - based on artificial intelligence and natural languane process technology - for natural and sentencial questions.
KR100433584B1 (en) * 2000-12-12 2004-06-04 한국전자통신연구원 Method for product detailed information extraction of internet shopping mall with ontology and wrapper data
KR20010085071A (en) * 2001-07-30 2001-09-07 이준정 Exchanging method of goods information in electronic commerce on computer network
KR20030026006A (en) * 2001-09-24 2003-03-31 한국신용평가정보주식회사 Product information input and searching method using standard product code
KR100490442B1 (en) * 2002-03-16 2005-05-17 삼성에스디에스 주식회사 Apparatus for clustering same and similar product using vector space model and method thereof
KR20030085314A (en) * 2002-04-30 2003-11-05 (주)메타웨이브 System for providing goods information using Internet and operating method thereof
KR100969447B1 (en) * 2004-03-18 2010-07-14 마이크로소프트 코포레이션 Rendering tables with natural language commands
KR20050107200A (en) * 2004-05-08 2005-11-11 (주) 맥스무비 Method and apparatus for extracting the information for booking up movie ticket from user query
KR100740978B1 (en) * 2004-12-08 2007-07-19 한국전자통신연구원 System and method for processing natural language request
KR100623628B1 (en) * 2005-05-20 2006-09-19 엔에이치엔(주) Query matching system and method, and computer readable recording medium recording program for implementing the method
WO2006123918A1 (en) * 2005-05-20 2006-11-23 Nhn Corporation Query matching system and method, and computer readable recording medium recording program for implementing the method
KR100709984B1 (en) * 2005-05-20 2007-04-23 엔에이치엔(주) Query matching method and system for outputting results matched to query by processing the query according to various logics
US7949576B2 (en) 2005-05-26 2011-05-24 Nhn Business Platform Corporation Method of providing product database
KR101137056B1 (en) * 2005-06-03 2012-04-20 엔에이치엔비즈니스플랫폼 주식회사 Commodity information registering method and system which uses automatic commodity model suggesting logic
KR20210030808A (en) * 2019-09-10 2021-03-18 한국과학기술정보연구원 Estimating apparatus for market size, and control method thereof

Also Published As

Publication number Publication date
KR100289065B1 (en) 2001-05-02

Similar Documents

Publication Publication Date Title
KR100289065B1 (en) Method for processing natural query language for searching commodity information of electronic commerce
US6519585B1 (en) System and method for facilitating presentation of subject categorizations for use in an on-line search query engine
US6772150B1 (en) Search query refinement using related search phrases
KR100699977B1 (en) Method and apparatus for identifying related searches in a database search system
US7996398B2 (en) Identifying related search terms based on search behaviors of users
US6101503A (en) Active markup--a system and method for navigating through text collections
US8014997B2 (en) Method of search content enhancement
JP5396533B2 (en) Information processing apparatus, information processing method, and program for information processing apparatus
US7664767B2 (en) System and method for geographically organizing and classifying businesses on the world-wide web
KR100834360B1 (en) Adaptive catalog page display
US8145619B2 (en) Method and system for identifying companies with specific business objectives
US20020143659A1 (en) Rules-based identification of items represented on web pages
JP2007293896A (en) System and method for refining search queries
EP3563240B1 (en) Systems and methods for harvesting data associated with fraudulent content in a networked environment
JPH09311869A (en) Internet retrieving server
KR100283103B1 (en) Method and system of automatic indexing of product information in online store
KR20030024297A (en) Search system and method
JP2013101416A (en) Retrieval device, retrieval method, and program for retrieval device
JP2008065417A (en) Associative word group retrieval device and system, and content match type advertisement system
KR100960709B1 (en) System and method for providing shoping key word using ontology in key word search system
JP2002207655A (en) Method, program, and system for information integration
US20050060296A1 (en) Search system and method for simultaneous querying and notification of multiple web sales sites
JP2013101415A (en) Commodity web page analyzer, commodity web page analysis method, and program for commodity web page analyzer
KR100673539B1 (en) Search system and method
US20010054015A1 (en) Method for facilitating the exchange of information over a computer network

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090202

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee