KR101647087B1 - Server and method for goods providing based on natural language processing - Google Patents

Server and method for goods providing based on natural language processing Download PDF

Info

Publication number
KR101647087B1
KR101647087B1 KR1020150019616A KR20150019616A KR101647087B1 KR 101647087 B1 KR101647087 B1 KR 101647087B1 KR 1020150019616 A KR1020150019616 A KR 1020150019616A KR 20150019616 A KR20150019616 A KR 20150019616A KR 101647087 B1 KR101647087 B1 KR 101647087B1
Authority
KR
South Korea
Prior art keywords
review
goods
keywords
extracted
goods information
Prior art date
Application number
KR1020150019616A
Other languages
Korean (ko)
Inventor
박대건
고민정
Original Assignee
케이에스비퓨처 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 케이에스비퓨처 주식회사 filed Critical 케이에스비퓨처 주식회사
Priority to KR1020150019616A priority Critical patent/KR101647087B1/en
Application granted granted Critical
Publication of KR101647087B1 publication Critical patent/KR101647087B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • G06F17/20
    • G06F17/2755
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/30Transportation; Communications
    • G06Q50/40

Abstract

The present invention relates to a server and a method for providing goods based on natural language processing, wherein the server for providing goods based on natural language processing analyzes a review on goods, written by a user terminal, based on the natural language processing and provides the goods suitable to a user writing the review. The server for providing goods based on natural language processing includes: a communication module; a memory storing a program providing the goods for the user terminal; and a processor executing the program stored in the memory. The processor receives the review written by the user terminal from one or more review providing servers based on the communication module according to the execution of the program and calculates a score of a keyword extracted based on an emotional quotient and a weight value on the extracted keyword by extracting the keyword included in the review based on a morpheme analyzer. The processor also extracts goods information recommended for the user terminal among one or more pieces of the goods information based on the calculated score of the keyword and transmits the extracted goods information to the user terminal. The weight value is calculated based on term frequency-inverse document frequency, and the emotional quotient is calculated based on polarity information of a sentence including the keyword.

Description

자연어 처리에 기반한 재화 제공 서버 및 방법{SERVER AND METHOD FOR GOODS PROVIDING BASED ON NATURAL LANGUAGE PROCESSING}TECHNICAL FIELD [0001] The present invention relates to a server and a method for providing goods based on natural language processing,

본 발명은 자연어 처리에 기반한 재화 제공 추천 서버 및 방법에 관한 것이다.The present invention relates to a goods provision recommendation server and method based on natural language processing.

추천 서비스(recommendation service)는 과다하게 제공되는 정보나 재화로부터 사용자의 취향이나 관심에 맞는 정보나 재화를 선택적으로 제공하는 서비스를 의미한다. 이러한 추천 서비스는 전자상거래, 인터넷 쇼핑몰 등에 응용되고 있다. A recommendation service is a service that selectively provides information or goods that meet the user's taste or interest from excessively provided information or goods. These recommendation services are applied to electronic commerce, Internet shopping malls, and the like.

추천 서비스는 특정 사용자와 유사한 사용자에 대한 구매 패턴에 기반하여 재화를 추천하거나, 사용자가 구매한 재화와 유사한 구매 패턴의 재화를 추천하는 협력적 여과기반 추천(collaborative filtering based recommendation), 사용자가 구매한 재화의 내용 정보(content information)에 기반하여 재화를 추천하는 내용기반 추천(content based recommendation) 등이 있다. The recommendation service is a collaborative filtering based recommendation that recommends a good based on a purchase pattern for a user similar to a specific user, recommends a good of a purchase pattern similar to a purchased good, And a content based recommendation that recommends a good based on the content information of the good.

내용 기반 추천은 정보 검색(information retrieval) 기법에 기초한 추천 방법으로, 사용자가 구매한 재화의 메타데이터에 기초하여 새로운 재화를 추천할 수 있기 때문에 도서, 음반, 의류 등의 쇼핑몰에 적합한 추천 방법이다. 그리고 쇼핑몰에서의 내용 기반 추천의 경우에는 오피니언 마이닝(opinion mining)에 기초하여 구매한 사용자의 리뷰 등에서 키워드를 추출하고, 추출된 키워드를 내용 정보로 사용할 수 있다. Content-based recommendation is a recommendation method based on information retrieval. It is recommended for shopping malls such as books, music, and clothing because it can recommend new goods based on metadata of purchased goods. In the case of the content-based recommendation in the shopping mall, the keyword may be extracted from reviews of the purchased user based on Opinion mining, and the extracted keyword may be used as content information.

이때, 오피니언 마이닝은 비정형 데이터(unstructured data)인 문서(document)에 포함된 자연어(natural language) 문장을 분석하여 의미를 파악하고 극성을 분석하는 기법으로 주로 재화나 서비스에 대한 사용자의 의견 분석 등에 활용되는 일종의 텍스트 마이닝(text mining) 기법이다.At this time, Opinion Mining analyzes the natural language sentences included in the unstructured data document to understand the meaning and analyze the polarity. It is mainly used for analyzing user's opinions on goods or services Is a kind of text mining technique.

재화의 추천 방법 및 시스템에 대한 종래의 기술로서, 한국 공개특허공보 제10-2014-0113771호(발명의 명칭: M2M 기반의 도서 추천 방법 및 시스템)는 스마트 폰, 태블릿 및 이북 리더 등과 같은 M2M(machine to machine) 사용자 단말의 사용자에게 개인화된 도서 추천 서비스를 제공할 수 있는 도서 추천 방법 및 시스템에 대한 발명을 개시하고 있다. 구체적으로 이 방법은 복수 개의 모바일 디바이스 사용자의 개인 정보에 기초하여 복수 개의 커뮤니티 그룹을 분류하고, 커뮤니티 그룹별로 도서 추천 목록을 결정한 후 사용자 단말에 전송한다. Korean Patent Laid-Open Publication No. 10-2014-0113771 (titled " M2M-based book recommendation method and system ") discloses a method and system for recommending a good M2M product, such as a smart phone, a tablet, machine-to-machine (UI) method and system capable of providing a personalized book recommendation service to a user of a user terminal. Specifically, the method classifies a plurality of community groups based on personal information of a plurality of mobile device users, determines a book recommendation list for each community group, and transmits the list to the user terminal.

또한, 한국 공개특허공보 제10-2014-0142810호(발명의 명칭: 추천 상품 정보 제공하는 방법 및 서버, 그리고 모바일 디바이스)는 모바일 디바이스로부터 모바일 디바이스의 디바이스 정보를 포함하는 연결 개시 요청을 수신하고, 추천 상품을 검색하여 모바일 디바이스로 제공하는 방법 및 서버에 관한 발명을 개시하고 있다. 구체적으로 이 방법은 제조사, 휴대전화 번호, 모델 정보 등의 모바일 디바이스의 정보에 기초하여 모바일 디바이스에 대응하는 추천 상품을 제공한다. Korean Patent Laid-Open Publication No. 10-2014-0142810 (titled invention: method and server for providing recommended product information, and mobile device) receives a connection start request including device information of a mobile device from a mobile device, Discloses a method and server for searching for a recommended product and providing it to a mobile device. Specifically, the method provides a recommendation product corresponding to the mobile device based on information of the mobile device such as a manufacturer, a mobile phone number, and model information.

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 본 실시예는 자연어 처리에 기반하여 사용자 단말을 통하여 작성한 재화에 대한 리뷰를 분석하고, 리뷰를 작성한 사용자에게 적합한 재화를 제공하는 서버 및 방법을 제공하는데 그 목적이 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above problems of the prior art, and it is an object of the present invention to provide a server and a method for analyzing a review on goods created through a user terminal based on natural language processing, The purpose is to provide.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.It should be understood, however, that the technical scope of the present invention is not limited to the above-described technical problems, and other technical problems may exist.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 자연어 처리에 기반한 재화 제공 서버는 통신 모듈, 사용자 단말에 재화를 제공하는 프로그램이 저장된 메모리 및 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하고, 프로세서는 프로그램의 실행에 따라, 통신모듈에 기초하여 하나 이상의 리뷰 제공 서버로부터 사용자 단말에 의해 작성된 리뷰를 전달받고, 형태소 분석기에 기초하여 리뷰에 포함된 키워드를 추출하여 추출된 키워드에 대한 가중치 및 감성 지수에 기초하여 추출된 키워드의 점수를 산출하며, 산출된 키워드의 점수에 기초하여 하나 이상의 재화 정보 중 사용자 단말에 추천될 재화 정보를 추출하고, 추출된 재화 정보를 사용자 단말에 전송한다. 이때, 가중치는 단어 빈도-역문서 빈도(term frequency-inverse document frequency)에 기초하여 산출되며, 감성 지수는 키워드가 포함된 문장의 극성 정보에 기초하여 산출된다. As a technical means for achieving the above technical object, a natural language processing-based goods providing server according to the first aspect of the present invention includes a communication module, a memory storing a program for providing goods to the user terminal, The processor receives a review made by the user terminal from one or more review providing servers based on the communication module, extracts the keywords included in the review based on the morpheme analyzer, Extracts the goods information to be recommended to the user terminal from among one or more goods information based on the score of the calculated keyword, and outputs the extracted goods information to the user terminal send. At this time, the weight is calculated based on the term frequency-inverse document frequency, and the emotion index is calculated based on the polarity information of the sentence including the keyword.

또한, 본 발명의 제 2 측면에 따른 서버에서의 자연어 처리에 기반한 재화 정보 제공 방법은 하나 이상의 리뷰 제공 서버로부터 사용자 단말에 의해 작성된 리뷰를 전달받는 단계; 형태소 분석기에 기초하여 리뷰에 포함된 키워드를 추출하는 단계; 추출된 키워드에 대한 가중치 및 감성 지수에 기초하여 추출된 키워드의 점수를 산출하는 단계; 산출된 키워드의 점수에 기초하여 하나 이상의 재화 정보 중 사용자 단말에 추천될 재화 정보를 추출하는 단계; 및 추출된 재화 정보를 사용자 단말에 전송하는 단계를 포함한다. 이때, 가중치는 단어 빈도-역문서 빈도(term frequency-inverse document frequency)에 기초하여 산출되며, 감성 지수는 키워드가 포함된 문장의 극성 정보에 기초하여 산출된다. According to a second aspect of the present invention, there is provided a method for providing information on natural language processing in a server, the method comprising: receiving a review created by a user terminal from one or more review providing servers; Extracting keywords included in the review based on the morpheme analyzer; Calculating a score of the extracted keyword based on the weight value and the emotion index of the extracted keyword; Extracting a piece of good information to be recommended to the user terminal from among one or more pieces of good information based on the score of the calculated keyword; And transmitting the extracted goods information to the user terminal. At this time, the weight is calculated based on the term frequency-inverse document frequency, and the emotion index is calculated based on the polarity information of the sentence including the keyword.

전술한 과제 해결 수단 중 어느 하나에 의하면, 본 발명의 일 실시예는 사용자 리뷰에 포함된 키워드 및 키워드의 감성 지수에 기초하여 사용자의 선호 정보를 빠르고 정확하게 추출하여, 사용자의 선호 정보에 맞는 재화를 제공할 수 있다.According to an embodiment of the present invention, an embodiment of the present invention can quickly and accurately extract user's preference information based on the emotion index of a keyword and a keyword included in a user review, .

또한, 본 발명의 일 실시예는 기계학습에 기초하여 업데이트되는 형태소 분석기를 사용하므로, 점진적으로 선호 정보 추출의 정확도를 향상시킬 수 있다. In addition, since the embodiment of the present invention uses a morpheme analyzer that is updated based on machine learning, the accuracy of preference information extraction can be gradually improved.

그리고 본 발명의 일 실시예는 재화 판매자가 복수의 리뷰 제공 서버의 리뷰를 통합 관리할 수 있으므로 적은 비용으로 사용자에게 양질의 서비스를 제공할 수 있으며, 이를 통하여 판매자에 대한 사용자의 만족도 및 재화 판매량이 향상될 수 있다. According to an embodiment of the present invention, since the merchandise seller can integrally manage reviews of a plurality of review providing servers, it is possible to provide a high quality service to the user at a low cost, thereby enabling the satisfaction of the user and the sales volume of goods Can be improved.

도 1은 본 발명의 일 실시예에 따른 재화 제공 서버의 서비스 개념도이다.
도 2는 본 발명의 일 실시예에 따른 재화 제공 서버의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 자연어 처리 과정의 예시도이다.
도 4는 본 발명의 일 실시예에 따른 재화 제공 방법의 순서도이다.
1 is a service conceptual diagram of a goods providing server according to an embodiment of the present invention.
2 is a configuration diagram of a goods providing server according to an embodiment of the present invention.
3 is an exemplary diagram of a natural language processing process according to an embodiment of the present invention.
4 is a flowchart of a method for providing goods according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly explain the present invention in the drawings, parts not related to the description are omitted.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is referred to as being "connected" to another part, it includes not only "directly connected" but also "electrically connected" with another part in between . Also, when a part is referred to as "including " an element, it does not exclude other elements unless specifically stated otherwise.

이하에서는 도 1을 참조하여 본 발명의 일 실시예에 따른 재화 제공 서버(100)의 재화 제공 서비스를 설명한다. Hereinafter, a goods providing service of the goods providing server 100 according to an embodiment of the present invention will be described with reference to FIG.

도 1은 본 발명의 일 실시예에 따른 재화 제공 서버(100)의 서비스 개념도이다. 1 is a service conceptual diagram of a goods providing server 100 according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 재화 제공 서버(100)는 리뷰를 작성한 사용자의 리뷰를 분석하여, 추천 재화를 제공한다. 구체적으로 사용자는 사용자 단말(110)을 이용하여 재화에 대한 리뷰를 작성하고, 작성된 리뷰를 리뷰 제공 서버(120)에 전송한다. 재화 제공 서버(100)는 형태소 분석기를 이용한 자연어 처리에 기초하여 리뷰 제공 서버(120)에 업로드 된 사용자의 하나 이상의 리뷰를 분석하고, 분석된 리뷰 및 재화 메타데이터 제공 서버(130)에서 제공하는 재화의 메타데이터에 기초하여 리뷰를 작성한 사용자에게 추천할 재화를 제공한다. The goods providing server 100 according to the embodiment of the present invention analyzes the review of the user who wrote the review and provides the recommended goods. Specifically, the user creates a review of the goods using the user terminal 110, and transmits the created review to the review providing server 120. The goods providing server 100 analyzes one or more reviews of the user uploaded to the review providing server 120 based on the natural language processing using the morpheme analyzer, and analyzes the goods provided by the analyzed review and goods metadata providing server 130 Based on the meta data of the user.

이때, 재화 제공 서버(100)에 의하여 제공되는 추천 재화는 재화 제공 서버(100)에서 직접 사용자 단말(110)로 전송할 수 있다. 또한, 리뷰를 작성한 사용자에게 제공되는 추천 재화는 재화 제공 서버(100)에서 리뷰 제공 서버(120)로 전달되고, 리뷰 제공 서버(120)를 통하여 사용자 단말(110)로 전송될 수 있다. At this time, the recommended goods provided by the goods providing server 100 can be directly transmitted from the goods providing server 100 to the user terminal 110. In addition, the recommended goods provided to the user who wrote the review may be transmitted from the goods providing server 100 to the review providing server 120 and transmitted to the user terminal 110 via the review providing server 120.

또한, 본 발명의 또 다른 실시예에서는 재화 제공 서버(100)는 자연어 처리 엔진 서버 및 상품 매칭 서버일 수 있다. 이때, 자연어 처리 엔진 서버는 사용자의 리뷰를 분석하여 사용자가 선호하는 키워드를 추출할 수 있다. 또한, 상품 매칭 서버는 자연어 처리 엔진 서버를 통하여 추출된 키워드에 기초하여 사용자에게 추천할 재화를 추출하여, 제공할 수 있다. In yet another embodiment of the present invention, the goods providing server 100 may be a natural language processing engine server and a goods matching server. At this time, the natural language processing engine server analyzes the user's review and extracts a keyword preferred by the user. Further, the goods matching server can extract and provide the goods to be recommended to the user based on the keyword extracted through the natural language processing engine server.

한편, 본 발명의 일 실시예에 따른 재화 제공 서버(100)는 하나 이상의 리뷰 제공 서버(120)로부터 재화에 대한 리뷰를 제공받을 수 있다. Meanwhile, the goods providing server 100 according to an embodiment of the present invention may receive a review of goods from one or more review providing servers 120. [

이때, 리뷰 제공 서버(120)는 도서, 음반, 의류 및 가전제품 등의 재화를 판매하는 쇼핑몰일 수 있다. 또한, 리뷰 제공 서버(120)는 도서, 음반, 영화, 의류 및 가전제품 등의 재화에 대한 가격, 사양, 제조사 등의 재화의 정보를 제공하고, 사용자가 직접 재화에 대한 리뷰를 작성할 수 있는 가격정보 사이트, 포털 사이트 등이 될 수 있다. 또한, 리뷰 제공 서버(120)는 하나 이상의 외부의 리뷰 제공 사이트의 리뷰를 수집하여 재화 제공 서버(100)에 제공하거나, 외부의 웹 페이지, 블로그(blog) 및 소셜 미디어(social media) 등에 사용자가 게재한 재화에 대한 리뷰를 수집한 후, 재화 제공 서버(100)에 제공하는 리뷰 수집 서버일 수 있다. At this time, the review providing server 120 may be a shopping mall selling goods such as books, records, clothes, and household appliances. In addition, the review providing server 120 provides information on the prices of goods such as books, records, movies, clothes, and household appliances, information on goods such as specifications and manufacturers, and a price An information site, a portal site, and the like. In addition, the review providing server 120 may collect reviews of one or more external review providing sites and provide them to the goods providing server 100, or may provide users with information such as external web pages, blogs, and social media And may be a review collection server that collects reviews of the posted goods and provides the goods to the goods providing server 100.

리뷰 제공 서버(120)는 재화 제공 서버(100)에 리뷰를 제공하기 위하여, 미리 리뷰를 작성한 사용자의 로그인 정보 및 리뷰 수집 동의를 얻는 단계를 더 포함할 수 있다. 이에 따라 리뷰 제공 서버(120)는 리뷰 수집 동의를 수락한 사용자에 한하여, 미리 저장한 로그인 정보에 따라, 재화 제공 서버(100)에 리뷰를 제공할 수 있다. The review providing server 120 may further include obtaining login information and a review collection agreement of a user who has made a review in advance to provide a review to the goods providing server 100. [ Accordingly, the review providing server 120 can provide a review to the goods providing server 100 only on the user who accepted the review gathering agreement, in accordance with the login information previously stored.

재화 메타데이터 제공 서버(130)는 재화의 명칭, 제조사, 장르 등의 메타데이터(mate data)를 제공하는 서버이다. 예를 들어, 재화 메타데이터 제공 서버(130)가 도서 메타데이터 제공 서버인 경우에는 도서의 제목, 출판사, 저자, 역자, 장르, 가격 및 ISBN 정보 등을 제공할 수 있다. 또한, 재화 메타데이터 제공 서버(130)가 영화 메타데이터 제공 서버인 경우에는 감독, 배우, 제작사, 배급사, 장르 및 개봉일 등의 정보를 제공할 수 있다. 이때, 재화 메타데이터 제공 서버(130)는 리뷰 제공 서버(120)와 동일한 서버일 수 있다. 또한, 재화 메타데이터 제공 서버(130)는 재화 메타데이터를 제공하는 포털 사이트일 수 있다. The goods metadata providing server 130 is a server for providing mate data such as name, manufacturer, and genre of goods. For example, if the goods metadata providing server 130 is a book metadata providing server, it can provide title, publisher, author, translator, genre, price and ISBN information of the book. When the goods metadata providing server 130 is a movie metadata providing server, it may provide information such as director, actor, producer, distributor, genre, and release date. At this time, the good metadata providing server 130 may be the same server as the review providing server 120. Also, the goods metadata providing server 130 may be a portal site for providing the goods metadata.

또한, 또 다른 실시예에서는 재화 메타데이터 제공 서버(130)는 재화 설명 서버, 키워드 저장 서버 및 재화 키워드 저장 서버를 포함할 수 있다. 이때, 재화 설명 서버는 리뷰의 분석 대상이 되는 재화에 대한 메타데이터를 저장하고, 키워드 저장 서버는 리뷰에 포함된 키워드 및 메타데이터를 저장하며, 재화 키워드 저장 서버는 재화 제공 대상이 되는 재화에 대한 키워드 및 메타데이터를 저장할 수 있다. In yet another embodiment, the good metadata providing server 130 may include a good describing server, a keyword storing server, and a good keyword storing server. At this time, the goods description server stores the metadata about the goods to be analyzed in the review, the keyword storage server stores the keywords and the metadata included in the review, and the goods keyword storage server stores the metadata about the goods Keywords and metadata.

사용자 단말(110)은 재화 제공 서버(100)를 통하여 재화를 구매하는 단말일 수 있다. 또한, 사용자 단말(110)은 사용자가 재화에 대하여 작성한 리뷰를 리뷰 제공 서버(120)로 전송하는 단말일 수 있다. 구체적으로, 사용자 단말(120)은 리뷰 제공 서버(120)에 로그인하여 사용자가 구매하였거나, 사용한 재화에 대한 리뷰를 작성할 수 있다. 또한, 사용자 단말(120)은 리뷰 분석 및 재화 제공을 위하여 재화 제공 서버(100) 또는 리뷰 제공 서버(120)에 리뷰 수집 동의 여부 및 로그인 정보를 저장할 수 있다. The user terminal 110 may be a terminal that purchases goods through the goods providing server 100. Also, the user terminal 110 may be a terminal that transmits a review made by the user to the goods to the review providing server 120. Specifically, the user terminal 120 may login to the review providing server 120 and write a review of the purchased or used goods by the user. In addition, the user terminal 120 may store review consent and login information in the goods providing server 100 or the review providing server 120 for review analysis and provision of goods.

이때, 사용자 단말(110)은 디스플레이 모듈, 메모리, 프로세서 및 통신 모듈 등을 포함하고, 네트워크를 사용할 수 있는 모든 단말기를 통칭하는 것이다. 예를 들어, 사용자 단말(110)은 PC(personal computer), 서버 컴퓨터와 같은 일반적인 컴퓨팅 시스템일 수 있다.At this time, the user terminal 110 includes a display module, a memory, a processor, a communication module, and the like, and collectively refers to all terminals that can use the network. For example, the user terminal 110 may be a general computing system, such as a personal computer (PC), a server computer.

또한, 사용자 단말(110)은 휴대성과 이동성이 보장되는 무선 통신 장치, 즉 PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치 등을 포함할 수 있다. The user terminal 110 may be a wireless communication device, such as a PCS (Personal Communication System), a GSM (Global System for Mobile communications), a PDC (Personal Digital Cellular), a PHS (Personal Digital Assistant), IMT (International Mobile Telecommunication) -2000, Code Division Multiple Access (CDMA) -2000, W-Code Division Multiple Access (W-CDMA), WiBro (Wireless Broadband Internet) A handheld-based wireless communication device, and the like.

그리고 사용자 단말(110)은 노트북 컴퓨터(notebook computer), 태블릿(tablet) PC 등 이동성이 보장되며, 무선 통신이 가능한 개인용 컴퓨터와 스마트 폰(Smartphone) 등의 스마트 디바이스(smart device) 등을 포함할 수 있다.The user terminal 110 may include a personal computer capable of wireless communication such as a notebook computer, a tablet PC, etc. and a smart device such as a smart phone. have.

한편, 재화 제공 서버(100), 사용자 단말(110), 리뷰 제공 서버(120) 및 재화 메타데이터 제공 서버(130)는 네트워크를 통해 연결될 수 있다. 이때, 네트워크는 단말 및 서버와 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 3GPP(3rd generation partnership project) 네트워크, LTE(long term evolution) 네트워크, WIMAX(world interoperability for microwave access) 네트워크, 인터넷(internet), LAN(local area network), Wireless LAN(Wireless local area network), WAN(wide area network), PAN(personal area network), 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(digital multimedia broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Meanwhile, the goods providing server 100, the user terminal 110, the review providing server 120, and the goods metadata providing server 130 may be connected through a network. In this case, the network means a connection structure in which information can be exchanged between each node such as a terminal and a server. An example of such a network is a 3rd generation partnership project (3GPP) network, a long term evolution (LTE) network, a WIMAX world interoperability for microwave access networks, internet, local area network (LAN), wireless local area network (WLAN), wide area network (WAN), personal area network (PAN), bluetooth network, Broadcast networks, analog broadcast networks, digital multimedia broadcasting (DMB) networks, and the like.

또한, 재화 제공 서버(100)는 독립적인 서버 컴퓨터(server computer)에서 실행되거나, 리뷰 제공 서버(120) 또는 재화 메타데이터 제공 서버(130)에 사용자에게 추천 재화를 제공하는 서버 프로그램(server program)으로 탑재되어 서비스될 수 있다. 그리고 재화 제공 서버(100)는 리뷰 제공 서버(120) 및 재화 메타데이터 제공 서버(130)와 상이한 재화 판매 서버에 서버 프로그램으로 탑재되어 서비스될 수 있다. The goods providing server 100 may also be a server program that runs on an independent server computer or provides the recommendation goods to the review providing server 120 or the goods metadata providing server 130, And can be serviced. The goods providing server 100 may be installed as a server program in a goods selling server different from the review providing server 120 and the goods metadata providing server 130 and may be serviced.

다음은 도 2 및 도 3을 참조하여 본 발명의 일 실시예에 따른 재화 제공 서버(100)를 설명한다. Next, a goods providing server 100 according to an embodiment of the present invention will be described with reference to FIG. 2 and FIG.

도 2는 본 발명의 일 실시예에 따른 재화 제공 서버(100)의 구성도이다. 또한, 도 3은 본 발명의 일 실시예에 따른 자연어 처리 과정의 예시도이다. 2 is a configuration diagram of a goods providing server 100 according to an embodiment of the present invention. 3 is an exemplary diagram of a natural language processing process according to an embodiment of the present invention.

도 2를 참조하면, 재화 제공 서버(100)는 통신 모듈(210), 메모리(220) 및 프로세서(230)를 포함한다. 또한, 재화 제공 서버(100)는 재화 정보 데이터베이스(240)를 포함할 수 있다. Referring to FIG. 2, the goods providing server 100 includes a communication module 210, a memory 220, and a processor 230. In addition, the goods providing server 100 may include a goods information database 240.

통신 모듈(210)은 사용자 단말(110)을 통하여 사용자가 리뷰 제공 서버(120)에 업로드한 재화에 대한 리뷰를 전달받는다. 그리고 통신 모듈(210)은 재화 메타데이터 제공 서버(130)를 통하여 재화의 메타데이터를 전달받는다. 또한, 통신 모듈(210)은 프로세서(230)를 통하여 추출된 사용자에게 추천할 재화를 제공한다. 이때, 통신 모듈(210)은 유선 통신 모듈 및 무선 통신 모듈을 모두 포함할 수 있다. The communication module 210 receives a review of the goods that the user has uploaded to the review providing server 120 through the user terminal 110. The communication module 210 receives the metadata of the goods through the goods metadata providing server 130. In addition, the communication module 210 provides a recommendable item to the user extracted through the processor 230. At this time, the communication module 210 may include both a wired communication module and a wireless communication module.

메모리(220)에는 사용자 단말(110)에 재화를 제공하는 프로그램이 저장된다. 여기에서, 메모리(220)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치를 통칭하는 것이다. 또한, 메모리(220)에 저장된 프로그램은 소프트웨어 또는 FPGA(Field Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 형태로 구현될 수 있으며, 소정의 역할들을 수행할 수 있다. In the memory 220, a program for providing goods to the user terminal 110 is stored. Here, the memory 220 is collectively referred to as a non-volatile storage device that keeps stored information even when power is not supplied. The program stored in the memory 220 may be implemented in hardware such as software or an FPGA (Field Programmable Gate Array) or ASIC (Application Specific Integrated Circuit), and may perform predetermined roles.

재화 정보 데이터베이스(240)는 재화 정보에 대응하는 메타데이터를 저장할 수 있다. 이때, 재화 정보에 대응하는 메타데이터는 재화 메타데이터 제공 서버(130)에서 제공하는 재화의 명칭, 제조사, 장르 등의 메타데이터일 수 있으며, 재화 제공 서버(100)에 의하여 추가 작성되거나 수집되거나 가공된 메타데이터일 수 있다.The goods information database 240 may store the metadata corresponding to the goods information. At this time, the metadata corresponding to the goods information may be meta data such as the name of the goods, the manufacturer, and the genre provided by the goods metadata providing server 130, and may be additionally created, Metadata.

본 발명의 일 실시예에 따른 프로세서(230)는 통신 모듈(230)을 통해 하나 이상의 리뷰 제공 서버(120)로부터 사용자 추천 재화를 제공받을 사용자가 사용자 단말(110)을 이용하여 기 작성한 재화에 대한 리뷰를 전달받는다. 이때, 리뷰는 도 3의 (a)와 같이 하나 이상의 문장으로 구성될 수 있다. The processor 230 according to an exemplary embodiment of the present invention may be configured to allow a user to receive user recommendation goods from one or more review server 120 through the communication module 230 to use the user terminal 110 I receive a review. At this time, the review may be composed of one or more sentences as shown in FIG. 3 (a).

또한, 프로세서(230)는 형태소 분석기(morphological analyzer)에 기초하여 리뷰 제공 서버(120)로부터 전달받은 리뷰에 포함된 키워드를 추출한다. In addition, the processor 230 extracts keywords included in the review received from the review providing server 120 based on a morphological analyzer.

이때, 본 발명의 일 실시예에 따른 형태소 분석기는 자연어(natural language) 문장이나 문서 등을 구성하는 단어의 형태소를 분석할 수 있는 도구이다. 구체적으로 형태소 분석기는 리뷰에 포함된 문장의 구문 분석(parsing)을 수행하여 어절을 추출하고, 구분 분석을 통하여 추출된 어절의 형태소를 분석하여, 필요한 형태소의 단어를 추출할 수 있다. The morpheme analyzer according to an embodiment of the present invention is a tool for analyzing morphemes of words constituting a natural language sentence or a document. Specifically, the morpheme analyzer parses the sentences included in the review, extracts the phrases, and analyzes the morphemes of the extracted phrases through the classification analysis to extract the necessary morpheme words.

예를 들어, 도 3을 참조하면, 도 3의 (a)와 같은 리뷰 문서에 포함된 첫 문장 "<오기사 행복을 찾아 바르셀로나로 떠나다>는 ‘오기사’라는 필명으로 더 유명한 건축가 오영욱 님의 스페인 체류기다"라는 문장은 도 3의 (b)와 같이 분석될 수 있다. For example, referring to FIG. 3, the first sentence in the review document as shown in FIG. 3 (a), "<Going to Barcelona in search of happiness and happiness> Quot; can be analyzed as shown in FIG. 3 (b).

또한, 형태소 분석기는 구문 분석 및 각 어절의 형태소를 분석하기 위하여, 단어별 형태소 및 단어 간의 연결 관계를 표현하는 문법 사전 데이터베이스를 포함할 수 있다. 이때, 형태소 분석기는 리뷰의 형태소 분석 시, 분석하는 리뷰에 자주 사용되는 단어의 처리를 빠르고, 정확하게 형태소를 분석하기 위하여, 기계학습에 기초하여 문법 사전 데이터베이스를 업데이트 할 수 있다. In addition, the morpheme analyzer may include a grammar dictionary database for expressing connection relationships between word-based morphemes and words in order to analyze the syntax and morpheme of each word. At this time, the morpheme analyzer can update the grammar dictionary database based on the machine learning in order to quickly and accurately analyze the morpheme of the review, the analysis of the words frequently used in the review, and the morpheme analysis.

예를 들어, 형태소 분석기는 기 보유된 데이터를 형태소 분석할 때, 사용한 문법의 빈도에 따라 점수를 산출하고, 점수가 높은 문법을 우선 적용할 수 있도록 산출된 점수와 기계학습에 기초하여 문법 사전 데이터베이스를 자동 수정할 수 있다. For example, the morpheme analyzer calculates the score according to the frequency of the grammar used, and calculates the grammar dictionary database based on the calculated score and the machine learning so that the higher- Can be automatically corrected.

프로세서(230)는 형태소 분석기에 의하여 단어의 형태소가 분석되면, 분석된 단어에서 불용어(stop word)를 처리하는 전처리(preprocess)를 수행할 수 있다. 이때, 불용어는 문서나 문장 내에서 높은 빈도로 출현하지만, 특별한 의미가 없는 단어를 의미한다. 예를 들어, 리뷰에서 불용어는 "나", "그", "저"와 같은 대명사와 "은", "는", "이다"와 같은 조사가 될 수 있다. 또한, 리뷰에서 불용어는 재화와 관련된 분야에서 고 빈도로 출현하는 단어가 될 수 있다. 예를 들어, 도서의 리뷰에서는 "책", "저자"와 같은 단어가 불용어가 될 수 있다. The processor 230 may perform preprocessing to process stop words in the analyzed word if the morpheme of the word is analyzed by the morpheme analyzer. At this time, an abbreviation refers to a word that appears at a high frequency in a document or a sentence but has no special meaning. For example, in a review, an idiom can be a pronoun such as "I", "it", "me", and an investigation such as "silver", "silver", "is" In addition, abbreviations in the review can be words that occur at high frequency in the field related to goods. For example, in a review of a book, words such as "book" and "author" can be abbreviated.

그리고 프로세서(230)는 전처리된 단어에 대한 형태소에 기초하여 재화 제공에 필요한 단어를 키워드로 추출한다. 예를 들어, 도 3의 (b)에서 프로세서(230)는 명사 품사로 형태소가 분석된 단어인 "오기사", "바르셀로나", "건축가", "오영욱", "스페인" 등을 키워드로 추출할 수 있다. The processor 230 extracts words necessary for providing goods based on the morpheme for the preprocessed word as keywords. For example, in FIG. 3 (b), the processor 230 extracts the words "Ogi", "Barcelona", "architect", "Oh Young-wook", "Spain" .

또한, 프로세서(230)는 형태소 분석기를 통하여 추출된 단어 중 연속된 명사를 포함하는 단어를 하나의 키워드로 추출할 수 있다. 예를 들어, 프로세서(230)는 추출된 단어가 복합 명사이거나, 띄어쓰기 있는 연속된 명사인 경우, 하나의 키워드로 추출할 수 있다.In addition, the processor 230 may extract a word including consecutive nouns among the words extracted through the morpheme analyzer as one keyword. For example, the processor 230 may extract a single keyword if the extracted word is a compound noun or a contiguous noun with spaces.

또한, 프로세서(230)는 재화 정보 데이터베이스(240)에 저장된 메타데이터에 기초하여 분석된 단어 중 재화의 명칭, 제조사 등을 하나의 키워드로 추출할 수 있다. 예를 들어, 도 3의 (b)에서 "오기사, 행복을 찾아서 바르셀로나로 떠나다"가 재화 정보 데이터베이스(240)에 재화의 명칭으로 존재하는 경우, 프로세서(230)는 "오기사, 행복을 찾아서 바르셀로나로 떠나다"를 하나의 키워드로 추출할 수 있다. In addition, the processor 230 may extract the name, manufacturer, etc. of the goods among the analyzed words based on the metadata stored in the goods information database 240 as one keyword. For example, in FIG. 3 (b), if the word "Ogata, leaving happily for Barcelona" is present in the goods information database 240 as the name of the goods, the processor 230 reads " Quot; leave "can be extracted as one keyword.

한편, 프로세서(230)는 리뷰에 포함된 키워드를 추출하는 과정과 동일한 과정을 통하여 재화 정보 데이터베이스(240)에 자연어 문장이나 구 형태로 저장된 메타데이터에서 키워드를 추출하여, 재화 정보로 활용할 수 있다. 구체적으로 프로세서(230)는 재화 정보 데이터베이스(240)에 저장된 문장이나 구 형태로 저장된 메타데이터에 대하여 형태소 분석기에 기초하여 키워드를 추출할 수 있다. 그리고 프로세서(230)는 메타데이터에서 추출된 키워드를 활용하여 리뷰에 포함된 키워드를 추출할 수 있다. 또한, 프로세서(230)는 메타데이터에서 추출된 키워드를 다시 재화 정보 데이터베이스(240)에 저장하여, 메타데이터로 활용할 수 있다. Meanwhile, the processor 230 may extract keywords from the metadata stored in the form of a natural language sentence or phrase in the goods information database 240 through the same process as the process of extracting the keywords included in the review, and utilize the keywords as goods information. Specifically, the processor 230 may extract a keyword based on the morpheme analyzer with respect to the metadata stored in the sentence or sphere stored in the goods information database 240. The processor 230 may extract the keyword included in the review by utilizing the keyword extracted from the metadata. In addition, the processor 230 may store the keyword extracted from the metadata again in the goods information database 240, and utilize the keyword as metadata.

프로세서(230)는 키워드가 추출되면, 추출된 키워드에 대한 가중치 및 감성 지수에 기초하여 추출된 키워드의 점수를 산출한다. When the keyword is extracted, the processor 230 calculates the score of the extracted keyword based on the weight for the extracted keyword and the emotion index.

이때, 리뷰에서 추출된 키워드의 가중치는 단어 빈도- 역문서 빈도(term frequency-inverse document frequency; TF-IDF)에 기초하여 산출한다. 단어 빈도-역문서 빈도 가중치는 정보 검색 분야에서 주로 활용되는 벡터 스페이스 모델(vector space model)의 대표적인 단어 가중치 측정 방법이다. 예를 들어, 단어 빈도-역문서 빈도는 수학식 1과 같이 계산될 수 있다. At this time, the weight of the keyword extracted from the review is calculated based on the term frequency-inverse document frequency (TF-IDF). Word frequency - Inverse document frequency weighting is a representative word weight measurement method of the vector space model that is mainly used in the field of information retrieval. For example, the word frequency - inverse document frequency can be calculated as shown in equation (1).

Figure 112015013658980-pat00001
Figure 112015013658980-pat00001

이때, 수학식 1에서

Figure 112015013658980-pat00002
는 가중치를 구하는 단어,
Figure 112015013658980-pat00003
는 단어
Figure 112015013658980-pat00004
의 가중치이며,
Figure 112015013658980-pat00005
는 가중치를 구하고자 하는 리뷰에 포함된
Figure 112015013658980-pat00006
의 빈도수,
Figure 112015013658980-pat00007
는 전체 리뷰 중
Figure 112015013658980-pat00008
를 포함하는 리뷰의 빈도수이다. At this time, in Equation (1)
Figure 112015013658980-pat00002
Is a word for obtaining a weight,
Figure 112015013658980-pat00003
Word
Figure 112015013658980-pat00004
&Lt; / RTI &gt;
Figure 112015013658980-pat00005
Is included in the review for which we want to calculate weights.
Figure 112015013658980-pat00006
Frequency,
Figure 112015013658980-pat00007
In the full review
Figure 112015013658980-pat00008
Is the frequency of reviews that include.

도 3의 (a)를 참조하면, "바로셀로나" 키워드의 경우, 도 3의 (a)에 4번 등장하므로,

Figure 112015013658980-pat00009
는 4가 될 수 있다. 만약 전체 리뷰 중 "바로셀로나"라는 키워드를 포함하는 리뷰가 40건이라면
Figure 112015013658980-pat00010
는 40이 되며, 가중치
Figure 112015013658980-pat00011
는 0.1이 될 수 있다. Referring to FIG. 3 (a), in the case of the keyword "barcelona", the keyword appears four times in FIG. 3 (a)
Figure 112015013658980-pat00009
Can be four. If there are 40 reviews in the entire review that contain the keyword "Barcelona"
Figure 112015013658980-pat00010
Is 40, and the weight
Figure 112015013658980-pat00011
Can be 0.1.

또한, 감성 지수는 키워드가 포함된 문장의 극성 정보(polarity information)에 기초하여 산출된다. 프로세서(230)는 문장에 포함된 형태소에 기초하여 문장이 긍정(positive), 부정(negative) 및 중립 중 어떤 의미를 포함하는지를 판별할 수 있다. 그리고 프로세서(230)는 판별된 극성 정보에 기초하여 긍정인 경우 감성 지수를 양수로 설정하고, 부정인 경우 감성 지수를 음수로 설정하여 감성 지수를 계산할 수 있다. In addition, the emotion index is calculated based on the polarity information of the sentence including the keyword. The processor 230 may determine based on the morpheme included in the sentence that the sentence includes a meaning such as positive, negative, and neutral. The processor 230 may set the emotion index to a positive number if it is affirmative based on the discriminated polarity information, and may calculate the emotion index by setting the emotion index to a negative value if it is negative.

예를 들어, 도 3의 (a)에 포함된 "나도 꼭 한번 바르셀로나에 가보고 싶다"라는 문장의 "가보고 싶다"라는 어미는 긍정의 표현이므로 해당 문장은 긍정을 의미한다고 판별할 수 있다. 그러므로 프로세서(230)는 "바로셀로나"라는 키워드가 포함된 문장의 극성 정보가 긍정이라고 판단하여 "바로셀로나"의 감정 지수를 2로 계산할 수 있다. For example, the word " I want to see "in the phrase " I would like to go to Barcelona once again" included in FIG. 3 (a) is an expression of affirmation. Therefore, the processor 230 may determine that the polarity information of the sentence containing the keyword "barcelona" is affirmative and calculate the emotion index of "barcelona "

프로세서(230)는 추출된 키워드에 대한 가중치 및 감성 지수가 계산되면, 계산된 가중치 및 감성 지수에 기초하여 키워드의 점수를 산출한다. 예를 들어, 프로세서(230)는 추출된 키워드인 "바로셀로나"의 산출된 가중치가 0.1이고 감성 지수가 1이라면, 두 값의 곱인 0.2를 추출된 키워드에 대한 점수로 산출할 수 있다. The processor 230 calculates the score of the keyword based on the calculated weight and the emotion index when the weight and emotion index of the extracted keyword are calculated. For example, the processor 230 may calculate 0.2, which is the product of the two values, as a score for the extracted keyword, if the calculated weight of the extracted keyword " barcelona " is 0.1 and the emotion index is 1.

프로세서(230)는 재화 정보 데이터베이스(240)에 포함된 온톨로지(ontology) 사전에 기초하여 키워드를 추가로 추출할 수 있다. The processor 230 may further extract a keyword based on an ontology dictionary included in the goods information database 240. [

이때, 온톨로지 사전은 키워드의 개념 분류 및 인과 관계 등에 따른 관계를 정의한 사전이다. 예를 들어, 키워드로 "여행기"가 추출되고, 온톨로지 사전에 "여행기"의 상위 단어가 "여행"이라면, 프로세서(230)는 "여행"을 키워드로 추출할 수 있다. 이때 "여행"의 점수는 온톨로지 사전상의 "여행"의 하위 단어들의 점수의 최대값이 될 수 있다. At this time, the ontology dictionary is a dictionary which defines a conceptual classification of keywords and a relation according to causal relationships. For example, if the word "traveler" is extracted as the keyword and the upper word of the "traveler" is "travel" in the ontology dictionary, the processor 230 can extract "travel" At this time, the score of "travel" can be the maximum value of the score of the sub-words of "travel" in the ontology dictionary.

프로세서(230)는 키워드를 추출하고, 각 키워드의 점수를 계산 한 다음, 미리 설정된 임계값 이상인 키워드를 추출하거나, 미리 설정된 개수의 키워드를 추천 재화를 제공받을 사용자의 선호 키워드로 추출할 수 있다. The processor 230 extracts a keyword, calculates a score of each keyword, extracts a keyword having a preset threshold value or more, or extracts a predetermined number of keywords as a user's favorite keyword to be provided with a recommended product.

도 3을 참조하면, 도 3의 (c)는 형태소 분석 결과에서 키워드를 추출하고, 점수를 산출한 결과이다. 만약 미리 설정된 임계값이 0.1이라고 하면, 추천 재화를 제공받을 사용자가 선호하는 키워드는 "바르셀로나" 및 "여행"이 될 수 있다. Referring to FIG. 3, (c) in FIG. 3 is a result of extracting a keyword from the morphological analysis result and calculating a score. If the preset threshold value is 0.1, the keywords preferred by the user to receive the recommended goods may be "Barcelona" and "Travel ".

프로세서(230)는 이와 같이 추출된 선호 키워드 및 선호 키워드의 점수에 기초하여, 하나 이상의 추천 대상이 되는 재화 정보 중 사용자에게 추천될 재화 정보를 추출할 수 있다. The processor 230 may extract the goods information to be recommended to the user among the goods information as one or more recommendable objects based on the scores of the extracted preferred keywords and preferred keywords.

이때, 추천 대상이 되는 재화 정보는 재화 정보 데이터베이스(240)에 포함된 재화 중 사용자가 구매하였거나, 사용한 이력에 포함되지 않은 재화의 리스트에 포함된 정보일 수 있다. 또한, 추천 대상이 되는 재화 정보는 신제품 리스트 등과 같은 리뷰 제공 서버(120) 또는 제 3의 재화 판매 서버에서 제공하는 재화의 리스트에 포함된 정보가 될 수 있으며, 이에 한정된 것은 아니다. At this time, the goods information to be recommended may be information included in the list of goods purchased by the user or not included in the used history among the goods included in the goods information database 240. The recommended product information may be information included in the list of goods provided by the review providing server 120 or the third goods selling server such as a new product list, but is not limited thereto.

프로세서(230)는 추출된 선호 키워드와 재화 정보간의 일치 정도에 기초하여 사용자에게 제공될 하나 이상의 재화에 대한 순위를 매길 수 있다. 예를 들어, 추천 대상이 되는 제 1 재화에 포함된 정보가 "여행", "바로셀로나" 및 "건축"이고, 제 2 재화에 포함된 정보가 "바로셀로나" 및 "그림"이라면, 제 1 재화에는 사용자가 선호하는 키워드가 2개 일치되며, 제 2 재화에는 사용자가 선호하는 키워드가 1개 일치된다. 그러므로 프로세서(230)는 일치 정도가 높은 제 1 재화 및 제 2 재화 순으로 순위를 매길 수 있다. The processor 230 may rank the one or more goods to be provided to the user based on the degree of matching between the extracted preferred keyword and the goods information. For example, if the information included in the first item to be referenced is "Travel", "Barcelona" and "Architecture", and the information contained in the second item is "Barcelona" and " The user's favorite keywords are matched with two, and the second good is matched with one user's preferred keyword. Thus, the processor 230 may rank in order of first matching goods and second goods.

또한, 프로세서(230)는 추출된 선호 키워드와 재화 정보간의 일치 정도 및 추출된 선호 키워드 각각의 점수에 기초하여 사용자에게 제공될 재화의 순위를 매길 수 있다. 위 예시에서 제 1 재화는 사용자가 선호하는 2개의 키워드가 일치된다. 그러므로 도 3의 (c)를 참조하면, 일치되는 2개의 키워드의 점수가 각각 0.3436, 0.1250이므로 제 1 재화의 선호도는 두 값의 평균인 0.2343이 될 수 있다. 또한, 제 2 재화는 사용자가 선호하는 키워드가 1개 일치되며, 일치하는 키워드의 점수가 0.3436이므로 제 2 재화의 선호도는 0.3436이 될 수 있다. 그러므로 프로세서(230)는 선호도가 높은 제 2 재화 및 제 1 재화 순으로 순위를 매길 수 있다. In addition, the processor 230 can rank the goods to be provided to the user based on the degree of matching between the extracted preferred keyword and the goods information and the score of each extracted preferred keyword. In the above example, the first goods match two user-preferred keywords. Therefore, referring to FIG. 3 (c), since the score of two matching keywords is 0.3436 and 0.1250, the preference of the first good can be 0.2343, which is the average of the two values. In addition, since the second favorite matches one keyword that the user prefers, and the score of the matching keyword is 0.3436, the preference of the second good may be 0.3436. Thus, the processor 230 may rank in order of preference second goods and first goods.

이렇게 사용자에게 제공할 재화에 대한 순위를 매긴 다음, 프로세서(230)는 미리 정해진 개수 또는 미리 정해진 점수에 따라, 하나 이상의 추천 대상이 되는 재화 정보 중 사용자에게 추천될 재화 정보를 추출할 수 있다. 예를 들어, 미리 정해진 개수가 n이라면, 프로세서(230)는 사용자에게 제공될 하나 이상의 재화 중 가장 순위가 높은 n개의 재화를 사용자에게 제공할 수 있다. 만약 n이 2이라면, 프로세서(230)는 순위가 높은 2개의 재화를 사용자에게 제공할 수 있다. 또한, 미리 정해진 점수가 x 이상이라면, 계산된 재화의 선호도가 x 이상인 재화를 사용자에게 제공할 수 있다. 만약, 미리 정해진 점수가 0.3이라면, 선호도가 0.3 이상인 재화를 사용자에게 제공할 수 있다. After ranking the goods to be provided to the user in this way, the processor 230 can extract the goods information to be recommended to the user among the one or more goods information to be recommended, according to a predetermined number or a predetermined score. For example, if the predetermined number is n, the processor 230 may provide the user with the highest ranked n items of the one or more goods to be presented to the user. If n is 2, then the processor 230 may provide the user with two more ranked items. Further, if the predetermined score is x or more, the user can be provided with the goods whose preference of the calculated goods is x or more. If the predetermined score is 0.3, it is possible to provide the user with a preference of 0.3 or more.

한편, 프로세서(230)는 추출된 키워드와 하나 이상의 재화 정보에 대한 연관 관계 분석에 기반하여 사용자에게 제공할 재화를 추출할 수 있다. 이때, 연관 관계는 연관 분석(association analysis)을 통하여 추출할 수 있다. 이때, 연관 분석은 데이터마이닝 기법의 대표적인 분석 알고리즘으로 사용자들의 재화 구매 이력에 존재하는 동시 발생성(concurrent)에 기초하여, 재화 구매 또는 사용에 숨겨진 규칙을 찾는 방법이다. On the other hand, the processor 230 can extract the goods to be provided to the user based on the extracted keyword and analysis of association with one or more goods information. At this time, the association can be extracted through association analysis. At this time, association analysis is a typical analysis algorithm of data mining, and it is a method to find hidden rules for purchasing or using goods based on the concurrence existing in users' purchase history of goods.

프로세서(230)는 연관 분석에 기초하여 키워드 속에 숨겨진 연관 관계를 도출하고, 연관 관계를 통하여 사용자에게 제공할 재화를 추출할 수 있다. 또한, 프로세서(230)는 연관 분석 결과로 도출된 상관 계수(correlation coefficient), 지지도(support) 및 신뢰도(confidence) 등의 값을 연결 강도로 이용하여 키워드 간의 네트워크를 생성하여 사용자에게 제공할 수 있다. 예를 들어, 프로세서(230)는 키워드 간의 네트워크를 생성하고, 방사형 그래프 형태로 가시화(visualization)된 결과를 사용자에게 제공할 수 있다. The processor 230 may derive an association hidden in the keyword based on the association analysis and extract the goods to be provided to the user through the association. In addition, the processor 230 may generate a network between the keywords using the correlation coefficient, support, and confidence derived from the association analysis as the connection strength, and provide the generated network to the user . For example, the processor 230 may generate a network of keywords and provide the user with a visualization result in the form of a radial graph.

또한, 연관 분석을 통하여, 프로세서(230)는 "(바로셀로나, 여행)"의 상관 계수를 0.8, "(바르셀로나, 그림)"의 상관 계수를 -0.5, "(바로셀로나, 건축)"의 상관 계수를 0.1로 산출할 수 있다. 이때, 상관 계수는 1에 가까울수록 강한 양의 상관 관계를 가지며, -1에 가까울수록 강한 음의 상관 관계를 가진다. 또한, 상관 계수는 0에 가까울수록 두 키워드 간의 상관 관계가 적어진다. 그러므로 예에서 "바로셀로나"와 "여행"은 강한 양의 상관 관계를 가지므로, 두 키워드는 동시 발생 확률이 높다고 할 수 있다. 또한, "바로셀로나"와 "그림"은 강한 음의 상관 관계를 보이므로, 두 키워드가 동시에 발생할 확률이 낮다고 할 수 있다. 그리고 "바로셀로나" 및 "건축"은 서로 상관 관계가 거의 없다고 할 수 있다. Further, through the association analysis, the processor 230 calculates the correlation coefficient of "(Barcelona, travel)" to 0.8, the correlation coefficient of "(Barcelona, 0.1. &Lt; / RTI &gt; At this time, the correlation coefficient has a strong positive correlation with the closer to 1, and a stronger negative correlation with the closer to -1. In addition, the correlation coefficient between the two keywords decreases as the correlation coefficient approaches zero. Therefore, in the example, "Barcelona" and "travel" have a strong positive correlation, so the two keywords have a high probability of coincidence. In addition, the strong correlation between "Barcelona" and "picture" shows a strong negative correlation, so that the probability of two keywords occurring at the same time is low. And "Barcelona" and "Architecture" have little correlation with each other.

이렇게 사용자에게 제공할 재화 정보가 추출되면, 프로세서(230)는 통신 모듈(210)을 통하여 추출된 재화 정보를 사용자 단말(110)에 전송한다. 이때, 프로세서(230)는 통신 모듈(210)을 통하여 추출된 재화 정보를 사용자 단말(110)에 직접 전송할 수 있다. 또한, 프로세서(230)는 통신 모듈(210)을 통하여 하나 이상의 리뷰 제공 서버(120) 중 추출된 재화 정보와 대응되는 리뷰 제공 서버(120)로 추출된 재화 정보를 전달하고, 추출된 재화 정보를 전달받은 리뷰 제공 서버(120)가 추출된 재화 정보를 사용자 단말(110)에 전송할 수 있다. When the goods information to be provided to the user is extracted in this manner, the processor 230 transmits the goods information extracted through the communication module 210 to the user terminal 110. At this time, the processor 230 can directly transmit the extracted goods information through the communication module 210 to the user terminal 110. The processor 230 transfers the extracted goods information to the review providing server 120 corresponding to the extracted goods information among the one or more review providing servers 120 through the communication module 210, The received review providing server 120 can transmit the extracted goods information to the user terminal 110. [

다음은 도 4를 참조하여 본 발명의 일 실시예에 따른 재화 제공 서버(100)에서의 자연어 처리에 기반한 재화 정보 제공 방법을 설명한다. Next, referring to FIG. 4, a description will be made of a method for providing goods information based on natural language processing in the goods providing server 100 according to an embodiment of the present invention.

재화 제공 서버(100)는 하나 이상의 리뷰 제공 서버(120)로부터 사용자 단말(110)에 의해 작성된 사용자가 기 구매하였거나, 기 사용한 재화의 리뷰를 전달받는다(S400). In step S400, the goods providing server 100 receives a review of the goods purchased by the user created by the user terminal 110 from the one or more review providing servers 120 or the used goods.

그리고 재화 제공 서버(100)는 형태소 분석기에 기초하여 리뷰에 포함된 키워드를 추출한다(S410). 이때, 형태소 분석기는 형태소 분석 결과에 따라, 리뷰에 자주 포함되는 단어의 처리를 빠르고 정확하게 분석하기 위하여, 기계학습에 기초하여 업데이트 되는 문법 사전 데이터베이스를 포함할 수 있다. Then, the goods providing server 100 extracts keywords included in the review based on the morpheme analyzer (S410). At this time, the morpheme analyzer may include a grammar dictionary database that is updated based on the machine learning in order to quickly and accurately analyze the processing of the words frequently included in the review, according to the morphological analysis result.

또한, 재화 제공 서버(100)는 형태소 분석기를 통하여 추출된 단어 중 연속된 명사가 포함되면 연속된 명사를 하나의 키워드로 추출할 수 있다. 또한, 재화 제공 서버(100)는 추출된 단어 중 재화 정보 데이터베이스(240)에 저장된 재화 정보 메타데이터에 포함되는 단어를 키워드로 추출할 수 있다. 그리고 재화 제공 서버(100)는 키워드의 개념 분류와 연관 관계를 정의한 온톨로지 사전에 기초하여 키워드를 추가로 추출할 수 있다. In addition, if the product providing server 100 includes a consecutive noun among the words extracted through the morpheme analyzer, the product providing server 100 may extract the consecutive nouns as one keyword. In addition, the goods providing server 100 may extract words included in the goods information metadata stored in the goods information database 240 among the extracted words as keywords. The goods providing server 100 can further extract the keyword based on the ontology dictionary defining the concept classification and association of the keyword.

재화 제공 서버(100)는 이렇게 추출된 키워드에 대한 가중치 및 감성 지수에 기초하여 추출된 키워드의 점수를 산출한다(S420). 이때, 가중치는 단어 빈도- 역문서 빈도(term frequency-inverse document frequency)에 기초하여 산출된다. 또한, 감성 지수는 키워드가 포함된 문장의 긍정, 부정 및 중립과 같은 극성 정보에 기초하여 산출된다. The goods providing server 100 calculates the score of the extracted keyword based on the weight and the emotion index of the extracted keyword (S420). At this time, the weight is calculated based on the term frequency-inverse document frequency. In addition, the emotion index is calculated based on polarity information such as positive, negative, and neutral of the sentence including the keyword.

재화 제공 서버(100)는 키워드에 대한 점수를 산출한 다음, 산출된 키워드의 점수에 기초하여 하나 이상의 재화 정보 중 사용자 단말(110)에 추천될 재화 정보를 추출한다(S430). 이때, 재화 제공 서버(100)는 추출된 키워드와 재화 정보간의 일치 정도에 기초하여 사용자에게 제공될 재화를 추출할 수 있다. The goods providing server 100 calculates the score for the keyword, and then extracts the goods information to be recommended to the user terminal 110 from among one or more goods information based on the calculated score of the keyword (S430). At this time, the goods providing server 100 can extract the goods to be provided to the user based on the degree of matching between the extracted keyword and the goods information.

그리고 재화 제공 서버(100)는 추출된 재화 정보를 사용자 단말(110)에 전송한다(S440). 이때, 재화 제공 서버(100)는 사용자 단말(110)에 직접 추출된 재화 정보를 전달할 수 있다. 또한, 재화 제공 서버(100)는 추출된 재화 정보와 대응되는 리뷰 제공 서버(120)로 추출된 재화 정보를 전달하여, 사용자 단말(110)에 전송할 수 있다. Then, the goods providing server 100 transmits the extracted goods information to the user terminal 110 (S440). At this time, the goods providing server 100 can deliver the extracted goods information to the user terminal 110 directly. In addition, the goods providing server 100 may transmit the goods information extracted by the review providing server 120 corresponding to the extracted goods information to the user terminal 110.

재화 제공 방법은 독립적인 서버 컴퓨터(server computer)에 구형되어 실행될 수 있다. 또한, 재화 제공 방법은 API(application programming interface)로 구현되어, 리뷰 제공 서버(120) 또는 재화 메타데이터 제공 서버(130)에 사용자에게 추천 재화를 제공하는 프로그램으로 탑재되어 서비스될 수 있다. The method of providing goods can be performed in a stand-alone manner on an independent server computer. In addition, the goods providing method may be implemented as an application programming interface (API), and may be installed and serviced as a program for providing recommendation goods to the user to the review providing server 120 or the goods metadata providing server 130.

본 발명의 일 실시예에 따른 자연어 처리에 기반한 재화 제공 서버(100) 및 방법은 사용자 리뷰에 포함된 키워드 및 키워드의 감성 지수에 기초하여 사용자의 선호 정보를 빠르고 정확하게 추출하여, 사용자에게 맞춤형 재화를 제공할 수 있다. 또한, 재화 제공 서버(100) 및 방법은 기계학습에 기초하여 업데이트되는 형태소 분석기를 사용하므로, 점진적으로 선호 정보 추출의 정확도가 향상될 수 있다. The natural language processing-based goods providing server 100 and method according to an embodiment of the present invention can quickly and accurately extract the user's preference information based on the emotion index of the keywords and keywords included in the user review, . In addition, since the goods providing server 100 and the method use a morpheme analyzer that is updated based on machine learning, the accuracy of preference information extraction can be gradually improved.

그리고 재화 제공 서버(100) 및 방법은 재화 판매자가 복수의 리뷰 제공 서버(120)의 리뷰를 통합 관리할 수 있으므로 적은 비용으로 사용자에게 양질의 서비스를 제공할 수 있으며, 이를 통하여 판매자에 대한 사용자의 만족도 및 재화 판매량이 향상될 수 있다. The goods providing server 100 and the method can provide a good quality service to the user at a low cost since the goods seller can collectively manage reviews of the plurality of review providing servers 120, Satisfaction and merchandise sales volume can be improved.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다. One embodiment of the present invention may also be embodied in the form of a recording medium including instructions executable by a computer, such as program modules, being executed by a computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium can include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes any information delivery media, including computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transport mechanism.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.While the methods and systems of the present invention have been described in connection with specific embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

110: 사용자 단말 100: 재화 제공 서버
120: 리뷰 제공 서버 130: 재화 메타데이터 제공 서버
110: User terminal 100: Goods providing server
120: review providing server 130: goods metadata providing server

Claims (9)

자연어 처리에 기반한 재화 제공 서버에 있어서,
하나 이상의 리뷰 제공 서버 및 사용자 단말과의 데이터 통신을 수행하는 통신 모듈,
재화 정보 데이터베이스,
상기 사용자 단말에 추천될 재화 정보를 추출하는 프로그램이 저장된 메모리 및
상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하고,
상기 프로세서는 상기 프로그램의 실행에 따라, 형태소 분석기에 기초하여 상기 리뷰 제공 서버로부터 전달받은 리뷰에 포함된 하나 이상의 키워드를 추출하며,
상기 리뷰의 어미에 기초하여, 상기 리뷰의 극성 정보를 분석하고, 상기 분석된 극성 정보를 이용하여, 상기 리뷰에 대한 감성 지수를 산출하고,
상기 추출된 하나 이상의 키워드에 대한 가중치 및 상기 산출된 감성 지수에 기초하여, 상기 추출된 하나 이상의 키워드에 대한 점수를 산출하고,
상기 추출된 하나 이상의 키워드에 대한 연관관계에 기초하여, 상기 재화 정보 데이터베이스에 저장된 하나 이상의 재화 정보 중 상기 추출된 하나 이상의 키워드와 매칭되는 재화 정보를 선택하고, 상기 산출된 키워드에 대한 점수에 기초하여, 상기 선택된 재화 정보에 대한 점수를 계산하며,
상기 계산된 재화 정보에 대한 점수가 높은 순으로 상기 사용자 단말에 추천될 재화 정보를 추출하고,
상기 추출된 하나 이상의 키워드에 대한 연관관계에 기초하여 키워드 간의 네트워크를 생성하며,
상기 생성된 키워드 간의 네트워크 및 상기 추출된 재화 정보를 상기 사용자 단말에 전송하되,
상기 리뷰는 상기 사용자 단말에 의해 생성된 후, 상기 리뷰 제공 서버에 저장된 것이며,
상기 추출된 하나 이상의 키워드에 대한 가중치는 상기 추출된 하나 이상의 키워드에 포함된 각각의 키워드에 대한 가중치를 이용하여 산출된 것이고,
상기 각각의 키워드에 대한 가중치는 상기 리뷰에 포함된 상기 가중치를 산출할 키워드의 개수 및 상기 리뷰 제공 서버에 포함된 하나 이상의 리뷰 중 상기 가중치를 산출할 키워드를 포함하는 리뷰의 개수에 기초하여 산출되며,
상기 추출된 하나 이상의 키워드에 대한 연관관계는 상기 재화 정보 데이터베이스에 저장된 하나 이상의 재화 정보에 대한 연관관계 분석에 기초하여 기생성된 것이며,
상기 키워드 간의 네트워크는 상기 하나 이상의 키워드 간의 연결강도에 기초하여 생성된 것이며,
상기 하나 이상의 키워드 간의 연결 강도는 상기 연관관계 분석에 기초하여 산출된 상기 하나 이상의 키워드 간의 상관 계수, 지지도 및 신뢰도 중 어느 하나이고,
상기 극성 정보는 긍정, 부정 및 중립 중 어느 하나이며,
상기 리뷰에 대한 감성 지수는 상기 리뷰의 어미가 긍정이면, 미리 설정된 양수 값으로 설정되며, 상기 리뷰의 어미가 부정이면, 미리 설정된 음수 값으로 설정되며, 상기 리뷰의 어미가 중립이면 0으로 설정되는 것인, 재화 제공 서버.
A goods providing server based on natural language processing,
At least one review providing server and a communication module for performing data communication with the user terminal,
A goods information database,
A memory for storing a program for extracting product information to be recommended to the user terminal,
And a processor for executing a program stored in the memory,
The processor extracts one or more keywords included in the review received from the review providing server based on the morpheme analyzer,
Analyzing the polarity information of the review based on the end of the review, calculating an emotion index for the review using the analyzed polarity information,
Calculating a score for the extracted one or more keywords based on the weight for the extracted one or more keywords and the calculated emotion index,
Selecting one or more goods information matching the extracted one or more keywords among the one or more goods information stored in the goods information database based on the extracted relation of one or more keywords, Calculates a score for the selected good,
Extracting the goods information to be recommended to the user terminal in descending order of the score of the calculated goods information,
Generating a network between the keywords based on the association relation of the extracted one or more keywords,
Transmitting the network between the generated keywords and the extracted goods information to the user terminal,
Wherein the review is generated by the user terminal and then stored in the review providing server,
Wherein the weight of the extracted one or more keywords is calculated by using a weight for each keyword included in the extracted one or more keywords,
The weight for each of the keywords is calculated based on the number of keywords included in the review and the number of reviews including the keyword to calculate the weight among the one or more reviews included in the review providing server ,
Wherein the association relation for the extracted one or more keywords is preliminarily generated on the basis of an association analysis for one or more goods information stored in the goods information database,
Wherein the network between the keywords is generated based on a connection strength between the at least one keyword,
Wherein the connection strength between the at least one keyword is one of a correlation coefficient, a support degree and a reliability among the one or more keywords calculated based on the association analysis,
The polarity information is any one of positive, negative and neutral,
The emotion index for the review is set to a preset positive value if the end of the review is positive and to a negative value if the end of the review is negative and to 0 if the end of the review is neutral A goods offering server,
제 1 항에 있어서,
상기 프로세서는 상기 통신모듈을 통하여, 상기 하나 이상의 리뷰 제공 서버 중 상기 추출된 재화 정보와 대응되는 리뷰 제공 서버로 상기 추출된 재화 정보를 전송하여 상기 사용자 단말에 전달하는, 재화 제공 서버.
The method according to claim 1,
Wherein the processor transmits the extracted goods information to the review providing server corresponding to the extracted goods information among the one or more review providing servers through the communication module and delivers the extracted goods information to the user terminal.
제 1 항에 있어서,
상기 형태소 분석기는 문법 사전 데이터베이스를 포함하고,
상기 문법 사전 데이터베이스는 기계학습에 기초하여 업데이트되는 것인, 재화 제공 서버.
The method according to claim 1,
The morpheme analyzer includes a grammar dictionary database,
Wherein the grammar dictionary database is updated based on machine learning.
제 1 항에 있어서,
상기 프로세서는 상기 형태소 분석기를 통하여 추출된 단어 중 연속된 명사를 포함하는 단어를 하나의 키워드로 추출하는, 재화 제공 서버.
The method according to claim 1,
Wherein the processor extracts words containing consecutive nouns of the words extracted through the morpheme analyzer with one keyword.
제 1 항에 있어서,
상기 재화 정보 데이터베이스는 상기 하나 이상의 재화 정보에 대응하는 메타데이터를 저장하되,
상기 프로세서는 상기 저장된 하나 이상의 재화 정보에 대응하는 메타데이터에 기초하여, 상기 추출된 키워드와 매칭되는 재화 정보를 선택하는, 재화 제공 서버.
The method according to claim 1,
Wherein the goods information database stores metadata corresponding to the one or more goods information,
Wherein the processor selects the goods information matching the extracted keyword based on the metadata corresponding to the stored one or more goods information.
제 5 항에 있어서,
상기 프로세서는 상기 형태소 분석기에 기초하여 상기 리뷰에 포함된 하나 이상의 단어를 추출하고, 상기 메타데이터 및 온톨로지 사전에 기초하여 상기 추출된 하나 이상의 단어 중 하나 이상의 키워드를 추출하고, 상기 추출된 하나 이상의 키워드에 대한 점수를 산출하는, 재화 제공 서버.
6. The method of claim 5,
Wherein the processor extracts one or more words included in the review based on the morpheme analyzer, extracts one or more keywords of the extracted one or more words based on the meta data and the ontology dictionary, The server provides a score for the goods.
제 1 항에 있어서,
상기 프로세서는 상기 추출된 하나 이상의 키워드 및 상기 하나 이상의 재화 정보간의 일치되는 재화 정보의 개수에 기초하여 상기 선택된 재화 정보에 대한 점수를 계산하는, 재화 제공 서버.
The method according to claim 1,
Wherein the processor calculates a score for the selected goods information based on the number of matched goods information between the extracted one or more keywords and the one or more goods information.
삭제delete 재화 제공 서버에서의 자연어 처리에 기반한 재화 정보 제공 방법에 있어서,
형태소 분석기에 기초하여 하나 이상의 리뷰 제공 서버로부터 전달받은 리뷰에 포함된 하나 이상의 키워드를 추출하는 단계;
상기 리뷰의 어미에 기초하여 상기 리뷰의 극성 정보를 분석하고, 상기 분석된 극성 정보를 이용하여, 상기 리뷰에 대한 감성 지수를 산출하는 단계;
상기 추출된 하나 이상의 키워드에 대한 가중치 및 상기 산출된 감성 지수에 기초하여 상기 추출된 하나 이상의 키워드에 대한 점수를 산출하는 단계;
상기 추출된 하나 이상의 키워드에 대한 연관관계에 기초하여, 재화 정보 데이터베이스에 저장된 하나 이상의 재화 정보 중 상기 추출된 하나 이상의 키워드와 매칭되는 재화 정보를 선택하고, 상기 산출된 키워드에 대한 점수에 기초하여, 상기 선택된 재화 정보에 대한 점수를 계산하는 단계;
상기 계산된 재화 정보에 대한 점수가 높은 순으로 상기 사용자 단말에 추천될 재화 정보를 추출하는 단계;
상기 추출된 하나 이상의 키워드에 대한 연관관계에 기초하여 하나 이상의 키워드 간의 네트워크를 생성하는 단계; 및
상기 생성된 키워드 간의 네트워크 및 상기 추출된 재화 정보를 상기 사용자 단말에 전송하는 단계를 포함하되,
상기 리뷰는 상기 사용자 단말에 의해 생성된 후, 상기 리뷰 제공 서버에 저장된 것이며,
상기 추출된 하나 이상의 키워드에 대한 가중치는 상기 추출된 하나 이상의 키워드에 포함된 각각의 키워드에 대한 가중치를 이용하여 산출된 것이고,
상기 각각의 키워드에 대한 가중치는 상기 리뷰에 포함된 상기 가중치를 산출할 키워드의 개수 및 상기 리뷰 제공 서버에 포함된 하나 이상의 리뷰 중 상기 가중치를 산출할 키워드를 포함하는 리뷰의 개수에 기초하여 산출되며,
상기 추출된 하나 이상의 키워드에 대한 연관관계는 상기 재화 정보 데이터베이스에 저장된 하나 이상의 재화 정보에 대한 연관관계 분석에 기초하여 기생성된 것이며,
상기 키워드 간의 네트워크는 상기 하나 이상의 키워드 간의 연결강도에 기초하여 생성된 것이며,
상기 하나 이상의 키워드 간의 연결 강도는 상기 연관관계 분석에 기초하여 산출된 상기 하나 이상의 키워드 간의 상관 계수, 지지도 및 신뢰도 중 어느 하나이고,
상기 극성 정보는 긍정, 부정 및 중립 중 어느 하나이며,
상기 리뷰에 대한 감성 지수는 상기 리뷰의 어미가 긍정이면, 미리 설정된 양수 값으로 설정되며, 상기 리뷰의 어미가 부정이면, 미리 설정된 음수 값으로 설정되며, 상기 리뷰의 어미가 중립이면 0으로 설정되는 것인, 재화 제공 방법.
A method for providing goods information based on natural language processing in a goods providing server,
Extracting one or more keywords included in the review received from at least one review providing server based on the morpheme analyzer;
Analyzing the polarity information of the review based on the end of the review, and calculating an emotion index for the review using the analyzed polarity information;
Calculating a score for the extracted one or more keywords based on the weight for the extracted one or more keywords and the calculated emotion index;
Selecting one or more goods information items matching the extracted one or more goods information items from among one or more goods information items stored in the goods information database based on the extracted relation of one or more keywords, Calculating a score for the selected good;
Extracting the goods information to be recommended to the user terminal in descending order of the score of the calculated goods information;
Generating a network between one or more keywords based on an association relation of the extracted one or more keywords; And
And transmitting the network of generated keywords and the extracted goods information to the user terminal,
Wherein the review is generated by the user terminal and then stored in the review providing server,
Wherein the weight of the extracted one or more keywords is calculated by using a weight for each keyword included in the extracted one or more keywords,
The weight for each of the keywords is calculated based on the number of keywords included in the review and the number of reviews including the keyword to calculate the weight among the one or more reviews included in the review providing server ,
Wherein the association relation for the extracted one or more keywords is preliminarily generated on the basis of an association analysis for one or more goods information stored in the goods information database,
Wherein the network between the keywords is generated based on a connection strength between the at least one keyword,
Wherein the connection strength between the at least one keyword is one of a correlation coefficient, a support degree and a reliability among the one or more keywords calculated based on the association analysis,
The polarity information is any one of positive, negative and neutral,
The emotion index for the review is set to a preset positive value if the end of the review is positive and to a negative value if the end of the review is negative and to 0 if the end of the review is neutral A method of providing goods.
KR1020150019616A 2015-02-09 2015-02-09 Server and method for goods providing based on natural language processing KR101647087B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150019616A KR101647087B1 (en) 2015-02-09 2015-02-09 Server and method for goods providing based on natural language processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150019616A KR101647087B1 (en) 2015-02-09 2015-02-09 Server and method for goods providing based on natural language processing

Publications (1)

Publication Number Publication Date
KR101647087B1 true KR101647087B1 (en) 2016-08-09

Family

ID=56712683

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150019616A KR101647087B1 (en) 2015-02-09 2015-02-09 Server and method for goods providing based on natural language processing

Country Status (1)

Country Link
KR (1) KR101647087B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101838573B1 (en) * 2017-02-08 2018-03-14 서울대학교산학협력단 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon
CN109857852A (en) * 2019-01-24 2019-06-07 安徽商贸职业技术学院 A kind of the screening judgment method and system of electric business online comment training set feature
KR20190101156A (en) * 2018-02-22 2019-08-30 삼성전자주식회사 Electric apparatus and method for control thereof
KR102107341B1 (en) * 2019-09-27 2020-05-28 최영 Shared kitchen based restaurant management system
WO2021195133A1 (en) * 2020-03-23 2021-09-30 Sorcero, Inc. Cross-class ontology integration for language modeling
KR20220147833A (en) * 2021-04-28 2022-11-04 한양대학교 산학협력단 Explainable recommendation system and method incorporating sentiment on relations into knowledge graph and reinforcement learning

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110045519A (en) * 2009-10-27 2011-05-04 주식회사 버즈니 Entity searching and opinion mining system of hybrid-based using internet and method thereof
JP2011180945A (en) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd Device, method and program for selecting recommended commodity and sales support system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110045519A (en) * 2009-10-27 2011-05-04 주식회사 버즈니 Entity searching and opinion mining system of hybrid-based using internet and method thereof
JP2011180945A (en) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd Device, method and program for selecting recommended commodity and sales support system

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101838573B1 (en) * 2017-02-08 2018-03-14 서울대학교산학협력단 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon
KR102551343B1 (en) * 2018-02-22 2023-07-05 삼성전자주식회사 Electric apparatus and method for control thereof
KR20190101156A (en) * 2018-02-22 2019-08-30 삼성전자주식회사 Electric apparatus and method for control thereof
US11544469B2 (en) 2018-02-22 2023-01-03 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
CN109857852B (en) * 2019-01-24 2021-02-23 安徽商贸职业技术学院 Method and system for screening and judging characteristics of E-commerce online comment training set
CN109857852A (en) * 2019-01-24 2019-06-07 安徽商贸职业技术学院 A kind of the screening judgment method and system of electric business online comment training set feature
KR102107341B1 (en) * 2019-09-27 2020-05-28 최영 Shared kitchen based restaurant management system
WO2021195133A1 (en) * 2020-03-23 2021-09-30 Sorcero, Inc. Cross-class ontology integration for language modeling
US11151982B2 (en) 2020-03-23 2021-10-19 Sorcero, Inc. Cross-context natural language model generation
US11557276B2 (en) 2020-03-23 2023-01-17 Sorcero, Inc. Ontology integration for document summarization
US11636847B2 (en) 2020-03-23 2023-04-25 Sorcero, Inc. Ontology-augmented interface
US11699432B2 (en) 2020-03-23 2023-07-11 Sorcero, Inc. Cross-context natural language model generation
US11790889B2 (en) 2020-03-23 2023-10-17 Sorcero, Inc. Feature engineering with question generation
US11854531B2 (en) 2020-03-23 2023-12-26 Sorcero, Inc. Cross-class ontology integration for language modeling
KR20220147833A (en) * 2021-04-28 2022-11-04 한양대학교 산학협력단 Explainable recommendation system and method incorporating sentiment on relations into knowledge graph and reinforcement learning
KR102633688B1 (en) * 2021-04-28 2024-02-05 한양대학교 산학협력단 Explainable recommendation system and method incorporating sentiment on relations into knowledge graph and reinforcement learning

Similar Documents

Publication Publication Date Title
KR101647087B1 (en) Server and method for goods providing based on natural language processing
US10180967B2 (en) Performing application searches
US8838438B2 (en) System and method for determining sentiment from text content
US9235646B2 (en) Method and system for a search engine for user generated content (UGC)
KR101419504B1 (en) System and method providing a suited shopping information by analyzing the propensity of an user
US20160328401A1 (en) Method and apparatus for recommending hashtags
Margaris et al. What makes a review a reliable rating in recommender systems?
US20150089409A1 (en) System and method for managing opinion networks with interactive opinion flows
US10437894B2 (en) Method and system for app search engine leveraging user reviews
US11127063B2 (en) Product and content association
US20140257795A1 (en) Linguistic Expression of Preferences in Social Media for Prediction and Recommendation
WO2014183089A9 (en) Hybrid human machine learning system and method
US11263664B2 (en) Computerized system and method for augmenting search terms for increased efficiency and effectiveness in identifying content
WO2012003034A1 (en) Infinite browse
IL227140A (en) System and method for performing a semantic operation on a digital social network
JP6137960B2 (en) Content search apparatus, method, and program
US11430049B2 (en) Communication via simulated user
KR101758695B1 (en) Multi korean wave contents search and recommendation system based on social taste anaysis
Sun et al. A hybrid approach for article recommendation in research social networks
KR101866411B1 (en) Method for providing document recommandation information, and device using the same
KR20220026255A (en) Recommendation System for Health Supplement by Using Big Data
US11256703B1 (en) Systems and methods for determining long term relevance with query chains
KR20150022583A (en) Apparatus for extracting keyword and method thereof
CN115618126A (en) Search processing method, system, computer readable storage medium and computer device
CN110930208B (en) Object searching method and device

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant