KR20140089452A - Method for analysing user interssts based on comment analysis and apparatus thereof - Google Patents
Method for analysing user interssts based on comment analysis and apparatus thereof Download PDFInfo
- Publication number
- KR20140089452A KR20140089452A KR1020130000943A KR20130000943A KR20140089452A KR 20140089452 A KR20140089452 A KR 20140089452A KR 1020130000943 A KR1020130000943 A KR 1020130000943A KR 20130000943 A KR20130000943 A KR 20130000943A KR 20140089452 A KR20140089452 A KR 20140089452A
- Authority
- KR
- South Korea
- Prior art keywords
- interest
- user
- index
- comment
- internet site
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000004458 analytical method Methods 0.000 title abstract description 26
- 239000000284 extract Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008685 targeting Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000013515 script Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 명세서는 사용자 관심사 분석 장치 및 방법에 관한 것으로서, 보다 상세하게는 사용자가 인터넷 사이트에서 작성한 댓글 및/또는 본문글의 내용을 바탕으로 사용자의 관심사를 찾아내는 방법 및 그에 사용되는 서버에 관한 것이다.The present invention relates to an apparatus and method for analyzing a user interest, and more particularly, to a method of finding a user's interest on the basis of a content of a comment and / or text written by a user on an Internet site and a server used therein.
최근, 통신 네트워크가 비약적으로 발전함에 따라, 기존의 고정된 컴퓨터를 이용하는 통신 서비스 뿐만 아니라 이동단말을 이용한 통신 서비스의 이용률이 급증하고 있고 이에 힘입어 각종 통신 서비스의 종류가 매우 다양해지고 잇다. 2. Description of the Related Art [0002] With the rapid development of communication networks in recent years, the utilization rates of communication services using mobile terminals as well as communication services using existing fixed computers have been rapidly increasing.
이러한 컴퓨터 및/또는 이동단말을 위한 통신 서비스 중 가장 대표적인 것으로는, 음악, 동영상, 쿠폰 등의 다양한 컨텐츠나 어플리케이션 프로그램을 구매할 수 있도록 하는 컨텐츠 제공서비스, 앱 스토어 등이 있다.Among the communication services for such computers and / or mobile terminals, there are a content providing service and an app store for purchasing various contents and application programs such as music, movies, and coupons.
최근 이러한 컨텐츠 또는 어플리케이션을 전문 제작자가 아닌 일반 사용자들도 충분히 자체 제작이 가능한 환경이 조성됨에 따라, 온라인 상에 존재하는 컨텐츠의 수와 종류가 무수히 많아지고 있는 실정이다.In recent years, since the environment in which such contents or applications can be produced in a self sufficient manner by general users other than professional producers has been developed, the number and kinds of contents existing on the online are in myriad.
이에 따라 일반 사용자는 컨텐츠나 어플리케이션 등의 구매를 위해 온라인 상에서 자신의 기호나 취향에 맞는 가장 필요한 컨텐츠가 무엇인지 찾는 것이 점점 어려워지고 있다. 또한 제공자의 입장에서도 각 사용자의 취향에 맞는 프로모션을 진행하기에도 어려움이 있다.Accordingly, it is becoming increasingly difficult for general users to find out what contents most necessary for their preferences or preferences online for purchasing contents or applications. Also, from the perspective of the provider, it is also difficult to carry out a promotion according to each user's taste.
따라서, 가입자에게 컨텐츠를 광고/추천하는 서비스를 제공하기 위한 보다 효율적인 방안이 요청되고 있다.Accordingly, there is a need for a more efficient scheme for providing a service for advertising / recommending contents to subscribers.
본 명세서는 사용자 관심사 분석 장치 및 방법을 제공하는 데에 그 목적이 있다. 보다 구체적으로는 사용자가 인터넷 사이트에서 작성한 댓글 및/또는 본문글의 내용을 바탕으로 사용자의 관심사를 찾아낸 후, 사용자 별 관심사를 기반으로 개인화 추천, 광고 타겟팅, 프로모션 진행 등 개인 맞춤형 서비스를 제공하는 서버와 그 방법을 제공하는 것에 목적이 있다.It is an object of the present invention to provide a user interest analysis apparatus and method. More specifically, after finding a user's interest on the basis of the contents of a comment and / or a text written by a user on an Internet site, a server providing personalized services such as personalization recommendation, advertisement targeting, And to provide a method thereof.
본 명세서의 일 실시예에 따라 사용자 관심사 분석 서버가 제공된다. 상기 서버는 사용자가 인터넷 사이트에 작성한 댓글 및 상기 댓글이 첨부된 본문글 중 적어도 하나를 분석하여 상기 사용자의 관심사를 추정하는 관심사 추정부와; 상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 관심지수 산출부와; 상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 관심사 결정부를 포함할 수 있다.A user interest analysis server is provided in accordance with one embodiment of the present disclosure. The server includes an interest estimator for estimating a user's interest by analyzing at least one of a comment made by a user on an Internet site and a text attached to the comment; An interest index calculating unit for calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text; And an interest determination unit that determines the interest of the user based on the calculated interest index.
상기 관심사 추정부는 상기 본문글로부터 키워드를 추출하고, 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정하며, 상기 관심지수 산출부는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출할 수 있다.Wherein the interest estimator extracts a keyword from the text and estimates the interest corresponding to the extracted keyword as the interest of the user, and the interest index calculating unit calculates at least one of the propensity and frequency of the comment corresponding to the estimated interest, May be used to calculate an interest index for each of the estimated interests.
상기 관심지수 산출부는 상기 인터넷 사이트의 속성에 따른 가중치를 더 반영하여 상기 관심지수를 산출할 수 있다.The interest index calculating unit may calculate the interest index by further reflecting the weight according to the property of the Internet site.
상기 인터넷 사이트의 속성은 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분되며, 상기 관심지수 산출부는 상기 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출하거나, 또는 상기 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출할 수 있다.The attributes of the Internet site are classified into an Internet site related to purchase of goods and an Internet site related to a community, and the interest index calculating unit may reflect a larger weight to a comment written on the Internet site related to the purchase of the product by the user, A related interest index may be calculated or a preference related interest index of the user may be calculated by reflecting a larger weight on a comment written on the internet site related to the interest group by the user.
상기 사용자의 구매 관련 관심지수를 산출하는 경우, 상기 서버는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 관심사 제공부를 더 포함할 수 있다.The server may further include an interest providing unit for providing the advertiser with the interest of the user determined based on the purchase related interest index when the purchase interest index of the user is calculated.
상기 사용자의 선호 관련 관심지수를 산출하는 경우, 상기 서버는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 관심사 제공부를 더 포함할 수 있다.The server may further include an interest provider for providing the application or the content provider with the interest of the user determined based on the preference related interest index when the user calculates the preference related interest index.
본 명세서의 다른 실시예에 따라 사용자 관심사 분석 방법이 제공된다. 상기 방법은 사용자가 인터넷 사이트에 작성한 댓글 및 상기 댓글이 첨부된 본문글 중 적어도 하나를 분석하여 상기 사용자의 관심사를 추정하는 단계와; 상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 단계와; 상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 단계를 포함할 수 있다.According to another embodiment of the present disclosure, a user interest analysis method is provided. Analyzing at least one of a comment made by the user on the internet site and a text attached to the comment to estimate the user's interest; Calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text; And determining the interest of the user based on the calculated interest index.
상기 사용자의 관심사를 추정하는 단계는 상기 본문글로부터 키워드를 추출하는 단계와; 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정하는 단계를 포함하고,The step of estimating the interest of the user may include extracting keywords from the text article; Estimating the interest corresponding to the extracted keyword as the interest of the user,
상기 관심지수를 산출하는 단계는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계일 수 있다.The step of calculating the interest index may be a step of calculating an interest index for each of the estimated interest using at least one of a tendency and a frequency of comments corresponding to the estimated interest.
상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는 상기 인터넷 사이트의 속성에 따른 가중치를 더 반영하여 상기 관심지수를 산출하는 단계일 수 있다.The step of calculating the interest index for each of the estimated interests may further include the step of calculating the interest index further reflecting the weight according to the property of the internet site.
상기 인터넷 사이트의 속성은 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분되며, 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는 상기 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출하는 단계이거나, 또는 상기 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출하는 단계일 수 있다.Wherein the attribute of the Internet site is classified into an Internet site related to purchase of goods and an Internet site related to a community, and the step of calculating an interest index for each of the estimated interests includes: A step of calculating a purchase interest index of the user by reflecting a large weight or a step of calculating a preference related interest index of the user by reflecting a larger weight on a comment written on an internet site related to a fellowship have.
상기 방법은 상기 사용자의 구매 관련 관심지수를 산출하는 경우는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 단계를 더 포함할 수 있다.The method may further include providing the advertiser with an interest of the user determined based on the purchase related interest index in the case of calculating the purchasing interest index of the user.
상기 방법은 상기 사용자의 선호 관련 관심지수를 산출하는 경우는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 단계를 더 포함할 수 있다.The method may further include providing the application or the content provider with the interest of the user determined based on the preference related interest index when calculating the preference related interest index of the user.
본 명세서의 실시예들은 사용자가 작성한 댓글 또는 본문글의 내용을 바탕으로 사용자의 관심사를 찾아 최적화된 개인 맞춤형 추천 서비스를 제공할 수 있는 효과가 있다. 더 나아가 발굴된 사용자의 관심사를 다양한 제휴 사이트에 제공하여 해당 사용자에게 다각적인 프로모션 등을 타겟팅(cross offering)할 수 있는 효과도 성취할 수 있다.The embodiments of the present invention have the effect of providing a personalized personalized recommendation service optimized for a user's interest based on the contents of a comment or a text written by a user. Furthermore, it is possible to achieve the effect of cross-offering a diverse promotion to the user by providing the interests of the discovered users to various affiliate sites.
도 1은 본 발명의 일 실시예에 따른 사용자 관심사 분석 서버의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 사용자 관심사 분석 방법을 나타낸 흐름도이다.1 is a block diagram of a user interest analysis server according to an embodiment of the present invention.
2 is a flowchart illustrating a method of analyzing a user interest according to an embodiment of the present invention.
본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 명세서에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는, 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.It is noted that the technical terms used herein are used only to describe specific embodiments and are not intended to limit the invention. It is also to be understood that the technical terms used herein are to be interpreted in a sense generally understood by a person skilled in the art to which the present invention belongs, Should not be construed to mean, or be interpreted in an excessively reduced sense. Further, when a technical term used herein is an erroneous technical term that does not accurately express the spirit of the present invention, it should be understood that technical terms that can be understood by a person skilled in the art are replaced. In addition, the general terms used in the present invention should be interpreted according to a predefined or prior context, and should not be construed as being excessively reduced.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니됨을 유의해야 한다. 본 발명의 사상은 첨부된 도면 외에 모든 변경, 균등물 내지 대체물에 까지도 확장되는 것으로 해석되어야 한다.
Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings, wherein like reference numerals refer to like or similar elements throughout the several views, and redundant description thereof will be omitted. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail. It is to be noted that the accompanying drawings are only for the purpose of facilitating understanding of the present invention, and should not be construed as limiting the scope of the present invention with reference to the accompanying drawings. The spirit of the present invention should be construed as extending to all modifications, equivalents, and alternatives in addition to the appended drawings.
도 1은 본 발명의 일 실시예에 따른 사용자 관심사 분석 서버의 블록도이다.1 is a block diagram of a user interest analysis server according to an embodiment of the present invention.
도 1을 참고하여 보면, 상기 사용자 관심사 분석 서버(100)는 관심사 추정부(101), 관심지수 산출부(102), 관심사 결정부(103)을 포함하여 구성될 수 있다.Referring to FIG. 1, the user
상기 서버는 특정 사용자의 웹 사이트 이용 형태, 참여 성향 등을 분석하여 해당 사용자의 관심사를 추출하고, 그 결과가 개인화 추천이나 마케팅 등에 활용되도록 할 수 있다. 특히 상기 서버는 특정 사용자가 인터넷 사이트에서 작성한 댓글(reply)과 그 댓글이 첨부된 본문글을 분석하여 해당 사용자의 관심사를 파악할 수 있다. 본 명세서에서 개시하는 방법 및 장치에 의해 사용자의 관심사가 분석되면, 해당 관심사와 가장 밀접한 어플리케이션(Application), 컨텐츠 등의 추천을 제공할 수 있다. 또한. 개인별로 정의된 관심사를 기반으로 해당 관심사와 가장 관련성이 높은 내용의 광고를 우선 노출하거나, 광고주가 해당 광고에 맞는 관심사에 정의된 고객을 타겟팅하는 서비스를 제공할 수도 있으며, 프로모션 대상 고객 선정 시, 특정 관심사에 정의된 고객을 타겟팅할 수도 있다.The server can analyze a user's use of a web site, participation tendency, etc. of the specific user, extract the interest of the user, and make the result utilized for personalization recommendation or marketing. Particularly, the server can analyze a reply made by a specific user at an internet site and a text article to which the comment is attached to grasp interest of the user. When a user's interest is analyzed by the method and apparatus disclosed in the present specification, it is possible to provide recommendation of an application, content, etc. closest to the interest. Also. Based on the individual-defined interests, the advertiser may first provide the advertisement with the highest relevance to the interest, or the advertiser may provide the service targeting the customer defined in the interest of the advertisement, You can also target customers defined for specific interests.
사용자 관심사 분석 서버(100)의 관심사 추정부(101)는 어느 사용자가 인터넷 사이트에 작성한 댓글 및 상기 댓글이 첨부된 본문글 중 적어도 하나를 분석하여 상기 사용자의 관심사를 추정할 수 있다. The interest estimating
즉, 특정 인터넷 사이트에서 어느 사용자가 작성한 댓글의 내용 및/또는 해당 댓글이 첨부된 본문글의 형태소 분석을 통해 유의미한 키워드를 추출하며, 추출한 키워드를 기반으로 사용자의 관심사를 분석할 수 있는 것이다. 예를 들어, 본문글에서 상품/서비스 등에 연관된 키워드가 추출되는 경우에, 상기 상품/서비스의 명칭 또는 메타 데이터와 매핑된 관심사 항목들을 상기 사용자의 관심사로 추정할 수 있다. 만약 관심사 추정 대상 사용자가 "디지털 카메라"판매와 관련된 인터넷 사이트에서 어느 한 기종의 카메라에 대한 판매글에 다수의 댓글을 남겼다면, 상기 사용자의 관심사는 "디지털 카메라"일 것으로 추정할 수 있으며, 또 다르게는 어느 사용자가 사진 동호회 사이트에서 타 사용자가 작성한 카메라에 대한 글에 여러 댓글을 달았다면 이러한 기록(정보)들로부터도 상기 사용자의 관심사는 "디지털 카메라"임을 추정할 수 있다. That is, the user can extract a meaningful keyword from the morphological analysis of the content of a comment created by a user on a specific Internet site and / or the text of the text to which the comment is attached, and analyze the user's interest based on the extracted keyword. For example, when a keyword associated with a product / service is extracted from a text article, the name of the goods / service or interest items mapped with the metadata may be estimated as the interest of the user. If the subject of interest estimation left a large number of comments on the sale text for a camera of one type on the Internet site related to the sale of "digital camera", the user's interest could be presumed to be "digital camera" Alternatively, if a user has made various comments on a photo about a camera created by another user at a photo community site, the user's interest can be estimated from such records (information) as a "digital camera".
사용자의 관심사를 추정하는 일 실시예로서, 상기 관심사 추정부(101)는 상기 본문글로부터 키워드를 추출하고, 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정할 수 있다. 이러한 방식은 어느 사용자가 댓글을 작성하는 행위를 통하여 (댓글을 남긴) 본문글의 특정 내용에 해당 사용자의 관심사가 존재한다는 사실에 착안한 것이며, 더 나아가 관련 댓글이 많을수록 관련 내용에 해당 사용자의 관심이 크다는 점에 근거한 것이다. The interest estimating
위와 같이 본문글의 키워드를 중심으로 댓글 작성자의 관심사가 하나 이상 추정된다면, 상기 관심지수 산출부(102)는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출한다. 또 다르게는 최신 시점에 작성된 댓글에 더 큰 가중치를 두어 관심지수를 산출하는 것도 가능하다.If one or more interests of the commenter are estimated based on the keyword of the main text as described above, the interest
한편, 본문글로부터 추출된 키워드와 직접 맵핑된 관심사 뿐만 아니라, 그 관심사에 흥미를 갖는 사용자들이 함께 관심을 갖는 다른 관심사(잠재적 관심사)도 추론하여 이에 대한 관심지수를 산출할 수도 있다. 예를 들어 "자동차"에 관심을 갖는 사람들이 함께 관심을 갖는 관심사에 "보험"이 있다면, "보험"이라는 관심사에 대하여도 관심지수를 산출하거나, 또는 이러한 잠재적 관심사에 대하여 광고 타겟팅, 추천제공 등을 수행할 수도 있다.상기에서 댓글의 성향이란 특정 내용에 대한 "긍정적인" 또는 "부정적인"댓글을 의미할 수 있다. 즉, 본문글에서 추출된 관심사에 대하여 "긍정적인" 댓글이 있다면 해당 관심사에 양(+)의 관심지수를 예상할 수 있으며, 반대로 추정된 어느 관심사에 대하여"부정적인" 댓글이 있다면 해당 관심사에 음(-)의 관심지수를 예상할 수 있다.On the other hand, not only the interests mapped directly to the keywords extracted from the text, but also other interests (potential interests) interested by the users interested in the interest may be deduced to calculate the interest index. For example, if people interested in "automobiles" have "insurance" in their interests, they can also calculate interest indices for "insurance" interests, or provide ads targeting, recommendations, etc. for these potential interests In the above, the propensity of a comment may mean "positive" or "negative" That is, if there is a "positive" comment on the interest extracted from the text, a positive (+) interest index can be expected for that interest, and if there is a "negative" (-) of interest index can be expected.
한편, 댓글의 빈도수란 추정된 어느 관심사에 대하여 남겨진 댓글의 횟수일 수 있다. 즉 댓글을 작성한 행위의 수가 많을수록 해당 관심사에 대한 관심지수가 크다고 정의할 수 있는 것이다.On the other hand, the frequency of comments may be the number of comments left for an estimated interest. That is, the greater the number of comments, the greater the interest index for the interest.
상기 관심지수 산출부(102)는 댓글의 성향 및 빈도수라는 두 가지 변수 중 어느 하나를 사용하거나 또는 두 가지를 조합하여 어느 관심사에 대한 사용자의 관심지수를 산출한다. 이때 상기 관심지수 산출부(102)는 위의 두 가지 변수에 더하여 본문글과 댓글이 남겨진 "인터넷 사이트"의 속성에 따라 사용자의 관심지수를 산출할 수도 있다. 인터넷 사이트 속성은 여러 가지로 구분될 수다. 방문자 수에 따른 등급, 상업적/비상업적, 상품구매/취미(동호회) 방문자 수에 따른 등급, 상업적/비상업적, 상품구매/취미(동호회) 사이트 등으로 사이트의 속성을 구분하는 것이 그 예이다.The interest
본 명세서에서 제안하는 일 실시예에서는 상기 인터넷 사이트의 속성을 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분한다. 상기와 같이 구분하는 이유는 직접 상품/서비스 구매가 이루어지는 인터넷 사이트에서의 활동(즉, 댓글 작성)은 해당 사용자의 구매 관심도를 암시할 가능성이 크고, 동호회 활동과 관련된 인터넷 사이트에서의 활동은 해당 사용자의 순수 선호도를 암시할 가능성이 크기 때문이다. 다시 말해 직접적인 상품 구매는 사용자의 수입, 지출 패턴 등에 제약을 받을 수 있으며, 반면 순수한 취미 활동은 사용자의 관심사항을 보다 자유롭게 드러낼 수 있음을 감안하는 것이다. In one embodiment of the present invention, an attribute of the Internet site is classified into an Internet site related to purchase of goods and an Internet site related to a community. The reason for distinguishing the above is that there is a high possibility that the activity (i.e., comment creation) on the Internet site where the direct product / service purchase is made implies the purchase interest of the user, and the activity on the Internet site related to the activity Is likely to suggest a pure preference of. In other words, direct product purchases can be constrained by the user's income and expenditure patterns, while pure hobbies allow users to express their interests more freely.
따라서 상기 관심지수 산출부(102)는 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출할 수 있으며, 다르게는 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출할 수도 있다. Therefore, the interest
위와 같이 산출된 관심지수와 관심지수는 각각 별도의 용도로 이용될 수 있다. 예를 들어 사용자의 구매 관련 관심지수를 산출하는 경우, 상기 사용자 관심사 분석 서버(100)는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 관심사 제공부를 더 포함하여 상기 구매 관련 관심지수를 기반으로 한 마케팅, 광고 등을 지원할 수 있다. 또는 사용자의 선호 관련 관심지수를 산출하는 경우, 상기 사용자 관심사 분석 서버(100)는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 관심사 제공부를 더 포함하여 상기 선호 관련 관심지수를 기반으로 한 애플리케이션, 컨텐츠 등의 개인화 추천을 지원할 수 있다.The index of interest and the index of interest calculated as above can be used separately. For example, when calculating the purchasing interest index of the user, the user
상기 관심사 결정부(103)는 상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정한다. 예를 들어, 본문글 분석을 통해 추출된 다수개의 관심사 각각에 대하여 산출된 관심지수들을 내림차순으로 정렬하여 상위에 랭크된 관심사들을 해당 사용자의 관심사로 결정하는 것이다. 이와 같이 결정된 관심사들은 상술한 바와 같이 마케팅, 프로모션, 개인화 추천 등에 이용될 수 있다. 예를 들어, A라는 포털 사이트에 사용자가 "자동차"에 대한 본문글에 댓글을 많이 남겼다는 이력으로부터 해당 사용자가 "자동차"에 관심이 있다는 것을 알았다면, 해당 고객이 B 또는 C라는 인터넷 쇼핑몰에 접속했을 때 자동차 관련 제품 추천, 프로모션 제공 등이 가능하다. 인터넷 사이트 혹은 서비스 제공자간에 사용자 정보 연동이 가능하다고 전제한다면, 이러한 교차 제공(cross offering)도 수행될 수 있다.
The
도 2는 본 발명의 일 실시예에 따른 사용자 관심사 분석 방법을 나타낸 흐름도이다.2 is a flowchart illustrating a method of analyzing a user interest according to an embodiment of the present invention.
이하에서 상술하는 사용자 관심사 분석 방법은 사용자 관심사 분석 서버에 의해 수행될 수 있다.The user interest analysis method described below may be performed by the user interest analysis server.
상기 서버는 특정 사용자의 웹 사이트 이용 형태, 참여 성향 등을 분석하여 해당 사용자의 관심사를 추출하고, 그 결과가 개인화 추천이나 마케팅 등에 활용되도록 할 수 있다. 특히 상기 서버는 특정 사용자가 인터넷 사이트에서 작성한 댓글(reply)과 그 댓글이 첨부된 본문글을 분석하여 해당 사용자의 관심사를 파악할 수 있다. 본 명세서에서 개시하는 방법 및 장치에 의해 사용자의 관심사가 분석되면, 해당 관심사와 가장 밀접한 어플리케이션(Application), 컨텐츠 등의 추천을 제공할 수 있다. 또한. 개인별로 정의된 관심사를 기반으로 해당 관심사와 가장 관련성이 높은 내용의 광고를 우선 노출하거나, 광고주가 해당 광고에 맞는 관심사에 정의된 고객을 타겟팅하는 서비스를 제공할 수도 있으며, 프로모션 대상 고객 선정 시, 특정 관심사에 정의된 고객을 타겟팅할 수도 있다.The server can analyze a user's use of a web site, participation tendency, etc. of the specific user, extract the interest of the user, and make the result utilized for personalization recommendation or marketing. Particularly, the server can analyze a reply made by a specific user at an internet site and a text article to which the comment is attached to grasp interest of the user. When a user's interest is analyzed by the method and apparatus disclosed in the present specification, it is possible to provide recommendation of an application, content, etc. closest to the interest. Also. Based on the individual-defined interests, the advertiser may first provide the advertisement with the highest relevance to the interest, or the advertiser may provide the service targeting the customer defined in the interest of the advertisement, You can also target customers defined for specific interests.
사용자 관심사 분석 서버는 어느 사용자가 인터넷 사이트에 작성한 댓글 및 상기 댓글이 첨부된 본문글 중 적어도 하나를 분석하여 상기 사용자의 관심사를 추정할 수 있다(S210).The user interest analysis server may estimate at least one of the user's comments on the internet site and the text attached with the comment to estimate the user's interest (S210).
즉, 특정 인터넷 사이트에서 어느 사용자가 작성한 댓글의 내용 및/또는 해당 댓글이 첨부된 본문글의 형태소 분석을 통해 유의미한 키워드를 추출하며, 추출한 키워드를 기반으로 사용자의 관심사를 분석할 수 있는 것이다. 예를 들어, 본문글에서 상품/서비스 등에 연관된 키워드가 추출되는 경우에, 상기 상품/서비스의 명칭 또는 메타 데이터와 매핑된 관심사 항목들을 상기 사용자의 관심사로 추정할 수 있다. 만약 관심사 추정 대상 사용자가 "디지털 카메라"판매와 관련된 인터넷 사이트에서 어느 한 기종의 카메라에 대한 판매글에 다수의 댓글을 남겼다면, 상기 사용자의 관심사는 "디지털 카메라"일 것으로 추정할 수 있으며, 또 다르게는 어느 사용자가 사진 동호회 사이트에서 타 사용자가 작성한 카메라에 대한 글에 여러 댓글을 달았다면 이러한 기록(정보)들로부터도 상기 사용자의 관심사는 "디지털 카메라"임을 추정할 수 있다. That is, the user can extract a meaningful keyword from the morphological analysis of the content of a comment created by a user on a specific Internet site and / or the text of the text to which the comment is attached, and analyze the user's interest based on the extracted keyword. For example, when a keyword associated with a product / service is extracted from a text article, the name of the goods / service or interest items mapped with the metadata may be estimated as the interest of the user. If the subject of interest estimation left a large number of comments on the sale text for a camera of one type on the Internet site related to the sale of "digital camera", the user's interest could be presumed to be "digital camera" Alternatively, if a user has made various comments on a photo about a camera created by another user at a photo community site, the user's interest can be estimated from such records (information) as a "digital camera".
사용자의 관심사를 추정하는 일 실시예로서, 상기 서버는 상기 본문글로부터 키워드를 추출하고, 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정할 수 있다. 이러한 방식은 어느 사용자가 댓글을 작성하는 행위를 통하여 (댓글을 남긴) 본문글의 특정 내용에 해당 사용자의 관심사가 존재한다는 사실에 착안한 것이며, 더 나아가 관련 댓글이 많을수록 관련 내용에 해당 사용자의 관심이 크다는 점에 근거한 것이다. In one embodiment of estimating a user's interest, the server extracts a keyword from the text and estimates a concern corresponding to the extracted keyword as a concern of the user. This method is based on the fact that the interest of the user exists in the specific content of the text (comment) by which a user creates a comment, and furthermore, the more relevant comments, It is based on the fact that it is big.
위와 같이 본문글의 키워드를 중심으로 댓글 작성자의 관심사가 하나 이상 추정된다면, 상기 서버는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출한다(S220). 또 다르게는 최신 시점에 작성된 댓글에 더 큰 가중치를 두어 관심지수를 산출하는 것도 가능하다.If one or more interests of the commentator are estimated based on the keyword of the main text as described above, the server calculates an index of interest for each of the estimated interests using at least one of the propensity and the frequency of the comment corresponding to the estimated interest (S220). Alternatively, it is also possible to calculate the interest index by placing a larger weight on the comments made at the latest point in time.
한편, 본문글로부터 추출된 키워드와 직접 맵핑된 관심사 뿐만 아니라, 그 관심사에 흥미를 갖는 사용자들이 함께 관심을 갖는 다른 관심사(잠재적 관심사)도 추론하여 이에 대한 관심지수를 산출할 수도 있다. 예를 들어 "자동차"에 관심을 갖는 사람들이 함께 관심을 갖는 관심사에 "보험"이 있다면, "보험"이라는 관심사에 대하여도 관심지수를 산출하거나, 또는 이러한 잠재적 관심사에 대하여 광고 타겟팅, 추천제공 등을 수행할 수도 있다.On the other hand, not only the interests mapped directly to the keywords extracted from the text, but also other interests (potential interests) interested by the users interested in the interest may be deduced to calculate the interest index. For example, if people interested in "automobiles" have "insurance" in their interests, they can also calculate interest indices for "insurance" interests, or provide ads targeting, recommendations, etc. for these potential interests . ≪ / RTI >
상기에서 댓글의 성향이란 특정 내용에 대한 "긍정적인" 또는 "부정적인"댓글을 의미할 수 있다. 즉, 본문글에서 추출된 관심사에 대하여 "긍정적인" 댓글이 있다면 해당 관심사에 양(+)의 관심지수를 예상할 수 있으며, 반대로 추정된 어느 관심사에 대하여"부정적인" 댓글이 있다면 해당 관심사에 음(-)의 관심지수를 예상할 수 있다.In the above, the propensity of a comment may mean a "positive" or "negative" comment on a particular content. That is, if there is a "positive" comment on the interest extracted from the text, a positive (+) interest index can be expected for that interest, and if there is a "negative" (-) of interest index can be expected.
한편, 댓글의 빈도수란 추정된 어느 관심사에 대하여 남겨진 댓글의 횟수일 수 있다. 즉 댓글을 작성한 행위의 수가 많을수록 해당 관심사에 대한 관심지수가 크다고 정의할 수 있는 것이다.On the other hand, the frequency of comments may be the number of comments left for an estimated interest. That is, the greater the number of comments, the greater the interest index for the interest.
상기 서버는 댓글의 성향 및 빈도수라는 두 가지 변수 중 어느 하나를 사용하거나 또는 두 가지를 조합하여 어느 관심사에 대한 사용자의 관심지수를 산출한다. 이때 상기 서버는 위의 두 가지 변수에 더하여 본문글과 댓글이 남겨진 "인터넷 사이트"의 속성에 따라 사용자의 관심지수를 산출할 수도 있다. 인터넷 사이트 속성은 여러 가지로 구분될 수다. 방문자 수에 따른 등급, 상업적/비상업적, 상품구매/취미(동호회) 사이트 등으로 사이트의 속성을 구분하는 것이 그 예이다.The server uses either one of two variables, the propensity and frequency of comments, or a combination of the two, to calculate the user's interest index for a particular interest. At this time, the server may calculate the interest index of the user according to the attributes of the "Internet site " in addition to the above two variables. Internet site properties can be divided into several categories. This is an example of distinguishing the attributes of a site by the number of visitors, commercial / non-commercial, commodity purchase / hobby (club) sites.
본 명세서에서 제안하는 일 실시예에서는 상기 인터넷 사이트의 속성을 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분한다. 상기와 같이 구분하는 이유는 직접 상품/서비스 구매가 이루어지는 인터넷 사이트에서의 활동(즉, 댓글 작성)은 해당 사용자의 구매 관심도를 암시할 가능성이 크고, 동호회 활동과 관련된 인터넷 사이트에서의 활동은 해당 사용자의 순수 선호도를 암시할 가능성이 크기 때문이다. 다시 말해 직접적인 상품 구매는 사용자의 수입, 지출 패턴 등에 제약을 받을 수 있으며, 반면 순수한 취미 활동은 사용자의 관심사항을 보다 자유롭게 드러낼 수 있음을 감안하는 것이다. In one embodiment of the present invention, an attribute of the Internet site is classified into an Internet site related to purchase of goods and an Internet site related to a community. The reason for distinguishing the above is that there is a high possibility that the activity (i.e., making a comment) on the Internet site where the direct product / service purchase is made implies the purchase interest of the user, and the activity on the Internet site related to the activity Is likely to suggest a pure preference of. In other words, direct product purchases can be constrained by the user's income and expenditure patterns, while pure hobbies allow users to express their interests more freely.
따라서 상기 서버는 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출할 수 있으며, 다르게는 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출할 수도 있다. Therefore, the server can calculate the purchase interest index of the user by reflecting a larger weight on the comment written on the Internet site related to the purchase of the goods by the user. Alternatively, And may calculate the preference related interest index of the user by reflecting the weight.
위와 같이 산출된 관심지수와 관심지수는 각각 별도의 용도로 이용될 수 있다. 예를 들어 사용자의 구매 관련 관심지수를 산출하는 경우, 상기 사용자 관심사 분석 서버는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 관심사 제공부를 더 포함하여 상기 구매 관련 관심지수를 기반으로 한 마케팅, 광고 등을 지원할 수 있다. 또는 사용자의 선호 관련 관심지수를 산출하는 경우, 상기 사용자 관심사 분석 서버는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 관심사 제공부를 더 포함하여 상기 선호 관련 관심지수를 기반으로 한 애플리케이션, 컨텐츠 등의 개인화 추천을 지원할 수 있다.The index of interest and the index of interest calculated as above can be used separately. The user interest analysis server may further include a concern provider for providing an advertiser with a concern of the user determined based on the purchase interest index, when calculating a purchase interest index of a user, Based marketing, advertising, and so on. The user interest analysis server may further include a concern provider for providing the application or the content provider with the interest of the user determined based on the preference related interest index, when the preference related interest index is calculated, Can support personalized recommendation of applications, contents,
상기 서버는 상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정한다(S230). 예를 들어, 본문글 분석을 통해 추출된 다수개의 관심사 각각에 대하여 산출된 관심지수들을 내림차순으로 정렬하여 상위에 랭크된 관심사들을 해당 사용자의 관심사로 결정하는 것이다. 이와 같이 결정된 관심사들은 상술한 바와 같이 마케팅, 프로모션, 개인화 추천 등에 이용될 수 있다. 예를 들어, A라는 포털 사이트에 사용자가 "자동차"에 대한 본문글에 댓글을 많이 남겼다는 이력으로부터 해당 사용자가 "자동차"에 관심이 있다는 것을 알았다면, 해당 고객이 B 또는 C라는 인터넷 쇼핑몰에 접속했을 때 자동차 관련 제품 추천, 프로모션 제공 등이 가능하다. 인터넷 사이트 혹은 서비스 제공자간에 사용자 정보 연동이 가능하다고 전제한다면, 이러한 교차 제공(cross offering)도 수행될 수 있다.The server determines the interest of the user based on the calculated interest index (S230). For example, the interest indexes calculated for each of the plurality of interests extracted through the text article analysis are sorted in descending order, and the ranked interests are determined as interests of the user. Such determined interests can be used for marketing, promotion, personalized recommendation, etc., as described above. For example, if a user on a portal site A knows that he / she is interested in "car" because he / she has left a lot of comments on the text of "car", he / When it is connected, it is possible to recommend automobile related products and provide promotions. This cross offering may also be performed if it is assumed that user information interworking is possible between an Internet site or a service provider.
한편, 본 명세서의 사용자 관심사 분석 방법은, 상기 서술한 각 단계를 수행하는 명령들을 포함하는 컴퓨터로 판독 가능한 기록매체로 구현될 수도 있다.Meanwhile, the user interest analysis method of the present specification may be implemented as a computer-readable recording medium including instructions for performing the steps described above.
즉, 상기 방법은 사용자가 인터넷 사이트에 작성한 댓글 및 상기 댓글이 첨부된 본문글 중 적어도 하나를 분석하여 상기 사용자의 관심사를 추정하는 단계; 상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 단계; 상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 단계를 수행하는 명령들을 포함하는 컴퓨터 판독 가능 기록매체로써 제공될 수 있는 것이다.That is, the method may include analyzing at least one of a comment made by the user on the Internet site and a text attached to the comment to estimate the user's interest; Calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text; And determining the interest of the user based on the calculated interest index.
이때 상기 사용자의 관심사를 추정하는 단계는 상기 본문글로부터 키워드를 추출하는 단계와; 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정하는 단계를 포함하고, 상기 관심지수를 산출하는 단계는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계일 수 있다.The step of estimating the interest of the user may include extracting keywords from the text; Wherein the step of estimating the interest index includes estimating a degree of interest of the user corresponding to the extracted keyword by using at least one of a propensity and a frequency of a comment corresponding to the estimated interest, And calculating an interest index for each of the interests.
상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는 상기 인터넷 사이트의 속성에 따른 가중치를 더 반영하여 상기 관심지수를 산출하는 단계일 수 있다.The step of calculating the interest index for each of the estimated interests may further include the step of calculating the interest index further reflecting the weight according to the property of the internet site.
상기 인터넷 사이트의 속성은 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분되며, 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는 상기 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출하는 단계이거나, 또는 상기 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출하는 단계일 수 있다.Wherein the attribute of the Internet site is classified into an Internet site related to purchase of goods and an Internet site related to a community, and the step of calculating an interest index for each of the estimated interests includes: A step of calculating a purchase interest index of the user by reflecting a large weight or a step of calculating a preference related interest index of the user by reflecting a larger weight on a comment written on an internet site related to a fellowship have.
상기 방법은 상기 사용자의 구매 관련 관심지수를 산출하는 경우는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 단계를 더 포함할 수 있다.The method may further include providing the advertiser with an interest of the user determined based on the purchase related interest index in the case of calculating the purchasing interest index of the user.
상기 방법은 상기 사용자의 선호 관련 관심지수를 산출하는 경우는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 단계를 더 포함할 수 있다.The method may further include providing the application or the content provider with the interest of the user determined based on the preference related interest index when calculating the preference related interest index of the user.
본 명세서에 따른 사용자 관심사 분석 서버(100)는 메모리에 의하여 정보를 저장할 수 있는데, 일 구현예의 경우 메모리는 컴퓨터로 판독 가능한 매체이다. 일 구현예에서 메모리는 휘발성 메모리 유닛일 수 있으며, 다른 구현예의 경우 메모리는 비휘발성 메모리 유닛일 수 있다. 또한, 메모리는 예컨대 하드디스크 장치, 광학디스크 장치, 혹은 어떤 다른 대용량 저장 장치를 포함할 수도 있다.The user
사용자 관심사 분석 서버(100)나 사용자 단말은 또한 예컨대 이더넷 카드와 같은 하나 이상의 네트워크 인터페이스 장치, 예컨대 RS-232 포트와 같은 직렬 통신 장치 및/또는 예컨대 802.11 카드와 같은 무선 인터페이스 장치를 외부 입출력 장치로서 포함할 수 있다. 다른 구현예에서, 이러한 입출력 장치는 다른 입출력 장치로 출력 데이터를 전송하고 입력 데이터를 수신하도록 구성된 드라이버 장치, 예컨대 키보드, 프린터 및 디스플레이 장치 등을 포함할 수 있다.The user
사용자 관심사 분석 서버(100)는 실행 시 하나 이상의 처리 장치로 하여금 전술한 기능과 프로세스를 수행하도록 하는 명령에 의하여 실현될 수 있다. 예를 들어 그러한 명령으로는, 예컨대 JavaScript나 ECMAScript 명령 등의 스크립트 명령과 같은 해석되는 명령이나 실행 가능한 코드 혹은 컴퓨터로 판독 가능한 매체에 저장되는 기타의 명령이 포함될 수 있다.The user
본 발명에 따른 사용자 관심사 분석 서버(100)는 서버 팜(Server Farm)과 같이 네트워크에 걸쳐서 분산형으로 구현될 수 있으며, 혹은 단일의 컴퓨터 장치로 구현될 수 있다.The user
본 명세서에서 설명하는 기능적인 동작과 주제의 구현물들은 디지털 전자 회로로 구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다. 본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 처리 시스템의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다.Implementations of the functional operations and the subject matter described herein may be implemented in digital electronic circuitry, or may be implemented in computer software, firmware, or hardware, including the structures disclosed herein, and structural equivalents thereof, It can be implemented. Implementations of the subject matter described herein may be implemented as one or more computer program products, i. E. One or more modules relating to computer program instructions encoded on a type of program storage medium for execution by, or control of, the operation of the processing system Can be implemented.
컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.The computer-readable medium can be a machine-readable storage device, a machine-readable storage substrate, a memory device, a composition of matter that affects the machine readable propagation type signal, or a combination of one or more of the foregoing.
본 명세서에서 "시스템"이나 "장치"라 함은 예컨대 프로그래머블 프로세서, 컴퓨터 혹은 다중 프로세서나 컴퓨터를 포함하여 데이터를 처리하기 위한 모든 기구, 장치 및 기계를 포괄한다. 처리 시스템은, 하드웨어에 부가하여, 예컨대 프로세서 펌웨어를 구성하는 코드, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 혹은 이들 중 하나 이상의 조합 등 요청 시 컴퓨터 프로그램에 대한 실행 환경을 형성하는 코드를 포함할 수 있다.As used herein, the term " system "or" device "encompasses any apparatus, apparatus, and machine for processing data, including, for example, a programmable processor, a computer or a multiprocessor or computer. The processing system may, in addition to the hardware, comprise code that forms an execution environment for a computer program upon request, such as, for example, code comprising a processor firmware, a protocol stack, a database management system, an operating system, .
컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.A computer program (also known as a program, software, software application, script or code) may be written in any form of programming language, including compiled or interpreted language, a priori or procedural language, Components, subroutines, or other units suitable for use in a computer environment. A computer program does not necessarily correspond to a file in the file system. The program may be stored in a single file provided to the requested program, or in multiple interactive files (e.g., a file storing one or more modules, subprograms, or portions of code) (E.g., one or more scripts stored in a markup language document). A computer program may be deployed to run on multiple computers or on one computer, located on a single site or distributed across multiple sites and interconnected by a communications network.
한편, 컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체는, 예컨대 EPROM, EEPROM 및 플래시메모리 장치와 같은 반도체 메모리 장치, 예컨대 내부 하드디스크나 외장형 디스크와 같은 자기 디스크, 자기광학 디스크 및 CD-ROM과 DVD-ROM 디스크를 포함하여 모든 형태의 비휘발성 메모리, 매체 및 메모리 장치를 포함할 수 있다. 프로세서와 메모리는 특수 목적의 논리 회로에 의해 보충되거나, 그것에 통합될 수 있다.On the other hand, computer readable media suitable for storing computer program instructions and data include semiconductor memory devices such as, for example, EPROM, EEPROM and flash memory devices, such as magnetic disks such as internal hard disks or external disks, Non-volatile memory, media and memory devices, including ROM and DVD-ROM disks. The processor and memory may be supplemented by, or incorporated in, special purpose logic circuits.
본 명세서에서 설명한 주제의 구현물은 예컨대 데이터 서버와 같은 백엔드 컴포넌트를 포함하거나, 예컨대 어플리케이션 서버와 같은 미들웨어 컴포넌트를 포함하거나, 예컨대 사용자가 본 명세서에서 설명한 주제의 구현물과 상호 작용할 수 있는 웹 브라우저나 그래픽 유저 인터페이스를 갖는 클라이언트 컴퓨터와 같은 프론트엔드 컴포넌트 혹은 그러한 백엔드, 미들웨어 혹은 프론트엔드 컴포넌트의 하나 이상의 모든 조합을 포함하는 연산 시스템에서 구현될 수도 있다. 시스템의 컴포넌트는 예컨대 통신 네트워크와 같은 디지털 데이터 통신의 어떠한 형태나 매체에 의해서도 상호 접속 가능하다.Implementations of the subject matter described herein may include, for example, a back-end component such as a data server, or may include a middleware component, such as an application server, or may be a web browser or a graphical user, for example a user, who may interact with an implementation of the subject- Front-end components such as client computers with interfaces, or any combination of one or more of such back-end, middleware, or front-end components. The components of the system may be interconnected by any form or medium of digital data communication, such as, for example, a communications network.
이상, 본 발명의 실시예에 대하여 설명하였으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 특허청구범위에 기재된 본 발명의 사상으로부터 벗어나지 않는 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등에 의해 본 발명을 다양하게 수정 및 변경시킬 수 있을 것이며, 이 또한 본 발명의 권리범위 내에 포함된다고 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.
100 : 사용자 관심사 분석 서버
101 : 관심사 추정부
102 : 관심지수 산출부
103 : 관심사 결정부100: user interest analysis server
101: Interest Assessment Government
102: interest index calculating section
103: Interest decision part
Claims (13)
상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 관심지수 산출부; 및
상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 관심사 결정부를 포함하는 것을 특징으로 하는 사용자 관심사 분석 서버.An interest estimation unit for analyzing at least one of a comment written on the Internet site by the user and a text attached to the comment to estimate the interest of the user;
An interest index calculating unit for calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text; And
And a concern determination unit for determining a concern of the user based on the calculated interest index.
상기 관심사 추정부는 상기 본문글로부터 키워드를 추출하고, 상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정하며,
상기 관심지수 산출부는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 것을 특징으로 하는 사용자 관심사 분석 서버.The method according to claim 1,
Wherein the interest estimator extracts a keyword from the text and estimates a concern corresponding to the extracted keyword as a concern of the user,
Wherein the interest index calculating unit calculates an interest index for each of the estimated interests by using at least one of a propensity and a frequency of comments corresponding to the estimated interest.
상기 관심지수 산출부는 상기 인터넷 사이트의 속성에 따른 가중치를 더 반영하여 상기 관심지수를 산출하는 것을 특징으로 하는 사용자 관심사 분석 서버.The method according to claim 1,
Wherein the interest index calculating unit calculates the interest index by further reflecting a weight according to an attribute of the internet site.
상기 인터넷 사이트의 속성은 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분되며,
상기 관심지수 산출부는 상기 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출하거나,
또는 상기 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출하는 것을 특징으로 하는 사용자 관심사 분석 서버.The method of claim 3,
The attributes of the Internet site are classified into an Internet site related to purchase of goods and an Internet site related to a community,
The interest index calculating unit may calculate the purchase interest index of the user by reflecting a larger weight on the comment written on the internet site related to the purchase of the user by the user,
Or a preference related interest index of the user is calculated by reflecting a larger weight in a comment made by the user on an internet site related to the interest group.
상기 사용자의 구매 관련 관심지수를 산출하는 경우, 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 관심사 제공부를 더 포함하는 것을 특징으로 하는 사용자 관심사 분석 서버.5. The method of claim 4,
Further comprising a concern provider for providing an advertiser with a concern of the user determined based on the purchase related interest index when the purchase interest index of the user is calculated.
상기 사용자의 선호 관련 관심지수를 산출하는 경우는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 관심사 제공부를 더 포함하는 것을 특징으로 하는 사용자 관심사 분석 서버.5. The method of claim 4,
And a concern provider for providing the user with an interest or an interest of the user determined based on the preference related interest index when the preference related interest index of the user is calculated.
상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 단계;
상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 단계를 포함하는 것을 특징으로 하는 사용자 관심사 분석 방법.Analyzing at least one of a comment written on the Internet site by the user and a text attached to the comment to estimate the user's interest;
Calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text;
And determining the interest of the user based on the calculated interest index.
상기 사용자의 관심사를 추정하는 단계는 상기 본문글로부터 키워드를 추출하는 단계; 및
상기 추출된 키워드와 대응되는 관심사를 상기 사용자의 관심사로 추정하는 단계를 포함하고,
상기 관심지수를 산출하는 단계는 상기 추정된 관심사에 대응되는 댓글의 성향 및 빈도수 중 적어도 하나를 이용하여 상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계인 것을 특징으로 하는 사용자 관심사 분석 방법.8. The method of claim 7,
The step of estimating the interest of the user includes: extracting keywords from the text; And
Estimating the interest corresponding to the extracted keyword as the interest of the user,
Wherein the step of calculating the interest index is a step of calculating an interest index for each of the estimated interest using at least one of a propensity and a frequency of comments corresponding to the estimated interest.
상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는
상기 인터넷 사이트의 속성에 따른 가중치를 더 반영하여 상기 관심지수를 산출하는 단계인 것을 특징으로 하는 사용자 관심사 분석 방법.8. The method of claim 7,
The step of calculating the interest index for each of the estimated interests
Wherein the interest index is calculated by further reflecting a weight according to an attribute of the internet site.
상기 인터넷 사이트의 속성은 상품구매와 관련된 인터넷 사이트 및 동호회와 관련된 인터넷 사이트로 구분되며,
상기 추정된 관심사 각각에 대한 관심지수를 산출하는 단계는,
상기 사용자가 상품구매와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 구매 관련 관심지수를 산출하는 단계이거나,
또는 상기 사용자가 동호회와 관련된 인터넷 사이트에 작성한 댓글에 더 큰 가중치를 반영하여 상기 사용자의 선호 관련 관심지수를 산출하는 단계인 것을 특징으로 하는 사용자 관심사 분석 방법.10. The method of claim 9,
The attributes of the Internet site are classified into an Internet site related to purchase of goods and an Internet site related to a community,
Wherein the step of calculating an interest index for each of the estimated interests includes:
A step of calculating a purchase interest index of the user by reflecting a larger weight on a comment written on the internet site related to purchase of the user by the user,
Or calculating a preference related interest index of the user by reflecting a larger weight on a comment made by the user on an internet site related to the interest group.
상기 사용자의 구매 관련 관심지수를 산출하는 경우는 상기 구매 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 광고주에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 사용자 관심사 분석 방법.11. The method of claim 10,
Further comprising the step of providing the advertiser with the interests of the user determined based on the purchase related interest index when the purchase interest index of the user is calculated.
상기 사용자의 선호 관련 관심지수를 산출하는 경우는 상기 선호 관련 관심지수를 기반으로 결정된 상기 사용자의 관심사를 애플리케이션 또는 컨텐츠 제공자에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 사용자 관심사 분석 방법.11. The method of claim 10,
Further comprising the step of providing the application or the content provider with the interest of the user determined based on the preference related interest index when calculating the preference related interest index of the user.
상기 댓글 및 상기 본문글의 속성 및 빈도수 중 하나 이상을 기초로 하여 상기 추정된 상기 사용자의 관심사 각각에 대한 관심지수를 산출하는 단계;
상기 산출된 관심지수를 기반으로 상기 사용자의 관심사를 결정하는 단계를 수행하는 명령들을 포함하는 컴퓨터 판독 가능 기록매체.Analyzing at least one of a comment written on the Internet site by the user and a text attached to the comment to estimate the user's interest;
Calculating an interest index for each of the estimated interests of the user based on at least one of attributes and frequency of the comment and the text;
And determining the interest of the user based on the calculated interest index.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130000943A KR20140089452A (en) | 2013-01-04 | 2013-01-04 | Method for analysing user interssts based on comment analysis and apparatus thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130000943A KR20140089452A (en) | 2013-01-04 | 2013-01-04 | Method for analysing user interssts based on comment analysis and apparatus thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140089452A true KR20140089452A (en) | 2014-07-15 |
Family
ID=51737554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130000943A KR20140089452A (en) | 2013-01-04 | 2013-01-04 | Method for analysing user interssts based on comment analysis and apparatus thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20140089452A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017074066A1 (en) * | 2015-10-27 | 2017-05-04 | 에이원 미디어 그룹 가부시키가이샤 | Internet content providing server and computer readable recording medium embodying same method |
KR20210105059A (en) * | 2020-02-18 | 2021-08-26 | 한양대학교 산학협력단 | Method for predicting contents viewing rate |
-
2013
- 2013-01-04 KR KR1020130000943A patent/KR20140089452A/en not_active Application Discontinuation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017074066A1 (en) * | 2015-10-27 | 2017-05-04 | 에이원 미디어 그룹 가부시키가이샤 | Internet content providing server and computer readable recording medium embodying same method |
JP2018537763A (en) * | 2015-10-27 | 2018-12-20 | 株式会社A1 Media Group | Internet content providing server and computer-readable recording medium embodying the method |
AU2016346740B2 (en) * | 2015-10-27 | 2020-07-09 | A1 Media Group Co., Ltd. | Server for providing internet content and computer-readable recording medium including implemented internet content providing method |
KR20210105059A (en) * | 2020-02-18 | 2021-08-26 | 한양대학교 산학협력단 | Method for predicting contents viewing rate |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861628B2 (en) | Method, system and computer readable medium for creating a profile of a user based on user behavior | |
US11182823B2 (en) | Automated creative extension selection for content performance optimization | |
US9336282B2 (en) | Systems and methods for identifying and analyzing internet users | |
US8676875B1 (en) | Social media measurement | |
JP6262886B2 (en) | Automated click type selection for content performance optimization | |
US20150379571A1 (en) | Systems and methods for search retargeting using directed distributed query word representations | |
US20190026760A1 (en) | Method for profiling user's intention and apparatus therefor | |
US20140025509A1 (en) | Methods and apparatus for bid optimization and inventory scoring | |
US10007645B2 (en) | Modifying the presentation of a content item | |
US20130332385A1 (en) | Methods and systems for detecting and extracting product reviews | |
JP5615857B2 (en) | Analysis apparatus, analysis method, and analysis program | |
US20150356627A1 (en) | Social media enabled advertising | |
US20130097152A1 (en) | Topical activity monitor system and method | |
US9104746B1 (en) | Identifying contrarian terms based on website content | |
US20170032424A1 (en) | System and method for contextual video advertisement serving in guaranteed display advertising | |
US20140101064A1 (en) | Systems and Methods for Automated Reprogramming of Displayed Content | |
KR20140089452A (en) | Method for analysing user interssts based on comment analysis and apparatus thereof | |
JP5869931B2 (en) | Recommendation item detection program, apparatus and method for detecting items to be criticized by critics | |
JP2012221360A (en) | System capable of providing information deliverer (influencer) influential for purchasing behavior with advertisement information | |
KR101347220B1 (en) | System for providing advertisement contents | |
JP2018041509A (en) | Automated click type selection for content performance optimization | |
US9824073B1 (en) | Estimating effects of user interface changes on content item performance | |
Shan | Computing advertising intelligent computing and push based on artificial intelligence in the big data era | |
US20190114344A1 (en) | Decision platform for directed information delivery | |
CN111353795A (en) | Advertisement effect measuring method, device, medium and equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |