KR101541297B1 - Method and apparatus of generating multilingual semantic network based on the user description - Google Patents

Method and apparatus of generating multilingual semantic network based on the user description Download PDF

Info

Publication number
KR101541297B1
KR101541297B1 KR1020130160503A KR20130160503A KR101541297B1 KR 101541297 B1 KR101541297 B1 KR 101541297B1 KR 1020130160503 A KR1020130160503 A KR 1020130160503A KR 20130160503 A KR20130160503 A KR 20130160503A KR 101541297 B1 KR101541297 B1 KR 101541297B1
Authority
KR
South Korea
Prior art keywords
content
description
original
multilingual
added
Prior art date
Application number
KR1020130160503A
Other languages
Korean (ko)
Other versions
KR20150072869A (en
Inventor
문의선
Original Assignee
엔에이치엔엔터테인먼트 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔엔터테인먼트 주식회사 filed Critical 엔에이치엔엔터테인먼트 주식회사
Priority to KR1020130160503A priority Critical patent/KR101541297B1/en
Publication of KR20150072869A publication Critical patent/KR20150072869A/en
Application granted granted Critical
Publication of KR101541297B1 publication Critical patent/KR101541297B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

웹 기반 서비스에 콘텐츠가 추가된 경우, 콘텐츠와 동일한 원본 콘텐츠를 탐색하는 단계, 원본 콘텐츠에 대한 디스크립션을 수집하는 단계, 그리고 콘텐츠의 디스크립션과 원본 콘텐츠의 디스크립션 사이의 관계를 생성하는 단계를 통해 다국어 관계망을 생성하는 다국어 관계망 생성 장치가 제공된다.When a content is added to the web-based service, a step of searching for the same original content as the content, a step of collecting the description of the original content, and a step of creating a relationship between the description of the content and the description of the original content, A multi-language network generating apparatus is provided.

Description

사용자 디스크립션에 기반한 다국어 관계망 생성 방법 및 장치 {Method and apparatus of generating multilingual semantic network based on the user description}[0001] The present invention relates to a method and apparatus for generating a multilingual network based on user description,

본 발명은 사용자 디스크립션에 기반하여 다국어 관계망을 생성하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for generating a multilingual network based on user descriptions.

통상, 서로 다른 언어 간의 관계는 사전(辭典)에 기재된 내용을 기반으로 정의될 수 있다. 예를 들어, 국어의 '의자'에 해당하는 영어 단어는 한영사전에 기재된 내용을 통해 영어로 'chair' 또는 'stool' 등으로 표현될 수 있다. In general, the relationships between different languages can be defined based on the contents described in the dictionary. For example, an English word corresponding to a 'chair' of a Korean word can be expressed in English as 'chair' or 'stool' through the contents written in the Korean-English dictionary.

하지만, 사전을 통해 언어 간의 관계를 정의하는 방식은 새로 등장한 단어 또는 의미가 변한 단어에 대응하는데 시간이 걸리고, 사전에 기재되지 않은 사투리, 비속어 등에는 적용될 수 없다는 문제점이 있다. 즉, 사전을 통해 언어 간의 관계를 정의하는 방식이 위 문제점에 대응하려면, 새로 업데이트 할 단어를 수집하고 수집된 단어에 대응하는 외국어 표현을 파악해야 하므로, 자동화하기 어려워서 많은 비용과 시간이 소모될 수 있다.However, there is a problem in that a method of defining a relationship between languages through a dictionary takes time to correspond to a newly introduced word or a word whose meaning has changed, and can not be applied to a dialect, a profanity, or the like not previously described. In other words, in order to cope with the above problem, there is a need to collect new words to be updated and to recognize foreign language expressions corresponding to the collected words. have.

따라서, 본 발명의 실시 예에서는, 사전에 기반하지 않고 사용자 디스크립션에 기반하여 단일 언어에 대응하는 다양한 외국어 표현을 제공할 수 있는 다국어 관계망의 생성 방법 및 장치를 제공한다.Accordingly, embodiments of the present invention provide a method and apparatus for generating a multilingual network that can provide various foreign language expressions corresponding to a single language based on a user description, not based on a dictionary.

본 발명의 한 특징에 따르면, 웹 기반 서비스에서 다국어 관계망을 생성하는 방법이 제공된다. 상기 다국어 관계망 생성 방법은, 서비스에 콘텐츠가 추가된 경우, 콘텐츠와 동일한 원본 콘텐츠를 탐색하는 단계, 원본 콘텐츠의 디스크립션 중에서 콘텐츠를 추가한 사용자가 사용하는 언어와 다른 언어로 표현된 다국어 디스크립션을 수집하는 단계, 그리고 콘텐츠의 디스크립션과 다국어 디스크립션 사이의 관계를 생성하는 단계를 포함한다.According to one aspect of the invention, a method is provided for creating a multilingual network in a web-based service. The multi-language network generating method includes: searching for an original content identical to a content when a content is added to a service; collecting a multi-lingual description expressed in a language different from a language used by a user who added the content among descriptions of the original content And creating a relationship between the description of the content and the multilingual description.

상기 다국어 관계망 생성 방법에서 탐색하는 단계는, 콘텐츠가 인용 방식으로 추가된 경우, 피인용 콘텐츠를 원본 콘텐츠로 결정하는 단계를 포함할 수 있다.The step of searching in the multi-language network generating method may include a step of, when the content is added in a citation manner, determining the content to be cited as the original content.

상기 다국어 관계망 생성 방법에서 탐색하는 단계는, 피인용 콘텐츠와 동일한 기존 콘텐츠를 원본 콘텐츠로 결정하는 단계를 더 포함할 수 있다.The searching step in the method for generating a multilingual network may further include determining an existing content identical to the content to be cited as the original content.

상기 다국어 관계망 생성 방법에서 탐색하는 단계는, 콘텐츠가 인용 방식이 아닌 방식으로 추가된 경우, 콘텐츠의 속성값과 동일한 속성값을 가지는 콘텐츠를 검색하는 단계, 그리고 검색된 콘텐츠를 원본 콘텐츠로 결정하는 단계를 포함할 수 있다.The searching step in the method for generating a multilingual network includes: searching for a content having an attribute value equal to an attribute value of the content when the content is added in a manner other than a quotation method; and determining the searched content as an original content .

상기 다국어 관계망 생성 방법에서 속성값은, 콘텐츠의 해시(hash) 값 또는 출처의 파일 식별자(Uniform Resource Locator, URL)일 수 있다.In the method for generating a multi-language network, the attribute value may be a hash value of a content or a Uniform Resource Locator (URL) of a source.

상기 다국어 관계망 생성 방법에서 생성하는 단계는, 인크레먼트(increment) 함수를 이용하여 콘텐츠의 디스크립션과 다국어 디스크립션 사이의 관계값을 증가시키는 단계를 포함할 수 있다.The step of generating in the multi-language network generating method may include a step of increasing a relation value between the description of the content and the multi-lingual description using an increment function.

본 발명의 다른 특징에 따르면, 웹 기반 서비스에서 다국어 관계망을 생성하는 장치가 제공된다. 상기 다국어 관계망 생성 장치는, 서비스에 콘텐츠가 추가된 경우, 콘텐츠와 동일한 원본 콘텐츠를 탐색하는 원본 탐색부, 원본 콘텐츠의 디스크립션 중에서 콘텐츠를 추가한 사용자가 사용하는 언어와 다른 언어로 표현된 다국어 디스크립션을 수집하는 디스크립션 수집부, 그리고 콘텐츠의 디스크립션과 다국어 디스크립션 사이의 관계를 생성하는 관계 설정부를 포함한다.According to another aspect of the present invention, there is provided an apparatus for creating a multilingual network in a web-based service. The multi-language network generating apparatus includes an original search unit for searching for an original content identical to a content when a content is added to a service, and a multi-lingual description expressed in a different language from a language used by a user A description collection unit for collecting the contents, and a relation setting unit for generating a relation between the description of the contents and the multilingual description.

상기 다국어 관계망 생성 장치에서 원본 탐색부는, 콘텐츠가 인용 방식으로 추가된 경우, 피인용 콘텐츠를 원본 콘텐츠로 결정할 수 있다.In the multi-language network generating apparatus, when the content is added in a cited manner, the original search unit can determine the content to be cited as the original content.

상기 다국어 관계망 생성 장치에서 원본 탐색부는, 피인용 콘텐츠와 동일한 기존 콘텐츠를 원본 콘텐츠로 결정할 수 있다.In the multi-language network generating apparatus, the original search unit may determine an existing content identical to the content to be cited as the original content.

상기 다국어 관계망 생성 장치에서 원본 탐색부는, 콘텐츠가 인용 방식이 아닌 방식으로 추가된 경우, 콘텐츠의 속성값과 동일한 속성값을 가지는 콘텐츠를 검색하고, 검색된 콘텐츠를 원본 콘텐츠로 결정할 수 있다.In the multi-language network generating apparatus, when the content is added by a method other than a quotation method, the original search unit can search for a content having the same attribute value as the content attribute value, and determine the searched content as the original content.

상기 다국어 관계망 생성 장치에서 속성값은, 콘텐츠의 해시(hash) 값 또는 출처의 파일 식별자(Uniform Resource Locator, URL)일 수 있다.In the multi-language network generating apparatus, an attribute value may be a hash value of a content or a Uniform Resource Locator (URL) of a source.

상기 다국어 관계망 생성 장치에서 관계 생성부는, 인크레먼트(increment) 함수를 이용하여 콘텐츠의 디스크립션과 다국어 디스크립션 사이의 관계값을 증가시킬 수 있다.In the multi-language network generating apparatus, the relation creating unit may increase a relation value between a description of a content and a multilingual description by using an increment function.

이와 같이 본 발명의 한 실시 예에 따르면, 콘텐츠에 부가되는 디스크립션 사이의 관계값을 콘텐츠의 동일성에 기반하여 설정하고, 설정된 관계값을 통해 다국어 관계망을 생성할 수 있다. 사용자는 이렇게 생성된 다국어 관계망을 통해 여러 언어로 표현된 동일한 콘텐츠를 검색할 수 있다.As described above, according to an embodiment of the present invention, a relation value between descriptions added to a content can be set based on the identity of content, and a multilingual network can be created through a set relationship value. The user can search for the same content expressed in multiple languages through the generated multi-language network.

도 1은 본 발명의 실시 예에 따른 다국어 관계망 생성 장치를 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 다국어 관계망 생성 방법을 나타낸 흐름도이다.
1 is a block diagram of an apparatus for generating a multi-language network according to an embodiment of the present invention.
2 is a flowchart illustrating a method of generating a multi-language network according to an exemplary embodiment of the present invention.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 소프트웨어나 마이크로 프로세서 등의 하드웨어 또는 소프트웨어 및 하드웨어의 결합으로 구현될 수 있다.Throughout the specification, when an element is referred to as "comprising ", it means that it can include other elements as well, without excluding other elements unless specifically stated otherwise. It should be noted that terms such as " part ", "module "," module ", "block ", and the like described in the specification mean units for processing at least one function or operation, And a combination of hardware.

근래, 사용자가 멀티미디어(사진, 동영상) 또는 문서(pdf, html) 등의 콘텐츠를 추가하고 추가한 콘텐츠에 코멘트(comment) 또는 디스크립션(description) 등을 부가할 수 있는 웹 기반 서비스가 제공되고 있다. 이러한 서비스를 통해 사용자는 다른 사용자가 추가한 콘텐츠를 인용할 수 있고, 코멘트를 부가할 수 있다. 각 콘텐츠에는 콘텐츠에 대한 설명, 평가 등이 기재된 텍스트가 부가될 수 있는데, 이를 콘텐츠의 '디스크립션'이라고 한다. 사용자가 콘텐츠에 대해 임의로 입력한 태그, 또는 임의로 입력한 텍스트에서 추출된 키워드 등도 디스크립션이 될 수 있다. 그리고, 여러 사용자들이 콘텐츠에 부가한 별점, 좋아요 표시, 댓글 등이 코멘트가 될 수 있다. 이때, 각 콘텐츠마다 콘텐츠의 해시(hash) 값 또는 출처의 파일 식별자(Uniform Resource Locator, URL) 등의 콘텐츠 속성이 존재할 수 있다. In recent years, a web-based service has been provided in which a user can add a content such as multimedia (photo, video) or document (pdf, html) and add a comment or description to the added content. Through this service, the user can quote the content added by another user and add a comment. Each content may be accompanied by a text describing the content, evaluation, etc., which is referred to as a 'description' of the content. The description may be a tag arbitrarily input by the user to the content, or a keyword extracted from arbitrarily inputted text. And comments, comments, comments, etc., that are added to the content by multiple users, can be comments. At this time, for each content, a content attribute such as a hash value of the content or a file identifier (Uniform Resource Locator, URL) of the source may exist.

위와 같은 서비스에서, 특정 콘텐츠가 많은 사용자 사이에서 반복적으로 인용되면, 그 콘텐츠에는 서로 다른 디스크립션이 부가될 수 있다. 위와 같은 서비스는 여러 국가의 사용자에게 제공될 수 있기 때문에, 각 디스크립션은 서로 다른 언어로 표현될 수 있고, 같은 언어로 표현되더라도 서로 다른 표현이 존재할 수 있다. In such a service, if a particular content is repeatedly quoted among a large number of users, a different description may be added to the content. Since these services can be provided to users in different countries, each description can be expressed in different languages, and different expressions can exist even if they are expressed in the same language.

본 발명에서는 특정 콘텐츠에 대해 부가된 서로 다른 언어의 디스크립션을 수집하고 수집된 디스크립션 간의 관계를 설정하여 다국어 관계망을 생성한다. 서비스의 사용자는 생성된 다국어 관계망을 통해 하나의 언어로 검색하더라도 전 세계의 사용자가 다양한 언어로 추가한 콘텐츠를 검색할 수 있다. In the present invention, a multilingual network is created by collecting descriptions of different languages added to specific contents and setting a relationship between collected descriptions. The user of the service can search contents added in various languages by the users of the world even if they search in one language through the generated multilingual network.

한편, 콘텐츠에 부가된 코멘트 또는 디스크립션 등은 콘텐츠에 대한 정보를 구성할 수 있는데, 이때, 하나의 콘텐츠에 대한 정보는 아래와 같은 정보 요소를 포함할 수 있다.Meanwhile, a comment or description added to the content may constitute information about the content. At this time, the information about one content may include the following information elements.

정보[i]={콘텐츠 이름, {콘텐츠 속성}, 코멘트, {디스크립션}, 언어}Information [i] = {content name, {content property}, comment, {description}, language}

도 1은 본 발명의 실시 예에 따른 다국어 관계망 생성 장치를 나타낸 도면이다.1 is a block diagram of an apparatus for generating a multi-language network according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 실시 예에 따른 다국어 관계망 생성 장치(100)는, 원본 탐색부(110), 디스크립션 수집부(120), 관계 설정부(130)를 포함한다.Referring to FIG. 1, an apparatus 100 for generating a multi-language network according to an exemplary embodiment of the present invention includes an original search unit 110, a description collecting unit 120, and a relation setting unit 130.

원본 탐색부(110)는, 사용자가 서비스에 추가한 신규 콘텐츠와 동일한 콘텐츠를 탐색한다. 이때, 서비스에 추가된 신규 콘텐츠와 동일한 콘텐츠를 '원본 콘텐츠'라고 한다. 원본 탐색부(110)는 전 세계의 사용자가 추가한 신규 콘텐츠 중에서 원본 콘텐츠를 탐색할 수 있다.The original search unit 110 searches for the same content as the new content added by the user to the service. At this time, the same content as the new content added to the service is referred to as 'original content'. The original search unit 110 can search for original content among new contents added by users all over the world.

디스크립션 수집부(120)는, 탐색된 원본 콘텐츠에 부가된 디스크립션을 수집한다. 디스크립션 수집부(120)에서는 원본 콘텐츠에서 사용자에게 제공되는 서비스의 언어와 다른 언어로 표현된 디스크립션을 수집한다. The description collection unit 120 collects descriptions added to the searched original contents. The description collecting unit 120 collects descriptions expressed in a language different from the language of the service provided to the user from the original contents.

관계 설정부(130)는, 원본 콘텐츠에 대해서 서로 다른 언어로 표현된 디스크립션이 복수 개 있는 경우, 각 디스크립션 간의 관계값을 증가시킨다. 이때, 각 디스크립션 간의 관계값은 'Increment' 함수에 따라서 증가될 수 있다. 예를 들어, 아래 수학식1에 기재된 Increment 함수는 제1 언어와 제2 언어로 표현된 각 디스크립션 사이의 관계값을 증가시키는 역할을 한다.The relation setting unit 130 increases the relationship value between respective descriptions when there are a plurality of descriptions expressed in different languages for the original contents. At this time, the relation value between each descriptions can be increased according to the 'Increment' function. For example, the Increment function described in Equation (1) below serves to increase the relationship value between each description expressed in the first language and the second language.

Figure 112013117157943-pat00001
Figure 112013117157943-pat00001

도 2는 본 발명의 실시 예에 따른 다국어 관계망 생성 방법을 나타낸 흐름도이다.2 is a flowchart illustrating a method of generating a multi-language network according to an exemplary embodiment of the present invention.

도 2를 참조하면, 사용자가 신규 콘텐츠를 서비스에 추가하면(S201), 원본 탐색부(110)는 사용자가 콘텐츠를 추가한 방식을 판단한다(S202). 서비스의 사용자가 '인용 방식'을 통해 신규 콘텐츠를 추가하였다면, 원본 탐색부(110)는 피인용 콘텐츠를 신규 콘텐츠에 대한 원본 콘텐츠로 결정한다(S203). 그리고, 기존에 피인용 콘텐츠와 동일한 것으로 결정된 콘텐츠('기존 콘텐츠'라고 함)가 적어도 하나 있다면, 적어도 하나의 기존 콘텐츠도 신규 콘텐츠에 대한 원본 콘텐츠로 결정한다(S204).Referring to FIG. 2, when a user adds a new content to a service (S201), the original search unit 110 determines a method of adding a content (S202). If the user of the service adds the new content through the 'citation method', the original search unit 110 determines the cited content as the original content for the new content (S203). If there is at least one existing content (referred to as 'existing content') that is determined to be the same as the content to be cited, at least one existing content is determined to be the original content for the new content (S204).

서비스의 사용자가 인용 방식이 아닌 방식으로 신규 콘텐츠를 추가하였다면, 원본 탐색부(110)는 신규 콘텐츠의 속성값과 동일한 속성값을 가지는 콘텐츠를 검색하고(S205), 검색된 콘텐츠를 신규 콘텐츠에 대한 원본 콘텐츠로 결정한다(S206).If the user of the service adds new content in a manner other than the quotation method, the original search unit 110 searches for a content having the same attribute value as the attribute value of the new content (S205) (S206).

디스크립션 수집부(120)는, 위와 같이 결정된 원본 콘텐츠에서 디스크립션을 수집한다(S207). 즉, 디스크립션 수집부(120)는, 적어도 하나의 원본 콘텐츠가 있는 경우, 원본 콘텐츠에 부가된 디스크립션 중에서 사용자가 사용하는 언어와 다른 언어로 표현된 디스크립션을 수집한다. 이후, 관계 설정부(130)는, Inc 함수를 이용하여 원본 콘텐츠의 디스크립션과 신규 콘텐츠의 디스크립션 사이의 관계값을 증가시킨다(S208).The description collecting unit 120 collects a description from the original content determined as described above (S207). That is, if there is at least one original content, the description collecting unit 120 collects a description expressed in a language different from the language used by the user among the descriptions added to the original content. Then, the relation setting unit 130 increases the relationship value between the description of the original content and the description of the new content using the Inc function (S208).

본 발명의 실시 예에 따른 다국어 관계망 생성 장치에서는 위와 같은 방법을 통해 신규 콘텐츠와 동일한 콘텐츠를 탐색하고, 탐색된 콘텐츠의 다국어 디스크립션과 신규 콘텐츠의 디스크립션 사이의 관계값을 증가시킴으로써, 다국어 관계망을 생성할 수 있다. 이후, 사용자가 한 가지 언어로 표현된 키워드로 검색한 경우, 다국어 관계망에 저장된 다국어 디스크립션 사이의 관계값을 이용(아래 기재된 Find 함수 및 Find2 함수 사용)하여 사용자에게 검색 결과를 제공할 수 있다. In the multilingual network generating apparatus according to the embodiment of the present invention, the same content as the new content is searched through the above method, and the relationship value between the multilingual description of the searched content and the description of the new content is increased to thereby create a multilingual network . Thereafter, when the user searches for a keyword expressed in one language, the user can provide the search result to the user by using the relationship value between the multilingual descriptions stored in the multilingual network (using the Find function and Find2 function described below).

즉, 본 발명의 실시 예에 따른 웹 기반 서비스는, 사용자의 키워드와 관련된 대표 정보를 적어도 하나 선정하고, 다국어 관계망에서 선정된 대표 정보의 디스크립션과 관계된 다른 디스크립션을 결정할 수 있다.That is, the web-based service according to the embodiment of the present invention can select at least one representative information related to the keyword of the user and determine another description related to the description of representative information selected in the multilingual network.

본 발명의 실시 예에 따른 웹 기반 서비스에서 두 개의 다른 언어로 표현된 디스크립션 사이의 관계값을 파악하는 경우에는 'Relation 함수'가 사용될 수 있다. Relation 함수는 수학식 2와 같다.In a web-based service according to an embodiment of the present invention, a 'Relation function' can be used when a relation value between descriptions described in two different languages is grasped. The Relation function is expressed by Equation (2).

Figure 112013117157943-pat00002
Figure 112013117157943-pat00002

Relation 함수에서, 언어1과 언어2는 경우에 따라 생략될 수 있다.In the Relation function, Language 1 and Language 2 may be omitted in some cases.

웹 기반 서비스가 대표 정보의 디스크립션과 관계 있는 복수의 다국어 디스크립션을 탐색하는 경우에는 'Find 함수' 또는 'Find2 함수'가 사용될 수 있다. 복수의 다국어 디스크립션을 탐색하는 경우에는 Rel 함수를 통해 두 디스크립션 사이의 관계값을 파악하고, 'Find 함수' 또는 'Find2 함수'를 통해 파악된 관계값을 크기 순으로 정렬하여 결과를 반환한다. Find 함수는 수학식 3과 같다.The 'Find function' or 'Find2 function' can be used when the web-based service searches a plurality of multilingual descriptions related to the description of the representative information. When retrieving a plurality of multilingual descriptions, the relation value between two descriptions is obtained through the Rel function, and the relation values obtained through the 'Find function' or 'Find2 function' are sorted in order of magnitude and the result is returned. The Find function is expressed by Equation (3).

Figure 112013117157943-pat00003
Figure 112013117157943-pat00003

이 경우, Find 함수는 대표 정보의 디스크립션과 관계값이 높은 상위 n개의 다국어 디스크립션을 검색 결과로 반환할 수 있다.In this case, the Find function can return the top n multilingual descriptions having the description and representative value information of the representative information in the search result.

웹 기반 서비스가 대표 정보의 디스크립션과 관계 있는 하나의 특정 다국어 디스크립션을 탐색하는 경우에는 'Find2 함수'가 사용될 수 있다. Find2 함수는 수학식 4와 같다.The 'Find2 function' can be used when the web-based service searches for a specific multilanguage description related to the description of the representative information. The Find2 function is shown in Equation (4).

Figure 112013117157943-pat00004
Figure 112013117157943-pat00004

이 경우, Find2 함수는 특정 언어의 디스크립션 중에서 대표 정보의 디스크립션과 관계값이 높은 상위 n개의 다국어 디스크립션을 검색 결과로 반환할 수 있다.In this case, the Find2 function can return the description of the representative information among the description of the specific language and the top n multilingual descriptions having a high relation value in the search result.

이와 같이 본 발명의 실시 예에 따르면, 콘텐츠에 부가되는 디스크립션 사이의 관계값을 콘텐츠의 동일성에 기반하여 설정하고, 설정된 관계값을 통해 다국어 관계망을 생성할 수 있다. 사용자는 이렇게 생성된 다국어 관계망을 통해 여러 언어로 표현된 동일한 콘텐츠를 검색할 수 있다.As described above, according to the embodiment of the present invention, a relation value between descriptions added to contents can be set based on the identity of contents, and a multilingual network can be created through a set relation value. The user can search for the same content expressed in multiple languages through the generated multi-language network.

이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, It belongs to the scope of right.

Claims (12)

웹 기반 서비스에 신규 콘텐츠가 추가된 경우, 상기 신규 콘텐츠와 동일한 원본 콘텐츠를 검색하는 단계;
상기 원본 콘텐츠의 디스크립션 중에서 상기 신규 콘텐츠를 추가한 사용자가 사용하는 언어와 다른 언어로 표현된 다국어 디스크립션을 수집하는 단계; 및
상기 신규 콘텐츠의 디스크립션과 상기 다국어 디스크립션 사이의 관계값을 생성하는 것을 통해 다국어 관계망을 생성하는 단계;
를 포함하는 다국어 관계망 생성 방법.
Searching for an original content identical to the new content if new content is added to the web-based service;
Collecting a multilingual description expressed in a language different from a language used by a user who has added the new content among the descriptions of the original content; And
Creating a multilingual network through generating a relationship value between the description of the new content and the multilingual description;
The method comprising the steps of:
제1항에서,
상기 원본 콘텐츠를 검색하는 단계는,
상기 신규 콘텐츠가 인용 방식으로 추가된 경우, 상기 신규 콘텐츠가 인용하고 있는 피인용 콘텐츠를 상기 원본 콘텐츠로 결정하는 단계;
를 포함하는 다국어 관계망 생성 방법.
The method of claim 1,
The step of retrieving the original content may include:
Determining, when the new content is added in a cited manner, the content to be cited by the new content as the original content;
The method comprising the steps of:
제2항에서,
상기 원본 콘텐츠를 검색하는 단계는,
기존에 상기 피인용 콘텐츠와 동일한 것으로 결정된 콘텐츠를 상기 원본 콘텐츠로 결정하는 단계;
를 더 포함하는 다국어 관계망 생성 방법.
3. The method of claim 2,
The step of retrieving the original content may include:
Determining a content determined to be the same as the content to be cited in the past as the original content;
The method comprising the steps of:
제2항에서,
상기 원본 콘텐츠를 검색하는 단계는,
상기 신규 콘텐츠가 상기 인용 방식이 아닌 방식으로 추가된 경우, 상기 신규 콘텐츠의 속성값과 동일한 속성값을 가지는 콘텐츠를 검색하여 상기 원본 콘텐츠로 결정하는 단계;
를 더 포함하는 다국어 관계망 생성 방법.
3. The method of claim 2,
The step of retrieving the original content may include:
Searching for a content having the same attribute value as the attribute value of the new content and determining the content as the original content if the new content is added in a manner other than the quotation method;
The method comprising the steps of:
제4항에서,
상기 속성값은,
해당 콘텐츠의 해시(hash) 값 또는 출처의 파일 식별자(Uniform Resource Locator, URL)인 다국어 관계망 생성 방법.
5. The method of claim 4,
The attribute value,
A hash value of the content or a file identifier (Uniform Resource Locator, URL) of the source.
제1항에서,
상기 다국어 관계망을 생성하는 단계는,
인크레먼트(increment) 함수를 이용하여 상기 신규 콘텐츠의 디스크립션과 상기 다국어 디스크립션 사이의 관계값을 증가시켜, 상기 다국어 관계망을 생성하는 단계;
를 포함하는 다국어 관계망 생성 방법.
The method of claim 1,
Wherein the step of generating the multi-
Increasing the relationship value between the description of the new content and the multilingual description using an increment function to generate the multilingual network;
The method comprising the steps of:
웹 기반 서비스에 신규 콘텐츠가 추가된 경우, 상기 신규 콘텐츠와 동일한 원본 콘텐츠를 검색하는 원본 검색부;
상기 원본 콘텐츠의 디스크립션 중에서 상기 신규 콘텐츠를 추가한 사용자가 사용하는 언어와 다른 언어로 표현된 다국어 디스크립션을 수집하는 디스크립션 수집부; 및
상기 신규 콘텐츠의 디스크립션과 상기 다국어 디스크립션 사이의 관계값을 생성하는 것을 통해 다국어 관계망를 생성하는 관계 설정부;
를 포함하는 다국어 관계망 생성 장치.
An original search unit for searching for an original content identical to the new content when new content is added to the web-based service;
A description collection unit for collecting, in a description of the original content, a multilingual description expressed in a language different from a language used by a user who has added the new content; And
A relationship setting unit for generating a multilingual network through generating a relationship value between the description of the new content and the multilingual description;
And a plurality of foreign language networks.
제7항에서,
상기 원본 검색부는,
상기 신규 콘텐츠가 인용 방식으로 추가된 경우, 상기 신규 콘텐츠가 인용하고 있는 피인용 콘텐츠를 상기 원본 콘텐츠로 결정하는,
다국어 관계망 생성 장치.
8. The method of claim 7,
The original search unit
And when the new content is added in a cited manner, determining that the content to be cited by the new content is the original content,
Multilingual network generating device.
제8항에서,
상기 원본 검색부는,
기존에 상기 피인용 콘텐츠와 동일한 것으로 결정된 콘텐츠를 상기 원본 콘텐츠로 결정하는,
다국어 관계망 생성 장치.
9. The method of claim 8,
The original search unit
Determining a content determined to be the same as the content to be cited in the past as the original content,
Multilingual network generating device.
제8항에서,
상기 원본 검색부는,
상기 신규 콘텐츠가 상기 인용 방식이 아닌 방식으로 추가된 경우, 상기 신규 콘텐츠의 속성값과 동일한 속성값을 가지는 콘텐츠를 검색하여 상기 원본 콘텐츠로 결정하는,
다국어 관계망 생성 장치.
9. The method of claim 8,
The original search unit
A content having the same attribute value as the attribute value of the new content is searched and determined as the original content when the new content is added in a manner other than the quotation method,
Multilingual network generating device.
제10항에서,
상기 속성값은,
해당 콘텐츠의 해시(hash) 값 또는 출처의 파일 식별자(Uniform Resource Locator, URL)인 다국어 관계망 생성 장치.
11. The method of claim 10,
The attribute value,
A hash value of the content, or a file identifier (Uniform Resource Locator) (URL) of the source.
제7항에서,
상기 관계 생성부는,
인크레먼트(increment) 함수를 이용하여 상기 콘텐츠의 디스크립션과 상기 다국어 디스크립션 사이의 관계값을 증가시켜, 상기 다국어 관계망을 생성하는,
다국어 관계망 생성 장치.
8. The method of claim 7,
Wherein the relationship generator comprises:
The method comprising: incrementing a relationship value between a description of the content and the multilingual description using an increment function,
Multilingual network generating device.
KR1020130160503A 2013-12-20 2013-12-20 Method and apparatus of generating multilingual semantic network based on the user description KR101541297B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130160503A KR101541297B1 (en) 2013-12-20 2013-12-20 Method and apparatus of generating multilingual semantic network based on the user description

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130160503A KR101541297B1 (en) 2013-12-20 2013-12-20 Method and apparatus of generating multilingual semantic network based on the user description

Publications (2)

Publication Number Publication Date
KR20150072869A KR20150072869A (en) 2015-06-30
KR101541297B1 true KR101541297B1 (en) 2015-08-03

Family

ID=53518724

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130160503A KR101541297B1 (en) 2013-12-20 2013-12-20 Method and apparatus of generating multilingual semantic network based on the user description

Country Status (1)

Country Link
KR (1) KR101541297B1 (en)

Also Published As

Publication number Publication date
KR20150072869A (en) 2015-06-30

Similar Documents

Publication Publication Date Title
CA2832909C (en) System and method for matching comment data to text data
US8635061B2 (en) Language identification in multilingual text
US20150067476A1 (en) Title and body extraction from web page
JP2015523659A (en) Multilingual mixed search method and system
US8812504B2 (en) Keyword presentation apparatus and method
US10936806B2 (en) Document processing apparatus, method, and program
CN107357777B (en) Method and device for extracting label information
Cordobés et al. Graph-based techniques for topic classification of tweets in Spanish
JP5952711B2 (en) Prediction server, program and method for predicting future number of comments in prediction target content
CN104679783A (en) Network searching method and device
US10176256B1 (en) Title rating and improvement process and system
JP6108212B2 (en) Synonym extraction system, method and program
JP6106489B2 (en) Semantic analyzer and program
US20120023119A1 (en) Data searching system
KR101541297B1 (en) Method and apparatus of generating multilingual semantic network based on the user description
CN107220249B (en) Classification-based full-text search
KR20070008994A (en) System and method for extracting domain information in unstructured web documents
KR101402339B1 (en) System and method of managing document
JP6079207B2 (en) Keyword presentation program, keyword presentation method, and keyword presentation apparatus
JP6488399B2 (en) Information presentation system and information presentation method
JP2015103101A (en) Text summarization device, method, and program
KR101541299B1 (en) Method and apparatus of generating contents semantic network based on the user description
JP2015225412A (en) Document summarizing device, method, and program
JP6655981B2 (en) Keyword extraction device, keyword extraction method, and program
JP5495425B2 (en) Sentence correction program, method, and sentence analysis server for correcting sentences containing unknown words

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180626

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190624

Year of fee payment: 5