KR20170085736A - Apparatus and method for creating information on electronic publication - Google Patents

Apparatus and method for creating information on electronic publication Download PDF

Info

Publication number
KR20170085736A
KR20170085736A KR1020160005235A KR20160005235A KR20170085736A KR 20170085736 A KR20170085736 A KR 20170085736A KR 1020160005235 A KR1020160005235 A KR 1020160005235A KR 20160005235 A KR20160005235 A KR 20160005235A KR 20170085736 A KR20170085736 A KR 20170085736A
Authority
KR
South Korea
Prior art keywords
information
character
subject
verb
property information
Prior art date
Application number
KR1020160005235A
Other languages
Korean (ko)
Other versions
KR101781597B1 (en
Inventor
김승훈
김기원
김서희
박태근
안희정
윤종률
이원진
이재동
홍민하
Original Assignee
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 산학협력단 filed Critical 단국대학교 산학협력단
Priority to KR1020160005235A priority Critical patent/KR101781597B1/en
Priority to PCT/KR2016/003347 priority patent/WO2017122872A1/en
Publication of KR20170085736A publication Critical patent/KR20170085736A/en
Application granted granted Critical
Publication of KR101781597B1 publication Critical patent/KR101781597B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices

Abstract

본 발명의 일 실시예에 따른 전자 출판물에 대한 정보 생성 장치는 전자 출판물을 입력받는 입력부와, 동사의 성질을 나타내는 성질 정보를 복수 개의 동사 각각에 대하여 저장하는 저장부와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 문장 구조 파악부 및 상기 추출된 동사 각각의 성질 정보를 상기 저장부로부터 획득하며 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 인물 파악부를 포함하는 등장 인물 파악부와, 상기 파악된 등장 인물에 대한 정보를 생성하는 정보 생성부를 포함한다..According to an embodiment of the present invention, there is provided an apparatus for generating information about an electronic publication, the apparatus comprising: an input unit for inputting an electronic publication; a storage unit for storing property information indicating a property of the verb for each of a plurality of verbs; A sentence structure grasping unit for extracting a subject and a verb from a plurality of sentences respectively, and a verb structure acquiring unit for acquiring the property information of each of the extracted verbs from the storage unit and associating the verb corresponding to the acquired property information on the basis of the obtained property information A character recognition unit for recognizing a subject as a character in the electronic publication; and an information generation unit for generating information on the identified character.

Description

전자 출판물에 대한 정보를 생성하는 장치 및 방법{APPARATUS AND METHOD FOR CREATING INFORMATION ON ELECTRONIC PUBLICATION}[0001] APPARATUS AND METHOD FOR CREATING INFORMATION ON ELECTRONIC PUBLICATION [0002]

본 발명은 전자 출판물에 대한 정보를 생성하는 장치 및 방법에 관한 것이다. 보다 자세하게는 전자 출판물을 구성하는 문장으로부터 동사의 성질을 나타내는 성질 정보를 이용하여 등장 인물을 파악하고, 이와 같이 파악된 등장 인물에 대한 정보, 예를 들면 등장 인물 중에서 전자 출판물에서 차지하는 비중이 높은 주요한 등장 인물이 누구인지에 대한 정보를 생성하는 정보 생성 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for generating information about electronic publications. More specifically, it is possible to grasp the characters by using the property information indicating the properties of the verb from the sentences constituting the electronic publications, and to obtain information on the characters thus identified, for example, And an information generating apparatus and method for generating information on who the character is.

최근, 기존의 종이책으로 제공되던 많은 컨텐츠는 전자 출판물의 일종인 전자책(e-book)으로 제공되고 있다. 전자책은 퍼스널 컴퓨터(PC), 스마트폰, 노트북 또는 태블릿과 같은 전자책 전용 단말기에서, 전자책 리더(reader) 또는 뷰어(viewer) 소프트웨어를 통해 열람 가능하다. In recent years, many contents provided as existing paper books have been provided as electronic books (e-books), which are electronic publications. An e-book can be viewed on an e-book-only terminal such as a personal computer (PC), a smart phone, a notebook or a tablet, or through an e-book reader or viewer software.

전자책은 디지털화된 정보의 형태를 갖는다. 따라서, 정보를 추출하고 추출된 정보를 데이터베이스로 구축하는데 있어서, 전자책은 기존의 종이책보다 용이하다. 데이터베이스로 구축된 전자책에 대한 정보는 예를 들면, 공공 도서관이나 대학의 도서관, 전자책을 판매하는 도서 정보 제공 사이트 등에서 다양하게 활용 가능하다.Electronic books have the form of digitized information. Therefore, in extracting information and constructing extracted information as a database, electronic books are easier than existing paper books. Information on e-books constructed as databases can be used in various ways, for example, in public libraries, university libraries, and book information websites that sell e-books.

전자책으로부터 추출 가능한 정보에는 예를 들면 가격에 대한 정보, 저자(author)에 대한 정보, 타인이 온라인으로 작성한 서평에 대한 정보 등이 있으며, 전자책에 등장하는 등장 인물에 대한 정보도 있다. 이 중에서 등장 인물에 대한 정보에 대하여 보다 구체적으로 살펴보도록 한다.Information that can be extracted from an eBook includes, for example, information about the price, information about the author, information about book reviews written online by others, and information about the characters appearing in e-books. Among these, the information about the characters will be discussed in more detail.

전자책 중에서 소설의 경우, 주로 등장 인물을 중심으로 내용이 전개된다. 따라서, 소설에 있어서의 등장 인물에 대한 정보, 그 중에서도 소설에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보는 다른 장르의 전자책보다 상대적으로 중요하다. 아울러, 소설 뿐만 아니라 다른 장르의 도서 분석에 있어서도 등장 인물에 대한 정보는 다양한 방면에서 활용 가능하다.In the case of novels among e-books, contents are mainly developed around characters. Therefore, information about the characters in novels, among them the key characters who play a major role in novels, is relatively more important than other genres of electronic books. In addition, in the analysis of books of different genres as well as novels, information on characters can be used in various ways.

이러한 등장 인물에 대한 정보를 전자책으로부터 추출하기 위해서는, 전자책을 구성하는 복수의 문장으로부터 등장 인물을 추출하는 과정이 수행되어야 한다. 이를 위한 종래의 기술로, 국내 등록특허 10-1255957호는 사람의 명칭을 저장하고 있는 인물 사전(dictionary)을 이용하여 등장 인물을 추출한다. 이에 따르면, 전자책을 구성하는 문장이 인물 사전에 등재된 사람의 명칭과 동일한 단어를 포함하고 있으면, 해당 단어는 등장 인물을 지칭하는 것으로 인식된다.In order to extract information on the character from the electronic book, a process of extracting characters from a plurality of texts constituting the electronic book must be performed. In the conventional technique for this purpose, Korean Patent No. 10-1255957 extracts a character using a person dictionary storing the name of a person. According to this, if the sentence constituting the electronic book includes the same word as the name of the person registered in the person dictionary, the word is recognized as referring to the character.

그러나, 이러한 종래의 기술은, 인물 사전에 등재되어 있지 않은 새로운 명칭은 등장 인물로 인식할 수 없다. 등장 인물의 명칭은 누구나 임의로 지을 수 있다는 점 그리고 시대에 따라서 명칭은 계속하여 변화한다는 점을 고려하면, 인물 사전에 제한받지 않고 등장 인물에 대한 정보, 그 중에서도 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출하는 방안이 요구된다.However, such a conventional technique can not recognize a new name that is not listed in the person dictionary as a character. Considering that the name of the character can be arbitrarily constructed and that the name changes continuously according to the age, it is not limited to the character dictionary, and information about the character is the main character It is required to extract information about recognition.

한국등록특허, 10-1255957 (2013.04.11.등록)Korea registered patent, 10-1255957 (registered on Apr. 11, 2013)

본 발명의 해결하고자 하는 과제는 전자책과 같은 전자 출판물로부터 등장 인물에 대한 정보, 예를 들면 해당 전자 출판물에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출하는 기술을 제공하는 것이다.A problem to be solved by the present invention is to provide a technique for extracting information on a character from electronic publications such as electronic books, for example, information on who is a main character who plays a major role in the electronic publication .

다만, 본 발명의 해결하고자 하는 과제는 이에 한정되지 않는다However, the problem to be solved by the present invention is not limited to this

본 발명의 일 실시예에 따른 전자 출판물에 대한 정보 생성 장치는 전자 출판물을 입력받는 입력부와, 동사의 성질을 나타내는 성질 정보를 복수 개의 동사 각각에 대하여 저장하는 저장부와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 문장 구조 파악부 및 상기 추출된 동사 각각의 성질 정보를 상기 저장부로부터 획득하며 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 인물 파악부를 포함하는 등장 인물 파악부와, 상기 파악된 등장 인물에 대한 정보를 생성하는 정보 생성부를 포함한다.According to an embodiment of the present invention, there is provided an apparatus for generating information about an electronic publication, the apparatus comprising: an input unit for inputting an electronic publication; a storage unit for storing property information indicating a property of the verb for each of a plurality of verbs; A sentence structure grasping unit for extracting a subject and a verb from a plurality of sentences respectively, and a verb structure acquiring unit for acquiring the property information of each of the extracted verbs from the storage unit and associating the verb corresponding to the acquired property information on the basis of the obtained property information A character recognition unit for recognizing a subject as a character in the electronic publication; and an information generation unit for generating information on the identified character.

또한, 상기 저장부에서 동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 가질 수 있다.Also, verbs having the same or similar meaning in the storage unit may have the same property information among each other.

또한, 상기 인물 파악부는 상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.In addition, if the acquired property information is property information related to a behavior of a person, the person identification unit can identify a subject related to the verb corresponding to the acquired property information as a character in the electronic publication.

또한, 상기 문장 구조 파악부는 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되는 문장을 선별하고, 상기 인물 파악부는 상기 선별된 문장에 포함된 동사의 성질 정보를 상기 저장부로부터 획득하며, 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.Also, the sentence structure recognition unit may extract a subject and a verb from the plurality of sentences, respectively, and select a sentence in which at least one subject and a verb are extracted, and the person identification unit identifies the verb's property information included in the selected sentence, And a subject associated with the verb corresponding to the obtained property information is recognized as a character in the electronic publication based on the acquired property information.

또한, 상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며, 상기 인물 파악부는 상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하고, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물로 파악할 때 제외시킬 수 있다.The storage unit may store an exclusion list having information on a subject that should be excluded from the character, and the person identification unit may check whether the extracted subject is included in the exclusion list, If it is included in the list, the extracted subject can be excluded when it is recognized as the character.

또한, 상기 정보 생성부는 상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하며, 상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정할 수 있다.Further, the information generating unit may add a predetermined value to the main figure corresponding to the subject every time the subject is recognized as a character, and may select a subject having a relatively high main figure as a main character.

또한, 상기 주요도에 더해지는 수치는 상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 가질 수 있다.In addition, the numerical value added to the main diagram may have a relatively small value in a single sentence including a subject recognized as the character, as the number of subjects included in the single sentence increases.

본 발명의 일 실시예에 따른 정보 생성 방법은 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 포함한다.According to another aspect of the present invention, there is provided a method of generating information, the method comprising: receiving an electronic publication; extracting a subject and a verb from a plurality of sentences constituting the electronic publication; The method comprising the steps of: acquiring, from a storage unit for storing a plurality of verbs, a subject associated with a verb corresponding to the acquired property information as a character in the electronic publication based on the acquired property information; , And generating information on the identified character.

또한, 상기 저장부에서 동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 가질 수 있다.Also, verbs having the same or similar meaning in the storage unit may have the same property information among each other.

또한, 상기 등장 인물로 파악하는 단계는 상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.Also, in the step of identifying as a character, if the acquired property information is property information related to a behavior of a person, the subject related to the verb corresponding to the acquired property information can be recognized as a character in the electronic publication.

또한, 상기 성질 정보를 획득하는 단계와 상기 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와 상기 파악된 등장 인물에 대한 정보를 생성하는 단계는, 상기 추출하는 단계에서, 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되면 수행될 수 있다.In addition, the step of acquiring the property information, the step of recognizing the subject as a character in the electronic publication, and the step of generating information on the identified character are performed in the extracting step, The subject and verb can be extracted if at least one subject and verb are extracted.

또한, 상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며, 상기 등장 인물로 파악하는 단계는 상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하는 단계와, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물로 파악할 때 제외시키는 단계를 더 포함할 수 있다.The storage unit may store an exclusion list having information on a subject that should be excluded from the character, and the step of recognizing the character as the character may include checking whether the extracted subject is included in the exclusion list, If the extracted subject is included in the exclusion list, the extracted subject may be excluded when the subject is recognized as the character.

또한, 상기 정보를 생성하는 단계는 상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하는 단계와, 상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정하는 단계를 포함할 수 있다.The step of generating the information may include the steps of adding a predetermined value to the main figure corresponding to the subject every time the subject is recognized as a character, and selecting the main subject as a main character Step < / RTI >

또한, 상기 주요도에 소정의 수치를 더하는 단계는 상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는 수치를 더할 수 있다.In addition, the step of adding a predetermined value to the main figure may include adding a numerical value having a relatively small value in a single sentence including a subject recognized as the character, as the number of subjects included in the one sentence increases have.

본 발명의 다른 실시예에 따른 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램은 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하도록 프로그램된다.A computer program stored in a computer-readable recording medium according to another embodiment of the present invention includes the steps of receiving an electronic publication, extracting a subject and a verb from a plurality of sentences constituting the electronic publication, Acquiring from the storage unit for storing each piece of property information for each of a plurality of verbs; and based on the acquired property information, extracting a subject related to the verb corresponding to the acquired property information from the electronic publication Identifying the person as a character, and generating information on the identified character.

본 발명의 또 다른 실시예에 따른 컴퓨터 판독가능 기록매체는 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하는 명령어를 포함하는 프로그램이 기록된다.According to another aspect of the present invention, there is provided a computer-readable medium having the steps of receiving an electronic publication, extracting a subject and a verb from a plurality of sentences constituting the electronic publication, Acquiring information on a verb corresponding to the obtained property information from a storage unit for storing each of a plurality of verbs; and acquiring, based on the acquired property information, a subject related to the verb corresponding to the acquired property information as a character in the electronic publication , And a step of generating information on the identified character is recorded.

본 발명의 일 실시예에 따르면, 인물 사전을 이용하지 않고도 전자책과 같은 전자 출판물로부터 등장 인물에 대한 정보를 추출할 수 있다. 따라서, 전자 출판물이 작가가 임의로 지은 등장 인물에 대한 명칭을 포함하고 있는 경우에도 등장 인물에 대한 정보를 정확하게 추출할 수 있다. 아울러, 해당 전자 출판물에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출함에 있어서, 하나의 문장에 포함된 주어의 개수를 반영함으로써 보다 세밀하게 주요 등장 인물을 추출할 수 있다.According to an embodiment of the present invention, information on a character can be extracted from an electronic publication such as an electronic book without using a character dictionary. Therefore, even when the electronic publication includes the name of the character arbitrarily created by the artist, the information on the character can be accurately extracted. Further, in extracting information on who is the main character who plays a major role in the electronic publications, the main characters can be extracted more finely by reflecting the number of subjects included in one sentence.

도 1a는 본 발명의 일 실시예에 따른 정보 생성 장치를 이용하는 것을 도시한 도면이다.
도 1b는 본 발명의 일 실시예에 따른 정보 생성 장치가, 전자 출판물에 등장하는 등장 인물에 대한 정보를 독자에게 제공하는 것을 예시적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 정보 생성 장치의 구성을 도시한 도면이다
도 3a 및 3b는 저장부에서 복수 개의 동사에 대하여 성질 정보가 할당되어 있는 것을 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 등장 인물 파악부의 구성을 상세하게 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 정보 생성 방법의 단계를 도시한 도면이다
도 6은 도 5에서 등장 인물에 대한 정보를 생성하는 단계를 세부적으로 도시한 도면이다.
FIG. 1A is a diagram showing the use of an information generating apparatus according to an embodiment of the present invention.
FIG. 1B is a diagram illustrating an example in which the information generating apparatus according to the embodiment of the present invention provides information to a reader about a character appearing in an electronic publication.
2 is a diagram illustrating a configuration of an information generating apparatus according to an embodiment of the present invention
3A and 3B are diagrams showing that property information is allocated to a plurality of verbs in the storage unit.
FIG. 4 is a diagram showing in detail a configuration of a character figure-of-catcher according to an embodiment of the present invention.
5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention
FIG. 6 is a detailed view showing a step of generating information on a character in FIG.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention and the manner of achieving them will become apparent with reference to the embodiments described in detail below with reference to the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. To fully disclose the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims.

본 발명의 일 실시예를 설명하기에 앞서, 전자 출판물은 전자책(e-book)이나 인터넷 상에서 열람 가능한 텍스트 형태의 정보(예를 들면, 인터넷 신문, 인터넷 잡지, 블로그 등) 등을 지칭하는 것이며, 다만 이에 한정되는 것은 아니다. 전자 출판물은 적어도 하나 이상의 문장으로 구성된다.Before describing an embodiment of the present invention, an electronic publication refers to an electronic book (e-book) or information in a form of text that can be browsed on the Internet (for example, an Internet newspaper, an Internet magazine, a blog, , But is not limited thereto. The electronic publication is composed of at least one sentence.

도 1a는 본 발명의 일 실시예에 따른 정보 생성 장치를 사용자가 이용하는 것을 도시한 도면이다.FIG. 1A is a diagram illustrating a user's use of an information generating apparatus according to an embodiment of the present invention.

도 1a를 참조하면, 정보 생성 장치(100)와 사용자(310)가 사용하는 사용자 단말(300)은 네트워크(200)를 통해 연결된다. 다만, 도 1a는 예시적인 것이므로 본 발명의 사상이 이와 같이 도시된 것으로 한정 해석되는 것은 아니다.Referring to FIG. 1A, a user terminal 300 used by an information generating apparatus 100 and a user 310 is connected through a network 200. It should be understood, however, that the concept of the present invention is not construed as being limited by the above description,

먼저, 사용자 단말(300)은 정보 생성 장치(100)로부터 네트워크(200)를 통해 전자 출판물에 대한 정보를 수신하고 이를 표시한다. 사용자 단말(300)에 표시되는 정보는 전자 출판물에 대한 다양한 정보, 예를 들면 가격에 대한 정보, 저자(author)에 대한 정보, 타인이 작성한 서평에 대한 정보, 등장 인물에 대한 정보 등을 포함한다. 도 1b는 전자 출판물이 전자책(e-book)일 때, 전자책에 등장하는 등장 인물에 대한 정보가 사용자 단말(300)에 표시된 것을 예시적으로 도시한 도면이다. 이러한 사용자 단말(300)은 인터넷에 접속 가능한 장치로서, 예를 들면 개인용 컴퓨터, 스마트폰 또는 스마트패드 등일 수 있다.First, the user terminal 300 receives information about the electronic publications from the information generating apparatus 100 via the network 200 and displays the information. The information displayed on the user terminal 300 includes various pieces of information about the electronic publication, for example, information on prices, information on the author, information on book reviews created by others, information on characters, and the like . FIG. 1B is a diagram exemplarily showing information on a character appearing in an electronic book displayed on the user terminal 300 when the electronic publication is an e-book. Such a user terminal 300 is an apparatus connectable to the Internet, for example, a personal computer, a smart phone, a smart pad, or the like.

네트워크(200)는 사용자 단말(300)과 정보 생성 장치(100)를 연결하며, 예를 들면, LAN, 3G, LTE, LTE-A, Wi-Fi 또는 블루투스 등의 방식으로 구현될 수 있다.The network 200 connects the user terminal 300 and the information generating apparatus 100 and may be implemented by a method such as LAN, 3G, LTE, LTE-A, Wi-Fi or Bluetooth.

정보 생성 장치(100)는 전자 출판물에 대한 정보를 네트워크(200)를 통해 사용자 단말(300)로 전달한다. 이를 위해, 정보 생성 장치(100)는 전자 출판물을 적어도 하나 이상 입력받으며, 입력받은 전자 출판물로부터 다양한 정보를 추출한다. 정보 생성 장치(100)는 서버, 개인용 컴퓨터(PC) 등에서 구현될 수 있다. 아울러, 이러한 정보 생성 장치(100)는 도서 정보를 제공하는 온라인 도서관, 종이책을 판매하는 업체에서 운영하는 온라인 도서 판매/정보 제공 시스템, 또는 전자책을 판매하는 업체에서 운영하는 온라인 전자책 판매/정보 제공 시스템 등에 적용 가능하다. 이하에서는 이러한 정보 생성 장치(100)에 대하여 보다 자세하게 살펴보기로 한다.The information generating apparatus 100 transmits information about electronic publications to the user terminal 300 through the network 200. [ To this end, the information generating apparatus 100 receives at least one electronic publication and extracts various information from the received electronic publication. The information generating apparatus 100 may be implemented in a server, a personal computer (PC) or the like. In addition, the information generating apparatus 100 may include an online library for providing book information, an online book selling / information providing system operated by a company that sells paper books, an online book selling / information providing system operated by a company that sells electronic books, Information providing system, and the like. Hereinafter, the information generating apparatus 100 will be described in more detail.

도 2는 본 발명의 일 실시예에 따른 정보 생성 장치의 구성을 도시한 도면이다.2 is a diagram showing a configuration of an information generating apparatus according to an embodiment of the present invention.

도 2를 참조하면, 정보 생성 장치(100)는 입력부(110), 저장부(120), 등장 인물 파악부(130) 및 정보 생성부(140)를 포함한다. 다만, 정보 생성 장치(100)의 이러한 구성은 예시적인 것이므로, 이 중 적어도 하나 이상의 구성이 포함되지 않거나 여기에 도시되지 않은 구성이 더 포함될 수 있다.2, the information generating apparatus 100 includes an input unit 110, a storage unit 120, a character recognizing unit 130, and an information generating unit 140. As shown in FIG. However, this configuration of the information generating apparatus 100 is for illustrative purposes, so that at least one of the configurations of the information generating apparatus 100 is not included or may not be shown here.

입력부(110)는 전자 출판물을 입력받는다. 입력부(110)가 전자 출판물을 입력(또는 전달)받는 방식에는 예를 들면, 전자 출판물을 저장하는 별도의 데이터베이스(도면에는 미도시)와 연결되어 그로부터 전자 출판물을 전달받는 방식, USB나 광디스크와 같은 저장 매체와 연결되어 이에 저장된 전자 출판물을 전달받는 방식 또는 정보 생성 장치(100)의 관리자로부터 임의의 전자 출판물을 직접 입력받는 방식 등이 있으며, 다만 이에 한정되지 않는다. 이러한 입력부(110)는 데이터베이스와 연결되는 통신 포트, USB와 연결되는 직렬(serial) 포트 또는 광디스크를 읽는 리더기(예를 들면 CD-ROM) 등일 수 있다.The input unit 110 receives electronic publications. Examples of the way in which the input unit 110 receives (or delivers) electronic publications include a method of receiving electronic publications from a separate database (not shown) storing electronic publications and receiving electronic publications therefrom, A method of receiving an electronic publication stored in the storage medium, or a method of directly receiving an electronic publication from an administrator of the information generating apparatus 100, but the present invention is not limited thereto. The input unit 110 may be a communication port connected to the database, a serial port connected to the USB, or a reader (e.g., CD-ROM) for reading the optical disc.

저장부(120)는 복수 개의 동사와, 복수 개의 동사 각각의 성질을 나타내는 성질 정보를 미리 저장한다. 이러한 저장부(120)는 데이터를 저장하는 메모리 등으로 구현 가능하다. 이하에서는 성질 정보에 대하여 보다 자세하게 살펴보도록 한다. The storage unit 120 previously stores a plurality of verbs and property information indicating the property of each of the plurality of verbs. The storage unit 120 may be implemented as a memory for storing data. Hereinafter, the property information will be described in more detail.

성질 정보는 동사가 나타내는 의미를 기초로 동사의 성질을 나타내는 정보이다. 이러한 성질 정보는, 예를 들면 국립국어원과 같이, 국가의 언어를 연구하고 관리하는 기관에서 동사마다 부여한다. 이에, 일 실시예에서는 이와 같은 기관에서 동사에 성질 정보를 부여한 자료를 획득하여 저장부(120)에 저장한 뒤 활용할 수 있으나 이에 한정되는 것은 아니다. 도 3a는 동사마다 성질 정보를 나타낸 것을 예시적으로 도시한 도면이다. 도 3a를 참조하면, 동사 '가격하다'는 특정 대상을 향하여 타격을 가하는 행위를 나타내므로 성질 정보는 '방향성 행위동사'이며, 동사 '가공시키다'는 무언가를 생성하는 행위를 나타내므로 성질 정보는 '창조 행위동사'이다. The property information is information indicating the nature of the verb based on the meaning represented by the verb. Such property information is given to each verb in an institution that researches and manages the language of the country, for example, the National Language Institute. Accordingly, in one embodiment, data obtained by assigning property information to a verb in such an institution may be obtained and stored in the storage unit 120, but the present invention is not limited thereto. 3A is a diagram exemplarily showing property information for each verb. Referring to FIG. 3A, since the verb 'prune' indicates an act of striking a specific object, the property information is a 'directional action verb', and the verb 'generates' something to produce. It is a 'creation act verb'.

저장부(120)에 저장된 동사 중에는 동일하거나 유사한 의미를 갖는 동사들이 있다. 예를 들면, 동사 '말하다'와 동사 '대화하다'는 유사한 의미를 가지며, 동사 '원하다', 동사 '바라다' 및 동사 '기원하다'는 서로 간에 유사한 의미를 갖는다. 이와 같이 동일하거나 유사한 의미를 갖는 동사들에 대해서, 저장부(120)는 동일한 성질 정보를 갖도록 구성될 수 있다.Among the verbs stored in the storage unit 120, there are verbs having the same or similar meaning. For example, the verb 'to talk' and the verb 'to communicate' have a similar meaning, and the verb 'wants', 'verb' and 'originate' have similar meanings. For such verbs having the same or similar meaning, the storage unit 120 may be configured to have the same property information.

한편, 저장부(120)는 제외 리스트를 저장한다. 제외 리스트는 등장 인물에서 제외되어야 하는 명칭을 적어도 하나 이상 갖는다. 후술하겠지만 일 실시예에서는 문장으로부터 추출된 주어가 등장 인물인지 여부를 파악함에 있어서 동사의 성질 정보를 참고하는데, 제외 리스트에 저장된 명칭과 동일한 주어는 동사의 성질 정보와는 무관하게 등장 인물이 아닌 것으로 간주된다. 이러한 제외 리스트는 정보 생성 장치(100)를 관리하는 관리자 등에 의하여 작성될 수 있으며, 이후 그 안에 포함된 명칭은 추가, 수정 또는 삭제될 수 있다.Meanwhile, the storage unit 120 stores the exclusion list. The exclusion list has at least one name that should be excluded from the characters. As will be described later, in one embodiment, the fact that the subject extracted from the sentence is a character is referred to, and the same subject as the name stored in the exclusion list is not a character regardless of the property information of the verb . Such an exclusion list may be created by an administrator or the like who manages the information generating apparatus 100, and the names included therein may be added, modified or deleted.

등장 인물 파악부(130)는 전자 출판물에 등장하는 등장 인물을 파악하며, 이러한 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리, 그리고 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다. The character identification unit 130 can be embodied by a microprocessor for recognizing a character appearing in an electronic publication, a memory for storing a command programmed to perform such a function, and a microprocessor for executing such a command.

도 4는 이러한 등장 인물 파악부의 구성을 보다 세부적으로 도시한 도면이다. 도 4를 참조하면, 등장 인물 파악부(130)는 전처리부(131), 문장 구조 파악부(133) 및 인물 파악부(135)를 포함할 수 있다. 그리고 각각의 구성은 후술될 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리, 그리고 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다.Fig. 4 is a diagram showing in more detail the configuration of the character character recognition unit. 4, the character character recognition unit 130 may include a preprocessor 131, a sentence structure recognition unit 133, and a character recognition unit 135. [ Each configuration may be implemented by a memory that stores instructions programmed to perform the functions described below, and a microprocessor that executes such instructions.

전처리부(131)는 전자 출판물을 구성하는 복수의 문장을 각각 하나의 문장으로 분리할 수 있다. 이를 위하여, 전처리부(131)는 괄호를 검색할 수 있으며, 검색된 괄호와 이러한 괄호 안에 있는 내용을 제거할 수 있다. 또한 전처리부(131)는 마침표, 쉼표, 느낌표 또는 물음표 등을 인식한 뒤 이들을 기준으로 복수의 문장을 각각 하나의 문장으로 분리할 수 있다.The preprocessing unit 131 may separate a plurality of sentences constituting the electronic publication into one sentence. To this end, the preprocessing unit 131 may search for parentheses and remove the searched parentheses and the content within these parentheses. In addition, the preprocessing unit 131 may recognize a period, a comma, an exclamation point, a question mark, or the like, and divide a plurality of sentences into one sentence on the basis of these.

문장 구조 파악부(133)는 각각의 문장으로부터 주어와 동사를 추출한다. 이를 위하여, 문장 구조 파악부(133)는 형태소 분석기를 이용하여 문장 내에서 주어와 동사를 구분할 수 있다. 예를 들면, '은', '는', '이' 또는 '가'와 같은 조사와 결합되어 있는 단어에 대해서, 문장 구조 파악부(133)는 문장의 주어로 추출할 수 있다. 다만, 문장을 형태소 단위로 분석하여 그로부터 주어와 동사를 추출하는 기술은 이미 공지된 것이므로 이에 대한 자세한 설명은 생략하기로 한다.The sentence structure grasping unit 133 extracts subject and verb from each sentence. For this, the sentence structure grasping unit 133 can distinguish a subject from a verb in a sentence using a morpheme analyzer. For example, a sentence structure grasping unit 133 can extract a word combined with an investigation such as 'E', 'E', 'E', or 'G' as a subject of a sentence. However, the technique of analyzing a sentence by morpheme unit and extracting a subject and a verb from the sentence is already known, so a detailed description thereof will be omitted.

문장 구조 파악부(133)는, 주어와 동사를 추출한 결과, 복수의 문장 중에서 주어와 동사가 각각 적어도 하나씩 포함된 문장을 선별한다. 일 실시예에서는 주어와 동사가 각각 적어도 하나씩 포함된 문장을 대상으로, 인물 파악부(135)가 이러한 문장에 포함된 주어가 해당 전자 출판물에서의 등장 인물에 해당하는지 여부를 판단한다.The sentence structure grasping unit 133 selects a sentence including at least one subject and a verb among a plurality of sentences as a result of extracting subject and verb. In one embodiment, the person identification unit 135 determines whether the subject included in the sentence corresponds to a character in the corresponding electronic publication, with respect to a sentence including at least one subject and verbs respectively.

인물 파악부(135)는 문장 구조 파악부(133)가 선별한 문장에 포함된 동사의 성질 정보를 저장부(120)로부터 획득한다. 아울러, 인물 파악부(135)는 획득된 성질 정보를 기초로 해당 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단한다. 사람을 주어로 행위 동사란, 행위의 주체가 사람인 동사를 의미한다. 도 3b는 사람을 주어로 하는 행위 동사를 예시적으로 나타낸 것이다.The person identification unit 135 acquires the property information of the verb contained in the sentence selected by the sentence structure identification unit 133 from the storage unit 120. [ In addition, the person identification unit 135 determines whether the verb is an action verb based on a person, based on the acquired property information. The act verb, given to a person, means a verb whose subject is a person. FIG. 3B is an exemplary representation of an action verb based on a person.

여기서, 인물 파악부(135)는 다음과 같은 방법을 이용하여, 성질 정보를 기초로 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단할 수 있다. 예를 들면, 동사의 성질 정보가 기 지정된 성질 정보 중 어느 하나에 속하면, 이러한 동사를 사람을 주어로 하는 행위 동사로 판별할 수 있다. 예를 들면, '결과 행위 동사', '방향성 행위 동사' 또는 '창조 행위 동사'의 성질 정보를 갖는 동사가, 사람을 주어로 하는 행위 동사로 기 지정될 수 있다. 따라서, 동사의 성질 정보가 이 중 어느 하나에 해당하면, 해당 동사는 사람을 주어로 하는 행위 동사로 판별될 수 있다. 다만, 이는 예시적인 것이므로 본 발명의 사상이 이러한 방법에 한정되는 것은 아니다. 예를 들면, 인물 파악부(135)는 동사를 구성하는 어간과 어미 중에서, 어간을 이용하여 동사가 사람을 주어로 하는 행위 동사인지를 파악할 수도 있다.Here, the person identification unit 135 can determine whether the verb is an action verb based on the person, based on the property information, by using the following method. For example, if the property information of the verb belongs to any one of the pre-specified property information, it can be determined that the verb is an action verb based on a person. For example, a verb with property information of 'result action verb', 'directional verb' or 'creation verb' may be predefined as an action verb based on a person. Therefore, if the property information of the verb corresponds to any one of them, the verb can be judged as an action verb based on the person. However, the present invention is not limited to the above-described method. For example, the person identification unit 135 can determine whether the verb is an action verb based on a person, using the stem between the stem and the mother of the verb.

한편, 인물 파악부(135)는, 문장 구조 파악부(133)에서 추출된 주어가 저장부(120)에 저장된 제외 리스트에 포함되어 있는지를 체크한다. 체크 결과, 추출된 주어가 제외 리스트에 포함되어 있으면, 추출된 주어에 대해서는 주어가 등장 인물인지를 파악하는 과정(전술한 동사의 성질 정보를 참조하는 과정)이 수행되지 않으며, 곧바로 등장 인물에서 제외된다. 이를 통해서, 모든 주어가 아닌 일부의 주어에 대해서만 등장 인물인지를 파악하는 과정이 수행될 수 있다. 따라서, 등장 인물을 파악하는데 소요되는 자원과 시간이 절약될 수 수 있다.On the other hand, the person identification unit 135 checks whether or not the subject extracted by the sentence structure recognition unit 133 is included in the exclusion list stored in the storage unit 120. [ As a result of the check, if the extracted subject is included in the exclusion list, the process of determining whether the subject is a character (the process of referring to the property information of the verb mentioned above) is not performed with respect to the extracted subject, do. Through this process, it is possible to perform a process of determining whether a character is a character only for a part of subjects, not all subjects. Therefore, resources and time required to identify characters can be saved.

인물 파악부(135)는, 동사가 사람을 주어로 하는 행위 동사라고 판단되면, 이러한 동사와 관련된 주어를 전자 출판물에서의 등장 인물로 파악한다.If the verb determination unit 135 determines that the verb is an action verb that takes a person as a subject, the subject recognition unit 135 identifies the subject related to the verb as a character in the electronic publication.

이를 기초로 살펴보면, 일 실시예에서는 인물 사전을 활용하지 않고도 동사의 성질 정보를 이용하여 주어가 전자 출판물에서의 등장 인물인지 여부를 파악할 수 있다. 따라서, 등장 인물의 명칭이 작가에 의하여 임의로 지어진 경우에도, 등장 인물에 대한 정보가 정확하게 추출될 수 있다.On the basis of this, in one embodiment, it is possible to know whether or not a subject is a character in an electronic publication by using the property information of the verb without using a person dictionary. Therefore, even when the name of the character is arbitrarily set by the artist, the information on the character can be accurately extracted.

정보 생성부(140)는 인물 파악부(135)에 의하여 파악된 등장 인물에 대한 정보를 생성한다. 생성되는 등장 인물에 대한 정보는, 예를 들면, 등장 인물 중 비중을 상대적으로 많이 차지하는 주요 등장 인물이 누구인지에 대한 정보일 수 있다. 정보 생성부(140)는 이와 같은 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리와, 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다.The information generation unit 140 generates information on the characters identified by the character identification unit 135. [ The information on the character to be generated may be, for example, information on who is the main character that occupies a relatively large portion of the characters. The information generation unit 140 may be implemented by a memory that stores instructions programmed to perform such functions and a microprocessor that executes such instructions.

보다 구체적으로 살펴보면, 정보 생성부(140)는 주요 등장 인물을 선정하기 위해서, 주어가 등장 인물로 파악되는 횟수를 파악하며, 이러한 횟수를 기초로 주요도를 계산한다. 예를 들면, A, B, C 및 D가 임의의 전자 출판물에서의 각각 3번, 8번, 7번, 6번씩 등장 인물로 파악되는 경우를 상정하자. 이 경우, A부터 D까지 등장 인물의 주요도는 각각이 등장 인물로 파악될 때마다 소정의 수치를 더함으로써 산정된다. 이에 따르면, A부터 D까지의 주요도는 각각이 등장 인물로 파악될 때마다 소정의 수치인 1을 더한 결과 각각 3,8,7,6일 수 있다.More specifically, in order to select a major character, the information generation unit 140 determines the number of times a subject is recognized as a character, and calculates a main figure based on the number of times. For example, assume that A, B, C, and D are identified as characters 3, 8, 7, and 6, respectively, in an electronic publication. In this case, the main figures of characters from A to D are calculated by adding predetermined numerical values each time they are identified as characters. According to this, the main diagrams A to D can be 3, 8, 7, and 6, respectively, as a result of adding a predetermined value of 1 each time it is identified as a character.

이 때, 정보 생성부(140)는 등장 인물로 파악될 때마다 더해지는 값(위에서는 '1')에 가중치를 곱한 뒤 가중치가 곱해진 값을 더하여 주요도를 산정할 수 있다. 가중치는 하나의 문장 내에 포함되는 주어의 개수가 많을수록 적은 값을 갖는다. 예를 들면, '갑이 밥을 먹다'라는 문장에서는 주어의 개수가 1개이므로 가중치는 10, '갑과 을이 밥을 먹다'라는 문장에서는 주어의 개수가 2개이므로 가중치는 2, '갑과 을과 병이 밥을 먹다'라는 문장에서는 주어의 개수가 3개이므로 가중치는 1, '갑과 을과 병과 정이 밥을 먹다'에서는 주어의 개수가 4개이므로 가중치는 0일 수 있다. At this time, the information generating unit 140 may calculate the main figure by multiplying the added value ('1' in the above) by a weight, and adding the multiplied value to the added value every time the character is recognized as a character. The weights are smaller as the number of subjects included in one sentence is larger. For example, in the sentence "Eat a meal", the number of subjects is 1, so the weight is 10, and in the sentence "Eat and eat rice", the number of subjects is 2, so the weight is 2, In the sentence "eat this rice", the weight is 1, since the number of subject is 3, and the number of subject is 4 in '

통상적으로, 주요 등장 인물은 단독으로 하는 행동이 많은 반면, 부수적인 등장 인물은 타인들과 함께 하는 행동이 많다. 이를 반영하여, 일 실시예에서는 단독으로 행동을 하는 등장 인물(전자)이 주어로 판단되는 횟수와 타인들과 함께 행동하는 등장 인물(후자)이 주어로 판단되는 횟수가 동일한 경우, 전자의 주요도를 후자의 주요도보다 높게 산정하기 위하여 위와 같이 주어의 개수에 따라 가중치를 반영한 것이다. 다만, 가중치를 반영하는 이러한 방법은 예시적인 것이므로 본 발명의 사상이 이에 한정되는 것은 아니며, 여기서 개시되지 않았으나 주된 등장 인물과 부수적인 등장 인물을 구분하기 위한 다양한 방법이 적용될 수 있다.Typically, a major character has many actions in isolation, while an incidental character has many behaviors with others. In other words, if the number of times the character (electronic) acting as a sole person is judged as the subject and the number of times the character (latter) acting as the subject is judged as the subject is the same in the embodiment, In order to estimate higher than the latter, the weight is reflected according to the number of subjects. However, the method of reflecting the weight is exemplary, and thus the idea of the present invention is not limited thereto. Various methods for distinguishing the main characters from the auxiliary characters, which are not disclosed here, can be applied.

이상에서 살펴본 바와 같이, 일 실시예에 따르면 동사의 성질 정보를 이용하여 주어가 등장 인물인지 여부를 파악할 수 있다. 따라서, 인물 사전과 같은 고정적인 기준을 참조하지 않고도 보다 정확하게 전자 출판물로부터 등장 인물을 파악할 수 있다.As described above, according to one embodiment, it can be determined whether or not a subject is a character by using the property information of the verb. Thus, characters can be grasped more precisely from electronic publications without reference to fixed criteria such as person dictionary.

아울러, 하나의 문장에 포함된 주어의 개수를 고려하여 가중치 및 이에 따른 주요도를 산정하고, 이러한 주요도를 기초로 등장 인물로부터 주요 등장 인물이 누구인지에 대한 정보를 생성함으로써, 단순하게 등장 인물의 등장 횟수만으로 주요 등장 인물을 선정하는 것보다 정확하게 주요 등장 인물을 선정할 수 있다.In addition, by calculating the weights and the major figures according to the number of subjects included in one sentence, and by generating information on the major characters from the characters based on the main figure, Can be selected more precisely than the main characters by the number of appearances.

도 5는 본 발명의 일 실시예에 따른 정보 생성 방법의 단계를 도시한 도면이다. 도 5에 도시된 정보 생성 방법은 도 2에 도시된 정보 생성 장치(100)에 의하여 수행 가능하다.5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention. The information generating method shown in FIG. 5 can be performed by the information generating apparatus 100 shown in FIG.

도 5를 참조하면, 전자 출판물을 입력받는 단계(S100)가 수행된다. 전자 출판물을 입력(또는 전달)받는 방식에는 예를 들면, 전자 출판물을 저장하는 별도의 데이터베이스(도면에는 미도시)와 연결되어 그로부터 전자 출판물을 전달받는 방식, USB나 광디스크와 같은 저장 매체와 연결되어 이에 저장된 전자 출판물을 전달받는 방식 또는 정보 생성 장치(100)의 관리자로부터 임의의 전자 출판물을 직접 입력받는 방식 등이 있으며, 다만 이에 한정되지 않음은 전술한 바와 같다.Referring to FIG. 5, step S100 of receiving an electronic publication is performed. A method of receiving (or transmitting) electronic publications includes, for example, a method of receiving electronic publications from a separate database (not shown) for storing electronic publications, a method of receiving electronic publications therefrom, a method of connecting to a storage medium such as a USB or an optical disk A method of receiving electronic publications stored therein, or a method of directly receiving an electronic publication from an administrator of the information generating apparatus 100, but the present invention is not limited thereto.

다음으로 전자 출판물을 구성하는 복수의 문장으로부터 주어와 동사를 각각 추출하는 단계(S200)가 수행된다. 이 단계(S200)에서는 먼저 전자 출판물을 구성하는 복수의 문장을 각각의 문장으로 분리한다. 이후 분리된 각각의 문장으로부터 주어와 동사를 추출한다. 이 때, 형태소 분석기를 이용하여 문장 내에서 주어와 동사를 구분할 수 있음은 전술한 바와 같다. 이후, 복수의 문장 중에서 주어와 동사가 각각 적어도 하나씩 포함된 문장을 선별한다. 즉, 일 실시예에서는 주어와 동사가 각각 적어도 하나씩 포함된 문장을 대상으로, 이러한 문장에 포함된 주어가 해당 전자 출판물에서의 등장 인물에 해당하는지 여부를 판단한다.Next, a step S200 of extracting a subject and a verb from a plurality of sentences constituting the electronic publication is performed. In this step S200, a plurality of sentences constituting the electronic publications are separated into respective sentences. Then, subject and verb are extracted from each separated sentence. In this case, the subject and the verb can be distinguished in the sentence using the morpheme analyzer as described above. Then, sentences containing at least one subject and verb are selected from a plurality of sentences. That is, in one embodiment, a sentence including at least one subject and verb is determined, and it is determined whether the subject included in the sentence corresponds to a character in the corresponding electronic publication.

다음으로, 단계(S200)에서 선별된 문장에 대하여, 이러한 문장에 포함된 동사의 성질 정보를 획득하는 단계(S300)가 수행된다. 성질 정보는 도 2에 도시된 저장부(120)에 미리 저장되어 있으므로, 저장부(120)로부터 획득 가능하다. 이후, 획득된 성질 정보를 기초로 해당 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단한다. 사람을 주어로 하는 행위 동사란, 행위의 주체가 사람인 동사를 의미함은 전술한 바와 같다.Next, with respect to the sentence selected in step S200, step S300 of obtaining the property information of the verb included in the sentence is performed. Since the property information is stored in advance in the storage unit 120 shown in FIG. 2, it can be acquired from the storage unit 120. FIG. Then, based on the acquired property information, it is determined whether the verb is an action verb that takes a person as a subject. An act that takes a person as a verb means the verb that the subject of the act is a person, as described above.

이 때, 단계(S200)에서 추출된 주어가 저장부(120)에 저장된 제외 리스트에 포함되어 있는지를 체크하여, 추출된 주어가 제외 리스트에 포함되어 있으면, 인물 파악부(135)는 추출된 주어에 대해서는 등장 인물인지를 파악하는 과정(전술한 동사의 성질 정보를 참조하는 과정)을 수행하지 않은 채로 등장 인물에서 제외시킨다. 이를 통해서, 인물 파악부(135)는 모든 주어가 아닌 일부의 주어에 대해서만 등장 인물인지를 파악하는 과정을 수행할 수 있다. 따라서, 등장 인물을 파악하는데 소요되는 자원과 시간이 절약되도록 할 수 있다.At this time, it is checked whether or not the subject extracted in step S200 is included in the exclusion list stored in the storage unit 120. If the extracted subject is included in the exclusion list, the person identification unit 135 extracts the subject Is excluded from the character without performing the process of determining whether the character is a character (the process of referring to the property information of the verb mentioned above). Through this, the person identification unit 135 can perform a process of determining whether or not the subject is only the subject of some subject but not all subjects. Therefore, it is possible to save resources and time required to identify characters.

이후, 동사가 사람을 주어로 하는 행위 동사라고 판단되면, 이러한 동사와 관련된 주어를 전자 출판물에서의 등장 인물로 파악하는 단계(S400)가 수행된다.Thereafter, if the verb is judged to be an action verb with a person as a subject, a step (S400) of recognizing the subject related to the verb as a character in the electronic publication is performed.

이를 기초로 살펴보면, 일 실시예에서는 인물 사전을 활용하지 않고도 동사의 성질 정보를 이용하여 전자 출판물의 등장 인물에 대한 정보를 추출할 수 있다. 따라서, 작가가 임의로 지은 등장 인물에 대한 명칭에 대해서도 등장 인물의 명칭으로 추출할 수 있다.On the basis of this, in one embodiment, it is possible to extract information about the character of the electronic publication using the property information of the verb without using the character dictionary. Therefore, the name of the character arbitrarily created by the artist can be extracted as the character's name.

다음으로, 등장 인물에 대한 정보를 생성하는 단계(S500)가 수행된다. 등장 인물에 대한 정보란 예를 들면, 등장 인물 중 비중을 상대적으로 많이 차지하는 주요 등장 인물을 나타내는 것임은 전술한 바와 같다.Next, a step S500 of generating information on the characters is performed. The information about the character is, for example, a major character that occupies a relatively large portion of the characters.

도 6을 참조하여 보다 구체적으로 살펴보면, 주요 등장 인물을 선정하기 위해서, 주어가 등장 인물로 파악되는 횟수를 기초로 주어별로 주요도를 계산한다(S510). 이 때, 정보 생성부(140)는 등장 인물로 파악될 때마다 더해지는 값에 가중치를 곱한 뒤, 가중치가 곱해진 값을 더하여 주요도를 산정할 수 있는데, 이 때의 가중치는 하나의 문장 내에 포함되는 주어의 개수가 많을수록 작아짐은 전술한 바와 같다. 6, in order to select a major character, a main figure is calculated for each subject based on the number of times a subject is recognized as a character (S510). At this time, the information generating unit 140 may multiply the added value every time it is recognized as a character, multiply the weighted value, and add the value multiplied by the weighted value to calculate the main figure. The weighted value is included in one sentence The larger the number of subjects is, the smaller the number of subjects is.

이후, 주요도를 기초로 등장 인물 중에서 주요 등장 인물을 선정한다(S520). Then, a main character is selected from the characters based on the main figure (S520).

이상에서 살펴본 바와 같이, 일 실시예에 따르면 동사의 성질 정보를 이용하여 주어가 등장 인물인지 여부를 파악할 수 있다. 따라서, 인물 사전과 같은 고정적인 기준을 참조하지 않고도 보다 정확하게 전자 출판물로부터 등장 인물을 파악할 수 있다.As described above, according to one embodiment, it can be determined whether or not a subject is a character by using the property information of the verb. Thus, characters can be grasped more precisely from electronic publications without reference to fixed criteria such as person dictionary.

아울러, 하나의 문장에 포함된 주어의 개수를 고려하여 가중치 및 이에 따른 주요도를 산정하고, 이러한 주요도를 기초로 등장 인물로부터 주요 등장 인물이 누구인지에 대한 정보를 생성함으로써, 단순하게 등장 인물의 등장 횟수만으로 주요 등장 인물을 선정하는 것보다 정확하게 주요 등장 인물을 선정할 수 있다.In addition, by calculating the weights and the major figures according to the number of subjects included in one sentence, and by generating information on the major characters from the characters based on the main figure, Can be selected more precisely than the main characters by the number of appearances.

한편, 본 발명의 일 실시예에 따른 정보 생성 방법은 이러한 방법에 포함된 각 단계를 수행하도록 프로그램된 컴퓨터 기록매체에 저장된 컴퓨터 프로그램 또는 이러한 방법에 포함된 각 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독가능 기록매체로 구현될 수 있다.Meanwhile, a method of generating information according to an embodiment of the present invention includes a computer program stored in a computer recording medium programmed to perform each step included in the method, or a program including an instruction to perform each step included in the method And may be embodied as a computer-readable recording medium recorded thereon.

본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.Combinations of each step of the flowchart and each block of the block diagrams appended to the present invention may be performed by computer program instructions. These computer program instructions may be loaded into a processor of a general purpose computer, special purpose computer, or other programmable data processing apparatus so that the instructions, which may be executed by a processor of a computer or other programmable data processing apparatus, And means for performing the functions described in each step are created. These computer program instructions may also be stored in a computer usable or computer readable memory capable of directing a computer or other programmable data processing apparatus to implement the functionality in a particular manner so that the computer usable or computer readable memory It is also possible for the instructions stored in the block diagram to produce a manufacturing item containing instruction means for performing the functions described in each block or flowchart of the block diagram. Computer program instructions may also be stored on a computer or other programmable data processing equipment so that a series of operating steps may be performed on a computer or other programmable data processing equipment to create a computer- It is also possible that the instructions that perform the processing equipment provide the steps for executing the functions described in each block of the block diagram and at each step of the flowchart.

또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.Also, each block or each step may represent a module, segment, or portion of code that includes one or more executable instructions for executing the specified logical function (s). It should also be noted that in some alternative embodiments, the functions mentioned in the blocks or steps may occur out of order. For example, two blocks or steps shown in succession may in fact be performed substantially concurrently, or the blocks or steps may sometimes be performed in reverse order according to the corresponding function.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 품질에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and various modifications and changes may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are intended to illustrate rather than limit the scope of the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents thereof should be construed as falling within the scope of the present invention.

100: 정보 생성 장치
110: 입력부 120: 저장부
130: 등장 인물 파악부 140: 정보 생성부
100: Information generating device
110: input unit 120: storage unit
130: Charactor identification unit 140:

Claims (16)

전자 출판물을 입력받는 입력부와,
동사의 성질을 나타내는 성질 정보를 복수 개의 동사 각각에 대하여 저장하는 저장부와,
상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 문장 구조 파악부 및 상기 추출된 동사 각각의 성질 정보를 상기 저장부로부터 획득하며 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 인물 파악부를 포함하는 등장 인물 파악부와,
상기 파악된 등장 인물에 대한 정보를 생성하는 정보 생성부를 포함하는
전자 출판물에 대한 정보 생성 장치.
An input unit for receiving electronic publications,
A storage unit for storing property information indicating a property of a verb for each of a plurality of verbs;
A sentence structure recognition unit for extracting a subject and a verb from a plurality of sentences constituting the electronic publication, a feature extraction unit for extracting the feature information of each extracted verb from the storage unit, A character recognition unit for recognizing a subject associated with a verb corresponding to the electronic publication as a character in the electronic publication;
And an information generating unit for generating information on the identified character
Information generating device for electronic publications.
제 1 항에 있어서,
상기 저장부에서,
동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 갖는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 1,
In the storage section,
Verbs with the same or similar meaning have the same property information
Information generating device for electronic publications.
제 1 항에 있어서,
상기 인물 파악부는,
상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 1,
The person-
If the obtained property information is property information related to a behavior of a person, a subject related to the verb corresponding to the acquired property information is identified as a character in the electronic publication
Information generating device for electronic publications.
제 1 항에 있어서,
상기 문장 구조 파악부는 상기 복수 개의 문장 중에서 주어와 동사가 적어도 하나씩 추출되는 문장을 선별하고,
상기 인물 파악부는,
상기 선별된 문장에 포함된 동사의 성질 정보를 상기 저장부로부터 획득하며, 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 1,
The sentence structure determination unit selects a sentence in which at least one subject and verb are extracted from the plurality of sentences,
The person-
Acquiring property information of the verb included in the selected sentence from the storage unit and identifying a subject related to the verb corresponding to the acquired property information as a character in the electronic publication based on the acquired property information
Information generating device for electronic publications.
제 1 항에 있어서,
상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며,
상기 인물 파악부는,
상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하고, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물에서 제외시키는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 1,
The storage unit stores an exclusion list having information on a subject that should be excluded from the character,
The person-
Checking whether the extracted subject is included in the exclusion list, and if the extracted subject is included in the exclusion list, extracting the extracted subject from the character
Information generating device for electronic publications.
제 1 항에 있어서,
상기 정보 생성부는,
상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하며, 상기 주요도가 상대적으로 높은 주어를 상기 등장 인물 중에서 주요한 주요 등장 인물로 선정하며, 상기 선정된 주요 등장 인물에 대한 정보를 상기 파악된 등장 인물에 대한 정보로써 생성하는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 1,
Wherein the information generating unit comprises:
Each time a subject is recognized as a character, a predetermined value is added to a main figure corresponding to the subject, a main subject having a higher degree is selected as a main character in the character, Information on the character is generated as information on the character
Information generating device for electronic publications.
제 6 항에 있어서,
상기 주요도에 더해지는 수치는,
상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는
전자 출판물에 대한 정보 생성 장치.
The method according to claim 6,
The numerical value added to the above-
In a single sentence including a subject recognized as the character, the larger the number of subjects included in the one sentence, the smaller the value
Information generating device for electronic publications.
전자 출판물을 입력받는 단계와,
상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,
상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,
상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,
상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 포함하는
전자 출판물에 대한 정보 생성 방법.
Receiving an electronic publication,
Extracting a subject and a verb from a plurality of sentences constituting the electronic publication,
Acquiring property information of each of the extracted verbs from a storage unit that stores property information for each of a plurality of verbs;
Identifying a subject associated with the verb corresponding to the obtained property information as a character in the electronic publication based on the acquired property information;
And generating information on the identified character
A method for generating information about electronic publications.
제 8 항에 있어서,
상기 저장부에서,
동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 갖는
전자 출판물에 대한 정보 생성 방법.
9. The method of claim 8,
In the storage section,
Verbs with the same or similar meaning have the same property information
A method for generating information about electronic publications.
제 8 항에 있어서,
상기 등장 인물로 파악하는 단계는,
상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는
전자 출판물에 대한 정보 생성 방법.
9. The method of claim 8,
The step of recognizing the character as the character comprises:
If the obtained property information is property information related to a behavior of a person, a subject related to the verb corresponding to the acquired property information is identified as a character in the electronic publication
A method for generating information about electronic publications.
제 8 항에 있어서,
상기 성질 정보를 획득하는 단계와 상기 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와 상기 파악된 등장 인물에 대한 정보를 생성하는 단계는,
상기 추출하는 단계에서, 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되면 수행되는
전자 출판물에 대한 정보 생성 방법.
9. The method of claim 8,
The method comprising: acquiring the property information; identifying the subject as a character in the electronic publication; and generating information on the identified character,
In the extracting step, a subject and a verb are extracted from the plurality of sentences, respectively, and at least one subject and a verb are extracted and extracted
A method for generating information about electronic publications.
제 8 항에 있어서,
상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며,
상기 등장 인물로 파악하는 단계는,
상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하는 단계와,
상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물에서 제외시키는 단계를 더 포함하는
전자 출판물에 대한 정보 생성 방법.
9. The method of claim 8,
The storage unit stores an exclusion list having information on a subject that should be excluded from the character,
The step of recognizing the character as the character comprises:
Checking whether the extracted subject is included in the exclusion list,
And if the extracted subject is included in the exclusion list, excluding the extracted subject from the character
A method for generating information about electronic publications.
제 8 항에 있어서,
상기 정보를 생성하는 단계는,
상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하는 단계와,
상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정하여, 상기 선정된 주요 등장 인물에 대한 정보를 상기 파악된 등장 인물에 대한 정보로써 생성하는 단계를 포함하는
전자 출판물에 대한 정보 생성 방법.
9. The method of claim 8,
Wherein the step of generating the information comprises:
Adding a predetermined value to the main figure corresponding to the subject each time the subject is recognized as a character;
Selecting a main subject having a relatively high main figure as a main character and generating information on the selected main character as information on the identified character
A method for generating information about electronic publications.
제 13 항에 있어서,
상기 주요도에 소정의 수치를 더하는 단계는,
상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는 수치를 더하는
전자 출판물에 대한 정보 생성 방법.
14. The method of claim 13,
Wherein the step of adding a predetermined value to the main figure comprises:
In one sentence including a subject recognized as the character, a value having a relatively small value is added to the number of subjects included in the one sentence
A method for generating information about electronic publications.
전자 출판물을 입력받는 단계와,
상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,
상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,
상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,
상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하도록 프로그램된
컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.
Receiving an electronic publication,
Extracting a subject and a verb from a plurality of sentences constituting the electronic publication,
Acquiring property information of each of the extracted verbs from a storage unit that stores property information for each of a plurality of verbs;
Identifying a subject associated with the verb corresponding to the obtained property information as a character in the electronic publication based on the acquired property information;
And generating information about the identified character
A computer program stored on a computer readable recording medium.
전자 출판물을 입력받는 단계와,
상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,
상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,
상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,
상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하는 명령어를 포함하는 프로그램이 기록된
컴퓨터 판독가능 기록매체.
Receiving an electronic publication,
Extracting a subject and a verb from a plurality of sentences constituting the electronic publication,
Acquiring property information of each of the extracted verbs from a storage unit that stores property information for each of a plurality of verbs;
Identifying a subject associated with the verb corresponding to the obtained property information as a character in the electronic publication based on the acquired property information;
And a step of generating information on the identified character by executing the step of:
Computer readable recording medium.
KR1020160005235A 2016-01-15 2016-01-15 Apparatus and method for creating information on electronic publication KR101781597B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160005235A KR101781597B1 (en) 2016-01-15 2016-01-15 Apparatus and method for creating information on electronic publication
PCT/KR2016/003347 WO2017122872A1 (en) 2016-01-15 2016-03-31 Device and method for generating information on electronic publication

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160005235A KR101781597B1 (en) 2016-01-15 2016-01-15 Apparatus and method for creating information on electronic publication

Publications (2)

Publication Number Publication Date
KR20170085736A true KR20170085736A (en) 2017-07-25
KR101781597B1 KR101781597B1 (en) 2017-09-25

Family

ID=59311700

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160005235A KR101781597B1 (en) 2016-01-15 2016-01-15 Apparatus and method for creating information on electronic publication

Country Status (2)

Country Link
KR (1) KR101781597B1 (en)
WO (1) WO2017122872A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036372A (en) * 2018-08-24 2018-12-18 科大讯飞股份有限公司 A kind of voice broadcast method, apparatus and system
KR20210056814A (en) * 2019-11-11 2021-05-20 한림대학교 산학협력단 Apparatus, method and program for extraction EMF frequency bandwidth information in research literature

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4148247B2 (en) * 2005-07-01 2008-09-10 日本電信電話株式会社 Vocabulary acquisition method and apparatus, program, and computer-readable recording medium
KR101391599B1 (en) * 2007-09-05 2014-05-09 삼성전자주식회사 Method for generating an information of relation between characters in content and appratus therefor
JP5331023B2 (en) * 2010-02-12 2013-10-30 日本電信電話株式会社 Important word extraction device, important word extraction method, and important word extraction program
KR101265467B1 (en) * 2010-12-17 2013-05-16 한국과학기술원 Method for extracting experience and classifying verb in blog
KR101255957B1 (en) * 2011-12-09 2013-04-24 포항공과대학교 산학협력단 Method and apparatus for tagging named entity

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036372A (en) * 2018-08-24 2018-12-18 科大讯飞股份有限公司 A kind of voice broadcast method, apparatus and system
CN109036372B (en) * 2018-08-24 2021-10-08 科大讯飞股份有限公司 Voice broadcasting method, device and system
KR20210056814A (en) * 2019-11-11 2021-05-20 한림대학교 산학협력단 Apparatus, method and program for extraction EMF frequency bandwidth information in research literature

Also Published As

Publication number Publication date
WO2017122872A1 (en) 2017-07-20
KR101781597B1 (en) 2017-09-25

Similar Documents

Publication Publication Date Title
JP6664784B2 (en) Display device
US10380262B2 (en) Detecting literary elements in literature and their importance through semantic analysis and literary correlation
US9767144B2 (en) Search system with query refinement
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
CN108463795A (en) Self-service categorizing system
KR101491627B1 (en) Quantification method, apparatus and system of reviews for mobile application evaluation
JP7313069B2 (en) Search material information storage device
JP2008198132A (en) Peculiar expression extraction program, peculiar expression extraction method and peculiar expression extraction device
CN110968664A (en) Document retrieval method, device, equipment and medium
CN110647504B (en) Method and device for searching judicial documents
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
KR101781597B1 (en) Apparatus and method for creating information on electronic publication
KR102280490B1 (en) Training data construction method for automatically generating training data for artificial intelligence model for counseling intention classification
JP5117744B2 (en) Word meaning tag assigning device and method, program, and recording medium
JP6942759B2 (en) Information processing equipment, programs and information processing methods
JP6178480B1 (en) DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM
JP6419525B2 (en) Visualization means selection support system, visualization means selection support method, and visualization means selection support program
JP6181890B2 (en) Literature analysis apparatus, literature analysis method and program
KR101783012B1 (en) Method for providing guideline according to the document selection, computer readable program recorded medium for excuting the same, and medium stored application for device
JP7131518B2 (en) Electronic device, pronunciation learning method, server device, pronunciation learning processing system and program
JP5768009B2 (en) Information processing apparatus, information processing method, and program
JP6828812B2 (en) Information processing equipment, information processing methods and programs
JP2007280052A (en) Experience information extraction method and device, program, and computer-readable recording medium
KR101618600B1 (en) Method for providing guideline according to the document selection, computer readable program recorded medium for excuting the same, and medium stored application for device
JP2020154448A (en) Information extraction support device and information extraction support method and program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
GRNT Written decision to grant