WO2017122872A1 - Device and method for generating information on electronic publication - Google Patents

Device and method for generating information on electronic publication Download PDF

Info

Publication number
WO2017122872A1
WO2017122872A1 PCT/KR2016/003347 KR2016003347W WO2017122872A1 WO 2017122872 A1 WO2017122872 A1 WO 2017122872A1 KR 2016003347 W KR2016003347 W KR 2016003347W WO 2017122872 A1 WO2017122872 A1 WO 2017122872A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
subject
character
verb
person
Prior art date
Application number
PCT/KR2016/003347
Other languages
French (fr)
Korean (ko)
Inventor
김승훈
김기원
김서희
박태근
안희정
윤종률
이원진
이재동
홍민하
Original Assignee
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 산학협력단 filed Critical 단국대학교 산학협력단
Publication of WO2017122872A1 publication Critical patent/WO2017122872A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices

Definitions

  • the present invention relates to an apparatus and method for generating information about an electronic publication. More specifically, the characters are identified by using the property information indicating the properties of the verbs from the sentences constituting the electronic publication, and the information about the characters identified in this way, for example, the main portion of the electronic publication with a high proportion of characters.
  • An information generating apparatus and method for generating information on who a character is.
  • e-books which are a kind of electronic publications.
  • the e-book can be viewed through an e-book reader or viewer software in an e-book dedicated terminal such as a personal computer (PC), smart phone, notebook or tablet.
  • PC personal computer
  • smart phone smart phone
  • notebook or tablet a personal computer
  • Ebooks take the form of digitized information. Therefore, in extracting information and building the extracted information into a database, an e-book is easier than a conventional paper book.
  • the information on the e-book constructed as a database can be variously used, for example, in a public library, a university library, or a book information providing site that sells e-books.
  • Information that can be extracted from an e-book includes, for example, price information, author information, book reviews written by others, and information on characters appearing in the e-book. Among them, the information about the characters will be described in more detail.
  • Korean Patent No. 10-1255957 extracts a person using a person dictionary that stores the person's name. According to this, if the sentence constituting the e-book contains the same word as the name of the person listed in the person dictionary, it is recognized that the word refers to the person.
  • the problem to be solved by the present invention is to provide a technique for extracting information about the characters from the electronic publication, such as an e-book, for example, who is the main character who plays a major role in the electronic publication. .
  • An information generating apparatus for an electronic publication includes an input unit for receiving an electronic publication, a storage unit storing property information representing a property of a verb for each of a plurality of verbs, and configuring the electronic publication.
  • a sentence structure grasping unit for extracting a subject and a verb from a plurality of sentences, and obtaining property information of each of the extracted verbs from the storage unit and related to a verb corresponding to the obtained property information based on the obtained property information
  • a person identification unit including a person identification unit for identifying a subject as a person in the electronic publication, and an information generation unit for generating information about the identified person.
  • the verbs having the same or similar meanings in the storage unit may have the same property information.
  • the person identifying unit may identify a subject related to a verb corresponding to the acquired property information as a person in the electronic publication, if the acquired property information is property information related to an action of a person.
  • the sentence structure determiner is a result of extracting a subject and a verb from each of the plurality of sentences, the subject and the verb is extracted at least one sentence, the person grasping portion is stored in the property information of the verb included in the selected sentence Based on the acquired property information, a subject related to a verb corresponding to the obtained property information may be identified as a person in the electronic publication.
  • the storage unit stores an exclusion list having information on the subject to be excluded from the character
  • the person identifying unit checks whether the extracted subject is included in the exclusion list, and the extracted subject is excluded If it is included in the list, the extracted subject may be excluded when it is identified as the character.
  • the information generator may add a predetermined value to a main degree corresponding to the subject, and select a subject having a relatively high main degree as the main character.
  • the numerical value added to the main map may have a relatively small value in one sentence including a subject identified as the character, as the number of subjects included in the one sentence increases.
  • An information generating method comprises the steps of receiving an electronic publication, extracting a subject and a verb from a plurality of sentences constituting the electronic publication, and extracting property information of each of the extracted verbs, Acquiring from a storage for storing each of a plurality of verbs; identifying a subject associated with a verb corresponding to the acquired property information as a person in the electronic publication based on the obtained property information; And generating information on the identified person.
  • the verbs having the same or similar meanings in the storage unit may have the same property information.
  • a subject related to a verb corresponding to the obtained property information may be recognized as a person in the electronic publication.
  • the acquiring of the property information, identifying the subject as a person in the electronic publication, and generating information about the identified person may include extracting the information from the plurality of sentences. Result of extracting subject and verb respectively It can be performed if at least one subject and verb is extracted.
  • the storage unit stores an exclusion list having information on a subject to be excluded from the character, and the step of identifying as the character includes checking whether the extracted subject is included in the exclusion list; If the extracted subject is included in the exclusion list, the extracted subject may further include a step of excluding when identifying as the character.
  • the generating of the information may include adding a predetermined value to a main degree corresponding to the subject whenever the subject is identified as a character, and selecting a subject having a relatively high main degree as the main character. It may include a step.
  • the step of adding a predetermined value to the main diagram may include a numerical value having a relatively small value in one sentence including a subject identified as the character, as the number of subjects included in the one sentence increases. have.
  • a computer program stored in a computer-readable recording medium may include receiving an electronic publication, extracting subjects and verbs from a plurality of sentences constituting the electronic publication, and extracting the extracted verbs. Obtaining each property information from a storage for storing each of the plurality of verbs, and based on the obtained property information, a subject related to the verb corresponding to the obtained property information in the electronic publication. And identifying the person and generating the information about the identified person.
  • a computer-readable recording medium may include receiving an electronic publication, extracting subjects and verbs from a plurality of sentences constituting the electronic publication, and properties of each of the extracted verbs. Acquiring information from a storage for storing each of a plurality of verbs; and identifying a subject related to the verb corresponding to the acquired property information as a character in the electronic publication, based on the obtained property information. And a command for performing the step of generating information on the identified person.
  • information about a person may be extracted from an electronic publication such as an e-book without using a person dictionary. Therefore, even when the electronic publication includes names of characters randomly written by the author, information on the characters can be accurately extracted.
  • the main character in extracting information on who is the main character who plays a major role in the electronic publication, the main character can be extracted in more detail by reflecting the number of subjects included in one sentence.
  • FIG. 1A is a diagram illustrating the use of an information generating device according to an embodiment of the present invention.
  • FIG. 1B is a diagram exemplarily illustrating that an information generating apparatus according to an embodiment of the present invention provides a reader with information about a person who appears in an electronic publication.
  • FIG. 2 is a diagram illustrating a configuration of an information generating apparatus according to an embodiment of the present invention.
  • 3A and 3B are diagrams illustrating that property information is allocated to a plurality of verbs in a storage unit.
  • FIG. 4 is a diagram illustrating in detail the configuration of the person identification unit according to an embodiment of the present invention.
  • FIG. 5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention.
  • FIG. 6 is a diagram illustrating in detail a step of generating information on a person in FIG. 5.
  • an electronic publication refers to an e-book or textual information (eg, an internet newspaper, an internet magazine, a blog, etc.) that can be viewed on the Internet.
  • an electronic publication consists of at least one sentence.
  • FIG. 1A is a diagram illustrating a user using an information generating apparatus according to an embodiment of the present invention.
  • the information generating apparatus 100 and the user terminal 300 used by the user 310 are connected through the network 200.
  • FIG. 1A is exemplary, the spirit of the present invention is not limited to the illustrated embodiment.
  • the user terminal 300 receives information about the electronic publication from the information generating apparatus 100 through the network 200 and displays it.
  • the information displayed on the user terminal 300 includes various information about the electronic publication, for example, information on prices, information on authors, information on book reviews written by others, information on characters, and the like.
  • FIG. 1B is a diagram exemplarily illustrating that information about a person who appears in an e-book is displayed on the user terminal 300 when the electronic publication is an e-book.
  • the user terminal 300 is a device that can be connected to the Internet, and may be, for example, a personal computer, a smartphone, or a smart pad.
  • the network 200 connects the user terminal 300 and the information generating apparatus 100 and may be implemented by, for example, LAN, 3G, LTE, LTE-A, Wi-Fi, or Bluetooth.
  • the information generating apparatus 100 transmits the information about the electronic publication to the user terminal 300 through the network 200. To this end, the information generating apparatus 100 receives at least one electronic publication, and extracts various information from the received electronic publication.
  • the information generating apparatus 100 may be implemented in a server, a personal computer (PC), or the like.
  • the information generating apparatus 100 is an online library for providing book information, an online book sales / information system operated by a company that sells paper books, or an online e-book sales / operated by a company that sells e-books. Applicable to an information providing system.
  • the information generating apparatus 100 will be described in more detail.
  • FIG. 2 is a diagram illustrating a configuration of an information generating apparatus according to an embodiment of the present invention.
  • the information generating apparatus 100 includes an input unit 110, a storage unit 120, a character identifying unit 130, and an information generating unit 140.
  • the configuration of the information generating apparatus 100 is exemplary, at least one of the components may not be included or a configuration not shown here may be further included.
  • the input unit 110 receives an electronic publication.
  • the input unit 110 receives (or transmits) an electronic publication, for example, is connected to a separate database (not shown) for storing the electronic publication and receives the electronic publication therefrom, such as a USB or an optical disk.
  • a method of receiving an electronic publication stored in the storage medium connected to the storage medium or a method of directly receiving an electronic publication from an administrator of the information generating apparatus 100 may be used.
  • the input unit 110 may be a communication port connected to a database, a serial port connected to a USB, or a reader (for example, a CD-ROM) that reads an optical disk.
  • the storage unit 120 stores in advance a plurality of verbs and property information indicating the properties of each of the plurality of verbs.
  • the storage unit 120 may be implemented as a memory for storing data.
  • the property information will be described in more detail.
  • Property information is information indicating the property of a verb based on the meaning of the verb. This property information is given for each verb in an institution that studies and manages the language of the country, for example, the National Institute of the Korean Language. Thus, in one embodiment, such an institution may obtain and store data in which the property information is assigned to the verb in the storage unit 120, but is not limited thereto.
  • 3A is a diagram exemplarily illustrating property information for each verb. Referring to FIG. 3A, since the verb 'price' refers to an act of hitting a specific object, the property information is 'directional action verb', and the verb 'process' refers to an action of generating something. 'Creative act verbs'.
  • verbs stored in the storage unit 120 are verbs having the same or similar meanings.
  • the verb 'to speak' and the verb 'to converse' have similar meanings
  • the verb 'want', the verb 'to sea' and the verb 'to come' have similar meanings to one another.
  • the storage 120 may be configured to have the same property information.
  • the storage unit 120 stores the exclusion list.
  • the exclusion list has at least one name that should be excluded from the character.
  • a subject extracted from a sentence is a character
  • reference is made to the property information of a verb in determining whether a subject extracted from a sentence is a character, reference is made to the property information of a verb, and a subject identical to a name stored in an exclusion list is not a character regardless of the property information of the verb. Is considered.
  • Such an exclusion list may be created by an administrator or the like who manages the information generating apparatus 100, and names included therein may be added, modified, or deleted.
  • the character identifying unit 130 may identify the characters appearing in the electronic publication, and may be embodied by a memory for storing instructions programmed to perform such a function, and a microprocessor for performing the instructions.
  • the character determiner 130 may include a preprocessor 131, a sentence structure determiner 133, and a person determiner 135.
  • Each configuration may be implemented by a memory storing instructions programmed to perform a function to be described later, and a microprocessor performing such instructions.
  • the preprocessor 131 may separate a plurality of sentences constituting the electronic publication into one sentence. To this end, the preprocessor 131 may search the parentheses, and may remove the searched parentheses and the contents in the parentheses. In addition, the preprocessor 131 may recognize a period, a comma, an exclamation point, or a question mark, and then separate the plurality of sentences into one sentence based on these.
  • the sentence structure determining unit 133 extracts a subject and a verb from each sentence.
  • the sentence structure determiner 133 may distinguish between a subject and a verb in a sentence using a morpheme analyzer.
  • the sentence structure grasping unit 133 may extract the sentence as a subject of a sentence associated with a search such as 'silver', 'silver', 'yi' or 'ga'.
  • a search such as 'silver', 'silver', 'yi' or 'ga'.
  • the sentence structure determining unit 133 selects a sentence including at least one of the subject and the verb from a plurality of sentences.
  • the person identifying unit 135 determines whether the subject included in the sentence corresponds to a person in the electronic publication, based on a sentence including at least one subject and a verb each.
  • the person grasping unit 135 obtains, from the storage 120, property information of a verb included in a sentence selected by the sentence structure grasping unit 133. In addition, the person grasping unit 135 determines whether the verb is an action verb given to a person based on the acquired property information.
  • an action verb means a verb whose subject is a person.
  • 3B exemplarily shows an action verb based on a person.
  • the person grasping unit 135 may determine whether the verb is an action verb based on the property information by using the following method. For example, if the property information of the verb belongs to any one of the predetermined property information, such a verb can be discriminated as an action verb with a human subject. For example, a verb having the property information of 'result behavior verb', 'directional behavior verb' or 'creation behavior verb' may be designated as an action verb whose subject is the subject. Therefore, if the property information of the verb corresponds to any one of the above, the verb may be determined as an action verb with a subject. However, this is merely an example, and the inventive concept is not limited to this method. For example, the person grasping unit 135 may determine whether a verb is an action verb to which a person is given using a stem, among stems and endings constituting a verb.
  • the person grasping unit 135 checks whether the subject extracted by the sentence structure grasping unit 133 is included in the exclusion list stored in the storage unit 120. As a result of the check, if the extracted subject is included in the exclusion list, the process of identifying whether the subject is a character (referring to the above-described verb property information) is not performed on the extracted subject, and is immediately excluded from the character. do. Through this, a process of determining whether a character is present for only some subjects but not all subjects may be performed. Thus, resources and time required to identify the characters can be saved.
  • the person grasping unit 135 identifies the subject associated with the verb as a character in the electronic publication.
  • the information generating unit 140 generates information on the person identified by the person identifying unit 135.
  • the information on the generated characters may be, for example, information on who are the main characters who occupy a relatively large proportion of the characters.
  • the information generating unit 140 may be implemented by a memory for storing instructions programmed to perform such a function and a microprocessor that executes the instructions.
  • the information generating unit 140 determines the number of times that the subject is identified as the characters, and calculates the main degree based on the number of times. For example, suppose that A, B, C, and D are identified as characters 3, 8, 7, and 6 in any electronic publication, respectively. In this case, the main degree of the characters from A to D is calculated by adding a predetermined value each time each is identified as a character. According to this, the main maps from A to D may be 3, 8, 7, and 6 as a result of adding 1, which is a predetermined value each time each is identified as a character.
  • the information generation unit 140 may calculate the principal degree by multiplying the weight added to each added value ('1' in the above) each time it is identified as a character, and then adding the multiplied value.
  • the weight has a smaller value as the number of subjects included in one sentence increases. For example, in the sentence "Gap eats rice", the number of subjects is 1 because the number of subjects is 1, and in the sentence "Gap and Eul eats", the weight of the subject is 2, so the weight is 2, In the sentence 'Eating rice', the number of subjects is three, so the weight is 1, and in 'A, B, and B, the class eats', the number of subjects is four, so the weight may be zero.
  • the main character has many actions alone, while the secondary character has many actions with others.
  • the main figure of the former In order to calculate the higher than the latter main degree, the weight is reflected according to the number of subjects as above.
  • the spirit of the present invention is not limited thereto, but various methods for distinguishing the main character and the incidental character may be applied, although not disclosed herein.
  • whether or not the subject is a character may be determined using property information of a verb.
  • property information of a verb it is possible to more accurately identify a person from an electronic publication without referring to fixed criteria such as a person dictionary.
  • the weight and the corresponding main road are calculated, and based on the main road, information about who the main person is from the characters is generated, and the character is simply. It is possible to select the main characters more accurately than to select the main characters only by the number of appearances.
  • FIG. 5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention.
  • the information generating method illustrated in FIG. 5 may be performed by the information generating apparatus 100 illustrated in FIG. 2.
  • the method of receiving (or transmitting) an electronic publication may include, for example, connecting to a separate database (not shown) for storing the electronic publication and receiving the electronic publication therefrom, or to a storage medium such as a USB or an optical disk.
  • a separate database not shown
  • a storage medium such as a USB or an optical disk.
  • a step (S200) of extracting a subject and a verb from each of a plurality of sentences constituting the electronic publication is performed.
  • a plurality of sentences constituting the electronic publication are separated into respective sentences.
  • the subject and verb are then extracted from each of the separated sentences.
  • the subject and the verb may be distinguished in the sentence using the morpheme analyzer as described above.
  • sentences including at least one of a subject and a verb are selected from the plurality of sentences. That is, in one embodiment, it is determined whether a subject included in at least one of the subject and the verb corresponds to a character in the electronic publication.
  • step S300 of obtaining property information of verbs included in such sentences is performed. Since the property information is previously stored in the storage unit 120 illustrated in FIG. 2, the property information may be obtained from the storage unit 120. Subsequently, it is determined whether the verb is an action verb based on the acquired property information.
  • the action verb which has a human subject means the verb whose subject is a person as the above-mentioned.
  • the person identification unit 135 extracts the extracted subject. Is excluded from the character without performing the process of identifying whether or not it is a character (referring to the above-described verbal property information). Through this, the person grasping unit 135 may perform a process of identifying whether the person is a character for only some of the subjects instead of all subjects. Therefore, it is possible to save the resources and time required to identify the characters.
  • a step (S400) of identifying a subject related to the verb as a character in the electronic publication is performed.
  • information on the characters of an electronic publication may be extracted using property information of a verb without using a person dictionary. Therefore, the names of the characters randomly created by the artist can be extracted as the names of the characters.
  • an operation (S500) of generating information on the person is performed.
  • the information on the characters indicates the main characters who occupy a relatively large portion of the characters, as described above.
  • the main figure is calculated for each subject based on the number of times the subject is identified as the character (S510).
  • the information generating unit 140 may multiply the added value every time it is identified as a character, and then calculate the main degree by adding the multiplied weight value, wherein the weight is included in one sentence. As the number of subjects becomes larger, the smaller is as described above.
  • a main character is selected from the characters based on the main degree (S520).
  • whether or not the subject is a character may be determined using property information of a verb.
  • property information of a verb it is possible to more accurately identify a person from an electronic publication without referring to fixed criteria such as a person dictionary.
  • the weight and the corresponding main road are calculated, and based on the main road, information about who the main person is from the characters is generated, and the character is simply. It is possible to select the main characters more accurately than to select the main characters only by the number of appearances.
  • the information generating method includes a computer program stored in a computer recording medium programmed to perform each step included in the method or a program including instructions for performing each step included in the method. It may be implemented as a recorded computer readable recording medium.
  • Combinations of each block of the block diagrams and respective steps of the flowcharts attached to the present invention may be performed by computer program instructions.
  • These computer program instructions may be mounted on a processor of a general purpose computer, special purpose computer, or other programmable data processing equipment such that instructions executed through the processor of the computer or other programmable data processing equipment may not be included in each block or flowchart of the block diagram. It will create means for performing the functions described in each step.
  • These computer program instructions may be stored in a computer usable or computer readable memory that can be directed to a computer or other programmable data processing equipment to implement functionality in a particular manner, and thus the computer usable or computer readable memory.
  • instructions stored in may produce an article of manufacture containing instruction means for performing the functions described in each block or flowchart of each step of the block diagram.
  • Computer program instructions may also be mounted on a computer or other programmable data processing equipment, such that a series of operating steps may be performed on the computer or other programmable data processing equipment to create a computer-implemented process to create a computer or other programmable data. Instructions that perform processing equipment may also provide steps for performing the functions described in each block of the block diagram and in each step of the flowchart.
  • each block or step may represent a portion of a module, segment or code that includes one or more executable instructions for executing a specified logical function (s).
  • a specified logical function s.
  • the functions noted in the blocks or steps may occur out of order.
  • the two blocks or steps shown in succession may in fact be executed substantially concurrently or the blocks or steps may sometimes be performed in the reverse order, depending on the functionality involved.

Abstract

According to one embodiment of the present invention, a device for generating information on an electronic publication comprises: an input unit for receiving an electronic publication; a storage unit for storing, for each of a plurality of verbs, feature information indicating features of verbs; a character figure identification unit including a sentence structure identification unit for extracting each of subjects and verbs from a plurality of sentences constituting the electronic publication, and a character identification unit for acquiring feature information on each of the extracted verbs from the storage unit and identifying the subject related to the verb corresponding to the acquired feature information, as a character figure in the electronic publication, on the basis of the acquired feature information; and an information generating unit for generating information on the identified character figure.

Description

전자 출판물에 대한 정보를 생성하는 장치 및 방법Apparatus and method for generating information about an electronic publication
본 발명은 전자 출판물에 대한 정보를 생성하는 장치 및 방법에 관한 것이다. 보다 자세하게는 전자 출판물을 구성하는 문장으로부터 동사의 성질을 나타내는 성질 정보를 이용하여 등장 인물을 파악하고, 이와 같이 파악된 등장 인물에 대한 정보, 예를 들면 등장 인물 중에서 전자 출판물에서 차지하는 비중이 높은 주요한 등장 인물이 누구인지에 대한 정보를 생성하는 정보 생성 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for generating information about an electronic publication. More specifically, the characters are identified by using the property information indicating the properties of the verbs from the sentences constituting the electronic publication, and the information about the characters identified in this way, for example, the main portion of the electronic publication with a high proportion of characters. An information generating apparatus and method for generating information on who a character is.
최근, 기존의 종이책으로 제공되던 많은 컨텐츠는 전자 출판물의 일종인 전자책(e-book)으로 제공되고 있다. 전자책은 퍼스널 컴퓨터(PC), 스마트폰, 노트북 또는 태블릿과 같은 전자책 전용 단말기에서, 전자책 리더(reader) 또는 뷰어(viewer) 소프트웨어를 통해 열람 가능하다. Recently, many contents provided by existing paper books have been provided as e-books, which are a kind of electronic publications. The e-book can be viewed through an e-book reader or viewer software in an e-book dedicated terminal such as a personal computer (PC), smart phone, notebook or tablet.
전자책은 디지털화된 정보의 형태를 갖는다. 따라서, 정보를 추출하고 추출된 정보를 데이터베이스로 구축하는데 있어서, 전자책은 기존의 종이책보다 용이하다. 데이터베이스로 구축된 전자책에 대한 정보는 예를 들면, 공공 도서관이나 대학의 도서관, 전자책을 판매하는 도서 정보 제공 사이트 등에서 다양하게 활용 가능하다.Ebooks take the form of digitized information. Therefore, in extracting information and building the extracted information into a database, an e-book is easier than a conventional paper book. The information on the e-book constructed as a database can be variously used, for example, in a public library, a university library, or a book information providing site that sells e-books.
전자책으로부터 추출 가능한 정보에는 예를 들면 가격에 대한 정보, 저자(author)에 대한 정보, 타인이 온라인으로 작성한 서평에 대한 정보 등이 있으며, 전자책에 등장하는 등장 인물에 대한 정보도 있다. 이 중에서 등장 인물에 대한 정보에 대하여 보다 구체적으로 살펴보도록 한다.Information that can be extracted from an e-book includes, for example, price information, author information, book reviews written by others, and information on characters appearing in the e-book. Among them, the information about the characters will be described in more detail.
전자책 중에서 소설의 경우, 주로 등장 인물을 중심으로 내용이 전개된다. 따라서, 소설에 있어서의 등장 인물에 대한 정보, 그 중에서도 소설에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보는 다른 장르의 전자책보다 상대적으로 중요하다. 아울러, 소설 뿐만 아니라 다른 장르의 도서 분석에 있어서도 등장 인물에 대한 정보는 다양한 방면에서 활용 가능하다.In the case of novels in e-books, the content mainly develops around the characters. Therefore, information about the characters in the novel, and among them, who is the main character who plays a major role in the novel, is more important than the e-books of other genres. In addition, in the analysis of books of other genres as well as novels, information on characters can be used in various ways.
이러한 등장 인물에 대한 정보를 전자책으로부터 추출하기 위해서는, 전자책을 구성하는 복수의 문장으로부터 등장 인물을 추출하는 과정이 수행되어야 한다. 이를 위한 종래의 기술로, 국내 등록특허 10-1255957호는 사람의 명칭을 저장하고 있는 인물 사전(dictionary)을 이용하여 등장 인물을 추출한다. 이에 따르면, 전자책을 구성하는 문장이 인물 사전에 등재된 사람의 명칭과 동일한 단어를 포함하고 있으면, 해당 단어는 등장 인물을 지칭하는 것으로 인식된다.In order to extract information about the characters from the e-book, a process of extracting the characters from a plurality of sentences constituting the e-book should be performed. As a conventional technique for this purpose, Korean Patent No. 10-1255957 extracts a person using a person dictionary that stores the person's name. According to this, if the sentence constituting the e-book contains the same word as the name of the person listed in the person dictionary, it is recognized that the word refers to the person.
그러나, 이러한 종래의 기술은, 인물 사전에 등재되어 있지 않은 새로운 명칭은 등장 인물로 인식할 수 없다. 등장 인물의 명칭은 누구나 임의로 지을 수 있다는 점 그리고 시대에 따라서 명칭은 계속하여 변화한다는 점을 고려하면, 인물 사전에 제한받지 않고 등장 인물에 대한 정보, 그 중에서도 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출하는 방안이 요구된다.However, this conventional technique cannot recognize a new name that is not listed in the person dictionary as a person. Considering that the names of the characters can be arbitrarily chosen and that the names continue to change according to the times, who is the main character who plays a major role in information about the characters, among them, without being restricted in the dictionary of characters. A method of extracting information about cognition is required.
본 발명의 해결하고자 하는 과제는 전자책과 같은 전자 출판물로부터 등장 인물에 대한 정보, 예를 들면 해당 전자 출판물에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출하는 기술을 제공하는 것이다.The problem to be solved by the present invention is to provide a technique for extracting information about the characters from the electronic publication, such as an e-book, for example, who is the main character who plays a major role in the electronic publication. .
다만, 본 발명의 해결하고자 하는 과제는 이에 한정되지 않는다However, the problem to be solved by the present invention is not limited thereto.
본 발명의 일 실시예에 따른 전자 출판물에 대한 정보 생성 장치는 전자 출판물을 입력받는 입력부와, 동사의 성질을 나타내는 성질 정보를 복수 개의 동사 각각에 대하여 저장하는 저장부와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 문장 구조 파악부 및 상기 추출된 동사 각각의 성질 정보를 상기 저장부로부터 획득하며 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 인물 파악부를 포함하는 등장 인물 파악부와, 상기 파악된 등장 인물에 대한 정보를 생성하는 정보 생성부를 포함한다.An information generating apparatus for an electronic publication according to an embodiment of the present invention includes an input unit for receiving an electronic publication, a storage unit storing property information representing a property of a verb for each of a plurality of verbs, and configuring the electronic publication. A sentence structure grasping unit for extracting a subject and a verb from a plurality of sentences, and obtaining property information of each of the extracted verbs from the storage unit and related to a verb corresponding to the obtained property information based on the obtained property information And a person identification unit including a person identification unit for identifying a subject as a person in the electronic publication, and an information generation unit for generating information about the identified person.
또한, 상기 저장부에서 동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 가질 수 있다.In addition, the verbs having the same or similar meanings in the storage unit may have the same property information.
또한, 상기 인물 파악부는 상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.The person identifying unit may identify a subject related to a verb corresponding to the acquired property information as a person in the electronic publication, if the acquired property information is property information related to an action of a person.
또한, 상기 문장 구조 파악부는 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되는 문장을 선별하고, 상기 인물 파악부는 상기 선별된 문장에 포함된 동사의 성질 정보를 상기 저장부로부터 획득하며, 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.In addition, the sentence structure determiner is a result of extracting a subject and a verb from each of the plurality of sentences, the subject and the verb is extracted at least one sentence, the person grasping portion is stored in the property information of the verb included in the selected sentence Based on the acquired property information, a subject related to a verb corresponding to the obtained property information may be identified as a person in the electronic publication.
또한, 상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며, 상기 인물 파악부는 상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하고, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물로 파악할 때 제외시킬 수 있다.In addition, the storage unit stores an exclusion list having information on the subject to be excluded from the character, the person identifying unit checks whether the extracted subject is included in the exclusion list, and the extracted subject is excluded If it is included in the list, the extracted subject may be excluded when it is identified as the character.
또한, 상기 정보 생성부는 상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하며, 상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정할 수 있다.In addition, whenever the subject is identified as a person, the information generator may add a predetermined value to a main degree corresponding to the subject, and select a subject having a relatively high main degree as the main character.
또한, 상기 주요도에 더해지는 수치는 상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 가질 수 있다.In addition, the numerical value added to the main map may have a relatively small value in one sentence including a subject identified as the character, as the number of subjects included in the one sentence increases.
본 발명의 일 실시예에 따른 정보 생성 방법은 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 포함한다.An information generating method according to an embodiment of the present invention comprises the steps of receiving an electronic publication, extracting a subject and a verb from a plurality of sentences constituting the electronic publication, and extracting property information of each of the extracted verbs, Acquiring from a storage for storing each of a plurality of verbs; identifying a subject associated with a verb corresponding to the acquired property information as a person in the electronic publication based on the obtained property information; And generating information on the identified person.
또한, 상기 저장부에서 동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 가질 수 있다.In addition, the verbs having the same or similar meanings in the storage unit may have the same property information.
또한, 상기 등장 인물로 파악하는 단계는 상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악할 수 있다.In the identifying as the person, when the acquired property information is property information related to a person's behavior, a subject related to a verb corresponding to the obtained property information may be recognized as a person in the electronic publication.
또한, 상기 성질 정보를 획득하는 단계와 상기 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와 상기 파악된 등장 인물에 대한 정보를 생성하는 단계는, 상기 추출하는 단계에서, 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되면 수행될 수 있다.The acquiring of the property information, identifying the subject as a person in the electronic publication, and generating information about the identified person may include extracting the information from the plurality of sentences. Result of extracting subject and verb respectively It can be performed if at least one subject and verb is extracted.
또한, 상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며, 상기 등장 인물로 파악하는 단계는 상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하는 단계와, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물로 파악할 때 제외시키는 단계를 더 포함할 수 있다.In addition, the storage unit stores an exclusion list having information on a subject to be excluded from the character, and the step of identifying as the character includes checking whether the extracted subject is included in the exclusion list; If the extracted subject is included in the exclusion list, the extracted subject may further include a step of excluding when identifying as the character.
또한, 상기 정보를 생성하는 단계는 상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하는 단계와, 상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정하는 단계를 포함할 수 있다.The generating of the information may include adding a predetermined value to a main degree corresponding to the subject whenever the subject is identified as a character, and selecting a subject having a relatively high main degree as the main character. It may include a step.
또한, 상기 주요도에 소정의 수치를 더하는 단계는 상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는 수치를 더할 수 있다.In addition, the step of adding a predetermined value to the main diagram may include a numerical value having a relatively small value in one sentence including a subject identified as the character, as the number of subjects included in the one sentence increases. have.
본 발명의 다른 실시예에 따른 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램은 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하도록 프로그램된다.According to another embodiment of the present invention, a computer program stored in a computer-readable recording medium may include receiving an electronic publication, extracting subjects and verbs from a plurality of sentences constituting the electronic publication, and extracting the extracted verbs. Obtaining each property information from a storage for storing each of the plurality of verbs, and based on the obtained property information, a subject related to the verb corresponding to the obtained property information in the electronic publication. And identifying the person and generating the information about the identified person.
본 발명의 또 다른 실시예에 따른 컴퓨터 판독가능 기록매체는 전자 출판물을 입력받는 단계와, 상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와, 상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와, 상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와, 상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하는 명령어를 포함하는 프로그램이 기록된다.According to another embodiment of the present invention, a computer-readable recording medium may include receiving an electronic publication, extracting subjects and verbs from a plurality of sentences constituting the electronic publication, and properties of each of the extracted verbs. Acquiring information from a storage for storing each of a plurality of verbs; and identifying a subject related to the verb corresponding to the acquired property information as a character in the electronic publication, based on the obtained property information. And a command for performing the step of generating information on the identified person.
본 발명의 일 실시예에 따르면, 인물 사전을 이용하지 않고도 전자책과 같은 전자 출판물로부터 등장 인물에 대한 정보를 추출할 수 있다. 따라서, 전자 출판물이 작가가 임의로 지은 등장 인물에 대한 명칭을 포함하고 있는 경우에도 등장 인물에 대한 정보를 정확하게 추출할 수 있다. 아울러, 해당 전자 출판물에서 주요한 역할을 수행하는 주요 등장 인물이 누구인지에 대한 정보를 추출함에 있어서, 하나의 문장에 포함된 주어의 개수를 반영함으로써 보다 세밀하게 주요 등장 인물을 추출할 수 있다.According to an embodiment of the present invention, information about a person may be extracted from an electronic publication such as an e-book without using a person dictionary. Therefore, even when the electronic publication includes names of characters randomly written by the author, information on the characters can be accurately extracted. In addition, in extracting information on who is the main character who plays a major role in the electronic publication, the main character can be extracted in more detail by reflecting the number of subjects included in one sentence.
도 1a는 본 발명의 일 실시예에 따른 정보 생성 장치를 이용하는 것을 도시한 도면이다.1A is a diagram illustrating the use of an information generating device according to an embodiment of the present invention.
도 1b는 본 발명의 일 실시예에 따른 정보 생성 장치가, 전자 출판물에 등장하는 등장 인물에 대한 정보를 독자에게 제공하는 것을 예시적으로 도시한 도면이다.FIG. 1B is a diagram exemplarily illustrating that an information generating apparatus according to an embodiment of the present invention provides a reader with information about a person who appears in an electronic publication.
도 2는 본 발명의 일 실시예에 따른 정보 생성 장치의 구성을 도시한 도면이다2 is a diagram illustrating a configuration of an information generating apparatus according to an embodiment of the present invention.
도 3a 및 3b는 저장부에서 복수 개의 동사에 대하여 성질 정보가 할당되어 있는 것을 도시한 도면이다.3A and 3B are diagrams illustrating that property information is allocated to a plurality of verbs in a storage unit.
도 4는 본 발명의 일 실시예에 따른 등장 인물 파악부의 구성을 상세하게 도시한 도면이다.4 is a diagram illustrating in detail the configuration of the person identification unit according to an embodiment of the present invention.
도 5는 본 발명의 일 실시예에 따른 정보 생성 방법의 단계를 도시한 도면이다5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention.
도 6은 도 5에서 등장 인물에 대한 정보를 생성하는 단계를 세부적으로 도시한 도면이다.FIG. 6 is a diagram illustrating in detail a step of generating information on a person in FIG. 5.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.Advantages and features of the present invention and methods for achieving them will be apparent with reference to the embodiments described below in detail with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but can be implemented in various different forms, and only the embodiments make the disclosure of the present invention complete, and the general knowledge in the art to which the present invention belongs. It is provided to fully inform the person having the scope of the invention, which is defined only by the scope of the claims.
본 발명의 일 실시예를 설명하기에 앞서, 전자 출판물은 전자책(e-book)이나 인터넷 상에서 열람 가능한 텍스트 형태의 정보(예를 들면, 인터넷 신문, 인터넷 잡지, 블로그 등) 등을 지칭하는 것이며, 다만 이에 한정되는 것은 아니다. 전자 출판물은 적어도 하나 이상의 문장으로 구성된다.Prior to describing an embodiment of the present invention, an electronic publication refers to an e-book or textual information (eg, an internet newspaper, an internet magazine, a blog, etc.) that can be viewed on the Internet. However, the present invention is not limited thereto. An electronic publication consists of at least one sentence.
도 1a는 본 발명의 일 실시예에 따른 정보 생성 장치를 사용자가 이용하는 것을 도시한 도면이다.1A is a diagram illustrating a user using an information generating apparatus according to an embodiment of the present invention.
도 1a를 참조하면, 정보 생성 장치(100)와 사용자(310)가 사용하는 사용자 단말(300)은 네트워크(200)를 통해 연결된다. 다만, 도 1a는 예시적인 것이므로 본 발명의 사상이 이와 같이 도시된 것으로 한정 해석되는 것은 아니다.Referring to FIG. 1A, the information generating apparatus 100 and the user terminal 300 used by the user 310 are connected through the network 200. However, since FIG. 1A is exemplary, the spirit of the present invention is not limited to the illustrated embodiment.
먼저, 사용자 단말(300)은 정보 생성 장치(100)로부터 네트워크(200)를 통해 전자 출판물에 대한 정보를 수신하고 이를 표시한다. 사용자 단말(300)에 표시되는 정보는 전자 출판물에 대한 다양한 정보, 예를 들면 가격에 대한 정보, 저자(author)에 대한 정보, 타인이 작성한 서평에 대한 정보, 등장 인물에 대한 정보 등을 포함한다. 도 1b는 전자 출판물이 전자책(e-book)일 때, 전자책에 등장하는 등장 인물에 대한 정보가 사용자 단말(300)에 표시된 것을 예시적으로 도시한 도면이다. 이러한 사용자 단말(300)은 인터넷에 접속 가능한 장치로서, 예를 들면 개인용 컴퓨터, 스마트폰 또는 스마트패드 등일 수 있다.First, the user terminal 300 receives information about the electronic publication from the information generating apparatus 100 through the network 200 and displays it. The information displayed on the user terminal 300 includes various information about the electronic publication, for example, information on prices, information on authors, information on book reviews written by others, information on characters, and the like. . FIG. 1B is a diagram exemplarily illustrating that information about a person who appears in an e-book is displayed on the user terminal 300 when the electronic publication is an e-book. The user terminal 300 is a device that can be connected to the Internet, and may be, for example, a personal computer, a smartphone, or a smart pad.
네트워크(200)는 사용자 단말(300)과 정보 생성 장치(100)를 연결하며, 예를 들면, LAN, 3G, LTE, LTE-A, Wi-Fi 또는 블루투스 등의 방식으로 구현될 수 있다.The network 200 connects the user terminal 300 and the information generating apparatus 100 and may be implemented by, for example, LAN, 3G, LTE, LTE-A, Wi-Fi, or Bluetooth.
정보 생성 장치(100)는 전자 출판물에 대한 정보를 네트워크(200)를 통해 사용자 단말(300)로 전달한다. 이를 위해, 정보 생성 장치(100)는 전자 출판물을 적어도 하나 이상 입력받으며, 입력받은 전자 출판물로부터 다양한 정보를 추출한다. 정보 생성 장치(100)는 서버, 개인용 컴퓨터(PC) 등에서 구현될 수 있다. 아울러, 이러한 정보 생성 장치(100)는 도서 정보를 제공하는 온라인 도서관, 종이책을 판매하는 업체에서 운영하는 온라인 도서 판매/정보 제공 시스템, 또는 전자책을 판매하는 업체에서 운영하는 온라인 전자책 판매/정보 제공 시스템 등에 적용 가능하다. 이하에서는 이러한 정보 생성 장치(100)에 대하여 보다 자세하게 살펴보기로 한다.The information generating apparatus 100 transmits the information about the electronic publication to the user terminal 300 through the network 200. To this end, the information generating apparatus 100 receives at least one electronic publication, and extracts various information from the received electronic publication. The information generating apparatus 100 may be implemented in a server, a personal computer (PC), or the like. In addition, the information generating apparatus 100 is an online library for providing book information, an online book sales / information system operated by a company that sells paper books, or an online e-book sales / operated by a company that sells e-books. Applicable to an information providing system. Hereinafter, the information generating apparatus 100 will be described in more detail.
도 2는 본 발명의 일 실시예에 따른 정보 생성 장치의 구성을 도시한 도면이다.2 is a diagram illustrating a configuration of an information generating apparatus according to an embodiment of the present invention.
도 2를 참조하면, 정보 생성 장치(100)는 입력부(110), 저장부(120), 등장 인물 파악부(130) 및 정보 생성부(140)를 포함한다. 다만, 정보 생성 장치(100)의 이러한 구성은 예시적인 것이므로, 이 중 적어도 하나 이상의 구성이 포함되지 않거나 여기에 도시되지 않은 구성이 더 포함될 수 있다.Referring to FIG. 2, the information generating apparatus 100 includes an input unit 110, a storage unit 120, a character identifying unit 130, and an information generating unit 140. However, since the configuration of the information generating apparatus 100 is exemplary, at least one of the components may not be included or a configuration not shown here may be further included.
입력부(110)는 전자 출판물을 입력받는다. 입력부(110)가 전자 출판물을 입력(또는 전달)받는 방식에는 예를 들면, 전자 출판물을 저장하는 별도의 데이터베이스(도면에는 미도시)와 연결되어 그로부터 전자 출판물을 전달받는 방식, USB나 광디스크와 같은 저장 매체와 연결되어 이에 저장된 전자 출판물을 전달받는 방식 또는 정보 생성 장치(100)의 관리자로부터 임의의 전자 출판물을 직접 입력받는 방식 등이 있으며, 다만 이에 한정되지 않는다. 이러한 입력부(110)는 데이터베이스와 연결되는 통신 포트, USB와 연결되는 직렬(serial) 포트 또는 광디스크를 읽는 리더기(예를 들면 CD-ROM) 등일 수 있다.The input unit 110 receives an electronic publication. The input unit 110 receives (or transmits) an electronic publication, for example, is connected to a separate database (not shown) for storing the electronic publication and receives the electronic publication therefrom, such as a USB or an optical disk. A method of receiving an electronic publication stored in the storage medium connected to the storage medium or a method of directly receiving an electronic publication from an administrator of the information generating apparatus 100 may be used. The input unit 110 may be a communication port connected to a database, a serial port connected to a USB, or a reader (for example, a CD-ROM) that reads an optical disk.
저장부(120)는 복수 개의 동사와, 복수 개의 동사 각각의 성질을 나타내는 성질 정보를 미리 저장한다. 이러한 저장부(120)는 데이터를 저장하는 메모리 등으로 구현 가능하다. 이하에서는 성질 정보에 대하여 보다 자세하게 살펴보도록 한다. The storage unit 120 stores in advance a plurality of verbs and property information indicating the properties of each of the plurality of verbs. The storage unit 120 may be implemented as a memory for storing data. Hereinafter, the property information will be described in more detail.
성질 정보는 동사가 나타내는 의미를 기초로 동사의 성질을 나타내는 정보이다. 이러한 성질 정보는, 예를 들면 국립국어원과 같이, 국가의 언어를 연구하고 관리하는 기관에서 동사마다 부여한다. 이에, 일 실시예에서는 이와 같은 기관에서 동사에 성질 정보를 부여한 자료를 획득하여 저장부(120)에 저장한 뒤 활용할 수 있으나 이에 한정되는 것은 아니다. 도 3a는 동사마다 성질 정보를 나타낸 것을 예시적으로 도시한 도면이다. 도 3a를 참조하면, 동사 '가격하다'는 특정 대상을 향하여 타격을 가하는 행위를 나타내므로 성질 정보는 '방향성 행위동사'이며, 동사 '가공시키다'는 무언가를 생성하는 행위를 나타내므로 성질 정보는 '창조 행위동사'이다. Property information is information indicating the property of a verb based on the meaning of the verb. This property information is given for each verb in an institution that studies and manages the language of the country, for example, the National Institute of the Korean Language. Thus, in one embodiment, such an institution may obtain and store data in which the property information is assigned to the verb in the storage unit 120, but is not limited thereto. 3A is a diagram exemplarily illustrating property information for each verb. Referring to FIG. 3A, since the verb 'price' refers to an act of hitting a specific object, the property information is 'directional action verb', and the verb 'process' refers to an action of generating something. 'Creative act verbs'.
저장부(120)에 저장된 동사 중에는 동일하거나 유사한 의미를 갖는 동사들이 있다. 예를 들면, 동사 '말하다'와 동사 '대화하다'는 유사한 의미를 가지며, 동사 '원하다', 동사 '바라다' 및 동사 '기원하다'는 서로 간에 유사한 의미를 갖는다. 이와 같이 동일하거나 유사한 의미를 갖는 동사들에 대해서, 저장부(120)는 동일한 성질 정보를 갖도록 구성될 수 있다.Among the verbs stored in the storage unit 120 are verbs having the same or similar meanings. For example, the verb 'to speak' and the verb 'to converse' have similar meanings, and the verb 'want', the verb 'to sea' and the verb 'to come' have similar meanings to one another. For the verbs having the same or similar meanings as described above, the storage 120 may be configured to have the same property information.
한편, 저장부(120)는 제외 리스트를 저장한다. 제외 리스트는 등장 인물에서 제외되어야 하는 명칭을 적어도 하나 이상 갖는다. 후술하겠지만 일 실시예에서는 문장으로부터 추출된 주어가 등장 인물인지 여부를 파악함에 있어서 동사의 성질 정보를 참고하는데, 제외 리스트에 저장된 명칭과 동일한 주어는 동사의 성질 정보와는 무관하게 등장 인물이 아닌 것으로 간주된다. 이러한 제외 리스트는 정보 생성 장치(100)를 관리하는 관리자 등에 의하여 작성될 수 있으며, 이후 그 안에 포함된 명칭은 추가, 수정 또는 삭제될 수 있다.Meanwhile, the storage unit 120 stores the exclusion list. The exclusion list has at least one name that should be excluded from the character. As will be described later, in one embodiment, in determining whether a subject extracted from a sentence is a character, reference is made to the property information of a verb, and a subject identical to a name stored in an exclusion list is not a character regardless of the property information of the verb. Is considered. Such an exclusion list may be created by an administrator or the like who manages the information generating apparatus 100, and names included therein may be added, modified, or deleted.
등장 인물 파악부(130)는 전자 출판물에 등장하는 등장 인물을 파악하며, 이러한 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리, 그리고 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다. The character identifying unit 130 may identify the characters appearing in the electronic publication, and may be embodied by a memory for storing instructions programmed to perform such a function, and a microprocessor for performing the instructions.
도 4는 이러한 등장 인물 파악부의 구성을 보다 세부적으로 도시한 도면이다. 도 4를 참조하면, 등장 인물 파악부(130)는 전처리부(131), 문장 구조 파악부(133) 및 인물 파악부(135)를 포함할 수 있다. 그리고 각각의 구성은 후술될 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리, 그리고 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다.4 is a view showing in more detail the configuration of such a character identification unit. Referring to FIG. 4, the character determiner 130 may include a preprocessor 131, a sentence structure determiner 133, and a person determiner 135. Each configuration may be implemented by a memory storing instructions programmed to perform a function to be described later, and a microprocessor performing such instructions.
전처리부(131)는 전자 출판물을 구성하는 복수의 문장을 각각 하나의 문장으로 분리할 수 있다. 이를 위하여, 전처리부(131)는 괄호를 검색할 수 있으며, 검색된 괄호와 이러한 괄호 안에 있는 내용을 제거할 수 있다. 또한 전처리부(131)는 마침표, 쉼표, 느낌표 또는 물음표 등을 인식한 뒤 이들을 기준으로 복수의 문장을 각각 하나의 문장으로 분리할 수 있다.The preprocessor 131 may separate a plurality of sentences constituting the electronic publication into one sentence. To this end, the preprocessor 131 may search the parentheses, and may remove the searched parentheses and the contents in the parentheses. In addition, the preprocessor 131 may recognize a period, a comma, an exclamation point, or a question mark, and then separate the plurality of sentences into one sentence based on these.
문장 구조 파악부(133)는 각각의 문장으로부터 주어와 동사를 추출한다. 이를 위하여, 문장 구조 파악부(133)는 형태소 분석기를 이용하여 문장 내에서 주어와 동사를 구분할 수 있다. 예를 들면, '은', '는', '이' 또는 '가'와 같은 조사와 결합되어 있는 단어에 대해서, 문장 구조 파악부(133)는 문장의 주어로 추출할 수 있다. 다만, 문장을 형태소 단위로 분석하여 그로부터 주어와 동사를 추출하는 기술은 이미 공지된 것이므로 이에 대한 자세한 설명은 생략하기로 한다.The sentence structure determining unit 133 extracts a subject and a verb from each sentence. To this end, the sentence structure determiner 133 may distinguish between a subject and a verb in a sentence using a morpheme analyzer. For example, the sentence structure grasping unit 133 may extract the sentence as a subject of a sentence associated with a search such as 'silver', 'silver', 'yi' or 'ga'. However, since the technique of analyzing the sentence in morpheme units and extracting the subject and the verb from the sentence is already known, a detailed description thereof will be omitted.
문장 구조 파악부(133)는, 주어와 동사를 추출한 결과, 복수의 문장 중에서 주어와 동사가 각각 적어도 하나씩 포함된 문장을 선별한다. 일 실시예에서는 주어와 동사가 각각 적어도 하나씩 포함된 문장을 대상으로, 인물 파악부(135)가 이러한 문장에 포함된 주어가 해당 전자 출판물에서의 등장 인물에 해당하는지 여부를 판단한다.As a result of extracting the subject and the verb, the sentence structure determining unit 133 selects a sentence including at least one of the subject and the verb from a plurality of sentences. In one embodiment, the person identifying unit 135 determines whether the subject included in the sentence corresponds to a person in the electronic publication, based on a sentence including at least one subject and a verb each.
인물 파악부(135)는 문장 구조 파악부(133)가 선별한 문장에 포함된 동사의 성질 정보를 저장부(120)로부터 획득한다. 아울러, 인물 파악부(135)는 획득된 성질 정보를 기초로 해당 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단한다. 사람을 주어로 행위 동사란, 행위의 주체가 사람인 동사를 의미한다. 도 3b는 사람을 주어로 하는 행위 동사를 예시적으로 나타낸 것이다.The person grasping unit 135 obtains, from the storage 120, property information of a verb included in a sentence selected by the sentence structure grasping unit 133. In addition, the person grasping unit 135 determines whether the verb is an action verb given to a person based on the acquired property information. As a subject, an action verb means a verb whose subject is a person. 3B exemplarily shows an action verb based on a person.
여기서, 인물 파악부(135)는 다음과 같은 방법을 이용하여, 성질 정보를 기초로 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단할 수 있다. 예를 들면, 동사의 성질 정보가 기 지정된 성질 정보 중 어느 하나에 속하면, 이러한 동사를 사람을 주어로 하는 행위 동사로 판별할 수 있다. 예를 들면, '결과 행위 동사', '방향성 행위 동사' 또는 '창조 행위 동사'의 성질 정보를 갖는 동사가, 사람을 주어로 하는 행위 동사로 기 지정될 수 있다. 따라서, 동사의 성질 정보가 이 중 어느 하나에 해당하면, 해당 동사는 사람을 주어로 하는 행위 동사로 판별될 수 있다. 다만, 이는 예시적인 것이므로 본 발명의 사상이 이러한 방법에 한정되는 것은 아니다. 예를 들면, 인물 파악부(135)는 동사를 구성하는 어간과 어미 중에서, 어간을 이용하여 동사가 사람을 주어로 하는 행위 동사인지를 파악할 수도 있다.Here, the person grasping unit 135 may determine whether the verb is an action verb based on the property information by using the following method. For example, if the property information of the verb belongs to any one of the predetermined property information, such a verb can be discriminated as an action verb with a human subject. For example, a verb having the property information of 'result behavior verb', 'directional behavior verb' or 'creation behavior verb' may be designated as an action verb whose subject is the subject. Therefore, if the property information of the verb corresponds to any one of the above, the verb may be determined as an action verb with a subject. However, this is merely an example, and the inventive concept is not limited to this method. For example, the person grasping unit 135 may determine whether a verb is an action verb to which a person is given using a stem, among stems and endings constituting a verb.
한편, 인물 파악부(135)는, 문장 구조 파악부(133)에서 추출된 주어가 저장부(120)에 저장된 제외 리스트에 포함되어 있는지를 체크한다. 체크 결과, 추출된 주어가 제외 리스트에 포함되어 있으면, 추출된 주어에 대해서는 주어가 등장 인물인지를 파악하는 과정(전술한 동사의 성질 정보를 참조하는 과정)이 수행되지 않으며, 곧바로 등장 인물에서 제외된다. 이를 통해서, 모든 주어가 아닌 일부의 주어에 대해서만 등장 인물인지를 파악하는 과정이 수행될 수 있다. 따라서, 등장 인물을 파악하는데 소요되는 자원과 시간이 절약될 수 수 있다.On the other hand, the person grasping unit 135 checks whether the subject extracted by the sentence structure grasping unit 133 is included in the exclusion list stored in the storage unit 120. As a result of the check, if the extracted subject is included in the exclusion list, the process of identifying whether the subject is a character (referring to the above-described verb property information) is not performed on the extracted subject, and is immediately excluded from the character. do. Through this, a process of determining whether a character is present for only some subjects but not all subjects may be performed. Thus, resources and time required to identify the characters can be saved.
인물 파악부(135)는, 동사가 사람을 주어로 하는 행위 동사라고 판단되면, 이러한 동사와 관련된 주어를 전자 출판물에서의 등장 인물로 파악한다.If it is determined that the verb is an action verb with a subject, the person grasping unit 135 identifies the subject associated with the verb as a character in the electronic publication.
이를 기초로 살펴보면, 일 실시예에서는 인물 사전을 활용하지 않고도 동사의 성질 정보를 이용하여 주어가 전자 출판물에서의 등장 인물인지 여부를 파악할 수 있다. 따라서, 등장 인물의 명칭이 작가에 의하여 임의로 지어진 경우에도, 등장 인물에 대한 정보가 정확하게 추출될 수 있다.On the basis of this, in one embodiment, it is possible to determine whether a subject is a character in an electronic publication by using verbal property information without using a person dictionary. Therefore, even when the name of the person is arbitrarily named by the artist, information on the person can be accurately extracted.
정보 생성부(140)는 인물 파악부(135)에 의하여 파악된 등장 인물에 대한 정보를 생성한다. 생성되는 등장 인물에 대한 정보는, 예를 들면, 등장 인물 중 비중을 상대적으로 많이 차지하는 주요 등장 인물이 누구인지에 대한 정보일 수 있다. 정보 생성부(140)는 이와 같은 기능을 수행하도록 프로그램된 명령어를 저장하는 메모리와, 이러한 명령어를 수행하는 마이크로프로세서에 의하여 구현 가능하다.The information generating unit 140 generates information on the person identified by the person identifying unit 135. The information on the generated characters may be, for example, information on who are the main characters who occupy a relatively large proportion of the characters. The information generating unit 140 may be implemented by a memory for storing instructions programmed to perform such a function and a microprocessor that executes the instructions.
보다 구체적으로 살펴보면, 정보 생성부(140)는 주요 등장 인물을 선정하기 위해서, 주어가 등장 인물로 파악되는 횟수를 파악하며, 이러한 횟수를 기초로 주요도를 계산한다. 예를 들면, A, B, C 및 D가 임의의 전자 출판물에서의 각각 3번, 8번, 7번, 6번씩 등장 인물로 파악되는 경우를 상정하자. 이 경우, A부터 D까지 등장 인물의 주요도는 각각이 등장 인물로 파악될 때마다 소정의 수치를 더함으로써 산정된다. 이에 따르면, A부터 D까지의 주요도는 각각이 등장 인물로 파악될 때마다 소정의 수치인 1을 더한 결과 각각 3,8,7,6일 수 있다.In more detail, in order to select the main characters, the information generating unit 140 determines the number of times that the subject is identified as the characters, and calculates the main degree based on the number of times. For example, suppose that A, B, C, and D are identified as characters 3, 8, 7, and 6 in any electronic publication, respectively. In this case, the main degree of the characters from A to D is calculated by adding a predetermined value each time each is identified as a character. According to this, the main maps from A to D may be 3, 8, 7, and 6 as a result of adding 1, which is a predetermined value each time each is identified as a character.
이 때, 정보 생성부(140)는 등장 인물로 파악될 때마다 더해지는 값(위에서는 '1')에 가중치를 곱한 뒤 가중치가 곱해진 값을 더하여 주요도를 산정할 수 있다. 가중치는 하나의 문장 내에 포함되는 주어의 개수가 많을수록 적은 값을 갖는다. 예를 들면, '갑이 밥을 먹다'라는 문장에서는 주어의 개수가 1개이므로 가중치는 10, '갑과 을이 밥을 먹다'라는 문장에서는 주어의 개수가 2개이므로 가중치는 2, '갑과 을과 병이 밥을 먹다'라는 문장에서는 주어의 개수가 3개이므로 가중치는 1, '갑과 을과 병과 정이 밥을 먹다'에서는 주어의 개수가 4개이므로 가중치는 0일 수 있다. At this time, the information generation unit 140 may calculate the principal degree by multiplying the weight added to each added value ('1' in the above) each time it is identified as a character, and then adding the multiplied value. The weight has a smaller value as the number of subjects included in one sentence increases. For example, in the sentence "Gap eats rice", the number of subjects is 1 because the number of subjects is 1, and in the sentence "Gap and Eul eats", the weight of the subject is 2, so the weight is 2, In the sentence 'Eating rice', the number of subjects is three, so the weight is 1, and in 'A, B, and B, the class eats', the number of subjects is four, so the weight may be zero.
통상적으로, 주요 등장 인물은 단독으로 하는 행동이 많은 반면, 부수적인 등장 인물은 타인들과 함께 하는 행동이 많다. 이를 반영하여, 일 실시예에서는 단독으로 행동을 하는 등장 인물(전자)이 주어로 판단되는 횟수와 타인들과 함께 행동하는 등장 인물(후자)이 주어로 판단되는 횟수가 동일한 경우, 전자의 주요도를 후자의 주요도보다 높게 산정하기 위하여 위와 같이 주어의 개수에 따라 가중치를 반영한 것이다. 다만, 가중치를 반영하는 이러한 방법은 예시적인 것이므로 본 발명의 사상이 이에 한정되는 것은 아니며, 여기서 개시되지 않았으나 주된 등장 인물과 부수적인 등장 인물을 구분하기 위한 다양한 방법이 적용될 수 있다.Typically, the main character has many actions alone, while the secondary character has many actions with others. Reflecting this, in one embodiment, when the number of times the person (the former) acting alone is determined to be the same as the number of times the person (the latter) acting together with others is determined to be the same, the main figure of the former In order to calculate the higher than the latter main degree, the weight is reflected according to the number of subjects as above. However, since the method of reflecting the weight is exemplary, the spirit of the present invention is not limited thereto, but various methods for distinguishing the main character and the incidental character may be applied, although not disclosed herein.
이상에서 살펴본 바와 같이, 일 실시예에 따르면 동사의 성질 정보를 이용하여 주어가 등장 인물인지 여부를 파악할 수 있다. 따라서, 인물 사전과 같은 고정적인 기준을 참조하지 않고도 보다 정확하게 전자 출판물로부터 등장 인물을 파악할 수 있다.As described above, according to an embodiment, whether or not the subject is a character may be determined using property information of a verb. Thus, it is possible to more accurately identify a person from an electronic publication without referring to fixed criteria such as a person dictionary.
아울러, 하나의 문장에 포함된 주어의 개수를 고려하여 가중치 및 이에 따른 주요도를 산정하고, 이러한 주요도를 기초로 등장 인물로부터 주요 등장 인물이 누구인지에 대한 정보를 생성함으로써, 단순하게 등장 인물의 등장 횟수만으로 주요 등장 인물을 선정하는 것보다 정확하게 주요 등장 인물을 선정할 수 있다.In addition, by considering the number of subjects included in one sentence, the weight and the corresponding main road are calculated, and based on the main road, information about who the main person is from the characters is generated, and the character is simply. It is possible to select the main characters more accurately than to select the main characters only by the number of appearances.
도 5는 본 발명의 일 실시예에 따른 정보 생성 방법의 단계를 도시한 도면이다. 도 5에 도시된 정보 생성 방법은 도 2에 도시된 정보 생성 장치(100)에 의하여 수행 가능하다.5 is a diagram illustrating steps of an information generating method according to an embodiment of the present invention. The information generating method illustrated in FIG. 5 may be performed by the information generating apparatus 100 illustrated in FIG. 2.
도 5를 참조하면, 전자 출판물을 입력받는 단계(S100)가 수행된다. 전자 출판물을 입력(또는 전달)받는 방식에는 예를 들면, 전자 출판물을 저장하는 별도의 데이터베이스(도면에는 미도시)와 연결되어 그로부터 전자 출판물을 전달받는 방식, USB나 광디스크와 같은 저장 매체와 연결되어 이에 저장된 전자 출판물을 전달받는 방식 또는 정보 생성 장치(100)의 관리자로부터 임의의 전자 출판물을 직접 입력받는 방식 등이 있으며, 다만 이에 한정되지 않음은 전술한 바와 같다.Referring to FIG. 5, an operation S100 of receiving an electronic publication is performed. The method of receiving (or transmitting) an electronic publication may include, for example, connecting to a separate database (not shown) for storing the electronic publication and receiving the electronic publication therefrom, or to a storage medium such as a USB or an optical disk. There may be a method of receiving the electronic publication stored therein or a method of directly inputting any electronic publication from an administrator of the information generating apparatus 100, but is not limited thereto.
다음으로 전자 출판물을 구성하는 복수의 문장으로부터 주어와 동사를 각각 추출하는 단계(S200)가 수행된다. 이 단계(S200)에서는 먼저 전자 출판물을 구성하는 복수의 문장을 각각의 문장으로 분리한다. 이후 분리된 각각의 문장으로부터 주어와 동사를 추출한다. 이 때, 형태소 분석기를 이용하여 문장 내에서 주어와 동사를 구분할 수 있음은 전술한 바와 같다. 이후, 복수의 문장 중에서 주어와 동사가 각각 적어도 하나씩 포함된 문장을 선별한다. 즉, 일 실시예에서는 주어와 동사가 각각 적어도 하나씩 포함된 문장을 대상으로, 이러한 문장에 포함된 주어가 해당 전자 출판물에서의 등장 인물에 해당하는지 여부를 판단한다.Next, a step (S200) of extracting a subject and a verb from each of a plurality of sentences constituting the electronic publication is performed. In this step (S200), first, a plurality of sentences constituting the electronic publication are separated into respective sentences. The subject and verb are then extracted from each of the separated sentences. In this case, the subject and the verb may be distinguished in the sentence using the morpheme analyzer as described above. Subsequently, sentences including at least one of a subject and a verb are selected from the plurality of sentences. That is, in one embodiment, it is determined whether a subject included in at least one of the subject and the verb corresponds to a character in the electronic publication.
다음으로, 단계(S200)에서 선별된 문장에 대하여, 이러한 문장에 포함된 동사의 성질 정보를 획득하는 단계(S300)가 수행된다. 성질 정보는 도 2에 도시된 저장부(120)에 미리 저장되어 있으므로, 저장부(120)로부터 획득 가능하다. 이후, 획득된 성질 정보를 기초로 해당 동사가 사람을 주어로 하는 행위 동사인지 여부를 판단한다. 사람을 주어로 하는 행위 동사란, 행위의 주체가 사람인 동사를 의미함은 전술한 바와 같다.Next, with respect to the sentences selected in step S200, step S300 of obtaining property information of verbs included in such sentences is performed. Since the property information is previously stored in the storage unit 120 illustrated in FIG. 2, the property information may be obtained from the storage unit 120. Subsequently, it is determined whether the verb is an action verb based on the acquired property information. The action verb which has a human subject means the verb whose subject is a person as the above-mentioned.
이 때, 단계(S200)에서 추출된 주어가 저장부(120)에 저장된 제외 리스트에 포함되어 있는지를 체크하여, 추출된 주어가 제외 리스트에 포함되어 있으면, 인물 파악부(135)는 추출된 주어에 대해서는 등장 인물인지를 파악하는 과정(전술한 동사의 성질 정보를 참조하는 과정)을 수행하지 않은 채로 등장 인물에서 제외시킨다. 이를 통해서, 인물 파악부(135)는 모든 주어가 아닌 일부의 주어에 대해서만 등장 인물인지를 파악하는 과정을 수행할 수 있다. 따라서, 등장 인물을 파악하는데 소요되는 자원과 시간이 절약되도록 할 수 있다.At this time, it is checked whether the extracted subject in the step S200 is included in the exclusion list stored in the storage unit 120, and if the extracted subject is included in the exclusion list, the person identification unit 135 extracts the extracted subject. Is excluded from the character without performing the process of identifying whether or not it is a character (referring to the above-described verbal property information). Through this, the person grasping unit 135 may perform a process of identifying whether the person is a character for only some of the subjects instead of all subjects. Therefore, it is possible to save the resources and time required to identify the characters.
이후, 동사가 사람을 주어로 하는 행위 동사라고 판단되면, 이러한 동사와 관련된 주어를 전자 출판물에서의 등장 인물로 파악하는 단계(S400)가 수행된다.Subsequently, if it is determined that the verb is an action verb based on a person, a step (S400) of identifying a subject related to the verb as a character in the electronic publication is performed.
이를 기초로 살펴보면, 일 실시예에서는 인물 사전을 활용하지 않고도 동사의 성질 정보를 이용하여 전자 출판물의 등장 인물에 대한 정보를 추출할 수 있다. 따라서, 작가가 임의로 지은 등장 인물에 대한 명칭에 대해서도 등장 인물의 명칭으로 추출할 수 있다.Based on this, in one embodiment, information on the characters of an electronic publication may be extracted using property information of a verb without using a person dictionary. Therefore, the names of the characters randomly created by the artist can be extracted as the names of the characters.
다음으로, 등장 인물에 대한 정보를 생성하는 단계(S500)가 수행된다. 등장 인물에 대한 정보란 예를 들면, 등장 인물 중 비중을 상대적으로 많이 차지하는 주요 등장 인물을 나타내는 것임은 전술한 바와 같다.Next, an operation (S500) of generating information on the person is performed. For example, the information on the characters indicates the main characters who occupy a relatively large portion of the characters, as described above.
도 6을 참조하여 보다 구체적으로 살펴보면, 주요 등장 인물을 선정하기 위해서, 주어가 등장 인물로 파악되는 횟수를 기초로 주어별로 주요도를 계산한다(S510). 이 때, 정보 생성부(140)는 등장 인물로 파악될 때마다 더해지는 값에 가중치를 곱한 뒤, 가중치가 곱해진 값을 더하여 주요도를 산정할 수 있는데, 이 때의 가중치는 하나의 문장 내에 포함되는 주어의 개수가 많을수록 작아짐은 전술한 바와 같다. Looking in more detail with reference to Figure 6, in order to select the main character, the main figure is calculated for each subject based on the number of times the subject is identified as the character (S510). At this time, the information generating unit 140 may multiply the added value every time it is identified as a character, and then calculate the main degree by adding the multiplied weight value, wherein the weight is included in one sentence. As the number of subjects becomes larger, the smaller is as described above.
이후, 주요도를 기초로 등장 인물 중에서 주요 등장 인물을 선정한다(S520). Subsequently, a main character is selected from the characters based on the main degree (S520).
이상에서 살펴본 바와 같이, 일 실시예에 따르면 동사의 성질 정보를 이용하여 주어가 등장 인물인지 여부를 파악할 수 있다. 따라서, 인물 사전과 같은 고정적인 기준을 참조하지 않고도 보다 정확하게 전자 출판물로부터 등장 인물을 파악할 수 있다.As described above, according to an embodiment, whether or not the subject is a character may be determined using property information of a verb. Thus, it is possible to more accurately identify a person from an electronic publication without referring to fixed criteria such as a person dictionary.
아울러, 하나의 문장에 포함된 주어의 개수를 고려하여 가중치 및 이에 따른 주요도를 산정하고, 이러한 주요도를 기초로 등장 인물로부터 주요 등장 인물이 누구인지에 대한 정보를 생성함으로써, 단순하게 등장 인물의 등장 횟수만으로 주요 등장 인물을 선정하는 것보다 정확하게 주요 등장 인물을 선정할 수 있다.In addition, by considering the number of subjects included in one sentence, the weight and the corresponding main road are calculated, and based on the main road, information about who the main person is from the characters is generated, and the character is simply. It is possible to select the main characters more accurately than to select the main characters only by the number of appearances.
한편, 본 발명의 일 실시예에 따른 정보 생성 방법은 이러한 방법에 포함된 각 단계를 수행하도록 프로그램된 컴퓨터 기록매체에 저장된 컴퓨터 프로그램 또는 이러한 방법에 포함된 각 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독가능 기록매체로 구현될 수 있다.On the other hand, the information generating method according to an embodiment of the present invention includes a computer program stored in a computer recording medium programmed to perform each step included in the method or a program including instructions for performing each step included in the method. It may be implemented as a recorded computer readable recording medium.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.Combinations of each block of the block diagrams and respective steps of the flowcharts attached to the present invention may be performed by computer program instructions. These computer program instructions may be mounted on a processor of a general purpose computer, special purpose computer, or other programmable data processing equipment such that instructions executed through the processor of the computer or other programmable data processing equipment may not be included in each block or flowchart of the block diagram. It will create means for performing the functions described in each step. These computer program instructions may be stored in a computer usable or computer readable memory that can be directed to a computer or other programmable data processing equipment to implement functionality in a particular manner, and thus the computer usable or computer readable memory. It is also possible for the instructions stored in to produce an article of manufacture containing instruction means for performing the functions described in each block or flowchart of each step of the block diagram. Computer program instructions may also be mounted on a computer or other programmable data processing equipment, such that a series of operating steps may be performed on the computer or other programmable data processing equipment to create a computer-implemented process to create a computer or other programmable data. Instructions that perform processing equipment may also provide steps for performing the functions described in each block of the block diagram and in each step of the flowchart.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.In addition, each block or step may represent a portion of a module, segment or code that includes one or more executable instructions for executing a specified logical function (s). It should also be noted that in some alternative embodiments, the functions noted in the blocks or steps may occur out of order. For example, the two blocks or steps shown in succession may in fact be executed substantially concurrently or the blocks or steps may sometimes be performed in the reverse order, depending on the functionality involved.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 품질에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and those skilled in the art to which the present invention pertains may make various modifications and changes without departing from the essential quality of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be interpreted by the following claims, and all technical ideas that fall within the scope of equivalents should be construed as being included in the scope of the present invention.

Claims (16)

  1. 전자 출판물을 입력받는 입력부와,An input unit for receiving an electronic publication,
    동사의 성질을 나타내는 성질 정보를 복수 개의 동사 각각에 대하여 저장하는 저장부와,A storage unit for storing property information representing a property of a verb for each of a plurality of verbs;
    상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 문장 구조 파악부 및 상기 추출된 동사 각각의 성질 정보를 상기 저장부로부터 획득하며 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 인물 파악부를 포함하는 등장 인물 파악부와,A sentence structure grasping unit for extracting a subject and a verb from a plurality of sentences constituting the electronic publication, and property information of each of the extracted verbs is obtained from the storage unit, and the acquired property information is based on the obtained property information. A character grasping unit comprising a character grasping unit which grasps a subject related to a verb corresponding to the character as the character in the electronic publication;
    상기 파악된 등장 인물에 대한 정보를 생성하는 정보 생성부를 포함하는An information generator for generating information about the identified person,
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  2. 제 1 항에 있어서,The method of claim 1,
    상기 저장부에서,In the storage unit,
    동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 갖는Verbs that have the same or similar meanings have the same property information
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  3. 제 1 항에 있어서,The method of claim 1,
    상기 인물 파악부는,The person grasping unit,
    상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는If the acquired property information is property information related to a person's behavior, identifying a subject related to a verb corresponding to the obtained property information as a character in the electronic publication.
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  4. 제 1 항에 있어서,The method of claim 1,
    상기 문장 구조 파악부는 상기 복수 개의 문장 중에서 주어와 동사가 적어도 하나씩 추출되는 문장을 선별하고,The sentence structure determiner selects at least one sentence from which a subject and a verb are extracted from the plurality of sentences,
    상기 인물 파악부는,The person grasping unit,
    상기 선별된 문장에 포함된 동사의 성질 정보를 상기 저장부로부터 획득하며, 상기 획득된 성질 정보를 기초로 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는Acquiring property information of a verb included in the selected sentence from the storage unit, and recognizing a subject related to the verb corresponding to the acquired property information as a person in the electronic publication based on the acquired property information;
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  5. 제 1 항에 있어서,The method of claim 1,
    상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며,The storage unit stores an exclusion list having information on a subject to be excluded from the character,
    상기 인물 파악부는,The person grasping unit,
    상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하고, 상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물에서 제외시키는Check whether the extracted subject is included in the exclusion list, and if the extracted subject is included in the exclusion list, exclude the extracted subject from the character
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  6. 제 1 항에 있어서,The method of claim 1,
    상기 정보 생성부는,The information generation unit,
    상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하며, 상기 주요도가 상대적으로 높은 주어를 상기 등장 인물 중에서 주요한 주요 등장 인물로 선정하며, 상기 선정된 주요 등장 인물에 대한 정보를 상기 파악된 등장 인물에 대한 정보로써 생성하는Whenever the subject is identified as a character, a predetermined value is added to the main degree corresponding to the subject, a subject having a relatively high main degree is selected as the main main character among the characters, and the selected main Generating information on the character as information on the identified character
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  7. 제 6 항에 있어서,The method of claim 6,
    상기 주요도에 더해지는 수치는,The numerical value added to the said main figure,
    상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는In one sentence including the subject identified as the character, the more the number of subjects included in the one sentence has a relatively smaller value
    전자 출판물에 대한 정보 생성 장치.Device for generating information about electronic publications.
  8. 전자 출판물을 입력받는 단계와,Receiving an electronic publication;
    상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,Extracting a subject and a verb from each of a plurality of sentences constituting the electronic publication;
    상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,Obtaining property information of each of the extracted verbs from a storage for storing a plurality of verbs;
    상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,Identifying a subject associated with a verb corresponding to the acquired property information as a person in the electronic publication based on the obtained property information;
    상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 포함하는Generating information about the identified person;
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  9. 제 8 항에 있어서,The method of claim 8,
    상기 저장부에서,In the storage unit,
    동일 또는 유사한 뜻을 갖는 동사는 서로 간에 동일한 성질 정보를 갖는Verbs that have the same or similar meanings have the same property information
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  10. 제 8 항에 있어서,The method of claim 8,
    상기 등장 인물로 파악하는 단계는,The step of identifying as the character,
    상기 획득된 성질 정보가 사람의 행위와 관련된 성질 정보이면, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는If the acquired property information is property information related to a person's behavior, identifying a subject related to a verb corresponding to the obtained property information as a character in the electronic publication.
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  11. 제 8 항에 있어서,The method of claim 8,
    상기 성질 정보를 획득하는 단계와 상기 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와 상기 파악된 등장 인물에 대한 정보를 생성하는 단계는,Acquiring the property information, identifying the subject as a person in the electronic publication, and generating information about the identified person,
    상기 추출하는 단계에서, 상기 복수 개의 문장 중에서 주어와 동사를 각각 추출한 결과 주어와 동사가 적어도 하나씩 추출되면 수행되는In the extracting step, a result of extracting a subject and a verb from each of the plurality of sentences is performed when at least one of the subject and the verb is extracted.
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  12. 제 8 항에 있어서,The method of claim 8,
    상기 저장부는 등장 인물에서 제외되어야 하는 주어에 대한 정보를 갖는 제외 리스트를 저장하며,The storage unit stores an exclusion list having information on a subject to be excluded from the character,
    상기 등장 인물로 파악하는 단계는,The step of identifying as the character,
    상기 추출된 주어가 상기 제외 리스트에 포함되어 있는지를 체크하는 단계와,Checking whether the extracted subject is included in the exclusion list;
    상기 추출된 주어가 상기 제외 리스트에 포함되어 있으면 상기 추출된 주어는 상기 등장 인물에서 제외시키는 단계를 더 포함하는If the extracted subject is included in the exclusion list, further comprising: excluding the extracted subject from the character;
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  13. 제 8 항에 있어서,The method of claim 8,
    상기 정보를 생성하는 단계는,Generating the information,
    상기 주어가 등장 인물로 파악될 때마다 상기 주어에 상응하는 주요도에 소정의 수치를 더하는 단계와,Each time the subject is identified as a character, adding a predetermined value to a main degree corresponding to the subject;
    상기 주요도가 상대적으로 높은 주어를 주요 등장 인물로 선정하여, 상기 선정된 주요 등장 인물에 대한 정보를 상기 파악된 등장 인물에 대한 정보로써 생성하는 단계를 포함하는Selecting a subject having a relatively high majority as a main character, and generating information on the selected main character as information on the identified character;
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  14. 제 13 항에 있어서,The method of claim 13,
    상기 주요도에 소정의 수치를 더하는 단계는,Adding a predetermined value to the main diagram,
    상기 등장 인물로 파악되는 주어가 포함되는 하나의 문장에서, 상기 하나의 문장에 포함하는 주어의 개수가 많을수록 상대적으로 적은 값을 갖는 수치를 더하는In one sentence including the subject identified as the character, the larger the number of subjects included in the one sentence, the more numerical value having a relatively smaller value is added.
    전자 출판물에 대한 정보 생성 방법.How to generate information about electronic publications.
  15. 전자 출판물을 입력받는 단계와,Receiving an electronic publication;
    상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,Extracting a subject and a verb from each of a plurality of sentences constituting the electronic publication;
    상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,Obtaining property information of each of the extracted verbs from a storage for storing a plurality of verbs;
    상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,Identifying a subject associated with a verb corresponding to the acquired property information as a person in the electronic publication based on the obtained property information;
    상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하도록 프로그램된Programmed to perform the step of generating information about the identified person.
    컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.A computer program stored on a computer readable recording medium.
  16. 전자 출판물을 입력받는 단계와,Receiving an electronic publication;
    상기 전자 출판물을 구성하는 복수 개의 문장으로부터 주어와 동사를 각각 추출하는 단계와,Extracting a subject and a verb from each of a plurality of sentences constituting the electronic publication;
    상기 추출된 동사 각각의 성질 정보를, 복수 개의 동사 각각에 대하여 저장하는 저장부로부터 획득하는 단계와,Obtaining property information of each of the extracted verbs from a storage for storing a plurality of verbs;
    상기 획득된 성질 정보를 기초로, 상기 획득된 성질 정보에 대응되는 동사와 관련된 주어를 상기 전자 출판물에서의 등장 인물로 파악하는 단계와,Identifying a subject associated with a verb corresponding to the acquired property information as a person in the electronic publication based on the obtained property information;
    상기 파악된 등장 인물에 대한 정보를 생성하는 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 A program is recorded that includes a command to perform the step of generating information about the identified person.
    컴퓨터 판독가능 기록매체.Computer-readable recording medium.
PCT/KR2016/003347 2016-01-15 2016-03-31 Device and method for generating information on electronic publication WO2017122872A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160005235A KR101781597B1 (en) 2016-01-15 2016-01-15 Apparatus and method for creating information on electronic publication
KR10-2016-0005235 2016-01-15

Publications (1)

Publication Number Publication Date
WO2017122872A1 true WO2017122872A1 (en) 2017-07-20

Family

ID=59311700

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/003347 WO2017122872A1 (en) 2016-01-15 2016-03-31 Device and method for generating information on electronic publication

Country Status (2)

Country Link
KR (1) KR101781597B1 (en)
WO (1) WO2017122872A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036372B (en) * 2018-08-24 2021-10-08 科大讯飞股份有限公司 Voice broadcasting method, device and system
KR102339714B1 (en) * 2019-11-11 2021-12-14 한림대학교 산학협력단 Apparatus, method and program for extraction EMF frequency bandwidth information in research literature

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011892A (en) * 2005-07-01 2007-01-18 Nippon Telegr & Teleph Corp <Ntt> Vocabulary acquisition method and device, program, and storage medium storing program
JP2011165087A (en) * 2010-02-12 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> Important word extraction device, important word extraction method and important word extraction program
KR101255957B1 (en) * 2011-12-09 2013-04-24 포항공과대학교 산학협력단 Method and apparatus for tagging named entity
KR101265467B1 (en) * 2010-12-17 2013-05-16 한국과학기술원 Method for extracting experience and classifying verb in blog
KR101391599B1 (en) * 2007-09-05 2014-05-09 삼성전자주식회사 Method for generating an information of relation between characters in content and appratus therefor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011892A (en) * 2005-07-01 2007-01-18 Nippon Telegr & Teleph Corp <Ntt> Vocabulary acquisition method and device, program, and storage medium storing program
KR101391599B1 (en) * 2007-09-05 2014-05-09 삼성전자주식회사 Method for generating an information of relation between characters in content and appratus therefor
JP2011165087A (en) * 2010-02-12 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> Important word extraction device, important word extraction method and important word extraction program
KR101265467B1 (en) * 2010-12-17 2013-05-16 한국과학기술원 Method for extracting experience and classifying verb in blog
KR101255957B1 (en) * 2011-12-09 2013-04-24 포항공과대학교 산학협력단 Method and apparatus for tagging named entity

Also Published As

Publication number Publication date
KR101781597B1 (en) 2017-09-25
KR20170085736A (en) 2017-07-25

Similar Documents

Publication Publication Date Title
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
WO2013125286A1 (en) Non-factoid question answering system and computer program
WO2020262800A1 (en) System and method for automating natural language understanding (nlu) in skill development
US11635883B2 (en) Indication of content linked to text
WO2023279692A1 (en) Question-and-answer platform-based data processing method and apparatus, and related device
WO2023106855A1 (en) Method, system and non-transitory computer-readable recording medium for supporting writing assessment
WO2015099264A1 (en) Biological network analyzing device and method
WO2020111827A1 (en) Automatic profile generation server and method
WO2017122872A1 (en) Device and method for generating information on electronic publication
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
CN113889074A (en) Voice generation method, device, equipment and medium
WO2015037871A1 (en) System, server and terminal for providing voice playback service using text recognition
JP5876396B2 (en) Information collection program, information collection method, and information processing apparatus
CN108268602A (en) Analyze method, apparatus, equipment and the computer storage media of text topic point
WO2014148664A1 (en) Multi-language search system, multi-language search method, and image search system, based on meaning of word
WO2011049313A2 (en) Apparatus and method for processing documents to extract expressions and descriptions
WO2014021656A1 (en) System and method for pathway construction
CN115525750A (en) Robot phonetics detection visualization method and device, electronic equipment and storage medium
CN115113967A (en) Question feedback method and device, electronic equipment and storage medium
CN111859985B (en) AI customer service model test method and device, electronic equipment and storage medium
Ripoll et al. Multi-Lingual Contextual Hate Speech Detection Using Transformer-Based Ensembles
CN114722174A (en) Word extraction method and device, electronic equipment and storage medium
CN110378378B (en) Event retrieval method and device, computer equipment and storage medium
JP5877775B2 (en) Content management apparatus, content management system, content management method, program, and storage medium
KR20200096043A (en) Method and apparatus for blind processing of specific information in document

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16885184

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16885184

Country of ref document: EP

Kind code of ref document: A1