KR102189567B1 - System for writing electronic document by detecting key and corresponding value from sentence with multiple key - Google Patents

System for writing electronic document by detecting key and corresponding value from sentence with multiple key Download PDF

Info

Publication number
KR102189567B1
KR102189567B1 KR1020190035190A KR20190035190A KR102189567B1 KR 102189567 B1 KR102189567 B1 KR 102189567B1 KR 1020190035190 A KR1020190035190 A KR 1020190035190A KR 20190035190 A KR20190035190 A KR 20190035190A KR 102189567 B1 KR102189567 B1 KR 102189567B1
Authority
KR
South Korea
Prior art keywords
content data
data
electronic document
intention
question
Prior art date
Application number
KR1020190035190A
Other languages
Korean (ko)
Other versions
KR20200114079A (en
Inventor
박미경
송지훈
신성진
Original Assignee
주식회사 포시에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 포시에스 filed Critical 주식회사 포시에스
Priority to KR1020190035190A priority Critical patent/KR102189567B1/en
Publication of KR20200114079A publication Critical patent/KR20200114079A/en
Application granted granted Critical
Publication of KR102189567B1 publication Critical patent/KR102189567B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Abstract

다수의 의도가 포함된 문장으로부터 의도 및 의도에 대응되는 내용을 검출하는 전자문서 시스템이 개시되며, 본원의 일 실시예에 따른 전자문서 작성 방법은, 전자문서 기입 항목에 연계된 질문을 생성하는 단계, 상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신하는 단계, 상기 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출하는 단계, 상기 의도 데이터에 대응되는 원시 내용 데이터를 추출하는 단계, 상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 단계 및 상기 최종 내용 데이터를 전자문서 기입 항목에 입력하는 단계를 포함할 수 있다.An electronic document system is disclosed that detects an intention and a content corresponding to an intention from a sentence including a plurality of intentions, and the method of creating an electronic document according to an embodiment of the present application includes the steps of generating a question related to an electronic document entry item. , Transmitting the question to a user terminal and receiving a user input sentence including a response to the question, extracting intention data associated with an electronic document entry item from the user input sentence, corresponding to the intention data Extracting the original content data, obtaining final content data by processing the original content data, and inputting the final content data into an electronic document entry item.

Description

다수의 의도가 포함된 문장으로부터 의도 및 의도에 대응되는 내용을 검출하는 전자문서 시스템{SYSTEM FOR WRITING ELECTRONIC DOCUMENT BY DETECTING KEY AND CORRESPONDING VALUE FROM SENTENCE WITH MULTIPLE KEY}An electronic document system that detects the content corresponding to the intention and intention from sentences containing multiple intentions {SYSTEM FOR WRITING ELECTRONIC DOCUMENT BY DETECTING KEY AND CORRESPONDING VALUE FROM SENTENCE WITH MULTIPLE KEY}

본원은 다수의 의도가 포함된 문장으로부터 의도 및 의도에 대응되는 내용을 검출하는 전자문서 시스템에 관한 것이다.The present application relates to an electronic document system for detecting an intention and a content corresponding to the intention from a sentence including a plurality of intentions.

일반적으로 업무 영역에서 다양한 양식의 문서가 발생하게 되고, 이러한 문서들은 종래에는 종이에 인쇄된 형태로 작성되었다면, 최근 다양한 문서들을 전자적인 형태로 생성하는 전자 문서 및 전자 서명 서비스가 도입되어 활용되고 있으며, 정부의 페이퍼리스(Paperless) 정책과 맞물려 급속한 성장 추세를 보이고 있다.In general, various forms of documents are generated in the business area, and if these documents were prepared in the form of printed on paper in the past, electronic documents and electronic signature services that generate various documents in electronic form have been recently introduced and utilized. , It is showing a rapid growth trend in line with the government's paperless policy.

또한, 스마트 디바이스의 대중화에 따라 음성 기반 서비스를 이용하는 사용자 경험은 지속적으로 축적되어 왔다. 현재 음성 기반 서비스의 대부분은 개인의 일상 생활에 연계된 기능을 제공하고 있으며, 앞으로는 기업의 업무 영역에 까지 확장될 것으로 예상된다In addition, with the popularization of smart devices, user experiences using voice-based services have been continuously accumulated. Currently, most of the voice-based services provide functions related to daily life of individuals, and in the future, it is expected to expand to the business area of companies.

따라서, 음성 신호를 포함한 다양한 형태의 입력을 기초로 전자 문서를 생성하는 기술 및 시스템이나 음성 입력 등을 기초로 전자 문서를 제어 및 관리할 수 있는 기술 및 시스템 개발의 필요성이 증대되고 있다.Accordingly, there is an increasing need for a technology and a system for generating an electronic document based on various types of input including a voice signal, or a technology and a system capable of controlling and managing an electronic document based on a voice input.

더욱이, 질문과 질문에 대한 사용자의 답변을 기초로 문서를 작성하는 대화 기반의 종래의 문서 작성 서비스는 문서에 기입해야 할 항목이 많은 경우 사용자에게 개별 항목에 대하여 다수의 질문을 구성하고 이에 대한 답변을 여러 차례 수신해야하는 번거로움이 존재하므로, 문서 작성을 완료하는 데 소요되는 시간이 증가하는 등 사용자 편의성이 저하되는 단점이 존재한다. Moreover, the conversation-based conventional document creation service, which creates a document based on a user's answer to a question and a question, provides a user with a large number of questions for individual items and answers when there are many items to be filled in the document. Since there is a hassle of receiving multiple times, there is a disadvantage that user convenience is deteriorated, such as an increase in the time required to complete document creation.

본원의 배경이 되는 기술은 한국등록특허공보 제10-1372837호에 개시되어 있다.The technology behind the present application is disclosed in Korean Patent Publication No. 10-1372837.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 사용자의 음성 신호를 단순히 텍스트로 변환하는데 그치지 않고, 사용자가 입력한 문장으로부터 전자문서 작성에 연계된 의도(Key) 및 의도에 상응하는 내용(Value)을 추출하여, 템플릿에 기초하여 전자문서를 작성하는 장치 및 방법을 제공하려는 것을 목적으로 한다.The present application is intended to solve the problems of the prior art described above, and not only converts the user's voice signal into text, but also contents corresponding to the intention (Key) and intention linked to the electronic document creation from the sentence input by the user ( Value), and to provide an apparatus and method for creating an electronic document based on a template.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 대화 기반의 전자 문서 작성 서비스를 제공하는데 있어, 복수의 전자 문서 기입 항목과 연계된 질문을 구성하거나 여러 기입 항목에 대해 사용자가 선택적으로 대답할 수 있게 열린 형태의 질문을 구성하고, 해당 질문에 대한 사용자의 응답을 의도(Key) 및 의도에 상응하는 내용(Value) 단위로 추출하여, 복수개의 전자 문서 기입 항목을 동시에 입력할 수 있도록 구현하여, 대화 기반의 전자 문서 작성 서비스의 사용성을 높이려는 것을 목적으로 한다.The present application is to solve the problems of the prior art described above, and in providing a conversation-based electronic document creation service, a user can selectively answer a question related to a plurality of electronic document entry items or By constructing a question in an open form so that the user's response to the question is extracted in units of intent (Key) and content (Value) corresponding to the intent, it is implemented so that multiple electronic document entry items can be entered at the same time. It aims to increase the usability of the conversation-based electronic document creation service.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the embodiments of the present application is not limited to the technical problems as described above, and other technical problems may exist.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 사용자 입력 문장으로부터 전자문서를 작성하는 방법은, 전자문서 기입 항목에 연계된 질문을 생성하는 단계, 상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신하는 단계, 상기 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출하는 단계, 상기 의도 데이터에 대응되는 원시 내용 데이터를 추출하는 단계, 상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 단계 및 상기 최종 내용 데이터를 전자문서 기입 항목에 입력하는 단계를 포함할 수 있다.As a technical means for achieving the above technical problem, a method of creating an electronic document from a user input sentence according to an embodiment of the present application includes the steps of generating a question related to an electronic document entry item, and sending the question to a user terminal. Transmitting and receiving a user input sentence including a response to the question, extracting intention data associated with the electronic document entry item from the user input sentence, extracting raw content data corresponding to the intention data It may include processing the original content data to obtain final content data, and inputting the final content data to an electronic document entry item.

또한, 상기 최종 내용 데이터를 획득하는 단계는, 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리하는 단계, 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행하는 단계 및 상기 형태소 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지하는 단계를 포함할 수 있다.In addition, the obtaining of the final content data includes determining and processing whether the first segment of the original content data is a survey, performing a morpheme analysis on the last segment of the original content data, and a result of the morpheme analysis It may include the step of detecting a real morpheme by searching in the reverse direction.

또한, 상기 최종 내용 데이터를 획득하는 단계는, 상기 탐지된 실질 형태소가 명사 형태가 아닌 경우, 상기 탐지된 실질 형태소를 명사 형태로 변환하는 단계를 포함할 수 있다.Further, the obtaining of the final content data may include converting the detected real morpheme into a noun form when the detected real morpheme is not a noun form.

또한, 상기 사용자 입력 문장은, 음성 입력 또는 입력 장치 화면 상에 구비된 대화 창에 텍스트를 기입하는 방식으로 입력된 대화형 입력의 형태로 입력될 수 있다.In addition, the user input sentence may be input in the form of a voice input or an interactive input input by writing a text in a chat window provided on the screen of the input device.

또한, 상기 의도 데이터는, 전자문서의 서식에 기초하여 결정될 수 있다.In addition, the intention data may be determined based on the format of the electronic document.

또한, 상기 의도 데이터를 추출하는 단계는, 상기 사용자 입력 문장에서 상기 전자문서 기입 항목과의 유사도가 소정 이상인 부분을 추출하는 것일 수 있다.In addition, the extracting the intention data may include extracting a portion of the user input sentence having a degree of similarity with the electronic document entry item greater than or equal to a predetermined value.

또한, 상기 의도 데이터가 시작되는 지점은, 레벤슈타인 편집 거리 알고리즘(Levenshtein Edit Distance Algorithm) 을 통해 의도 데이터의 예상 위치를 특정하고, 상기 예상 위치를 하나씩 순차적으로 옮겨가며 상기 전자문서 기입 항목과 상기 의도 데이터로 추정되는 부분 간의 편집 거리를 계산하여, 상기 편집 거리가 최소가 되는 지점을 상기 의도 데이터가 시작되는 지점으로 결정하는 방식으로 도출될 수 있다. In addition, the point at which the intention data starts is specified by a Levenshtein Edit Distance Algorithm to specify the expected position of the intention data, and the expected positions are sequentially moved one by one, and the electronic document entry item and the intention It may be derived by calculating an edit distance between portions estimated as data, and determining a point at which the edit distance is minimum as a point at which the intention data starts.

또한, 상기 원시 내용 데이터를 추출하는 단계는, 상기 사용자 입력 문장 중 N번째 의도 데이터의 종료 지점부터 (N+1)번째 의도 데이터의 시작 지점 전까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출하는 것일 수 있다.In addition, the extracting of the original content data may include a portion of the user input sentence from the end point of the N-th intention data to the start point of the (N+1)-th intention data, and the original content corresponding to the N-th intention data. It may be extracting data.

또한, 상기 원시 내용 데이터를 추출하는 단계는, 상기 사용자 입력 문장 중 N번째 의도 데이터가 마지막 의도 데이터인 경우 상기 N번째 의도 데이터의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출하는 것일 수 있다.In addition, the extracting of the original content data may include, if the Nth intention data among the user input sentences is the last intention data, a portion from the end point of the Nth intention data to the end of the user input sentence is the Nth intention. It may be extracted as raw content data corresponding to the data.

또한, 상기 질문은 상기 의도 데이터를 포함하는 제1타입 질문 및 상기 의도 데이터를 미포함하는 제2타입 질문을 포함할 수 있다.Also, the question may include a first type question including the intention data and a second type question not including the intention data.

또한, 본원의 일 실시예에 따른 전자문서 작성 방법은, 상기 질문이 제1타입 질문인 경우, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단하는 최종 내용 데이터 검증 단계를 포함할 수 있다.In addition, in the electronic document creation method according to an embodiment of the present disclosure, when the question is a first type question, whether the final content data corresponds to all of the intention data included in the question and whether the final content data is appropriately It may include a final content data verification step of determining whether or not it is determined.

또한, 상기 최종 내용 데이터 검증 결과, 상기 최종 내용 데이터가 상기 질문에 포함된 상기 의도 데이터 중 일부에 대응되지 않는 경우, 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성할 수 있다.Further, as a result of verifying the final content data, if the final content data does not correspond to some of the intention data included in the question, a question associated with the electronic document entry item may be generated based on the missing intention data. have.

또한, 상기 최종 내용 데이터 검증 결과, 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 해당 의도 데이터와 연계된 질문을 재차 생성할 수 있다.In addition, as a result of verifying the final content data, when the final content data is not appropriately determined according to the intention data, a question associated with the corresponding intention data may be generated again.

또한, 상기 의도 데이터는 예외적 의도 데이터를 포함할 수 있고, 상기 예외적 의도 데이터는 상기 전자문서의 서식에 기초하여 결정된 전체 의도 데이터에서 상기 사용자 입력 문장에 포함된 상기 예외적 의도 데이터 이외의 의도 데이터를 제외한 나머지 의도 데이터를 포괄할 수 있다.In addition, the intention data may include exceptional intention data, and the exceptional intention data excludes intention data other than the exceptional intention data included in the user input sentence from the total intention data determined based on the format of the electronic document. The rest of the intent data can be covered.

또한, 상기 예외적 의도 데이터는 '이외, 나머지, 다른 것' 등을 포함하며, 의도 데이터를 직접적으로 지칭하는 것이 아니라, 사용자가 앞서 언급한 의도 데이터를 제외한 나머지 의도 데이터를 지칭하기 위하여 사용한 부분을 의미할 수 있다.In addition, the exceptional intention data includes'others, rest, other', etc., and does not directly refer to intention data, but refers to a portion used by the user to refer to the rest of the intention data excluding the previously mentioned intention data. can do.

또한, 본원의 일 실시예에 따른 전자문서 작성 방법은, 상기 예외적 의도 데이터가 추출된 경우, 상기 예외적 의도 데이터에 대응되는 최종 내용 데이터를 전자문서 기입 항목에 입력할지 여부를 판단하는 단계를 포함할 수 있다.In addition, the electronic document creation method according to an embodiment of the present application, when the exceptional intention data is extracted, includes determining whether to input final content data corresponding to the exceptional intention data into the electronic document entry item. I can.

또한, 본원의 일 실시예에 따른 전자문서 작성 방법은, 상기 의도 데이터에 대응되는 원시 내용 데이터가 복수개인 경우, 상기 복수의 원시 내용 데이터 중 상기 예외적 의도 데이터를 포함하거나 공백으로 이루어진 원시 내용 데이터를 삭제하는 단계를 포함할 수 있다.In addition, in the electronic document creation method according to an embodiment of the present application, when there are a plurality of raw content data corresponding to the intention data, the raw content data including the exceptional intention data or consisting of blanks among the plurality of raw content data It may include the step of deleting.

한편, 본원의 일 실시예에 따른 사용자 입력 문장으로부터 전자문서를 작성하는 장치는, 전자문서 기입 항목에 연계된 질문을 생성하는 질문 생성부, 상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신하는 입출력부, 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출하는 의도 데이터 검출부, 상기 의도 데이터에 대응되는 원시 내용 데이터를 추출하는 내용 데이터 검출부, 상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 내용 데이터 처리부 및 상기 최종 내용 데이터를 전자문서 기입 항목에 입력하는 전자문서 작성부를 포함할 수 있다.Meanwhile, the apparatus for creating an electronic document from a user input sentence according to an embodiment of the present application includes a question generator that generates a question related to an electronic document entry item, transmits the question to the user terminal, and responds to the question. An input/output unit for receiving a user input sentence including, an intention data detection unit for extracting intention data associated with an electronic document entry item from the user input sentence, a content data detection unit for extracting raw content data corresponding to the intention data, A content data processing unit that processes the content data to obtain final content data, and an electronic document creation unit that inputs the final content data into an electronic document entry item.

또한, 상기 내용 데이터 처리부는, 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리하는 조사 처리부, 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행하고, 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지하는 형태소 분석부 및 상기 탐지된 실질 형태소를 명사 형태로 변환하는 형 변환부를 포함할 수 있다.In addition, the content data processing unit includes an investigation processing unit that determines and processes whether the first segment of the original content data is an investigation, performs morpheme analysis on the last segment of the original content data, and searches the analysis result in a reverse direction to actually A morpheme analysis unit that detects morphemes and a type conversion unit that converts the detected real morphemes into a noun form may be included.

또한, 상기 사용자 단말은, 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함할 수 있다.In addition, the user terminal may include a voice recognition terminal capable of recognizing a user's voice and an interactive terminal capable of inputting the user input sentence through a separate input device.

또한, 상기 입출력부는, 상기 사용자 단말이 상기 음성 인식 단말인 경우, 전자문서 작성과 연계된 정보를 음성 형태로 출력할 수 있고, 상기 사용자 단말이 상기 대화형 단말인 경우, 전자문서 작성과 연계된 정보를 상기 대화형 단말의 디스플레이 상에 구비된 대화 창에 텍스트 형태로 출력할 수 있다.In addition, when the user terminal is the voice recognition terminal, the input/output unit may output information related to electronic document creation in a voice format, and when the user terminal is the interactive terminal, Information may be output in text form on a chat window provided on the display of the interactive terminal.

또한, 상기 질문 생성부는, 상기 의도 데이터를 포함하는 제1타입 질문을 생성하거나 상기 의도 데이터를 미포함하는 제2타입 질문을 생성할 수 있다.In addition, the question generator may generate a first type question including the intention data or a second type question that does not include the intention data.

또한, 본원의 일 실시예에 따른 전자문서 작성 장치는, 상기 질문 생성부가 생성한 질문이 상기 제1타입 질문인 경우, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단하는 최종 내용 데이터 검증부를 포함할 수 있다.In addition, when the question generated by the question generator is the first type question, the electronic document creation apparatus according to an exemplary embodiment of the present application includes whether the final content data corresponds to all intention data included in the question, and the It may include a final content data verification unit that determines whether the final content data is appropriately determined according to the intention data.

또한, 상기 질문 생성부는, 상기 최종 내용 데이터 검증부의 검증 결과, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 중 일부에 대응되지 않는 경우, 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성할 수 있다. In addition, if the final content data does not correspond to some of the intention data included in the question as a result of the verification of the final content data verification unit, the question generator is linked to the electronic document entry item based on the missing intention data. Created questions.

또한, 상기 질문 생성부는, 상기 최종 내용 데이터 검증부의 검증 결과, 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 해당 의도 데이터와 연계된 질문을 재차 생성할 수 있다.In addition, when the final content data is not appropriately determined according to the intention data as a result of the verification of the final content data verification unit, the question generator may regenerate a question associated with the corresponding intention data.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary and should not be construed as limiting the present application. In addition to the above-described exemplary embodiments, additional embodiments may exist in the drawings and detailed description of the invention.

전술한 본원의 과제 해결 수단에 의하면, 사용자의 음성 신호를 단순 문자로 변환하는데 그치지 않고, 사용자가 입력한 문장으로부터 전자문서 작성에 연계된 의도(Key) 및 의도에 상응하는 내용(Value)을 추출함으로써, 템플릿에 기초하여 전자문서를 작성하는 장치 및 방법이 제공되는 효과가 있다.According to the above-described problem solving means of the present application, not only converting the user's voice signal into simple text, but also extracting the intention (Key) associated with the electronic document creation and the content (Value) corresponding to the intention from the sentence entered by the user. By doing so, there is an effect that an apparatus and method for creating an electronic document based on a template are provided.

전술한 본원의 과제 해결 수단에 의하면, 정형화된 템플릿을 기초로 전자 문서 작성이 가능하고, 전자 문서에 입력되는 항목들이 사전 정의될 수 있으며, 음성 등 다양한 입력 방식을 통한 간단한 전자문서 작성 및 처리가 가능함으로써 업무 생산성이 증대되는 효과가 있다.According to the above-described problem solving means of the present application, it is possible to create an electronic document based on a standardized template, items to be input to the electronic document can be predefined, and simple electronic document creation and processing through various input methods such as voice is possible. As it is possible, there is an effect of increasing work productivity.

다만, 본원에서 얻을 수 있는 효과는 상기된 바와 같은 효과들로 한정되지 않으며, 또 다른 효과들이 존재할 수 있다.However, the effect obtainable in the present application is not limited to the effects as described above, and other effects may exist.

도1은 본원의 일 실시예에 따른 전자문서 작성 장치의 구성을 도시한 도면이다.
도2는 전자문서 내에 존재하는 의도 데이터를 설명하기 위한 도면이다.
도3은 본원의 일 실시예에 따른 전자문서 작성 장치에 인가되는 사용자 입력의 유형을 설명하기 위한 도면이다.
도4는 사용자 입력 문장에서 의도 데이터를 추출하는 과정을 설명하기 위한 도면이다.
도5은 사용자 입력 문장에서 원시적 내용 데이터를 추출하는 과정을 설명하기 위한 도면이다.
도6은 본원의 일 실시예에 따른 내용 데이터 처리부의 세부 구성을 도시한 도면이다.
도7은 본원의 일 실시예에 따른 전자문서 작성부가 최종 내용 데이터를 전자문서 기입 항목에 입력하는 과정을 설명하기 위한 도면이다.
도8은 본원의 일 실시예에 따른 전자문서 작성 방법의 동작 흐름도이다.
도9는 본원의 일 실시예에 따른 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 단계를 세분화한 동작 흐름도이다.
1 is a diagram showing the configuration of an electronic document creation apparatus according to an embodiment of the present application.
2 is a diagram for explaining intention data existing in an electronic document.
3 is a diagram illustrating a type of user input applied to an electronic document creation apparatus according to an embodiment of the present application.
4 is a diagram for describing a process of extracting intention data from a user input sentence.
5 is a diagram illustrating a process of extracting primitive content data from a user input sentence.
6 is a diagram showing a detailed configuration of a content data processing unit according to an embodiment of the present application.
7 is a view for explaining a process of inputting final content data into an electronic document entry item by an electronic document creation unit according to an embodiment of the present application.
8 is a flowchart illustrating an electronic document writing method according to an embodiment of the present application.
9 is a flowchart illustrating a detailed operation of obtaining final content data by processing raw content data according to an embodiment of the present application.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, exemplary embodiments of the present application will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art may easily implement the present application. However, the present application may be implemented in various different forms and is not limited to the embodiments described herein. In addition, in the drawings, parts not related to the description are omitted in order to clearly describe the present application, and similar reference numerals are attached to similar parts throughout the specification.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다. Throughout the present specification, when a part is said to be "connected" with another part, it is not only "directly connected", but also "electrically connected" or "indirectly connected" with another element interposed therebetween. "Including the case.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.Throughout this specification, when a member is positioned "on", "upper", "upper", "under", "lower", and "lower" of another member, this means that a member is located on another member. It includes not only the case where they are in contact but also the case where another member exists between the two members.

본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification of the present application, when a certain part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.

도1은 본원의 일 실시예에 따른 전자문서 작성 장치의 구성을 도시한 도면이다.1 is a diagram showing the configuration of an electronic document creation apparatus according to an embodiment of the present application.

도1을 참조하면, 본원의 일 실시예에 따른 전자문서 작성 장치(100)는, 질문 생성부(110), 입출력부(120), 의도 데이터 검출부(130), 내용 데이터 검출부(140), 내용 데이터 처리부(150), 최종 내용 데이터 검증부(160) 및 전자문서 작성부(170)를 포함할 수 있다.Referring to FIG. 1, an electronic document creation apparatus 100 according to an embodiment of the present application includes a question generator 110, an input/output unit 120, an intention data detector 130, a content data detector 140, and a content A data processing unit 150, a final content data verification unit 160, and an electronic document creation unit 170 may be included.

질문 생성부(110)는, 전자문서 기입 항목에 연계된 질문을 생성할 수 있다.The question generator 110 may generate a question related to an electronic document entry item.

또한, 상기 질문은 의도 데이터를 포함하는 제1타입 질문 및 상기 의도 데이터를 미포함하는 제2타입 질문을 포함할 수 있다.Also, the question may include a first type question including intention data and a second type question not including the intention data.

또한, 상기 의도 데이터는 전자문서의 서식에 기초하여 결정될 수 있다.Also, the intention data may be determined based on the format of the electronic document.

구체적으로, 상기 의도 데이터는 하나의 전자문서가 완성되기 위하여 전자문서 상에 사용자가 입력해야 하는 기입 항목과 연계될 수 있다.Specifically, the intention data may be associated with entry items that a user must input on an electronic document in order to complete one electronic document.

도2는 전자문서 내에 존재하는 의도 데이터를 설명하기 위한 도면이다.2 is a diagram for explaining intention data existing in an electronic document.

도2의 (a)를 참조하면, 본원의 일 실시예에 따른 상기 의도 데이터는 휴가 신청서를 완성하기 위하여 사용자가 입력해야 하는 '(휴가) 일시, (휴가) 구분, (휴가) 사유'를 포함할 수 있다.Referring to Figure 2 (a), the intention data according to an embodiment of the present application includes'(vacation) date and time, (vacation) classification, (vacation) reason' that the user must input in order to complete a vacation application. can do.

도2의 (b)를 참조하면, 본원의 다른 실시예에 따른 상기 의도 데이터는 해빙기 건설공사 등 안전점검표의 전자문서 서식에서 2) 절토부와 관련하여 '인장균열, 침하, 지하수 용출, 낙석'을 포함할 수 있다.2(b), the intention data according to another embodiment of the present application is in the form of an electronic document for safety checklists such as sea ice construction work, etc. 2)'tensile cracks, subsidence, groundwater elution, rockfall' in relation to the cut section. It may include.

이 때, 본원의 일 실시예에 따르면, 상기 제1타입 질문은 '휴가 구분과 휴가 사유를 알려주세요.'와 같이 본원의 일 실시예에 따른 상기 의도 데이터 '휴가 구분' 및 '휴가 사유'를 질문 내에 직접적으로 포함하는 형태의 질문을 의미할 수 있다.At this time, according to an embodiment of the present application, the first type question is the intention data'vacation classification' and'vacation reason' according to an embodiment of the present application, such as'Please tell me the vacation classification and the reason for the vacation.' It can refer to a type of question that is directly included in the question.

또한, 본원의 다른 실시예에 따르면, 상기 제2타입 질문은 '절토부의 상태를 알려주세요.'와 같이 본원의 다른 실시예에 따른 상기 의도 데이터 '인장균열, 침하, 지하수 용출, 낙석'을 직접적으로 포함하지 않으면서 이를 포괄하는 형태의 질문을 의미할 수 있다.In addition, according to another embodiment of the present application, the second type question directly refers to the intention data'tensile crack, subsidence, groundwater elution, rockfall' according to another embodiment of the present application, such as'Please tell me the state of the cut section.' It may mean a question in a form that encompasses it without including it.

또한, 전자문서 작성 과정에서 사용자에게 묻는 질문의 수가 많으면, 문서 작성이 완료되는 데 걸리는 시간이 길어질 수 있으므로, 질문 생성부(110)가 둘 이상의 기입 항목을 포괄하는 질문을 생성하는 것이 바람직하나 이에 한정되는 것은 아니다.In addition, if the number of questions to be asked to the user during the electronic document creation process is large, the time it takes for the document to be completed may be lengthened, so it is preferable that the question generator 110 generates a question that includes more than one entry item. It is not limited.

도3은 본원의 일 실시예에 따른 전자문서 작성 장치에 인가되는 사용자 입력의 유형을 설명하기 위한 도면이다.3 is a diagram illustrating a type of user input applied to an electronic document creation apparatus according to an embodiment of the present application.

도3을 참조하면, 본원의 일 실시예에 따른 전자문서 작성 장치(100)는 (a)와 같이 스마트 스피커(Smart Speaker), 스마트 가전(Smart Appliances), 웨어러블 장치(Wearable Device) 등 음성 인식 기능을 지원하는 사용자 단말(11)을 통해 사용자가 육성으로 말한 문장을 상기 사용자 입력으로 하는 음성 입력 형태로 상기 사용자 입력을 수신할 수 있다.Referring to FIG. 3, the electronic document writing apparatus 100 according to an embodiment of the present application has a voice recognition function such as a smart speaker, a smart appliance, a wearable device, as shown in (a). The user input may be received in the form of a voice input in which a sentence spoken by the user as the user's input is used as the user input through the user terminal 11 supporting the user.

또한, (b)와 같이 사용자가 태플릿 PC, 스마트폰 등의 사용자 단말(12), 노트북, PC등과 연결된 키보드(13) 등의 별도의 입력 장치를 통해 타이핑한 문장을 상기 사용자 입력으로 하는 대화형 입력 형태로 상기 사용자 입력을 수신할 수 있다.In addition, as shown in (b), a dialogue in which the user inputs a sentence typed through a separate input device such as a user terminal 12 such as a tablet PC or a smartphone, and a keyboard 13 connected to a laptop or PC. The user input may be received in the form of a type input.

입출력부(120)는, 질문 생성부(110)가 생성한 상기 질문을 사용자 단말에 전송할 수 있다.The input/output unit 120 may transmit the question generated by the question generator 110 to the user terminal.

예시적으로, 입출력부(120)는 상기 질문을 상기 음성 입력에 대응되도록 음성 형태로 구현하여 상기 사용자 단말에 전달할 수 있다.For example, the input/output unit 120 may implement the question in a voice format to correspond to the voice input and transmit it to the user terminal.

또한, 입출력부(120)는 상기 질문은 상기 대화형 입력에 대응되도록 대화창에 텍스트 형태로 구현하여 상기 사용자 단말에 전달할 수 있다.In addition, the input/output unit 120 may implement the question in a text format in a chat window so as to correspond to the interactive input and transmit the question to the user terminal.

다만, 이는 예시적 기재일 뿐, 상기 사용자 입력의 유형과 무관하게 상기 사용자 단말의 제약 조건을 고려하여, 다양한 유형으로 상기 질문을 상기 사용자 단말에 전달할 수 있다. However, this is only an exemplary description, and the question can be transmitted to the user terminal in various types, taking into account the constraints of the user terminal irrespective of the type of the user input.

구체적으로, 상기 사용자 단말에 사용자의 음성을 인식할 수 있는 구성이 구비되어 있으나, 음성 신호 형태의 출력이 불가능한 경우, 음성 입력 형태로 사용자 입력을 수신 받고, 상기 질문은 텍스트 형태로 사용자에게 전달될 수 있다.Specifically, when the user terminal is equipped with a configuration capable of recognizing the user's voice, but when output in the form of a voice signal is not possible, a user input is received in the form of a voice input, and the question is transmitted to the user in a text form. I can.

또한, 전술한 입출력부(120)의 질문 전달 방식은 사용자의 요청에 따라 결정되는 형태로 구현될 수도 있다.In addition, the above-described method of transmitting a question by the input/output unit 120 may be implemented in a form determined according to a user's request.

또한, 상기 사용자 단말은 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함할 수 있다.In addition, the user terminal may include a speech recognition terminal capable of recognizing a user's voice and an interactive terminal through which the user can input the user input sentence through a separate input device.

예를 들면, 상기 사용자 단말은, 스마트폰(Smartphone), 스마트패드(SmartPad), 태블릿 PC등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 유/무선 통신 장치를 포함할 수 있다.For example, the user terminal, a smartphone (Smartphone), a smart pad (SmartPad), a tablet PC, etc. and PCS (Personal Communication System), GSM (Global System for Mobile communication), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet) It can include all types of wired/wireless communication devices.

특히, 상기 사용자 단말은, 스마트 스피커(Smart Speaker), 스마트 카(Smart Car), 스마트 가전(Smart Appliances), 웨어러블 장치(Wearable Device) 증강현실기기 (VR/MR) 등 새롭게 생겨나는 각종 통신기술을 이용한 다양한 음향기기, 구동기기 등을 포함할 수 있다.In particular, the user terminal is a smart speaker (Smart Speaker), Smart Car (Smart Car), Smart Appliances (Smart Appliances), wearable devices (Wearable Device) augmented reality devices (VR/MR), etc. It may include a variety of used acoustic devices, driving devices, and the like.

입출력부(120)는, 상기 질문에 대한 사용자의 응답을 포함하는 사용자 입력 문장을 상기 사용자 단말로부터 수신할 수 있다.The input/output unit 120 may receive a user input sentence including a user's response to the question from the user terminal.

또한, 상기 사용자 입력 문장은 음성 입력 또는 입력 장치 화면 상에 구비된 대화 창에 텍스트를 기입하는 방식으로 입력된 대화형 입력의 형태로 입력될 수 있다.In addition, the user input sentence may be input in the form of a voice input or an interactive input input by writing text in a chat window provided on the screen of the input device.

또한, 입출력부(120)는, 상기 사용자 단말이 상기 음성 인식 단말인 경우, 전자문서 작성과 연계된 정보를 음성 형태로 출력할 수 있다.In addition, when the user terminal is the voice recognition terminal, the input/output unit 120 may output information related to electronic document creation in a voice format.

또한, 입출력부(120)는, 상기 사용자 단말이 상기 대화형 단말인 경우, 전자문서 작성과 연계된 정보를 상기 대화형 단말의 디스플레이 상에 구비된 대화 창에 텍스트 형태로 출력할 수 있다.In addition, when the user terminal is the interactive terminal, the input/output unit 120 may output information related to electronic document creation in a text format to a chat window provided on the display of the interactive terminal.

의도 데이터 검출부(130)는, 상기 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출할 수 있다.The intention data detection unit 130 may extract intention data associated with the electronic document entry item from the user input sentence.

또한, 의도 데이터 검출부(130)는, 상기 사용자 입력 문장에서 상기 전자문서 기입 항목과의 유사도가 소정 이상인 부분을 추출할 수 있다.In addition, the intention data detection unit 130 may extract a portion of the user input sentence having a degree of similarity with the electronic document entry item greater than or equal to a predetermined value.

또한, 본원의 일 실시예에 따르면, 의도 데이터 검출부(130)는 상기 의도 데이터가 시작되는 지점을 결정하기 위하여, 레벤슈타인 편집 거리 알고리즘을 활용할 수 있으며, 상기 알고리즘을 통해 의도 데이터의 예상 위치를 특정하고, 상기 예상 위치를 하나씩 순차적으로 옮겨가며 상기 전자문서 기입 항목과 상기 의도 데이터로 추정되는 부분 간의 편집 거리를 계산하여, 상기 편집 거리가 최소가 되는 지점을 상기 의도 데이터가 시작되는 지점으로 결정할 수 있다.In addition, according to an embodiment of the present application, the intention data detection unit 130 may utilize a Levenstein edit distance algorithm to determine a point at which the intention data starts, and specify an expected position of the intention data through the algorithm. And, by sequentially moving the predicted positions one by one and calculating the edit distance between the electronic document entry item and the part estimated as the intention data, a point at which the edit distance is minimum may be determined as a point at which the intention data starts. have.

도4는 사용자 입력 문장에서 의도 데이터를 추출하는 과정을 설명하기 위한 도면이다.4 is a diagram illustrating a process of extracting intention data from a user input sentence.

도4의 (a)를 참조하면, 본원의 일 실시예에 따른 상기 사용자 입력 문장은 "휴가 구분은 연차 휴가이고, 휴가 사유는 결혼식이야." 가 될 수 있다.Referring to FIG. 4A, the user input sentence according to an embodiment of the present application is "The vacation category is an annual vacation, and the vacation reason is a wedding." Can be.

도4의 (b)를 참조하면, 본원의 다른 실시예에 따른 상기 사용자 입력 문장은 "지하수 용출 발생했고, 지하수 용출 이외는 이상 없음."이 될 수 있다.Referring to (b) of FIG. 4, the user input sentence according to another embodiment of the present application may be "groundwater elution has occurred, and there is no abnormality other than groundwater elution."

본원의 일 실시예에 따르면(도4의 a), 의도 데이터 검출부(130)는 본원의 일 실시예에 따른 상기 사용자 입력 문장으로부터 휴가 신청서 전자문서 서식에 기초하여 결정된 본원의 일 실시예에 따른 의도 데이터인 '휴가 일시, 휴가 구분, 휴가 사유'와 유사한 부분을 추출할 수 있다.According to an embodiment of the present application (Fig. 4a), the intention data detection unit 130 is determined based on the form of the vacation application electronic document from the user input sentence according to an embodiment of the present application. The data similar to'vacation date/time, vacation classification, vacation reason' can be extracted.

본원의 일 실시예에 따르면, 1번째 의도 데이터 '휴가 구분'은 상기 사용자 입력 문장에서 붉은 색으로 표시된 문장 시작 부분에서 추출될 수 있다. (의도 데이터 ①)According to the exemplary embodiment of the present application, the first intention data'vacation classification' may be extracted from the beginning of the sentence indicated in red in the user input sentence. (Intentional data ①)

본원의 일 실시예에 따르면, 2번째 의도 데이터 '휴가 사유'는 상기 사용자 입력 문장에서 푸른 색으로 표시된 문장 중간 부분에서 추출될 수 있다. (의도 데이터 ②)According to an exemplary embodiment of the present disclosure, the second intention data'reason for vacation' may be extracted from the middle portion of the sentence displayed in blue color in the user input sentence. (Intentional data ②)

본원의 다른 실시예에 따르면(도4의 b), 의도 데이터 검출부(130)는 본원의 다른 실시예에 따른 상기 사용자 입력 문장으로부터 해빙기 건설공사 등 안전점검표 전자문서 서식에 기초하여 2) 절토부의 기입 항목에 연계되어 결정된 본원의 다른 실시예에 따른 의도 데이터인 '인장균열, 침하, 지하수 용출, 낙석'과 유사한 부분을 추출할 수 있다.According to another embodiment of the present application (Fig. 4b), the intention data detection unit 130 is based on the electronic document form of the safety checklist, such as sea ice construction work, from the user input sentence according to another embodiment of the present application. It is possible to extract a portion similar to'tensile crack, subsidence, groundwater elution, rockfall', which is the intention data according to another embodiment of the present application determined in connection with the item.

또한, 상기 의도 데이터는 예외적 의도 데이터를 포함할 수 있다.Also, the intention data may include exceptional intention data.

예시적으로, 상기 예외적 의도 데이터는 '이외, 나머지, 다른 것' 등을 포함하며, 의도 데이터를 직접적으로 지칭하는 것이 아니라, 사용자가 앞서 언급한 의도 데이터를 제외한 나머지 의도 데이터를 지칭하기 위하여 사용한 부분을 의미할 수 있다.Illustratively, the exceptional intention data includes'others, rest, other', etc., and does not directly refer to intention data, but a portion used by the user to refer to the rest of the intention data excluding the previously mentioned intention data. Can mean

구체적으로, 상기 예외적 의도 데이터는, 상기 전자문서의 서식에 기초하여 결정된 전체 의도 데이터에서 상기 사용자 입력 문장에 포함된 상기 예외적 의도 데이터 이외의 의도 데이터를 제외한 나머지 의도 데이터를 포괄할 수 있다.Specifically, the exceptional intention data may include the remaining intention data excluding intention data other than the exceptional intention data included in the user input sentence from the entire intention data determined based on the format of the electronic document.

본원의 다른 실시예에 따르면, 1번째 의도 데이터 및 2번째 의도 데이터 '지하수 용출'은 상기 사용자 입력 문장에서 붉은 색으로 표시된 문장 시작 부분 및 문장 중간 부분에서 추출될 수 있다. (의도 데이터 ① 및 의도 데이터 ②)According to another embodiment of the present application, the first intention data and the second intention data'groundwater elution' may be extracted from the beginning of the sentence and the middle of the sentence indicated in red in the user input sentence. (Intent data ① and intention data ②)

본원의 다른 실시예에 따르면, 예외적 의도 데이터(3번째 의도 데이터) '이외'는 상기 사용자 입력 문장에서 푸른 색으로 표시된 2번째 '지하수 용출' 다음 부분에서 추출될 수 있다. (의도 데이터 ③)According to another embodiment of the present application, the exceptional intention data (third intention data)'other than' may be extracted from a portion following the second'groundwater dissolution' indicated in blue in the user input sentence. (Intentional data ③)

이 때, 본원의 다른 실시예에 따르면, 전술한 바와 같이 '이외'에 해당하는 예외적 의도 데이터는 사용자 입력 문장에 포함된 예외적 의도 데이터를 제외한 의도 데이터인 '지하수 용출'을 제외한 나머지 의도 데이터 '인장균열, 침하, 낙석'을 포괄하는 것일 수 있다.At this time, according to another embodiment of the present application, as described above, the exceptional intention data corresponding to'other than' is intention data excluding'groundwater dissolution', which is intention data excluding the exceptional intention data included in the user input sentence. It may include'cracks, subsidence, and rockfall'.

내용 데이터 검출부(140)는, 상기 의도 데이터에 대응되는 원시 내용 데이터를 추출할 수 있다.The content data detector 140 may extract raw content data corresponding to the intention data.

구체적으로, 내용 데이터 검출부(140)는, 상기 사용자 입력 문장 중 N번째 의도 데이터의 종료 지점부터 (N+1)번째 의도 데이터의 시작 지점 전까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출할 수 있다.Specifically, the content data detection unit 140 includes a portion of the user input sentence from the end point of the N-th intention data to the start point of the (N+1)-th intention data as raw content data corresponding to the N-th intention data. Can be extracted with

또한, 내용 데이터 검출부(140)는, 상기 사용자 입력 문장 중 N번째 의도 데이터가 마지막 의도 데이터인 경우 상기 N번째 의도 데이터의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출할 수 있다.In addition, the content data detection unit 140, when the Nth intention data among the user input sentences is the last intention data, the Nth intention data from the end point of the Nth intention data to the end of the user input sentence. It can be extracted as the corresponding raw content data.

도5은 사용자 입력 문장에서 원시적 내용 데이터를 추출하는 과정을 설명하기 위한 도면이다.5 is a diagram illustrating a process of extracting primitive content data from a user input sentence.

도5의 (a)를 참조하면, 본원의 일 실시예에 따른 1번째 의도 데이터는 '휴가 구분'이고, 본원의 일 실시예에 따른 2번째 의도 데이터는 '휴가 사유'이며, 본원의 일 실시예에 따른 사용자 입력 문장 내 다른 의도 데이터는 존재하지 않는다.Referring to Figure 5 (a), the first intention data according to an embodiment of the present application is'vacation classification', the second intention data according to an embodiment of the present application is'a vacation reason', one implementation of the present application There is no other intention data in the user input sentence according to the example.

이 때, 본원의 일 실시예에 따르면, 내용 데이터 검출부(140)는 상기 사용자 입력 문장 중 1번째 의도 데이터인 '휴가 구분'의 종료 지점부터 2번째 의도 데이터인 '휴가 사유'의 시작 지점까지의 부분인 "은 연차 휴가이고,"를 상기 1번째 의도 데이터인 '휴가 구분’'에 대응되는 원시 내용 데이터로 추출할 수 있다. (원시 내용 데이터 ①)At this time, according to an embodiment of the present application, the content data detection unit 140 is from the end point of the first intention data'vacation classification' among the user input sentences to the start point of the second intention data'vacation reason'. The part, "is annual leave," may be extracted as raw content data corresponding to the first intention data, "vacation classification". (Raw content data ①)

또한, 본원의 일 실시예에 따르면, 내용 데이터 검출부(140)는 상기 사용자 입력 문장 중 마지막 의도 데이터인 '휴가 사유'의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분인 "는 결혼식이야."를 상기 2번째 의도 데이터인 '휴가 사유'에 대응되는 원시 내용 데이터로 추출할 수 있다. (원시 내용 데이터 ②)In addition, according to an exemplary embodiment of the present application, the content data detection unit 140 includes "is a wedding ceremony", which is a part from the end point of the last intention data of the user input sentence to the end of the user input sentence. May be extracted as raw content data corresponding to the second intention data,'reason for vacation'. (Raw content data ②)

도5의 (b)를 참조하면, 본원의 다른 실시예에 따른 1번째 의도 데이터는 '지하수 용출'이고, 본원의 다른 실시예에 따른 2번째 의도 데이터는 '지하수 용출'이며, 본원의 다른 실시예에 따른 3번째 의도 데이터는 예외적 의도 데이터인 '이외'이며, 본원의 다른 실시예에 따른 사용자 입력 문장 내 다른 의도 데이터는 존재하지 않는다.5B, the first intention data according to another embodiment of the present application is'groundwater dissolution', and the second intention data according to another embodiment of the present application is'groundwater elution', and another implementation of the present application The third intention data according to the example is'other than' which is the exceptional intention data, and there is no other intention data in the user input sentence according to another embodiment of the present application.

이 때, 본원의 다른 실시예에 따르면, 내용 데이터 검출부(140)는 상기 사용자 입력 문장 중 1번째 의도 데이터인 '지하수 검출'의 종료 지점부터 2번째 의도 데이터인 '지하수 검출'의 시작 지점까지의 부분인 "발생했고,"를 상기 1번째 의도 데이터인 '지하수 검출'에 대응되는 원시 내용 데이터로 추출할 수 있다. (원시 내용 데이터 ①)At this time, according to another embodiment of the present application, the content data detection unit 140 is from the end point of'groundwater detection', which is the first intention data among the user input sentences, to the start point of'groundwater detection', which is the second intention data. The part "occurred" may be extracted as raw content data corresponding to the first intention data "groundwater detection". (Raw content data ①)

또한, 본원의 다른 실시예에 따르면, 내용 데이터 검출부(140)는 상기 사용자 입력 문장 중 중 2번째 의도 데이터인 '지하수 검출'의 종료 지점부터 3번째 의도 데이터인 '지하수 검출'의 시작 지점까지의 부분인 '공백(NULL)'을 상기 2번째 의도 데이터인 '지하수 검출'에 대응되는 원시 내용 데이터로 추출할 수 있다. (원시 내용 데이터 ②)In addition, according to another embodiment of the present application, the content data detection unit 140 is from the end point of the second intention data'groundwater detection' among the user input sentences to the start point of the third intention data'groundwater detection'. The partial'space (NULL)' may be extracted as raw content data corresponding to the second intention data'groundwater detection'. (Raw content data ②)

달리 말해, 본원의 다른 실시예에 따르면, 의도 데이터 타입 '지하수 검출'에 대응되는 원시 내용 데이터가 두 개 검출될 수 있다.In other words, according to another embodiment of the present application, two raw content data corresponding to the intention data type'groundwater detection' may be detected.

또한, 본원의 다른 실시예에 따르면, 내용 데이터 검출부(140)는 상기 사용자 입력 문장 중 마지막 의도 데이터인 '이외'의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분인 "는 이상 없음."를 상기 3번째 의도 데이터인 '이외'에 대응되는 원시 내용 데이터로 추출할 수 있다. (원시 내용 데이터 ③)In addition, according to another embodiment of the present application, the content data detection unit 140 detects "No abnormality", which is a part from the end point of the last intention data'other than' of the user input sentence to the end of the user input sentence. It may be extracted as raw content data corresponding to the third intention data'other'. (Raw content data ③)

전술한 바와 같이, 상기 원시 내용 데이터에는 상기 의도 데이터에 대응되고, 전자문서 기입 항목에 대하여 입력될 데이터와 함께 정제되지 않은 발화 일부가 포함될 수 있으며, 이는 후술할 내용 데이터 처리부(150)에 의해 최종 내용 데이터로 가공되어 상기 전자문서 기입 항목에 입력될 수 있다.As described above, the raw content data corresponds to the intention data and may include a part of unrefined speech along with data to be input for an electronic document entry item, which is finalized by the content data processing unit 150 to be described later. It may be processed into content data and entered into the electronic document entry item.

내용 데이터 처리부(150)는, 상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득할 수 있다.The content data processing unit 150 may process the raw content data to obtain final content data.

도6은 본원의 일 실시예에 따른 내용 데이터 처리부의 세부 구성을 도시한 도면이다.6 is a diagram showing a detailed configuration of a content data processing unit according to an embodiment of the present application.

도6을 참조하면, 본원의 일 실시예에 따른 내용 데이터 처리부(150)는, 조사 처리부(151), 형태소 분석부(152) 및 형 변환부(153)를 포함할 수 있다.Referring to FIG. 6, the content data processing unit 150 according to an exemplary embodiment of the present disclosure may include an investigation processing unit 151, a morpheme analysis unit 152, and a type conversion unit 153.

조사 처리부(151)는, 내용 데이터 검출부(140)가 추출한 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리할 수 있다.The investigation processing unit 151 may determine and process whether the first segment of the original content data extracted by the content data detection unit 140 is an investigation.

이 때, 조사 처리부(151)는, 상기 원시 내용 데이터의 첫 분절이 조사인 경우, 해당 분절을 삭제할 수 있다.In this case, when the first segment of the original content data is an investigation, the investigation processing unit 151 may delete the segment.

본원의 일 실시예 따른 1번째 의도 데이터 '휴가 구분'에 대응되는 원시적 내용 데이터인 "은 연차휴가이고,"의 첫 분절은 '은'으로, 주격 조사에 해당하므로, 본원의 일 실시예에 따르면, 조사 처리부(151)는 이 경우, 조사에 해당하는 '은' 부분을 상기 원시적 내용 데이터로부터 삭제할 수 있다.The primitive content data corresponding to the first intention data'vacation classification' according to an embodiment of the present application "is annual leave," the first segment of "silver" corresponds to the nominative investigation, according to an embodiment of the present application , In this case, the investigation processing unit 151 may delete the'silver' part corresponding to the investigation from the primitive content data.

형태소 분석부(152)는, 상기 첫 분절을 제외한 나머지 분절들을 결합할 수 있다.The morpheme analysis unit 152 may combine the remaining segments except for the first segment.

형태소 분석부(152)는, 조사 처리부(151)에 의해 1차적으로 가공된 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행할 수 있다.The morpheme analysis unit 152 may perform a morpheme analysis on the last segment of the original content data that is primarily processed by the irradiation processing unit 151.

또한, 형태소 분석부(152)는, 상기 형태소 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지할 수 있다.In addition, the morpheme analysis unit 152 may detect the real morpheme by searching the morpheme analysis result in the reverse direction.

본원의 일 실시예에 따르면, 조사 처리부(151)에 의해 가공된 원시 내용 데이터인 "연차 휴가이고,"에 대해 형태소 분석부(152)는 역방향으로 형태소 분석을 수행할 수 있다.According to an exemplary embodiment of the present disclosure, the morpheme analysis unit 152 may perform morpheme analysis in the reverse direction with respect to “It is an annual vacation,” which is raw content data processed by the irradiation processing unit 151.

본원의 일 실시예에 따른 역방향 탐색 결과, '고'는 연결 어미이고 '이'는 긍정 지정사로써 실질 형태소가 아닌 문법 형태소에 해당한다. 따라서, "이고," 부분은 원시 내용 데이터로부터 삭제될 수 있다.As a result of a backward search according to an exemplary embodiment of the present application,'go' is a connection ending and'i' is a positive designator and corresponds to a grammatical morpheme rather than a real morpheme. Thus, the "is," part can be deleted from the original content data.

결국, 본원의 일 실시예에 따르면, 형태소 분석부(152)에 의해, 실질 형태소인 "연차 휴가"가 획득될 수 있다.As a result, according to an embodiment of the present application, by the morpheme analysis unit 152, a real morpheme, “annual vacation” may be obtained.

예시적으로, 형태소 분석부(152)는 기 존재하는 형태소 분석 서비스를 활용하여 상기 형태소 분석을 수행할 수 있다.For example, the morpheme analysis unit 152 may perform the morpheme analysis using an existing morpheme analysis service.

형 변환부(153)는, 상기 탐지된 실질 형태소가 명사 형태가 아닌 경우, 상기 탐지된 실질 형태소를 명사 형태로 변환할 수 있다.When the detected real morpheme is not a noun form, the type conversion unit 153 may convert the detected real morpheme into a noun form.

본원의 일 실시예에 따르면, 형태소 분석부(152)에 의해 획득된 실질 형태소인 "연차 휴가"는 명사 형태이므로, 형 변환부(153)에 의해 명사 형태로 변환되지 않지만, 동사 형태 등의 실질 형태소가 탐색되는 경우에 있어서, 일반적으로 전자문서 서식의 개별 기입 항목은 명사 형태로 기입되는 경우가 많으므로, 형 변환부(153)는 명사형이 아닌 실질 형태소에 대해 명사 형태로의 변환을 수행하여, 원시적 내용 데이터에 대한 처리를 완결할 수 있다.According to an exemplary embodiment of the present application, the "annual leave", which is a real morpheme obtained by the morpheme analysis unit 152, is a noun form, so it is not converted into a noun form by the type conversion unit 153, but the substance of the verb form, etc. In the case where morphemes are searched, in general, the individual entry items of the electronic document form are often entered in a noun form, so the type conversion unit 153 converts the real morphemes, not the noun form, into a noun form. In addition, processing of primitive content data can be completed.

예를 들어, 형 변환부(153)는 용언(동사, 형용사) 형태의 실질 형태소 뒤에 '-ㅁ' 또는 '-음'을 결합하여 상기 명사 형태로의 변환을 수행할 수 있다.For example, the type conversion unit 153 may perform conversion into the noun form by combining'-ㅁ' or'-um' after the real morpheme in the form of a verb (verb, adjective).

형 변환부(153)에 의해 명사 형태로의 변환까지 완료된 상기 원시적 내용 데이터는 최종적으로 전자문서 내에 입력되는 최종 내용 데이터로 확정될 수 있다.The primitive content data that has been converted into a noun form by the type conversion unit 153 may be finally determined as final content data input into the electronic document.

또한, 내용 데이터 처리부(150)는, 상기 의도 데이터에 대응되는 원시 내용 데이터가 복수개인 경우, 상기 복수의 원시 내용 데이터 중 상기 예외적 의도 데이터를 포함하거나 공백으로 이루어진 원시 내용 데이터를 삭제할 수 있다.In addition, when there are a plurality of original content data corresponding to the intention data, the content data processing unit 150 may delete the original content data including the exceptional intention data from among the plurality of original content data or consisting of blanks.

본원의 다른 실시예에 따르면, 하나의 의도 데이터 '지하수 검출'에 대응되는 원시 내용 데이터가 '발생했고,'와 '공백(NULL)'로 복수개인 경우, 내용 데이터 처리부(150)는, 공백으로 이루어진 원시 내용 데이터를 삭제할 수 있고, 따라서, '지하수 검출'에 대응되는 원시 내용 데이터는 '발생했고,' 하나만 남게된다.According to another embodiment of the present application, when raw content data corresponding to one intention data'groundwater detection' is'occurred' and a plurality of'spaces', the content data processing unit 150 is The raw content data that has been made can be deleted, and thus, the raw content data corresponding to the'groundwater detection' is'occurred' and only one remains.

최종 내용 데이터 검증부(160)는, 상기 질문이 제1타입 질문인 경우, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단할 수 있다.When the question is a first type question, the final content data verification unit 160 determines whether the final content data corresponds to all of the intention data included in the question, and whether the final content data is appropriately adapted according to the intention data. It can be determined whether or not it has been decided.

본원의 일 실시예에 따르면, 상기 질문은 "휴가 구분과 휴가 사유를 알려주세요." 로, 의도 데이터인 '휴가 구분'과 '휴가 사유'를 직접적으로 포함하는 제1타입 질문일 수 있다.According to an embodiment of the present application, the question is "Please tell me the vacation category and vacation reason." As such, it may be a first-type question that directly includes the intention data'distinguishing leave' and'reason for vacation'.

이 때, 본원의 일 실시예에 따른 상기 최종 내용 데이터가 만일 의도 데이터 '휴가 구분'에 대응되나, 의도 데이터 '휴가 사유'에 대응되지 않는 경우, 이는 사용자가 '휴가 구분'에 대한 내용만을 응답한 경우에 해당할 수 있다(사용자 입력 문장에 '휴가 사유'에 대한 내용이 포함되지 않은 경우).At this time, if the final content data according to an embodiment of the present application corresponds to the intention data'vacation classification', but does not correspond to the intention data'vacation reason', this means that the user responds only to the contents of'vacation classification'. This may be the case (if the user input sentence does not include the'reason for vacation').

이 때, 상기 최종 내용 데이터가 상기 질문에 포함된 상기 의도 데이터 중 일부에 대응되지 않는 경우, 질문 생성부(110)는, 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성할 수 있다.In this case, if the final content data does not correspond to some of the intention data included in the question, the question generator 110 generates a question related to the electronic document entry item based on the missing intention data. can do.

본원의 일 실시예에 따르면, '휴가 구분'에 대한 내용만을 사용자가 응답하였고, '휴가 사유'에 대응되는 내용을 응답하지 않은 경우, 질문 생성부(110)는, "휴가 사유도 알려주세요."와 같이 누락된 의도 데이터 '휴가 사유'에 기초하여 휴가신청서 기입 항목에 연계된 질문을 재생성할 수 있다.According to an exemplary embodiment of the present application, when the user responds only to the content of'vacation classification' and does not respond to the content corresponding to the'reason of vacation', the question generator 110, "Please inform us of the vacation reason. On the basis of the missing intention data'reason for vacation', a question related to the entry item of the vacation request form may be regenerated.

또한, 본원의 일 실시예에 따르면, 질문 생성부(110)는 최종 내용 데이터 검증부(160)의 검증 결과, 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 해당 의도 데이터와 연계된 질문을 재차 생성할 수 있다.In addition, according to an embodiment of the present application, when the final content data verification result of the final content data verification unit 160, the final content data is not appropriately determined according to the intention data, the question generation unit 110 Related questions can be re-created.

본원의 일 실시예에 따르면, '휴가 구분'에 대한 내용을 사용자가 응답하였으나, 의도 데이터인 '휴가 구분'에 대응되는 최종 내용 데이터가 의도 데이터 '휴가 구분'과 무관한 내용을 포함하고 있거나, 의도 데이터 '휴가 구분'과 연계될 수 없는 형식을 가지는 경우 등, 의도 데이터에 따라 적합하게 결정되지 않은 경우, 질문 생성부(110)는 의도 데이터 '휴가 구분'과 연계된 질문을 재차 생성할 수 있다.According to an exemplary embodiment of the present application, although the user responds to the contents of'vacation classification', the final contents data corresponding to the intention data'vacation classification' includes contents irrelevant to the intention data'vacation classification', If it is not appropriately determined according to the intention data, such as when it has a format that cannot be linked with the intention data'vacation classification', the question generator 110 may regenerate a question related to the intention data'vacation classification'. have.

또한, 질문 생성부(110)는, 상기 질문의 유형이 제1타입 질문인지 제2타입 질문인지와 무관하게, 전자문서의 완성을 위해 기입되어야 하는 전체 의도 데이터를 고려하여, 아직 대응되는 최종 내용 데이터의 기입이 경료되지 않은 의도 데이터가 남아 있는 경우, 남아있는 의도 데이터를 고려한 전자문서 기입 항목에 연계된 질문을 재생성할 수도 있다.In addition, the question generation unit 110, regardless of whether the type of the question is a first type question or a second type question, considering the entire intention data to be filled in for the completion of the electronic document, When intent data for which data has not been completed remains, a question linked to an electronic document entry item in consideration of the remaining intent data may be recreated.

본원의 일 실시예에 따르면, 상기 질문 "휴가 구분과 휴가 사유를 알려주세요"에 대한 응답으로 사용자가 입력한 사용자 입력 문장으로부터 의도 데이터 '휴가 구분' 및 '휴가 사유' 모두에 대응되는 최종 내용 데이터의 입력은 완료되었으나, 휴가신청서 상에 의도 데이터 '휴가 일시'에 대응되는 최종 내용 데이터의 입력이 완료되지 않은 경우, 질문 생성부(110)는 "휴가 일시도 알려주세요"와 같은 질문을 재생성할 수 있다.According to an embodiment of the present application, the intention data from the user input sentence entered by the user in response to the question "Please tell me the vacation classification and the reason for vacation" final content data corresponding to both the "vacation classification" and the "vacation reason" When the input of is completed, but the input of the final data corresponding to the intention data'vacation date' on the vacation application is not completed, the question generator 110 may regenerate a question such as "please tell me also the vacation date". I can.

전자문서 작성부(170)는, 상기 최종 내용 데이터를 전자문서 기입 항목에 입력할 수 있다.The electronic document creation unit 170 may input the final content data into an electronic document entry item.

도7은 본원의 일 실시예에 따른 전자문서 작성부가 최종 내용 데이터를 전자문서 기입 항목에 입력하는 과정을 설명하기 위한 도면이다.7 is a view for explaining a process of inputting final content data into an electronic document entry item by an electronic document creation unit according to an embodiment of the present application.

도7의 (a)를 참조하면, 본원의 일 실시예에 따르면, 의도 데이터 '휴가 구분'에 대응되는 최종 내용 데이터는 '연차 휴가' 이고, 의도 데이터 '휴가 사유'에 대응되는 최종 내용 데이터는 '결혼식'일 수 있다.Referring to Figure 7 (a), according to an embodiment of the present application, the final content data corresponding to the intention data'vacation classification' is'annual vacation', and the final content data corresponding to the intention data'reason for vacation' is It could be a'wedding'.

도7의 (b)를 참조하면, 본원의 다른 실시예에 따르면, 의도 데이터 '지하수 용출'에 대응되는 최종 내용 데이터는 '발생'이고, 의도 데이터 '이외'에 대응되는 최종 내용 데이터는 '이상 없음'일 수 있다. Referring to Figure 7 (b), according to another embodiment of the present application, the final content data corresponding to the intention data'groundwater dissolution' is'occurrence', and the final content data corresponding to the intention data'other than' is'abnormality'. May be'none'.

또한, 상기 최종 내용 데이터 각각은 전자문서의 서식에 따라 최종 내용 데이터 그 자체가 기입될 수도 있고, 최종 내용 데이터에 내용에 부합하도록 O/X 형태로 기입될 수도 있으며, V자 모양을 체크하는 방식으로 기입되거나 기입 항목 별로 미리 설정된 답변 유형 중 부합하는 답변을 고르는 형태로 기입될 수도 있으나, 이에 한정되는 것은 아니다.In addition, for each of the final content data, the final content data itself may be written according to the format of the electronic document, or it may be written in O/X format to conform to the content in the final content data, and a V-shape is checked. It may be written as or in the form of selecting a matching answer among preset answer types for each entry item, but is not limited thereto.

또한, 전자문서 작성부(170)는, 상기 예외적 의도 데이터가 추출된 경우, 상기 예외적 의도 데이터에 대응되는 최종 내용 데이터를 전자문서 기입 항목에 입력할지 여부를 추가적으로 판단하여, 판단 결과에 기초하여 상기 예외적 의도 데이터에 대응되는 상기 최종 내용 데이터를 전자문서 기입 항목에 입력할 수 있다.In addition, when the exceptional intention data is extracted, the electronic document creation unit 170 additionally determines whether to input final content data corresponding to the exceptional intention data into the electronic document entry item, and based on the determination result, the The final content data corresponding to the exceptional intention data may be input into the electronic document entry item.

본원의 다른 실시예에 따르면(도 7의 b), 예외적 의도 데이터 '이외'는 사용자 입력 문장에 포함된 다른 의도 데이터인 '지하수 용출'을 제외한 의도 데이터인 '인장균열, 침하, 낙석'을 포괄할 수 있고, 본원의 다른 실시예에 따르면 상기 예외적 의도 데이터에 대응되는 최종 내용 데이터인 '이상 없음'은 도7에 도시된 바와 같이 이에 부합하는 X 형태로 기입될 수 있다.According to another embodiment of the present application (Fig. 7b), the exceptional intention data'other than' encompasses intention data'tensile cracks, subsidence, rockfall', excluding'groundwater dissolution', which is other intention data included in the user input sentence According to another embodiment of the present application,'no abnormality', which is the final content data corresponding to the exceptional intention data, may be written in the form of an X corresponding thereto, as shown in FIG. 7.

다만, 본원의 다른 실시예와 달리, 예외적 의도 데이터에 대응되는 최종 내용 데이터가 "알 수 없음, 모름" 등과 같이 부정확한 내용을 포함하고 있거나, 소정의 다른 원인으로 전자문서 내에 기입되기에 부적합한 경우, 전자문서 작성부(170)는 예외적 의도 데이터에 대응되는 최종 내용 데이터를 전자문서 기입 항목에 입력할지 여부를 추가적으로 판단하여, 전자문서 기입 항목에 최종 내용 데이터를 기입하지 않을 수 있다.However, unlike other embodiments of the present application, when the final content data corresponding to the exceptional intention data contains inaccurate content such as "unknown, unknown", or is unsuitable to be written in an electronic document for some other reason , The electronic document creation unit 170 may additionally determine whether to input final content data corresponding to the exceptional intention data into the electronic document entry item, and may not write the final content data into the electronic document entry entry.

전술한 바와 같이, 본원의 일 실시예에 따른 전자문서 작성 장치(100)에 의해, 질문 생성부(110)가 전자문서 기입 항목과 연계된 질문을 생성하고, 입출력부(120)가 상기 질문을 전달하고 이에 대한 사용자의 응답인 사용자 입력 문장을 수신하고, 상기 사용자 입력 문장으로부터 의도 데이터 검출부(130), 내용 데이터 검출부(140), 내용 데이터 처리부(150), 최종 내용 데이터 검증부(160)의 동작에 의해 전자문서에 기입될 값이 결정되고, 이 값을 전자문서 작성부(170)가 전자문서 서식에 기입하도록 동작함으로써, 사용자와 대화 형태로 전자문서 작성에 필요한 정보를 반복적으로 교환해나감으로써 하나의 전자문서를 완성할 수 있다.As described above, by the electronic document creation apparatus 100 according to an embodiment of the present application, the question generation unit 110 generates a question associated with the electronic document entry item, and the input/output unit 120 receives the question. It transmits and receives a user input sentence, which is a user's response thereto, and from the user input sentence, the intention data detection unit 130, the content data detection unit 140, the content data processing unit 150, the final content data verification unit 160 A value to be written in the electronic document is determined by the operation, and the electronic document creation unit 170 operates to write the value in the electronic document form, thereby repeatedly exchanging information required for electronic document creation in a conversation with the user. As a result, one electronic document can be completed.

도8은 본원의 일 실시예에 따른 전자문서 작성 방법의 동작 흐름도이다.8 is a flowchart illustrating an electronic document writing method according to an embodiment of the present application.

도8에 도시된 전자문서 작성 방법은 앞서 설명된 전자문서 작성 장치(100)에 의하여 수행될 수 있다. 따라서, 이하 생략된 내용이라고 하더라도 전자문서 작성 장치(100)에 대하여 설명된 내용은 도8에도 동일하게 적용될 수 있다.The electronic document creation method illustrated in FIG. 8 may be performed by the electronic document creation apparatus 100 described above. Accordingly, even if the contents are omitted below, the contents described with respect to the electronic document creation apparatus 100 may be equally applied to FIG. 8.

도8을 참조하면, 단계 S810에서 질문 생성부(110)는, 전자문서 기입 항목에 연계된 질문을 생성할 수 있다.Referring to FIG. 8, in step S810, the question generator 110 may generate a question related to an electronic document entry item.

또한, 상기 질문은 의도 데이터를 포함하는 제1타입 질문 및 상기 의도 데이터를 미포함하는 제2타입 질문을 포함할 수 있다.Also, the question may include a first type question including intention data and a second type question not including the intention data.

또한, 상기 의도 데이터는 전자문서의 서식에 기초하여 결정될 수 있다.Also, the intention data may be determined based on the format of the electronic document.

구체적으로, 상기 의도 데이터는 하나의 전자문서가 완성되기 위하여 전자문서 상에 사용자가 입력해야 하는 기입 항목과 연계될 수 있다.Specifically, the intention data may be associated with entry items that a user must input on an electronic document in order to complete one electronic document.

다음으로, 단계 S820에서 입출력부(120)는, 상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신할 수 있다.Next, in step S820, the input/output unit 120 may transmit the question to the user terminal and receive a user input sentence including a response to the question.

또한, 상기 사용자 단말은 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함할 수 있다.In addition, the user terminal may include a speech recognition terminal capable of recognizing a user's voice and an interactive terminal through which the user can input the user input sentence through a separate input device.

또한, 상기 사용자 입력 문장은 음성 입력 또는 입력 장치 화면 상에 구비된 대화 창에 텍스트를 기입하는 방식으로 입력된 대화형 입력의 형태로 입력될 수 있다.In addition, the user input sentence may be input in the form of a voice input or an interactive input input by writing text in a chat window provided on the screen of the input device.

다음으로, 단계 S830에서 의도 데이터 검출부(130)는, 상기 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출할 수 있다.Next, in step S830, the intention data detection unit 130 may extract intention data associated with the electronic document entry item from the user input sentence.

구체적으로, 단계 S830에서 의도 데이터 검출부(130)는, 상기 사용자 입력 문장에서 상기 전자문서 기입 항목과의 유사도가 소정 이상인 부분을 상기 의도 데이터로 추출할 수 있다.Specifically, in step S830, the intention data detection unit 130 may extract, as the intention data, a portion of the user input sentence having a similarity of the electronic document entry item equal to or greater than a predetermined value.

또한, 상기 의도 데이터는 예외적 의도 데이터를 포함할 수 있다.Also, the intention data may include exceptional intention data.

구체적으로, 상기 예외적 의도 데이터는, 상기 전자문서의 서식에 기초하여 결정된 전체 의도 데이터에서 상기 사용자 입력 문장에 포함된 상기 예외적 의도 데이터 이외의 의도 데이터를 제외한 나머지 의도 데이터를 포괄할 수 있다Specifically, the exceptional intention data may include other intention data excluding intention data other than the exceptional intention data included in the user input sentence from the entire intention data determined based on the format of the electronic document.

다음으로, 단계 S840에서 내용 데이터 검출부(140)는, 상기 사용자 입력 문장으로부터 상기 의도 데이터에 대응되는 원시 내용 데이터를 추출할 수 있다.Next, in step S840, the content data detector 140 may extract raw content data corresponding to the intention data from the user input sentence.

구체적으로, 단계 S840에서 내용 데이터 검출부(140)는, 상기 사용자 입력 문장 중 N번째 의도 데이터의 종료 지점부터 (N+1)번째 의도 데이터의 시작 지점 전까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출할 수 있다.Specifically, in step S840, the content data detection unit 140 includes a portion of the user input sentence from the end point of the Nth intention data to the start point of the (N+1)th intention data corresponding to the Nth intention data. It can be extracted as raw content data.

또한, 단계 S840에서 내용 데이터 검출부(140)는, 상기 사용자 입력 문장 중 N번째 의도 데이터가 마지막 의도 데이터인 경우 상기 N번째 의도 데이터의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출할 수 있다.Further, in step S840, when the Nth intention data among the user input sentences is the last intention data, the content data detection unit 140 determines the Nth portion from the end point of the Nth intention data to the end of the user input sentence. It can be extracted as raw content data corresponding to the intention data.

다음으로, 단계 S850에서 내용 데이터 처리부(150)는, 상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득할 수 있다.Next, in step S850, the content data processing unit 150 may process the original content data to obtain final content data.

다음으로, 단계 S860에서 최종 내용 데이터 검증부(160)는, 질문 생성부(110)가 생성한 질문이 상기 제1타입인 경우, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단할 수 있다.Next, in step S860, the final content data verification unit 160, when the question generated by the question generation unit 110 is the first type, whether the final content data corresponds to all intention data included in the question. It may be determined whether or not the final content data is appropriately determined according to the intention data.

이 때, 단계 S860에서 최종 내용 데이터 검증부(160)의 검증 결과, 상기 최종 내용 데이터가 상기 질문에 포함된 상기 의도 데이터 중 일부에 대응되지 않는 경우, 질문 생성부(110)는, 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성할 수 있다.In this case, if the final content data verification unit 160 verifies in step S860, if the final content data does not correspond to some of the intention data included in the question, the question generator 110 A question associated with the electronic document entry item may be generated based on the data.

또한, 단계 S860에서 최종 내용 데이터 검증부(160)의 검증 결과, 상기 최종 내용 데이터가 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 해당 의도 데이터와 연계된 질문을 재차 생성할 수 있다.In addition, in step S860, if the final content data is not properly determined according to the intention data as a result of verification by the final content data verification unit 160, a question associated with the corresponding intention data is generated again. I can.

다음으로, 단계 S870에서 전자문서 작성부(170)는, 상기 최종 내용 데이터를 전자문서 기입 항목에 입력할 수 있다.Next, in step S870, the electronic document creation unit 170 may input the final content data into the electronic document entry item.

상술한 설명에서, 단계 S810 내지 단계 S870은 본원의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.In the above description, steps S810 to S870 may be further divided into additional steps or may be combined into fewer steps, according to an embodiment of the present disclosure. In addition, some steps may be omitted as necessary, and the order between steps may be changed.

도9는 본원의 일 실시예에 따른 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 단계를 세분화한 동작 흐름도이다.9 is a flowchart illustrating a detailed operation of obtaining final content data by processing raw content data according to an embodiment of the present application.

도9에 도시된 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 방법은 앞서 설명된 전자문서 작성 장치(100)에 의하여 수행될 수 있다. 따라서, 이하 생략된 내용이라고 하더라도 전자문서 작성 장치(100)에 대하여 설명된 내용은 도9에도 동일하게 적용될 수 있다.The method of obtaining final content data by processing the original content data illustrated in FIG. 9 may be performed by the electronic document creation apparatus 100 described above. Accordingly, even if the contents are omitted below, the contents described with respect to the electronic document creation apparatus 100 may be equally applied to FIG. 9.

도9를 참조하면, 단계 S910에서 내용 데이터 처리부(150)는, 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리할 수 있다.Referring to FIG. 9, in step S910, the content data processing unit 150 may determine and process whether the first segment of the original content data is a survey.

다음으로, 단계 S920에서 내용 데이터 처리부(150)는, 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행할 수 있다.Next, in step S920, the content data processing unit 150 may perform morpheme analysis on the last segment of the original content data.

다음으로, 단계 S930에서 내용 데이터 처리부(150)는, 상기 형태소 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지할 수 있다.Next, in step S930, the content data processing unit 150 may detect the real morpheme by searching the morpheme analysis result in the reverse direction.

다음으로, 단계 S940에서 내용 데이터 처리부(150)는, 상기 탐지된 실질 형태소가 명사 형태가 아닌 경우, 상기 탐지된 실질 형태소를 명사 형태로 변환할 수 있다.Next, in step S940, if the detected real morpheme is not a noun form, the content data processing unit 150 may convert the detected real morpheme into a noun form.

상술한 설명에서, 단계 S910 내지 단계 S940은 본원의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.In the above description, steps S910 to S940 may be further divided into additional steps or may be combined into fewer steps, according to an embodiment of the present application. In addition, some steps may be omitted as necessary, and the order between steps may be changed.

본원의 일 실시예에 따른 전자문서 작성 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. The method of creating an electronic document according to an exemplary embodiment of the present disclosure may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded in the medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The above-described hardware device may be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

또한, 전술한 전자문서 작성 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.In addition, the above-described electronic document creation method may be implemented in the form of a computer program or application executed by a computer stored in a recording medium.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present application is for illustrative purposes only, and those of ordinary skill in the art to which the present application pertains will be able to understand that it is possible to easily transform it into other specific forms without changing the technical spirit or essential features of the present application. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not limiting. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present application is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present application.

100: 전자문서 작성 장치
110: 질문 생성부
120: 입출력부
130: 의도 데이터 검출부
140: 내용 데이터 검출부
150: 내용 데이터 처리부
151: 조사 처리부
152: 형태소 분석부
153: 형 변환부
160: 최종 내용 데이터 검증부
170: 전자문서 작성부
100: electronic document writing device
110: question generator
120: input/output unit
130: intention data detection unit
140: content data detection unit
150: content data processing unit
151: investigation processing unit
152: morpheme analysis unit
153: type conversion unit
160: final content data verification unit
170: electronic document preparation unit

Claims (19)

사용자 입력 문장으로부터 전자문서를 작성하는 전자문서 작성 장치에 의해 수행되는 사용자 입력 문장으로부터 전자문서를 작성하는 방법에 있어서,
질문 생성부가 전자문서 기입 항목에 연계된 질문을 생성하는 단계;
입출력부가 상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신하는 단계;
의도 데이터 검출부가 상기 사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 식별하는 단계;
내용 데이터 검출부가 상기 식별된 의도 데이터에 대응되는 원시 내용 데이터를 추출하는 단계;
내용 데이터 처리부가 상기 추출된 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 단계; 및
전자문서 작성부가 상기 최종 내용 데이터를 전자문서 기입 항목에 입력하는 단계,
를 포함하고,
상기 최종 내용 데이터를 획득하는 단계는,
최종 내용 데이터의 시작을 결정하기 위해 조사 처리부가 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리하는 단계;
최종 내용 데이터의 끝을 결정하기 위해 형태소 분석부가 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행하는 단계; 및
상기 형태소 분석부가 상기 형태소 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지하는 단계,
를 포함하는 것인, 전자문서 작성 방법.
In the method of creating an electronic document from a user input sentence, which is performed by an electronic document creation device that creates an electronic document from a user input sentence,
Generating, by the question generation unit, a question associated with the electronic document entry item;
Transmitting the question to the user terminal by an input/output unit and receiving a user input sentence including a response to the question;
Identifying, by an intention data detection unit, intention data associated with the electronic document entry item from the user input sentence;
Extracting, by a content data detection unit, raw content data corresponding to the identified intention data;
Obtaining final content data by processing the extracted original content data by a content data processing unit; And
Inputting, by an electronic document creation unit, the final content data into an electronic document entry item,
Including,
The step of obtaining the final content data,
Determining and processing whether the first segment of the original content data is a survey in order to determine the start of the final content data;
Performing, by a morpheme analysis unit, a morpheme analysis on the last segment of the original content data to determine an end of the final content data; And
Detecting a real morpheme by searching the morpheme analysis result in a reverse direction by the morpheme analysis unit,
That includes, electronic document writing method.
삭제delete 제1항에 있어서,
상기 최종 내용 데이터를 획득하는 단계는,
형 변환부가 상기 탐지된 실질 형태소가 명사 형태가 아닌 경우, 상기 탐지된 실질 형태소를 명사 형태로 변환하는 단계,
를 더 포함하는 것인 전자문서 작성 방법.
The method of claim 1,
The step of obtaining the final content data,
Converting the detected real morpheme into a noun form when the detected real morpheme is not a noun form,
The electronic document writing method further comprising a.
제1항에 있어서,
상기 사용자 입력 문장은 음성 입력 또는 입력 장치 화면 상에 구비된 대화 창에 텍스트를 기입하는 방식으로 입력된 대화형 입력의 형태로 입력되는 것인, 전자문서 작성 방법.
The method of claim 1,
The user input sentence is input in the form of a voice input or an interactive input input in a manner of writing text in a chat window provided on the screen of the input device.
제1항에 있어서,
상기 의도 데이터는 전자문서의 서식에 기초하여 결정되고,
상기 의도 데이터를 추출하는 단계는,
상기 사용자 입력 문장에서 상기 전자문서 기입 항목과의 유사도가 소정 이상인 부분을 추출하는 것인,
전자문서 작성 방법.
The method of claim 1,
The intention data is determined based on the format of the electronic document,
The step of extracting the intention data,
Extracting a portion of the user input sentence having a degree of similarity with the electronic document entry item greater than or equal to a predetermined value,
How to write an electronic document.
제1항에 있어서,
상기 원시 내용 데이터를 추출하는 단계는,
상기 사용자 입력 문장 중 N번째 의도 데이터의 종료 지점부터 (N+1)번째 의도 데이터의 시작 지점 전까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출하는 것인, 전자문서 작성 방법.
The method of claim 1,
Extracting the raw content data,
Extracting a portion of the user input sentence from the end point of the Nth intention data to the start point of the (N+1)th intention data as raw content data corresponding to the Nth intention data.
제1항에 있어서,
상기 원시 내용 데이터를 추출하는 단계는,
상기 사용자 입력 문장 중 N번째 의도 데이터가 마지막 의도 데이터인 경우 상기 N번째 의도 데이터의 종료 지점부터 상기 사용자 입력 문장의 마지막까지의 부분을 상기 N번째 의도 데이터에 대응되는 원시 내용 데이터로 추출하는 것인,
전자문서 작성 방법.
The method of claim 1,
Extracting the raw content data,
If the N-th intention data among the user input sentences is the last intention data, extracting a portion from the end point of the N-th intention data to the end of the user input sentence as raw content data corresponding to the N-th intention data ,
How to write an electronic document.
제1항에 있어서,
상기 질문은 상기 의도 데이터를 포함하는 제1타입 질문 및 상기 의도 데이터를 미포함하는 제2타입 질문을 포함하는 것인,
전자문서 작성 방법.
The method of claim 1,
The question includes a first type question including the intention data and a second type question not including the intention data,
How to write an electronic document.
제8항에 있어서,
상기 질문이 제1타입 질문인 경우,
최종 내용 데이터 검증부가 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단하는 최종 내용 데이터 검증 단계를 더 포함하는 것인,
전자문서 작성 방법.
The method of claim 8,
If the above question is a first type question,
The final content data verification step further comprising a final content data verification step of determining whether the final content data verification unit corresponds to all of the intention data included in the question and whether the final content data is appropriately determined according to the intention data. That,
How to write an electronic document.
제9항에 있어서,
상기 최종 내용 데이터 검증 결과,
상기 최종 내용 데이터가 상기 질문에 포함된 상기 의도 데이터 중 일부에 대응되지 않는 경우, 상기 질문을 생성하는 단계는 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성하고,
상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 상기 질문을 생성하는 단계는 해당 의도 데이터와 연계된 질문을 재차 생성하는 것인,
전자문서 작성 방법.
The method of claim 9,
The final content data verification result,
If the final content data does not correspond to some of the intention data included in the question, the step of generating the question generates a question associated with the electronic document entry item based on the missing intention data,
If the final content data is not appropriately determined according to the intention data, the step of generating the question is to regenerate a question associated with the corresponding intention data,
How to write an electronic document.
제5항에 있어서,
상기 사용자 입력 문장이 상기 전자문서의 서식에 기초하여 결정된 전체 의도 데이터 중 적어도 하나에 해당하는 소정의 의도 데이터 및 예외적 의도 데이터를 함께 포함하면,
상기 예외적 의도 데이터는 상기 전체 의도 데이터에서 사용자가 전자문서를 최종 내용 데이터로 채우기 위해 상기 문장 내에서 언급한 상기 소정의 의도 데이터를 제외한 나머지 의도 데이터를 포괄하는 것인,
전자문서 작성 방법.
The method of claim 5,
When the user input sentence includes both predetermined intention data and exceptional intention data corresponding to at least one of all intention data determined based on the format of the electronic document,
The exceptional intention data includes intention data other than the predetermined intention data mentioned in the sentence in order for the user to fill the electronic document with final content data from the entire intention data,
How to write an electronic document.
제11항에 있어서,
상기 전자문서 작성부가 상기 예외적 의도 데이터에 대응되는 최종 내용 데이터의 정확도, 상기 기입 항목에의 적합도, 상기 기입 항목에 대한 입력 가능성 및 입력 값의 허용범위 중 적어도 하나를 고려하여 상기 예외적 의도 데이터에 대응되는 최종 내용 데이터를 전자문서 기입 항목에 입력할지 여부를 판단하는 단계를 더 포함하는,
전자문서 작성 방법.
The method of claim 11,
The electronic document creation unit responds to the exceptional intention data by considering at least one of the accuracy of the final content data corresponding to the exceptional intention data, the suitability for the entry item, the possibility of input to the entry item, and the allowable range of the input value. Further comprising the step of determining whether to input the final content data to be entered into the electronic document entry item,
How to write an electronic document.
제11항에 있어서,
상기 의도 데이터에 대응되는 원시 내용 데이터가 복수개인 경우,
상기 내용 데이터 처리부가 상기 복수의 원시 내용 데이터 중 상기 예외적 의도 데이터를 포함하거나 공백과 같이 비중도가 낮은 원시 내용 데이터를 삭제하는 단계를 더 포함하는,
전자문서 작성 방법.
The method of claim 11,
When there are a plurality of raw content data corresponding to the intention data,
The content data processing unit further comprising the step of deleting original content data having a low specific gravity such as blank or including the exceptional intention data among the plurality of original content data,
How to write an electronic document.
사용자 입력 문장으로부터 전자문서를 작성하는 장치에 있어서,
전자문서 기입 항목에 연계된 질문을 생성하는 질문 생성부,
상기 질문을 사용자 단말에 전송하고, 상기 질문에 대한 응답을 포함하는 사용자 입력 문장을 수신하는 입출력부;
사용자 입력 문장으로부터 전자문서 기입 항목과 연계된 의도 데이터를 추출하는 의도 데이터 검출부;
상기 의도 데이터에 대응되는 원시 내용 데이터를 추출하는 내용 데이터 검출부;
상기 원시 내용 데이터를 처리하여 최종 내용 데이터를 획득하는 내용 데이터 처리부; 및
상기 최종 내용 데이터를 전자문서 기입 항목에 입력하는 전자문서 작성부,
를 포함하고,
상기 내용 데이터 처리부는,
최종 내용 데이터의 시작을 결정하기 위해 상기 원시 내용 데이터의 첫 분절이 조사인지 여부를 판단하여 처리하는 조사 처리부;
최종 내용 데이터의 끝을 결정하기 위해 상기 원시 내용 데이터의 마지막 분절에 대해 형태소 분석을 수행하고, 분석 결과를 역방향으로 탐색하여 실질 형태소를 탐지하는 형태소 분석부; 및
상기 탐지된 실질 형태소를 명사 형태로 변환하는 형 변환부,
를 포함하는 것인, 전자문서 작성 장치.
In the device for creating an electronic document from a user input sentence,
A question generation unit that generates a question related to an electronic document entry item,
An input/output unit for transmitting the question to a user terminal and receiving a user input sentence including a response to the question;
An intention data detection unit for extracting intention data associated with the electronic document entry item from the user input sentence;
A content data detection unit that extracts raw content data corresponding to the intention data;
A content data processing unit that processes the original content data to obtain final content data; And
An electronic document creation unit for inputting the final content data into an electronic document entry item,
Including,
The content data processing unit,
A survey processing unit determining and processing whether the first segment of the original content data is a survey in order to determine the start of the final content data;
A morpheme analysis unit that performs a morpheme analysis on the last segment of the original content data to determine an end of the final content data and detects a real morpheme by searching the analysis result in a reverse direction; And
A type conversion unit for converting the detected real morpheme into a noun form,
That includes, electronic document writing device.
삭제delete 제14항에 있어서,
상기 사용자 단말은 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함하고,
상기 입출력부는,
상기 사용자 단말이 상기 음성 인식 단말인 경우, 전자문서 작성과 연계된 정보를 음성 형태로 출력하고,
상기 사용자 단말이 상기 대화형 단말인 경우, 전자문서 작성과 연계된 정보를 상기 대화형 단말의 디스플레이 상에 구비된 대화 창에 텍스트 형태로 출력하는 것인,
전자문서 작성 장치.
The method of claim 14,
The user terminal includes a voice recognition terminal capable of recognizing a user's voice and an interactive terminal through which a user can input the user input sentence through a separate input device,
The input/output unit,
When the user terminal is the voice recognition terminal, information related to electronic document creation is output in a voice form,
When the user terminal is the interactive terminal, outputting information related to electronic document creation in text form on a dialog window provided on the display of the interactive terminal,
Electronic document writing device.
제14항에 있어서,
상기 질문 생성부는,
상기 의도 데이터를 포함하는 제1타입 질문을 생성하거나 상기 의도 데이터를 미포함하는 제2타입 질문을 생성하는 것인,
전자문서 작성 장치.
The method of claim 14,
The question generator,
Generating a first type question including the intent data or generating a second type question including the intent data,
Electronic document writing device.
제17항에 있어서,
상기 질문 생성부가 생성한 질문이 상기 제1타입 질문인 경우, 상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 전부에 대응되는지 여부 및 상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되었는지 여부를 판단하는 최종 내용 데이터 검증부를 더 포함하는 것인,
전자문서 작성 장치.
The method of claim 17,
When the question generated by the question generator is the first type question, whether the final content data corresponds to all of the intention data included in the question and whether the final content data is appropriately determined according to the intention data It further comprises a final content data verification unit to determine,
Electronic document writing device.
제18항에 있어서,
상기 질문 생성부는 상기 최종 내용 데이터 검증부의 검증 결과,
상기 최종 내용 데이터가 상기 질문에 포함된 의도 데이터 중 일부에 대응되지 않는 경우, 누락된 의도 데이터에 기초하여 상기 전자문서 기입 항목에 연계된 질문을 생성하고,
상기 최종 내용 데이터가 상기 의도 데이터에 따라 적합하게 결정되지 않은 경우, 해당 의도 데이터와 연계된 질문을 재차 생성하는 것인,
전자문서 작성 장치.
The method of claim 18,
The question generation unit verification result of the final content data verification unit,
If the final content data does not correspond to some of the intention data included in the question, a question associated with the electronic document entry item is generated based on the missing intention data,
If the final content data is not appropriately determined according to the intent data, regenerating a question associated with the intent data,
Electronic document writing device.
KR1020190035190A 2019-03-27 2019-03-27 System for writing electronic document by detecting key and corresponding value from sentence with multiple key KR102189567B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190035190A KR102189567B1 (en) 2019-03-27 2019-03-27 System for writing electronic document by detecting key and corresponding value from sentence with multiple key

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190035190A KR102189567B1 (en) 2019-03-27 2019-03-27 System for writing electronic document by detecting key and corresponding value from sentence with multiple key

Publications (2)

Publication Number Publication Date
KR20200114079A KR20200114079A (en) 2020-10-07
KR102189567B1 true KR102189567B1 (en) 2020-12-11

Family

ID=72883196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190035190A KR102189567B1 (en) 2019-03-27 2019-03-27 System for writing electronic document by detecting key and corresponding value from sentence with multiple key

Country Status (1)

Country Link
KR (1) KR102189567B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102472447B1 (en) * 2022-06-13 2022-11-30 (주)유알피시스템 A system and method for automatically blocking specific content in complex documents using machine learning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323572A1 (en) 2011-06-19 2012-12-20 Detlef Koll Document Extension in Dictation-Based Document Generation Workflow
KR101255468B1 (en) 2011-10-17 2013-04-16 포항공과대학교 산학협력단 Method of labeling dialogue intention
WO2016120904A1 (en) 2015-01-28 2016-08-04 三菱電機株式会社 Intent deduction device and intent deduction method
JP2017107078A (en) 2015-12-10 2017-06-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Voice interactive method, voice interactive device, and voice interactive program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080052279A (en) * 2006-12-05 2008-06-11 한국전자통신연구원 Apparatus and method of dialogue tv agent service for providing daily information
KR20170027061A (en) * 2015-09-01 2017-03-09 삼성에스디에스 주식회사 Method and apparatus for using virtual assistant application on instant messenger
KR101971582B1 (en) * 2016-11-16 2019-08-13 한국과학기술원 Method of providing health care guide using chat-bot having user intension analysis function and apparatus for the same
KR102494944B1 (en) * 2017-06-18 2023-02-01 박여림 Contents creating method and a system thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323572A1 (en) 2011-06-19 2012-12-20 Detlef Koll Document Extension in Dictation-Based Document Generation Workflow
KR101255468B1 (en) 2011-10-17 2013-04-16 포항공과대학교 산학협력단 Method of labeling dialogue intention
WO2016120904A1 (en) 2015-01-28 2016-08-04 三菱電機株式会社 Intent deduction device and intent deduction method
JP2017107078A (en) 2015-12-10 2017-06-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Voice interactive method, voice interactive device, and voice interactive program

Also Published As

Publication number Publication date
KR20200114079A (en) 2020-10-07

Similar Documents

Publication Publication Date Title
US11615799B2 (en) Automated meeting minutes generator
JP6904449B2 (en) Generate a meeting review document that contains links to one or more documents that have been reviewed
US11545156B2 (en) Automated meeting minutes generation service
TWI437449B (en) Multi-mode input method and input method editor system
US20190087455A1 (en) System and method for natural language processing
US8160881B2 (en) Human-assisted pronunciation generation
US10803253B2 (en) Method and device for extracting point of interest from natural language sentences
US9262411B2 (en) Socially derived translation profiles to enhance translation quality of social content using a machine translation
KR20170106346A (en) How to Understand Incomplete Natural Language Queries
JP2016529603A (en) Online speech translation method and apparatus
KR20050015586A (en) Method and apparatus for handling speech recognition errors in spoken dialogue systems
CN104850543A (en) Voice conversation support apparatus and voice conversation support method
KR102076793B1 (en) Method for providing electric document using voice, apparatus and method for writing electric document using voice
US10635730B2 (en) Modification of search subject in predictive search sentences
US9772816B1 (en) Transcription and tagging system
WO2022108671A1 (en) Automatic document sketching
US11257484B2 (en) Data-driven and rule-based speech recognition output enhancement
KR102189567B1 (en) System for writing electronic document by detecting key and corresponding value from sentence with multiple key
KR20210109914A (en) Apparatus and method for filling electronic document using dialogue comprehension based on format of electronic document
KR101705228B1 (en) Electronic document producing apparatus, and control method thereof
KR102305181B1 (en) Method for providing electric document using chatbot, apparatus and method for writing electric document using chatbot
KR20060104544A (en) System and method for providing automatically completed query and computer readable recording medium recording program for implementing the method
KR102189568B1 (en) Apparatus and method for controlling electronic document based on natural language processing
CN115298736A (en) Speech recognition and training for data input
KR20210062828A (en) Apparatus and method for writing electronic document by interactive type and document type, method for providing interactive type electronic documnet

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant