KR20210109914A

KR20210109914A - 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법

Info

Publication number: KR20210109914A
Application number: KR1020200025119A
Authority: KR
Inventors: 박미경
Original assignee: 주식회사 포시에스
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2021-09-07
Also published as: KR102581414B1

Abstract

대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법이 개시되며, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은, 소정의 전자문서의 작성과 연계된 대화 입력을 수신하는 단계, 상기 전자문서의 서식에 기초하여 상기 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 단계 및 상기 필드 리스트에 기초하여 상기 대화 입력으로부터 상기 전자문서를 작성하는 단계를 포함할 수 있다.

Description

대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법{APPARATUS AND METHOD FOR FILLING ELECTRONIC DOCUMENT USING DIALOGUE COMPREHENSION BASED ON FORMAT OF ELECTRONIC DOCUMENT}

본원은 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법에 관한 것이다. 특히, 본원은 지문 형태의 자연스러운 대화를 입력으로 수신하여 전자문서의 폼 서식을 기초로 자동으로 추출된 필드(질문)를 통해 해당 서식의 전자문서를 자동 입력하는 전자문서 시스템에 관한 것이다.

일반적으로 업무 영역에서 다양한 양식의 문서가 발생하게 되고, 이러한 문서들은 종래에는 종이에 인쇄된 형태로 작성되었다면, 최근 다양한 문서들을 전자적인 형태로 생성하는 전자문서 및 전자서명 서비스가 도입되어 활용되고 있으며, 정부의 페이퍼리스(Paperless) 정책과 맞물려 급속한 성장 추세를 보이고 있다.

또한, 스마트 디바이스의 대중화에 따라 음성 기반 서비스를 이용하는 사용자 경험은 지속적으로 축적되어 왔다. 현재 음성 기반 서비스의 대부분은 개인의 일상 생활에 연계된 기능을 제공하고 있으며, 앞으로는 기업의 업무 영역에까지 확장될 것으로 예상된다.

따라서, 음성 입력 등을 기초로 전자문서를 생성하는 기술 및 시스템이나 음성 입력 등을 기초로 전자 문서를 제어 및 관리할 수 있는 기술 및 시스템 개발의 필요성이 증대되고 있다.

그러나, 현재까지의 음성을 통한 전자문서 작성 기술은 음성이 포함된 컨텐츠(영화, 온라인에 업로드된 동영상 등)에 대한 자막을 생성하거나 인터뷰 내용을 단순 받아쓰기 하는 등 음성 전체의 텍스트화(전사, Transcription)에만 편중되어 있었다.

또한, 최근 들어 관공서, 은행, 증권사, 통신사 등의 주체들이 제공하는 민원, 금융거래, 통신 서비스 등의 서비스를 신청 또는 가입하거나 신규 회원으로 등록하는 등의 제반 상황에서 태블릿 등의 별도로 마련된 디바이스로 신청 또는 가입 시 작성이 필요한 문서를 전자적으로 표시하거나 태블릿과 연계된 터치펜 등의 입력 수단을 통해 전자문서의 내용을 기입하는 것은 흔히 찾아볼 수 있으나, 관공서, 은행, 증권사, 통신사 등의 주체 측 직원과 특정 서비스를 신청 또는 가입하려는 고객의 음성 기반의 대화의 내용을 인식하여 이를 기초로 작성하고자 하는 전자문서 내의 각각의 항목을 적절하게 자동으로 기입해주는 방식은 아직 도입된바 없다.

아울러, 앞서 예시한 특정 서비스의 제공 주체와 해당 서비스에 가입하려는 고객의 대화 상황에 국한되지 않고, 업무 영역에서 이루어지는 대화 상황(회의 상황, 발표 상황 등)에서의 발화 또는 음성을 인식하여 필요한 양식(서식)의 문서를 자동으로 기입할 수 있다면 업무 처리와 연계된 전자문서의 작성 및 작성된 전자문서에 대한 관리가 더욱 용이해질 수 있을 것이다.

본원의 배경이 되는 기술은 한국등록특허공보 제10-1705228호에 개시되어 있다.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 자연스럽게 이루어지는 대화를 입력으로 수신하여 전자문서의 폼 서식을 기초로 자동으로 추출된 필드(질문)를 통해 해당 서식의 전자문서를 자동 입력할 수 있는 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법을 제공하려는 것을 목적으로 한다.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은, 소정의 전자문서의 작성과 연계된 대화 입력을 수신하는 단계, 상기 전자문서의 서식에 기초하여 상기 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 단계 및 상기 필드 리스트에 기초하여 상기 대화 입력으로부터 상기 전자문서를 작성하는 단계를 포함할 수 있다.

또한, 상기 전자문서를 작성하는 단계는, 상기 대화 입력으로부터 상기 기입 항목 각각에 대응되는 필드값을 추출하는 단계 및 상기 기입 항목 각각에 대하여 추출된 상기 필드값을 기입하는 단계를 포함할 수 있다.

또한, 상기 필드값을 추출하는 단계는, 상기 대화 입력에서 상기 기입 항목에 대응하여 기입될 내용을 포함하는 발화 부분을 상기 필드값으로 추출하는 것일 수 있다.

또한, 상기 대화 입력을 수신하는 단계는, 질문자 및 응답자를 포함하는 복수의 주체에 의해 수행된 제1타입 대화 입력 또는 응답자에 해당하는 하나의 주체에 의해 수행된 제2타입 대화 입력을 수신할 수 있다.

또한, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은, 상기 제1타입 대화 입력을 상기 질문자에 의해 수행된 질문자 발화 및 상기 응답자에 의해 수행된 응답자 발화로 분류하는 단계를 포함할 수 있다.

또한, 상기 필드값을 추출하는 단계는, 상기 기입 항목에 해당하는 부분을 상기 질문자 발화로부터 탐색하고, 탐색된 기입 항목이 포함된 상기 질문자 발화에 대하여 소정 수준 이내로 인접한 상기 응답자 발화에서 해당 기입 항목에 대응하여 기입될 상기 필드값을 추출할 수 있다.

또한, 상기 필드값을 추출하는 단계는, 상기 필드값이 추출된 상기 응답자 발화에 대하여 후속하는 상기 질문자 발화에서 기 추출된 상기 필드값에 상응하는 발화 부분이 재차 탐색되면, 상기 탐색된 발화 부분으로 상기 필드값을 갱신할 수 있다.

또한, 상기 필드값을 기입하는 단계는, 상기 추출된 필드값을 대응되는 기입 항목의 속성에 따라 정규화하는 단계를 포함할 수 있다.

또한, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은, 입력되는 중인 상기 전자문서를 형상화한 전자문서 인터페이스를 상기 질문자가 보유한 제1사용자 단말 및 상기 응답자가 보유한 제2사용자 단말 중 적어도 하나에 표시하는 단계를 포함할 수 있다.

또한, 상기 표시하는 단계는, 상기 전자문서 인터페이스에서 상기 필드값이 입력되는 중인 영역이 미리 설정된 소정의 시간 동안 하이라이트 되도록 표시할 수 있다.

또한, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은, 상기 질문자가 보유한 제1사용자 단말 및 상기 응답자가 보유한 제2사용자 단말 중 적어도 하나에 입력이 완료된 상기 전자문서를 형상화한 전자문서 확인 인터페이스를 표시하는 단계를 포함할 수 있다.

또한, 상기 전자문서 확인 인터페이스를 표시하는 단계는, 상기 전자문서 확인 인터페이스에서 상기 필드값이 미입력된 영역 또는 상기 필드값이 오입력된 영역이 구분되어 표시되도록 할 수 있다.

한편, 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치는, 소정의 전자문서의 작성과 연계된 대화 입력을 수신하는 대화 수신부, 상기 전자문서의 서식에 기초하여 상기 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 리스트 생성부, 상기 대화 입력으로부터 상기 기입 항목 각각에 대응되는 필드값을 추출하는 필드값 추출부 및 상기 기입 항목 각각에 대하여 추출된 상기 필드값을 기입하는 기입부를 포함할 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.

전술한 본원의 과제 해결 수단에 의하면, 자연스럽게 이루어지는 대화를 입력으로 수신하여 전자문서의 폼 서식을 기초로 자동으로 추출된 필드(질문)를 통해 해당 서식의 전자문서를 자동 입력할 수 있는 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법을 제공할 수 있다.

전술한 본원의 과제 해결 수단에 의하면, 대화를 진행하는 사용자들이 직접 대면하지 않는 상태에서 문서를 작성해야 하는 경우, 손을 사용하기 어렵거나 다른 작업과 병행하여 문서를 작성해야 하는 경우 등 필기 기반, 텍스트 입력 기반의 방식으로는 문서의 작성이 어려운 상황에서도 자연스러운 대화를 통해 편리하게 전자문서를 작성할 수 있다.

전술한 본원의 과제 해결 수단에 의하면, 시각 장애인, 손, 팔 등의 거동이 불편한 사람 등 종래의 방식으로 문서를 작성하기 어려운 사람도 쉽게 전자문서를 작성할 수 있다.

다만, 본원에서 얻을 수 있는 효과는 상기된 바와 같은 효과들로 한정되지 않으며, 또 다른 효과들이 존재할 수 있다.

도 1은 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치를 포함하는 전자문서 시스템의 개략적인 구성도이다.
도 2는 소정의 전자문서의 서식에 기초하여 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 것을 설명하기 위한 개념도이다.
도 3a는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 수신된 대화 입력이 텍스트 타입의 지문으로 변환된 것을 나타낸 도면이다.
도 3b는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 지문화된 대화 입력이 질문자 발화 및 응답자 발화로 분류되는 것을 나타낸 도면이다.
도 3c는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 발화 분류를 포함하는 지문화된 대화 입력으로부터 필드 리스트 내의 기입 항목 각각에 대응하는 필드값을 추출하는 과정을 설명하기 위한 도면이다.
도 3d는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 발화 분류를 미포함하는 지문화된 대화 입력으로부터 필드 리스트 내의 기입 항목 각각에 대응하는 필드값을 추출하는 과정을 설명하기 위한 도면이다.
도 4는 필드 리스트 내의 기입 항목에 각각에 대응하여 추출된 필드값 및 추출된 필드값의 정규화 결과를 나타낸 도표이다.
도 5a는 질문자가 작성하고자 하는 전자문서에 대한 필드 리스트를 확인하면서 응답자와 대화를 수행하는 본원의 일 실시예를 설명하기 위한 개념도이다.
도 5b는 대화 입력에 포함된 발화 각각을 스크립트 방식으로 형상화한 전자문서 인터페이스를 예시적으로 나타낸 도면이다.
도 5c는 하나의 전자문서가 시간의 흐름에 따라 분할된 복수의 대화 입력을 기초로 입력되는 본원의 일 실시예를 설명하기 위한 개념도이다.
도 6a 및 도 6b는 전자문서 인터페이스에서 필드값이 입력되는 중인 영역이 하이라이트 되도록 표시되는 것을 설명하기 위한 도면이다.
도 7은 체크박스 타입에 해당하는 복수의 기입 항목에 대한 동시 기입 처리 또는 일괄 기입 처리를 설명하기 위한 도면이다.
도 8은 응답자에 해당하는 하나의 주체에 의해 수행되는 대화 입력을 기초로 소정의 전자문서를 입력하는 본원의 일 실시예에 따른 전자문서 시스템의 개략적인 구성도이다.
도 9a는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 수신된 하나의 주체에 의해 수행되는 대화 입력에 기초한 텍스트 타입의 지문 변환 및 해당 전자문서의 서식에 기초하여 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 것을 설명하기 위한 개념도이다.
도 9b는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스가 사용자 단말에 표시되는 방식을 설명하기 위한 도면이다.
도 9c는 입력이 완료된 전자문서를 형상화한 전자문서 확인 인터페이스가 사용자 단말에 표시되는 방식을 설명하기 위한 도면이다.
도 10a 내지 도 10c는 복수의 질문자를 포함하거나 복수의 응답자를 포함하는 등 다수 발화자를 포함하는 대화 상황에서 단일 전자문서 또는 복수의 전자문서가 생성되는 본원의 일 실시예를 설명하기 위한 도면이다.
도 11은 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치의 개략적인 구성도이다.
도 12는 본원의 일 실시예에 따른 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법에 대한 동작 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.

본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

도 1은 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치를 포함하는 전자문서 시스템의 개략적인 구성도이다.

도 1을 참조하면, 본원의 일 실시예에 따른 전자문서 시스템(10)은 대화 인식을 통한 서식 기반 전자문서 입력 장치(100)(이하, '전자문서 입력 장치(100)'라 한다.)를 포함할 수 있다. 또한, 후술하는 도 10a를 참조하면, 전자문서 시스템(10)은 제1사용자 단말(200) 및 제2사용자 단말(300)을 포함할 수 있다. 본원의 일 실시예에 따른 전자문서 시스템(10)은 전자문서 입력 장치(100)를 통하여(또는, 본원의 구현예에 따라 전자문서 입력 장치(100)와 사용자 단말(200, 300)의 상호 작용을 통하여) 전자문서를 작성하고, 작성된 전자문서를 제공(표시)할 수 있는 시스템을 의미할 수 있다. 본원의 구현예에 따라, 전자문서 입력 장치(100)는 사용자 단말(200, 300)과 동일한 서버 또는 장치일 수 있다.

전자문서 입력 장치(100), 제1사용자 단말(200) 및 제2사용자 단말(300) 상호간은 네트워크(20)를 통해 통신할 수 있다. 네트워크(20)는 단말들 및 서버들과 같은 각각의 노드 상호간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크(20)의 일 예에는, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5G 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), wifi 네트워크, 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.

제1사용자 단말(200) 및 제2사용자 단말(300)은 예를 들면, 스마트폰(Smartphone), 스마트패드(SmartPad), 태블릿 PC등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 무선 통신 장치일 수 있다. 특히, 제1사용자 단말(200) 및 제2사용자 단말(300)은, 스마트 스피커(Smart Speaker), 스마트 카(Smart Car), 스마트 가전(Smart Appliances), 웨어러블 장치(Wearable Device) 증강현실기기 (VR/MR) 등 새롭게 생겨나는 각종 통신기술을 이용한 다양한 음향기기, 구동기기 등을 포함할 수 있다.

본원의 실시예에 관한 설명에서 제1사용자 단말(200)은 질문자(A)가 보유한 사용자 단말을 지칭하는 것일 수 있다. 또한, 본원의 실시예에 관한 설명에서 제2사용자 단말(300)은 응답자(B)가 보유한 사용자 단말을 지칭하는 것일 수 있다. 본원의 일 실시예에 따른 전자문서 시스템(10)은 제1사용자 단말(200) 및 제2사용자 단말(300) 모두를 포함하거나 제1사용자 단말(200) 및 제2사용자 단말(300) 중 어느 하나만을 포함하도록 구현될 수 있다.

예를 들어, 질문자(A)가 관공서, 은행, 증권사, 통신사 등에 근무하는 공무원 또는 직원이고 응답자(B)가 해당 관공서, 은행, 증권사, 통신사 등에 방문한 민원인 또는 고객인 경우, 질문자(A)가 보유한 제1사용자 단말(200)을 통해 획득된 질문자(A)와 응답자(B)의 대화 입력이 전자문서 입력 장치(100)로 전달되어 전자문서 입력 장치(100)가 수신한 대화 입력에 기초하여 소정의 전자문서를 작성하는 것일 수 있다.

다른 예로, 질문자(A)와 응답자(B)가 원격에서 대화(예를 들면, 전화 상황 등)하는 경우, 원격의 대화를 위하여 질문자(A) 측 제1사용자 단말(200) 및 응답자(B) 측 제2사용자 단말(300)이 모두 구비되어 제1사용자 단말(200) 및 제2사용자 단말(300)을 통해 획득된 질문자(A)와 응답자(B)의 대화 입력이 전자문서 입력 장치(100)로 전달되어 전자문서 입력 장치(100)가 수신한 대화 입력에 기초하여 소정의 전자문서를 작성하는 것일 수 있다.

또 다른 예로, 별도의 질문자(A)가 존재하지 않고, 응답자(B)가 제2사용자 단말(300)을 통해 응답자(B) 혼자 발화하는 형태의 대화 입력을 전자문서 입력 장치(100)에 전달(인가)하고, 전자문서 입력 장치(100)가 제2사용자 단말(300)을 통해 획득된 대화 입력을 기초로 하여 소정의 전자문서를 작성하는 것일 수 있다.

또한, 실시예에 따라, 제1사용자 단말(200) 또는 제2사용자 단말(300)은 전자문서 입력 장치(100)가 작성 중인 전자문서 또는 작성이 완료된 전자문서를 표시하기 위한 디스플레이를 포함할 수 있다.

이와 관련하여, 본원의 일 실시예에 따른 전자문서 입력 장치(100)는 제1사용자 단말(200) 또는 제2사용자 단말(300)이 디스플레이를 포함하는 경우, 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스를 제1사용자 단말 및 상기 응답자가 보유한 제2사용자 단말 중 적어도 하나에 표시함으로써 질문자(A)와 응답자(B) 또는 단일 응답자(B)가 실시간으로 대화 입력에 의한 전자문서 작성(기입) 상황을 확인하도록 구현될 수 있다. 여기서, 실시간으로 대화 입력에 의한 전자문서 작성 상황을 확인한다는 것은 전자문서 입력 장치(100)가 사용자 단말(200, 300)에 마련된 디스플레이 화면을 통해 작성 중인 전자문서에 대한 시각적인 피드백을 제공하는 것으로 이해될 수 있다.

본원의 일 실시예에 따르면, 질문자(A)는 제1사용자 단말(200)의 화면을 통해서, 응답자(B)는 제2사용자 단말(300)의 화면을 통해서 개별적으로 작성중인 전자문서를 형상화한 전자문서 인터페이스를 확인할 수 있는 멀티 스크린 환경에서 대화 및 전자문서 작성이 수행되는 것일 수 있다.

또한, 본원의 구현예에 따라, 제1사용자 단말(200) 또는 제2사용자 단말(300)이 전자문서 인터페이스를 표시할 수 있는 디스플레이를 포함하는 경우라도 질문자(A) 또는 응답자(B)가 사용자 단말의 디스플레이를 확인할 수 없는 상황에 놓인 경우(예를 들어, 스마트폰 등의 사용자 단말의 메인 화면에 다른 어플리케이션이 실행되어야 하는 경우, 다른 작업을 병행하는 경우 등)에는 입력되는 중인 전자문서에 대한 인터페이스 표시는 생략하되, 소정의 전자문서에 대한 작성이 완료된 후 입력이 완료된 전자문서를 형상화한 전자문서 확인 인터페이스를 표시하고, 전자문서 확인 인터페이스를 통해 오입력된 기입 항목이나 미입력된 기입 항목을 질문자(A) 또는 응답자(B)가 확인하고, 이러한 오입력 내지 미입력 항목을 사용자 단말(200, 300)을 통해 추후 보완하도록 구현될 수도 있다.

도 2는 소정의 전자문서의 서식에 기초하여 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 것을 설명하기 위한 개념도이다.

도 2를 참조하면, 전자문서 입력 장치(100)는 전자문서의 서식에 기초하여 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성할 수 있다. 달리 말해, 전자문서 입력 장치(100)는 기 생성된 전자문서 템플릿 내의 각각의 기입 항목에 해당하는 복수의 입력 컴포넌트를 추출하여 목록화할 수 있다.

또한, 전자문서 입력 장치(100)는 필드 리스트 내의 추출된 기입 항목 각각에 대한 순서를 결정할 수 있다. 이와 관련하여, 전자문서 입력 장치(100)는 필드 리스트 내의 복수의 기입 항목들의 순서에 기초하여 후술하는 전자문서 인터페이스(입력되는 중인 전자문서가 형상화된 인터페이스)에서 소정의 기입 항목에 대한 필드값이 입력되면 결정된 기입 항목들 간의 순서에 기초하여 해당 기입 항목의 다음 순서에 해당하는 기입 항목이 하이라이트 되도록 표시(활성화 표시)되도록 동작할 수 있다.

또한, 도 2를 참조하면, 전자문서 입력 장치(100)는 사용자(질문자 및 응답자 또는 단일 응답자)가 작성하려는 전자문서의 서식(1)의 유형에 기초하여, 사용자의 발화로부터 전자문서의 완성을 위한 데이터를 수집하기 위하여 필요한 기입 항목 각각에 연계되는 질문 형태의 필드 리스트를 생성할 수 있다.

예시적으로, 도 2를 참조하면, 전자문서의 서식(1)이 통신사에서 제공하는 소정의 서비스를 가입하기 위한 신청서 양식에 해당하는 경우, 전자문서 입력 장치(100)는 신청서 양식으로부터 기입 항목인 신청 서비스명, 신청자 전화번호, 신청자 생년월일, 신청자 성명, 신청자 사용 모바일 기기 기종, 신청 일시, 서비스 개통 시간 등을 확인하기 위한 질문 형태의 필드 리스트(List)를 생성할 수 있다. 예를 들어, 필드 리스트(List) 내의 질문은 '신청자 전화번호는?'과 같이 해당 전자문서의 서식(1)의 기입 항목(필드명, 필드, Field)을 질문 내에 포함하는 직접적인 형식을 가질 수 있으나, 이에만 한정되는 것은 아니다.

전자문서 입력 장치(100)는 소정의 전자문서의 작성과 연계된 대화 입력을 수신할 수 있다. 예를 들어, 전자문서 입력 장치(100)는 제1사용자 단말(200) 또는 제2사용자 단말(300)에 마련된 음성 입력 수신 모듈(예를 들어, 마이크 모듈 등)에 의해 획득된 대화 입력을 제1사용자 단말(200) 또는 제2사용자 단말(300)로부터 획득하는 것일 수 있다.

또한, 전자문서 입력 장치(100)는 생성된 필드 리스트에 기초하여 전자문서 입력 장치(100)에 수신된 대화 입력으로부터 전자문서를 작성할 수 있다.

구체적으로, 전자문서 입력 장치(100)는 수신된 대화 입력으로부터 생성된 필드 리스트 내의 기입 항목 각각에 대응되는 필드값을 추출할 수 있다. 본원의 일 실시예에 따르면, 전자문서 입력 장치(100)는 수신된 대화 입력 및 미리 생성된 필드 리스트에 기초하여 필드 리스트 내의 기입 항목 각각에 대응되는 발화를 대화 입력으로부터 추출하기 위한 인공지능 알고리즘을 탑재할 수 있다. 예를 들어, 전자문서 입력 장치(100)에 탑재되는 인공지능 알고리즘은 스스로 문서를 분석하고 질문에 대한 최적의 답을 찾도록 미리 학습된 기계 독해(Machine Reading Comprehension, MRC) 알고리즘과 연계된 것일 수 있다.

이와 관련하여, 전자문서 입력 장치(100)는 수신된 대화 입력을 문서 형태로 지문화하여 기계 독해 알고리즘에 제공하고, 작성하려는 전자문서의 서식(1)에 대하여 미리 생성된 질문 형태의 복수의 기입 항목을 포함하는 필드 리스트를 기계 독해 알고리즘에 입력함으로써 지문화된 대화 입력으로부터 기입 항목에 대응하는 발화 부분(달리 말해, 필드 리스트의 질문에 대한 답변에 해당하는 발화 부분)을 필드값으로 추출하여 전자문서의 서식(1)을 완성해나갈 수 있다.

달리 말해, 전자문서 입력 장치(100)가 대화 입력으로부터 필드값을 추출하는 것은, 전자문서 입력 장치(100)가 수신된 대화 입력에서 기입 항목 각각에 대응하여 기입될 내용을 포함하는 발화 부분을 추출하는 것으로 이해될 수 있다.

또한, 본원의 일 실시예에 따르면, 전자문서 입력 장치(100)는 동등한 의미를 내포하는 발화로부터 하나의 기입 항목을 인식하기 위한 동의어 인식 알고리즘을 구비할 수 있다.

또한, 전자문서 입력 장치(100)는 전자문서의 서식의 기입 항목에 해당하는 부분(영역)에 추출된 필드값을 필드 리스트 내의 기입 항목 각각에 대하여 기입할 수 있다.

구체적으로, 전자문서 입력 장치(100)는 질문자(A) 및 응답자(B)를 포함하는 복수의 주체에 의해 수행된 제1타입 대화 입력 또는 응답자(B)에 해당하는 하나의 주체에 의해 수행된 제2타입 대화 입력을 수신할 수 있다.

이하에서는, 먼저 전자문서 입력 장치(100)가 복수의 주체에 의해 수행된 제1타입 대화 입력으로부터 전자문서를 작성하는 실시예에 관하여 설명한 다음, 전자문서 입력 장치(100)가 하나의 주체에 의해 수행된 제2타입 대화 입력으로부터 전자문서를 작성하는 실시예에 관하여 서술하고, 도 10a 내지 도 10c를 참조하여 다수 발화자를 포함하는 대화 상황에서 단일 전자문서 또는 복수의 전자문서를 작성하는 실시예에 관하여 후술하도록 한다.

전자문서 입력 장치(100)는 질문자(A) 및 응답자(B)를 포함하는 복수의 주체에 의해 수행된 제1타입 대화 입력을 수신할 수 있다. 본원의 일 실시예에 따르면, 제1타입 대화 입력을 통한 전자문서 입력 실시예는, 병원에서의 치료 컨설팅, 보험 가입 후 확인 전화, 전화 주문 혹은 예약 상황 등 전자문서의 완성을 위하여 획득해야 하는 정보의 유형이 정해져 있고, 해당 정보를 획득하기 위하여 주로 질문 혹은 가이드를 제공하는 질문자(A)와 주로 답변을 하는 응답자(B)가 구분되는 전자문서 서식(폼, 템플릿)에 적합할 수 있으나, 이에만 한정되는 것은 아니다.

도 3a는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 수신된 대화 입력이 텍스트 타입의 지문으로 변환된 것을 나타낸 도면이다.

도 3a를 참조하면, 전자문서 입력 장치(100)는 수신된 제1타입 대화 입력을 텍스트 타입의 지문으로 변환할 수 있다. 즉, 전자문서 입력 장치(100)는 수신된 대화 입력을 지문화할 수 있다. 이와 관련하여, 전자문서 입력 장치(100)는 당해 기술 분야에서 널리 알려진 적어도 하나의 음성 인식 알고리즘 또는 텍스트 형식으로의 변환을 위한 STT(Speech-To-Text) 기법을 활용하는 것일 수 있다. 참고로, 전자문서 입력 장치(100)가 수신된 대화 입력을 텍스트 타입의 지문으로 변환하는 프로세스는 후술하는 단일 응답자(B)에 의한 제2타입 대화 입력이 수신되는 경우에도 동일하게 수행될 수 있다.

도 3b는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 지문화된 대화 입력이 질문자 발화 및 응답자 발화로 분류되는 것을 나타낸 도면이다.

도 3b를 참조하면, 전자문서 입력 장치(100)는 제1타입 대화 입력을 질문자(A)에 의해 수행된 질문자 발화(도 3b를 참조하면, "A:" 으로 표시된 발화 부분) 및 응답자(B)에 의해 수행된 응답자 발화(도 3b를 참조하면, "B:" 으로 표시된 발화 부분)로 분류할 수 있다. 본원의 일 실시예에 따르면, 전자문서 입력 장치(100)는 질문자 발화 및 응답자 발화의 구분을 위한 화자 식별(Speaker Identification) 알고리즘을 구비할 수 있다.

도 3c는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 발화 분류를 포함하는 지문화된 대화 입력으로부터 필드 리스트 내의 기입 항목 각각에 대응하는 필드값을 추출하는 과정을 설명하기 위한 도면이다. 참고로, 도 3c은, 지문화된 대화 입력에서 추출된 기입 항목을 볼드체로 표시하고, 기입 항목에 대응하여 추출된 필드값에 밑줄 표시하여 나타낸 것일 수 있다.

도 3c를 참조하면, 본원의 일 실시예에 따른 전자문서 입력 장치(100)는 기입 항목에 해당하는 부분을 질문자 발화로부터 탐색할 수 있다. 또한, 전자문서 입력 장치(100)는 탐색된 기입 항목이 포함된 질문자 발화에 대하여 소정 수준 이내로 인접한 응답자 발화에서 해당 기입 항목에 대응하여 기입될 필드값을 추출할 수 있다.

또한, 본원의 일 실시예에 따르면, 전자문서 입력 장치(100)는 필드값이 추출된 응답자 발화에 대하여 후속하는 질문자 발화 또는 응답자 발화에서 기 추출된 필드값에 상응하는 발화 부분이 재차 탐색되면, 탐색된 발화 부분으로 필드값을 갱신할 수 있다. 달리 말해, 이미 선행된 질문자 발화 또는 응답자 발화를 통해 필드값이 추출된 기입 항목에 대하여도 질문자(A)가 해당 필드값의 내용을 응답자(B)로부터 재차 정확하게 확인하는 재질문 과정에서 올바르게 갱신되도록 함으로써 오입력된 필드값이 정정될 수 있다. 즉, 응답자(B)가 필드값을 명확하게 발화하지 않은 경우, 질문자(A)가 재발화 또는 재질문을 진행하면 올바른 필드값이 입력될 수 있다.

도 3d는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 발화 분류를 미포함하는 지문화된 대화 입력으로부터 필드 리스트 내의 기입 항목 각각에 대응하는 필드값을 추출하는 과정을 설명하기 위한 도면이다. 참고로, 도 3d은, 지문화된 대화 입력에서 추출된 기입 항목을 볼드체로 표시하고, 기입 항목에 대응하여 추출된 필드값에 밑줄 표시하여 나타낸 것일 수 있다

도 3d를 참조하면, 전자문서 입력 장치(100)는 지문화된 대화 입력이 응답자 발화 및 질문자 발화로 구분되지 않더라도 전체 발화로부터 기입 항목에 해당하는 부분을 탐색하고, 탐색된 기입 항목에 해당하는 부분과 인접하여 발화된 필드값을 추출할 수 있다.

예를 들어, 전자문서 입력 장치(100)는 응답자(B)가 '신청자 이름은 홍길동입니다'와 같이 기입 항목을 스스로 언급한 발화 또는 질문자(A)가 '신청자 성함이 홍길동이라고 말씀해주신 것이 맞나요'와 같이 응답자(B)의 발화를 확인하는 과정에서 기입 항목이 포함된 발화 등에서 기입 항목에 해당하는 부분(전술한 예시에서 '신청자 이름', '신청자 성함' 등)을 발화로부터 탐색하고, 탐색된 기입 항목이 포함된 발화 및 해당 발화와 소정 수준 이내로 인접한 발화 중 적어도 하나의 발화에서 해당 기입 항목에 대응하여 기입될 필드값(전술한 예시에서 '홍길동')을 추출할 수 있다.

종합하면, 본원의 일 실시예에 따른 전자문서 입력 장치(100)는 도 3b 및 도 3c에 도시된 바와 같이 대화 입력을 응답자 발화 및 질문자 발화를 분류하는 기능을 구비함으로써 응답자 발화와 질문자 발화로 구분되는 분류 결과를 고려하여 기입 항목을 탐색하고 대응하는 필드값을 추출하거나 도 3d에 도시된 바와 같이 대화 입력에 포함된 발화 각각을 수행한 주체를 구분(분류)하는 기능을 구비하지 않더라도 발화 전체로부터 기입 항목을 탐색하고 대응하는 필드값을 추출함으로써 전자문서를 작성하도록 동작할 수 있다.

도 4는 필드 리스트 내의 기입 항목에 각각에 대응하여 추출된 필드값 및 추출된 필드값의 정규화 결과를 나타낸 도표이다.

도 4를 참조하면, 전자문서 입력 장치(100)는 추출된 필드값을 대응되는 기입 항목의 속성에 따라 정규화할 수 있다. 이와 관련하여, 전자문서 입력 장치(100)가 추출하는 필드값은 전자문서 기입 항목에 대하여 입력될 내용과 함께 정제되지 않은 발화 일부가 포함될 수 있으며, 이는 최종적으로 전자문서 입력 장치(100)에 의해 정규화되어 전자문서 기입 항목에 기입될 수 있다.

예를 들어, 전자문서 입력 장치(100)는, 추출된 필드값에서 조사에 해당하는 분절을 제거하는 프로세스를 수행할 수 있다.

또한, 본원의 일 실시예에 따르면, 전자문서 입력 장치(100)는, 필드값에 대한 형태소 분석 결과에 기초하여 필드값에서 탐지된 실질 형태소를 변환하는 정규화 프로세스(예를 들어, 탐지된 실질 형태소가 '텍스트 타입'의 기입 항목에 대한 것인 경우, 탐지된 실질 형태소에 '-ㅁ' 또는 '-음' 등을 결합하여 명사 형태로 변환하거나, 탐지된 실질 형태소가 '날짜 타입'의 기입 항목에 대한 것인 경우, 탐지된 실질 형태소를 날짜 형식(예를 들면, 년-월-일 꼴)으로 변환하거나, 해당 기입 항목의 형식이 콤보박스, 체크박스, 라디오 버튼 등 탐지된 실질 형태소 자체를 기입하기에 적절치 못한 경우 레벤슈타인 편집 거리 알고리즘에 기초하여, 탐지된 실질 형태소에 포함된 내용과 가장 근접한 콤보박스, 체크박스, 라디오 버튼을 선택하는 프로세스) 등을 수행할 수 있다.

예를 들어, 도 4를 참조하면, 전자문서 입력 장치(100)는 '날짜 타입'의 기입 항목인 신청날짜에 대하여 추출된 필드값이 '2019년 12월 06일'인 경우, 추출된 필드값을 날짜 형식에 부합하는 '2019-12-06'으로 정규화할 수 있다.

또한, 전자문서 입력 장치(100)는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스를 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300) 중 적어도 하나에 표시할 수 있다.

도 5a는 질문자가 작성하고자 하는 전자문서에 대한 필드 리스트를 확인하면서 응답자와 대화를 수행하는 본원의 일 실시예를 설명하기 위한 개념도이다.

도 5b를 참조하면, 본원의 일 실시예에 따르면, 질문자(A)가 전자문서 입력 장치(100)(다른 예로, 질문자(A)가 보유한 제1사용자 단말(200) 등)에 표시되는 전자문서 인터페이스에 나타나는 필드 리스트를 확인하면서 응답자(B)에게 적절한 응답을 유도하기 위한 질문을 제공할 수 있도록 전자문서 입력 장치(100) 또는 제1사용자 단말(200)은 작성중인 전자문서의 서식에 기초하여 기 생성된 필드 리스트를 표시(출력)할 수 있다. 이에 따라, 질문자(A)는 전자문서의 완성을 위하여 필요한 정보를 응답자(B)가 제공하도록 필드 리스트를 참조하여 질문을 함으로써 적절하게 대화를 이끌어 나갈 수 있다.

도 5b는 대화 입력에 포함된 발화 각각을 스크립트 방식으로 형상화한 전자문서 인터페이스를 예시적으로 나타낸 도면이다.

도 5b를 참조하면, 스크립트 방식(예시적으로, Dialog flow 방식으로 달리 지칭될 수 있다.)으로 표시된 전자문서 인터페이스는 질문자 발화와 응답자 발화를 구분하여 표시할 수 있다. 예를 들어, 스크립트 방식으로 표시된 전자문서 인터페이스는 질문자 발화는 상대적으로 상측(하측)에 배치되도록 형상화하고 응답자 발화는 상대적으로 하측(상측)에 배치되도록 형상화할 수 있으나, 이에만 한정되는 것은 아니다. 다른 예로, 실시간 표시되는 스크립트 방식의 전자문서 인터페이스는 시간의 흐름에 따라 현재 입력되는 중인 발화와 해당 발화 이전에 수신된 발화를 구분하여 표시하도록 형상화될 수 있다.

도 5c는 하나의 전자문서가 시간의 흐름에 따라 분할된 복수의 대화 입력을 기초로 입력되는 본원의 일 실시예를 설명하기 위한 개념도이다.

도 5c를 참조하면, 전자문서 입력 장치(100)는 수신된 대화 입력 또는 수신된 대화 입력에 기초하여 지문화된 대화 입력을 시간에 흐름에 따라 분할된 복수의 대화 입력으로 분할하고, 분할된 복수의 대화 입력 각각에 기초하여 하나의 전자문서 서식 내 서로 다른 영역을 기입하도록 동작할 수 있다.

예를 들어, 질문자(A)와 응답자(B) 사이의 대화 입력을 실시간으로 수신하여 수신된 대화 입력에 기초하여 전자문서가 작성되는 경우, 전자문서 입력 장치(100)는 대화 중지(정지)를 위한 사용자 입력을 수신할 수 있고, 대화 중지(정지)를 위한 사용자 입력이 수신되면, 이후 시점에 인가되는 대화 입력은 전자문서 작성에 활용되지 않도록 비활성화(Pause)할 수 있다. 그 상태에서 전자문서 입력 장치(100)는 대화 재개를 위한 사용자 입력을 수신할 수 있고, 대화 재개를 위한 사용자 입력이 수신되면, 이후 시점에 인가되는 대화 입력은 재차 전자문서 작성에 활용되도록 활성화(Play)될 수 있다. 구체적으로, 도 5c를 참조하면, 예를 들어 한 쌍의 대화 중지(정지)를 위한 사용자 입력 및 대화 재개를 위한 사용자 입력이 인가됨으로써(도 5c의

) 전제 대화 입력이 Dialog 1 내지 Dialog 3으로 분할될 수 있다.

달리 말해, 전자문서 입력 장치(100)는 하나의 전자문서에 대하여 대화(지문)을 여러 번 끊어서 반복적으로 입력할 수 있다. 즉, 전자문서 입력 장치(100)는 분할된 복수의 대화 입력에 기반한 전자문서 작성 기능을 구비할 수 있다.

도 6a 및 도 6b는 전자문서 인터페이스에서 필드값이 입력되는 중인 영역이 하이라이트 되도록 표시되는 것을 설명하기 위한 도면이다.

도 6a 및 도 6b를 참조하면, 전자문서 입력 장치(100)는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스에서 필드값이 입력되는 중인 영역(필드값이 추출된 기입 항목 영역)이 하이라이트 되도록 표시할 수 있다. 도 5a 및 도 5b를 참조하면, 하이라이트 되도록 표시하는 것은 필드값이 입력되는 중인 영역에 해당하는 기입 칸이 굵은 테두리로 구분되게 강조되거나 다른 기입 칸과 구분되는 색상으로 표시되는 등 다양하게 구현될 수 있다.

예를 들어, 전자문서 입력 장치(100)는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스에서 필드값이 입력되는 중인 영역(필드값이 추출된 기입 항목 영역)이 미리 설정된 소정의 시간 동안 하이라이트 되도록 표시할 수 있다.

도 7은 체크박스 타입에 해당하는 복수의 기입 항목에 대한 동시 기입 처리 또는 일괄 기입 처리를 설명하기 위한 도면이다.

도 7을 참조하면, 본원의 일 실시예에 따른 전자문서 입력 장치(100)는 서식에서 요구하는 특성 사항에 대한 동의 여부 체크 등의 상황에서 활용되는 콤보박스, 체크박스, 라디오 버튼 등의 선택형 기입 항목에 대하여, 복수의 기입 항목에 대한 일괄 처리(그룹화 처리)를 수행할 수 있다.

예를 들어, 가입 서비스와 연계된 이벤트 정보 수신과 관련하여 SMS, E-MAIL, 우편물 또는 전화 방식이 가능하고 각각에 대한 개별적인 동의 여부를 획득해야 하는 경우, 질문자(A)가 '이벤트 정보는 어떤 방법으로 받아보시겠어요? SMS, E-Mail, 우편, 전화 방법이 가능합니다'라는 질문자 발화를 하고 응답자(B)가 'SMS랑 이메일 할게요'라는 응답자 발화를 제공한 경우, 전자문서 입력 장치(100)는 미리 그룹화된 4가지 기입 항목에 대하여 일괄적으로 SMS 및 E-MAIL에 대하여는 '동의'를 기입하고, 우편물 및 전화에 대하여는 '미동의'를 기입하도록 동작할 수 있다. 이렇듯, 전자문서 입력 장치(100)는 필드 리스트 내의 각각의 기입 항목에 대하여 미리 설정된 계층 구조 정보 또는 그룹핑 정보를 보유하여 이를 기초로 복수의 기입 항목에 대한 일괄 기입 처리를 수행할 수 있다.

도 8은 응답자에 해당하는 하나의 주체에 의해 수행되는 대화 입력을 기초로 소정의 전자문서를 입력하는 본원의 일 실시예에 따른 전자문서 시스템의 개략적인 구성도이다.

도 8을 참조하면, 응답자(B)에 해당하는 하나의 주체에 의해 수행되는 제2타입 대화 입력을 기초로 전자문서를 작성하는 실시예는, 체크 리스트, 일지 등 비교적 정형화된 형식 내에서 반복적인 정보를 제공함으로써 입력되고, 응답자(B)가 전자문서의 완성을 위하여 어떠한 정보를 입력(제공)해야 하는지 비교적 정확하게 인지하고 상황 또는 전자문서 작성과 함께 다른 작업을 병행해야 하는 상황 등 문서를 텍스트 입력 등을 통해 작성하는 것 보다 음성 발화로 작성하는 것이 편리한 상황 등에 유리할 수 있다.

도 9a는 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치에 의해 수신된 하나의 주체에 의해 수행되는 대화 입력에 기초한 텍스트 타입의 지문 변환 및 해당 전자문서의 서식에 기초하여 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 것을 설명하기 위한 개념도이다.

도 9a를 참조하면, 전자문서 입력 장치(100)는 제2타입 대화 입력에 기초하여 전자문서를 작성할 수 있도록 하는 소정 유형의 전자문서의 서식에 기초하여 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성할 수 있다. 본원의 일 실시예에 따르면, 제2타입 대화 입력(a)에 기초하여 전자문서를 작성하고자 하는 사용자(응답자)는 생성된 필드 리스트(질문 리스트, (b))를 고려하여 기입 항목에 대한 발화 부분 및 기입 항목에 대한 발화 부분에 후속하며 해당 기입 항목에 대응되는 필드값을 포함하는 발화 부분을 반복하여 발화함으로써 전자문서를 작성할 수 있다. 본원의 일 실시예에 따르면, 사용자(응답자)가 혼자 발화하는 상황에서의 전자문서 작성(달리 말해, 제2타입 대화 입력에 기초한 전자문서 작성) 프로세스가 원활히 수행되도록 전자문서 입력 장치(100)는 생성된 필드 리스트(질문 리스트)가 전자문서 입력 장치(100) 또는 제2사용자 단말(300)에 표시되도록 할 수 있다.

도 9b는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스가 사용자 단말에 표시되는 방식을 설명하기 위한 도면이다.

도 9b를 참조하면, 응답자(B)의 제2사용자 단말(300)의 화면에는 전자문서 인터페이스가 도 9b의 (a)에 도시된 필드 목록 방식으로 표시되거나, 도 9b의 (b)에 도시된 문서 템플릿 방식으로 표시되거나, 도 9b의 (c)에 도시된 스크립트 방식(예시적으로, Dialog flow 방식으로 달리 지칭될 수 있다.)으로 표시될 수 있다. 예를 들어, 필드 목록 방식은 미리 정의된 기입 항목(참고로, 본원의 실시예에 관한 설명에서 기입 항목은 입력 컴포넌트, 필드명, 필드 등으로 달리 지칭될 수 있다.) 및 해당 기입 항목에 대하여 전자문서에 입력된 정규화된 필드값이 요약된 형태로 표시되는 것을 의미할 수 있다. 또한, 문서 템플릿 방식은 미리 정의된 전자문서 서식(폼, 템플릿) 상에 정규화된 필드값이 해당 위치에 기입된 형태로 표시되는 것을 의미할 수 있다. 또한, 스크립트 방식은 응답자 발화(a1, a2 등)에 대한 식별 결과에 기초하여 대화 입력이 지문화되어 표시되는 것을 의미할 수 있다. 본원의 일 실시예에 따르면, 응답자(B)가 제2사용자 단말(300)의 화면을 확인하면서 실시간으로 전자문서를 작성하는 경우, 전자문서 입력 장치(100)는 제2사용자 단말(300)에 인가된 사용자 입력에 기초하여 전자문서 인터페이스의 표시 방식을 전술한 필드 목록 방식, 문서 템플릿 방식 및 스크립트 방식 중 어느 하나로 전환하도록 동작할 수 있다. 또한, 전자문서 입력 장치(100)는 제2사용자 단말(300)에 인가된 사용자 입력에 기초하여 기본으로 표시되는 표시 방식을 결정하거나 일부 표시 방식은 표출되지 않도록 하는 설정을 세팅할 수 있다.

도 9c는 입력이 완료된 전자문서를 형상화한 전자문서 확인 인터페이스가 사용자 단말에 표시되는 방식을 설명하기 위한 도면이다.

도 9c를 참조하면, 전자문서 확인 인터페이스에는 오류가 발생한 필드가 강조(예를 들면, 빨간색 폰트로 표시되거나 느낌표 아이콘 등의 식별 표지가 표출)될 수 있다. 또한, 전자문서 입력 장치(100)는 해당 전자문서 작성에 활용된 대화 입력을 기입 항목 각각에 대응하도록 분할된 부분 발화 데이터를 생성할 수 있다. 이와 관련하여, 전자문서 입력 장치(100)는 전자문서 확인 인터페이스에서 소정의 기입 항목을 선택하는 사용자 입력을 사용자 단말(200, 300)을 통해 수신하고, 선택된 기입 항목에 대하여 매칭되어 생성된 부분 발화 데이터를 사용자(응답자 또는 질문자)가 확인하여 사후적으로 수정할 수 있도록 부분 발화 데이터를 음성 형태 또는 스크립트 형태로 제공할 수 있다. 또한, 도 9c를 참조하면, 예를 들어, 음성 형태의 부분 발화 데이터가 재생되는 경우, 사용자 단말(200, 300)의 화면에는 재생 시간 정보, 재생 바 등을 포함하는 음성 재생 인터페이스(REC)가 표출될 수 있다. 또한, 도 9c를 참조하면, 스크립트 형태의 부분 발화 데이터가 표시되는 경우, 해당 기입 항목에서 요구하는 조건을 미충족하여 오입력으로 판단된 발화 부분이 강조 표시(예를 들어, 도 9를 참조하면, 빨간색 폰트로 표시)될 수 있다.

도 10a 내지 도 10c는 복수의 질문자를 포함하거나 복수의 응답자를 포함하는 등 다수 발화자를 포함하는 대화 상황에서 단일 전자문서 또는 복수의 전자문서가 생성되는 본원의 일 실시예를 설명하기 위한 도면이다.

구체적으로, 도 10a는 단일 질문자(A)와 복수의 응답자(B)를 포함하는 대화 상황을 나타낸 것이고, 도 10b는 복수의 질문자(A)와 단일 응답자(B)를 포함하는 대화 상황을 나타낸 것이고, 도 10c는 복수의 질문자(A) 및 복수의 응답자(B)를 포함하는 대화 상황을 나타낸 것이다.

또한, 본원의 일 실시예에 따르면, 도 10a 내지 도 10c를 통해 설명하는 다수 발화자를 포함하는 대화 상황 각각은 발화 참여자의 수에 따라 복수의 서로 다른 전자문서가 생성(복수 문서 생성 유형)되거나 발화 참여자 전체의 대화를 종합하여 하나의 단일한 전자문서가 생성(단일 문서 생성 유형)되는 것일 수 있다.

도 10a를 참조하면, 전자문서 입력 장치(100)는 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300)과 연계된 것일 수 있다. 예를 들어, 제1사용자 단말(200) 및 제2사용자 단말(300)은 발화자(응답자 및 질문자)의 음성 입력(대화 입력)을 수신하기 위한 음성 수신 모듈을 포함할 수 있으며, 실시예에 따라 입력되는 중인 전자문서 인터페이스를 표시하거나 입력이 완료된 전자문서 확인 인터페이스를 표시하는 디스플레이 모듈을 포함할 수 있다. 또한, 본원의 구현예에 따라 제1사용자 단말(200) 또는 제2사용자 단말(300)은 발화자의 상황, 대화 환경 등에 따라 일부 구비되지 않을 수 있다. 또한, 도 10a와 같이 복수의 응답자(B)를 포함하는 경우에도 응답자(B) 각각이 모두 제2사용자 단말(300)을 구비할 필요는 없다. 설명의 편의를 위하여 도 10b 및 도 10c에서는 제1사용자 단말(200) 및 제2사용자 단말(300)의 도시를 생략하였다.

참고로, 이하에서 설명하는 다수 발화자를 포함하는 대화 상황과 연계된 전자문서 작성 실시예는 질문자의 수를 Q로, 응답자의 수를 A로, 생성되는 전자문서의 수를 D로 간략하게 표현될 수 있다. 예들 들어, 앞서 상세히 서술한 한 명의 질문자(A)와 한 명의 응답자(B)의 대화 입력을 기초로 하나의 전자문서를 생성하는 실시예는 1Q/1A/1D 와 같이 표현될 수 있다.

도 10a를 참조하면, 예시적으로 전자문서 입력 장치(100)는 한 명의 질문자(A)가 복수의 응답자(B)에게 동일한 질문을 동시에 질의하고 복수의 응답자(B) 중 적어도 일부 인원 또는 전체 인원이 해당 질의에 대한 답변을 제공하는 형태의 대화 상황(예를 들면, Focus Group Interview 의견 수렴 폼 등)에서 수신된 대화 입력에 기초하여 하나의 전자문서를 작성(생성)할 수 있다(1Q/nA/1D).

다른 예로, 전자문서 입력 장치(100)는 한 명의 질문자(A)가 동일한 질문을 복수의 응답자(B)에게 질의하고, 응답자(B)들이 연속적으로 각자 질의에 대한 답변을 제공하는 형태의 대화 상황(예를 들면, Focus Group Interview 등)에서 수신된 대화 입력에 기초하여 응답자(B)의 수에 상응하는 수의 전자문서를 작성(생성)할 수 있다(1Q/nA/nD).

또한, 도 10b를 참조하면, 예를 들어, 전자문서 입력 장치(100)는 복수의 질문자(A)가 서로 다른 질문을 한 명의 응답자(B)에게 질의하고, 응답자(B)가 각각의 질의에 대한 답변을 제공하는 형태의 대화 상황(예를 들면, 면접 상황 등)에서 수신된 대화 입력에 기초하여 하나의 전자문서를 작성(생성)할 수 있다(mQ/1A/1D).

다른 예로, 전자문서 입력 장치(100)는 복수의 질문자(A)가 서로 다른 질문을 한 명의 응답자(B)에게 질의하고, 응답자(B)가 각각의 질의에 대한 답변을 제공하는 형태의 대화 상황(예를 들면, 면접 내용 정리 폼 등)에서 수신된 대화 입력에 기초하여 복수의 질문자(A) 각각에 대하여 서로 다른 폼을 사용한 질문자(A)의 수에 상응하는 수의 전자문서를 작성(생성)할 수 있다(mQ/1A/mD).

또한, 도 10c를 참조하면, 예시적으로 전자문서 입력 장치(100)는 복수의 질문자(A)가 서로 다른 질문을 질의하고, 복수의 응답자(B) 중 일부 인원 또는 전제 인원이 각각의 질문에 대한 답변을 제공하는 형태의 대화 상황(예를 들면, 토론 상황을 정리하기 위한 목적으로 여러 명의 답변을 취합하여 작성되는 폼 등)에서 수신된 대화 입력에 기초하여 하나의 전자문서를 작성(생성)할 수 있다(mQ/nA/1D).

다른 예로, 전자문서 입력 장치(100)는 복수의 질문자(A)가 응답자 그룹에게 서로 다른 질문을 질의하고, 응답자 그룹 내의 복수의 응답자(B) 중 적어도 일부 인원 또는 전체 인원이 답변을 제공하는 형태의 대화 상황에서 질문자 별로 서로 다른 폼을 사용하여 질문자 각각의 질문에 대한 대답을 기반으로 하여 전자문서를 작성(생성)할 수 있다(mQ/nA/mD). 이와 관련하여, 전자문서 입력 장치(100)는 앞서 설명한 mQ/1A/mD 형태의 대화가 병렬적으로 여러 명의 답변자에 대하여 진행되는 형태의 대화 상황에서 전자문서를 작성(생성)할 수 있다. 또한, 전자문서 입력 장치(100)는 앞서 설명한 1Q/nA/1D 형태의 대화가 병렬적으로 여러 명의 답변자에 대하여 진행되는 형태의 대화 상황에서 전자문서를 작성(생성)할 수 있다.

또한, 도 10c를 참조하면, 전자문서 입력 장치(100)는 복수의 질문자(A)가 응답자 그룹에게 서로 다른 질문을 질의하고, 응답자 그룹 내의 복수의 응답자(B) 각각이 연속적으로 답변을 제공하는 형태의 대화 상황에서 응답자(B)의 수에 상응하는 수의 전자문서를 작성(생성)할 수 있다(mQ/nA/nD). 이와 관련하여, 전자문서 입력 장치(100)는 앞서 설명한 mQ/1A/1D 형태의 대화가 병렬적으로 n 명의 답변자에 대하여 진행되는 형태의 대화 상황에서 전자문서를 작성(생성)할 수 있다. 또한, 전자문서 입력 장치(100)는 앞서 설명한 1Q/nA/nD 형태의 대화가 독립적으로 m 명의 질문자에 의하여 진행되는 형태의 대화 상황에서 전자문서를 작성(생성)할 수 있다.

다만, 도 10a 내지 도 10c를 통해 설명한 것과 같이 다수 발화자를 포함하는 대화 상황에서 인가되는 대화 입력을 통해 전자문서를 작성하는 전자문서 입력 장치(100)는 별도로 질문자(A)와 응답자(B)의 구분없이 전체 대화 입력을 종합하여 전자문서를 작성하도록 동작할 수도 있다(Multiple Role).

도 11은 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 장치의 개략적인 구성도이다.

도 11을 참조하면, 전자문서 입력 장치(100)는, 대화 수신부(110), 리스트 생성부(120), 필드값 추출부(130), 기입부(140) 및 표시부(150)를 포함할 수 있다.

대화 수신부(110)는 소정의 전자문서의 작성과 연계된 대화 입력을 수신할 수 있다. 또한, 대화 수신부(110)는 수신된 대화 입력을 지문화할 수 있다

리스트 생성부(120)는 전자문서의 서식에 기초하여 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성할 수 있다.

필드값 추출부(130)는 수신된 대화 입력(또는 지문화된 대화 입력)으로부터 필드 리스트 내의 기입 항목 각각에 대응되는 필드값을 추출할 수 있다.

기입부(140)는 필드 리스트 내의 기입 항목 각각에 대하여 추출된 필드값을 전자문서에 기입할 수 있다.

표시부(150)는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스를 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300) 중 적어도 하나에 표시할 수 있다.

또한, 표시부(150)는 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300) 중 적어도 하나에 입력이 완료된 전자문서를 형상화한 전자문서 확인 인터페이스를 표시할 수 있다.

본원의 일 실시예에 따르면, 표시부(150)는 전자문서 확인 인터페이스에서 필드값이 미입력된 영역 또는 필드값이 오입력된 영역이 구분되어 표시되도록 할 수 있다.

이하에서는 상기에 자세히 설명된 내용을 기반으로, 본원의 동작 흐름을 간단히 살펴보기로 한다.

도 12는 본원의 일 실시예에 따른 본원의 일 실시예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법에 대한 동작 흐름도이다.

도 12에 도시된 대화 인식을 통한 서식 기반 전자문서 입력 방법은 앞서 설명된 대화 인식을 통한 서식 기반 전자문서 입력 장치(100)에 의하여 수행될 수 있다. 따라서, 이하 생략된 내용이라고 하더라도 대화 인식을 통한 서식 기반 전자문서 입력 장치(100)에 대하여 설명된 내용은 대화 인식을 통한 서식 기반 전자문서 입력 방법에 대한 설명에도 동일하게 적용될 수 있다.

도 12를 참조하면, 단계 S11에서 대화 수신부(110)는 소정의 전자문서의 작성과 연계된 대화 입력을 수신할 수 있다.

다음으로, 단계 S12에서 대화 수신부(110)는 단계 S1110에서 수신된 대화 입력을 지문화할 수 있다.

다음으로, 단계 S113에서 리스트 생성부(120)는 전자문서의 서식(1)에 기초하여 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성할 수 있다.

다음으로, 단계 S14에서 필드값 추출부(130)는 수신된 대화 입력(또는 지문화된 대화 입력)으로부터 필드 리스트 내의 기입 항목 각각에 대응되는 필드값을 추출할 수 있다.

다음으로, 단계 S15에서 기입부(140)는 필드 리스트 내의 기입 항목 각각에 대하여 추출된 필드값을 정규화하여 전자문서에 기입할 수 있다.

다음으로, 단계 S16에서 표시부(150)는 입력되는 중인 전자문서를 형상화한 전자문서 인터페이스를 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300) 중 적어도 하나에 표시할 수 있다.

또한, 단계 S16에서 표시부(150)는 질문자(A)가 보유한 제1사용자 단말(200) 및 응답자(B)가 보유한 제2사용자 단말(300) 중 적어도 하나에 입력이 완료된 전자문서를 형상화한 전자문서 확인 인터페이스를 표시할 수 있다.

상술한 설명에서, 단계 S11 내지 S16은 본원의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

본원의 일 실시 예에 따른 대화 인식을 통한 서식 기반 전자문서 입력 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

또한, 전술한 대화 인식을 통한 서식 기반 전자문서 입력 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.

10: 전자문서 시스템
100: 대화 인식을 통한 서식 기반 전자문서 입력 장치
110: 대화 수신부
120: 리스트 생성부
130: 필드값 추출부
140: 기입부
150: 표시부
20: 네트워크
200: 제1사용자 단말
300: 제2사용자 단말

Claims

대화 인식을 통한 서식 기반 전자문서 입력 방법에 있어서,
소정의 전자문서의 작성과 연계된 대화 입력을 수신하는 단계;
상기 전자문서의 서식에 기초하여 상기 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 단계; 및
상기 필드 리스트에 기초하여 상기 대화 입력으로부터 상기 전자문서를 작성하는 단계,
를 포함하는, 전자문서 입력 방법.
제1항에 있어서,
상기 전자문서를 작성하는 단계는,
상기 대화 입력으로부터 상기 기입 항목 각각에 대응되는 필드값을 추출하는 단계; 및
상기 기입 항목 각각에 대하여 추출된 상기 필드값을 기입하는 단계,
를 포함하는 것인, 전자문서 입력 방법.
제2항에 있어서,
상기 필드값을 추출하는 단계는,
상기 대화 입력에서 상기 기입 항목에 대응하여 기입될 내용을 포함하는 발화 부분을 상기 필드값으로 추출하는 것인, 전자문서 입력 방법.
제2항에 있어서,
상기 대화 입력을 수신하는 단계는,
질문자 및 응답자를 포함하는 복수의 주체에 의해 수행된 제1타입 대화 입력 또는 응답자에 해당하는 하나의 주체에 의해 수행된 제2타입 대화 입력을 수신하는 것인, 전자문서 입력 방법.
제4항에 있어서,
상기 제1타입 대화 입력을 상기 질문자에 의해 수행된 질문자 발화 및 상기 응답자에 의해 수행된 응답자 발화로 분류하는 단계,
를 더 포함하는 것인, 전자문서 입력 방법.
제5항에 있어서,
상기 필드값을 추출하는 단계는,
상기 기입 항목에 해당하는 부분을 상기 질문자 발화로부터 탐색하고, 탐색된 기입 항목이 포함된 상기 질문자 발화에 대하여 소정 수준 이내로 인접한 상기 응답자 발화에서 해당 기입 항목에 대응하여 기입될 상기 필드값을 추출하는 것인, 전자문서 입력 방법.
제6항에 있어서,
상기 필드값을 추출하는 단계는,
상기 필드값이 추출된 상기 응답자 발화에 대하여 후속하는 상기 질문자 발화에서 기 추출된 상기 필드값에 상응하는 발화 부분이 재차 탐색되면, 상기 탐색된 발화 부분으로 상기 필드값을 갱신하는 단계,
를 포함하는 것을 특징으로 하는, 전자문서 입력 방법.
제2항에 있어서,
상기 필드값을 기입하는 단계는,
상기 추출된 필드값을 대응되는 기입 항목의 속성에 따라 정규화하는 단계,
를 포함하는 것인, 전자문서 입력 방법.
제4항에 있어서,
입력되는 중인 상기 전자문서를 형상화한 전자문서 인터페이스를 상기 질문자가 보유한 제1사용자 단말 및 상기 응답자가 보유한 제2사용자 단말 중 적어도 하나에 표시하는 단계,
를 더 포함하는 것인, 전자문서 입력 방법.
제9항에 있어서,
상기 표시하는 단계는,
상기 전자문서 인터페이스에서 상기 필드값이 입력되는 중인 영역이 미리 설정된 소정의 시간 동안 하이라이트 되도록 표시하는 것인, 전자문서 입력 방법.
제4항에 있어서,
상기 질문자가 보유한 제1사용자 단말 및 상기 응답자가 보유한 제2사용자 단말 중 적어도 하나에 입력이 완료된 상기 전자문서를 형상화한 전자문서 확인 인터페이스를 표시하는 단계를 더 포함하고,
상기 전자문서 확인 인터페이스를 표시하는 단계는,
상기 전자문서 확인 인터페이스에서 상기 필드값이 미입력된 영역 또는 상기 필드값이 오입력된 영역이 구분되어 표시되도록 하는 것인, 전자문서 입력 방법.
대화 인식을 통한 서식 기반 전자문서 입력 장치에 있어서,
소정의 전자문서의 작성과 연계된 대화 입력을 수신하는 대화 수신부;
상기 전자문서의 서식에 기초하여 상기 전자문서의 완성을 위한 복수의 기입 항목을 포함하는 필드 리스트를 생성하는 리스트 생성부;
상기 대화 입력으로부터 상기 기입 항목 각각에 대응되는 필드값을 추출하는 필드값 추출부; 및
상기 기입 항목 각각에 대하여 추출된 상기 필드값을 기입하는 기입부,
를 포함하는, 전자문서 입력 장치.