KR20200114357A - Method and apparatus for providing electronic document data through speaker identification - Google Patents

Method and apparatus for providing electronic document data through speaker identification Download PDF

Info

Publication number
KR20200114357A
KR20200114357A KR1020190035988A KR20190035988A KR20200114357A KR 20200114357 A KR20200114357 A KR 20200114357A KR 1020190035988 A KR1020190035988 A KR 1020190035988A KR 20190035988 A KR20190035988 A KR 20190035988A KR 20200114357 A KR20200114357 A KR 20200114357A
Authority
KR
South Korea
Prior art keywords
electronic document
user
talker
data
document data
Prior art date
Application number
KR1020190035988A
Other languages
Korean (ko)
Other versions
KR102280453B1 (en
Inventor
박미경
최영범
김현우
Original Assignee
주식회사 포시에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 포시에스 filed Critical 주식회사 포시에스
Priority to KR1020190035988A priority Critical patent/KR102280453B1/en
Publication of KR20200114357A publication Critical patent/KR20200114357A/en
Application granted granted Critical
Publication of KR102280453B1 publication Critical patent/KR102280453B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Library & Information Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Provided is a method for providing electronic document data, which comprises the steps of: receiving voice data of a speaker from an electronic document consuming device; identifying the speaker based on the voice data; generating electronic document data; updating the electronic document data so that the voice data is reflected in a first part of the electronic document when the speaker is a first user as a result of the identification, and updating the electronic document data so that the voice data is reflected in a second part of the electronic document when the speaker is a second user as a result of the identification; and transmitting the update result to the electronic document consuming device.

Description

화자 식별을 통한 전자문서 데이터 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING ELECTRONIC DOCUMENT DATA THROUGH SPEAKER IDENTIFICATION}Method and apparatus for providing electronic document data through speaker identification {METHOD AND APPARATUS FOR PROVIDING ELECTRONIC DOCUMENT DATA THROUGH SPEAKER IDENTIFICATION}

본원은 화자 식별을 통한 전자문서 데이터 제공 방법 및 장치에 관한 것이다.The present application relates to a method and apparatus for providing electronic document data through speaker identification.

스마트폰이나 웨어러블 디바이스의 경우, 한 명의 사용자가 개인 디바이스를 사용하는 경우가 대부분이다. 하지만 인공지능/스마트 스피커인 경우에는 지정된 장소에 설치하여 다수의 사용자가 하나의 디바이스를 공용으로 사용하는 경우가 많다.In the case of smartphones or wearable devices, in most cases, one user uses a personal device. However, in the case of an artificial intelligence/smart speaker, it is often installed in a designated place so that a number of users use one device in common.

전자문서 작성에 있어서도 다수의 사용자가 하나의 인공지능/스마트 스피커를 통하여 서비스를 제공 받는 경우가 많기 때문에, 사용자의 역할에 맞는 전자문서 데이터를 제공해야 한다.In creating an electronic document, since many users are often provided with services through a single artificial intelligence/smart speaker, it is necessary to provide electronic document data suitable for the user's role.

특히, 전자문서 결재 및 요청의 경우 사용자의 역할에 따라 문서의 내용이나 형태가 달라지므로 사용자가 누구인지 식별하고 해당 사용자에 맞는 전자문서 데이터를 제공해야 한다.In particular, in the case of electronic document approval and request, since the content or form of the document varies according to the user's role, it is necessary to identify who the user is and provide electronic document data appropriate to the user.

본원의 배경이 되는 기술은 한국등록특허공보 제 10-1705228호에 개시되어 있다.The technology behind the present application is disclosed in Korean Patent Publication No. 10-1705228.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 디바이스에 발화중인 발화자를 식별하고, 상기 발화자의 역할에 해당하는 전자문서 데이터를 제공하는 것을 목적으로 한다.The present application is to solve the above-described problems of the prior art, and an object of the present invention is to identify a speaker who is speaking to a device, and to provide electronic document data corresponding to the role of the speaker.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the embodiments of the present application is not limited to the technical problems as described above, and other technical problems may exist.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the embodiments of the present application is not limited to the technical problems as described above, and other technical problems may exist.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 전자문서 데이터 제공 방법은, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계, 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계, 전자문서 데이터를 생성하는 단계, 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 단계, 상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 단계를 포함할 수 있다.As a technical means for achieving the above technical problem, an electronic document data providing method according to an embodiment of the present application includes the steps of receiving voice data of a talker from an electronic document consuming device, and identifying the talker based on the voice data. Generating electronic document data, updating the electronic document data so that the voice data is reflected in the first part of the electronic document when the speaker is a first user as a result of the identification, 2 If the user is a user, updating the electronic document data so that the voice data is reflected in the second part of the electronic document, and transmitting the update result to the electronic document consuming device.

본원의 일 실시예에 따르면, 상기 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계는, 상기 복수의 사용자 정보를 저장하는 단계, 상기 발화자가 상기 사용자 정보에 저장된 사용자인지 판단하는 단계, 상기 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악하는 단계를 포함할 수 있다.According to an embodiment of the present application, the step of identifying the talker based on the voice data includes storing the plurality of user information, determining whether the talker is a user stored in the user information, the determination result According to the method, the voice data may be analyzed to identify information of the talker.

본원의 일 실시예에 따르면, 상기 사용자 정보는 사용자가 속한 그룹에서의 직급을 포함하는 개인정보 및 그룹정보를 저장하고, 상기 발화자를 식별하는 단계는, 상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단하는 단계를 더 포함할 수 있다.According to an embodiment of the present application, the user information stores personal information and group information including a position in a group to which the user belongs, and the step of identifying the talker comprises: the talker is a first user based on the position It may further include the step of determining authority information for distinguishing whether the user is the second user.

본원의 일 실시예에 따르면, 상기 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것일 수 있다.According to an exemplary embodiment of the present disclosure, when the talker is the first user as a result of determining the authorization information, the electronic document data may be updated by processing security data in a range accessible to the second user.

본원의 일 실시예에 따르면, 사용자에 따라 자주 입력받는 상용구를 포함하고, 상기 전자문서 데이터를 업데이트하는 단계는, 상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트 하는 단계를 포함할 수 있다.According to an embodiment of the present application, a boilerplate that is frequently input by a user is included, and the updating of the electronic document data may include replacing and updating the utterance content related to the boilerplate with the stored boilerplate. .

본원의 일 실시예에 따르면, 상기 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 사용자 별 상용구에 반영되는 것일 수 있다.According to the exemplary embodiment of the present application, the user information may be updated based on the content spoken by the talker, classified based on the personal information and group information, and reflected in the boilerplate for each user.

본원의 일 실시예에 따르면, 상기 전자문서 데이터를 생성하는 단계는, 복수의 전자문서 유형별 템플릿을 저장하는 단계를 포함하고, 사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것일 수 있다.According to an embodiment of the present application, the generating of the electronic document data includes storing a plurality of templates for each type of electronic document, and if there is an electronic document previously stored by the user, the corresponding electronic document is loaded and stored. If there is no electronic document, a new electronic document may be generated by applying the template according to a user request.

본원의 일 실시예에 따르면, 상기 제 1 사용자는 결재자를 포함하고, 상기 업데이트 결과는, 상기 업데이트 결과는, 상기 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것일 수 있다.According to an embodiment of the present application, the first user includes a payer, and the update result is a list of electronic documents waiting to be processed for approval among the updated electronic documents, or a payment request to the first user. It may contain a list of requested payment requesters.

본원의 일 실시예에 따르면, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계는, 발화자로부터 전자문서 데이터에 대해 음성 데이터, 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.According to an embodiment of the present application, the step of receiving the voice data of the talker from the electronic document consuming device may be receiving an interactive input for the electronic document data from the talker in the form of voice data, text data, and packet data. .

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 전자문서 데이터 제공 장치는, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 발화자 음성 수신부, 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 발화자 식별부, 전자문서 데이터를 생성하는 전자문서 데이터 생성부, 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 전자문서 업데이트부, 상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 전자문서 결과 전송부를 포함할 수 있다.As a technical means for achieving the above technical problem, an electronic document data providing apparatus according to an embodiment of the present application includes a talker voice receiver for receiving voice data of a talker from an electronic document consuming device, and the talker based on the voice data. A talker identification unit for identifying a, an electronic document data generation unit for generating electronic document data, and updating the electronic document data so that the voice data is reflected in a first portion of the electronic document when the identification result is the first user , An electronic document update unit for updating the electronic document data so that the voice data is reflected in a second portion of the electronic document when the identification result is the second user, and an electronic document transmitting the update result to the electronic document consuming device It may include a document result transmission unit.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary and should not be construed as limiting the present application. In addition to the above-described exemplary embodiments, additional embodiments may exist in the drawings and detailed description of the invention.

전술한 본원의 과제 해결 수단에 의하면, 발화자를 식별하여 전자문서 데이터를 제공함으로써, 하나의 디바이스로도 다수의 사용자의 역할에 맞춰 전자문서 데이터를 제공할 수 있다.According to the above-described problem solving means of the present application, by identifying a talker and providing electronic document data, even a single device can provide electronic document data according to the roles of multiple users.

도 1은 본원의 일 실시예에 따른 전자문서 데이터 제공 시스템 개략도이다.
도 2는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 개인별 상용구를 적용한 전자문서 데이터 제공을 나타내는 도면이다.
도 3은 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 사용자 요청에 따른 전자문서 데이터 제공을 나타내는 도면이다.
도 4는 본원의 일 실시예에 따른 전자문서 데이터 제공 방법을 나타내는 흐름도이다.
도 5은 본원의 일 실시예에 따른 발화자를 식별하는 방법을 나타내는 흐름도이다.
1 is a schematic diagram of a system for providing electronic document data according to an embodiment of the present application.
FIG. 2 is a diagram illustrating provision of electronic document data to which an individual boilerplate is applied by an electronic document data providing device according to an embodiment of the present application.
3 is a diagram illustrating provision of electronic document data according to a user request by an electronic document data providing apparatus according to an exemplary embodiment of the present disclosure.
4 is a flowchart illustrating a method of providing electronic document data according to an embodiment of the present application.
5 is a flowchart illustrating a method of identifying a talker according to an embodiment of the present disclosure.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, exemplary embodiments of the present application will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art may easily implement the present application. However, the present application may be implemented in various different forms and is not limited to the embodiments described herein. In addition, in the drawings, parts not related to the description are omitted in order to clearly describe the present application, and similar reference numerals are attached to similar parts throughout the specification.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다. Throughout the present specification, when a part is said to be "connected" with another part, it is not only "directly connected", but also "electrically connected" or "indirectly connected" with another element interposed therebetween. "Including the case.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.Throughout this specification, when a member is positioned "on", "upper", "upper", "under", "lower", and "lower" of another member, this means that a member is located on another member. It includes not only the case where they are in contact but also the case where another member exists between the two members.

본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification of the present application, when a certain part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.

이하에서는 도 1 내지 도 5를 참조하여 본원의 전자문서 데이터 제공 시스템(10)에 대하여 설명한다.Hereinafter, the electronic document data providing system 10 of the present application will be described with reference to FIGS. 1 to 5.

도 1은 본원의 일 실시예에 따른 전자문서 데이터 제공 시스템 개략도이다. 도 1을 참조하면, 전자문서 데이터 제공 시스템(10)은 전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100)를 포함할 수 있다. 본 명세서에서 전자문서 소비 디바이스(200)는 사용자 단말이라고 달리 표현할 수 있다.1 is a schematic diagram of a system for providing electronic document data according to an embodiment of the present application. Referring to FIG. 1, the electronic document data providing system 10 may include an electronic document consuming device 200 and an electronic document data providing device 100. In this specification, the electronic document consuming device 200 may be differently expressed as a user terminal.

전자문서 소비 디바이스(200)는 사용자 입력을 수신하고, 상기 사용자 입력에 기초하여 전자문서 데이터 제공 장치(100)에 상기 사용자 입력에 대한 처리를 요청하고, 전자문서 데이터 제공 장치(100)로부터 상기 사용자 입력에 대한 처리 결과를 수신할 수 있다.The electronic document consuming device 200 receives a user input, requests the electronic document data providing device 100 to process the user input based on the user input, and sends the user input from the electronic document data providing device 100 You can receive the result of processing the input.

예를 들면, 전자문서 소비 디바이스(200)는, 스마트워치(Smartwatch), 인공지능 스피커, 스마트폰(Smartphone), 스마트패드(SmartPad), 태블릿 PC등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 무선 통신 장치 및 데스크탑 컴퓨터, 스마트 TV 등 유선 통신 장치를 포함할 수 있다.For example, the electronic document consuming device 200 includes a smartwatch, an artificial intelligence speaker, a smartphone, a smart pad, a tablet PC, and a personal communication system (PCS), a global system for Mobile communication), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W- Code Division Multiple Access), Wibro (Wireless Broadband Internet) terminals, and wired communication devices such as desktop computers and smart TVs.

특히, 상기 전자문서 소비 디바이스(200)는, 스마트 스피커(Smart Speaker), 스마트 카(Smart Car), 스마트 가전(Smart Appliances), 웨어러블 장치(Wearable Device) 증강현실기기 (VR/MR) 등 새롭게 생겨나는 각종 통신기술을 이용한 다양한 음향기기, 구동기기 등을 포함할 수 있다.In particular, the electronic document consuming device 200 is newly created such as a smart speaker, a smart car, a smart appliance, a wearable device, an augmented reality device (VR/MR), etc. May include various sound devices, driving devices, etc. using various communication technologies.

또한, 예시적으로, 전자문서 소비 디바이스(200)는 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함할 수 있다.In addition, as an example, the electronic document consuming device 200 may include a voice recognition terminal capable of recognizing a user's voice and an interactive terminal through which the user can input the user input sentence through a separate input device. have.

이 때, 전자문서 소비 디바이스(200)는 전자문서 소비 어플리케이션을 포함할 수 있다. 전자문서 소비 어플리케이션은, 문서작성 서비스와 관련되어 디바이스에 설치되는 것으로, 사용자 요청에 따라 실행되는 것일 수 있다.In this case, the electronic document consuming device 200 may include an electronic document consuming application. The electronic document consuming application is installed on a device in connection with a document creation service, and may be executed according to a user request.

전자문서 데이터 제공 장치(100)는 전자문서 소비 디바이스(200), 더 구체적으로는 전자문서 소비 어플리케이션과 연동하여 전자문서 작성 서비스를 제공하는 서비스 제공자의 서버 장치로, 발화자를 식별하여 전자문서 데이터를 다르게 제공할 수 있다.The electronic document data providing apparatus 100 is an electronic document consuming device 200, more specifically, a server device of a service provider providing an electronic document creation service in connection with an electronic document consuming application, and identifying a speaker to provide electronic document data. It can be provided differently.

전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100)는 상호 연결되는 네트워크로 통신(처리 요청 송수신 및 처리 결과 송수신)할 수 있다.The electronic document consuming device 200 and the electronic document data providing device 100 may communicate (transmitting/receiving a processing request and transmitting/receiving a processing result) through a network connected to each other.

상기 네트워크는 전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100) 간에 정보 교환이 가능한 유, 무선의 연결 구조를 의미하며, 예시적으로, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5G 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.The network refers to a wired and wireless connection structure capable of exchanging information between the electronic document consuming device 200 and the electronic document data providing device 100, and illustratively, 3GPP (3rd Generation Partnership Project) network, LTE (Long Term Evolution) network, 5G network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network), PAN (Personal Area) Network), a Bluetooth network, a satellite broadcasting network, an analog broadcasting network, a Digital Multimedia Broadcasting (DMB) network, and the like, but are not limited thereto.

본원의 일 실시예에 따르면, 전자문서 데이터 제공 장치(100)는 발화자에 따라 전자문서의 형태를 달리 제공할 수 있다. 달리 말해, 발화자를 식별하고 발화자의 역할 및 권한에 따라 전자문서의 형태를 달리 제공할 수 있다. 이 때, 발화자는 다수의 사용자 중 전자문서 소비 디바이스(200)에 발화중인 사용자를 의미할 수 있다.According to the exemplary embodiment of the present disclosure, the electronic document data providing apparatus 100 may provide different forms of the electronic document according to the speaker. In other words, it is possible to identify the speaker and provide a different form of the electronic document according to the role and authority of the speaker. In this case, the talker may mean a user who is talking on the electronic document consuming device 200 among a plurality of users.

다수의 사용자는 회사 내에서 직급 및 역할에 따라 전자문서에 대한 권한을 다르게 가질 수 있다. 예를 들어, 사원은 결재 요청자, 부장은 결재자로 권한을 분류할 수 있다. 또한, 같은 직급이라도 업무에 따라 권한은 다르게 분류될 수 있다. 직급 및 역할은, 신청자 중간 처리자, 결재자, 접수자 등이 될 수 있으며, 이에 한정하는 것은 아니다.Multiple users may have different rights to electronic documents according to their position and role within the company. For example, an employee can classify the authority as an approval requester and a manager as an approver. Also, even in the same position, the authority can be classified differently according to the job. The position and role may be, but is not limited to, an applicant intermediate processor, an approver, or a receiver.

전자문서 데이터 제공 장치(100)는 발화자 음성 수신부(110), 발화자 식별부(120), 전자문서 데이터 생성부(130), 전자문서 업데이트부(140), 전자문서 결과 전송부(150)를 포함할 수 있다.The electronic document data providing apparatus 100 includes a speaker voice receiving unit 110, a speaker identification unit 120, an electronic document data generation unit 130, an electronic document update unit 140, and an electronic document result transmission unit 150. can do.

발화자 음성 수신부(110)는 전자문서 소비 디바이스로(200)부터 발화자의 음성 데이터를 수신할 수 있다. 추가적으로는, 음성 데이터 이외에 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.The talker's voice receiving unit 110 may receive voice data of the talker from the electronic document consuming device 200. Additionally, it may receive interactive input in the form of text data and packet data in addition to voice data.

발화자 음성 수신부(110)는 사용자에 의해 발화된 음성을 인식하여 텍스트 형식으로 변환할 수 있다. 이를 위해, 발화자 음성 수신부(110)는, 당해 기술 분야에서 널리 알려진 적어도 하나의 음성 인식 알고리즘을 이용할 수 있고, 상기 텍스트 형식으로의 변환을 위해STT(Speech-To-Text) 기법이 활용될 수 있다.The talker's voice receiver 110 may recognize a voice uttered by a user and convert it into a text format. To this end, the talker speech receiver 110 may use at least one speech recognition algorithm well known in the art, and a speech-to-text (STT) technique may be used for conversion into the text format. .

발화자 식별부(120)는 상기 음성 데이터에 기초하여 상기 발화자를 식별할 수 있다. 본원의 일 실시예에 따르면, 발화자 식별부(120)는 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.The talker identification unit 120 may identify the talker based on the voice data. According to the exemplary embodiment of the present application, the talker identification unit 120 may store a plurality of user information. User information may be stored in a database and updated by receiving user feedback.

상기 데이터베이스는 사용자의 음성 데이터를 제공받아 권한 정보, 개인 정보, 그룹 정보 등을 매칭하여 저장할 수 있다. 음성 데이터는 전자문서 소비 디바이스(200)로부터 수신할 수 있으며, 상기 데이터베이스는 음성 데이터의 특징을 추출하여 사용자 별 음성모델을 구축하는 것일 수 있다. 권한 정보, 개인 정보, 그룹 정보는 사용자로부터 입력받는 것일 수 있다.The database may receive the user's voice data and match and store authority information, personal information, group information, and the like. Voice data may be received from the electronic document consuming device 200, and the database may be for constructing a user-specific voice model by extracting features of the voice data. Authority information, personal information, and group information may be input from a user.

또한, 발화자 식별부(120)는 발화자가 상기 사용자 정보에 저장된 사용자인지 판단할 수 있다. 상기 데이터베이스에 저장된 복수의 사용자 별 음성모델과 발화자의 음성 데이터를 비교하여 일치하는 음성모델이 있는지를 판단할 수 있다.Also, the talker identification unit 120 may determine whether the talker is a user stored in the user information. It is possible to determine whether or not there is a matching voice model by comparing the voice models of a plurality of users stored in the database with voice data of a talker.

발화자 식별부(120)는 상기 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악할 수 있다. 발화자가 데이터베이스에 저장된 사용자로 판단될 경우, 데이터베이스에 음성 데이터와 매칭되어 저장된 정보를 기반으로 발화자의 정보를 파악할 수 있다.The talker identification unit 120 may analyze the voice data according to the determination result to identify the talker information. When it is determined that the talker is a user stored in the database, information of the talker may be identified based on information that is matched with voice data and stored in the database.

반면, 발화자가 데이터베이스에 저장되지 않은 사용자로 판단될 경우, 발화자가 말한 내용을 분석하여 발화자의 정보를 파악할 수 있다. 또한, 데이터베이스에 상기 발화자의 음성 데이터 및 분석 내용을 매칭하여 신규로 등록할 수 있다.On the other hand, when it is determined that the talker is a user who is not stored in the database, information of the talker can be identified by analyzing the contents of the talker. In addition, it is possible to newly register by matching the speech data and analysis content of the talker in the database.

예를 들어, 사용자 정보에 저장되지 않은 발화자가 "나 A팀 신입 사원인데, 우리팀 명단 보여줘"라고 했을 때, 전자문서 데이터 제공 장치는, 상기 발화자의 음성데이터를 A팀 신입 사원으로 등록할 수 있다.For example, when a talker who is not stored in the user information says "I am a new employee in team A, show me the list of our team", the electronic document data providing device can register the voice data of the talker as a new employee in team A. have.

사용자 정보는 사용자가 속한 그룹에서의 직급을 포함하는 개인정보 및 그룹정보를 저장하고, 발화자 식별부(120)는 상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단할 수 있다.The user information stores personal information and group information including the position in the group to which the user belongs, and the talker identification unit 120 identifies whether the talker is a first user or a second user based on the position. Can judge.

개인정보는 직급 이외에 이름, 나이, 성별, 선호하는 문서 템플릿을 더 포함할 수 있고, 그룹정보는 그룹 이름, 그룹 배치도, 그룹 연락망을 포함할 수 있으며, 이에 한정되는 것은 아니다.The personal information may further include a name, age, gender, and a preferred document template in addition to the position, and the group information may include a group name, a group layout, and a group contact network, but is not limited thereto.

또한, 사용자 정보는 다수의 사용자에 대하여 공통 카테고리를 정하여 분류한 것일 수 있다. 예를 들어, 같은 회사 내에 다수의 사용자를 팀 별로 카테고리를 나누어 분류하여 저장한 것일 수 있다. 권한정보는, 신청자, 중간 처리자, 결재자, 접수자 등으로 역할에 따라 분류될 수 있다. 전자문서 데이터 제공 장치(100)는 발화자의 권한정보에 따라 다른 내용을 공개하는 것일 수 있다.In addition, the user information may be classified by determining a common category for a plurality of users. For example, a number of users within the same company may be classified and stored in categories by team. Authority information can be classified according to roles such as applicant, intermediate processor, approver, and receiver. The electronic document data providing apparatus 100 may disclose other contents according to the speaker's authority information.

전자문서 데이터 생성부(130)는 전자문서 데이터를 생성할 수 있다. The electronic document data generation unit 130 may generate electronic document data.

본원의 일 실시예에 따른 전자문서 데이터 생성부(130)는 복수의 전자문서 유형별 템플릿을 저장할 수 있고, 사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것일 수 있다.The electronic document data generation unit 130 according to the exemplary embodiment of the present application may store a plurality of templates for each type of electronic document, and if there is an electronic document previously stored by the user, the electronic document is loaded, but there is no stored electronic document. In this case, a new electronic document may be generated by applying the template according to a user request.

예를 들어, 사용자가 A설계 업무와 관련하여 전자문서 데이터를 요청할 수 있으며, 사용자가 A설계 업무와 관련해 저장한 전자문서가 있을 경우 해당 전자문서를 불러올 수 있다.For example, a user can request electronic document data related to design A work, and if the user has an electronic document stored related to design A work, the corresponding electronic document can be called.

반면, A설계 업무와 관련하여 저장한 전자문서가 없을 경우, 설계 업무에 적용할 수 있는 전자문서 템플릿을 적용시켜 신규 전자문서를 생성할 수 있다.On the other hand, if there is no electronic document stored in relation to the design A task, a new electronic document can be created by applying an electronic document template applicable to the design task.

템플릿은 문서의 항목 배치, 그래픽, 파일 형식 등을 포함하며, 사용자 요청에 의해 조합되는 것일 수 있다. 예를 들어, A설계 업무와 관련하여 사용자가 문서의 항목 순서 및 배치를 조합할 수 있다. 사용자 요청은, 음성 데이터로서 입력되는 것일 수 있다.The template includes an item arrangement of a document, a graphic, a file format, and the like, and may be combined according to a user request. For example, in relation to the A design task, the user can combine the order and arrangement of items in the document. The user request may be input as voice data.

전자문서 업데이트부(140)는 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.As a result of the identification, the electronic document update unit 140 updates the electronic document data so that the voice data is reflected in the first part of the electronic document when the speaker is a first user, and as a result of the identification, the speaker is a second user. In this case, the electronic document data may be updated so that the voice data is reflected in the second part of the electronic document.

예를 들어, 발화자가 결재자인 경우, 발화자의 음성 데이터가 전자문서의 결재 부분에 반영되는 것일 수 있다. 결재자인 발화자가 "서명해줘"라고 발화했을 때, 전자문서의 결재자 서명란에 서명이 되는 것일 수 있다.For example, when the speaker is the approver, voice data of the speaker may be reflected in the payment portion of the electronic document. When the talker, who is the approver, utters "Sign me", the signature of the approver may be signed in the electronic document.

전자문서 업데이트부(140)는 전자문서 기입 항목에 대해 대화형으로 질문할 수 있다. 대화형은, 사용자로부터 질문에 대한 입력을 받고, 상기 입력에 대해 추가적으로 연계 질문을 하거나 다음 항목으로 넘어가 질문을 하여 문서를 보완할 수 있다.The electronic document updater 140 may interactively ask a question about an electronic document entry item. In the interactive mode, a document may be supplemented by receiving an input for a question from a user and additionally asking a related question for the input or by moving to the next item and asking a question.

구체적으로, 전자문서의 작성이 완료(모든 필수 기입 항목에 대한 기입이 완료된 것)될 때까지, 상기 전자문서 기입 항목에 연계된 질문을 전자문서 소비 디바이스(200)에 전송하고, 상기 질문에 대응되는 사용자의 응답을 포함하는 사용자 입력을 수신하고, 이를 분석하여 해당하는 전자문서 기입 항목에 입력 값을 할당하는 대화 방식을 통하여, 전자문서를 완성해 나갈 수 있다.Specifically, a question related to the electronic document entry item is transmitted to the electronic document consuming device 200 until the creation of the electronic document is completed (filling in all required entry items has been completed), and the question is responded to. The electronic document can be completed through a conversational method of receiving a user input including a response from a user to be received, analyzing it, and assigning an input value to a corresponding electronic document entry item.

전자문서 업데이트부(140)는 사용자로부터 입력되지 않은 항목에 대해 순서를 변경하여 마지막 항목으로 구성할 수 있다. 입력되지 않은 항목이 다수개일 경우, 연관된 항목끼리 위치하도록 순서를 배치하여 다시 질문할 수 있다. 또한, 입력된 항목 중 입력되지 않은 항목과 연관된 항목들을 함께 구성하여 다시 질문할 수 있다.The electronic document updater 140 may change the order of items that are not input by the user and configure them as the last item. If there are a number of items that have not been entered, questions can be asked again by arranging the order so that related items are located. Also, among the input items, items related to the items that are not inputted can be configured together and asked again.

전자문서 업데이트부(140)는 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것일 수 있다. 상기 보안 데이터 처리는, 예를 들어, 암호화일 수 있다.As a result of determining the authority information, the electronic document update unit 140 may be updated by processing security data in a range accessible by the second user when the talker is the first user. The security data processing may be, for example, encryption.

예를 들어, 제 1 사용자가 결재 요청자이고 제 2 사용자가 결재자일 때, 전자문서 데이터 제공 장치가 제 1 사용자에게 전자문서 데이터를 제공하는 경우, 결재자 서명란을 보안 데이터 처리하여 업데이트할 수 있다. 이 때, 상기 발화자는, 결재자 서명란을 제외한 전자문서를 제공받을 수 있다.For example, when a first user is an approval requester and a second user is an approver, when the electronic document data providing device provides electronic document data to the first user, the approver signature field may be processed and updated with security data. In this case, the talker may be provided with an electronic document excluding the signature column of the approver.

또한, 전자문서 업데이트부(140)는 사용자로부터 음성데이터로 전자문서 작성에 대한 입력을 받고 음성데이터의 내용을 분석하여 전자문서 데이터를 업데이트 할 수 있다.In addition, the electronic document update unit 140 may update the electronic document data by receiving an input for creating an electronic document as voice data from a user and analyzing the contents of the voice data.

전자문서 업데이트부(140)는, 전자문서에 대한 처리의 타당성 및 안정성을 재고하기 위하여, 화자 인식(Speaker Recognition) 기법을 활용하여, 상기 전자문서에 대한 처리 권한을 가진 사용자 의해 해당 전자문서에 대한 처리가 이루어졌는지 여부를 다시 검증할 수 있다.The electronic document update unit 140 uses a speaker recognition technique to reconsider the validity and stability of the processing of the electronic document, and the user who has the processing authority for the electronic document It can be verified again whether the processing has been done.

전자문서 결과 전송부(150)는 업데이트 결과를 상기 전자문서 소비 디바이스(200)로 전송할 수 있다. 구체적으로는, 전자문서 소비 디바이스(200)의 어플리케이션을 통해 전송할 수 있다.The electronic document result transmission unit 150 may transmit an update result to the electronic document consuming device 200. Specifically, it may be transmitted through an application of the electronic document consuming device 200.

전자문서 소비 디바이스(200)에 전자문서 업데이트 결과를 전송하고, 사용자로부터 피드백을 수신할 수 있다. 피드백의 내용을 분석하여, 전자문서 업데이트부(140)에 전달할 수 있다. 전자문서 업데이트부(140)는 피드백 내용에 따라 전자문서를 업데이트할 수 있다.The electronic document consuming device 200 may transmit an electronic document update result and receive feedback from a user. The content of the feedback may be analyzed and transmitted to the electronic document update unit 140. The electronic document updater 140 may update the electronic document according to the feedback content.

도 2는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 개인별 상용구를 적용한 전자문서 데이터 제공을 나타내는 도면이다.FIG. 2 is a diagram illustrating provision of electronic document data to which an individual boilerplate is applied by an electronic document data providing device according to an embodiment of the present application.

도2를 참조하면, 사용자 정보는 사용자에 따라 자주 입력받는 상용구를 포함하고, 전자문서 업데이트부(140)는 상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트할 수 있다.Referring to FIG. 2, the user information includes a boilerplate frequently inputted by a user, and the electronic document update unit 140 may replace and update the utterance content related to the boilerplate with the stored boilerplate.

상용구는, 사용자 별로 다르게 저장되는 것이며, 동일한 단어라도 내용이 다르게 저장되는 것일 수 있다. 예를 들어, 제1사용자의 상용구에 있어서, 집 주소는 '강남구 논현로 123번지'이고, 끝맺음은 '제1사용자 드림'일 수 있다. 반면, 제 2 사용자의 상용구에 있어서, 집 주소는 '강남구 논현로 456번지'이고, 끝맺음은 '감사합니다'일 수 있다.The boilerplate is stored differently for each user, and the content may be stored differently even with the same word. For example, in the boilerplate of the first user, the home address may be '123 Nonhyeon-ro, Gangnam-gu,' and the end may be'First User Dream'. On the other hand, in the boilerplate of the second user, the home address may be '456 Nonhyeon-ro, Gangnam-gu,' and the end may be'Thank you'.

상용구는 사용자가 특정 발화어와 관련하여 상용구를 설정하여 저장하거나, 사용자가 동일한 의미를 가지는 발화어를 일정 횟수 이상 입력하였을 때 상기 발화어가 상기 사용자의 상용구로 등록되는 것일 수 있다.The boilerplate may be that when a user sets and stores a boilerplate in relation to a specific spoken word, or when the user inputs a spoken word having the same meaning more than a certain number of times, the spoken word is registered as the user's boilerplate.

예를 들어, 사용자가 발화어 '끝맺음'에 '감사합니다'로 설정하여 저장한 경우, 사용자가 "끝맺음 입력해줘"라고 발화함으로써 전자문서 데이터의 끝부분에는 '감사합니다'라는 문구가 입력될 수 있다.For example, if the user sets'Thank you' for the spoken word'Closed', the user utters "Please enter the closing" and the phrase'Thank you' can be entered at the end of the electronic document data. have.

사용자가 "끝맺음으로 감사합니다 입력해줘"라는 발화를 일정 횟수 이상 입력한 경우, 상기 사용자의 상용구로 등록될 수 있다. 일정 횟수는, 사용자가 설정한 횟수일 수 있으며, 예를 들어, 15회일 수 있다. 상기 횟수는 전자문서 소비 디바이스의 어플리케이션을 통해 설정되는 것일 수 있다.When the user inputs the utterance “Thank you in closing” more than a certain number of times, it may be registered as the user's boilerplate. The predetermined number of times may be a number set by the user, and may be, for example, 15 times. The number of times may be set through an application of the electronic document consuming device.

또한, 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 사용자 별 상용구에 반영되는 것일 수 있다.In addition, the user information may be updated based on the content spoken by the talker, classified based on the personal information and group information, and reflected in the boilerplate for each user.

예를 들어, 사용자의 그룹정보가 A팀으로 분류된 경우, 사용자의 상용구에 있어서 발화어 '우리 팀'에 대한 상용구는 'A팀'으로 등록될 수 있다. 또한, "우리 팀 사람들 명단 작성해줘"라고 했을 때, 사용자 정보 데이터베이스에서 그룹정보 A팀으로 분류된 사용자들의 명단을 수집하여 전자문서 데이터로 제공할 수 있다.For example, when the user's group information is classified as team A, the boilerplate for the spoken word'our team' in the user's boilerplate may be registered as'team A'. In addition, when "please create a list of people on my team", a list of users classified as group A team in the user information database can be collected and provided as electronic document data.

도3은 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 결재 문서 데이터 제공을 나타내는 도면이다.3 is a diagram illustrating provision of payment document data by an electronic document data providing apparatus according to an embodiment of the present application.

도3을 참조하면, 전자문서 결과 전송부(150)는 전자문서 소비 디바이스(200)로 사용자가 요청한 전자문서 데이터 목록을 전송할 수 있다.Referring to FIG. 3, the electronic document result transmission unit 150 may transmit an electronic document data list requested by a user to the electronic document consuming device 200.

예를 들어, 제 1 사용자는 결재자를 포함하고, 전자문서 데이터 업데이트 결과는, 발화자가 제1사용자일 경우, 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것일 수 있다.For example, the first user includes the approver, and the electronic document data update result is a list of electronic documents waiting for approval among the updated electronic documents or requesting approval from the first user when the speaker is the first user. It may include a list of applicants for payment.

구체적으로, 본원의 일 실시예에 따른 전자문서 데이터 제공 장치(100)는 발화자의 권한정보에 해당하는 문서들을 수집하고, 해당 문서들 중 발화자가 요청하는 전자문서들의 목록을 생성하여 전자문서 소비 디바이스(200)로 전송할 수 있다.Specifically, the electronic document data providing apparatus 100 according to an embodiment of the present application collects documents corresponding to the speaker's authority information, and generates a list of electronic documents requested by the speaker among the documents to consume the electronic document. It can be transmitted to 200.

또한, 업무 처리가 완료된 문서와 완료되지 않은 문서를 분류하고, 사용자가 요청하는 문서 분류에 대해 목록을 생성하여 전자문서 소비 디바이스(200)로 전송할 수 있다.In addition, it is possible to classify documents that have been processed for work and documents that have not been completed, create a list of document classifications requested by the user, and transmit them to the electronic document consuming device 200.

도4는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 전자문서 데이터 제공 방법을 나타내는 흐름도이다.4 is a flowchart illustrating a method of providing electronic document data by an electronic document data providing apparatus according to an embodiment of the present application.

도4를 참조하면, 단계S810에서는 발화자의 음성 데이터를 수신할 수 있다.Referring to FIG. 4, in step S810, voice data of a talker may be received.

추가적으로는, 음성 데이터 이외에 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.Additionally, it may receive interactive input in the form of text data and packet data in addition to voice data.

단계S820에서는 음성 데이터에 기초하여 상기 발화자를 식별할 수 있다.In step S820, the talker may be identified based on the voice data.

이 때, 전자문서 데이터 제공 장치는, 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.In this case, the electronic document data providing apparatus may store a plurality of user information. User information may be stored in a database and updated by receiving user feedback.

단계S830에서는 전자문서 데이터를 생성할 수 있다. 이 때, 상기 발화 내용과 연관된 전자문서 데이터를 생성하는 것일 수 있다. 생성한 전자문서 데이터를 발화자가 제 1 사용자인 경우와 제 2사용자인 경우에 따라 다르게 업데이트할 수 있다. In step S830, electronic document data may be generated. In this case, the electronic document data related to the utterance content may be generated. The generated electronic document data may be updated differently depending on the case where the talker is the first user and the second user.

단계 S840은 발화자가 제 1 사용자인 경우, 단계 S850은 발화자가 제 2 사용자인 경우를 나타낸다.Step S840 indicates a case where the talker is a first user, and step S850 indicates a case where the talker is a second user.

단계S840에서는 식별 결과 상기 발화자가 제 1 사용자인 경우, 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.In step S840, if the speaker is the first user as a result of identification, the electronic document data may be updated so that the voice data is reflected in the first part of the electronic document.

단계S850에서는 상기 식별 결과 상기 발화자가 제 2 사용자인 경우, 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.In step S850, when the speaker is a second user as a result of the identification, the electronic document data may be updated so that the voice data is reflected in the second part of the electronic document.

예를 들어, 발화자가 결재자인 경우, 발화자의 음성 데이터가 전자문서의 결재 부분에 반영되는 것일 수 있다. 결재자인 발화자가 "서명해줘"라고 발화했을 때, 전자문서의 결재자 서명란에 서명이 되는 것일 수 있다.For example, when the speaker is the approver, voice data of the speaker may be reflected in the payment portion of the electronic document. When the talker, who is the approver, utters "Sign me", the signature of the approver may be signed in the electronic document.

단계S860에서는 업데이트 결과를 상기 전자문서 소비 디바이스로 전송할 수 있다. 이 때, 전자문서 업데이트 결과를 전송하고, 사용자로부터 피드백을 수신할 수 있다.In step S860, the update result may be transmitted to the electronic document consuming device. In this case, the electronic document update result may be transmitted and a feedback may be received from the user.

도 5은 본원의 일 실시예에 따른 발화자를 식별하는 방법을 나타내는 흐름도이다.5 is a flowchart illustrating a method of identifying a talker according to an embodiment of the present disclosure.

도5를 참조하면, 단계S821에서는 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.Referring to FIG. 5, in step S821, a plurality of user information may be stored. User information may be stored in a database and updated by receiving user feedback.

단계 S822에서는 발화자가 상기 사용자 정보에 저장된 사용자인지 판단할 수 있다. 상기 데이터베이스에 저장된 복수의 사용자 별 음성모델과 발화자의 음성 데이터를 비교하여 일치하는 음성모델이 있는지를 판단할 수 있다.In step S822, it may be determined whether the talker is a user stored in the user information. It is possible to determine whether or not there is a matching voice model by comparing the voice models of a plurality of users stored in the database with voice data of a talker.

단계 S823에서는 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악할 수 있다. 발화자가 데이터베이스에 저장된 사용자로 판단될 경우, 데이터베이스에 음성 데이터와 매칭되어 저장된 정보를 기반으로 발화자의 정보를 파악할 수 있다. 또한, 발화 내용을 사용자 음성과 매칭하여 갱신할 수 있다.In step S823, the information of the talker may be identified by analyzing the voice data according to the determination result. When it is determined that the talker is a user stored in the database, information of the talker may be identified based on information that is matched with voice data and stored in the database. In addition, the content of speech may be updated by matching the user's voice.

반면, 발화자가 데이터베이스에 저장되지 않은 사용자로 판단될 경우, 발화자가 말한 내용을 분석하여 발화자의 정보를 파악할 수 있다. 또한, 데이터베이스에 상기 발화자의 음성 데이터 및 분석 내용을 매칭하여 신규로 등록할 수 있다.On the other hand, when it is determined that the talker is a user who is not stored in the database, information of the talker can be identified by analyzing the contents of the talker. In addition, it is possible to newly register by matching the speech data and analysis content of the talker in the database.

상술한 설명에서, 단계 S810 내지 S860은 본원의 구현 예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.In the above description, steps S810 to S860 may be further divided into additional steps or may be combined into fewer steps, according to an exemplary embodiment of the present disclosure. In addition, some steps may be omitted as necessary, and the order between steps may be changed.

본원의 일 실시 예에 따른 전자문서 데이터 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method of providing electronic document data according to an exemplary embodiment of the present disclosure may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The above-described hardware device may be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

또한, 전술한 전자문서 데이터 제공 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.In addition, the above-described method of providing electronic document data may be implemented in the form of a computer program or application executed by a computer stored in a recording medium.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present application is for illustrative purposes only, and those of ordinary skill in the art to which the present application pertains will be able to understand that it is possible to easily transform it into other specific forms without changing the technical spirit or essential features of the present application. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not limiting. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present application is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present application.

10: 전자문서 데이터 제공 시스템
100: 전자문서 데이터 제공 장치
110: 발화자 음성 수신부
120: 발화자 식별부
130: 전자문서 데이터 생성부
140: 전자문서 업데이트부
150: 전자문서 결과 전송부
200: 전자문서 소비 디바이스
10: Electronic document data provision system
100: electronic document data providing device
110: talker voice receiver
120: talker identification unit
130: electronic document data generation unit
140: electronic document update unit
150: electronic document result transmission unit
200: electronic document consumption device

Claims (11)

전자문서 데이터 제공 방법에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계;
상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계;
전자문서 데이터를 생성하는 단계;
상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 단계; 및
상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 단계를 포함하는 전자문서 데이터 제공 방법.
In the method of providing electronic document data,
Receiving voice data of a talker from an electronic document consuming device;
Identifying the talker based on the voice data;
Generating electronic document data;
As a result of the identification, if the talker is the first user, the electronic document data is updated so that the voice data is reflected in the first part of the electronic document. Updating the electronic document data to be reflected in a second part; And
And transmitting the update result to the electronic document consuming device.
제1항에 있어서,
상기 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계는,
상기 복수의 사용자 정보를 저장하는 단계;
상기 발화자가 상기 사용자 정보에 저장된 사용자인지 판단하는 단계; 및
상기 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악하는 단계;
를 포함하는 것인, 전자문서 데이터 제공 방법.
The method of claim 1,
Identifying the talker based on the voice data,
Storing the plurality of user information;
Determining whether the talker is a user stored in the user information; And
Analyzing voice data according to the determination result to determine information of the talker;
That includes, electronic document data providing method.
제2항에 있어서,
상기 사용자 정보는 사용자가 속한 그룹에서의 직급을 포함하는 개인정보 및 그룹정보를 저장하고,
상기 발화자를 식별하는 단계는,
상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단하는 단계,
를 더 포함하는 것인 전자문서 처리 방법.
The method of claim 2,
The user information stores personal information and group information including the position in the group to which the user belongs,
Identifying the talker,
Determining authority information for distinguishing whether the talker is a first user or a second user based on the position,
The electronic document processing method further comprising a.
제3항에 있어서,
상기 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것인, 전자문서 처리 방법.
The method of claim 3,
When the user is the first user as a result of determining the authorization information, the electronic document data is updated by processing security data in a range accessible to the second user.
제3항에 있어서,
상기 사용자 정보는,
사용자에 따라 자주 입력받는 상용구를 포함하고,
상기 전자문서 데이터를 업데이트하는 단계는,
상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트 하는 단계, 를 포함하는 것인, 전자문서 처리 방법.
The method of claim 3,
The user information,
Includes boilerplate frequently inputted by users,
The step of updating the electronic document data,
Comprising the step of replacing and updating the speech content related to the boilerplate text with the stored boilerplate text.
제5항에 있어서,
상기 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 사용자 별 상용구에 반영되는 것인, 전자문서 처리 방법.
The method of claim 5,
The user information is updated based on the content uttered by the talker, classified based on the personal information and group information, and reflected in the boilerplate for each user.
제1항에 있어서,
상기 전자문서 데이터를 생성하는 단계는,
복수의 전자문서 유형별 템플릿을 저장하는 단계;를 포함하고,
사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것인, 전자문서 데이터 제공 방법.
The method of claim 1,
Generating the electronic document data,
Including; storing templates for each type of a plurality of electronic documents,
If there is an electronic document previously stored by the user, the electronic document is called, and if there is no electronic document stored, a new electronic document is generated by applying the template according to the user's request.
제1항에 있어서,
상기 제 1 사용자는 결재자를 포함하고,
상기 업데이트 결과는,
상기 발화자가 제1사용자일 경우,
상기 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것인, 전자문서 데이터 제공 방법.
The method of claim 1,
The first user includes a payer,
The update result is,
When the talker is the first user,
The electronic document data providing method comprising a list of electronic documents waiting for payment processing among the updated electronic documents or a list of payment requestors who have requested the first user for payment.
제1항에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계는,
발화자로부터 전자문서 데이터에 대해 음성 데이터, 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것인, 전자문서 데이터 제공 방법.
The method of claim 1,
Receiving the voice data of the talker from the electronic document consuming device,
A method of providing electronic document data, receiving an interactive input for electronic document data from a talker in the form of voice data, text data, and packet data.
전자문서 데이터 제공 장치에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 발화자 음성 수신부;
상기 음성 데이터에 기초하여 상기 발화자를 식별하는 발화자 식별부;
전자문서 데이터를 생성하는 전자문서 데이터 생성부;
상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 전자문서 업데이트부; 및
상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 전자문서 결과 전송부를 포함하는 전자문서 데이터 제공 장치.
In the electronic document data providing device,
A talker voice receiving unit for receiving voice data of the talker from the electronic document consuming device;
A talker identification unit for identifying the talker based on the voice data;
An electronic document data generator for generating electronic document data;
As a result of the identification, if the talker is the first user, the electronic document data is updated so that the voice data is reflected in the first part of the electronic document. An electronic document update unit for updating the electronic document data to be reflected in a second part; And
Electronic document data providing apparatus comprising an electronic document result transmission unit for transmitting the update result to the electronic document consuming device.
제1항 내지 제9항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium recording a program for executing the method of claim 1 on a computer.
KR1020190035988A 2019-03-28 2019-03-28 Method and apparatus for providing electronic document data through speaker identification KR102280453B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190035988A KR102280453B1 (en) 2019-03-28 2019-03-28 Method and apparatus for providing electronic document data through speaker identification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190035988A KR102280453B1 (en) 2019-03-28 2019-03-28 Method and apparatus for providing electronic document data through speaker identification

Publications (2)

Publication Number Publication Date
KR20200114357A true KR20200114357A (en) 2020-10-07
KR102280453B1 KR102280453B1 (en) 2021-07-22

Family

ID=72884680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190035988A KR102280453B1 (en) 2019-03-28 2019-03-28 Method and apparatus for providing electronic document data through speaker identification

Country Status (1)

Country Link
KR (1) KR102280453B1 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070299880A1 (en) * 2006-06-22 2007-12-27 Fuji Xerox Co., Ltd. Document Management Server, Document Management Method, Computer Readable Medium, Computer Data Signal, and System For Managing Document Use
US20110153857A1 (en) * 2009-12-23 2011-06-23 Research In Motion Limited Method for partial loading and viewing a document attachment on a portable electronic device
KR20120051517A (en) * 2010-11-12 2012-05-22 삼성전자주식회사 Method and system for generating document using speech data, and image forming apparatus having it
KR20140142280A (en) * 2012-03-08 2014-12-11 페이스북, 인크. Device for extracting information from a dialog
KR20150080550A (en) * 2013-04-19 2015-07-09 시아오미 아이엔씨. Electronic document data updating method and device
KR20170059248A (en) * 2015-11-20 2017-05-30 쿠팡 주식회사 System, method, and computer program for managing warehouse
WO2017217978A1 (en) * 2016-06-15 2017-12-21 Nuance Communications, Inc. Techniques for wake-up word recognition and related systems and methods

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070299880A1 (en) * 2006-06-22 2007-12-27 Fuji Xerox Co., Ltd. Document Management Server, Document Management Method, Computer Readable Medium, Computer Data Signal, and System For Managing Document Use
US20110153857A1 (en) * 2009-12-23 2011-06-23 Research In Motion Limited Method for partial loading and viewing a document attachment on a portable electronic device
KR20120051517A (en) * 2010-11-12 2012-05-22 삼성전자주식회사 Method and system for generating document using speech data, and image forming apparatus having it
KR20140142280A (en) * 2012-03-08 2014-12-11 페이스북, 인크. Device for extracting information from a dialog
KR20150080550A (en) * 2013-04-19 2015-07-09 시아오미 아이엔씨. Electronic document data updating method and device
KR20170059248A (en) * 2015-11-20 2017-05-30 쿠팡 주식회사 System, method, and computer program for managing warehouse
WO2017217978A1 (en) * 2016-06-15 2017-12-21 Nuance Communications, Inc. Techniques for wake-up word recognition and related systems and methods

Also Published As

Publication number Publication date
KR102280453B1 (en) 2021-07-22

Similar Documents

Publication Publication Date Title
US11551692B2 (en) Digital assistant
US11217239B2 (en) Computer proxy messaging bot
US20230206911A1 (en) Processing natural language using machine learning to determine slot values based on slot descriptors
US10217059B2 (en) Method and system for generating natural language training data
US11425215B1 (en) Methods and systems for virtual assistant routing
US20190221208A1 (en) Method, user interface, and device for audio-based emoji input
US11157533B2 (en) Designing conversational systems driven by a semantic network with a library of templated query operators
US20140207716A1 (en) Natural language processing method and system
KR102170088B1 (en) Method and system for auto response based on artificial intelligence
US11244120B1 (en) Systems and methods for processing nuances in natural language
US11538464B2 (en) Speech recognition using data analysis and dilation of speech content from separated audio input
US20180308481A1 (en) Automated assistant data flow
KR102188564B1 (en) Method and system for machine translation capable of style transfer
US11115410B1 (en) Secure authentication for assistant systems
CN116802629A (en) Multi-factor modeling for natural language processing
KR20230029582A (en) Using a single request to conference in the assistant system
Patil et al. A voice based assistant using Google dialogflow and machine learning
EP4252149A1 (en) Method and system for over-prediction in neural networks
JP2020042131A (en) Information processor, information processing method and program
US11056103B2 (en) Real-time utterance verification system and method thereof
JP7182584B2 (en) A method for outputting information of parsing anomalies in speech comprehension
KR20190074508A (en) Method for crowdsourcing data of chat model for chatbot
KR20180089242A (en) Method, system and non-transitory computer-readable recording medium for generating dialogue contents according to output type for same at chatbot
KR102280453B1 (en) Method and apparatus for providing electronic document data through speaker identification
Bisser et al. Introduction to the microsoft conversational ai platform

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)