KR102280453B1

KR102280453B1 - 화자 식별을 통한 전자문서 데이터 제공 방법 및 장치

Info

Publication number: KR102280453B1
Application number: KR1020190035988A
Authority: KR
Inventors: 박미경; 최영범; 김현우
Original assignee: 주식회사 포시에스
Priority date: 2019-03-28
Filing date: 2019-03-28
Publication date: 2021-07-22
Also published as: KR20200114357A

Abstract

전자문서 데이터 제공 방법이 제공되며, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계, 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계, 전자문서 데이터를 생성하는 단계, 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 단계, 상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 단계를 포함할 수 있다.

Description

화자 식별을 통한 전자문서 데이터 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING ELECTRONIC DOCUMENT DATA THROUGH SPEAKER IDENTIFICATION}

본원은 화자 식별을 통한 전자문서 데이터 제공 방법 및 장치에 관한 것이다.

스마트폰이나 웨어러블 디바이스의 경우, 한 명의 사용자가 개인 디바이스를 사용하는 경우가 대부분이다. 하지만 인공지능/스마트 스피커인 경우에는 지정된 장소에 설치하여 다수의 사용자가 하나의 디바이스를 공용으로 사용하는 경우가 많다.

전자문서 작성에 있어서도 다수의 사용자가 하나의 인공지능/스마트 스피커를 통하여 서비스를 제공 받는 경우가 많기 때문에, 사용자의 역할에 맞는 전자문서 데이터를 제공해야 한다.

특히, 전자문서 결재 및 요청의 경우 사용자의 역할에 따라 문서의 내용이나 형태가 달라지므로 사용자가 누구인지 식별하고 해당 사용자에 맞는 전자문서 데이터를 제공해야 한다.

본원의 배경이 되는 기술은 한국등록특허공보 제 10-1705228호에 개시되어 있다.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 디바이스에 발화중인 발화자를 식별하고, 상기 발화자의 역할에 해당하는 전자문서 데이터를 제공하는 것을 목적으로 한다.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 전자문서 데이터 제공 방법은, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계, 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계, 전자문서 데이터를 생성하는 단계, 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 단계, 상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 단계를 포함할 수 있다.

본원의 일 실시예에 따르면, 상기 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계는, 상기 복수의 사용자 정보를 저장하는 단계, 상기 발화자가 상기 사용자 정보에 저장된 사용자인지 판단하는 단계, 상기 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악하는 단계를 포함할 수 있다.

본원의 일 실시예에 따르면, 상기 사용자 정보는 사용자가 속한 그룹에서의 직급을 포함하는 개인정보 및 그룹정보를 저장하고, 상기 발화자를 식별하는 단계는, 상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단하는 단계를 더 포함할 수 있다.

본원의 일 실시예에 따르면, 상기 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것일 수 있다.

본원의 일 실시예에 따르면, 사용자에 따라 자주 입력받는 상용구를 포함하고, 상기 전자문서 데이터를 업데이트하는 단계는, 상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트 하는 단계를 포함할 수 있다.

본원의 일 실시예에 따르면, 상기 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 사용자 별 상용구에 반영되는 것일 수 있다.

본원의 일 실시예에 따르면, 상기 전자문서 데이터를 생성하는 단계는, 복수의 전자문서 유형별 템플릿을 저장하는 단계를 포함하고, 사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것일 수 있다.

본원의 일 실시예에 따르면, 상기 제 1 사용자는 결재자를 포함하고, 상기 업데이트 결과는, 상기 업데이트 결과는, 상기 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것일 수 있다.

본원의 일 실시예에 따르면, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계는, 발화자로부터 전자문서 데이터에 대해 음성 데이터, 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 전자문서 데이터 제공 장치는, 전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 발화자 음성 수신부, 상기 음성 데이터에 기초하여 상기 발화자를 식별하는 발화자 식별부, 전자문서 데이터를 생성하는 전자문서 데이터 생성부, 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 전자문서 업데이트부, 상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 전자문서 결과 전송부를 포함할 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.

전술한 본원의 과제 해결 수단에 의하면, 발화자를 식별하여 전자문서 데이터를 제공함으로써, 하나의 디바이스로도 다수의 사용자의 역할에 맞춰 전자문서 데이터를 제공할 수 있다.

도 1은 본원의 일 실시예에 따른 전자문서 데이터 제공 시스템 개략도이다.
도 2는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 개인별 상용구를 적용한 전자문서 데이터 제공을 나타내는 도면이다.
도 3은 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 사용자 요청에 따른 전자문서 데이터 제공을 나타내는 도면이다.
도 4는 본원의 일 실시예에 따른 전자문서 데이터 제공 방법을 나타내는 흐름도이다.
도 5은 본원의 일 실시예에 따른 발화자를 식별하는 방법을 나타내는 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.

본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

이하에서는 도 1 내지 도 5를 참조하여 본원의 전자문서 데이터 제공 시스템(10)에 대하여 설명한다.

도 1은 본원의 일 실시예에 따른 전자문서 데이터 제공 시스템 개략도이다. 도 1을 참조하면, 전자문서 데이터 제공 시스템(10)은 전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100)를 포함할 수 있다. 본 명세서에서 전자문서 소비 디바이스(200)는 사용자 단말이라고 달리 표현할 수 있다.

전자문서 소비 디바이스(200)는 사용자 입력을 수신하고, 상기 사용자 입력에 기초하여 전자문서 데이터 제공 장치(100)에 상기 사용자 입력에 대한 처리를 요청하고, 전자문서 데이터 제공 장치(100)로부터 상기 사용자 입력에 대한 처리 결과를 수신할 수 있다.

예를 들면, 전자문서 소비 디바이스(200)는, 스마트워치(Smartwatch), 인공지능 스피커, 스마트폰(Smartphone), 스마트패드(SmartPad), 태블릿 PC등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 무선 통신 장치 및 데스크탑 컴퓨터, 스마트 TV 등 유선 통신 장치를 포함할 수 있다.

특히, 상기 전자문서 소비 디바이스(200)는, 스마트 스피커(Smart Speaker), 스마트 카(Smart Car), 스마트 가전(Smart Appliances), 웨어러블 장치(Wearable Device) 증강현실기기 (VR/MR) 등 새롭게 생겨나는 각종 통신기술을 이용한 다양한 음향기기, 구동기기 등을 포함할 수 있다.

또한, 예시적으로, 전자문서 소비 디바이스(200)는 사용자의 음성을 인식할 수 있는 음성 인식 단말 및 사용자가 별도의 입력 장치를 통해 상기 사용자 입력 문장을 입력할 수 있는 대화형 단말을 포함할 수 있다.

이 때, 전자문서 소비 디바이스(200)는 전자문서 소비 어플리케이션을 포함할 수 있다. 전자문서 소비 어플리케이션은, 문서작성 서비스와 관련되어 디바이스에 설치되는 것으로, 사용자 요청에 따라 실행되는 것일 수 있다.

전자문서 데이터 제공 장치(100)는 전자문서 소비 디바이스(200), 더 구체적으로는 전자문서 소비 어플리케이션과 연동하여 전자문서 작성 서비스를 제공하는 서비스 제공자의 서버 장치로, 발화자를 식별하여 전자문서 데이터를 다르게 제공할 수 있다.

전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100)는 상호 연결되는 네트워크로 통신(처리 요청 송수신 및 처리 결과 송수신)할 수 있다.

상기 네트워크는 전자문서 소비 디바이스(200)와 전자문서 데이터 제공 장치(100) 간에 정보 교환이 가능한 유, 무선의 연결 구조를 의미하며, 예시적으로, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5G 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.

본원의 일 실시예에 따르면, 전자문서 데이터 제공 장치(100)는 발화자에 따라 전자문서의 형태를 달리 제공할 수 있다. 달리 말해, 발화자를 식별하고 발화자의 역할 및 권한에 따라 전자문서의 형태를 달리 제공할 수 있다. 이 때, 발화자는 다수의 사용자 중 전자문서 소비 디바이스(200)에 발화중인 사용자를 의미할 수 있다.

다수의 사용자는 회사 내에서 직급 및 역할에 따라 전자문서에 대한 권한을 다르게 가질 수 있다. 예를 들어, 사원은 결재 요청자, 부장은 결재자로 권한을 분류할 수 있다. 또한, 같은 직급이라도 업무에 따라 권한은 다르게 분류될 수 있다. 직급 및 역할은, 신청자 중간 처리자, 결재자, 접수자 등이 될 수 있으며, 이에 한정하는 것은 아니다.

전자문서 데이터 제공 장치(100)는 발화자 음성 수신부(110), 발화자 식별부(120), 전자문서 데이터 생성부(130), 전자문서 업데이트부(140), 전자문서 결과 전송부(150)를 포함할 수 있다.

발화자 음성 수신부(110)는 전자문서 소비 디바이스로(200)부터 발화자의 음성 데이터를 수신할 수 있다. 추가적으로는, 음성 데이터 이외에 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.

발화자 음성 수신부(110)는 사용자에 의해 발화된 음성을 인식하여 텍스트 형식으로 변환할 수 있다. 이를 위해, 발화자 음성 수신부(110)는, 당해 기술 분야에서 널리 알려진 적어도 하나의 음성 인식 알고리즘을 이용할 수 있고, 상기 텍스트 형식으로의 변환을 위해STT(Speech-To-Text) 기법이 활용될 수 있다.

발화자 식별부(120)는 상기 음성 데이터에 기초하여 상기 발화자를 식별할 수 있다. 본원의 일 실시예에 따르면, 발화자 식별부(120)는 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.

상기 데이터베이스는 사용자의 음성 데이터를 제공받아 권한 정보, 개인 정보, 그룹 정보 등을 매칭하여 저장할 수 있다. 음성 데이터는 전자문서 소비 디바이스(200)로부터 수신할 수 있으며, 상기 데이터베이스는 음성 데이터의 특징을 추출하여 사용자 별 음성모델을 구축하는 것일 수 있다. 권한 정보, 개인 정보, 그룹 정보는 사용자로부터 입력받는 것일 수 있다.

또한, 발화자 식별부(120)는 발화자가 상기 사용자 정보에 저장된 사용자인지 판단할 수 있다. 상기 데이터베이스에 저장된 복수의 사용자 별 음성모델과 발화자의 음성 데이터를 비교하여 일치하는 음성모델이 있는지를 판단할 수 있다.

발화자 식별부(120)는 상기 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악할 수 있다. 발화자가 데이터베이스에 저장된 사용자로 판단될 경우, 데이터베이스에 음성 데이터와 매칭되어 저장된 정보를 기반으로 발화자의 정보를 파악할 수 있다.

반면, 발화자가 데이터베이스에 저장되지 않은 사용자로 판단될 경우, 발화자가 말한 내용을 분석하여 발화자의 정보를 파악할 수 있다. 또한, 데이터베이스에 상기 발화자의 음성 데이터 및 분석 내용을 매칭하여 신규로 등록할 수 있다.

예를 들어, 사용자 정보에 저장되지 않은 발화자가 "나 A팀 신입 사원인데, 우리팀 명단 보여줘"라고 했을 때, 전자문서 데이터 제공 장치는, 상기 발화자의 음성데이터를 A팀 신입 사원으로 등록할 수 있다.

사용자 정보는 사용자가 속한 그룹에서의 직급을 포함하는 개인정보 및 그룹정보를 저장하고, 발화자 식별부(120)는 상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단할 수 있다.

개인정보는 직급 이외에 이름, 나이, 성별, 선호하는 문서 템플릿을 더 포함할 수 있고, 그룹정보는 그룹 이름, 그룹 배치도, 그룹 연락망을 포함할 수 있으며, 이에 한정되는 것은 아니다.

또한, 사용자 정보는 다수의 사용자에 대하여 공통 카테고리를 정하여 분류한 것일 수 있다. 예를 들어, 같은 회사 내에 다수의 사용자를 팀 별로 카테고리를 나누어 분류하여 저장한 것일 수 있다. 권한정보는, 신청자, 중간 처리자, 결재자, 접수자 등으로 역할에 따라 분류될 수 있다. 전자문서 데이터 제공 장치(100)는 발화자의 권한정보에 따라 다른 내용을 공개하는 것일 수 있다.

전자문서 데이터 생성부(130)는 전자문서 데이터를 생성할 수 있다.

본원의 일 실시예에 따른 전자문서 데이터 생성부(130)는 복수의 전자문서 유형별 템플릿을 저장할 수 있고, 사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것일 수 있다.

예를 들어, 사용자가 A설계 업무와 관련하여 전자문서 데이터를 요청할 수 있으며, 사용자가 A설계 업무와 관련해 저장한 전자문서가 있을 경우 해당 전자문서를 불러올 수 있다.

반면, A설계 업무와 관련하여 저장한 전자문서가 없을 경우, 설계 업무에 적용할 수 있는 전자문서 템플릿을 적용시켜 신규 전자문서를 생성할 수 있다.

템플릿은 문서의 항목 배치, 그래픽, 파일 형식 등을 포함하며, 사용자 요청에 의해 조합되는 것일 수 있다. 예를 들어, A설계 업무와 관련하여 사용자가 문서의 항목 순서 및 배치를 조합할 수 있다. 사용자 요청은, 음성 데이터로서 입력되는 것일 수 있다.

전자문서 업데이트부(140)는 상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.

예를 들어, 발화자가 결재자인 경우, 발화자의 음성 데이터가 전자문서의 결재 부분에 반영되는 것일 수 있다. 결재자인 발화자가 "서명해줘"라고 발화했을 때, 전자문서의 결재자 서명란에 서명이 되는 것일 수 있다.

전자문서 업데이트부(140)는 전자문서 기입 항목에 대해 대화형으로 질문할 수 있다. 대화형은, 사용자로부터 질문에 대한 입력을 받고, 상기 입력에 대해 추가적으로 연계 질문을 하거나 다음 항목으로 넘어가 질문을 하여 문서를 보완할 수 있다.

구체적으로, 전자문서의 작성이 완료(모든 필수 기입 항목에 대한 기입이 완료된 것)될 때까지, 상기 전자문서 기입 항목에 연계된 질문을 전자문서 소비 디바이스(200)에 전송하고, 상기 질문에 대응되는 사용자의 응답을 포함하는 사용자 입력을 수신하고, 이를 분석하여 해당하는 전자문서 기입 항목에 입력 값을 할당하는 대화 방식을 통하여, 전자문서를 완성해 나갈 수 있다.

전자문서 업데이트부(140)는 사용자로부터 입력되지 않은 항목에 대해 순서를 변경하여 마지막 항목으로 구성할 수 있다. 입력되지 않은 항목이 다수개일 경우, 연관된 항목끼리 위치하도록 순서를 배치하여 다시 질문할 수 있다. 또한, 입력된 항목 중 입력되지 않은 항목과 연관된 항목들을 함께 구성하여 다시 질문할 수 있다.

전자문서 업데이트부(140)는 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것일 수 있다. 상기 보안 데이터 처리는, 예를 들어, 암호화일 수 있다.

예를 들어, 제 1 사용자가 결재 요청자이고 제 2 사용자가 결재자일 때, 전자문서 데이터 제공 장치가 제 1 사용자에게 전자문서 데이터를 제공하는 경우, 결재자 서명란을 보안 데이터 처리하여 업데이트할 수 있다. 이 때, 상기 발화자는, 결재자 서명란을 제외한 전자문서를 제공받을 수 있다.

또한, 전자문서 업데이트부(140)는 사용자로부터 음성데이터로 전자문서 작성에 대한 입력을 받고 음성데이터의 내용을 분석하여 전자문서 데이터를 업데이트 할 수 있다.

전자문서 업데이트부(140)는, 전자문서에 대한 처리의 타당성 및 안정성을 재고하기 위하여, 화자 인식(Speaker Recognition) 기법을 활용하여, 상기 전자문서에 대한 처리 권한을 가진 사용자 의해 해당 전자문서에 대한 처리가 이루어졌는지 여부를 다시 검증할 수 있다.

전자문서 결과 전송부(150)는 업데이트 결과를 상기 전자문서 소비 디바이스(200)로 전송할 수 있다. 구체적으로는, 전자문서 소비 디바이스(200)의 어플리케이션을 통해 전송할 수 있다.

전자문서 소비 디바이스(200)에 전자문서 업데이트 결과를 전송하고, 사용자로부터 피드백을 수신할 수 있다. 피드백의 내용을 분석하여, 전자문서 업데이트부(140)에 전달할 수 있다. 전자문서 업데이트부(140)는 피드백 내용에 따라 전자문서를 업데이트할 수 있다.

도 2는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 개인별 상용구를 적용한 전자문서 데이터 제공을 나타내는 도면이다.

도2를 참조하면, 사용자 정보는 사용자에 따라 자주 입력받는 상용구를 포함하고, 전자문서 업데이트부(140)는 상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트할 수 있다.

상용구는, 사용자 별로 다르게 저장되는 것이며, 동일한 단어라도 내용이 다르게 저장되는 것일 수 있다. 예를 들어, 제1사용자의 상용구에 있어서, 집 주소는 '강남구 논현로 123번지'이고, 끝맺음은 '제1사용자 드림'일 수 있다. 반면, 제 2 사용자의 상용구에 있어서, 집 주소는 '강남구 논현로 456번지'이고, 끝맺음은 '감사합니다'일 수 있다.

상용구는 사용자가 특정 발화어와 관련하여 상용구를 설정하여 저장하거나, 사용자가 동일한 의미를 가지는 발화어를 일정 횟수 이상 입력하였을 때 상기 발화어가 상기 사용자의 상용구로 등록되는 것일 수 있다.

예를 들어, 사용자가 발화어 '끝맺음'에 '감사합니다'로 설정하여 저장한 경우, 사용자가 "끝맺음 입력해줘"라고 발화함으로써 전자문서 데이터의 끝부분에는 '감사합니다'라는 문구가 입력될 수 있다.

사용자가 "끝맺음으로 감사합니다 입력해줘"라는 발화를 일정 횟수 이상 입력한 경우, 상기 사용자의 상용구로 등록될 수 있다. 일정 횟수는, 사용자가 설정한 횟수일 수 있으며, 예를 들어, 15회일 수 있다. 상기 횟수는 전자문서 소비 디바이스의 어플리케이션을 통해 설정되는 것일 수 있다.

또한, 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 사용자 별 상용구에 반영되는 것일 수 있다.

예를 들어, 사용자의 그룹정보가 A팀으로 분류된 경우, 사용자의 상용구에 있어서 발화어 '우리 팀'에 대한 상용구는 'A팀'으로 등록될 수 있다. 또한, "우리 팀 사람들 명단 작성해줘"라고 했을 때, 사용자 정보 데이터베이스에서 그룹정보 A팀으로 분류된 사용자들의 명단을 수집하여 전자문서 데이터로 제공할 수 있다.

도3은 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 결재 문서 데이터 제공을 나타내는 도면이다.

도3을 참조하면, 전자문서 결과 전송부(150)는 전자문서 소비 디바이스(200)로 사용자가 요청한 전자문서 데이터 목록을 전송할 수 있다.

예를 들어, 제 1 사용자는 결재자를 포함하고, 전자문서 데이터 업데이트 결과는, 발화자가 제1사용자일 경우, 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것일 수 있다.

구체적으로, 본원의 일 실시예에 따른 전자문서 데이터 제공 장치(100)는 발화자의 권한정보에 해당하는 문서들을 수집하고, 해당 문서들 중 발화자가 요청하는 전자문서들의 목록을 생성하여 전자문서 소비 디바이스(200)로 전송할 수 있다.

또한, 업무 처리가 완료된 문서와 완료되지 않은 문서를 분류하고, 사용자가 요청하는 문서 분류에 대해 목록을 생성하여 전자문서 소비 디바이스(200)로 전송할 수 있다.

도4는 본원의 일 실시예에 따른 전자문서 데이터 제공 장치에 의한 전자문서 데이터 제공 방법을 나타내는 흐름도이다.

도4를 참조하면, 단계S810에서는 발화자의 음성 데이터를 수신할 수 있다.

추가적으로는, 음성 데이터 이외에 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것일 수 있다.

단계S820에서는 음성 데이터에 기초하여 상기 발화자를 식별할 수 있다.

이 때, 전자문서 데이터 제공 장치는, 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.

단계S830에서는 전자문서 데이터를 생성할 수 있다. 이 때, 상기 발화 내용과 연관된 전자문서 데이터를 생성하는 것일 수 있다. 생성한 전자문서 데이터를 발화자가 제 1 사용자인 경우와 제 2사용자인 경우에 따라 다르게 업데이트할 수 있다.

단계 S840은 발화자가 제 1 사용자인 경우, 단계 S850은 발화자가 제 2 사용자인 경우를 나타낸다.

단계S840에서는 식별 결과 상기 발화자가 제 1 사용자인 경우, 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.

단계S850에서는 상기 식별 결과 상기 발화자가 제 2 사용자인 경우, 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트할 수 있다.

단계S860에서는 업데이트 결과를 상기 전자문서 소비 디바이스로 전송할 수 있다. 이 때, 전자문서 업데이트 결과를 전송하고, 사용자로부터 피드백을 수신할 수 있다.

도 5은 본원의 일 실시예에 따른 발화자를 식별하는 방법을 나타내는 흐름도이다.

도5를 참조하면, 단계S821에서는 복수의 사용자 정보를 저장할 수 있다. 사용자 정보는 데이터베이스에 저장되어 사용자의 피드백을 받아 갱신될 수 있다.

단계 S822에서는 발화자가 상기 사용자 정보에 저장된 사용자인지 판단할 수 있다. 상기 데이터베이스에 저장된 복수의 사용자 별 음성모델과 발화자의 음성 데이터를 비교하여 일치하는 음성모델이 있는지를 판단할 수 있다.

단계 S823에서는 판단결과에 따라 음성 데이터를 분석하여 상기 발화자의 정보를 파악할 수 있다. 발화자가 데이터베이스에 저장된 사용자로 판단될 경우, 데이터베이스에 음성 데이터와 매칭되어 저장된 정보를 기반으로 발화자의 정보를 파악할 수 있다. 또한, 발화 내용을 사용자 음성과 매칭하여 갱신할 수 있다.

상술한 설명에서, 단계 S810 내지 S860은 본원의 구현 예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

본원의 일 실시 예에 따른 전자문서 데이터 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

또한, 전술한 전자문서 데이터 제공 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.

10: 전자문서 데이터 제공 시스템
100: 전자문서 데이터 제공 장치
110: 발화자 음성 수신부
120: 발화자 식별부
130: 전자문서 데이터 생성부
140: 전자문서 업데이트부
150: 전자문서 결과 전송부
200: 전자문서 소비 디바이스

Claims

전자문서 데이터 제공 장치에 의해 수행되는 전자문서 데이터 제공 방법에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계;
상기 음성 데이터에 기초하여 상기 발화자를 식별하는 단계;
전자문서 데이터를 생성하는 단계;
상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 단계; 및
상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 단계를 포함하고,
상기 발화자를 식별하는 단계는,
복수의 사용자 각각이 속한 그룹정보, 직급을 포함하는 개인정보 및 상기 복수의 사용자 각각이 자주 입력하는 상용구를 포함하는 사용자 정보와 상기 복수의 사용자 각각의 음성 데이터를 매칭하여 저장한 데이터베이스에 기초하여 상기 발화자가 상기 데이터베이스에 저장된 사용자인지 판단하는 단계;
상기 발화자가 상기 데이터베이스에 기 저장된 사용자인 것으로 판단되면, 상기 데이터베이스에 상기 발화자의 음성 데이터와 매칭되어 저장된 상기 사용자 정보를 기반으로 상기 발화자의 정보를 파악하는 단계; 및
상기 발화자가 상기 데이터베이스에 미 저장된 사용자인 것으로 판단되면, 상기 발화자의 음성 데이터에 반영된 내용을 분석하여 상기 발화자의 정보를 파악하고, 상기 발화자의 음성 데이터와 상기 분석된 내용을 매칭하여 상기 데이터베이스에 상기 발화자를 신규 등록하는 단계,
를 포함하고,
상기 발화자의 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 상용구에 반영되는 것을 특징으로 하고,
상기 전자문서 데이터를 업데이트하는 단계는,
상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트 하는 단계,
를 포함하고,
상기 상용구는,
상기 전자문서 소비 디바이스의 어플리케이션을 통해 미리 설정된 횟수 이상의 횟수로 상기 사용자가 반복하여 발화한 문구를 포함하는 것인, 전자문서 데이터 제공 방법.
삭제
제1항에 있어서,
상기 발화자를 식별하는 단계는,
상기 직급에 기초하여 상기 발화자가 제 1 사용자인지 제2 사용자인지를 구분하는 권한정보를 판단하는 단계,
를 더 포함하는 것인 전자문서 데이터 제공 방법.
제3항에 있어서,
상기 권한정보를 판단한 결과 상기 발화자가 제 1 사용자인 경우, 상기 전자문서 데이터는 상기 제2 사용자가 접근 가능한 범위를 보안 데이터 처리하여 업데이트되는 것인, 전자문서 데이터 제공 방법.
삭제
삭제
제1항에 있어서,
상기 전자문서 데이터를 생성하는 단계는,
복수의 전자문서 유형별 템플릿을 저장하는 단계;를 포함하고,
사용자가 기 저장한 전자문서가 있을 경우 해당 전자문서를 불러오되, 저장한 전자문서가 없을 경우 사용자 요청에 따른 상기 템플릿을 적용하여 신규 전자문서를 생성하는 것인, 전자문서 데이터 제공 방법.
제1항에 있어서,
상기 제 1 사용자는 결재자를 포함하고,
상기 업데이트 결과는,
상기 발화자가 제1사용자일 경우,
상기 업데이트된 전자문서 중 결재 처리 대기중인 전자문서의 목록 또는 상기 제 1사용자에게 결재를 요청한 결재요청자 목록을 포함하는 것인, 전자문서 데이터 제공 방법.
제1항에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 단계는,
발화자로부터 전자문서 데이터에 대해 음성 데이터, 텍스트 데이터, 및 패킷 데이터의 형태로 대화형 입력을 받는 것인, 전자문서 데이터 제공 방법.
전자문서 데이터 제공 장치에 있어서,
전자문서 소비 디바이스로부터 발화자의 음성 데이터를 수신하는 발화자 음성 수신부;
상기 음성 데이터에 기초하여 상기 발화자를 식별하는 발화자 식별부;
전자문서 데이터를 생성하는 전자문서 데이터 생성부;
상기 식별 결과 상기 발화자가 제 1 사용자인 경우 상기 음성 데이터가 전자문서의 제 1 부분에 반영되도록 상기 전자문서 데이터를 업데이트하되, 상기 식별 결과 상기 발화자가 제 2 사용자인 경우 상기 음성 데이터가 전자문서의 제 2 부분에 반영되도록 상기 전자문서 데이터를 업데이트하는 전자문서 업데이트부; 및
상기 업데이트 결과를 상기 전자문서 소비 디바이스로 전송하는 전자문서 결과 전송부를 포함하고,
상기 발화자 식별부는,
복수의 사용자 각각이 속한 그룹정보, 직급을 포함하는 개인정보 및 상기 복수의 사용자 각각이 자주 입력하는 상용구를 포함하는 사용자 정보와 상기 복수의 사용자 각각의 음성 데이터를 매칭하여 저장한 데이터베이스에 기초하여 상기 발화자가 상기 데이터베이스에 저장된 사용자인지 판단하고,
상기 발화자가 상기 데이터베이스에 기 저장된 사용자인 것으로 판단되면, 상기 데이터베이스에 상기 발화자의 음성 데이터와 매칭되어 저장된 상기 사용자 정보를 기반으로 상기 발화자의 정보를 파악하고, 상기 발화자가 상기 데이터베이스에 미 저장된 사용자인 것으로 판단되면, 상기 발화자의 음성 데이터에 반영된 내용을 분석하여 상기 발화자의 정보를 파악하고, 상기 발화자의 음성 데이터와 상기 분석된 내용을 매칭하여 상기 데이터베이스에 상기 발화자를 신규 등록하고,
상기 발화자의 사용자 정보는 상기 발화자가 발화한 내용을 기반으로 갱신되고, 상기 개인정보 및 그룹정보를 기반으로 분류되어 상기 상용구에 반영되는 것을 특징으로 하고,
상기 전자문서 업데이트부는,
상기 상용구와 관련된 발화 내용을 상기 저장된 상용구로 치환하여 업데이트 하고,
상기 상용구는,
상기 전자문서 소비 디바이스의 어플리케이션을 통해 미리 설정된 횟수 이상의 횟수로 상기 사용자가 반복하여 발화한 문구를 포함하는 것인, 전자문서 데이터 제공 장치.
제1항, 제3항, 제4항, 제7항 내지 제9항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.