KR102291113B1 - 회의록 작성 장치 및 방법 - Google Patents

회의록 작성 장치 및 방법 Download PDF

Info

Publication number
KR102291113B1
KR102291113B1 KR1020190139919A KR20190139919A KR102291113B1 KR 102291113 B1 KR102291113 B1 KR 102291113B1 KR 1020190139919 A KR1020190139919 A KR 1020190139919A KR 20190139919 A KR20190139919 A KR 20190139919A KR 102291113 B1 KR102291113 B1 KR 102291113B1
Authority
KR
South Korea
Prior art keywords
meeting
unit
minutes
content
title
Prior art date
Application number
KR1020190139919A
Other languages
English (en)
Other versions
KR20210054157A (ko
Inventor
이진운
박누가
이영근
이영훈
Original Assignee
두산중공업 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 두산중공업 주식회사 filed Critical 두산중공업 주식회사
Priority to KR1020190139919A priority Critical patent/KR102291113B1/ko
Publication of KR20210054157A publication Critical patent/KR20210054157A/ko
Application granted granted Critical
Publication of KR102291113B1 publication Critical patent/KR102291113B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

회의록 작성 장치가 제공된다. 상기 회의록 작성 장치는, 회의자의 회의 내용을 획득하는 수집 유니트; 상기 회의 내용을 처리하는 처리 유니트; 및 상기 처리 유니트에서 처리된 상기 회의 내용을 기반으로 회의록을 생성하는 생성 유니트;를 포함할 수 있다.

Description

회의록 작성 장치 및 방법{APPARATUS AND METHOD FOR PRODUCING CONFERENCE RECORD}
본 발명은 회의록을 자동으로 작성하는 장치 및 방법에 관한 것이다.
회의를 진행할 경우 회의가 끝난 이후, 발언자별로 발언한 내용을 회의록으로 작성한다.
종래에는 회의 과정 중 발화한 모든 내용을 비디오로 녹화하고, 회의가 끝난 이후, 기록원이 이를 재생하여 각 발언자마다 발언한 내용을 기록하였다. 따라서, 회의가 6시간 정도 이루어지면 이를 기록하는 데는 10시간(6시간 회의를 재생하며 기록하는 시간) 이상이 소요되었다.
특히, 휴식시간이나 발언이 없는 빈 시간에도 녹화는 이루어져 회의록을 작성하는데 많은 비용이 소요되고 있는 실정이다.
한국등록특허공보 제1970753호에는 음성을 인식해서 회의록을 작성하는 시스템이 나타나 있다.
한국등록특허공보 제1970753호
본 발명의 목적은 회의 내용이 입력되면 회의록을 자동으로 생성하는 회의록 작성 장치 및 회의록 작성 방법을 제공하기 위한 것이다.
본 발명의 실시예에 따르면 회의록 작성 장치가 제공된다. 상기 회의록 작성 장치는, 회의자의 회의 내용을 획득하는 수집 유니트; 상기 회의 내용을 처리하는 처리 유니트; 및 상기 처리 유니트에서 처리된 상기 회의 내용을 기반으로 회의록을 생성하는 생성 유니트;를 포함할 수 있다.
상기 처리 유니트는 상기 회의 내용의 화자를 구별하거나, 상기 회의 내용에 포함된 노이즈를 제거하거나, 상기 회의 내용을 정리할 수 있다.
상기 수집 유니트는 복수 화자의 음성을 획득할 수 있다.
상기 음성의 주파수를 분석해서 상기 제1 화자의 제1 음성과 상기 제2 화자의 제2 음성을 구분하는 구분부, 상기 제1 음성을 제1 텍스트로 변환하고, 상기 제2 음성을 제2 텍스트로 변환하는 변환부가 마련될 수 있다.
상기 생성 유니트는 상기 제1 텍스트와 상기 제2 텍스트가 포함된 상기 회의록을 생성할 수 있다.
생성부 및 배치부가 마련될 수 있다.
상기 생성부는 제1 화자를 나타내는 제1 식별자, 제2 화자를 나타내는 제2 식별자, 상기 제1 화자의 음성이 텍스트화된 제1 텍스트, 상기 제2 화자의 음성이 텍스트화된 제2 텍스트가 포함된 상기 회의록을 생성할 수 있다.
상기 배치부는 상기 회의록 내에서 상기 제1 식별자의 발언으로 인식되는 상기 회의록의 제1 위치에 상기 제1 텍스트를 배치할 수 있다.
상기 배치부는 상기 회의록 내에서 상기 제2 식별자의 발언으로 인식되는 상기 회의록의 제2 위치에 상기 제2 텍스트를 배치할 수 있다.
제1 화자의 개별 마이크에 해당하는 제1 마이크, 제2 화자의 개별 마이크에 해당하는 제2 마이크, 상기 제1 마이크를 통해 입수된 제1 음성과 상기 제2 마이크를 통해 입수된 제2 음성을 이용해서 상기 제1 화자와 상기 제2 화자를 구분하는 구분 모델을 생성하는 학습부가 마련될 수 있다.
상기 제1 마이크에는 상기 제1 화자의 제1 식별자가 부여될 수 있다.
상기 제2 마이크에는 상기 제2 화자의 제2 식별자가 부여될 수 있다.
상기 학습부는 상기 제1 음성과 상기 제1 식별자를 매칭시키고, 상기 제2 음성과 상기 제2 식별자를 매칭시키는 상기 구분 모델을 생성하며, 생성된 상기 구분 모델을 상기 처리 유니트로 제공할 수 있다.
상기 처리 유니트는 상기 구분 모델을 이용해서 상기 회의 내용의 화자를 구별할 수 있다.
회의 모델을 생성하는 학습 유니트가 마련될 수 있다.
상기 회의 모델은 NER(Named Entity Recognition) 기법을 이용해서 회의자의 회의 내용으로부터 키워드를 추출하고, 상기 키워드를 이용해서 회의록의 초안을 생성하며, 상기 초안에 대한 상기 회의자의 검토를 학습하며, 학습 결과를 다음 초안 작성에 활용할 수 있다.
상기 생성 유니트는 상기 회의 모델을 이용해서 상기 회의록을 생성할 수 있다.
회의와 관련된 회의 내용을 매칭 내용으로 판별하고, 상기 회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부, 상기 노이즈 내용을 처리하는 처리부가 마련될 수 있다.
상기 처리부는 상기 노이즈 내용을 삭제하거나, 상기 노이즈 내용의 표시 상태를 조절하는 조절 메뉴를 제공할 수 있다.
회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부가 마련될 수 있다.
상기 판별부는 상기 회의 내용을 분석해서 상기 회의의 키워드와의 매칭도를 산출할 수 있다.
상기 판별부는 상기 매칭도가 설정값을 불만족하는 회의 내용을 상기 노이즈 내용으로 판별할 수 있다.
회의의 키워드를 이용해서 상기 회의 내용의 노이즈 여부를 판별하는 판별부가 마련될 수 있다.
상기 회의의 키워드는 상기 회의자에 의해 사전에 입력될 수 있다.
상기 판별부는 데이터베이스의 검색을 통해 상기 키워드와 관련된 단어를 검색하고, 검색 결과에 해당하는 검색어와 상기 회의 내용의 매칭도를 산출할 수 있다.
상기 판별부는 상기 매칭도를 이용해서 상기 회의 내용의 노이즈 여부를 판별할 수 있다.
회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부가 마련될 수 있다.
상기 판별부는 설정 시간 내에 설정 회수 반복되는 회의 내용 또는 설정 시간 내에 설정 회수동안 동일하게 지속되는 회의 내용을 상기 노이즈 내용으로 판별할 수 있다.
상기 처리 유니트는 제목이 기재된 회의 양식을 획득할 수 있다.
상기 회의 내용에서 상기 제목과 관련된 특정 단어를 추출하는 추출부가 마련될 수 있다.
상기 생성 유니트는 상기 회의록 내에서 상기 제목의 커버리지 영역에 상기 특정 단어가 포함된 회의 내용을 배치시킬 수 있다.
특정 회의 내용에 포함된 특정 단어를 추출하는 추출부, 상기 특정 단어를 이용해서 제목을 설정하는 설정부가 마련될 수 있다.
상기 생성 유니트는 상기 회의록 내에서 상기 제목의 커버리지 영역에 상기 제목과 관련된 회의 내용을 배치시킬 수 있다.
상기 회의 내용에서 제목이 획득되면, 상기 회의록 내에서 상기 제목의 커버리지 영역을 설정하는 설정부가 마련될 수 있다.
상기 설정부는 제1 제목이 획득된 제1 시점, 상기 제1 제목 바로 다음의 제2 제목이 획득된 제2 시점을 파악할 수 있다.
상기 설정부는 상기 회의록의 시간의 흐름에 따라 작성할 수 있다.
상기 설정부는 상기 제1 시점과 상기 제2 시점 사이의 제1 구간을 상기 제1 제목의 커버리지 영역으로 설정할 수 있다.
상기 생성 유니트는 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용을 상기 제1 구간에 배치할 수 있다.
상기 회의 내용에 포함된 요약 단어를 추출하는 추출부, 상기 요약 단어가 포함된 상기 회의 내용을 이용해서 회의의 요약 내용을 생성하는 요약부가 마련될 수 있다.
상기 생성 유니트는 상기 요약 내용이 표시되는 요약 메뉴를 상기 회의록에 추가할 수 있다.
회의 전체에 걸쳐 설정 회수 이상 반복되는 특정 회의 내용을 추출하는 추출부, 요약부가 마련될 수 있다.
상기 요약부는 상기 특정 회의 내용만으로 형성된 요약 메뉴를 상기 회의록에 추가하고, 상기 요약 메뉴에는 상기 특정 회의 내용의 반복 회수, 상기 특정 회의 내용의 화자가 함께 표시될 수 있다.
상기 생성 유니트는 상기 회의록에 대한 리뷰 메뉴를 제공할 수 있다.
상기 생성 유니트는 상기 리뷰 메뉴를 통한 상기 회의록의 수정이 완료되면, 수정이 완료된 상기 회의록을 기설정된 사용자에게 배포할 수 있다.
상기 수집 유니트, 상기 처리 유니트, 상기 생성 유니트는 단일의 단말기에 모두 포함될 수 있다.
회의에 참석한 복수의 회의자별로 상기 단말기가 마련될 수 있다.
복수의 단말기 중에서 선택된 마스터 단말기는 나머지 서브 단말기와 통신할 수 있다.
상기 서브 단말기는 상기 회의자의 음성을 입력받아 상기 마스터 단말기로 전송할 수 있다.
상기 마스터 단말기는 복수의 서브 단말기로부터 수집한 음성을 처리해서 회의록을 생성할 수 있다.
상기 마스터 단말기는 상기 서브 단말기로 상기 회의록을 전송하거나, 기설정된 연락처로 상기 회의록을 전송할 수 있다.
상기 수집 유니트, 상기 처리 유니트, 상기 생성 유니트는 단일의 단말기에 모두 포함될 수 있다.
회의에 참석한 복수의 회의자별로 상기 단말기가 마련될 수 있다.
각 단말기를 통해 입력된 상기 회의자의 음성은 복수의 상기 단말기에 공유될 수 있다.
복수의 상기 단말기는 공유된 상기 음성을 이용해서 상기 회의록을 각각 생성할 수 있다.
각 단말기에서 생성된 회의록은 기설정된 마스터 단말기로 전송될 수 있다.
상기 마스터 단말기에는 취합 유니트가 마련될 수 있다.
상기 취합 유니트는 동일한 회의를 대상으로 생성된 복수의 회의록을 취합해서 오류를 보정하고, 보정이 완료된 최종 회의록을 생성할 수 있다.
본 발명의 다른 실시예에 따르면 회의록 작성 장치가 제공된다. 상기 회의록 작성 장치에는, 회의 모델을 생성하는 학습 유니트가 마련될 수 있다. 상기 회의 모델은 NER(Named Entity Recognition) 기법을 이용해서 회의자의 회의 내용으로부터 키워드를 추출하고, 상기 키워드를 이용해서 회의록의 초안을 생성하며, 상기 초안에 대한 상기 회의자의 검토를 학습하며, 학습 결과를 다음 초안 작성에 활용할 수 있다.
상기 학습 유니트는 상기 회의 모델의 형성 전에 상기 NER 기법의 적용에 필요한 단어의 형태를 정의할 수 있다.
상기 단어의 형태 정의에 필요한 리퍼런스(reference)는 회사 내부의 데이터베이스, 분야별 키워드 템플릿, 프로젝트 계획서, 점검 자료, 보고 자료, 본 회의 전에 수행되는 키워드 추출 회의 중 적어도 하나로부터 추출될 수 있다.
본 발명의 또 다른 실시예에 따르면 회의록 작성 방법이 제공된다. 상기 회의록 작성 방법은 화자의 음성을 입력받는 입력 단계; 제1 화자의 발언 내용과 제2 화자의 발언 내용을 구분하고, 상기 화자의 음성을 텍스트로 변환하는 변환 단계; 상기 제1 화자와 상기 제2 화자를 구별하거나, 상기 발언 내용에 포함된 노이즈를 제거하거나, 상기 발언 내용을 정리하는 처리 단계; 처리 단계를 거친 발언 내용을 이용해서 회의록을 자동 생성하는 작성 단계; 관리자에 의해 상기 회의록이 검토되는 검토 단계; 검토가 완료된 상기 회의록이 기설정 사용자에게 배포되는 배포 단계;를 포함할 수 있다.
본 발명에 따르면, 외형적인 회의 결과에 해당하는 회의록이 자동으로 생성될 수 있다.
본 발명의 회의록 작성 장치 및 방법에 따르면, 회의 내용이 화자별로 구분해서 작성될 수 있다. 화자별로 구분되는 회의 내용을 이용하면 회의 당시의 상황, 회의 내용이 의미하는 의미의 파악에 도움이 될 수 있다.
본 발명에 따르면, 화자의 음성 중 회의 내용과 상관없는 쓸데없는 말, 의미없이 반복되는 말 등이 잡음으로 처리될 수 있다. 잡음으로 처리되는 말은 회의록에서 삭제되거나, 사용자의 선택에 따라 표시 유무가 결정될 수 있다.
본 발명의 따르면, 회의에 대한 매칭도 스코어링을 통해 회의 내용과 무관한 노이즈의 구분이 가능하다. 또한, 매칭도를 이용하면 전체 회의의 요약본이 자동으로 생성될 수 있다.
본 발명의 회의록 작성 장치는 별도의 회의록 작성용 디바이스의 형태로 구성될 수 있다. 또는, 본 발명의 회의록 작성 장치는 스마트폰 등의 단말기 형태로 구성될 수 있다. 후자의 경우, 별도의 회의록 작성용 디바이스가 배제되어도 무방하다. 누구나 소지하고 있는 스마트폰을 이용하는 경우, 복수의 회의록 작성 장치가 마련된 셈이 될 수 있다. 이때, 각 스마트폰에서 생성된 복수의 회의록의 취합을 통해 실제 회의를 추종하는 최종 회의록이 생성될 수 있다.
도 1은 본 발명의 실시예에 따른 회의록 작성 장치를 나타낸 개략도이다.
도 2는 처리 유니트와 생성 유니트를 나타낸 블록도이다.
도 3은 생성부의 동작을 나타낸 개략도이다.
도 4는 학습 유니트를 나타낸 블록도이다.
도 5는 회의록의 커버리지 영역을 나타낸 개략도이다.
도 6은 본 발명의 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
도 7은 본 발명의 다른 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
도 8은 본 발명의 또 다른 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
도 9는 본 발명의 실시예에 따른 회의록 작성 방법을 나타낸 흐름도이다.
도 10은 본 발명의 실시예에 따른, 컴퓨팅 장치를 나타내는 도면이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예를 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 도면을 참조하여 본 발명의 실시예에 따른 회의록 작성 장치(100) 및 회의록 작성 방법을 설명한다.
도 1은 본 발명의 실시예에 따른 회의록 작성 장치를 나타낸 개략도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 회의록 작성 장치(100)는 수집 유니트(110), 처리 유니트(130), 생성 유니트(150), 학습 유니트(190), 취합 유니트(170)를 포함할 수 있다.
본 발명의 회의록 작성 장치 및 방법은 복수의 사용자가 동일한 주제를 놓고 진행하는 회의를 대상으로 할 수 있다. 이때, 복수의 사용자는 하나의 회의실에 모두 모여서 회의하거나, 화상 회의 시스템을 통해 서로 이격된 복수의 장소에서 회의할 수 있다.
수집 유니트(110)는 특정 회의에 참석한 회의자의 회의 내용을 획득할 수 있다. 회의 내용은 회의에 관련해 회의자가 발언한 내용을 포함할 수 있다. 회의자의 회의 내용은 음성 데이터, 텍스트 데이터, 이미지 데이터 등의 형태로 획득될 수 있다.
음성 데이터의 획득을 위해 수집 유니트(110)는 마이크를 포함할 수 있다. 수집 유니트(110)는 복수 화자(말하는 회의자)의 음성을 획득할 수 있다.
텍스트 데이터 또는 이미지 데이터의 획득을 위해 수집 유니트(110)는 키보드, 필기 입력이 가능한 단말 수단 등을 포함할 수 있다.
수집 유니트(110)는 회의실당 하나 이상 마련될 수 있다. 마이크를 포함한 수집 유니트(110)는 회의자의 숫자 이상으로 마련되고, 각 회의자마다 할당될 수도 있다.
마이크가 회의자별로 마련된 경우, 각 마이크는 특정 사용자의 음성만 입력받을 수 있는 지향성 마이크인 것이 바람직하다.
처리 유니트(130)는 회의 내용을 처리할 수 있다.
일 예로, 처리 유니트(130)는 회의 내용의 화자를 구별하거나, 회의 내용에 포함된 노이즈(noise)를 제거하거나, 회의 내용을 정리할 수 있다.
생성 유니트(150)는 처리 유니트(130)에서 처리된 회의 내용을 기반으로 회의록을 자동으로 생성할 수 있다.
학습 유니트(190)는 처리 유니트(130)에서 필요로 하는 구분 모델을 생성해서 처리 유니트(130)에 제공할 수 있다.
학습 유니트(190)는 생성 유니트(150)에서 필요로 하는 회의 모델을 생성해서 생성 유니트(150)에 제공할 수 있다.
취합 유니트(170)는 동일 회의에 대해 생성된 복수의 회의록을 취합해서 최종 회의록을 생성할 수 있다.
도 2는 처리 유니트(130)와 생성 유니트(150)를 나타낸 블록도이다. 도 3은 생성부(151)의 동작을 나타낸 개략도이다.
처리 유니트(130)에는 구분부(131), 변환부(132)가 마련될 수 있다
구분부(131)는 수집 유니트(110)에 의해 획득된 복수 화자의 음성의 주파수를 분석할 수 있다. 구분부(131)는 주파수의 분석을 통해 제1 화자의 제1 음성과 제2 화자의 제2 음성을 구분할 수 있다.
변환부(132)는 STT(Speech To Text) 기술을 이용하여 제1 음성을 제1 텍스트로 변환하고, 제2 음성을 제2 텍스트로 변환할 수 있다.
생성 유니트(150)는 제1 텍스트 1st와 제2 텍스트 2nd가 포함된 회의록 r을 생성할 수 있다. 회의록 r에는 화자와 텍스트의 자리를 구분하는 구분선 d가 설정될 수 있다. 도 3에서는 상하로 연장되는 구분선 d를 기준으로 좌측에는 화자를 나타내는 식별자 aaa, bbb가 표기되고, 우측에는 텍스트 1st, 2nd가 표기될 수 있다.
회의록 r의 생성을 위해 생성 유니트(150)에는 생성부(151) 및 배치부(153)가 마련될 수 있다.
생성부(151)는 제1 화자를 나타내는 제1 식별자 aaa, 제2 화자를 나타내는 제2 식별자 bbb, 제1 화자의 음성이 텍스트화된 제1 텍스트 1st, 제2 화자의 음성이 텍스트화된 제2 텍스트 2nd가 포함된 회의록 r을 생성할 수 있다.
배치부(153)는 회의록 r 내에서 제1 식별자 aaa의 발언으로 인식되는 회의록 r의 제1 위치 ①에 제1 텍스트 1st를 배치할 수 있다.
배치부(153)는 회의록 r 내에서 제2 식별자 bbb의 발언으로 인식되는 회의록 r의 제2 위치 ②에 제2 텍스트 2nd를 배치할 수 있다.
제1 위치 ①은 구분선(투명 가능) d를 사이에 두고 제1 식별자 aaa 바로 옆자리를 포함할 수 있다. 해당 위치는 직관적으로 제1 식별자 aaa가 부여된 제1 화자의 발언 내용(회의 내용)이 표기될 자리로 인식될 수 있다.
제2 위치 ②는 구분선 d를 사이에 두고 제2 식별자 bbb 바로 옆자리를 포함할 수 있다. 해당 위치는 직관적으로 제2 식별자 bbb가 부여된 제2 화자의 발언 내용(회의 내용)이 표기될 자리로 인식될 수 있다.
본 실시예에 따르면, 회의록 r에 기재된 회의 내용이 화자별로 구분될 수 있다.
도 4는 학습 유니트(190)를 나타낸 블록도이다.
도 4에 도시된 학습 유니트(190)에는 제1 학습부(191) 및 제2 학습부(192)가 마련될 수 있다.
회의록 작성 장치(100)에는 제1 화자의 개별 마이크에 해당하는 제1 마이크(111), 제2 화자의 개별 마이크에 해당하는 제2 마이크(112)가 추가로 마련될 수 있다. 제1 마이크(111) 및 제2 마이크(112)는 수집 유니트(110)의 마이크와 일체로 형성되어도 무방하다.
제1 학습부(191)는 제1 마이크(111)를 통해 입수된 제1 음성과 제2 마이크(112)를 통해 입수된 제2 음성을 이용해서 제1 화자와 제2 화자를 구분하는 구분 모델을 생성할 수 있다.
제1 마이크(111)에는 제1 화자의 제1 식별자 aaa가 부여되며, 제2 마이크(112)에는 제2 화자의 제2 식별자 bbb가 부여될 수 있다. 학습부는 제1 음성과 제1 식별자를 매칭시키고, 제2 음성과 제2 식별자를 매칭시키는 구분 모델을 생성할 수 있다. 학습부는 생성된 구분 모델을 처리 유니트(130)로 제공할 수 있다.
처리 유니트(130)는 구분 모델을 이용해서 회의 내용의 화자를 구별할 수 있다.
제2 학습부(192)는 회의 모델을 생성할 수 있다.
회의 모델은 NER(Named Entity Recognition) 기법을 이용해서 회의자의 회의 내용으로부터 키워드를 추출하고, 키워드를 이용해서 회의록의 초안을 생성할 수 있다. 회의 모델은 초안에 대한 회의자의 검토 결과를 학습할 수 있다. 회의 모델은 학습 결과를 다음의 초안 작성에 활용할 수 있다.
생성 유니트(150)는 회의 모델을 이용해서 회의록을 생성할 수 있다.
NER(Named Entity Recognition, 개체명 인식)은 미리 정의해 둔 사람, 회사, 장소, 시간, 단위 등에 해당하는 단어(개체명)를 문서에서 인식하여 추출 분류하는 기법이다. 추출된 개체명은 인명(person), 지명(location), 기관명(organization), 시간(time) 등으로 분류될 수 있다. 개체명 인식을 위해 학습 유니트(190)는 회의 모델의 형성 전에 NER 기법의 적용에 필요한 단어의 형태를 정의할 수 있다. 단어의 형태 정의에 필요한 리퍼런스(reference)는 회사 내부의 데이터베이스, 분야별 키워드 템플릿, 프로젝트 계획서, 점검 자료, 보고 자료, 본 회의 전에 수행되는 키워드 추출 회의 중 적어도 하나로부터 추출될 수 있다.
다시 도 2로 돌아가서, 처리 유니트(130)에는 판별부(133), 처리부(134)가 마련될 수 있다.
판별부(133)는 화자의 음성을 입력으로 하거나 텍스트를 입력으로 할 수 있다. 후자의 경우, 판별부(133)는 변환부(132)로부터 출력되는 텍스트를 입력으로 할 수 있다.
판별부(133)는 회의와 관련된 회의 내용을 매칭 내용을 판별하고, 회의와 무관한 회의 내용을 노이즈 내용으로 판별할 수 있다. 일 예로, 중장비 관련 회의 중 현재 중장비의 유지 보수 방안에 대한 발언 내용은 중장비 관련 회의에 매칭되므로, 판별부(133)에 의해 매칭 내용으로 판별될 수 있다. 반면, 중장비 관련 회의 중 오늘 날씨에 대한 발언 내용은 중장비 관련 회의와 무관하므로, 판별부(133)에 의해 노이즈 내용으로 판별될 수 있다.
판별부(133)는 회의의 키워드를 이용해서 회의 내용의 노이즈 여부를 판별할 수 있다. 판별부(133)는 회의 내용을 분석해서 회의의 키워드와의 매칭도를 산출할 수 있다. 판별부(133)는 매칭도가 설정값을 불만족하는 회의 내용을 노이즈 내용으로 판별할 수 있다. 앞의 예시에서 '중장비'가 키워드에 해당될 수 있다. 이때, '유지 보수'에는 중장비에 대해 높은 매칭 점수가 부여될 수 있다. 높은 매칭 점수의 부여로 인해, '유지 보수 방안'에 대한 발언 내용은 매칭도가 설정값을 만족하는 매칭 내용으로 분류될 수 있다. 반면, '오늘 날씨'는 중장비에 대해 낮은 매칭 점수가 부여될 수 있다. 낮은 매칭 점수의 부여로 인해, '오늘 날씨'에 대한 발언 내용은 매칭도가 설정값을 불만족하는 노이즈 내용으로 분류될 수 있다.
회의의 키워드는 회의자에 의해 사전에 입력될 수 있다. 판별부(133)는 데이터베이스의 검색을 통해 키워드와 관련된 단어를 검색할 수 있다. 판별부(133)는 검색 결과에 해당하는 검색어와 회의 내용 간의 매칭도를 산출할 수 있다.
판별부(133)는 산출된 매칭도를 이용해서 회의 내용의 노이즈 여부를 판별할 수 있다.
다른 예로, 판별부(133)는 설정 시간 내에 설정 회수 반복되는 회의 내용 또는 설정 시간 내에 설정 회수동안 동일하게 지속되는 회의 내용을 노이즈 내용으로 판별할 수 있다. 일 예로, 회의 발표시 습관적으로 내뱉는 '에~', '그러니까', '음~' '휴~' 등과 같은 습관어는 설정 시간 내에 연속해서 반복되거나, 설정 시간 동안 연속적으로 지속될 수 있다. 본 실시예에 따르면, 의미없는 습관어가 노이즈 내용으로 처리되고 처리부(134)에 의해 삭제될 수 있다.
처리부(134)는 노이즈 내용을 처리할 수 있다. 일 예로, 처리부(134)는 노이즈 내용을 삭제하거나, 노이즈 내용의 표시 상태를 조절하는 조절 메뉴를 제공할 수 있다. 회의록의 검토자 또는 사용자는 조절 메뉴를 이용하면 회의록에 노이즈 내용의 표시 여부를 선택하거나, 노이즈 내용의 표시 색깔 변환 등의 이미지 처리를 수행할 수 있다.
회의록에 제목이 존재하지 않는 경우, 회의 내용의 화자의 구분만 이루어진 상태로 시계열적으로 나열되는 상태가 될 수 있다. 모든 회의 내용이 시계열적으로 나열만 된 회의록은 가독성이 매우 낮을 수 있다. 회의록의 가독성을 개선하기 위해, 실제 사람이 작성한 회의록과 유사하게 제목이 포함되는 것이 좋다. 제목의 표기를 위해 처리 유니트(130)에는 추출부(135), 설정부(136)가 마련될 수 있다.
도 5는 회의록의 커버리지 영역을 나타낸 개략도이다.
일 예로, 처리 유니트(130)는 제목이 기재된 회의 양식을 획득할 수 있다. 이때, 회의 양식은 사전에 회의자에 의해 사전에 입력된 것일 수 있다.
회의록 내에서 복수의 제목이 존재할 수 있다. 제목의 개수만큼 제목의 커버리지 영역 c가 회의록에 존재할 수 있다.
추출부(135)는 회의 내용에서 특정 제목과 관련된 특정 단어를 추출할 수 있다. 추출부(135)에 의해 추출된 특정 단어는 비교 대상이 되는 특정 제목에 매칭되는 내용을 포함하는 것으로 추정될 수 있다.
생성 유니트(150)의 배치부(153)는 복수의 제목 중에서 특정 제목 '1.1 소안건1'의 커버리지 영역 c에 특정 단어가 포함된 회의 내용 z를 배치시킬 수 있다.
일 예로, 처리 유니트(130)의 추출부(135)는 특정 회의 내용에 포함된 특정 단어를 추출할 수 있다. 설정부(136)는 특정 단어를 이용해서 제목 '1.1 소안건1'을 자동으로 설정할 수 있다. 예를 들어, 회의 내용 중 제목을 나타내는 '안건', '주제', '제목' 등의 특정 단어가 추출부(135)에 의해 추출되면, 설정부(136)는 해당 특정 단어가 포함된 발언 내용에 포함된 키워드를 제목으로 자동 생성할 수 있다.
이 경우에도, 생성 유니트(150)는 회의록 r 내에서 제목의 커버리지 영역 c에 해당 제목과 관련된 회의 내용 z를 배치시킬 수 있다.
설정부(136)는 회의 내용에서 제목이 획득되면, 회의록 내에서 제목의 커버리지 영역 c를 설정할 수 있다. 설정부(136)는 제1 제목 '1.1 소안건1'이 획득된 제1 시점 t1, 제1 제목 바로 다음의 제2 제목 '1.2 소안건2'가 획득된 제2 시점 t2를 파악할 수 있다.
설정부(136)는 회의록 r을 시간 흐름 t에 따라 작성할 수 있다.
설정부(136)는 제1 시점 t1과 제2 시점 t2 사이의 제1 구간 p1을 제1 제목의 커버리지 영역 c로 설정할 수 있다.
생성 유니트(150)는 제1 시점 t1과 제2 시점 t2 사이에 입수된 회의 내용 z를 제1 구간 p1에 배치할 수 있다.
한편, 설정부(136)는 제1 시점 t1과 제2 시점 t2 사이에 입수된 회의 내용 z가 다른 구간을 커버리지 영역으로 하는 다른 제목과 매칭되는 내용이 존재하는지 판별할 수 있다.
판별 결과, 회의 내용 z 중 특정 내용이 다른 제목과 매칭되는 것으로 판별되면, 설정부(136)는 해당 특정 내용을 제1 구간 p1에 배치하는 한편, 다른 회의 내용과 구별되는 양식으로 해당 특정 내용을 조정한 후 해당 다른 제목의 커버리지 영역에 추가할 수 있다.
회의 시간이 길어지고, 회의 내용이 많아지면 회의록의 내용을 요약한 요약본이 제공되는 것이 매우 유리하다. 요약본을 제공하기 위해 처리 유니트(130)에는 요약부(137)가 추가로 마련될 수 있다. 이때, 요약본은 회의록과 별개의 파일로 제공되거나, 회의록의 말미에 추가될 수 있다.
요약본의 제공을 위해, 추출부(135)는 회의 내용 중 요약본과 관련된 요약 단어를 추출할 수 있다. 요약부(137)는 요약 단어가 포함된 회의 내용을 이용해서 회의의 요약 내용을 생성할 수 있다. 생성 유니트(150)는 요약 내용이 표시되는 요약 메뉴를 회의록에 추가할 수 있다.
일 예로, 추출부(135)는 회의 전체에 걸쳐 설정 회수 이상 반복되는 특정 회의 내용을 추출할 수 있다. 이때, 요약부(137)는 특정 회의 내용만으로 형성된 요약 메뉴를 회의록에 추가할 수 있다. 요약 메뉴에는 특정 회의 내용의 반복 회수, 특정 회의 내용의 화자가 함께 표시될 수 있다. 본 실시예에 따르면, 요약 메뉴 생성의 기초가 된 반복 발언 회수, 화자를 파악할 수 있으며, 이를 통해 해당 요약 내용의 중요도가 현실적으로 파악될 수 있다. 일 예로, 팀장이 요약 내용을 5회 이상 반복한 것으로 파악되면, 해당 요약 내용이 해당 팀의 매우 중요한 사안인 것으로 파악될 수 있다.
생성 유니트(150)는 처리 유니트(130)에서 처리된 회의 내용을 기반으로 회의록을 자동 생성할 수 있다. 회의록의 정확도는 기계 학습으로 획득된 회의 모델 등을 통해 지속적으로 개선될 수 있다. 그럼에도 불구하고, 예측 불가능한 다양한 음성이 포함될 수 있는 회의의 특성을 고려해서 회의자 또는 제3 자에 의해 리뷰되는 것이 좋다.
생성 유니트(150)는 회의록에 대한 리뷰 메뉴를 제공할 수 있다. 리뷰 메뉴는 회의자 또는 회의를 감독할 수 있는 제3 자에게 제공될 수 있다. 리뷰어는 회의록을 검토하고, 리뷰 메뉴를 통해 회의록을 수정하거나 확정할 수 있다.
생성 유니트(150)는 리뷰 메뉴를 통한 회의록의 수정이 완료되면, 수정이 완료된 회의록을 기설정된 사용자에게 배포할 수 있다. 기설정된 사용자는 회의자, 회의 내용과 관련된 업무를 수행하는 사용자 등을 포함할 수 있다.
도 6은 본 발명의 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
처리 유니트(130), 생성 유니트(150)는 단일의 회의 기기(30)에 모두 포함될 수 있다. 수집 유니트(110)는 회의실에 가운데에 하나만 설치되거나, 사용자의 자리마다 설치되는 마이크 등의 입력 기기(10)를 포함할 수 있다.
하나 이상 마련된 입력 기기(10)는 획득된 음성을 회의 기기(30)로 전송하고, 회의 기기(30)는 음성을 텍스트로 변환하고 텍스트를 이용해 회의록을 생성할 수 있다.
도 7은 본 발명의 다른 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
수집 유니트(110), 처리 유니트(130), 생성 유니트(150)는 단일의 단말기(90)에 모두 포함될 수 있다. 수집 유니트(110)에 해당하는 마이크, 처리 유니트(130)에 해당하는 프로세서, 생성 유니트(150)에 해당하는 프로세서, 통신 수단 등을 모두 갖는 단말기(90)는 스마트폰을 포함할 수 있다. 이때, 수집 유니트(110), 처리 유니트(130), 생성 유니트(150)는 애플리케이션의 형태로 스마트폰에 탑재될 수 있다. 단말기(90)는 스마트폰과 별도로 회의 전용으로 형성되어도 무방하다.
회의에 참석한 복수의 회의자별로 단말기(90)가 마련될 수 있다. 본 실시예에 따르면, 모든 단말기(90)는 각자 회의록을 생성할 수 있는 능력을 보유한 상태일 수 있다. 혼선을 방지하기 위해 복수의 단말기(90) 중에서 하나가 마스터 단말기(91)로 선택될 수 있다.
복수의 단말기(90) 중 선택된 마스터 단말기(91)는 나머지 서브 단말기(92)와 통신할 수 있다.
서브 단말기(92)는 회의자의 음성, 자판 입력 등의 회의 내용 z를 입력받아 마스터 단말기(91)로 전송할 수 있다. 마스터 단말기(91)는 복수의 서브 단말기(92)로부터 수집한 음성을 처리해서 회의록을 생성할 수 있다. 마스터 단말기(91)는 서브 단말기(92)로 회의록을 전송하거나, 기설정된 연락처로 회의록을 전송할 수 있다.
도 7에서는 복수의 단말기(90) 중 어느 하나의 마스터 단말기(91)만 처리 유니트(130), 생성 유니트(150)의 기능을 수행하고, 나머지 서브 단말기(92)는 오로지 수집 유니트(110)로만 기능하고 있다. 마스터 단말기(91)는 수집 유니트(110)의 기능을 겸할 수 있다. 마스터 단말기(91)는 주로 회의 진행자, 회의 관리자에게 할당된 단말기(90)인 것이 바람직하다.
도 8은 본 발명의 또 다른 실시예에 따른 회의록 작성 장치의 하드웨어 구성을 나타낸 개략도이다.
수집 유니트(110), 처리 유니트(130), 생성 유니트(150)는 단일의 단말기(90)에 모두 포함될 수 있다. 회의에 참석한 복수의 회의자별로 단말기(90)가 마련될 수 있다. 단말기(90)는 개인이 소지한 스마트폰을 포함할 수 있다.
각 단말기(90)를 통해 입력된 회의자의 음성은 복수의 단말기(90)에 공유될 수 있다.
복수의 단말기(90)는 공유된 음성을 이용해서 회의록을 각각 생성할 수 있다.
각 단말기(90)에서 생성된 회의록 r은 기설정된 마스터 단말기(91)로 전송될 수 있다.
마스터 단말기(91)에는 취합 유니트(170)가 마련될 수 있다. 취합 유니트(170)는 동일한 회의를 대상으로 생성된 복수의 회의록을 취합해서 오류를 보정하고, 보정이 완료된 최종 회의록을 생성할 수 있다. 복수의 단말기(90)에서 생성된 회의록 r은 회의 내용(요약 메뉴 포함)이 서로 다를 수 있다. 취합 유니트(170)는 복수의 회의록 r을 비교 분석해서 특정 회의 내용이 서로 다른 경우, 기설정 규칙에 따라 처리할 수 있다.
일 예로, 취합 유니트(170)는 각 회의록마다 서로 다른 특정 회의 내용을 모두 최종 회의록에 기재하고, 해당 특정 회의 내용에 대한 리뷰 메뉴를 추가할 수 있다. 리뷰 메뉴를 통해 서로 다른 특정 회의 내용이 실제 회의 내용에 부합하게 수정될 수 있다.
다른 예로, 취합 유니트(170)는 다수결의 원칙에 따라 보다 많은 회의록에 공통적으로 기재된 회의 내용을 이용해서 최종 회의록을 생성할 수 있다.
도 9는 본 발명의 실시예에 따른 회의록 작성 방법을 나타낸 흐름도이다.
도 9의 회의록 작성 방법은 도 1에 도시된 회의록 작성 장치에 의해 수행될 수 있다.
회의록 작성 방법은 입력 단계(S 510), 변환 단계(S 520), 처리 단계(S 530), 작성 단계(S 540), 검토 단계(S 550), 배포 단계(S 560)를 포함할 수 있다.
입력 단계(S 510)는 화자의 음성을 입력받을 수 있다. 수집 유니트(110)에 의해 수행되는 동작으로, 수집 유니트(110)에는 음성을 입력받을 수 있는 마이크가 마련될 수 있다.
변환 단계(S 520)는 제1 화자의 발언 내용과 제2 화자의 발언 내용을 구분하고, 화자의 음성을 텍스트로 변환할 수 있다. 처리 유니트(130)에 의해 수행되는 동작일 수 있다. 처리 유니트(130)는 음성 레벨에서 제1 화자와 제2 화자를 구분한 후, 각 음성을 텍스트로 변환할 수 있다.
처리 단계(S 530)는 제1 화자와 제2 화자를 구별하거나, 발언 내용에 포함된 노이즈를 제거하거나, 발언 내용을 정리할 수 있다. 처리 유니트(130)에 의해 수행되는 동작일 수 있다. 처리 유니트(130)에 의해 각 텍스트에는 음성의 구분 결과에 해당하는 화자의 식별자가 부여되거나 매칭될 수 있다. 발언 내용의 정리는 회의록 내에서 제목 또는 그 커버리지 영역을 설정하거나 복수의 발언 내용을 요약하는 것일 수 있다.
작성 단계(S 540)는 처리 단계(S 530)를 거친 발언 내용을 이용해서 회의록을 자동 생성할 수 있다. 생성 유니트(150)에 의해 수행될 수 있다.
검토 단계(S 550)에서, 리뷰어에 해당하는 관리자에 의해 회의록이 검토될 수 있다. 검토 단계(S 550)를 위해 생성 유니트(150)는 회의록에 리뷰 메뉴를 추가할 수 있다. 리뷰 메뉴에는 회의록을 수정할 수 있는 인터페이스가 마련될 수 있다.
배포 단계(S 560)를 통해 검토가 완료된 회의록이 기설정 사용자에게 배포될 수 있다. 리뷰어에 의해 검토가 완료된 회의록은 다시 생성 유니트(150)로 접수될 수 있다. 생성 유니트(150)는 기등록된 이메일 주소 등의 연락처를 타겟으로 하여 해당 회의록을 전송할 수 있다.
도 10은 본 발명의 실시예에 따른, 컴퓨팅 장치를 나타내는 도면이다. 도 10의 컴퓨팅 장치(TN100)는 본 명세서에서 기술된 장치(예, 회의록 작성 장치 등) 일 수 있다. 도 10의 실시예에서, 컴퓨팅 장치(TN100)는 적어도 하나의 프로세서(TN110), 송수신 장치(TN120), 및 메모리(TN130)를 포함할 수 있다. 또한, 컴퓨팅 장치(TN100)는 저장 장치(TN140), 입력 인터페이스 장치(TN150), 출력 인터페이스 장치(TN160) 등을 더 포함할 수 있다. 컴퓨팅 장치(TN100)에 포함된 구성 요소들은 버스(bus)(TN170)에 의해 연결되어 서로 통신을 수행할 수 있다.
프로세서(TN110)는 메모리(TN130) 및 저장 장치(TN140) 중에서 적어도 하나에 저장된 프로그램 명령(program command)을 실행할 수 있다. 프로세서(TN110)는 중앙 처리 장치(CPU: central processing unit), 그래픽 처리 장치(GPU: graphics processing unit), 또는 본 발명의 실시예에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 프로세서(TN110)는 본 발명의 실시예와 관련하여 기술된 절차, 기능, 및 방법 등을 구현하도록 구성될 수 있다. 프로세서(TN110)는 컴퓨팅 장치(TN100)의 각 구성 요소를 제어할 수 있다.
메모리(TN130) 및 저장 장치(TN140) 각각은 프로세서(TN110)의 동작과 관련된 다양한 정보를 저장할 수 있다. 메모리(TN130) 및 저장 장치(TN140) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(TN130)는 읽기 전용 메모리(ROM: read only memory) 및 랜덤 액세스 메모리(RAM: random access memory) 중에서 적어도 하나로 구성될 수 있다.
송수신 장치(TN120)는 유선 신호 또는 무선 신호를 송신 또는 수신할 수 있다. 송수신 장치(TN120)는 네트워크에 연결되어 통신을 수행할 수 있다.
한편, 전술한 본 발명의 실시예에 따른 다양한 방법은 다양한 컴퓨터수단을 통하여 판독 가능한 프로그램 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 와이어뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 와이어를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상, 본 발명의 일 실시예에 대하여 설명하였으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 특허청구범위에 기재된 본 발명의 사상으로부터 벗어나지 않는 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등에 의해 본 발명을 다양하게 수정 및 변경시킬 수 있을 것이며, 이 또한 본 발명의 권리범위 내에 포함된다고 할 것이다.
10...입력 기기 30...회의 기기
90...단말기 91...마스터 단말기
92...서브 단말기 110...수집 유니트
111...제1 마이크 112...제2 마이크
130...처리 유니트 131...구분부
132...변환부 133...판별부
134...처리부 135...추출부
136...설정부 137...요약부
150...생성 유니트 151...생성부
153...배치부 170...취합 유니트
190...학습 유니트 191...제1 학습부
192...제2 학습부

Claims (20)

  1. 회의자의 회의 내용을 획득하는 수집 유니트;
    상기 회의 내용을 처리하는 처리 유니트;
    상기 처리 유니트에서 처리된 상기 회의 내용을 기반으로 회의록을 생성하는 생성 유니트;를 포함하고,
    상기 처리 유니트는 상기 회의 내용의 화자를 구별하거나, 상기 회의 내용에 포함된 노이즈를 제거하거나, 상기 회의 내용을 정리하며,
    상기 회의 내용에서 제목이 획득되면, 상기 회의록 내에서 상기 제목의 커버리지 영역을 설정하는 설정부가 마련되고,
    상기 설정부는 제1 제목이 획득된 제1 시점, 상기 제1 제목 바로 다음의 제2 제목이 획득된 제2 시점을 파악하며,
    상기 설정부는 상기 회의록을 시간의 흐름에 따라 작성하고,
    상기 설정부는 상기 제1 시점과 상기 제2 시점 사이의 제1 구간을 상기 제1 제목의 커버리지 영역으로 설정하고,
    상기 생성 유니트는 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용을 상기 제1 구간에 배치하며,
    상기 설정부는 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용에 상기 제1 구간과 다른 구간을 커버리지 영역으로 하는 다른 제목과 매칭되는 내용이 존재하는지 판별하고,
    상기 설정부는 판별 결과 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용 중 특정 내용이 상기 다른 제목과 매칭되는 것으로 판별되면, 상기 특정 내용을 상기 제1 구간에 배치하는 한편, 상기 다른 제목의 커버리지 영역에 상기 특정 내용을 추가하는
    회의록 작성 장치.
  2. 제1항에 있어서,
    상기 수집 유니트는 복수 화자의 음성을 획득하고,
    상기 음성의 주파수를 분석해서 제1 화자의 제1 음성과 제2 화자의 제2 음성을 구분하는 구분부, 상기 제1 음성을 제1 텍스트로 변환하고, 상기 제2 음성을 제2 텍스트로 변환하는 변환부가 마련되고,
    상기 생성 유니트는 상기 제1 텍스트와 상기 제2 텍스트가 포함된 상기 회의록을 생성하는
    회의록 작성 장치.
  3. 제1항에 있어서,
    생성부 및 배치부가 마련되고,
    상기 생성부는 제1 화자를 나타내는 제1 식별자, 제2 화자를 나타내는 제2 식별자, 상기 제1 화자의 음성이 텍스트화된 제1 텍스트, 상기 제2 화자의 음성이 텍스트화된 제2 텍스트가 포함된 상기 회의록을 생성하며,
    상기 배치부는 상기 회의록 내에서 상기 제1 식별자의 발언으로 인식되는 상기 회의록의 제1 위치에 상기 제1 텍스트를 배치하고,
    상기 배치부는 상기 회의록 내에서 상기 제2 식별자의 발언으로 인식되는 상기 회의록의 제2 위치에 상기 제2 텍스트를 배치하는
    회의록 작성 장치.
  4. 제1항에 있어서,
    제1 화자의 개별 마이크에 해당하는 제1 마이크, 제2 화자의 개별 마이크에 해당하는 제2 마이크, 상기 제1 마이크를 통해 입수된 제1 음성과 상기 제2 마이크를 통해 입수된 제2 음성을 이용해서 상기 제1 화자와 상기 제2 화자를 구분하는 구분 모델을 생성하는 학습부가 마련되고,
    상기 제1 마이크에는 상기 제1 화자의 제1 식별자가 부여되며,
    상기 제2 마이크에는 상기 제2 화자의 제2 식별자가 부여되고,
    상기 학습부는 상기 제1 음성과 상기 제1 식별자를 매칭시키고, 상기 제2 음성과 상기 제2 식별자를 매칭시키는 상기 구분 모델을 생성하며, 생성된 상기 구분 모델을 상기 처리 유니트로 제공하며,
    상기 처리 유니트는 상기 구분 모델을 이용해서 상기 회의 내용의 화자를 구별하는
    회의록 작성 장치.
  5. 제1항에 있어서,
    회의 모델을 생성하는 학습 유니트가 마련되고,
    상기 회의 모델은 NER(Named Entity Recognition) 기법을 이용해서 회의자의 회의 내용으로부터 키워드를 추출하고, 상기 키워드를 이용해서 회의록의 초안을 생성하며, 상기 초안에 대한 상기 회의자의 검토를 학습하며, 학습 결과를 다음 초안 작성에 활용하고,
    상기 생성 유니트는 상기 회의 모델을 이용해서 상기 회의록을 생성하는
    회의록 작성 장치.
  6. 제1항에 있어서,
    회의와 관련된 회의 내용을 매칭 내용으로 판별하고, 상기 회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부, 상기 노이즈 내용을 처리하는 처리부가 마련되고,
    상기 처리부는 상기 노이즈 내용을 삭제하거나, 상기 노이즈 내용의 표시 상태를 조절하는 조절 메뉴를 제공하는
    회의록 작성 장치.
  7. 제1항에 있어서,
    회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부가 마련되고,
    상기 판별부는 상기 회의 내용을 분석해서 상기 회의의 키워드와의 매칭도를 산출하며,
    상기 판별부는 상기 매칭도가 설정값을 불만족하는 회의 내용을 상기 노이즈 내용으로 판별하는
    회의록 작성 장치.
  8. 제1항에 있어서,
    회의의 키워드를 이용해서 상기 회의 내용의 노이즈 여부를 판별하는 판별부가 마련되고,
    상기 회의의 키워드는 상기 회의자에 의해 사전에 입력되며,
    상기 판별부는 데이터베이스의 검색을 통해 상기 키워드와 관련된 단어를 검색하고, 검색 결과에 해당하는 검색어와 상기 회의 내용 간의 매칭도를 산출하고,
    상기 판별부는 상기 매칭도를 이용해서 상기 회의 내용의 노이즈 여부를 판별하는
    회의록 작성 장치.
  9. 회의자의 회의 내용을 획득하는 수집 유니트;
    상기 회의 내용을 처리하는 처리 유니트;
    상기 처리 유니트에서 처리된 상기 회의 내용을 기반으로 회의록을 생성하는 생성 유니트;를 포함하고,
    회의와 무관한 회의 내용을 노이즈 내용으로 판별하는 판별부가 마련되고,
    상기 판별부는 설정 시간 내에 설정 회수 반복되는 회의 내용 또는 설정 시간 내에 설정 회수동안 동일하게 지속되는 회의 내용을 상기 노이즈 내용으로 판별하며,
    상기 처리 유니트는 상기 노이즈 내용을 제거하는
    회의록 작성 장치.
  10. 제9항에 있어서,
    상기 처리 유니트는 제목이 기재된 회의 양식을 획득하고,
    상기 회의 내용에서 상기 제목과 관련된 특정 단어를 추출하는 추출부가 마련되며,
    상기 생성 유니트는 상기 회의록 내에서 상기 제목의 커버리지 영역에 상기 특정 단어가 포함된 회의 내용을 배치시키는
    회의록 작성 장치.
  11. 제9항에 있어서,
    특정 회의 내용에 포함된 특정 단어를 추출하는 추출부, 상기 특정 단어를 이용해서 제목을 설정하는 설정부가 마련되고,
    상기 생성 유니트는 상기 회의록 내에서 상기 제목의 커버리지 영역에 상기 제목과 관련된 회의 내용을 배치시키는
    회의록 작성 장치.
  12. 제9항에 있어서,
    상기 회의 내용에서 제목이 획득되면, 상기 회의록 내에서 상기 제목의 커버리지 영역을 설정하는 설정부가 마련되고,
    상기 설정부는 제1 제목이 획득된 제1 시점, 상기 제1 제목 바로 다음의 제2 제목이 획득된 제2 시점을 파악하며,
    상기 설정부는 상기 회의록을 시간의 흐름에 따라 작성하고,
    상기 설정부는 상기 제1 시점과 상기 제2 시점 사이의 제1 구간을 상기 제1 제목의 커버리지 영역으로 설정하고,
    상기 생성 유니트는 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용을 상기 제1 구간에 배치하며,
    상기 설정부는 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용에 상기 제1 구간과 다른 구간을 커버리지 영역으로 하는 다른 제목과 매칭되는 내용이 존재하는지 판별하고,
    상기 설정부는 판별 결과 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용 중 특정 내용이 상기 다른 제목과 매칭되는 것으로 판별되면, 상기 특정 내용을 상기 제1 구간에 배치하는 한편, 상기 다른 제목의 커버리지 영역에 상기 특정 내용을 추가하는
    회의록 작성 장치.
  13. 제1항에 있어서,
    상기 회의 내용에 포함된 요약 단어를 추출하는 추출부, 상기 요약 단어가 포함된 상기 회의 내용을 이용해서 회의의 요약 내용을 생성하는 요약부가 마련되고,
    상기 생성 유니트는 상기 요약 내용이 표시되는 요약 메뉴를 상기 회의록에 추가하는
    회의록 작성 장치.
  14. 제1항에 있어서,
    회의 전체에 걸쳐 설정 회수 이상 반복되는 특정 회의 내용을 추출하는 추출부, 요약부가 마련되고,
    상기 요약부는 상기 특정 회의 내용만으로 형성된 요약 메뉴를 상기 회의록에 추가하고, 상기 요약 메뉴에는 상기 특정 회의 내용의 반복 회수, 상기 특정 회의 내용의 화자가 함께 표시되는
    회의록 작성 장치.
  15. 제1항에 있어서,
    상기 생성 유니트는 상기 회의록에 대한 리뷰 메뉴를 제공하고,
    상기 생성 유니트는 상기 리뷰 메뉴를 통한 상기 회의록의 수정이 완료되면, 수정이 완료된 상기 회의록을 기설정된 사용자에게 배포하는
    회의록 작성 장치.
  16. 제1항에 있어서,
    상기 수집 유니트, 상기 처리 유니트, 상기 생성 유니트는 단일의 단말기에 모두 포함되고,
    회의에 참석한 복수의 회의자별로 상기 단말기가 마련되며,
    복수의 단말기 중에서 선택된 마스터 단말기는 나머지 서브 단말기와 통신하고,
    상기 서브 단말기는 상기 회의자의 음성을 입력받아 상기 마스터 단말기로 전송하며,
    상기 마스터 단말기는 복수의 서브 단말기로부터 수집한 음성을 처리해서 회의록을 생성하고,
    상기 마스터 단말기는 상기 서브 단말기로 상기 회의록을 전송하거나, 기설정된 연락처로 상기 회의록을 전송하는
    회의록 작성 장치.
  17. 제1항에 있어서,
    상기 수집 유니트, 상기 처리 유니트, 상기 생성 유니트는 단일의 단말기에 모두 포함되고,
    회의에 참석한 복수의 회의자별로 상기 단말기가 마련되며,
    각 단말기를 통해 입력된 상기 회의자의 음성은 복수의 상기 단말기에 공유되고,
    복수의 상기 단말기는 공유된 상기 음성을 이용해서 상기 회의록을 각각 생성하며,
    각 단말기에서 생성된 회의록은 기설정된 마스터 단말기로 전송되고,
    상기 마스터 단말기에는 취합 유니트가 마련되며,
    상기 취합 유니트는 동일한 회의를 대상으로 생성된 복수의 회의록을 취합해서 오류를 보정하고, 보정이 완료된 최종 회의록을 생성하는
    회의록 작성 장치.
  18. 제1항에 있어서,
    회의 모델을 생성하는 학습 유니트가 마련되고,
    상기 회의 모델은 NER(Named Entity Recognition) 기법을 이용해서 상기 회의 내용으로부터 키워드를 추출하고, 상기 키워드를 이용해서 상기 회의록의 초안을 생성하며, 상기 초안에 대한 상기 회의자의 검토를 학습하며, 학습 결과를 다음 초안 작성에 활용하는
    회의록 작성 장치.
  19. 제18항에 있어서,
    상기 학습 유니트는 상기 회의 모델의 형성 전에 상기 NER 기법의 적용에 필요한 단어의 형태를 정의하고,
    상기 단어의 형태 정의에 필요한 리퍼런스(reference)는 회사 내부의 데이터베이스, 분야별 키워드 템플릿, 프로젝트 계획서, 점검 자료, 보고 자료, 본 회의 전에 수행되는 키워드 추출 회의 중 적어도 하나로부터 추출되는
    회의록 작성 장치.
  20. 회의록 작성 장치에 의해 수행되는 회의록 작성 방법에 있어서,
    화자의 음성을 입력받는 입력 단계;
    제1 화자의 발언 내용과 제2 화자의 발언 내용을 구분하고, 상기 화자의 음성을 텍스트로 변환하는 변환 단계;
    상기 제1 화자와 상기 제2 화자를 구별하거나, 상기 발언 내용에 포함된 노이즈를 제거하거나, 상기 발언 내용을 정리하는 처리 단계;
    처리 단계를 거친 발언 내용을 이용해서 회의록을 자동 생성하는 작성 단계;
    관리자에 의해 상기 회의록이 검토되는 검토 단계;
    검토가 완료된 상기 회의록이 기설정 사용자에게 배포되는 배포 단계;를 포함하고,
    상기 처리 단계는,
    상기 회의 내용에서 제목이 획득되면, 상기 회의록 내에서 상기 제목의 커버리지 영역을 설정하며,
    제1 제목이 획득된 제1 시점, 상기 제1 제목 바로 다음의 제2 제목이 획득된 제2 시점을 파악하며,
    상기 회의록을 시간의 흐름에 따라 작성하고,
    상기 제1 시점과 상기 제2 시점 사이의 제1 구간을 상기 제1 제목의 커버리지 영역으로 설정하고,
    상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용을 상기 제1 구간에 배치하며,
    상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용에 상기 제1 구간과 다른 구간을 커버리지 영역으로 하는 다른 제목과 매칭되는 내용이 존재하는지 판별하고,
    판별 결과 상기 제1 시점과 상기 제2 시점 사이에 입수된 회의 내용 중 특정 내용이 상기 다른 제목과 매칭되는 것으로 판별되면, 상기 특정 내용을 상기 제1 구간에 배치하는 한편, 상기 다른 제목의 커버리지 영역에 상기 특정 내용을 추가하는
    회의록 작성 방법.
KR1020190139919A 2019-11-05 2019-11-05 회의록 작성 장치 및 방법 KR102291113B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190139919A KR102291113B1 (ko) 2019-11-05 2019-11-05 회의록 작성 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190139919A KR102291113B1 (ko) 2019-11-05 2019-11-05 회의록 작성 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210054157A KR20210054157A (ko) 2021-05-13
KR102291113B1 true KR102291113B1 (ko) 2021-08-19

Family

ID=75913307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190139919A KR102291113B1 (ko) 2019-11-05 2019-11-05 회의록 작성 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102291113B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240127513A1 (en) * 2022-10-17 2024-04-18 vTapestry, Inc. Automated Generation Of Meeting Tapestries

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272990A (ja) * 2000-03-28 2001-10-05 Fuji Xerox Co Ltd 対話記録編集装置
JP2005175627A (ja) * 2003-12-08 2005-06-30 Fuji Photo Film Co Ltd 議事録作成システム
JP2017167318A (ja) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア 議事録生成装置、及び議事録生成プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3185505B2 (ja) * 1993-12-24 2001-07-11 株式会社日立製作所 会議録作成支援装置
KR20160019279A (ko) * 2014-08-11 2016-02-19 엘지전자 주식회사 이동단말기 및 그 제어방법
KR101970753B1 (ko) 2019-02-19 2019-04-22 주식회사 소리자바 음성인식을 이용한 회의록 작성 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272990A (ja) * 2000-03-28 2001-10-05 Fuji Xerox Co Ltd 対話記録編集装置
JP2005175627A (ja) * 2003-12-08 2005-06-30 Fuji Photo Film Co Ltd 議事録作成システム
JP2017167318A (ja) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア 議事録生成装置、及び議事録生成プログラム

Also Published As

Publication number Publication date
KR20210054157A (ko) 2021-05-13

Similar Documents

Publication Publication Date Title
US11417343B2 (en) Automatic speaker identification in calls using multiple speaker-identification parameters
CN108962282B (zh) 语音检测分析方法、装置、计算机设备及存储介质
CN107818798B (zh) 客服服务质量评价方法、装置、设备及存储介质
US10930300B2 (en) Automated transcript generation from multi-channel audio
JP4466564B2 (ja) 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
US10347250B2 (en) Utterance presentation device, utterance presentation method, and computer program product
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
TWI616868B (zh) 會議記錄裝置及其自動生成會議記錄的方法
CN108305632A (zh) 一种会议的语音摘要形成方法及系统
WO2005069171A1 (ja) 文書対応付け装置、および文書対応付け方法
TWI590240B (zh) 會議記錄裝置及其自動生成會議記錄的方法
KR20120038000A (ko) 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템
TWI619115B (zh) 會議記錄裝置及其自動生成會議記錄的方法
JP2006301223A (ja) 音声認識システム及び音声認識プログラム
JP5030868B2 (ja) 会議音声録音システム
CN101867742A (zh) 一种基于声控控制下的电视系统
KR102312993B1 (ko) 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치
CN111223487B (zh) 一种信息处理方法及电子设备
KR20160108874A (ko) 대화록 자동 생성 방법 및 장치
KR102291113B1 (ko) 회의록 작성 장치 및 방법
KR102287431B1 (ko) 회의 녹음 장치 및 회의 녹음 기록 시스템
KR20190065194A (ko) 회의록 열람 문서 생성 방법 및 그 장치
JP2015094811A (ja) 通話録音可視化システムおよび通話録音可視化方法
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN114492436A (zh) 一种审计访谈信息的处理方法、装置和系统

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant