KR20230126999A - 이동형 회의록 작성 시스템 - Google Patents
이동형 회의록 작성 시스템 Download PDFInfo
- Publication number
- KR20230126999A KR20230126999A KR1020220024526A KR20220024526A KR20230126999A KR 20230126999 A KR20230126999 A KR 20230126999A KR 1020220024526 A KR1020220024526 A KR 1020220024526A KR 20220024526 A KR20220024526 A KR 20220024526A KR 20230126999 A KR20230126999 A KR 20230126999A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- user
- text
- voice collection
- user information
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 24
- 238000004891 communication Methods 0.000 claims description 8
- 230000003213 activating effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명의 일 실시예에 따른 복수의 화자를 구분할 수 있는 이동형 회의록 작성 시스템은 사용자의 선택에 따라 상기 사용자의 음성을 수집하는 복수개의 음성수집장치; 및 상기 복수개의 음성수집장치에 서로 다른 사용자 정보를 각각 할당하고, 상기 각 음성수집장치에서 수집되는 상기 사용자의 음성을 해당 음성수집장치에 할당된 상기 사용자 정보에 따라 분류하여 텍스트로 변환하는 텍스트 변환장치를 포함하고, 상기 복수개의 음성수집장치는, 상기 적어도 하나의 음성수집장치가 상기 사용자에 의해 선택되면, 선택된 음성수집장치는 활성화되고 나머지 음성수집장치는 뮤트되는 것을 특징으로 한다.
Description
본 발명은 회의록 작성 시스템에 관한 것 관한 것이다.
본 명세서에서 달리 표시되지 않는 한, 이 식별항목에 설명되는 내용들은 이 출원의 청구항들에 대한 종래 기술이 아니며, 이 식별항목에 기재된다고 하여 종래 기술이라고 인정되는 것은 아니다.
공공기관이나 기업에서 회의를 수행하는 경우, 정보공개 등의 이유로 회의록 작성이 필요하다. 일반적으로, 속기사나 회의구성원이 회의록을 작성한다. 회의록 작성 과정은 많은 시간이 소요될 뿐만 아니라, 회의내용의 오류가 없도록 작성되어야 하기 때문에 필요이상의 노력이 소요된다.
이에 따라, 음성인식기술을 활용한 회의록 시스템이 활발히 개발되고 있다. 음성인식기술이란, 정보처리장치가 인간의 음성을 이해하여 텍스트로 변환하는 기술을 의미한다.
종래의 회의록 시스템은 특정 회의실 내에 각종 설비가 구축되어 해당 회의실 내에서 회의를 수행해야만 동작한다는 문제가 있었다.
또한, 종래의 회의록 시스템은 복수 화자의 음성이 구분됨이 없이 단순히 텍스트로만 변환되기에, 사용자가 각 텍스트의 주체를 일일이 확인 후 수정하는 작업이 필요하다는 문제가 있었다.
본 발명은 복수의 화자를 구분할 수 있는 이동형 회의록 작성 시스템을 제공하는 것을 그 목적으로 한다.
또한, 본 발명은 특정 회의실 외에도 용이하게 구축할 수 있는 이동형 회의록 작성 시스템을 제공하는 것을 그 목적으로 한다.
또한, 본 발명은 회의내용을 실시간으로 제공할 수 있는 이동형 회의록 작성 시스템을 제공하는 것을 그 목적으로 한다.
본 발명의 일 실시예에 따른 이동형 회의록 작성 시스템은 사용자의 선택에 따라 상기 사용자의 음성을 수집하는 복수개의 음성수집장치; 및 상기 복수개의 음성수집장치에 서로 다른 사용자 정보를 각각 할당하고, 상기 각 음성수집장치에서 수집되는 상기 사용자의 음성을 해당 음성수집장치에 할당된 상기 사용자 정보에 따라 분류하여 텍스트로 변환하는 텍스트 변환장치를 포함하고, 상기 복수개의 음성수집장치는, 상기 적어도 하나의 음성수집장치가 상기 사용자에 의해 선택되면, 선택된 음성수집장치는 활성화되고 나머지 음성수집장치는 뮤트되는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 상기 각 음성수집장치는, 선택버튼; 음성을 수집하는 마이크 모듈; 및 상기 마이크 모듈이 연결되고, 수집된 음성을 상기 텍스트 생성장치로 전송하는 사용자 단말을 포함하고, 상기 사용자 단말은 상기 선택버튼이 선택되면, 연결된 마이크 모듈을 활성화시키고, 나머지 사용자 단말로 해당 사용자 단말에 연결된 마이크 모듈을 뮤트시키는 신호를 전송하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 상기 복수개의 음성수집장치와 상기 텍스트 생성장치간 폐쇄형 네트워크를 구축하여 상호간의 통신을 중계하는 중계기를 더 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 상기 텍스트 변환 장치는, 상기 텍스트들을 사용자 정보 별로 시간적 순서에 따라 나열하여 회의록을 생성하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 상기 텍스트 변환 장치는, 상기 텍스트 및 해당 텍스트의 사용자 정보를 실시간으로 표시하는 것을 특징으로 한다.
본 발명은 발언하고 있는 사용자의 선택에 따라 음성수집장치들의 동작을 제어하여 복수의 화자를 구분함으로써, 소프트웨어를 통한 음성인식으로 사용자를 구분하는 것과 달리 화자 구분에 오류가 발생할 수 없을 뿐만 아니라, 사용자의 후처리 작업이 필요없다는 효과가 있다.
또한, 본 발명은 이동 가능하게 구성되어 특정 회의실 외에도 용이하게 구축될 수 있기 때문에, 간이회의나 외부회의 등에도 활용할 수 있다는 효과가 있다.
또한, 본 발명은 회의내용을 실시간으로 제공할 수 있어 회의구성원들의 회의참여율 및 회의이해도가 향상된다는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 이동형 회의록 작성 시스템의 구성을 보여주는 도면이다.
도 2는 본발명에 따른 음성수집장치를 보여주는 도면이다.
도 3은 본 발명의 일 실시예에 따른 텍스트 변환장치의 구성을 보여주는 도면이다.
도 4는 실시간 회의록 재생 청취 페이지의 일 실시예를 보여주는 도면이다.
도 5는 회의록 관리 페이지의 일 실시예를 보여주는 도면이다.
도 6은 회의록 열람페이지의 일 실시예를 보여주는 도면이다.
도 7은 회의록 편집페이지의 일 실시예를 보여주는 도면이다.
도 8은 음성회의록 작성페이지의 일 실시예를 보여주는 도면이다.
도 2는 본발명에 따른 음성수집장치를 보여주는 도면이다.
도 3은 본 발명의 일 실시예에 따른 텍스트 변환장치의 구성을 보여주는 도면이다.
도 4는 실시간 회의록 재생 청취 페이지의 일 실시예를 보여주는 도면이다.
도 5는 회의록 관리 페이지의 일 실시예를 보여주는 도면이다.
도 6은 회의록 열람페이지의 일 실시예를 보여주는 도면이다.
도 7은 회의록 편집페이지의 일 실시예를 보여주는 도면이다.
도 8은 음성회의록 작성페이지의 일 실시예를 보여주는 도면이다.
본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.
한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다. 단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "제 1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. "포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분 품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
"적어도 하나"의 용어는 하나 이상의 관련 항목으로부터 제시 가능한 모든 조합을 포함하는 것으로 이해되어야 한다. 예를 들어, "제1 항목, 제2 항목 및 제 3 항목 중에서 적어도 하나"의 의미는 제1 항목, 제2 항목, 또는 제3 항목 각각 뿐만 아니라 제1 항목, 제2 항목, 및 제3 항목 중에서 2개 이상으로부터 제시될 수 있는 모든 항 목의 조합을 의미한다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예들에 대해 설명한다.
본 발명에 따른 이동형 회의록 작성 시스템은 회의 시 화자(또는 사용자)들의 음성을 텍스트화하여 회의록을 자동 생성할 수 있다.
특히, 본 발명에 따른, 이동형 회의록 작성 시스템은 이동 가능하게 구성되어 장소에 구애받지 않고 구축될 수 있다.
이와 같은, 이동형 회의록 작성 시스템은 도 1에 도시된 바와 같이 구성될 수 있다.
도 1은 본 발명의 일 실시예에 따른 이동형 회의록 작성 시스템의 구성을 보여주는 도면이다. 도 1에 도시된 바와 같이, 본 발명에 따른 이동형 회의록 작성 시스템(1)은 복수개의 음성수집장치(100), 텍스트 변환장치(200), 및 중계기(300)를 포함한다.
본 발명에 따른 복수개의 음성수집장치(100)는 사용자의 음성을 수집한다. 구체적으로, 음성수집장치(100)는 사용자의 선택에 따라 사용자의 음성을 수집한다.
일 실시예에 있어서, 복수개의 음성수집장치(100)는 적어도 하나의 음성수집장치(100)가 사용자에 의해 선택되면, 선택된 음성수집장치(100)는 활성화되고, 나머지 음성수집장치(100)는 뮤트(Mute)될 수 있다. 여기서 음성수집장치(100)가 활성화된다는 것은 음성수집장치(100)가 음성을 수집할 수 있는 상태로 동작한다는 것을 의미한다. 음성수집장치(100)가 뮤트된다는 것은 음성수집장치(100)가 음성을 수집하지 못 하는 상태로 동작한다는 것을 의미한다.
이러한 실시예를 따를 때, 복수개의 음성수집장치(100)는 디폴트모드 시 활성화되어 있을 수 있다. 또한, 이와 달리 복수개의 음성수집장치(100)는 디폴트모드 시 뮤트되어 있을 수 있다.
이하, 본 발명에 따른 음성수집장치(100)에 대해 도 2를 참조하여 보다 구체적으로 설명한다.
도 2는 본발명에 따른 음성수집장치를 보여주는 도면이다.
본 발명에 따른 각 음성수집장치(100)는 도 2에 도시된 바와 같이 선택버튼(110), 마이크 모듈(120), 사용자 단말(130), 및 거치대(140)을 포함할 수 있다.
선택버튼(110)은 사용자에 의해 선택될 수 있는 버튼이다. 여기서, 선택버튼(110)을 별도의 구성으로 설명하나, 이는 하나의 실시예일뿐, 선택버튼(110)은 마이크 모듈(120)에 포함되어 있을 수도 있고, 사용자 단말(130)에 포함되어 있을 수도 있다.
여기서 사용자 단말(130)에 선택버튼(110)이 포함되는 경우, 선택버튼(110)은 사용자 단말(130) 자체에 형성된 버튼일 수도 있고, 사용자 단말(130)에 설치된 프로그램, 어플리케이션, 에이전트 등을 통해 제공되는 버튼일 수 있다.
마이크 모듈(120)은 사용자의 음성을 수집한다. 마이크 모듈(120)은 사용자 단말(130)과 연결되어 있을 수 있다.
사용자 단말(130)은 마이크 모듈이 연결된다. 사용자 단말(130)은 마이크 모듈(120)에 의해 수집된 사용자의 음성을 텍스트 생성장치(200)로 전송한다.
일 실시예에 있어서, 사용자 단말(130)은 선택버튼(110)이 사용자에 의해 선택되면, 연결된 마이크 모듈(120)을 활성화시킨다. 동시에, 사용자 단말(130)은 나머지 사용자 단말(130)들로 해당 사용자 단말(130)에 연결된 마이크 모듈(120)을 뮤트시키는 신호를 전송한다.
이와 같이, 본 발명은, 선택버튼(110)을 통해 선택된 사용자 단말(130)에 연결된 마이크 모듈(120)만을 활성화시킴으로써, 화자 구분을 수행할 수 있다. 또한, 본 발명은 물리적으로 화자 구분을 수행함으로써, 화자 구분의 정확도 또한 향상될 수 있다.
여기서, 사용자 단말(130)은 스마트폰, 노트북, 태블릿PC 등을 포함할 수 있다. 도 2에서는, 본 발명에 따른 사용자 단말(130)이 스마트폰인 것으로 도시하였으나, 이는 하나의 실시예일뿐, 휴대할 수 있는 전자기기일 수도 있을 것이다.
거치대(140)는 선택버튼(110), 마이크 모듈(120), 사용자 단말(130)을 거치한다. 도 2에서는 거치대(140)가 삼발이 구조를 갖는 것으로 도시하였으나, 이는 하나의 실시예 일 뿐, 거치할 수 있는 구조를 갖는 어떠한 형태도 가능할 것이다.
한편, 다시 도 1을 참조하면, 텍스트 변환장치(200)는 복수개의 음성수집장치(100)에서 수집되는 음성을 텍스트로 변환한다. 구체적으로, 텍스트 변환장치(200)는 활성화된 음성수집장치(100)로부터 음성을 텍스트로 변환한다.
일 실시예에 있어서, 텍스트 변환장치(200)는 복수개의 음성수집장치(100)에 서로 다른 사용자 정보를 각각 할당할 수 있다. 여기서 사용자 정보는, 사용자를 식별할 수 있는 정보로서, 사용자의 이름, 직함, 계급 등을 의미한다.
예컨대, 텍스트 변환장치(200)는 제1 음성수집장치에 제1 사용자 정보를 할당하고, 제2 음성수집장치에 제2 사용자 정보를 할당할 수 있다.
일 실시예에 있어서, 텍스트 변환장치(200)는 각 음성수집장치(100)를 이용하는 사용자의 사용자 정보를 복수개의 음성수집장치(100) 각각에 할당할 수 있다.
예컨대, 제1 음성수집장치를 제1 사용자가 이용하고, 제2 음성수집장치를 제2 사용자를 이용하는 경우, 텍스트 변환장치(200)는 제1 음성수집장치에 제1 사용자의 제1 사용자 정보를 할당하고, 제2 음성수집장치에 제2 사용자의 제2 사용자 정보를 할당할 수 있다.
일 실시예에 있어서, 텍스트 변환장치(200)는 각 음성수집장치(100)에서 수집되는 사용자의 음성을 해당 음성수집장치(100)에 할당된 사용자 정보에 따라 분류하여 텍스트로 변환할 수 있다.
예컨대, 제1 음성수집장치에 제1 사용자 정보가 할당되고, 제2 음성수집장치에 제2 사용자 정보가 할당된 경우, 텍스트 변환장치(200)는 제1 음성수집장치에서 수집되는 음성을 제1 사용자 정보의 음성으로 분류하고, 해당 음성을 텍스트로 변환할 수 있다. 텍스트 변환장치(200)는 제2 음성수집장치에서 수집되는 음성을 제2 사용자 정보의 음성으로 분류하고, 해당 음성을 텍스트로 변환할 수 있다.
이러한 예를 따르는 경우, 텍스트 변환장치(200)는 제1 음성수집장치에서 수집되는 음성을 변환한 텍스트를 제1 사용자 정보에 매핑하여 관리할 수 있다. 텍스트 변환장치(200)는 제2 음성수집장치에서 수집되는 음성을 변환한 텍스트를 제2 사용자 정보에 매핑하여 관리할 수 있다.
여기서 텍스트 변환장치(200)는 노트북으로 도시하였으나, 이는 하나의 예로, 휴대가능하고 서버기능을 수행할 수 있는 전자기기일 수 있을 것이다.
이와 같은, 텍스트 변환장치(200)에 대해 도 3을 참조하여 보다 구체적으로 설명한다.
도 3은 본 발명의 일 실시예에 따른 텍스트 변환장치의 구성을 보여주는 도면이다. 도 3에 도시된 바와 같이, 텍스트 변환장치(200)는 통신부(210), 사용자 정보 할당부(220), 음성분류부(230), 음성처리부(240), 인터페이스부(250), 및 데이터베이스(260)를 포함한다.
통신부(210)는 중계기(300)를 통해 복수개의 음성수집장치(100)와 송수신을 수행한다. 이에 따라, 통신부(210)는 복수개의 음성수집장치(100)로부터 음성들을 수신한다.
사용자 정보 할당부(220)는 복수개의 음성수집장치(100)에 사용자 정보를 각각 할당한다. 구체적으로, 사용자 정보 할당부(220)는 복수개의 음성수집장치(100)에 서로 다른 사용자 정보를 각각 할당한다. 여기서, 사용자 정보는 사용자를 식별할 수 있는 정보로서, 사용자의 이름, 직함, 계급 등을 의미한다.
일 실시예에 있어서, 사용자 정보 할당부(220)는 각 음성수집장치(100)를 이용하는 사용자의 사용자 정보를 복수개의 음성수집장치(100) 각각에 할당할 수 있다.
일 실시예에 있어서, 사용자 정보 할당부(220)는 인터페이스부(250)에 의해 각 음성수집장치(100)를 이용하는 사용자의 사용자 정보가 입력되면, 입력된 사용자 정보들을 각 사용자가 이용하는 음성수집장치(100)와 매칭되도록 복수개의 음성수집장치(100) 각각에 할당할 수 있다.
음성분류부(230)는 통신부(210)에 의해 수신된 음성들을 분류한다. 구체적으로, 음성분류부(230)는 음성들을 사용자 정보에 따라 분류한다.
일 실시예에 있어서, 음성분류부(230)는 각 음성수집장치(100)에서 수집된 음성들을 해당 음성수집장치(100)에 할당된 사용자 정보에 따라 분류할 수 있다.
이러한 실시예를 따르는 경우, 음성분류부(230)는 각 음성을 해당 사용자 정보에 매핑하여 관리할 수 있다. 음성분류부(230)는 사용자 정보에 매핑된 음성을 데이터베이스(260)에 저장하고, 음성처리부(240)로 전달한다.
음성처리부(240)는 사용자 정보에 따라 분류된 음성을 텍스트로 변환한다. 음성처리부(240)는 변환한 텍스트를 사용자 정보에 매핑하여 관리할 수 있다. 음성처리부(240)는 변환한 텍스트를 사용자 정보에 매핑하여 데이터베이스(260)에 저장한다.
일 실시예에 있어서, 음성처리부(240)는 미리 설정된 알고리즘에 따라 학습된 음성인식모델에 음성을 입력하여 텍스트로 변환할 수 있다.
일 실시예에 있어서, 음성인식모델은 회의록 학습데이터로 학습될 수 있다. 여기서 회의록 학습데이터는 각 기관에서 실제 수행한 회의에서 수집된 회의록 데이터일 수 있다. 여기서, 기관은 공공기관, 사기업, 대학교 등을 포함하며, 회의록 학습데이터는 실제 본 발명이 적용되는 기관에서 수행된 회의에서 수집될 수 있다.
일 실시예에 있어서, 음성인식모델은 DNN 알고리즘으로 학습될 수 있다. 여기서 DNN 알고리즘은 음성파형의 특징을 추출하여 특징에 가까운 예상단어를 결정할 수 있도록 한다.
일 실시예에 있어서, 음성인식모델은 LSTM 알고리즘으로 학습될 수 있다. LSTM 알고리즘은 DNN 알고리즘을 통해 추출된 음성파형의 특징과 선행단어를 기초로 후행단어를 예측할 수 있도록 한다.
일 실시예에 있어서, 음성인식모델은 CNN 알고리즘으로 학습될 수 있다. CNN 알고리즘은 음성파형을 이미지로 인식하여 예상단어를 결정할 수 있도록 한다.
예컨대, 음성인식모델은 입력된 음성을 음성파형으로 변환하고, 음성파형으로부터 특징을 추출한다. 음성인식모델은 음성파형의 특징에 따라 예상단어를 결정한다. 음성인식모델은 음성파형을 이미지로 변환하여 이미지를 분석하여 예상단어를 결정한다. 음성인식모델은 음성파형의 특징 및 이미지에 따라 각각 결정된 예상단어와 선행단어를 기초로 해당 음성의 단어를 결정하게 된다.
일 실시예에 있어서, 음성처리부(240)는 변환된 텍스트들로 회의록을 생성한다. 음성처리부(240)는 텍스트들을 시간적 순서에 따라 나열하여 회의록을 생성할 수 있다. 또한, 음성처리부(240)는 텍스트들을 사용자 정보 별로 그룹핑하여 회의록을 생성할 수 있다.
이러한 실시예를 따르는 경우, 음성처리부(240)는 텍스트들을 사용자 정보 별로 시간적 순서에 따라 나열하여 회의록을 생성할 수 있다.
음성처리부(240)는 회의록을 생성하여 데이터베이스(260)에 저장한다. 여기서 회의록은 docs, hwp, xlsx, pdf 등의 파일로 저장될 수 있다.
인터페이스부(250)는 사용자에게 음성이 변환된 텍스트를 제공한다. 일 실시예에 있어서, 인터페이스부(250)는 사용자에게 실시간으로 음성이 변환된 텍스트를 제공할 수 있다.
일 실시예에 있어서, 인터페이스부(250)는 사용자 정보 및 텍스트를 음성이 수집된 순서에 따라 실시간으로 표시할 수 있다. 구체적으로, 인터페이스부(250)는 사용자 정보와 해당 사용자 정보에 매핑된 텍스트를 음성이 수집된 순서에 따라 실시간으로 표시할 수 있다.
예컨대, 도 4에 도시된 바와 같이, 인터페이스부(250)는 사용자 정보와 텍스트를 수집된 순서에 따라 제공할 수 있다.
이와 같이, 본 발명은 실시간으로 음성을 텍스트화하여 해당 음성의 사용자 정보와 동시에 제공함으로써, 회의 중에 회의내용을 놓치거나 회의 도중에 참가하더라도 회의내용을 파악할 수 있어 회의 참여율 및 회의 이해도가 향상된다는 효과가 있다.
인터페이스부(250)는 사용자에게 음성이 텍스트화되어 나열된 회의록을 제공할 수 있다. 예컨대, 인터페이스부(250)는 도 5에 도시된 바와 같이, 회의록 관리 페이지를 제공할 수 있다. 인터페이스부(250)는 파일버튼(251)이 선택되면, 데이터베이스(260)에 저장된 회의록 파일을 사용자에게 제공한다.
또한, 예컨대, 인터페이스부(250)는 도 6에 도시된 바와 같이, 회의록 열람페이지를 제공할 수 있다. 이에 따라, 사용자는 인터페이스부(250)에 의해 제공되는 회의록 열람페이지를 통해 회의록을 열람할 수 있게 된다.
일 실시예에 있어서, 인터페이스부(250)는 회의록 편집페이지를 제공할 수 있다. 이러한 경우, 사용자는 회의록 편집 페이지를 통해 회의록 내용을 수정하거나 오탈자를 정정할 수 있다. 예컨대, 도 7에 도시된 바와 같이, 인터페이스부(250)는 회의록 편집페이지를 제공할 수 있다.
일 실시예에 있어서, 인터페이스부(250)는 음성 회의록 작성페이지를 제공할 수 있다. 사용자가 음성 회의록 작성페이지를 통해 음성 회의록 파일을 업로드하면, 인터페이스부(250)는 해당 음성회의록 파일을 음성처리부(240)로 전달하게 된다. 음성처리부(240)는 전달된 음성회의록 파일을 텍스트화하여 회의록을 생성할 수 있다.
예컨대, 인터페이스부(250)는 도 8에 도시된 바와 같이, 음성회의록 작성페이지를 제공할 수 있다.
일 실시예에 있어서, 인터페이스부(250)는 동영상 회의록 작성페이지를 제공할 수 있다. 사용자가 동영상 회의록 작성페이지를 통해 동영상 회의록 파일을 업로드하면, 인터페이스부(250)는 해당 동영상 회의록 파일을 음성처리부(240)로 전달하게 된다. 음성처리부(240)는 전달된 동영상 회의록 파일을 텍스트화하여 회의록을 생성할 수 있다.
한편, 다시 도 1을 참조하면, 중계기(300)는 복수개의 음성수집장치(100)와 텍스트 생성장치(200)간의 통신을 중계한다. 구체적으로, 중계기(300)는 복수개의 음성수집장치(100)와 텍스트 생성장치(200)간 폐쇄형 네트워크를 구축하여 상호간의 통신을 중계한다.
이상 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명하였지만, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해되어야 하고, 본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Claims (5)
- 사용자의 선택에 따라 상기 사용자의 음성을 수집하는 복수개의 음성수집장치; 및
상기 복수개의 음성수집장치에 서로 다른 사용자 정보를 각각 할당하고, 상기 각 음성수집장치에서 수집되는 상기 사용자의 음성을 해당 음성수집장치에 할당된 상기 사용자 정보에 따라 분류하여 텍스트로 변환하는 텍스트 변환장치를 포함하고,
상기 복수개의 음성수집장치는,
상기 적어도 하나의 음성수집장치가 상기 사용자에 의해 선택되면, 선택된 음성수집장치는 활성화되고 나머지 음성수집장치는 뮤트되는 것을 특징으로 하는 이동형 회의록 작성 시스템.
- 제1항에 있어서,
상기 각 음성수집장치는,
선택버튼;
음성을 수집하는 마이크 모듈; 및
상기 마이크 모듈이 연결되고, 수집된 음성을 상기 텍스트 생성장치로 전송하는 사용자 단말을 포함하고,
상기 사용자 단말은
상기 선택버튼이 선택되면, 연결된 마이크 모듈을 활성화시키고, 나머지 사용자 단말로 해당 사용자 단말에 연결된 마이크 모듈을 뮤트시키는 신호를 전송하는 것을 특징으로 하는 이동형 회의록 작성 시스템.
- 제1항에 있어서,
상기 복수개의 음성수집장치와 상기 텍스트 생성장치간 폐쇄형 네트워크를 구축하여 상호간의 통신을 중계하는 중계기를 더 포함하는 것을 특징으로 하는 이동형 회의록 작성 시스템.
- 제1항에 있어서,
상기 텍스트 변환 장치는,
상기 텍스트들을 사용자 정보 별로 시간적 순서에 따라 나열하여 회의록을 생성하는 것을 특징으로 하는 이동형 회의록 작성 시스템.
- 제1항에 있어서,
상기 텍스트 변환 장치는,
상기 텍스트 및 해당 텍스트의 사용자 정보를 실시간으로 표시하는 것을 특징으로 하는 이동형 회의록 작성 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220024526A KR20230126999A (ko) | 2022-02-24 | 2022-02-24 | 이동형 회의록 작성 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220024526A KR20230126999A (ko) | 2022-02-24 | 2022-02-24 | 이동형 회의록 작성 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230126999A true KR20230126999A (ko) | 2023-08-31 |
Family
ID=87847575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220024526A KR20230126999A (ko) | 2022-02-24 | 2022-02-24 | 이동형 회의록 작성 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230126999A (ko) |
-
2022
- 2022-02-24 KR KR1020220024526A patent/KR20230126999A/ko unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7029613B2 (ja) | インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム | |
US20220012413A1 (en) | Summarization method for recorded audio | |
Mostefa et al. | The CHIL audiovisual corpus for lecture and meeting analysis inside smart rooms | |
JP2020016875A (ja) | 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム | |
JP2006190296A (ja) | マルチメディア通信システムにおけるコンテキスト抽出及びこれを用いた情報提供装置及び方法 | |
US10367944B2 (en) | Apparatus, system, and method of conference assistance | |
KR20220101672A (ko) | 오디오-비주얼 스트림에서 프라이버시-인식 회의실 전사 | |
CN109448709A (zh) | 一种终端投屏的控制方法和终端 | |
CN1936967A (zh) | 声纹考勤机 | |
JP2021067830A (ja) | 議事録作成システム | |
EP4174849B1 (en) | Automatic generation of a contextual meeting summary | |
US11769504B2 (en) | Virtual meeting content enhancement triggered by audio tracking | |
KR20170126667A (ko) | 회의 기록 자동 생성 방법 및 그 장치 | |
Ronzhin et al. | Multichannel system of audio-visual support of remote mobile participant at e-meeting | |
CN108320761B (zh) | 音频录制方法、智能录音设备及计算机可读存储介质 | |
Furui | Speech recognition technology in the ubiquitous/wearable computing environment | |
JP6596373B2 (ja) | 表示処理装置及び表示処理プログラム | |
Ronzhin et al. | Context-aware mobile applications for communication in intelligent environment | |
KR20230126999A (ko) | 이동형 회의록 작성 시스템 | |
EP3862963A1 (en) | Interpretation system, server device, distribution method, and recording medium | |
CN113035246A (zh) | 音频数据同步处理方法、装置、计算机设备及存储介质 | |
US11716364B2 (en) | Reducing bandwidth requirements of virtual collaboration sessions | |
US12099945B2 (en) | Communication management apparatus | |
CN113689855A (zh) | 一种会议记录生成系统、方法、装置、存储介质 | |
CN102263929A (zh) | 会议视像信息实时发布系统和相应装置 |