KR101934280B1 - 발화내용 분석 장치 및 방법 - Google Patents

발화내용 분석 장치 및 방법 Download PDF

Info

Publication number
KR101934280B1
KR101934280B1 KR1020160128635A KR20160128635A KR101934280B1 KR 101934280 B1 KR101934280 B1 KR 101934280B1 KR 1020160128635 A KR1020160128635 A KR 1020160128635A KR 20160128635 A KR20160128635 A KR 20160128635A KR 101934280 B1 KR101934280 B1 KR 101934280B1
Authority
KR
South Korea
Prior art keywords
speech
topic
utterance
keyword
deriving
Prior art date
Application number
KR1020160128635A
Other languages
English (en)
Other versions
KR20180037868A (ko
Inventor
이지아
한지민
박정미
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020160128635A priority Critical patent/KR101934280B1/ko
Priority to US15/377,847 priority patent/US10347243B2/en
Publication of KR20180037868A publication Critical patent/KR20180037868A/ko
Application granted granted Critical
Publication of KR101934280B1 publication Critical patent/KR101934280B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • G06F17/30749
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

일 실시 예에 따른 발화내용 분석 방법은 발화자의 음성 신호를 수집하는 단계; 상기 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계; 상기 텍스트 정보로부터 상기 텍스트 정보의 키워드를 추출하는 단계; 및 상기 추출된 텍스트 정보의 키워드를 기초로 적어도 하나의 발화 주제를 도출하는 단계;를 포함한다.

Description

발화내용 분석 장치 및 방법{APPARATUS AND METHOD FOR ANALYZING SPEECH MEANING}
개시된 발명은 발화내용 분석 장치 및 방법에 관한 발명이다.
발화내용 처리 기술은 발화자의 발화내용을 이용하고 적절한 응답을 찾아 제시해 주는 지능형 기술이다. 이러한 발화내용 처리 기술을 구현하기 위해 각 발화에 숨겨진 발화자의 의도를 찾아내고, 적절한 시스템 응답을 만들어내기 위한 기술들이 연구 중에 있다. 현재 연구 중인 기술로는, 일본 공개특허 2015-156066의 회의 지원 장치, 한국공개특허 2015-0081981의 회의 내용 구조화 장치, 한국등록특허 10-1560459의 트랜드 정보 추출 및 예측 방법, 한국등록특허 10-00881334의 대화형 정보 제공 서비스 장치 및 방법 등이 있다.
발화내용 처리 기술은 인터뷰, 회의, 대화 등 다양한 환경에 활용 및 응용 가능할 수 있다.
일 측면은 텍스트 정보의 키워드를 기초로 발화내용의 주제를 도출하도록 마련된 발화내용 분석 장치 및 방법을 제공한다.
다른 측면은 발화내용의 주제 범위 내에서 텍스트 정보의 키워드를 기초로 발화내용을 분석 가능하도록 마련된 발화내용 분석 장치 및 방법을 제공한다.
일 측면에 따른 발화내용 분석 방법은 발화자의 음성 신호를 수집하는 단계; 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계; 텍스트 정보로부터 텍스트 정보의 키워드를 추출하는 단계; 및 추출된 텍스트 정보의 키워드를 기초로 적어도 하나의 발화 주제를 도출하는 단계;를 포함한다.
또한, 발화 주제를 도출하는 단계는, 분석된 텍스트 정보의 키워드들 중 미리 설정된 기준 값 이상으로 출현된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 키워드를 기초로 도출된 적어도 하나의 발화 주제 중 사용자에 의해 선택된 적어도 하나의 발화 주제를 발화 주제로 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 추출된 키워드들 간의 연관성을 기초로 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 발화자의 정보에 기초해 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 복수의 발화자가 존재하는 경우, 발화자 들의 공통 정보에 기초해 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 미리 설정된 주제 키워드의 범위 내에서 분석된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 도출된 발화 주제 범위 내에서 세부 발화 주제를 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 추출된 텍스트 정보의 키워드를 기초로 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 추출된 정보를 기초로 발화 주제를 도출하는 것;을 포함할 수 있다.
또한, 도출된 발화 주제를 기초로 발화내용을 분석하는 단계;를 더 포함할 수 있다.
또한, 발화내용을 분석하는 단계는, 도출된 발화 주제의 범위 내에서 추출된 텍스트 정보의 키워드로 검색을 수행하고, 검색 결과를 표시하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 미리 설정된 주제 키워드의 범위 내에서 분석된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하고, 도출된 발화 주제의 범위 내에서 세부 발화 주제를 도출하는 것을 포함하고, 발화내용을 분석하는 단계는, 세부 발화 주제별 발화내용의 분석 결과를 표시하는 것을 포함할 수 있다.
또한, 발화 주제를 도출하는 단계는, 발화내용의 분석 결과를 기초로 발화 주제를 도출하는 것을 포함할 수 있다.
일 측면에 따른 발화내용 분석 장치는 발화자의 음성 신호를 수집하는 수집부; 음성 신호를 텍스트 형태의 정보로 변환하고, 텍스트 정보의 키워드를 기초로 발화자의 발화 주제를 도출하는 제어부; 및 도출된 발화 주제를 표시하는 표시부;를 포함한다.
또한, 제어부는, 텍스트 정보의 키워드들 중 미리 설정된 기준 값 이상으로 출력된 텍스트 정보의 키워드를 기초로 발화 주제를 도출할 수 있다.
또한, 제어부는, 키워드를 기초로 도출된 적어도 하나의 발화 주제 중 사용자에 의해 선택된 적어도 하나의 발화 주제를 발화 주제로 도출할 수 있다.
또한, 제어부는, 추출된 키워드들 간의 연관성을 기초로 발화 주제를 도출할 수 있다.
또한, 제어부는, 발화자의 발화 정보에 기초해 발화 주제를 도출할 수 있다.
또한, 제어부는, 복수의 발화자가 존재하는 경우, 발화자 들의 공통 정보에 기초해 발화 주제를 도출할 수 있다.
또한, 제어부는, 미리 설정된 주제 키워드의 범위 내에서 텍스트 정보의 키워드를 기초로 발화 주제를 도출할 수 있다.
또한, 제어부는, 도출된 발화 주제의 범위 내에서 세부 발화 주제를 도출할 수 있다.
또한, 제어부는, 세부 발화 주제를 기초로 발화자의 발화내용을 분석하고, 표시부는, 세부 발화 주제별 발화내용의 분석 결과를 표시할 수 있다.
또한, 제어부는, 발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출할 수 있다.
또한, 제어부는, 키워드를 기초로 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 추출된 정보를 기초로 발화 주제를 도출할 수 있다.
또한, 제어부는, 도출된 발화내용의 주제를 기초로 발화내용을 분석할 수 있다.
또한, 제어부는, 도출된 주제 범위 내에서 텍스트 정보의 키워드로 검색을 수행하고, 표시부는, 검색 결과를 표시할 수 있다.
또한, 제어부는, 발화내용의 분석 결과를 기초로 발화 주제를 도출할 수 있다.
또한, 표시부는, 발화자가 표시부의 표시 내용을 확인 가능하도록 배치된 것을 포함할 수 있다.
일 측면에 따른 발화내용 분석 장치 및 방법에 의하면 발화내용을 텍스트 형태로 변환하는 작업 없이 발화내용을 효율적으로 정리할 수 있다.
다른 측면에 따른 발화내용 분석 장치 및 방법에 의하면 발화내용의 분석 결과를 다양한 형태로 시각화하여 제공할 수 있다.
또 다른 측면에 따른 발화내용 분석 장치 및 방법에 의하면 발화내용을 실시간으로 분석하고, 분석 결과에 기초해 발화내용의 주제를 도출할 수 있다.
도 1은 일 실시 예에 따른 발화내용 분석 장치의 구성을 도시한 제어 블록도 이다.
도 2는 일 실시 예에 따른 발화내용 분석 방법의 흐름을 도시한 흐름도 이다.
도 3은 아이디어 발상 모드에서 발화내용 분석 방법의 일 예를 도시한 흐름도 이다.
도 4는 아이디어 발상 모드에서 발화내용 분석 방법의 다른 예를 도시한 흐름도 이다.
도 5는 도 4에 따른 아이디어 발상 모드에서 이미지 검색 결과 화면의 예를 도시한 도면이다.
도 6은 아이디어 발상 모드에서 발화내용 분석 방법의 또 다른 예를 도시한 흐름도 이다.
도 7은 도 6에 따른 아이디어 발상 모드에서 발화내용 분석 결과 화면의 일 예를 도시한 도면이다.
도 8은 비서 모드에서 발화내용 분석 방법의 일 예를 도시한 흐름도 이다.
개시된 발명은 발화내용 분석 장치 및 방법에 대한 것이다.
일 측면에 따른 발화내용 분석 장치 및 방법은 입력된 발화자의 음성 신호를 기초로 발화자의 발화 주제를 도출하고, 발화내용을 분석할 수 있다. 보다 상세하게, 발화내용 분석 장치 및 방법은 단일 발화자의 발화내용을 분석하거나, 복수 발화자 들의 대화 내용을 분석하기 위한 툴로 제공될 수 있다. 예를 들어, 발화내용 분석 장치 및 방법을 이용해 실시간 인터뷰 내용을 분석하거나 회의 내용의 분석이 가능할 수 있다.
이러한 발화내용 분석 장치는 데스크탑, 스마트폰 및 태블릿 PC(tablet PC) 등과 같이 발화자의 음성 신호를 수집 및 처리하고 그 결과를 표시 가능한 장치를 통해 구현 가능할 수 있다.
이하 첨부된 도면을 참조하여 발화내용 분석 장치 및 방법에 대해 상세하게 설명한다.
도 1은 일 실시 예에 따른 발화내용 분석 장치(100)의 구성을 도시한 제어 블록도 이다.
도 1에 도시된 바를 참조하면 일 실시 예에 따른 발화내용 분석 장치(100)는, 입력부(110)와, 수집부(120)와, 표시부(130)와, 메모리(140)와, 제어부(150)를 포함할 수 있다.
입력부(110)는 발화내용 분석 장치(100)에 대한 사용자의 제어 명령을 입력 받을 수 있다. 사용자는 입력부(110)를 통해 발화내용의 분석 모드를 설정할 수 있다. 여기서 발화내용 분석 모드는 인터뷰 모드, 아이디어 발상 모드, 비서 모드 등을 포함할 수 있다. 이하, 인터뷰 모드는 인터뷰 대상의 발화 정보를 기초로 인터뷰 주제 및 내용을 분석하는 모드로 정의하고, 아이디어 발상 모드는 회의 중 회의 참여자들의 발화내용을 기초로 회의의 주제 및 내용을 분석하는 모드로 정의하고, 비서 모드는 회의 중 발생되는 발화 정보를 기초로 질문 내용에 대한 검색 기능을 제공하는 모드로 정의한다.
입력부(110)는 사용자의 입력을 위해 각종 버튼이나 스위치, 키보드, 마우스, 트랙볼(track-ball) 등과 같은 하드웨어적인 입력 장치를 포함할 수 있으며, 실시 예에 따라 터치 패드(touch pad) 등과 같은 GUI(Graphic User Interface), 즉 소프트웨어적인 입력 장치를 포함할 수 있다. 입력부(110)가 터치 패드 형태로 마련될 경우 터치 패드는 터치 스크린 패널(Touch Screen Panel; TSP)로 구현되어 표시부(130)와 상호 레이어 구조를 이룰 수 있다.
수집부(120)는 발화자의 음성 신호를 수집하고, 수집된 음성 신호를 제어부(150)에 출력할 수 있다.
수집부(120)는 일반적인 가청 주파수 대역의 음성 신호를 수집하는 음성 센서를 포함할 수 있다. 예를 들어, 수집부(120)는 마이크로폰(Microphone), 압전 센서(Piezoelectric Sensor) 및 음향 차동형 센서(Acoustic Differential Sensor)를 포함하는 군에서 선택된 적어도 하나의 음성 센서를 채용할 수 있으나, 채용 가능한 음성 센서의 예가 이에 한정되는 것은 아니다.
표시부(130)는 발화자가 표시부(130)의 표시 내용을 확인 가능하도록 배치될 수 있다. 일 예에 따르면, 복수의 발화자 들이 모여 회의를 진행하는 경우 표시부(130)는 회의실의 중앙에 스크린 형태로 마련될 수 있다. 이에, 복수의 발화자들이 표시부(130)의 표시 내용을 확인 가능하도록 배치될 수 있으며, 이 경우 필요에 따라 복수 개의 표시부(130)가 마련될 수도 있다.
표시부(130)는 수집부(120)에서 수집된 음성 신호에 대한 분석 결과 화면을 표시할 있다. 보다 상세하게, 표시부(130)는 수집부(120)에서 수집된 음성 신호가 텍스트 형태의 정보로 변환되면, 변환된 텍스트 정보를 표시하거나 실시 예에 따라 텍스트 정보가 처리 중임을 이미지, 동영상 등의 형태로 표시할 수 있다.
표시부(130)는 텍스트 정보의 키워드를 기초로 발화자의 발화 주제가 도출되면, 도출된 발화 주제 정보를 표시할 수 있다. 이 때, 단일한 발화 주제가 도출되면 단일한 발화 주제를 표시하고, 복수 개의 발화 주제들이 도출되면 복수 개의 발화 주제들을 표시할 수 있다. 아울러, 시간의 흐름에 따라 발화 주제가 변경되는 경우 시간의 흐름에 따라 발화 주제를 변경하여 표시할 수 있으며, 이 경우 화면의 일 측에 발화 주제의 히스토리를 함께 표시할 수도 있다.
표시부(130)는 사용자로부터 설정된 모드에 따라 세부 발화 주제들이 도출되면, 메인 발화 주제를 중심으로 세부 발화 주제 정보들을 함께 표시할 수 있다.
표시부(130)는 발화내용의 분석 결과를 텍스트, 이미지, 동영상 등의 형태로 표시할 수 있다.
예를 들어, 발화내용 분석 장치(100)는 발화 주제 범위 내에서 텍스트 정보의 키워드를 사용해 검색을 수행함으로써 발화자의 발화내용을 분석할 수 있다. 이 경우, 표시부(130)는 텍스트 및 이미지가 조합된 검색 결과 화면을 표시할 수 있다.
다른 예에 따르면, 발화내용 분석 장치(100)는 사용자로부터 설정된 모드에 따라 세부 발화 주제들을 도출하고 발화자의 발화내용을 도출된 세부 발화 주제별로 분류할 수 있다. 이 경우, 표시부(130)는 발화 주제를 중심으로 세부 발화 주제들을 표시하고, 발화자의 발화내용과 관련된 컨텐츠를 세부 발화 주제 항목별로 분류하여 표시할 수 있다. 이러한 표시 방식은 아이디어 회의 중 회의 참여자의 아이디어에 대한 트리를 형성하는 경우에 유용할 수 있다.
메모리(140)는 발화내용 분석 장치(100)를 구동하고 제어하기 위한 제어 프로그램 또는 어플리케이션을 저장할 수 있다.
보다 상세하게, 메모리(140)는 수집부(120)를 통해 수집된 아날로그 형태의 음성 신호를 디지털 형태로 변환하고, 디지털 형태의 음성 신호를 텍스트 형태의 정보로 변환하기 위한 프로그램 등을 저장할 수 있다.
또한, 메모리(140)는 텍스트 정보로부터 키워드를 추출하고, 추출된 키워드를 주체로 발화자의 발화 주제를 도출하고, 도출된 발화 주제를 기초로 발화내용을 분석하는 프로그램 등을 저장할 수 있다.
메모리(140)는 발화내용 분석 장치(100) 제어를 위한 제어 프로그램 또는 어플리케이션과 관련된 UI(User Interface), UI를 제공하기 위한 오브젝트(예를 들어, 이미지, 텍스트, 아이콘, 버튼 등), 사용자 정보, 문서, 데이터베이스들 또는 관련 데이터들을 저장할 수 있다.
메모리(140)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory: RAM), SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
제어부(150)는 발화내용 분석 장치(100)의 전반적인 동작을 제어한다. 제어부(150)는 발화내용 분석 장치(100)의 각 구성 즉, 입력부(110), 표시부(130), 수집부(120) 및 메모리(140) 등을 제어할 수 있다. 제어부(150)는 집적 회로(integrated circuit)가 형성된 적어도 하나의 칩을 포함하는 각종 프로세서일 수 있다.
제어부(150)는 수집부(120)에서 수집된 음성 신호를 텍스트 형태의 정보로 변환할 수 있으며, 변환된 텍스트 정보로부터 키워드를 추출할 수 있다.
이 경우, 제어부(150)는 미리 설정된 기준 값 이상으로 출현된 텍스트 정보의 키워드들 중 "은", "는", "이", "가"와 같은 조사를 포함하는 미리 설정된 키워드는 제외하고 명사, 형용사, 동사 등과 같은 미리 설정된 키워드를 중심으로 텍스트 정보의 키워드를 추출할 수 있다. 발화자의 발화 내용에는 일반적으로 조사, 어미 등이 빈번한 키워드로 추출될 가능성이 높으므로 이러한 과정을 거쳐 보다 의미 있는 키워드가 추출되도록 할 수 있다.
제어부(150)는 추출된 키워드를 기초로 발화 주제를 도출할 수 있다. 보다 상세하게, 제어부(150)는 추출된 키워드를 기초로 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 추출된 정보를 기초로 발화 주제를 도출할 수 있다. 여기서 발화 주제의 도출 시 제공되는 키워드는 추출된 키워드들 중 미리 설정된 기준 값 이상으로 출현된 텍스트 정보의 키워드일 수 있다.
한편, 실시 예에 따라 복수개의 발화 주제들이 도출될 수 있다. 이 경우, 제어부(150)는 발화자의 발화가 진행됨에 따라 추출된 키워드들 간의 연관성을 기초로 발화 주제의 범위를 좁힐 수 있다.
예를 들어, 발화 주제 도출 과정에서 김치, 깍두기, 파, 무, 젓갈, 숙성, 소금, 김장과 같은 키워드 들이 미리 설정된 기준 값 이상으로 출현되는 경우, 이들 키워드들을 기초로 파김치 담그는 법, 깍두기 담그는 법, 김치 담그는 법 등의 발화 주제가 도출될 수 있다.
이 경우 발화가 진행됨에 따라 추출된 키워드들 간의 연관성을 기초로 발화 주제의 범위가 좁혀질 수 있다. 얘를 들어, 무, 파, 젓갈 및 소금과 같은 키워드는 깍두기를 담그는 재료인 점에서 연관성이 있으며, 이러한 단어들의 연관성을 기초로 발화 주제가 깍두기 담그는 법으로 좁혀질 수 있다.
도출된 발화 주제는 제어부(150)의 제어에 의해 표시부(130)에 표시될 수 있으며, 복수 개의 발화 주제들이 도출되는 경우 표시부(130)는 발화 주제들의 목록을 표시할 수 있다. 이 경우, 표시부(130)는 발화 주제로 도출될 가능성이 높은 발화 주제 항목을 최 상단에 표시하거나 다른 항목들보다 크게 표시하거나 다른 서체를 적용하여 표시할 수 있다. 다만 표시부(130)의 발화 주제 표시 방식이 전술한 예에 한정되는 것은 아니다.
한편, 제어부(150)는 복수의 발화 주제 중 사용자에 의해 선택된 적어도 하나의 발화 주제를 발화 주제로 도출할 수 있으며, 도출된 발화 주제를 표시하도록 표시부(130)의 표시를 제어할 수 있음은 물론이다.
또한, 제어부(150)는 도출된 발화 주제 범위 내에서 세부 발화 주제를 도출할 수도 있다. 세부 발화 주제의 도출 방식은 전술한 발화 주제의 도출 방식과 유사하며 이하 발화 주제의 도출 방식과 중복되는 설명은 생략하도록 한다. 제어부(150)는 도출된 발화 주제 범위 내에서 세부 발화 주제가 도출되면 세부 발화 주제 별로 신규 트리를 생성할 수 있다. 표시부(130)는 발화 순서에 따라 트리에 발화 내용과 대응되는 컨텐츠를 표시할 수 있다.
또한, 제어부(150)는 발화자의 정보에 기초해 발화 주제를 도출할 수 있으며, 실시 예에 따라 복수의 발화자가 존재하는 경우 발화자 들의 공통 정보에 기초해 발화 주제를 도출할 수도 있다.
일 예에 따르면, 제어부(150)는 발화자의 성별, 나이, 직업 등의 정보를 기초로 발화 주제를 도출할 수 있으며, 실시 예에 따라 SNS(Social Network Service), 이메일 등의 개인정보를 기초로 발화 주제를 도출할 수도 있다.
다른 예에 따르면, 제어부(150)는 복수 대화 참여자들의 성별, 나이, 직업 등의 정보를 기초로 대화 주제를 도출할 수 있으며, 실시 예에 따라 복수 대화 참여자들의 SNS(Social Network Service), 이메일 등의 개인정보를 기초로 대화 주제를 도출할 수도 있다. 한편, 실시 예에 따라 제어부(150)는 복수 대화 참여자들의 정보에 기초해 대화 참여자들의 공통 관심사를 추출하고, 추출된 관심사를 기초로 추천 가능한 대화 주제를 도출할 수도 있다.
또한, 제어부(150)는 미리 설정된 주제 키워드의 범위 내에서 텍스트 정보의 키워드를 기초로 발화 주제를 도출할 수 있다. 여기서 미리 설정된 주제 키워드는 사용자에 의해 미리 설정된 "발화 주제의 분야 관련 키워드"일 수 있으며, 실시 예에 따라 특정 발화 주제 관련 키워드일 수 있다. 여기서 발화 주제의 분야(分野)는 여러 갈래로 나누어진 주제 범위나 부분을 의미하는 용어로, 예를 들어 전자, 통신, 자동차 등과 같은 여러 갈래로 나누어진 주제 범위를 포함하는 용어를 의미할 수 있다. 또한, 발화 주제에 대한 키워드는 사용자에 의해 설정된 보다 세부적인 주제와 관련된 용어를 의미할 수 있다. 제어부(150)는 전술한 바와 같은 미리 설정된 주제 키워드의 범위 내에서 발화 주제를 도출함으로써 발화 주제 도출 과정에서의 정확도를 높일 수 있다.
또한, 제어부(150)는 발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출할 수도 있다. 일 예에 따르면, 텍스트 정보의 키워드를 기초로 발화자의 발화 주제가 도출되는 과정에서 복수 개의 발화 주제들이 도출될 수 있으며, 이 경우 사용자에 의해 선택된 하나의 주제가 발화 주제로 도출될 수 있다. 이 경우 발화자에 의해 선택된 발화 주제는 발화 진행 중 발화 주제의 재 선택 과정에서 발화 주제의 선택 이력으로 제공될 수 있다.
또한, 제어부(150)는 도출된 발화 주제를 기초로 발화내용을 분석할 수 있으며, 실시 예에 따라 발화내용의 분석 결과를 발화 주제를 도출하는 과정에 제공할 수 있다. 아울러, 제어부(150)는 발화내용의 분석 결과를 표시하도록 표시부(130)를 제어할 수 있다.
일 예에 따르면, 제어부(150)는 도출된 발화 주제의 범위 내에서 추출된 텍스트 정보의 키워드로 웹 검색을 수행하고 검색 결과를 표시하도록 표시부(130)를 제어할 수 있다. 표시부(130)는 웹 검색 결과 화면을 표시할 수 있으며, 이 때 결과 화면은 텍스트 형태, 이미지 형태로 표시되거나 실시 예에 따라 양자가 결합된 형태로 표시될 수 있다.
이상으로 일 실시 예에 따른 발화내용 분석 장치(100)의 구성에 대해 설명하였다. 다음으로, 일 실시 예에 따른 발화내용 분석 방법에 대해 설명하도록 한다.
도 2는 일 실시 예에 따른 발화내용 분석 방법의 흐름을 도시한 흐름도 이다. 도 2에 도시된 바를 참조하면, 일 실시 예에 따른 발화내용 분석 방법은 발화자의 음성 신호를 수집하는 단계와(210), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(220), 텍스트 정보의 키워드를 추출하는 단계와(230), 키워드를 기초로 발화자의 발화 주제를 도출하는 단계와(240), 도출된 발화 주제를 기초로 발화내용을 분석하는 단계(250)를 포함할 수 있다.
이하 설명의 편의상 발화자의 음성 신호를 수집하는 단계와(210), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(220)와 관련하여 전술한 제어부(150)의 구성에서 설명한 것과 중복되는 설명은 생략하도록 한다.
텍스트 정보의 키워드를 추출하는 단계는 텍스트 정보로부터 미리 설정된 기준 값 이상으로 출현된 단어를 텍스트 정보의 키워드로 추출하는 것을 포함할 수 있다(230).
발화자의 발화 주제를 도출하는 단계는 추출된 텍스트 정보의 키워드를 기초로 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 추출된 정보를 기초로 발화자의 발화 주제를 도출하는 것을 포함할 수 있다. 여기서 발화 주제의 도출 시 제공되는 키워드는 추출된 키워드들 중 미리 설정된 기준 값 이상으로 출현된 텍스트 정보의 키워드일 수 있다.
또한, 발화자의 발화 주제를 도출하는 단계는 복수의 발화 주제가 도출되는 경우 발화자의 발화가 진행됨에 따라 추출된 키워드들 간의 연관성을 기초로 발화 주제의 범위를 좁히는 것을 포함할 수 있다. 다만 발화 주제의 도출 방식이 이에 한정되는 것은 아니며, 복수의 발화 주제들 중 사용자에 의해 선택된 적어도 하나의 발화 주제가 발화 주제로 도출될 수도 있다.
또한, 발화 주제를 도출하는 단계는 미리 설정된 주제 키워드의 범위 내에서 분석된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 것을 포함할 수 있다. 이 때, 도출된 발화 주제 범위 내에서 세부 발화 주제를 도출할 수 있음은 물론이다.
또한, 발화 주제를 도출하는 단계는 발화자의 정보에 기초해 발화 주제를 도출하는 것을 포함할 수 있으며, 실시 예에 따라 복수의 발화자가 존재하는 경우 발화자 들의 공통 정보에 기초해 발화 주제를 도출하는 것을 포함할 수 있다
또한, 발화 주제를 도출하는 단계는 발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출하는 것을 포함할 수도 있다
이하, 발화 주제의 도출 방법과 관련된 구체적인 예와 관련해 전술한 발화 내용 분석 장치(100)의 제어부(150)에서 설명한 것과 중복되는 설명은 생략하도록 한다(240).
발화 주제가 도출되면, 도출된 발화 주제를 기초로 발화내용을 분석하는 단계가 수행될 수 있으며, 실시 예에 따라 발화내용의 분석 결과는 발화 주제의 도출 과정에 제공될 수도 있다(250).
발화내용을 분석하는 단계는 도출된 발화 주제의 범위 내에서 키워드로 웹 검색을 수행하고 웹 검색 결과를 표시부(130)에 표시하는 것을 포함할 수 있다. 실시 예에 따라 웹 검색 결과를 표시부(130)에 표시하는 것은 발화내용을 분석하는 단계와 별도로 수행될 수도 있다. 표시부(130)는 제어부(150)의 제어에 따라 웹 검색 결과 화면을 표시할 수 있으며 이 때 웹 검색 결과 화면은 텍스트 형태 또는 이미지 형태로 표시되거나 양자가 결합된 형태로 표시될 수 있다.
이상으로 일 실시 예에 따른 발화내용의 분석 방법에 대해 설명하였다.
이하, 발화내용의 분석 모드에 따른 발화내용 분석 방법의 세부 실시 예에 대해 구체적으로 설명하도록 한다. 발화내용 분석 모드는 전술한 바와 같이 아이디어 발상 모드, 비서 모드, 인터뷰 모드 등을 포함할 수 있다. 발화내용 분석 모드가 이에 한정되는 것은 아니나 이하 설명의 편의상 전술한 모드들을 예로 들어 발화내용의 분석 과정에 대해 상세하게 설명하도록 한다.
도 3은 아이디어 발상 모드에서 발화내용 분석 방법의 일 예를 도시한 흐름도 이다. 도 3에 따른 아이디어 발상 모드에서는 회의 과정 등에서 논의된 아이디어에 대한 특허 검색 결과를 실시간으로 제공할 수 있다. 아울러, 특허 검색 결과가 아이디어 발상 모드에서 발화 내용의 주제 도출 과정에 제공될 수도 있다.
도 3에 도시된 바를 참조하면, 아이디어 발상 모드에서는 주제 키워드를 설정하는 단계가 선행되고(205), 이어서 음성 신호를 수집하는 단계와(210), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(220), 텍스트 정보의 키워드를 추출하는 단계와(230), 키워드를 기초로 발화자의 발화 주제를 도출하는 단계와(240), 발화 주제를 분석하는 단계와(250), 검색 결과 화면을 표시하는 단계(260)가 수행될 수 있다.
여기서 주제 키워드를 설정하는 단계는 미리 설정된 주제 키워드의 범위 내에서 주제 키워드를 설정하는 것을 포함할 수 있다. 미리 설정된 주제 키워드는 사용자에 의해 미리 설정된 "발화 주제의 분야 관련 키워드"일 수 있다. 예를 들어, 발화 주제의 분야 관련 키워드는, "전자", "통신" 또는 "자동차" 등과 같은 키워드를 포함할 수 있으나, 주제 키워드의 예가 이에 한정되는 것은 아니다(205).
주제 키워드가 설정되면 음성 신호를 수집하는 단계 등을 거쳐 발화 주제를 도출하는 단계가 수행될 수 있다. 여기서 발화 주제를 도출하는 단계는 텍스트 정보로부터 추출된 키워드들 중 미리 설정된 기준 값 이상으로 출현되는 키워드를 기초로 발화 주제를 도출하는 것을 포함할 수 있다(210 내지 240).
예를 들어, 주제 키워드가 "통신"으로 설정된 후 음성 신호를 수집하는 단계 등을 거쳐 "A 발명의 등록 가능성", "구성 A-1", "구성 A-2" 등이 키워드로 추출될 수 있다. 제어부(150)는 텍스트 정보로부터 도출된 키워드들 중 미리 설정된 기준 값 이상으로 출현하는 키워드를 기초로 "통신" 분야의 범위 내에서 발화 주제를 도출할 수 있다. 즉, "A 발명의 등록가능성", "구성 A-1" 및 "구성 A-2"와 같은 키워드가 미리 설정된 기준 값 이상으로 발화된 것으로 판단될 경우, 해당 키워드들을 기초로 "통신" 분야의 범위에서 "A 발명의 등록 가능성 모색"과 같은 발화 주제가 도출될 수 있다. 또한, 제어부(150)는 복수 개의 키워드들 중 빈도수가 높은 키워드에 가중치를 부여하여 발화 주제를 도출할 수도 있다.
이하, 발화 주제의 도출 과정과 관련해 전술한 바와 중복되는 설명은 생략하도록 한다.
발화 주제가 도출되면 발화 주제를 분석하는 단계가 수행될 수 있다(250). 발화 주제를 분석하는 단계는 텍스트 정보의 키워드들 중 주요 키워드 후보를 추출하고(252), 추출된 주요 키워드 후보들 중 선택된 키워드로 특허 검색을 수행하는 것을 포함할 수 있다(254, 258). 이 때, 키워드 선택 이력이 메모리(140)에 저장될 수 있으며, 키워드 선택 이력은 추후 발화자의 발화 주제를 도출하는 과정에 제공될 수 있다.
한편, 주요 키워드 후보들 중 어떠한 키워드도 선택되지 않은 경우 주요 키워드 후보들로 특허 검색이 수행될 수도 있다(254, 256).
예를 들어, "A 발명의 등록 가능성 모색"이 발화 주제로 선택된 경우, 발화 주제 선택 시 제공된 키워드들 중 일부가 주요 키워드 후보로 추출될 수 있다. 일반적으로 빈도 수가 높은 키워드들이 주요 키워드 후보로 추출될 수 있으나 주요 키워드 후보의 추출 방식이 이에 한정되는 것은 아니다.
예를 들어, 발화 주제 선택 시 제공된 키워드들 중 일부인 "A 발명의 등록 가능성", "구성 A-1" 및 "구성 A-2"와 같은 키워드가 주요 키워드 후보로 추출될 수 있다. 이 경우, 추출된 주요 키워드 후보들 중 "구성 A-1" 및 "구성 A-2"와 같은 키워드가 선택되면 선택된 키워드로 특허 검색이 수행될 수 있으며, 표시부(130)에는 검색 결과 화면이 제공될 수 있다.
한편, "A 발명의 등록가능성", "구성 A-1" 및 "구성 A-2"와 같은 주요 키워드 후보들 중 어떠한 키워드도 선택되지 않은 경우 "A 발명의 등록가능성", "구성 A-1" 및 "구성 A-2" 전체를 키워드로 하여 특허 검색이 수행될 수 있다.
전술한 예에 따른 아이디어 회의 모드에서는 아이디어 회의 과정에서 논의된 아이디어에 대해 실시간으로 특허 검색이 수행되도록 할 수 있으며, 이에 회의에서 논의된 아이디어에 대한 관련 기술들을 사용자가 손쉽게 파악하도록 할 수 있다.
도 4는 아이디어 발상 모드에서 발화내용 분석 방법의 다른 예를 도시한 흐름도 이다. 도 4에 따른 아이디어 발상 모드에서는 회의 과정에서 논의된 아이디어에 대한 검색 결과를 이미지 형태로 제공할 수 있다.
도 4에 도시된 바를 참조하면 다른 실시 예에 따른 아이디어 발상 모드는 음성 신호를 수집하는 단계와(210), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(220), 텍스트 정보의 키워드를 추출하는 단계와(230), 키워드를 기초로 발화자의 발화 주제를 도출하는 단계와(240), 발화 주제를 분석하는 단계와(250), 검색 결과 화면을 표시하는 단계(260)를 포함할 수 있다.
실시 예에 따라 도 4에 따른 아이디어 발상 모드에서는 도 3에 따른 아이디어 발상 모드에서와 같이 주제 키워드를 설정하는 단계가 포함될 수도 있으며, 이하 전술한 바와 중복되는 내용은 생략하도록 한다.
발화 주제를 분석하는 단계는 텍스트 정보의 키워드들 중 주요 키워드 후보를 추출하고(252), 추출된 키워드 후보들 중 적어도 하나의 키워드가 선택될 경우 선택된 키워드로 이미지를 검색하는 것을 포함할 수 있다(254, 258a). 이 때, 키워드 선택 이력이 메모리(140)에 저장될 수 있으며, 키워드 선택 이력은 추후 발화자의 발화 주제를 도출하는 과정에 제공될 수 있다.
한편, 주요 키워드 후보들 중 어떠한 키워드도 선택되지 않은 경우 주요 키워드 후보들로 이미지 검색이 수행될 수도 있다(254, 256a).
도 5는 도 4에 따른 아이디어 발상 모드에서 이미지 검색 결과 화면의 예를 도시한 도면이다.
도 5에 도시된 바를 참조하면 이미지 검색 결과 화면은 복수 개의 이미지들이 바둑판 모양으로 배치된 형태로 제공될 수 있으며, 이 때 표시되는 이미지들의 모양, 크기, 개수 등은 사용자에 의해 설정 가능할 수 있다. 아울러, 이미지들의 제공 방식이 도 5에 도시된 바에 의해 한정되는 것은 아니며 실시 예에 따라 다양한 형태로 제공될 수 있다.
도 6은 아이디어 발상 모드에서 발화내용 분석 방법의 또 다른 예를 도시한 흐름도 이고, 도 7은 도 6에 따른 아이디어 발상 모드에서 발화내용 분석 결과 화면의 일 예를 도시한 도면이다.
도 6에 따른 아이디어 발상 모드에서는 아이디어 회의 과정에서 논의된 아이디어와 관련된 세부 주제들을 도출하고 논의된 아이디어들을 세부 주제별로 정리하여 도 7에 도시된 바와 같은 트리 형태로 제공할 수 있다.
도 6에 도시된 바를 참조하면 또 다른 실시 예에 따른 아이디어 발상 모드는 주제 키워드를 설정하는 단계와(205), 주요 발화 주제를 도출하는 단계와(310), 세부 발화 주제를 도출 및 분석하는 단계(320)를 포함할 수 있다.
보다 상세하게, 주제 키워드를 설정하는 단계는 미리 설정된 주제 키워드의 범위 내에서 주제 키워드를 설정하는 것을 포함할 수 있다. 미리 설정된 주제 키워드는 사용자에 의해 미리 설정된 "특정 발화 주제 관련 키워드"일 수 있다. 예를 들어, "시간"과 같은 키워드가 주제 키워드로 설정될 수 있다(205).
주제 키워드가 설정되면 설정된 주제 키워드 범위 내에서 주요 발화 주제를 도출하는 단계가 수행될 수 있다(310).
주요 발화 주제를 도출하는 과정은 음성 신호를 수집하는 단계와(312), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(314), 텍스트 정보의 키워드를 추출하는 단계와(316), 키워드를 기초로 발화자의 발화 주제를 도출하는 단계(318)를 포함할 수 있다.
예를 들어 주제 키워드가 "시간"과 같이 설정되면 설정된 주제 키워드 범위 내에서 주요 발화 주제가 도출될 수 있다. 주제 키워드가 시간으로 설정되고, 전술한 일련의 과정을 거쳐 "효율", "감독", "모니터링" 등이 키워드로 추출된 경우, 추출된 키워드에 기초해 "시간 관리"와 같은 발화 주제가 도출될 수 있다.
주요 발화 주제가 도출되면 도출된 주요 발화 주제의 범위 내에서 세부 발화주제를 도출하고 이를 분석하는 과정이 수행될 수 있다(320).
세부 발화 주제를 도출 및 분석하는 과정은 음성 신호를 수집하고(322), 수집된 음성 신호를 텍스트 형태의 정보로 전환하고(324), 텍스트 정보의 키워드를 추출하고(326), 키워드를 기초로 발화자의 세부 발화 주제를 도출하고(328), 세부 발화 주제별 신규 트리를 생성하고(330), 신규 트리에 컨텐츠를 표시하는 것(332)을 포함할 수 있다.
예를 들어, 주요 발화 주제가 "시간 관리"로 도출된 경우, 수집된 발화자의 음성 신호를 기초로 전술한 일련의 과정을 거쳐 "시간 관리의 필요성", "시간을 효율적으로 관리하는 방법", "시간 관리의 사례" 등이 세부 발화 주제로 도출될 수 있다. 이 경우, 표시부(130)에는 세부 발화 주제별 신규 트리가 표시될 수 있으며, 신규 트리에는 발화내용의 주요 컨텐츠들이 발화자의 발화 순서에 따라 실시간으로 표시될 수 있다.
즉, 본 실시 예에 따른 아이디어 발상 모드에서는 아이디어 회의 과정에서 논의된 아이디어를 세부 주제별로 정리하여 표시함으로써 회의에서 논의된 아이디어들을 편하게 정리하도록 할 수 있다.
도 8은 비서 모드에서 발화내용 분석 방법의 일 예를 도시한 흐름도 이다. 도 8에 따른 비서 모드에서는 회의 과정 등에서 논의된 질문 사항에 대한 검색 결과를 실시간으로 제공할 수 있다.
도 8에 도시된 바를 참조하면, 일 실시 예에 따른 비서 모드는 음성 신호를 수집하는 단계와(410), 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계와(420), 텍스트 정보의 키워드를 추출하는 단계와(430), 키워드를 기초로 검색 필요 정보를 도출하는 단계와(440), 검색 필요 정보를 기초로 웹 검색을 수행하는 단계와(450), 웹 검색 결과 화면을 표시하는 단계(460)를 포함할 수 있다.
예를 들어, 회의 과정에서 발화자가 "**페이지 **단락에 기재된 A는 뭐지?"와 같은 내용을 발화한 경우 발화내용이 수집부(120)에 의해 수집될 수 있다. 이 경우, 수집된 음성 신호는 텍스트 형태의 정보로 전환될 수 있으며, 이후 텍스트 정보의 키워드를 추출하는 단계가 수행될 수 있다. 본 실시 예에서는 "A는 뭐지?"가 텍스트 정보의 키워드로 추출될 수 있다.
텍스트 정보의 키워드가 추출되면 키워드를 기초로 검색 필요 정보를 도출하는 단계가 수행될 수 있다. 검색 필요 정보를 도출하는 단계는 키워드를 기초로 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하는 것을 포함할 수 있다. 본 실시 예에서는 발화자의 발화 의도가 질문이며, 발화 목적은 정보의 검색이고, 검색 대상은 A인 것으로 검색 필요 정보가 도출될 수 있다.
검색 필요 정보가 도출되면 A에 대한 검색이 수행될 수 있으며, 웹 검색 결과 화면이 표시부(130)에 표시될 수 있다. 웹 검색 화면은 텍스트 형태, 이미지 형태 또는 양자가 조합된 형태로 제공될 수 있다.
이상으로, 발화내용 분석 장치 및 방법의 실시 예에 대해 상세하게 설명하였다. 발명의 실시 예가 전술한 예에 의해 한정되는 것은 아니며 당해 업계에서 통상의 지식을 가진 자가 쉽게 실시할 수 있는 범위 내에서 다양한 변경이 가능할 수 있다.
100: 발화내용 분석 장치
110: 입력부
120: 표시부
130: 수집부
140: 메모리
150; 제어부

Claims (29)

  1. 적어도 한 명의 발화자의 음성 신호를 수집하는 단계;
    상기 수집된 음성 신호를 텍스트 형태의 정보로 전환하는 단계;
    상기 텍스트 정보로부터 상기 텍스트 정보의 키워드를 추출하는 단계; 및
    상기 추출된 텍스트 정보의 키워드를 기초로 빈도수가 높은 키워드에 가중치를 부여하고, 상기 적어도 한명의 발화자의 정보와 추출된 키워드로부터 적어도 하나의 발화 주제를 도출하는 단계;를 포함하는 발화내용 분석 방법.
  2. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    미리 설정된 주제 키워드의 범위 내에서 상기 분석된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 것을 포함하는 발화내용 분석 방법.
  3. 제 2항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    상기 도출된 발화 주제 범위 내에서 세부 발화 주제를 도출하는 것을 포함하는 발화내용 분석 방법.
  4. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    상기 분석된 텍스트 정보의 키워드들 중 미리 설정된 기준 값 이상으로 출현된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 것을 포함하는 발화내용 분석 방법.
  5. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    상기 키워드를 기초로 도출된 적어도 하나의 발화 주제 중 사용자에 의해 선택된 적어도 하나의 발화 주제를 발화 주제로 도출하는 것을 포함하는 발화내용 분석 방법.
  6. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    상기 추출된 키워드들 간의 연관성을 기초로 발화 주제를 도출하는 것을 포함하는 발화내용 분석 방법.
  7. 삭제
  8. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    복수의 발화자가 존재하는 경우,
    상기 발화자 들의 공통 정보에 기초해 발화 주제를 도출하는 것을 포함하는 발화 내용 분석 방법.
  9. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출하는 것을 포함하는 발화내용 분석 방법.
  10. 제 1항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    상기 추출된 텍스트 정보의 키워드를 기초로 상기 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 상기 추출된 정보를 기초로 상기 발화 주제를 도출하는 것;을 포함하는 발화내용 분석 방법.
  11. 제 1항에 있어서,
    상기 도출된 발화 주제를 기초로 상기 발화내용을 분석하는 단계;를 더 포함하는 발화내용 분석 방법.
  12. 제 11항에 있어서,
    상기 발화내용을 분석하는 단계는,
    상기 도출된 발화 주제의 범위 내에서 상기 추출된 텍스트 정보의 키워드로 검색을 수행하고, 상기 검색 결과를 표시하는 것을 포함하는 발화내용 분석 방법.
  13. 제 11항에 있어서,
    상기 발화 주제를 도출하는 단계는,
    미리 설정된 주제 키워드의 범위 내에서 상기 분석된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하고, 상기 도출된 발화 주제의 범위 내에서 세부 발화 주제를 도출하는 것을 포함하고,
    상기 발화내용을 분석하는 단계는,
    상기 세부 발화 주제별 상기 발화내용의 분석 결과를 표시하는 것을 포함하는 발화내용 분석 방법.
  14. 삭제
  15. 적어도 한 명의 발화자의 음성 신호를 수집하는 수집부;
    상기 음성 신호를 텍스트 형태의 정보로 변환하고, 상기 텍스트 정보로부터 추출된 키워드를 기초로 빈도수가 높은 키워드에 가중치를 부여하고, 상기 적어도 한 명의 발화자의 정보와 상기 추출된 키워드로부터 적어도 하나의 발화 주제를 도출하는 제어부; 및
    상기 도출된 발화 주제를 표시하는 표시부;를 포함하는 발화내용 분석 장치.
  16. 제 15항에 있어서,
    상기 제어부는,
    미리 설정된 주제 키워드의 범위 내에서 상기 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 발화내용 분석 장치.
  17. 제 16항에 있어서,
    상기 제어부는,
    상기 도출된 발화 주제의 범위 내에서 세부 발화 주제를 도출하는 발화내용 분석 장치.
  18. 제 17항에 있어서,
    상기 제어부는,
    상기 세부 발화 주제를 기초로 상기 발화자의 발화내용을 분석하고,
    상기 표시부는,
    상기 세부 발화 주제별 상기 발화내용의 분석 결과를 표시하는 발화내용 분석 장치.
  19. 제 15항에 있어서,
    상기 제어부는,
    상기 텍스트 정보의 키워드들 중 미리 설정된 기준 값 이상으로 출력된 텍스트 정보의 키워드를 기초로 발화 주제를 도출하는 발화내용 분석 장치.
  20. 제 15항에 있어서,
    상기 제어부는,
    상기 키워드를 기초로 도출된 적어도 하나의 발화 주제 중 사용자에 의해 선택된 적어도 하나의 발화 주제를 발화 주제로 도출하는 발화내용 분석 장치.
  21. 제 15항에 있어서,
    상기 제어부는,
    상기 추출된 키워드들 간의 연관성을 기초로 발화 주제를 도출하는 발화 내용 분석 장치.
  22. 삭제
  23. 제 15항에 있어서,
    상기 제어부는,
    복수의 발화자가 존재하는 경우,
    상기 발화자 들의 공통 정보에 기초해 발화 주제를 도출하는 발화 내용 분석 장치.
  24. 제 15항에 있어서,
    상기 제어부는,
    발화 주제의 선택 이력을 기초로 미리 설정된 기준 값 이상으로 선택된 발화 주제를 발화자의 발화 주제로 도출하는 발화내용 분석 장치.
  25. 제 15항에 있어서,
    상기 제어부는,
    상기 키워드를 기초로 상기 발화자의 발화 의도, 발화 목적 및 발화 대상 중 적어도 하나의 정보를 추출하고, 상기 추출된 정보를 기초로 발화 주제를 도출하는 발화내용 분석 장치.
  26. 제 15항에 있어서,
    상기 제어부는,
    상기 도출된 발화내용의 주제를 기초로 상기 발화내용을 분석하는 발화내용 분석 장치.
  27. 제 15항에 있어서,
    상기 제어부는,
    상기 도출된 주제 범위 내에서 상기 텍스트 정보의 키워드로 검색을 수행하고,
    상기 표시부는,
    상기 검색 결과를 표시하는 발화내용 분석 장치.
  28. 제 15항에 있어서,
    상기 제어부는,
    상기 발화내용의 분석 결과를 기초로 상기 발화 주제를 도출하는 발화내용 분석 장치.
  29. 제 19항에 있어서,
    상기 표시부는,
    상기 발화자가 상기 표시부의 표시 내용을 확인 가능하도록 배치된 것을 포함하는 발화내용 분석 장치.
KR1020160128635A 2016-10-05 2016-10-05 발화내용 분석 장치 및 방법 KR101934280B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160128635A KR101934280B1 (ko) 2016-10-05 2016-10-05 발화내용 분석 장치 및 방법
US15/377,847 US10347243B2 (en) 2016-10-05 2016-12-13 Apparatus and method for analyzing utterance meaning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160128635A KR101934280B1 (ko) 2016-10-05 2016-10-05 발화내용 분석 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20180037868A KR20180037868A (ko) 2018-04-13
KR101934280B1 true KR101934280B1 (ko) 2019-01-03

Family

ID=61757156

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160128635A KR101934280B1 (ko) 2016-10-05 2016-10-05 발화내용 분석 장치 및 방법

Country Status (2)

Country Link
US (1) US10347243B2 (ko)
KR (1) KR101934280B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10681458B2 (en) * 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
JP7142315B2 (ja) * 2018-09-27 2022-09-27 パナソニックIpマネジメント株式会社 説明支援装置および説明支援方法
KR20210036169A (ko) * 2019-09-25 2021-04-02 현대자동차주식회사 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법
KR20210098250A (ko) * 2020-01-31 2021-08-10 삼성전자주식회사 전자 장치 및 이의 제어 방법
KR102287431B1 (ko) * 2020-10-07 2021-08-09 주식회사 셀바스에이아이 회의 녹음 장치 및 회의 녹음 기록 시스템
KR102620070B1 (ko) * 2022-10-13 2024-01-02 주식회사 타이렐 상황 인지에 따른 자율발화 시스템

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625748A (en) * 1994-04-18 1997-04-29 Bbn Corporation Topic discriminator using posterior probability or confidence scores
US6411683B1 (en) * 2000-02-09 2002-06-25 At&T Corp. Automated telephone call designation system
DE60032776T2 (de) * 2000-11-16 2007-11-08 Sony Deutschland Gmbh Verfahren zur Spracherkennung
US20030066067A1 (en) 2001-09-28 2003-04-03 Koninklijke Philips Electronics N.V. Individual recommender profile modification using profiles of others
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US20050010411A1 (en) * 2003-07-09 2005-01-13 Luca Rigazio Speech data mining for call center management
US20050165607A1 (en) * 2004-01-22 2005-07-28 At&T Corp. System and method to disambiguate and clarify user intention in a spoken dialog system
US7672845B2 (en) * 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
DE102004037858A1 (de) * 2004-08-04 2006-03-16 Harman Becker Automotive Systems Gmbh Navigationssystem mit sprachgesteuerter Angabe von Sonderzielen
KR100695127B1 (ko) * 2004-10-08 2007-03-14 삼성전자주식회사 다 단계 음성 인식 장치 및 방법
US20070078708A1 (en) * 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
US7606856B2 (en) * 2005-11-09 2009-10-20 Scenera Technologies, Llc Methods, systems, and computer program products for presenting topical information referenced during a communication
JP2007219190A (ja) * 2006-02-17 2007-08-30 Murata Mach Ltd 音声認識装置と認識方法及びそのプログラム
JP4188989B2 (ja) * 2006-09-15 2008-12-03 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識プログラム
KR20080052279A (ko) 2006-12-05 2008-06-11 한국전자통신연구원 실생활 정보제공 대화형 tv 에이전트 서비스 방법 및장치
US8713078B2 (en) * 2009-08-13 2014-04-29 Samsung Electronics Co., Ltd. Method for building taxonomy of topics and categorizing videos
EP2299440B1 (en) * 2009-09-11 2012-10-31 Vodafone Holding GmbH Method and Device for automatic recognition of given keywords and/or terms within voice data
KR101622111B1 (ko) * 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
US8214344B2 (en) 2010-03-16 2012-07-03 Empire Technology Development Llc Search engine inference based virtual assistance
US20130018895A1 (en) * 2011-07-12 2013-01-17 Harless William G Systems and methods for extracting meaning from speech-to-text data
US9324323B1 (en) * 2012-01-13 2016-04-26 Google Inc. Speech recognition using topic-specific language models
CN104143328B (zh) * 2013-08-15 2015-11-25 腾讯科技(深圳)有限公司 一种关键词检测方法和装置
KR101562279B1 (ko) 2013-09-16 2015-10-30 고려대학교 산학협력단 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법
KR101560456B1 (ko) 2013-11-01 2015-10-15 황성봉 어휘 분석을 이용한 트렌드정보 추출 및 예측 방법
WO2015075975A1 (ja) * 2013-11-25 2015-05-28 三菱電機株式会社 対話制御装置及び対話制御方法
KR20150081981A (ko) 2014-01-07 2015-07-15 삼성전자주식회사 회의 내용 구조화 장치 및 방법
JP6413256B2 (ja) 2014-02-20 2018-10-31 株式会社リコー 会議支援装置、会議支援装置の制御方法、及びプログラム
US9645703B2 (en) * 2014-05-14 2017-05-09 International Business Machines Corporation Detection of communication topic change
KR102301880B1 (ko) * 2014-10-14 2021-09-14 삼성전자 주식회사 전자 장치 및 이의 음성 대화 방법
US10108702B2 (en) * 2015-08-24 2018-10-23 International Business Machines Corporation Topic shift detector
KR20170032114A (ko) * 2015-09-14 2017-03-22 삼성전자주식회사 음성 인식 장치 및 그의 제어방법

Also Published As

Publication number Publication date
US20180096680A1 (en) 2018-04-05
US10347243B2 (en) 2019-07-09
KR20180037868A (ko) 2018-04-13

Similar Documents

Publication Publication Date Title
KR101934280B1 (ko) 발화내용 분석 장치 및 방법
de Barcelos Silva et al. Intelligent personal assistants: A systematic literature review
Tulshan et al. Survey on virtual assistant: Google assistant, siri, cortana, alexa
CN108399923B (zh) 多人发言中发言人识别方法以及装置
KR20180025121A (ko) 메시지 입력 방법 및 장치
CN107211061A (zh) 用于空间会议回放的优化虚拟场景布局
CN107210045A (zh) 会议搜索以及搜索结果的回放
JP2017016566A (ja) 情報処理装置、情報処理方法及びプログラム
CN107211027A (zh) 感知质量比会议中原始听到的更高的后会议回放系统
CN107211062A (zh) 虚拟声学空间中的音频回放调度
CN107210036A (zh) 会议词语云
CN108733343A (zh) 生成语音控制指令的方法、装置及存储介质
JP2015153108A (ja) 音声会話支援装置、及び音声会話支援方法及びプログラム
Tsai et al. A study of multimodal addressee detection in human-human-computer interaction
KR20130082835A (ko) 대화 연관 컨텐츠 제공 방법 및 장치
CN108109618A (zh) 语音交互方法、系统以及终端设备
JP2017016296A (ja) 画像表示装置
Rajan et al. Conflictnet: End-to-end learning for speech-based conflict intensity estimation
CN109002184A (zh) 一种输入法候选词的联想方法和装置
KR102342571B1 (ko) 다중 음성인식모듈을 적용한 음성 인식 방법 및 이를 위한 음성인식장치
Liu et al. Learning salient features for speech emotion recognition using CNN
JPWO2020017151A1 (ja) 情報処理装置、情報処理方法及びプログラム
Watada Speech recognition in a multi-speaker environment by using hidden markov model and mel-frequency approach
Minker et al. Next-generation human-computer interfaces-towards intelligent, adaptive and proactive spoken language dialogue systmes
CN112214114A (zh) 一种输入方法、装置和电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant