KR20150066882A - 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 - Google Patents
다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 Download PDFInfo
- Publication number
- KR20150066882A KR20150066882A KR1020130152483A KR20130152483A KR20150066882A KR 20150066882 A KR20150066882 A KR 20150066882A KR 1020130152483 A KR1020130152483 A KR 1020130152483A KR 20130152483 A KR20130152483 A KR 20130152483A KR 20150066882 A KR20150066882 A KR 20150066882A
- Authority
- KR
- South Korea
- Prior art keywords
- speaker
- user
- voice
- conversation
- processing apparatus
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000004044 response Effects 0.000 claims abstract description 56
- 238000003672 processing method Methods 0.000 claims abstract description 14
- 230000010365 information processing Effects 0.000 claims description 52
- 230000033001 locomotion Effects 0.000 claims description 17
- 210000001747 pupil Anatomy 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 8
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010304 firing Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 다중 사용자 중에서 발화자를 인식하는 것을 설명하는 예시도이다.
도 3은 본 발명의 실시예에 따른 대화 이력 모델을 구축하는 것을 설명하는 흐름도이다.
도 4는 본 발명의 실시예에 따른 그래픽 아이콘을 통해 발화자에게 응답을 제공하는 것을 설명하는 예시도이다.
도 5는 본 발명의 실시예에 따른 다중 사용자 기반의 대화 처리 장치를 나타내는 블록도이다.
12: 디스플레이 장치 13: 스피커
14: 그래픽 아이콘 100: 대화 처리 장치
110: 발화자 인식부 111: 참여자 판별 모듈
113: 발화자 식별 모듈 120: 발화의도 추출부
130: 응답 생성부 140: 대화 이력 모델
150: 응답 제공부
Claims (14)
- 디지털 신호 처리가 가능한 정보 처리 장치에서 수행되는 다중 사용자 기반의 대화 처리 방법에 있어서,
적어도 하나의 센서로부터 수집한 다중 사용자의 영상 또는 음성을 기반으로 상기 다중 사용자 중에서 발화자를 인식하는 단계;
상기 적어도 하나의 센서를 이용하여 상기 발화자의 음성을 녹음하고, 상기 녹음된 발화자의 음성을 분석하여 상기 발화자의 발화 의도를 추출하는 단계; 및
미리 구축된 대화 이력 모델을 기반으로 상기 발화자의 발화 의도에 상응하는 응답을 생성하는 단계를 포함하는 다중 사용자 기반의 대화 처리 방법. - 청구항 1에 있어서,
그래픽 아이콘을 통해 상기 발화자를 향한 시선 및 모션 중 적어도 하나를 디스플레이함과 동시에 상기 발화자에게 상기 발화 의도에 상응하는 응답을 제공하는 단계를 더 포함하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 청구항 1에 있어서,
상기 다중 사용자 중에서 발화자를 인식하는 단계는,
상기 다중 사용자의 영상을 분석하여 입 모양이 변화하거나 일정 시간 동안 동공이 상기 정보 처리 장치의 디스플레이 장치를 응시하거나 상기 정보 처리 장치를 향해 모션을 취하는 적어도 하나의 사용자를 대화 참여자로 판별하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 청구항 3에 있어서,
상기 다중 사용자 중에서 발화자를 인식하는 단계는,
상기 대화 참여자 중에서 상기 적어도 하나의 센서를 통해 음성이 수집된 사용자를 발화자로 인식하고 상기 다중 사용자의 영상 또는 음성으로부터 상기 발화자의 얼굴 또는 음성의 특징을 추출하여 상기 발화자를 식별하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 청구항 1에 있어서,
상기 발화자의 발화 의도를 추출하는 단계는,
상기 녹음된 발화자의 음성을 텍스트로 변환하고, 상기 텍스트로부터 상기 발화자의 발화 의도를 추출하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 청구항 1에 있어서,
상기 대화 이력 모델은,
상기 다중 사용자의 사용자 별로 발화가 진행되는 상황에서의 영상 및 음성을 수집하여 저장된 사용자 별 대화 이력과 대화 말뭉치(corpus)를 확률 기반 모델 또는 기계 학습 기반으로 훈련함으로써 구축되는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 청구항 6에 있어서,
상기 발화자의 발화 의도에 상응하는 응답을 생성하는 단계는,
상기 미리 구축된 대화 이력 모델에서 상기 발화자에 상응하는 상기 사용자 별 대화 이력을 추출하고 상기 추출된 사용자 별 대화 이력을 기반으로 상기 발화자의 발화 의도에 상응하는 응답을 생성하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 방법. - 디지털 신호 처리가 가능한 정보 처리 장치에 구현되는 다중 사용자 기반의 대화 처리 장치에 있어서,
적어도 하나의 센서로부터 수집한 다중 사용자의 영상 또는 음성을 기반으로 상기 다중 사용자 중에서 발화자를 인식하는 발화자 인식부;
상기 적어도 하나의 센서를 이용하여 상기 발화자의 음성을 녹음하고, 상기 녹음된 발화자의 음성을 분석하여 상기 발화자의 발화 의도를 추출하는 발화의도 추출부; 및
미리 구축된 대화 이력 모델을 기반으로 상기 발화자의 발화 의도에 상응하는 응답을 생성하는 응답 생성부를 포함하는 다중 사용자 기반의 대화 처리 장치. - 청구항 8에 있어서,
그래픽 아이콘을 통해 상기 발화자를 향한 시선 및 모션 중 적어도 하나를 디스플레이함과 동시에 상기 발화자에게 상기 발화 의도에 상응하는 응답을 제공하는 응답 제공부를 더 포함하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치. - 청구항 8에 있어서,
상기 발화자 인식부는,
상기 다중 사용자의 영상을 분석하여 입 모양이 변화하거나 일정 시간 동안 동공이 상기 정보 처리 장치의 디스플레이 장치를 응시하거나 상기 정보 처리 장치를 향해 모션을 취하는 적어도 하나의 사용자를 대화 참여자로 판별하는 참여자 판별 모듈을 포함하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치. - 청구항 10에 있어서,
상기 발화자 인식부는,
상기 대화 참여자 중에서 상기 적어도 하나의 센서를 통해 음성이 수집된 사용자를 발화자로 인식하고 상기 다중 사용자의 영상 또는 음성으로부터 상기 발화자의 얼굴 또는 음성의 특징을 추출하여 상기 발화자를 식별하는 발화자 식별 모듈을 포함하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치. - 청구항 8에 있어서,
상기 발화의도 추출부는,
상기 녹음된 발화자의 음성을 텍스트로 변환하고, 상기 텍스트로부터 상기 발화자의 발화 의도를 추출하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치. - 청구항 8에 있어서,
상기 대화 이력 모델은,
상기 다중 사용자의 사용자 별로 발화가 진행되는 상황에서의 영상 및 음성을 수집하여 저장된 사용자 별 대화 이력과 대화 말뭉치(corpus)를 확률 기반 모델 또는 기계 학습 기반으로 훈련함으로써 구축되는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치. - 청구항 8에 있어서,
상기 응답 생성부는,
상기 미리 구축된 대화 이력 모델에서 상기 발화자에 상응하는 상기 사용자 별 대화 이력을 추출하고 상기 추출된 사용자 별 대화 이력을 기반으로 상기 발화자의 발화 의도에 상응하는 응답을 생성하는 것을 특징으로 하는 다중 사용자 기반의 대화 처리 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130152483A KR101567154B1 (ko) | 2013-12-09 | 2013-12-09 | 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130152483A KR101567154B1 (ko) | 2013-12-09 | 2013-12-09 | 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150066882A true KR20150066882A (ko) | 2015-06-17 |
KR101567154B1 KR101567154B1 (ko) | 2015-11-09 |
Family
ID=53515091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130152483A KR101567154B1 (ko) | 2013-12-09 | 2013-12-09 | 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101567154B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019088384A1 (ko) * | 2017-11-03 | 2019-05-09 | 주식회사 머니브레인 | 답변을 변형하여 풍부한 표현의 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
CN111903194A (zh) * | 2018-04-02 | 2020-11-06 | 昕诺飞控股有限公司 | 使用连接的照明系统来增强语音命令的系统和方法 |
CN114093351A (zh) * | 2020-08-07 | 2022-02-25 | 青岛海尔洗衣机有限公司 | 语音播报方法、装置、电子设备及存储介质 |
WO2023231936A1 (zh) * | 2022-06-01 | 2023-12-07 | 华为技术有限公司 | 一种语音交互方法及终端 |
CN118968990A (zh) * | 2024-10-15 | 2024-11-15 | 新兴际华科技(天津)有限公司 | 一种多人唇语交互方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018174397A1 (ko) | 2017-03-20 | 2018-09-27 | 삼성전자 주식회사 | 전자 장치 및 제어 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040174431A1 (en) * | 2001-05-14 | 2004-09-09 | Stienstra Marcelle Andrea | Device for interacting with real-time streams of content |
-
2013
- 2013-12-09 KR KR1020130152483A patent/KR101567154B1/ko not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019088384A1 (ko) * | 2017-11-03 | 2019-05-09 | 주식회사 머니브레인 | 답변을 변형하여 풍부한 표현의 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
CN111903194A (zh) * | 2018-04-02 | 2020-11-06 | 昕诺飞控股有限公司 | 使用连接的照明系统来增强语音命令的系统和方法 |
CN111903194B (zh) * | 2018-04-02 | 2024-04-09 | 昕诺飞控股有限公司 | 使用连接的照明系统来增强语音命令的系统和方法 |
CN114093351A (zh) * | 2020-08-07 | 2022-02-25 | 青岛海尔洗衣机有限公司 | 语音播报方法、装置、电子设备及存储介质 |
WO2023231936A1 (zh) * | 2022-06-01 | 2023-12-07 | 华为技术有限公司 | 一种语音交互方法及终端 |
CN118968990A (zh) * | 2024-10-15 | 2024-11-15 | 新兴际华科技(天津)有限公司 | 一种多人唇语交互方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
KR101567154B1 (ko) | 2015-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12118999B2 (en) | Reducing the need for manual start/end-pointing and trigger phrases | |
KR101567154B1 (ko) | 다중 사용자 기반의 대화 처리 방법 및 이를 수행하는 장치 | |
US8793621B2 (en) | Method and device to control touchless recognition | |
US20160042228A1 (en) | Systems and methods for recognition and translation of gestures | |
CN107491469A (zh) | 智能任务发现 | |
CN108292203A (zh) | 基于设备间对话通信的主动协助 | |
CN107491181A (zh) | 语言输入的动态短语扩展 | |
CN108763552B (zh) | 一种基于家教机的学习方法及家教机 | |
CN110534109B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN107430501A (zh) | 对语音触发进行响应的竞争设备 | |
KR20210008089A (ko) | 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트 특정 핫워드 | |
CN104090652A (zh) | 一种语音输入方法和装置 | |
CN107735833A (zh) | 自动口音检测 | |
CN111126009A (zh) | 表单填写方法、装置、终端设备及存储介质 | |
CN106528859A (zh) | 一种数据推送系统及方法 | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
KR102222911B1 (ko) | 로봇 상호작용 시스템 및 그를 위한 프로그램 | |
CN108877334A (zh) | 一种语音搜题方法及电子设备 | |
CN108877357A (zh) | 一种基于家教机的交互方法及家教机 | |
WO2019093123A1 (ja) | 情報処理装置および電子機器 | |
KR101337420B1 (ko) | 감성대화단말기 | |
JP2017211430A (ja) | 情報処理装置および情報処理方法 | |
US11430429B2 (en) | Information processing apparatus and information processing method | |
WO2021161841A1 (ja) | 情報処理装置及び情報処理方法 | |
WO2023036810A1 (en) | Method for detecting user input to a breath input configured user interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20131209 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20141219 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
PG1501 | Laying open of application | ||
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20150628 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20141219 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
AMND | Amendment | ||
PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20150628 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20150115 Comment text: Amendment to Specification, etc. |
|
PX0701 | Decision of registration after re-examination |
Patent event date: 20150818 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20150716 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20150628 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20150115 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20151102 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20151102 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20190813 |