KR100560750B1 - 홈네트워크의 음성 인식 시스템 - Google Patents
홈네트워크의 음성 인식 시스템 Download PDFInfo
- Publication number
- KR100560750B1 KR100560750B1 KR1020030087773A KR20030087773A KR100560750B1 KR 100560750 B1 KR100560750 B1 KR 100560750B1 KR 1020030087773 A KR1020030087773 A KR 1020030087773A KR 20030087773 A KR20030087773 A KR 20030087773A KR 100560750 B1 KR100560750 B1 KR 100560750B1
- Authority
- KR
- South Korea
- Prior art keywords
- sound
- multimedia
- voice
- audio
- output
- Prior art date
Links
- 238000004891 communication Methods 0.000 claims abstract description 42
- 238000005070 sampling Methods 0.000 claims description 60
- 230000005236 sound signal Effects 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 33
- 238000007781 pre-processing Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/31—Voice input
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (11)
- 자신이 재생하여 스피커를 통해 출력하는 멀티미디어 음향에 관한 음향 출력정보를 생성하는 멀티미디어 기기와,댁내에서 상기 멀티미디어 음향과 사람의 음성 명령을 포함한 소리 정보를 수신하여 무선 네트워크를 통해 전송하는 이동형 홈에이전트와,상기 멀티 미디어 기기로부터 상기 생성된 음향 출력 정보를 네트워크를 통해 수신하고, 상기 무선 네트워크를 통해 상기 이동형 홈에이전트로부터 음향 정보를 수신하여 그 음향 정보중에서 상기 음향 출력 정보에 상응하는 멀티 미디어 음향을 제거하고, 사람의 음성 신호를 추출하여 음성 인식을 수행하는 음성 인식 서버를 포함하는 홈네트워크의 음성 인식 시스템.
- 제 1항에 있어서, 상기 음향 출력 정보는,멀티미디어 기기를 통해 출력되는 음향 데이터, 그 음향 데이터의 출력 세기를 포함하는 홈네트워크의 음성 인식 시스템.
- 제 1항에 있어서,상기 네트워크는 유무선 인터페이스를 포함하는 홈네트워크의 음성 인식 시 스템.
- 제 1항에 있어서, 상기 음성 인식 서버는,상기 이동형 홈에이전트로부터 이동형 홈에이전트에 입력된 음향 신호에서 패턴 잡음이 제거된 신호와, 상기 멀티미디어 음향에 대한 감쇄계수를 무선을 통해 수신하고, 상기 멀티미디어 기기로부터 멀티미디어 음향 데이터와 음향 출력의 세기를 유무선을 통해 수신하는 통신 연결부와,상기 패턴 잡음이 제거된 신호로부터 멀티 미디어 음향 데이터, 음향 출력 세기, 감쇄계수를 곱한 신호를 제거하여 사람의 음성 명령만을 추출하는 음성 추출부와,상기 음성 추출부에 의해 추출된 음성에 대하여 음성 인식을 수행하는 음성 인식부와,상기 음성 인식한 결과에 대한 응답을 분류하여 홈네트워크내에서 사용자가 내린 음성 명령에 따라 해당 홈네트워크 장치의 동작에 필요한 메시지를 생성하는 결과 처리부를 포함하는 홈네트워크의 음성 인식 시스템.
- 제 1항에 있어서, 상기 이동형 홈에이전트는,음성 명령을 입력받거나 상기 멀티미디어 음향을 포함하여 가정환경에서 입력되는 잡음들을 입력받는 음성 입력부와,상기 음성 입력부를 통해 입력된 음성 명령 및 잡음들을 전처리 필터링하는 음향 전처리부와,상기 멀티미디어 음향이 출력되는 스피커와 이동형 홈에이전트와의 거리를 계산하여 상기 멀티미디어 음향의 감쇄계수를 추정하는 감쇄 계수 추정부와,상기 음향 전처리부에 의해 전처리된 음향 신호와 감쇄 계수 추정부에 의한 감쇄 계수를 상기 음성 인식 서버에 무선으로 전송하는 홈에이전트 모듈을 포함하는 포함하는 홈네트워크의 음성 인식 시스템.
- 제 5항에 있어서, 상기 음향 전처리부는,상기 음성 입력부를 통해 입력된 음성 명령 및 잡음들을 사람의 음성에 맞추어 다운 샘플링을 수행하고 일정한 잡음 패턴을 가지고 반복되는 잡음들을 제거하기 위한 필터링을 수행하는 홈네트워크의 음성 인식 시스템.
- 제 1항에 있어서, 상기 멀티미디어 기기는,자신이 재생할 멀티미디어 데이터를 재생하여 스피커로 출력하는 멀티미디어 재생모듈과,상기 멀티미디어 재생모듈을 통해 출력되는 멀티미디어 신호중에서 음향 신 호를 사람의 음성에 맞추어 다운 샘플링하여 상기 음성 인식 서버에서의 음성 인식을 위한 전처리를 수행하는 음향 전처리부와,상기 전처리된 음향 신호와 상기 멀티미디어 모듈에서 스피커로 출력하는 음향 출력 세기 정보를 상기 음성 인식 서버로 유무선 네트워크를 통해 전송하는 통신 연결부를 포함하는 홈네트워크의 음성 인식 시스템.
- 제 7항에 있어서, 상기 통신 연결부는,시간 정보를 상기 음성 인식 서버에 전송하는 홈네트워크의 음성 인식 시스템.
- 자신에게 연결된 멀티미디어 기기에 해당 멀티미디어 데이터를 제공하고, 각 멀티미디어 기기를 통해 출력될 멀티미디어 음향에 관한 음향 출력 정보를 생성하는 멀티미디어 분산 서버와,상기 멀티 미디어 분산 서버로부터 멀티 미디어 데이터를 수신하여 재생하고, 자신이 재생하여 출력하는 음향의 출력 세기 정보를 상기 멀티미디어 분산 서버에 전송하는 멀티미디어 기기와,댁내에서 수신되는 상기 멀티미디어 음향과 사람의 음성을 포함한 음향 정보를 무선 네트워크를 통해 전송하는 이동형 홈에이전트와,상기 멀티 미디어 분산 서버로부터 음향 출력 정보를 네트워크를 통해 수신하고, 상기 무선 네트워크를 통해 상기 이동형 홈에이전트로부터 음향 정보를 수신하여 그 음향 정보중에서 상기 음향 출력 정보에 상응하는 멀티 미디어 음향을 제거하고, 사람의 음성 신호를 추출하여 음성 인식을 수행하는 음성 인식 서버를 포함하는 홈네트워크의 음성 인식 시스템.
- 제 9항에 있어서, 상기 멀티미디어 분산 서버는,상기 음성 인식 서버에 전송할 음향 데이터를 사람의 음성에 맞추어 다운 샘플링하여 상기 음성 인식 서버에서의 음성 인식을 위한 전처리를 수행하는 홈네트워크의 음성 인식 시스템.
- 제 9항에 있어서, 상기 멀티미디어 기기는,상기 멀티미디어 분산 서버와 독립적으로 자신이 재생하여 출력하는 음향 데이터를 사람의 음성에 맞추어 다운 샘플링하여 상기 음성 인식 서버에서의 음성 인식을 위한 전처리를 수행하고 그 전처리된 음향 신호를 상기 멀티미디어 분산 서버에 전송하는 홈네트워크의 음성 인식 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030087773A KR100560750B1 (ko) | 2003-12-04 | 2003-12-04 | 홈네트워크의 음성 인식 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030087773A KR100560750B1 (ko) | 2003-12-04 | 2003-12-04 | 홈네트워크의 음성 인식 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050054399A KR20050054399A (ko) | 2005-06-10 |
KR100560750B1 true KR100560750B1 (ko) | 2006-03-13 |
Family
ID=37249737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030087773A KR100560750B1 (ko) | 2003-12-04 | 2003-12-04 | 홈네트워크의 음성 인식 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100560750B1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4431836B2 (ja) * | 2007-07-26 | 2010-03-17 | 株式会社カシオ日立モバイルコミュニケーションズ | 音声取得装置、雑音除去システム、及び、プログラム |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
KR101667557B1 (ko) | 2015-01-19 | 2016-10-19 | 한국과학기술연구원 | 실시간 음원 분류 장치 및 방법 |
KR101982260B1 (ko) * | 2017-01-12 | 2019-05-24 | 주식회사 하이 | 홈 소셜 로봇 |
CN111208736B (zh) * | 2019-12-17 | 2023-10-27 | 中移(杭州)信息技术有限公司 | 智能音箱控制方法、装置、电子设备及存储介质 |
KR102403803B1 (ko) * | 2020-07-29 | 2022-05-30 | 삼성전자 주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
-
2003
- 2003-12-04 KR KR1020030087773A patent/KR100560750B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20050054399A (ko) | 2005-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101313483B (zh) | 回音消除的配置 | |
US11929088B2 (en) | Input/output mode control for audio processing | |
KR100966415B1 (ko) | 오디오 네트워크 분산 시스템 | |
US20060182291A1 (en) | Acoustic processing system, acoustic processing device, acoustic processing method, acoustic processing program, and storage medium | |
US7929710B2 (en) | Communication system for remote sound monitoring with ambiguous signal processing | |
CN103124165B (zh) | 自动增益控制 | |
CN105551517B (zh) | 一种具有应用场景识别控制的无线传输录音笔及录音系统 | |
CN102160359B (zh) | 控制系统的方法和信号处理系统 | |
KR20080077085A (ko) | 오디오 장치 품질의 판단 | |
JP2006246438A (ja) | ネットワーク基盤のロボットシステムで動作含みのマルチメディアコンテンツを再生するための処理方法 | |
WO2010030889A1 (en) | Method and system for sound monitoring over a network | |
JP2001117587A (ja) | マイクロホンアレイを有するボイス制御システム | |
JP2003510645A (ja) | 音声認識装置及び消費者電子システム | |
WO2017039575A1 (en) | Remote sensor voice recognition | |
KR100560750B1 (ko) | 홈네트워크의 음성 인식 시스템 | |
CN108540680B (zh) | 讲话状态的切换方法及装置、通话系统 | |
US20100249961A1 (en) | Environmental sound reproducing device | |
KR102113572B1 (ko) | 소리 제거 시스템 및 이를 이용한 소리 제거 방법 | |
KR20200054923A (ko) | 소리 제거 시스템 및 이를 이용한 소리 제거 방법 | |
AU2011211407B2 (en) | Audio video distribution system using multiple network speaker nodes in a multi speaker session | |
WO2022137806A1 (ja) | 耳装着型デバイス、及び、再生方法 | |
US20240029755A1 (en) | Intelligent speech or dialogue enhancement | |
JP7349410B2 (ja) | 音響信号を所定の到来方向から再生するシステム及び方法 | |
KR100565428B1 (ko) | 인간 청각 모델을 이용한 부가잡음 제거장치 | |
WO2023119764A1 (ja) | 耳装着型デバイス、及び、再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130227 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140227 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150226 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160226 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170224 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180227 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190227 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20200227 Year of fee payment: 15 |