KR20190109341A - 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 - Google Patents
노이즈 관리가 가능한 전자기기 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR20190109341A KR20190109341A KR1020190111007A KR20190111007A KR20190109341A KR 20190109341 A KR20190109341 A KR 20190109341A KR 1020190111007 A KR1020190111007 A KR 1020190111007A KR 20190111007 A KR20190111007 A KR 20190111007A KR 20190109341 A KR20190109341 A KR 20190109341A
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- electronic device
- driving
- electronic devices
- voice command
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012549 training Methods 0.000 claims description 45
- 238000010801 machine learning Methods 0.000 claims description 26
- 230000005534 acoustic noise Effects 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 abstract description 10
- 238000013528 artificial neural network Methods 0.000 description 48
- 239000010410 layer Substances 0.000 description 42
- 238000013473 artificial intelligence Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 20
- 210000002569 neuron Anatomy 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000002372 labelling Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 210000000225 synapse Anatomy 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Selective Calling Equipment (AREA)
Abstract
본 발명은 5G 통신 네트워크를 통한 사물 인터넷 환경에서도 동작할 수 있는 발명은 노이즈 관리가 가능한 전자기기 및 이의 제어 방법에 관한 것으로, 본 발명의 전자기기는, 사용자에 의해 음성 명령이 발생하였을 때, 노이즈가 발생하는 전자기기의 구동을 제어할 수 있도록 한다. 이러한 본 발명의 노이즈 관리가 가능한 전자기기는, 사용자로부터 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 수신하는 수신부, 상기 노이즈를 추출하는 노이즈 추출부 및 수신한 상기 음성 명령이 인식 가능한지 판단하고, 상기 음성 명령이 인식이 불가능하다고 판단되는 경우, 상기 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키는 프로세서를 포함하여 구성될 수 있다.
Description
본 발명은 노이즈 관리가 가능한 전자기기 및 이의 제어 방법에 관한 것이다. 보다 구체적으로, 본 발명은 사용자에 의해 음성 명령이 발생하였을 때, 노이즈가 발생하는 전자기기의 구동을 제어할 수 있도록 하는 기술에 관한 것이다.
이하에서 기술되는 내용은 본 발명의 실시예와 관련되는 배경 정보를 제공할 목적으로 기재된 것일 뿐이고, 기술되는 내용들이 당연하게 종래기술을 구성하는 것은 아니다.
기술의 발달에 따라 다양한 전자기기(예: TV, 오디오, 세탁기, 냉장고, 건조기 등)가 사무실, 집안 내에 보급되어 있다. 이러한 전자기기들은 사용자들의 보다 나은 사용상의 편리함을 추구하고자 대부분 원격 제어장치(이하 리모컨이라 칭함)가 개발되어 사용되고 있다. 따라서, 대부분의 전자기기들이 리모콘을 통해 사용자가 편리하게 원격으로 제어 및 구동된다.
또한, 기술이 발달함에 따라 최근 많은 분야에서 음성 인식 기술을 적용한 각종 서비스들이 소개되고 있다. 음성 인식 기술은 사람이 발성하는 음성을 이해하여 컴퓨터가 다룰 수 있는 문자 정보로 변환하는 일련의 과정이라 할 수 있으며, 음성 인식 기술을 이용하는 음성 인식 서비스는 사용자의 음성을 인식하고 이에 해당하는 적합한 서비스를 제공하는 일련의 과정을 포함할 수 있다.
특히 음성 인식 기술의 예시로 사용자의 음성 명령으로 가정, 사무실 내 전자기기들을 제어할 수 있다. 이때, 사용자의 음성과 주변의 전자기기들이 작동하며 발생하는 노이즈가 함께 발생할 수 있다. 이 경우, 사용자의 음성이 정확하게 인지되지 않아 사용자의 음성 명령에 대응하는 전자기기의 제어가 제대로 이루어지지 않을 수 있다.
따라서, 발생한 주변의 노이즈를 최소화하고 사용자의 음성 명령에 대응하는 전자기기 제어가 필요한 실정이다. 이러한 음성 인식 기술을 적용한 기술이 선행기술 1 및 선행기술 2에 의해 개시되어 있다.
구체적으로 국내등록특허(선행기술 1) 제10-0998897호 '음성인식 홈 오토메이션 시스템 및 이를 이용한 가정용 기기 제어방법'에는 휴대폰의 음성 메시지를 외부 서버를 통해 변환된 제어명령 데이터를 이용하여 원격지에서 가정 내 전자기기를 제어할 수 있는 기술이 개시되어 있다.
그러나, 상기의 '음성인식 홈 오토메이션 시스템 및 이를 이용한 가정용 기기 제어방법'은 가정용 기기를 제어하기 위한 음성 메시지를 휴대폰을 이용하여 전송한다.
즉, 발생한 주변의 노이즈를 최소화하고 사용자의 음성 명령에 대응하여 전자기기를 제어할 수 있는 기술에 대해서는 개시되어 있지 않다.
또한, 국내등록특허 제10-1506510호(선행기술 2)의 '음성인식 홈 네트워크 시스템'은 리모컨과 음성 컨트롤박스를 통해 제어가 가능한 모든 전자기기를 간단한 음성 명령으로 제어할 수 있으며, 외부서버 혹은 사용자가 본 기기에 직접 수시로 리모컨과 음성컨트롤박스를 업데이트하도록 할 수 있도록 하는 기술이 개시되어 있다.
그러나, 상기의 선행기술 2에는 발생한 주변의 노이즈를 최소화하고 사용자의 음성 명령에 대응하여 전자기기를 제어할 수 있는 기술에 대해서는 개시되어 있지 않다.
따라서, 음성 명령이 발생할 때 주변의 전자기기 중 노이즈가 발생한 전자기기의 구동을 제어함으로써, 사용자의 음성 명령이 정확하게 인지되어 사용자의 음성 명령에 대응하는 전자기기의 제어가 제대로 이루어질 수 있도록 하는 기술이 필요하다.
전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
[선행기술문헌]
[특허문헌]
선행기술 1: 한국 등록특허 10-0998897 (2010.12.01. 등록)
선행기술 2: 한국 등록특허 10-1506510 (2015.03.23. 등록)
본 발명의 일 과제는, 사용자로부터 발생한 관리 명령 인식 기능이 향상될 수 있도록 하는데 있다.
또한, 본 발명의 다른 과제는 사용자로부터 발생한 음성 명령에 대응하여 가정 내 배치된 복수의 전자기기 중에서 노이즈가 발생하는 전자기기를 판단할 수 있는데 있다.
또한, 본 발명의 또 다른 과제는 전자기기에서 발생하는 노이즈를 측정하고, 측정된 노이즈가 적정 노이즈로 유지될 수 있도록 전자기기의 구동을 제어할 수 있는데 있다.
본 발명의 목적은 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.
상기 과제들을 달성하기 위한, 노이즈 관리를 위한 가정 내 전자기기를 제어하는 방법은, 사용자로부터의 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하고 음향 신호로부터 노이즈를 추출한 뒤, 수신한 음성 명령 대비 복수의 전자기기에서 발생한 음성 명령이 인식 가능한지 판단한 후에, 음성 명령이 인식 불가능하다고 판단되는 경우, 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기를 판단하면, 제1 전자기기의 구동을 제어하여 노이즈를 감소시키는 과정으로 이루어질 수 있다.
구체적으로 제1 전자기기를 판단할 때, 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 복수의 전자기기에서 발생한 구동 노이즈의 레벨(dB)을 측정한 뒤, 복수의 전자기기에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈를 추출한 후, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 제1 전자기기로 판단할 수 있다.
이때, 구동 노이즈의 레벨(dB)을 측정할 때, 복수의 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나의 구동 노이즈의 레벨을 측정할 수 있다.
또한, 제1 전자기기를 판단할 때, 음성 명령 인식이 불가하도록 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나를 분석할 수 있다.
본 발명의 전자기기를 제어하는 방법에서 음성 명령이 인식 가능한지 판단할 때, 신호 대 잡음비(SNR)를 기반으로 하는 음성 명령과 노이즈 사이의 비율을 판단하고, 판단된 음성 명령과 노이즈 사이의 비율을 분석할 수 있다.
구체적으로, 비율을 분석한 이후에, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 클수록 음성 명령 인식이 불가한 것으로 판단하게 된다.
또한, 음성 명령이 인식 가능한지 판단한 이후, 복수의 전자기기 중에서 제1 전자기기 판단이 불가능할 수 있다.
구체적으로, 제1 전자기기 판단이 불가능하다고 판단되면, 복수의 전자기기 중 어느 하나의 전자기기 구동을 제어하고, 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 어느 하나의 전자기기를 제외한 복수의 전자기기에서 발생한 구동 노이즈의 레벨을 측정한 뒤, 측정한 레벨을 기초로 복수의 전자기기에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈를 추출할 수 있다.
이때, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 제1 전자기기로 판단하게 된다.
또한, 사용자로부터 음성 명령을 수신하기 이전에, 복수의 전자기기 구동 시, 복수의 전자기기의 구동 단계별로 발생하는 구동 노이즈가 레이블된 학습 데이터 세트를 입력 받는 학습 데이터를 입력하고, 학습 데이터 세트에 기초하여 복수의 전자기기 구동 중 발생한 복수의 전자기기의 구동 노이즈의 단계를 판단하기 위한 기계학습 모델을 트레이닝한 뒤, 트레이닝 단계로 생성된 기계학습 모델을 복수의 전자기기의 구동 노이즈 판단 프로그램을 저장할 수 있다.
한편, 본 발명의 실시예에 따라 노이즈 관리 가능한 가정 내 전자기기는, 사용자로부터의 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하는 수신부, 음향 신호로부터 노이즈를 추출하는 노이즈 추출부 및 수신한 음성 명령이 인식 가능한지 판단하고, 음성 명령이 인식이 불가능하다고 판단되는 경우, 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키는 프로세서를 포함할 수 있다.
구체적으로, 프로세서는, 음성 명령이 인식이 불가능하다고 판단되는 경우, 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 복수의 전자기기에서 발생한 구동 노이즈의 레벨(dB)을 측정하는 레벨 측정부와 복수의 전자기기에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈를 추출하는 노이즈 추출부를 포함하고, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 제1 전자기기로 판단할 수 있다.
이때, 레벨 측정부는, 복수의 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나의 구동 노이즈의 레벨을 측정할 수 있다.
또한, 프로세서는, 신호 대 잡음비(SNR)를 기반으로 하는 음성 명령과 노이즈 사이의 비율을 판단하고, 판단된 음성 명령과 노이즈 사이의 비율을 분석하는 분석부를 더 포함할 수 있다.
이때, 분석부는, 음성 명령 인식이 불가하도록 복수의 전자기기가 작동할 때, 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나를 분석하게 된다.
즉 분석부는, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 클수록 음성 명령 인식이 불가한 것으로 판단하는 것이다.
한편, 프로세서는, 복수의 전자기기 중에서 제1 전자기기 판단이 불가능한지 여부를 판단할 수 있다.
여기서, 프로세서는, 복수의 전자기기 중에서 제1 전자기기 판단이 불가능하다고 판단되는 경우, 복수의 전자기기 중 어느 하나의 전자기기 구동을 제어하고, 레벨 측정부를 통해 어느 하나의 전자기기를 제외한 복수의 전자기기에서 발생한 구동 노이즈의 레벨을 측정하여 측정한 측정한 레벨을 기초로 복수의 전자기기에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈를 추출한 후, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 제1 전자기기로 판단할 수 있다.
또한, 프로세서는, 복수의 전자기기 구동 시, 복수의 전자기기의 구동 단계별로 발생하는 구동 노이즈가 레이블된 학습 데이터 세트에 기초하여 복수의 전자기기 구동 중 발생한 복수의 전자기기의 구동 노이즈의 단계를 판단하기 위한 기계학습 모델을 트레이닝하고, 트레이닝으로 생성된 기계학습 모델을 복수의 전자기기의 구동 노이즈 판단 프로그램을 저장한 메모리를 더 포함할 수 있다.
한편, 본 발명의 노이즈 관리 가능한 가정 내 전자기기로서는, 하나 이상의 프로세서와 프로세서에 연결되는 메모리를 포함한다.
이때, 메모리는, 하나 이상의 프로세서에 의해 실행될 때, 프로세서가 사용자로부터 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하고, 음향신호로부터 노이즈를 추출하고, 수신한 음성 명령이 인식 가능한지 판단하고, 음성 명령이 인식이 불가능하다고 판단되는 경우, 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키도록 야기하는(cause) 명령을 저장할 수 있다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
본 발명에 의하면, 전자기기가 전자기기 구동 시 발생하는 노이즈의 종류와 크기 등에 대한 정보를 학습한 상태에서 사용자로부터 발생한 음성 명령을 통해 발생한 음성 명령이 인식 불가능하다고 판단되면, 사용자로부터 발생한 음성 명령이 인식되도록 노이즈를 발생시킨 제1 전자기기를 판단할 수 있다. 이때, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율을 판단하여 가장 큰 노이즈가 발생한 제1 전자기기를 판단하게 된다. 이로 인해 사용자가 노이즈로 인한 불편함을 최소화할 수 있게 된다.
또한, 본 발명은 사용자로부터 음성 명령이 발생하고, 복수의 전자기기에서 발생한 노이즈 중에서 적정 노이즈 이상으로 노이즈가 발생하는 제1 전자기기를 판단하기 어려운 경우, 복수의 전자기기 중에서 어느 하나의 전자기기의 구동을 제어한 뒤, 노이즈 레벨을 측정하고 적정 노이즈 이상이 측정되는 경우 제어한 어느 하나의 전자기기를 제외한 다른 하나의 전자기기 구동을 제어하여 노이즈가 발생하는 노이즈 근원을 차단하도록 할 수 있다. 이로 인하여 가정에서 발생하는 노이즈를 차단하여 노이즈로 인하 불편을 최소화하게 된다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 노이즈 관리가 가능한 전자기기가 적용된 전자기기, 서버, 사용자 및 이들을 서로 연결하는 네트워크를 포함하는 노이즈 관리 가능한 전자기기를 도시한 도면이다.
도 2는 본 발명의 실시예에 따라 노이즈 관리가 가능한 전자기기의 구동 제어 실시예를 설명하기 위한 도면이다.
도 3 본 발명의 실시예에 따른 노이즈 관리가 가능한 전자기기의 개략적인 블록도이다.
도 4는 도 3의 노이즈 관리 가능한 전자기기의 구성을 구체적으로 도시한 블록도이다.
도 5는 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 실시예를 도시한 도면이다.
도 6은 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 과정을 도시한 흐름도이다.
도 7은 도 6의 사용자로부터 발생한 음성 명령을 인식하는 과정을 구체적으로 도시한 흐름도이다.
도 8은 도 6의 노이즈가 발생한 제1 전자기기를 판단하는 과정을 구체적으로 도시한 흐름도이다.
도 9는 도 6의 노이즈가 발생한 제1 전자기기의 판단 및 구동 제어를 위한 다른 실시예에 따른 과정을 도시한 흐름도이다.
도 10은 본 발명의 실시예에 따른 전자기기에서 발생한 구동 노이즈에 따라 전자기기 구동 노이즈 판단 프로그램을 실시하기 위한 심층 신경망 모델을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따라 노이즈 관리가 가능한 전자기기의 구동 제어 실시예를 설명하기 위한 도면이다.
도 3 본 발명의 실시예에 따른 노이즈 관리가 가능한 전자기기의 개략적인 블록도이다.
도 4는 도 3의 노이즈 관리 가능한 전자기기의 구성을 구체적으로 도시한 블록도이다.
도 5는 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 실시예를 도시한 도면이다.
도 6은 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 과정을 도시한 흐름도이다.
도 7은 도 6의 사용자로부터 발생한 음성 명령을 인식하는 과정을 구체적으로 도시한 흐름도이다.
도 8은 도 6의 노이즈가 발생한 제1 전자기기를 판단하는 과정을 구체적으로 도시한 흐름도이다.
도 9는 도 6의 노이즈가 발생한 제1 전자기기의 판단 및 구동 제어를 위한 다른 실시예에 따른 과정을 도시한 흐름도이다.
도 10은 본 발명의 실시예에 따른 전자기기에서 발생한 구동 노이즈에 따라 전자기기 구동 노이즈 판단 프로그램을 실시하기 위한 심층 신경망 모델을 설명하기 위한 도면이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 여기에서 설명하는 실시예들에 한정되지 않는다. 이하 실시예에서는 본 발명을 명확하게 설명하기 위해서 설명과 직접적인 관계가 없는 부분을 생략하지만, 본 발명의 사상이 적용된 장치 또는 시스템을 구현함에 있어서, 이와 같이 생략된 구성이 불필요함을 의미하는 것은 아니다. 아울러, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조번호를 사용한다.
이하의 설명에서 제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 되며, 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 또한, 이하의 설명에서 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
이하의 설명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하 도면을 참고하여 본 발명의 사용자가 음성 명령을 발화하였을 때, 잡음이 발생하는 전자기기의 구동을 제어할 수 있는 노이즈 관리가 가능한 전자기기에 대해 자세히 살펴보기로 한다.
도 1은 본 발명의 실시예에 따른 노이즈 관리가 가능한 전자기기가 적용된 전자기기, 서버, 사용자 및 이들을 서로 연결하는 네트워크를 포함하는 노이즈 관리 가능한 전자기기를 도시한 도면이고, 도 2는 본 발명의 실시예에 따라 노이즈 관리가 가능한 전자기기의 구동 제어 실시예를 설명하기 위한 도면이다.
본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기는 통신 네트워크를 통해 가정 내(예: 가정 내, 사무실 등)에 설치된 인공지능 스피커 및 서버(300)와 통신할 수 있다.
이하 노이즈 관리가 가능한 전자기기는 가정 내 배치된 예를 들기로 하며, 노이즈 관리가 가능한 전자기기가 위치한 가정 내에는 5G 통신을 통해 IoT 환경이 구현되어 각종 전자기기들이 서로 통신하도록 구성될 수 있다.
서버(300)는 전자기기에 탑재된 마이크, 카메라 등을 통해 사용자의 음성 명령, 가정 내에서 발생한 노이즈, 노이즈가 발생한 전자기기 등을 판단할 수 있다. 이렇게 판단된 노이즈가 발생한 전자기기(이하 제1 전자기기(100a_도 2 및 도 5 참고))의 구동을 제어하도록 전자기기의 프로세서(180)를 제어할 수 있다. 즉, 사용자의 음성 명령이 발생한 후, 노이즈가 발생한 전자기기의 제어가 서버(300)에 의해 수행될 수 있다.
네트워크(400)는 노이즈 관리 가능한 전자기기와 서버(300)를 연결하는 역할을 수행할 수 있다. 이러한 네트워크(400)는 예컨대 LANs(local area networks), WANs(wide area networks), MANs(metropolitan area networks), ISDNs(integrated service digital networks) 등의 유선 네트워크나, 무선 LANs, CDMA, 블루투스, 위성 통신 등의 무선 네트워크를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
또한 네트워크(400)는 근거리 통신 및/또는 원거리 통신을 이용하여 정보를 송수신할 수 있다. 여기서 근거리 통신은 블루투스(bluetooth), RFID(radio frequency identification), 적외선 통신(IrDA, infrared data association), UWB(ultra-wideband), ZigBee, Wi-Fi (wireless fidelity) 기술을 포함할 수 있고, 원거리 통신은 CDMA(code division multiple access), FDMA(frequency division multiple access), TDMA(time division multiple access), OFDMA(orthogonal frequency division multiple access), SC-FDMA(single carrier frequency division multiple access) 기술을 포함할 수 있다.
네트워크(400)는 허브, 브리지, 라우터, 스위치 및 게이트웨이와 같은 네트워크 요소들의 연결을 포함할 수 있다. 네트워크(400)는 인터넷과 같은 공용 네트워크 및 안전한 기업 사설 네트워크와 같은 사설 네트워크를 비롯한 하나 이상의 연결된 네트워크들, 예컨대 다중 네트워크 환경을 포함할 수 있다. 네트워크(400)에의 액세스는 하나 이상의 유선 또는 무선 액세스 네트워크들을 통해 제공될 수 있다. 더 나아가 네트워크(400)는 사물 등 분산된 구성 요소들 간에 정보를 주고 받아 처리하는 IoT(Internet of Things, 사물인터넷) 망 및/또는 5G 통신을 지원할 수 있다.
전자기기는 가정 내에 위치한 카메라, 마이크 등을 통해 음성으로 지시되는 사용자(200)의 음성 명령을 수신 받을 수도 있고, 반대로 전자기기의 구동 상태를 인공 지능 스피커에 송신하여 음성으로 사용자에게 알릴 수도 있다. 또한, 전자기기에는 음성을 인식하는 인공지능 스피커가 탑재되어 사용자의 음성 명령을 직접 전달 받거나 전자기기에서 발생한 신호를 탑재된 인공지능 스피커를 통해 사용자(200)에게 알릴 수도 있다.
한편, 본 발명의 실시예에서는 사용자(200)의 음성 명령을 음성으로 송, 수신하는 예를 들지만, 다르게는 사용자(200)가 전자기기에 설치된 노이즈 관리 확인을 위한 디스플레이, 확인 버튼 등을 통해 음성 명령을 송, 수신할 수 있음은 물론이다.
더불어, 전자기기는 사용자의 단말(예: 개인휴대 단말기, 태블릿, 웨어러블 기기 등)을 통해 사용자의 지시를 수신 받을 수 있으며, 반대로 전자기기에서 발생한 신호를 사용자 단말에 전달할 수도 있다.
이러한 전자기기는 가정 내에 설치되는 에어컨, 냉장고, TV, 세탁기 등 다양한 전자기기 중 어느 하나가 될 수 있으며, 전자기기의 종류에 의해 본 발명이 제한되는 것은 아니다.
특히, 전자기기가 구동하는 과정에서 구동 진동과 같은 노이즈가 발생할 수 있다. 이때, 사용자의 음성 명령에 따라 전자기기에서 발생한 노이즈를 감소시키기 위해 전자기기의 구동을 제어할 수 있다.
이러한 전자기기의 구동 제어란, 도 2에 도시된 바와 같이, 사용자가 통화를 진행하거나, 사용자가 “시끄러워”, “소리 줄여줘” 라고 음성 명령이 발생하는 경우, 구동 중이 전자기기 중 노이즈가 크게 발생하는 전자기기의 구동을 제어하는 것으로 설정할 수 있다.
예시적으로, TV는 사용자의 음성 명령을 수신 받을 수 있는 인공지능 스피커를 포함할 수 있다. 이러한 인공지능 스피커에 수신되는 사용자의 음성에 따라 TV의 볼륨 조절 동작이 제어될 수 있다.
구체적으로 TV가 온(on) 되어 있는 상태에서 사용자가 개인휴대단말기로 통화를 할 수 있다. 사용자의 통화 음성이 TV의 인공지능 스피커에서 수신할 수 있으며, TV의 인공지능 스피커에서 사용자의 통화 음성을 수신하는 경우 TV의 볼륨을 자동으로 감소시키도록 설정할 수 있다.
TV가 온 되어 있는 상태에서 개인휴대단말기를 이용하여 통화를 진행하면 TV에서 발생하는 소리로 인하여 사용자 및 사용자가 통화 내용의 완벽한 전달에 어려움이 있을 수 있다.
그러나, 본 발명의 실시예에 따른 전자기기의 TV는 인공지능 스피커가 내장되고, 내장된 인공지능 스피커를 통해 사용자가 전화 통화가 이루어지는 것으로 판단하여 전자기기의 TV의 볼륨을 줄이는 것과 같은 TV의 구동을 제어할 수 있다.
통상적으로 사용자가 통화를 하게 되면 TV의 볼륨이 노이즈라고 판단하기 때문에, 상술된 바와 같이 사용자가 통화 시에 TV에서 발생하는 소리를 노이즈라고 판단하여 TV의 볼륨을 제어하도록 하는 구성은 사용자의 음성 명령 오인식 확률을 크게 줄일 수 있게 된다.
이하 도면을 참고하여 노이즈가 발생한 전자기기 구동을 제어하는 실시예를 설명하기로 한다.
도 3 본 발명의 실시예에 따른 노이즈 관리가 가능한 전자기기의 개략적인 블록도이고, 도 4는 도 3의 노이즈 관리 가능한 전자기기의 구성을 구체적으로 도시한 블록도이다. 이하의 설명에서 도 1 및 도 2에 대한 설명과 중복되는 부분의 그 설명은 생략하기로 한다.
본 발명의 실시예에 따라 노이즈 관리 가능한 전자기기(100_도 1 참고)는, 수신부(130), 노이즈 추출부(140), 프로세서(180)를 포함하여 구성될 수 있다.
수신부(130)는 사용자의 음성 명령과 가정 내 배치된 복수의 전자기기(100)에서 발생하는 노이즈를 수신할 수 있다. 이를 위해 수신부(130)는 인공지능 스피커, 마이크(121) 등으로 이루어질 수 있다. 마이크(121)에 의해 수신된 사용자의 음성 명령은 음성 명령이 맞는지를 확인해야 한다. 이를 위해 수신부(130)는 사용자가 “시끄러워”라고 발화한 음성 명령을 확인할 수 있는 음성 명령 확인부(132)를 더 포함할 수 있다. 사용자의 음성 명령과 복수의 전자기기(100)에서 발생한 노이즈는 전자기기에 탑재된 수신부(130)를 통해 수집할 수 있지만, 별도의 인공지능 스피커(AI)를 통해 수집된 후, 노이즈 관리 가능한 전자기기의 수신부(미도시)를 통해 수신될 수도 있다.
여기서 음성 명령은 사용자(200)가 음성을 발화한 예를 들어 설명하지만 다르게는 전자기기에 배치된 버튼, 디스플레이 등을 터치하여 발생한 명령일 수도 있다.
노이즈 추출부(140)는 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 추출할 수 있다. 구체적으로, 노이즈 추출부(140)는 예컨대 사용자 음성과 전자기기의 구동 노이즈가 동시에 발화되면 전자기기의 구동 노이즈만 분리할 수 있다.
즉, 수신부(130)는 사용자가 발화한 음성 명령과 가정 내에 배치된 복수의 전자기기(100)에서 발생한 노이즈를 모두 수신할 수 있다. 소리가 수신되면 노이즈 추출부(140)를 통해 음성 명령과 노이즈로 분리하는 것이다.
수신한 소리를 음성 명령과 노이즈로 분리하면, 프로세서(180)에서 수신한 음성 명령이 인식 가능한지 판단할 수 있다. 이때, 음성 명령이 인식 가능하다고 판단되면 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기(100a)의 구동을 제어하여 노이즈를 감소시킬 수 있다.
이와 다르게, 음성 명령이 인식 불가능하다고 판단되면, 프로세서(180)는 신호 대 잡음비(SNR)를 기반으로 하여 음성 명령과 노이즈 사이의 비율을 판단할 수 있다. 즉, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 작을수록 음성 명령 인식이 불가능하다고 판단하는 것이다.
신호 대 잡음비(SNR)란, 정보를 지닌 신호의 세기를 잡음의 세기로서 나눈 값을 의미한다. 구체적으로 신호에 동반하는 잡음 성분의 양을 수치로 표시한 것으로 신호(SIGNAL, S)와 잡음(NOISES, N)의 비율을 표시하는 것이다. 이러한 신호 대 잡음비는 단위는 dB이고 수치가 클수록 노이즈가 작음을 의미한다.
이를 위해, 프로세서(180)는 신호 대 잡음비(SNR)를 기반으로 하는 음성 명령과 노이즈 사이으 비율을 판단하고, 판단된 음성 명령과 노이즈 사이의 비율을 분석할 수 있는 SNR 비율 판단부(151)를 포함하는 분석부(150)를 더 포함할 수 있다.
구체적으로 분석부(150)는 음성 명령 인식이 불가하도록 복수의 전자기기가 작동할 때, 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나를 분석할 수 있다.
예시적으로 에어컨, 공기 청정기 등의 전자기기가 구동할 때에는 풍향 노이즈가 발생할 수 있으며, 세탁기, 건조기 등의 전자기기가 구동할 때에는 작동 진동 노이즈가 발생할 수 있다. 또한, 로봇청소기, 무선 청소기 등의 청소기가 작동할 때에는 흡입 노이즈와 함께 풍향 노이즈가 발생할 수 있다. 더불어, TV나 인공지능 스피커(AI)의 경우 음향 노이즈가 발생할 수 있으며, 이러한 노이즈를 분석부(150)에서 분석하는 것이다.
또한, 분석부(150)는 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 클수록 음성 명령 인식이 불가능하다고 판단할 수 있다. 앞서 설명한 바와 같이 신호 대 잡음 비는, 신호에 동반하는 잡음 성분의 양을 수치로 표시한 것으로 신호(SIGNAL, S)와 잡음(NOISES, N)의 비율을 표시하는 것이며, 수치가 클수록 노이즈가 작음을 의미하기 때문에 노이즈 비율이 클수록 음성 명령의 인식이 불가능하다고 할 수 있다.
이와 같이 분석부(150)에서 신호 대 잡음 비에서 노이즈 비율이 큰 경우, 노이즈가 발생한 것으로 판단한다. 음성 명령을 인식하기 위해서는 노이즈가 발생한 전자기기를 판단해야 하는데 이를 위해 사용자(200)가 음성 명령을 발생시킨 위치와 근접한 전자기기(100c_도 5 참고)에 탑재된 마이크, 카메라 등으로 유입되는 가정 내 배치된 전자기기에서 발생한 노이즈를 인지하고, 인지된 노이즈 중에서 가장 큰 레벨(dB)을 발생시키는 전자기기를 노이즈가 발생하는 제1 전자기기(100a)라고 판단할 수 있다.
이를 위해, 프로세서(180)는 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 복수의 전자기기(100)에서 발생한 구동 노이즈의 레벨(dB)을 측정하는 레벨 측정부(160)와, 복수의 전자기기(100)에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈를 추출하는 구동 노이즈 추출부(170)를 포함할 수 있다.
앞서 설명한 바와 같이, 전자기기는 구동할 때 구동 노이즈(예: 진동 노이즈, 풍향 노이즈, 음향 노이즈 등)이 발생할 수 있다. 이때, 레벨 측정부(160)의 구동 노이즈 구별부(161)를 통해 각각의 전자기기에서의 구동 노이즈의 종류를 판단하고, 판단된 구동 노이즈 중에서 가장 큰 구동 노이즈를 추출할 수 있는 것이다. 여기서, 구동 노이즈 구별은 각각의 전자기기에서 발생하는 구동 노이즈 정보가 저장된 데이터 베이스(115)를 기초로 이루어질 수 있다.
여기서, 레벨 측정부(160)는 복수의 전자기기가 작동할 때 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나의 노이즈 레벨을 측정하게 된다.
이와 같이, 전자기기에서 발생한 노이즈의 종류 및 레벨을 측정하면, 구동 노이즈 추출부(170)를 통해 측정된 노이즈의 레벨 중에서 가장 큰 구동 노이즈를 추출할 수 있다. 추출된 가장 큰 노이즈는 제1 전자기기 추출부(171)에서 노이즈가 발생하는 제1 전자기기(100c_도 5 참고)을 추출하는 기준 데이터가 될 수 있다.
제1 전자기기를 판단하면, 구동 프로세서(180)를 통해 제1 전자기기의 구동을 제어하여 노이즈 근원을 차단할 수 있다. 구체적으로, 제1 전자기기의 모터를 제어하여 해당 전자기기를 일시적으로 정지하거나, 제1 전자기기의 볼륨을 줄이는 등의 제어를 통해 노이즈 근원을 차단할 수 있다.
이때, 노이즈가 발생한다고 판단되는 제1 전자기기의 구동을 제어하기 위해서 복수의 전자기기의 구동 노이즈 정보를 메모리(120)에 저장할 수 있다.
구체적으로, 메모리(120)에는 복수의 전자기기가 구동하는 구동 단계별로 발생하는 구동 노이즈가 레이블된 학습 데이터 세트가 저장될 수 있다. 예를 들어, TV의 볼륨에 대한 레벨(dB), 에어컨 구동 시, 설정 온도에 따라 발생하는 풍향 노이즈에 대한 레벨(dB) 등이 레이블되어 저장될 수 있다.
이렇게 저장된 학습 데이터 세트에 기초하여 복수의 전자기기가 구동하면, 구동 중 발생한 각각의 전자기기에서 발생하는 노이즈를 단계별로 트레이닝 프로그램(122)을 통해 트레이닝할 수 있다. 예를 들어 TV의 최저 볼륨에서부터 최고 볼륨까지 트레이닝할 수 있으며, 에어컨 구동 시 발생하는 풍향 노이즈를 설정 온도에 따라 단계별로 트레이닝하는 것이다.
이와 같이 트레이닝으로 생성된 기계학습 모델이 복수의 전자기기의 구동 노이즈 판단 프로그램(124)으로 메모리(120)에 저장될 수 있다. 저장된 전자기기의 구동 노이즈 판단 프로그램(124)을 기초로 전자기기에서 발생하는 노이즈의 크기를 판단할 수 있게 된다.
또한, 메모리(120)는 노이즈 관리 가능한 전자기기를 통한 전자기기의 제어에 필요한 각종 정보들을 기록하는 것으로 휘발성 또는 비휘발성 기록 매체를 포함할 수 있다. 기록 매체는 프로세서(180)에 의해 읽힐 수 있는 데이터를 저장한 것으로, HDD(hard disk drive), SSD(solid state disk), SDD(silicon disk drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등을 포함할 수 있다. 본 실시 예에서 메모리(120)에 저장되는 정보는 문맥에 맞게 상황 별로 기재하기로 한다.
이렇게 메모리(120)에 전자기기의 노이즈 정보가 저장되면, 저장된 노이즈 정보를 기초로 전자기기의 노이즈에 대한 학습이 학습부(미도시)를 통해 이루어질 수 있다.
한편 학습은 전자기기 자체에서 이루어질 수 있지만 전자기기가 아닌 외부에서 수행할 수도 있으며, 학습 결과로 도출된 노이즈 정보만이 전자기기에 전달되어 저장될 수도 있다.
본 발명의 실시예에서는 메모리(120)에 저장된 전자기기의 노이즈 정보에 대한 정보는 외부 서버(미도시)로부터 제공받는 예를 들어 설명하기로 한다. 이러한 서버는 각종 인공지능 알고리즘을 적용하는데 필요한 빅데이터 및 음성 인식에 관한 데이터를 제공하는 데이터베이스 서버일 수 있다. 그 밖에 서버는 전자기기에 설치된 애플리케이션 또는 웹 브라우저와 통신하는 통신부(미도시)를 통해 원격으로 전자기기를 제어할 수 있는 웹 서버 또는 애플리케이션을 포함할 수도 있다.
즉, 서버(300)에 저장된 복수의 전자기기의 노이즈 정보, 각 전자기기에서 발생 가능한 노이즈의 크기 정보 등을 기초로 가정 내에서 노이즈를 발생시킨 제1 전자기기(100a)를 추출할 수 있는 것이다.
이때, 서버(300)는 복수의 전자기기와 연동된 전자기기 정보를 통해 전자기기의 on/off를 확인할 수 있다. 이로 인해, on 상태의 전자기기의 정보를 기초로 노이즈를 발생시킨 제1 전자기기(100a)를 추출하게 되는 것이다.
한편, 본 발명의 실시예에 따른 전자기기는 하나 이상의 프로세서를 포함하고, 메모리는 하나 이상의 프로세서와 연결될 수 있다.
이때, 메모리(120)는, 하나 이상의 프로세서에 의해 실행될 때 프로세서가 사용자로부터 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하고, 음향신호로부터 노이즈를 추출하고, 수신한 음성 명령이 인식 가능한지 판단하고, 음성 명령이 인식이 불가능하다고 판단되는 경우, 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키도록 야기하는(cause) 명령을 저장할 수 있다.
즉, 앞서 설명된 수신부(130), 노이즈 추출부(140), 레벨 측정부(160), 구동 노이즈 추출부(170), 분석부(150) 등을 구동하기 위한 명령은 하나의 프로세서에 의해 구동할 수 있지만, 다르게는 각각의 구성과 연결되는 복수의 프로세서에 의해 구동할 수 있다.
한편, 프로세서(180)는 메모리(120)에서 기계학습모델을 트레이닝할 수 있도록 러닝 프로세서(180)와, 메모리(120)에 저장된 복수의 전자기기의 구동 노이즈 판단 프로그램을 기초로 노이즈를 분석하는 노이즈 분석 프로세서(180) 및 노이즈 분석 프로세서(180)에서 분석되어 노이즈가 가장 큰 제1 전자기기의 구동을 제어할 수 있는 구동 프로세서(180) 등을 더 포함할 수 있다.
구체적으로, 제1 전자기기의 모터를 제어하여 해당 전자기기를 일시적으로 정지하거나, 제1 전자기기의 볼륨을 줄이는 등의 제어를 통해 노이즈 근원을 차단할 수 있다.
이와 같이 노이즈 근원으로 추출되는 제1 전자기기의 구동을 제어하는 구동 프로세서(180)를 포함하는 프로세서(180)는, 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
결과적으로, 사용자로부터 발생한 음성 명령과 복수의 전자기기에서 발생한 노이즈를 수집하고, 수집한 소리에서부터 복수의 전자기기에서 발생한 노이즈를 분리한다.
수집한 소리에서부터 노이즈가 분리되면, 음성 명령이 인식 가능한지 판단할 수 있다. 즉, 음성 명령에 의해 노이즈가 발생한 제1 전자기기의 구동을 제어할 수 있는지 판단하는 것이다.
이때, 신호 대 잡음비를 기반으로 하는 음성 명령과 노이즈 사이의 비율을 통해 음성 명령이 인식 가능한지 판단할 수 있다. 즉, 음성 명령과 노이즈 사이의 비율에서 노이즈의 비율이 작을수록 음성 명령 인식이 불가능한 것으로 판단할 수 있다.
음성 명령이 불가능한 것으로 판단되면, 노이즈를 발생시킨 제1 전자기기(100a)를 판단할 수 있다. 예시적으로 작동 중인 전자기기 중에서 구동 노이즈가 가장 큰 전자기기가 노이즈를 발생시킨 제1 전자기기(100a)라고 판단할 수 있다.
제1 전자기기(100a)를 판단하면 제1 전자기기(100a)의 모터를 제어하거나, 구동을 멈추게 하여 노이즈가 발생되는 것을 최소화할 수 있다. 그 결과 사용자(200)가 발생시킨 음성 명령을 인식할 수 있도록 한다.
도 5는 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 실시예를 도시한 도면이다. 이하의 설명에서 도 1 내지 도 4에 대한 설명과 중복되는 부분의 그 설명은 생략하기로 한다.
도면을 참고하면, 가정 내에는 복수의 전자기기(예: TV, 에어컨, 세탁기, 로봇 청소기 등_100_도 1 참고)가 배치될 수 있다. 이때, 사용자(200_도 1 참고)가 통화를 하기 위함이나, 기타 다른 이유에 의하여 “시끄러워” 또는 “소리 줄여줘” 라는 음성 명령을 발생시킬 수 있다. 발생된 음성 명령과, 가정 내 배치된 복수의 전자기기에서 발생한 노이즈를 수신부(130)에서 수신할 수 있다.
이후, 수신부(130)에서 수신한 노이즈와 음성 명령이 혼합된 소리에서 노이즈 추출부(140)를 통해 노이즈를 추출하고, 추출리한 음성 명령이 인식 가능한지 판단할 수 있다. 이때, 음성 명령이 인식 가능하다고 판단되면 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기(100a)의 구동을 제어하여 노이즈를 감소시킬 수 있다.
이와 다르게, 음성 명령이 인식 불가능하다고 판단되면, 프로세서(180)는 신호 대 잡음비(SNR)를 기반으로 하여 음성 명령과 노이즈 사이의 비율을 판단할 수 있다. 즉, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 작을수록 음성 명령 인식이 불가능하다고 판단하는 것이다.
음성 명령이 불가능한 것으로 판단되면, 노이즈를 발생시킨 제1 전자기기(100a)를 판단할 수 있다. 구체적으로 작동 중인 전자기기 중에서 구동 노이즈가 가장 큰 전자기기가 노이즈를 발생시킨 제1 전자기기(100a)라고 판단할 수 있다.
제1 전자기기(100a)를 판단하면 제1 전자기기(100a)의 모터를 제어하거나, 구동을 멈추게 하여 노이즈가 발생되는 것을 최소화하게 된다.
예시적으로, 수집된 가전기기의 구동 노이즈 중에서 노이즈 레벨이 가장 높은 제1 전자기기가 TV인 것으로 판단되면, TV의 볼륨을 내리거나 TV를 off 하여 노이즈가 발생하는 전자기기를 차단할 수 있다.
한편, 제1 전자기기를 판단할 때, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 판단하지 못할 수 있다.
이 경우, 사용자에 최 인접하고 구동 중인 전자기기의 구동을 제어할 수 있다. 사용자와 가장 인접한 전자기기(예: 도 5의 경우 에어컨(100c))에서 발생하는 노이즈가 사용자에게 가장 큰 노이즈를 제공하는 노이즈가 발생하는 전자기기가 될 수 있기 때문이다.
또한, 제1 전자기기를 판단할 때, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 판단하지 못할 때, 구동 중인 전자기기 중에서 어느 하나의 전자기기의 구동을 제어할 수 있다. 즉, 노이즈 발생원인 전자기기를 판단하지 못하는 경우, 복수의 전자기기 중 어느 하나의 전자기기를 제어하여 사용자가 감지하는 “시끄러운 상태”가 유지되는지 여부를 판단하는 것이다. 이렇게 복수의 전자기기 중 어느 하나의 전자기기를 제어하여 사용자가 감지하는 “시끄러운 상태”가 유지되는 경우 계속해서 복수의 전자기기 중 어느 하나의 전자기기를 제어하는 방식으로 노이즈가 발생하는 전자기기를 추출하는 것이다.
더불어, 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 판단하지 못할 때, 구동 중인 전자기기 전체의 구동을 제어(예: 전원 off)하여 노이즈가 발생하는 원인을 제어할 수도 있다.
도 6은 본 발명의 실시예에 따른 노이즈 관리 가능한 전자기기를 통해 전자기기의 구동을 제어하는 과정을 도시한 흐름도이고, 도 7은 도 6의 사용자로부터 발생한 음성 명령을 인식하는 과정을 구체적으로 도시한 흐름도이며, 도 8은 도 6의 노이즈가 발생한 제1 전자기기를 판단하는 과정을 구체적으로 도시한 흐름도이고, 도 9는 도 6의 노이즈가 발생한 제1 전자기기의 판단 및 구동 제어를 위한 다른 실시예에 따른 과정을 도시한 흐름도이다. 이하의 설명에서 도 1 내지 도 5에 대한 설명과 중복되는 부분의 그 설명은 생략하기로 한다.
본 발명의 실시예에 따른 전자기기는 사용자가 음성 명령이 발생하였을 때, 노이즈가 발생하는 전자기기의 구동을 제어할 수 있는 노이즈 관리 가능한 전자기기를 포함한다.
이러한 전자기기가 구동하는 과정에서 구동 진동, 음향 노이즈 등과 같은 노이즈가 발생할 수 있다. 이때, 사용자의 명령에 따라 전자기기에서 발생한 노이즈를 감소시키기 위해 전자기기의 구동을 제어할 수 있다.
구체적으로, 소음 관리 가능한 전자기기를 이용하여 전자기기의 구동을 제어하는 과정을 살펴보면, 우선 사용자는 “시끄러워”, “소리 줄여줘” 라는 등의 소음 관리 명령과 복수의 전자기기(100_도 1 참고)에서 발생한 노이즈를 수신할 수 있다(단계 S110).
이후, 노이즈와 음성 명령이 혼합된 소리에서 노이즈만을 분리할 수 있다(단계 S120). 수신한 소리를 음성 명령과 노이즈로 분리하면, 수신한 음성 명령이 인식 가능한지 판단할 수 있다(단계 S130).
이때, 음성 명령이 인식 가능하다고 판단되면 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기(100a)의 구동을 제어하여 노이즈를 감소시킬 수 있다(단계 S150).
이와 다르게, 음성 명령이 인식 불가능하다고 판단되면, 프로세서(180)는 신호 대 잡음비(SNR)를 기반으로 하여 음성 명령과 노이즈 사이의 비율을 판단할 수 있다. 즉, 신호 대 잡음 비에서 음성 명령 대비 노이즈의 비율이 작을수록 음성 명령 인식이 불가능하다고 판단하는 것이다(단계 S130, S132).
신호 대 잡음비(SNR)란, 정보를 지닌 신호의 세기를 잡음의 세기로서 나눈 값을 의미한다. 즉, 신호 대 잡음비(SNR)를 기반으로 하는 음성 명령과 노이즈 사이으 비율을 판단하고, 판단된 음성 명령과 노이즈 사이의 비율을 분석할 수 있다(단계 S134).
이때, 노이즈 비율이 음성 명령에 비해 작다면 음성 명령이 인식 가능한 것으로 판단하여 노이즈가 발생한 제1 전자기기(100a)의 구동을 제어하게 된다(단계 S138, S150).
이와 반대로, 노이즈 비율이 음성 명령에 비해 크다면, 음성 명령이 인식 불가능한 것으로 판단하고, 제1 전자기기(100a)를 판단하게 된다(단계 S136, S140).
구체적으로, 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 복수의 전자기기(100)에서 발생한 구동 노이즈의 레벨(dB)을 측정하고, 복수의 전자기기(100)에서 발생한 구동 노이즈 중 레벨이 가장 큰 구동 노이즈가 발생한 전자기기를 추출한다(단계 S142, S144). 이렇게 구동 노이즈 레벨이 가장 큰 전자기기가 노이즈가 가장 크게 발생한 제1 전자기기(100a)라고 판단할 수 있다.
이후, 판단된 제1 전자기기(100a)의 모터를 제어하거나, 구동을 멈추게 하여 노이즈가 발생되는 것을 최소화하게 된다(단계 S150).
한편, 제1 전자기기 판단 시, 레벨이 가장 큰 구동 소음이 발생하는 전자기기를 판단하지 못할 수 있다(단계 S131). 구동 중인 전자기기 중에서 어느 하나의 전자기기의 구동을 제어할 수 있다(단계 S133).
즉, 사용자와 인접한 전자기기에 탑재된 마이크 또는 인공지능 스피커 등을 통해 소음 발생원인 전자기기를 판단하지 못하는 경우, 복수의 전자기기 중 어느 하나의 전자기기를 제어하여 사용자가 감지하는 “시끄러운 상태”가 유지되는지 여부를 판단하는 것이다.
예를 들어, 소음 발생원인 전자기기를 판단하지 못하는 경우, 전체의 전자기기에서 에어컨의 구동을 제어할 수 있다. 이후, 남은 복수의 전자기기의 구동 소음 레벨을 측정한 뒤, 레벨이 가장 큰 구동 소음을 추출하여 소음이 발생한 제1 전자기기를 판단하는 것이다(단계 S135, S137).
이때, 소음 발생원인 전자기기를 판단하지 못하는 경우, 구동이 제어된 에어컨을 제외한 남은 전자기기 중 다른 하나의 전자기기 구동을 제어하고, 남은 전자기기의 구동 소음 레벨을 측정하여 제1 전자기기를 판단하는 과정으로 제1 전자기기를 판단한 뒤, 판단한 제1 전자기기의 구동을 제어할 수 있다(단계 S139, S150).
이와 같이 발생한 사용자의 소음 관리 명령과 함께 복수의 전자기기에서 발생한 노이즈를 수집한 뒤, 수집한 소리에서 노이즈를 분리한 뒤, 소음 관리 명령 대비 노이즈의 비율을 분석하여 노이즈의 비율이 클수록 소음 관리 명령의 인식이 불가능하다고 판단할 수 있다. 소음 관리 명령 인식이 불가능하다고 판단되는 경우 음성 명령을 발생시킨 위치와 근접한 전자기기에 탑재된 마이크, 카메라 등으로 유입되는 가정 내 배치된 전자기기에서 발생한 노이즈를 인지하고 인지된 노이즈 중에서 가장 큰 레벨(dB)을 발생시키는 전자기기를 노이즈가 발생하는 제1 전자기기고 판단할 수 있다. 이렇게 판단된 제1 전자기기의 모터를 제어하여 해당 전자기기를 일시적으로 정지하거나, 제1 전자기기의 볼륨을 줄이는 등의 제어를 통해 노이즈 근원을 차단할 수 있다. 이로 인해 사용자가 소음으로 인한 불편함을 최소화할 수 있게 된다.
도 10은 본 발명의 실시예에 따른 전자기기에서 발생한 구동 노이즈에 따라 전자기기 구동 노이즈 판단 프로그램을 실시하기 위한 심층 신경망 모델을 설명하기 위한 도면이다.
전자기기는 구동 시, 구동 단계별로 발생하는 음향이 전자기기 구동 노이즈인지를 판단하기 위해 인공지능의 머신 러닝을 이용하여 미리 훈련된 심층 신경망 모델을 사용할 수도 있다.
여기서, 인공 지능(artificial intelligence, AI)은 인간의 지능으로 할 수 있는 사고, 학습, 자기계발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보기술의 한 분야로, 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것을 의미한다.
또한, 인공지능은 그 자체로 존재하는 것이 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 많은 관련을 맺고 있다. 특히 현대에는 정보기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.
머신 러닝(machine learning)은 인공지능의 한 분야로, 컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야이다.
구체적으로 머신 러닝은, 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이라 할 수 있다. 머신 러닝의 알고리즘들은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 취한다.
용어 '머신 러닝'은 용어 '기계 학습'과 혼용되어 사용될 수 있다.
기계 학습에서 데이터를 어떻게 분류할 것인가를 놓고, 많은 기계 학습 알고리즘이 개발되었다. 의사결정나무(Decision Tree)나 베이지안 망(Bayesian network), 서포트벡터머신(SVM: support vector machine), 그리고 인공 신경망(ANN: Artificial Neural Network) 등이 대표적이다.
의사결정나무는 의사결정규칙(Decision Rule)을 나무구조로 도표화하여 분류와 예측을 수행하는 분석방법이다.
베이지안 망은 다수의 변수들 사이의 확률적 관계(조건부독립성: conditional independence)를 그래프 구조로 표현하는 모델이다. 베이지안 망은 비지도 학습(unsupervised learning)을 통한 데이터마이닝(data mining)에 적합하다.
서포트벡터머신은 패턴인식과 자료분석을 위한 지도 학습(supervised learning)의 모델이며, 주로 분류와 회귀분석을 위해 사용한다.
인공신경망은 생물학적 뉴런의 동작원리와 뉴런간의 연결 관계를 모델링한 것으로 노드(node) 또는 처리 요소(processing element)라고 하는 다수의 뉴런들이 레이어(layer) 구조의 형태로 연결된 정보처리 시스템이다.
인공 신경망은 기계 학습에서 사용되는 모델로써, 기계학습과 인지과학에서 생물학의 신경망(동물의 중추신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘이다.
구체적으로 인공신경망은 시냅스(synapse)의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다.
용어 인공신경망은 용어 뉴럴 네트워크(Neural Network)와 혼용되어 사용될 수 있다.
인공신경망은 복수의 레이어(layer)를 포함할 수 있고, 레이어들 각각은 복수의 뉴런(neuron)을 포함할 수 있다. 또한 인공신경망은 뉴런과 뉴런을 연결하는 시냅스를 포함할 수 있다.
인공 신경망은 일반적으로 다음의 세가지 인자, 즉 (1) 다른 레이어의 뉴런들 사이의 연결 패턴 (2) 연결의 가중치를 갱신하는 학습 과정 (3) 이전 레이어로부터 수신되는 입력에 대한 가중 합으로부터 출력값을 생성하는 활성화 함수에 의해 정의될 수 있다.
인공 신경망은, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network), MLP(Multilayer Perceptron), CNN(Convolutional Neural Network)와 같은 방식의 네트워크 모델들을 포함할 수 있으나, 이에 한정되지 않는다.
본 명세서에서 용어 '레이어'는 용어 '계층'과 혼용되어 사용될 수 있다.
인공신경망은 계층 수에 따라 단층 신경망(Single-Layer Neural Networks)과 다층 신경망(Multi-Layer Neural Networks)으로 구분된다.
일반적인 단층 신경망은, 입력층과 출력층으로 구성된다.
또한 일반적인 다층 신경망은 입력층(Input Layer)과 하나 이상의 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성된다.
입력층은 외부의 자료들을 받아들이는 층으로서, 입력층의 뉴런 수는 입력되는 변수의 수와 동일하며, 은닉층은 입력층과 출력층 사이에 위치하며 입력층으로부터 신호를 받아 특성을 추출하여 출력층으로 전달한다. 출력층은 은닉층으로부터 신호를 받고, 수신한 신호에 기반한 출력 값을 출력한다. 뉴런간의 입력신호는 각각의 연결강도(가중치)와 곱해진 후 합산되며 이 합이 뉴런의 임계치보다 크면 뉴런이 활성화되어 활성화 함수를 통하여 획득한 출력값을 출력한다.
한편 입력층과 출력 층 사이에 복수의 은닉층을 포함하는 심층 신경망은, 기계 학습 기술의 한 종류인 딥 러닝을 구현하는 대표적인 인공 신경망일 수 있다.
한편 용어 '딥 러닝'은 용어 '심층 학습'과 혼용되어 사용될 수 있다.
인공 신경망은 훈련 데이터(training data)를 이용하여 학습(training)될 수 있다. 여기서 학습이란, 입력 데이터를 분류(classification)하거나 회귀분석(regression)하거나 군집화(clustering)하는 등의 목적을 달성하기 위하여, 학습 데이터를 이용하여 인공 신경망의 파라미터(parameter)를 결정하는 과정을 의미할 수 있다. 인공 신경망의 파라미터의 대표적인 예시로써, 시냅스에 부여되는 가중치(weight)나 뉴런에 적용되는 편향(bias)을 들 수 있다.
훈련 데이터에 의하여 학습된 인공 신경망은, 입력 데이터를 입력 데이터가 가지는 패턴에 따라 분류하거나 군집화 할 수 있다.
한편 훈련 데이터를 이용하여 학습된 인공 신경망을, 본 명세서에서는 학습 모델(a trained model)이라 명칭 할 수 있다.
다음은 인공 신경망의 학습 방식에 대하여 설명한다.
인공 신경망의 학습 방식은 크게, 지도 학습, 비 지도 학습, 준 지도 학습(Semi-Supervised Learning), 강화 학습(Reinforcement Learning)으로 분류될 수 있다.
지도 학습은 훈련 데이터로부터 하나의 함수를 유추해내기 위한 기계 학습의 한 방법이다.
그리고 이렇게 유추되는 함수 중, 연속 적인 값을 출력하는 것을 회귀분석(Regression)이라 하고, 입력 벡터의 클래스(class)를 예측하여 출력하는 것을 분류(Classification)라고 할 수 있다.
지도 학습에서는, 훈련 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시킨다.
여기서 레이블이란, 훈련 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과 값)을 의미할 수 있다.
본 명세서에서는 훈련 데이터가 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과값)을 레이블 또는 레이블링 데이터(labeling data)이라 명칭 한다.
또한 본 명세서에서는, 인공 신경망의 학습을 위하여 훈련 데이터에 레이블을 설정하는 것을, 훈련 데이터에 레이블링 데이터를 레이블링(labeling) 한다고 명칭 한다.
이 경우 훈련 데이터와 훈련 데이터에 대응하는 레이블)은 하나의 트레이닝 셋(training set)을 구성하고, 인공 신경망에는 트레이닝 셋의 형태로 입력될 수 있다.
한편 훈련 데이터는 복수의 특징(feature)을 나타내고, 훈련 데이터에 레이블이 레이블링 된다는 것은 훈련 데이터가 나타내는 특징에 레이블이 달린다는 것을 의미할 수 있다. 이 경우 훈련 데이터는 입력 객체의 특징을 벡터 형태로 나타낼 수 있다.
인공 신경망은 훈련 데이터와 레이블링 데이터를 이용하여, 훈련 데이터와 레이블링 데이터의 연관 관계에 대한 함수를 유추할 수 있다. 그리고, 인공 신경망에서 유추된 함수에 대한 평가를 통해 인공 신경망의 파라미터가 결정(최적화)될 수 있다.
비 지도 학습은 기계 학습의 일종으로, 훈련 데이터에 대한 레이블이 주어지지 않는다.
구체적으로, 비 지도 학습은, 훈련 데이터 및 훈련 데이터에 대응하는 레이블의 연관 관계 보다는, 훈련 데이터 자체에서 패턴을 찾아 분류하도록 인공 신경망을 학습시키는 학습 방법일 수 있다.
비 지도 학습의 예로는, 군집화 또는 독립 성분 분석(Independent Component Analysis)을 들 수 있다.
본 명세서에서 용어 '군집화'는 용어 '클러스터링'과 혼용되어 사용될 수 있다.
비지도 학습을 이용하는 인공 신경망의 일례로 생성적 적대 신경망(GAN: Generative Adversarial Network), 오토 인코더(AE: Autoencoder)를 들 수 있다.
생성적 적대 신경망이란, 생성기(generator)와 판별기(discriminator), 두 개의 서로 다른 인공지능이 경쟁하며 성능을 개선하는 머신 러닝 방법이다.
이 경우 생성기는 새로운 데이터를 창조하는 모형으로, 원본 데이터를 기반으로 새로운 데이터를 생성할 수 있다.
또한 판별기는 데이터의 패턴을 인식하는 모형으로, 입력된 데이터가 원본 데이터인지 또는 생성기에서 생성한 새로운 데이터인지 여부를 감별하는 역할을 수행할 수 있다.
그리고 생성기는 판별기를 속이지 못한 데이터를 입력 받아 학습하며, 판별기는 생성기로부터 속은 데이터를 입력 받아 학습할 수 있다. 이에 따라 생성기는 판별기를 최대한 잘 속이도록 진화할 수 있고, 판별기는 원본 데이터와 생성기에 의해 생성된 데이터를 잘 구분하도록 진화할 수 있다.
오토 인코더는 입력 자체를 출력으로 재현하는 것을 목표로 하는 신경망이다.
오토 인코더는 입력층, 적어도 하나의 은닉층 및 출력층을 포함한다.
이 경우 은닉 계층의 노드 수가 입력 계층의 노드 수보다 적으므로 데이터의 차원이 줄어들게 되며, 이에 따라 압축 또는 인코딩이 수행되게 된다.
또한 은닉 계층에서 출력한 데이터는 출력 계층으로 들어간다. 이 경우 출력 계층의 노드 수는 은닉 계층의 노드 수보다 많으므로, 데이터의 차원이 늘어나게 되며, 이에 따라 압축 해제 또는 디코딩이 수행되게 된다.
한편 오토 인코더는 학습을 통해 뉴런의 연결 강도를 조절함으로써 입력 데이터가 은닉층 데이터로 표현된다. 은닉층에서는 입력층보다 적은 수의 뉴런으로 정보를 표현하는데 입력 데이터를 출력으로 재현할 수 있다는 것은, 은닉층이 입력 데이터로부터 숨은 패턴을 발견하여 표현했다는 것을 의미할 수 있다.
준 지도 학습은 기계 학습의 일종으로, 레이블이 주어진 훈련 데이터와 레이블이 주어지지 않은 훈련 데이터를 모두 사용하는 학습 방법을 의미할 수 있다.
준 지도 학습의 기법 중 하나로, 레이블이 주어지지 않은 훈련 데이터의 레이블을 추론한 후 추론된 라벨을 이용하여 학습을 수행하는 기법이 있으며, 이러한 기법은 레이블링에 소요되는 비용이 큰 경우에 유용하게 사용될 수 있다.
강화 학습은, 에이전트(Agent)가 매 순간 어떤 행동을 해야 좋을지 판단할 수 있는 환경이 주어진다면, 데이터 없이 경험으로 가장 좋을 길을 찾을 수 있다는 이론이다.
강화 학습은 주로 마르코프 결정 과정(MDP: Markov Decision Process)에 의하여 수행될 수 있다.
마르코프 결정 과정을 설명하면, 첫 번째로 에이전트가 다음 행동을 하기 위해 필요한 정보들이 구성된 환경이 주어지며, 두 번째로 그 환경에서 에이전트가 어떻게 행동할지 정의하고, 세 번째로 에이전트가 무엇을 잘하면 보상(reward)를 주고 무엇을 못하면 벌점(penalty)을 줄지 정의하며, 네 번째로 미래의 보상이 최고점에 이를 때까지 반복 경험하여 최적의 정책(policy)을 도출하게 된다.
인공 신경망은 모델의 구성, 활성 함수(Activation Function), 손실 함수(Loss Function) 또는 비용 함수(Cost Function), 학습 알고리즘, 최적화 알고리즘 등에 의해 그 구조가 특정되며, 학습 전에 하이퍼파라미터(Hyperparameter)가 미리 설정되고, 이후에 학습을 통해 모델 파라미터(Model Parameter)가 설정되어 내용이 특정될 수 있다.
예컨대, 인공 신경망의 구조를 결정하는 요소에는 은닉층의 개수, 각 은닉층에 포함된 은닉 노드의 개수, 입력 특징 벡터(Input Feature Vector), 대상 특징 벡터(Target Feature Vector) 등이 포함될 수 있다.
하이퍼파라미터는 모델 파라미터의 초기값 등과 같이 학습을 위하여 초기에 설정하여야 하는 여러 파라미터들을 포함한다. 그리고, 모델 파라미터는 학습을 통하여 결정하고자 하는 여러 파라미터들을 포함한다.
예컨대, 하이퍼파라미터에는 노드 간 가중치 초기값, 노드 간 편향 초기값, 미니 배치(Mini-batch) 크기, 학습 반복 횟수, 학습률(Learning Rate) 등이 포함될 수 있다. 그리고, 모델 파라미터에는 노드 간 가중치, 노드 간 편향 등이 포함될 수 있다.
손실 함수는 인공 신경망의 학습 과정에서 최적의 모델 파라미터를 결정하기 위한 지표(기준)로 이용될 수 있다. 인공 신경망에서 학습은 손실 함수를 줄이기 위하여 모델 파라미터들을 조작하는 과정을 의미하며, 학습의 목적은 손실 함수를 최소화하는 모델 파라미터를 결정하는 것으로 볼 수 있다.
손실 함수는 주로 평균 제곱 오차(MSE: Mean Squared Error) 또는 교차 엔트로피 오차(CEE, Cross Entropy Error)를 사용할 수 있으며, 본 발명이 이에 한정되지는 않는다.
교차 엔트로피 오차는 정답 레이블이 원 핫 인코딩(one-hot encoding)된 경우에 사용될 수 있다. 원 핫 인코딩은 정답에 해당하는 뉴런에 대하여만 정답 레이블 값을 1로, 정답이 아닌 뉴런은 정답 레이블 값이 0으로 설정하는 인코딩 방법이다.
머신 러닝 또는 딥 러닝에서는 손실 함수를 최소화하기 위하여 학습 최적화 알고리즘을 이용할 수 있으며, 학습 최적화 알고리즘에는 경사 하강법(GD: Gradient Descent), 확률적 경사 하강법(SGD: Stochastic Gradient Descent), 모멘텀(Momentum), NAG(Nesterov Accelerate Gradient), Adagrad, AdaDelta, RMSProp, Adam, Nadam 등이 있다.
경사 하강법은 현재 상태에서 손실 함수의 기울기를 고려하여 손실 함수값을 줄이는 방향으로 모델 파라미터를 조정하는 기법이다.
모델 파라미터를 조정하는 방향은 스텝(step) 방향, 조정하는 크기는 스텝 사이즈(size)라고 칭한다.
이때, 스텝 사이즈는 학습률을 의미할 수 있다.
경사 하강법은 손실 함수를 각 모델 파라미터들로 편미분하여 기울기를 획득하고, 모델 파라미터들을 획득한 기울기 방향으로 학습률만큼 변경하여 갱신할 수 있다.
확률적 경사 하강법은 학습 데이터를 미니 배치로 나누고, 각 미니 배치마다 경사 하강법을 수행하여 경사 하강의 빈도를 높인 기법이다.
Adagrad, AdaDelta 및 RMSProp는 SGD에서 스텝 사이즈를 조절하여 최적화 정확도를 높이는 기법이다. SGD에서 모멘텀 및 NAG는 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Adam은 모멘텀과 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Nadam은 NAG와 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다.
인공 신경망의 학습 속도와 정확도는 인공 신경망의 구조와 학습 최적화 알고리즘의 종류뿐만 아니라, 하이퍼파라미터에 크게 좌우되는 특징이 있다. 따라서, 좋은 학습 모델을 획득하기 위하여는 적당한 인공 신경망의 구조와 학습 알고리즘을 결정하는 것뿐만 아니라, 적당한 하이퍼파라미터를 설정하는 것이 중요하다.
통상적으로 하이퍼파라미터는 실험적으로 다양한 값으로 설정해가며 인공 신경망을 학습시켜보고, 학습 결과 안정적인 학습 속도와 정확도를 제공하는 최적의 값으로 설정한다.
위와 같은 방식들을 이용하면 피가열체의 상태에 대한 추정이 더욱 정교해질 수 있다.
본 발명의 실시예에서 사용되기 위한 심층 신경망 모델을 생성하기 위해서는 다양한 방식이 존재할 수 있으나, 지도 학습의 경우에는 사전 작업으로서 아래와 같은 훈련 과정이 수행될 수 있다.
전자기기의 프로세서(180)는 복수의 전자기기(100)는 구동 시, 구동 단계별로 발생하는 음향을 감지하고, 이에 대해 사용자가 전자기기에서 발생한 음향이 전자기기 구동 노이즈인지를 레이블링하게 하는 학습 데이터 세트를 구성할 수도 있다.
이러한 훈련 데이터로 심층 신경망 모델을 훈련시키면, 훈련된 학습 모델은 이후 전자기기의 구동 노이즈 특징을 반영하여, 전자기기가 구동될 때, 발생하는 음향이 전자기기의 구동 노이즈인지에 대해 판단할 수 있게 된다.
사용자는 심층 신경망 모델의 판단 결과에 대해 지속적으로 피드백을 줌으로써, 이러한 학습 모델을 보다 정교화할 수 있다.
이상 설명된 본 발명에 따른 실시예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.
한편, 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.
본 발명의 명세서(특히 특허청구범위에서)에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 발명에서 범위(range)를 기재한 경우 범위에 속하는 개별적인 값을 적용한 발명을 포함하는 것으로서(이에 반하는 기재가 없다면), 발명의 상세한 설명에 범위를 구성하는 각 개별적인 값을 기재한 것과 같다.
본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 단계들은 적당한 순서로 행해질 수 있다. 반드시 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 또한, 본 발명에 따른 방법들에 포함된 단계들은 프로세서 또는 해당 단계의 기능을 수행하기 위한 모듈들을 통해서 수행될 수 있다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
Claims (20)
- 노이즈 관리를 위한 가정 내 전자기기를 제어하는 방법으로서,
사용자로부터의 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하는 단계;
상기 음향 신호로부터 상기 노이즈를 추출하는 단계;
수신한 상기 노이즈 대비 상기 음성 명령이 인식 가능한지 판단하는 단계;
상기 음성 명령이 인식 불가능하다고 판단되는 경우, 상기 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기를 판단하는 단계; 및
상기 제1 전자기기의 구동을 제어하여 노이즈를 감소시키는 단계를 포함하는,
전자기기를 제어하는 방법.
- 제1항에 있어서,
상기 제1 전자기기를 판단하는 단계는,
상기 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 상기 복수의 전자기기에서 발생한 구동 노이즈의 레벨(dB)을 측정하는 단계;
상기 복수의 전자기기에서 발생한 구동 노이즈 중 상기 레벨이 가장 큰 구동 노이즈를 추출하는 단계를 포함하고,
상기 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 상기 제1 전자기기로 판단하는,
전자기기를 제어하는 방법.
- 제2항에 있어서,
상기 구동 노이즈의 레벨(dB)을 측정하는 단계는,
상기 복수의 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나의 구동 노이즈의 레벨을 측정하는,
전자기기를 제어하는 방법.
- 제3항에 있어서,
상기 제1 전자기기를 판단하는 단계는,
상기 음성 명령 인식이 불가하도록 상기 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나를 분석하는 단계를 포함하는,
전자기기를 제어하는 방법.
- 제1항에 있어서,
상기 음성 명령이 인식 가능한지 판단하는 단계는,
신호 대 잡음비(SNR)를 기반으로 하는 상기 음성 명령과 상기 노이즈 사이의 비율을 판단하는 단계, 및
판단된 상기 음성 명령과 상기 노이즈 사이의 비율을 분석하는 단계를 포함하는,
전자기기를 제어하는 방법.
- 제5항에 있어서,
상기 비율을 분석하는 단계 이후에,
상기 신호 대 잡음 비에서 상기 음성 명령 대비 상기 노이즈의 비율이 클수록 상기 음성 명령 인식이 불가한 것으로 판단하는 단계를 포함하는,
전자기기를 제어하는 방법.
- 제1항에 있어서,
상기 음성 명령이 인식 가능한지 판단하는 단계 이후에,
상기 복수의 전자기기 중에서 상기 제1 전자기기 판단이 불가능한 단계를 더 포함하는,
전자기기를 제어하는 방법.
- 제7항에 있어서,
상기 제1 전자기기 판단이 불가능한 단계 이후에,
상기 복수의 전자기기 중 어느 하나의 전자기기 구동을 제어하는 단계;
상기 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 상기 어느 하나의 전자기기를 제외한 상기 복수의 전자기기에서 발생한 구동 노이즈의 상기 레벨을 측정하는 단계;
측정한 상기 레벨을 기초로 상기 복수의 전자기기에서 발생한 구동 노이즈 중 상기 레벨이 가장 큰 구동 노이즈를 추출하는 단계를 포함하고,
상기 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 상기 제1 전자기기로 판단하는,
전자기기를 제어하는 방법.
- 제1항에 있어서,
상기 사용자로부터 음성 명령을 수신하는 단계 이전에,
상기 복수의 전자기기 구동 시, 상기 복수의 전자기기의 구동 단계별로 발생하는 구동 노이즈가 레이블된 학습 데이터 세트를 입력 받는 학습 데이터 입력 단계;
상기 학습 데이터 세트에 기초하여 상기 복수의 전자기기 구동 중 발생한 상기 복수의 전자기기의 구동 노이즈의 단계를 판단하기 위한 기계학습 모델을 트레이닝하는 트레이닝 단계; 및
상기 트레이닝 단계로 생성된 기계학습 모델을 상기 복수의 전자기기의 구동 노이즈 판단 프로그램을 저장하는 단계를 더 포함하는,
전자기기를 제어하는 방법.
- 컴퓨터를 이용하여 제1항 내지 제9항의 방법 중 어느 한 항의 방법을 실행시키기 위하여 상기 컴퓨터로 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
- 노이즈 관리 가능한 가정 내 전자기기로서,
사용자로부터의 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하는 수신부;
상기 음향 신호로부터 상기 노이즈를 추출하는 노이즈 추출부; 및
수신한 상기 음성 명령이 인식 가능한지 판단하고, 상기 음성 명령이 인식이 불가능하다고 판단되는 경우, 상기 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키는 프로세서를 포함하는,
전자기기.
- 제11항에 있어서,
상기 프로세서는, 상기 음성 명령이 인식이 불가능하다고 판단되는 경우,
상기 가정 내 배치된 마이크, 카메라 중 적어도 어느 하나를 통해 상기 복수의 전자기기에서 발생한 구동 노이즈의 레벨(dB)을 측정하는 레벨 측정부, 및
상기 복수의 전자기기에서 발생한 구동 노이즈 중 상기 레벨이 가장 큰 구동 노이즈를 추출하는 노이즈 추출부를 포함하고,
상기 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 상기 제1 전자기기로 판단하는,
전자기기.
- 제12항에 있어서,
상기 레벨 측정부는,
상기 복수의 전자기기 작동 시 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나의 구동 노이즈의 레벨을 측정하는,
전자기기.
- 제11항에 있어서,
상기 프로세서는,
신호 대 잡음비(SNR)를 기반으로 하는 상기 음성 명령과 상기 노이즈 사이의 비율을 판단하고, 판단된 상기 음성 명령과 상기 노이즈 사이의 비율을 분석하는 분석부를 더 포함하는,
전자기기.
- 제14항에 있어서,
상기 분석부는,
상기 음성 명령 인식이 불가하도록 상기 복수의 전자기기가 작동할 때, 발생하는 풍향 노이즈, 진동 노이즈, 흡입 노이즈 및 음향 노이즈 중 적어도 어느 하나를 분석하는,
전자기기.
- 제14항에 있어서,
상기 분석부는,
상기 신호 대 잡음 비에서 상기 음성 명령 대비 상기 노이즈의 비율이 클수록 상기 음성 명령 인식이 불가한 것으로 판단하는,
전자기기.
- 제12항에 있어서,
상기 프로세서는,
상기 복수의 전자기기 중에서 상기 제1 전자기기 판단이 불가능한지 여부를 판단하는,
전자기기.
- 제17항에 있어서,
상기 프로세서는,
상기 복수의 전자기기 중에서 상기 제1 전자기기 판단이 불가능하다고 판단되는 경우,
상기 복수의 전자기기 중 어느 하나의 전자기기 구동을 제어하고, 상기 레벨 측정부를 통해 상기 어느 하나의 전자기기를 제외한 상기 복수의 전자기기에서 발생한 구동 노이즈의 상기 레벨을 측정하여 측정한 측정한 상기 레벨을 기초로 상기 복수의 전자기기에서 발생한 구동 노이즈 중 상기 레벨이 가장 큰 구동 노이즈를 추출한 후, 상기 레벨이 가장 큰 구동 노이즈가 발생하는 전자기기를 상기 제1 전자기기로 판단하는,
전자기기.
- 제11항에 있어서,
상기 프로세서는,
상기 복수의 전자기기 구동 시, 상기 복수의 전자기기의 구동 단계별로 발생하는 구동 노이즈가 레이블된 학습 데이터 세트에 기초하여 상기 복수의 전자기기 구동 중 발생한 상기 복수의 전자기기의 구동 노이즈의 단계를 판단하기 위한 기계학습 모델을 트레이닝하고, 상기 트레이닝으로 생성된 기계학습 모델을 상기 복수의 전자기기의 구동 노이즈 판단 프로그램을 저장한 메모리를 더 포함하는,
전자기기.
- 노이즈 관리 가능한 가정 내 전자기기로서,
하나 이상의 프로세서; 및
상기 프로세서에 연결되는 메모리를 포함하고,
상기 메모리는,
상기 하나 이상의 프로세서에 의해 실행될 때, 상기 프로세서가 사용자로부터 음성 명령 및 가정 내 배치된 복수의 전자기기에서 발생하는 노이즈를 포함하는 음향 신호를 수신하고, 상기 음향신호로부터 상기 노이즈를 추출하고, 수신한 상기 음성 명령이 인식 가능한지 판단하고, 상기 음성 명령이 인식이 불가능하다고 판단되는 경우, 상기 복수의 전자기기 중 노이즈를 발생시킨 제1 전자기기의 구동을 제어하여 노이즈를 감소시키도록 야기하는(cause) 명령을 저장하는,
노이즈 관리 가능한 가정 내 전자기기.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190111007A KR20190109341A (ko) | 2019-09-06 | 2019-09-06 | 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 |
US16/696,373 US11264016B2 (en) | 2019-09-06 | 2019-11-26 | Noise manageable electronic device and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190111007A KR20190109341A (ko) | 2019-09-06 | 2019-09-06 | 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190109341A true KR20190109341A (ko) | 2019-09-25 |
Family
ID=68068020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190111007A KR20190109341A (ko) | 2019-09-06 | 2019-09-06 | 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11264016B2 (ko) |
KR (1) | KR20190109341A (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111968614A (zh) * | 2020-08-24 | 2020-11-20 | 湖南工业大学 | 一种基于卷积-模糊网络的车辆全局空间的主动噪声控制装置 |
KR20210094177A (ko) * | 2020-01-20 | 2021-07-29 | 주식회사 원더풀플랫폼 | 인공지능형 멀티미디어장치 제어 방법 및 시스템 |
WO2021157999A1 (en) * | 2020-02-06 | 2021-08-12 | Samsung Electronics Co., Ltd. | Voice command resolution method and apparatus based on non-speech sound in iot environment |
WO2022092530A1 (ko) * | 2020-10-30 | 2022-05-05 | 삼성전자(주) | 전자장치 및 그 제어방법 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3825553B1 (en) * | 2019-11-25 | 2024-01-10 | Grundfos Holding A/S | Method for controlling a water utility system using a user perception of noise |
US11682411B2 (en) | 2021-08-31 | 2023-06-20 | Spotify Ab | Wind noise suppresor |
CN113763916B (zh) * | 2021-09-07 | 2023-08-04 | 吉林大学 | 一种非线性混合主动噪声控制方法及控制系统 |
US12118997B1 (en) * | 2023-05-16 | 2024-10-15 | Roku, Inc. | Use of relative time of receipt of voice command as basis to control response to voice command |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100998897B1 (ko) | 2003-08-25 | 2010-12-09 | 엘지전자 주식회사 | 음성인식 홈 오토메이션 시스템 및 이를 이용한 가정용기기 제어방법 |
US8488803B2 (en) * | 2007-05-25 | 2013-07-16 | Aliphcom | Wind suppression/replacement component for use with electronic systems |
KR101444100B1 (ko) * | 2007-11-15 | 2014-09-26 | 삼성전자주식회사 | 혼합 사운드로부터 잡음을 제거하는 방법 및 장치 |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
KR101506510B1 (ko) | 2013-10-10 | 2015-03-30 | 송철호 | 음성인식 홈 네트워크 시스템 |
US10475466B2 (en) * | 2014-07-17 | 2019-11-12 | Ford Global Technologies, Llc | Adaptive vehicle state-based hands-free phone noise reduction with learning capability |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9818404B2 (en) * | 2015-12-22 | 2017-11-14 | Intel Corporation | Environmental noise detection for dialog systems |
US9978390B2 (en) * | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10304463B2 (en) * | 2016-10-03 | 2019-05-28 | Google Llc | Multi-user personalization at a voice interface device |
US10468032B2 (en) * | 2017-04-10 | 2019-11-05 | Intel Corporation | Method and system of speaker recognition using context aware confidence modeling |
US11355108B2 (en) * | 2019-08-20 | 2022-06-07 | International Business Machines Corporation | Distinguishing voice commands |
-
2019
- 2019-09-06 KR KR1020190111007A patent/KR20190109341A/ko not_active Application Discontinuation
- 2019-11-26 US US16/696,373 patent/US11264016B2/en active Active
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210094177A (ko) * | 2020-01-20 | 2021-07-29 | 주식회사 원더풀플랫폼 | 인공지능형 멀티미디어장치 제어 방법 및 시스템 |
WO2021149898A1 (ko) * | 2020-01-20 | 2021-07-29 | 주식회사 원더풀플랫폼 | 인공지능형 멀티미디어장치 제어 방법 및 시스템 |
WO2021157999A1 (en) * | 2020-02-06 | 2021-08-12 | Samsung Electronics Co., Ltd. | Voice command resolution method and apparatus based on non-speech sound in iot environment |
US11842732B2 (en) | 2020-02-06 | 2023-12-12 | Samsung Electronics Co., Ltd. | Voice command resolution method and apparatus based on non-speech sound in IoT environment |
CN111968614A (zh) * | 2020-08-24 | 2020-11-20 | 湖南工业大学 | 一种基于卷积-模糊网络的车辆全局空间的主动噪声控制装置 |
CN111968614B (zh) * | 2020-08-24 | 2023-09-19 | 湖南工业大学 | 一种基于卷积-模糊网络的车辆全局空间的主动噪声控制装置 |
WO2022092530A1 (ko) * | 2020-10-30 | 2022-05-05 | 삼성전자(주) | 전자장치 및 그 제어방법 |
Also Published As
Publication number | Publication date |
---|---|
US11264016B2 (en) | 2022-03-01 |
US20210074283A1 (en) | 2021-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11264016B2 (en) | Noise manageable electronic device and control method thereof | |
US11183190B2 (en) | Method and apparatus for recognizing a voice | |
KR102608051B1 (ko) | 인공지능 장치 | |
US11189284B2 (en) | Apparatus for communicating with voice recognition device, apparatus with voice recognition capability and controlling method thereof | |
KR102137151B1 (ko) | 노이즈 캔슬링 장치 및 그 방법 | |
US11480351B2 (en) | Air purifier and operating method of the same | |
US11448412B2 (en) | Air conditioner with an artificial intelligence | |
US10962663B2 (en) | Method, apparatus and system of detecting foreign objects in laundry machine | |
KR20190087351A (ko) | 머신 러닝 시스템, 방법 및 장치 | |
US20190391666A1 (en) | Gesture recognition apparatus and method | |
US11164565B2 (en) | Unsupervised learning system and method for performing weighting for improvement in speech recognition performance and recording medium for performing the method | |
KR102321855B1 (ko) | 음성으로 상호작용하는 인공 지능 장치 및 그 방법 | |
US11776544B2 (en) | Artificial intelligence apparatus for recognizing speech of user and method for the same | |
US11721334B2 (en) | Method and apparatus for controlling device located a distance away from a user | |
US20220254006A1 (en) | Artificial intelligence server | |
US11468886B2 (en) | Artificial intelligence apparatus for performing voice control using voice extraction filter and method for the same | |
US10916240B2 (en) | Mobile terminal and method of operating the same | |
US20210365769A1 (en) | Artificial intelligence apparatus for controlling auto stop system based on driving information and method for the same | |
KR20190116188A (ko) | 상황 인식에 기반한 방해 금지 모드 추천을 위한 장치 및 제어 방법 | |
KR20210052034A (ko) | 생체 정보의 위조 검증 장치 및 방법 | |
US11244695B2 (en) | Noise manageable electronic apparatus and method for controlling the same | |
KR20190119549A (ko) | 음성 기반의 액션 아이템 제안장치 및 제안방법 | |
Firos | Semantic Based Emotional Voice Coding Using Feed Forward Artificial Neural Network for Smart Home Devices | |
KR20190123362A (ko) | 인공지능을 이용한 음성 대화 분석 방법 및 장치 | |
Kulakov et al. | Sound and video processing in wireless sensor networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal |