KR101621797B1 - 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 - Google Patents
시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 Download PDFInfo
- Publication number
- KR101621797B1 KR101621797B1 KR1020140036631A KR20140036631A KR101621797B1 KR 101621797 B1 KR101621797 B1 KR 101621797B1 KR 1020140036631 A KR1020140036631 A KR 1020140036631A KR 20140036631 A KR20140036631 A KR 20140036631A KR 101621797 B1 KR101621797 B1 KR 101621797B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- average energy
- difference
- frame
- valid
- Prior art date
Links
- 230000035622 drinking Effects 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 3
- 239000003651 drinking water Substances 0.000 claims 1
- 235000020188 drinking water Nutrition 0.000 claims 1
- 235000019441 ethanol Nutrition 0.000 description 51
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 49
- 238000010586 diagram Methods 0.000 description 12
- 238000012850 discrimination method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/16—Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
- A61B5/18—Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state for vehicle drivers or machine operators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4803—Speech analysis specially adapted for diagnostic purposes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4845—Toxicology, e.g. by detection of alcohol, drug or toxic products
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K28/00—Safety devices for propulsion-unit control, specially adapted for, or arranged in, vehicles, e.g. preventing fuel supply or ignition in the event of potentially dangerous conditions
- B60K28/02—Safety devices for propulsion-unit control, specially adapted for, or arranged in, vehicles, e.g. preventing fuel supply or ignition in the event of potentially dangerous conditions responsive to conditions relating to the driver
- B60K28/06—Safety devices for propulsion-unit control, specially adapted for, or arranged in, vehicles, e.g. preventing fuel supply or ignition in the event of potentially dangerous conditions responsive to conditions relating to the driver responsive to incapacity of driver
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Biophysics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Psychiatry (AREA)
- Evolutionary Computation (AREA)
- Psychology (AREA)
- Developmental Disabilities (AREA)
- Epidemiology (AREA)
- Social Psychology (AREA)
- Educational Technology (AREA)
- Child & Adolescent Psychology (AREA)
- Hospice & Palliative Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physiology (AREA)
- Telephone Function (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
음주 판별 방법은, 입력된 음성 신호의 복수의 유효 프레임을 검출하는 단계; 유효 프레임의 원신호의 차신호를 검출하는 단계; 각 유효 프레임마다 원신호의 평균 에너지 및 차신호의 평균 에너지를 검출하는 단계; 및 각 유효 프레임마다 원신호의 평균 에너지와 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 단계를 포함한다. 이에 따라, 음성 신호를 이용한 차신호 에너지법에 의하여 원거리에 있는 운전자 또는 운항자의 음주 여부 및 정도를 파악할 수 있으므로, 음주 운전 또는 운항으로 인한 사고를 예방할 수 있다.
Description
본 발명은 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치에 관한 것으로서, 더욱 상세하게는 목소리를 이용한 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치에 관한 것이다.
적당한 양의 알코올 섭취는 사람에게 여러 가지 도움을 주지만 지나친 음주는 건강을 해친다. 또한, 음주 운전 후 운전으로 인한 사고는 대형 사고를 일으켜 목숨까지도 앗아간다.
음주 상태를 측정하는 방법으로는 알코올 센서가 장착된 호흡형 음주 측정기기를 사용하여 호흡 시에 내뿜는 공기에서 알코올 농도를 측정하는 방법과 레이저를 이용하여 혈류량에 포함된 알코올 농도를 측정하는 방법이 있다. 일반적으로 음주 단속에 사용되는 방법으로는 흔히 전자의 방법이 사용되는데, 일부 음주측정에 불복하는 운전자에 대해 운전자의 동의를 얻어 혈액 채취 등의 방법으로 혈중 알코올 농도를 추정하는 위드마크(Widmark) 공식을 사용하는 경우도 있다.
한편, 요즘 자동차뿐만 아니라 해양 및 항공에서의 음주운항으로 인한 사고도 문제되고 있으나, 기존의 음주 측정방법은 음주자를 직접 대면해서 측정하는 방법이므로 원거리에 있는 운항자의 음주 여부를 판단하기에는 적합하지 않다.
따라서, 해양 및 항공에서의 음주운항을 예방하기 위해 정부에서는 여러 가지 노력을 하고 있다. 그 노력의 일환으로 선박의 경우 운항 전과 후에 음주 측정을 하여 단속하지만 항해 중에는 측정이 어렵다. 물론 불시에 해양경찰청에서 해양 위에서의 직접 접촉을 통해 측정하기도 하지만 선박끼리의 접촉의 어려움과 도주 등의 위험으로 이 방법은 매우 위험하다.
대부분은 해양 위에 있는 운항자와의 통신을 통해 간접적으로 음주여부를 판별하지만, 이 또한 운항자가 음주를 부인하는 경우 음주 여부를 판단하기 어렵다. 그러므로, 원거리에서도 간접적이고 객관적인 운항자의 음주 여부 판단 방법이 필요하다.
이에, 본 발명의 기술적 과제는 이러한 점에서 착안된 것으로 본 발명의 목적은 통신 중 채취한 운항자의 음성을 분석하여 음주 여부 및 정도를 판단하기 위한 음주 판별 방법을 제공하는 것이다.
본 발명의 다른 목적은 상기 음주 판별 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 기록 매체를 제공하는 것이다.
본 발명의 또 다른 목적은 상기 음주 판별 방법을 수행하기 위한 장치를 제공하는 것이다.
상기한 본 발명의 목적을 실현하기 위한 일 실시예에 따른 음주 판별 방법은, 입력된 음성 신호의 복수의 유효 프레임을 검출하는 단계; 상기 유효 프레임의 원신호의 차신호를 검출하는 단계; 상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 단계; 및 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 단계를 포함한다.
본 발명의 실시예에서, 상기 음주 상태를 판단하는 단계는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 단계; 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 단계; 및 상기 카운트된 유효 프레임의 개수가 미리 정해진 제2 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 단계를 포함할 수 있다.
본 발명의 실시예에서, 상기 음주 상태를 판단하는 단계는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 단계; 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 단계; 상기 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출하는 단계; 및 상기 비율이 미리 정해진 제3 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 단계를 포함할 수 있다.
본 발명의 실시예에서, 상기 유효 프레임을 검출하는 단계는, 상기 입력된 음성 신호의 음성 프레임을 형성하는 단계; 및 상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 단계를 포함할 수 있다.
본 발명의 실시예에서, 상기 차신호를 검출하는 단계는, 상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하는 단계; 및 상기 원신호와 상기 시프트 신호와의 차신호(S(n)-S(n-1))를 출력하는 단계를 포함할 수 있다.
본 발명의 실시예에서, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 단계는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지를 검출하는 단계; 및 상기 각 유효 프레임마다 상기 차신호의 평균 에너지를 검출하는 단계를 포함할 수 있다.
상기한 본 발명의 다른 목적을 실현하기 위한 일 실시예에 따른 컴퓨터로 판독 가능한 저장 매체에는, 전술한 음주 판별 방법을 수행하기 위한 컴퓨터 프로그램이 기록되어 있다.
상기한 본 발명의 또 다른 목적을 실현하기 위한 일 실시예에 따른 음주 판별을 수행하기 위한 장치는, 입력된 음성 신호의 복수의 유효 프레임을 검출하는 유효 프레임 검출부; 상기 유효 프레임의 원신호의 차신호를 검출하는 차신호 검출부; 상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 에너지 검출부; 및 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 음주 판단부를 포함한다.
본 발명의 실시예에서, 상기 음주 판단부는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 에너지 비교부; 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 카운팅부; 및 상기 카운트된 유효 프레임의 개수가 미리 정해진 제2 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 결과 출력부를 포함할 수 있다.
본 발명의 실시예에서, 상기 음주 판단부는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 에너지 비교부; 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 카운팅부; 상기 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출하는 비율 산출부; 및 상기 비율이 미리 정해진 제3 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 결과 출력부를 포함할 수 있다.
본 발명의 실시예에서, 상기 음주 판단부는, 상기 제1 임계값, 상기 제2 임계값 및 상기 제3 임계값 중 적어도 하나를 미리 저장하는 저장부를 더 포함할 수 있다.
본 발명의 실시예에서, 상기 유효 프레임 검출부는, 상기 입력된 음성 신호의 음성 프레임을 형성하는 프레임 형성부; 및 상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 유성음 판단부를 포함할 수 있다.
본 발명의 실시예에서, 상기 차신호 검출부는, 상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하는 시프트 신호부; 및 상기 원신호와 상기 시프트 신호와의 차신호(S(n)-S(n-1))를 출력하는 차신호 출력부를 포함할 수 있다.
본 발명의 실시예에서, 상기 에너지 검출부는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지를 검출하는 제1 에너지 검출부; 및 상기 각 유효 프레임마다 상기 차신호의 평균 에너지를 검출하는 제2 에너지 검출부를 포함할 수 있다.
이와 같은 본 발명에 따르면, 시간 영역에서 음주 여부를 판단하는 것으로 음성 신호의 고주파를 강조하고 더 나아가 신호의 분석력을 높이기 위해서 차신호의 에너지 비교법을 이용하여, 원거리에 있는 운전자 또는 운항자의 음주 여부 및 정도를 파악할 수 있으며, 음주 전과 음주 후의 음성을 화자 독립과 화자 종속에 적용 가능하다.
따라서, 원거리에 있는 운전자 또는 운항자라도 통신에 의해 음성을 추출하여 음주 여부를 간접적이면서도 객관적으로 파악할 수 있으므로, 음주 운전 또는 운항으로 인한 사고를 예방할 수 있다.
도 1은 본 발명의 일 실시예에 따른 음주 판별을 수행하기 위한 장치의 블록도이다.
도 2는 도 1의 유효 프레임 검출부의 상세 블록도이다.
도 3은 도 2의 유효 프레임 검출부의 프레임 형성부에서 음성 신호를 음성 프레임으로 변환하는 개념을 설명하기 위한 도면이다.
도 4는 도 2의 유효 프레임 검출부의 유성음 판단부의 상세 블록도이다.
도 5는 도 1의 차신호 검출부의 상세 블록도이다.
도 6은 도 1의 에너지 검출부의 동작을 설명하기 위한 도면이다.
도 7은 도 1의 음주 판단부의 상세 블록도이다.
도 8은 본 발명의 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
도 9는 본 발명의 또 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
도 10은 본 발명의 일 실시예에 따른 음주 판별 방법의 흐름도이다.
도 2는 도 1의 유효 프레임 검출부의 상세 블록도이다.
도 3은 도 2의 유효 프레임 검출부의 프레임 형성부에서 음성 신호를 음성 프레임으로 변환하는 개념을 설명하기 위한 도면이다.
도 4는 도 2의 유효 프레임 검출부의 유성음 판단부의 상세 블록도이다.
도 5는 도 1의 차신호 검출부의 상세 블록도이다.
도 6은 도 1의 에너지 검출부의 동작을 설명하기 위한 도면이다.
도 7은 도 1의 음주 판단부의 상세 블록도이다.
도 8은 본 발명의 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
도 9는 본 발명의 또 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
도 10은 본 발명의 일 실시예에 따른 음주 판별 방법의 흐름도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 음주 판별을 수행하기 위한 장치의 블록도이다.
도 1을 참조하면, 본 실시예에 따른 음주 판별을 수행하기 위한 장치(10)는 입력된 음성 신호의 복수의 유효 프레임을 검출하는 유효 프레임 검출부(110), 상기 유효 프레임의 원신호의 차신호를 검출하는 차신호 검출부(130), 상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 에너지 검출부(150) 및 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 음주 판단부(170)를 포함한다.
본 발명의 상기 장치(10)는 음주 판별을 수행하기 위한 소프트웨어(애플리케이션)가 설치되어 실행될 수 있으며, 상기 유효 프레임 검출부(110) 등의 구성은 상기 장치(10)에서 실행되는 상기 음주 판별을 위한 소프트웨어에 의해 제어될 수 있다.
상기 장치(10)는 별도의 단말이거나 또는 단말의 일부 모듈일 수 있다. 상기 장치(10)는 이동성을 갖거나 고정될 수 있다. 상기 장치(10)는, 단말(terminal), UE(user equipment), MS(mobile station), MT(mobile terminal), UT(user terminal), SS(subscriber station), 무선기기(wireless device), PDA(personal digital assistant), 무선 모뎀(wireless modem), 휴대기기(handheld device) 등 다른 용어로 불릴 수 있다.
상기 장치(10)는 유선 또는 무선 통신을 지원하는 장치로서, 스마트 폰, 휴대 전화, 태블릿 컴퓨터, 노트북, 넷북, 피디에이(PDA), 피엠피(PMP), 피에스피(PSP), 엠피쓰리(MP3) 플레이어, 이북(e-book) 리더, 내비게이션, 스마트 카메라, 전자사전, 전자시계, 게임기 등 다양한 형태의 모바일(mobile) 장치뿐만 아니라 데스크 탑 컴퓨터, 스마트 TV 등의 전자 장치를 포함할 수 있다.
상기 장치(10)는 운영체제(Operation System; OS)를 기반으로 다양한 애플리케이션을 실행할 수 있다. 상기 운영체제는 애플리케이션이 장치의 하드웨어를 사용할 수 있도록 하기 위한 시스템 프로그램으로서, iOS, 안드로이드 OS, 윈도우 모바일 OS, 바다 OS, 심비안 OS, 블랙베리 OS 등 모바일 컴퓨터 운영체제 및 윈도우 계열, 리눅스 계열, 유닉스 계열, MAC, AIX, HP-UX 등 컴퓨터 운영체제를 모두 포함할 수 있다.
상기 애플리케이션은 단말기를 이용하여 특정한 작업을 수행할 수 있도록 개발된 프로그램으로서, 각종 응용 프로그램 및 서비스 객체뿐 아니라 게임, 동영상, 사진 등의 각종 멀티미디어 컨텐츠(contents) 또는 상기 멀티미디어 컨텐츠를 실행하는 이미지 뷰어, 동영상 재생기 등의 실행 프로그램을 모두 포함할 수 있다. 이하에서는, 애플리케이션으로 기재하나, 모든 응용 프로그램 및 실행 프로그램을 포함할 수 있다.
상기 유효 프레임 검출부(110)는 입력되는 사용자의 음성 신호의 복수의 유효 프레임을 검출하여 출력한다. 상기 음성 신호는 상기 장치(10)에 직접 입력되거나 통신에 의해 입력될 수 있다. 즉, 음성 신호는 상기 장치(10)에 구비된 마이크를 통해 입력되거나, 원격에서 송신될 수 있다.
도 2를 참조하면, 상기 유효 프레임 검출부(110)는 상기 입력된 음성 신호의 음성 프레임을 형성하는 프레임 형성부(111) 및 상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 유성음 판단부(113)를 포함한다.
상기 프레임 형성부(111)는 사람의 음성을 입력받아 음성 데이터로 변환하고, 음성 데이터를 프레임 단위의 음성 프레임 데이터로 변환하여 출력한다. 통상적으로 아날로그 음성 신호는 초당 8000개의 샘플과 16비트(65535단계)의 크기로 샘플링하여 음성데이터로 변환된다.
상기 프레임 형성부(111)는 입력되는 음성 신호를 음성 데이터로 변환하고, 음성 데이터를 프레임 단위의 음성 프레임 데이터로 변환할 수 있다. 여기서, 하나의 음성 프레임 데이터는 256개의 에너지 값을 갖게 된다.
음성 데이터는 도 3에서와 같이, 입력되는 음성에 따라 다수의 음성 프레임들(n=프레임의 개수, n=1,2,3,...)로 구성된다. 상기 프레임 형성부(111)는 음성 프레임을 생성한 후, 그 정보를 상기 유성음 판단부(113)로 출력한다.
상기 유성음 판단부(113)는 음성 프레임을 입력받아 기 설정된 특징들을 추출하고, 추출된 특징들에 따라 입력된 음성 프레임이 유성음, 무성음 또는 잡음에 대한 것인지 여부를 분석한다. 그 분석 결과에 따라 음성 프레임 중 유성음에 대한 프레임만 분리하여 출력할 수 있다.
도 4를 참조하면, 상기 유성음 판단부(113)는 음성 프레임을 입력받아 기 설정된 특징들을 추출하는 특징 추출부(113a)와, 음성 프레임의 인식 결과를 도출하는 인식부(113b)와, 인식 결과에 따라 입력된 음성 프레임이 유성음에 대한 것인지 무성음에 대한 것인지, 또는 배경 잡음에 의한 것인지를 판별하는 판단부(113c)와, 판별 결과에 따라 유효 프레임을 분리하여 출력하는 분리 출력부(113d)를 포함할 수 있다.
상기 특징 추출부(113a)는 상기 프레임 형성부(111)를 통해 음성 프레임이 입력되면, 그 음성 프레임으로부터 고조파의 주기적 특성 또는 저대역 음성 신호 에너지 영역의 크기(RMSE: Root Mean Squared Energy of Signal)나 0점 교차 횟수(Zero-Crossing Count: ZC) 등과 같은 특징들을 추출할 수 있다.
상기 인식부(113b)는 일반적으로 신경망으로 구성될 수 있다. 이는 신경망의 특성상, 비선형적, 즉 수학적으로 해결 가능하지 않은 복잡한 문제들을 분석하는데 유용하기 때문에, 음성 신호들을 분석하고, 분석된 결과에 따라 해당 음성 신호를 유성음 또는 무성음 및 배경 잡음으로 판단하기에 적합하기 때문이다. 이러한 신경망으로 구성된 상기 인식부(113b)는 상기 특징 추출부(113a)로부터 추출된 특징들에 기 설정된 가중치를 부여하고, 신경망 계산 과정을 통해 음성 프레임의 인식 결과를 도출할 수 있다. 여기서 인식 결과라는 것은 음성 프레임에 대해 각 음성 프레임의 특징 별로 부여된 가중치에 따라 각각의 계산 요소를 계산한 결과, 산출된 값을 말한다.
상기 판단부(113c)는 상술한 인식 결과, 즉 상기 인식부(113b)로부터 산출된 값에 따라 입력된 음성 신호가 유성음인지 무성음인지에 대한 판단을 하고, 상기 판단부(113c)의 판단 결과에 따라 상기 분리 출력부(113d)는 음성 프레임을 유성음, 무성음 또는 배경잡음으로 분리한다.
한편, 유성음의 경우 다양한 특징들이 무성음 및 배경 잡음과 확연히 차이가 나므로, 이를 구분하기는 상대적으로 쉬운 편이며 공지된 여러 가지 기술이 있다. 예를 들어, 유성음의 경우 고조파가 일정 주기를 반복하여 나타나는 주기적 특성을 가지고 있는 반면, 배경 잡음은 고조파라는 특징을 가지지 않는다.
그런데, 무성음의 경우에는 고조파가 있기는 하여도 그것이 가지는 주기성이 약하다. 다시 말해, 유성음의 경우 고조파가 하나의 프레임 안에서도 반복된다는 특성이 있으나, 무성음의 경우 고조파가 있다고는 하나, 고조파의 주기성과 같은 유성음의 특성이, 몇 개 이상의 프레임에 걸쳐서 나타나게 될 정도로 약하게 나타난다는 특성이 있다.
상기 유성음 판단부(113)가 유성음, 무성음 또는 배경잡음을 분리하면, 상기 유효 프레임 검출부(110)는 유성음에 대한 프레임만 출력한다. 이와 같이 출력된 유성음에 대한 프레임을 유효 프레임의 원신호(S(n))라 하며, 상기 유효 프레임의 원신호(S(n))는 상기 차신호 검출부(130)로 전달된다.
도 5를 참조하면, 상기 차신호 검출부(130)는 상기 유효 프레임의 원신호(S(n))의 차신호(S(n)-S(n-1))를 출력하기 위해 시프트 신호부(131) 및 차신호 출력부(133)를 포함한다.
상기 시프트 신호부(131)는 상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하고, 상기 차신호 출력부(133)는 상기 원신호와 상기 시프트 신호(S(n-1))와의 차신호(S(n)-S(n-1))를 출력한다.
음주 전 후의 특징으로는 비음의 특성처럼 고주파 성분이 상승하는 것으로 보고되어 있는데, 저주파 성분은 거의 변화가 없지만 고주파 성분에서 상당한 차이가 나는 현상을 보이고 있다. 이는 음주 후에는 청각 기능이 저하되어 잘 들리지 않아 화자가 소리를 크게 내게 되고 소리를 크게 내려면 입도 크게 벌리게 되고 이로써 폐활량이 증가하여 에너지에 영향을 주기 때문이다. 또한, 술에 취할 경우 음성이 적정한 음량을 일정하게 지키지 못하고 너무 커지거나 너무 작아지는 것이 일반적이기 때문에 술 마신 후 말하는 크기의 편차가 심해진다.
본 발명에서는 원신호의 차신호를 구하게 되는데 이렇게 구해진 신호는 고주파 성분이 강조된 특성을 보인다. 따라서, 음주 전 후의 차이를 더욱 강조할 수 있고, 차신호를 이용하여 고주파의 분석이 더욱 용이해진다.
상기 에너지 검출부(150)는 상기 각 유효 프레임마다 상기 원신호(S(n))의 평균 에너지를 검출하고, 마찬가지로 상기 각 유효 프레임마다 상기 차신호(S(n)-S(n-1))의 평균 에너지를 검출한다.
도 6를 참조하면, 상기 에너지 검출부(150)에서 산출하는 평균 에너지는 표본 n에 대해서 단시간(short time) 에너지 "n-N+1" 에서 "n"까지 N개의 표본의 제곱의 합으로 계산되며 그 수식은 다음의 수학식 1과 같다.
[수학식 1]
수학식 1을 통해, 유성음으로 판별된 유효 프레임 각각의 평균 에너지가 산출될 수 있다. 그러나, 상기 평균 에너지는 다른 공지된 기술로 산출될 수 있음은 물론이다.
상기 에너지 검출부(150)는 상기 각 유효 프레임마다 상기 원신호(S(n))의 평균 에너지를 검출하는 제1 에너지 검출부(151) 및 상기 각 유효 프레임마다 상기 차신호(S(n)-S(n-1))의 평균 에너지를 검출하는 제2 에너지 검출부(152)를 포함할 수 있다.
본 실시예에서는 상기 유효 프레임의 원신호(S(n))와 상기 유효 프레임의 차신호(S(n)-S(n-1))가 별도의 에너지 검출부에서 에너지 검출이 수행되나, 다른 실시예로서, 상기 에너지 검출부(150)는 상기 유효 프레임의 원신호(S(n)) 및 상기 유효 프레임의 차신호(S(n)-S(n-1))의 에너지 검출을 동시에, 임의의 순서로 또는 차례로 수행할 수도 있다.
상기 n번째 유효 프레임의 원신호(S(n))의 평균 에너지(E1(n)) 및 상기 n번째 유효 프레임의 차신호(S(n)-S(n-1))의 평균 에너지(E2(n))는 상기 음주 판단부(170)로 출력된다.
상기 음주 판단부(170)는 상기 유효 프레임의 원신호(S(n))의 평균 에너지(E1) 및 상기 유효 프레임의 차신호(S(n)-S(n-1))의 평균 에너지(E2)의 차이를 구하여 음주 상태를 판단한다.
음주를 하게 되면 목소리의 크기를 제어하는 능력이 저하되어 고주파 성분의 에너지 변화가 크므로, 상기 음주 판단부(170)는 일정 구간 동안의 고주파 성분의 에너지 변화에 대한 차이에 따라 음주 여부를 판별할 수 있게 된다.
도 7을 참조하면, 상기 음주 판단부(170)는 에너지 비교부(171), 카운팅부(173) 및 결과 출력부(177)를 포함한다.
상기 에너지 비교부(171)는 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지를 비교하여 차이값을 출력한다. n번째 유효 프레임의 평균 에너지 차이값(ER(n))은 다음과 같은 수학식 2에 의해 산출될 수 있다.
[수학식 2]
여기서, E1(n)은 상기 n번째 유효 프레임의 원신호(S(n))의 평균 에너지이고, E2(n)은 상기 n번째 유효 프레임의 차신호(S(n)-S(n-1))의 평균 에너지이며, α, β는 평균 에너지 차이값을 보다 쉽게 인지할 수 있도록 미리 설정된 상수값이다.
상기 카운팅부(173)는 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값(ER(n))이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운팅한다. 상기 제1 임계값은 미리 설정되어 저장될 수 있으며, 일률적으로 적용할 수 있다. 상기 제1 임계값은 실험에 의해 설정된 최적값일 수 있다. 한편, 성별, 나이에 따라 다른 임계값이 적용되거나 개인 맞춤형으로 서로 다른 제1 임계값이 적용될 수도 있다.
상기 결과 출력부(177)는 상기 카운트된 유효 프레임의 개수가 미리 정해진 제2 임계값보다 크면 음주 상태로 판단하여 결과를 출력한다. 예를 들어, 상기 제2 임계값을 5로 정한 경우, 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수가 5보다 크면 음주 상태로 판단하는 것이다.
본 실시예에서 도시하지는 않았으나, 상기 음주 판단부(170)는 상기 제1 임계값 및 상기 제2 임계값이 저장된 저장부를 더 포함할 수 있을 것이다.
도 8은 본 발명의 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
본 실시예에 따른 음주 판단부는, 비율 산출부(175)를 더 포함하는 것을 제외하고, 도 7의 음주 판단부와 실질적으로 동일하다. 따라서, 도 7의 음주 판단부와 동일한 구성요소는 동일한 도면부호를 부여하고, 반복되는 설명은 생략한다.
상기 비율 산출부(175)는 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값(ER(n))이 미리 정해진 제1 임계값보다 크다고 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출한다.
상기 비율 산출부(175)는 카운팅부(173)에 의해 산출된 결과를 전체 유효 프레임(유성음으로 판단된 전체 음성 프레임)의 개수와 비교하여 그 비율을 산출한다. 상기 비율 산출부(175)는 다음 수학식 3에 따라 비율(R)을 산출한다.
[수학식 3]
여기서, C는 카운팅된 개수이며, T는 전체 유효 프레임의 개수이다.
상기 결과 출력부(177)는 상기 비율(R)이 미리 정해진 제3 임계값보다 크면 고주파 성분의 에너지 변화가 큰 것이므로, 음주 상태로 판단하여 결과를 출력한다.
도 9는 본 발명의 또 다른 실시예에 따른 음주 판별을 수행하기 위한 장치의 음주 판단부의 상세 블록도이다.
본 실시예에 따른 음주 판단부는, 저장부(179)를 더 포함하는 것을 제외하고, 도 8의 음주 판단부와 실질적으로 동일하다. 따라서, 도 8의 음주 판단부와 동일한 구성요소는 동일한 도면부호를 부여하고, 반복되는 설명은 생략한다.
상기 저장부(179)는 상기 제1 임계값, 상기 제2 임계값 및 상기 제3 임계값 중 적어도 하나를 미리 저장한다. 상기 제1 임계값, 상기 제2 임계값 및 상기 제3 임계값들은 실험에 의해 설정된 최적값일 수 있다. 한편, 성별, 나이에 따라 다른 임계값이 적용되거나 개인 맞춤형으로 서로 다른 임계값들이 적용될 수도 있다. 또한, 상기 임계값들은 추후 변경, 삭제, 저장, 추가 등이 가능하다.
본 발명에 따른 상기 음주 판별 장치는 음성 신호의 시간 영역에서 음주 여부를 판단하고, 특히 음성 신호의 고주파를 강조하고 더 나아가 신호의 분석력을 높이기 위해 차신호의 에너지 비교법을 사용하였다. 이는 저주파의 특성을 최대한 줄이고 고주파 특성을 강조함으로써 에너지 변화를 분석하기 위함이며, 원신호와 차신호의 평균 에너지 차를 구하여 프래임별 에너지 편차를 구한다. 이러한 평균 에너지 차이는 비교 음주자의 특성을 대변하고 이를 파라미터로 사용하여 객관적으로 음주 상태를 판별하게 된다.
도 10은 본 발명의 일 실시예에 따른 음주 판별 방법의 흐름도이다.
본 실시예에 따른 음주 판별 방법은, 도 1의 장치(10)와 실질적으로 동일한 구성에서 진행될 수 있다. 따라서, 도 1의 장치(10)와 동일한 구성요소는 동일한 도면부호를 부여하고, 반복되는 설명은 생략한다.
또는, 본 실시예에 따른 음주 판별 방법은 음주 판별을 위한 소프트웨어(애플리케이션)에 의해 실행될 수 있다.
도 10을 참조하면, 본 실시예에 따른 음주 판별 방법은, 입력된 음성 신호의 유효 프레임을 검출한다(단계 S110).
상기 유효 프레임을 검출하는 단계(단계 S110)는, 상기 입력된 음성 신호의 음성 프레임을 형성하는 단계 및 상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 단계를 포함할 수 있다.
구체적으로, 사람의 음성을 입력받아 음성 데이터로 변환하고, 음성 데이터를 프레임 단위의 음성 프레임 데이터로 변환한 후, 음성 프레임이 유성음, 무성음 또는 잡음에 대한 것인지 여부를 분석한다. 그 분석 결과에 따라 유성음에 대한 프레임, 즉 유효 프레임만 출력할 수 있다.
상기 유효 프레임이 검출되면, 상기 유효 프레임의 원신호의 차신호를 검출한다(단계 S130).
상기 차신호를 검출하는 단계(단계 S130)는, 상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하는 단계 및 상기 원신호와 상기 시프트 신호와의 차신호(S(n)-S(n-1))를 출력하는 단계를 포함할 수 있다.
상기 차신호는 고주파 성분이 강조된 특성을 보이므로, 음주 전 후의 차이를 더욱 강조할 수 있고, 차신호를 이용하여 고주파의 분석이 더 용이해진다.
상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출한다(단계 S150).
상기 평균 에너지를 검출하는 단계(단계 S150)는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지를 검출하는 단계 및 상기 각 유효 프레임마다 상기 차신호의 평균 에너지를 검출하는 단계를 포함할 수 있다.
이와 다르게, n번째 유효 프레임의 원신호의 평균 에너지(E1(n)) 및 n번째 유효 프레임의 차신호의 평균 에너지(E2(n))는 동시에, 임의의 순서로 또는 차례로 검출될 수도 있다.
상기 n번째 유효 프레임의 원신호의 평균 에너지(E1(n)) 및 상기 n번째 유효 프레임의 차신호의 평균 에너지(E2(n)) 차이에 기초하여 음주 상태를 판단한다(단계 S170).
상기 음주 상태를 판단하는 단계(단계 S170)는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 단계, 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 단계 및 상기 카운트된 유효 프레임의 개수가 미리 정해진 제2 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 단계를 포함할 수 있다.
다른 실시예에서, 상기 음주 상태를 판단하는 단계(단계 S170)는, 상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 단계, 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 단계, 상기 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출하는 단계 및 상기 비율이 미리 정해진 제3 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 단계를 포함할 수 있다.
또한, 상기 제1 임계값, 상기 제2 임계값 및 상기 제3 임계값 중 적어도 하나를 미리 설정되어 저장될 수 있으며, 일률적으로 적용할 수 있다. 상기 임계값들은 실험에 의해 설정된 최적값일 수 있다. 한편, 성별, 나이에 따라 다른 임계값들이 적용되거나 개인 맞춤형으로 서로 다른 임계값들이 적용될 수도 있다.
이와 같은, 음주 판별 방법은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
본 발명에 따른 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치는, 원거리에 있는 운전자 또는 운항자의 음주 여부를 통신을 통해 파악할 수 있으므로 음주 운전 또는 운항으로 인한 사고를 예방할 수 있다. 또한, 선박뿐 아니라 철도, 항공기, 자동차, 버스, 고속도로 등 근접거리에서 측정이 어려운 수송기관 및 국내외 모든 해상 및 항공 교통관제서비스 시스템에 장착하는 등 널리 적용 가능하다. 나아가, 개인 휴대폰으로 음주를 측정하는 웹 어플리케이션에 기여할 수 있다.
10: 장치 110: 유효 프레임 검출부
130: 차신호 검출부 150: 에너지 검출부
170: 음주 판단부
130: 차신호 검출부 150: 에너지 검출부
170: 음주 판단부
Claims (14)
- 입력된 음성 신호의 복수의 유효 프레임을 검출하는 단계;
상기 유효 프레임의 원신호의 차신호를 검출하는 단계;
상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 단계; 및
상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 단계를 포함하고,
상기 음주상태를 판단하는 단계는,
상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 단계;
상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 단계;
상기 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출하는 단계; 및
상기 비율이 미리 정해진 제3 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 단계를 포함하는, 음주 판별 방법.
- 삭제
- 삭제
- 제1항에 있어서,
상기 유효 프레임을 검출하는 단계는,
상기 입력된 음성 신호의 음성 프레임을 형성하는 단계; 및
상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 단계를 포함하는, 음주 판별 방법.
- 제1항에 있어서,
상기 차신호를 검출하는 단계는,
상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하는 단계; 및
상기 원신호와 상기 시프트 신호와의 차신호(S(n)-S(n-1))를 출력하는 단계를 포함하는, 음주 판별 방법.
- 제1항에 있어서,
상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 단계는,
상기 각 유효 프레임마다 상기 원신호의 평균 에너지를 검출하는 단계; 및
상기 각 유효 프레임마다 상기 차신호의 평균 에너지를 검출하는 단계를 포함하는, 음주 판별 방법.
- 제1항 및 제4항 내지 제6항 중 어느 하나의 항에 따른 음주 판별 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.
- 입력된 음성 신호의 복수의 유효 프레임을 검출하는 유효 프레임 검출부;
상기 유효 프레임의 원신호의 차신호를 검출하는 차신호 검출부;
상기 각 유효 프레임마다 상기 원신호의 평균 에너지 및 상기 차신호의 평균 에너지를 검출하는 에너지 검출부; 및
상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이에 기초하여 음주 상태를 판단하는 음주 판단부를 포함하고,
상기 음주 판단부는,
상기 각 유효 프레임마다 상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지 차이를 비교하여 차이값을 출력하는 에너지 비교부;
상기 원신호의 평균 에너지와 상기 차신호의 평균 에너지의 차이값이 미리 정해진 제1 임계값보다 큰 유효 프레임의 개수를 카운트하는 카운팅부;
상기 카운트된 유효 프레임의 개수를 전체 유효 프레임 개수와 비교하여 비율을 산출하는 비율 산출부; 및
상기 비율이 미리 정해진 제3 임계값보다 크면 음주 상태로 판단하여 결과를 출력하는 결과 출력부를 포함하는, 음주 판별 장치.
- 삭제
- 삭제
- 제8항에 있어서,
상기 음주 판단부는,
상기 제1 임계값 및 상기 제3 임계값 중 적어도 하나를 미리 저장하는 저장부를 더 포함하는, 음주 판별 장치.
- 제8항에 있어서,
상기 유효 프레임 검출부는,
상기 입력된 음성 신호의 음성 프레임을 형성하는 프레임 형성부; 및
상기 음성 프레임이 유성음에 해당하는지 여부를 판단하는 유성음 판단부를 포함하는, 음주 판별 장치.
- 제8항에 있어서,
상기 차신호 검출부는,
상기 유효 프레임의 원신호(S(n))를 시프트 한 시프트 신호(S(n-1))를 생성하는 시프트 신호부; 및
상기 원신호와 상기 시프트 신호와의 차신호(S(n)-S(n-1))를 출력하는 차신호 출력부를 포함하는, 음주 판별 장치.
- 제8항에 있어서,
상기 에너지 검출부는,
상기 각 유효 프레임마다 상기 원신호의 평균 에너지를 검출하는 제1 에너지 검출부; 및
상기 각 유효 프레임마다 상기 차신호의 평균 에너지를 검출하는 제2 에너지 검출부를 포함하는, 음주 판별 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140036631A KR101621797B1 (ko) | 2014-03-28 | 2014-03-28 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
PCT/KR2014/002851 WO2015147364A1 (ko) | 2014-03-28 | 2014-04-02 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
US15/300,217 US9943260B2 (en) | 2014-03-28 | 2014-04-02 | Method for judgment of drinking using differential energy in time domain, recording medium and device for performing the method |
CN201480077595.9A CN106133835B (zh) | 2014-03-28 | 2014-04-02 | 用于使用时域中的差分能量判断饮酒的方法、用于执行该方法的记录介质和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140036631A KR101621797B1 (ko) | 2014-03-28 | 2014-03-28 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150113380A KR20150113380A (ko) | 2015-10-08 |
KR101621797B1 true KR101621797B1 (ko) | 2016-05-17 |
Family
ID=54195858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140036631A KR101621797B1 (ko) | 2014-03-28 | 2014-03-28 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9943260B2 (ko) |
KR (1) | KR101621797B1 (ko) |
CN (1) | CN106133835B (ko) |
WO (1) | WO2015147364A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102825B (zh) * | 2018-07-27 | 2021-06-04 | 科大讯飞股份有限公司 | 一种饮酒状态检测方法及装置 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9419388D0 (en) | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
KR100206205B1 (ko) | 1995-12-23 | 1999-07-01 | 정몽규 | 음성 인식 기능을 이용한 음주운전 방지장치 및 방법 |
KR970038004U (ko) | 1995-12-30 | 1997-07-29 | 자동차 본네트의 접합구조 | |
US6446038B1 (en) | 1996-04-01 | 2002-09-03 | Qwest Communications International, Inc. | Method and system for objectively evaluating speech |
US5776055A (en) | 1996-07-01 | 1998-07-07 | Hayre; Harb S. | Noninvasive measurement of physiological chemical impairment |
KR100201256B1 (ko) * | 1996-08-27 | 1999-06-15 | 윤종용 | 음성을 이용한 차량 시동 제어장치 |
JP2955247B2 (ja) | 1997-03-14 | 1999-10-04 | 日本放送協会 | 話速変換方法およびその装置 |
US6006188A (en) | 1997-03-19 | 1999-12-21 | Dendrite, Inc. | Speech signal processing for determining psychological or physiological characteristics using a knowledge base |
KR19990058415A (ko) | 1997-12-30 | 1999-07-15 | 윤종용 | 음주 운전 방지 시스템 |
WO2001007281A1 (en) | 1999-07-24 | 2001-02-01 | Novtech Co Ltd | Apparatus and method for prevention of driving of motor vehicle under the influence of alcohol and prevention of vehicle theft |
US7222075B2 (en) | 1999-08-31 | 2007-05-22 | Accenture Llp | Detecting emotions using voice signal analysis |
US6275806B1 (en) | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6427137B2 (en) | 1999-08-31 | 2002-07-30 | Accenture Llp | System, method and article of manufacture for a voice analysis system that detects nervousness for preventing fraud |
JP4696418B2 (ja) | 2001-07-25 | 2011-06-08 | ソニー株式会社 | 情報検出装置及び方法 |
DE60115653T2 (de) | 2001-10-05 | 2006-08-10 | Sony Deutschland Gmbh | Verfahren zur Detektion von Emotionen, unter Verwendung von Untergruppenspezialisten |
US7283962B2 (en) | 2002-03-21 | 2007-10-16 | United States Of America As Represented By The Secretary Of The Army | Methods and systems for detecting, measuring, and monitoring stress in speech |
KR100497837B1 (ko) | 2002-10-16 | 2005-06-28 | 이시우 | 유무선 통신망과 음성신호를 이용한 음주상태의 안내서비스 시스템 |
US8972266B2 (en) | 2002-11-12 | 2015-03-03 | David Bezar | User intent analysis extent of speaker intent analysis system |
US20040167774A1 (en) | 2002-11-27 | 2004-08-26 | University Of Florida | Audio-based method, system, and apparatus for measurement of voice quality |
KR100511316B1 (ko) | 2003-10-06 | 2005-08-31 | 엘지전자 주식회사 | 음성신호의 포만트 주파수 검출방법 |
EP1531458B1 (en) | 2003-11-12 | 2008-04-16 | Sony Deutschland GmbH | Apparatus and method for automatic extraction of important events in audio signals |
US8938390B2 (en) | 2007-01-23 | 2015-01-20 | Lena Foundation | System and method for expressive language and developmental disorder assessment |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
US8478596B2 (en) | 2005-11-28 | 2013-07-02 | Verizon Business Global Llc | Impairment detection using speech |
KR100664271B1 (ko) | 2005-12-30 | 2007-01-04 | 엘지전자 주식회사 | 음원분리가 가능한 휴대용 단말기 및 그 방법 |
KR100717625B1 (ko) | 2006-02-10 | 2007-05-15 | 삼성전자주식회사 | 음성 인식에서의 포먼트 주파수 추정 방법 및 장치 |
KR100762596B1 (ko) | 2006-04-05 | 2007-10-01 | 삼성전자주식회사 | 음성 신호 전처리 시스템 및 음성 신호 특징 정보 추출방법 |
EP1850328A1 (en) | 2006-04-26 | 2007-10-31 | Honda Research Institute Europe GmbH | Enhancement and extraction of formants of voice signals |
US7962342B1 (en) * | 2006-08-22 | 2011-06-14 | Avaya Inc. | Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns |
US7925508B1 (en) * | 2006-08-22 | 2011-04-12 | Avaya Inc. | Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns |
EP2063416B1 (en) | 2006-09-13 | 2011-11-16 | Nippon Telegraph And Telephone Corporation | Feeling detection method, feeling detection device, feeling detection program containing the method, and recording medium containing the program |
JPWO2008096421A1 (ja) * | 2007-02-07 | 2010-05-20 | パイオニア株式会社 | 酒酔い運転防止装置、酒酔い運転防止方法、及び、酒酔い運転防止プログラム |
US8990073B2 (en) | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
KR101441896B1 (ko) | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
JP5077107B2 (ja) | 2008-07-04 | 2012-11-21 | 日産自動車株式会社 | 車両用飲酒検知装置及び車両用飲酒検知方法 |
WO2010148141A2 (en) | 2009-06-16 | 2010-12-23 | University Of Florida Research Foundation, Inc. | Apparatus and method for speech analysis |
WO2011011413A2 (en) | 2009-07-20 | 2011-01-27 | University Of Florida Research Foundation, Inc. | Method and apparatus for evaluation of a subject's emotional, physiological and/or physical state with the subject's physiological and/or acoustic data |
US9613630B2 (en) | 2009-11-12 | 2017-04-04 | Lg Electronics Inc. | Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual |
JP5834449B2 (ja) | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
US9058816B2 (en) | 2010-07-06 | 2015-06-16 | Rmit University | Emotional and/or psychiatric state detection |
WO2012014301A1 (ja) | 2010-07-29 | 2012-02-02 | ユニバーサルロボット株式会社 | 飲酒状態判定装置及び飲酒状態判定方法 |
JP5709980B2 (ja) | 2011-04-08 | 2015-04-30 | 三菱電機株式会社 | 音声認識装置およびナビゲーション装置 |
WO2012152323A1 (en) | 2011-05-11 | 2012-11-15 | Robert Bosch Gmbh | System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure |
US9801590B2 (en) | 2011-05-17 | 2017-10-31 | University Health Network | Breathing disorder identification, characterization and diagnosis methods, devices and systems |
ES2364401B2 (es) | 2011-06-27 | 2011-12-23 | Universidad Politécnica de Madrid | Método y sistema para la estimación de parámetros fisiológicos de la fonación. |
JP5664480B2 (ja) | 2011-06-30 | 2015-02-04 | 富士通株式会社 | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム |
US20130158434A1 (en) * | 2011-12-20 | 2013-06-20 | Delta Electronics, Inc. | Apparatus for voice assisted medical diagnosis |
CN102646415B (zh) * | 2012-04-10 | 2014-07-23 | 苏州大学 | 一种语音识别中的特征参数提取方法 |
WO2014115115A2 (en) | 2013-01-24 | 2014-07-31 | B. G. Negev Technologies And Applications Ltd. | Determining apnea-hypopnia index ahi from speech |
JP6263868B2 (ja) | 2013-06-17 | 2018-01-24 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
KR101475894B1 (ko) | 2013-06-21 | 2014-12-23 | 서울대학교산학협력단 | 장애 음성 개선 방법 및 장치 |
CN104347067B (zh) | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
US20150127343A1 (en) * | 2013-11-04 | 2015-05-07 | Jobaline, Inc. | Matching and lead prequalification based on voice analysis |
KR101621774B1 (ko) * | 2014-01-24 | 2016-05-19 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
KR101621766B1 (ko) * | 2014-01-28 | 2016-06-01 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
US20150262429A1 (en) * | 2014-03-13 | 2015-09-17 | Gary Stephen Shuster | Systems, devices and methods for sensory augmentation to achieve desired behaviors or outcomes |
KR20150123579A (ko) | 2014-04-25 | 2015-11-04 | 삼성전자주식회사 | 사용자 음성으로부터 감정정보를 확인하는 방법 및 장치 |
-
2014
- 2014-03-28 KR KR1020140036631A patent/KR101621797B1/ko active IP Right Grant
- 2014-04-02 WO PCT/KR2014/002851 patent/WO2015147364A1/ko active Application Filing
- 2014-04-02 US US15/300,217 patent/US9943260B2/en active Active
- 2014-04-02 CN CN201480077595.9A patent/CN106133835B/zh active Active
Non-Patent Citations (2)
Title |
---|
배성근, ‘음주운항 단속을 위한 음성감시시스템 개선에 관한 연구’, 숭실대학교 대학원 정보통신공학과, 박사학위논문, 2014년 2월.* |
이원희 외 2명, ‘음주·비음주 음성의 유효프레임 거리 편차에 관한 연구’, 한국통신학회 2014년도 동계종합학술발표회, pp.876-8797, 2014년 1월.* |
Also Published As
Publication number | Publication date |
---|---|
CN106133835A (zh) | 2016-11-16 |
US20170135620A1 (en) | 2017-05-18 |
CN106133835B (zh) | 2020-02-07 |
KR20150113380A (ko) | 2015-10-08 |
US9943260B2 (en) | 2018-04-17 |
WO2015147364A1 (ko) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106531172B (zh) | 基于环境噪声变化检测的说话人语音回放鉴别方法及系统 | |
KR101721303B1 (ko) | 백그라운드 잡음의 존재에서 음성 액티비티 검출 | |
KR101621774B1 (ko) | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
US20170140773A1 (en) | Context and environment aware volume control in telephonic conversation | |
EP2407960B1 (en) | Audio signal detection method and apparatus | |
KR101621766B1 (ko) | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 | |
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
KR101621780B1 (ko) | 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
US20190057705A1 (en) | Methods and apparatus to identify a source of speech captured at a wearable electronic device | |
CN109634554B (zh) | 用于输出信息的方法和装置 | |
KR101621797B1 (ko) | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
EP3594948B1 (en) | Audio signal classifier | |
KR101621778B1 (ko) | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 | |
KR101569343B1 (ko) | 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
US20150279373A1 (en) | Voice response apparatus, method for voice processing, and recording medium having program stored thereon | |
KR101547261B1 (ko) | 화자 식별 방법 | |
Ong et al. | Real-time Voice Activity Detector Using Gammatone Filter and Modified Long-Term Signal Variability | |
Rennies et al. | Speech privacy-aware acquisition of acoustic information based on deep learning algorithms | |
Mathivanan et al. | Multi Channel Voice Active Detection Using Instance Filed Auto-Interrelation Function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190401 Year of fee payment: 4 |