KR101265841B1 - 음성기록 피드백 시스템 및 방법 - Google Patents

음성기록 피드백 시스템 및 방법 Download PDF

Info

Publication number
KR101265841B1
KR101265841B1 KR1020110088394A KR20110088394A KR101265841B1 KR 101265841 B1 KR101265841 B1 KR 101265841B1 KR 1020110088394 A KR1020110088394 A KR 1020110088394A KR 20110088394 A KR20110088394 A KR 20110088394A KR 101265841 B1 KR101265841 B1 KR 101265841B1
Authority
KR
South Korea
Prior art keywords
voice
variable
input
stored
recording feedback
Prior art date
Application number
KR1020110088394A
Other languages
English (en)
Other versions
KR20130025080A (ko
Inventor
김근호
김영수
이유정
김종열
Original Assignee
한국 한의학 연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국 한의학 연구원 filed Critical 한국 한의학 연구원
Priority to KR1020110088394A priority Critical patent/KR101265841B1/ko
Publication of KR20130025080A publication Critical patent/KR20130025080A/ko
Application granted granted Critical
Publication of KR101265841B1 publication Critical patent/KR101265841B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 음성기록 피드백 시스템 및 방법에 관한 것으로서, 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는 음성 입력부, 상기 입력된 음성에 대한 기준 음성 변수를 추출하는 음성 변수 추출부, 상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성 저장 제어부, 및 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성기록 피드백 처리부를 포함할 수 있다.

Description

음성기록 피드백 시스템 및 방법{SYSTEM OF VOICE RECORDER FEEDBACK AND METHOD OF THE SAME}
본 발명은 음성기록 피드백 시스템 및 방법에 관한 것으로서, 사용자의 음성을 반복적으로 수집하여 가장 안정적인 음성만을 수집하여 양질의 음성 파일을 생성하는 기술적 사상을 개시한다.
현대 사회는 건강에 대한 관심이 나날이 증가하고 있다.
이러한 시대적인 관심과 더불어, 실시간 데이터 수집에 의한 데이터 분석 방식 및 툴(tool)이 고도화되는 등 기술이 비약적으로 발전함에 따라서, 건강 상태를 모니터링하고 개인화된 건강관리 서비스를 제공받는 것이 가능하게 되었다.
또한, 소비자의 의식 변화에 따른 고객 요구의 다양화와 기대수준의 향상으로 건강 서비스 및 관련 시스템 이용의 편리성 및 맞춤화가 강화되고 있는 추세이며, 축적된 개인의 건강 데이터를 바탕으로 생활 습관병 예방이나 체중관리 등의 개인화(personalized) 건강관리 사업이 급속도로 성장하고 있다.
이는 과거 건강관리 서비스가 환자를 대상으로 병원이나 의료기관에서 이루어지는 질병 치료에만 국한되는 헬스케어(Healthcare) 중심으로 이루어졌다면, 최근 소비자들의 건강관리 니즈(needs)는 건강한 사람을 대상으로 하는 질병의 사전예방 및 건강유지로 선회되고 있음을 반증하는 결과이다.
다시 말해, 생활수준의 향상과 함께 삶의 질(Quality of Life)과 웰빙/wellness에 대한 관심이 증대하면서 소비자들은 차츰 건강상태 측정, 적정 운동량 관리 등의 사전 예방적인 건강관리에 대한 선호도가 높아지고 있다.
한방에서는 사용자의 목소리를 통해서 건강상태와 체질종류 등을 진단할 수 있다.
그러나, 환자나 노인, 또는 개인적인 습관, 예를 들어 헛기침 등으로 인해서 목소리가 제대로 분석되지 않는 경우가 많이 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템은 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는 음성 입력부, 상기 입력된 음성에 대한 기준 음성 변수를 추출하는 음성 변수 추출부, 상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성 저장 제어부, 및 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성기록 피드백 처리부를 포함할 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 입력부에서, 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는 단계, 음성 변수 추출부에서, 상기 입력된 음성에 대한 기준 음성 변수를 추출하는 단계, 음성 저장 제어부에서, 상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계, 및 음성기록 피드백 처리부에서, 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따르면, 사용자의 음성을 반복적으로 수집하여 가장 안정적인 음성만을 수집하여 양질의 음성 파일을 생성할 수 있다.
본 발명의 일실시예에 따르면, 단어/문장의 간격을 빈 간격으로 입력함으로써, 잡음의 영향을 최소화시킬 수 있다.
본 발명의 일실시예에 따르면, 녹음된 단어/문장을 이용하여 간섭없는 명확한 음성의 판별 및 분석이 가능하다.
도 1은 본 발명의 일실시예에 따른 음성기록 피드백 시스템이 적용된 컴퓨터와 주변 장치를 설명하는 블록도이다.
도 2는 본 발명의 일실시예에 따른 음성기록 피드백 시스템을 설명하는 블록도이다.
도 3은 본 발명의 일실시예에 따른 음성기록을 위한 지시 화면을 설명하는 도면이다.
도 4 내지 도 6은 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법을 설명하는 흐름도이다.
도 7 및 도 8은 본 발명의 일실시예에 따른 음성 파일의 구조를 설명하는 도면이다.
도 9는 본 발명의 다른 일실시예에 따른 음성기록 피드백 시스템의 동작 방법을 설명하는 흐름도이다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 바람직한 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 음성기록 피드백 시스템이 적용된 컴퓨터와 주변 장치들을 설명하는 블록도이다.
사용자의 음성은 마이크(110) 및 사운드 카드(120)를 통해서 컴퓨터(130)에 전달될 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템은 컴퓨터에 모듈 또는 소프트웨어의 형태로 구현될 수 있다. 즉, 사운드카드를 통해서 전달된 음성신호는 소프트웨어(131)를 통해서 여러 번 반복 입력되고, 그 중에서 가장 합리적인 음성이 결정되며, 상기 결정된 음성들을 조합하여 음성 파일(132)이 생성될 수 있다.
생성된 음성 파일(132)은 분석 알고리즘(133)을 통해서 다양한 분야에서 활용될 수 있다.
일례로, 상기 생성된 음성 파일(132)은 한의학에서 사용자의 건강상태나 체질정보를 확인하는데 이용될 수도 있다.
도 1에서는 본 발명의 일실시예에 따른 음성기록 피드백 시스템이 적용된 컴퓨터에 적용된 경우를 설명하였으나, 본 발명의 일실시예에 따른 음성기록 피드백 시스템은 모바일 폰, 휴대용 기기 등과 같은 소형 기기에도 적용될 수 있다.
도 2는 본 발명의 일실시예에 따른 음성기록 피드백 시스템(200)을 구체적으로 설명하는 블록도이다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템(200)은 음성 입력부(210), 음성 변수 추출부(220), 음성 저장 제어부(230), 음성기록 피드백 처리부(240), 음성 파일 생성부(250), 및 버퍼(260)를 포함할 수 있다.
음성 입력부(210)는 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는다.
다음으로, 음성 변수 추출부(220)는 상기 입력된 음성에 대한 기준 음성 변수를 추출할 수 있다.
본 발명의 일실시예에 따른 음성 변수 추출부(220)는 다양한 음성 변수를 추출할 수 있는데, 그 중에서 어떠한 음성 변수를 기준 음성 변수로 설정할 것인지는 사전에 결정될 수 있다.
예를 들어, 본 발명의 일실시예에 따른 음성 변수 추출부(220)는 상기 입력된 음성에 대한 최소 지속 시간, 주파수 특성, 강도의 특성, 및 주파수 표준 편차의 음성 변수들을 추출할 수 있고, 이중에서 음성에 대한 강도의 특성이 상기 기준 음성 변수로 결정될 수 있다.
즉, 입력되는 음성들 중에서 음성 파일에 삽입하기 위한 양질의 음성을 판단하는 기준이 음성의 강도가 될 수 있다.
음성 저장 제어부(230)는 상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼(260)에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
예를 들어, 상기 기준 음성 변수가 상기 강도의 특성인 경우, 음성 저장 제어부(230)는 일정 강도를 넘는 음성에 대해서만 버퍼에 저장할 수 있다.
음성기록 피드백 처리부(240)는 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
다시 말해, 음성기록 피드백 처리부(240)는 동일한 음성에 대해서 사전에 설정된 개수만큼 저장되도록 제어할 수 있다.
예를 들어, '아이'라는 단어를 3회 입력받기로 사전에 결정되었다면, 음성기록 피드백 처리부(240)는 사전에 설정된 3회만큼 상기 음성 '아이'가 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
음성 파일 생성부(250)는 상기 버퍼에 저장되어 있는 음성들 중에서 양질의 음성, 즉 선정된 기준을 만족하여 신뢰도가 높은 음성들만을 조합하여 음성 파일로 생성할 수 있다.
이때, 음성 파일 생성부(250)는 상기 결정된 음성에 널(null) 음성을 결합하여 상기 음성 파일을 생성할 수 있다.
결국, 본 발명의 일실시예에 따르면, 단어/문장의 간격을 빈 간격으로 입력함으로써, 잡음의 영향을 최소화시킬 수 있고, 녹음된 단어/문장을 이용하여 간섭없는 명확한 음성의 판별 및 분석이 가능하다.
본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 버퍼(260)에 사전에 설정된 개수만큼 상기 음성이 저장된 경우, 상기 저장된 음성의 기준 음성 변수를 확인하고, 가장 큰 값을 갖는 기준 음성 변수와 가장 작은 값을 갖는 기준 음성 변수의 차이가 제2 임계값 이상인지 여부를 판단할 수 있다.
예를 들어, 버퍼(260)에 저장되는 한 종류의 음성, '아이'를 3회 입력 받기로 설정되어 있다면, 버퍼(260)에는 '아이1', '아이2', '아이3'의 음성이 저장될 수 있다.
만약, 상기 기준 음성 변수가 강도의 특성이고, '아이1'이 1의 강도, '아이2'가 7의 강도, '아이3'이 8의 강도의 기준 음성 변수로 확인되었다면, '아이1'의 강도가 다른 두 '아이' 음성에 비해서 현저한 차이가 존재한다.
이를 확인하기 위해서, 가장 큰 기준 음성 변수 값과 가장 작은 기준 음성 변수 값의 차이를 확인할 수 있다.
또한, 본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 상기 판단 결과, 상기 제2 임계값 이상인 경우에 상기 가장 큰 값을 갖는 기준 음성 변수에 해당하는 음성 및 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성 중에서 적어도 하나의 음성을 삭제하고, 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
또한, 본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 상기 재입력되는 음성의 기준 음성 변수가 상기 가장 작은 값을 갖는 기준 음성 변수 보다 상기 가장 큰 값을 갖는 기준 음성 변수에 가까운 경우, 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성을 삭제할 수 있다.
만약, 위와 같이 '아이1'이 1의 강도, '아이2'가 7의 강도, '아이3'의 강도가 8로 분석된 경우, '아이3'의 강도와 '아이1'의 강도의 차이가 7이기 때문에 특정 음성을 삭제하고 새로운 음성을 입력 받아야만 한다.
그러기 위해서 새로운 음성으로 '아이4'를 입력 받았을 때, '아이4'의 강도가 '아이3'에 가깝다면, 모집단에 동떨어진 '아이1'을 삭제하여 '아이4'로 대체하고, 반대로 '아이4'의 강도가 '아이1'에 가깝다면 모집단에 동떨어진 '아이4'를 삭제할 수 있다.
또한, 본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 상기 재입력되는 음성의 기준 음성 변수가 상기 가장 큰 값을 갖는 기준 음성 변수 보다 상기 가장 작은 값을 갖는 기준 음성 변수에 가까운 경우, 상기 큰 값을 갖는 기준 음성 변수에 해당하는 음성을 삭제할 수 있다.
또한, 본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 상기 판단 결과, 상기 제2 임계값 이상인 경우에 상기 버퍼에 저장된 음성 중에서 상기 기준 음성 변수가 평균에 가장 근접하는 음성을 결정할 수 있다.
만약, 음성을 홀수 개 입력 받는 경우, 기준 음성 변수를 이용하여 오름차순 또는 내림차순 정렬하여 가운데 위치하는 음성을 음성 파일을 위한 음성으로 결정할 수가 있다.
다만, 음성을 짝수개 입력 받는 경우, 정렬 후 가운데 집중되는 두 개의 음성 중에서 평균에 보다 가까운 음성을 음성 파일을 위한 음성으로 결정할 수가 있다.
본 발명의 일측에 따른 음성기록 피드백 처리부(240)는 상기 음성이 결정되면, 결정된 음성 개수를 누적하고, 상기 누적된 음성 개수가 사전에 설정된 개수인지 여부를 판단하며, 상기 판단 결과 사전에 설정된 개수가 아닌 경우, 상기 음성의 다음 입력을 위한 지시 신호를 출력할 수 있다.
본 발명의 일실시예에 따르면, 사용자의 음성을 반복적으로 수집하여 가장 안정적인 음성만을 수집하여 양질의 음성 파일을 생성할 수 있다.
도 3은 본 발명의 일실시예에 따른 음성기록을 위한 지시 화면을 설명하는 도면이다.
도 3에서 보는 바와 같이, 사용자는 표시되는 단어나 문장을 안내지에 표시된 대로 읽어 음성을 입력할 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템은 안내지에 표시된 단어나 문장을 각각 수회 반복하고, 그 중에서 신뢰도가 높은 단어나 문장만을 추출하여, 음성 파일로 변환할 수 있다.
예를 들어, '아~'를 5회, '에~'를 3회, '이~'를 4회 등으로 수회 반복하도록 지시하고, 반복되어 입력되는 각각의 단어 중에서 상기 기준 음성 변수를 고려하여 가장 신뢰도 높은 음성을 음성 파일을 위한 소스로 결정할 수 있다.
도 4 내지 도 6은 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법을 설명하는 흐름도이다.
도 4를 참조하면, 도면부호 401 및 402와 같이 음성 입력을 위한 파라미터를 입력받을 수 있다.
즉, 입력되는 단어/문장의 총 개수(n)를 설정하고(단계 401), 각 단어의 최소 지속 시간(Dt)과 단어/문장 간에 빈 간격, 즉 널(null) 음성의 간격(DT)를 설정할 수 있다(단계 402).
다음으로, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 입력부에서, 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받을 수 있다(단계 403).
이에, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 변수 추출부에서, 상기 입력된 음성에 대한 기준 음성 변수로서, 최소 지속 시간, 주파수 특성, 강도의 특성, 및 주파수 표준 편차 중에서 적어도 어느 하나를 추출할 수 있다.
이에, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 저장 제어부를 통해서, 상기 입력된 음성으로부터 추출된 상기 기준 음성 변수가 제1 임계값(Thi) 이상인지와 상기 음성 변수가 충분한 시간 동안 입력되었는지를 확인하기 위해서, 최소 지속 시간(Dt) 이상 입력되었는지를 Tht와 비교하여 확인할 수 있다(단계 405).
상기 입력된 음성의 기준 음성 변수가 제1 임계값(Thi) 이상이고, 상기 음성이 Tht 이상으로 지속된 경우, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 상기 기준 음성 변수를 추출하여 버퍼에 저장하고(단계 406), 상기 음성 역시 버퍼에 저장한다(단계 407).
만약, 상기 입력된 음성의 기준 음성 변수가 제1 임계값(Thi) 이하이거나, 상기 음성이 Tht 이하로 지속된 경우 단계 403으로 분기하여 상기 단어/문장을 다시 한번 입력하도록 제어할 수 있다. 이를 위해, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
즉, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성기록 피드백 처리부에서, 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력할 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 하나의 음성에 대해서 획득하고자 하는 샘플의 개수만큼 획득했다면, 도 5로 분기한다.
만약, 획득하고자 하는 샘플의 개수만큼 획득하지 못했다면, 다시 단계 403으로 분기하여 단어/문장의 음성을 입력받는다.
사전에 입력 받으려는 샘플을 3개로 설정한 경우, 단계 408에서는 음성의 샘플이 3개 저장되었는지를 확인할 수 있다.
도 5에서는 원하는 개수만큼, 예를 들어 3개의 음성 샘플이 저장된 경우, 음성들에 해당하는 3개의 기준 음성 변수를 비교할 수 있다(단계 409).
이때, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성기록 피드백 처리부에서, 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장된 경우, 상기 저장된 음성의 기준 음성 변수를 확인하고, 가장 큰 값을 갖는 기준 음성 변수와 가장 작은 값을 갖는 기준 음성 변수의 차이가 제2 임계값(Th(i)) 이상인지 여부를 판단할 수 있다(단계 410).
즉, 임의 변수의 3개의 차이 중 prior 정보를 가진 임계값 Th(i)보다 크면 다른 값으로 보고 다시 문장/음성 입력하고, Thp보다 큰 개수만큼 n값 감소시킬 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 상기 3개의 기준 음성 변수 중에서 중간 값을 선택하고(단계 411), 중간 값에 해당하는 단어/문장이 포함된 음성을 결정할 수 있다(단계 412).
일례로, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 3개의 각 변수의 비교하여 변수의 중간 값의 음성 단어/문장을 선택할 수 있고, 다시 말해 주파수 특성, 강도의 특성, 주파수 표준편차를 이용하여 비교하여 중간 크기 값을 가진 단어 또는 문장을 선택할 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 결정된 상기 음성에 DT의 빈 간격을 삽입하여(단계 413), 즉 널(null) 음성을 결합하여 상기 음성 파일에 저장할 수 있다(단계 414).
다음으로, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 사전에 파라미터로서 입력된 단어/문자의 개수가 모두 입력되었는지를 확인하고(단계 415), 다시 한번 결정된 상기 음성에 DT의 빈 간격을 삽입하여(단계 416), 음성 파일의 생성을 완료할 수 있다(단계 417).
즉, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 앞에서 입력된 단어/문자의 개수가 일치하는지 판별하여, 개수가 일치하지 않는 경우 앞으로 돌아가 다시 음성을 입력 받을 수 있다.
즉, 도 7에서 보는 음성 파일의 구조가 형성될 수 있다.
즉, 단어/문장의 음성 간에 DT 간격이 삽입될 수 있다.
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 단계 414가 먼저 실행되고, 단계 413이 나중에 실행되어도 관계없다.
대신 단계 416의 위치의 공간을 넣는 과정을 제거하고 단계 403의 이전에 빈 공간을 넣은 과정을 넣어 주면 도 7과 같은 파일 구조가 생성될 수 있다.
음성 간에 삽입되는 시간 간격(DT 간격)은 일정할 수도 있고, 설정에 따른 변동될 수도 있다.
도 7과는 상이하게, 도 8과 같은 음성 파일 구조도 형성될 수 있다.
즉, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 파일에 널 음성이 더해진 단어/문장을 따로 저장할 수도 있다.
도 6에서는 도 5와 유사하나, 선택(결정)된 음성파일에 널 음성을 먼저 저장할 수 있다.
구체적으로, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 3개의 음성 샘플이 저장된 경우, 음성들에 해당하는 3개의 기준 음성 변수를 비교할 수 있다(단계 501).
이때, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성기록 피드백 처리부에서, 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장된 경우, 상기 저장된 음성의 기준 음성 변수를 확인하고, 가장 큰 값을 갖는 기준 음성 변수와 가장 작은 값을 갖는 기준 음성 변수의 차이가 제2 임계값(Th(i)) 이상인지 여부를 판단할 수 있다(단계 502).
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 상기 3개의 기준 음성 변수 중에서 중간 값을 선택하고(단계 503), 중간 값에 해당하는 단어/문장이 포함된 음성을 결정할 수 있다(단계 504).
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 결정된 상기 음성의 앞에 DT의 빈 간격을 삽입하여(단계 505), 즉 널(null) 음성을 결합하여 상기 음성 파일에 저장할 수 있다(단계 506).
다음으로, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 상기 음성의 뒤에 DT의 빈 간격을 삽입하고(단계 507), 음성 파일을 생성할 수 있다(단계 508).
이후, 본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 사전에 파라미터로서 입력된 단어/문자의 개수가 모두 입력되었는지를 확인하여, 음성 파일의 생성을 완료할 수 있다(단계 509).
도 9는 본 발명의 다른 일실시예에 따른 음성기록 피드백 시스템의 동작 방법을 설명하는 흐름도이다.
본 발명의 다른 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 음성 입력부에서, 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받을 수 있다(단계 901).
만약, 3보다 큰 M개의 변수를 비교할 때(단계 902), M개의 기준 음성 변수를 순차적으로 정렬 후 주변 값의 변수 차를 구하여 통과 시켜 비교할 수 있다(단계 903).
본 발명의 다른 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 가장 큰 변수와 가장 작은 변수 차인 최대 변수 차가 임계 값(prior 정보)보다 작은지 여부를 판단하여(단계 904, 단계 905), 가장 큰 변수와 가장 작은 변수 차인 최대 변수 차가 임계 값보다 클 경우 다음 변수의 값을 입력한 후 다음 기준 음성 변수를 추출하고 이 값이 위치하는 곳 분석할 수 있다.
이때, 위치하는 곳이 가장 큰 변수에 가까우면 가장 작은 값 소거 후 저장하고, 위치하는 곳이 가장 작은 변수에 가까우면 가장 큰 값 소거 후 저장할 수 있다. 또한,
최대 변수 차 구한 후 임계 값보다 작으면 단계 906으로 분기하여, M개의 버퍼 변수 중에서 중간 값을 선태할 수 있다(단계 906).
본 발명의 일실시예에 따른 음성기록 피드백 시스템의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
200: 음성기록 피드백 시스템 210: 음성 입력부
220: 음성 변수 추출부 230: 음성 저장 제어부
240: 음성기록 피드백 처리부 250: 음성 파일 생성부
260: 버퍼

Claims (15)

  1. 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는 음성 입력부;
    상기 입력된 음성에 대한 기준 음성 변수를 추출하는 음성 변수 추출부;
    상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성 저장 제어부; 및
    상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성기록 피드백 처리부
    를 포함하고,
    상기 음성기록 피드백 처리부는,
    상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장된 경우, 상기 저장된 음성의 기준 음성 변수를 확인하고, 가장 큰 값을 갖는 기준 음성 변수와 가장 작은 값을 갖는 기준 음성 변수의 차이가 제2 임계값 이상인지 여부를 판단하는 음성기록 피드백 시스템.
  2. 삭제
  3. 제1항에 있어서,
    상기 음성기록 피드백 처리부는,
    상기 판단 결과, 상기 제2 임계값 이상인 경우에 상기 가장 큰 값을 갖는 기준 음성 변수에 해당하는 음성 및 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성 중에서 적어도 하나의 음성을 삭제하고, 상기 음성의 재입력을 위한 지시 신호를 출력하는 음성기록 피드백 시스템.
  4. 제3항에 있어서,
    상기 음성기록 피드백 처리부는,
    상기 재입력되는 음성의 기준 음성 변수가 상기 가장 작은 값을 갖는 기준 음성 변수 보다 상기 가장 큰 값을 갖는 기준 음성 변수에 가까운 경우, 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성을 삭제하는 음성기록 피드백 시스템.
  5. 제3항에 있어서,
    상기 음성기록 피드백 처리부는,
    상기 재입력되는 음성의 기준 음성 변수가 상기 가장 큰 값을 갖는 기준 음성 변수 보다 상기 가장 작은 값을 갖는 기준 음성 변수에 가까운 경우, 상기 큰 값을 갖는 기준 음성 변수에 해당하는 음성을 삭제하는 음성기록 피드백 시스템.
  6. 제1항에 있어서,
    상기 음성기록 피드백 처리부는,
    상기 판단 결과, 상기 제2 임계값 이상인 경우에 상기 버퍼에 저장된 음성 중에서 상기 기준 음성 변수가 평균에 가장 근접하는 음성을 결정하는 음성기록 피드백 시스템.
  7. 제6항에 있어서,
    상기 결정된 음성을 이용하여, 음성 파일을 생성하는 음성 파일 생성부
    를 더 포함하는 음성기록 피드백 시스템.
  8. 제7항에 있어서,
    상기 음성 파일 생성부는,
    상기 결정된 음성에 널(null) 음성을 결합하여 상기 음성 파일을 생성하는 음성기록 피드백 시스템.
  9. 제6항에 있어서,
    상기 음성기록 피드백 처리부는,
    상기 음성이 결정되면, 결정된 음성 개수를 누적하고, 상기 누적된 음성 개수가 사전에 설정된 개수인지 여부를 판단하며, 상기 판단 결과 사전에 설정된 개수가 아닌 경우, 상기 음성의 다음 입력을 위한 지시 신호를 출력하는 음성기록 피드백 시스템.
  10. 제1항에 있어서,
    상기 기준 음성 변수는,
    상기 입력된 음성에 대한 최소 지속 시간, 주파수 특성, 강도의 특성, 및 주파수 표준 편차 중에서 적어도 하나를 포함하는 것을 특징으로 하는 음성기록 피드백 시스템.
  11. 음성 입력부에서, 사전에 설정된 단어 및 문장 중에서 적어도 하나를 포함하는 음성을 입력 받는 단계;
    음성 변수 추출부에서, 상기 입력된 음성에 대한 기준 음성 변수를 추출하는 단계;
    음성 저장 제어부에서, 상기 추출된 기준 음성 변수가 제1 임계값 이상인 경우에, 상기 입력된 음성을 버퍼에 저장하도록 처리하고, 상기 추출된 기준 음성 변수가 임계값 이하인 경우에, 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계; 및
    음성기록 피드백 처리부에서, 상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장되었는지를 판단하고, 사전에 설정된 개수만큼 상기 음성이 저장되지 않은 경우 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계
    를 포함하고,
    상기 음성기록 피드백 처리부에서, 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계는,
    상기 버퍼에 사전에 설정된 개수만큼 상기 음성이 저장된 경우, 상기 저장된 음성의 기준 음성 변수를 확인하고, 가장 큰 값을 갖는 기준 음성 변수와 가장 작은 값을 갖는 기준 음성 변수의 차이가 제2 임계값 이상인지 여부를 판단하는 단계; 및
    상기 판단 결과, 상기 제2 임계값 이상인 경우에 상기 가장 큰 값을 갖는 기준 음성 변수에 해당하는 음성 및 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성 중에서 적어도 하나의 음성을 삭제하고, 상기 음성의 재입력을 위한 지시 신호를 출력하는 단계
    를 포함하는 음성기록 피드백 시스템의 동작 방법.
  12. 삭제
  13. 제11항에 있어서,
    상기 음성기록 피드백 처리부에서, 상기 재입력되는 음성의 기준 음성 변수가 상기 가장 작은 값을 갖는 기준 음성 변수 보다 상기 가장 큰 값을 갖는 기준 음성 변수에 가까운 경우, 상기 가장 작은 값을 갖는 기준 음성 변수에 해당하는 음성을 삭제하는 단계
    를 더 포함하는 음성기록 피드백 시스템의 동작 방법.
  14. 제11항에 있어서,
    상기 음성기록 피드백 처리부에서, 상기 판단 결과에 따라 상기 제2 임계값 이상인 경우에 상기 버퍼에 저장된 음성 중에서 상기 기준 음성 변수가 평균에 가장 근접하는 음성을 결정하는 단계; 및
    음성 파일 생성부에서, 상기 결정된 음성으로 음성 파일을 생성하는 음성기록 피드백 시스템의 동작 방법.
  15. 제11항, 제13항, 및 제14항 중에서 어느 한 항의 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.
KR1020110088394A 2011-09-01 2011-09-01 음성기록 피드백 시스템 및 방법 KR101265841B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110088394A KR101265841B1 (ko) 2011-09-01 2011-09-01 음성기록 피드백 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110088394A KR101265841B1 (ko) 2011-09-01 2011-09-01 음성기록 피드백 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20130025080A KR20130025080A (ko) 2013-03-11
KR101265841B1 true KR101265841B1 (ko) 2013-05-20

Family

ID=48176863

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110088394A KR101265841B1 (ko) 2011-09-01 2011-09-01 음성기록 피드백 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101265841B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100732611B1 (ko) 2006-04-25 2007-06-28 학교법인 포항공과대학교 음성대화 오류검증을 통한 확인대화 방법 및 장치
KR100926771B1 (ko) 2009-05-14 2009-11-16 한국 한의학 연구원 음성 분석을 통한 사상체질 구분 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100732611B1 (ko) 2006-04-25 2007-06-28 학교법인 포항공과대학교 음성대화 오류검증을 통한 확인대화 방법 및 장치
KR100926771B1 (ko) 2009-05-14 2009-11-16 한국 한의학 연구원 음성 분석을 통한 사상체질 구분 방법

Also Published As

Publication number Publication date
KR20130025080A (ko) 2013-03-11

Similar Documents

Publication Publication Date Title
CN110263322B (zh) 用于语音识别的音频语料筛选方法、装置及计算机设备
CN109783632B (zh) 客服信息推送方法、装置、计算机设备及存储介质
US11646032B2 (en) Systems and methods for audio processing
CN104252864B (zh) 实时语音分析方法和系统
US10529328B2 (en) Processing speech signals in voice-based profiling
WO2019085330A1 (zh) 人物性格分析方法、装置及存储介质
Lee et al. Modeling mutual influence of interlocutor emotion states in dyadic spoken interactions.
KR102081495B1 (ko) 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체
CN107844480B (zh) 将书面文本转换为口语文本的方法及系统
US20080201134A1 (en) Computer-readable record medium in which named entity extraction program is recorded, named entity extraction method and named entity extraction apparatus
JP6823809B2 (ja) 対話行為推定方法、対話行為推定装置およびプログラム
JP5553578B2 (ja) 医用診断レポートシステム、当該システムとして機能させるためのプログラム、および医用診断レポートの作成支援方法
CN110222331A (zh) 谎言识别方法及装置、存储介质、计算机设备
Casanova et al. Deep learning against COVID-19: respiratory insufficiency detection in Brazilian Portuguese speech
JP7266390B2 (ja) 行動識別方法、行動識別装置、行動識別プログラム、機械学習方法、機械学習装置及び機械学習プログラム
JP2013088552A (ja) 発音トレーニング装置
KR20150001031A (ko) 개인화된 라이프 스타일 모델링 장치 및 방법
KR101265841B1 (ko) 음성기록 피드백 시스템 및 방법
KR20130024535A (ko) 맥파를 이용한 건강 상태 판단 장치 및 방법
Mallol-Ragolta et al. Performance analysis of unimodal and multimodal models in valence-based empathy recognition
KR102114368B1 (ko) 사용자 영상을 기반으로 하는 정보 입력 장치, 방법, 시스템 및 컴퓨터 판독 가능한 저장 매체
JP5441174B2 (ja) 関係情報抽出装置、その方法及びプログラム
KR20210012606A (ko) 바이오 정보 분석 방법 및 이를 수행하기 위한 프로그램을 저장하는 저장 매체
CN111149154B (zh) 一种声纹识别方法、装置、设备和储存介质
CN109977405A (zh) 一种智能语义匹配方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160516

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170412

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181105

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190611

Year of fee payment: 7