KR101486875B1 - 음성 인식 마우스 회로 및 이의 동작 방법 - Google Patents

음성 인식 마우스 회로 및 이의 동작 방법 Download PDF

Info

Publication number
KR101486875B1
KR101486875B1 KR20130119363A KR20130119363A KR101486875B1 KR 101486875 B1 KR101486875 B1 KR 101486875B1 KR 20130119363 A KR20130119363 A KR 20130119363A KR 20130119363 A KR20130119363 A KR 20130119363A KR 101486875 B1 KR101486875 B1 KR 101486875B1
Authority
KR
South Korea
Prior art keywords
mapped
mouse
drag
scroll
voice
Prior art date
Application number
KR20130119363A
Other languages
English (en)
Inventor
정해
정재현
정상윤
Original Assignee
금오공과대학교 산학협력단
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 금오공과대학교 산학협력단, 포항공과대학교 산학협력단 filed Critical 금오공과대학교 산학협력단
Priority to KR20130119363A priority Critical patent/KR101486875B1/ko
Application granted granted Critical
Publication of KR101486875B1 publication Critical patent/KR101486875B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/038Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
    • G06F3/0383Signal control means within the pointing device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Position Input By Displaying (AREA)

Abstract

본 발명의 실시예에 따른 음성 인식 마우스 회로의 동작 방법은 사용자가 발성하는 음성을 인식하는 단계 및 상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 단계를 포함한다. 본 발명의 실시예에 따른 음성 인식 마우스 회로에 의하면, 사용자의 음성을 이용하여 마우스의 동작을 제어함으로써 실제 마우스를 이용하기 힘든 상황에서 마우스의 동작 제어가 가능할 수 있다.

Description

음성 인식 마우스 회로 및 이의 동작 방법{A VOICE RECOGNITION MOUSE CIRCUIT AND A METHOD OF OPERATING THE SAME}
본 발명의 개념에 따른 실시예는 음성 인식 마우스 회로 및 이의 동작 방법에 관한 것으로, 보다 상세하게는 음성 인식을 이용하여 마우스 제어가 가능한 음성 인식 마우스 회로 및 이의 동작 방법에 관한 것이다.
마우스(mouse)는 컴퓨터의 다양한 기능에 신속하게 액세스(access)하기 위해 고안된 입력 장치이다. 원칙적으로 마우스는 컴퓨터에 유선/무선으로 연결되어 사용자에 의해 생성되는 입력 신호 즉, 마우스 제어 신호를 컴퓨터 측에 전송하는 방식의 장치이다.
최근 스마트폰(smartphone), 네비게이션(navigation), 스마트 TV 등 전자 장치의 광범위한 보급에 따라 사용자가 보다 편리하게 제어할 수 있도록 다양한 입력 장치들이 개발되고 있다. 주로 터치 스크린(touch screen)이나 외장 버튼이 전자 장치의 주요 입력 수단으로 이용될 수 있으나, 이러한 주요 입력 수단 만으로 신속하고 정확한 전자 장치의 제어가 어려울 수 있고 손을 사용하기 힘든 상황(예컨대, 운전 중 네비게이션의 조작)에서는 다른 형태의 입력 장치의 활용이 필요하다.
본 발명이 이루고자 하는 기술적 과제는 다른 입력 수단을 이용하기 어려운 상황 또는 마우스의 정상적인 이용이 불가능한 상황에서도 용이하게 마우스를 제어할 수 있는 음성 인식 마우스 회로 및 이의 동작 방법을 제공함에 있다.
본 발명의 실시예에 따른 음성 인식 마우스 회로의 동작 방법은 사용자가 발성하는 음성을 인식하는 단계 및 상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 단계를 포함한다.
실시예에 따라, 상기 마우스 제어 신호를 생성하는 단계는 상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하는 단계 및 상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성하는 단계를 포함한다.
실시예에 따라, 상기 마우스 동작은 상 이동, 우 이동, 하 이동 및 좌 이동을 포함하고, 상기 상 이동은 'ㅗ'에 매핑되고, 상기 우 이동은 'ㅏ'에 매핑되고, 상기 하 이동은 'ㅜ'에 매핑되고, 상기 좌 이동은 'ㅔ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상우 이동, 우하 이동, 하좌 이동 및 좌상 이동을 포함하고, 상기 상우 이동은 'ㅛ'에 매핑되고, 상기 우하 이동은 'ㅑ'에 매핑되고, 상기 하좌 이동은 'ㅠ'에 매핑되고, 상기 좌상 이동은 'ㅖ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상 스크롤, 우 스크롤, 하 스크롤 및 좌 스크롤을 포함하고, 상기 상 스크롤은 '모'에 매핑되고, 상기 우 스크롤 이동은 '마'에 매핑되고, 상기 하 스크롤 이동은 '무'에 매핑되고, 상기 좌 스크롤 이동은 '메'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 우 버튼 싱글 클릭 및 좌 버튼 싱글 클릭을 포함하고, 상기 우 버튼 싱글 클릭은 '미'에 매핑되고, 상기 좌 버튼 싱글 클릭은 'ㅣ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 좌 버튼 더블 클릭을 포함하고, 상기 좌 버튼 더블 클릭은 제2 시간 이내로 연속하는 'ㅣ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상 드래그, 우 드래그, 하 드래그, 좌 드래그, 상우 드래그, 우하 드래그, 하좌 드래그, 및 좌상 드래그를 포함하고, 상기 상 드래그, 상기 우 드래그, 상기 하 드래그, 상기 좌 드래그, 상기 상우 드래그, 상기 우하 드래그, 상기 하좌 드래그, 및 상기 좌상 드래그 각각은 'ㅣ' 이후 제2 시간 이내로 연속하는 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ', 및 'ㅖ' 각각에 매핑된다.
실시예에 따라, 상기 음성을 인식하는 단계는 상기 사용자가 발성한 음성 이외의 노이즈를 제거하는 단계, 상기 음성의 특징 벡터를 추출하는 단계 및 상기 추출된 특징 벡터를 기초로 상기 음성을 인식하는 단계를 포함한다.
본 발명의 실시예에 따른 음성 인식 마우스 회로는 사용자가 발성하는 음성을 인식하는 음성 인식부 및 상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 마우스 제어부를 포함한다.
실시예에 따라, 상기 마우스 제어부는 상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하고, 상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성한다.
실시예에 따라, 상기 마우스 동작은 상 이동, 우 이동, 하 이동 및 좌 이동을 포함하고, 상기 상 이동은 'ㅗ'에 매핑되고, 상기 우 이동은 'ㅏ'에 매핑되고, 상기 하 이동은 'ㅜ'에 매핑되고, 상기 좌 이동은 'ㅔ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상우 이동, 우하 이동, 하좌 이동 및 좌상 이동을 포함하고, 상기 상우 이동은 'ㅛ'에 매핑되고, 상기 우하 이동은 'ㅑ'에 매핑되고, 상기 하좌 이동은 'ㅠ'에 매핑되고, 상기 좌상 이동은 'ㅖ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상 스크롤, 우 스크롤, 하 스크롤 및 좌 스크롤을 포함하고, 상기 상 스크롤은 '모'에 매핑되고, 상기 우 스크롤 이동은 '마'에 매핑되고, 상기 하 스크롤 이동은 '무'에 매핑되고, 상기 좌 스크롤 이동은 '메'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 우 버튼 싱글 클릭 및 좌 버튼 싱글 클릭을 포함하고, 상기 우 버튼 싱글 클릭은 '미'에 매핑되고, 상기 좌 버튼 싱글 클릭은 'ㅣ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 좌 버튼 더블 클릭을 포함하고, 상기 좌 버튼 더블 클릭은 제2 시간 이내로 연속하는 'ㅣ'에 매핑된다.
실시예에 따라, 상기 마우스 동작은 상 드래그, 우 드래그, 하 드래그, 좌 드래그, 상우 드래그, 우하 드래그, 하좌 드래그, 및 좌상 드래그를 포함하고, 상기 상 드래그, 상기 우 드래그, 상기 하 드래그, 상기 좌 드래그, 상기 상우 드래그, 상기 우하 드래그, 상기 하좌 드래그, 및 상기 좌상 드래그 각각은 'ㅣ' 이후 제2 시간 이내로 연속하는 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ', 및 'ㅖ' 각각에 매핑된다.
실시예에 따라, 상기 음성 인식부는 상기 사용자가 발성한 음성 이외의 노이즈를 제거하는 음성 개선부, 상기 음성의 특징 벡터를 추출하는 음성 분석부 및 상기 추출된 특징 벡터를 기초로 상기 음성을 인식하는 패턴 분석부를 포함한다.
본 발명의 실시예에 따른 음성 인식 마우스 회로 및 이의 동작 방법에 의하면, 사용자의 음성을 이용하여 마우스의 동작을 제어함으로써 손목, 손, 또는 손가락이 불편한 장애인의 경우나 실제 마우스를 이용하기 힘든 상황에서 마우스의 동작 제어가 가능하다.
본 발명의 실시예에 따른 음성 인식 마우스 회로 및 이의 동작 방법에 의하면, 전세계적으로 공통적으로 쓰이는 모음을 이용한 음성 인식을 기반으로 마우스 동작을 제어함으로써 언어별 차이의 고려나 화자 적응 없이도 마우스의 동작 제어가 가능하다.
도 1은 본 발명의 실시예에 따른 전자 장치를 설명하기 위한 블록도이다.
도 2는 도 1에 도시된 음성 인식 마우스 회로를 상세히 나타낸 블록도이다.
도 3은 도 1에 도시된 음성 인식 마우스 회로의 동작 방법을 나타낸 흐름도이다.
도 4는 도 3에 도시된 마우스 제어 신호를 생성하는 단계를 상세히 나타낸 흐름도이다.
도 5a 내지 도 5g는 각각 전자 장치의 화면상에 마우스 포인터가 표시된 화면의 실시예들을 나타낸 도면이다.
도 5h는 마우스 포인터가 없이 도 1에 도시된 음성 인식 마우스 회로가 이용되는 전자 장치의 일 실시예를 나타낸 도면이다.
도 6 내지 도 8은 각각 인식된 음성에 매핑된 마우스 제어 동작의 실시예 들을 나타낸 도면이다.
도 9는 언어별로 사용 중인 단모음을 조사한 결과를 나타낸 도면이다.
본 명세서 또는 출원에 개시되어 있는 본 발명의 실시 예들에 대해서 특정한 구조적 내지 기능적 설명들은 단지 본 발명에 따른 실시 예를 설명하기 위한 목적으로 예시된 것으로, 본 발명에 따른 실시 예들은 다양한 형태로 실시될 수 있으며 본 명세서 또는 출원에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.
본 발명에 따른 실시예는 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있으므로 특정실시 예들을 도면에 예시하고 본 명세서 또는 출원에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시 예를 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1 및/또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시 예를 설명함으로써, 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 실시예에 따른 전자 장치를 설명하기 위한 블록도이다. 도 2는 도 1에 도시된 음성 인식 마우스 회로를 상세히 나타낸 블록도이다.
도 1 및 도 2를 참조하면, 전자 장치(1)는 이동 전화기 (cellular phone), 스마트폰(smart phone), 넷-북(net-book), e-리더(e-reader) 또는 PDA(personal digital assistant) 등의 모바일(mobile) 계열의 단말기, PC(Personal Computer), 태블릿(tablet) PC, 노트북(notebook) PC와 같은 컴퓨팅(computing) 계열의 기기, 스마트 TV, 스마트 냉장고 등의 스마트 정보가전기기, 네비게이션(navigation), 차량 DMB 등의 운행 중에 설정 변경을 하면 위험 요인이 따르는 ITS (Intelligent Transport System) 계열의 기기, 음성으로 제어하기를 원하는 휴대용 게임기, 콘솔형 게임기, 아케이드 게임기와 같은 모든 계열의 게임기기, 웨어러블 컴퓨터, 웨어러블 로봇과 같이 핸즈프리(hands-free)가 중시되는 모든 웨어러블 기기, 현대전에 적용되는 차세대 화기, 손목, 손, 손가락의 장애로 인해 기기를 사용하기 힘든 사람들을 위한 전동휠체어로 구현될 수 있다.
전자 장치(1)는 중앙 처리부(CPU:Central Processing Unit, 2), 입력부(input device, 3), 네트워크 인터페이스(network interface, 6), 디스플레이부(display unit, 7) 및 음성 인식 마우스 회로(voice recognition mouse circuit, 10)를 포함할 수 있다.
중앙 처리부(2)는 전자 장치(1)의 전반적인 동작을 제어할 수 있다. 중앙 처리부(2)는 입력부(3)를 통해 입력되는 사용자의 명령 또는 음성 신호에 따라 음성 인식 마우스 모드의 동작을 처리할 수 있다. 상기 음성 인식 마우스 모드는 사용자의 선택에 의해 실행되며, 디스플레이부(7)에 출력되는 마우스 커서의 위치 이동, 왼쪽/오른쪽 버튼 클릭 등의 동작을 음성 인식 마우스 회로(10)의 동작을 통해 제어할 수 있는 모드를 의미한다.
입력부(3)는 터치 스크린(touch screen, 4) 및 마이크(mike;microphone, 5)를 포함할 수 있다.
터치 스크린(4)은 터치 패널 상에 사용자가 터치하는 위치를 감지하고, 상기 위치에 상응하는 터치 신호를 생성할 수 있다. 다른 실시예에 따라 터치 스크린(4)이 아닌 다른 형태의 입력 장치(예컨대, 외장 버튼, 리모트 컨트롤 수신기)들이 사용될 수 있다.
마이크(5)는 사람이 발성하는 음성을 감지하여 상기 음성에 상응하는 전기 신호인 음성 신호를 생성할 수 있다.
디스플레이부(7)는 중앙 처리부(2)로부터 데이터를 전송받아 해당 데이터에 대응하는 화면을 디스플레이할 수 있다.
네트워크 인터페이스(6)는 무선 및/또는 유선 통신 방식을 통해 전자 장치(1)의 외부와의 데이터 송수신을 담당할 수 있다.
음성 인식 마우스 회로(10)는 중앙 처리부(2)에 의해 실행될 수 있는 프로그램의 형태로 전자 장치(1)에 포함된 메모리(memory, 미도시)에 저장될 수 있다. 상기 메모리는 플래시 메모리(flash memory) 등의 비휘발성 메모리(non-volatile memory) 또는 DRAM(Dynamic Random Access Memory)등의 휘발성 메모리로 구현될 수 있다.
실시예에 따라 음성 인식 마우스 회로(10)는 스마트폰의 어플리케이션(application)으로 구현될 수 있다. 다른 실시예에 따라 음성 인식 마우스 회로(10)의 전부 또는 일부는 하드웨어(hardware)로 구현될 수 있다.
도 2에 도시된 바와 같이 음성 인식 마우스 회로(10)는 음성 인식부(100) 및 마우스 제어부(200)를 포함할 수 있다.
음성 인식부(100)는 음성 개선부(110), 음성 분석부(120), 패턴 분석부(130) 및 음성 데이터베이스(140)를 포함할 수 있다.
음성 개선부(100)는 마이크(5)가 생성한 음성 신호에 포함된 노이즈를 제거할 수 있다. 예컨대, 음성 개선부(100)는 밴드 패스 필터(Band Pass Filter;BPF), 로우 패스 필터(Low Pass Filter;LPF) 및/또는 하이 패스 필터(High Pass Filter;HPF)를 이용하여 사람의 음성이 포함되는 주파수 대역(예컨대, 400Hz~5000Hz) 이외의 노이즈, 및/또는 신호처리 기술을 이용하여 여러 가지 배경 노이즈를 제거할 수 있다.
음성 분석부(120)는 음성 신호를 분석하여 상기 음성 신호의 특징 벡터를 추출할 수 있다.
먼저, 음성 분석부(120)는 특정 구간마다의 평균 에너지 값(또는 로그 에너지 값)을 미리 결정된 임계 에너지 값과 비교하여 음성 구간(사용자가 발음하는 구간)과 묵음 구간(사용자가 발음하지 않는 구간)을 구별할 수 있다.
다음으로 음성 분석부(120)는 상기 음성 구간에 포함된 음성 신호로부터 인식에 유효한 특징 파라미터 즉, 특징 벡터를 추출할 수 있다. 예컨대, 음성 분석부(120)는 상기 특징 벡터의 추출에는 선형 예측 계수(Linear Prediction Coefficients; LPC) 추출법, 켑스트럼 계수(Mel-Frequency Cepstral Coefficients; MFCC) 추출법 등이 이용될 수 있다.
패턴 분석부(130)는 추출된 특징 벡터를 기초로 사용자의 음성을 인식할 수 있다. 패턴 분석부(130)는 추출된 특징 벡터를 음소 단위에 각각 대응하는 음소 특징 벡터들과 비교하여 가장 유사도가 높은 음소 특징 벡터를 결정할 수 있다. 패턴 분석부(130)는 가장 유사도가 높은 음소 특징 벡터에 해당하는 음소(예컨대, 한글의 자음 또는 모음)에 대한 음성 인식 결과를 생성할 수 있다.
예컨대, 패턴 분석부(130)는 템플릿 기반의 패턴 매칭 방법을 이용하는 DTW(Dynamic Time Warping) 알고리즘, 통계적 패턴 인식을 이용한 HMM(Hidden Markov Model) 알고리즘 등을 이용해 사용자의 음성을 인식할 수 있다.
음성 데이터 베이스(140)는 음소 단위에 각각 대응하는 음소 특징 벡터들을 저장하고 패턴 분석부(130)에 제공할 수 있다.
마우스 제어부(200)는 음성 인식부(100)가 생성하는 음성 인식 결과에 따라 마우스 제어 신호(MCS)를 생성할 수 있다. 마우스 제어부(200)는 음성 인식 결과에 기초하여 도 4에 도시된 알고리즘에 따라 마우스 제어 신호(MCS)를 생성할 수 있다.
도 3은 도 1에 도시된 음성 인식 마우스 회로의 동작 방법을 나타낸 흐름도이다. 도 4는 도 3에 도시된 마우스 제어 신호를 생성하는 단계를 상세히 나타낸 흐름도이다. 도 5a 내지 도 5g는 각각 전자 장치의 화면상에 마우스 포인터가 표시된 화면의 실시예들을 나타낸 도면이다. 도 5h는 마우스 포인터가 없이 도 1에 도시된 음성 인식 마우스 회로가 이용되는 전자 장치의 일 실시예를 나타낸 도면이다. 도 6 내지 도 8은 각각 인식된 음성에 매핑된 마우스 제어 동작의 실시예 들을 나타낸 도면이다.
도 1 내지 도 8을 참조하면, 전자 장치(1)는 기본적으로 휴면 모드(idle mode)로 동작할 수 있다(S30). 상기 휴면 모드는 음성 인식 마우스 회로(10)가 동작하지 않는 상태를 의미할 수 있다.
상기 휴면 모드는 사용자의 명령에 의해 해제될 수 있다(S31). 상기 사용자의 명령은 예컨대, 특정 어플리케이션의 실행 또는 화면상의 연속적인 터치일 수 있다.
상기 휴면 모드가 해제되면, 음성 인식 마우스 회로(10)가 동작할 수 있다(S32). 디스플레이부(7)에 의해 출력되는 화면상에 마우스 커서가 표시될 수 있다. 도 5a 내지 도 5g는 각각 전자 장치(10)가 스마트 TV, 스마트폰, PC, 또는 네비게이션일 경우 각각의 화면에 표시되는 마우스 포인터를 도시하고 있다. 특히, 도 5b는 스마트 TV에서 리모컨이 없거나 분실된 상황에서도 그래픽으로 마우스 포인터와 가상 리모컨을 표시하여 음성으로 상기 리모컨과 동일한 제어가 가능한 실시예를 나타낸다. 도 5d는 스마트폰에서 네비게이션 앱(navigation application)을 실행할 때 터치 스크린을 이용하지 않고 음성으로 목적지를 입력할 수 있는 실시예를 나타낸다. 도 5g의 좌측 그림은 차기 소총의 디스플레이(display)에 마우스 기능이 없음에 따라 차기 소총의 본체에 존재하는 다양한 하드웨어 버튼을 나타낸다. 만약 도 5g의 우측 그림과 같이 차기 소총의 디스플레이에 마우스 기능을 추가한다면, 도 5g의 좌측 그림과 같이 하드웨어적으로 구현된 다양한 하드웨어 버튼을 포함하는 조준장치 본체 제어판을 소프트웨어적으로 가상의 조준장치 본체 제어판으로 디스플레이 상에 표시할 수 있다. 이로 인해 차기 소총의 소형화 및 경량화를 유도하고 기계적인 고장에서 탈피될 수 있다. 소프트웨어적으로 표시될 수 있는 가상의 제어판은 도 5g의 좌측 그림에 도시된 조준장치 본체 제어판 이외에 방아쇠 부근에 존재하는 여러 가지 버튼들도 포함할 수 있다. 이는 디스플레이가 내장된 다른 화기에도 유사한 개념을 적용시킬 수 있음을 의미한다. 마우스 포인터의 크기나 모양은 사용자에 의해 얼마든지 변경 가능하도록 프로그래밍될 수 있다.
도 5h에서는 손목, 손, 또는 손가락이 불편한 장애인이 음성 인식으로 움직임을 제어할 수 있는 전동 휠체어를 나타낸다. 실시예에 따라 마우스 제어부(200)가 생성하는 마우스 제어 신호(MCS)는 전동 휠체어의 전, 후, 좌, 우 이동과 대각선 방향의 이동에 대응하여 전동 휠체어의 움직임을 제어하는 신호로 이용될 수 있다.
예컨대, 화면상의 연속적인 터치에 의해 상기 휴면 모드가 해제될 경우 마우스 포인터의 최초 위치는 상기 연속적인 터치가 이루어진 위치에 해당할 수 있다.
중앙 처리부(2)는 음성 분석부(120)가 감지하는 음성 구간이 제1 시간(t1) 동안 나타나지 않는 경우(S33의 No 경로) 음성 인식 마우스 회로(10)의 동작을 중지할 수 있다. 이는 사용자의 음성이 일정 시간 동안 입력되지 않을 경우 전력 소비 낭비를 줄이기 위함이다. 예컨대, 제1 시간(t1)은 10 초에 해당할 수 있고, 환경 설정을 통해 사용자가 변경할 수 있으나, 본 발명의 범위는 이에 한정되지 않는다. 또한, 제1 시간(t1)은 환경 설정을 통해 사용자가 변경할 수 있다.
중앙 처리부(2)는 음성 분석부(120)가 감지하는 음성 구간이 제1 시간(t1) 내에 나타날 경우(S33의 Yes 경로) 음성 개선부(110)는 마이크(5)가 생성한 음성 신호에 포함된 노이즈를 제거할 수 있다(S35).
음성 분석부(120)는 음성 신호를 분석하여 상기 음성 신호의 특징 벡터를 추출할 수 있다(S36).
패턴 분석부(130)는 추출된 특징 벡터를 기초로 사용자의 음성을 인식한 결과인 음성 인식 결과를 생성할 수 있다(S37).
마우스 제어부(200)는 음성 인식부(100)가 생성하는 음성 인식 결과에 따라 마우스 제어 신호(MCS)를 생성할 수 있다(S38). 마우스 제어 신호(MCS)를 생성하는 단계(S38)는 도 4에 도시된 알고리즘으로 구체화될 수 있다. 즉, S38 단계는 S40 내지 S83 단계를 포함할 수 있다.
S37 단계 이후 마우스 제어부(200)는 음성 인식 결과(예컨대, 하나의 음성 구간에 포함된 자음 및/또는 모음의 음소)에 자음이 검출되었는지 판단할 수 있다(S40).
음성 인식 결과에 자음이 검출된 경우(S40의 Yes 경로) 마우스 제어부(200)는 검출된 자음이 'ㅁ'인지 판단할 수 있다(S50).
마우스 제어부(200)는 검출된 자음이 'ㅁ'이 아닌 경우(S50의 No 경로) 도 3에 도시된 S33 단계가 실행될 수 있다. 검출된 자음이 'ㅁ'인 경우(S50의 Yes 경로) 마우스 제어부(200)는 연속되는 모음이 'ㅣ'인지 판단할 수 있다(S51).
'ㅁ'에 연속되는 모음이 'ㅣ'인 경우(S51의 Yes 경로) 마우스 제어부(200)는 '미'에 매핑(mapping)된 마우스의 우 버튼 클릭에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S52). 본 명세서에서 특정의 자음 또는 모음이 마우스의 특정 동작에 매핑된다는 것은 하나의 예시일 뿐, 본 발명의 범위는 이에 한정되지 않는다.
도 6 내지 도 8은 각각 인식된 음성에 매핑된 마우스 제어 동작을 나타내고 있다. 마우스 제어부(200)는 인식된 음성에 각각 매핑된 마우스 제어 동작에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다.
도 6과 같이 인식된 음성이 '이', '미', 'ㅗ', 'ㅏ', 'ㅜ' 및 'ㅔ'일 경우 각각 마우스 제어 동작 중 좌 버튼 클릭, 우 버튼 클릭, 상 이동, 우 이동, 하 이동 및 좌 이동에 매핑될 수 있다. '이'가 제2 시간(t2) 이내에 연속으로 2 회 인식되는 경우 좌 버튼 더블 클릭에 매핑될 수 있고, '이'가 제2 시간(t2) 이내에 연속으로 2 회 인식되지 않는 경우 좌 버튼 싱글 클릭에 매핑될 수 있다. 또한, '이'가 인식되고 제2 시간 이내에 'ㅗ', 'ㅏ', 'ㅜ' 및 'ㅔ'가 인식되는 경우 즉, 'ㅣ'+'ㅗ', 'ㅣ'+'ㅏ', 'ㅣ'+'ㅜ' 및 'ㅣ'+'ㅔ'가 인식되는 경우 각각 상 드래그, 우 드래그, 하 드래그 및 좌 드래그에 매핑될 수 있다.
예컨대, 제2 시간(t2)은 150 msec 이하에 해당할 수 있으나, 본 발명의 범위는 이에 한정되지 않는다. 또한, 제2 시간(t2)은 환경 설정을 통해 사용자가 변경할 수 있다.
도 7과 같이 인식된 음성이 'ㅛ', 'ㅑ', 'ㅠ' 및 'ㅖ'일 경우 각각 마우스 제어 동작 중 상우 이동, 우하 이동, 하좌 이동 및 좌상 이동에 매핑될 수 있다. 상우 이동은 상 방향과 우 방향 사이의 대각선 방향으로의 이동을 의미하며, 우하 이동, 하좌 이동 및 좌상 이동 역시 이에 대등한 의미를 갖는다. 또한, '이'가 인식되고 제2 시간 이내에 'ㅛ', 'ㅑ', 'ㅠ' 및 'ㅖ'가 인식되는 경우 즉, 'ㅣ'+'ㅛ', 'ㅣ'+'ㅑ', 'ㅣ'+'ㅠ' 및 'ㅣ'+'ㅖ'가 인식되는 경우 각각 상우 드래그, 우하 드래그, 하좌 드래그 및 좌상 드래그에 매핑될 수 있다.
도 8과 같이 인식된 음성이 '모', '마', '무' 및 '메'일 경우 각각 마우스 제어 동작 중 상 스크롤, 우 스크롤, 하 스크롤 및 좌 스크롤에 매핑될 수 있다.
'ㅁ'에 연속되는 모음이 'ㅣ'이 아닌 경우(S51의 No 경로) 마우스 제어부(200)는 'ㅁ'에 연속되는 모음이 'ㅗ', 'ㅏ', 'ㅜ' 또는 'ㅔ'인지 판단할 수 있다(S53).
'ㅁ'에 연속되는 모음이 'ㅗ', 'ㅏ', 'ㅜ' 또는 'ㅔ'가 아닌 경우(S53의 No 경로) 도 3에 도시된 S33 단계가 실행될 수 있다.
'ㅁ'에 연속되는 모음이 'ㅗ', 'ㅏ', 'ㅜ' 또는 'ㅔ'인 경우(S53의 Yes 경로) 마우스 제어부(200)는 '모', '마', '무' 또는 '메'에 매핑된 마우스의 상 스크롤, 우 스크롤, 하 스크롤 또는 좌 스크롤에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S54).
음성 인식 결과에 자음이 검출되지 않은 경우(S40의 No 경로) 마우스 제어부(200)는 'ㅣ'가 검출되는지 판단할 수 있다(S60).
'ㅣ'가 검출되지 않은 경우(S60의 No 경로) 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출되는지 판단할 수 있다(S61).
'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출되지 않은 경우(S61의 No 경로) 도 3에 도시된 S33 단계가 실행될 수 있다.
'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출된 경우(S61의 Yes 경로) 마우스 제어부(200)는 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'에 각각 매핑된 마우스의 상 이동, 우 이동, 하 이동, 좌 이동, 상우 이동, 우하 이동, 하좌 이동 또는 좌상 이동에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S62). 상기 마우스의 이동 동작은 해당 발음이 지속되는 동안(예컨대, 상 이동의 경우 ‘ㅗ’ 발음의 지속되는 동안) 지속되거나, 해당 발음을 짧게 발음한 뒤 ‘ㅣ’ 발음이 감지될 때까지 지속될 수 있다. 상기 마우스의 이동 동작의 지속 여부를 결정하는 방법은 사용자가 환경 설정을 통해 선택 또는 변경할 수 있다.
'ㅣ'가 검출된 경우(S60의 Yes 경로) 마우스 제어부(200)는 'ㅣ'에 대한 음성 인식 결과를 수신한 뒤 제2 시간(t2) 이내에 다시 모음에 대한 음성 인식 결과를 수신하는지 판단할 수 있다(S70).
제2 시간(t2) 이내에 다시 모음에 대한 음성 인식 결과를 수신하지 않는 경우(S70의 No 경로) '이'에 매핑된 마우스의 좌 버튼 싱글 클릭에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S71).
제2 시간(t2) 이내에 다시 모음에 대한 음성 인식 결과를 수신하는 경우(S70의 Yes 경로) 'ㅣ'에 연속되는 모음이 'ㅣ'인지 판단할 수 있다(S80).
'ㅣ'에 연속되는 모음이 'ㅣ'인 경우(S80의 Yes 경로) '이'+'이'에 매핑된 마우스의 좌 버튼 더블 클릭에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S81).
'ㅣ'에 연속되는 모음이 'ㅣ'가 아닌 경우(S80의 No 경로) 'ㅣ'에 연속된 모음으로 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출되는지 판단할 수 있다(S82).
'ㅣ'에 연속된 모음으로 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출되지 않는 경우(S82의 No 경로) 도 3에 도시된 S33 단계가 실행될 수 있다.
'ㅣ'에 연속된 모음으로 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ' 또는 'ㅖ'가 검출되는 경우(S82의 Yes 경로) 마우스 제어부(200)는 'ㅣ'+'ㅗ', 'ㅣ'+'ㅏ', 'ㅣ'+'ㅜ', 'ㅣ'+'ㅔ', 'ㅣ'+'ㅛ', 'ㅣ'+'ㅑ', 'ㅣ'+'ㅠ' 또는 'ㅣ'+'ㅖ'에 각각 매핑된 마우스의 상 드래그, 우 드래그, 하 드래그, 좌 드래그, 상우 드래그, 우하 드래그, 하좌 드래그 또는 좌상 드래그에 해당하는 마우스 제어 신호(MCS)를 생성할 수 있다(S83). 상기 마우스의 드래그 동작은 해당 발음 중 후행 발음이 지속되는 동안(예컨대, 상 드래그의 경우 ‘ㅗ’ 발음의 지속되는 동안) 지속되거나, 해당 발음 중 후행 발음을 짧게 발음한 뒤 ‘ㅣ’ 발음이 감지될 때까지 지속될 수 있다. 상기 마우스의 드래그 동작의 지속 여부를 결정하는 방법은 사용자가 환경 설정을 통해 선택 또는 변경할 수 있다.
도 4에서 조건문으로 표시된 S40, S50, S51, S53, S60, S61, S70, S80 및 S82는 마우스 제어부(20)가 음성 인식 결과에 포함된 인식된 음성의 자음 또는 모음에 매핑된 마우스 동작을 검색하는 단계에 해당할 수 있다. 또한, 실행문으로 표시된 S52, S54, S62, S71, S81 및 S83은 마우스 제어부(20)가 검색된 마우스 동작에 대응하는 마우스 제어 신호(MCS)를 생성하는 단계에 해당할 수 있다.도 9는 언어별로 사용 중인 단모음을 조사한 결과를 나타낸 도면이다.
도 9를 참조하면, 전세계적으로 많은 인구가 사용중인 주요 언어들을 중심으로 각 언어에 포함되는 단모음의 종류와 사용 인구가 도시되어 있다.
주요 언어들 모두에 포함된 모음으로는 '아', '우' 및 '이'가 있고, 주요 언어들 중 아랍어를 제외한 나머지에 포함된 모음으로는 '오' 및 '에'가 있다.
즉, '아', '우', '이', '오' 및 '에'가 전세계적으로 가장 많이 쓰이는 모음이라 할 수 있다. 특히, '오', '아', '우' 및 '에'는 한글의 창제 원리인 천지인의 천(·)의 방향과 동일 또는 유사한 면이 있어 마우스의 이동 방향을 직관적으로 느낄 수 있다.
따라서, 본 발명에서는 도 6에서와 같이 'ㅗ', 'ㅏ', 'ㅜ' 및 'ㅔ'가 각각 마우스 제어 동작 중 상 이동, 우 이동, 하 이동 및 좌 이동에 매핑되는 이유에 해당한다. 또한, 'ㅗ', 'ㅏ', 'ㅜ' 및 'ㅔ' 이외에 가장 많이 쓰이는 모음인 'ㅣ'가 좌 버튼 클릭에 매핑된다.
또한, 사람의 발음 구조상 가장 쉽고 자연스럽게 발음하게 되는 자음인 'ㅁ'(예컨대, 아기가 가장 먼저 발음하게 되는 '엄마', 'mama'에 포함)과 'ㅗ', 'ㅏ', 'ㅜ' 및 'ㅔ'와 유사한 모양과 발음을 가진 'ㅛ', 'ㅑ', 'ㅠ' 및 'ㅖ'를 이용해 나머지 마우스 동작들을 매핑시킬 수 있다.
이에 따라 언어별 차이의 고려나 화자 적응 없이도 쉽게 이용이 가능한 음성 인식 마우스 회로의 구현이 가능하다. 또한, 음성 인식을 기반으로 마우스 제어 신호(MCS)를 생성하므로 손이 불편한 장애인, 외장 마우스가 없는 상황 또는 손이 자유롭지 않은 상황에서도 역시 쉽게 이용이 가능할 수 있다.
따라서, 본 발명의 실시예에 따른 음성 인식 마우스 회로 및 이의 동작 방법에 의하면, 사용자의 음성을 이용하여 마우스의 동작을 제어함으로써 실제 마우스를 이용하기 힘든 상황에서 마우스의 동작 제어가 가능할 수 있다.
또한, 본 발명의 실시예에 따른 음성 인식 마우스 회로 및 이의 동작 방법에 의하면, 전세계적으로 공통적으로 쓰이는 모음을 이용한 음성 인식을 기반으로 마우스 동작을 제어함으로써 언어별 차이의 고려나 화자 적응 없이도 마우스의 동작 제어가 가능할 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.
컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 본 발명에 따른 객체 정보 추정 방법을 수행하기 위한 프로그램 코드는 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 전송될 수도 있다.
또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
본 발명은 도면에 도시된 일 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
전자 장치(1) 마이크(5)
중앙 처리부(2) 네트워크 처리부(6)
입력부(3) 디스플레이부(7)
터치 스크린(4) 음성 인식 마우스 회로(10)

Claims (18)

  1. 사용자가 발성하는 음성을 인식하는 단계; 및
    상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 단계를 포함하고,
    상기 마우스 제어 신호를 생성하는 단계는
    상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하는 단계; 및
    상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성하는 단계를 포함하고,
    상기 마우스 동작은 상 스크롤, 우 스크롤, 하 스크롤 및 좌 스크롤을 포함하고,
    상기 상 스크롤은 '모'에 매핑되고, 상기 우 스크롤 이동은 '마'에 매핑되고, 상기 하 스크롤 이동은 '무'에 매핑되고, 상기 좌 스크롤 이동은 '메'에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 마우스 동작은 상 이동, 우 이동, 하 이동 및 좌 이동을 포함하고,
    상기 상 이동은 'ㅗ'에 매핑되고, 상기 우 이동은 'ㅏ'에 매핑되고, 상기 하 이동은 'ㅜ'에 매핑되고, 상기 좌 이동은 'ㅔ'에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  4. 제1항에 있어서,
    상기 마우스 동작은 상우 이동, 우하 이동, 하좌 이동 및 좌상 이동을 포함하고,
    상기 상우 이동은 'ㅛ'에 매핑되고, 상기 우하 이동은 'ㅑ'에 매핑되고, 상기 하좌 이동은 'ㅠ'에 매핑되고, 상기 좌상 이동은 'ㅖ'에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  5. 삭제
  6. 사용자가 발성하는 음성을 인식하는 단계; 및
    상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 단계를 포함하고,
    상기 마우스 제어 신호를 생성하는 단계는
    상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하는 단계; 및
    상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성하는 단계를 포함하고,
    상기 마우스 동작은 우 버튼 싱글 클릭 및 좌 버튼 싱글 클릭을 포함하고,
    상기 우 버튼 싱글 클릭은 '미'에 매핑되고, 상기 좌 버튼 싱글 클릭은 'ㅣ'에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  7. 제6항에 있어서,
    상기 마우스 동작은 좌 버튼 더블 클릭을 포함하고,
    상기 좌 버튼 더블 클릭은 제2 시간 이내로 연속하는 'ㅣ'에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  8. 제6항에 있어서,
    상기 마우스 동작은 상 드래그, 우 드래그, 하 드래그, 좌 드래그, 상우 드래그, 우하 드래그, 하좌 드래그, 및 좌상 드래그를 포함하고,
    상기 상 드래그, 상기 우 드래그, 상기 하 드래그, 상기 좌 드래그, 상기 상우 드래그, 상기 우하 드래그, 상기 하좌 드래그, 및 상기 좌상 드래그 각각은 'ㅣ' 이후 제2 시간 이내로 연속하는 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ', 및 'ㅖ' 각각에 매핑되는 음성 인식 마우스 회로의 동작 방법.
  9. 제1항에 있어서,
    상기 음성을 인식하는 단계는
    상기 사용자가 발성한 음성 이외의 노이즈를 제거하는 단계;
    상기 음성의 특징 벡터를 추출하는 단계; 및
    상기 추출된 특징 벡터를 기초로 상기 음성을 인식하는 단계를 포함하는 음성 인식 마우스 회로의 동작 방법.
  10. 사용자가 발성하는 음성을 인식하는 음성 인식부; 및
    상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 마우스 제어부를 포함하고,
    상기 마우스 제어부는
    상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하고, 상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성하고,
    상기 마우스 동작은 상 스크롤, 우 스크롤, 하 스크롤 및 좌 스크롤을 포함하고,
    상기 상 스크롤은 '모'에 매핑되고, 상기 우 스크롤 이동은 '마'에 매핑되고, 상기 하 스크롤 이동은 '무'에 매핑되고, 상기 좌 스크롤 이동은 '메'에 매핑되는 음성 인식 마우스 회로.
  11. 삭제
  12. 제10항에 있어서,
    상기 마우스 동작은 상 이동, 우 이동, 하 이동 및 좌 이동을 포함하고,
    상기 상 이동은 'ㅗ'에 매핑되고, 상기 우 이동은 'ㅏ'에 매핑되고, 상기 하 이동은 'ㅜ'에 매핑되고, 상기 좌 이동은 'ㅔ'에 매핑되는 음성 인식 마우스 회로.
  13. 제10항에 있어서,
    상기 마우스 동작은 상우 이동, 우하 이동, 하좌 이동 및 좌상 이동을 포함하고,
    상기 상우 이동은 'ㅛ'에 매핑되고, 상기 우하 이동은 'ㅑ'에 매핑되고, 상기 하좌 이동은 'ㅠ'에 매핑되고, 상기 좌상 이동은 'ㅖ'에 매핑되는 음성 인식 마우스 회로.
  14. 삭제
  15. 사용자가 발성하는 음성을 인식하는 음성 인식부; 및
    상기 인식된 음성에 따라 마우스 제어 신호를 생성하는 마우스 제어부를 포함하고,
    상기 마우스 제어부는
    상기 인식된 음성의 자음 또는 모음에 매핑(mapping)된 마우스 동작을 검색하고, 상기 검색된 마우스 동작에 대응하는 상기 마우스 제어 신호를 생성하고,
    상기 마우스 동작은 우 버튼 싱글 클릭 및 좌 버튼 싱글 클릭을 포함하고,
    상기 우 버튼 싱글 클릭은 '미'에 매핑되고, 상기 좌 버튼 싱글 클릭은 'ㅣ'에 매핑되는 음성 인식 마우스 회로.
  16. 제15항에 있어서,
    상기 마우스 동작은 좌 버튼 더블 클릭을 포함하고,
    상기 좌 버튼 더블 클릭은 제2 시간 이내로 연속하는 'ㅣ'에 매핑되는 음성 인식 마우스 회로.
  17. 제15항에 있어서,
    상기 마우스 동작은 상 드래그, 우 드래그, 하 드래그, 좌 드래그, 상우 드래그, 우하 드래그, 하좌 드래그, 및 좌상 드래그를 포함하고,
    상기 상 드래그, 상기 우 드래그, 상기 하 드래그, 상기 좌 드래그, 상기 상우 드래그, 상기 우하 드래그, 상기 하좌 드래그, 및 상기 좌상 드래그 각각은 'ㅣ' 이후 제2 시간 이내로 연속하는 'ㅗ', 'ㅏ', 'ㅜ', 'ㅔ', 'ㅛ', 'ㅑ', 'ㅠ', 및 'ㅖ' 각각에 매핑되는 음성 인식 마우스 회로.
  18. 제10항에 있어서,
    상기 음성 인식부는
    상기 사용자가 발성한 음성 이외의 노이즈를 제거하는 음성 개선부;
    상기 음성의 특징 벡터를 추출하는 음성 분석부; 및
    상기 추출된 특징 벡터를 기초로 상기 음성을 인식하는 패턴 분석부를 포함하는 음성 인식 마우스 회로.
KR20130119363A 2013-10-07 2013-10-07 음성 인식 마우스 회로 및 이의 동작 방법 KR101486875B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130119363A KR101486875B1 (ko) 2013-10-07 2013-10-07 음성 인식 마우스 회로 및 이의 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130119363A KR101486875B1 (ko) 2013-10-07 2013-10-07 음성 인식 마우스 회로 및 이의 동작 방법

Publications (1)

Publication Number Publication Date
KR101486875B1 true KR101486875B1 (ko) 2015-01-29

Family

ID=52592888

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130119363A KR101486875B1 (ko) 2013-10-07 2013-10-07 음성 인식 마우스 회로 및 이의 동작 방법

Country Status (1)

Country Link
KR (1) KR101486875B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102232308B1 (ko) 2020-06-01 2021-03-26 이혁수 스마트 입력 장치 및 그 동작 방법
KR102485594B1 (ko) 2022-03-14 2023-01-10 주식회사 엘젠 음성 마우스 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060040002A (ko) * 2004-11-04 2006-05-10 한국전자통신연구원 음성 인식 장치 및 그 방법
KR20110121169A (ko) * 2010-04-30 2011-11-07 주식회사 인프라웨어 음성을 이용한 마우스 포인터 제어 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060040002A (ko) * 2004-11-04 2006-05-10 한국전자통신연구원 음성 인식 장치 및 그 방법
KR20110121169A (ko) * 2010-04-30 2011-11-07 주식회사 인프라웨어 음성을 이용한 마우스 포인터 제어 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102232308B1 (ko) 2020-06-01 2021-03-26 이혁수 스마트 입력 장치 및 그 동작 방법
KR102485594B1 (ko) 2022-03-14 2023-01-10 주식회사 엘젠 음성 마우스 시스템

Similar Documents

Publication Publication Date Title
CN108829235B (zh) 语音数据处理方法和支持该方法的电子设备
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
EP3806091B1 (en) Detecting a trigger of a digital assistant
US10593346B2 (en) Rank-reduced token representation for automatic speech recognition
US8421932B2 (en) Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition
CN110310623B (zh) 样本生成方法、模型训练方法、装置、介质及电子设备
KR100586286B1 (ko) 구술 및 명령 구별을 향상하는 방법
US8606735B2 (en) Apparatus and method for predicting user's intention based on multimodal information
EP4354840A2 (en) Distributed personal assistant
US20180374476A1 (en) System and device for selecting speech recognition model
WO2017213683A1 (en) Digital assistant providing whispered speech
WO2017212306A1 (en) Multilingual word prediction
US20160247520A1 (en) Electronic apparatus, method, and program
WO2016111881A1 (en) Headless task completion within digital personal assistants
KR100632400B1 (ko) 음성 인식을 이용한 입출력 장치 및 그 방법
CN110164421B (zh) 语音解码方法、装置及存储介质
JP2022013610A (ja) 音声インタラクション制御方法、装置、電子機器、記憶媒体及びシステム
KR102630662B1 (ko) 어플리케이션 실행 방법 및 이를 지원하는 전자 장치
CN111833872B (zh) 对电梯的语音控制方法、装置、设备、系统及介质
DK179930B1 (en) DETECTING A TRIGGER OF A DIGITAL ASSISTANT
JP2018159788A (ja) 情報処理装置、方法及びプログラム
CN103903618A (zh) 一种语音输入方法及电子设备
KR101486875B1 (ko) 음성 인식 마우스 회로 및 이의 동작 방법
CN114049890A (zh) 语音控制方法、装置以及电子设备
CN111816180B (zh) 基于语音控制电梯的方法、装置、设备、系统及介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee