KR20110132247A - 음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램 - Google Patents

음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램 Download PDF

Info

Publication number
KR20110132247A
KR20110132247A KR1020110049025A KR20110049025A KR20110132247A KR 20110132247 A KR20110132247 A KR 20110132247A KR 1020110049025 A KR1020110049025 A KR 1020110049025A KR 20110049025 A KR20110049025 A KR 20110049025A KR 20110132247 A KR20110132247 A KR 20110132247A
Authority
KR
South Korea
Prior art keywords
sliding
sliding operation
microphone
detection unit
signal
Prior art date
Application number
KR1020110049025A
Other languages
English (en)
Inventor
유지 기따자와
고헤이 아사다
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20110132247A publication Critical patent/KR20110132247A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03547Touch pads, in which fingers can move on a surface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0362Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 1D translations or rotations of an operating part of the device, e.g. scroll wheels, sliders, knobs, rollers or belts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/043Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means using propagating acoustic waves
    • G06F3/0433Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means using propagating acoustic waves in which the acoustic waves are either generated by a movable member and propagated within a surface layer or propagated within a surface layer and captured by a movable member
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R9/00Transducers of moving-coil, moving-strip, or moving-wire type
    • H04R9/08Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication

Abstract

음성 신호 처리 장치는, 마이크로폰에 의해 집음된 음성 신호가 입력되고, 입력된 음성 신호에서의, 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 슬라이딩 조작의 개시 및 종료를 판정하는 슬라이딩 조작 검지부; 및 슬라이딩 조작 검지부에 의해 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 제어부를 포함한다.

Description

음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램{SOUND SIGNAL PROCESSING APPARATUS, MICROPHONE APPARATUS, SOUND SIGNAL PROCESSING METHOD, AND PROGRAM}
본원은 마이크로폰에 의해 집음된 음성 신호에 의한 유저 조작 입력을 검지하는 음성 신호 처리 장치 및 음성 신호 처리 방법에 관한 것이다. 또한, 본원은 음성 신호 처리 장치 및 음성 신호 처리 방법을 구현하기 위한 프로그램에 관한 것이다. 또한, 본원은 음성 신호 처리 장치에 음성 신호를 공급하는 마이크로폰 장치에 관한 것이다.
각종 전자 기기에서, 유저 조작을 입력하기 위한 디바이스로서, 조작 키, 키보드, 마우스, 조작 다이얼, 터치 패널 등이 사용된다.
통상, 전자 기기의 기능에 따라 이들 조작 디바이스가 탑재된다. 한편, 전자 기기의 기능이나 사용 형태에 따라서는, 가능한 한 조작 키의 수를 적게 하거나, 보다 사용성이 좋고 효율적인 조작을 할 수 있도록 하는 것이 요구되고 있다.
일본 특허 공개 번호 제2008-166897호에는 조작 입력을 위한 디바이스로서 마이크로폰을 사용하는 기술이 개시되어 있다. 일본 특허 공개 번호 제2008-166897호에 기재된 기술은 사용자가 마이크로폰 및 그 주변을 손가락 등으로 가볍게 태핑하는(tapping) 것을 조작 입력으로서 인식한다. 그 결과, 유저가 마이크로폰을 태핑할 때에 마이크로폰에 의해 집음된 음성 신호의 파형이 파형 상관 처리를 통해 인식된다.
일본 특허 공개 제2008-166897호 공보
상술된 일본 특허 공개 번호 제2008-166897호와 같이, 마이크로폰을 입력 디바이스로서도 사용하는 능력은 기기의 하우징에 대한 조작 키의 수를 감소시키고 조작성을 개선하는데 기여할 수 있다.
예를 들어, 휴대용 음악 플레이어의 조작으로서, 유저가 끼고 있는 헤드폰 부분에 마이크로폰이 부착되어 있는 경우를 가정한다. 유저는 통상, 의복 포켓, 가방 등에 휴대용 음악 플레이어를 넣는다. 유저가 헤드폰 부분의 마이크로폰 주변을 태핑함으로써 미리 결정된 조작을 행할 수 있다면, 유저가 휴대용 음악 플레이어를 꺼내는 불편함을 덜 수 있다.
한편, "태핑"은 검지되기 때문에, 예를 들어, 재생/정지/녹음/전원 온/오프의 "버튼을 1회 누르는" 행위와 대등한 액션을 할 수 있지만, 상술한 기술은 "버튼을 누르고 있는 시간이 중요한 조작 행위"에는 부적합하다.
예를 들어, 상술한 기술은 빨리 감기 재생으로서의 "버튼을 누르고 있는 동안, 재생하면서 빨리 감기를 행하는 조작" 또는 "버튼을 누르고 있는 동안, 재생 피치나 재생 속도를 변경하는" 등의 액션에는 부적합하다.
조작량과 관계되는 조작의 경우에, 예를 들어, 음량 업/다운, 및 커서나 메뉴의 선택 부분의 "보냄(Advance)" 등의 조작을 행하는 데에 태핑을 사용할 수 있지만, 일부 경우에 태핑은 불편하다. 예를 들어, 조그(jog) 다이얼이나 슬라이드 레버 등의 조작 요소가 적합하게 되어 있는 조작의 종류에는 태핑이 불편하다.
예를 들어, 태핑 조작을 음량의 업/다운에 적용하는 경우, 고려할 수 있는 조작 방식은 각 1회의 태핑에 따라 1단계 음량 업(또는 다운)이 되게 하는 것이다. 그 후, 빠르게 음량을 대폭 올리는(내리는) 태핑 조작의 경우에는, 여러번 태핑을 행할 필요가 있어 빠른 조작에 어려움이 있다. 또한, 결과로서 얻어진 조작은 사용에 있어 직감적이지도 용이하지도 않다.
마이크로폰을 입력 디바이스로서 사용하고, 상술한 바와 같은 방식의 태핑에 의해 조작이 이루어지도록 하는 것은 유용하지만, 그러한 조작 입력 방식은 계속적인 조작, 조작량과 관계되는 조작 등의 일부 조작 내용에 따라서는 적절하지 않다.
마이크로폰을 입력 디바이스로서 사용함으로써 계속적인 조작이나 조작량을 지정하는 조작도 가능하게 하여, 마이크로폰을 사용한 조작 입력 방식의 유효 이용을 가능하게 하는 것이 바람직하다.
본원의 실시예에 따른 음성 신호 처리 장치는, 마이크로폰에 의해 집음된 음성 신호가 입력되고, 입력된 음성 신호에서의, 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 슬라이딩 조작의 개시 및 종료를 판정하는 슬라이딩 조작 검지부, 및 슬라이딩 조작 검지부에 의해 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 제어부를 포함한다.
또한, 슬라이딩 조작 검지부는, 슬라이딩 음성 신호 성분의 에너지 레벨이 제1 레벨 이상인 동안의 시간이 제1 시간 이상 계속된 경우에, 슬라이딩 조작이 개시된 것으로 판정한다.
또한, 슬라이딩 조작 검지부는, 판정 처리로서, 슬라이딩 음성 신호 성분의 에너지 레벨이 제2 레벨 미만인 동안의 시간이 제2 시간 계속된 경우에, 슬라이딩 조작이 종료된 것으로 판정한다.
또한, 슬라이딩 조작 검지부는, 손가락 또는 슬라이딩 도구를 이용하여 마이크로폰 자체 또는 그 주변에 대한 회전형 슬라이딩 모션(rotary sliding motion)에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하여 판정 처리를 행한다.
또한, 복수 채널의 음성 신호는 슬라이딩 조작 검지부에 입력되고, 슬라이딩 조작 검지부는 복수 채널의 음성 신호를 서로 가산하여 얻어진 음성 신호에 대하여 판정 처리를 행한다.
선택적으로, 복수 채널의 음성 신호는 슬라이딩 조작 검지부에 입력되고, 슬라이딩 조작 검지부는, 복수 채널의 음성 신호 각각에 대하여 상기 판정 처리를 행하고, 각각의 채널에 대한 슬라이딩 조작의 개시 및 종료를 판정한다.
선택적으로, 복수 채널의 음성 신호는 슬라이딩 조작 검지부에 입력되고, 슬라이딩 조작 검지부는, 복수 채널의 음성 신호 중에서 슬라이딩 신호 성분을 포함하는 채널을 판정하는 채널 판정 처리와, 복수 채널로부터의 음성 신호 성분들을 서로 가산 또는 감산하여 얻어진 신호에 대하여 판정 처리를 행함으로써, 상기 슬라이딩 조작의 개시 및 종료를 판정하고, 슬라이딩 조작이 행해진 채널을 판정한다.
또한, 슬라이딩 조작 검지부는, 입력된 음성 신호로부터 슬라이딩 조작 방향을 더 검지하고, 제어부는, 슬라이딩 조작 검지부에 의해 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작 검지부에 의해 검지된 슬라이딩 조작 방향에 대하여 설정된 미리 결정된 제어 처리를 행한다.
또한, 슬라이딩 조작 검지부는, 입력된 음성 신호로부터 슬라이딩 조작 개소를 더 검지하고, 제어부는, 슬라이딩 조작 검지부에 의해 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작 검지부에 의해 검지된 슬라이딩 조작 개소에 대하여 설정된 미리 결정된 제어 처리를 행한다.
또한, 음성 신호 처리 장치는 마이크로폰을 더 포함하고, 마이크로폰에 의해 집음된 음성 신호는 슬라이딩 조작 검지부에 입력된다.
본 발명의 실시예에 따른 마이크로폰 장치는, 마이크로폰 및 마이크로폰의 주변에 형성되어 슬라이딩 조작 위치를 가이드하는 슬라이딩 가이드부를 포함한다.
또한, 본 발명의 실시예에 따른 마이크로폰 장치는, 마이크로폰, 및 마이크로폰의 주변에 제공되고 슬라이딩 조작 방향에 따라 상이한 음성 신호 성분들을 발생시키는 방향성 음원부를 포함한다.
또한, 본 발명의 실시예에 따른 마이크로폰 장치는, 마이크로폰 및 마이크로폰의 주변에 제공되고 슬라이딩 조작이 행해질 때에 상이한 음성 신호 성분들을 발생시키는 복수의 슬라이딩 음원부를 포함한다.
본 발명의 음성 신호 처리 방법은, 마이크로폰에 의해 집음된 음성 신호에서의, 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 슬라이딩 조작의 개시 및 종료를 판정하는 단계, 및 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 단계를 포함한다.
본 발명의 실시예에 따른 프로그램은, 슬라이딩 조작의 개시 및 종료의 판정 및 미리 결정된 제어 처리를 연산 처리 장치에 실행시키는 프로그램이다.
상술한 바와 같이 본 발명의 실시예들은, 마이크로폰을 입력 조작에 사용하면서, 간이한 음성 신호 처리를 통해, 계속적 또는 조작량을 수반하는 입력 조작을 검지할 수 있도록 한다.
따라서, 유저는 마이크로폰 또는 그 주변을 손가락 등으로 슬라이딩 모션, 즉, 마이크로폰 또는 그 주변을 트레이싱 방식으로 터치하면서 손가락 등을 유지하는 조작으로서, 미리 결정된 조작을 행한다.
그 경우, 슬라이딩 모션에 의해 발생하는 소리가 마이크로폰에 의해 집음된다. 따라서, 마이크로폰으로부터 음성 신호 처리 장치에 입력되는 음성 신호는, 슬라이딩 모션에 의해 발생한 소리의 음성 신호 성분(슬라이딩 음성 신호 성분)을 포함한다. 따라서, 슬라이딩 음성 신호 성분의 에너지 레벨 또는 진폭으로부터 슬라이딩 조작의 개시와 종료를 판정한다. 이에 의해, 슬라이딩 조작의 계속 시간으로부터 계속적인 조작 또는 조작량을 인식할 수 있다. 즉, 마이크로폰이나 그 주변의 슬라이딩 조작을, 계속적인 조작이나 조작량을 수반하는 조작으로서 인식하여, 대응하는 제어 처리를 행하는 것이 가능하게 된다.
본원의 실시예에 따르면, 조작 입력 디바이스로서 마이크로폰을 사용하여, 계속적인 조작, 또는 조작 품질이 특정될 수 있는 조작을 인지할 수 있고, 대응하는 제어를 행할 수 있다. 따라서, 유저는, 계속적인 조작, 또는 조작 품질이 특정될 수 있는 조작으로서, 마이크로폰을 사용하여, 용이하고 이해하기 쉬운 조작, 응답이 우수한 조작 등을 행할 수 있어, 편리함을 상당히 향상시킬 수 있다.
또한, 통상 다이얼 또는 슬라이드 레버를 사용하기에 편리한 조작을 마이크로폰을 사용하여 행할 수 있어, 기기 비용의 저감, 단순화된 장치 구성 등에 기여하는데에도 적합하다.
도 1은 본 발명의 실시예에 따른 기본적인 구성의 블록도이다.
도 2의 (a) 및 (b)는 각각 본 발명의 실시예에 따른 슬라이딩 조작의 설명도이다.
도 3은 본 발명의 실시예에 따른 기본적인 처리의 흐름도이다.
도 4는 실시예에 따른 NC 헤드폰의 설명도이다.
도 5는 실시예에 따른 NC 헤드폰의 블록도이다.
도 6은 실시예에 따른 슬라이딩 조작 검지부의 구성예 I의 블록도이다.
도 7은 실시예에 따른 슬라이딩 조작 검지부에서 처리되는 음성 신호의 설명도이다.
도 8은 실시예에 따른 슬라이딩 조작 검지부의 처리의 흐름도이다.
도 9는 실시예에 따른 슬라이딩 조작 검지부에 의한 슬라이딩 조작 개시/종료 판정의 설명도이다.
도 10은 실시예에 따른 슬라이딩 조작 검지부의 구성예 II의 블록도이다.
도 11은 실시예에 따른 슬라이딩 조작 검지부의 구성예 III의 블록도이다.
도 12는 실시예에 따른 구성예 III의 슬라이딩 조작 검지부의 처리의 흐름도이다.
도 13의 (a) 및 (b)는 각각 실시예에 따른 슬라이딩 가이드를 포함하는 구성의 설명도이다.
도 14의 (a) 및 (b)는 각각 실시예에 따른 방향성 음원부를 포함하는 구성의 설명도이다.
도 15의 (a) 내지 (c)는 각각 실시예에 따른 방향성 음원부의 예의 설명도이다.
도 16은 실시예에 따른 슬라이딩 방향 검지 구성의 블록도이다.
도 17은 실시예에 따른 슬라이딩 방향 검지 구성의 경우의 처리의 흐름도이다.
도 18의 (a) 및 (b)는 각각 실시예에 따른 슬라이딩 방향에 대한 주파수 특성의 설명도이다.
도 19의 (a) 및 (b)는 각각 실시예에 따른 슬라이딩 방향 판정의 설명도이다.
도 20의 (a) 및 (b)는 각각 실시예에 따른 슬라이딩 방향 판정의 다른 예의 설명도이다.
도 21의 (a) 및 (b)는 각각 실시예에 따른 슬라이딩 가이드 및 방향성 음원부를 포함하는 구성의 설명도이다.
도 22의 (a) 및 (b)는 각각 실시예에 따른 복수의 슬라이딩 음원부를 포함하는 구성의 설명도이다.
이하, 본 발명의 실시예에 대하여 다음 순서로 설명한다.
<1. 기본 구성 및 처리>
<2. NC 헤드폰에 적용한 실시예>
[2-1: NC 헤드폰의 구성]
[2-2: 슬라이딩 조작 검지부(구성예 I)]
[2-3: 슬라이딩 조작 검지부(구성예 II)]
[2-4: 슬라이딩 조작 검지부(구성예 III)]
<3. 슬라이딩 가이드가 제공되는 실시예>
<4. 방향성 음원부가 제공되는 실시예>
<5. 슬라이딩 가이드 및 방향성 음원부가 제공되는 실시예>
<6. 슬라이딩 음원부가 제공되는 실시예>
<7. 각종 기기에 적용한 실시예 및 변형예>
<8. 프로그램>
<1. 기본 구성 및 처리>
우선, 본 발명의 실시예로서의 기본 구성을 설명한다.
본원은 기기에 설치되어 집음을 목적으로 사용되고 있는 마이크로폰 디바이스를, 기기의 기능을 제어하기 위한 각종 조작 입력의 센서로서 사용하는 시스템을 가정한다.
상술한 일본 특허 공개 제2008-166897호 공보와 같이, 마이크로폰 또는 그 주변을 태핑(탭)하여, 기능을 전환시키거나 턴 온/오프할 수 있게 하는 시스템이 제안되어 왔다. 그러나, 각종 기기의 기능 중에는, 특정한 시간 범위(span)를 실시간으로 지정할 필요가 있는 기능 및 조작량을 지정하는 것이 적합한 기능도 있다. 통상의 스위치에서 유추하면, 이들 기능은 누름 버튼 스위치를 미리 결정된 시간 동안 누르는 것을 유지하는 조작에 해당한다. 이러한 점에서, 마이크로폰의 태핑에 기초한 조작 방식은 그러한 기능들을 조작하는 데 적합하지 않다.
따라서, 본원의 실시예는 마이크로폰 또는 그 주변을 터치하면서 손가락 등을 움직이는 "슬라이딩 조작"에 의해 조작 입력을 가능하게 함으로써, 계속적인 조작이나 조작량을 지정하는 조작에 적합한 유저 인터페이스를 제공한다.
본원은 이 슬라이딩 조작에 의해 이루어진 조작 입력을 검지하기 위한 검지 알고리즘 및 그 검지 알고리즘에 관련한 기구에 관한 것이다. 본원의 실시예에 따른 검지 알고리즘은, 주파수 축 해석 등의 큰 계산량을 필요로 하는 처리를 행하지 않고, 시간 축(temporal axis)만으로 처리를 행함으로써, 처리 리소스를 적게 하여 검지 효과를 얻을 수 있다.
이하 설명하는 실시예는, 상술한 구성을 채용하여 슬라이딩 조작에 의해 이루어진 조작 입력을 인식하는 음성 신호 처리 장치를 탑재한 각종 전자 기기를 나타낸다.
도 1은 실시예에 따른 기본 구성을 나타낸다.
도 1은 음성 신호 처리부(1), 마이크로폰(4), 마이크로폰 증폭기(5), A/D 변환기(6) 및 통상 처리계(7)를 나타낸다.
음성 신호 처리부(1)는 슬라이딩 조작 검지부(2)와 제어부(3)를 포함한다. 음성 신호 처리부(1)는 본원의 실시예에 따른 음성 신호 처리 장치에 대응한다. 음성 신호 처리부(1)는, 예를 들어, 중앙 처리부(CPU: central processing unit)나 디지털 신호 처리기(DSP: digital signal processor)로 형성된다.
마이크로폰(4)에 의해 집음된 음성 신호는 마이크로폰 증폭기(5)로 증폭된 후, A/D 변환기(6)에서 아날로그-디지털 변환된다. 그 후, 디지털 신호로 변환된 음성 신호는 통상 처리계(7) 및 음성 신호 처리부(1)에 입력된다.
여기에서 사용되는 통상 처리계(7)라는 용어는, 마이크로폰(4)으로부터 음성 신호가 입력되는 전자 기기에서의 음성 신호에 대한 통상의 기능의 처리부를 지칭한다.
가전 제품 기기에는, 다양한 목적을 위해 마이크로폰(4)이 미리 설치되어 있다. 선택적으로, 가전 제품 기기에는 별개의 마이크로폰(4)이 접속 가능하게 되어 있다.
그러한 가전 제품 기기의 예들은, 녹화 기능뿐만 아니라 녹음 기능이 갖춰진 디지털 카메라, IC 레코더, 음성 커뮤니케이션 기능을 갖는 퍼스널 컴퓨터 등의 정보 처리 장치, 모바일 기기 및 노이즈-소거 헤드폰(이하, "NC 헤드폰")을 포함한다.
이들 각종 전자 기기에는, 마이크로폰 입력 음성 신호에 대하여, 기능에 따른 처리계가 제공되어 있다.
예를 들어, 기록 매체에의 녹음 기능을 갖는 기기의 경우, 녹음을 위한 압축 처리, 기록용 인코드 처리 및 기록 매체에의 기록 처리를 행하는 부분은, 도 1에 도시된 통상 처리계(7)를 구성한다.
휴대 전화기 등의 통신 가능하고 음성 신호를 송신하는 기능을 갖는 기기의 경우, 압축 처리 및 송신용 인코드 처리 및 송신 처리를 행하는 부분은 도 1에 도시된 통상 처리계(7)를 구성한다.
또한, 도 3 이후에서 설명하는 NC 헤드폰의 경우, 노이즈 소거 처리를 행하는 기능 부분은 통상 처리계(7)에 대응한다.
통상 처리계(7)는 입력된 음성 신호에 대하여, 이들 기능에 따른 처리를 행한다.
음성 신호 처리부(1)는 입력된 음성 신호에 대하여 슬라이딩 조작의 검지를 행하여, 유저에 의해 이루어진 조작 입력을 검지한다.
우선, 슬라이딩 조작 검지부(2)는 시간축에 대한 처리만으로도 유저의 슬라이딩 조작의 개시 및 종료를 검지한다.
구체적으로, 입력된 음성 신호 중 슬라이딩 음성 신호 성분의 에너지 레벨이 제1 레벨 이상인 동안의 시간이 제1 시간 이상 계속되는 경우, 슬라이딩 조작 검지부(2)는 슬라이딩 조작이 개시되었다고 판정한다. 이때, 슬라이딩 조작 검지부(2)는 슬라이딩 개시 검지 신호 SdetS를 제어부(3)에 출력한다.
개시가 판정된 후, 슬라이딩 음성 신호 성분의 에너지 레벨이 제2 레벨 미만인 동안의 시간이 제2 시간 계속되는 경우에, 슬라이딩 조작 검지부(2)는 슬라이딩 조작이 종료되었다고 판정한다. 이때, 슬라이딩 조작 검지부(2)는 슬라이딩 종료 검지 신호 SdetE를 제어부(3)에 출력한다.
즉, 개시 판정으로부터 종료 판정까지의 시간이 슬라이딩 조작이 계속되는 동안의 기간으로서 판정된다.
후술하겠지만, 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE는 다양하게 고려가능한 신호 형식을 취할 수 있다.
슬라이딩 개시 검지 신호 SdetS와 슬라이딩 종료 검지 신호 SdetE는 2개의 독립적인 신호 계통(line)일 필요는 없지만, 제어부(3)가 슬라이딩 개시와 종료를 인식하게 하는 임의의 신호일 수 있다.
제어부(3)는 전자 기기에서 적어도 유저 조작에 따라 제어 처리를 행하는 기능을 구비한다. 제어부(3)가 슬라이딩 개시 검지 신호 SdetS에 기초하여 슬라이딩 조작 검지부(2)에 의해 슬라이딩 조작의 개시가 검지된 것을 인식하면, 제어부(3)는 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 개시한다.
제어부(3)가 슬라이딩 종료 검지 신호 SdetE에 기초하여, 슬라이딩 조작 검지부(2)에 의해 슬라이딩 조작의 종료가 검지된 것을 인식하면, 제어부(3)는 실행하고 있는 제어 처리를 종료한다.
선택적으로, 제어부(3)는, 슬라이딩 개시 검지 신호 SdetS로부터 슬라이딩 종료 검지 신호 SdetE까지의 기간 길이, 즉, 유저가 슬라이딩 조작을 계속하고 있는 동안의 기간 길이를, 조작량으로서 인식하여 미리 결정된 제어 처리를 행한다.
각종 전자 기기에 대하여 실행되는 제어 처리가 상이하기 때문에, 제어 처리의 예는 구체적인 전자 기기의 실시예의 설명에서 후에 설명할 것이다. 예를 들어, 음악 데이터 등의 재생 기능을 갖는 기기의 경우에는, 음량 업/다운 제어, 빨리 감기 재생 또는 되감기 재생의 제어 등이 생각된다. 예를 들어, 유저가 마이크로폰(4)에 대하여 슬라이딩 조작을 행함으로써 재생 음성의 음량의 업/다운 등이 구현된다.
도 2의 (a) 및 (b)는 슬라이딩 조작이 행해지는 방법을 나타낸다.
도 2의 (a)는 퍼스널 컴퓨터(100)를 나타낸다. 퍼스널 컴퓨터(100)에서는, 예를 들어, 키보드 부근의 하우징의 평면부에 마이크로폰(4)이 제공된다.
확대하여 보면, 유저는, 손가락이나 펜 형상의 포인터 등의 슬라이딩 도구로, 마이크로폰(4)의 상면 또는 그 주변을 트레이싱하도록 슬라이딩 조작을 행한다.
슬라이딩 조작에 의해 발생한 소리가 마이크로폰(4)에 의해 집음되어, 도 1에 도시된 구성에 따라 슬라이딩 조작 검지부(2)에 공급된다. 슬라이딩 조작 검지부(2)는, 입력된 음성 신호 중 슬라이딩 음성 신호 성분의 진폭 또는 에너지 레벨(진폭의 절대값)을 관측하여, 슬라이딩 조작의 개시/종료를 판정한다.
도 2의 (b)는 예를 들어, 노이즈 소거용의 마이크로폰(4)이 제공된 헤드폰(이어폰)(200)의 일부를 나타낸다. 헤드폰(200)은, 헤드폰 드라이버(201), 및 유저가 귀에 삽입하는 부분인 이어 피스(202)를 갖는다. 마이크로폰(4)은 이어 피스(202)와는 반대측, 즉, 마이크로폰(4)이 외부 음성을 집음할 수 있는 위치에 제공된다.
유저는 손가락 등으로, 마이크로폰(4)의 상면 또는 그 주변을 트레이싱하도록 하는 것 같은 슬라이딩 조작을 행한다.
상기한 바와 마찬가지 방식으로, 슬라이딩 조작에 의해 발생한 소리는 마이크로폰(4)에 의해 집음되어, 도 1에 도시된 구성에 따라 슬라이딩 조작 검지부(2)에 공급된다. 슬라이딩 조작 검지부(2)는 입력된 음성 신호 중 슬라이딩 음성 신호 성분의 진폭 또는 에너지 레벨(진폭의 절대값)을 관측하여, 슬라이딩 조작의 개시/종료를 판정한다.
상술한 바와 같이, 예를 들어, 슬라이딩 조작은, 유저가 각종 전자 기기의 마이크로폰(4)의 상면이나 그 주변을, 손가락 등으로 터치하면서 계속해서 트레이싱하는 것 같은 조작이다.
슬라이딩 조작에 관해서 도 2의 (a) 및 (b)는 직선적인(linear) 슬라이딩 조작을 묘사하고 있지만, 유저는 원 형상(회전형)의 슬라이딩 조작을 행할 수 있다는 점에 주목해야 한다.
직선적인 슬라이딩 조작은 단시간 동안만 유지될 수 있고, 그 결과, 일부 경우에 유저는 의도했던 제어를 행할 수 없을 수 있다. 이러한 경우, 예를 들어, 유저가 마이크로폰(4)의 주위에서 원 형상의 슬라이딩 모션을 행하게 되면, 유저는 슬라이딩 조작을 용이하게 계속할 수 있다.
본원의 실시예에 따른 기본 구성은 도 1을 참조하여 상술한 바와 같다. 즉, 마이크로폰(4)으로부터의 입력 음성 신호는 음성 신호 처리부(1)에 입력되고, 음성 신호 처리부(1)는 슬라이딩 조작을 판정함으로써 유저 조작을 검지한다. 조작 입력이 이루어졌다고 검지한 경우에는, 그 조작에 따른 미리 결정된 제어 처리를 행한다.
도 3은 실시예에 따른 기본적인 처리의 수순을 나타낸다.
도 1에 도시한 바와 같이 마이크로폰-입력 음성 신호가 항상 입력되는 음성 신호 처리부(1)에서, 단계 F2로서, 슬라이딩 조작이 개시되었는지를 판정한다. 이는 슬라이딩 조작 검지부(2)에서의 처리이다. 그 후, 유저 조작 입력으로서의 슬라이딩 조작이 개시되었다고 판정된 경우, 처리는 단계 F2로부터 F3으로 진행하여, 제어부(3)에서의 처리로서 조작 입력에 따른 제어 처리를 개시한다.
단계 F4에서, 슬라이딩 조작 검지부(2)에서의 처리로서, 유저의 슬라이딩 조작이 종료되었는지를 판정한다. 그 후, 슬라이딩 조작이 종료되었다고 판정된 경우, 처리는 단계 F4로부터 F5로 진행하여, 제어부(3)에 의해 실행된 조작 입력에 따른 동작이 종료된다.
이하에서는, 구체적인 전자 기기의 예로서, 노이즈 소거 헤드폰(NC 헤드폰)에 대하여 설명한다.
다른 전자 기기의 예에 대하여도 후술한다.
<2. NC 헤드폰에 적용한 실시예>
[2-1: NC 헤드폰의 구성]
도 4는 휴대용의 미디어 플레이어(20) 등의 음악 재생 기기에 접속되어 사용되는 노이즈 소거 헤드폰(NC 헤드폰)(10)을 모식적으로 나타낸다.
미디어 플레이어(20)는 내부의 기록 매체에 기록된 음악 등의 데이터를 재생하고, L 및 R의 2 채널의 음성 신호를, 접속된 NC 헤드폰(10)에 출력한다.
NC 헤드폰(10)은 헤드폰부(11)와 노이즈 소거 유닛(14)을 포함한다.
헤드폰부(11)는 유저의 좌우 귀에 대응하는 각각의 스피커 하우징 내에 L 채널과 R 채널의 스피커(13L 및 13R)를 갖는다.
이 예의 경우, 소위 피드 포워드(feedforward) 방식의 노이즈 소거 처리를 행한다. 마이크로폰(12L 및 12R)은 각각 좌우 스피커 하우징의 외측으로부터의 외부 음성을 집음하도록 제공된다.
헤드폰부(11)는 도면에 도시된 바와 같은 스피커 하우징을 갖는 타입이 아닐 수 있지만, 도 2의 (b)에 나타낸 이어폰형이나, 귀걸이형일 수도 있다는 점에 주목해야 한다. 본 예에서는, 마이크로폰(12L 및 12R)이 제공되는 한 이들 타입 중 어떠한 타입을 사용해도 된다.
또한, NC 헤드폰(10)은 피드 포워드 노이즈 소거 처리를 행하는 NC 헤드폰에 한정되지 않고, 피드백 노이즈 소거 처리를 행하는 NC 헤드폰일 수 있다.
상술한 바와 같이 마이크로폰(12L 및 12R)이 제공된 헤드폰부(11)에 노이즈 소거 유닛(14)이 접속된다.
노이즈 소거 유닛(14)은, 미디어 플레이어(20)로부터 공급되는 재생 음악 등의 음성 신호에 노이즈 저감 음성 신호를 믹스함으로써, 외부 노이즈가 저감된 음성 신호를 각각의 스피커(13L 및 13R)로부터 출력시킨다.
간단하게 말하면, 다음과 같이 노이즈 저감이 행해진다.
스피커 하우징에 각각 부착된 마이크로폰(12L 및 12R)은 스피커 하우징을 통해 유저의 귀에 도달하는 외부 노이즈를 집음한다. 노이즈 소거 유닛(14)은, 마이크로폰(12L 및 12R) 각각에 의해 집음된 외부 노이즈의 음성 신호로부터, 외부 노이즈와는 음향적으로 역상의 노이즈 저감 음성 신호를 생성한다. 그 후, 노이즈 소거 유닛(14)은, 생성된 노이즈 저감 음성 신호를, 재생 음악 등의 음성 신호에 합성하여, 결과적으로 얻어진 음성 신호를 각각의 스피커(13L 및 13R)에 공급한다.
따라서, 각각의 스피커(13L 및 13R)로부터 출력되는 음성은 외부 노이즈의 역상 성분을 포함한다. 따라서, 이 역상 성분과, 실제로 스피커 하우징을 통해 누설되는 외부 노이즈는 공간적으로 서로 상쇄되고, 결과적으로, 유저가 인지하는 청각으로서는, 외부 노이즈 성분이 저감되어 본래의 재생 음악의 출력 음성이 유저에게 도달하게 된다.
노이즈 소거 유닛(14)의 내부 구성예를 도 5에 나타낸다.
노이즈 소거 유닛(14)은 마이크로폰 증폭기(31L 및 31R), A/D 변환기(32L 및 32R), DSP 또는 CPU에 의해 형성된 주 처리부(33), 메모리부(40), 파워 증폭기(42L 및 42R) 및 A/D 변환기(41L 및 41R)를 갖는다.
주 처리부(33)에는 노이즈 소거부(34), 게인부(35), 가산기(36L 및 36R), 슬라이딩 조작 검지부(37), 제어부(38) 및 이퀄라이저(39)가 제공된다.
우선, 미디어 플레이어(20)로부터의 재생 음악 등의 음성 신호는 다음과 같이 처리된다.
미디어 플레이어(20)로부터, 소위 헤드폰 출력으로서 L 채널 및 R 채널의 재생 음성 신호 SA-L 및 SA-R가 공급된다.
재생 음성 신호 SA-L 및 SA-R는 A/D 변환기(41L 및 41R)에 의해 디지털 신호로 각각 변환된다. 그 후, 이퀄라이저(39)에서, 이들 음성 신호에, 진폭- 주파수 특성 보정이나 위상- 주파수 특성 보정, 또는 그 양쪽 등의 음질 보정이 이루어진다.
이퀄라이저(39)에서의 보정 처리는 제어부(38)로부터의 제어 신호 SG3에 기초하여 실행된다. 예를 들어, 주파수 특성의 지시 등이 제어 신호 SG3에 의해 이루어진다.
이퀄라이저(39)에서 음질 보정된 재생 음성 신호 SA-L 및 SA-R는, 가산기(36L 및 36R)에 의해 노이즈 저감 음성 신호에 각각 가산되어, 파워 증폭기(42L 및 42R)에 각각 공급된다.
파워 증폭기(42L 및 42R)는 각각 디지털 증폭기로 구성될 수 있거나, D/A 변환기와 아날로그 증폭기로 구성될 수 있다.
파워 증폭기(42L 및 42R)로부터의 출력은 스피커(13L 및 13R)에 대한 구동 신호로서 기능하고, 재생 음성 신호 SA-L 및 SA-R에 기초하는 음성은 각각 스피커(13L 및 13R)로부터 출력된다.
한편, 상술한 노이즈 소거를 위한 처리가 다음과 같이 행해진다.
마이크로폰(12L 및 12R)에 의해 집음된 음성 신호 SmL 및 SmR는 노이즈 소거 유닛(14)에서의 마이크로폰 증폭기(31L 및 31R)에 의해 증폭된 후, A/D 변환기(32L 및 32R)에 의해 디지털 신호로 각각 변환된다.
A/D 변환기(32L 및 32R)로부터 출력되는 디지털화된 음성 신호 SmL 및 SmR는 노이즈 소거부(34)에 공급된다. 노이즈 소거부(34)는 상술한 피드 포워드 방식에서의 노이즈 저감 음성 신호를 생성하는 디지털 필터로서 구성된다. 노이즈 소거부(34)는, 제어부(38)로부터 제어 신호 SG1에 의해 지시되는 필터 계수에 의해, 음성 신호 SmL 및 SmR의 각각에 관한 필터링을 행하여, L 채널 및 R 채널의 노이즈 저감 음성 신호를 생성한다.
생성된 L 채널 및 R 채널의 노이즈 저감 음성 신호는 게인부(35)에 공급된다. 게인부(35)는 제어부(38)로부터의 제어 신호 SG2에 의해 지시되는 게인 계수에 의해, L 채널 및 R 채널의 노이즈 저감 음성 신호에 게인을 부여한다.
그 후, 게인부(35)로부터의 L 채널 및 R 채널의 노이즈 저감 음성 신호는 가산기(36L 및 36R)에 공급되어, 상술한 바와 같이 재생 음성 신호 SA-L 및 SA-R에 각각 가산된다.
노이즈 저감 음성 신호가 이러한 방식으로 가산된 재생 음성 신호 SA-L 및 SA-R에 기초하여, 스피커(13L 및 13R)로부터 재생 음성이 각각 출력됨으로써, 상술한 바와 같은 노이즈 저감 기능이 발휘된다.
본 예의 노이즈 소거 유닛(14)은 또한, 마이크로폰(12L 및 12R) 또는 그 주변의 슬라이딩 조작에 의해 이루어진 유저 조작을 검지하는 기능을 구비한다.
마이크로폰(12L 및 12R)에 의해 각각 집음된 음성 신호 SmL 및 SmR는 슬라이딩 조작 검지부(37)에도 공급된다.
슬라이딩 조작 검지부(37)의 구성 및 동작은 보다 상세히 후술하겠지만, 슬라이딩 조작 검지부(37)는 시간축에 대한 처리를 통해서만 마이크로폰(12L 및 12R) 및 그 주변에 대한 유저의 슬라이딩 조작을 검지한다. 구체적으로는, 입력된 음성 신호 SmL, SmR에서의 슬라이딩 음성 신호 성분의 에너지 레벨이 제1 시간 이상 계속해서 미리 결정된 값을 초과하게 되면, 슬라이딩 조작 검지부(37)는 슬라이딩 조작이 개시되었다고 판정한다. 그 후, 유저에 의한 조작 입력의 개시를 통지하기 위해, 슬라이딩 조작 검지부(37)는 슬라이딩 개시 검지 신호 SdetS를 제어부(38)에 출력한다.
또한, 슬라이딩 조작 검지부(37)는, 슬라이딩 조작이 개시된 후에, 슬라이딩 음성 신호 성분의 에너지 레벨이 제2 시간 이상 계속해서 미리 결정된 값 미만이 되면, 슬라이딩 조작이 종료된 것으로 판정한다. 그 후, 유저에 의한 조작 입력의 종료를 통지하기 위해, 슬라이딩 조작 검지부(37)는 슬라이딩 종료 검지 신호 SdetE를 제어부(38)에 출력한다.
제어부(38)는 상술한 제어 신호 SG1, SG2 및 SG3에 의해 노이즈 소거 유닛(14)의 각 부를 제어한다. 또한, 제어부(38)는 미디어 플레이어(20)에 제어 신호 SG4를 송신할 수도 있다.
특히, 본 예에서, 제어부(38)는 유저의 슬라이딩 조작에 따른 제어 처리를 행하는 기능을 구비한다. 즉, 제어부(38)는, 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE에 의해 파악되는 슬라이딩 조작이 실행되고 있는 기간 동안, 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행한다. 예를 들어, 제어부(38)는 슬라이딩 조작에 의해 입력된 조작의 검지에 응답하여, 제어 신호 SG4로서 미디어 플레이어(20)에 조작 입력 정보를 송신한다.
메모리부(40)에는 제어 처리를 행할 때 제어부(38)에 의해 참조되는 정보가 기억되어 있다. 예를 들어, 메모리부(40)에는 노이즈 소거부(34) 및 이퀄라이저(39) 등에서의 필터 계수에 대한 정보 등이 기억되어 있다.
본 실시예에서, 제어부(38)는 유저의 슬라이딩 조작에 따라 미리 결정된 제어를 행한다. 제어 처리에는 실시간의 계속적인 제어가 적합하다. 그러한 제어의 예로서 다음을 가정한다.
우선, 제어 신호 SG4로서 미디어 플레이어(20)에 커맨드를 송신하여, 미디어 플레이어(20)에 예를 들어, 다음과 같은 동작들을 실행시키는 것을 고려할 수 있다.
- 슬라이딩 조작 기간 동안, 유저가 희망하는 재생 위치까지, 소리를 들으면서 FF(빨리 감기)/REW(되감기)를 행하는 제어.
- 슬라이딩 조작 기간 동안만 재생 오프 및 노이즈 소거 오프하는 제어(짧은 대화를 하는 데 적합한 상태로 전환하는 제어).
- 슬라이딩 조작 기간 동안만 노이즈 소거 기능을 오프하여 주변 소리를 듣기 쉽게 하는 동작의 제어.
- 슬라이딩 조작 기간의 길이를 조작량으로 하여, 유저가 희망하는 음량 위치까지, 음량 업 또는 다운을 조절하는 제어.
- 슬라이딩 조작 기간의 길이를 조작량으로 하여, 유저가 희망하는 재생 속도까지, 재생 속도 업 또는 다운을 조절하는 제어.
- 슬라이딩 조작 기간의 길이를 조작량으로 하여, 유저가 희망하는 재생 피치까지, 재생 피치 업 또는 다운을 조절하는 제어.
- 슬라이딩 조작 기간 동안, 음악 또는 비디오 등의 복수의 콘텐츠를 순차적으로, 부분적으로 재생하는 제어, 즉, 유저가 콘텐츠를 부분적으로 시청하면서 콘텐츠를 순차 검색하도록 하고, 슬라이딩 조작이 멈춘 시점의 콘텐츠를 재생시키는 것 같은 동작의 제어.
예를 들어, 슬라이딩 조작이 미디어 플레이어(20)의 동작에 관한 조작이라고 가정하는 경우, 제어부(38)는 슬라이딩 조작 검지부(37)에 의해 검지되는 슬라이딩 조작 기간 동안, 미디어 플레이어(20)에 필요한 커맨드를 송신하는 처리를 행한다.
후술하겠지만, 마이크로폰(12L)에 대한 슬라이딩 조작과 마이크로폰(12R)에 대한 슬라이딩 조작을 구별하여 검지하는 경우에는, 2종류의 조작 내용을 할당할 수 있다. 그 경우, 예를 들어, 마이크로폰(12L)에 대한 슬라이딩 조작은 음량 업을 의미하고, 마이크로폰(12R)에 대한 슬라이딩 조작은 음량 다운을 의미한다고 가정하면, 제어부(38)는 슬라이딩 조작 검지부(37)에 의한 슬라이딩 조작의 검지에 응답하여, 미디어 플레이어(20)에 "음량 업" 또는 "음량 다운"의 커맨드를 송신하는 처리를 행한다.
또한, 후술하겠지만, 슬라이딩 방향, 슬라이딩 개소 등에 따라 조작을 구별하는 것도 가능하다. 또한, 그들 구별과 좌우 마이크로폰(12L 및 12R)의 조합에 기초하여, 다양한 조작을 구별하여 설정할 수도 있다. 그 경우도, 제어부(38)는 그들 슬라이딩 조작의 검지에 응답하여, 미리 결정된 커맨드를 미디어 플레이어(20)에 송신한다.
노이즈 소거 기능을 실현하기 위해서는, 가능하면 귀에 가까운 마이크로폰(12L 및 12R)을 설치하는 것이 필요하다. 이러한 이유로, 마이크로폰(12L 및 12R)은 통상 귀에 가까이 설치되어 있다. 따라서, 예를 들어, 유저가 통근 시 등에 미디어 플레이어(20)의 본체를 취하지 않아도, 마이크로폰(12L 및 12R)에 대하여 슬라이딩 조작을 행하는 것만으로, 미디어 플레이어(20)의 동작을 제어할 수 있다면, 이는 유저에게 아주 편리하다.
또한, 제어부(38)가 슬라이딩 조작의 검지에 응답하여 노이즈 소거 유닛(14)의 내부 제어를 행하는 것도 고려할 수 있다.
예를 들어, 슬라이딩 조작에 응답하여, 제어부(38)는 제어 신호 SG1를 사용한 제어에 의해 노이즈 소거부(34)의 필터 계수를 전환하도록 구성될 수 있다. 예를 들어, 슬라이딩 조작 기간 동안 단시간 단위로 필터 계수를 순차 전환하여, 유저가 현재 조건에 적합한 필터 특성을 선택할 수 있도록 하는 동작을 제어할 수도 있다.
일반적으로, 노이즈 환경 특성은, 주파수 특성으로서 관찰된 경우라도, 비행장, 기차역의 플랫홈, 기차 내, 공장 등의 각각의 개별적 장소의 환경에 따라 크게 다르다. 따라서, 노이즈 저감을 위한 필터 특성으로서, 각각의 개별적 노이즈 환경 특성에 적합한 최적의 필터 특성을 사용하는 것이 요망된다. 이러한 이유로 인해, 유저가 마이크로폰(12L, 12R)에 대하여 슬라이딩 조작을 행함으로써, 가장 적합한 필터 특성을 순차 전환하여 선택하도록 하는 것이 유용하다.
또한, 제어부(38)는 슬라이딩 조작에 응답하여, 제어 신호 SG2를 사용하는 제어에 의해 게인부(35)의 게인 계수를 전환하도록 구성될 수 있다. 이에 의해, 유저는 노이즈 소거 레벨을, 용이한 조작을 통해 임의의 방식으로 조절하게 된다.
또한, 제어부(38)는 슬라이딩 조작의 검지에 응답하여, 제어 신호 SG3를 사용하는 제어에 의해 이퀄라이저(39)에서의 필터 계수를 변경하도록 구성될 수 있다. 예를 들어, 슬라이딩 조작 기간 동안 단시간 단위로 이퀄라이징 특성을 순차 전환하여, 유저가 원하는 특성을 선택할 수 있도록 하는 동작의 제어도 가능하다. 이에 의해 유저는 용이한 조작을 통해 음질 보정 상태를 선택할 수 있다. 예를 들어, 각종 프리셋 주파수 특성을 메모리부(40)에 미리 기억시키고, 유저가, 원하는 음질을 제공하는 이퀄라이저 특성을 순차 적용하여, 슬라이딩 조작의 종료 시에 적합한 특성을 선택할 수 있도록 하는 것은 유용하다.
[2-2: 슬라이딩 조작 검지부(구성예 I)]
이하, 슬라이딩 조작 검지부(37)의 구성 및 동작을 설명한다. 여기서, 우선, 도 6에 도시된 구성예 I에 대하여 설명한다.
이 구성예 I는 마이크로폰(12L 및 12R)으로부터의 음성 신호 SmL 및 SmR에 대하여 공통으로 슬라이딩 조작을 검지하는 구성예를 나타낸다.
슬라이딩 조작 검지부(37)는 가산기(51), 저역 통과 필터(52), 절대값화 회로(53), 저역 통과 필터(54) 및 판정 처리부(55)를 포함한다.
마이크로폰(12L 및 12R)으로부터의 각 음성 신호 SmL 및 SmR는 가산기(51)에 함께 가산되어 저역 통과 필터(52)에 입력된다. 저역 통과 필터(52)의 컷오프 주파수는 fc1로 설정된다. 이 컷오프 주파수 fc1는 슬라이딩 음성 신호 성분을 추출하기 위한 주파수로 설정된다. 마이크로폰(12L 및 12R)이 예를 들어, 수지로부터 성형된 헤드폰 하우징에 각각 부착되어 있는 경우, 컷오프 주파수는, 수지 재료를 손가락으로 트레이싱할 때 발생하는 음성 신호 성분을 추출할 수 있는 주파수로 설정된다. 따라서, 사용되는 수지의 종류에 적합한 컷오프 주파수 fc1가 결정된다. 물론, 금속 재료나 다른 재료로 구성되는 성분이 마이크로폰(12L 및 12R)의 주위에 사용되는 경우도 있다. 따라서, 마이크로폰(12L 및 12R) 자체의 재료나 그들 주위에 사용되는 재료에 따른 필터 특성이 판정된다.
슬라이딩 조작 동안, 음성 신호 SmL 또는 SmR에서는, 마이크로폰 부근에서 발생하는 슬라이딩 소리는 지배적인 성분이다. 그러나, 음성 신호 SmL 및 SmR는 배경 노이즈나 주변 노이즈 등 대역이 넓은 노이즈도 포함한다는 점에 주목해야 한다. 따라서, 우선, 저역 통과 필터(52)로 슬라이딩 음성 신호 성분을 추출한다.
일반적으로, 슬라이딩 모션에 의해 발생하는 소리의 음성 신호 성분은 저주파수에서 높은 에너지를 갖는다. 따라서, 저역 통과 필터(52)로 슬라이딩 음성 신호 성분을 추출하는 것을 생각할 수 있다. 그러나, 사용되는 재질에 따라서는, 미리 결정된 통과 대역을 갖는 대역 통과 필터를 사용하는 것도 생각할 수 있다.
어느 경우에도, 우선, 슬라이딩 음성 신호 성분의 에너지 레벨이 높은 주파수 대역이 추출되면 좋다.
저역 통과 필터(52)로부터 출력되는 음성 신호 SmL 및 SmR의 가산 신호에서의 슬라이딩 음성 신호 성분은 절대값화 회로(53)에서 절대값화된다.
절대값화 회로(53)에서 절대값화된 신호 S0는 저역 통과 필터(54)를 통해, 음성 신호 SmL, SmR의 에너지 레벨을 나타내는 신호 S로 변환되어, 판정 처리부(55)에 입력된다. 저역 통과 필터(54)의 컷오프 주파수 fc2는 신호 S0를 포락(envelope) 신호로 변환하기 위한 주파수로 설정된다.
판정 처리부는 신호 S에 대하여 후술하는 처리를 통해 슬라이딩 조작의 개시/종료를 검지한다. 그 후, 검지의 결과로서, 판정 처리부는 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE를 제어부(38)에 출력한다.
상술한 슬라이딩 조작 검지부(37)의 동작은 도 7 내지 도 9와 관련하여 설명한다.
도 7은 슬라이딩 조작이 행해질 때의 신호 S0 및 신호 S의 파형의 예를 나타낸다.
상술한 바와 같이, 저역 통과 필터(52)는 슬라이딩 음성 신호 성분을 추출한다. 슬라이딩 음성 신호 성분인 저역 통과 필터(52)의 출력은 정/부(positive/negative)의 값을 갖는 진폭을 갖기 때문에, 부의 진폭도 에너지 레벨로서 판정하기 위해서는 절대값화 회로(53)에서 절대값화된 신호 S0를 사용한다.
도면에 도시한 바와 같이, 슬라이딩 조작 기간 동안에는, 신호 S0의 에너지 레벨(절대값화된 슬라이딩 음성 신호 성분의 진폭 레벨)이 높아진다.
그러나, 유저의 슬라이딩 조작은 불안정하여, 트레이싱이 반드시 일정한 속도 및 강도로 행해지는 것이 아니라는 점에 주목해야 한다. 따라서, 진폭은 미소한 시간 척도로 변동한다.
이것을 저역 통과 필터(54)로 포락된 신호 S로서 나타냄으로써, 높은 에너지 레벨이 계속되는 동안의 기간을 슬라이딩 조작 기간으로서 용이하게 판정할 수 있다.
판정 처리부(55)는, 이 신호 S로부터, 도면에 도시한 슬라이딩 조작 기간, 즉, 제어 대상에 대하여 슬라이딩 조작에 따른 기능 제어를 행하는 동안의 기간을 판정한다.
도 8은 판정 처리부(55)가 신호 S로부터 슬라이딩 조작의 개시와 종료를 판정하는 처리의 흐름도이다.
판정 처리부(55)는 입력되는 신호 S에 대하여 도 8에 도시한 슬라이딩 조작 판정 처리를 행한다.
우선, 단계 F101에서, 판정 처리부(55)는 신호 S의 레벨이 임계값 TH1보다 높은지의 여부를 판정한다.
도 9는 신호 S의 파형과 임계값 TH1 및 TH2을 나타낸다. 임계값 TH1은 신호 S의 에너지 레벨이 증가했는지의 여부를 판정하는 임계값이다. 한편, 임계값 TH2은 신호 S의 에너지 레벨이 감소했는지의 여부를 판정하는 임계값이다.
단계 F101에서, 입력되는 신호 S의 값을 임계값 TH1과 순차적으로 비교한다. 신호 S의 값이 임계값 TH1 이하인 것으로 판정되는 경우, 판정 처리부(55)는 "R"로 나타낸 바와 같이 단계 F101로 복귀하고, 다음 신호 S의 입력값과 임계값 TH1을 비교한다.
신호 S의 값이 임계값 TH1을 초과하는 경우, 판정 처리부(55)는 단계 F102로 진행한다.
단계 F102에서, 판정 처리부(55)는 우선 카운터 Cn1를 0으로 리셋하여, 카운트를 개시하게 한다.
그 후, 판정 처리부(55)는 단계 F103에서 카운터 Cn1를 증가시키면서 단계 F104 및 F105에서 판정을 행한다.
단계 F104에서, 판정 처리부(55)는 신호 S의 값이 임계값 TH1보다 큰지의 여부를 판정한다.
단계 F105에서, 판정 처리부(55)는 카운터 Cn1의 값이, 제1 시간 THtm1에 도달한 것인지의 여부를 판정한다.
제1 시간 THtm1은 도 9에 도시한 바와 같은 미리 결정된 시간 기간이다. 이것은 신호 S의 에너지에서 발생한 증가가 순간적인 것이 아니라, 슬라이딩 조작으로 인한 계속적인 에너지 레벨의 증가임을 판정하기 위한 시간으로서 설정된다.
단계 F104에서 신호 S가 임계값 TH1보다 낮은 것이 검지되는 경우, 단계 F101에서 검지된 에너지 레벨의 증대는 순간적인 것이며, 슬라이딩 조작에 의한 것이 아니라고 판정하고, 판정 처리부(55)는 "R"로 나타낸 바와 같이 단계 F101로 복귀한다. 즉, 슬라이딩 조작이 개시된 것이 아니라고 판정한다.
한편, 단계 F105에서 카운터 Cn1의 값이 제1 시간 THtm1에 도달했다고 판정되는 경우는, 신호 S의 에너지 레벨이 임계값 TH1보다 큰 상태가 계속되었다고 판정되는 경우이다.
이때, 판정 처리부(55)는 단계 F106으로 진행하고, 슬라이딩 조작이 개시되었다고 판정한다. 그 후, 판정 처리부(55)는 제어부(38)에 슬라이딩 개시 검지 신호 SdetS를 출력한다.
슬라이딩 조작이 개시되었다고 판정한 후, 판정 처리부(55)는 단계 F107로 진행하여, 슬라이딩 조작의 종료 판정을 개시한다.
우선, 단계 F107에서, 판정 처리부(55)는 신호 S를 임계값 TH2과 비교하여, 신호 S가 임계값 TH2 미만이 된 것인지의 여부를 판정한다.
도 9에 도시한 바와 같이, 예를 들어, 임계값 TH2은 임계값 TH1보다 다소 낮은 레벨로 설정된다. 이 임계값 TH2은 신호 S의 에너지 레벨의 저하를 판정하기 위한 값이다.
신호 S가 임계값 TH2보다 작아진 경우, 판정 처리부(55)는 슬라이딩 조작이 종료된 가능성을 나타내는 것으로 간주하여, 단계 F108로 진행한다.
단계 F108에서, 판정 처리부(55)는 카운터 Cn2를 0으로 리셋하여, 카운트를 개시하게 한다.
그 후, 판정 처리부(55)는, 단계 F109에서 카운터 Cn2를 증대시키면서, 단계 F110 및 F111에서 판정을 행한다.
단계 F110에서, 판정 처리부(55)는 신호 S가 임계값 TH2 미만이 된 것인지의 여부를 판정한다.
또한, 단계 F111에서, 판정 처리부(55)는 카운터 Cn2의 값이 제2 시간 THtm2에 도달한 것인지의 여부를 판정한다.
제2 시간 THtm2은 도 9에 도시한 바와 같은 미리 결정된 시간 기간이다. 이것은 신호 S의 에너지에서 발생한 감소가 순간적으로 일어난 것이 아니고, 슬라이딩 조작의 종료에 수반하는 계속적인 에너지 레벨의 감소임을 판정하기 위한 시간으로서 설정된다.
단계 F110에서, 신호 S가 임계값 TH2보다 낮아지지 않는 것이 검지되는 경우, 단계 F107에서 검지된 에너지 레벨의 감소는 순간적인 것이고, 슬라이딩 조작의 종료에 의한 것이 아니라고 판정하고, 판정 처리부(55)는 "Q"로 나타낸 바와 같이 단계 F107로 복귀한다. 즉, 슬라이딩 조작이 종료된 것이 아니라고 판정한다.
예를 들어, 도 9는 슬라이딩의 개시 후, 기간 tmA으로서, 신호 S의 에너지 레벨이 임계값 TH2보다 일시적으로 감소된 상태를 나타낸다. 이 경우, 기간 tmA은 제2 시간 THtm2보다 짧은 기간이다. 이러한 경우, 그 감소는, 슬라이딩 조작 동안의 일시적인 레벨 감소로서 판정된다.
유저에 의해 행해진 슬라이딩 조작은 반드시 규칙적인 슬라이딩 모션인 것은 아니다. 상술한 바와 같이, 고정 강도를 갖고 일정한 속도로 슬라이딩 모션이 행해지는 것은 아니다. 또한, 슬라이딩 시의 손가락의 걸림(getting stuck) 등으로 인한 순간적인 슬라이딩의 정지도 통상 발생한다.
이로 인해, 신호 S의 에너지 레벨의 감소가 관측되자마자 슬라이딩 조작이 종료되었다고 판정하는 것은 적절하지 않다. 따라서, 제2 시간 THtm2을 설정하고, 감소가 발생된 동안의 기간이 제2 시간 THtm2 미만이면, 슬라이딩 조작은 종료되지 않았다고 판정한다.
한편, 단계 F111에서, 카운터 Cn2의 값이 제2 시간 THtm2에 도달한 것으로 판정되는 경우는, 신호 S의 에너지 레벨이 임계값 TH2보다 작은 상태가 계속된 것으로 판정되는 경우이다.
이때, 판정 처리부(55)는 단계 F112로 진행하고, 슬라이딩 조작이 종료되었다고 판정한다. 그 후, 판정 처리부(55)는 제어부(38)에 슬라이딩 종료 검지 신호 SdetE를 출력한다.
예를 들어, 도 9에서, 2회째에 신호 S의 에너지 레벨이 임계값 TH2 아래로 강하된 후에는, 에너지 레벨이 강하된 상태가 제2 시간 THtm2 이상 계속된다. 그 경우는, 슬라이딩 조작이 종료되었다고 판정된다.
본 예의 슬라이딩 조작 검지부(37)에서, 판정 처리부(55)는 도 8과 관련하여 상술한 바와 같은 방식으로 슬라이딩 조작의 개시/종료를 판정한다. 이에 의해, 제어부(38)는 슬라이딩 조작이 행해지는 동안의 기간을 인식하게 되어, 계속적인 조작 또는 조작량을 지정하는 조작으로서의 슬라이딩 조작에 기초하는 제어가 가능하게 된다.
또한, 슬라이딩 조작 검지부(37)에서, 판정 처리부(55)는 시간축에서의 에너지 레벨의 증감을 관측하여 슬라이딩 조작의 개시/종료의 판정한다. 이에 의해, 리소스의 증가를 초래하지 않고도, 용이하게 슬라이딩 조작을 판정할 수 있다.
슬라이딩 조작이 행해지는 경우, 마이크로폰 입력 신호에서의 미리 결정된 대역의 음성 신호(슬라이딩 음성 신호 성분)의 에너지 레벨(진폭)이 증가된다. 따라서, 슬라이딩 음성 신호 성분의 에너지를 감시함으로써, 파형 해석을 행하지 않고도, 에너지의 증감을 판정함으로써 슬라이딩 조작을 검지할 수 있다.
이에 의해, 조작을 검지하기 위한 처리 부담의 경감, 및 그 결과 얻어진 저 비용화가 가능하게 된다. 특히, NC 헤드폰(10)의 노이즈 소거 유닛(14)과 같이 소형이고 리소스가 작은 기기의 경우, 이와 같은 간이한 동작을 통해 필요한 검지 처리를 행할 수 있게 되는 것은 매우 이롭다.
불규칙한 유저 조작을 처리하기 위해서는 조작 입력 검지 처리를 항상 실행할 필요가 있다. 이러한 이유로 인해, 검지 처리는 계산량이 작은 시간축에 대한 신호 처리이기 때문에, 그러한 검지 처리는 항상 실행될 처리로서 적합하다.
또한, 검지 처리는 간단하므로, 슬라이딩 조작의 개시나 종료를 검지하는데 필요한 시간이 단축되어, 응답이 우수한 장치의 동작이 가능하게 된다.
본 예의 경우, 순간적인 슬라이딩의 정지 등으로 인해 순간적으로 신호 S의 에너지 레벨의 강하가 있더라도, 바로 슬라이딩 조작의 종료로서 간주되지는 않는다.
예를 들어, 슬라이딩 중에 다소 손가락이 쉬는 것이나 비정기적인 노이즈의 혼입 등에 의해, 아주 단시간 동안 일시적으로 에너지 레벨이 강하되더라도, 강하 이후 바로 에너지 레벨이 증가되면, 슬라이딩 조작은 계속되고 있다고 판정한다.
이에 의해, 유저 조작의 검지로서, 적합한 방식이면서 유저의 의지에 따른 조작의 종료를 검지할 수 있다. 즉, 유저는 세심한 슬라이딩 모션을 하는 것에 그다지 신경을 쓸 필요가 없어 조작이 용이하게 된다.
도 5에 나타낸 구성예 I에 따르면, 유저는 좌우의 마이크로폰(12L 및 12R) 중 어느 한쪽에 대하여 슬라이딩 조작을 행할 수 있다.
그 후, 예를 들어, 가방을 드는 등 한쪽 손이 다른 어떠한 일을 행하고 있을 때, 다른 비어 있는 손을 사용하여 용이하게 슬라이딩 조작을 행할 수 있게 됨으로써, 향상된 조작성이 제공된다.
그 후, 이러한 방식의 슬라이딩 조작 검지부(37)에 의한 슬라이딩 조작의 검지에 응답하여, 제어부(38)는 이 슬라이딩 조작에 할당된 조작 내용에 따른 제어, 예를 들어, 상술한 제어를 행한다.
제어부(38)가 미디어 플레이어(20)의 동작을 제어하는 커맨드를 송신하면, 유저는 통근 시 등에 미디어 플레이어(20)를 포켓이나 가방에 챙긴 채 미디어 플레이어(20)를 조작할 수 있다.
또한, 사용된 조작 방법은 손가락 등으로 슬라이딩 모션이 이루어지도록 하는 것이므로, 직관적으로(intuitively) 미디어 플레이어(20) 또는 노이즈 소거 유닛(14)을 제어할 수 있다.
또한, 사용된 방식은 마이크로폰(12L, 12R) 또는 그 주변에 대하여 슬라이딩 모션이 이루어지도록 하는 것이므로, 터치 센서 등 특수한 센서를 사용하지 않아도 통상의 (저렴한) 마이크로폰 및 CPU/DSP 등의 신호 처리부가 존재하는 한, 구현될 수 있으므로, 비용 삭감에 도움이 된다.
또한, 본 예의 NC 헤드폰(10)의 경우, 노이즈 소거 기능을 위해 헤드폰부(11)에 마이크로폰(12L 및 12R)이 제공된다. 마이크로폰(12L 및 12R)을 사용하여 슬라이딩 조작을 행할 수 있기 때문에, 조작 입력을 위한 추가적인 센서 디바이스를 제공할 필요는 없다. 그 점에서도 이 구성예는 비용 삭감에 적합하고, 또한 기기를 구성하는 구성 부품수의 증대도 초래하지 않는다.
도 5에 도시된 예에서는, 마이크로폰(12L 및 12R)의 각각의 L 및 R 채널로부터의 음성 신호 SmL 및 SmR를 합성하여, 슬라이딩 조작을 판정했지만, 음성 신호(예를 들어, 음성 신호 SmL)의 한쪽 채널만을 저역 통과 필터(52)에 입력할 수도 있다. 그 경우, 대응하는 채널의 마이크로폰(12L)만이 슬라이딩 조작의 용도로 사용된다.
[2-3: 슬라이딩 조작 검지부(구성예 II)]
구성예 II로서의 슬라이딩 조작 검지부(37)를 도 10과 관련하여 설명한다.
이 구성예 II는 L 채널과 R 채널, 즉, 마이크로폰(12L 및 12R)을 상이한 조작에 할당할 수 있도록 하는 예이다.
예를 들어, 본 구성예는 마이크로폰(12L)에 대한 슬라이딩 조작을 음량 업에 할당하고, 마이크로폰(12R)의 슬라이딩 조작을 음량 다운에 할당할 수 있도록 한다.
도 10에 도시한 바와 같이, 슬라이딩 조작 검지부(37)는 L 채널과 R 채널에 대하여 독립적인 2 계통의 슬라이딩 조작 검지 구성을 채택한다.
즉, 마이크로폰(12L)으로부터의 음성 신호 SmL에 대하여, 저역 통과 필터(52L), 절대값화 회로(53L), 저역 통과 필터(54L) 및 판정 처리부(55L)를 제공한다. 또한, 마이크로폰(12R)으로부터의 음성 신호 SmR에 대하여, 저역 통과 필터(52R), 절대값화 회로(53R), 저역 통과 필터(54R) 및 판정 처리부(55R)를 제공한다.
저역 통과 필터(52L 및 52R), 절대값화 회로(53L 및 53R) 및 저역 통과 필터(54L 및 54R)의 동작은 상술한 구성예 I에 따른 저역 통과 필터(52), 절대값화 회로(53) 및 저역 통과 필터(54)의 동작과 마찬가지이기 때문에, 반복의 설명은 피한다.
판정 처리부(55L 및 55R)는 예를 들어, 도 8에 도시된 바와 같은 슬라이딩 조작의 개시/종료를 판정하는 처리를 각각 행할 수 있다.
판정 처리부(55L)는, 음성 신호 SmL로부터 얻어지는 신호 S에 대하여 슬라이딩 조작의 개시를 검지하면, 슬라이딩 개시 검지 신호 SdetS(L)를 제어부(38)에 출력하고, 슬라이딩 조작의 종료를 검지하면, 판정 처리부(55L)는 슬라이딩 종료 검지 신호 SdetE(L)를 제어부(38)에 출력한다.
판정 처리부(55R)는 음성 신호 SmR로부터 얻어지는 신호 S에 대하여 슬라이딩 조작의 개시를 검지하면, 슬라이딩 개시 검지 신호 SdetS(R)를 제어부(38)에 출력하고, 슬라이딩 조작의 종료를 검지하면, 판정 처리부(55R)는 슬라이딩 종료 검지 신호 SdetE(R)를 제어부(38)에 출력한다.
제어부(38)는 슬라이딩 개시 검지 신호 SdetS(L) 및 슬라이딩 종료 검지 신호 SdetE(L)와, 슬라이딩 개시 검지 신호 SdetS(R) 및 슬라이딩 종료 검지 신호 SdetE(R)에 기초하여, 2종류의 조작 입력을 인식할 수 있다. 따라서, 그들 조작 입력에 따라, 예를 들어, 상술한 음량 업/다운의 제어 등을 행할 수 있다.
상술한 구성예 II에 따르면, 좌우의 마이크로폰(12L 및 12R)에 의한 사용에 따라 2종류의 조작이 전환될 수 있고, 이러한 구성은 유저의 조작성 향상에 적합하다.
[2 -4: 슬라이딩 조작 검지부(구성예 III)]
계속해서, 구성예 III을 도 11에 도시한다. 본 예에서는, 상술한 구성예 II와 마찬가지로, L 채널과 R 채널, 즉, 마이크로폰(12L 및 12R)을 상이한 조작에 할당할 수 있다. 상술한 구성예 II의 경우, 슬라이딩 조작 검지부(37)에 단순하게 2 계통의 슬라이딩 조작 검지 처리계를 탑재하여, 구성 부담이 커진다. 구성예 III는 구성 부담을 경감할 수 있다.
구성예 III에서, 슬라이딩 조작 검지부(37)는 복수의 채널의 음성 신호 SmL 및 SmR 중 슬라이딩 음성 신호 성분을 포함하는 채널을 판정하는 채널 판정 처리와, 복수의 채널로부터의 슬라이딩 음성 신호 성분을 서로 가산 또는 감산하여 얻어진 음성 신호에 관한 슬라이딩 조작 개시/종료 판정 처리를 행한다. 이에 의해 슬라이딩 조작, 및 슬라이딩 조작이 행해진 채널이 검지될 수 있다.
이 경우, 도 11에 도시한 바와 같이, 마이크로폰(12L)으로부터의 음성 신호 SmL는 저역 통과 필터(52L)에 입력되어, 컷오프 주파수 fc1로 슬라이딩 음성 신호 성분이 추출된다.
마이크로폰(12R)으로부터의 음성 신호 SmR는 저역 통과 필터(52)R에 입력되고, 컷오프 주파수 fc1로 슬라이딩 음성 신호 성분이 추출된다.
저역 통과 필터(52L)의 출력은 절대값화 회로(56L)와 감산기(59)에 공급된다. 저역 통과 필터(52R)의 출력은 절대값화 회로(56R)와 감산기(59)에 공급된다.
절대값화 회로(56L)는 저역 통과 필터(52L)의 출력을 절대값화하여, 그 결과 얻어진 출력을 감산기(57)에 공급한다. 절대값화 회로(56R)는 저역 통과 필터(52R)의 출력을 절대값화하여 그 결과 얻어진 출력을 감산기(57)에 공급한다.
따라서, 감산기(57)의 출력으로서, 좌우 채널의 음성 신호 SmL 및 SmR의 각각의 슬라이딩 음성 신호 성분 간의 에너지 레벨의 차분이 나타나게 된다.
감산기(57)의 출력은 컷오프 주파수 fc2를 갖는 저역 통과 필터(58)에 의해 포락 신호로 변환되어 판정 처리부(55)에 공급된다.
판정 처리부(55)에서는, 마이크로폰(12L 및 12R) 중 어느 하나에 대하여 슬라이딩 조작이 행해질 때, 포락 신호의 정부(positive or negative) 판정에 의해, 마이크로폰(12L 및 12R)의 어느쪽에 대하여 슬라이딩 조작이 행해졌는지를 검지할 수 있다.
저역 통과 필터(52L 및 52R)로 추출된 음성 신호 SmL 및 SmR의 각각의 슬라이딩 음성 신호 성분은 감산기(59)에서 감산 처리되어, 그들의 차분값이 추출된다.
마이크로폰(12L 및 12R) 중 한쪽에 대하여 슬라이딩 조작이 행해지는 경우, 슬라이딩 조작이 행해진 마이크로폰으로부터의 음성 신호의 슬라이딩 음성 신호 성분의 에너지가 증대된다. 따라서, 감산기(59)의 출력으로서, 슬라이딩 조작에 의한 에너지 증대 성분이 나타난다.
이 감산기(59)의 출력은 절대값화 회로(53)에서 절대값화되어, 컷오프 주파수 fc2를 갖고 저역 통과 필터(54)에 의해 포락된 신호 S로 변환되어 판정 처리부(55)에 공급된다.
판정 처리부(55)는 신호 S에 대하여 슬라이딩 조작 판정 처리를 행하고, 신호 S에 관한 판정 처리에 따라 슬라이딩 개시 검지 신호 SdetS, 슬라이딩 종료 검지 신호 SdetE 및 L 채널/R 채널의 판정 신호 D-LR를 제어부(38)에 출력한다.
이 경우의 판정 처리부(55)의 판정 처리는 예를 들어, 도 12에 도시된 바와 같은 방식으로 행해질 수 있다.
도 12에서, 상술한 도 8과 동일한 처리에 대해서는 동일한 단계 번호를 붙이고, 중복 설명은 피한다.
도 12에 도시된 처리에서는, 단계 F101 내지 F106에서, 도 8의 경우와 마찬가지 방식으로 슬라이딩 조작의 개시를 판정한다.
그 후, 단계 F106에서 슬라이딩이 개시되었다고 판정하는 경우, 판정 처리부(55)는 단계 F130에서 L/R 판정을 행한다.
즉, 이 시점에서, 도 11에 도시된 저역 통과 필터(58)로부터의 신호가 정인지 부인지를 판정한다. 도 11에 도시한 바와 같이 L 채널의 절대값화 신호로부터 R 채널의 절대값화 신호가 감산되는 구성의 경우, 저역 통과 필터(58)로부터의 신호가 정이면 그 채널은 L 채널이라고 판정하고, 그 신호가 부이면 그 채널은 R 채널이라고 판정한다.
이 L/R 판정은, 마이크로폰(12L 및 12R) 중 어느쪽에 대하여 슬라이딩 조작이 행해졌는지를 검지하는 처리이다. 그 후, 판정 처리부(55)는 L/R 판정의 결과를 나타내는 L 채널/R 채널의 판정 신호 D-LR를 제어부(38)에 출력한다.
따라서, 슬라이딩 조작의 개시가 검지되는 경우, 제어부(38)에는, 슬라이딩 개시 검지 신호 SdetS와 판정 신호 D-LR가 공급된다.
계속해서, 판정 처리부(55)는 도 8의 경우와 마찬가지 방식으로 단계 F107 내지 F111에서 슬라이딩 조작의 종료를 판정한다.
그 후, 슬라이딩 조작이 종료되었다고 판정되면, 판정 처리부(55)는 단계 F112에서 제어부(38)에 슬라이딩 종료 검지 신호 SdetE를 출력한다.
상술한 구성예 III의 경우, 제어부(38)는 슬라이딩 개시 검지 신호 SdetS, 슬라이딩 종료 검지 신호 SdetE 및 판정 신호 D-LR에 기초하여, 마이크로폰(12L 및 12R)을 구분하여 사용하여 2종류의 조작 입력을 인식할 수 있어, 예를 들어, 그들 조작 입력에 따라 음량 업/다운 제어 등을 행할 수 있다.
따라서, 마찬가지로 상술한 구성예 III에 따르면, 좌우의 마이크로폰(12L 및 12R)의 사용에 따라 2종류의 조작이 전환될 수 있어, 이러한 구성은 유저의 조작성 향상에 적합하다. 또한, 구성예 II에 비하여 슬라이딩 조작 검지부(37)의 구성 부담을 경감시킬 수 있다. 특히, 1개의 판정 처리부(55)만으로 된다는 사실은 처리(리소스) 부담을 경감시키는데 도움이 된다.
또한, 감산기(59) 대신 가산기를 사용하는 것도 생각된다는 점에 주목해야 한다.
<3. 슬라이딩 가이드가 제공되는 실시예>
계속해서, 마이크로폰측에 슬라이딩 조작 위치를 가이드하는 슬라이딩 가이드가 제공되는 실시예에 대하여 설명한다. 본 실시예는 본원에 따른 마이크로폰 장치의 실시예로서 기능한다.
도 2의 (a) 및 (b)에서는 마이크로폰(4)에 대하여 슬라이딩 조작이 행해지는 방식을 나타냈다. 그 경우는, 슬라이딩 조작과는 마이크로폰(4)이 형성된 부위를 간단히 트레이싱하는 조작이라고 설명했다.
이에 대해, 도 13의 (a) 및 (b)는 각각 마이크로폰(4)의 주변에 슬라이딩 가이드(8)가 제공되는 구성을 나타낸다.
도 13의 (a)는 도 2의 (a)와 마찬가지로 퍼스널 컴퓨터(100)의 하우징 상의 미리 결정된 부위에 마이크로폰(4)이 제공되는 경우를 나타낸다.
도 13의 (a)의 경우에는, 마이크로폰(4)의 주위에 링 형상의 슬라이딩 가이드(8)가 형성되어 있다.
도 13의 (b)도 도 2의 (b)와 마찬가지로, 예를 들어, 노이즈 소거용의 마이크로폰(4)이 제공된 헤드폰(이어폰)(200)의 일부를 나타낸다. 이 경우도 마이크로폰(4)의 주위에 링 형상의 슬라이딩 가이드(8)가 형성된다.
슬라이딩 가이드(8)는 간단히 유저가 촉각으로 인식할 수 있는 임의의 구조부일 수 있다. 예를 들어, 슬라이딩 가이드(8)는 볼록 또는 오목 형상으로 형성되어, 유저의 손가락에 의해 슬라이딩 모션을 가이드할 수 있다. 즉, 슬라이딩 가이드(8)는, 유저가 슬라이딩 가이드(8)를 의식하면서 원 형상으로 원활하게 손가락 등을 움직일 수 있게 하기 위해 설치된 임의의 구조물일 수 있다.
상술한 도 13의 (a) 및 (b)의 경우, 오목 형상(recessed), 즉, 링 형상의 홈이 마이크로폰(4)의 주위에 형성되지만, 돌출된(레일 형상) 링도 형성될 수 있다.
유저가 슬라이딩 조작을 회전형 방식으로(원을 그리는 방식으로) 행하면, 슬라이딩 조작이 용이하다고 상술했다. 이 점에서, 예를 들어, 이러한 방식으로 링 형상의 슬라이딩 가이드(8)가 제공되면, 유저는 보다 용이하게 회전형 슬라이딩 조작을 행할 수 있다. 즉, 유저는 손끝으로 슬라이딩 가이드(8)를 터치하면서 손가락을 돌리면, 그 결과 얻어지는 모션이 슬라이딩 조작이 된다.
그 후, 슬라이딩 가이드(8)에 의해 가이드되면서 유저가 회전형 슬라이딩 조작을 행함에 따라, 유저는 예를 들어, 비교적 오랜 시간 동안 슬라이딩 조작을 계속하기가 용이하게 된다.
또한, 슬라이딩 가이드(8)가 제공됨으로써 유저가 마이크로폰(4)으로부터 떨어진 위치에서 슬라이딩 조작을 행하여 조작이 적절하게 판정되지 않거나, 유저가 슬라이딩 조작이 행해져야 하는 위치를 알지 못하는 상황을 제거할 수 있다.
본 예에서는 회전형 슬라이딩 조작을 가이드하는 링 형상의 슬라이딩 가이드(8)를 예시했지만, 슬라이딩 가이드(8)는 직선 또는 만곡 형상을 가질 수 있다. 선택적으로, 슬라이딩 가이드(8)는 일부가 절단된 링 형상이나 직선 형상을 가질 수도 있다.
<4. 방향성 음원부가 제공되는 실시예>
또한, 마이크로폰 장치의 실시예로서, 도 14의 (a) 및 (b)는 마이크로폰(4)의 주변에 슬라이딩 조작의 방향에 따른 상이한 음성 신호 성분을 발생시키는 방향성 음원부(9)가 제공되는 예를 나타낸다.
도 14의 (a) 및 (b)도, 도 2의 (a) 및 (b)와 도 13의 (a) 및 (b)와 마찬가지로, 퍼스널 컴퓨터(100) 및 헤드폰(200)의 예를 각각 나타낸다. 이들 도면에서는, 마이크로폰(4) 주위부가 방향성 음원부(9)로서 기능한다.
방향성 음원부(9)는 슬라이딩 방향에 따라 상이한 소리를 발생시키는 재료 또는 구조의 일부이다.
방향성 음원부(9)의 일례를 도 15의 (a) 내지 (c)에 도시한다. 예를 들어, 도 15의 (a)는, 상호 접촉에 의해 소리가 발생하는 재질이 섬유로 된 것이며 근원부에는 탄력성(springiness)을 갖는 것을 나타낸다. 이 예는 이러한 성질을 갖는 재료이어도 되고, 또는 주형(mold) 등으로 이루어진 구조물이어도 된다.
이 경우, 방향성 음원부(9)는, 예를 들어, 도 15의 (b)에 도시된 바와 같이, 우측으로 슬라이딩 조작이 행해지면 상호 접촉이 발생하기 쉬워 소리가 발생하기 쉽지만, 도 15의 (c)에 도시한 바와 같이 좌측으로 슬라이딩 조작이 행해지는 경우에는, 상호 접촉이 이루어지지 않아 소리가 거의 발생하지 않는다는 성질을 갖는다고 가정한다.
즉, 슬라이딩 조작의 방향에 따라 발생하는 소리의 주파수 특성이 다르다. 이 두 방향 간의 소리의 차이를 검지함으로써, 방향별로 상이한 제어 처리를 행할 수 있다.
방향성 음원부(9)의 예는 돼지털 등의 털로 구성되는 것, 나일론, 폴리프로필렌, 폴리올레핀, ABS, 유리 섬유, FRP 등으로 실 또는 섬유 형상으로 뜬 것, 및 털 또는 견뿐만 아니라, 면, 레이온, 아세테이트 등으로부터 이루어진 벨벳이나 벨루어 섬유 등의 직물의 양측을 보풀린 천 가공한 물질 등의 재료로 구성되는 것을 포함한다.
또한, 금속, 고무 또는 수지 등의 재료나 그 재료의 조합으로 구성되는 구조물도, 구조 형상에 따라 상이한 방향에서 접촉했을 때에 상이한 소리가 나도록 구성할 수 있어, 방향성 음원부(9)로서도 사용될 수 있다.
상술한 도 15의 (a) 내지 (c)는 일방향과 그 방향의 역방향의 슬라이딩의 경우에 관한 것이지만, 슬라이딩 방향에 따라 상이한 소리가 발생하는 재질 및 구조가 다양하게 생각될 수도 있다.
물론, 발생된 소리가 상이한 것에 따른 슬라이딩 방향에 대하여도, 도 15의 (a) 내지 (c)에 도시한 바와 같이 슬라이딩의 순방향과 역방향 사이에서뿐만 아니라, X 방향과 X 방향에 직교하는 Y 방향 사이에서도 소리가 상이하도록 할 수 있다. 또한, X 방향, Y 방향 및 경사 방향 사이에서 소리를 상이하게 하는 것도 가능하다.
또한, 도 20의 (a)에 도시한 바와 같이, 순방향 X 방향(X1), 역방향 X 방향(X2), 순방향 Y 방향(Y1) 및 역방향 Y 방향(Y2) 사이에서 소리를 상이하게 하는 것도 가능하다.
도 14의 (a) 및 (b)는 각각, X 방향의 슬라이딩과 Y 방향의 슬라이딩 사이에서 상이한 소리가 발생하는 재질 또는 구조의 방향성 음원부(9)가 사용되는 경우를 나타내고 있다.
이 경우, X 방향의 왕복 슬라이딩 모션 시와, Y 방향의 왕복 슬라이딩 모션시 간에, 발생하는 소리가 상이하다. 따라서, 예를 들어, 도 1에 나타낸 슬라이딩 조작 검지부(2)는 슬라이딩 조작의 개시/종료뿐만 아니라, X 방향으로 슬라이딩 조작이 행해지는지 또는 Y 방향으로 슬라이딩 조작이 행해지는지도 판정할 수 있다. 제어부(3)는 그 판정에 따른 제어 처리를 행할 수 있다.
결과적으로, 유저가 X 방향의 슬라이딩 조작과 Y 방향의 슬라이딩 조작을 둘 사이의 차이를 의식하면서 행함에 따라, 상이한 내용의 조작 입력이 이루어질 수 있다.
도 16은 마이크로폰(4)의 주변에 방향성 음원부(9)를 제공한 경우에, 슬라이딩 방향을 검지하도록 설계된 음성 신호 처리부(1)의 구성, 특히, 슬라이딩 조작 검지부(2)의 구성의 예를 도시한다.
도 16은 도 1에 나타낸 기본 구성 중, 슬라이딩 조작 검지부(2)의 내부 구성을 상세하게 도시한다.
이 경우, 슬라이딩 조작 검지부(2)는, 슬라이딩 조작에 의해 발생하는 슬라이딩 음성 신호 성분을 사용한 판정 처리를 통해, 슬라이딩 조작의 개시 및 종료를 판정하고, 또한, 입력된 음성 신호로부터 슬라이딩 조작의 방향을 검지한다.
그 후, 제어부(3)는 슬라이딩 조작 검지부(2)에 의해 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작 검지부에 의해 검지된 슬라이딩 조작 방향에 대하여 설정된 미리 결정된 제어 처리를 행한다.
슬라이딩 조작 검지부(2)는 저역 통과 필터(52), 절대값화 회로(53), 저역 통과 필터(54) 및 판정 처리부(55)를 포함한다. 이들 부품은 상술한 NC 헤드폰(10)의 경우의 구성예 I, II 및 III에서 설명한 바와 마찬가지라고 생각할 수 있다.
즉, 저역 통과 필터(52)는 마이크로폰(4)에 의해 얻어진 음성 신호로부터 슬라이딩 음성 신호 성분을 추출한다. 여기에서는 저역 통과 필터라고 가정하고 있지만, 방향성 음원부(9)의 재질이나 구조에 따라서는 대역 통과 필터를 사용하는 것이 적합한 경우도 있을 수 있다.
이 슬라이딩 음성 신호 성분은 절대값화 회로(53)에서 절대값화되어, 저역 통과 필터(54)에 의해 포락된 신호 S로 변환되어 판정 처리부(55)에 공급된다.
판정 처리부(55)에는 개시/종료 검지 처리 블록(55a)과 슬라이딩 방향 검지 블록(55b)이 제공된다.
개시/종료 검지 처리 블록(55a)은 신호 S로부터 슬라이딩 조작의 개시 및 종료를 판정하고, 이 판정에 따라서 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE를 제어부(3)에 출력한다.
슬라이딩 조작 검지부(2)에는 또한, 대역 통과 필터(61-1, 61-2, 61-3 및 61-4) 및 절대값화 회로(62-1, 62-2, 62-3 및 62-4)가 제공된다.
대역 통과 필터(61-1)의 통과 대역 중심 주파수는 fc3으로 설정된다.
대역 통과 필터(61-2)의 통과 대역 중심 주파수는 fc4로 설정된다.
대역 통과 필터(61-3)의 통과 대역 중심 주파수는 fc5로 설정된다.
대역 통과 필터(61-4)의 통과 대역 중심 주파수는 fc6으로 설정된다.
절대값화 회로(62-1, 62-2, 62-3 및 62-4)는 각각 대역 통과 필터(61-1, 61-2, 61-3 및 61-4)의 출력을 절대값화하여 얻어진 신호 S1, S2, S3 및 S4를, 판정 처리부(55)에서의 슬라이딩 방향 검지 블록(55b)에 공급한다.
슬라이딩 방향 검지 블록(55b)은 신호 S1, S2, S3 및 S4에 기초한 특성을 관측한다.
예를 들어, 슬라이딩 방향 검지 블록(55b)에는, 슬라이딩 방향별로 주파수 특성의 경향이 미리 설정된다. 이들을 신호 S1, S2, S3 및 S4와 비교하고, 패턴 인식과 동일한 방식으로, 가장 가까운 특성에 대응하는 방향을 슬라이딩 방향으로서 판정한다. 그 후,슬라이딩 방향 검지 블록(55b)은 슬라이딩 방향 판정 신호 Sd를 제어부(3)에 출력한다.
개시/종료 검지 처리 블록(55a) 및 슬라이딩 방향 검지 블록(55b)을 포함하는 판정 처리부(55)의 처리는 도 17에 도시한 바와 같다.
도 17에서, 상술한 도 8과 동일한 처리에 대해서는 동일한 단계 번호를 붙이고, 중복 설명은 피한다.
도 17에 도시한 처리에서는, 단계 F101 내지 F106에서, 개시/종료 검지 처리 블록(55a)측에 대한 처리로서, 도 8의 경우와 마찬가지 방식으로 슬라이딩 조작의 개시를 판정한다.
그 후, 단계 F106에서 슬라이딩 조작이 개시되었다고 판정하여 슬라이딩 개시 검지 신호 SdetS를 출력하는 경우, 판정 처리부(55)는, 슬라이딩 방향 검지 블록(55b)에 대한 처리로서, 단계 F140에서 슬라이딩 방향을 판정하여 슬라이딩 방향 판정 신호 Sd를 출력한다.
슬라이딩 방향 검지 블록(55b)은 신호 S1 내지 S4와, 각각의 슬라이딩 방향에 대하여 미리설정된 주파수 특성 패턴을 비교하고, 현재의 신호 S1 내지 S4에 기초한 주파수 특성이 어느 패턴에 가까운지에 따라 슬라이딩 방향을 판정한다.
도 18의 (a)및 (b) 및 도 19의 (a) 및 (b)는 각각 슬라이딩 방향을 판정하는 방법의 예를 도시한다.
도 18의 (a) 및 (b)는 방향성 음원부(9)가 훅 앤 루프 파스너(hook-and-loop fastener) 형상인 경우에, 순방향 및 역방향으로 슬라이딩이 행해질 때의 주파수 특성을 각각 도시한다.
순방향 슬라이딩 시에는, 도 18의 (a)의 피크 1 및 피크 2로서 나타낸 주파수 피크가 관측된다. 역방향 슬라이딩 시에는, 도 18의 (b)의 피크 3 및 피크 4로서 나타낸 주파수 피크가 관측된다. 예를 들어, 슬라이딩 방향에 따른 주파수 특성의 차이를 이용하여 슬라이딩 방향을 판정한다.
도 19의 (a) 및 (b)는 판정 처리를 모식적으로 나타낸다.
도 19의 (a)에 도시한 바와 같이, 대역 통과 필터(61-1 내지 61-4)의 각각의 통과 대역 중심 주파수 fc3 내지 fc6는 각각 상술한 도 18의 (a) 및 (b)에 도시한 피크 1 내지 피크 4에 대응하는 50Hz, 150Hz, 3KHz 및 7KHz로 설정된다고 가정한다.
도 19의 (b)의 순방향 슬라이딩 모델 패턴으로서 나타낸 바와 같이, 신호 S1 내지 S4에 대하여, 순방향 슬라이딩 시에는 피크 1 및 피크 2가 관측되는 주파수 특성이 된다.
또한, 도 19의 (b)의 역방향 슬라이딩 모델 패턴으로서 나타낸 바와 같이, 신호 S1 내지 S4에 대하여, 역방향 슬라이딩 시에는 피크 3 및 피크 4가 관측되는 주파수 특성이 된다.
슬라이딩 방향 검지 블록(55b)에서는, 이러한 방식으로 신호 S1 내지 S4에 대응하는 모델 패턴이 미리 설정된다.
입력되는 신호 S1 내지 S4의 각각의 레벨로부터, 대응하는 주파수 특성이 어느쪽의 모델 패턴에 가까운지를 패턴 매칭에 의해 판정한다. 그 후, 그 결과에 기초하여 슬라이딩 방향을 판정한다.
예를 들어, 도시된 예에서, 입력된 신호 S1 내지 S4에 기초한 주파수 특성은 순방향 슬라이딩 모델 패턴에 가까운 것으로 간주된다. 따라서, 슬라이딩 방향은 순방향으로 판정된다.
본 예는 순방향과 역방향의 슬라이딩 간을 구별하지만, X 방향과 Y 방향 간을 판별하는 경우에도 동일하게 적용된다.
또한, 도 20의 (a)에 도시한 바와 같이, 순방향 X 방향(X1), 역방향 X 방향(X2), 순방향 Y 방향(Y1) 및 역방향 Y 방향(Y2)의 슬라이딩 조작 간을 구별하는 경우에도 동일하게 적용된다. 예를 들어, 도 20의 (b)에 도시한 바와 같이, 슬라이딩 방향 X1, X2, Y1 및 Y2에 대응하는 각각의 주파수 특성의 모델 패턴을 미리 준비한다. 그 후, 입력된 신호 S1 내지 S4의 각각의 레벨로부터 얻어지는 주파수 특성이 어느 모델 패턴에 가까운지를 판정함으로써, 슬라이딩 방향 X1, X2, Y1 및 Y2 간을 구별할 수 있다.
이 예에서는, 4개의 대역 통과 필터(61-1 내지 61-4)를 사용하는 4개의 대역 레벨에 기초하여 패턴 매칭을 행하였지만, 한정적으로 해석되어서는 안된다. 어떻든 간에, 슬라이딩 방향에 따라 상이한 주파수 특성을 판정할 수 있도록 한다면 충분하다.
예를 들어, 슬라이딩 방향이 순방향인 경우에는 대역 A가 피크가 되고, 슬라이딩 방향이 역방향인 경우에는 대역 B가 피크가 되는 것이 분명하다면, 대역 A 및 B의 2개의 대역 통과 필터가 제공될 수도 있다. 경우에 따라서는, 5 이상의 대역 통과 필터에 의해 주파수 특성을 5 이상의 대역으로 나누어 주파수 특성 매칭을 행할 수도 있다.
도 17의 단계 F140에서, 슬라이딩 방향 검지 블록(55b)은 예를 들어, 상술한 패턴 매칭 방법에 의해 슬라이딩 방향을 판정하여, 슬라이딩 방향 판정 신호 Sd를 제어부(3)에 출력한다.
따라서, 슬라이딩 조작의 개시가 검지되는 경우, 단계 F106 및 F140의 처리를 통해, 제어부(38)에는, 슬라이딩 개시 검지 신호 SdetS와 슬라이딩 방향 판정 신호 Sd가 공급된다.
계속해서, 판정 처리부(55)는 도 8의 경우와 마찬가지 방식으로 단계 F107 내지 F111에서 슬라이딩 조작의 종료를 판정한다.
그 후, 슬라이딩 조작이 종료되었다고 판정되면, 판정 처리부(55)는 단계 F112에서 슬라이딩 종료 검지 신호 SdetE를 제어부(38)에 출력한다.
슬라이딩 조작 검지부(2)가 상술한 처리를 행함으로써, 제어부(38)는, 슬라이딩 개시 검지 신호 SdetS, 슬라이딩 종료 검지 신호 SdetE 및 슬라이딩 방향 판정 신호 Sd에 기초하여, 마이크로폰(4)에 대한 슬라이딩 방향에 따른 복수 종류의 조작 입력을 인식할 수 있다. 따라서, 그들 조작 입력에 따라서 상이한 제어 처리, 예를 들어, 음량 업/다운 등의 제어를 행할 수 있다.
따라서, 1개의 마이크로폰(4)에 대한 슬라이딩 조작에 의해 2 이상의 조작 입력이 가능하게 된다.
또한, 상술한 NC 헤드폰(10)의 구성예 II 및 III과 같이 복수의 마이크로폰에 대한 슬라이딩 조작이 서로 구별되면, 더 다양한 종류의 조작이 가능하게 된다.
또한, 도 20의 (a)에 도시한 바와 같이 4 방향 각각의 슬라이딩 소리가 규정 축으로서 독립적이고, 소리에 대하여 벡터 분해 처리가 가능하면, 4 이상의 방향(예를 들어, 비스듬하게 위 방향의 슬라이딩)을 검지할 수도 있다.
X/Y 방향, 4 방향, 나아가 다방향의 슬라이딩을 판정할 수 있다면, 마우스 조작이나 포인팅 디바이스용의 슬라이딩 조작을 사용할 수도 있다. 또한, 스크롤 조작용의 슬라이딩 조작을 사용할 수도 있다.
<5. 슬라이딩 가이드 및 방향성 음원부가 제공되는 실시예>
도 21의 (a) 및 (b)는 각각 슬라이딩 가이드(8) 및 방향성 음원부(9)가 둘 다 제공되는 경우를 나타낸다.
도 21의 (a) 및 (b)도, 도 2의 (a) 및 (b), 도 13의 (a) 및 (b), 및 도 14의 (a) 및 (b)에서와 마찬가지로 퍼스널 컴퓨터(100) 및 헤드폰(200)의 예를 각각 도시하지만, 도 21의 (a) 및 (b)에서는, 슬라이딩 가이드(8)가 방향성 음원부(9)로서 형성된다.
예를 들어, 마이크로폰(4)의 주위에 돌출된(레일 형상) 슬라이딩 가이드(8)가 링 형상으로 형성된다. 슬라이딩 가이드(8)의 재질 또는 구조는 방향성 음원부(9)가 순방향 및 역방향으로 상이한 슬라이딩 소리들을 발생시키는 것이다.
유저는, 화살표 R1 및 R2로 나타낸 바와 같이, 슬라이딩 가이드(8)에 따라 시계 방향 슬라이딩과 반시계 방향 슬라이딩 간을 구별하여 조작 입력을 행할 수 있다.
상술한 구성의 경우도, 슬라이딩 조작 검지부(2)는 도 17과 같이 슬라이딩 조작의 개시/종료 및 슬라이딩 방향을 판정하도록 구성될 수 있다.
그 후, 제어부(3)는 슬라이딩 방향에 따른 제어 처리를 행할 수 있다. 예를 들어, 음량 업/다운, 채널 또는 재생 콘텐트의 보냄(advance)/복귀(return)를 포함하는, 통상의 AV 기기에서 사용하는 것 같은 직감적인 조작이 가능하게 되어, 유저의 편리성이 높아진다.
본 예는 회전형 슬라이딩 조작을 가이드하는 링 형상의 슬라이딩 가이드(8)의 경우에 관한 것이지만, 슬라이딩 가이드(8)는 직선 또는 만곡 형상을 가질 수 있다. 선택적으로, 슬라이딩 가이드(8)는 일부가 잘린 링 형상이나 직선 형상을 가질 수도 있다. 그러한 슬라이딩 가이드(8) 각각이 방향성 음원부(9)로서 형성되는 경우, 슬라이딩 가이드(8)에 따른 순방향 및 역방향 슬라이딩 방향에 따라 복수 종류의 조작 입력이 가능하게 된다.
<6. 슬라이딩 음원부가 제공되는 실시예>
다음으로, 마이크로폰(4)의 주변에, 슬라이딩 조작 시에 상이한 음성 신호 성분을 발생시키는 복수의 슬라이딩 음원부가 제공되는 구성을 설명한다.
예를 들어, 도 22의 (a)는 마이크로폰(4)의 주위에 2개의 링 형상의 슬라이딩 음원부(8a 및 8b)가 제공되는 예를 도시한다.
또한, 도 22의 (b)는 마이크로폰(4)의 부근에 2개의 직선 형상의 슬라이딩 음원부(8a 및 8b)가 제공되는 예를 도시한다.
두 경우 모두, 슬라이딩 음원부(8a 및 8b)는 재질 및 형상에 있어 서로 상이하여, 슬라이딩이 행해질 때 상이한 소리를 발생시킨다.
이 경우, 슬라이딩 조작 검지부(2)는 입력된 음성 신호로부터 슬라이딩 조작의 개소를 검지한다. 즉, 슬라이딩 조작에 의해 발생하는 슬라이딩 음성 신호 성분을 사용한 판정 처리에 의해, 슬라이딩 조작 검지부(2)는 슬라이딩 조작의 개시 및 종료를 판정하고, 또한, 입력된 음성 신호로부터 슬라이딩 조작이 행해진 개소를 검지한다.
슬라이딩 조작이 행해진 개소를 검지하는 것은 슬라이딩 음원부(8a 및 8b) 중 어느 것에 대하여 슬라이딩 조작이 행해졌는지를 판정하는 것을 의미한다. 슬라이딩 음원부(8a 및 8b)는 슬라이딩이 행해질 때 상이한 소리를 발생시키기 때문에, 이 경우도, 도 16에 도시한 바와 같은 구성 및 처리가 채용될 수 있다.
즉, 슬라이딩의 개소는 각각의 슬라이딩 음원부(8a 및 8b)에 의해 얻어지는 소리의 주파수 특성의 패턴 매칭에 의해 판정될 수 있다. 그 후, 슬라이딩 조작 검지부(2)는, 슬라이딩 조작의 개시 및 종료의 판정에 따라, 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE를 제어부(3)에 출력하고, 또한 슬라이딩 개소의 판정 신호를 출력한다.
제어부(3)는 슬라이딩 개소의 판정 신호로부터 슬라이딩 음원부(8a 및 8b) 중 어느 것에 대하여 슬라이딩 조작이 행해졌는지를 인식할 수 있기 때문에, 제어부(3)는 이 인식에 따라 상이한 제어 처리를 행할 수 있다. 예를 들어, 제어부(3)는 슬라이딩 음원부(8a)가 조작될 시에는 음량 업, 슬라이딩 음원부(8b)가 조작될 시에는 음량 다운 등의 제어를 행한다.
이에 의해, 유저는 마이크로폰(4)의 부근의 슬라이딩의 개소를 선택하여, 다양한 조작 입력을 할 수 있게 된다.
그러한 슬라이딩 개소에 기초한 구별, 상술한 슬라이딩 방향에 기초한 구별, 나아가 복수의 마이크로폰(4) 간의 구별을 조합하여 다양한 조작 입력을 가능하게 할 수도 있다는 점에 주목해야 한다.
<7. 각종 기기에 적용한 실시예 및 변형예>
상술한 바와 같이, 각종 실시예를 상술했지만, 본원은 다양한 전자 기기에 적용될 수 있다. 이하에서는, 구체적인 전자 기기에 적용한 경우에 관한 본원의 구성 및 이점, 그 변형예 등을 예시한다.
우선, 도 4에 도시한 미디어 플레이어(20)에, 음성 신호 처리부(1)(슬라이딩 조작 검지부(2) 및 제어부(3))를 탑재하는 것이 생각된다.
즉, 노이즈 소거 유닛(14)의 기능이 미디어 플레이어(20)에 내장된다. 이 경우, 미디어 플레이어(20)는 본원의 실시예에 따른 음성 신호 처리부(1)를 탑재한 구체적인 장치이고, 상술한 NC 헤드폰(10)의 효과와 마찬가지의 효과를 제공할 수 있다.
그 경우, 마이크로폰(4)은 접속되는 헤드폰 장치에 탑재될 수 있거나, 또는 마이크로폰 입력 단자에 접속된 헤드폰 장치와는 별개의 마이크로폰 기기일 수도 있다. 물론, 미디어 플레이어(20)의 본체에 마이크로폰이 내장되는 경우, 그 마이크로폰을 사용할 수 있다.
IC 레코더 등의 녹음 기기의 경우에는, 마이크로폰(4)이 제공되어, 도 1에 도시한 바와 같은 구성을 용이하게 구현할 수 있다. 그 경우, 마이크로폰(4)에 대한 슬라이딩 조작을, 녹음 마이크로폰 레벨의 조정에 적용하는 것이 생각된다.
또한, 디지털 스틸 카메라 및 비디오 카메라 등의 다종의 촬상 기기에도 마이크로폰이 탑재되어 있다. 그러한 촬상 기기에 도 1에 도시한 구성을 제공함으로써, 마이크로폰을 이용한 조작 입력이 가능하게 된다.
예를 들어, 디지털 스틸 카메라의 경우에는, 촬상 화상의 재생 또는 검색 시에 스크롤 조작을 행하는 슬라이딩 조작을 사용하는 것이 생각된다. 비디오 카메라의 경우에는, 예를 들어, 촬상 대상에 대하여 줌을 행하는 슬라이딩 조작, 또는 카메라 줌 조작을 사용하는 것이 생각된다.
게임기의 경우에는, 마이크로폰(4)에 대한 슬라이딩 조작을 게임에 관한 조작을 행하는데에 사용할 수도 있다.
텔레비전 수상기의 경우에는, 마이크로폰(4)에 대한 슬라이딩 조작을 채널 선택을 위한 스크롤 조작, 음량 제어 조작 등을 하는데에 사용할 수 있다.
마찬가지로, 본원은 퍼스널 컴퓨터, 휴대형 정보 처리 장치(예를 들어, 개인 휴대 정보 단말기(PDA; personal digital assistant)), 휴대 전화기 등에도 적용할 수 있다.
이들 종류의 기기에 음성 입력용의 마이크폰이 제공되는 경우, 마이크로폰에 대하여 슬라이딩 조작을 행함으로써 조작 입력이 가능하게 된다. 예를 들어, 퍼스널 컴퓨터나 모바일 PC에 탑재되어 있는 통신용 스테레오 마이크로폰을 사용하여, 슬라이딩 조작 검지에 의한 조작을 인식하여, 미리 결정된 처리를 행할 수 있다. 예를 들어, 슬라이딩 조작을, 마우스 조작, 포인팅 조작, 스크롤 조작 등에 할당하는 것이 생각된다.
휴대 전화기의 경우, 마이크로폰은 당연히 제공된다. 따라서, 이 마이크로폰을 사용함으로써, 마이크로폰 디바이스의 신규 탑재 부담 없이 본원이 적용될 수 있다. 예를 들어, 본원은 전화 번호, 어드레스, 송신처명 등을 통한 검색 시의 스크롤 조작에 적용되는 것이 적합하다.
또한, 본원은 각종 통신 장치, AV(audio-visual) 기기, 가전 기기 등에도 적용될 수 있다.
또한, 슬라이딩 조작에 의해 행해질 수 있는 조작 내용으로서, 기록/재생에 관한 조작, 송/수신에 관한 조작, 메뉴 제어 조작, 엔터 조작 및 전원 온/오프 조작 등 다양한 예가 생각된다.
또한, 다수의 경우에, NC 헤드폰, 미디어 플레이어, 휴대 전화기, 모바일 PC 및 휴대용 게임기 등과 같은 모바일 기기에는 마이크로폰이 설치되어 휴대성(portability)이 높다. 이에 의해, 넓은 장소를 차지하는 스위치의 설치를 생략할 수 있는 이점이 있다.
그러한 기기는 소형이기 때문에, 기기 내부에 탑재되는 CPU나 DSP의 리소스가 필연적으로 한정된다는 점에 주목해야 한다. 이러한 배경에서, 검지 알고리즘은 가능한 한 계산량이 적은 것이 요구된다.
그로 인해, 시간축에 대하여 에너지 판정 처리를 행하고, 주파수 해석 등을 행하지 않고 슬라이딩 조작을 검지하는 실시예에 따른 상술한 알고리즘이 보다 효과적이다.
슬라이딩 조작에 의해 주어진 조작 내용에 관해서는, 상술한 슬라이딩 조작이 행해지는 마이크로폰에 대한 구별, 슬라이딩의 방향, 슬라이딩의 개소 등 외에, 간헐적인 슬라이딩 조작, 슬라이딩 조작 간격 등을 조합하여 다양한 조작을 할당할 수도 있다.
또한, 유저가 손가락으로 슬라이딩 조작을 행하는 경우, 손가락의 두툼한 부분으로 슬라이딩 조작을 행할 경우와, 손톱 끝으로 슬라이딩 조작을 행할 경우 사이에서는, 발생하는 슬라이딩 소리가 상이하다. 즉, 결과적으로 얻어진 슬라이딩 음성 신호 성분의 주파수 특성이 상이하다. 따라서, 이들 2가지 경우는 슬라이딩 조작을 판정하는 경우, 슬라이딩 조작 검지부(2)에 의해 서로 구별될 수 있다. 따라서, 그 슬라이딩 조작이 두꺼운 손가락으로 행해졌는지 또는 손톱으로 행해졌는지에 따라 상이한 조작을 할당함으로써, 슬라이딩 조작가능한 조작 내용을 증가시키는 것도 생각될 수 있다.
마이크로폰에 관하여, 다른 음성 입력 기능에 사용되는 마이크로폰을 채용할 뿐만 아니라, 슬라이딩 조작 입력 전용의 마이크로폰을 제공할 수도 있다. 조작 입력용의 다수의 마이크로폰이 제공되면, 마이크로폰을 사용하여 다수 종류의 조작 입력이 가능하게 된다.
슬라이딩 조작에 사용되는 마이크로폰은 스테레오 마이크로폰, 모노럴 마이크로폰 및 다채널 마이크로폰 중 어느 것이어도 된다.
부수적으로, 상술한 실시예에서, 슬라이딩 조작 검지부(2, 37)는 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE를 출력한다. 그들 신호는, 제어부(3, 38)가 슬라이딩 조작의 개시와 종료를 인식하게 하는 임의의 신호 형태를 취할 수 있다.
예를 들어, 슬라이딩 개시 검지 신호 SdetS 및 슬라이딩 종료 검지 신호 SdetE는 각각 H 레벨 펄스의 신호일 수 있거나, 슬라이딩의 개시 시에 H 레벨로 상승하고, 슬라이딩의 종료 시에 L 레벨로 하강하는 펄스일 수도 있다. 즉, 펄스는 슬라이딩 조작 기간 중에 계속해서 H 레벨이 되는 펄스이다. 물론, 펄스 논리는 역일 수도 있다.
나아가, 신호 형식은, 슬라이딩 기간 중에 주파수가 높은 펄스를 반복하여 출력하도록 할 수 있다.
<8. 프로그램>
본원의 실시예에 따른 프로그램은 슬라이딩 조작 검지 단계 및 제어 단계를 연산 처리 장치에 실행시키는 프로그램이다.
슬라이딩 조작 검지 단계는 일체로 또는 별도로 접속된 마이크로폰에 의해 집음된 소리 신호의 슬라이딩 음성 신호 성분을 사용한 판정 처리에 의해, 슬라이딩 조작의 개시 및 종료를 판정한다. 슬라이딩 음성 신호 성분은 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생된다.
제어 단계는 슬라이딩 조작 검지 단계에서 판정된 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행한다.
이러한 프로그램에 기초하여, 상술한 각종 기기 각각의 제어부(연산 처리 장치)가 동작함으로써, 본원의 실시예에 따른 음성 신호 처리 장치가 구현된다. 즉, 도 3 및 도 8(또는 도 12, 도 17 등)의 처리가 실행된다.
그러한 프로그램은 퍼스널 컴퓨터 등의 기기에 내장되어 있는 기록 매체로서 기능하는 HDD, CPU를 갖는 마이크로 컴퓨터 내의 ROM, 플래시 메모리 등에 미리 기록될 수 있다.
선택적으로, 프로그램은 플렉시블 디스크, CD-ROM(compact disc read only memory), 자기 광(MO: magnet optical) 디스크, DVD, 블루레이 디스크, 반도체 메모리 또는 메모리 카드 등의 리무버블 기록 매체에, 일시적 또는 영구적으로 저장(기록)될 수 있다. 이러한 리무버블 기록 매체는 소위 패키지 소프트웨어로서 제공될 수 있다.
프로그램은, 리무버블 기록 매체로부터 퍼스널 컴퓨터 등에 인스톨되는 것 외에, LAN(Local Area Network), 인터넷 등의 네트워크를 통해 다운로드 사이트로부터 다운로드할 수도 있다.
본원은 2010년 6월 1일 일본 특허청에 출원된 일본 특허 출원 번호 제2010-125501호에 기재된 것과 관련한 요지를 포함하며, 그 전체 내용은 본원에 참조로서 원용된다.
다양한 변형, 조합, 서브-조합 및 변경은, 그들이 첨부하는 특허청구범위 또는 그 균등물 내에 있는 한, 설계 요건 및 다른 요소에 따라 발생할 수 있다는 것을 본 기술분야의 기술자라면 이해할 것이다.
1: 음성 신호 처리부
2: 슬라이딩 조작 검지부
3: 제어부
4: 마이크로폰
8: 슬라이딩 가이드
8a , 8b: 슬라이딩 음원부
9: 방향성 음원부
10: NC 헤드폰
11: 헤드폰부
12L, 12R: 마이크로폰
13L, 13R: 스피커
14: 노이즈 소거 유닛
20: 미디어 플레이어
34: 노이즈 소거부
35: 게인부
37: 슬라이딩 조작 검지부
38: 제어부
39: 이퀄라이저
52, 52L, 52R, 54, 54L, 54R, 58: 저역 통과 필터
53, 53L, 53R, 56L, 56R: 절대값화 회로
55, 55L, 55R: 판정 처리부
55a: 개시 종료 검지 처리 블록
55b: 슬라이딩 방향 검지 블록

Claims (15)

  1. 마이크로폰에 의해 집음된 음성 신호가 입력되고, 입력된 상기 음성 신호에서의, 상기 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 상기 슬라이딩 조작의 개시 및 종료를 판정하는 슬라이딩 조작 검지부; 및
    상기 슬라이딩 조작 검지부에 의해 판정된 상기 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 상기 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 제어부
    를 포함하는, 음성 신호 처리 장치.
  2. 제1항에 있어서,
    상기 슬라이딩 조작 검지부는, 상기 판정 처리로서, 상기 슬라이딩 음성 신호 성분의 에너지 레벨이 제1 레벨 이상인 동안의 시간이 제1 시간 이상 계속된 경우에, 상기 슬라이딩 조작이 개시된 것으로 판정하는, 음성 신호 처리 장치.
  3. 제2항에 있어서,
    상기 슬라이딩 조작 검지부는, 상기 판정 처리로서, 상기 슬라이딩 음성 신호 성분의 에너지 레벨이 제2 레벨 미만인 동안의 시간이 제2 시간 계속된 경우에, 상기 슬라이딩 조작이 종료된 것으로 판정하는, 음성 신호 처리 장치.
  4. 제3항에 있어서,
    상기 슬라이딩 조작 검지부는, 손가락 또는 슬라이딩 도구를 이용하여 상기 마이크로폰 자체 또는 그 주변에 대한 회전형 슬라이딩 모션(rotary sliding motion)에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하여 상기 판정 처리를 행하는, 음성 신호 처리 장치.
  5. 제3항에 있어서,
    복수 채널의 음성 신호는 상기 슬라이딩 조작 검지부에 입력되고,
    상기 슬라이딩 조작 검지부는 상기 복수 채널의 음성 신호를 서로 가산하여 얻어진 음성 신호에 대하여 상기 판정 처리를 행하는, 음성 신호 처리 장치.
  6. 제3항에 있어서,
    복수 채널의 음성 신호는 상기 슬라이딩 조작 검지부에 입력되고,
    상기 슬라이딩 조작 검지부는, 상기 복수 채널의 음성 신호 각각에 대하여 상기 판정 처리를 행하고, 각각의 상기 채널에 대한 상기 슬라이딩 조작의 개시 및 종료를 판정하는, 음성 신호 처리 장치.
  7. 제3항에 있어서,
    복수 채널의 음성 신호는 상기 슬라이딩 조작 검지부에 입력되고,
    상기 슬라이딩 조작 검지부는, 상기 복수 채널의 음성 신호 중에서 슬라이딩 신호 성분을 포함하는 채널을 판정하는 채널 판정 처리와, 상기 복수 채널로부터의 음성 신호 성분들을 서로 가산 또는 감산하여 얻어진 신호에 대하여 상기 판정 처리를 행함으로써, 상기 슬라이딩 조작의 개시 및 종료를 판정하고, 상기 슬라이딩 조작이 행해진 채널을 판정하는, 음성 신호 처리 장치.
  8. 제1항에 있어서,
    상기 슬라이딩 조작 검지부는 입력된 상기 음성 신호로부터 슬라이딩 조작 방향을 더 검지하고,
    상기 제어부는, 상기 슬라이딩 조작 검지부에 의해 판정된 상기 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 상기 슬라이딩 조작 검지부에 의해 검지된 상기 슬라이딩 조작 방향에 대하여 설정된 미리 결정된 제어 처리를 행하는, 음성 신호 처리 장치.
  9. 제1항에 있어서,
    상기 슬라이딩 조작 검지부는 입력된 상기 음성 신호로부터 슬라이딩 조작 개소를 더 검지하고,
    상기 제어부는, 상기 슬라이딩 조작 검지부에 의해 판정된 상기 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 상기 슬라이딩 조작 검지부에 의해 검지된 상기 슬라이딩 조작 개소에 대하여 설정된 미리 결정된 제어 처리를 행하는, 음성 신호 처리 장치.
  10. 제1항에 있어서,
    마이크로폰을 더 포함하고,
    상기 마이크로폰에 의해 집음된 음성 신호는 상기 슬라이딩 조작 검지부에 입력되는, 음성 신호 처리 장치.
  11. 마이크로폰; 및
    상기 마이크로폰의 주변에 형성되어 슬라이딩 조작 위치를 가이드하는 슬라이딩 가이드부
    를 포함하는, 마이크로폰 장치.
  12. 마이크로폰; 및
    상기 마이크로폰의 주변에 제공되고, 슬라이딩 조작 방향에 따라 상이한 음성 신호 성분들을 발생시키는 방향성 음원부
    를 포함하는, 마이크로폰 장치.
  13. 마이크로폰; 및
    상기 마이크로폰의 주변에 제공되고, 슬라이딩 조작이 행해질 때에 상이한 음성 신호 성분들을 발생시키는 복수의 슬라이딩 음원부
    를 포함하는, 마이크로폰 장치.
  14. 마이크로폰에 의해 집음된 음성 신호에서의, 상기 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 상기 슬라이딩 조작의 개시 및 종료를 판정하는 단계; 및
    판정된 상기 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 상기 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 단계
    를 포함하는, 음성 신호 처리 방법.
  15. 마이크로폰에 의해 집음된 음성 신호에서의, 상기 마이크로폰 자체 또는 그 주변에 대한 슬라이딩 조작에 의해 발생되는 슬라이딩 음성 신호 성분을 사용하는 판정 처리에 의해, 상기 슬라이딩 조작의 개시 및 종료를 판정하는 단계; 및
    판정된 상기 슬라이딩 조작의 개시부터 종료까지의 기간 동안, 상기 슬라이딩 조작에 대하여 설정된 미리 결정된 제어 처리를 행하는 단계를 연산 처리 장치에 실행시키는 프로그램.
KR1020110049025A 2010-06-01 2011-05-24 음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램 KR20110132247A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010125501A JP5593851B2 (ja) 2010-06-01 2010-06-01 音声信号処理装置、音声信号処理方法、プログラム
JPJP-P-2010-125501 2010-06-01

Publications (1)

Publication Number Publication Date
KR20110132247A true KR20110132247A (ko) 2011-12-07

Family

ID=44530007

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110049025A KR20110132247A (ko) 2010-06-01 2011-05-24 음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램

Country Status (8)

Country Link
US (2) US8699718B2 (ko)
EP (1) EP2393305B1 (ko)
JP (1) JP5593851B2 (ko)
KR (1) KR20110132247A (ko)
CN (1) CN102333266B (ko)
BR (1) BRPI1102464A2 (ko)
SG (1) SG176404A1 (ko)
TW (1) TW201218785A (ko)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5716287B2 (ja) 2010-04-07 2015-05-13 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
JP5593852B2 (ja) 2010-06-01 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法
JP5593851B2 (ja) 2010-06-01 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
US8908877B2 (en) 2010-12-03 2014-12-09 Cirrus Logic, Inc. Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices
US9142207B2 (en) 2010-12-03 2015-09-22 Cirrus Logic, Inc. Oversight control of an adaptive noise canceler in a personal audio device
US8948407B2 (en) 2011-06-03 2015-02-03 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9076431B2 (en) 2011-06-03 2015-07-07 Cirrus Logic, Inc. Filter architecture for an adaptive noise canceler in a personal audio device
US9824677B2 (en) 2011-06-03 2017-11-21 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9214150B2 (en) 2011-06-03 2015-12-15 Cirrus Logic, Inc. Continuous adaptation of secondary path adaptive response in noise-canceling personal audio devices
US8958571B2 (en) * 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US9318094B2 (en) 2011-06-03 2016-04-19 Cirrus Logic, Inc. Adaptive noise canceling architecture for a personal audio device
US9325821B1 (en) * 2011-09-30 2016-04-26 Cirrus Logic, Inc. Sidetone management in an adaptive noise canceling (ANC) system including secondary path modeling
US9208772B2 (en) * 2011-12-23 2015-12-08 Bose Corporation Communications headset speech-based gain control
CN102547511B (zh) * 2011-12-28 2014-11-26 谭青松 耳机控制方法及耳机
US9781529B2 (en) 2012-03-27 2017-10-03 Htc Corporation Electronic apparatus and method for activating specified function thereof
US9014387B2 (en) 2012-04-26 2015-04-21 Cirrus Logic, Inc. Coordinated control of adaptive noise cancellation (ANC) among earspeaker channels
US9142205B2 (en) 2012-04-26 2015-09-22 Cirrus Logic, Inc. Leakage-modeling adaptive noise canceling for earspeakers
US9123321B2 (en) 2012-05-10 2015-09-01 Cirrus Logic, Inc. Sequenced adaptation of anti-noise generator response and secondary path response in an adaptive noise canceling system
US9076427B2 (en) 2012-05-10 2015-07-07 Cirrus Logic, Inc. Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices
US9082387B2 (en) 2012-05-10 2015-07-14 Cirrus Logic, Inc. Noise burst adaptation of secondary path adaptive response in noise-canceling personal audio devices
US9319781B2 (en) 2012-05-10 2016-04-19 Cirrus Logic, Inc. Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC)
US9318090B2 (en) 2012-05-10 2016-04-19 Cirrus Logic, Inc. Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system
US9225307B2 (en) 2012-06-28 2015-12-29 Sonos, Inc. Modification of audio responsive to proximity detection
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US9134856B2 (en) 2013-01-08 2015-09-15 Sony Corporation Apparatus and method for controlling a user interface of a device based on vibratory signals
US9107010B2 (en) 2013-02-08 2015-08-11 Cirrus Logic, Inc. Ambient noise root mean square (RMS) detector
US9369798B1 (en) 2013-03-12 2016-06-14 Cirrus Logic, Inc. Internal dynamic range control in an adaptive noise cancellation (ANC) system
US9106989B2 (en) 2013-03-13 2015-08-11 Cirrus Logic, Inc. Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device
US9414150B2 (en) 2013-03-14 2016-08-09 Cirrus Logic, Inc. Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device
US9215749B2 (en) 2013-03-14 2015-12-15 Cirrus Logic, Inc. Reducing an acoustic intensity vector with adaptive noise cancellation with two error microphones
US9635480B2 (en) 2013-03-15 2017-04-25 Cirrus Logic, Inc. Speaker impedance monitoring
US9324311B1 (en) 2013-03-15 2016-04-26 Cirrus Logic, Inc. Robust adaptive noise canceling (ANC) in a personal audio device
US9208771B2 (en) 2013-03-15 2015-12-08 Cirrus Logic, Inc. Ambient noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices
US9467776B2 (en) 2013-03-15 2016-10-11 Cirrus Logic, Inc. Monitoring of speaker impedance to detect pressure applied between mobile device and ear
US10206032B2 (en) 2013-04-10 2019-02-12 Cirrus Logic, Inc. Systems and methods for multi-mode adaptive noise cancellation for audio headsets
US9066176B2 (en) 2013-04-15 2015-06-23 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation including dynamic bias of coefficients of an adaptive noise cancellation system
US9462376B2 (en) 2013-04-16 2016-10-04 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9460701B2 (en) 2013-04-17 2016-10-04 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by biasing anti-noise level
US9478210B2 (en) 2013-04-17 2016-10-25 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9578432B1 (en) 2013-04-24 2017-02-21 Cirrus Logic, Inc. Metric and tool to evaluate secondary path design in adaptive noise cancellation systems
US9264808B2 (en) 2013-06-14 2016-02-16 Cirrus Logic, Inc. Systems and methods for detection and cancellation of narrow-band noise
US9392364B1 (en) 2013-08-15 2016-07-12 Cirrus Logic, Inc. Virtual microphone for adaptive noise cancellation in personal audio devices
US9666176B2 (en) 2013-09-13 2017-05-30 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path
US9508345B1 (en) 2013-09-24 2016-11-29 Knowles Electronics, Llc Continuous voice sensing
US9620101B1 (en) 2013-10-08 2017-04-11 Cirrus Logic, Inc. Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation
US20150128095A1 (en) * 2013-11-07 2015-05-07 Tencent Technology (Shenzhen) Company Limited Method, device and computer system for performing operations on objects in an object list
US9271064B2 (en) * 2013-11-13 2016-02-23 Personics Holdings, Llc Method and system for contact sensing using coherence analysis
US9532155B1 (en) 2013-11-20 2016-12-27 Knowles Electronics, Llc Real time monitoring of acoustic environments using ultrasound
US9704472B2 (en) 2013-12-10 2017-07-11 Cirrus Logic, Inc. Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system
US10382864B2 (en) 2013-12-10 2019-08-13 Cirrus Logic, Inc. Systems and methods for providing adaptive playback equalization in an audio device
US10219071B2 (en) 2013-12-10 2019-02-26 Cirrus Logic, Inc. Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation
US9369557B2 (en) 2014-03-05 2016-06-14 Cirrus Logic, Inc. Frequency-dependent sidetone calibration
US9479860B2 (en) 2014-03-07 2016-10-25 Cirrus Logic, Inc. Systems and methods for enhancing performance of audio transducer based on detection of transducer status
US9648410B1 (en) 2014-03-12 2017-05-09 Cirrus Logic, Inc. Control of audio output of headphone earbuds based on the environment around the headphone earbuds
US9437188B1 (en) 2014-03-28 2016-09-06 Knowles Electronics, Llc Buffered reprocessing for multi-microphone automatic speech recognition assist
US9319784B2 (en) 2014-04-14 2016-04-19 Cirrus Logic, Inc. Frequency-shaped noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices
DK3149966T3 (en) * 2014-05-30 2018-09-03 Sonova Ag A METHOD FOR CONTROLING A HEARING DEVICE THROUGH TOUCH MOVEMENTS, A TOUCH MOVEMENT CONTROL HEARING AND A METHOD OF ADAPTING A TOUCH MOVEMENT CONTROLLED HEARING
US9609416B2 (en) 2014-06-09 2017-03-28 Cirrus Logic, Inc. Headphone responsive to optical signaling
US10181315B2 (en) 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US9478212B1 (en) 2014-09-03 2016-10-25 Cirrus Logic, Inc. Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device
US9552805B2 (en) 2014-12-19 2017-01-24 Cirrus Logic, Inc. Systems and methods for performance and stability control for feedback adaptive noise cancellation
US10026388B2 (en) 2015-08-20 2018-07-17 Cirrus Logic, Inc. Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter
US9578415B1 (en) 2015-08-21 2017-02-21 Cirrus Logic, Inc. Hybrid adaptive noise cancellation system with filtered error microphone signal
US10013966B2 (en) 2016-03-15 2018-07-03 Cirrus Logic, Inc. Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device
US10582290B2 (en) * 2017-02-21 2020-03-03 Bragi GmbH Earpiece with tap functionality
JP6416995B1 (ja) * 2017-07-12 2018-10-31 レノボ・シンガポール・プライベート・リミテッド 携帯型情報処理装置、携帯型情報処理装置のコマンド入力方法、及びコンピュータが実行可能なプログラム
CN107809703A (zh) * 2017-11-15 2018-03-16 联想(北京)有限公司 一种电子设备
US20190191246A1 (en) * 2017-12-14 2019-06-20 AIWA Corporation System and Method of Intra-Speaker Network Sound Delivery
EP3627854B1 (en) * 2018-09-18 2023-06-07 Sonova AG Method for operating a hearing system and hearing system comprising two hearing devices
TWI692253B (zh) * 2018-11-22 2020-04-21 塞席爾商元鼎音訊股份有限公司 耳機組控制方法和耳機組
CN111246326B (zh) * 2018-11-29 2022-03-11 原相科技股份有限公司 耳机组控制方法和耳机组
US10969873B2 (en) * 2019-04-12 2021-04-06 Dell Products L P Detecting vibrations generated by a swipe gesture
CN111370026A (zh) * 2020-02-25 2020-07-03 维沃移动通信有限公司 设备状态检测方法及电子设备
CN112118506B (zh) * 2020-09-29 2022-11-11 英华达(上海)科技有限公司 耳机降噪模式控制方法、系统、设备及存储介质
FR3122510A1 (fr) * 2021-04-30 2022-11-04 Sagemcom Broadband Sas Commande par glissement sur des boutons virtuels
CN114371796A (zh) * 2022-01-10 2022-04-19 上海深聪半导体有限责任公司 一种识别触摸位置的方法、设备和存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000235452A (ja) * 1999-02-15 2000-08-29 Tokai Rika Co Ltd タッチ操作入力装置
JP2003516576A (ja) * 1999-12-08 2003-05-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ポータブル通信装置及びその通信方法
JP2001306254A (ja) * 2000-02-17 2001-11-02 Seiko Epson Corp 打音検出による入力機能
US7394911B2 (en) * 2003-07-08 2008-07-01 Sonian Roskilde A/S Control panel with activation zone
US8477955B2 (en) * 2004-09-23 2013-07-02 Thomson Licensing Method and apparatus for controlling a headphone
WO2006075275A1 (en) * 2005-01-12 2006-07-20 Koninklijke Philips Electronics N.V. Audio entertainment system, method, computer program product
US7966084B2 (en) * 2005-03-07 2011-06-21 Sony Ericsson Mobile Communications Ab Communication terminals with a tap determination circuit
KR100677613B1 (ko) * 2005-09-09 2007-02-02 삼성전자주식회사 멀티미디어 기기의 동작을 제어하는 방법 및 그 장치
US20140169582A1 (en) * 2006-06-30 2014-06-19 Plantronics, Inc. User interface for intelligent headset
US7978091B2 (en) * 2006-08-24 2011-07-12 Navisense Method and device for a touchless interface
US20080130910A1 (en) * 2006-11-30 2008-06-05 Motorola, Inc. Gestural user interface devices and methods for an accessory to a wireless communication device
JP4997962B2 (ja) 2006-12-27 2012-08-15 ソニー株式会社 音声出力装置、音声出力方法、音声出力処理用プログラムおよび音声出力システム
US20080234842A1 (en) * 2007-03-21 2008-09-25 Microsoft Corporation Microphones as contact sensors for device control
JP2009134451A (ja) * 2007-11-29 2009-06-18 Shin Etsu Polymer Co Ltd 電子機器およびその制御法
GB0724005D0 (en) * 2007-12-07 2008-01-16 Univ Glasgow Controller
JP4927009B2 (ja) * 2008-03-12 2012-05-09 ヤフー株式会社 手書き文字認識装置
US20090270141A1 (en) * 2008-04-29 2009-10-29 Sony Ericsson Mobile Communications Ab Apparatus having input means with rugged surface
US8418084B1 (en) * 2008-05-30 2013-04-09 At&T Intellectual Property I, L.P. Single-touch media selection
JP5061087B2 (ja) 2008-11-28 2012-10-31 株式会社豊田自動織機 ばり取り装置付き摩擦圧接機と該ばり取り装置付き摩擦圧接機のばり取り方法
US20100172522A1 (en) * 2009-01-07 2010-07-08 Pillar Ventures, Llc Programmable earphone device with customizable controls and heartbeat monitoring
US20110096036A1 (en) * 2009-10-23 2011-04-28 Mcintosh Jason Method and device for an acoustic sensor switch
US8880206B2 (en) * 2010-03-11 2014-11-04 Sony Corporation Touch-sensitive sensor
JP5716287B2 (ja) 2010-04-07 2015-05-13 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
CA2702216C (en) * 2010-05-20 2012-02-07 Research In Motion Limited Gesture based smart headphone
JP5593851B2 (ja) 2010-06-01 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
JP5593852B2 (ja) 2010-06-01 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法
US8787599B2 (en) * 2010-09-20 2014-07-22 Plantronics, Inc. Reduced microphone handling noise

Also Published As

Publication number Publication date
US9485569B2 (en) 2016-11-01
CN102333266B (zh) 2016-06-15
CN102333266A (zh) 2012-01-25
TW201218785A (en) 2012-05-01
JP2011254188A (ja) 2011-12-15
EP2393305A3 (en) 2014-09-17
US20140177851A1 (en) 2014-06-26
US20110293102A1 (en) 2011-12-01
BRPI1102464A2 (pt) 2012-11-06
EP2393305B1 (en) 2017-03-15
SG176404A1 (en) 2011-12-29
EP2393305A2 (en) 2011-12-07
US8699718B2 (en) 2014-04-15
JP5593851B2 (ja) 2014-09-24

Similar Documents

Publication Publication Date Title
KR20110132247A (ko) 음성 신호 처리 장치, 마이크로폰 장치, 음성 신호 처리 방법 및 프로그램
CN108370466B (zh) 头戴式耳机、再现控制方法和程序
EP2375775A1 (en) Audio signal processing apparatus, audio signal processing method, and program
KR102513461B1 (ko) 헤드폰 시스템
US20140079239A1 (en) System and apparatus for controlling a user interface with a bone conduction transducer
JP6927331B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid