KR101163273B1 - 음성 원격 제어 - Google Patents

음성 원격 제어 Download PDF

Info

Publication number
KR101163273B1
KR101163273B1 KR1020097001565A KR20097001565A KR101163273B1 KR 101163273 B1 KR101163273 B1 KR 101163273B1 KR 1020097001565 A KR1020097001565 A KR 1020097001565A KR 20097001565 A KR20097001565 A KR 20097001565A KR 101163273 B1 KR101163273 B1 KR 101163273B1
Authority
KR
South Korea
Prior art keywords
user
control
word
image capture
mobile terminal
Prior art date
Application number
KR1020097001565A
Other languages
English (en)
Other versions
KR20090025362A (ko
Inventor
매츠 구스타프손
줄리앙 호페
Original Assignee
소니 에릭슨 모빌 커뮤니케이션즈 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 에릭슨 모빌 커뮤니케이션즈 에이비 filed Critical 소니 에릭슨 모빌 커뮤니케이션즈 에이비
Publication of KR20090025362A publication Critical patent/KR20090025362A/ko
Application granted granted Critical
Publication of KR101163273B1 publication Critical patent/KR101163273B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/16Transforming into a non-visible representation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Studio Devices (AREA)
  • Telephone Function (AREA)
  • Selective Calling Equipment (AREA)
  • Magnetically Actuated Valves (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

장치는 이미지 캡처 장치 및 논리를 포함할 수 있다. 논리는 사용자로부터 음성 입력을 수신하여 음성 입력을 식별하도록 구성될 수 있다. 논리는 또한 식별된 음성 입력에 기초하여 이미지 캡처 장치에 연관된 제어 동작을 수행하도록 구성될 수 있다.
이미지 캡처 장치, 음성 입력

Description

음성 원격 제어{VOICE REMOTE CONTROL}
본 발명은 일반적으로 제어 동작을 수행하는 것에 관한 것이며, 특히, 음성 인식을 사용하여 이미지 캡처-관련 제어 동작을 수행하는 것에 관한 것이다.
셀룰러 전화기와 같은 통신 장치는 점차 다용도가 되고 있다. 예를 들어, 셀룰러 전화기는 오늘날 종종 사용자가 전화 통화를 하거나 전화 통화를 수신하는 것보다 문자 메시지를 전송/수신하고 음악을 재생하며, 비디오 게임을 재생하는 것, 등과 같은 것을 행하도록 하는 애플리케이션을 포함한다. 게다가, 셀룰러 전화기는 종종 사용자가 사진을 촬영하고 비디오 클립을 기록하도록 하는 카메라를 포함한다. 결과적으로, 셀룰러 전화기는 점차 일상의 일반적인 부분이 되고 있다.
US 2005118990호는 디지털 카메라가 오디오 또는 음성 제어를 통해 제어될 수 있는 디지털 카메라 및 컴비네이션 이동 전화기에 관한 것이다. 이동 전화기는 오디오 입력을 검출하기 위해서 적어도 하나의 마이크로폰을 포함한다. 검출된 오디오 입력은 전기 신호로 변환되어 프로세서로 전송된다. 프로세서가 검출된 오디오 입력을 동작시키도록 하는 소프트웨어를 포함하는 저장 매체에 프로세서가 액세스한다. 프로세서는 검출된 오디오 입력이 데이터 베이스의 카메라 명령어 중 하나에 일치하다고 결정하도록 카메라 명령어 데이터베이스와 검출된 오디오 입력을 비교한다. 일치하는 것이 있다면, 프로세서는 희망하는 기능을 수행하기 위해서 카메라 명령어에 연관된 명령 세트를 실행한다.
US 5027249호에서, 카메라는 음성 인식 동작에 의해 사진을 촬영하는 것을 설명한다. 카메라는 디지털 데이터의 형태로서 오퍼레이터의 음성 명령어 단어를 컴퓨터에 등록하는 마이크로폰을 포함한다. 컴퓨터는 등록된 데이터에 따른 동일한 음성 명령어 단어를 식별하여 카메라의 의도된 기능을 동작시킨다. 카메라는 디스플레이 장치의 음성 명령어 단어의 등록 및 인식을 위해 컴퓨터의 기능을 나타내어, 오퍼레이터가 카메라 상에서 그의 동작을 확인할 수 있도록 한다.
음성 명령어 시스템을 구비한 카메라는 음성 명령어 시스템을 습득 모드 또는 동작 모드 중 하나를 선택적으로 가져오는 스위치를 포함하며, 이는 US 4389109호에서 설명된다. 습득 모드 동안, 여러 명령어 음성이 마이크로폰 내에서 말해지며, 각각이 지정된 섹션에서 카메라에 저장된다. 동작 모드 동안, 말해진 명령어 음성은 등록된 명령어 음성 각각에 비교되며 식별된 섹션 상에 따라 제어 신호를 주로 생성하기 위해 서로 연관시키는 것에 의해 인식된다.
하나의 양상에 따르면, 적어도 하나의 이미지 캡처 장치 및 논리를 포함하는 장치가 제공된다. 논리는 사용자로부터 음성 입력을 수신하고, 음성 입력을 식별하여, 식별된 음성 입력에 따라 적어도 하나의 이미지 캡처 장치에 연관된 제어 동작을 수행하도록 구성된다.
부가적으로, 적어도 하나의 이미지 캡처 장치는 카메라를 포함하며, 제어 동작은 카메라를 사용하여 사진을 촬영하는 것을 포함할 수 있다.
부가적으로, 적어도 하나의 이미지 캡처 장치는 비디오 기록 장치를 포함하며, 제어 동작은 비디오 기록 장치에 연관된 비디오 기록 모드를 활성화시키는 것을 포함할 수 있다.
부가적으로, 제어 동작은 자동 초점 기능을 제어하는 것, 줌 렌즈를 제어하거나 해상도 모드를 제어하는 것을 포함할 수 있다.
부가적으로, 음성 입력을 식별할 때, 논리는 음성 인식 소프트웨어를 사용하여 음성 입력을 식별하도록 구성된다.
부가적으로, 장치는 사용자 입력에 응답하여, 다수의 제어 동작 각각에 연관된 음성 명령어 및 다수의 제어 동작을 디스플레이하도록 구성된 디스플레이를 포함할 수 있다.
부가적으로, 장치는 메모리를 포함할 수 있고, 논리는 사용자가 다수의 각 제어 동작 각각에 대응하는 적어도 하나의 단어를 제공하도록 또한 구성될 수 있다. 논리는 또한 다수의 각 제어 동작 각각에 대응하는 적어도 하나의 단어를 메모리에 저장하도록 구성될 수 있다.
부가적으로, 논리는 또한 다수의 제어 동작들 중 제1 제어 동작에 연관된 제1 단어 또는 구를 식별하기 위해서 음성 인식을 수행하고, 식별된 제1 단어 또는 구가 정확한지 여부를 사용자가 확인하고, 식별된 제1 단어 또는 구가 정확하다고 확인될 때 메모리에서 제1 제어 동작에 대응하는 식별된 제1 단어 또는 구를 저장한다.
부가적으로, 장치는 또는 메모리를 포함하며, 논리는 사용자가 텍스트를 장치에 입력하도록 구성된 사용자 인터페이스를 제공하도록 또한 구성되는데, 상기 텍스트는 적어도 하나의 이미지 캡처 장치에 연관된 제1 제어 동작에 대응할 적어도 하나의 단어 또는 구를 식별하며, 제1 제어 동작에 대응하는 것으로서 메모리에 텍스트를 저장하도록 구성될 수 있다.
부가적으로, 장치는 셀룰러 전화기를 포함할 수 있다.
다른 양상에 따르면, 방법은 적어도 하나의 이미지 캡처 장치를 포함하는 이동 단말기에서 수행된다. 방법은 사용자로부터 음성 입력을 수신하는 단계, 음성 입력을 식별하는 단계, 및 식별된 음성 입력에 기초하여 적어도 하나의 이미지 캡처 장치에 연관된 제어 동작을 수행하는 단계를 포함한다.
부가적으로, 제어 동작은 사진을 촬영하고, 비디오 기록 모드를 활성화하고, 해상도 모드를 설정하고, 플래시를 활성화하고, 줌 렌즈를 제어하거나 자동 초점 기능을 제어하는 것 중 적어도 하나를 포함할 수 있다.
부가적으로, 음성 입력을 식별하는 단계는 음성 인식 소프트웨어를 사용하여 음성 입력을 식별하는 단계를 포함한다.
부가적으로, 음성 인식 소프트웨어를 사용하여 음성 입력을 식별하는 단계는 음성 입력을 사용자에 의해 제공된 다수의 저장된 음성 신호와 비교하는 단계 및 음성 입력이 저장된 음성 신호들 중 하나에 일치하는지 여부를 결정하는 단계를 포함한다.
부가적으로, 방법은 또한 다수의 개별적인 제어 동작 각각에 연관된 음성 입력을 제공하도록 사용자를 프롬프트하는 단계, 프롬프트에 응답하여 다수의 각 제어 동작 각각에 연관된 사용자로부터 적어도 하나의 단어를 수신하는 단계, 및 다수의 각 제어 동작 각각에 연관된 적어도 하나의 단어를 저장하는 단계를 더 포함할 수 있다.
부가적으로, 방법은 다수의 제어 동작들 중 제1 동작에 연관된 적어도 제1 단어를 식별하기 위해 음성 인식을 수행하는 단계, 제1 제어 동작에 연관된 식별된 제1 단어가 정확한지 여부를 사용자가 확인하는 단계, 및 식별된 제1 단어가 정확한 것으로 확인될 때 제 제어 동작에 연관된 제1 단어를 저장하는 단계를 더 포함할 수 있다.
또 다른 양상에 따르면 장치가 제공된다. 장치는 사진 또는 비디오 중 적어도 하나를 촬영하는 수단, 사용자로부터 음성 입력을 수신하는 수단, 및 음성 입력에 기초하여 사진 또는 비디오 중 적어도 하나를 촬영하는 수단에 연관된 제어 동작을 수행하는 수단을 포함한다.
부가적으로, 장치는 다수의 제어 동작, 및 다수의 제어 동작에 대응하는 다수의 음성 명령어를 디스플레이하는 수단을 포함할 수 있다.
또 다른 양상에 따르면, 다수의 명령어가 저장된 컴퓨터-판독 가능한 매체가 제공된다. 명령어는, 적어도 하나의 프로세서에 의해 실행될 때, 적어도 하나의 프로세서가 사용자로부터 음성 입력을 수신하도록 하고, 음성 입력을 식별하도록 하며, 식별된 음성 입력에 기초하여 이미지 캡처-관련 제어 기능을 수행하도록 한다.
부가적으로, 이미지 캡처-관련 제어 기능은 사진을 카메라로 촬영하고, 비디오 판독 장치에 연관된 비디오 판독 모드를 활성화시키고, 해상도 모드를 설정하고, 플래시를 활성화시키고, 줌 렌즈를 제어하거나 오디오 초점 기능을 제어하는 것 중 적어도 하나를 포함할 수 있다.
부가적으로, 명령어는 또한 프로세서가 사용자 입력에 응답하여 다수의 이미지-캡처 제어 동작, 및 다수의 이미지 캡처-관련 제어 동작 각각에 대응하는 음성 명령어를 디스플레이하도록 한다.
부가적으로, 명령어는, 또한 프로세서에게 사용자가 다수의 이미지 캡처-관련 제어 동작 각각에 대응하는 단어 또는 구를 선택하도록 한다.
본 발명의 다른 특징 및 이점은 다음 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 도시되고 설명된 실시예는 본 발명을 수행하도록 심사숙고되는 최상의 모드의 설명을 제공한다. 본 발명은 본 발명으로부터 벗어나지 않고 여러 명백한 관점에서 수정이 가능하다. 따라서, 도면은 제한하기 위한 것이 아니라, 일반적으로 도시된 바와 같이 고려되는 것이다.
첨부된 도면이 참조되며, 동일한 참조 번호 표시를 갖는 요소는 전반에 걸쳐 동일한 요소를 나타낼 수 있다.
도1A 및 도1B는 본 발명에 일관된 방법 및 시스템이 구현될 수 있는 대표적인 이동 전화기의 도면;
도2는 본 발명에 일관된 구현에 따라 도1A 및 도1B의 이동 단말기의 대표적인 블록도;
도3은 본 발명에 일관된 구현에 따라 도2의 이동 단말기에서 구현되는 구성 요소의 대표적인 기능 블록도;
도4는 본 발명에 일관된 도2의 이동 단말기를 구성하는 것에 관련된 대표적인 프로세싱을 도시하는 흐름도;
도5는 도2의 이동 단말기에 저장될 수 있고/있거나 사용자에게 디스플레이될 수 있는 대표적인 표; 및
도6은 본 발명에 일관된 대표적인 프로세싱을 도시하는 흐름도.
본 발명의 다음 상세한 설명은 첨부된 도면에 관한 것이다. 여러 도면에서 동일한 참조 번호는 동일하거나 유사한 요소를 식별한다. 또한, 다음 상세한 설명은 본 발명을 제한하지 않는다. 대신, 발명의 범위는 첨부된 청구항 및 등가물에 의해 한정된다.
도1A 및 도1B는 본 발명에 일치된 시스템 및 방법이 구현되는 대표적인 이동 단말기(100: 이동 장치)의 전면도 및 후면도이다. 본 발명은 본원에서 이동 전화기의 관점에서 설명된다. 본원에서 사용되는 바와 같이, "이동 단말기"라는 용어는 멀티-라인 디스플레이를 구비하거나 구비하지 않은 셀룰러 무선 전화기; 데이터를 처리하는 셀룰러 무선 전화기, 팩시밀리 및 데이터 통신 기능을 결합할 수 있는 개인용 통신 시스템(PCS) 단말기; 무선 전화기, 페이저, 인터넷/인트라넷 액세스, 웹 브라우저, 오거나이저, 칼렌더 및/또는 GPS 수신기를 포함할 수 있는 개인용 정보 단말기(PDA); 및 종래 랩톱 및/또는 팜톱 수신기 또는 무선 전화기 송수신기를 포함하는 다른 애플리언스를 포함할 수 있다. 이동 단말기는 또한 "보급형 계산(pervasive computing)" 장치라 칭해질 수 있다. 또한, 본 발명의 양상은 전화 통화를 하거나 수신하는 것에 관련된 통신 기능을 포함하지 않는 다른 장치에서 구현될 수 있다고 이해되어야만 한다. 예를 들어, 본 발명의 양상은 임의의 이미지 캡처 장치에서 구현될 수 있다. "이미지 캡처 장치"라는 용어는 본원에서 사용되는 바와 같이 카메라와 같은 스틸 이미지를 캡처하고/하거나 비디오 기록 장치와 같이 움직이는 이미지를 캡처하는 임의의 장치를 포함할 수 있다.
도1A를 참조하면, 이동 단말기(10)는 하우징(110), 렌즈(120) 및 셔터 버튼(130)을 포함할 수 있다. 하우징(110)은 이동 단말기(100)의 구성 요소를 외부 요소로부터 보호할 수 있다. 렌즈(120)는 빛의 초점을 맞출 수 있고, 여러 렌즈 요소를 포함할 수 있다. 렌즈 커버(도시되지 않음)는 사용자가 사진을 촬영하도록 렌즈(120)를 열고, 카메라를 사용하지 않을 때 렌즈를 덥도록 제어될 수 있다. 셔터 버튼(130)은 사진을 촬영하기 위해서 사용자가 누를 수 있다.
도1B는 이동 단말기(100)의 후면도를 도시한다. 도1B를 참조하면, 이동 단말기(100)는 디스플레이 스크린(140) 및 사용자 제어 영역(150)을 포함한다. 디스플레이 스크린(140)은 액정 표시 장치(LCD)일 수 있으며, 또는 사용자가 사진을 촬영하고/촬영하거나 비디오 클립을 기록할 때 캡처될 이미지를 보도록 하는 어떤 다른 유형의 디스플레이 스크린일 수 있다. 어떤 구현에서, 렌즈(120)는 디스플레이 스크린(140)과 같은 이동 단말기(100)의 동일한 측면에 위치될 수 있다. 이동 단말기(100)는 사진을 촬영하고/촬영하거나 비디오 클립을 기록하는 것에 관련된 다른 요소/구성 요소(도시되지 않음)를 포함할 수 있다. 예를 들어, 이동 단말기(100)는 사진 및/또는 비디오를 촬영하는 것을 용이하게 하는 줌 렌즈, 플래시, 및 다른 요소를 포함할 수 있다.
사용자 제어 영역(150)은 이동 단말기(100)를 통해 전화 통화를 하는 것에 관련된 제어를 포함할 수 있다. 예를 들어, 사용자 제어 영역(150)은 다이얼 버튼, 전화 종료 버튼 등을 포함할 수 있다. 사용자 제어 영역(150)은 또한 후술되는 바와 같이, 이동 단말기(100)를 위한 음성 활성 원격 제어 기능과 같은 기능들을 선택하는 것에 관련된 메뉴를 사용자에게 보여주도록 메뉴 버튼을 포함할 수 있다.
도2는 본 발명에 일치하는 대표적인 구현에 따른 이동 단말기(100)의 도면이다. 이동 단말기(100)는 버스(210), 처리 논리(220), 메모리(230), 입력 장치(240), 출력 장치(250), 이미지 캡처 장치(260) 및 통신 인터페이스를 포함할 수 있다. 버스(210)는 이동 단말기(100)의 구성 요소들 사이의 통신을 가능하게 한다. 당업자는 이동 단말기(100)가 여러 다른 방법으로 구성될 수 있으며, 다른 요소 또는 여러 요소일 수 있다고 인식할 것이다. 예를 들어, 이동 단말기(100)는 하나 이상의 전력 공급원(도시되지 않음)을 포함할 수 있다. 이동 단말기(100)는 또한 데이터를 처리하기 위해 변조기, 복조기, 인코더, 디코더 등을 포함할 수 있다.
처리 논리(220)는 프로세서, 마이크로프로세서, 주문형 반도체(ASIC), FPGA(field programmable gate array) 등을 포함할 수 있다. 처리 논리(220)는 이동 단말기(100)의 동작을 제어하기 위해서 소프트웨어 명령어/프로그램 또는 데이터 구성을 실행할 수 있다.
메모리(230)는 랜덤 액세스 메모리(RAM) 또는 처리 논리(220)에 의해 실행하기 위한 정보 및 명령어를 저장하는 다른 유형의 동적 저장 장치; 읽기 전용 메모리(ROM) 또는 처리 논리(220)에 의해 사용하기 위한 정보 및 명령어를 저장하는 다른 유형의 고정 저장 장치; 정보 및 명령어를 저장하기 위한 플래시 메모리(예컨대, 전기적으로 삭제 가능한 프로그래밍 가능한 읽기 전용 메모리(EEPROM) 장치) 장치; 및/또는 다른 유형의 자기 또는 광학 기록 매체 및 그의 대응하는 드라이브를 포함할 수 있다. 메모리(230)는 또한 처리 논리(220)에 의해 명령어의 수행 동안 일시적으로 변경 가능하거나 다른 중간 정보를 저장하는데 사용될 수 있다. 처리 논리(220)에 의해 사용되는 명령어는 또한, 대안적으로 처리 논리(220)에 의해 액세스 가능한 다른 유형의 컴퓨터-판독 가능한 매체에 저장될 수 있다.
입력 장치(240)는 마이크로폰, 키보드, 키패드, 마우스, 펜, 음성 인식 및/또는 바이오메트릭 메커니즘 등과 같은 오퍼레이터가 이동 단말기(100)에 정보를 입력하도록 하는 임의의 메커니즘을 포함할 수 있다. 입력 장치(240)는 또한 사용자 제어 영역(150)(도1B)에서 버튼과 같이, 사용자가 출력 장치(250)를 통해 옵션 메뉴를 수신하도록 하는 하나 이상의 버튼을 포함할 수 있다. 메뉴는 사용자가 이동 단말기(100)에 의해 실행되는 애플리케이션에 관련된 여러 기능 또는 모드를 선택하도록 할 수 있다. 대안적으로, 입력 장치(240)는 카메라(260)에 연관된 음성 활성 원격 제어 기능을 활성화시키는 것에 연관된 모드와 같은, 이동 단말기(100)를 위한 특정 모드를 사용자가 활성화시키도록 하는 제어 영역(150)의 하나 이상의 버튼을 포함할 수 있다.
출력 장치(250)는 디스플레이, 프린터기, 하나 이상의 스피커 등을 포함하 는, 사용자에게 정보를 출력하는 하나 이상의 종래 메커니즘을 포함할 수 있다. 출력 장치(250)는 또한 전화가 올 때 이동 전화기가 진동하도록 하는 진동 메커니즘을 포함할 수 있다.
이미지 캡처 장치(260)는 렌즈(120), 셔터 버튼(130) 및 다른 구성 요소와 같이, 이동 단말기(100)가 사진을 촬영할 수 있도록 하는 종래 카메라 요소를 포함할 수 있다. 이미지 캡처 장치(260)는 또한 이미지 캡처 장치(260)가 비디오 클립과 같은 움직이는 이미지를 기록하도록 하는 구성 요소를 포함할 수 있다. 이미지 캡처 장치(260)는 예를 들어 메모리(230) 또는 다른 메모리에 픽처/비디오 클립을 저장할 수 있다. 위에서 논의되는 바와 같이, 이미지 캡처 장치(260)는 줌 렌즈, 플래시 등과 같은 다른 요소를 포함할 수 있다. 이미지 캡처 장치(260)는 또한 두 개의 모드 중 하나를 동작시킬 수 있다. 제1 모드에서, 이동 단말기(100)의 사용자는 셔터 버튼(130)을 누름으로써 사진을 촬영하고, 줌 렌즈를 수동으로 동작시키고/시키거나 이동 단말기(100) 상의 하나 이상의 버튼을 누름으로써 비디오 모드로 스위치할 수 있다. 제2 모드에서, 이동 단말기(100)의 사용자는 아래에서 상세히 설명되는 바와 같이, 음성 명령어를 사용하여 이미지 캡처 장치(260)를 통해 사진/비디오를 촬영할 수 있다. 이미지 캡처 장치(260)는 도2에서 단일 장치로 도시된다. 어떤 구현에서, 이미지 캡처 장치(260)는 스틸 사진을 촬영하기 위한 별도의 카메라 관련 요소/구성요소 및 움직이는 이미지(예컨대, 비디오)를 촬영하여 기록하는 별도의 비디오 기록 관련 요소/구성요소를 포함할 수 있다.
통신 인터페이스(270)는 이동 단말기(100)가 다른 장치 및/또는 시스템과 통 신하도록 하는 임의의 송수신-형-메커니즘을 포함할 수 있다. 예를 들어, 통신 인터페이스(270)는 모뎀 또는 LAN으로 이더넷 인터페이스를 포함할 수 있다.
통신 인터페이스(270)는 또한 무선 네트워크와 같은 네트워크를 통한 통신을 위한 다른 메커니즘을 포함할 수 있다. 예를 들어, 통신 인터페이스(270)는 RF 데이터를 전송하고 수신하고/하거나 송수신하는 하나 이상의 무선 주파수(RF)를 포함할 수 있다. 통신 인터페이스(270)는 RF 데이터와 같은 송신/수신 데이터용 안테나를 또한 하나 이상 포함할 수 있다.
본 발명에 일치하는 이동 단말기(100)는 이미지 캡처 논리 또는 이미지 캡처 장치(260)와 같은, 이동 단말기(100) 상의 여러 요소를 제어하는 것에 관련된 프로세싱을 수행할 수 있다. 이동 단말기(100)는 메모리(230)와 같은, 컴퓨터-판독 가능한 매체에 포함된 명령의 시퀀스를 수행하는 프로세싱 논리(220)에 응답하여 이러한 동작을 수행할 수 있다. 이런 명령은 예를 들어 통신 인터페이스(270)를 통해 다른 컴퓨터 판독 가능한 매체로부터 메모리(230) 내에서 판독될 수 있다. 컴퓨터-판독 가능한 매체는 하나 이상의 메모리 장치 및/또는 반송파를 포함할 수 있다. 대안적인 실시예에서, 하드웨어 회로 소자는 본 발명에 일치하는 프로세스를 구현하기 위해서 소프트웨어 명령 대신 또는 이와 결합하여 사용될 수 있다. 그러므로 본 발명에 일치하는 구현은 하드웨어 회로 소자 및 소프트웨어의 어떤 특정한 조합에 국한되지 않는다.
도3은 본 발명에 일치된 구현에 따라, 메모리(230)에서와 같이, 도2의 이동 단말기(100)에서 구현되는 대표적인 구성 요소의 기능적인 블록도이다. 도3을 참조하면, 메모리(230)는 음성 인식 프로그램(310) 및 제어 명령어 생성기(320)를 포함할 수 있다. 음성 인식 프로그램(310)은 여러 단어 및/또는 구를 식별하고, 인식된 단어/구에 기초하여 정보를 출력하기 위해 음성 인식을 수행할 수 있는 음성 인식 소프트웨어 및/또는 하드웨어를 포함할 수 있다. 음성 인식 프로그램(310)은 또한 이동 단말기(100)의 사용자가 아래에서 상세히 후술되는 바와 같이, 여러 동작에 서로 관련될 단어/구를 제공하도록 프롬프트되는 사용자 인터페이스를 포함할 수 있다. 음성 인식 프로그램(310)은 또한 음성 인식을 수행하는 것에 관련된 다수의 규칙 또는 문법을 저장하는 규칙 데이터베이스를 포함할 수 있다. 이러한 규칙/문법은 음성 인식 프로그램(310)이 인식하도록 구성된 특정한 단어/문법에 기초할 수 있다.
예를 들어, 음성 인식 프로그램(310)은 "치즈", "클릭", 사진 촬영", "줌 인", "와이드 앵글", 초점", "자동 초점 표준", 자동 초점 매크로", "자동 초점 오프", "버스트 4", "비디오 시작", "비디오 종료", "플래시", "고해상도", "저해상도", "마이크로폰 온", "마이크로폰 오프" 및 사진을 촬영하는 것에 관련되고/되거나 이미지 캡처 장치(260)로 비디오를 촬영하는 것에 관련된 다른 단어/구와 같은 여러 단어를 인식하도록 구성될 수 있다. 이러한 단어/구는 아래서 상세히 설명되는 바와 같이, 이동 단말기(100)의 사용자에 의해 제공되고, 여러 제어 동작에 서로 연관되며 이동 단말기(100)에 저장될 수 있다. 음성 인식 프로그램(310)은 정확한 음성 인식을 용이하게 하기 위해서 이러한 저장된 단어/구를 사용할 수 있다.
음성 인식 프로그램(310)은 또한 사용자가 여러 제어 동작에 서로 관련시킬 수 있는 이동 단말기(100)의 사용자에 의한 단어/구 입력과 같은 음성 샘플을 저장할 수 있다. 음성 인식 프로그램(310)은 또한 음성 인식 프로세스를 용이하게 하기 위해서 이러한 저장된 음성 샘플을 사용할 수 있다. 예를 들어, 음성 인식 프로그램(310)은 사용자에 의해 입력된 단어 또는 구를 저장된 음성 샘플과 비교할 수 있다. 수신된 단어 또는 구가 저장된 음성 샘플 중 하나에 일치한다면, 음성 인식 프로그램(310)은 사용자가 말한 단어/구와 같은 저장된 음성 샘플에 관련된 단어/구를 식별할 수 있다. 저장된 음성 샘플을 사용하는 것은 음성 인식 프로세스의 정확성을 강화시키는 것을 도울 수 있다.
각각의 경우에, 음성 인식 프로그램(310)은 음성 입력을 수신하고, 음성 입력이 음성 인식 프로그램(310)에 저장된 단어/구 중 하나에 대응하는지 여부를 결정할 수 있다. 음성 인식 프로그램(310)은 그 후에 제어 명령어 생성기(320)와 같은, 이동 단말기(100)의 다른 장치/애플리케이션으로 말해진 단어/구를 식별하는 정보를 전달할 수 있다.
제어 명령어 생성기(320)는 음성 인식 프로그램(310)으로부터 정보를 수신하고, 이동 단말기(100)에 의해 실행되는 애플리케이션을 제어하기 위한 명령어를 생성한다. 예를 들어, 하나의 구현에서, 제어 명령어 생성기(320)는 이미지 캡처 장치(260), 및/또는 줌 렌즈 또는 플래시와 같은 이미지 캡처 장치(260)에 연관된 주변 장치에 의해 사진 및/또는 비디오를 촬영하는 것에 관련된 제어 동작을 수행하도록 구성될 수 있다. 각각의 경우에, 제어 명령어 생성기(320)는 이미 저장된 명령어/코드를 포함하고/하거나 희망하는 제어 동작을 위해 적절한 명령어, 코드 또는 명령을 발생시킬 수 있다.
상술된 바와 같이, 어떤 구현에서, 음성 인식 프로그램(310)은 여러 제어 명 령어에 서로 관련될 여러 단어/구를 사용자가 제공하도록 하는 사용자 인터페이스를 포함할 수 있다. 예를 들어, 도4는 여러 제어 동작을 수행하기 위해 음성 인식 프로그램(310) 및/또는 제어 명령어 생성기(320)에 의해 사용될 커스터마이즈된(customized) 음성 명령어를 제공하는 것에 관련된 대표적인 프로세싱을 도시한다. 프로세싱은 사용자가 예를 들어, 이동 단말기(100)의 출력 장치(250)를 통해 제공된 메뉴에 액세스하는 것으로 시작될 수 있다. 메뉴는 음성 인식 프로그램(310)에 의해 인식될 여러 음성 명령어를 사용자가 입력하도록 하는 옵션을 포함할 수 있다. 사용자가 이러한 옵션을 선택한다고 가정하자.
그 후에 음성 인식 프로그램(310)은 이동 단말기(100)의 사용자에게 사용자 인터페이스를 제공할 수 있다(동작 410). 대표적인 구현에서, 사용자 인터페이스는 사진 촬영, 줌 인, 줌 아웃, 자동 초점, 사진을 촬영할 때 플래시를 활성화하기, 비디오 모드, 고해상도 모드 사용, 저해상도 모드 사용, 카메라 턴 온, 카메라 턴 오프, 마이크로폰 턴 온, 마이크로폰 턴 오프와 같은 여러 명령어를 디스플레이 스크린(140)을 통해 사용자에게 디스플레이할 수 있다.
사용자가 사진을 촬영하기 위한 명령어를 선택한다고 가정하자. 이러한 경우에, 사용자 인터페이스는 그/그녀가 이미지 캡처 장치(260)를 사용하여 사진을 촬영하기 위한 명령어에 대응할 수 있는 단어 또는 구를 사용자가 말하도록 프롬프트 할 수 있다. 음성 인식 프로그램(310)에 의해 제공된 프롬프트는 출력 장치(250)(예컨대, 스피커)를 통해 사용자에게 출력된 음성 프롬프트 및/또는 디스플레이 스크린(140)을 통해 출력된 텍스트 프롬프트일 수 있다.
사용자는 사진을 촬영하기 위해 음성 명령어에 대응하는 단어 "치즈"를 사용한다고 가정하자. 이러한 경우에, 사용자는 단어 "치즈"라고 말할 수 있다. 음성 인식 프로그램(310)은 예를 들어, 입력 장치(240)(예컨대, 마이크로폰)를 통해 음성 입력을 수신할 수 있다(동작 420). 음성 인식 프로그램(310)은 단어가 음성 인식 프로그램(310)에 의해 정확히 식별되는 것을 보장하기 위해서 사용자에게 다시 단어 "치즈"라고 말할 수 있다.
예를 들어, 음성 인식 프로그램(310)은 "You have selected the word cheese as the command for taking a picture. Is that correct?"와 같은 음성 출력을 제공할 수 있다. 음성 인식 프로그램(310)이 단어/구(이러한 예에서 치즈)를 적절히 식별한다면, 사용자는 예스라고 응답하는 것과 같이 음성 인식 프로그램(310)에 의해 식별된 단어/구를 확인할 수 있다(동작 430).
대안적으로, 음성 인식 프로그램(310)에 의해 제공된 프롬프트는, 사용자가 입력 장치(240)(예컨대, 문자 숫자식 키패드)를 통한, 텍스트 입력을 통해 단어/구를 입력하도록 나타낼 수 있다.
각각의 경우에, 음성 인식 프로그램(310)은 사용자에 의해 제공된 단어/구를 저장할 것이며, 사진을 촬영하기 위한 명령어에 단어/구를 서로 관련시킬 것이다(동작 440). 프로세싱은 여러 다른 명령어/동작을 위한 이러한 방법으로 계속될 수 있다. 즉, 사용자는 소정의 양으로 줌하고, 최대 양으로 줌 인하고, 소정의 양으로 줌 아웃하고, 최대 양으로 줌 아웃하고, 자동 초점 기능을 사용하고, 연사로 신속히 여러 장의 사진을 촬영하고, 사진을 촬영할 때 플래시를 사용하고, 비디오 캡처 모드를 시작하고, 비디오 캡처 모드를 종료하고, 사진을 촬영하고/종료하는 것에 관련된 고해상도 모드를 활성화시키고, 사진을 촬영하고/종료하는 것에 관련된 저해상도 모드를 활성화시키고, 카메라를 턴 온하고, 카메라를 턴 오프하고, 마이크로폰을 턴 온하고, 마이크로폰을 턴 오프하는 것 등을 위한 단어/구를 제공할 수 있다. 각각의 경우에, 사용자는 희망하는 동작을 수행하기 위해 그/그녀가 희망하는 단어 또는 구를 선택할 수 있다.
예를 들어, 상술된 바와 같이, 단어/구는 사진을 촬영하기 위해 치즈, 이미지 캡처 장치(260)가 비디오 기록 모드에서 동작할 수 있는 "비디오" 등과 같은 단어일 수 있다. 대안적으로, 단어/구는 물체를 줌 인하기 위해서 줌 렌즈를 사용하기 위해 "최대 줌", 카메라(260)를 통해 사용 가능한 다수의 메가 픽셀을 사용하여 디지털 사진을 촬영하여 저장하기 위해 이미지 캡처 장치(260)에 지시하는 "고해상도", 매우 빠른 연사로 네 장의 사진을 촬영하기 위해 이미지 캡처 장치(260)에 지시하는 "버스트 4"와 같은 여러 단어일 수 있다. 이러한 방법으로, 사용자가 선호하는 음성 명령어는 이동 단말기(100)에 의해 저장되어 희망하는 제어 동작에 서로 연관될 수 있다.
초기 명령어가 사용자에 의해 제공된 후에, 사용자는 이동 단말기(100)가 저장한 단어/구 및 대응하는 명령어 리스트를 볼 수 있다. 예를 들어, 이동 단말기(100)는 사용자가 이동 단말기(100)에 저장된 음성 명령어를 보도록 하는 메뉴를 포함할 수 있다. 사용자는 예를 들어 사용자 제어 영역(150)(도1B)의 버튼을 누름으로써 명령어를 볼 수 있다. 사용자에 의한 선택에 응답하여, 이동 단말기(100)는 디스플레이 스크린(140)을 통해 명령어 및 대응하는 음성 입력 리스트를 출력할 수 있다.
예를 들어, 도5는 이동 단말기(100)에 저장되고/되거나 디스플레이 스크린(140)을 통해 사용자에게 디스플레이되는 대표적인 표를 도시한다. 도5를 참조하면, 표(500)는 필드(510)에서 제어 동작 리스트 및 필드(520)에서 대응하는 음성 명령어 리스트를 포함할 수 있다. 예를 들어, 카메라를 턴 온하기 위한 음성 명령어는 제1 입력에서 보여지는 바와 같이, "카메라 온"일 수 있다. 사용자가 음성 명령어를 바꾸기를 원한다면, 사용자는 키패드 제어 장치와 같은 입력 장치를 통해 특정한 명령어를 선택하여, 새로운 명령어를 제공할 수 있다. 예를 들어, 사용자가 "치즈"로부터 "클릭"으로 사진을 촬영하기 위한 명령어를 변경하기 원한다면, 사용자는 필드(510)에서 "사진 촬영" 동작을 선택하거나 필드(520)에서 음성 명령어 "치즈"를 선택하여, "치즈"를 대체하기 위한 새로운 단어/구를 제공할 수 있다. 이러한 예에서, 사용자는 "클릭"이라고 말하고(또는 문자 숫자식 키패드를 통해 "클릭"이라고 입력하고), 음성 인식 프로그램(310)은 "치즈"를 "클릭"으로 대체하고, 사진을 촬영하기 위한 음성 명령어로서 "클릭"을 인식할 것이다. 이러한 방법으로, 사용자는 어떤 시간에 특정 제어 동작을 위한 특정 음성 명령어를 변경할 수 있다.
어떤 구현에서, 음성 인식 프로그램(310)은 각각의 특정한 제어 동작에 사용될 수 있는 선택 메뉴(즉, 단어/구)를 저장할 수 있다. 이러한 경우에, 음성 인식 프로그램(310)은 특정한 제어 동작을 위한 선택(또는 선택 항목)을 디스플레이할 수 있고, 사용자는 그/그녀가 특정한 제어 동작에 사용하기를 원하는 선택들 중 하나를 선택할 수 있다. 사용자는 그 후에 희망하는 제어 동작을 수행하기 위한 음성 명령어로서 선택된 단어/구를 사용할 수 있다.
게다가, 어떤 구현에서, 디폴트 음성 명령어는 음성 인식 프로그램(310)에 의해 사전 저장될 수 있다. 즉, 음성 인식 프로그램(310)은 어떤 특정한 구/단어를 사용자가 입력하기 전에 특정한 동작을 위한 여러 음성 명령어를 저장할 수 있다. 이러한 경우에, 사용자는 음성 명령어를 볼 수 있고 사전 저장된 단어/구를 사용하거나 음성 명령어에 대응하는 사전 저장된 단어/구에 대한 하나 이상의 변경을 행하는지 여부를 결정한다. 각각의 경우에, 음성 인식 명령어(310)는 사용자가 여러 제어 동작을 수행하기 위해 그/그녀가 희망하는 단어/구를 선택하도록 할 수 있다. 이동 단말기(100)는 그 후에 아래에서 상세히 설명되는 바와 같이, 음성 입력에 응답하여 희망하는 제어 동작을 수행할 수 있다.
도6은 이미지 캡처 장치(260)에 연관된 제어 동작을 수행하는 것에 관련된 대표적인 프로세싱을 도시하는 흐름도이다. 이동 단말기(100)에 전원이 들어오고, 이동 단말기(100)의 사용자가 이미지 캡처 장치(260)를 사용하여 사진 촬영을 희망한다고 가정하자. 예를 들어, 이동 단말기(100)의 사용자는 이미지 캡처 장치(260)를 사용하여 친구 그룹과 함께 자신의 사진 촬영을 원할 수 있다. 이러한 경우에, 이동 단말기(100)의 사용자는 테이블과 같은 어떤 표면에 이동 단말기(100)를 두고, 렌즈(120)의 앞에서 자신 주변에 친구 그룹을 배치하고 "치즈"라고 말할 수 있다.
음성 인식 프로그램(310)은 음성 입력을 수신하고, 사용자에 의해 말해진 특정한 단어/구를 식별하도록 음성 인식을 수행한다(단어 610). 이러한 경우에, 음성 인식 프로그램이 단어 "치즈"를 식별한다고 가정하자. 음성 인식 프로그램(310)은 그 후에 말해진 단어/구(즉, 이러한 예에서 치즈)에 대응하는 명령어를 식별할 수 있다(동작 620). 예를 들어, 음성 인식 프로그램(310)은 테이블(500)에 액세스하여, 단어 "치즈"가 사진을 촬영하기 위한 제어 동작(510)에 대응한다는 것을 식별할 수 있다.
음성 인식 프로그램(310)은 식별된 명령어를 제어 명령어 생성기(320)로 전달할 수 있다. 제어 명령어 생성기(320)는 음성 인식 프로그램(310)으로부터 정보를 수신하고 이미지 캡처 장치(260)가 사진을 촬영하도록 하는 적절한 명령어 또는 명령을 생성한다(동작 630). 예를 들어, 제어 명령어 생성기(320)는 이미지 캡처 장치(260)가 사진을 촬영하도록 지시할 수 있다. 이러한 명령은 셔터 버튼(130)이 눌릴 때 수신된 종래 신호를 대체할 수 있다. 그 후에 이미지 캡처 장치(260)는 사진을 촬영할 수 있다(동작 640). 이러한 방법으로, 이동 단말기(100)의 사용자는 사진을 촬영하기 위한 명령어를 간단히 말할 수 있고, 이동 단말기(100)는 사진을 촬영하기 위해 필요로 되는 제어 동작을 수행할 수 있다. 이는 사용자가 희망하는 동작을 수행하기 위해 셔터 버튼(130) 또는 하나 이상의 다른 버튼을 누를 필요 없이 이미지 캡처 장치(260)에 연관된 여러 제어 동작을 사용자가 수행하도록 한다. 유리하게는, 이러한 방법으로 음성 인식 프로그램(310)을 사용하는 것은 사용자가 타이밍 장치를 설정한 후 자기 자신을 촬영하기 위해서 달릴 필요 없이 사용자가 자기 자신을 촬영할 수 있도록 할 수 있다. 게다가, 음성 인식 프로그램(310)을 사용하는 것은 사용자가 셔터 버튼을 누를 때 의도적이지 않게 이동 단말기(100)가 움직이는 것을 피할 수 있고, 이로써 사진이 초점이 맞지 않거나 적절하지 않게 중심이 맞춰지는 것을 피할 수 있다.
상술된 바와 같이, 제어 명령어 생성기(320)는 또한 줌 렌즈, 자동 초점 기능, 플래시 등과 같은 이미지 캡처 장치(260)에 연관된 다른 구성 요소를 제어하는 명령어 또는 명령을 생성할 수 있다. 각각의 경우에, 제어 명령어 생성기(320)는 희망하는 제어 기능을 수행하기 위해서 명령어, 코드 및/또는 명령을 저장하도록 구성될 수 있다.
다른 예와 같이, 이동 단말기(100)에 관련된 사용자가 비디오 기록 모드로 스위치하기를 희망하며, 사용자가 "비디오 시작"을 쉽게 말할 수 있으며, 이미지 캡처 장치(260)는 비디오 클립(예컨대, 움직이는 이미지)이 기록될 수 있는 비디오 기록 모드로 스위치 할 것이라고 가정하자. 이러한 방법으로, 음성 인식 프로그램을 사용하는 것은 사용자가 특정 물체 상에 매우 몰두할 때 또한 이점을 제공할 수 있다. 예를 들어, 사용자가 스포츠 이벤트에서 다음 동작을 하는 동안, 사용자는 이동 단말기(100) 상의 하나 이상의 버튼을 보고 누르지 않고 비디오 모드로 스위치하기 위한 명령어를 쉽게 말할 수 있다.
또 다른 예에서와 같이, 이동 단말기(100)의 사용자가 이미지 캡처 장치(260)를 통해 사용 가능한 고해상도 모드를 사용하여 사진을 촬영하기 원한다고 가정하자. 이러한 경우에, 사용자는 "최대 해상도"라고 말할 수 있고, 이미지 캡처 장치(260)는 이미지 캡처 장치(260)를 통해 사용 가능한 가장 최대 메가 픽셀 해상도를 사용하여 사진들을 촬영할 것이다. 또한, 이러한 방법으로 음성 인식 프로그 램(310)을 사용하는 것은 사용자가 이미지 캡처 장치(260)에 관련된 사진 해상도 모드를 변경시키도록 하나 이상의 버튼을 사용자가 누를 필요 없이 사진으로 캡처하기를 원하는 물체에 사용자가 집중하도록 한다.
또 다른 상황에서, 이동 단말기(100)의 사용자는 네 장의 사진과 같이 여러 사진을 연사로 촬영하기를 희망할 수 있다. 이러한 경우에, 사용자는 "버스트 4"라고 말할 수 있고, 이미지 캡처 장치(260)는 매우 신속한 연사로 네 장의 사진을 촬영할 수 있다. 이러한 명령어는 유리하게 사용자가 셔터 버튼(130)을 누름으로써 더욱 신속히 이미지를 캡처하도록 한다.
상술된 바와 같이, 이동 단말기(100)는 이미지 캡처 장치(260)에 연관된 여러 제어 동작을 수행하도록 음성 인식을 사용할 수 있다. 어떤 구현에서, 이동 단말기(100)는 이미지 캡처 장치(260) 및 상기 이미지 캡처 장치(260)에 연관된 다른 구성 요소가 음성 명령어를 통해 제어되도록 하는 모드 지정을 포함할 수 있다. 예를 들어, 이동 단말기(100)는 이동 단말기(100)의 사용자가 종래 메뉴 활성 모드와는 달리, 이미지 캡처 장치(260)가 음성 활성 제어 모드에서 사용된다고 나타내도록 하는 메뉴를 포함할 수 있다. 사용자는 예를 들어, 사용자 제어 영역(150)(도1B)에서 버튼을 누름으로써 메뉴를 수신할 수 있다. 대안적으로, 입력 장치(240)는 이미지 캡처 장치(260)가 종래 카메라/비디오 기록 모드 또는 음성 명령어에 연관된 모드에 있는지 여부를 선택하도록 하는 사용자 제어 영역(150)에 위치된 카메라/비디오 버튼을 포함할 수 있다. 또 다른 대안에서, 이미지 캡처 장치(260)에 연관된 어떠한 음성 활성 모드도 설정될 필요가 없을 수 있다. 즉, 이미지 캡처 장치(260)는 임의의 특정 모드를 설정할 필요 없이 음성 활성 모드에서 동작할 수 있다. 예를 들어, 한 구현에서, 이동 단말기(100)의 사용자가 입력 장치(240)에 포함될 수 있는 마이크로폰을 활성화시키기 위해 "마이크로폰 온"이라고 쉽게 말할 수 있다. 일단, 마이크로폰이 활성화되면, 음성 인식 프로그램(310)은 사용자로부터 음성 명령어를 수신할 수 있다. 각각의 경우에, 이동 단말기(100)는 이미지 캡처 장치(260)에 연관된 하나 이상의 동작의 결과를 가져올 음성 명령어를 사용자가 제공하도록 할 수 있다.
결론
본 발명에 일치하는 구현은 사용자가 음성 인식을 사용함으로써 효율적인 방법으로 이미지 캡처 기능에 연관된 제어 동작을 수행하도록 한다. 유리하게, 음성 인식을 사용하는 것은 사용자가 단순한 사용자-친숙 방법으로 카메라 및/또는 비디오 기록 장치에 연관된 여러 제어 기능을 수행하도록 할 수 있다. 이는 여러 이미지 캡처 관련 기능을 사용하는 사용자의 만족도를 증가시킬 수 있으며, 이러한 기능의 전체 사용을 간단하게 할 수 있다.
본 발명의 실시예에 대한 상기 설명은 예시 및 설명을 제공하지만, 철저히 연구된 것으로 의도되지 않거나 설명된 정확한 형태로 본 발명을 제한하지 않는다. 수정 및 변화가 상기 연구를 고려하여 가능하며, 본 발명의 실행으로부터 획득될 수 있다.
예를 들어, 본 발명은 카메라 및/또는 비디오 레코더와 같은, 이미지 캡처 장치를 포함하는 이동 단말기의 관점에서 주로 설명되었다. 그러나 본 발명은 독립 형 카메라, 독립형 비디오 기록 장치, 카메라/비디오 기록 장치의 조합 등과 같은 이미지 캡처 장치를 포함하는 다른 장치에서 사용될 수 있다.
게다가, 어떤 구현에서, 이동 단말기(100)는 음성 명령어가 식별된 후에 단말기(100)의 사용자에게 오디오 및/또는 텍스트와 같은 피드백을 제공할 수 있다. 예를 들어, 사용자가 비디오 모드를 스위치하기 위한 명령어를 말한 후에, 이동 단말기는 "비디오 모드 활성"을 언급하는 오디오를 출력할 수 있다. 이러한 방법으로, 사용자는 특정한 제어 동작 수행을 나타내는 피드백을 수신할 수 있다.
게다가, 일련의 동작이 도4 및 도6에 관하여 설명되는 반면, 동작의 순서는 본 발명에 일치된 다른 구현에서 바뀔 수 있다. 게다가, 비-의존적인 동작이 동시에 수행될 수 있다.
또한 본 발명의 범위가 상술된 바와 같이 셀룰러 통신 장치/시스템, 방법, 및/또는 컴퓨터 프로그램 제품에서 구현될 수 있다는 것이 당업자에게 명백해질 것이다. 따라서, 본 발명은 하드웨어 및/또는 소프트웨어(펌웨어, 내장 소프트웨어, 마이크로-코드 등을 포함)에서 사용될 수 있다. 게다가, 본 발명에 일치된 양상은 명령 실행 시스템에 의해 또는 접촉하여 사용하기 위한 매체에서 사용되는 컴퓨터-사용 가능하거나 컴퓨터-판독 가능한 프로그램 코드가 있는 컴퓨터-사용 가능하거나 컴퓨터-판독 가능한 저장 매체 상의 컴퓨터 프로그램 제품 형태로 취해질 수 있다. 본 발명의 원리에 일치하는 양상을 구현하도록 사용되는 실제 소프트웨어 코드 또는 특성화된 제어 하드웨어는 본 발명의 제한하지 않는다. 그러므로 양상의 동작 및 행동은 특정 소프트웨어 코드를 참조하지 않고 설명된다-당업자가 본원의 설명 에 기초하는 양상을 제한하도록 소프트웨어 및 제어 하드웨어를 디자인할 수 있을 것이라고 이해된다.
게다가, 본 발명의 어떤 부분은 하나 이상의 기능을 수행하는 "논리"로서 구현될 수 있다. 이러한 논리는 소프트웨어, 마이크로프로세서, 주문형 반도체, 또는 FPGA, 소프트웨어 또는 하드웨어 및 소프트웨어 조합을 포함할 수 있다.
"포함하다/포함하는(compises/compising)"이라는 용어는 본 명세서에서 사용될 때 하나 이상의 다른 특징, 정수, 단계, 구성요소 또는 그의 그룹의 존재 또는 부가를 배제하는 것이 아니라, 언급된 특징, 정수, 단계 또는 구성요소를 규정하기 위해 취해진다는 것이 강조되어야만 한다.
본 명세서의 설명에서 사용되는 어떠한 요소, 동작 또는 명령도 명백하게 설명되지 않는 한 본 발명의 중요하거나 필수적인 것으로 해석되지 않아야만 한다. 또한, 본원에서 사용되는 바와 같이, 관사 "a"는 하나 이상의 아이템을 포함하도록 의도된다. 단지 하나의 아이템으로 의도된다면, "one" 또는 유사한 용어가 사용된다. 게다가, "~에 기초하는"이라는 구는 본원에서 사용되는 바와 같이 명백하게 설명되지 않는 한, "에 적어도 부분적으로 기초하는"을 의미하는 것으로 의도된다.
본 발명의 범위는 청구항 및 그의 등가물에 의해 한정된다.

Claims (22)

  1. 적어도 하나의 이미지 캡처 장치,
    메모리,
    사용자 입력에 응답하여, 적어도 하나의 이미지 캡처 장치와 연관된 다수의 제어 동작을 디스플레이하도록 구성된 디스플레이; 및
    논리(logic)를 포함하고, 상기 논리는,
    제1의 제어 동작의 선택을 사용자로부터 수신하고,
    디스플레이를 통해서, 제1의 제어 동작과 연관된 다수의 선택들을 제공하며,
    상기 사용자로부터, 상기 제1의 제어 동작에 대응하는 음성 명령어로서 사용되는 다수의 선택들로부터 선택된 단어 또는 구를 수신하고,
    수신된 단어 또는 구를 상기 메모리에 저장하고,
    상기 사용자로부터 음성 입력을 수신하고,
    저장된 단어 또는 구에 대응하는 상기 음성 입력을 식별하고, 그리고,
    식별된 음성 입력에 기초하여, 상기 저장된 단어 또는 구에 대응하는 상기 제어 동작을 수행하는, 이동 장치.
  2. 제 1 항에 있어서,
    상기 적어도 하나의 이미지 캡처 장치는 카메라를 포함하고, 상기 제1의 제어 동작은 상기 카메라를 사용하여 사진을 촬영하는 것을 포함하는, 이동 장치.
  3. 제 1 항에 있어서,
    상기 적어도 하나의 이미지 캡처 장치는 비디오 기록 장치를 포함하고, 상기 제1의 제어 동작은 상기 비디오 기록 장치와 연관된 비디오 기록 모드를 활성화시키는 것을 포함하는, 이동 장치.
  4. 제 1 항에 있어서,
    상기 제1의 제어 동작은 자동 초점 기능을 제어하는 것, 줌 렌즈를 제어하거나 해상도 모드를 제어하는 것을 포함하는, 이동 장치.
  5. 삭제
  6. 제 1 항에 있어서,
    상기 논리는,
    사용자가 다수의 각 제어 동작에 각각 대응하는 적어도 하나의 단어를 제공하도록 하고, 그리고
    다수의 각 제어 동작에 각각 대응하는 상기 적어도 하나의 단어를 상기 메모리에 저장하도록 구성되는, 이동 장치.
  7. 삭제
  8. 제 1 항에 있어서,
    상기 이동 장치는 이동 전화기를 포함하는, 이동 장치.
  9. 적어도 하나의 이미지 캡처 장치를 포함하는 이동 단말기에서 수행되는 제어 방법으로서,
    적어도 하나의 이미지 캡처 장치와 연관된 제어 동작의 선택을 사용자로부터 수신하고,
    상기 사용자로부터, 상기 제어 동작에 대응하는 음성 명령어로서 사용되는 단어 또는 구를 식별하는 텍스트를 수신하고,
    상기 제어 동작에 대응하는 상기 텍스트를 저장하고,
    상기 사용자로부터 음성 입력을 수신하고,
    제어 동작에 대응하는 저장된 텍스트에 대응하는 상기 음성 입력을 식별하고, 그리고,
    식별된 음성 입력에 기초하여, 상기 저장된 텍스트를 수행하는, 이동 단말기의 제어 방법.
  10. 제 9 항에 있어서,
    상기 제어 동작은, 사진을 촬영하는 것, 비디오 기록 모드를 활성화시키는 것, 해상도 모드를 설정하는 것, 플레시를 활성화시키는 것, 줌 렌즈를 제어하거나 자동 초점 기능을 제어하는 것 중 적어도 하나를 포함하는, 이동 단말기의 제어 방법.
  11. 제 9 항에 있어서,
    상기 음성 입력을 식별하는 것은 음성 인식 소프트웨어를 사용하여 음성 입력을 식별하는 것을 포함하는, 이동 단말기의 제어 방법.
  12. 삭제
  13. 삭제
  14. 삭제
  15. 다수의 명령어를 갖는 이동 단말기를 위한 제어 프로그램이 저장된 컴퓨터-판독 가능한 매체로서,
    상기 명령어는, 적어도 하나의 프로세서에 의해 수행될 때, 상기 적어도 하나의 프로세서가,
    적어도 하나의 이미지 캡처 장치와 연관된 제어 동작의 선택을 사용자로부터 수신하고,
    상기 사용자로부터, 상기 제어 동작에 대응하는 단어 또는 구를 식별하는 텍스트를 수신하고,
    상기 제어 동작에 대응하는 상기 텍스트를 메모리에 저장하고,
    상기 사용자로부터 음성 입력을 수신하고,
    저장된 텍스트에 대응하는 상기 음성 입력을 식별하고, 그리고,
    식별된 음성 입력에 기초하여, 저장된 단어 또는 구에 대응하는 상기 제어 동작을 수행하는, 이동 단말기를 위한 제어 프로그램이 저장된 컴퓨터-판독 가능한 매체.
  16. 제 15 항에 있어서,
    상기 제어 동작은, 카메라에 의해 사진을 촬영하는 것, 비디오 기록 장치와 연관된 비디오 기록 모드를 활성화시키는 것, 해상도 모드를 설정하는 것, 플래시를 활성화시키는 것, 줌 렌즈를 제어하거나 자동 초점 기능을 제어하는 것 중 적어도 하나를 포함하는, 이동 단말기를 위한 제어 프로그램이 저장된 컴퓨터-판독 가능한 매체.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
KR1020097001565A 2006-06-30 2006-12-27 음성 원격 제어 KR101163273B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/427,807 2006-06-30
US11/427,807 US8207936B2 (en) 2006-06-30 2006-06-30 Voice remote control
PCT/IB2006/055039 WO2008004037A1 (en) 2006-06-30 2006-12-27 Voice remote control

Publications (2)

Publication Number Publication Date
KR20090025362A KR20090025362A (ko) 2009-03-10
KR101163273B1 true KR101163273B1 (ko) 2012-07-05

Family

ID=37903620

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097001565A KR101163273B1 (ko) 2006-06-30 2006-12-27 음성 원격 제어

Country Status (8)

Country Link
US (3) US8207936B2 (ko)
EP (1) EP2041957B1 (ko)
JP (1) JP4975813B2 (ko)
KR (1) KR101163273B1 (ko)
CN (1) CN101480039B (ko)
AT (1) ATE489807T1 (ko)
DE (1) DE602006018539D1 (ko)
WO (1) WO2008004037A1 (ko)

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040006473A1 (en) * 2002-07-02 2004-01-08 Sbc Technology Resources, Inc. Method and system for automated categorization of statements
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US7801569B1 (en) * 2007-03-22 2010-09-21 At&T Intellectual Property I, L.P. Mobile communications device with distinctive vibration modes
CN101465960B (zh) * 2007-12-19 2011-07-27 深圳富泰宏精密工业有限公司 具有语音控制功能的摄像装置及其使用方法
JP4919993B2 (ja) * 2008-03-12 2012-04-18 株式会社日立製作所 情報記録装置
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
US8154644B2 (en) * 2008-10-08 2012-04-10 Sony Ericsson Mobile Communications Ab System and method for manipulation of a digital image
KR20110040590A (ko) * 2009-10-14 2011-04-20 삼성전자주식회사 휴대단말의 데이터 통신 방법 및 시스템
US9197736B2 (en) * 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
EP2519934A4 (en) * 2009-12-31 2015-12-16 Digimarc Corp METHOD AND ARRANGEMENTS WITH SMARTPHONES WITH SENSORS
JP5499796B2 (ja) * 2010-03-15 2014-05-21 株式会社ニコン 電子機器
CN101937676A (zh) * 2010-08-17 2011-01-05 深圳市同洲电子股份有限公司 通过音频识别实现远程控制设备的方法和移动终端
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
US9368107B2 (en) * 2011-04-20 2016-06-14 Nuance Communications, Inc. Permitting automated speech command discovery via manual event to command mapping
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
US20130120106A1 (en) 2011-11-16 2013-05-16 Motorola Mobility, Inc. Display device, corresponding systems, and methods therefor
US9564131B2 (en) 2011-12-07 2017-02-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
WO2013128508A1 (ja) * 2012-02-27 2013-09-06 Necカシオモバイルコミュニケーションズ株式会社 音声入力装置、音声入力方法及びプログラム
US20130250139A1 (en) * 2012-03-22 2013-09-26 Trung Tri Doan Method And System For Tagging And Organizing Images Generated By Mobile Communications Devices
US8913142B2 (en) * 2012-04-18 2014-12-16 Sony Corporation Context aware input system for focus control
CN102664009B (zh) * 2012-05-07 2015-01-14 乐视致新电子科技(天津)有限公司 一种通过移动通信终端对视频播放装置进行语音控制的系统及方法
CN102693726B (zh) * 2012-05-25 2014-06-04 福建英特莱信息技术咨询有限公司 具有语音识别功能的北斗卫星通信设备
KR101880636B1 (ko) * 2012-07-25 2018-07-20 삼성전자주식회사 디지털 촬영 장치 및 그의 제어 방법
KR101981316B1 (ko) * 2012-09-12 2019-05-22 엘지전자 주식회사 이동 단말기 및 이동 단말기의 제어 방법
USD769847S1 (en) * 2012-09-29 2016-10-25 Michael McClurkan Remote control
KR101971967B1 (ko) * 2012-10-23 2019-04-24 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
KR101990037B1 (ko) * 2012-11-13 2019-06-18 엘지전자 주식회사 이동 단말기 및 그것의 제어 방법
KR20140075997A (ko) * 2012-12-12 2014-06-20 엘지전자 주식회사 이동 단말기 및 이동 단말기의 제어 방법
KR20140077821A (ko) * 2012-12-14 2014-06-24 삼성전자주식회사 홈 네트워크 시스템에서 컨텐츠 백업 장치 및 방법
KR102102246B1 (ko) 2012-12-18 2020-04-22 삼성전자주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
US9622365B2 (en) 2013-02-25 2017-04-11 Google Technology Holdings LLC Apparatus and methods for accommodating a display in an electronic device
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
US20140247368A1 (en) * 2013-03-04 2014-09-04 Colby Labs, Llc Ready click camera control
CN103108235A (zh) * 2013-03-05 2013-05-15 北京车音网科技有限公司 电视控制方法、装置及系统
US9674922B2 (en) 2013-03-14 2017-06-06 Google Technology Holdings LLC Display side edge assembly and mobile device including same
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
JP6102588B2 (ja) * 2013-07-10 2017-03-29 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US10015308B2 (en) 2013-07-26 2018-07-03 Lg Electronics Inc. Mobile terminal and method of controlling the same
KR102077675B1 (ko) * 2013-07-26 2020-02-14 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
KR102047703B1 (ko) * 2013-08-09 2019-11-22 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
USD743944S1 (en) * 2013-11-15 2015-11-24 Sony Mobile Communications Ab Remote control
US9484001B2 (en) 2013-12-23 2016-11-01 Google Technology Holdings LLC Portable electronic device controlling diffuse light source to emit light approximating color of object of user interest
KR20150102489A (ko) * 2014-02-28 2015-09-07 삼성전자주식회사 디스플레이 장치
US20150279373A1 (en) * 2014-03-31 2015-10-01 Nec Corporation Voice response apparatus, method for voice processing, and recording medium having program stored thereon
JP2015233188A (ja) * 2014-06-09 2015-12-24 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
KR102147329B1 (ko) * 2014-06-17 2020-08-24 엘지전자 주식회사 영상 표시 기기 및 그의 동작 방법
US10245521B2 (en) * 2014-08-08 2019-04-02 Hung-Wang Hsu Speech remote control device
CN104580515A (zh) * 2015-01-28 2015-04-29 朱文通 基于微信的早教终端通信控制方法、早教终端及服务器
USD805502S1 (en) * 2015-03-27 2017-12-19 Koninklijke Philips N.V. Remote control
CN105611167B (zh) * 2015-12-30 2020-01-31 联想(北京)有限公司 一种对焦平面调整方法及电子设备
CN105578060A (zh) * 2016-02-18 2016-05-11 温岭市太平高级职业中学 基于asr mo8-a与tc35的语音远程控制数码相机
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10178293B2 (en) 2016-06-22 2019-01-08 International Business Machines Corporation Controlling a camera using a voice command and image recognition
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
CN106231197A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
CN106231196A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
CN106412312A (zh) * 2016-10-19 2017-02-15 北京奇虎科技有限公司 自动唤醒智能终端摄像功能的方法、系统及智能终端
US10212338B2 (en) 2016-11-22 2019-02-19 Google Llc Camera operable using natural language commands
US20180270343A1 (en) * 2017-03-20 2018-09-20 Motorola Mobility Llc Enabling event-driven voice trigger phrase on an electronic device
US11024305B2 (en) * 2017-08-07 2021-06-01 Dolbey & Company, Inc. Systems and methods for using image searching with voice recognition commands
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
JP7202853B2 (ja) * 2018-11-08 2023-01-12 シャープ株式会社 冷蔵庫
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
JP7215118B2 (ja) * 2018-11-30 2023-01-31 株式会社リコー 情報処理装置、情報処理システム、プログラムおよび方法
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10855921B2 (en) * 2019-04-29 2020-12-01 Sony Corporation Techniques for controlling camera interfaces using voice commands
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11134188B2 (en) * 2019-08-19 2021-09-28 Motorola Mobility Llc Electronic device with image capturing device that records based on external inputs
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11385526B2 (en) * 2019-11-15 2022-07-12 Samsung Electronics Co., Ltd. Method of processing image based on artificial intelligence and image processing device performing the same
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US11995297B2 (en) * 2021-03-08 2024-05-28 Samsung Electronics Co., Ltd. Enhanced user interface (UI) button control for mobile applications
CN114049878A (zh) * 2021-11-11 2022-02-15 惠州Tcl移动通信有限公司 一种基于语音识别的自动对焦方法、系统及移动终端

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11109498A (ja) * 1997-10-07 1999-04-23 Canon Inc 音声入力機能付き装置及びカメラ

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5697337A (en) * 1979-12-31 1981-08-06 Minolta Camera Co Ltd Voice control camera
US5027149A (en) * 1988-01-28 1991-06-25 Konica Corporation Voice-recognition camera
JPH06313838A (ja) * 1993-04-28 1994-11-08 Nikon Corp 音声入力カメラ
US5893902A (en) * 1996-02-15 1999-04-13 Intelidata Technologies Corp. Voice recognition bill payment system with speaker verification and confirmation
US6289140B1 (en) 1998-02-19 2001-09-11 Hewlett-Packard Company Voice control input for portable capture devices
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
JP2000083186A (ja) * 1998-09-03 2000-03-21 Canon Inc 映像機器
JP2001216059A (ja) 2000-02-04 2001-08-10 Sony Corp 情報処理装置および方法、並びにプログラム格納媒体
JP2002312386A (ja) 2001-04-12 2002-10-25 Kobelco Systems Corp 音声検索サービスシステム
JP4296473B2 (ja) * 2002-11-28 2009-07-15 富士フイルム株式会社 映像装置
US7302279B2 (en) * 2002-12-18 2007-11-27 Nokia Corporation Mobile terminal, a method of operating the terminal, and information items for use therein
JP2005027002A (ja) 2003-07-02 2005-01-27 Fuji Photo Film Co Ltd 通信機能付カメラ
US20050118990A1 (en) * 2003-12-02 2005-06-02 Sony Ericsson Mobile Communications Ab Method for audible control of a camera
KR100621593B1 (ko) * 2004-09-24 2006-09-19 삼성전자주식회사 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법
KR101081126B1 (ko) 2004-12-21 2011-11-07 주식회사 팬택 이동 통신 단말기의 키패드 설정 방법 및 시스템
US8207936B2 (en) * 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11109498A (ja) * 1997-10-07 1999-04-23 Canon Inc 音声入力機能付き装置及びカメラ

Also Published As

Publication number Publication date
KR20090025362A (ko) 2009-03-10
CN101480039B (zh) 2012-12-12
US20120265538A1 (en) 2012-10-18
US8674939B2 (en) 2014-03-18
JP4975813B2 (ja) 2012-07-11
EP2041957A1 (en) 2009-04-01
US9401159B2 (en) 2016-07-26
ATE489807T1 (de) 2010-12-15
US20080036869A1 (en) 2008-02-14
EP2041957B1 (en) 2010-11-24
WO2008004037A1 (en) 2008-01-10
CN101480039A (zh) 2009-07-08
DE602006018539D1 (de) 2011-01-05
US20140195250A1 (en) 2014-07-10
US8207936B2 (en) 2012-06-26
JP2009543396A (ja) 2009-12-03

Similar Documents

Publication Publication Date Title
KR101163273B1 (ko) 음성 원격 제어
EP3125530B1 (en) Video recording method and device
CN108419016B (zh) 拍摄方法、装置及终端
US20160373646A1 (en) Imaging device for capturing self-portrait images
US10230891B2 (en) Method, device and medium of photography prompts
KR20100008936A (ko) 듀얼 카메라를 구비하는 휴대 단말기 및 이를 이용한 촬영방법
CN109600303A (zh) 内容分享方法、装置及存储介质
KR100678201B1 (ko) 휴대단말기에서 메인언어를 설정하는 방법
CN109600549A (zh) 拍照方法、装置、设备以及存储介质
JP2015011634A (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
CN108848303A (zh) 拍摄提示方法及装置
US7889987B2 (en) Camera auto UV filter mode
CN108600625A (zh) 图像获取方法及装置
CN108509863A (zh) 信息提示方法、装置和电子设备
CN105323383B (zh) 手机铃声音量的调整方法和装置
KR20050042852A (ko) 터치 스크린을 이용한 휴대용 단말기의 디스플레이방법
CN112511686A (zh) 一种录音方法和耳机设备
CN107682623B (zh) 拍照方法及装置
CN112637416A (zh) 音量的调节方法、装置和存储介质
CN106375744B (zh) 信息投影方法及装置
CN109729219B (zh) 等待提示音播放方法及装置
KR20050000143A (ko) 음성인식을 이용한 이동통신 단말기의 카메라 동작방법
CN114339017B (zh) 远景对焦方法、装置及存储介质
CN106803881A (zh) 拍照方法、装置及终端
CN116450218A (zh) 数据处理方法、装置及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150526

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 8