KR20090111827A - 모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치 - Google Patents

모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20090111827A
KR20090111827A KR1020097015901A KR20097015901A KR20090111827A KR 20090111827 A KR20090111827 A KR 20090111827A KR 1020097015901 A KR1020097015901 A KR 1020097015901A KR 20097015901 A KR20097015901 A KR 20097015901A KR 20090111827 A KR20090111827 A KR 20090111827A
Authority
KR
South Korea
Prior art keywords
mobile communication
communication device
user
voice search
items
Prior art date
Application number
KR1020097015901A
Other languages
English (en)
Inventor
얀 밍 쳉
창쉐 씨. 마
시어도어 마주르키에비치
폴 씨. 데이비스
Original Assignee
모토로라 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 인코포레이티드 filed Critical 모토로라 인코포레이티드
Publication of KR20090111827A publication Critical patent/KR20090111827A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Abstract

모바일 통신 장치에서 보이스 검색을 수행하는 방법 및 장치가 개시된다. 이 방법은, 모바일 통신 장치의 사용자로부터 검색 쿼리를 수신하는 단계(3200), 검색 쿼리 내의 스피치 부분들을 언어 표현들로 변환하는 단계(3300), 언어 표현들을 보이스 검색 데이터베이스 내의 아이템들의 언어 표현들과 비교하여 매치들을 찾는 단계(3400), 매치들을 사용자에게 표시하는 단계(3500), 표시된 매치들로부터의 사용자의 선택을 수신하는 단계(3600), 및 사용자의 선택을 리트리빙 및 실행하는 단계(3700)를 포함한다.
모바일 통신 장치, 보이스 검색, 언어 표현, 보이스 검색 데이터베이스

Description

모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치{METHOD AND APPARATUS FOR VOICE SEARCHING IN A MOBILE COMMUNICATION DEVICE}
본 발명은 모바일 통신 장치들(mobile communication devices)에 관한 것이다.
모바일 통신 장치들은, 광범위한 특징들 및 기능들을 제공함으로써, 점점 더 "지능화(smart)"되고 있다. 또한, 이 특징들 및 기능들은, 음악들 및 사진들과 같은 점점 더 많은 컨텐츠와, 호 이력(call history), 웹 자주찾기들(web favorites), 웹 방문처들(web visits) 등과 같은 모든 종류의 이벤트들의 저장을 필요로 한다. 그러나, 통상의 모바일 장치들에게는, 그들이 가능하게 하는 특징들, 기능들, 컨텐츠들, 이벤트들, 어플리케이션들 등을 달성하기 위한 방법들이 매우 제한되어 있다. 현재, 모바일 장치들은, 이 특징들, 기능들, 컨텐츠들, 이벤트들 및 어플리케이션들을 달성 또는 액세스하기 위해, 계층적 트리 구조(hierarchical tree structure)를 통한 브라우징(browsing)과 다이얼로그(dialog)를 제공한다. 그러나, 이러한 유형의 액세스 기술은, 특징이 풍부한 장치들(feature rich devices)에 대해, 매우 엄격하고 기억하기 어려우며, 매우 장황하다. 따라서, 통상의 모바일 장치들에는, 액세스 기술에 대해 직관적, 우호적 및 인과적 방식이 결여되어 있다.
모바일 통신 장치에서 보이스 검색을 수행하는 방법 및 장치가 개시된다. 이 방법은 모바일 통신 장치의 사용자로부터 검색 쿼리를 수신하는 단계와, 검색 쿼리 내의 스피치 부분들을 언어 표현들로 변환하는 단계와, 쿼리 언어 표현들을 보이스 검색 데이터베이스 내의 모든 아이템들의 언어 표현들과 비교하여 매치들(matches)을 찾는 단계(상기 보이스 검색 데이터베이스는 장치와 연관된 모든 아이템들을 색인화하고 있음)와, 매치들을 사용자에게 표시하는 단계와, 표시된 매치들로부터의 사용자의 선택을 수신하는 단계와, 사용자의 선택을 리트리빙(retrieving)하고 실행하는 단계를 포함한다.
도 1은 본 발명의 가능한 실시예에 따른 예시적 모바일 통신 장치를 나타낸 도면이다.
도 2는 본 발명의 가능한 실시예에 따른 예시적 모바일 통신 장치의 블럭도이다.
도 3은 본 발명의 가능한 일 실시예에 따른 가능한 일 보이스 검색 처리를 나타내는 예시적 플로우차트이다.
본 발명에 대하여 상술된 이점들 및 특징들과, 그 외에 다른 이점들 및 특징들을 취득할 수 있는 방식으로 기술하기 위해서, 앞서 간략히 기술한 본 발명에 대 한 보다 구체적인 설명은, 첨부된 도면들에 도시된 특정 실시예들를 참조하여, 이루어질 것이다. 이 도면들은, 단지 본 발명의 전형적인 실시예들만을 도시하는 것으로서, 본 발명의 범주를 한정하고자 하는 것이 아니라는 점을 유의해야 하며, 본 발명은 첨부 도면들의 사용을 통해 부가적인 한정 및 세부와 함께 기술 및 설명될 것이다.
본 발명의 부가적인 특징들 및 이점들은 후속하는 상세한 설명에 기술되며, 상세한 설명으로부터 명료해지거나 상세한 설명에 기술된 본 발명의 실시예에 의해 교시될 것이다.
이하, 본 발명의 다양한 실시예를 상세히 기술한다. 특정 실시예들을 기술하지만, 이는 설명을 위해 이루어지는 것임을 이해해야 한다. 당업자는, 본 발명의 사상 및 범주를 벗어나지 않는 이상, 다른 요소들 및 구성들도 사용될 수 있음이 이해될 것이다.
본 발명은, 본 발명의 기본 개념들과 관련된 방법 및 장치와 같은 다양한 실시예들 및 다른 실시예들을 포함한다.
본 발명은, 장치 및 외부 장치들 상의 모든 어플리케이션들의 모든 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들 등이 사용자의 보이스 쿼리에 응답하여 색인화 및 검색될 수 있는 방법에 관한 것이다.
도 1은, 본 발명의 가능한 실시예에 따른 모바일 통신 장치(110)의 예시적 다이아그램에 관한 것이다. 도 1이 모바일 통신 장치(110)를 무선 전화기로서 도시하고 있지만, 모바일 통신 장치(110)는, 모바일 전화기(mobile telephone), 셀룰 러 전화기(cellular telephone), 무선 라디오(wireless radio), 휴대형 컴퓨터(portable computer), 랩톱(laptop), MP3 플레이어, 위성 라디오(satellite radio), 위성 텔레비전(satellite television), 디지털 비디오 레코더(Digital Video Recorder: DVR), 텔레비전 셋톱 박스(television set-top box) 등을 비롯한, 임의의 모바일 또는 휴대형 장치를 나타낼 수 있다.
도 2는, 본 발명의 가능한 실시예에 따른 보이스 검색 엔진(270)을 갖는 예시적 모바일 통신 장치(110)의 블럭도를 나타낸다. 예시적 모바일 통신 장치(110)는 버스(210), 프로세서(220), 메모리(230), 안테나(240), 송수신기(250), 통신 인터페이스(260), 보이스 검색 엔진(270), 및 보이스 검색 데이터베이스(280)를 포함할 수 있다. 버스(210)는 모바일 통신 장치(110)의 컴포넌트들 사이의 통신을 가능하게 할 수 있다.
프로세서(220)는 인스트럭션들을 해석하고 실행하는 적어도 하나의 통상의 프로세서 또는 마이크로프로세서(microprocessor)를 포함할 수 있다. 메모리(230)는 프로세서(220)에 의한 실행을 위해 정보 및 인스트럭션들을 저장하는, RAM(Random Access Memory) 또는 다른 유형의 동적 저장 장치일 수 있다. 또한, 메모리(230)는, 프로세서(220)를 위해 정적 정보 및 인스트럭션들을 저장하는, 통상의 ROM 장치 또는 다른 유형의 정적 저장 장치를 포함할 수 있는 ROM(Read Only Memory)을 포함할 수도 있다.
송수신기(250)는 하나 이상의 송신기들 및 수신기들을 포함할 수 있다. 송수신기(250)는 임의의 네트워크 또는 통신 스테이션(communication station)과 인 터페이스(interface)하는데 충분한 기능(functionality)을 포함할 수 있으며, 당업자에게 공지되어 있는 임의의 방식으로 하드웨어 또는 소프트웨어에 의해 정의될 수 있다. 프로세서(220)는, 통신 네트워크 내에서의 동작들을 지원하기 위해, 송수신기와 협동하여(cooperatively) 동작할 수 있다.
통신 인터페이스(260)는, 통신 네트워크를 통한 통신을 용이하게 하는 임의의 메커니즘을 포함할 수 있다. 예를 들어, 통신 인터페이스(260)는 모뎀을 포함할 수 있다. 대안적으로, 통신 인터페이스(260)는 무선 접속들을 통한 다른 장치들 및/또는 시스템들과의 통신시, 송수신기(250)를 조력(assisting)하는 다른 메커니즘을 포함할 수 있다.
모바일 통신 장치(110)는, 프로세서(220)에 응답하는 그러한 기능들을 컴퓨터 판독가능 매체, 가령, 메모리(230)에 포함된 인스트럭션들의 시퀀스들(sequences)을 실행함으로써 수행한다. 그러한 인스트럭션들은, 다른 컴퓨터 판독가능 매체, 가령, 저장 장치, 또는 개별 장치로부터 통신 인터페이스(260)를 통하여 메모리(230)에 기입될 수 있다.
보이스 검색 데이터베이스(280)는 모바일 통신 장치(110)의 모든 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 어플리케이션들 등을 색인화하여 인덱스들(indices)을 갖는 아이템들로서 저장한다. 보이스 검색 데이터베이스(280) 내의 각 아이템은 식별(identification) 및 매칭(matching)을 위한 언어 표현(linguistic representation)을 갖는다. 언어 표현들은 향후 비교 및 매칭을 위해, 음운 표현(phoneme representation), 음절 표현(syllable representation), 형 태소 표현(morpheme representation), 단어 표현(word representation) 등을 포함할 수 있다. 이 표현들은, 판독을 위한 원문 서술(textual description)과 구분된다.
특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 어플리케이션들 등은 모바일 통신 장치(100)에 부가됨에 따라, 그들은 예를 들어 텍스트(text), 스피치(speech), 픽쳐(picture) 등에 의해 최초로 기술될 수 있다. 최초의 기술이 텍스트라면, 텍스트는 언어 표현으로 번역되며, 최초의 기술이 스피치 또는 픽쳐라면, 그들의 텍스트 메타데이터(metadata)가 언어 표현들로 번역된다. 메타데이터가 이용가능하지 않은 경우, 이는 사용자로부터 취득되거나, 또는 장치 또는 장치 외부의 유사 컨텐츠와의 비교에 의해 컨텐츠들로부터 유추되며, 그런 다음, 언어 표현으로 번역될 수 있다.
또한, 보이스 검색 데이터베이스(280)는 저장된 각 아이템의 카테고리화된 인덱스(categorized index)를 포함할 수 있다. 보이스 검색 데이터베이스(280) 내에 저장된, 카테고리화된 인텍스들은, 이들이 모바일 통신 장치(110) 상에서 용이하게 네비게이팅 및 표시될 수 있는 방식으로 구성될 수 있다. 예를 들어, 모든 단일 카테고리의 인덱스들은, 디스플레이의 전경(foreground)으로 가져올 수 있거나 또는 단일 클릭에 의해 감추어질 수 있는 하나의 디스플레이 탭(display tab) 내에 표시 및 요약될 수 있으며, 카테고리 내의 인덱스는 단일 클릭에 의해 선택되고 카테고리와 연관된 디폴트 어플리케이션으로 시작될 수 있다. 이 사용자 선택가능 동작들은 보이스 커맨드들을 통해 완료될 수도 있다.
보이스 검색 데이터베이스(280)는 다른 장치들에 저장되는 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 어플리케이션들 등을 포함할 수 있다. 예를 들어, 사용자는, 보이스 검색 데이터베이스(280) 내에 색인화되고 카테고리화될 수 있는, 랩톱 컴퓨터 또는 다른 모바일 통신 장치에 저장되는 정보를 가질 수 있다. 사용자는, 사용자의 쿼리에 응답하여 보이스 검색 엔진(270)이 다른 장치들로부터 추출할 수 있는 이들 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 어플리케이션들 등을 요청할 수 있다. 도면에서는, 보이스 검색 데이터베이스(280)가 개별 엔티티(entity)로서 도시되어 있지만, 보이스 검색 데이터베이스(280)는 메모리(230) 내에 저장되거나, 그렇지 않으면 외부적으로 다른 컴퓨터 판독가능 매체 내에 저장될 수 있음에 유의한다.
도 1 및 도 2에 도시된 모바일 통신 장치(110) 및 그와 관련된 논의는, 본 발명이 구현될 수 있는, 적절한 통신 및 처리 환경에 대한 간략하고 일반적인 기술을 제공하기 위한 것이다. 비록 요청되지는 않았지만, 본 발명은, 적어도 부분적으로는, 통신 서버와 같은 모바일 통신 장치(110) 또는 범용 컴퓨터에 의해 실행되는, 프로그램 모듈들과 같은 컴퓨터 실행가능한 인스트럭션들의 일반적 컨텍스트(context)로 기술될 것이다. 일반적으로, 프로그램 모듈들은, 특정 작업을 수행하거나 또는 특정 추상 데이터 유형들(abstract data types)을 실행하는 루틴 프로그램들(routine programs), 객체들(objects), 컴포넌트들(components), 데이터 구조(data structures)들 등을 포함한다. 또한, 당업자들은, 본 발명의 다른 실시예가, 셀룰러 장치들, 모바일 통신 장치들, 개인용 컴퓨터들, 핸드헬드(hand-held) 장치들, 멀티 프로세서(multi-processor) 시스템들, 마이크로프로세서 기반 또는 프로그램 가능 소비자 전자제품 등을 포함하는, 많은 유형의 통신 장비와 컴퓨터 시스템 구성들을 갖는 통신 네트워크 환경에서 실시될 수 있다는 것이 이해될 것이다.
설명을 위해, 보이스 검색 엔진(270)의 동작과 보이스 검색 처리는 도 1 및 2에 도시된 블럭도와 관련하여 이하에서 기술될 것이다.
도 3은 본 발명의 가능한 실시예에 따른 보이스 검색 처리와 연관된 기본 단계들의 일부를 나타내는 예시적 플로우차트이다. 단계 3100에서 프로세스가 개시하며, 이어서, 단계 3200에서 보이스 검색 엔진(270)이 모바일 통신 장치(110)의 사용자로부터 검색 쿼리를 수신한다. 예를 들어, 사용자는 보이스 검색 사용자 인터페이스의 메인 메뉴에서, 매튜(Matthew)의 사진, 메간(Megan)의 주소, 또는 노래에 대한 제목을 요청한다. 상술한 바와 같이, 요청된 아이템은 모바일 통신 장치(110)에 존재할 필요는 없다. 아이템은 개인용 컴퓨터, 랩톱 컴퓨터, 다른 모바일 통신 장치, MP3 플레이어 등과 같은 다른 장치에 저장되어 있을 수 있다.
단계 3300에서, 보이스 검색 엔진(270)은 검색 쿼리의 스피치 부분들을 인식한다. 예컨대, 보이스 검색 엔진(270)은 자동 스피치 인식(automatic speech recognition: ARS) 시스템을 사용하여, 보이스 쿼리를, 단어들(words), 형태소들(morphemes), 음절들(syllables), 음소들(phonemes), 단음(phones) 등과 같은, 본 발명의 사상 및 범주 내의 언어 표현들로 변환할 수 있다.
단계 3400에서, 보이스 검색 엔진(270)은, 인식된 언어 표현들을 보이스 검 색 데이터베이스(280) 내에 저장된 각 아이템의 언어 표현들과 비교하여, 매치들(matches)을 찾는다. 단계 3500에서, 보이스 검색 엔진은 매칭된 아이템들을 그들의 카테고리화된 인덱스들에 따라 사용자에게 표시한다. 매치들은, 가령, 카테고리화된 탭들, 리스트, 아이콘들, 이미지들 또는 오디오 파일들로서 표시될 수 있다.
단계 3600에서, 보이스 검색 엔진(270)은 표시된 매치들로부터 사용자 선택을 수신한다. 단계 3700에서, 보이스 검색 엔진(270)은 사용자 선택 아이템들에 대응하는, 장치 또는 장치들에 대한 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 어플리케이션들 등을 검색하며, 그런 다음, 보이스 검색 엔진(270)은 자료(material)의 카테고리에 따라 사용자에 대해 리트리빙된 자료를 실행한다. 예를 들어, 리트리빙된 자료가 미디어 파일인 경우, 보이스 검색 엔진(270)은 미디어 파일을 사용자에게 재생할 것이고, 리트리빙된 자료가 헬프 토픽(help topic), 이메일, 포토 등인 경우, 보이스 검색 엔진(270)은 그들을 사용자에게 표시할 것이다. 처리는 단계 3800으로 가서 종료한다.
본 발명의 범주 내의 실시예들은, 컴퓨터 실행가능 인스트럭션들 또는 데이터 구조들을 수반 또는 포함하는 컴퓨터 판독가능 매체를 포함할 수도 있다. 그러한 컴퓨터 판독가능 매체는, 범용 또는 특수 컴퓨터에 의해 액세스될 수 있는, 임의의 이용가능한 매체일 수 있다. 한정이 아닌, 예에 의하면, 그러한 컴퓨터 판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 스토리지, 마그네틱 디스크 스토리지 또는 다른 마그네틱 스토리지 장치들, 또는 원하는 프로그램 코드 수단을 컴퓨터 실행가능 인스트럭션들 또는 데이터 구조들의 형태로 수반 또는 저장하는데 사용될 수 있는 임의의 다른 매체를 포함할 수 있다. 네트워크 또는 다른 통신 접속(배선, 무선 또는 그들의 조합 중 어느 하나)을 통해, 정보가 컴퓨터에 전달 또는 제공되는 경우, 컴퓨터는 그 접속을 컴퓨터 판독가능 매체로 간주하는 것이 적절하다. 따라서, 임의의 그러한 접속은 컴퓨터 판독가능 매체로 지칭되는 것이 적절하다. 상기의 조합들도 컴퓨터 판독가능 매체의 범주 내에도 포함될 수 있을 것이다.
컴퓨터 실행가능 인스트럭션들은, 가령, 범용 컴퓨터, 특수 컴퓨터 또는 특수 처리 장치가 소정의 기능 또는 기능들의 그룹을 수행하게 하는 인스트럭션들 및 데이터를 포함한다. 또한, 컴퓨터 실행가능 인스트럭션들은 독립하여 조작가능한 또는 네트워크 환경의 컴퓨터에 의해 실행되는 프로그램 모듈들을 포함한다. 일반적으로, 프로그램 모듈들은, 특정 작업들을 수행하거나 특정 추상 데이터 유형들을 실행하는, 루틴들, 프로그램들, 객체들, 컴포넌트들, 및 데이터 구조들 등을 포함한다. 데이터 구조들과 연관된 컴퓨터 판독가능 인스트럭션들과, 프로그램 모듈들은, 본 명세서에 개시되어 있는 방법들의 단계들을 실행하는 프로그램 코드 수단의 예들을 나타낸다. 그러한 실행가능한 인스트럭션들 또는 연관 데이터 구조들의 특정 시퀀스는, 그 단계들에서 기술되어 있는 기능들을 구현하기 위한 해당 동작들의 예들을 나타낸다.
상기 내용이 비록 명백한 세부 사항들을 포함하더라도, 그들이 청구항을 한정하는 것으로 해석되어서는 안될 것이다. 본 발명에 대해 기술된 실시예들과 다 른 구성들은 본 발명의 범주의 일부이다. 예를 들어, 본 발명의 원리들은, 각 개별 사용자들에게 적용될 수 있으며, 여기서 각 사용자가 개별적으로 그러한 시스템을 배치할 수 있다. 이는, 매우 많은, 가능성있는 어플리케이션들 중 어느 하나가 본 명세서에서 기술된 기능을 필요로 하지 않는다 할지라도, 각 사용자가 본 발명의 이익들을 사용할 수 있게 한다. 다시 말해, 도 2의 보이스 검색 엔진(270)으로서 다수의 예들이 존재하며, 각 예들은 가능성있는 다양한 방식으로 컨텐츠를 처리할 수 있다. 모든 엔드 사용자들에 의해 사용되는 하나의 시스템이 반드시 필요한 것은 아니다. 따라서, 첨부된 청구항들과 그들의 법적 균등물은, 임의로 제공된 특정 예가 아니라, 본 발명을 정의하는 것이다.

Claims (17)

  1. 모바일 통신 장치에서 보이스 검색(voice search)을 수행하는 방법으로서,
    상기 모바일 통신 장치의 사용자로부터 검색 쿼리(search query)를 수신하는 단계와,
    상기 검색 쿼리 내의 스피치 부분들(speech parts)을 언어 표현들(linguistic representations)로 변환하는 단계와,
    상기 언어 표현들을 보이스 검색 데이터베이스 내의 아이템들의 언어 표현들과 비교하여 매치들(matches)을 찾는 단계 - 상기 보이스 검색 데이터베이스는 상기 모바일 통신 장치와 연관된 아이템들에 대한 인덱스를 가짐 -와,
    상기 매치들을 상기 사용자들에게 표시하는 단계와,
    상기 표시된 매치들로부터의 상기 사용자의 선택을 수신하는 단계와,
    상기 사용자의 선택을 리트리빙(retrieving) 및 실행하는 단계
    를 포함하고,
    상기 언어 표현들은 형태소들(morphemes), 음절들(syllables), 단음들(phones) 및 음소(phonemes)로 이루어진 집합으로부터 선택되는 적어도 하나의 엘리먼트를 포함하는 보이스 검색을 수행하는 방법.
  2. 제1항에 있어서,
    상기 아이템들은 특징들(features), 기능들(functions), 파일들(files), 컨 텐츠들(content), 이벤트들(events) 및 어플리케이션들(applications) 중 적어도 하나인 보이스 검색을 수행하는 방법.
  3. 제1항에 있어서,
    상기 아이템들은 상기 모바일 통신 장치의 내부 및 외부 중 한 곳에 있는 장치와 연관될 수 있는 보이스 검색을 수행하는 방법.
  4. 제1항에 있어서,
    상기 사용자의 선택은 상기 모바일 통신 장치에서 동작이 수행되게 하는 보이스 검색을 수행하는 방법.
  5. 제1항에 있어서,
    상기 매치들은 리스트(list), 탭들(tabs), 아이콘들(icons), 이미지들(images) 또는 오디오 파일(audio file) 중 적어도 하나로서 표시되는 보이스 검색을 수행하는 방법.
  6. 제1항에 있어서,
    상기 모바일 통신 장치는, 모바일 전화기(mobile telephone), 셀룰러 전화기(cellular telephone), 무선 라디오(wireless radio), 휴대형 컴퓨터(portable computer), 랩톱(laptop), MP3 플레이어, 위성 라디오(satellite radio), 위성 텔 레비전(satellite television), DVR(Digital Video Recorder), 및 텔레비전 셋톱 박스(television set-top box) 중 하나인 보이스 검색을 수행하는 방법.
  7. 모바일 통신 장치에서 보이스 검색을 수행하는 장치로서,
    상기 모바일 통신 장치와 연관된 아이템들에 대한 인덱스를 갖는 보이스 검색 데이터베이스와,
    상기 모바일 통신 장치의 사용자로부터 검색 쿼리를 수신하고, 상기 검색 쿼리 내의 스피치 부분들을 언어 표현들로 변환하며, 상기 언어 표현들을 상기 보이스 검색 데이터베이스 내의 아이템들의 언어 표현들과 비교하여 매치들을 찾고, 상기 매치들을 상기 사용자에게 표시하며, 상기 표시된 매치들로부터의 상기 사용자의 선택을 수신하고, 상기 사용자의 선택을 리트리빙 및 실행하는 보이스 검색 엔진
    을 포함하며,
    상기 언어 표현들은 형태소들, 음절들, 단음들 및 음소들로 이루어진 집합으로부터 선택되는 적어도 하나의 엘리먼트를 포함하는 보이스 검색을 수행하는 장치.
  8. 제7항에 있어서,
    상기 아이템들은 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 및 어플리케이션들 중 적어도 하나인 보이스 검색을 수행하는 장치.
  9. 제7항에 있어서,
    상기 아이템들은 상기 모바일 통신 장치의 내부 및 외부 중 한 곳에 있는 장치와 연관될 수 있는 보이스 검색을 수행하는 장치.
  10. 제7항에 있어서,
    상기 사용자의 선택은, 상기 모바일 통신 장치에서 동작이 수행되게 하는 보이스 검색을 수행하는 장치.
  11. 제7항에 있어서,
    상기 매치들은 리스트, 탭들, 아이콘들, 이미지들 또는 오디오 파일 중 적어도 하나로서 표시되는 보이스 검색을 수행하는 장치.
  12. 제7항에 있어서,
    상기 모바일 통신 장치는 모바일 전화기, 셀룰러 전화기, 무선 라디오, 휴대형 컴퓨터, 랩톱, MP3 플레이어, 위성 라디오, 위성 텔레비전, DVR, 및 텔레비전 셋톱 박스 중 하나인 보이스 검색을 수행하는 장치.
  13. 모바일 통신 장치로서,
    신호들을 송신 및 수신하는 송수신기와,
    상기 모바일 통신 장치와 연관된 아이템들에 대한 인덱스를 갖는 보이스 검색 데이터베이스와,
    상기 모바일 통신 장치의 사용자로부터 검색 쿼리를 수신하고, 상기 검색 쿼리 내의 스피치 부분들을 언어 표현들로 변환하고, 상기 언어 표현들을 상기 보이스 검색 데이터베이스 내의 아이템들의 언어 표현들과 비교하여 매치들을 찾고, 상기 매치들을 상기 사용자에게 표시하며, 상기 표시된 매치들로부터의 상기 사용자의 선택을 수신하고, 상기 사용자의 선택을 리트리빙 및 실행하는 보이스 검색 엔진
    을 포함하고,
    상기 언어 표현들은 형태소들, 음절들, 단음들 및 음소들로 이루어진 집합으로부터 선택되는 적어도 하나의 엘리먼트를 포함하는 모바일 통신 장치.
  14. 제13항에 있어서,
    상기 아이템들은 특징들, 기능들, 파일들, 컨텐츠들, 이벤트들, 및 어플리케이션들 중 적어도 하나인 모바일 통신 장치.
  15. 제13항에 있어서,
    상기 아이템들은 상기 모바일 통신 장치의 내부 및 외부 중 한 곳에 있는 장치와 연관될 수 있는 모바일 통신 장치.
  16. 제13항에 있어서,
    상기 사용자의 선택은 상기 모바일 통신 장치에서 동작이 수행되게 하는 모바일 통신 장치.
  17. 제13항에 있어서,
    상기 모바일 통신 장치는 모바일 전화기, 셀룰러 전화기, 무선 라디오, 휴대형 컴퓨터, 랩톱, MP3 플레이어, 위성 라디오, 위성 텔레비전, DVR, 및 텔레비전 셋톱 박스 중 하나인 모바일 통신 장치.
KR1020097015901A 2006-12-28 2007-10-30 모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치 KR20090111827A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/617,134 US20080162472A1 (en) 2006-12-28 2006-12-28 Method and apparatus for voice searching in a mobile communication device
US11/617,134 2006-12-28
PCT/US2007/082924 WO2008082765A1 (en) 2006-12-28 2007-10-30 Method and apparatus for voice searching in a mobile communication device

Publications (1)

Publication Number Publication Date
KR20090111827A true KR20090111827A (ko) 2009-10-27

Family

ID=39585419

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097015901A KR20090111827A (ko) 2006-12-28 2007-10-30 모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치

Country Status (5)

Country Link
US (1) US20080162472A1 (ko)
EP (1) EP2126749A1 (ko)
KR (1) KR20090111827A (ko)
CN (1) CN101611403A (ko)
WO (1) WO2008082765A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912724B1 (en) * 2007-01-18 2011-03-22 Adobe Systems Incorporated Audio comparison using phoneme matching
US8069044B1 (en) * 2007-03-16 2011-11-29 Adobe Systems Incorporated Content matching using phoneme comparison and scoring
WO2009051791A2 (en) * 2007-10-16 2009-04-23 George Alex K Method and system for capturing voice files and rendering them searchable by keyword or phrase
US8594995B2 (en) * 2008-04-24 2013-11-26 Nuance Communications, Inc. Multilingual asynchronous communications of speech messages recorded in digital media files
US8249857B2 (en) * 2008-04-24 2012-08-21 International Business Machines Corporation Multilingual administration of enterprise data with user selected target language translation
US8249858B2 (en) * 2008-04-24 2012-08-21 International Business Machines Corporation Multilingual administration of enterprise data with default target languages
US20100153112A1 (en) * 2008-12-16 2010-06-17 Motorola, Inc. Progressively refining a speech-based search
US9081868B2 (en) * 2009-12-16 2015-07-14 Google Technology Holdings LLC Voice web search
US20110184740A1 (en) 2010-01-26 2011-07-28 Google Inc. Integration of Embedded and Network Speech Recognizers
US20150279354A1 (en) * 2010-05-19 2015-10-01 Google Inc. Personalization and Latency Reduction for Voice-Activated Commands
CN102385619A (zh) * 2011-10-19 2012-03-21 百度在线网络技术(北京)有限公司 一种根据语音输入信息提供访问建议的方法与设备
CN102780653B (zh) * 2012-08-09 2016-03-09 上海量明科技发展有限公司 即时通信中快捷通信的方法、客户端及系统
CN102968493A (zh) * 2012-11-27 2013-03-13 上海量明科技发展有限公司 通过输入法工具执行语音搜索的方法、客户端及系统
CN104424944B (zh) * 2013-08-19 2018-01-23 联想(北京)有限公司 一种信息处理方法及电子设备
US9582537B1 (en) * 2014-08-21 2017-02-28 Google Inc. Structured search query generation and use in a computer network environment
CN104239442B (zh) * 2014-09-01 2018-03-06 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
KR102348084B1 (ko) * 2014-09-16 2022-01-10 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
US9646611B2 (en) * 2014-11-06 2017-05-09 Microsoft Technology Licensing, Llc Context-based actions
US10203933B2 (en) 2014-11-06 2019-02-12 Microsoft Technology Licensing, Llc Context-based command surfacing
KR102480570B1 (ko) 2017-11-10 2022-12-23 삼성전자주식회사 디스플레이장치 및 그 제어방법
WO2020154834A1 (zh) * 2019-01-28 2020-08-06 深圳市大疆创新科技有限公司 一种外部负载的控制方法、设备、无人飞行器及终端设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0015233D0 (en) * 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
DE10054583C2 (de) * 2000-11-03 2003-06-18 Digital Design Gmbh Verfahren und Vorrichtung zum Aufzeichnen, Suchen und Wiedergeben von Notizen
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
US7275049B2 (en) * 2004-06-16 2007-09-25 The Boeing Company Method for speech-based data retrieval on portable devices

Also Published As

Publication number Publication date
US20080162472A1 (en) 2008-07-03
WO2008082765A1 (en) 2008-07-10
EP2126749A1 (en) 2009-12-02
CN101611403A (zh) 2009-12-23

Similar Documents

Publication Publication Date Title
KR20090111827A (ko) 모바일 통신 장치에서의 보이스 검색을 위한 방법 및 장치
US7818170B2 (en) Method and apparatus for distributed voice searching
US9824150B2 (en) Systems and methods for providing information discovery and retrieval
US9684741B2 (en) Presenting search results according to query domains
US7275049B2 (en) Method for speech-based data retrieval on portable devices
US9129606B2 (en) User query history expansion for improving language model adaptation
KR101777981B1 (ko) 데이터 스트림들의 실시간 자연어 처리
US9978365B2 (en) Method and system for providing a voice interface
RU2525440C2 (ru) Основанные на языке разметки выбор и использование распознавателей для обработки произнесения
CN106156244B (zh) 一种信息搜索导航方法及装置
US8484582B2 (en) Entry selection from long entry lists
US11048736B2 (en) Filtering search results using smart tags
US20150161236A1 (en) Recording context for conducting searches
CN109948073B (zh) 内容检索方法、终端、服务器、电子设备及存储介质
US8572090B2 (en) System and method for executing program in local computer
CN111160029A (zh) 信息的处理方法、装置、电子设备及计算机可读存储介质
CN109325180B (zh) 文章摘要推送方法、装置、终端设备、服务器及存储介质
CN109656942B (zh) 存储sql语句的方法、装置、计算机设备及存储介质
US20140372455A1 (en) Smart tags for content retrieval
WO2016077681A1 (en) System and method for voice and icon tagging
US8224844B1 (en) Searching for user interface objects
KR20130012388A (ko) 시맨틱 웹 어플리케이션의 모델 확장 장치, 시맨틱 웹 어플리케이션의 모델 확장 방법 및 이를 이용한 단말기
KR20210077573A (ko) 검색 시스템 및 그것의 음성인식 방법
WO2010117645A1 (en) Content item retrieval based on a free text entry

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid