KR100819928B1 - 휴대 단말기의 음성 인식장치 및 그 방법 - Google Patents
휴대 단말기의 음성 인식장치 및 그 방법 Download PDFInfo
- Publication number
- KR100819928B1 KR100819928B1 KR1020070040652A KR20070040652A KR100819928B1 KR 100819928 B1 KR100819928 B1 KR 100819928B1 KR 1020070040652 A KR1020070040652 A KR 1020070040652A KR 20070040652 A KR20070040652 A KR 20070040652A KR 100819928 B1 KR100819928 B1 KR 100819928B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- unit
- command
- words
- recognition
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 239000000284 extract Substances 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000003321 amplification Effects 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 무선망에 접속되는 휴대 단말기의 음성 인식율을 높여 음성 명령어의 입력을 통해 제반 동작을 실행시키고, 인식된 음성 명령어를 제어코드로 변환한 다음 무선망을 통해 서비스 센터에 전송하여 다양한 정보 서비스를 키 버튼의 입력이 수반되지 않는 상태에서 음성 명령어의 입력으로 제공받을 수 있도록 하는 것이다.
본 발명은 휴대 단말기의 대기상태에서 음성입력이 검출되면 시스템을 초기화한 후 음성 인식모드를 활성화하는 과정, 마이크로 입력되는 음성의 어절을 조합하여 단어를 생성하고, 단어의 속성과 어절간 의존관계를 분석하여 단어의 의미를 파악하는 과정, 의미가 파악되어진 단어를 조합하여 문장으로 생성하는 과정, 단어의 조합으로 생성된 문장을 음성 명령어로 인식하고, 설정된 한글 표준 코드 테이블을 적용하여 음성 명령어의 실질적인 의미를 분석하는 과정, 의미가 분석된 음성 명령어의 파일을 생성하고, 이를 제어코드로 변환하는 과정 및 제어코드에 따른 운용 프로그램의 작동으로 인식된 음성 명령에 매칭되는 정보를 엑세스하여 스피커를 통해 송출함과 동시에 표시부를 통해 표시하는 과정을 포함한다.
휴대 단말기, 음성 인식, 단어 조합, 제어코드, 표준 코드 테이블
Description
도 1은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치를 도시한 도면이다.
도 2는 도 1에 도시된 음성인식부 및 코드변환부의 상세 구성을 도시한 도면이다.
도 3은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식과정을 도시한 흐름도이다.
도 4는 본 발명의 실시예에 따른 휴대 단말기의 음성 인식과정에서 음성 명령어의 인식과정을 도시한 흐름도이다.
<도면의 주요 부분에 대한 부호의 설명>
110 : 키 입력부 120 : 오디오 처리부
130 : 제어부 140 : 변복조부
150 : 송수신부 160 : 영상입력부
170 : 영상처리부 200 : 음성 인식장치
210 : 단어 조합부 220 : 단어 인식부
230 : 음성인식부 240 : 코드변환부
본 발명은 휴대 단말기의 음성 인식장치에 관한 것으로, 더 상세하게는 무선망에 접속되는 휴대 단말기의 음성 인식율을 높여 음성 명령어의 입력을 통해 제반 동작을 실행시키고, 인식된 음성 명령어를 제어코드로 변환한 다음 무선망을 통해 서비스 센터에 전송하여 다양한 정보 서비스를 키 버튼의 입력이 수반되지 않는 상태에서 음성 명령어의 입력으로 제공받을 수 있도록 하는 휴대 단말기의 음성 인식장치 및 방법에 관한 것이다.
급속한 보급률을 보이고 있는 휴대 단말기는 고유의 음성 통화 서비스는 물론이고 데이터 전송 서비스와 메일, 증권, 뉴스, 날씨, 생활정보 등의 부가 서비스 및 상대방의 얼굴을 보면서 통화하는 영상 통화 서비스를 제공하는 멀티미디어 통신기기로 자리 매김을 하고 있다.
이러한 휴대 단말기에는 MP3 파일, 사진 파일, 동영상 파일 및 수신되는 각종 데이터 파일을 저장할 수 있는 대용량의 메모리가 적용되고 있으며, 음성 인식기능이 적용되어 사용상에 편리성을 제공하고 있다.
음성 인식기능은 사용자의 음성을 프로세서가 분석하여 이를 인식 또는 이해하는 것으로, 발음에 따라 입 모양과 혀의 위치 변화로 특정한 주파수를 갖는 인간의 발성 음성을 전기신호로 변환한 다음 음성의 주파수 특성을 추출하여 발음을 인식하는 기술이다.
이와 같은 음성 인식기능은 전화기의 다이얼링, 장난감 제어, 어학 학습, 가전기기의 제어 등과 같은 다양한 분야에 응용되고 있으며, 휴대 단말기에서는 사용자의 음성 인식을 통해 다이얼링을 제공하는 수준에 그치고 있다.
음성 다이얼링은 음성으로 기 설정된 특정 단어를 입력하면 음성을 인식한 후 그 인식된 음성에 설정된 전화번호를 자동 다이얼링하는 기능으로서, 운전시와 같이 다른 일을 하고 있어 손을 쓰기가 불편한 경우에 이용된다.
이와 같은 음성 다이얼링은 단순하게 몇개의 전화번호를 각각 특정한 단어로 설정하여 저장시켜 놓은 후 해당 단어를 음성으로 말함으로서 자동 다이얼링을 제공하기 때문에 저장된 몇개의 전화번호에 대해서만 음성 인식 다이얼링이 가능하며, 그외 등록되지 않은 다른 전화번호에 대해서는 음성인식이 제공되지 못하는 문제점이 있다.
그리고, 메모리의 용량 문제로 음성 다이얼링을 등록할 수 있는 전화번호의 갯수에 한계가 있어 음성 다이얼링의 효용성이 크지 않은 단점이 있다.
또한, 음성 인식기술은 주변 소음 등에 매우 열악하여 현재의 기술로는 아직 100%의 인식 성공율을 보장할 수 없기 때문에 음성인식에 의해 수행되는 작업에 빈번한 오류가 발생하고 있다.
이러한 작업의 오류 발생율을 줄이기 위한 방편으로서, 음성 인식의 결과에 대하여 사용자에게 확인을 요구하거나, 음성 인식의 결과에 따라서 복수개의 대안으로 이루어지는 목록을 사용자에게 제시함으로써, 사용자의 확인 또는 선택에 따라 최종 인식 단어를 결정하는 방법이 사용되고 있다.
상기한 사용자의 확인에 따른 음성 인식이나 사용자가 제시된 대안을 선택함에 따른 음성 인식은 휴대 단말기 자체의 완전한 음성 인식을 제공하지 못하며, 항상 사용자의 선택이 함께 이루어져야 하는 문제점이 있다.
또한, 통신 서비스의 발달에 따라 휴대 단말기에 인터넷 접속을 제공하여 웹 사이트의 검색이나 컨텐츠의 검색, 전자우편, 주식거래, 게임 등을 이용할 수 있도록 하고 있으나, 현재의 휴대 단말기에 적용되어 있는 음성 인식기술은 인식율이 너무 낮아 모바일 환경에서 음성을 이용하여 인터넷을 통해 상기한 다양한 서비스를 제공받는데 많은 어려움이 있다.
본 발명은 상기한 문제점을 해결하기 위하여 발명한 것으로, 그 목적은 무선망에 접속되는 휴대 단말기의 음성 인식율을 높여 수신된 메시지(메일)의 확인과 무선 인터넷망으로부터 증권정보, 날씨, 뉴스, 각종 생활정보, 컨텐츠 서비스를 버튼 입력없이 음성의 입력으로 제공받을 수 있도록 하는 것이다.
또한, 본 발명의 다른 목적은 휴대 단말기의 제반적인 동작을 음성 명령어의 인식으로 실행시키고, 수신된 메시지(메일)의 확인과 전송하고자 하는 메시지(메일)의 편집 및 편집된 메시지(메일)의 전송을 음성 명령어의 입력으로 실행하도록 하는 것이다.
또한, 본 발명의 다른 목적은 사용자의 음성 명령어를 인식하여 제어코드로 변환한 다음 인터넷 망에 전송하여 필요로 하는 정보 서비스를 요청하고, 그에 따른 다양한 정보 서비스를 키 버튼의 입력이 수반되지 않는 상태에서 제공받을 수 있도록 하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 특징에 따른 휴대 단말기의 음성 인식장치는 휴대 단말기에 있어서,
숫자 및 문자를 입력하기 위한 다수개의 키와 기능키로 구성되는 키 입력부;
마이크로 입력되는 아날로그 음성신호를 디지털 음성신호로 변환하고, 제어부에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커로 송출시키는 오디오 처리부;
무선망을 통해 송수신되는 음성신호 및 데이터 패킷을 부호화 및 복호화하는 변복조부;
안테나를 통해 무선망과 접속하며, 상기 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 무선망으로 송출하고, 무선망에서 수신되는 신호를 저잡음 증폭 및 주파수 하강 변환하는 송수신부;
주변의 영상을 입력하며, 내장되는 DSP를 통해 디지털 신호로 변환하는 영상 입력부;
JPEG 코덱, MPEG 코덱, Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며 영상 입력부에서 인가되는 영상신호를 프레임 단위로 처리하고 표시부의 특성 및 디스플레이 규격에 맞추에 출력하는 영상처리부;
상기 영상 처리부에서 인가되는 프레임 단위의 영상과 제어부에서 인가되는 메시지(메일), 컨텐츠, 뉴스, 날씨, 생활정보 데이터를 문자나 텍스트로 표시하는 표시부를 포함하며,
마이크로 입력되는 사용자 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간의 음소 및 음절을 조합하여 단어로 형성하며 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하는 음성 인식장치;
휴대 단말기의 운용 프로그램과 음성인식 명령어를 제어코드로 변환하기 위한 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장하는 메모리부;
설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 음성 인식모드에서 음성 명령어의 인식 결과에 따라 해당 정보를 엑세스하여 음성 송출 및 표시를 제공하거나 무선망에 해당하는 서비스를 요청하고 수신되는 서비스 정보를 표시부 및 음성으로 송출시키는 제어부를 더 포함한다.
또한, 본 발명의 특징에 따른 휴대 단말기의 음성 인식방법은 (a) 휴대 단말기의 대기상태에서 음성입력이 검출되면 시스템을 초기화한 후 음성 인식모드를 활성화하는 과정;
(b) 마이크로 입력되는 음성의 어절을 조합하여 단어로 생성하고, 단어의 속성과 어절간 의존관계를 분석하여 단어의 의미를 파악하는 과정;
(c) 상기 (b) 과정에서 의미가 파악되어진 단어를 조합하여 문장으로 생성하는 과정;
(d) 상기 (c) 과정에서 단어의 조합으로 생성된 문장을 음성 명령어로 인식하고, 설정된 한글 표준 코드 테이블을 적용하여 음성 명령어의 실질적인 의미를 분석하는 과정;
(e) 상기 (d) 과정에서 의미가 분석된 음성 명령어의 파일을 생성하고, 이를 제어코드로 변환하는 과정 및;
(f) 상기 (e) 과정에서 변환된 제어코드에 따른 운용 프로그램의 작동으로 인식된 음성 명령에 매칭되는 정보를 엑세스하여 스피커를 통해 송출함과 동시에 표시부를 통해 표시하는 과정을 포함한다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
그리고, 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이제 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치 및 방법에 대하여 도면을 참고로 하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치를 도시한 도 면이다.
도시된 바와 같이, 본 발명은 키 입력부(110)와 오디오 처리부(120), 제어부(130), 변복조부(140), 송수신부(150), 영상 입력부(160), 영상 처리부(170), 표시부(180), 메모리부(190) 및 음성 인식장치(200)를 포함한다.
키 입력부(110)는 숫자 및 문자를 입력하기 위한 다수개의 키와 휴대 단말기의 사용상 특정의 기능을 설정하기 위한 기능키를 포함하며, 상기 기능키에는 휴대 단말기를 음성 인식모드로 진입시키는 기능키가 더 포함될 수 있다.
오디오 처리부(120)는 패킷 데이터를 처리하는 데이터 코덱과 음성 등의 오디오 신호를 처리하는 오디오 코덱을 포함하며, 마이크(Mic)로 입력되는 사용자의 아날로그 음성신호를 오디오 코덱을 통해 디지털 신호로 변환하여 제어부(130)가 인식할 수 있도록 하고, 제어부(130)에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커(Spk)를 통해 송출한다.
또한, 무선망을 통해 수신되는 메시지(메일) 등의 데이터 패킷이 사용자에게 정보 제공을 위한 데이터 패킷인 경우 제어부(130)에서 제공되는 데이터 패킷을 데이터 코덱을 통해 아날로그 신호로 변환하여 스피커(Spk)를 통해 음성 안내로 제공한다.
제어부(110)는 설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 사용자의 음성 명령의 인식 혹은 키 입력부(110)에 구비된 기능키에 의해 음성 인식모드로 진입하여 음성 명령어의 인식에 따라 수신 메시지(메일)를 표시부(180)를 통해 표시하고, 필요에 따라 스피커(Spk)를 통해 음성으로 송출하며, 무선망에 필요로 하는 서비스를 요청하고 그에 따라 수신되는 증권정보, 뉴스, 날씨, 생활정보 등을 수신하여 표시부(180)를 통해 표시하고 동시에 스피커(Spk)를 통해 음성으로 송출한다.
변복조부(140)는 무선망으로 송신되는 음성신호 및 데이터 패킷을 부호화하여 송수신부(150)에 인가하고, 송수신부(150)를 통해 수신되는 음성신호 및 데이터 패킷을 복호화하여 제어부(130)에 제공한다.
송수신부(150)는 안테나(ANT)를 통해 무선망과 접속하며, 변복조부(140)에서 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 안테나(ANT)를 통해 송출하고, 무선망으로부터 안테나(ANT)를 통해 수신되는 신호를 저잡음 증폭 및 주파수를 하강 변환하여 변복조부(140)에 제공한다.
영상 입력부(160)는 예를 들어 CCD 촬상소자 혹은 카메라로, 제어부(130)에서 인가되는 제어신호에 따라 주변사물이나 인물 등 피사체의 영상을 입력하며, 입력되는 아날로그 영상신호를 내장되는 DSP(Digital Signal Processor)를 통해 디지털 신호로 변환한다.
영상처리부(170)는 제어부(130)의 제어신호에 따라 상기 영상 입력부(160)에서 인가되는 영상신호를 프레임 단위로 처리하며, 상기 프레임 단위의 영상신호를 표시부(180)의 특성 및 디스플레이 규격에 맞추에 출력한다.
상기 영상처리부(170)는 JPEG 코덱이나 MPEG 코덱 혹은 Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며, 상기 표시부(180)에 표시되는 프레임 단위의 영상 데이터를 설정된 방식으로 압축하거나 압축된 프레임 단위의 영상 데이터 를 복원하는 기능을 실행한다.
표시부(180)는 상기 영상 처리부(170)에서 인가되는 프레임 단위의 영상을 표시하며, 제어부(130)에서 인가되는 메시지(메일), 컨텐츠 정보, 뉴스, 날씨, 생활정보 등 데이터를 문자나 텍스트 혹은 그래프의 형식으로 표시한다.
상기 표시부(180)는 터치 스크린 방식으로 구현되어 키 입력부(110)를 대신하여 입력부로 동작할 수 있다.
메모리부(190)는 휴대 단말기를 운용하는 프로그램과 음성 명령어 인식을 위한 데이터 및 인식된 음성 명령어를 제어코드로 변환하기 위한 한글 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장한다.
음성 인식장치(200)는 마이크(Mic)로 입력되는 사용자의 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성한 다음 이를 인식하고, 인식된 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하며, 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 적용하여 인식된 음성 명령어를 제어 코드로 변환한다.
상기 음성 인식장치(200)는 추출된 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하는 단어 조합부(210)와, 조합된 단어를 인식하여 문장으로 구성하는 단어 인식부(220), 단어의 조합을 통해 구성된 문장을 인식하여 음성 명령어로 인식하는 음성 인식부(230), 인식된 음성 명령어를 상기 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 제어 코드로 변환하는 코드 변환부(240)를 포함한다.
상기 음성 인식부(230) 및 코드 변환부(240)에 대하여 도 2를 참조하여 그 구성을 좀 더 구체적으로 설명하면 다음과 같다.
도시된 바와 같이, 음성 인식부(230)는 구문 분석기(231)와 구문 해석기(232)를 포함하고, 코드 변환부(240)는 구문 분석기(241)와 구문 해석기(242), 음절 변환기(243) 및 파일 생성기(244)를 포함한다.
상기 음성 인식부(230)에 포함되는 구문 분석기(231)는 입력되는 음성을 분석하여 속성 파악한 다음 어절간 의존관계를 분석하여 음성 명령어의 문장으로 생성한다.
음성 인식부(230)에 포함되는 구문 해석기(232)는 상기 생성된 음성 명령어의 문장을 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 분석한다.
코드 변환기(240)에 포함되는 구문 분석기(241)는 상기 음성 인식부(230)에서 명령어의 실질적인 의미가 분석되어 인가되는 음성 명령어의 명사구 등 속성을 파악하고 어절간 의존관계를 분석한다.
상기 코드 변환기(240)에 포함되는 구문 해석기(242)는 구문 분석기(241)에서 분석되어진 음성 명령어를 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 파악한다.
상기 코드 변환기(240)에 포함되는 음절 변환기(243)는 상기 의미가 파악되어진 음성 명령어를 음절 변환한다.
상기 코드 변환기(240)에 포함되는 파일 생성기(244)는 음절 변환된 음성 명 령어를 파일로 생성하여 출력한다.
상기한 기능을 포함하여 구성되는 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치의 음성 명령어 인식과 그에 따른 동작에 대하여 설명한다.
휴대 단말기에서 키 입력에 따른 음성 통화나 영상 입력, 메시지(메일)의 송수신, 각종 컨텐츠 및 정보의 수신 등에 대한 동작은 통상적인 휴대 단말기의 동작과 동일 내지 유사하므로, 이에 대한 구체적인 설명은 생략한다.
본 발명은 음성 명령어를 인식하여 그에 따른 동작을 수행하는 것이므로, 이에 대하여 도 3 및 도 4를 참조하여 설명한다.
휴대 단말기가 전원 온을 유지하는 대기상태에서(S101) 제어부(130)는 마이크(Mic)를 통해 입력되는 사용자의 음성 명령어가 검출되는지 판단한다(S102).
사용자가 특정의 음성 명령어를 마이크(Mic)에 입력하면, 오디오 처리부(120)는 입력되는 사용자의 아날로그 음성신호를 오디오 코덱을 통해 디지털 신호로 변환하여 제어부(130)에 제공하므로, 제어부(130)는 동작 대기의 상태에서 음성 명령어가 입력되었는지의 여부를 판단할 수 있게 된다.
상기 S102의 판단에서 특정의 음성 명령어의 입력이 검출되면 음성 인식 모드의 진입 요구로 판단하여 시스템을 초기화하고(S103), 음성 변환모드를 활성화 한다(S104).
상기에서 음성 인식모드의 진입을 대기상태에서 특정 음성 명령어의 입력으로 진입하는 것으로 하였으나, 이에 한정하지 않고 키 입력부(110)에 구비되어 있는 특정 키의 입력을 통해 음성 인식모드로 진입되는 기능도 본 발명의 범위에 포 함된다.
상기 S104에서 음성 변환모드가 활성화되면 음성 인식장치(200)에 포함되는 단어 조합부(210)는 제어부(130)를 통해 인가되는 사용자의 음성신호에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하며 단어 인식부(220)는 조합된 단어를 인식하여 문장으로 구성한다(S105)(S106).
이후, 음성 인식부(230)는 단어의 조합으로 구성되는 문장에서 각 단어의 의존관계를 분석 및 해석하여(S107) 음성 명령어를 인식한다(S108).
상기 음성 명령어의 인식 절차에 대하여 도 4를 참조하여 설명한다.
문장을 구성하는 각 단어의 의존관계 분석 및 해석 결과 음성 명령어로 인식할 수 있도록 사전에 정의된 단어로 구성되어 있는지를 판단한다(S201)(S202).
상기의 판단 결과 사전에 정의된 단어로 구성되어 있으면 단어를 구성하는 각 음절을 검사하고(S203), 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 검색하여(S204) 매칭되는 코드가 존재하는지를 판단한다(S205).
상기 S205의 판단 결과 메칭되는 코드가 존재하면 해당 매칭 코드를 적용하여 음성 명령어로 인식한다(S206)(S207).
상기한 절차를 통해 음성 명령어를 인식하게 되면 이를 음성 명령어 파일로 생성하고(S109), 코드 변환부(240)를 통해 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 적용하여 인식된 음성 명령어를 제어 코드로 변환하여 제어부(130)에 인가한다(S110).
따라서, 제어부(130)는 음성 인식장치(200)에서 제어코드로 인가되는 음성 인식 명령에 따라 운용 프로그램을 실행시켜 인식된 명령을 실행하게 되며(S111), 실행 결과를 오디오 처리부(120)를 통해 아날로그 음성 신호로 변환하여 스피커(Spk)를 통해 송출함과 동시에 표시부(180)를 통해 표시하여 준다(S112).
일 예를 들어, 인식된 음성 명령어가 수신된 메시지(메일)의 출력이면 제어부(130)는 메모리부(190)에 저장되어 있는 데이터 패킷중에서 출력이 요청된 메시지(메일)을 엑세스하여 표시부(180)를 통해 출력한다.
또한, 필요에 따라 오디오 처리부(120)에 포함되는 오디오 코덱을 통해 수신된 메시지를 아날로그 음성신호로 변환한 다음 스피커(Spk)를 통해 송출하여 준다.
상기에서 인식된 음성 명령어가 무선 인터넷망으로부터 증권정보, 뉴스,날씨, 생활정보, 각종 컨텐츠 등의 서비스 요청이면 명령어의 제어코드에 따라 송수신부(150)를 통해 무선 인터넷망을 접속한다.
이후, 음성 인식되는 서비스의 요청을 해당하는 웹 서버에 전송하고, 그에 따라 제공되는 서비스의 데이터 패킷을 수신하여 표시부(180)를 통해 사용자에게 표시하여 준다.
그리고, 필요에 따라 오디오 처리부(120)의 오디오 코덱을 통해 음성으로 변환한 다음 스피커(Spk)를 통해 송출하여 준다.
이외에 메시지(메일)를 음성 명령의 입력으로 편집하여 상대방에게 전송하고, 상대방으로부터 수신되는 메시지를 표시부(180)에 표시하거나 음성으로 변환하여 스피커(Spk)를 통해 송출하여 준다.
본 발명은 이동통신 서비스 업체, 인터넷 서비스 업체, 컨텐츠 제공업체 등 음성인식 합성기술을 접목할 수 있는 환경이면 모드 적용할 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
전술한 구성에 의하여 본 발명은 와이브로(Wibro),WCDMA, HSPA(HSDPA+HSUPA)의 무선망 환경에서 음성 명령의 인식과 제어 코드의 변환을 통해 메시지(메일), 각종 생활정보, 개인 일정관리 데이터를 제공하고, 화자 기술을 적용시켜 동화상 및 음성으로 변환하여 서비스 제공할 수 있으며, 기존의 음성전화, 텍스트, 팩스뿐만 아니라 데이터 통신 기능에 화상전화, 동영상 멀티미디어 서비스, 게시판, 신문기사, 상품광고, 게시물, 경제, 오락, 나의 정보 등 인터넷 상에서 게시되는 모든 정보들의 제공받을 수 있다.
Claims (9)
- 숫자 및 문자를 입력하기 위한 다수개의 키와 기능키로 구성되는 키 입력부; 마이크로 입력되는 아날로그 음성신호를 디지털 음성신호로 변환하고, 제어부에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커로 송출시키는 오디오 처리부; 무선망을 통해 송수신되는 음성신호 및 데이터 패킷을 부호화 및 복호화하는 변복조부; 안테나를 통해 무선망과 접속하며, 상기 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 무선망으로 송출하고, 무선망에서 수신되는 신호를 저잡음 증폭 및 주파수 하강 변환하는 송수신부; 주변의 영상을 입력하며, 내장되는 DSP를 통해 디지털 신호로 변환하는 영상 입력부; JPEG 코덱, MPEG 코덱, Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며 영상 입력부에서 인가되는 영상신호를 프레임 단위로 처리하고 표시부의 특성 및 디스플레이 규격에 맞추에 출력하는 영상처리부; 상기 영상 처리부에서 인가되는 프레임 단위의 영상과 제어부에서 인가되는 메시지(메일), 컨텐츠, 뉴스, 날씨, 생활정보 데이터를 문자나 텍스트로 표시하는 표시부를 포함하며,마이크로 입력되는 사용자 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 추출되는 음소 및 음절을 조합하여 단어로 형성하며 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하는 음성 인식장치; 휴대 단말기의 운용 프로그램과 음성인식 명령어를 제어코드로 변환하기 위한 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장하는 메모리부; 설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 음성 인식모드에서 음성 명령어의 인식 결과에 따라 해당 정보를 엑세스하여 음성 송출 및 표시를 제공하거나 무선망에 해당하는 서비스를 요청하고 수신되는 서비스 정보를 표시부 및 음성으로 송출시키는 제어부를 더 포함하는 휴대 단말기의 음성 인식장치에 있어서,상기 음성 인식장치는 입력 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하는 단어 조합부;조합된 단어를 인식하여 문장으로 구성하는 단어 인식부;단어의 조합으로 구성된 문장을 음성 명령어로 인식하는 음성 인식부;인식된 음성 명령어를 메모리부에 저장된 한글 표준 코드 테이블을 적용하여 제어 코드로 변환하는 코드 변환부를 포함하는 휴대 단말기의 음성 인식장치.
- 삭제
- 삭제
- 삭제
- 제1항에 있어서,상기 음성 인식부는 입력 음성을 분석하여 속성을 파악하고 어절간 의존관계를 분석하여 음성 명령어의 문장으로 생성하는 구문 분석기;상기 구문 분석기에서 생성된 음성 명령어의 문장을 메모리부에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 분석하는 구문 해석기를 포함하는 휴대 단말기의 음성 인식장치.
- 제1항에 있어서,상기 코드 변환부는 상기 음성 인식부에서 명령어의 실질적인 의미가 분석된 음성 명령어의 속성을 파악하고 어절간 의존관계를 분석하는 구문 분석기;상기 분석된 음성 명령어를 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 파악하는 구문 해석기;상기 구문 해석기에 의해 의미가 파악되어진 음성 명령어를 음절 변환하는 음절 변환기;상기 음절 변환된 음성 명령어를 파일로 생성하는 파일 생성기를 포함하는 휴대 단말기의 음성 인식장치.
- (a) 휴대 단말기의 대기상태에서 음성입력이 검출되면 시스템을 초기화한 후 음성 인식모드를 활성화하는 과정;(b) 마이크로 입력되는 음성의 어절을 조합하여 단어로 생성하고, 단어의 속성과 어절간 의존관계를 분석하여 단어의 의미를 파악하는 과정;(c) 상기 (b) 과정에서 의미가 파악되어진 단어를 조합하여 문장으로 생성하는 과정;(d) 상기 (c) 과정에서 단어의 조합으로 생성된 문장을 음성 명령어로 인식하고, 설정된 한글 표준 코드 테이블을 적용하여 음성 명령어의 실질적인 의미를 분석하는 과정;(e) 상기 (d) 과정에서 의미가 분석된 음성 명령어의 파일을 생성하고, 이를 제어코드로 변환하는 과정 및;(f) 상기 (e) 과정에서 변환된 제어코드에 따른 운용 프로그램의 작동으로 인식된 음성 명령에 매칭되는 정보를 엑세스하여 스피커를 통해 송출함과 동시에 표시부를 통해 표시하는 과정을 포함하는 휴대 단말기의 음성 인식방법.
- 제7항에 있어서,상기 (e) 과정에서 인식된 음성 명령에 매칭되는 정보는 수신 저장된 메시지(메일)의 표시 및 청취, 무선망으로부터 증권, 뉴스, 날씨, 생활정보, 컨텐츠 정보의 서비스 요청이며, 서비스 요청에 따라 수신되는 정보를 표시 및 음성 송출하는 것을 더 포함하는 휴대 단말기의 음성 인식방법.
- 제7항에 있어서,상기 (a) 과정의 음성 인식모드에서 음성의 입력으로 메시지(메일)의 편집 및 전송과 수신 메시지(메일)의 출력을 제공하는 것을 더 포함하는 휴대 단말기의 음성 인식방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070040652A KR100819928B1 (ko) | 2007-04-26 | 2007-04-26 | 휴대 단말기의 음성 인식장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070040652A KR100819928B1 (ko) | 2007-04-26 | 2007-04-26 | 휴대 단말기의 음성 인식장치 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100819928B1 true KR100819928B1 (ko) | 2008-04-08 |
Family
ID=39533957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070040652A KR100819928B1 (ko) | 2007-04-26 | 2007-04-26 | 휴대 단말기의 음성 인식장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100819928B1 (ko) |
Cited By (99)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101352695B1 (ko) | 2012-02-24 | 2014-01-17 | 주식회사 비엔에스웍스 | 소리를 이용한 컨텐츠 출력 방법 |
WO2015005927A1 (en) * | 2013-07-11 | 2015-01-15 | Intel Corporation | Device wake and speaker verification using the same audio input |
KR101642918B1 (ko) * | 2015-08-03 | 2016-07-27 | 서치콘주식회사 | 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체 |
KR20160127911A (ko) * | 2015-04-28 | 2016-11-07 | 주식회사 디오티스 | 이종 망 연동을 이용한 구문 인식 기반의 폰뱅킹 제공 방법 |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
KR101834624B1 (ko) * | 2013-06-08 | 2018-03-05 | 애플 인크. | 핸즈 프리 상호작용을 위한 사용자 인터페이스 자동 적응 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
WO2022158633A1 (ko) * | 2021-01-25 | 2022-07-28 | 박상래 | 음성인식 및 음성합성을 이용한 무선통신장치 |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050122604A (ko) * | 2004-06-25 | 2005-12-29 | 삼성전자주식회사 | 휴대단말기에서 음성인식구동 방법 |
-
2007
- 2007-04-26 KR KR1020070040652A patent/KR100819928B1/ko not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050122604A (ko) * | 2004-06-25 | 2005-12-29 | 삼성전자주식회사 | 휴대단말기에서 음성인식구동 방법 |
Cited By (121)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
KR101352695B1 (ko) | 2012-02-24 | 2014-01-17 | 주식회사 비엔에스웍스 | 소리를 이용한 컨텐츠 출력 방법 |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
KR101834624B1 (ko) * | 2013-06-08 | 2018-03-05 | 애플 인크. | 핸즈 프리 상호작용을 위한 사용자 인터페이스 자동 적응 |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9852731B2 (en) | 2013-07-11 | 2017-12-26 | Intel Corporation | Mechanism and apparatus for seamless voice wake and speaker verification |
US9445209B2 (en) | 2013-07-11 | 2016-09-13 | Intel Corporation | Mechanism and apparatus for seamless voice wake and speaker verification |
WO2015005927A1 (en) * | 2013-07-11 | 2015-01-15 | Intel Corporation | Device wake and speaker verification using the same audio input |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
KR101707086B1 (ko) * | 2015-04-28 | 2017-02-15 | 주식회사 디오티스 | 이종 망 연동을 이용한 구문 인식 기반의 폰뱅킹 제공 방법 |
KR20160127911A (ko) * | 2015-04-28 | 2016-11-07 | 주식회사 디오티스 | 이종 망 연동을 이용한 구문 인식 기반의 폰뱅킹 제공 방법 |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
KR101642918B1 (ko) * | 2015-08-03 | 2016-07-27 | 서치콘주식회사 | 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
WO2022158633A1 (ko) * | 2021-01-25 | 2022-07-28 | 박상래 | 음성인식 및 음성합성을 이용한 무선통신장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100819928B1 (ko) | 휴대 단말기의 음성 인식장치 및 그 방법 | |
US10614803B2 (en) | Wake-on-voice method, terminal and storage medium | |
CN107895578B (zh) | 语音交互方法和装置 | |
US8824641B2 (en) | Real time automatic caller speech profiling | |
KR101861006B1 (ko) | 통역 장치 및 방법 | |
US9479911B2 (en) | Method and system for supporting a translation-based communication service and terminal supporting the service | |
CN102117614B (zh) | 个性化文本语音合成和个性化语音特征提取 | |
RU2352979C2 (ru) | Синхронное понимание семантических объектов для высокоинтерактивного интерфейса | |
WO2004036939A1 (fr) | Appareil de communication mobile numerique portable, procede de commande vocale et systeme | |
JP2002125047A (ja) | 通訳サービス方法および通訳サービス装置 | |
JP2002125050A5 (ko) | ||
CN109543021B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN110493123B (zh) | 即时通讯方法、装置、设备及存储介质 | |
KR100617711B1 (ko) | 휴대단말기에서 음성인식구동 방법 | |
JP2019175426A (ja) | 翻訳システム、翻訳方法、翻訳装置、及び音声入出力装置 | |
CN111325039B (zh) | 基于实时通话的语言翻译方法、系统、程序和手持终端 | |
US20060182236A1 (en) | Speech conversion for text messaging | |
JP2010026686A (ja) | 統合的インタフェースを有する対話型コミュニケーション端末及びそれを用いたコミュニケーションシステム | |
JP6549009B2 (ja) | 通信端末及び音声認識システム | |
JP6457706B1 (ja) | 翻訳システム、翻訳方法、及び翻訳装置 | |
US20080147409A1 (en) | System, apparatus and method for providing global communications | |
WO2008118038A1 (fr) | Procédé d'échange de messages et dispositif permettant sa mise en oeuvre | |
JP2018045675A (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
JP2004015478A (ja) | 音声通信端末装置 | |
KR101454254B1 (ko) | 유무선 통신 네트워크를 이용한 음성대화방법 및 휴대용 단말장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110331 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |