KR100250496B1 - 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법. - Google Patents

사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법. Download PDF

Info

Publication number
KR100250496B1
KR100250496B1 KR1019970072041A KR19970072041A KR100250496B1 KR 100250496 B1 KR100250496 B1 KR 100250496B1 KR 1019970072041 A KR1019970072041 A KR 1019970072041A KR 19970072041 A KR19970072041 A KR 19970072041A KR 100250496 B1 KR100250496 B1 KR 100250496B1
Authority
KR
South Korea
Prior art keywords
voice
speaker
recognition
mode
independent
Prior art date
Application number
KR1019970072041A
Other languages
English (en)
Other versions
KR19990052548A (ko
Inventor
이점도
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019970072041A priority Critical patent/KR100250496B1/ko
Publication of KR19990052548A publication Critical patent/KR19990052548A/ko
Application granted granted Critical
Publication of KR100250496B1 publication Critical patent/KR100250496B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • G10L15/05Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본발명은 디지틀 휴대폰이 화자 독립 및 화자 종속 음성 인식방법을 모두 채용하여 음성 다이알링를 서비스하는 경우에 있어서, 사용자가 전화를 걸 때마다 휴대폰 외부에 위치한 버튼을 통해 화자 독립 또는 화자 종속 음성다이알링을 선택하여 전화를 거는 방법에 대한 것이다.
사용자가 전화를 걸때 마다 버튼으로 음성인식모드를 선택하는 방법은 사전에 화자 종속 또는 화자 독립으로 설정하는 방법에 비해 상대적으로 편리할 뿐만아니라 음성 신호를 화자 종속 및 화자 독립 처리 모두를 처리하는 것에 비해 프로세싱타임 즉 응답시간이 단축되며 오류도 크게 줄일수 있다.

Description

사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.
본 발명은 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 관한 것으로서, 특히 화자 종속 과 화자 독립 음성인식 모두를 채용한 디지틀 휴대폰에서 음성인식 처리 속도를 증가 시킬뿐만 아니라, 음성인식 효율도 증가시킬 있음은 물론, 간편하게 두 모드중 한가지를 선택하여 전화를 할 수있어 사용상 편리한 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 관한 것이다.
일반적으로 음성인식기술은 컴퓨터와 음성을 통해 정보를 주고받는 음성기술의 한 형태이다. 음석인식은 선천적으로 다른 다양한 사람들의 음성을 인식하는 새로운 기술이다. 음성인식에는 두가지 종류의 인식 방법이 있는데, 이는 화자 종속 과 화자 독립 음성인식이다.
화자 종속음성인식은 특정인의 음성을 인식하는 방법으로 사전에 컴퓨터에 특정인의 음성을 훈련시켜 인식하는 방법이다. 음성인식 훈련은 특정인의 음성을 아날로그 음성으로 입력받아, 신호데이터로 변환하고, 이를 적당한 컴퓨터 명령에 대입시킨다. 실제로는 입력데이터와 저장된 사용자의 음성정보를 비교하여 가장 유사한 음성데이터를 찾아 해당 응답을 수행한다.
예를 들면, 최근에 디지틀 휴대폰에 채용된 화자인식방법을 말한다. 사용자가 "우리집" 또는 "엄마" , "아버지" 등 상대방 전화번호를 대표하는 명칭을 발성하면, 사전에 교육시켜 입력된 데이터와 비교하여 가장 유사한 데이터를 추출하여 해당 전화번호로 통화를 시도하는 방법이다.
화자독립음성인식 방법은 여러 사람의 음성중에 공통적으로 포함된 음성을 표현하는 복합 표준신호를 저장한 컴퓨터를 사용하여 수행하는 방법이다. 여기서 표준신호란 넓은 영역의 발음을 표현하는 신호 데이터의 여러 샘플로 부터 추출된 것이다. 실제 응용에선, 훈련되지 않은 음성과, 다양한 액센트등으로 음성인식을 처리하느데 화자종속에 비해 어렵다.
예를 들면, 실제 전화를 걸때, 입력하는 아라비아 숫자 자체를 음성인식하는 기술로 전화번호 860-5417이라하면 "팔육공 오사일칠"로 발음된 음성을 인식하는 방법으로 음성인식률은 화자종속에 비해 낮으나, 이용가치 측면에서는 유리하다.
음성인식의 응용분야로 기존 유선전화가 있다. 음성인식을 이용하면, 전화번호를 기억할 필요없고, 찾을 필요도 없고, 114에 문의할 필요도 없이 전화를 걸수 있다. 물론 손가락을 사용할 이유도 없다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 화자독립음성인식 기술과 화자종속독립음성인식 기술을 사용하여 필요에 따라 사용자가 이를 전환하여 사용함으로서, 프로그램 처리속도를 상당히 높여주는 역할을 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법 제공한 데 그 목적이 있다.
상술한 목적을 달성하기 위한 본 발명은 음성인식모드 시작신호로부터 화자독립버튼이 온 상태인지 여부를 확인하는 제 1단계와, 상기 확인결과, 버튼이 오프 상태이면 화자종속모드로 전환하여 음성의 끝점을 검출 하고, 음성 특징을 추출하는 제 2단계와, 상기 제 1단계의 확인결과 화자독립 버튼이 온 상태이면 화자독립모드로 전환하여 음성의 끝점검출을 하고, 음성특징을 추출 하는 제 3단계와, 상기 제 2단계로부터 추출된 음성을 화자종속모드의 기준 음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 4단계와, 상기 제 3단계로부터 추출된 음성을 화자독립모드의 기준음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 5단계와, 상기 제 4단계 및 상기 제5 단계로부터 계산된 결과에 따라 인식단어를 결정한 후 종료하는 제 7단계를 포함하여 이루어진 것을 특징으로 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법에 의하여 달성된다.
또한 종래의 기술은 화자독립 또는 화자종속음성인식중 하나만을 선택하여 인식할 수있었으나, 본발명에서는 두가지 모두들 사용할 경우에 있어서, 사용자가 키를 누르거나, 누르지않음에 따라, 화자종속음성인식이냐, 화자독립음성인식인가를 선택가능하게하여, 화자인식속도를 증가하는데 있다.
그리고 화자독립과 화자종속음성인식 모드 둘 다를 음성다이얼링으로 응용 할 경우, 화자 독립 또는 화자종속모드 두 모드를 연속적으로 처리하여야 한다. 따라서 본발명은 사용자가 화자인식모드를 간단히 버튼 입력에 의해 선택하여 서비스하는 방법으로, 이렇게 함으러서, 음성인식처리 속도를 증가시킬수 있고, 한가지 방법만을 사용해서 음성인식처리를 하므로, 인식효율을 증가시킬수 있다.
한편, 기술의 발전과 함께, 디지틀 휴대폰에 화자 종속 음성인식 기술뿐만 아니라, 화자 독립음성인식 기술이 도입되어 가고 있다. 따라서 본발명은 디지틀 휴대폰의 화자독립 및 화자종속 음성인식 방법의 절체를 간단한 방법으로 수행하여 화자독립인 경우와 화자 종속인 경우의 프로그램 경로를 분리하여 디지틀 휴대폰의 음성인식 속도를 배가하는 데 목적이 있다.
도 1은 기존 화자 독립 및 화자 종속을 모두 서비스하는 음성인식 CDMA휴대
폰의 블록 다이아그램.
도 2는 본발명의 화자독립음성인식버튼이 달린 휴대전화를 도시한 도면.
도 3은 본 발명에 의한 사용자 선택에 의한 음성인식 흐름도.
이하 첨부된 도면을 참조하여 본 발명을 설명하면 다음과 같다.
최근의 디지틀 휴대폰에 채용된 음성인식 방법은 화자종속 음성인식방법으로, 음성을 인식하기 위해서는 기본적으로 훈련이란 과정이 필요하다. 반면에 화자독립음성인식 방법은 훈련과정없이 음성을 인식하는 방법이다.
화자독립방식은 마이크를 통해입력된 음성신호가 입력되면, 디지탈화하여, 끝점을 검출한다. 그런후, 음성특징추출부에서 특징을 추출하여 거리및 유사도 계산부에서 미리저장되어 있는 기준음성신호부의 기준음성특징신호들과의 유사도를 계산한다.
도 1은 화자독립및 화자종속음성인식 처리에 대한 흐름도이다. 기존의 방법은 사용자의 음성을 우선 화자 독립 음식인식을 처리(2)한 후, 인식단어가 추출(4)되지 않으면, 화자 종속 음성인식처를 하거나, 순서를 바꾸어, 화자 종속음성 인식을 처리한후 화자 독립음성인식을 수행하여 인식단어를 검출한다.
도 2는 본발명의 화자독립음성인식버튼(20)이 달린 휴대전화를 도시한 도면으로서, 기존의 방식과는 달리 휴대폰의 측면에 화자독립선택버튼을 두어 사용자가 선택하도록 하였다.
도 3은 본 발명에 의한 사용자 선택에 의한 음성인식 흐름도로서, 음성인식모드루틴을 시작 (101)하면, 우선 화자독립버튼이 눌러졌는가 여부를 체크(102)한후, 버튼이 Off상태이면, 화자종속모드(103) 처리를 수행한다. 입력된 음성에서 끝점검출(104)과 음성특징 추출(105) 한 후, 화자종속모드 기준음성신호(107)와 비교하여 거리계산 및 유사도 계산(106)을 수행하여 가장 근접한 인식단어를 결정한다. 만약 화자독립버튼이 On상태이면 화자독립모드로 전환(109)한 후에 화자종속모드와 동일하게 끝점검출(110), 음성특징추출(111)의 순서로 처리한후 화자독립모드기준음성신호(113)와 비교하여 거리계산 및 유사도 계산(112)을 수행하여 인식단어(108)를 결정한다.
상술한 바와같이 본발명에 의한 사용자의 선택에 의해 화자독립 또는 화자종속 음성다이얼링을 할수 있는 방법에 의하여 다음과 같은 우수한 효과가 있다.
첫째,기존의 방법보다, 프로세싱시간을 절약할 수있어 음성인식 시간이 단축되는 효과가 있어, 사용자의 불편을 줄일수 있다.
둘째, 화자종속및 화자 독립모드로 2분화된 루틴을 거쳐 인식되므로 인식단어의 오류를 상당히 줄일수 있다.
셋째, 화자 종속 과 화자 독립 음성인식 모두를 채용한 디지틀 휴대폰에서 음성인식 처리 속도를 증가 시킬 수 있다.
넷째, 음성인식 효율도 증가시킬 수 있는 탁월한 효과가 있음은 물론, 사용자는 간편하게 두 모드중 한가지를 선택하여 전화를 할 수있어 사용상 편리하다.

Claims (1)

  1. 음성인식모드 시작신호로부터 화자독립버튼이 온 상태인지 여부를 확인하는 제 1단계와,
    상기 확인결과, 버튼이 오프 상태이면 화자종속모드로 전환하여 음성의 끝점을 검출하고, 음성 특징을 추출하는 제 2단계와,
    상기 제 1단계의 확인결과 화자독립 버튼이 온 상태이면 화자독립모드로 전환하여 음성의 끝점검출을 하고, 음성특징을 추출 하는 제 3단계와,
    상기 제 2단계로부터 추출된 음성을 화자종속모드의 기준 음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 4단계와,
    상기 제 3단계로부터 추출된 음성을 화자독립모드의 기준음성신호와 비교하여 거리계산 및 유사도 계산을 수행하는 제 5단계와,
    상기 제 4단계 및 상기 제5 단계로부터 계산된 결과에 따라 인식단어를 결정한 후 종료하는 제 7단계를 포함하여 이루어진 것을 특징으로 하는 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.
KR1019970072041A 1997-12-22 1997-12-22 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법. KR100250496B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970072041A KR100250496B1 (ko) 1997-12-22 1997-12-22 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970072041A KR100250496B1 (ko) 1997-12-22 1997-12-22 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.

Publications (2)

Publication Number Publication Date
KR19990052548A KR19990052548A (ko) 1999-07-15
KR100250496B1 true KR100250496B1 (ko) 2000-04-01

Family

ID=19528193

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970072041A KR100250496B1 (ko) 1997-12-22 1997-12-22 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.

Country Status (1)

Country Link
KR (1) KR100250496B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100423495B1 (ko) * 2001-06-21 2004-03-18 삼성전자주식회사 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100577990B1 (ko) * 1997-12-31 2006-08-30 엘지전자 주식회사 화자종속/독립음성인식장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100423495B1 (ko) * 2001-06-21 2004-03-18 삼성전자주식회사 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법

Also Published As

Publication number Publication date
KR19990052548A (ko) 1999-07-15

Similar Documents

Publication Publication Date Title
US9553979B2 (en) Bluetooth headset and voice interaction control thereof
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
CN100521708C (zh) 移动信息终端的语音识别与语音标签记录和调用方法
KR950015199A (ko) 음성 인식 방법 및 장치
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
CN107093425A (zh) 电力系统的语音导航系统、语音识别方法和语音交互方法
CA2221913A1 (en) Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US20010056345A1 (en) Method and system for speech recognition of the alphabet
KR100250496B1 (ko) 사용자의 선택에 의한 이동 단말기의 음성다이얼링 방법.
KR20010079734A (ko) 음성 다이얼링을 위한 방법 및 시스템
EP1316944B1 (en) Sound signal recognition system and method, and dialog control system and method using it
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
KR19980076309A (ko) 음성인식 방법 및 그 장치
KR100264852B1 (ko) 디지털휴대용전화기의음성인식장치및방법
JP2000122678A (ja) 音声認識機器制御装置
CN111274828A (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端
KR100214085B1 (ko) 음성 다이얼링 시스템에서 다수의 후보단어를 이용한 음성 다이얼링 방법
KR100827074B1 (ko) 이동 통신 단말기의 자동 다이얼링 장치 및 방법
KR100280873B1 (ko) 음성인식 시스템
JP2656234B2 (ja) 会話音声理解方法
KR950009425B1 (ko) 음성인식 전화기의 다이얼링 제어 방법
JPS61143798A (ja) 音声ダイヤル装置
KR100395222B1 (ko) 음성사서함서비스(브이엠에스)를 위한 음성인식시스템
JPH10198393A (ja) 会話記録装置
JPH01152851A (ja) 音声ダイアリング装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121206

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20131209

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20151228

Year of fee payment: 17

FPAY Annual fee payment

Payment date: 20161228

Year of fee payment: 18