KR100612882B1 - 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 - Google Patents
시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 Download PDFInfo
- Publication number
- KR100612882B1 KR100612882B1 KR1020040115069A KR20040115069A KR100612882B1 KR 100612882 B1 KR100612882 B1 KR 100612882B1 KR 1020040115069 A KR1020040115069 A KR 1020040115069A KR 20040115069 A KR20040115069 A KR 20040115069A KR 100612882 B1 KR100612882 B1 KR 100612882B1
- Authority
- KR
- South Korea
- Prior art keywords
- time
- alignment
- similarity
- feature
- signal
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
Abstract
Description
Claims (18)
- (a) 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징(feature) 및 시간 역방향 특징을 추출하는 단계;(b) 상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬(alignment) 및 시간 역방향 정렬을 생성하는 단계;(c) 상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도(likelihood)를 계산하는 단계; 및(d) 상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능 한 것으로 결정하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제1항에 있어서, 상기 (a) 단계는,(a1) 상기 입력 신호를 시간 역전하여 시간 역방향 신호를 생성하는 단계;(a2) 상기 입력 신호로부터 시간 정방향 특징을 추출하는 단계; 및(a3) 상기 시간 역방향 신호로부터 시간 역방향 특징을 추출하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제2항에 있어서, 상기 (a1) 단계는,상기 입력 신호를 소정의 역전 구간 길이 단위의 부분 신호들로 나누는 단계;상기 부분 신호들을 각각 시간 역전하는 단계; 및상기 시간 역전된 부분 신호들을 합쳐서 시간 역방향 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제3항에 있어서, 상기 역전 구간 길이는 40 msec 내지 60 msec인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제1항에 있어서, 상기 입력 신호는 음성 신호, 필기체 문자 신호, 또는 제스 쳐 신호인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제1항에 있어서, 상기 (b) 단계는,상기 시간 정방향 특징을 각 프레임 별로 시간 정방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 정방향 정렬을 생성하는 단계; 및상기 시간 역방향 특징을 각 프레임 별로 시간 역방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 역방향 정렬을 생성하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제6항에 있어서, 상기 (c) 단계는,(c1) 상기 시간 정방향 정렬에 대응하는 인식된 단어와 상기 시간 역방향 정렬에 대응하는 인식된 단어 간의 인식단어유사도를 계산하는 단계;(c2) 상기 시간 정방향 정렬과 상기 시간 역방향 정렬 간의 정렬유사도를 계산하는 단계;(c3) 상기 시간 정방향 정렬에 대응하는 특징들과 상기 시간 역방향 정렬에 대응하는 특징들 간의 특징유사도를 계산하는 단계; 및(c4) 상기 인식단어유사도, 정렬유사도, 및 특징유사도를 조합하여 상기 정방향 정렬과 상기 역방향 정렬 간의 전체 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제7항에 있어서, 상기 (c4) 단계는,상기 인식단어유사도, 정렬유사도, 및 특징유사도 각각에 소정의 가중치를 곱한 뒤 합산하여 가중합을 구하는 단계; 및상기 가중합을 상기 가중치들의 합으로 나누어 전체 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 제6항에 있어서, 상기 (c) 단계는,상기 시간 정방향 정렬 상의 프레임 별 스테이트와 상기 시간 역방향 정렬 상의 프레임 별 스테이트를 서로 비교하여 삽입, 삭제, 또는 치환된 것을 찾는 단계;상기 삽입, 삭제, 또는 치환된 스테이트에 대응하는 프레임의 수를 전체 프레임의 수에서 뺀 일치 프레임 수를 구하는 단계; 및상기 일치 프레임 수를 상기 전체 프레임 수로 나눈 비율을 유사도로 결정하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
- 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 특징추출부;상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 정렬생성부;상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 유사도계산부; 및상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 인식가능성결정부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제10항에 있어서, 상기 특징추출부는,상기 입력 신호를 시간 역전하여 시간 역방향 신호를 생성하는 신호역전부;상기 입력 신호로부터 상기 시간 정방향 특징으로 추출하는 정방향특징추출부; 및상기 시간 역방향 신호로부터 상기 시간 역방향 특징으로 추출하는 역방향특징추출부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제11항에 있어서, 상기 신호역전부는,상기 입력 신호를 소정의 역전 구간 길이 단위의 부분 신호들로 나누는 신호분리부;상기 부분 신호들을 각각 시간 역전하는 부분신호역전부; 및상기 시간 역전된 부분 신호들을 합쳐서 시간 역방향 신호를 생성하는 부분신호합성부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제12항에 있어서, 상기 역전 구간 길이는 40 msec 내지 60 msec인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제10항에 있어서, 상기 입력 신호는 음성 신호, 필기체 문자 신호, 또는 제스쳐 신호인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제10항에 있어서, 상기 정렬생성부는,상기 시간 정방향 특징을 각 프레임 별로 시간 정방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 정방향 정렬을 생성하는 정방향정렬생성부; 및상기 시간 역방향 특징으로 각 프레임 별로 시간 역방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 역방향 정렬을 생성하는 역방향정렬생성부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제15항에 있어서, 상기 유사도계산부는,상기 시간 정방향 정렬에 대응하는 인식된 단어와 상기 시간 역방향 정렬에 대응하는 인식된 단어 간의 인식단어유사도를 계산하는 인식단어유사도계산부;상기 시간 정방향 정렬과 상기 시간 역방향 정렬 간의 정렬유사도를 계산하는 정렬유사도계산부;상기 시간 정방향 정렬에 대응하는 특징들과 상기 시간 역방향 정렬에 대응하는 특징들 간의 특징유사도를 계산하는 특징유사도계산부; 및상기 인식단어유사도, 정렬유사도, 및 특징유사도를 조합하여 상기 정방향 정렬과 상기 역방향 정렬 간의 전체 유사도를 계산하는 유사도조합부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 제15항에 있어서, 상기 유사도계산부는,상기 시간 정방향 정렬 상의 프레임 별 스테이트와 상기 시간 역방향 정렬 상의 프레임 별 스테이트를 서로 비교하여 삽입, 삭제, 또는 치환된 것을 찾는 불일치스테이트검색부;상기 삽입, 삭제, 또는 치환된 스테이트에 대응하는 프레임의 수를 전체 프레임의 수에서 뺀 일치 프레임 수를 구하는 일치프레임수계산부; 및상기 일치 프레임 수를 상기 전체 프레임 수로 나눈 비율을 유사도로 결정하는 비율계산부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
- 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 단계;상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 단계;상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 단계; 및상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040115069A KR100612882B1 (ko) | 2004-12-29 | 2004-12-29 | 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 |
US11/263,826 US7603274B2 (en) | 2004-12-29 | 2005-11-02 | Method and apparatus for determining the possibility of pattern recognition of time series signal |
JP2005378933A JP5026700B2 (ja) | 2004-12-29 | 2005-12-28 | 時系列信号のパターン認識可能性の判断方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040115069A KR100612882B1 (ko) | 2004-12-29 | 2004-12-29 | 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060076595A KR20060076595A (ko) | 2006-07-04 |
KR100612882B1 true KR100612882B1 (ko) | 2006-08-14 |
Family
ID=36612881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040115069A KR100612882B1 (ko) | 2004-12-29 | 2004-12-29 | 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7603274B2 (ko) |
JP (1) | JP5026700B2 (ko) |
KR (1) | KR100612882B1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5037018B2 (ja) * | 2006-01-31 | 2012-09-26 | ヤマハ発動機株式会社 | 音声認識装置および音声認識方法 |
US8041571B2 (en) * | 2007-01-05 | 2011-10-18 | International Business Machines Corporation | Application of speech and speaker recognition tools to fault detection in electrical circuits |
US11244224B2 (en) | 2018-03-20 | 2022-02-08 | International Business Machines Corporation | Comparing time series data using context-based similarity |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990062566A (ko) * | 1997-12-16 | 1999-07-26 | 포만 제프리 엘 | 음성 인식 신뢰도 레벨 디스플레이 |
KR19990084984A (ko) * | 1998-05-13 | 1999-12-06 | 이계철 | 음성인식률 측정장치 및 그 방법 |
JP2000148185A (ja) | 1998-11-13 | 2000-05-26 | Matsushita Electric Ind Co Ltd | 認識装置及び認識方法 |
JP2003108187A (ja) | 2001-09-28 | 2003-04-11 | Fujitsu Ltd | 類似性評価方法及び類似性評価プログラム |
JP2004271596A (ja) | 2003-03-05 | 2004-09-30 | Advanced Media Inc | 音声認識システム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5502774A (en) * | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
JP3311467B2 (ja) * | 1994-03-10 | 2002-08-05 | 富士通株式会社 | 音声認識システム |
US5627859A (en) * | 1994-07-11 | 1997-05-06 | Huges Electronics | Time-reversed infinite impulse response digital filtering |
US5832430A (en) * | 1994-12-29 | 1998-11-03 | Lucent Technologies, Inc. | Devices and methods for speech recognition of vocabulary words with simultaneous detection and verification |
US5675706A (en) * | 1995-03-31 | 1997-10-07 | Lucent Technologies Inc. | Vocabulary independent discriminative utterance verification for non-keyword rejection in subword based speech recognition |
US5717826A (en) * | 1995-08-11 | 1998-02-10 | Lucent Technologies Inc. | Utterance verification using word based minimum verification error training for recognizing a keyboard string |
JPH09212190A (ja) * | 1996-02-02 | 1997-08-15 | Oki Electric Ind Co Ltd | 音声認識装置及び文認識装置 |
US6125345A (en) * | 1997-09-19 | 2000-09-26 | At&T Corporation | Method and apparatus for discriminative utterance verification using multiple confidence measures |
US5987411A (en) * | 1997-12-17 | 1999-11-16 | Northern Telecom Limited | Recognition system for determining whether speech is confusing or inconsistent |
KR20010024521A (ko) * | 1998-08-17 | 2001-03-26 | 이데이 노부유끼 | 음성 인식 장치 및 방법, 내비게이션 장치, 휴대 전화장치 및 정보 처리 장치 |
US6542866B1 (en) * | 1999-09-22 | 2003-04-01 | Microsoft Corporation | Speech recognition method and apparatus utilizing multiple feature streams |
US20060074664A1 (en) * | 2000-01-10 | 2006-04-06 | Lam Kwok L | System and method for utterance verification of chinese long and short keywords |
US6629075B1 (en) * | 2000-06-09 | 2003-09-30 | Speechworks International, Inc. | Load-adjusted speech recogintion |
JP2002189487A (ja) * | 2000-12-20 | 2002-07-05 | Mitsubishi Electric Corp | 音声認識装置および音声認識方法 |
EP1364356A1 (en) * | 2001-02-02 | 2003-11-26 | Wisconsin Alumni Research Foundation | Method and system for testing speech intelligibility in children |
TWI223791B (en) * | 2003-04-14 | 2004-11-11 | Ind Tech Res Inst | Method and system for utterance verification |
JP2005134436A (ja) * | 2003-10-28 | 2005-05-26 | Nissan Motor Co Ltd | 音声認識装置 |
US20050216260A1 (en) * | 2004-03-26 | 2005-09-29 | Intel Corporation | Method and apparatus for evaluating speech quality |
JP5037018B2 (ja) * | 2006-01-31 | 2012-09-26 | ヤマハ発動機株式会社 | 音声認識装置および音声認識方法 |
JP2011215291A (ja) * | 2010-03-31 | 2011-10-27 | Aisin Aw Co Ltd | 音声認識装置及びプログラム |
-
2004
- 2004-12-29 KR KR1020040115069A patent/KR100612882B1/ko not_active IP Right Cessation
-
2005
- 2005-11-02 US US11/263,826 patent/US7603274B2/en not_active Expired - Fee Related
- 2005-12-28 JP JP2005378933A patent/JP5026700B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990062566A (ko) * | 1997-12-16 | 1999-07-26 | 포만 제프리 엘 | 음성 인식 신뢰도 레벨 디스플레이 |
KR19990084984A (ko) * | 1998-05-13 | 1999-12-06 | 이계철 | 음성인식률 측정장치 및 그 방법 |
JP2000148185A (ja) | 1998-11-13 | 2000-05-26 | Matsushita Electric Ind Co Ltd | 認識装置及び認識方法 |
JP2003108187A (ja) | 2001-09-28 | 2003-04-11 | Fujitsu Ltd | 類似性評価方法及び類似性評価プログラム |
JP2004271596A (ja) | 2003-03-05 | 2004-09-30 | Advanced Media Inc | 音声認識システム |
Also Published As
Publication number | Publication date |
---|---|
JP2006189862A (ja) | 2006-07-20 |
US20060143005A1 (en) | 2006-06-29 |
US7603274B2 (en) | 2009-10-13 |
JP5026700B2 (ja) | 2012-09-12 |
KR20060076595A (ko) | 2006-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10699699B2 (en) | Constructing speech decoding network for numeric speech recognition | |
US8255215B2 (en) | Method and apparatus for locating speech keyword and speech recognition system | |
CN109036391B (zh) | 语音识别方法、装置及系统 | |
US5621809A (en) | Computer program product for automatic recognition of a consistent message using multiple complimentary sources of information | |
Wöllmer et al. | A multidimensional dynamic time warping algorithm for efficient multimodal fusion of asynchronous data streams | |
JP3886024B2 (ja) | 音声認識装置及びそれを用いた情報処理装置 | |
US20140172428A1 (en) | Method and apparatus for context independent gender recognition utilizing phoneme transition probability | |
KR101696555B1 (ko) | 영상 또는 지리 정보에서 음성 인식을 통한 텍스트 위치 탐색 시스템 및 그 방법 | |
US20020173953A1 (en) | Method and apparatus for removing noise from feature vectors | |
Sahoo et al. | Emotion recognition from audio-visual data using rule based decision level fusion | |
CN107093422B (zh) | 一种语音识别方法和语音识别系统 | |
KR101496876B1 (ko) | 휴대 단말기의 소리 인식 방법 및 장치 | |
Hienz et al. | HMM-based continuous sign language recognition using stochastic grammars | |
Kaynak et al. | Audio-visual modeling for bimodal speech recognition | |
CN104103280A (zh) | 基于动态时间归整算法的离线语音端点检测的方法和装置 | |
Kim et al. | Robust DTW-based recognition algorithm for hand-held consumer devices | |
KR100612882B1 (ko) | 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치 | |
US6678658B1 (en) | Speech processing using conditional observable maximum likelihood continuity mapping | |
KR20150035312A (ko) | 음성에 기반한 잠금 해제를 수행하는 사용자 장치, 음성에 기반한 사용자 장치의 잠금 해제 방법 및 컴퓨터 프로그램이 기록된 기록매체 | |
Luettin et al. | Learning to recognise talking faces | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
Lucey | An evaluation of visual speech features for the tasks of speech and speaker recognition | |
da Silva et al. | Speaker-independent embedded speech recognition using Hidden Markov Models | |
KR20020045960A (ko) | 음성인식에서 핵심어 검출 성능 개선 방법 | |
Gorniak et al. | Augmenting user interfaces with adaptive speech commands |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120716 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20130724 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140721 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150716 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160724 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170726 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |