KR960704299A - 신호해석장치 - Google Patents
신호해석장치Info
- Publication number
- KR960704299A KR960704299A KR1019960700535A KR19960700535A KR960704299A KR 960704299 A KR960704299 A KR 960704299A KR 1019960700535 A KR1019960700535 A KR 1019960700535A KR 19960700535 A KR19960700535 A KR 19960700535A KR 960704299 A KR960704299 A KR 960704299A
- Authority
- KR
- South Korea
- Prior art keywords
- cluster
- vector
- velocity
- similarity
- ear
- Prior art date
Links
- 239000013598 vector Substances 0.000 claims abstract 65
- 238000000034 method Methods 0.000 claims 13
- 230000001186 cumulative effect Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
적은 계산량이고, 정밀도 좋은 워드스폿팅이 가능한 HMM 장치, DP 매칭장치를 제공하는 것, 이를 위하여 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북을 구비하고, HMM에 있어서는 각 상태에서의 상기 클러스터 발생확률의 분포와, 인식해야할 입력특징벡터의 상기 각 클러스터에 대한 귀속도의 Kullback-Leibler Divergence에 기초한 유사도를 상기 특징벡터의 상기 상태에서의 발생정도로 하고, DP매칭에 있어서는 표준패턴을 형성하는 특징벡터의 상기 각 클러스터에 대한 귀속도의 분포와 입력특징벡터의 상기 각 클러스터에 대한 귀속도의 Kullback-Leibler Divergence에 기초한 유사도를 상기 입력패턴의 프레임과 대응하는 표준패턴 프레임의 프레임간 유사도로 하는 구성이다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
Claims (30)
- 해석의 대상으로 하는 시스템은 복수의 상태를 취하게 하고, 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형태로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉, 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률 기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉, 상기 각 클러스터의 이 관측벡터에 대한 사후 확률)를 산출하는 귀속도산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터의 귀속도와 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터의 발생확률 대수값의 적화 또는 그것에 등가한 량을 산출하고, 관측벡터의 상기 시스템의 각 상태에서의 발생정도를 산출하는 관측벡터 발생정도 산출수단을 구비하고, 상기 클러스터 발생확률 기억수단은 클러스터의 발생확률이 제 N+1위 이하로 되는 클러스터에 대한 발생확률은 0이 아닌 공통의 값으로 되고, 클러스터 발생확률의 총계가 1로 되도록 산출되고 있는 것을 특징으로 하는 신호해석장치.
- 제1항에 있어서, 귀속도산출수단은 귀속도가 제 K+1위 이하가 되는 클러스터에 대한 귀속도는 0으로 되고, 귀속도의 총계가 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
- 해석의 대상으로 하는 시스템은 복수의 상태를 취하게 하고, 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률 기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉 상기 각 클러스터의 이 관측벡터에 대한 사후 확률)를 산출하는 귀속도산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터 귀속도의 대수값과 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터 발생확률의 적화 또는 거기에 등가한 양을 산출하고, 관측벡터의 상기 시스템의 각 상태에 있어서 발생정도를 산출하는 관측벡터 발생정도 산출수단을 구비한 것을 특징으로 하는 신호해석장치.
- 제3항에 있어서, 각 상태에 있어서 클러스터 발생확률 기억수단을 미리 정한 N에 대해 그 확률이 상위 N까지의 클러스터에 대해서는 그 총합이 1로 되도록 산출한 것을 기억하고, 다른 클러스터의 발생확률은 0으로 하는 것을 특징으로 하는 신호해석장치.
- 제3항에 있어서, 귀속도산출수단은 관축벡터의 각 클러스터에 대한 귀속도를 그 귀속도가 제 K+1위 이하인 것은 0이 아닌 공통의 값으로 하고, 귀속도의총합이 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
- 제1항 또는 제3항에 있어서, 각 상태는 숨은 마르코프모델의 각 상태인 것을 특징으로 하는 신호해석장치.
- 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉 상기 각 클러스터의 이 관측벡터에 대한 사후확률)을 산출하는 귀속도 산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터의 귀속도와, 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터 발생확률의 대수값의 적화 또는 그것에 등가한 양을 산출하고, 관측벡터의 상기 시스템의 각 상태에 있어서 발생정도를 산출하는 관측벡터발생정도 산출수단을 구비하고, 상기 각 상태에 있어서 상기 각 클러스터 발생확률의 추정은 상기 관측벡터 발생정도 산출수단을 이용하여 계산하고, 인식시는 상기 관측벡터의 귀속도를 최대의 귀속도는 1로 하고, 다른 귀속도는 모두 0으로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
- 특징벡터가 분류되어야 할 클러스터 기억수단과, 비교해야 할 벡터 x, y에 대해 이 각 벡터의 상기 각 클러스터로의 귀속도 혹은상기 각 클러스터의 상기 각 벡터에 대한 사후확률(양쪽 포함시켜 이후 귀속도라 함)을 산출하고, 상기 각 벡터의 각 클러스터에 대한 귀속도를 요소로 하는 귀속도벡터 a, b를 산출하는 귀속도 산출수단과, 이 귀속도벡터끼리의 거리 또는 유사도를 산출하는 유사도 산출수단을 구비하고, 이 거리 또는 유사도로써 상기 특징벡터 y와 z의 거리 또는 유사도로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 특징벡터가 분류되어야 할 클러스터 기억수단과, 상기 벡터계열인 각 벡터의 상기 각 클러스터로의 귀속도를 산출하고, 상기 벡터의 각 클러스터에 대한 귀속도를 요소로 하는 귀속도벡터를 산출하는 귀속도산출수단과, 조합되어야 할 인식단위를 마찬가지로 귀속도벡터열로 표현한 표준패턴 기억수단과, 상기 귀속도산출수단의 출력으로서 얻어지는 귀속도벡터열로 구성되는 입력패턴과 상기 표준패턴의 매칭을 행하는 매칭수단을 구비하고, 이 매칭의 결과, 입력패턴과 표준패턴의 유사도 혹은 거리를 계산하는 것을 특징으로 하는 신호해석장치.
- 제9항에 있어서, 입력패턴 혹은 표준패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축을 선형 도는 비선형으로 압축하고, 양 패턴의 시간축을 맞추고, 서로 대응하는 귀속도벡터끼리의 거리 또는 유사도를 계산하는 유사도 산출수단과, 이 거리 또는 유사도를 상기 입력 패턴 혹은 표준 패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축에 따라 상기 거리 또는 유사도를 누적하는 누적유사도 산출수단을 구비하고, 이 누적값으로써 상기 입력패턴과 표준패턴의 거리 또는 유사도로 하는 것임을 특징으로 하는 신호해석장치.
- 제9항에 있어서, 귀속도벡터끼리의 귀속도 또는 유사도를 계산하는 유사도산출수단과, 입력패턴을 구성하는 귀속도벡터의 각각과, 상기 입력패턴과 매칭해야 할 표준패턴을 구성하는 귀속도벡터의 각각을, 양 패턴의 대응시킨 귀속도벡터끼리의 유사도의 상기 입력패턴 혹은 표준패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축에 따라 누적한 누적값이 최소 또는 최대로 되도록 최적으로 대응시키고, 그 최대값을 산출하는 동적계화수단을 구비한 것을 특징으로 하는 신호해석장치.
- 거리 또는 유사도를 계산하는 유사도 산출수단은 거리 또는 유사도를 산출해야 할 2개의 귀속도벡터를 각각 a=(a, …, aM), B=(b1, …, bM)으로 할 때, 다음의어느 하나 또는 그들과 등가인 양으로서 거리 또는 유사도를 산출하는 것을 특징으로 하는 신호해석장치.(식1)다만, C는 C>0 되는 정수.
- 제11항에 있어서, 입력패턴의 프레임 t에 대응하는 귀속도벡터를 at=a(at1, …, atM), 표준패턴의 프레임 j에 대응하는 귀속도벡터를 bj=(bj1, …, bjM), 상기 매칭경로상의 k번째의 (t, j) 좌표를 x(k)=(t(k), j(k), x(k)에 있어서 가중계수를 w(x(k))로 할 때,(식2)또는을 at(k)와 bj(k)의 유사도로 하고, 벡터계열 at(1), …, at(k)와 bj(1), …, bj(k)의 상기 경로에 따른 누적 유사도를(식3)또는로 하는 것으로서, 1≤n≤k-1에 대해 t(k)-t(k-n)=1일 때, w(x(k-n+1))+…+w(x(k))=1인 것을 특징으로 하는 신호해석장치.
- 제13항에 있어서, 매칭경로는 t(k)-t(k-1)=1, w(x(k))=1인 것을 특징으로 하는 신호해석장치.
- 제13항에 있어서, 매칭경로는 x(k)=(t, j), k-1≥n≥1에 대해, (1) x(k-1)=(t-1, j-n) 또는 x(k-1)=(t-1, j), (2) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t-1, j), m=2, …, n에 대해서는 x(k-m)=(t-1, j-m), (3) m=1, …, n-1에 대해, x(k-m)=(t, j-m), x(k-n)=(t-1,j-n), (4)m=1, …, n-1에 대해 x(k-m)=(t, i-m), x(k-n)=(t-1, j-n) (5) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t-1, j), m=2, …, n에 대해서는 x(k-m)=(t-1, j-m)의 어느 하나를 포함하고, 경로(1)에 대해서는 w(x(k))=1, 경로(2)에 대해서는 w(x(k))=1, w(x(k-m+1))=0, 경로 (3)에 대해서는 w(x(k-m+1))=0, w(x(k-n+1))=1, 경로 (4)(5)에 대해서는 w(x-k-m+1)=1/n으로 하는 것을 특징으로 하는 신호해석장치.
- 제11항에 있어서, 거리 또는 유사도를 계산하는 유사도 산출수단은 입력패턴의 프레임 t에 대응하는 귀속도벡터를 at=a(at1, …, atM), 표준패턴의 프레임 j에 대응하는 귀속도벡터를 bj=(bj1, …, bjM), 상기 매칭경로상의 k번째의 (t, j) 좌표를 x(k)=(t(k), j(k), x(k)에 있어서 가중계수를 w(x(k))로 할 때,(식4)또는를 at(k)와 bj(k)의 유사도로 하고, 벡터계열 at(1), …, at(k)와 bj(1), …, bj(k)의 상기 경로에 따른 유사도를(식5)또는로 하는 것으로서, 1≤n≤k-1에 대해 j(k)-j(k-n)=1일 때, w(x(k-1+1))+…+w(x(k))=1인 것을 특징으로 하는 신호해석장치.
- 제16항에 있어서, 매칭경로는 j(k)-j(k-1)=1, w(x(k))=1인 것을 특징으로 하는 신호해석장치.
- 제16항에 있어서,매칭경로는 x(k)=(t, j), k-1≥n≥1에 대해, (1) x(k-1)=(t-n, j-1) 또는 x(k-1)=(t, j-1), (2) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t, j-1), m=2, …, n에 대해서는 x(k-m)=(t-m, j-m), (3) m=1, …, n-1에 대해, x(k-m)=(t-m, j), x(k-n)=(t-n, j-1), (4) m=1, …, n-1에 대해 x(k-m)=(t-m, j), x(k-n)=(t-n, j-1)(5) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t, j-1), m=2, …, n에 대해서는 x(k-m)=(t-m, j-1)의 어느 하나를 포함하고, 경로(1)에 대해서는 w(x(k))=1, 경로(2)에 대해서는 w(x(k))=1, w(x(k-m+1))=0, 경로(3)에 대해서는 w(x(k-m+1))=0, w(x(k-n+1))=1, 경로 (4)(5)에 대해서는 w(x-(k-m+1)=1/n으로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 표준패턴 프레임 j의 특징벡터의 클러스터 m으로서의 귀속도를 bjm, 클러스터수를 M으로 할 때, bji, …, bjm중에서 크기 순서로 된 N개의 bj g(j, 1), bj g(i, 2,)…, bj, g(j, N), (g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)은 그대로의 값, 나머지는 일정값 b0에서 bj, g(j, 1)+…bj, g(j, N)+b0(M-N)=1로 되도록 산출한 값, 또는 각각의 대수값 log bj, g(j, 1), log bj,g(j, 2),…, log bj, g(j, N), log b0의 형으로 기억하는 표준패턴 기억수단을 구비한 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 표준패턴 프레임 j의 특징벡터의 클러스터 m으로서의 귀속도를 bjm, 클러스터수를 M으로 할 때, bji, …, bjm중에서 크기 순서로 된 N개의 bj g(j, 1), bj g(i, 2,)…, bj, g(j, N), (g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)은 bj g(j, 1)+…+bj, g(j, n)=1로 되도록 산출한 값, 나머지는 bj,g(j, N+1)=…=bj, g(j, M)=0으로서 기억하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 입력패턴 프레임 t의 특징벡터 yt의 클러스터 m으로의 귀속도를 utm, 클러스터 M으로 할 때, yt가 변환되어야 할 귀속도벡터를 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t, 1),ut, h(t,2), …,ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)은 그대로의 값, 나머지는 일정값 u0에서 ut, h(t, 1)+…+ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값으로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 입력패턴 프레임 t의 특징벡터 yt의 클러스터 m으로의 귀속도를 utm, 클러스터수를 M으로 할 때, yt가 변환되어야 할 귀속도벡터를 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t, 1), h(t, 2), …,ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)은 ut, h(t, 1)+…+ut, h(t, K)=1로 되도록 산출한 값, 나머지는 ut, h(t, K+1)=…ut, h(t, M)=0으로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 bj1, …biM중에서 크기 순서로 된 N개의 bj, g(j, 1), bj, g(j, 2), …, bj, g(j, N)(g(j, n)은 표준패턴의 프레임 j에 있어서 n번째로 큰 클러스터의 라벨, N≤M)과, bj, g(j, 1)+…+bj, g(j, N)+b0(M-N)=1이 되도록 산출한 값 b0과, 모든 클러스터에 대해 산출된 utm, 또는 ut1, …, utM중에서 크기 순서로 대응하여 ut, h(t, 1)+…ut, h(t, k)=1로 되도록 산출한 K개의 ut, h(t, 1),ut, h(t, 2), …, ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)에 대해,(식6)또는로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 bj1, …biM중에서 크기 순서로 대응하여 bj, g(j, 1),+bj, g(j, 2), …bj, g(j, N)(g(j, n)은 표준패턴의 프레임 j에 있어서 n번째로 큰 클러스터의 라벨, N≤M)과, 모든 클러스터에 대해 산출된 utm, 또는 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t,1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴의 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)과, ut, h(t, 1), ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값 u0에 대해,(식7)또는로 하는 것을 특징으로 하는 신호해석장치.
- 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 모든 클러스터에 대한 산출된 utm, 또는 bj1, …, bjM중에서 크기 순서로 대응하여 bj, g(j, 1)+…+bj, g(j, N)=1로 되도록 산출한 N개의 bj, g(j, 1), bj, g(j, 2), …, bj,g(j, N)(g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)과, ut1, …, utm중에서 크기 순서로 된 K개의 ut, h(t, 1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴 프레임 t에 있어서 k번째로 큰 클러스터의 라벨, K≤M)과, ut, h(t, 1)+…+ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값 u0에 대해,(식8)또는로 하는 것을 특징으로 하는 신호해석장치
- 제1항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 모든 클러스터에 대해 산출된 utm, 또는 bj1, …bjM 중에서 크기 순서로 된 N개의 bj, g(j, 1), bj, g(j, 2), …, bj,g(j, N)(g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)과, bj, g(j, 1)+…+bj, g(j, N)+b0(M-N)=1이 되도록 산출된 b|0과, ut1, …, utm중에서 크기 순서로 대응하여, ut, h(t, 1)+…+ut, h(t, K)=1이 되도록 산출한 값 k의 ut, h(t, 1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴 프레임 t에 서 k번째로 큰 클러스터의 라벨, K≤M)에 대해,(식9)또는로 하는 것을 특징으로 하는 신호해석장치.
- 제5항 또는 제9항에 있어서, 귀속도는 그들 귀속도를 산출해야 할 벡터와 각 클러스터의 대표벡터와의 거리에서 산출하는 것이고, 그 거리가 작은 것부터 순서대로 전자의 경우는 상기 K, 후자의 경우는 상기 N까지의 것에 대해서는 그들의 거리를 그대로 이용하고, 그 순위가 K+1또는 N+1 이하의 클러스터에 대해서는 공통 값을 이용하여 귀속도를 산출하는 것을 특징으로 하는 신호해석장치.
- 제27항에 있어서, 공통값은 상기 K+1 또는 상기 N+1 이하 순위의 클러스터에 대해서는 각 클러스터에 대한 거리의 평균으로 하는 것을 특징으로 하는 신호해석장치.
- 제27항에 있어서, 공통값은 상기 K+1 또는 상기 K+1 이하 순위의 클러스터에 대해서는 최소의 거리와 최대 거리의 평균으로 하는 것을 특징으로 하는 신호해석장치.
- 제5항 또는 제19항에 있어서, 귀속도는 귀속도를 산출해야 할 관측벡터와 각 클러스터의 대표벡터와의 거리와 작은 것부터 K+1위 또는 N+1위 이하의 클러스터에 대해서는 미리 정한 1/K 또는 1/N 이하의 일정값으로 하고, 거리의 작은 것부터 차례로 K 또는 N 클러스터에 대해서는 그들 개개의 거리와 상기 일정값에서 귀속도의 총합이 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13002394 | 1994-06-13 | ||
JP94-130023 | 1994-06-13 | ||
JP95-102665 | 1995-04-26 | ||
JP10266595 | 1995-04-26 | ||
PCT/JP1995/001154 WO1995034884A1 (fr) | 1994-06-13 | 1995-06-09 | Analyseur de signaux |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960704299A true KR960704299A (ko) | 1996-08-31 |
KR100324988B1 KR100324988B1 (ko) | 2002-08-27 |
Family
ID=26443348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960700535A KR100324988B1 (ko) | 1994-06-13 | 1995-06-09 | 신호해석장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6061652A (ko) |
KR (1) | KR100324988B1 (ko) |
CN (1) | CN1159704C (ko) |
WO (1) | WO1995034884A1 (ko) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3090119B2 (ja) * | 1998-05-15 | 2000-09-18 | 日本電気株式会社 | 話者照合装置、方法及び記憶媒体 |
US6216134B1 (en) | 1998-06-25 | 2001-04-10 | Microsoft Corporation | Method and system for visualization of clusters and classifications |
US6742003B2 (en) | 2001-04-30 | 2004-05-25 | Microsoft Corporation | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
US6219642B1 (en) * | 1998-10-05 | 2001-04-17 | Legerity, Inc. | Quantization using frequency and mean compensated frequency input data for robust speech recognition |
US6347297B1 (en) * | 1998-10-05 | 2002-02-12 | Legerity, Inc. | Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition |
KR100729316B1 (ko) * | 1998-10-09 | 2007-06-19 | 소니 가부시끼 가이샤 | 학습 장치 및 학습 방법, 인식 장치 및 인식 방법, 및기록 매체 |
US7263484B1 (en) * | 2000-03-04 | 2007-08-28 | Georgia Tech Research Corporation | Phonetic searching |
US6720984B1 (en) | 2000-06-13 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Characterization of bioelectric potentials |
EP2302580A1 (en) * | 2001-10-13 | 2011-03-30 | Superderivatives Inc | Method and system for pricing financial derivatives |
DE60225536T2 (de) * | 2002-06-04 | 2009-04-23 | Intellectual Ventures Fund 21 LLC, Carson City | Verfahren und Vorrichtung zur Spracherkennung |
US7076427B2 (en) * | 2002-10-18 | 2006-07-11 | Ser Solutions, Inc. | Methods and apparatus for audio data monitoring and evaluation using speech recognition |
US8055503B2 (en) * | 2002-10-18 | 2011-11-08 | Siemens Enterprise Communications, Inc. | Methods and apparatus for audio data analysis and data mining using speech recognition |
US7133828B2 (en) * | 2002-10-18 | 2006-11-07 | Ser Solutions, Inc. | Methods and apparatus for audio data analysis and data mining using speech recognition |
EP1576580B1 (en) * | 2002-12-23 | 2012-02-08 | LOQUENDO SpA | Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames |
US7904296B2 (en) * | 2003-07-23 | 2011-03-08 | Nexidia Inc. | Spoken word spotting queries |
US8170873B1 (en) * | 2003-07-23 | 2012-05-01 | Nexidia Inc. | Comparing events in word spotting |
US7245767B2 (en) * | 2003-08-21 | 2007-07-17 | Hewlett-Packard Development Company, L.P. | Method and apparatus for object identification, classification or verification |
US7584101B2 (en) * | 2003-08-22 | 2009-09-01 | Ser Solutions, Inc. | System for and method of automated quality monitoring |
KR20050054706A (ko) * | 2003-12-05 | 2005-06-10 | 엘지전자 주식회사 | 음성인식을 위한 어휘 트리 구축 방법 |
US7970613B2 (en) | 2005-11-12 | 2011-06-28 | Sony Computer Entertainment Inc. | Method and system for Gaussian probability data bit reduction and computation |
US8010358B2 (en) * | 2006-02-21 | 2011-08-30 | Sony Computer Entertainment Inc. | Voice recognition with parallel gender and age normalization |
US7778831B2 (en) * | 2006-02-21 | 2010-08-17 | Sony Computer Entertainment Inc. | Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch |
JP4745094B2 (ja) * | 2006-03-20 | 2011-08-10 | 富士通株式会社 | クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム |
TWI312945B (en) * | 2006-06-07 | 2009-08-01 | Ind Tech Res Inst | Method and apparatus for multimedia data management |
US8234116B2 (en) * | 2006-08-22 | 2012-07-31 | Microsoft Corporation | Calculating cost measures between HMM acoustic models |
CN101154379B (zh) * | 2006-09-27 | 2011-11-23 | 夏普株式会社 | 定位语音中的关键词的方法和设备以及语音识别系统 |
CN100552664C (zh) * | 2006-10-20 | 2009-10-21 | 东芝泰格有限公司 | 模式匹配装置以及方法 |
US20080243503A1 (en) * | 2007-03-30 | 2008-10-02 | Microsoft Corporation | Minimum divergence based discriminative training for pattern recognition |
US8442833B2 (en) * | 2009-02-17 | 2013-05-14 | Sony Computer Entertainment Inc. | Speech processing with source location estimation using signals from two or more microphones |
US8788256B2 (en) * | 2009-02-17 | 2014-07-22 | Sony Computer Entertainment Inc. | Multiple language voice recognition |
US8442829B2 (en) * | 2009-02-17 | 2013-05-14 | Sony Computer Entertainment Inc. | Automatic computation streaming partition for voice recognition on multiple processors with limited memory |
US8700399B2 (en) * | 2009-07-06 | 2014-04-15 | Sensory, Inc. | Systems and methods for hands-free voice control and voice search |
KR101092820B1 (ko) * | 2009-09-22 | 2011-12-12 | 현대자동차주식회사 | 립리딩과 음성 인식 통합 멀티모달 인터페이스 시스템 |
JP2011221688A (ja) * | 2010-04-07 | 2011-11-04 | Sony Corp | 認識装置、認識方法、およびプログラム |
JP5258915B2 (ja) * | 2011-02-28 | 2013-08-07 | 株式会社デンソーアイティーラボラトリ | 特徴変換装置、それを含む類似情報探索装置、コード化パラメータ生成方法、及びコンピュータ・プログラム |
CN105355214A (zh) * | 2011-08-19 | 2016-02-24 | 杜比实验室特许公司 | 测量相似度的方法和设备 |
US9153235B2 (en) | 2012-04-09 | 2015-10-06 | Sony Computer Entertainment Inc. | Text dependent speaker recognition with long-term feature based on functional data analysis |
US9053579B2 (en) * | 2012-06-19 | 2015-06-09 | Palo Alto Research Center Incorporated | Selective learning for growing a graph lattice |
US8831339B2 (en) | 2012-06-19 | 2014-09-09 | Palo Alto Research Center Incorporated | Weighted feature voting for classification using a graph lattice |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN105989849B (zh) * | 2015-06-03 | 2019-12-03 | 乐融致新电子科技(天津)有限公司 | 一种语音增强方法、语音识别方法、聚类方法及装置 |
US11429890B2 (en) * | 2017-10-30 | 2022-08-30 | Bank Of America Corporation | Dynamic pattern recognition and data reconciliation |
US11256869B2 (en) * | 2018-09-06 | 2022-02-22 | Lg Electronics Inc. | Word vector correction method |
WO2021152838A1 (en) * | 2020-01-31 | 2021-08-05 | Nec Corporation | Speech embedding apparatus, and method |
CN115398437A (zh) | 2020-03-30 | 2022-11-25 | 甲骨文国际公司 | 改进的域外(ood)检测技术 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4570232A (en) * | 1981-12-21 | 1986-02-11 | Nippon Telegraph & Telephone Public Corporation | Speech recognition apparatus |
JPS62231993A (ja) * | 1986-03-25 | 1987-10-12 | インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン | 音声認識方法 |
DE3711342A1 (de) * | 1987-04-03 | 1988-10-20 | Philips Patentverwaltung | Verfahren zum erkennen zusammenhaengend gesprochener woerter |
JPS63250698A (ja) * | 1987-04-08 | 1988-10-18 | 松下通信工業株式会社 | 音声認識装置 |
JPH01102599A (ja) * | 1987-10-12 | 1989-04-20 | Internatl Business Mach Corp <Ibm> | 音声認識方法 |
US5129002A (en) * | 1987-12-16 | 1992-07-07 | Matsushita Electric Industrial Co., Ltd. | Pattern recognition apparatus |
JP2764277B2 (ja) * | 1988-09-07 | 1998-06-11 | 株式会社日立製作所 | 音声認識装置 |
JP2964507B2 (ja) * | 1989-12-12 | 1999-10-18 | 松下電器産業株式会社 | Hmm装置 |
US5263120A (en) * | 1991-04-29 | 1993-11-16 | Bickel Michael A | Adaptive fast fuzzy clustering system |
JP2795058B2 (ja) * | 1992-06-03 | 1998-09-10 | 松下電器産業株式会社 | 時系列信号処理装置 |
-
1995
- 1995-06-09 KR KR1019960700535A patent/KR100324988B1/ko not_active IP Right Cessation
- 1995-06-09 US US08/596,305 patent/US6061652A/en not_active Expired - Fee Related
- 1995-06-09 WO PCT/JP1995/001154 patent/WO1995034884A1/ja active Application Filing
- 1995-06-09 CN CNB951905473A patent/CN1159704C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1129485A (zh) | 1996-08-21 |
CN1159704C (zh) | 2004-07-28 |
US6061652A (en) | 2000-05-09 |
WO1995034884A1 (fr) | 1995-12-21 |
KR100324988B1 (ko) | 2002-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR960704299A (ko) | 신호해석장치 | |
Nakkiran et al. | Compressing deep neural networks using a rank-constrained topology. | |
Renals et al. | Phoneme classification experiments using radial basis functions | |
Federico | Bayesian estimation methods for n-gram language model adaptation | |
Heigold et al. | An extensive empirical evaluation of character-based morphological tagging for 14 languages | |
Stafylakis et al. | Zero-shot keyword spotting for visual speech recognition in-the-wild | |
Povey et al. | Frame discrimination training for HMMs for large vocabulary speech recognition | |
CN117195890B (zh) | 一种基于机器学习的文本推荐方法 | |
CN115238893B (zh) | 面向自然语言处理的神经网络模型量化方法和装置 | |
Ortmanns et al. | Fast likelihood computation methods for continuous mixture densities in large vocabulary speech recognition. | |
Tsakalidis et al. | Efficient speech recognition using subvector quantization and discrete-mixture HMMs | |
CN108470025A (zh) | 局部话题概率生成正则化自编码文本嵌入表示方法 | |
CN105895089A (zh) | 一种语音识别方法及装置 | |
CN114925702A (zh) | 文本相似度识别方法、装置、电子设备及存储介质 | |
CN108520205B (zh) | 一种基于Citation-KNN的人体动作识别方法 | |
Knill et al. | Fast implementation methods for Viterbi-based word-spotting | |
CN109918484B (zh) | 对话生成方法和装置 | |
Ostendorf et al. | Continuous word recognition based on the stochastic segment model | |
CN116124448A (zh) | 用于风电齿轮箱的故障诊断系统及其方法 | |
CN113220887B (zh) | 一种利用目标知识增强模型的情感分类方法 | |
CN109212501B (zh) | 基于局部嵌入的雷达高分辨距离像目标识别方法 | |
US7634404B2 (en) | Speech recognition method and apparatus utilizing segment models | |
CN110555209A (zh) | 训练词向量模型的方法及装置 | |
US6275799B1 (en) | Reference pattern learning system | |
Haidar et al. | Fine-Tuning BERT For Monolingual Intent Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20050121 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |