KR960704299A - 신호해석장치 - Google Patents

신호해석장치

Info

Publication number
KR960704299A
KR960704299A KR1019960700535A KR19960700535A KR960704299A KR 960704299 A KR960704299 A KR 960704299A KR 1019960700535 A KR1019960700535 A KR 1019960700535A KR 19960700535 A KR19960700535 A KR 19960700535A KR 960704299 A KR960704299 A KR 960704299A
Authority
KR
South Korea
Prior art keywords
cluster
vector
velocity
similarity
ear
Prior art date
Application number
KR1019960700535A
Other languages
English (en)
Other versions
KR100324988B1 (ko
Inventor
에이이치 츠보카
준이치 나카하시
Original Assignee
모리시다 요이치
마쯔시다 덴키 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모리시다 요이치, 마쯔시다 덴키 산교 가부시키가이샤 filed Critical 모리시다 요이치
Publication of KR960704299A publication Critical patent/KR960704299A/ko
Application granted granted Critical
Publication of KR100324988B1 publication Critical patent/KR100324988B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

적은 계산량이고, 정밀도 좋은 워드스폿팅이 가능한 HMM 장치, DP 매칭장치를 제공하는 것, 이를 위하여 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북을 구비하고, HMM에 있어서는 각 상태에서의 상기 클러스터 발생확률의 분포와, 인식해야할 입력특징벡터의 상기 각 클러스터에 대한 귀속도의 Kullback-Leibler Divergence에 기초한 유사도를 상기 특징벡터의 상기 상태에서의 발생정도로 하고, DP매칭에 있어서는 표준패턴을 형성하는 특징벡터의 상기 각 클러스터에 대한 귀속도의 분포와 입력특징벡터의 상기 각 클러스터에 대한 귀속도의 Kullback-Leibler Divergence에 기초한 유사도를 상기 입력패턴의 프레임과 대응하는 표준패턴 프레임의 프레임간 유사도로 하는 구성이다.

Description

신호해석장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

Claims (30)

  1. 해석의 대상으로 하는 시스템은 복수의 상태를 취하게 하고, 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형태로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉, 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률 기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉, 상기 각 클러스터의 이 관측벡터에 대한 사후 확률)를 산출하는 귀속도산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터의 귀속도와 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터의 발생확률 대수값의 적화 또는 그것에 등가한 량을 산출하고, 관측벡터의 상기 시스템의 각 상태에서의 발생정도를 산출하는 관측벡터 발생정도 산출수단을 구비하고, 상기 클러스터 발생확률 기억수단은 클러스터의 발생확률이 제 N+1위 이하로 되는 클러스터에 대한 발생확률은 0이 아닌 공통의 값으로 되고, 클러스터 발생확률의 총계가 1로 되도록 산출되고 있는 것을 특징으로 하는 신호해석장치.
  2. 제1항에 있어서, 귀속도산출수단은 귀속도가 제 K+1위 이하가 되는 클러스터에 대한 귀속도는 0으로 되고, 귀속도의 총계가 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
  3. 해석의 대상으로 하는 시스템은 복수의 상태를 취하게 하고, 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률 기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉 상기 각 클러스터의 이 관측벡터에 대한 사후 확률)를 산출하는 귀속도산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터 귀속도의 대수값과 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터 발생확률의 적화 또는 거기에 등가한 양을 산출하고, 관측벡터의 상기 시스템의 각 상태에 있어서 발생정도를 산출하는 관측벡터 발생정도 산출수단을 구비한 것을 특징으로 하는 신호해석장치.
  4. 제3항에 있어서, 각 상태에 있어서 클러스터 발생확률 기억수단을 미리 정한 N에 대해 그 확률이 상위 N까지의 클러스터에 대해서는 그 총합이 1로 되도록 산출한 것을 기억하고, 다른 클러스터의 발생확률은 0으로 하는 것을 특징으로 하는 신호해석장치.
  5. 제3항에 있어서, 귀속도산출수단은 관축벡터의 각 클러스터에 대한 귀속도를 그 귀속도가 제 K+1위 이하인 것은 0이 아닌 공통의 값으로 하고, 귀속도의총합이 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
  6. 제1항 또는 제3항에 있어서, 각 상태는 숨은 마르코프모델의 각 상태인 것을 특징으로 하는 신호해석장치.
  7. 특징벡터공간을 클러스터링하고, 클러스터 각각의 대표벡터가 그 라벨에서 검색가능한 형으로 기억된 코드북과, 각 상태에 있어서 상기 각 라벨의 발생확률(즉 각 클러스터의 발생확률)을 기억하는 클러스터 발생확률기억수단과, 상기 코드북을 이용하여 관측벡터의 상기 각 클러스터로의 귀속도(즉 상기 각 클러스터의 이 관측벡터에 대한 사후확률)을 산출하는 귀속도 산출수단과, 이 산출된 각 클러스터로의 상기 관측벡터의 귀속도와, 상기 클러스터 발생확률 기억수단에 기억되어 있는 각 클러스터 발생확률의 대수값의 적화 또는 그것에 등가한 양을 산출하고, 관측벡터의 상기 시스템의 각 상태에 있어서 발생정도를 산출하는 관측벡터발생정도 산출수단을 구비하고, 상기 각 상태에 있어서 상기 각 클러스터 발생확률의 추정은 상기 관측벡터 발생정도 산출수단을 이용하여 계산하고, 인식시는 상기 관측벡터의 귀속도를 최대의 귀속도는 1로 하고, 다른 귀속도는 모두 0으로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
  8. 특징벡터가 분류되어야 할 클러스터 기억수단과, 비교해야 할 벡터 x, y에 대해 이 각 벡터의 상기 각 클러스터로의 귀속도 혹은상기 각 클러스터의 상기 각 벡터에 대한 사후확률(양쪽 포함시켜 이후 귀속도라 함)을 산출하고, 상기 각 벡터의 각 클러스터에 대한 귀속도를 요소로 하는 귀속도벡터 a, b를 산출하는 귀속도 산출수단과, 이 귀속도벡터끼리의 거리 또는 유사도를 산출하는 유사도 산출수단을 구비하고, 이 거리 또는 유사도로써 상기 특징벡터 y와 z의 거리 또는 유사도로 하는 것을 특징으로 하는 신호해석장치.
  9. 제8항에 있어서, 특징벡터가 분류되어야 할 클러스터 기억수단과, 상기 벡터계열인 각 벡터의 상기 각 클러스터로의 귀속도를 산출하고, 상기 벡터의 각 클러스터에 대한 귀속도를 요소로 하는 귀속도벡터를 산출하는 귀속도산출수단과, 조합되어야 할 인식단위를 마찬가지로 귀속도벡터열로 표현한 표준패턴 기억수단과, 상기 귀속도산출수단의 출력으로서 얻어지는 귀속도벡터열로 구성되는 입력패턴과 상기 표준패턴의 매칭을 행하는 매칭수단을 구비하고, 이 매칭의 결과, 입력패턴과 표준패턴의 유사도 혹은 거리를 계산하는 것을 특징으로 하는 신호해석장치.
  10. 제9항에 있어서, 입력패턴 혹은 표준패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축을 선형 도는 비선형으로 압축하고, 양 패턴의 시간축을 맞추고, 서로 대응하는 귀속도벡터끼리의 거리 또는 유사도를 계산하는 유사도 산출수단과, 이 거리 또는 유사도를 상기 입력 패턴 혹은 표준 패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축에 따라 상기 거리 또는 유사도를 누적하는 누적유사도 산출수단을 구비하고, 이 누적값으로써 상기 입력패턴과 표준패턴의 거리 또는 유사도로 하는 것임을 특징으로 하는 신호해석장치.
  11. 제9항에 있어서, 귀속도벡터끼리의 귀속도 또는 유사도를 계산하는 유사도산출수단과, 입력패턴을 구성하는 귀속도벡터의 각각과, 상기 입력패턴과 매칭해야 할 표준패턴을 구성하는 귀속도벡터의 각각을, 양 패턴의 대응시킨 귀속도벡터끼리의 유사도의 상기 입력패턴 혹은 표준패턴 어느 한쪽의 시간축, 또는 쌍방의 시간축에 따라 누적한 누적값이 최소 또는 최대로 되도록 최적으로 대응시키고, 그 최대값을 산출하는 동적계화수단을 구비한 것을 특징으로 하는 신호해석장치.
  12. 거리 또는 유사도를 계산하는 유사도 산출수단은 거리 또는 유사도를 산출해야 할 2개의 귀속도벡터를 각각 a=(a, …, aM), B=(b1, …, bM)으로 할 때, 다음의어느 하나 또는 그들과 등가인 양으로서 거리 또는 유사도를 산출하는 것을 특징으로 하는 신호해석장치.
    (식1)
    다만, C는 C>0 되는 정수.
  13. 제11항에 있어서, 입력패턴의 프레임 t에 대응하는 귀속도벡터를 at=a(at1, …, atM), 표준패턴의 프레임 j에 대응하는 귀속도벡터를 bj=(bj1, …, bjM), 상기 매칭경로상의 k번째의 (t, j) 좌표를 x(k)=(t(k), j(k), x(k)에 있어서 가중계수를 w(x(k))로 할 때,
    (식2)
    또는
    을 at(k)와 bj(k)의 유사도로 하고, 벡터계열 at(1), …, at(k)와 bj(1), …, bj(k)의 상기 경로에 따른 누적 유사도를
    (식3)
    또는
    로 하는 것으로서, 1≤n≤k-1에 대해 t(k)-t(k-n)=1일 때, w(x(k-n+1))+…+w(x(k))=1인 것을 특징으로 하는 신호해석장치.
  14. 제13항에 있어서, 매칭경로는 t(k)-t(k-1)=1, w(x(k))=1인 것을 특징으로 하는 신호해석장치.
  15. 제13항에 있어서, 매칭경로는 x(k)=(t, j), k-1≥n≥1에 대해, (1) x(k-1)=(t-1, j-n) 또는 x(k-1)=(t-1, j), (2) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t-1, j), m=2, …, n에 대해서는 x(k-m)=(t-1, j-m), (3) m=1, …, n-1에 대해, x(k-m)=(t, j-m), x(k-n)=(t-1,j-n), (4)m=1, …, n-1에 대해 x(k-m)=(t, i-m), x(k-n)=(t-1, j-n) (5) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t-1, j), m=2, …, n에 대해서는 x(k-m)=(t-1, j-m)의 어느 하나를 포함하고, 경로(1)에 대해서는 w(x(k))=1, 경로(2)에 대해서는 w(x(k))=1, w(x(k-m+1))=0, 경로 (3)에 대해서는 w(x(k-m+1))=0, w(x(k-n+1))=1, 경로 (4)(5)에 대해서는 w(x-k-m+1)=1/n으로 하는 것을 특징으로 하는 신호해석장치.
  16. 제11항에 있어서, 거리 또는 유사도를 계산하는 유사도 산출수단은 입력패턴의 프레임 t에 대응하는 귀속도벡터를 at=a(at1, …, atM), 표준패턴의 프레임 j에 대응하는 귀속도벡터를 bj=(bj1, …, bjM), 상기 매칭경로상의 k번째의 (t, j) 좌표를 x(k)=(t(k), j(k), x(k)에 있어서 가중계수를 w(x(k))로 할 때,
    (식4)
    또는
    를 at(k)와 bj(k)의 유사도로 하고, 벡터계열 at(1), …, at(k)와 bj(1), …, bj(k)의 상기 경로에 따른 유사도를
    (식5)
    또는
    로 하는 것으로서, 1≤n≤k-1에 대해 j(k)-j(k-n)=1일 때, w(x(k-1+1))+…+w(x(k))=1인 것을 특징으로 하는 신호해석장치.
  17. 제16항에 있어서, 매칭경로는 j(k)-j(k-1)=1, w(x(k))=1인 것을 특징으로 하는 신호해석장치.
  18. 제16항에 있어서,매칭경로는 x(k)=(t, j), k-1≥n≥1에 대해, (1) x(k-1)=(t-n, j-1) 또는 x(k-1)=(t, j-1), (2) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t, j-1), m=2, …, n에 대해서는 x(k-m)=(t-m, j-m), (3) m=1, …, n-1에 대해, x(k-m)=(t-m, j), x(k-n)=(t-n, j-1), (4) m=1, …, n-1에 대해 x(k-m)=(t-m, j), x(k-n)=(t-n, j-1)(5) x(k-1)=(t-1, j-1) 또는 x(k-1)=(t, j-1), m=2, …, n에 대해서는 x(k-m)=(t-m, j-1)의 어느 하나를 포함하고, 경로(1)에 대해서는 w(x(k))=1, 경로(2)에 대해서는 w(x(k))=1, w(x(k-m+1))=0, 경로(3)에 대해서는 w(x(k-m+1))=0, w(x(k-n+1))=1, 경로 (4)(5)에 대해서는 w(x-(k-m+1)=1/n으로 하는 것을 특징으로 하는 신호해석장치.
  19. 제8항에 있어서, 표준패턴 프레임 j의 특징벡터의 클러스터 m으로서의 귀속도를 bjm, 클러스터수를 M으로 할 때, bji, …, bjm중에서 크기 순서로 된 N개의 bj g(j, 1), bj g(i, 2,)…, bj, g(j, N), (g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)은 그대로의 값, 나머지는 일정값 b0에서 bj, g(j, 1)+…bj, g(j, N)+b0(M-N)=1로 되도록 산출한 값, 또는 각각의 대수값 log bj, g(j, 1), log bj,g(j, 2),…, log bj, g(j, N), log b0의 형으로 기억하는 표준패턴 기억수단을 구비한 것을 특징으로 하는 신호해석장치.
  20. 제8항에 있어서, 표준패턴 프레임 j의 특징벡터의 클러스터 m으로서의 귀속도를 bjm, 클러스터수를 M으로 할 때, bji, …, bjm중에서 크기 순서로 된 N개의 bj g(j, 1), bj g(i, 2,)…, bj, g(j, N), (g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)은 bj g(j, 1)+…+bj, g(j, n)=1로 되도록 산출한 값, 나머지는 bj,g(j, N+1)=…=bj, g(j, M)=0으로서 기억하는 것을 특징으로 하는 신호해석장치.
  21. 제8항에 있어서, 입력패턴 프레임 t의 특징벡터 yt의 클러스터 m으로의 귀속도를 utm, 클러스터 M으로 할 때, yt가 변환되어야 할 귀속도벡터를 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t, 1),ut, h(t,2), …,ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)은 그대로의 값, 나머지는 일정값 u0에서 ut, h(t, 1)+…+ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값으로 하는 것을 특징으로 하는 신호해석장치.
  22. 제8항에 있어서, 입력패턴 프레임 t의 특징벡터 yt의 클러스터 m으로의 귀속도를 utm, 클러스터수를 M으로 할 때, yt가 변환되어야 할 귀속도벡터를 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t, 1), h(t, 2), …,ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)은 ut, h(t, 1)+…+ut, h(t, K)=1로 되도록 산출한 값, 나머지는 ut, h(t, K+1)=…ut, h(t, M)=0으로 하는 것을 특징으로 하는 신호해석장치.
  23. 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 bj1, …biM중에서 크기 순서로 된 N개의 bj, g(j, 1), bj, g(j, 2), …, bj, g(j, N)(g(j, n)은 표준패턴의 프레임 j에 있어서 n번째로 큰 클러스터의 라벨, N≤M)과, bj, g(j, 1)+…+bj, g(j, N)+b0(M-N)=1이 되도록 산출한 값 b0과, 모든 클러스터에 대해 산출된 utm, 또는 ut1, …, utM중에서 크기 순서로 대응하여 ut, h(t, 1)+…ut, h(t, k)=1로 되도록 산출한 K개의 ut, h(t, 1),ut, h(t, 2), …, ut, h(t, K)(h(t, k)는 입력패턴 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)에 대해,
    (식6)
    또는
    로 하는 것을 특징으로 하는 신호해석장치.
  24. 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 bj1, …biM중에서 크기 순서로 대응하여 bj, g(j, 1),+bj, g(j, 2), …bj, g(j, N)(g(j, n)은 표준패턴의 프레임 j에 있어서 n번째로 큰 클러스터의 라벨, N≤M)과, 모든 클러스터에 대해 산출된 utm, 또는 ut1, …, utM중에서 크기 순서로 된 K개의 ut, h(t,1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴의 프레임 t에서 k번째로 큰 클러스터의 라벨, K≤M)과, ut, h(t, 1), ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값 u0에 대해,
    (식7)
    또는
    로 하는 것을 특징으로 하는 신호해석장치.
  25. 제8항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 모든 클러스터에 대한 산출된 utm, 또는 bj1, …, bjM중에서 크기 순서로 대응하여 bj, g(j, 1)+…+bj, g(j, N)=1로 되도록 산출한 N개의 bj, g(j, 1), bj, g(j, 2), …, bj,g(j, N)(g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)과, ut1, …, utm중에서 크기 순서로 된 K개의 ut, h(t, 1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴 프레임 t에 있어서 k번째로 큰 클러스터의 라벨, K≤M)과, ut, h(t, 1)+…+ut, h(t, K)+u0(M-K)=1이 되도록 산출한 값 u0에 대해,
    (식8)
    또는
    로 하는 것을 특징으로 하는 신호해석장치
  26. 제1항에 있어서, 입력패턴의 제 t번 프레임과 표준패턴의 제 j번 프레임의 유사도는 모든 클러스터에 대해 산출된 utm, 또는 bj1, …bjM 중에서 크기 순서로 된 N개의 bj, g(j, 1), bj, g(j, 2), …, bj,g(j, N)(g(j, n)은 표준패턴의 프레임 j에서 n번째로 큰 클러스터의 라벨, N≤M)과, bj, g(j, 1)+…+bj, g(j, N)+b0(M-N)=1이 되도록 산출된 b|0과, ut1, …, utm중에서 크기 순서로 대응하여, ut, h(t, 1)+…+ut, h(t, K)=1이 되도록 산출한 값 k의 ut, h(t, 1), ut, h(t, 2), …, ut, h(t, k)(h(t, k)는 입력패턴 프레임 t에 서 k번째로 큰 클러스터의 라벨, K≤M)에 대해,
    (식9)
    또는
    로 하는 것을 특징으로 하는 신호해석장치.
  27. 제5항 또는 제9항에 있어서, 귀속도는 그들 귀속도를 산출해야 할 벡터와 각 클러스터의 대표벡터와의 거리에서 산출하는 것이고, 그 거리가 작은 것부터 순서대로 전자의 경우는 상기 K, 후자의 경우는 상기 N까지의 것에 대해서는 그들의 거리를 그대로 이용하고, 그 순위가 K+1또는 N+1 이하의 클러스터에 대해서는 공통 값을 이용하여 귀속도를 산출하는 것을 특징으로 하는 신호해석장치.
  28. 제27항에 있어서, 공통값은 상기 K+1 또는 상기 N+1 이하 순위의 클러스터에 대해서는 각 클러스터에 대한 거리의 평균으로 하는 것을 특징으로 하는 신호해석장치.
  29. 제27항에 있어서, 공통값은 상기 K+1 또는 상기 K+1 이하 순위의 클러스터에 대해서는 최소의 거리와 최대 거리의 평균으로 하는 것을 특징으로 하는 신호해석장치.
  30. 제5항 또는 제19항에 있어서, 귀속도는 귀속도를 산출해야 할 관측벡터와 각 클러스터의 대표벡터와의 거리와 작은 것부터 K+1위 또는 N+1위 이하의 클러스터에 대해서는 미리 정한 1/K 또는 1/N 이하의 일정값으로 하고, 거리의 작은 것부터 차례로 K 또는 N 클러스터에 대해서는 그들 개개의 거리와 상기 일정값에서 귀속도의 총합이 1로 되도록 산출하는 것을 특징으로 하는 신호해석장치.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960700535A 1994-06-13 1995-06-09 신호해석장치 KR100324988B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP13002394 1994-06-13
JP94-130023 1994-06-13
JP95-102665 1995-04-26
JP10266595 1995-04-26
PCT/JP1995/001154 WO1995034884A1 (fr) 1994-06-13 1995-06-09 Analyseur de signaux

Publications (2)

Publication Number Publication Date
KR960704299A true KR960704299A (ko) 1996-08-31
KR100324988B1 KR100324988B1 (ko) 2002-08-27

Family

ID=26443348

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960700535A KR100324988B1 (ko) 1994-06-13 1995-06-09 신호해석장치

Country Status (4)

Country Link
US (1) US6061652A (ko)
KR (1) KR100324988B1 (ko)
CN (1) CN1159704C (ko)
WO (1) WO1995034884A1 (ko)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3090119B2 (ja) * 1998-05-15 2000-09-18 日本電気株式会社 話者照合装置、方法及び記憶媒体
US6216134B1 (en) 1998-06-25 2001-04-10 Microsoft Corporation Method and system for visualization of clusters and classifications
US6742003B2 (en) 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US6219642B1 (en) * 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
KR100729316B1 (ko) * 1998-10-09 2007-06-19 소니 가부시끼 가이샤 학습 장치 및 학습 방법, 인식 장치 및 인식 방법, 및기록 매체
US7263484B1 (en) * 2000-03-04 2007-08-28 Georgia Tech Research Corporation Phonetic searching
US6720984B1 (en) 2000-06-13 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Characterization of bioelectric potentials
EP2302580A1 (en) * 2001-10-13 2011-03-30 Superderivatives Inc Method and system for pricing financial derivatives
DE60225536T2 (de) * 2002-06-04 2009-04-23 Intellectual Ventures Fund 21 LLC, Carson City Verfahren und Vorrichtung zur Spracherkennung
US7076427B2 (en) * 2002-10-18 2006-07-11 Ser Solutions, Inc. Methods and apparatus for audio data monitoring and evaluation using speech recognition
US8055503B2 (en) * 2002-10-18 2011-11-08 Siemens Enterprise Communications, Inc. Methods and apparatus for audio data analysis and data mining using speech recognition
US7133828B2 (en) * 2002-10-18 2006-11-07 Ser Solutions, Inc. Methods and apparatus for audio data analysis and data mining using speech recognition
EP1576580B1 (en) * 2002-12-23 2012-02-08 LOQUENDO SpA Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames
US7904296B2 (en) * 2003-07-23 2011-03-08 Nexidia Inc. Spoken word spotting queries
US8170873B1 (en) * 2003-07-23 2012-05-01 Nexidia Inc. Comparing events in word spotting
US7245767B2 (en) * 2003-08-21 2007-07-17 Hewlett-Packard Development Company, L.P. Method and apparatus for object identification, classification or verification
US7584101B2 (en) * 2003-08-22 2009-09-01 Ser Solutions, Inc. System for and method of automated quality monitoring
KR20050054706A (ko) * 2003-12-05 2005-06-10 엘지전자 주식회사 음성인식을 위한 어휘 트리 구축 방법
US7970613B2 (en) 2005-11-12 2011-06-28 Sony Computer Entertainment Inc. Method and system for Gaussian probability data bit reduction and computation
US8010358B2 (en) * 2006-02-21 2011-08-30 Sony Computer Entertainment Inc. Voice recognition with parallel gender and age normalization
US7778831B2 (en) * 2006-02-21 2010-08-17 Sony Computer Entertainment Inc. Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch
JP4745094B2 (ja) * 2006-03-20 2011-08-10 富士通株式会社 クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム
TWI312945B (en) * 2006-06-07 2009-08-01 Ind Tech Res Inst Method and apparatus for multimedia data management
US8234116B2 (en) * 2006-08-22 2012-07-31 Microsoft Corporation Calculating cost measures between HMM acoustic models
CN101154379B (zh) * 2006-09-27 2011-11-23 夏普株式会社 定位语音中的关键词的方法和设备以及语音识别系统
CN100552664C (zh) * 2006-10-20 2009-10-21 东芝泰格有限公司 模式匹配装置以及方法
US20080243503A1 (en) * 2007-03-30 2008-10-02 Microsoft Corporation Minimum divergence based discriminative training for pattern recognition
US8442833B2 (en) * 2009-02-17 2013-05-14 Sony Computer Entertainment Inc. Speech processing with source location estimation using signals from two or more microphones
US8788256B2 (en) * 2009-02-17 2014-07-22 Sony Computer Entertainment Inc. Multiple language voice recognition
US8442829B2 (en) * 2009-02-17 2013-05-14 Sony Computer Entertainment Inc. Automatic computation streaming partition for voice recognition on multiple processors with limited memory
US8700399B2 (en) * 2009-07-06 2014-04-15 Sensory, Inc. Systems and methods for hands-free voice control and voice search
KR101092820B1 (ko) * 2009-09-22 2011-12-12 현대자동차주식회사 립리딩과 음성 인식 통합 멀티모달 인터페이스 시스템
JP2011221688A (ja) * 2010-04-07 2011-11-04 Sony Corp 認識装置、認識方法、およびプログラム
JP5258915B2 (ja) * 2011-02-28 2013-08-07 株式会社デンソーアイティーラボラトリ 特徴変換装置、それを含む類似情報探索装置、コード化パラメータ生成方法、及びコンピュータ・プログラム
CN105355214A (zh) * 2011-08-19 2016-02-24 杜比实验室特许公司 测量相似度的方法和设备
US9153235B2 (en) 2012-04-09 2015-10-06 Sony Computer Entertainment Inc. Text dependent speaker recognition with long-term feature based on functional data analysis
US9053579B2 (en) * 2012-06-19 2015-06-09 Palo Alto Research Center Incorporated Selective learning for growing a graph lattice
US8831339B2 (en) 2012-06-19 2014-09-09 Palo Alto Research Center Incorporated Weighted feature voting for classification using a graph lattice
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN105989849B (zh) * 2015-06-03 2019-12-03 乐融致新电子科技(天津)有限公司 一种语音增强方法、语音识别方法、聚类方法及装置
US11429890B2 (en) * 2017-10-30 2022-08-30 Bank Of America Corporation Dynamic pattern recognition and data reconciliation
US11256869B2 (en) * 2018-09-06 2022-02-22 Lg Electronics Inc. Word vector correction method
WO2021152838A1 (en) * 2020-01-31 2021-08-05 Nec Corporation Speech embedding apparatus, and method
CN115398437A (zh) 2020-03-30 2022-11-25 甲骨文国际公司 改进的域外(ood)检测技术

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4570232A (en) * 1981-12-21 1986-02-11 Nippon Telegraph & Telephone Public Corporation Speech recognition apparatus
JPS62231993A (ja) * 1986-03-25 1987-10-12 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン 音声認識方法
DE3711342A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen zusammenhaengend gesprochener woerter
JPS63250698A (ja) * 1987-04-08 1988-10-18 松下通信工業株式会社 音声認識装置
JPH01102599A (ja) * 1987-10-12 1989-04-20 Internatl Business Mach Corp <Ibm> 音声認識方法
US5129002A (en) * 1987-12-16 1992-07-07 Matsushita Electric Industrial Co., Ltd. Pattern recognition apparatus
JP2764277B2 (ja) * 1988-09-07 1998-06-11 株式会社日立製作所 音声認識装置
JP2964507B2 (ja) * 1989-12-12 1999-10-18 松下電器産業株式会社 Hmm装置
US5263120A (en) * 1991-04-29 1993-11-16 Bickel Michael A Adaptive fast fuzzy clustering system
JP2795058B2 (ja) * 1992-06-03 1998-09-10 松下電器産業株式会社 時系列信号処理装置

Also Published As

Publication number Publication date
CN1129485A (zh) 1996-08-21
CN1159704C (zh) 2004-07-28
US6061652A (en) 2000-05-09
WO1995034884A1 (fr) 1995-12-21
KR100324988B1 (ko) 2002-08-27

Similar Documents

Publication Publication Date Title
KR960704299A (ko) 신호해석장치
Nakkiran et al. Compressing deep neural networks using a rank-constrained topology.
Renals et al. Phoneme classification experiments using radial basis functions
Federico Bayesian estimation methods for n-gram language model adaptation
Heigold et al. An extensive empirical evaluation of character-based morphological tagging for 14 languages
Stafylakis et al. Zero-shot keyword spotting for visual speech recognition in-the-wild
Povey et al. Frame discrimination training for HMMs for large vocabulary speech recognition
CN117195890B (zh) 一种基于机器学习的文本推荐方法
CN115238893B (zh) 面向自然语言处理的神经网络模型量化方法和装置
Ortmanns et al. Fast likelihood computation methods for continuous mixture densities in large vocabulary speech recognition.
Tsakalidis et al. Efficient speech recognition using subvector quantization and discrete-mixture HMMs
CN108470025A (zh) 局部话题概率生成正则化自编码文本嵌入表示方法
CN105895089A (zh) 一种语音识别方法及装置
CN114925702A (zh) 文本相似度识别方法、装置、电子设备及存储介质
CN108520205B (zh) 一种基于Citation-KNN的人体动作识别方法
Knill et al. Fast implementation methods for Viterbi-based word-spotting
CN109918484B (zh) 对话生成方法和装置
Ostendorf et al. Continuous word recognition based on the stochastic segment model
CN116124448A (zh) 用于风电齿轮箱的故障诊断系统及其方法
CN113220887B (zh) 一种利用目标知识增强模型的情感分类方法
CN109212501B (zh) 基于局部嵌入的雷达高分辨距离像目标识别方法
US7634404B2 (en) Speech recognition method and apparatus utilizing segment models
CN110555209A (zh) 训练词向量模型的方法及装置
US6275799B1 (en) Reference pattern learning system
Haidar et al. Fine-Tuning BERT For Monolingual Intent Classification

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050121

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee