KR880000255B1

KR880000255B1 - 언어인지 마이크로 컴퓨터

Info

Publication number: KR880000255B1
Application number: KR8201882A
Authority: KR
Inventors: 애취 · 힛치코크 마이론
Original assignee: 존 에이취·호니켈; 휘기 인터내셔널인크
Priority date: 1981-05-01
Filing date: 1982-04-29
Publication date: 1988-03-15
Also published as: AU8308382A; DE3272684D1; JPS57185500A; JPH0420199B2; EP0065829A1; KR840000014A; US4388495A; CA1181858A; EP0065829B1

Abstract

내용 없음.

Description

언어인지 마이크로 컴퓨터

제1도는 10mSec 베이스 대 정현파 주파수의 제로 크로싱계수(zero crossing count)의 그래프도.

제2도는 본 발명의 회로의 계통도.

제3도 내지 제6도는 본 발명 시스템의 동작을 도시한 유통도.

* 도면의 주요부분에 대한 부호의 설명

11 : 마이크로폰 13 : 고이득 음성증폭기

17 : 마이크로 컴퓨터칩 19 : 해독전용메모리(ROM)

21,23 및 25 : 단(Port) 27 : 등속호출메모리(RAM)

31 : 타이머 및 카운터 33 : 전치계수기

75 : 타이머 입력선 301 및 305 : 계전기

303 및 307 : 스위치 309 : 로보트 헤드회전기

311 : 로보트 트랙터 모터

본 발명은 언어인지 컴퓨터에 관한 것으로, 특히 스피커 독립인지 컴퓨터에 관한 것이다. 더욱 상세하게 말하자면, 본 발명은 특정하게 응용하기 위해 매우 저렴하게 제조될 수 있고 신중하게 선택된 어휘로 스피커에 무관하게 언어를 인지하기 위해 사용하는 마이크로 컴퓨터에 관한 것이다.

지난 30여년동안, 증가하는 어휘를 인지할 수 있는 복잡한 컴퓨터 시스템을 제공하기 위해서 인간언어를 인지하기 위한 컴퓨터 사용방법이 개발되어 왔다. 또한, 스피커 독립인지 시스템을 개발하기 위해서 상당한 노력을 해왔다.

언어인지 시스템내의 모든 진지한 작업은 각각 상이한 주파수 대역을 선택하는 대역통과 휠터 뱅크(bank)를 시스템 전단부로서 사용함으로써 입력음성 신호를 스펙트럼 분석하는 것에 근거를 두었다. 각각의 대역통과 휠터 범위내의 신호레벨 또는 음성출력은 전형적으로 주파수 대단어 또는 숙어의 시간음성매트릭스를 제공하도록 주기적인 기간에 샘플되었다. 다수의 시간표준화 기술은 이것들의 기간에 관계없이 단어를 인지하기 위해 사용되었고, 주파수 표준화기술는 스피커에 무관하게 하기 위해 시도할 때 사용되었다.

물론, 이 모든 개발들로 언어인지 장점을 갖는 복잡하고도 대부분의 소비자가 구입하기에 값이 비싼 장치가 만들어졌다. 본질적으로, 언어인지 컴퓨터는 입력매체인 복잡한 언어인지 시스템의 값을 정당하게 하기에 충분하게 제조가격이 비싼 복잡한 장비의 입력시스템과 실험기구로 제한되었다.

이 개발로, 다양한 소비자 제품용으로 간략화된 언어인지 장치를 사용하게 되었다. 또한, 더욱 복잡한 시스템에 이용된 기술들은 메모리 자체의 가격이 시스템 가격을 비싸게 하기에 충분하도록 대부분의 인지시스템용만의 기억요구사항이 되어있기 때문에 비교적 간단한 언어인지 시스템에 사용하지 않았다.

다른 시스템들을 언어를 인지하기 위해 스펙트럼 분석하는데 사용하는 것이 알려져 있지만, 이 시스템들은 시스템어휘를 넓히기 위해서 모음 U및 O와 파열음 T 및 B와 같은 비교적 유사한 언어요소를 식별하기 위한 시도를 하였다.

본 발명은 과거에 취해왔던 것과는 다른 언어인지 방법을 사용하였다. 스피커 독립인지 및 인지가능한 어휘의 폭넓은 선택을 하기 위해인지 컴퓨터가 더욱 복잡하게 되지만, 본 발명 컴퓨터는 스피커에 무관하게 인지할 수 있고 인지가능한 어휘를 엄격하게 제한하므로서 저렴한 가격으로 제조될 수 있다. 또한, 이 결과들은 영어 또는 외국어의 다른 단어와 많이 선택된 어휘의 단어와의 차이가 아니라 많이 선택된 어휘의 단어들간의 차이를 집중시키므로서 이루어진다. 이 결과로 언어인지 시스템을 비싸게 사용하였던 여러 소비자 및 공업분야에 유용한 값싼 단어인지 시스템이 제공된다.

이 시스템은 전형적인 시스템 전단부, 즉 대역통과 휠터그룹을 사용하지 않고서 이 결과를 수행한다. 그대신, 시스템 입력은 간단하게 음성신호가 선정된 기간내에 임개 레벨을 교차하는 횟수의 계수로 된다. 이 계수는 이러한 선정된 기간동안 음성신호의 주파수를 평균한다. 이 주파수 평균을 기초로해서, 통상적인 언어패터의 세그먼트는 마찰음-형 기간, 즉 비교적 높은 평균주파수 내용기간, 중간 평균 주파수 내용을 갖고 있는 모음-형 기간 및 제로 크로싱 데이타항 내에서 주파수가 매우 낮은 묵음 기간으로 나누어질 수 있다. 그러나, 부수적인 제한이 없으면, 이러한 평균만을 기초로한 언어인지 시스템은 비교적 높은 착오율을 갖게된다.

본 발명은 인지 과정동안 언어패턴내의 한 상태에서 다른 상태로 변화시키기 위해 극복되어야 하는 히스테리시스를 효율적으로 삽입시키므로서 착오율을 현저하게 감소시킨다. 이 히스테리시스는 마찰음-형 소리와 모음-형 소리와 묵음 사이의 변환시에 생기는 잘못된 상태변화를 방지하여, 잘못된 상태변화 발전순서를 방지한다. 특히, 모음-형 소리로부터 마찰음-형 소리로 변환하기 위해서는, 10mSec 기간내에 24 이상의 제로크로싱 계수를 만드는 2400㎐ 이상의 높은 에너지를 필요로 하게 된다. 한편, 묵음 상태로부터 마찰음-형 상태로의 변환은 1600㎐ 이상의 높은 언어에너지만을 필요로 하게 된다. 마찰음-형이나 묵음으로부터 모음-형 소리로 상태 변환하게 하기 위해서, 대부분의 언어에너지는 10mSec 기간내에 16이하의 제로크로싱 계수를 필요로하는 1600㎐ 이하로 떨어져야 한다. 언어지역내의 주파수 성분은 200㎐ 이상의 낮은 에너지의 경우에 생기지 않기 때문에, 10mSec 기간내의 2개의 제로크로싱 계수의 묵음 임계값이 사용된다.

또한, 본 발명은 이 전의 기록된 상태에 따라 변하는 부수적인 변수 히스테리시스 레벨을 제공하므로서 착오율을 감소시키기도 한다. 예를들면 60mSec의 최소 모음-형 세그먼트가 상태 순서의 중간에 단어 어택(attack)의 "uh" 소리와 같은 예상된 최단 모음 세그먼트까지의 진(true) 모음-형 소리를 확인하기 위해 사용된다. 한편, 마찰음-형 어미에 관련된 점진적인 에너지 감쇠에 의해 만들어진 가공물을 제거시키도록 특정한 단어의 모음-형 어미를 확인하기 위해서는 최소한 160mSec의 기간이 필요하다. 예를들어, 단어어택(attack)의 "a"소리는 어택의 끝글자 "ck"가 소리나지 않기 때문에 전형적인 언어패턴에서 약 300mSec 정도로 길게 된다. 어택의 "ac" 소리는 단어어택이 인지될 경우에 실제 어미상태로 인지되어야 한다. 한편, "레스트(rest)"와 같은 단어의 끝에서의 점진적인 에너지 감쇠는 "st"소리로부터의 에너지가 감쇠하는 것과 같은 이것의 최종상태 때에 모음-형 소리를 갖고 있는 것으로 해석되지 않는다. 그러므로 인지가능한 순서내의 상태의 위치와 이미 인지된 상태의 위치가 발음한 단어내의 각각의 상태를 결정하기 위해 사용된 임계값 검사를 변화시키도록 사용된다.

그러므로, 이 인지시스템내의 변수 히스테리시스 레벨을 삽입시키므로서, 인지가능한 어휘가 동일한 상태 순서를 가질 수 없는 단어 그룹에 적당하게 제한되어 있는한, 언어인지 시스템이 매우 간단한 상태 베이스로 동작하더라도 착오율을 감소시킬 수가 있다.

인지될 단어의 상태순서는 해독-전용 메모리(ROM) 내에서와 같이 시스템내에 영구적으로 격납된 상태순서 템플레이트(template)와 비교된다. 단어를 인지하기 위해서는, 착오율은 낮고 인지율은 높게 하기 위하여 인지될 단어의 다수의 상이한 템플레이트를 포함해야 한다. 이 다수의 템플레이트는 다른 사람이 다르게 발음한 동일 단어를 포획하기 위해 사용된다. 그러나, 인지될 주어진 단어의 다수의 템플레이트는 인지될 다른 단어의 다수의 템플레이트와 중첩되지 않으므로, 각각의 인지가능한 상태순서가 유일한 출력을 만들게 된다.

이하, 첨부된 도면을 참조하여 본 발명을 더욱 상세하게 기술하겠다.

먼저 제1도를 참조하면, 입력 언어신호가 10mSec 단위로 샘플되면, 1K㎐의 정현파 주파수는 10mSec마다 10개의 정(+)행 제로크로싱 계수를 만들게 된다. 마찬가지로, 제로크로싱 임계점이 감지된 정현파의 극대점 사이의 어느곳에 있다고 가정하면, 5K㎐의 주파수는 10mSec마다 50개의 정(+)행 제로크로싱 계수를 만들게 된다. 만약, 언어패턴을 측정할 때, 증폭기가 엄격히 제한되어 사용되면, 본질적으로 모둔 언어패턴은 증폭기를 포화시키어 제어크로싱 계수를 발생시키게 된다. 그러므로, 엄격히 제한된 증폭기로부터 전기신호를 감시함으로써 실현되는 최후 계수는 평균 주파수 측정을 제공한다. 제2도의 계통도에 도시한 바와같은 본 발명의 시스템에 있어서, 마이크로(11)은 모든 언어신호들이 제로크로싱 데이타를 발생시키도록 포화되는 고이득 음성증폭기(13)에 음성신호 입력을 제공한다. 이 신호는 모터로라 반도체회사에서 제조한 MC 6805 P2마이크로컴퓨터 칩과 같은 마이크로 컴퓨터 칩(17)의 타이머 입력으로 선로(75)를 통해 공급된다. 이 타이머 입력(75)는 음성증폭기(13)이 포화상태에서 5V 출력을 제공할 경우에 타이머의 입력이 마이크로폰(11)에 공급된 음성신호의 평균 스펙트럼 주파수와 등가인 주파수에서 생기도록 0.8V의 임계전압에서 부(-)행 신호를 감지한다.

마이크로프로세서(17) 내에서, 해독전용 메모리(19)는 언어인지 시스템용의 퍼엄웨어(firmware) 뿐만 아니라 인지될 단어의 퍼엄웨어 언어 템플레이트도 포함한다. 그러므로, 언어인지 시스템이 해석되게 하는 선정된 선택된 어휘는 마이크로컴퓨터(17) 제조시에나 최소한 마이크로 컴퓨터(17)을 판매하기 전에 해독전용 메모리(19)내에 영구적으로 격납된다. 그러므로, 그 언어인지 장치를 사용하는 동안에는 어휘연습을 하지 않아도 되며, 이것의 임무(task)는 어휘를 인지가능한 단어그룹에 프리셋트시키고 언어인지 시스템을 값싸게 제조할 수 있도록 하기 위해 최초 제조시에 제공된다.

해독전용 메모리(19)내에 격납된 퍼엄웨어에 따라서, 제2도의 언어인지 시스템은 제3도 내지 제6도의 유통도에 도시된 과정에 따라 마이크로폰(11)로부터의 인입언어 데이타를 분석한다.

먼저 제3도를 참조하면, 이 시스템은 전력이 마이크로컴퓨터(17)에 최초 공급될 때 단계(111)에서 초기치 설정된다. 이 초기치 설정은 이 장치의 출력단으로서 제2도의 단(A, B 및 C, 측 21,23 및 25)를 지정한다. 이 각각의 단자(21 내지 25)는 마이크로컴퓨터(17)의 입력이나 출력과 같이 동작하며, 이 단들을 지정하면 언어인지로 생긴 출력데이타가 단(A, B 및 C) 중의 어느 한 단에 제공되게 한다는 것을 알 수 있다. 이 지정은 단계(113)에서 생기고, 그다음 마이크로컴퓨터(17)의 등속호출메모리(27)내의 레지스터내에 격납된 변수들은 단계(115)에서 초기치 설정된다. 제3도의 유통도 및 제4도 내지 제6도의 유통도는 분기점에서와 같이 순서가 유통내의 여러 점프점(jump point)으로 귀환되게 하는 귀환점 TT16(117)과 같은 귀환점들을 포함한다.

단계(115)에서 초기지 설정되는 변수들은 다음과 같다. FCNT는 마찰음-형 계수이고 현저한 고주파수나 마찰음-형소리에너지를 가진 10mSec 기간의 수를 정한다. VCNT는 현저한 저주파 언어출력을 가진 모음-형 10mSec 기간을 계수하기 위해 사용된 변수이다. SCNT는 본질적으로 언어내용을 갖고 있지 않은 10mSec 묵음 기간을 계수하기 위해 사용된 변수이다. X는 언어패턴을 확인하기 위해 사용된 상태순서내의 연속상태(마찰을-형, 모음-형, 묵음)들을 숫자로 확인하기 위해 사용된 포인터 변수이다. 변수 N은 인력단어의 모든 상태수를 정한다.

단계(119)에서, 한 쌍의 배열이 초기치 설정된다. 배열SEG(X)는 인력단어의 실제 상태순서, 즉 마찰음-형, 모음-형, 또는 묵음과 같은 각각의 세그먼트를 확인하는 각각의 세그먼트의 데이타를 포함한다.

배열VOWL(X)는 모음상태의 길이, 즉 모음 상태로서 확인된 세그먼트 X내의 10mSec 모음 기간의 수를 정한다.

이 변수와 배열들을 다음 표를 통해 더욱 잘 이해할 수 있다.

[표 1]

상기 표로부터, SEG(X)는 단어내의 특정한 상태가 마찰음-형, 즉 주로 고주파 음향에너지일 경우에 이 단어내의 특정한 상태에 대하여 그로 정해진다는 것을 알 수 있다. 이와 마찬가지로, 단어상태가 주로 모음-형이면, SEG(X)는 1로 정해지고 0은 묵음상태로 정해진다. 상술한 바와같이, 전형적인 발음을 할때, 단어 six에는 N이 4와 같이 되도록 4개의 연속상태가 있다. 1에서 4까지의 X값에 대하여, SEG(X)는 순서 2102, 또는 마찰음-형, 모음-형, 묵음, 마찰음-형으로 된다. 단어 six의 맨 처음 "S"는 "X"가 1로 되는 마찰음-형 상태를 제공한다. 단어 six의 모음은 X가 2로 되는 모음-형 상태를 제공한다. 단어 six내의 X소리를 형성하기 전에, 마찰을 X를 소리내기 위해 에너지를 격납시킬 때 음성의 통로는 SEG(X)=0에 의해 X=3으로 정해진 순간 묵음을 발생시키도록 폐쇄된다. 이 짧은 묵음은 SEF(X)=2로 도시된 X=4에서의 마찰음-형 X소리 다음에 오게된다.

배열 VOWL(X)는 X=2에서 모음-형 소리, 즉 단어 six에서의 문자 "i"의 기간을 정하는 값 Q를 격납한다.

다음 설명을 통해 더욱 잘 이해하게 되겠지만, 예를들어, X=2 또는 X=4에서의 마찰음-형 상태를 정하기 위해서, 마찰음-형 소리 에너지는 선정된 기간을 가져야 한다. 이 기간은 마찰음-형 에너지가 생기는 동안 10mSec 기간을 계수하는 변수 FCNT에 의해 측정된다. 이와 마찬가지로, 상기예의 X=2에서의 모음-형 상태는 변수 VCNT를 사용하여 격납되는 모음-형 평균 주파수가 예정된 기간동안 존재하도록 요구한다. 변수 SCNT는 유사한 방법으로 묵음 기간을 계수하기 위해 사용된다.

제3도에 도시된 순서를 참조하면, 단계(115 및 119)에서 변수 및 배열을 초기치 설정한 다음에, 마이크로프로세서(17)내의 제로크로싱 계수기(31)은 단기(121)에서 시동된다. 이것은 고이득 음성증폭기로부터 출력신호가 전치계수기(33)의 임계점, 이 예에서는 0.8V를 교차할 때마다 계수기(31)이 증가하게 한다. 귀한점 TT2는 제3도에 (123)으로 도시되어 있고 상술한 바와같이 시스템내에 루우프를 제공하도록 사용된다. 단계(125)에서, 10mSec의 지연은 제로크로싱 계수기가 단계(121)에서 시동된 직후에 즉시 시작된다. 이 10mSec 지연은 제2도에 도시한 타이머(31) 및 타이머 제어장치(35)에 의해 측정된다. 이 10mSec 지연이 끝날때, 제2도의 RAM(27)내에 격납된 변수ZCRA는 계수기(31)내의 계수, 즉 이 10mSec 기간동안의 모든 제로크로싱 계수와 같게 된다. 단계(127)에 도시한 바와같은 격납된 이 값으로, 제로크로싱 계수기(31)은 즉시 리셋트되고 단계(129)에서 다시 시동되므로, 다음 10mSec 기간동안의 제로크로싱 데이타는 누적되고 RAM(27)내에 변수 ZCRA로 격납된 제1의 10mSec 기간으로부터의 제로크로싱데이타는 분석된다. 마이크로프로세스 시스템은, 제1의 10mSec 시간데이타에 관련될 때, 모든 나머지 과정부분을 단계(125)에서 10mSec 지연이 끝나기 전에 충분히 완료시킬 수 있을만큼 신속하다. 그러므로 다음 설명에서 알 수 있는 바와같이, 이 최초의 10mSec 데이타가 분석된 후, 프로그램을 단계(125)에서 다음의 10mSec 기간이 끝나는 것을 기다리기 위해 지점 TT2(123)으로 귀환되므로, 다음의 제로크로싱 계수는 단계(127)에서 기록될 수 있다.

인력제로크로싱 계수를 분석할 때의 제1단계는 이 계수와 2를 비교하는 것이다. 만약 제1도에 도시한 바와같이 제로크로싱 계수기 2보다 작으면, 선로(75)를 통해 이 시스템으로 들어가는 주요 에너지는 200㎐ 이하로 되거나, 제로크로싱이 없는 경우에는 존재하지 않게된다. 이것은 묵음 기간으로 해석된다. 그러므로, 단계 (131)에서 생기는 비교는, 제로크로싱 계수가 2보다 작을 경우에 단계(133)으로 계속된 과정을 실행하도록 명령하고 제로크로싱 계수가 2보다 클 경우에는 루우프지점 TT9(135)로 가도록 명령하는 유통도 분기단계를 정한다. 다시 말하면, 이 10mSec 기간동안, 선로(75)(제2도)상의 입력신호가 묵음을 나타내면, 순서는 단계(133)으로 계속된다. 한편, 인지가능한 소리가 나타나면, 프로그램은 TT9(135)로 점프하게 된다.

만약 이 특정한 10mSec 기간동안 ZCRA 레지스러 위치내에 격납된 제로크로싱 계수가 묵음을 표시하는 2보다 작다고 가정하면, 단계(133)은 묵음 계수변수인 변수 SCNT를 증가시키므로, 이 변수는 묵음의 1개의 10mSec 기간을 표시하는 1과 같게된다. 다음 설명에서 알 수 있는 바와같이, 변수 SCNT는 실제 묵음 상태의 존재여부를 결정하도록 모든 10mSec 묵음 증가수를 계수하기 위해 사용된다. 물론, 이미 설명된 순서에서, 만약 모든 과정이 곧 시작되면, 이 최초 묵음 증가는 인지될 언어소리가 아직 시작되는 않았다는 것을 나타낸다. 이 사실은 현재의 세그먼트, 즉 감시된 가장 최근의 상태가 0과 같거나 묵음인가의 여부를 결정하도록 0과 값 SEG(X)을 비교하는 단계(137)에서 결정된다. 프로그램 작동이 시작할 때의 예에서, SEG(X)가 단계(119)에서 0과 같게되므로, 분기 단계(137)은 지점 TT12(139)에서 계속하도록 순서를 명령한다. 이 귀환점 TT12(139)는 제3도의 유통도의 밑에 도시한 귀환점(139)로 순서를 점프시킨다. 그러므로, 이미 설명한 바와같이, 현재 묵음 상태에 있고, 다른 묵음 증가를 측정하며 단계(133)에서 묵음 계수를 증가시켰다.

귀환점(139)는 FCNT 변수 및 VCNT변수가 0으로 셋트되는 단계(141)에서 순서를 계속한다. 모든 묵음 계수는 다음에 단계(143)에서 10진법으로 16인 16진법숫자 10과 비교된다. 본래, 이 단계(143)은 묵음 계수가 10mSec의 16배, 또는 160mSec의 모든 묵음기간을 표시하는 16에 도달하는지의 여부를 결정한다. 이 묵음 계수가 16보다 작으면, 프로그램은 더 큰 제로크로싱 10mSec 데이타를 받아들이도록 이미 설명된 귀환점 TT2(123)으로 분기된다. 그러나, 16묵음 계수가 있으면, 순서는 단계(145)에서 계속된다.

단계(145)에서, 변수(X)는 어떤 상태가 이 단어에 대해 기록되었는지의 여부를 결정하기 위해 0과 비교된다. 특히, 이 단계(145)는 순서가 단어의 처음부분을 기다리는가의 여부를 결정하기 위한 검사단계이다. 만약 X가 0와 같으면, 프로그램은 변수와 비열이 단계(115 및 119)에서 다시 초기치 설정되고 정보수집이 단계(121)에서 다시 시작되게 하는 귀환점 TT16(117)로 되돌아간다.

이때, 프로그램이 각각의 160mSec의 묵음 자체를 다시 초기치 설정하는 상기 순서를 통해 계속적으로 루우프된 후에, 단어는 선로(75, 제2도)상에 최초의 의미(meaning ful) 제로크로싱 데이타를 제공함으로써 말하여진다. 이때, 10mSec 셈플링 기간이 2 이상의 ZCRA 제로크로싱 계수를 만들면, 단계(131)은 프로그램을 귀환점 TT9(135)는 제4도에 초기단계로 도시된다.

제4도는 현재의 셈플이 선로(75, 제2도)상의 인력단어가 묵임이 아닌 것을 표시할때 지점(TT9, 135)에서 시작된다. 이때 소리가 이 10mSec 기간내의 마찰음-형 또는 모음-형인가의 여부가 결정되어야 한다. 이 검사는 0과 현재 상태 SEG(X)을 비교하는 분기단계(147)에서 시작된다. 이 예에서, 만약에 순서가 언어소리의 초기에 있으면, SEG(X)가 단계(119)에서 0으로 셋트된 것을 상기하게 되므로, 순서는 분기단계(149)로 계속된다. 이 단계에서, 제로크로싱 계수 ZCRA는 16진법값 10이나 10진법값 16과 비교된다. 제로크로싱 계수가 단계(131)에서 결정된 바와같이, 16보다 작고 그보다 크면, 제1도에 도시한 바와 같이, 시험된 10mSec 기간동안의 평균주파수는 200㎐보다는 크고 1600㎐보다는 작게되므로, 모음-형소리로서 해석된다. 그러므로, 귀환점(151)을 통과한 후, 단계(153)은 모음-형 10mSec 기간을 계수하기 위해 사용되는 변수 VCNT를 증가시킨다. 단계(155)에서 변수 VCNT의 값, 즉 모음-형 10mSec 기간의 모든 수는 모음-형 기간을 60mSec 가졌는지의 여부를 결정하기 위해 6과 비교된다. 이 예에서, 분기단계(155)는 단어가 금방 시작된후 VCNT 값이 단계(153)에서 1로 증가되는 것을 표시하고, 순서는 부수적인 10mSec 입력데이터를 수집하기 위해 귀환점(TT2, 123)으로 귀환된다. 그러므로, 단일의 10mSec 셈플링 기간이 모음-형 상태를 정하기에 불충분하기 때문에, 아직 상태가 인지되지 않았다. 그러나, 변수 VCNT는 단어가 200㎐ 내지 1600㎐ 사이의 주파수에서 주요 에너지를 갖고 있는 소리로 실제로 시작되는가를 결정하기 위해 모음-형 10mSec 기간을 계속 계수할 수 있도록 증가된다.

귀환점 TT2(123)으로 귀환시킴으로써, 단계(153)이 변수 VCNT를 5값 6으로 증가시키도록 5개의 부가시간이 상술한 순서 다음에 온다면, 순서는 포인터변수 X가 증가되는 단계(157)로 계속되므로, 포인터 변수 X는 인지될 단어내의 제1상태를 확인하는 1과 같이 된다. 단계(159)에서, SEG(X)의 제1값은, SEG(1)에 대하여 모음-형 상태를 표시하는 1로 셋트된다.

단계(159)에서 제1상태를 정하면, 프로그램은 귀환점 TT4(164)를 거쳐, 6개의 모든 모음-형이 증가하게 되는 기간동안 묵음 계수 및 마찰음-형 계수가 사이에 끼어드는 경우에 변수 SCUT 및 VCNT가 0으로 셋트되는 단계(163)으로 계속되므로, SCNT 및 FCNT 변수의 새로운 계수가 다시 시작되고, 순서는 제3도에 도시한 귀환점(123)으로 계속된다.

이 단어의 초기에 모음형 소리가 아니라 마찰음형 소리가 선로(75, 제2도)상에 나타나면, 단계(140)에서의 분기검사는 1600㎐ 이상의 평균 소리 주파수를 표시하는 16진법값 10 또는 10진법값 16 이상의 제로크로싱 계수를 만들게 된다. 이 경우에 순서는 귀환점 TT7(165)를 거쳐 마찰음형 10mSec 샘플을 계수하는 FCNT 변수를 증가시키는 단계(167)로 계속된다. 다음에 변수 FCNT는 마찰음형 소리의 20mSec의 모든 수가 감시되고 있는가의 여부를 결정하기 위해 단계(169)에서 값2와 비교된다. 20mSec 이하의 마찰음형 소리가 최종상태 확인 후에 감시되면 프로그램은 지점 TT2(123)으로 되돌아오게 된다. 그러나 변수 FCNT가 값 2와 같거나 이 값보다 크면 분기단계(171)은 가장 최근에 정해진 단어상태가 모음형소리인가의 여부를 결정하도록 값 1과 가장 최근에 정해진 단어상태, 즉 SEG(X)를 비교한다. 설명한예에서 SEG(X)가 0으로 셋트되므로 프로그램을 변수, VOWL(X)가 0으로 셋트되는 단계(173)으로 계속되고, 프로그램은 지점 TT14(175)로 귀환된다는 것을 알 수 있다. 프로그램이 지점 TT14(175)로 귀환되는 경우에 단어의 초기이외의 다른 부분은 모음형 소리가 마찰음형 소리보다 선행할 때 모든 모음 계수 변수 VCNT를 격납시키는데 이용될 수 있다. 그러므로 분기단계(171)에서 검사가 가장 최근에 감시된 상태가 모음인 것을 표시하면 프로그램은 귀환점 TT15(177)을 거쳐 증가단계(153)에서 이미 격납된값 VCNT와 같게 변수 VOWL(X)를 셋트시키도록 계속된다. 이것은 단계(179)에서 생긴다. 그 다음 이 과정은 이미 기술한 단계(159)와 유사한 방법으로 단계(183)에서 마찰음형소리, 즉 그로 SEG(X) 배열내의 다음 상태를 정하기 위해 이미 설명한 단계 (157)과 유사한 방법으로 귀환점 TT14(175)를 거쳐 단계(181)에서 X를 증가시키도록 계속되고, 귀환점 TT17(185)거쳐 계속된다. 이미 설명한 단계(163)과 유사한 방법으로 단계(187)에서의 순서는 변수 SCNT 및 VCNT를 리셋트시키고, 부수적인 데이타를 수집하기 위해 제3도의 단계(123)의 지점(TT2)로 프로그램을 귀환시킨다.

상술한 설명으로부터 분기단계(147)에서 결정된 것과 같이 이전의 상태가 묵음이었다면 60mSec의 모든 모음형 기간은 모음형 상태로 정해지게 되고 20mSec의 모든 마찰음형 기간은 인지될 이 단어의 제1상태와 같이 마찰음형 상태로 정해지게 된다는 것을 알 수 있다.

근본적으로 지금까지 설명한 것은 특정한 상태로 인입데이타를 받아들이도록 시스템의 순서내의 선정된 시간, 이 경우에는 모음형 소리에 대한 60mSec와 묵음 다음의 마찰음형 소리에 대한 20mSec 동안 예정된 상태가 계속되므로 하는 시스템내의 히스테리시스 형태이다.

다음 설명으로 알 수 있는 바와 같이 이전상태를 식별하는 것은 특정한 소리가 모음형인지 마찰음형인지를 결정하기 위해 사용되는 주파수 식별을 변화시키기 위해 사용된다. 그러므로 단계(149)에서는 이전 상태가 상태(147)에서 묵음으로 정해졌기 때문에 160㎐ 이상의 주파수가 마찰음형으로 정해진다. 다음 설명으로부터 알 수 있는 바와 같이 최근에 정해진 상태가 모음이라면 특정한 10mSec 기간은 이 기간의 평균 주파수 크기가 2400㎐를 초과하지 않는 한 마찰음형으로 정해지지 않게 된다. 이것은 모음형 소리에서 마찰음형 소리로 통과하기 위한 임계값이 증가되는 경우에 착오율이 감소되기 때문에 묵음 다음의 마찰음형 소리보다는 모음 다음의 마찰음형 소리를 인지하기가 더욱 어렵게 하는 부수적인 히스테리시스 형태이다. 그러므로 단계(169 및 155)에서 각각 필요로 하는 마찰음형 및 모음형 기간에 의해 발생한 시스템의 기본 히스테리시스 이외에도 가변 히스테리시스가 이전의 단어 상태에 따라 모음형 및 마찰음형 10mSec기간 사이의 주파수 전이점을 변화시킴으로써 시스템내에 도입된다.

다음 순서는 이 히스테리시스 원리를 설명한다. 단계(147)에서 가장 최근에 정해진 단어상태가 묵음이 아니었다고 결정되었으면 프로그램순서는 귀환점 TT8(189)를 거쳐 이전의 단어상태가 SEG(X)을 값 1과 비교함으로써 모음형 소리였는지의 여부를 결정하는 분기단계(191)로 계속된다. 만약 이전의 상태가 모음형 소리였다면, 순서는 제로크로싱계수가 2400㎐의 평균 주파수를 표시하는 16진법값 18, 즉 10진법값 24와 비교되는 분기단계(193)으로 분기된다. 이 값이 2400㎐를 초과하지 않으면 프로그램은 모음형으로 이 10mSec 기간을 확인하는 변수 VCNT를 증가시키며, 순서를 전술한 귀환점 TT4(161)로 귀환시키는 단계(195)로 진행된다. 한편, 분기지점(193)에서 주파수 크기가 2400Hz를 초과하면 프로그램은 전술한 귀환점 TT7(165)로 진행하여 단계(167)에서 변수 FCNT를 증가시키게 된다. 그러므로 마찰음형 10mSec기간에 대한 임계 주파수는 이전의 기록된 단어상태가 모음인지 아니면 묵음상태인지의 여부에 따라 변한다.

분기단계(193)은 이전상태가 모음형 소리일 경우, 즉 단계(155)에서 처리된 검사가 모음형 수리의 60mSec가 생긴것을 이미 표시하고 배열 SEG(X)가 모음형 상태를 표시하도록 단계(159)에서 셋트된 경우에만 도달하게 된다는 것을 주목해야 한다. 물론 1개의 모음형 상태가 다른 모음형 상태 다음에 오는 것은 이것이 비교적 긴모음소리라는 것을 표시하기 때문에 바람직하지 못하다. 그러므로 단계(195)에서 생기는 VCNT의 중가 및 귀환점 TT4(161)로의 프로그램 귀환은 다른 묵음이나 마찰음형 소리의 기간이 나타날 때까지 모음형 상태가 정해질 때 연속모음형 기간이 누산되게 하므로 부수적인 모음형 기간은 부수적인 모음형 상태를 만들지 많게 된다.

이와 마찬가지고 분지(191)에서 SEG(X)와 1을 비교한 것이 이전상태가 1이 아니라는 것을 표시하면 분기단계(147)이 이전상태가 묵음이 아니라는 것을 표시하기 때문에 프로그램은 이전상태가 마찰음형소리를 확인한 경우에 단계(197)로 분기된다. 이 경우에 가장 최근의 10mSec기간에 대한 제로크로싱 데이타가 16을 초과하면 가장 최근의 마찰음형 상태를 만드는 마찰음형 소리가 계속되고, 프로그램은 2개의 연속 마찰음형 상태가 비교적 긴 바찰음형 소리가 아니라 연속위치내의 단어내에 있는 2개의 마찰음형태를 잘못 표시하기 때문에 프로그램이 부수적인 마찰음형 상태를 만들지 않고서 부수적인 마찰음형 10mSec기간을 누산할 수 있도록 이미 설명한 귀환점 T T7(185)로 분기된다. 한편 이전상태가 마찰음형 소리였고, 가장 최근의 10mSec기간 샘플이 1600Hz이하의 평균 주파수를 발생시키면 분기단계(197)은 모음형 소리의 초기를 확인하도록 프로그램을 이미 설명한 귀환점 TT6(151)로 귀환시키게 된다.

단계(195) 다음에 단계(155)에서 정해진 계수 6이상의 모음형 계수가 계속되면 프로그램은 10mSec샘플이 연속적으로 생기지 않는한 때때로 모음형소리 중간의 마찰음형 기간과 묵음형 기간이 묵음상태나 마찰음형 상태를 잘못 표시하도록 누산되지 않게 하기 위해서 변수 SCNT 및 FCNT를 0로 셋트시키도록 귀환점(161)로 귀환된다는 것을 아는 것이 중요하다. 그러므로 단일의 마찰음형 및 묵음샘플 기간이 모음형 계수순서 중간에서 생기는 동안에 변수 SCNT 및 FCNT는 이들 변수의 불연속 계수를 누산하지 못하도록 0로 된다.

이와 비슷한 순서는 마찰음형 소리가 나고 분리된 묵음기간 및 모음형 기간만이 생기는 동안 단계(187)에서 변수 SCNT 및 VCNT를 리셋트시키는 귀환점 TT17(185)에서도 생간다.

제3도를 다시 참조하면 순서는 어떤 소리가 나타나서 비묵음 기간을 표시한 경우에 분기단계(131)로부터 귀환점 TT9(135)로 분기되고, 단계(137)에서 묵음기간이 단어의 맨 처음에 있다면 순서는 귀환점 TT12(139)로 분기된다는 것을 알 수 있다. 분기단계(137)에서 가장 최근에 기록된 단어상태가 묵음이 아니라는 것이 결정되면 단계(131)에서 현재의 10mSec샘플 기간이 묵음상태인 것을 결정하기 때문에 순서는 변수 SCNT의 현재값이 값 3과 비교되는 단계(199)로 분기된다. 즉 폭음기간이 음성에너지가 파열음 소리로 격납되는 동안 음성통로의 전파열음 폐쇄와 같이 단어내의 짧은 묵음상태를 포획하기에 충분한 시간인 30mSec를 초과하는지의 여부에 따라서 결정된다. 만약 변수 SCNT가 3을 초과하지 않으면 프로그램은 더 많은 기간 데이타를 수집하기 위해 귀환점 TT2(123)으로 분기된다. 만약 변수 SCNT가 값 3을 초과하면 프로그램은 가장 최근에 기록된 단어상태가 모음형 소리인지의 여부를 검사하기 위해 분기단계(201)로 계속된다. 만약 묵음상태 이전의 최종상태가 모음형 상태라면 프로그램은 귀환점 TT1g(203)을 통해 변수 VOWL(X)가 단계(179, 제4도)에서 모음형 소리의 전체 기간과 같게 이미 세트된 변수 VCNT와 같에 셋트되는 단계(205)로 계속된다. 가장 최근의 상태가 마찰음형 소리였다면 분기단계(201)은 프로그램을 단계(207)로 계속시키게 되는데, 이 단계에서 변수 VOWL(X)는 0로 리셋트된다. 그 다음 순서는 귀환점 TT19(209)를 통해 값 X가 증가되는 단계(211)로 계속되며, 묵음계수변수 SCNT가 3)단계 199)을 초과하기 때문에 변수 SEG(X)는 단계(213)에서 묵음상태를 정하도록 셋트된다. 동시에 변수 VOWL(X)는 단계(211)에서 X가 증가함에 따라 위치가 단계(205)에서 셋트된 후 VOWL 배열내의 다음 연속위치로 되도록 리셋트된다.

상술한 바와 같이 이때 단계(141)은 변수 SCNT 및 FCNT를 리셋트시키고, 묵음의 전체기간, 즉 변수 SCNT의 값이 16을 초과하는지의 여부를 결정하도록 단계(143)에서 비교를 하게 된다. 묵음계수가 160mSec를 초과하면 상술한 바와 같이 이전의 단어 상태가 기록되어 있는지의 여부가 단계(145)에서 결정된다. 만약 단어상태가 기록되어 있으면 160mSec의 묵음 기간은 단어의 마지막을 표시하기에 충분히 길게 정해지므로 프로그램은 단어내의 모든 상태수를 표시하는 변수 N이 기록되어 있는 모든 단어 상태수를 정하는 변수 X와 같게 셋트되는 단계(147)로 분기된다. 단계(147)이 끝나면 순서는 귀환점 TT23(215)를 통해 제5도에 도시한 단계의 순서로 계속된다.

다음 설명으로부터 알 수 있는 바와 같이 제5도의 단계순서는 최종 기록 단어상태가 단모음형 소리인가를 결정하도록 이 최종기록 단어상택을 조사하기 위해 사용된다. 단어의 끝에서의 단모음형 세그먼트가 마찰음형 소리의 끝에서의 에너지 감쇠 대신에 가끔 모음표시를 잘못하기 때문에 제5도에 도시한 단계의 순서는 이러한 단모음형 어미소리를 상태순서로부터 제거하기 위해 사용된다.

처음에 순서가 모든 단어를 160mSec기간을 초과하는 묵음상태 어미로 정하기 때문에 변수 X가 이미 기술한 바와 같이 묵음인 최종 기록상태를 표시하도록 변수 X는 단계(217)에서 변수 N과 같게 셋트된다. 단계(219)에서 변수 N는 어미 묵음 이전에 다음의 이전 단어상태를 확인하기 위해 증가된다. 이 다음의 선 단어상태는 단계(221)에서 이 상태가 모음형 소리였는지를 결정하도록 값 1과 SEG(X)을 비교하므로서 확인된다. 만약에 모음형 소리라면 프로그램은 제6도에 도시한 귀환점 REC(223)으로 분기된다. 한편 어미묵음선에 기록된 최종 단어상태가 모음형 소리이면 분기단계(225)는 16진법값 10 또는 10진법값 16과 단계(205, 제3도)에서 셋트된 변수 VOWL(X)를 비교하므로서 160mSec와 이 모음형 소리의 전체기간을 비교한다. 모음형 소리가 160mSec를 초과하면 순서는 귀환점TT22(227)로 계속된다. 한편 어미모음형 소리가 160mSec기간보다 짧으면 이것은 잘못된 어미모음으로 결정된다. 이 때문에 이 잘못된 상태를 효과적으로 제기시키도록 변수 X와 N을 감소시키기 위해 단계(229)가 사용된다. 그 다음 잘못된 어미 모음형상태 직전에 묵음상태가 생겼는지를 결정하기 위해 단계(231)이 사용된다. 묵음 상태가 이 잘못된 모음형 상태보다 먼저 생기지 않으면 순서는 귀환점 REC(223)으로 계속된다. 그러나 묵음상태가 잘못된 모음형 상태보다 먼저 생기면 묵음상태가 잘못되므로 단계(233)에서 값 X와 N이 잘못된 묵음상태를 제거시키도록 다시 감소된다.

배열 SEG(X)가 기록된 잘못된 상태를 제거시키도록 리셋트되지 않아도 제6도로부터 알 수 있는 바와같이 값 N의 감소로 단어인지 순서에 있게 되는 잘못된 상태를 효과적으로 감소시킨다.

그러므로 잘못된 어미상태를 제거하면 프로그램은 값 2와 변수 N을 비교하는 분기단계(235)로 귀환점(227)로부터 계속된다. 변수 N은 기록된 최종 상태가 단어의 끝에서 묵음상태이기 때문에 상태순서내의 실제의미(meaningful)상태의 수보다 1이 더 크다는 것을 알 수 있다. 그러므로 N과 2를 비교하면 상태순서내에 한 개 이상의 의미상태가 있는지의 여부가 결정된다. 변수 N이 2를 초과하면 의미상태 순서가 정해지고 단기순서는 제6도의 단계(223)으로 분기된다. N의 값이 값 2보다 작거나 이 값과 같으면 단계(237)은 값이 1 인지 2 인지를 결정하도록 다시 값 2와 값 N을 비교한다. 값이 1이면 단일상태가 단어의 끝에서 묵음으로 되어 의미상태 순서가 없게 되기 때문에 모든 상태순서가 제거된다. 그러므로 프로그램은 제3도의 귀환점 TT16(117)로 귀환된다.

분기단계(237)에서 N의 값이 2이어서 단어내에 한개의 의미 워드 상태가 있다는 것이 결정되면 변수 VOWL(X)의 값은 단계(239)에서 480mSec의 모음형 기간을 나타내는 16진법값 30 또는 10진법값 48과 비교된다. 단어내에는 단일 모음형 상태만 있으므로 순서는 모음형 상태가 이 상태 자체의 의미를 나타내기 위해 최소한 480mSec기간을 갖기를 요구한다. 기간이 480mSec 이하이면 순서는 다시 초기치 설정을 하기 위해 제3도의 TT16(단계 117)로 귀환된다. 한편 모음형상태 기간이 480mSec를 초과하면 순서는 제6도의 귀환점 REC(단계 223)으로 계속된다. 단일상태 순서가 마찰음형 소리만을 포함하면 단계(187,제4도)은 값 VCNT를 0으로 셋트시킨다는 것도 알 수 있다. 그러므로 분기단계(239)는 순서를 다시 초기치 설정하도록 귀환점 TT16(117)로 프로그램을 귀환시키는 단일마찰음상태 순서를 효율적으로 제거시킨다.

제6도를 참조하면, 인지순서는 귀환점 REC(223)에서 시작하는 것으로 도시되어 있다. 이 순서는 마이크로프로세서(제2도)의 해독전용 메모리(19)내에 영구적으로 격납된 다수의 단어 템플레이트와 이미 기술한 배열 SEG(X)내에 격납된 상태순서에 의해 정해진 새로운 단어를 비교하기 위해 이용된다. 템플레이트는 다음의 포오멧에서 REF(IX)로 확인된 배열내에 격납된다.

[표 2]

포인터 IX는 배열 REF(IX)내의 연속적인 메모리 바이트를 정하기 위해 사용된다. 해독전용메모리(19)내의 각각의 단어템플레이트는 이 단어 템플레이트 내의 상태수를 설계하기 시작한다. 상기 표 2의 예에서 상태수는 REF(0)에 격납된 4이다. 이 초기설계다음에 단어템플레이트 내의 상태순서가 행해진다. 이 경우에, 상기 표 1과 마찬가지로, 영어단어 six의 전형적인 템플레이트는 다음의 순서로 격납된다 : 마찰음-형, 모음-형, 묵음, 마찰음-형, 즉 2102가 위치 IX=1내지 4에 격잡된다. 템플레이트가 3개의 상태 템플레이트를 가졌으면, 초기위치 REF(0)는 숫자 3을 갖고, 단지 3개의 상태 식별자만이 IX=1 내지 3을 뒤따르게 된다. 특정한 템플레이트에 관련된 단어를 확인하는 단어수 다음에는 상태순서가 뒤따르게 된다. 표 2의 경우에, 단어식별자 수는 REF(5)에서 상태순서 다음에 즉시 배치된 숫자 8이다. 이 경우에 숫자 8은 영어단어 6을 확인하고 마이크로프로세서(17)의 출력을 위해 사용된 임의 식별자이다.

표 2에 나타낸 바와같이, 다음의 연속적인 단어템플레이트는 위치 REF(6)의 제1단어 템플레이트 직후에 따르게 되고, 그후에 REF(6)에 격납된 다음의 템플레이트의 상태 수가 뒤따르게 된다. 그러므로 각각의 템플레이트는 상태순서 템플레이트가 상이한 길이를 값더라도 연속적인 위치 X에 있는 해독전용 메모리 내에 연속적으로 격납된다.

새로운 단어를 확인하기 위해서, 새로운 단어의 상태순서는 정확한 정합이 이루어질 때까지 해독전용메모리(19) 내의 각각의 단어템플레이트와 비교된다. 정확한 정합이 이루어질때, 표 2의 REF(5)에 격납된 수 8과 같은 단어수 식별자는 인지된 단어를 정하고 특정한 단어의 인지 결과에 따라 다른 시스템을 응답시키기 위한 마이크로프로세서의 출력이다.

제6도를 참조하면, 이 인지순서의 초기단계는 이미 기술한 바와같이 인지될 새로운 단어내의 전체 상태수를 정하는 변수 N을 감쇠시키는 단계(241)로 도시되어 있다. 값 N은 새로운 상태순서의 최종 묵음상태를 포함하고 단계(241)에서 감쇠시키는 것은 인지될 단어내의 이 최종 묵을상태가 없는 실제 의미 상태로 전체 상태수를 감소시키기 위해 사용된다. 그다음, 단계(243)에서, 변수 IX는 해독전용메모리(19, 제2도) 내의 템플레이트 배열초기에 비교순서를 시작하도록 0으로 리셋트된다. 이 순서는 귀환점 RI(245)를 통해 포인링 변수 Y가 값 1로 처음에 셋트되는 단계(247)까지 계속된다. 그다음, 단계(249)에서, 값 REF(IX)가 부(-)수 인지를 결정하도록 이 값을 비교하기 위해 분기검사가 이용된다. 해독전용메모리(19)내에 격납된 템플테이트 순서는 템플레이트 배열의 단부가 확인될 수 있도록 최종위치 REF(IX)에서 1부(-)수로 끝난다. REF(IX)의 현재 값이 부(-)인 경우에 분기검사(249)가 도달하면, 인지순서는 배열내의 템플레이트와 새로운 단어격납 순서사이를 완전하게 정합시키지 않고서 템플레이트 배열의 끝에 도달하게 되므로, 순서는 귀환점 TT16(117, 제3도)로 분기된다. 이것은 대부분 최근에 격납된 새로운 단어가 해독전용메모리(19)내의 인지가능한 템플레이트를 정합시키지 못하고 인지 순서가 완전히 다시 초기치 설정된다는 것을 나타낸다.

분기검사(249)에서, 값 IX는 항상 값 REF(IX)가 단어템플레이트의 상태수를 확인하도록 되어 있다는 것을 알 수 있다. 그러므로, 예를들어 표 2를 참조하면, 단계(249)에서의 값 IX는 0이나 6 또는 단어템플레이트내의 다른 초기숫자로 될 수 있다.

검사단계(249)에서 행해지는 비교가, 부수적인 단어템플레이트가 비교하는데 유용하도록 값 REF(IX)가 정(+)수라는 것을 나타내면, 순서는 귀환점 R2(251)을 통해 분기단계(253)으로 계속된다. 이 단계에서, 단어템플레이트내의 상태수를 정하는 값 REF(IX)와 새로운 단어내의 상태수를 저정하는 값 N 사이에 비교가 행해진다. 상태수가 다르면, 이 다음의 단어템플레이트는 새로운 단어상태 순서를 정확하게 정합시키지 못한다. 이 순서에서, 분기단계(253)은 IX+REF(IX)+2와 같은 값으로 값 IX를 리셋트시키는 단계(255)에서 순서를 계속한다. REF(IX)는 새로운 단어템플레이트내의 상태수와 같고 각각의 단어템플레이트는 상태순서 외에도 2개의 숫자를 포함하기 때문에, 단계(255)는 다음의 인접템플레이트 내의 상태수를 지적하는 이 다음의 인접템플레이트의 숫자를 확인하도록 지표 IX의 값을 증가시킨다. 이때, 순서는 해독전용메모리(19, 제2도)내의 다음의 템플레이트가 새로운 단어와 동일한 상태수를 갖고 있는지를 결정하도록 귀환점 R1(245)로 계속된다. 템플레이트가 새로운 단어의 상태수와 같게되면, 분기검사(253)은 지표값 IX가 증가하는 귀환점 R3(257)을 통해 단계(259)로 검사를 계속하게 된다. IX는 적당한 상태수를 갖고 있는 이 템플레이트내의 제1상태를 확인한는 것으로 인지된다.

귀환점 R6(261)을 통과한 후에, 이 다음 템플레이트의 제1상태, 즉 제1상태의 마찰음-형, 모음-형 또는 묵음확인이 단계(263)에서 레지스터 AC내에 격납된다. 그 다음, 단계(265)에서 지표값 IX는 레지스터 XTMP내에 일시적으로 격납되고, 단계(267)에서 지표 IX는 Y와 같게 셋트된다.

그다음, 단계(269)에서, AC 레지스터내에 격납된 값, 즉 시험되는 템플레이트의 제1상태와, SEG(IX)에 배치된 새로운 단어의 제1상태 사이에 비교가 행해진다. 이 상태들이 이 템플레이트가 새로운 단어를 정확하게 정합시키지 못한다는 것을 나타내는 것을 확인하지 않으면, 귀환점 R4(271) 다음의 단계순서는 해독전용메모리(19, 제2도) 내에 다음상태 템플레이트가 도달하게 한다. 이 순서는 정합하지 않는 단어 템플레이트내의 상태순서가 끝나게 되는지를 결정하도록 현재값 IX와 N을 비교하는 분리단계(273)에서 시작된다. 만약에 끝나지 않게되면, 단계(273)은 변수 IX와 XTMP가 증가되는 단계(275)에서 순서를 계속하고, 순서는 값 IX와 N을 다시 비교하도록 귀환점 R4(271)을 통해 귀환된다. 이 비교단계(273)이 템플레이트가 끝났다는 것을 나타내는 정합을 제공하면, 변수 XTMP는 다음의 템플레이트의 상태수를 확인하는 숫자에 포인터를 배치시키도록 2만큼 증가된다. 이 증가는 단계(277)에서 생긴다. 그다음 단계(279)는 변수 Y의 값을 IX와 같게 셋트하고 변수 IX의 값을 값 XTMP로 셋트시키고, 순서는 다음의 연속적인 템플레이트와 새로운 단어를 비교하기 위해 귀환점 R1(245)로 귀환된다.

단계(269)에서, 시험되는 템플레이트와 새로운 단어의 초기상태가 같으면, 순서는 비교가 완전히 끝나고 새로운 단어를 완전히 정합한다는 것을 나타내도록 템플레이트 상태순서가 끝났는지를 결정하기 위해 변수 IX와값 N사이를 비교하는 분기단계(281)에서 시작된다. 상태순서가 아직 끝나지 않으면, 순서는 변수 IX를 증가시키므로서 단계(283)에서 계속되고, 변수 Y를 IX와 같게 셋팅시키고 변수 IX를 XTMP와 같게 셋팅시키므로서 단계(285)에서 계속된다. 이때부터, 프로그램은 새로운 단어의 다음 상태와 시험되는 템플레이트의 다음 상태를 비교하기 위해 귀환점 R6(261)로 계속된다. 지점 R6(261)로의 이 귀환을 통하여, 각각의 단어상태는 템플레이트의 상태와 연속적으로 비교된다. 한 상태라도 다르면, 단계(269)에서 행해지는 비교는 순서가 시험되는 나머지 템플리에트에 관계없이 다음의 연속적인 템플레이트를 즉시 시험하기 시작하게 한다.

정확한 정합이 분기검사단계(281)에 의해 정해진 바와같이 템플레이트 배열내에 배치되어 있으면, 순서는 변수 Y를 IX와 같게 셋트시키고 변수 IX를 XTMP와 같게 셋트시키고 단계(287)에서 IX를 증가시키도록 귀환점 R5 (283)을 통해 계속된다. 단계(287)에서의 이 IX증가는 지표 IX가 단어 식별자 수가 템플레이트 배열내에 격납되게 하는 지점 REF(IX)를 지정하게 한다. 그러므로, 상기의 표 2를 다시 참조하면, 확인상태 순서가 배치되었을때 단계(287)에서 생기는 증가는, 예를들어 제1템플레이트가 정확하게 정합된 경우에 지표 IX를 위치 5로 증가시키어 값 REF(5)가 단어 식별자수 8을 확인하게 된다.

다음에 레지스터 ANS는 단계(289)에서 정합상태 템플레이트의 단어 확인수를 격납하도록 값 REF(IX)로 셋트된다. 이때 마이크로프로세서는 단계(290)에서 이 식별자수를 내보내고 모든 인지 순서를 반복하도록 귀환점 TT16(117, 제3도)로 귀환된다.

본 발명의 단어 인지 시스템의 사용방법에 대해서 다음의 예를 참조하여 기술하겠다. 제2도에 도시한 바와 같이, 출력단자 B23은 아랫자리 비트 BO가 한쌍의 스위치 접점(303)을 작동시키는 계전기 코일(303)에 접속되도록 접속될 수 있다. 이와 마찬가지로, 다음의 아랫자리 비트 B1은 스위치 쌍(307)을 작동시키는 계전기 코일(305)에 접속될 수 있다.

마이크로프로세서(17), 고이득 음성 증폭기(13), 마이크로폰(11), 및 이 시스템용의 밧데리 전력 공급원을 포함하는 전체 시스템은 소형 장난감 로보트내에 수용될 수 있다. 이 경우에, 장난감 로부트는 예를들어 로보트의 헤드를 회전시키도록 접속된 모터(309)와 로보트가 걸어가게하기 위해 트랙터 매카니즘을 구동시키도록 접속된 제2모터(311)을 포함한다. 로보트 헤드 회전기(309)는 스위치(303)에 의해 작동되고, 로부트 트랙터 동작은 스위치(307)에 의해 제어된다. 단자 B23으로 부터의 출력단어가 2진수 01로 있으면, 로보트의 헤드는 비트 BO에서의 2진 1출력이 스위치(303)을 폐쇄시키도록 계전기(301)을 작동시키기 때문에 회전하게 된다. 이와 마찬가지로 B23으로 부터의 10진법 값 2와 동가인 2진수 10의 출력이 계전기(305)를 작동시키어, 스위치(307)을 폐쇄시키고 로보트가 걸어가게 한다. 이와 마찬가지로 단자 B23으로부터의 2진수 00의 출력은 로보트의 모든 동작을 정지시키게 된다.

다음의 표 3은 영어로 말한 단어 "조사(search)", "정지(stop)", "헤드 전진(go head)"를 인지하기 위해 마이크로프로세서(17)의 해독 전용 메모리(19)내에 격납될 수 있는 상태 순서 템플레이트의 일예이다.

[표 3]

이 상태 순서 템플레이트는 상기 표 2의 형태로 되어 있고, 각각의 순서내의 상태수를 확인하는 제1숫자와 단자 B의 출력을 확인하는 최종 숫자, 이 경우에는 이미 정해진 2진수 0, 1 또는 2를 갖고 있다.

표 3에 작성된 템플레이트로 부터, 영어 단어 "조사(search)"와 "헤드 전진(go head)"가 매우 명확한 상태 순서를 제공하는 동안, 단어 "정지(stop)"가 단어를 말하는 특정 개개인에 따라 변하는 다양한 상태순서를 제공한다는 것을 알수 있다. 이 때문에, 다중 상태 순서가 단어 "정지(stop)"에 대한 마이크로프로세서의 인지능력을 확대하도록 이 단어의 템플레이트 격납고 내에 격납된다.

표 3과 제2도 내지 제6도를 참조하여 기술한 상술한 내용으로부터, 단어 "조사(search)", "정지(stop)" 및 "헤드 전진(go head)"를 마이크로폰(11)에 말하므로서, 사용자는 선택하는 명령에 따라서 로보트가 헤드를 회전하게 하고, 정지하게 하며 걸어가게 한다. 물론 이것은 간단한 예에 불과한 것으로 본 발명을 이용하는 것을 나타낸 것이다. 스위치(307 및 303)과 단(21, 23 및 25)에 접속된 그외의 다른 여러가지의 스위치들이 말한 단어의 확인에 따라서 여러 소비자나 공업 제품을 제어하도록 사용될 수 있다.

다음의 표 4는 양호한 실시예에 사용된 모토로라 모델 Mc 6805 P2 HMOS 마이크로 컴류터에 부합될 수 있는 컴퓨터프로그램을 작성한 것이다. 물론 제3도 내지 제6도의 유통로와 상술한 설명을 이용함으로써, 다양한 컴퓨터 프로그램 또는 특수 목적 컴퓨터 장비를 사용하여 본 발명을 실시할 수도 있다.

[표 4]

상술한 로보트 예로부터, 본 발명은 인지가능한 어휘를 신중하게 미리 선택함으로써 스피커에 무관하게 비교적 낮은 착오율을 제공한다는 것을 알 수 있다. 그러므로, 표 3으로부터, 인지가능한 단어 "조사(search)", "정지(stop)" 및 "헤드 전진(go head)" 중 아무것도 확인상태 템플레이트를 갖고 있지 않다는 것을 알 수 있다. 이것은 이 3개의 말한 단어 사이를 정확하게 식별하지만 동일한 언어로 이와 다른 유사한 단어로부터 이 단어들을 식별하지는 못한다. 그러므로 시스템 하드웨어를 간단하게 하여 인지시스템의 제조가격과 복잡성을 현저하게 감소시키기 위하여 인지가능한 그룹의 외측의 단어로부터 인지가능한 단어를 식별하는 것에 대한 이 무능력을 제외한다.

상술한 시스템은 여러가지 중요한 특징을 포함한다. 처음에 말한 소리는 주기적으로 샘플되고 각각의 샘플들은 시스템 전단부 휠러를 사용하지 않고서 제로 크로싱 데이타만을 사용하요 마찰음형, 모음형 및 목음기간으로 식별된다. 이 기간의 연속적이 그룹들이 계수되며 이 계수는 시스템이 마찰음형상태, 모음형상태 또는 묵음상태를 정하도록 선정된 수에 도달해야 한다. 특정한 상태가 존재하는 것을 정하기 위해 사용된 특정한 샘플 수는 단어내의 이 상태의 위치에 따라서 변하게 된다. 예를 들면 단어의 끝에서의 모음소리는 모음형 상태로 인지되기 위해 160mSec기간을 가져야 하고, 단어의 중간에서의 모음소리는 모음형 상태로 인지되기 위해 단지 60mSec의 기간을 가져야 한다.

상태를 인지하기 위한 다중, 연속, 동일 기간의 요구사항은 시스템 히스테리시스의 제1명령을 효과적으로 제공한다. 왜냐하면 마찰음형으로부터 모음형으로 평균 주파수 성분을 변화시키려면 예를 들어 모음형 순서가 인지되기 전에 선정된 기간 동안 모음형 평균이 유지되어야 하기 때문이다.

시스템 히스테리시스의 제2형태는 마찰음형 또는 모음형으로 특정한 샘플이 증가하는 것을 확인하기 위해 사용된 제로크로싱수를 변화시키므로서 제공된다. 예를 들어 이전 상태가 묵음이었으면 1600Hz이상의 평균 소리주파수를 나타내는 10mSec내의 제로 크로싱 계수 16은 마찰음형 기간을 만들게 된다. 그러나 이전의 상태가 모음형 상태이었으면 제로크로싱 계수는 이전의 묵음 상태의 경우보다 더 높은 2400Hz이상의 주파수 평균을 나타내는 24를 초과한다. 이것은 모음영 소리의 끝이 실제 마찰음형 소리를 나타내지 않는 1600 내지 2400Hz 사이의 범위내의 주파수 성분을 종종 형성한다는 것을 결정하기 때문에 모음형 소리로부터 마찰음형 소리로 변환시키기가 더욱 어렵게 한다. 그러므로 이 제2명령 히스테리시스는 이전의 상태에 대라 변하는 변수이다.

이 시스템은 짧은 모음형 상태가 실제 모음어미가 아니라 마찰음형 소리의 끝에서의 에너지 소모로 인해 종종 생긴다고 결정되었기 때문에 상태 순서의 끝에서 이 짧은 모음형 상태를 제거시키기도 한다.

Claims

언어인지회로에 있어서, 상기 언어에 의해 결정된 주파수를 가진 AC전기 신호를 발생시키기 위한 회로(13), 상기 AC전기 신호를 임계 전기 신호 레벨과 비교함으로써 디지탈신호를 발생시키기 위한 검출기(33), 기간을 정하기 위한 클럭회로(35), 디지탈계수 신호를 발생시키도록 상기 기간내의 상기 디지탈신호를 계수하기 위해 상기 클럭회로와 상기 검출기에 접속된 계수회로(31), 언어 식별 디지탈 신호를 발생시키도록 상기 디지탈 계수신호를 분석하고 상기 언어 식별 디지탈 신호가 상기 다수의 언어템플레이트 중의 정합 언어 템플레이트에 대응하는가를 결정하기 위해 메모리(19)내에 격납된 다수의 언어템플레이트 디지탈 신호와 상기 언어 식별 디지탈 신호를 비교하기 위한 회로 및 상기 정합 언어 템플레이트를 식별하기 위한 출력신호 발생기(23)으로 구성된 것을 특징으로 하는 언어 인지마이크로컴퓨터.
제1항에 있어서, 사용시에 상기 분석회로가 마찰음형기간, 모음형기간, 또는 묵음기간으로 상기 기간동안 상기 언어를 분류하도록 다수의 계수 임계값과 상기 디지탈 계수신호를 비교하는 것을 특징으로하는 언어 인지 마이크로컴퓨터.
제2항에 있어서, 상기 분석회로가 사용시에 상기 다수의 계수 임계값을 변화시키는 것을 특징으로 하는 언어 인지 마이크로컴퓨터.
제3항에 있어서, 상기 분석회로가 사용시에 상기 다수의 계수 임계값들을 이전의 가간내의 상기 언어 분류에 따라 변화시키는 것을 특징으로 하는 언어 인지 마이크로컴퓨터.
제1항 내지 제4항중의 어느 한 항에 있어서, 상기 AC전기 신호 발생 회로가 상기 언어에 의해 포화되도록 작동된 고이득 증폭기(13)을 포함하는 것을 특징으로 하는 언어 인진 마이크로컴퓨터.
제5항에 있어서, 상기 AC전기 신호 발생회로가 상기 증폭기에 언어입력을 제공하기 위한 마이크로폰(11)을 포함하는 것을 특징으로 하는 언어 인지 마이크로컴퓨터.
제1항 내지 제4항중 어느 한 항에 있어서, 상기 분석회로가 상기 다수의 언어 템플레이트 디지탈신호를 격납하는 해독전용 메모리(19)를 포함하는 것을 특징으로 하는 언어 인지 타이크로컴퓨터.
제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 디지탈 계수 신호가 상기 기간 동안 상기 AC전기 신호의 평균 주파수를 나타내는 것을 특징으로 하는 언어 인지 마이크로컴퓨터.
언어신호를 인지하기 위한 방법에 있어서, 상기 언어 신호의 주파수 크기를 식별하는 아날로그 전기 신호를 제공하는 수단, 상기 아날로그 전기 신호가 상기 임계값과 교차할 때 디지탈 신호를 제공하도록 상기 아날로그 전기 신호를 임계값과 제일 먼저 비교하는 수단, 디지탈 계수선호를 발생시키기 위해 다수의 선정된 시간 중가 동안 상기 디지탈 신호를 제일 먼저 계수하는 수단, 상기 다수의 시간 증가 동안 상기 언어신호의 평균 주파수 크기를 식별하도록 다수의 계수 임계값과 상기 디지탈 계수신호를 두번째로 비교하는 수단, 상기 언어 신호에 대한 상태순서를 제공하도록 유하한 평균 주파수 크기를 갖고 잇는 상기 다수의 시간 증가 중의 연속적인 것을 두번째로 계수하는 수단 및 상기 언어 신호를 인지하도록 다수의 격납된 상태 순서 템플레이트와 상기 상태 순서를 세번째로 비교하는 수단을 포함하는 것을 특징으로 하는 언어 인지 마이크로컴퓨터.