CS219763B1 - Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku - Google Patents
Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku Download PDFInfo
- Publication number
- CS219763B1 CS219763B1 CS811485A CS148581A CS219763B1 CS 219763 B1 CS219763 B1 CS 219763B1 CS 811485 A CS811485 A CS 811485A CS 148581 A CS148581 A CS 148581A CS 219763 B1 CS219763 B1 CS 219763B1
- Authority
- CS
- Czechoslovakia
- Prior art keywords
- control unit
- bit
- word
- channel
- hamming
- Prior art date
Links
Landscapes
- Radar Systems Or Details Thereof (AREA)
Abstract
Vynález se týká zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným slovníkem, které srovnává normalizovaný tvar mikrofonního signálu se stejně uspořádanými vzory, přičemž neznámému slovu přiřadí význam, odpovídající nejbližšímu vzoru slovníku. Vynález zlepšuje poznatelnost systému v hlučném prostředí, dosahuje se nezávislosti na hlasitosti mluveného slova, pokud tato překročí nadprahovou hodnotu. Ekonomická výhodnost plyne z menší postačující kapacity paměti pro uložené vzory (cena paměti tvoří podstatnou část ceny kompletního zařízení). Řešení podle vynálezu umožňuje menší spotřebu elektrické energie související s menším rozsahem potřebných paměťových obvodů.
Description
Vynález se týká zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku, které srovnává normalizovaný tvar mikrofonního signálu se stejně uspořádanými vzory, přičemž neznámému slovu přiřadí význam, odpovídající nejbližšímu vzoru slovníku.
Dosud známá zařízení pro identifikaci izolovaně vyslovovaných slov, která srovnávají normalizovaný tvar mikrofonního signálu se stejně uspořádanými vzory, jsou s dobrou poznatelností (to je alespoň 95 %) použitelná pro rozsah slovníku 20 — 50 povelů (podle výběru slov a podle hlasového projevu mluvčího, na kterého nebo na které je zařízení adaptováno). Přitom používají poměrně složitá vyhodnocovací kritéria a potřebují i značnou kapacitu paměti pro uložení vzoru, nejméně 512 bitů/vzor. Některá z nich, užívající pomalejší (tj. levnější] centrální jednotky, jsou navíc pomalá. Chybovost známých systémů prudce vzrůstá při zvětšujícím se hluku okolí, který může být vyhodnocen jako mluvené slovo.
Výše uvedené nedostatky jsou zmírněny zařízením pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku podle vynálezu, jehož podstatou je takové provedení, že k mikrofonu jsou v kaskádě připojeny omezovač podprahového signálu, lineární omezovač, osmikanálový hřebenový filtr, osmikanálový usměrňovač, osmikanálový integrátor s paralelně připojeným vybíjecím obvodem spojeným s řídicí jednotkou, osmikanálový kruhový přepínač, spojený s řídicí jednotkou, logaritmický analogově-číslicový převodník, spojený s řídicí jednotkou, prahový obvod, spojený s řídicí jednotkou, osmibitový extraktor, spojený s řídicí jednotkou, šedesátičtyřbitový normalizátor, spojený s řídicí jednotkou a šedesátičtyřbítová paměť slova s řídicí jednotkou, a že na jeden vstup Hammingova komparátoru, spojeného s řídicí jednotkou je připojena šedesátičtyřbítová paměť slova a na druhý vstup Hammingova komparátoru je připojen výstup šedesátičtyřbitového kruhového přepínače, spojeného s řídicí jednotkou, na jehož vstupy jsou připojeny alespoň dvě šedesátičtyřbitové paměti vzorů, spojené s řídicí jednotkou a že na výstup Hammingova komparátoru je připojen vstup klasifikátoru, spojeného s řídicí jednotkou, na jehož výstupu je připojen výstupní obvod, spojený s řídící jednotkou. Omezovač podprahového signálu a lineární omezovač může tvořit jediný obvod. Prahový obvod, osmibitový extraktor, šedesátičtyřbitový normalizátor, šedesátičtyřbítová paměť slova, Hammingův komparátor, šedesátičtyřbitový kruhový přepínač, šedesátičtyřbítová paměť vzorů, klasifikátor, výstupní obvod a řídicí jednotka mohou být realizovány jediným mikroprocesorovým systémem nebo jiným počítačem.
Zařazením omezovače podprahového signálu a lineárního omezovače v kaskádě za mikrofonem se zlepší poznatelnost systému v hlučném prostředí a dosáhne se nezávislosti na hlasitosti mluveného slova, pokud tato překročí padprahovou hodnotu. Při použití osmibitového extraktoru, šedesátičtyřbitového normalizátoru, šedesátičtyřbitovépaměti slova a šedesátičtyřbitových pamětí vzorů podle vynálezu se pak při rozsahu slovníku 20 — 30 povelů (podle výběru slov a podle hlasového projevu mluvčího) dosáhne 95 % poznatelností se zařízením ekonomičtěji výhodnějším (lacinějším). Ekonomická výhodnost plyne z menší kapacity paměti pro uložené vzory (64 bitů na vzor místo 512 bitů a více) a ze skutečnosti, že cena paměti tvoří podstatnou část ceny kompletního zařízení. Řešení podle vynálezu umožňuje menší spotřebu elektrické energie, související s menším rozsahem potřebných paměťových obvodů. Energetická úspora zvláště vynikne při aplikaci mikroprocesoru.
Na připojeném obr. 1 je znázorněn příklad zapojeni zařízení pro identifikaci izolovaně mluvených slov s omezeným rozsahem slovníku. Za mikrofonem 1 jsou kaskádně zapojeny omezovač podprahového signálu 2, lineární omezovač 3, osmikanálový hřebenový filtr 4, osmikanálový usměrňovač 5, osmikanálový Integrátor 6 s paralelně připojeným vybíjecím obvodem 7, osmikanálový kruhový přepínač 8, logaritmický analogově-číslicový převodník 9, prahový obvod 10, osmibitový extraktor 11, šedesátičtyřbitový normalizátor 12 a šedesátičtyřbitová paměť slova 13. Na jeden vstup Hammingova komparátoru 14 je připojena šedesátičtyřbltová paměť slova 13 a na druhý vstup Hammingova komparátoru 14 je připojen výstup šedesátičtyřbitového kruhového přepínače 15, na jehož vstupy jsou připojeny alespoň dvě, na obr. 1 čtyři, šedesátičtyřbitové pamětí vzorů 16. Na výstup Hammingova komparátoru 14 je připojen vstup klasifikátoru 17 a na jeho výstup je připojen výstupní obvod 18. Řídicí jednotka 19 je spojena s vybíjecím obvodem 7, s osmikanálovým kruhovým přepínačem 8, s logaritmickým analogově-číslicovým převodníkem 9, s prahovým obvodem 10, s osmibitovým extraktorem 11, s šedesátičtyřbitovým normalizátorem 12, s šedesátičtyřbitovou pamětí slova 13, s Hammingovým komparátorem 14, s šedesátičtyřbitovým kruhovým přepínačem 15, s šedesátičtyřbitovými paměťmi slova 16, s klasifikátorem 17 a s výstupním obvodem 18.
Funkce jednotlivých bloků znázorněných na obr. 1 je dále podrobněji vysvětlena. Mikrofon 1 snímá akustický signál mluveného slova a převádí ho na signál elektrický. Omezovač podprahového signálu 2 pracuje jako expander dynamicky s nastavitelným prahem (tvarem expanzní charakteristiky]; omezuje zesílení podprahových signálů. Práh se nastaví v závislosti na hluku prostředí, z něhož je mluvené slovo snímáno tak, aby byl rušivý signál potlačen. Lineární omezovač 3 pracuje jako lineární zesilovač až do maximálního přípustného signálu, odpovídajícího rozsahu logaritmického' analogově-číslicového převodníku 9. Po překročení tohoto signálu se zesílení lineárního omezovače 3 progresivně zmenšuje. Osmikanálový hřebenový filtr 4 je tvořen osmi pásmovými propustmi., jejichž propouštěná pásma na sebe navazují a zahrnují pásmo kmitočtů, odpovídající pásmu použitého mikrofonu 1. Osmlkanálový usměrňovač 5 může usměrňovat jednu nebo obě půlvlny vstupních signálů. Osmikanálový integrátor 6 má nabíjecí časovou konstantu 3 — 15 ms, optimálně 5 ms a vybíjecí časovou konstantu 20 — 150 ms, optimálně 50 ms. Vybíjecí obvod 7 vybíjí integrační prvky osmikanálového integrátoru 6 s časovou konstantou 0 — — 2 ms (optimálně 0,5 ms). Osmikanálový kruhový přepínač 8 přepíná signály osmi vstupů na jediný výstup s kruhovou frekvencí 30 — 80 Hz (optimálně 50 Hz), přičemž je všech osm vstupů přepnuto včetně následujícího vybití integračních prvků v době menší, než 1/10 periody kruhové frekvence; ve zbylé části periody je signál zpracován osmibitovým extraktorem 11. Logaritmický analogově-číslicový převodník 9 převádí vstupní analogový signál o dynamickém rozpětí 20 — 80 dB, optimálně 64 dB, na 2 — 16 bitový, optimálně 4 bitový číslicový údaj. Prahový obvod 10 nahradí podprahové číslicové údaje nulami. Při aplikaci 4 bitového logaritmického' analogově-čísIícového převodníku 9 je vhodné nastavení prahu 2 — 6, optimálně 4 v závislosti na špičkových úrovních rušivého hluku prostředí, z něhož je mluvené slovo snímáno. Osmibitový extraktor 11 nalezne ve sledu osmi čísel, odpovídajících úrovním výstupních signálů osmikanálového hřebenového filtru 4 z jedné periody osmikanálového kruhového přepínače 8 čísla, která jsou ve vztahu k ostatním relativními spektrálními maximy a nahradí v nich původní hodnotu číslem 1. Ostatní čísla osmice osmibitový extraktor 11 vynuluje, stejně tak, jako čísla tvořící kontury mezi sousedícími plochými relativními maximy, zabírajícími více frekvenčních pásem. Takto vzniklou osmici jednobitových čísel osmibitový extraktor 11 nakonec shrne do jediného osmibitového čísla. Šedesátičtyřbitový normalizátor 12 počne takto vzniklá čísla, od prvního nenulového čísla, ukládat do paměti jako základní popis mluveného slova. Ukládání se ukončí po dosažení zadaného počtu čísel, optimálně 50 nebo po uložení více čísel, než odpovídá zadané minimální délce slova, optimálně 20, za níž následuje zadaný počet půlových čísel, optimálně 16, odpovídajících nulovému signálu za slovem. Krátké poruchy, menší než zadaná délka slova, optimálně a vzdálené od nenulového signálu alespoň o zadaný počet nulových čísel, optimálně 16, šedesátičtyřbitový normalizátor 12 ignoruje. Po uložení základního popisu mluveného slova do paměti šedesátičtyřbitový normalizátor 12 vymezí délku mluveného slova, rozdělí ji do osmi stejně dlouhých časových úseků a jednotlivé, sobě si odpovídající bity všech čísel základního popisu mluveného slova v každém úseku zprůměruje. Vzniklé šedesátičtyřbitové číslo uloží šedesátičtyřbitový normalizátor 12 do šedesátičtyřbitové paměti slova 13. Sedesátičtyřbitový kruhový přepínač 15 pak přepíná šedesátičtyřbitové paměti vzorů 16, pro jedno slovo může být libovolný počet vzorů, na druhý vstup Hammingova komparátoru 14, jehož první vstup je připojen na šedesátičtyřbitovou paměť slova 13, Hammingův komparátor 14 určí Hammingovu vzdálenost mezi dvěma šedesátičtyřbitovými čísly na svých vstupech. Vypočtená vzdálenost spolu s údajem o číslu vzoru jde z výstupu Hammingova komparátoru 14 na vstup klasifikátoru 17. Zde se určí číslo nejbližšího vzoru nebo jemu odpovídajícího slova a vyšle se z výstupu klasifikátoru 17 na vstup výstupního obvodu 18, který číslo identifikovaného slova předá do dalšího spolupracujícího nebo řízeného zařízení, které již není předmětem vynálezu. Ze spolupracujícího zařízení lze přijímat i příkaz pro řídicí jednotku 19, která činnost zařízení pro identifikaci izolovaných slov s omezeným rozsahem slovníku koordinuje, k sejmutí a k identifikaci mluveného slova.
Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku podle obr. 1 lze programovou úpravou realizovat jako adaptibilní, a to na nový slovník nebo na nového mluvčího nebo skupinu mluvčích. Při adaptaci se obsahy šedesátičtyřbitové paměti slova 13, odpovídající jednotlivým slovům nebo jejich odpovídajícím realizacím, přepisují prostřednictvím řídicí jednotky 19 do šedesátičtyřbitových pamětí vzorů 10, a to s údaji o číslech slov, jímž jednotlivé šedesátičtyřbitové paměti vzorů 16 odpovídají. Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem lze realizovat i tak, že omezovač podprahového signálu 2 a lineární omezovač 3 tvoří jediný celek řízený zesilovač, nebo i tak, že prahový obvod 10, osmibitový extraktor 11, šedesátičtyřbitový normalizátor 12, šedesátičtyřbitové paměť slova 13, Hammingův komparátor 14, šedesátičtyřbitový kruhový přepínač 15, šedesátičtyřbitové paměti vzorů 16, klasifikátor 17 a řídicí jednotka 19 jsou realizovány bud' všechny, nebo některé z nich, jediným mikroprocesorovým systémem nebo jiným počítačem. Funkci klasifikátoru 17 lze doplnit ještě odmítnutím identifikace v případě, kdy Hammingova vzdálenost mezi obsahem še7
213763 desátičtyřbitové paměti slova 13 a jemu nejhllžšího obsahu šedesátičtyřbitové paměti vzoru 16 překročí zadanou hodnotu optimálně 21.
Claims (2)
1. Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku, vyznačené tím, že k mikrofonu (lj jsou v kaskádě připojeny omezovač podprahového signálu (2), lineární omezovač (3), osmikanálový hřebenový filtr (4), osmikanálový usměrňovač (5), osmikanálový integrátor (6) s paralelně připojeným vybíjecím obvodem (7) spojeným s řídicí jednotkou (19), dále osmikanálový kruhový přepínač (8) spojený s řídicí jednotkou (19), logaritmický analogově číslicový převodník (9) spojený s řídicí jednotkou (19), prahový obvod (10) spojený s řídicí jednotkou (19), osmibitový extraktor (11) spojený s řídicí jednotkou (19), šedesátičtyřbitový normalizátor (12) spojený s řídicí jednotkou (19) a šedesátičtyřbitová paměť slova (13) spojená s řídicí jednotkou (19), přičemž na jeVYNÁLEZU den vstup Hammingova komparátoru (14) spojeného s řídicí jednotkou (19) je připojena šedesátičtyřbitová paměť slova (13) a na .druhý vstup Hammingova komparátoru (14) je připojen výstup šedesátičtyřbitového kruhového přepínače (15) spojeného s řídicí jednotkou (19), na jehož vstupy jsou připojeny alespoň dvě šedesátičtyřbitové paměti vzoru (16) spojené s řídicí jednotkou (19), přičemž na výstup Hammingova komparátoru (14) je připojen vstup klasifikátoru (17) spojeného s řídicí jednotkou (19), na jehož výstup je připojen výstupní obvod (18) spojený s řídicí jednotkou (19).
2. Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku podle bodu 1, vyznačené tím, že omezovač podprahového signálu (2) a lineární omezovač (3) tvoří jediný obvod.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CS811485A CS219763B1 (cs) | 1981-03-02 | 1981-03-02 | Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CS811485A CS219763B1 (cs) | 1981-03-02 | 1981-03-02 | Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CS219763B1 true CS219763B1 (cs) | 1983-03-25 |
Family
ID=5349377
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CS811485A CS219763B1 (cs) | 1981-03-02 | 1981-03-02 | Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku |
Country Status (1)
| Country | Link |
|---|---|
| CS (1) | CS219763B1 (cs) |
-
1981
- 1981-03-02 CS CS811485A patent/CS219763B1/cs unknown
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2000148186A5 (ja) | 音声認識システムの作動方法及び装置 | |
| EP1909532A1 (en) | Conference audio system | |
| DK151759B (da) | Programmerbar signalbehandlingsanordning for hoereapparater | |
| JPS5242007A (en) | Voice recognizing system | |
| US4543537A (en) | Method of and arrangement for controlling the gain of an amplifier | |
| JPS6329754B2 (cs) | ||
| EP1540646A2 (en) | Voice controlled system and method | |
| US3755627A (en) | Programmable feature extractor and speech recognizer | |
| CS219763B1 (cs) | Zařízení pro identifikaci izolovaně vyslovovaných slov s omezeným rozsahem slovníku | |
| GB981154A (en) | Improved phonetic typewriter system | |
| JPS6332394B2 (cs) | ||
| US2866848A (en) | Method of improving intelligence under random noise interference | |
| WO1994002936A1 (en) | Voice recognition apparatus and method | |
| KR0170140B1 (ko) | 가정자동화기기의 음성인식장치 | |
| JP2594028B2 (ja) | 音声認識装置 | |
| US5495529A (en) | Digital sound level control apparatus | |
| JPS57199039A (en) | Voice input and output controlling system | |
| JPH01316799A (ja) | 音声認識装置 | |
| JPH03200298A (ja) | 音声制御装置 | |
| SU720540A1 (ru) | Устройство дл распознавани | |
| JP3023137B2 (ja) | 音声認識制御装置 | |
| JPH0343639B2 (cs) | ||
| JPS5914769B2 (ja) | 音声機器 | |
| JPS6232320Y2 (cs) | ||
| KR930006541Y1 (ko) | 격리단어 음성 인식 장치 |