KR930006541Y1 - 격리단어 음성 인식 장치 - Google Patents

격리단어 음성 인식 장치 Download PDF

Info

Publication number
KR930006541Y1
KR930006541Y1 KR2019890003984U KR890003984U KR930006541Y1 KR 930006541 Y1 KR930006541 Y1 KR 930006541Y1 KR 2019890003984 U KR2019890003984 U KR 2019890003984U KR 890003984 U KR890003984 U KR 890003984U KR 930006541 Y1 KR930006541 Y1 KR 930006541Y1
Authority
KR
South Korea
Prior art keywords
signal
input
system controller
voice signal
level
Prior art date
Application number
KR2019890003984U
Other languages
English (en)
Other versions
KR900017641U (ko
Inventor
최재연
Original Assignee
삼성전자 주식회사
강진구
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사, 강진구 filed Critical 삼성전자 주식회사
Priority to KR2019890003984U priority Critical patent/KR930006541Y1/ko
Publication of KR900017641U publication Critical patent/KR900017641U/ko
Application granted granted Critical
Publication of KR930006541Y1 publication Critical patent/KR930006541Y1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Electric Clocks (AREA)

Abstract

내용 없음.

Description

격리단어 음성 인식 장치
제1도는 본 고안에 따른 격리단어 인식장치의 개요를 보인 도면.
제2도는 본 고안에 의한 격리단어 인식장치의 실시 예시도.
* 도면의 주요부분에 대한 부호의 설명
10 : 모드선택 키 보드 20 : 병렬 인터페이스
30 : 표시부 40 : 마이크로 폰
50 : 레벨 콘트롤부 60 : 압신기(compander)
70 : 저역 필터 80 : 샘플 호울더부
90 : A/D콘버터 95 : 래치부
100 : 시스템 콘트롤러(CPU) 102 : 변환제어부
110 : 디코더 120 : 엑세스 타임 동기 제어부
200 : ROM 300 : RAM
본 고안은 사람과 기계사이의 정보전달을 이룩하기 위하여 여러가지 정보전달 수단중의 하나인 음성을 기계가 인식하도록 하는 격리 단어(ISOLATED WORD)음성인식 장치에 관한 것이다.
음성은 사람마다 다르기 때문에 적당한 전처리를 거친 뒤 디지틀 신호로 바꾸어 특징을 추출하고, 추출된 음성패턴을 기준으로 하여 음성 입력신호를 인식하는 기술은 넓게는 인공지능(Artificial Intelligence)을 구현하기 위해 필요한 기술이고 좁게는 음성인식 전화기, 음성인식 전탁등 각종 자동화 기기에 응용될 수 있다.
이러한 음성인식 기술은 상기한 모든 제품에 채용하면 손이 자유로와지므로 행동의 동시성을 이룰수 있으며, 특히 손사용이 불편한 장애자들이 편리하게 사용할 수 있어 사람과 기계의 친숙성의 효과를 기대할 수 있다.
본 고안은 상기와 같은 점을 감안하여 안출한 것으로서, 사람의 음성 특징을 추출 및 비교계산하여 그 음성신호의 데이터에 따라 인식 전화기등과 같은 자동화 장치가 작동되게 하는 격리 단어 음성인식 장치를 제공하는 데 그 목적이 있다.
상기의 목적을 달성하기 위하여 본 고안에 따른 격리 단어 음성인식 장치는, 특정화자가 격리단어를 기준패턴으로 메모리 하는 경우나 기준 패턴과 입력 음성신호의 패턴간의 거리를 비교계산하여 본 고안의 장치를 채용한 시스템을 제어하고자 하는 경우에 따라 특정화자가 모드를 선택 할수 있게 하는 모드 선택 키보드와, ROM에 저장된 프로그램을 수행하여 주변 시스템을 제어하는 시스템 콘트롤러와, 상기한 시스템 콘트롤러의 제어 신호에 따라 모드 선택 키보드를 통해 입력된 데이터와 A/D 변환된 음성신호의 디지틀 데이터를 병렬 인터페이스를 통해 받아 표시하는 표시부와, 마이크로 폰(40)을 통해 입력된 음성신호의 레벨의 증폭도를 자동으로 결정하는 레벨 콘트롤부와, 상기한 레벨 콘트롤부에서 출력된 신호를 입력으로 하여 신장하는 압신기와, 압신기를 통해 인가된 음성신호의 차단주파수(Cutoff frequency) 특성을 좋게함과 동시에 잡음 성분을 제거하는 저역필터와, 상기 저역필터를 통한 음성신호를 적당한 주기로 샘플링하고 후술하는 A/D콘버터의 입력전압을 일정하게 하여 기준점을 제어하는 샘플 호울더부와, 입력된 아날로그 음성신호를 디지틀 음성신호로 변환하는 A/D 콘버터와, 상기한 A/D콘버터에서 출력된 디지틀 음성신호를 시스템 콘트롤러의 기입제어신호에 따라 기억하고 또한 시스템 콘트롤러의 독출제어신호에 따라 기억 데이터를 독출시켜 시스템 콘트롤러에 인가하는 RAM과, 상기한 시스템 콘트롤러에서 출력된 데이터를 디코딩하는 디코더의 출력 신호를 받아 주변 시스템을 엑세스(access)하고자 할 때 주변시스템을 콘트롤 하고 엑세스 타임을 제어하여 동기시키는 엑세스 타임 동기제어부와, 상기한 과정을 제어 하기 위한 프로그램을 저장하는 ROM으로 구성됨을 특징으로 한다.
이하 본 고안을 예시된 도면을 통하여 더욱 상세히 기술하기로 한다.
본 고안에 따른 격리단어 음성 인식 장치는 제1도와 같은 개요와 제2도에 도시된 상세 회로도를 가진다.
즉 레벨 콘트롤부(50)는 마이크로폰(40)을 통해 전기적인 신호로 변환된 음성 신호의 주파수 범위를 결정하는 대역필터(51)와, 이 대역 필터(51)를 통한 음성신호의 주파수 레벨을 증폭하는 연산증폭기(OP1)와, 상기 연산증폭기(OP1)에서 출력된 음성신호의 주파수의 레벨을ROM(200)에서 인가된 데이터에 따라 정밀하게 다시 증폭하는 이득콘트롤러(52)와, 연산증폭기(OP2)로 구성된다.
압신기(60)는 신장기(COP)의 입력레벨을 OV이상으로 하는 다이오드(D1)(D2) 및 전기한 연산증폭기(OP2)에서 반전된 위상을 바로하기 위한 연산증폭기(OP3)로 구성된다.
저역필터(70)는 클럭펄스에 의해 차단주파수가 결정되는 두개의 필피(FT1)(FT2)를 종속연결하여 구성된다.
샘플호울더부(80)는 상기한 저역필터(70)를 통한 아날로그 음성신호를 일정한 주기로 샘플링 하고 후술하는 A/D 콘버터(90)가 작동할때 샘플 레벨을 홀드하도록 구성된다.
시스템 콘트롤러(100)는 ROM(200)에 내장된 프로그램을 수행하여 주변 시스템에서 인가된 데이터에 따라 모든 동작을 제어 하도록 구성된다.
디코더(110)는 시스템 콘트롤러(100)가 주변 시스템을 제어할 때 출력되는 어드레스(address)를 디코딩 하여 주변시스템을 엑세스함과 동시에 후술하는 엑세스 타임 동기 제어부(120)에 공급하도록 구성된다.
엑세스 타임 동기 제어부(120)는 시스템 콘트롤러(100)가 주변 시스템을 엑세스(access)하고자 할 때 주변 시스템을 콘트롤하고 엑세스 타임을 제어하여 상호간의 작동이 동기되도록 구성된다.
병렬 인터페이스(20)는 ROM(200)에 내장된 프로그램과, 시스템 콘트롤러(100)에 의해서 모드 선택키보드(10)에 입력된 데이터와, 마이크로폰(40)을 통해 입력된 데이터를 표시부(30)에 표시하도록 구성된다.
상기한 바와 같은 구성을 가진 본 고안의 작동 관계를 상세히 설명한다.
제2도에서 특정화자가 격리단어 음성을 기준패턴으로 하고자 모드 선택키보드(10)를 통해 등록모드에 해당되는 데이터를 입력하면, ROM(200)에 저장된 프로그램의 순서에 의해서 표시부(30)에 등록모드를 표시하게 된다.
이때, 특정화자 격리 단어음성을 마이크로폰(40)에 입력시키면 음성신호는 전기적인 신호로 변환되어 저항(R1)의 양단에 결리게 된다. 저항(R1)의 양단에 걸리는 신호는 콘덴서(C1), 저항(R2), 저항(R3), 콘덴서(C2)로 구성된 대역필터(51)를 통해 원하는 주파수 범위가 정하여진 후 연산증폭기(OP1)에서 증폭되어 이득 콘트롤러(52)에 입력된다. 이득 콘트롤러(52)에 입력된 음성신호는 다시 증폭되어 연산증폭기(OP2)를 통해 압신기(60)에 인가된다. 여기서 연산증폭기(OP1)와 이득콘트롤러(52)에서 음성신호를 두번 증폭한 이유는 다음 단이 요구하는 입력레벨을 효율적으로 조절하기 위함이며, 또한 디지틀 콘트롤 데이터(digitally controlled data)값에 의한 증폭의 정밀도를 높이는데 있다.
압신기(60)에 입력된 신호의 레벨은 다이오드(D1)(D2)에 의해 OV이상의 유니폴라(Unipolar)가 되고 연산증폭기(OP3)에서 반전되어 저역필터(70)에 공급된다.
저역필터(70)에 공급된 음성신호중에 일정치 이상의 주파수와 잡음신호는 차단되어 샘플 호울더부(80)에 인가되는데, 주파수 차단 특성은 펄스발생기(71)에서 출력되는 클럭펄스를 분주하는 제1 분주기(72)에서 인가된 클럭신호에 의해서 결정되며, 종속 연결된 두개의 필터(FT1)(FT2)는 차단 주파수의 특성을 좋게 하기 위함이다.
샘플 호울더부(80)에 인가된 아날로그 신호는 일정한 주기로 샘플링되고 일정레벨에서 홀드되어 A/D콘버터(90)에 공급된다. A/D콘버터(90)에 공급된 아날로그 신호가 디지틀 신호로 변환되는 동중에 BUSY 출력단자의 신호가 "로우"상태로 될때, 시스템 콘트롤러(100)는 인터럽트(interrupt)되어, A/D콘버터(90)에서 출력되어 래치부(95)에서 래치된 데이터를 받아 RAM(300)의 특정번지에 저장한다.
상기와 같이 기준패턴의 격리음성단어를 RAM(300)에 저장한 후 특정화자가 모드선택키보드(10)에 인식 모드 데이터를 입력하면, 표시부(30)는 인식모드를 표시하게 된다.
상기와 같은 상태에서 특정화자가 음성신호로 본 고안을 채용한 시스템을 제어하고자 할 때 그 작동 관계를 설명한다.
특정화자의 음성신호로 본 고안을 채용한 시스템을 제어하고자 할 때는 특정화자가 모드선택 키보드(10)를 통해 음성인식 모드에 해당되는 데이터를 입력시키면, 시스템 콘트롤러(100)의 기입 및 독출단자(R/)에서 출력되는 기입()신호에 의해서 기입 상태가 된 표시부(30)는 ROM(200)에 내장된 프로그램의 수행 순서에 따라 음성인식 모드를 표시하게 된다. 이와 같은 상태에서 특정화자가 마이크로폰(40)에 음성신호를 입력시키면 전기한 과정과 마찬가지로 A/D변환되어 시스템 콘트롤러(100)에 입력이 되며, 시스템 콘트롤러(100)는 음성 데이타를 RAM(300)에 저장하고 다시 ROM(200)에 내장된 프로그램의 순서에 따라 상기 RAM(300)에 저장된 기준패턴 음성 신호와 음성인식 데이터 패턴을 시스템 콘트롤러(100)가 독출하여 양자의 패턴 거리 계산을 수행한 후 거리가 가장 짧은 기준패턴이 음성인식 패턴과 가장 유사도가 높다고 판단하고 계산된 거리가 일장한 임계값(Threshold Value)이하 일 때 그 데이터값을 시스템 콘트롤러(100)에 의해서 독출상태가 된 병렬 인터페이스(20)를 통해 표시부(30)에 표시한다.
상기한 작동 과정에서 시스템 콘트롤러(100)와 A/D 콘버터(90)간의 동작 매칭은 시스템 콘트롤러(100)의 클럭 출력단자(CKO)에서 출력되는 클럭펄스를 분주하는 제2분주기(102A)의 출력 신호를 카운트하는 카운트(102B)로 구성된 변환제어부(102)에 의해서 제어되며, 나머지 주변시스템은 작동 순서에 따라 시스템 콘트롤러(100)에서 출력되는 어드레스(A0~A3)를 디코딩하는 디코더(110)의 출력신호에 의해서 제어 되는 엑세스 타임 동기 제어부(120)에 의해서 제어된다.
상술한 바와 같이 작동하는 본 고안은 특정화자의 격리단어를 기준 패턴으로 저장 한 후 다시 격리단어가 입력될 때 이를 인식할 수 있는 바, 본 고안을 채용한 시스템을 격리단어 음성으로 콘트롤 할 수 있다.

Claims (3)

  1. 특정화자가 격리단어를 기준 패턴으로 메모리할때나 기준패턴과 입력음성신호의 패턴간의 거리를 비교계산하여 시스템을 제어하고자 하는 경우에 따라 특정화자가 모든 선택데이터를 입력할 수 있게 하는 모드 선택 키보드(10)와, ROM(200)에 저장된 프로그램을 수행하여 주변 시스템을 제어하는 시스템 콘트롤러(100)와, 상기한 시스템 콘트롤러(100)의 제어 신호에 따라 모드 선택 키보드(10)를 통해 입력된 데이터와 A/D 변환된 음성신호의 데이터를 병렬 인터페이스(20)를 통해 받아 표시하는 표시부(30)와, 마이크로폰(40)을 통해 입력된 음성신호의 레벨의 증폭도를 결정하는 레벨 콘트롤부(50)와, 상기한 레벨 콘트롤부(50)에서 출력된 신호를 입력으로 하여 신장하는 압신기(60)와, 압신기(60)를 통해 인가된 음성신호의 차단 주파수 특성을 좋게함과 동시에 잡음 성분을 제거하는 저역필터(70)와, 입력된 아날로그 음성신호를 디지틀 음성 신호로 변환하는 A/D 콘버터(90)와, 상기 저역필터(70)를 통한 음성신호를 적당한 주기로 샘플링 하고 A/D 콘버터(90)의 입력 전압을 일정하게 하여 기준점을 제어하는 샘플 호울더부(80)와, 상기한 A/D 콘버터(90)에서 출력된 디지틀 음성신호를 시스템 콘트롤러(100)의 기입 제어신호에 따라 기억하고 또한 시스템 콘트롤러의 독출제어 신호에 따라 기억된 데이터를 독출하여 시스템 콘트롤러에 인가하는 RAM(300)과, 시스템 콘트롤러(100)가 상기한 시스템 콘트롤러(100)에서 출력되는 어드레스를 디코딩 하는 디코더(110)의 출력 신호를 받아 주변시스템을 엑세스(access)하고자 할때, 주변 시스템을 콘트롤 하고 엑세스 타임을 제어 하여 동기시키는 엑세스 타임 동기 제어부(120)와, 상기한 과정을 제어 하기 위한 프로그램을 저장하는 ROM(200)을 구비하여 이루어짐을 특징으로 하는 격리 단어 음성인식 장치.
  2. 제1항에 있어서, 상기 레벨 콘트롤부(50)는 마이크로폰(40)을 통해 전기적인 신호로 변환된 음성신호의 주파수 범위를 결정하는 대역 필터(51)와, 이 대역 필터(51)를 통한 음성신호의 주파수 레벨을 증폭하는 연산 증폭기(OP1)와, 상기 연산 증폭기(OP1)에서 출력된 음성신호의 주파수 레벨을 ROM(200)에서 인가된 데이터에 따라 다시 증폭하여 다음단이 요구하는 입력레벨을 효율적으로 조절하고 증폭도의 정밀도 높이는 이득 콘트롤러(52)와, 연산증폭기(OP2)로 구성됨을 특징으로 하는 격리 단어 음성 인식장치.
  3. 제1항에 있어서, 상기 저역 필터(70)는 펄스 발생기(71)에서 출력되는 클럭펄스를 분주하는 제1분주기(72)에서 인가된 클럭펄스에 의해서 그 차단 주파수 특성이 결정되는 필터(FT1)(FT2)를 종속 연결하여 구성됨을 특징으로 하는 격리 단어 음성 인식장치.
KR2019890003984U 1989-03-31 1989-03-31 격리단어 음성 인식 장치 KR930006541Y1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR2019890003984U KR930006541Y1 (ko) 1989-03-31 1989-03-31 격리단어 음성 인식 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR2019890003984U KR930006541Y1 (ko) 1989-03-31 1989-03-31 격리단어 음성 인식 장치

Publications (2)

Publication Number Publication Date
KR900017641U KR900017641U (ko) 1990-10-05
KR930006541Y1 true KR930006541Y1 (ko) 1993-09-24

Family

ID=19284850

Family Applications (1)

Application Number Title Priority Date Filing Date
KR2019890003984U KR930006541Y1 (ko) 1989-03-31 1989-03-31 격리단어 음성 인식 장치

Country Status (1)

Country Link
KR (1) KR930006541Y1 (ko)

Also Published As

Publication number Publication date
KR900017641U (ko) 1990-10-05

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
TW347619B (en) A communication system and method using a speaker dependent time-scaling technique a method for time-scale modification of speech using a modified version of the Waveform Similarity based Overlap-Add technique (WSOLA).
DE68929442T2 (de) Vorrichtung zur Erfassung von Sprachlauten
ATE50463T1 (de) Text-zu-sprache-uebersetzungssystem.
KR930006541Y1 (ko) 격리단어 음성 인식 장치
JPS60158498A (ja) パターン照合装置
ATE255763T1 (de) Effizientes verfahren zur geschwindigkeitsmodifikation von sprachsignalen
EP0753855A2 (en) Data recording apparatus
KR920011049B1 (ko) 다기능 음성 디지타이져 회로
KR0174695B1 (ko) 다 채널 이중음 다중주파수 및 특수 톤 검출장치 및 방법
JPH02103599A (ja) 音声認識装置
KR920000456B1 (ko) 음성신호를 이용한 계산기
KR100336960B1 (ko) 부하를줄이는음성신호인식장치및그방법
KR900008498A (ko) 신호처리 회로
KR960025310A (ko) 노래반주용 채점장치
KR890001098Y1 (ko) 음성 인식기
JPH0520760B2 (ko)
EP0145669A3 (en) Device for the control by voice of a signal receiver
JPH0262879B2 (ko)
KR930004738B1 (ko) 음성 인식시스템의 기준패턴 저장방법
JPS59231600A (ja) 音声区間検出方法
JPH0228159B2 (ko)
KR960001932A (ko) 시계
JPS60498A (ja) 音声検出装置
KR970024536A (ko) 데이타 버스 구조의 멀티-채널, 멀티-스테이지의 오버샘플링 하프 밴드 필터

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
REGI Registration of establishment
FPAY Annual fee payment

Payment date: 20020627

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee