KR950025560A - 신경회로망을 이용한 음성인식 시스템 - Google Patents

신경회로망을 이용한 음성인식 시스템 Download PDF

Info

Publication number
KR950025560A
KR950025560A KR1019940001995A KR19940001995A KR950025560A KR 950025560 A KR950025560 A KR 950025560A KR 1019940001995 A KR1019940001995 A KR 1019940001995A KR 19940001995 A KR19940001995 A KR 19940001995A KR 950025560 A KR950025560 A KR 950025560A
Authority
KR
South Korea
Prior art keywords
voice
storage means
data
result
voice input
Prior art date
Application number
KR1019940001995A
Other languages
English (en)
Other versions
KR0185755B1 (ko
Inventor
정호선
고재평
Original Assignee
정호선
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정호선 filed Critical 정호선
Priority to KR1019940001995A priority Critical patent/KR0185755B1/ko
Publication of KR950025560A publication Critical patent/KR950025560A/ko
Application granted granted Critical
Publication of KR0185755B1 publication Critical patent/KR0185755B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Acoustics & Sound (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 신경회로망을 이용한 음성 인식시스템을 공개한다. 그 시스템은 음성을 입력하기 위한 음성 입력수단, 상기 음성입력단으로 부터 입력된 음성을 소정 대역의 필터 주파수에 의해서 분식하기 위한 음성 분석수단, 상기 음성분석된 결과 데이타를 입력하기 위한 음성 입력수단, 상기 음성 입력수단을 통한 상기 음성 분석 결과데이타를 저장하기 위한 제1저장수단, 학습된 가중치 데이타가 저장되어 있는 제2저장수단, 상기 제1저장수단에 저장된 결과를 저장된 프로그램에 의해서 정규화하고 이진화하고 상기 제1 저장수단에 저장한 후 상기 제1저장수단의 이진화된 데이타를 입력하고 상기 제2 저장수단에 저장된 가중치 데이타를 입력하여 학습을 수행하여 최종적인 음성인식 결과를 출력하기 위한 제3 저장수단, 상기 학습된 음성인식 결과를 출력하기 위한 음성출력단, 상기 제1, 제2, 제3저장수단의 인에이블을 제어하고 데이타의 리드와 라이트를 제어하기 위한 제어수단을 구비한 것을 특징으로 한다. 따라서, 컴퓨터를 사용하지 않고 간단하게 음성인식 시스템을 구성 할 수 있다.

Description

신경회로망을 이용한 음성인식 시스템
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 음성인식시스템에 사용될 신경 회로망의 모델을 나타내는 것이다,
제2도는 일반적인 시스템의 블럭도이다,
제3도는 본 발명의 음성인식 시스템의 블럭도이다.

Claims (1)

  1. 음성을 입력하기 위한 음성 입력수단; 상기 음성입력수단으로 부터 입력된 음성을 소정 대역의 필터 주파수에 의해서 분석하기 위한 음성 분석수단; 상기 음성분석된 결과 데이타를 입력하기 위한 음성 입력수단; 상기 음성 입력수단을 통한 상기 음성 분석 결과데이타를 저장하기 위한 제1저장수단; 학습된 가중치 데이타가 저장되어 있는 제2저장수단; 상기 제1저장수단에 저장된 결과를 저장된 프로그램에 의해서 정규화하고 이진화하고 상기 제1저장수단에 저장한 후 상기 제1저장수단의 이진화된 데이타를 입력하고 상기 제2저장수단에 저장된 가중치 데이타를 입력하여 학습을 수행하여 최종적인 음성인식 결과를 출력하기 위한 제3저장수단; 상기 학습된 음성인식 결과를 위한 음성출력수단; 상기 제1, 제2, 제3제어수단의 인에이블을 제어하고 데이타의 리드와 라이트를 제어하기 위한 제어수단을 구비한 것을 특징으로 하는 음성인식 시스템.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940001995A 1994-02-03 1994-02-03 신경회로망을 이용한 음성인식 시스템 KR0185755B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940001995A KR0185755B1 (ko) 1994-02-03 1994-02-03 신경회로망을 이용한 음성인식 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940001995A KR0185755B1 (ko) 1994-02-03 1994-02-03 신경회로망을 이용한 음성인식 시스템

Publications (2)

Publication Number Publication Date
KR950025560A true KR950025560A (ko) 1995-09-18
KR0185755B1 KR0185755B1 (ko) 1999-05-15

Family

ID=19376731

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940001995A KR0185755B1 (ko) 1994-02-03 1994-02-03 신경회로망을 이용한 음성인식 시스템

Country Status (1)

Country Link
KR (1) KR0185755B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100322202B1 (ko) * 1999-09-06 2002-02-06 윤장진 신경망을 이용한 음성인식장치 및 그 방법

Also Published As

Publication number Publication date
KR0185755B1 (ko) 1999-05-15

Similar Documents

Publication Publication Date Title
Black et al. Building voices in the Festival speech synthesis system
CN109543190A (zh) 一种意图识别方法、装置、设备及存储介质
TW347619B (en) A communication system and method using a speaker dependent time-scaling technique a method for time-scale modification of speech using a modified version of the Waveform Similarity based Overlap-Add technique (WSOLA).
US7966177B2 (en) Method and device for recognising a phonetic sound sequence or character sequence
WO2004070574A3 (en) System and method for semantic software analysis
Chittaragi et al. Automatic text-independent Kannada dialect identification system
CN111209380B (zh) 对话机器人的控制方法、装置、计算机设备和存储介质
CN116778967B (zh) 基于预训练模型的多模态情感识别方法及装置
Mahmoudi et al. Arabic speech emotion recognition using deep neural network
JP6082657B2 (ja) ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム
CN117219046A (zh) 一种交互语音情感控制方法及系统
KR950025560A (ko) 신경회로망을 이용한 음성인식 시스템
Dras Reluctant paraphrase: Textual restructuring under an optimisation model
Gonzalez et al. Voice recognition system to support learning platforms oriented to people with visual disabilities
KR900015062A (ko) 음성인식장치
CN112579768A (zh) 一种情感分类模型训练方法、文本情感分类方法及装置
JPH02304493A (ja) 音声合成システム
Nikalaenka et al. Training algorithm for speaker-independent voice recognition systems using HTK
Shashank et al. Emotion Recognition in Hindi Speech Using CNN-LSTM Model
CN117251405A (zh) 有声电子书的生成方法、装置、设备及存储介质
Warkentyne Eliciting intonation patterns
de Carvalho Campinho Automatic Speech Recognition for European Portuguese
Campinho Automatic speech recognition for European Portuguese
Upadhyay et al. Pronunciation Similarity Matching Using Deep Learning
Nguyen et al. Using Machine Learning Algorithms Combined with Deep Learning in Speech Recognition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee