KR200184200Y1 - 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치 - Google Patents

전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치 Download PDF

Info

Publication number
KR200184200Y1
KR200184200Y1 KR2019990028908U KR19990028908U KR200184200Y1 KR 200184200 Y1 KR200184200 Y1 KR 200184200Y1 KR 2019990028908 U KR2019990028908 U KR 2019990028908U KR 19990028908 U KR19990028908 U KR 19990028908U KR 200184200 Y1 KR200184200 Y1 KR 200184200Y1
Authority
KR
South Korea
Prior art keywords
data
expert system
voice
answer
speech recognition
Prior art date
Application number
KR2019990028908U
Other languages
English (en)
Inventor
김훈
Original Assignee
주식회사글로벌데이타시스템.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사글로벌데이타시스템. filed Critical 주식회사글로벌데이타시스템.
Application granted granted Critical
Publication of KR200184200Y1 publication Critical patent/KR200184200Y1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 고안은 화자의 음성을 인식하고 적절한 상황과 기존의 자료를 통하여 화자와 대화가 가능토록 한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치에 관한 것으로서, 이러한 본 고안은, 사용자의 음성을 입력받은 후, 그 입력받은 음성을 음소 단위로 분석하고, 분석된 음소 데이터를 전문가 시스템이 인식할 수 있는 데이터로 변환한다. 전문가 시스템에서는 변환된 데이터를 인식하고 추론에 의한 최적의 룰을 선택하며, 선택한 룰의 조건에 맞는 팩트를 워킹 메모리에서 선택하여 상기 룰에 적용하여 입력된 질문에 대한 답변을 추출하고, 답변 추출시 얻어진 결과를 신규 팩트로서 워킹 메모리에 저장한 뒤 다음 룰에 적용하도록 하고, 최종적으로 추출한 답변을 인퍼런스 엔진을 통해 음성 인식 장치가 인식할 수 있는 데이터로 변환한다. 그러면 음성 인식 장치는 변환한 데이터에 대응하는 음성 데이터를 추출하고, 추출한 음성 데이터를 합성한 후 그 합성된 음성을 스피커를 통해 사용자에게 출력해줌으로써 사용자와 자연스러운 대화가 가능하다.

Description

전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치{Apparatus for intelligent dialog based on voice recognition using expert system}
본 고안은 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치에 관한 것으로, 특히 화자의 음성을 인식하고 적절한 상황과 기존의 자료를 통하여 화자와 대화가 가능토록 한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치에 관한 것이다.
일반적으로, 기존의 음성인식 기술은 화자 종속형 음성 인식(특정인의 음성만 인식)이거나 불연속적 단어 인식으로써, 다수의 사람이 사용할 수 없고 발음시에도 한마디씩 끊어서 해야하는 불편함이 있다.
또한 새로운 단어를 추가하기 위해서 몇번에 걸친 학습이 필요하였으며, 한번 인식하고 답변하는데 걸리는 시간도 2 ~ 4초로서 많은 지연 시간이 걸렸다.
그밖에도 남녀노소, 음성고저, 목소리 톤의 변환에 민감하게 반응하여 제대로 인식하지 못하는 문제가 있었다.
또한, 음성 인식후 그에 대한 답변 방식(TTS)도 일반인이 느끼기에 어색한 억양과 톤으로 듣기에 거북한 면도 있어 전반적으로 음성인식 기술을 제품화하는 데 어려움이 있었다.
최근에는 주지한 바와 같은 음성 인식의 문제점을 해결하기 위해서, 화자 독립형 음성인식(특정인에 상관없이 음성인식 가능), 가변어 인식(특별한 학습 없이 단어 추가 가능), 연속음 인식(연속적인 발음을 인식), 주변 환경에의 독립적 인식 등의 기술이 개발되고 있다.
그러나 이렇게 개발되는 음성 인식 장치를 적용한 제품들도 사전에 각본에 의해 화자의 답변이 제한되는 단점이 있다. 즉 갑을 말하면 을을 답한다는 식으로 정해져 있기 때문에 대화 매체로서는 많은 부족함이 있다.
또한, 한번 만들어진 내용은 변경이 불가능하기 때문에 한정된 대화 내용으로 기술의 수명 측면에서 문제점이 발생하였다.
한편, 일반적으로 전문가 시스템은 전문가의 지식을 컴퓨터 시스템에 저장하여 전문가의 판단 절차와 동일하게 시스템 프로세스를 진행하도록 구현된 시스템으로써, 추론 절차를 거쳐 가장 이상적인 결과가 도출되도록 구축된 시스템이다.
기존에 전문가 시스템이 적용된 분야를 살펴보면, 의료 진단 시스템, 기계 고장 진단 시스템, 지하 광물 판단 시스템, 일기 예보 시스템 등 고난도의 산업에 다양하게 적용되어 왔다. 그러나 이러한 우수성에도 불구하고 소비재나 서비스관련 분야에는 적극적 진출이 부족하였다.
따라서 본 고안은 상기와 같은 기존의 음성 인식 장치에서 발생하는 제반 문제점과 전문가 시스템의 단편적인 적용 문제를 해결하기 위해서 제안된 것으로서,
본 고안의 목적은, 화자의 음성을 인식하고 적절한 상황과 기존의 자료를 통하여 화자와 대화가 가능토록 한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치를 제공하는 데 있다.
상기와 같은 목적들을 달성하기 위한 본 발명은,
음성 인식을 위해서 화자 독립형 음성 인식(특정인에 관계없이 거의 모든 사람의 음성을 인식) 기술을 적용하여 음소 기반의 자연어 대화가 가능토록 하고, 특별한 학습 없이도 자유롭게 단어를 추가할 수 있으며, 평균 1초 안팎의 응답 시간으로 최적의 대화 상태를 유지할 수 있도록 한다. 또한, 음성 인식시 잡음 제거 기술을 부가하여 주변 환경에 영향받지 않고 대화를 나눌 수 있도록 한다.
또한, 음성 인식 장치에 전문가 시스템을 부가하여, 화자의 기본 자료를 기억하고 있는 상태에서 이를 바탕으로 화자의 말을 인식하고 전문가 시스템의 널리지 베이스(Knowledge Base)를 활용함으로써 많은 룰을 적용하여 화자의 질문에 높은 수준의 가장 적절한 답변을 제공하도록 한다.
즉, 화자의 기본 자료로 자신의 주변 환경 자료들을 입력하고, 화자 수준의 사고가 가능하도록 전문가 시스템의 룰을 구성하여 친구 수준의 대화가 가능토록 한다.
도 1은 본 고안에 의한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치의 구성을 보인 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
10 : 음성 인식 장치
20 : 데이터 변환 장치
30 : 전문가 시스템
이하 상기와 같은 기술적 사상을 따르는 본 고안의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.
첨부한 도면 도 1은 본 고안에 의한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치의 구성을 보인 도면이다.
여기서, 참조부호 10은 사용자의 음성을 인식하고, 그 인식된 음성에 대한 답변을 합성 음성으로 송출해주는 음성 인식 장치를 나타내고, 참조부호 20은 상기 음성 인식 장치에서 인식된 음소 데이터를 후단의 전문가 시스템이 인식할 수 있는 데이터로 변환하여 상기 전문가 시스템에 전달하고, 상기 전문가 시스템에서 출력되는 답변 데이터를 상기 음성 인식부(10)에 전달해주는 데이터 변환장치를 나타낸다. 또한, 참조부호 30은 상기 데이터 변환장치(20)를 통해 전달되는 음소 데이터에 대응하는 답변을 도출하고, 그 도출한 답변을 상기 데이터 변환장치(20)에 전달해주는 전문가 시스템을 나타낸 것이다.
여기서, 상기 음성 인식 장치는, 사용자의 음성을 음소 단위로 분석하고 검토된 주된 질의어를 선택하여 데이터화하는 음소기반 음성분석부(11)와, 상기 데이터 변환장치(20)에서 전달되는 데이터에 해당하는 음성 데이터를 출력하는 음성 데이터 베이스(12)와, 상기 음성 데이터 베이스(12)에서 출력되는 음성 데이터를 합성 음성으로 만들어 사용자에게 송출해주는 음성 합성부(13)로 구성된다.
또한, 상기 전문가 시스템(30)은 입력된 질문 내용을 분석하여 분류하고, 적절한 룰로 연결시켜주며, 룰 적용후 선택된 답변 내용을 받아 상기 데이터 변환 장치(20)에 전달해주는 인퍼런스 엔진(31)과, 상기 인퍼런스 엔진(31)에서 설정되는 룰에 워킹 메모리(33)에서 인출한 팩트(Fact)를 적용하여 질문에 대한 답변을 추출하고 그 답변을 상기 인터페이스 엔진(31)에 전달해주는 답변 추출부(32)와, 사용자와의 대화를 통해 취득한 여러 기본 팩트 및 룰에 적용할 조건들의 집합체인 팩트를 저장한 워킹 메모리(33)로 구성된다.
이와 같이 구성된 본 고안에 의한 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치는, 먼저 사용자 음성을 인식하고, 그 인식된 음성에 대한 답변을 합성 음성으로 송출해주는 음성 인식 장치(10)내의 음소기반 음성분석부(11)는, 사용자로부터 질문 음성이 입력되면, 이를 음소 단위로 분석하고, 그 분석 결과에 따라 주된 질의어를 선택하여 데이터화한 후 데이터 변환 장치(20)에 전달한다.
상기 데이터 변환 장치(20)는 입력되는 질의어 음소 데이터를 전문가 시스템(30)에 적용할 수 있도록, 상기 질의어 음소 데이터를 전문가 시스템(30)에서 인식할 수 있는 데이터로 변환하여 상기 전문가 시스템(30)에 전달한다.
상기 전문가 시스템(30)은 상기 데이터 변환장치(20)를 통해 전달되는 음소 데이터에 대응하는 답변을 도출하고, 그 도출한 답변을 상기 데이터 변환장치(20)에 전달해준다.
즉, 전문가 시스템(30)내의 인퍼런스 엔진(31)은, Knowledge Base안의 룰(Rule)과 팩트(Fact)를 관리하는 시스템으로, 답변 추출부(32)에서 룰 적용의 안내를 Super Rule로서 관여하는 장치로서, 입력된 질문 내용을 분석하여 분류하고, 적절한 룰로 연결시켜준다.
이에 따라 답변 추출부(32)는 상기 인퍼런스 엔진(31)의 룰 적용에 따라 미리 설정된 룰중 상기 적용된 룰을 설정하고, 그 설정된 룰의 조건에 해당하는 팩트를 워킹 메모리(33)로부터 인출한 후, 상기 설정된 룰에 적용시켜 그 결과치를 사용자가 입력한 질의어의 답변으로 상기 인퍼런스 엔진(31)에 전달한다. 여기서, 답변 추출부(32)는 답변유도 룰의 집합체이며, 전문가 시스템의 성능은 이 룰의 적용에 달려있다. 따라서 본 고안의 답변 추출부(32)는 각 제품의 특색에 맞추어 각 질문과 응답을 각 분야의 전문가의 자문에 의거 미리 작성한 뒤 이를 룰로 변경하여 답변 추출부(32)에 저장해 놓는다.
또한, 워킹 메모리(33)는 팩트를 저장하는 곳으로 룰에 적용할 조건들의 집합체이다. 초기에 사용자와의 대화를 통해 취득된 기본 팩트들(예를 들어, 이름, 성격, 나이, 취미 등등)도 이곳에 저장하여 룰의 조건에 적용되도록 한다.
한편, 인퍼런스 엔진(31)은 상기 답변 추출부(32)에서 얻어지는 답변을 상기 데이터 변환 장치(20)에 전달하게 되며, 상기 데이터 변환 장치(20)는 그 전달되는 답변 데이터가 음성으로 출력될 수 있도록 조사(助詞) 등을 포함시켜 변환한 답변 데이터를 음성 인식 장치(10)에 전달한다.
상기 음성 인식 장치(10)내의 음성 데이터 베이스(12)는 상기 데이터 변환 장치(20)에서 요구하는 답변 데이터에 해당하는 음성을 데이터 베이스에서 선택하며, 이때 적절한 조사(助詞)의 음성 데이터도 같이 선택하여 음성 합성부(13)에 전달한다.
상기 음성 합성부(13)는 상기 음성 데이터 베이스(12)에서 전달되는 음성들을 합성하여 사용자의 질의어에 대한 답변으로 송출한다. 여기서, 음성 합성부(13)는 음성과 음성간의 간격, 높낮이, 조사 등을 고려하여 사용자가 자연스럽게 들을 수 있도록 음성들을 합성하여 송출해준다.
이상 설명한 본 고안은 대화 Contents 내용의 변경이 가능하므로, 새로운 제품으로의 내용 변경도 가능하며, 대화 칩의 교체를 통하여 간단히 새로운 시스템으로 변경할 수 도 있다. 결국, 어린이용, 외로운 노인용, 독신자용, 환자용 등으로 제품을 구별하여 적용할 수 있으며, 각 시스템의 룰을 변경하여 다른 대화 및 답변을 듣게되는 등의 버전을 변경할 수도 있다.
이상에서 상술한 본 고안 '전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치'에 따르면, 음성 인식 장치와 전문가 시스템을 결합하여 보다 지능적인 대화 시스템을 구현할 수 있으므로, 화자의 음성을 인식하고 적절한 상황과 기존의 자료를 통하여 화자와 자연스러운 대화가 가능한 이점이 있다.
또한, 편리성과 정확성을 모두 구현할 수 있으므로, 대화형 교육 시스템, 노인 복지 차원의 대화 시스템, 의학용 치료 시스템 등으로 적용 가능한 이점이 있다.

Claims (3)

  1. 대화 시스템에 있어서,
    사용자의 음성을 인식하고, 그 인식된 음성에 대한 답변을 합성 음성으로 송출 해주는 음성 인식 장치와;
    상기 음성 인식 장치에서 인식된 음소 데이터를 후단의 전문가 시스템이 인식할 수 있는 데이터로 변환하여 상기 전문가 시스템에 전달하고, 상기 전문가 시스템에서 출력되는 답변 데이터를 상기 음성 인식 장치에 전달해주는 데이터 변환장치와;
    상기 데이터 변환장치를 통해 전달되는 음소 데이터에 대응하는 답변을 도출하고, 그 도출한 답변을 상기 데이터 변환장치에 전달해주는 전문가 시스템을 포함하여 구성된 것을 특징으로 하는 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치.
  2. 제 1 항에 있어서, 상기 음성 인식 장치는, 사용자의 음성을 음소 단위로 분석하고 검토된 주된 질의어를 선택하여 데이터화하는 음소기반 음성분석부와, 상기 데이터 변환장치에서 전달되는 데이터에 해당하는 음성 데이터를 출력하는 음성 데이터 베이스와, 상기 음성 데이터 베이스에서 출력되는 음성 데이터를 합성 음성으로 만들어 사용자에게 송출해주는 음성 합성부로 구성된 것을 특징으로 하는 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치.
  3. 제 1 항에 있어서, 상기 전문가 시스템은, 입력된 질문 내용을 분석하여 분류하고, 적절한 룰로 연결시켜주며, 룰 적용후 선택된 답변 내용을 받아 상기 데이터 변환 장치에 전달해주는 인퍼런스 엔진과, 상기 인퍼런스 엔진에서 설정되는 룰에 워킹 메모리에서 인출한 팩트(Fact)를 적용하여 질문에 대한 답변을 추출하고 그 답변을 상기 인퍼런스 엔진에 전달해주는 답변 추출부와, 사용자와의 대화를 통해 취득한 기본 팩트들 및 룰에 적용할 조건들의 집합체인 팩트를 저장한 워킹 메모리로 구성된 것을 특징으로 하는 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치.
KR2019990028908U 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치 KR200184200Y1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-1999-0059554A KR100369732B1 (ko) 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-0059554A Division KR100369732B1 (ko) 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR200184200Y1 true KR200184200Y1 (ko) 2000-06-01

Family

ID=19627423

Family Applications (2)

Application Number Title Priority Date Filing Date
KR10-1999-0059554A KR100369732B1 (ko) 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법
KR2019990028908U KR200184200Y1 (ko) 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR10-1999-0059554A KR100369732B1 (ko) 1999-12-21 1999-12-21 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법

Country Status (1)

Country Link
KR (2) KR100369732B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101357804B1 (ko) 2012-10-24 2014-02-03 이동균 질의 답변 시스템 및 방법
KR20240000266U (ko) 2022-08-04 2024-02-14 (주)미소정보기술 가상비서 디바이스

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100945210B1 (ko) * 2009-03-05 2010-03-03 김창호 대기전력 차단 장치 및 그 제어 방법
KR102033388B1 (ko) * 2014-06-30 2019-10-17 한국전자통신연구원 질의 응답 장치 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06175677A (ja) * 1992-12-07 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法
US5774860A (en) * 1994-06-27 1998-06-30 U S West Technologies, Inc. Adaptive knowledge base of complex information through interactive voice dialogue
JP3968133B2 (ja) * 1995-06-22 2007-08-29 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
JPH10124086A (ja) * 1996-10-25 1998-05-15 Meidensha Corp 音声対話システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101357804B1 (ko) 2012-10-24 2014-02-03 이동균 질의 답변 시스템 및 방법
KR20240000266U (ko) 2022-08-04 2024-02-14 (주)미소정보기술 가상비서 디바이스

Also Published As

Publication number Publication date
KR100369732B1 (ko) 2003-01-30
KR20010057258A (ko) 2001-07-04

Similar Documents

Publication Publication Date Title
US9251142B2 (en) Mobile speech-to-speech interpretation system
US5758023A (en) Multi-language speech recognition system
US20060080098A1 (en) Apparatus and method for speech processing using paralinguistic information in vector form
US8812314B2 (en) Method of and system for improving accuracy in a speech recognition system
JP4914295B2 (ja) 力み音声検出装置
US11335324B2 (en) Synthesized data augmentation using voice conversion and speech recognition models
CN112581963B (zh) 一种语音意图识别方法及系统
KR20190135853A (ko) 텍스트- 다중 음성 변환 방법 및 시스템
KR200184200Y1 (ko) 전문가 시스템을 이용한 음성인식 기반의 지능형 대화 장치
JP2004163541A (ja) 音声応答装置
Jackson Automatic speech recognition: Human computer interface for kinyarwanda language
Ajayi et al. Systematic review on speech recognition tools and techniques needed for speech application development
Furui Toward the ultimate synthesis/recognition system
Schramm et al. A Brazilian Portuguese language corpus development
JP2002287791A (ja) 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法
KR100304788B1 (ko) 연속 음성 인식을 이용한 전화번호 안내 방법
JP2000242295A (ja) 音声認識装置および音声対話装置
Africa Victor ODUMUYIWA Department of Computer Sciences, University of Lagos Nigeria
Selouani “Well Adjusted”: Using Robust and Flexible Speech Recognition Capabilities in Clean to Noisy Mobile Environments
Peddawad On-The-Fly Student Notes from Video Lecture Using ASR
JP2003323191A (ja) 音声対応インターネットホームページのアクセスシステム
CN113870829A (zh) 基于家庭角色的声学模型播报的方法、系统、设备及存储介质
JPH10124090A (ja) 音声認識方法およびこの方法を実施する装置
Furui Speech recognition technology in multimodal/ubiquitous computing environments
KOSTOV12 et al. Advancement of Assistive Technology 195 G. Anogianakis et al.(Eds.) IOS Press, 1997

Legal Events

Date Code Title Description
U107 Dual application of utility model
REGI Registration of establishment
T701 Written decision to grant on technology evaluation
FPAY Annual fee payment

Payment date: 20000721

Year of fee payment: 3

LAPS Lapse due to unpaid annual fee