KR100918644B1 - 대화 시스템 및 대화 문장 생성 방법 - Google Patents

대화 시스템 및 대화 문장 생성 방법 Download PDF

Info

Publication number
KR100918644B1
KR100918644B1 KR1020090053816A KR20090053816A KR100918644B1 KR 100918644 B1 KR100918644 B1 KR 100918644B1 KR 1020090053816 A KR1020090053816 A KR 1020090053816A KR 20090053816 A KR20090053816 A KR 20090053816A KR 100918644 B1 KR100918644 B1 KR 100918644B1
Authority
KR
South Korea
Prior art keywords
word
sentence
conversation
answer
words
Prior art date
Application number
KR1020090053816A
Other languages
English (en)
Inventor
김정중
Original Assignee
김정중
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김정중 filed Critical 김정중
Priority to KR1020090053816A priority Critical patent/KR100918644B1/ko
Application granted granted Critical
Publication of KR100918644B1 publication Critical patent/KR100918644B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 대화 시스템에서, 실제 사용된 문장 및 단어의 수집과 상호 연결을 통하여 대화문장을 생성하고, 단어의 정의 수정 및 확대 과정을 거쳐 자신의 입장과 대화 상대자의 상황에 적당한 문장을 출력할 수 있도록 한 대화 시스템 및 대화 문장 생성 방법에 관한 것이다.
이러한 본 발명은, 생성하고자 하는 대답과 질문에 대한 문장의 각 단어에 대한 품사를 단어 연결 테이블과 파생 테이블로부터 확인하여 품사 불량 단어를 찾아 문장을 수정한 후 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장을 수정한 다음 문장 내 완성된 단어 리스트를 작성하는 제1과정과; 기 표현된 단어 테이블에 일치하는 단어가 있는지의 여부를 확인하여 일치하는 단어가 없는 경우 단어의 의미를 묻는 질문 문장을 생성하고 상식 단어 테이블을 이용하여 상식 단어를 확인한 후 상기 상식 단어 테이블에 일치하는 단어가 있는지의 여부에 따라 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성하거나 단어의 의미를 묻는 질문 문장을 생성하는 제2과정과; 대화자의 문장과 시스템에서 생성한 문장의 진위를 표시하고 세계관을 판단하는 제3과정과; 문장 완성 조건을 만족하거나 세계관 문장이 존재하지 않으면 하나의 문장이 완성된 것으로 판단하고, 그렇지 않은 경우 상기 대답문장을 생성하는 과정으로 복귀하는 제4과정에 의해 달성된다.
문장, 대화, 시스템, 단어, 대답문장

Description

대화 시스템 및 대화 문장 생성 방법{CONVERSATION SYSTEM AND SENTENCE GENERATION METHOD THEREOF}
본 발명은 청자 혹은 화자의 입장에서 직접 대화를 수행하는 기술에 관한 것으로, 특히 실제 사용된 문장 및 단어의 수집과 상호 연결을 통하여 대화문장을 생성하고, 단어의 정의 수정 및 확대 과정을 거쳐 자신의 입장과 대화 상대자의 상황에 적당한 문장을 출력할 수 있도록 한 대화 시스템 및 대화 문장 생성 방법에 관한 것이다.
최근 들어, 컴퓨팅 능력과 메모리에 관한 컴퓨터 용량의 획기적인 향상 및 다른 한편으로는 이론적인 음성분석으로 인하여, 음성 대화 시스템(이하, '대화 시스템'이라 칭함)에 대한 연구개발이 활발해지고 있는 실정에 있다. 대화 시스템은 음성, 사운드, 캐릭터, 숫자, 그래픽, 이미지 등을 입력, 출력 및 처리하는 멀티미디어 시스템에 통합되어 있다.
컴퓨터 동작을 위한 구어(spoken language) 입력의 기본적인 엘리먼트는, 즉 단어들의 세트에 의해 음성 신호에 대응하는 정자(orthographic) 표현으로 변환하는 것이 음성 인식이다. 인식된 단어 및 문장은, 명령 및 데이터 엔트리와 같은 애플케이션에 대하여 최종 결과일 수 있거나 또는 추가적인 언어에 대한 입력으로서 기능할 수 있다.
통계적인 언어 모델을 사용하여 분리된 워드 인식으로부터 연속적인 워드 인식으로 개발되고 있다.
대화 시스템의 출력 작업에 대하여, 부분적으로는 직접적인 문자/음성 대화 시스템들로부터 개별적인 억양까지도 고려하는 정교한 음성 합성 수단까지 개발되고 있다.
종래의 대화 시스템은 음성 인식 및 음성 합성으로서 개별적으로 개발된 컴포넌트들의 간단한 결합물로서 설계되었다. 부가적으로, 부분적으로는 일부 컴포넌트의 낮은 통합 정도의 결과로서, 현존 대화 시스템들은 특정 플랫폼에 결합되고, 다른 인터페이스들의 원하지 않은 다이버시티를 나타낸다.
그런데 종래의 대화 시스템에 있어서는 자신의 입장과 대화 상대자의 상황에 적당한 대화서비스를 적절히 제공하지 못하는 결함이 있었다.
따라서, 본 발명의 목적은 실제 사용된 문장 및 단어의 수집과 상호 연결을 통하여 대화문장을 생성하고, 단어의 정의 수정 및 확대 과정을 거쳐 자신의 입장과 대화 상대자의 상황에 적당한 문장을 출력할 수 있도록 하는 데 있다.
본 발명의 목적들은 앞에서 언급한 목적으로 제한되지 않는다. 본 발명의 다른 목적 및 장점들은 아래 설명에 의해 더욱 분명하게 이해될 것이다.
상기와 같은 목적을 달성하기 위한 본 발명은, 음성 입력부를 통해 대화 대상자로부터 입력되는 질문이나 대답에 대한 음성을 문장으로 변환한 후 대화의 토픽이나 대화 중 예견된 문장과 비교 및 수정하여 문장을 완성하는 음성 인식기와; 상기 음성 인식기에서 출력되는 문장에 대응하여, 생성하고자 하는 대답과 질문에 대한 문장의 불량 단어를 찾아 수정한 후, 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장을 수정한 다음 문장 내 완성된 단어 리스트를 작성하고, 기 표현된 단어 테이블에 일치하는 단어가 없는 경우 단어의 의미를 묻는 질문 문장을 생성하고 일치하는 단어가 있는지의 여부에 따라 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성하거나 단어의 의미를 묻는 질문 문장을 생성하는 문장 생성기와; 상기 문장 생성기에서 완성된 문장이 대화의 주제에 맞는지 확인하여 선별한 후 완성된 문장에 접속사 를 삽입하여 선별된 문장을 논리 순위로 배열하는 응답 작성기와; 상기 응답 작성기에서 생성된 문장을 문장음성발생기를 이용하여 음성 파일로 변환하여 음성출력부를 통해 대화음성으로 출력되게 하는 음성 생성기;로 구성함을 특징으로 한다.
바람직하게, 상기 음성입력부는 대화 대상자의 음성을 마이크를 통해 전기적인 신호로 변환한 후 음성 파일로 변환한다.
바람직하게, 상기 음성 인식기는, 통상의 음성 추출, 음향신호 처리 및 음소 인식 알고리즘(DTW,HMM)을 사용하여 음성을 문장으로 변환하는 음성 인식부와; 상기 음성 인식부에서 생성된 음성 인식 문장을 예상 대답이나 예상 질문 테이블과 비교하고, 상기 음성 인식부에서 생성된 음성 인식 문장을 구성하는 단어를 예상 대답 혹은 예상 질문의 단어 테이블과 비교하여 비교 테이블에 존재하지 않는 단어일 경우 연관/파생 단어 테이블과 비교하여 해당 단어를 연관/파생 단어의 원천 단어로 환원하여 표준 문장을 완성하는 문장 확인부를 포함하여 구성된다.
바람직하게 상기 음성 인식부는 음소 인식 시 토픽에 따른 예상 문장의 단어 음성 매핑 테이블을 사용하거나, 대화 예상 문장을 구성한 단어 음성 매핑 테이블을 사용한다.
상기와 같은 목적을 달성하기 위한 또 다른 본 발명은, 생성하고자 하는 대답과 질문에 대한 문장의 각 단어에 대한 품사를 단어 연결 테이블과 파생 테이블로부터 확인하여 품사 불량 단어를 찾아 문장을 수정한 후 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장을 수정한 다음 문장 내 완성된 단어 리스트를 작성하는 제1과정과; 기 표현된 단어 테이블에 일치하는 단어가 있는지의 여부를 확인하여 일치하는 단어가 없는 경우 단어의 의미를 묻는 질문 문장을 생성하고 상식 단어 테이블을 이용하여 상식 단어를 확인한 후 상기 상식 단어 테이블에 일치하는 단어가 있는지의 여부에 따라 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성하거나 단어의 의미를 묻는 질문 문장을 생성하는 제2과정과; 대화자의 문장과 시스템에서 생성한 문장의 진위를 표시하고 세계관을 판단하는 제3과정과; 문장 완성 조건을 만족하거나 세계관 문장이 존재하지 않으면 하나의 문장이 완성된 것으로 판단하고, 그렇지 않은 경우 상기 대답문장을 생성하는 과정으로 복귀하는 제4과정으로 이루어짐을 특징으로 한다.
바람직하게, 상기 제2과정의 상식 단어 테이블은 일반적으로 대다수의 대화자가 알고 있다고 생각하는 단어 묶음이다.
바람직하게, 제2과정은 대답문장을 생성하기 위하여, 대화문이 질문 대화문인 경우, 문의 단어와 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 단어 리스트를 만드는 단계와; 상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 설정하는 단계와; 대화문이 대답 대화문인 경우, 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾아내는 단계를 포함한다.
바람직하게, 상기 제2과정은 문장의 단어 구성연결 요소가 완비된 경우, 대화의 주제 단어 리스트로부터 단어를 추출하는 단계와; 상기 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성하는 단계와; 기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 상세 설명을 위한 대답 단어 구성연결 요소로 선정하는 단계와; 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만드는 단계와; 대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함한다.
바람직하게, 상기 제2과정은 문장의 단어 구성연결 요소가 불비된 경우, 불비된 단어 구성연결 요소에 해당하는 기준 단어 내용 구성연결 요소 단어와 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만드는 단계와; 대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함한다.
바람직하게, 제2과정은 질문문장을 생성하기 위하여, 대화문이 질문 대화문인 경우 문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 문의 단어를 포함한 단어 리스트를 만드는 단계와; 상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 부가 질문 문장으로 설정하는 단계와; 대화문이 대답 대화문인 경우 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾아내는 단계를 포함한다.
바람직하게, 상기 제2과정은 문장의 단어 구성연결 요소가 완비된 경우, 대 화의 주제 단어 리스트로부터 단어를 추출하는 단계와; 상기 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성하는 단계와; 기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 질문을 위한 문의 단어 구성연결 요소로 선정하고 이에 해당하는 문의 단어를 선정하는 단계와; 문의 단어에 해당하는 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어 리스트를 만드는 단계와; 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 부가 질문 문장으로 선정하는 단계를 포함한다.
바람직하게, 상기 제2과정은 문장의 단어 구성연결 요소가 불비된 경우, 불비된 단어 구성연결 요소에 해당하는 단어를 기준 단어 구성연결 요소 테이블로부터 추출하는 단계와; 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 정하고 이에 해당하는 문의 단어를 선정하는 단계와; 문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어를 포함한 단어 리스트를 만드는 단계와; 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함한다.
상기와 같은 목적을 달성하기 위한 또 다른 본 발명은, 주어진 단어들이 기 표현 단어 테이블에 존재하는지 확인한 후 정의/연관/파생 단어를 생성하는 과정과; 상기 정의/연관/파생 단어로부터 단어 내용 구성연결 단어(7W1H1V)를 선정하여 단어 리스트를 만드는 과정과; 표준 문장 테이블로부터 해당 단어 리스트가 들어 있는 표준 문장들을 추출한 후, 상기 추출한 표준문장 중에서 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 최종적으로 대화용 출력 문장으로 선정하는 과정으로 이루어짐을 특징으로 한다.
본 발명은 실제 사용된 문장과 단어의 수집이나 연결을 통하여 단어의 정의 수정과 확대 등을 꾀할 수 있게 하여, 자신의 입장과 대화 상대자의 상황에 적당한 문장을 출력할 수 있도록 함으로써, 교사의 도움을 받지 않고 저렴한 비용으로 대화 능력을 향상시킬 수 있는 효과가 있다.
전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 것이다.
본 발명을 설명함에 있어서, 본 발명과 관련된 공기 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하면 다음과 같다.
먼저, 본 발명의 대화 시스템에 사용되는 단어를 정의해 보면 다음과 같다.
대화는, 도 1에서와 같이 질문과 대답으로 이루어지는 일련의 사건이며 대화 행위는 본 대화 시스템과 대화자 사이에서 이루어지는 것으로서, 대화자는 본 대화 시스템과 대화를 하는 주체이다.
대화의 주제는, 대화가 달성하고자 하는 일련의 사건이며, 대화 초기에는 드러나지 않거나 대화의 양 주체가 주제를 설정하지 않을 수 있고, 주제는 문장이다.
주제 단어 리스트는, 주제 문장을 형성하는 단어 리스트와 각 단어의 연관 단어나 정의 단어 혹은 파생단어로 확대할 수 있다.
질문은, 기본적으로 대답을 요구하는 문장이며, 다른 질문을 요구하기도 한다.
대답은, 기본적으로 질문에 대한 문장이고, 다른 대답을 요구하기도 한다.
문장은, 의미를 나타내기 위하여 일정 형식의 문법에 따라 만들어지며, 기호와 구두점 포함하는 단어들의 모임이다.
단어는, 문장 속에 공백이나 구두점으로 구분되어 있는 문자들의 모임이며, 의미를 가진 요소의 어근들로 이루어진다.
어근은, 단어 속에 공통으로 사용된 문자들의 모임으로서 의미를 갖고, 어근이면서 동시에 단어일 수 있다.
의미는, 개념과 시청각 형상의 결합이다.
단어 간의 관계는, 사용 연결과 구성연결이 있는데, 도 2는 단어 연결 사례를 나타낸 예시도 이다.
정의 단어는, 본 단어의 정의를 구성하는 단어이다.
연관 단어는, 본 단어와 사용시 동일한 의미를 갖는 단어이다.
파생단어는, 본 단어의 상위, 동급, 하위 혹은 내용 단어를 의미하는 것으로 예를 들어, 바지의 상위 단어는 의류, 하위 단어는 바지 지퍼, 동급 단어는 치마, 내용 단어는 청바지, 양복 바지 등이다.
기 표현단어는, 대화자가 이미 만든 문장을 구성하는 단어로서, 기 표현 단어 테이블은 기 표현된 단어들로 구성된 테이블이다.
상식 단어는, 일반 대화자가 이미 알고 있다고 판단되는 단어로서, 상식 단어 테이블은 상식 단어들로 구성된 테이블이다.
단어 진위는, 단어의 의미는 부정, 판단불능과 긍정으로 분류되며 상기 부정의 값은 -1, 판단불능의 값은 0, 긍정의 값은 1이며, 단어 진위 테이블은 부정, 판단불능, 긍정으로 분류한 단어의 모임이다.
문장의 무게는, 문장을 구성하는 단어의 값(진위)의 합으로서, 문장의 무게 산출은 문장의 부정의 값, 문장의 긍정의 값, 문장의 판단불능의 값, 문장의 무게로 구성된다.
문장의 부정의 값은, 단어의 부정의 값들의 곱(예: -1×-1×-1×…)이고,
문장의 긍정의 값은, 단어의 긍정의 값들의 합(예: 1+1+1+…)이며,
문장의 판단불능의 값은, 0이고, 문장의 무게를 구하는 수식은 다음과 같다.
문장의 무게 = 문장의 긍정의 값 + 문장의 부정의 값
문장의 진위는, 문장을 구성하는 단어의 부정의 값들의 곱이다.
예상 질문과 대답은, 대화 시스템의 문장에 대응한 아직 사용하지 않은 대화 자의 문장으로서, 대화 시작 전에 대화 시스템이 대화자에게 시스템의 문장에 대하여 사용하도록 요구한 대화자의 문장이거나, 대화 시스템의 문장에 대하여 대화자가 대화 시작 전에 시스템이 알도록 한 대화자의 문장이며, 문장의 진위와 무게 값을 가진다.
단어 음성 매핑 테이블은, 문자 내 단어 음성신호 성분의 데이터를 모집한 자료로서, 동일한 단어라 하더라도 문장 내 음성신호 자료가 다를 수 있다.
세계관은, 특정 표준 문장으로서 문장의 진위와 무게 값을 가지는 것으로서, 예를 들어, 저속어나 사투리 등은 언어 구사 능력 부재에 따른 학습장애를 극복할 수 있는 대화시스템을 구현을 목적으로 하는 본 발명의 취지에 부적합하므로 이를 방지하기 위해 저속어나 사투리와 같은 부적합한 언어를 배제한 대중들이 일반적으로 사용하는 표준어를 사용하여 표준문장을 구성한다.
세계관의 표준문장은 단어 사용연결비가 상위 10%에 해당하는 표준문장을 의미한다.
본 발명의 대화 시스템에서 단어의 사용 연결에 대하여 설명하면 다음과 같다.
단어 사용 연결이란, 문장 속에서 단어들 간의 사용 관계를 의미하는 것으로서 언어별로 실제 사용한 사례를 수집하여 단어 연결 데이터 베이스를 작성한다.
문서화되거나 컴퓨터 자료로 만들어진 사례를 지속적으로 수집하고 갱신하며 문장 작성시 연결 값 순위 혹은 연결 임계값을 기준으로 사용하며, 문장의 단어 사용연결비를 구하는 수식은 다음과 같다.
사용연결비 = 문장의 단어 사용연결 총합÷문장의 단어수
단어 사용 연결의 요소로서 단어, 코드, 앞코드, 뒤코드, 연결이 있다.
본 발명의 대화 시스템에서의 코드는 3610 자리(Alphanumeric): 7+3(추가 단어 확장 자리), 3,656,158,440,062,980 개의 단어를 구비한 것을 예로 한다.
앞코드는, 본 단어의 바로 앞에 사용된 단어의 코드이다.
뒤코드는, 본 단어 바로 뒤에 사용된 단어의 코드이다.
연결은, 앞뒤단어와 동시에 사용된 실제 사례의 출현 누적 수이다.
본 발명의 대화 시스템에서 단어 구성연결에 대하여 설명하면 다음과 같다.
단어 구성연결이란, 특정 문장의 단어들 간의 구성관계를 의미하는 것으로, "누가(Who), 언제(When), 어디서(Where), 누구를(d-Whom), 누구에게(i-Whom), 왜(Why), 무엇을(What)의 7W와, 어떻게(How)의 1H와, 하다(Verb)의 1V" 등의 요소(7W1H1V)를 나타낸다.
기준 단어 구성연결 테이블에 대해 설명하면, 문장은 단어 구성연결 표현 요소와 내용 요소를 공히 가질 수 있으며, 언어별로 작성된 문장의 단어 구성연결 요소를 파악하여 작성하고, 대화 문자 생성시 각 단어에 필요한 연결 구성 요소를 파악한다.
기준 단어 구성연결 요소의 종류에는 표현 요소와 내용 요소가 있다.
표현 요소는, 단어 구성연결 요소에 해당하는 구체적인 문의 표현을 말하며, 기준 단어 구성연결 표현 요소 테이블은 아래의 <테이블 1>과 같다.
<테이블 1>
구성연결요소 표현
Where 어디
Where 어디서
Where 어디에
Where 어딘가
내용 요소는 단어 구성연결 요소에 해당하는 구체적인 내용을 말하는 것으로 모든 구체적인 내용을 수집하며, 기준 단어 구성연결 내용 요소 테이블은 아래의 <테이블 2>와 같다.
<테이블 2>
구성연결요소 표현
Where 장소에
Where 학교에
Where 캐나다에서
Where 위로
상기 구성 연결요소(7W1H1V)는, 누가(Who), 언제(When), 어디서(Where), 누구를(d-Whom), 누구에게(i-Whom), 왜(Why), 무엇을(What), 어떻게(How), 행위(Verb) 등 행위를 나타내는 동사의 묶음으로 한 개의 본동사와 다수개의 조동사로 구성된다.
또한, 본 발명의 대화 시스템에서 표준 문장은, 문서화되거나 전산 문서를 통하여 만들어진 문장을 말하는 것으로서, 이는 단어 사용연결 테이블을 통하여 완성된 문장이며, 각 단어 사용연결 누계 값이 특정 기준 값 이상이며, 또한 표준문장의 단어 사용연결비 > 2 × 총 문장의 단어 사용연결비 평균값이다.
표준 문장 테이블은, 표준 문장으로 구성된 테이블로서 문장의 진위와 무게 값을 가진다.
본 발명의 대화 시스템에서 특정 단어 또는 단어들로부터 대화용 출력 문장 을 생성하는 과정을 첨부한 도 3을 참조하여 설명하면 다음과 같다.
주어진 단어들이 기 표현 단어 테이블에 존재하는지 확인한다(S301).
정의/연관/파생 단어를 생성한다(S302, S303, S304).
상기 정의/연관/파생 단어로부터 단어 내용 구성연결 단어(7W1H1V)를 선정하여 단어 리스트를 만든다(S305).
표준 문장 테이블로부터 상기 단어 리스트가 들어 있는 표준 문장들을 추출한다(S306).
이후, 상기 추출한 표준문장 중에서 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 최종적으로 대화용 출력 문장으로 선정한다(S307, S308, S309).
본 발명의 대화 시스템은, 도 4에서와 같이 음성 입력부(400A), 대화 시스템부(400B) 및 음성 출력부(400C)로 구성된다.
즉, 상기 음성 입력부(400A)에서의 입력이란 질문 혹은 대답을 의미하는 것으로 음성 시스템(400B)에서 인식 가능한 레벨의 음성이며 음성 파일로 저장 가능하다.
대화 시스템부(400B)는, 음성 인식기(410), 문장 생성기(420), 응답 작성기(430) 및 음성 생성기(440)로 구성된다.
상기 음성 출력부(400C)에서의 출력이란 질문 혹은 대답을 의미하는 것으로 스피커를 통해 출력되며, 이를 음성파일로 저장할 수도 있다.
상기 음성인식기(410)의 작용을 도 5를 참조하여 설명하면 다음과 같다.
음성 입력부(400A)에서 대화 대상자의 음성이 마이크를 통해 전기적인 신호로 변환된 후 음성 파일로 변환되고 음성 인식부(411)는 음성 파일 형태로 변환된 음성을 문장으로 변환한다.
그리고 문장 확인부(412)는 상기 변환된 문장을 대화의 토픽이나 대화 중 예견된 문장(단어)과 비교 및 수정하여 문장을 완성한다.
이때, 음성 인식부(411)의 데이터는 데이터 베이스(413)에 저장되고 이 데이터는 문장 확인부(412)로 제공되며, 문장 확인부(412)에서 완성된 문장은 데이터 베이스(413)에 저장된다.
이와 동시에 음성 인식부(411)는, 통상의 음성 추출, 음향신호 처리(LPC(Liner predictive Coder) Analysis 등) 및 음소 인식(DTW(Dynamic Time Warping), HMM(Hidden Markov Model) 등) 알고리즘을 사용하여 음성을 문장으로 변환한다.
음소 인식 시에는, 토픽에 따른 예상 문장의 단어 음성 매핑 테이블을 사용하거나, 대화 예상 문장을 구성한 단어 음성 매핑 테이블을 사용하는데 이때 음성은 화자 종속적으로 단어 수가 200개 미만인 것이 바람직하다.
상기 문장 확인부(412)는, 음성 인식부(411)에서 생성된 음성 인식 문장을 예상 대답이나 예상 질문 테이블과 비교하고, 음성 인식부(411)에서 생성된 음성 인식 문장을 구성하는 단어를 예상 대답 혹은 예상 질문의 단어 테이블과 비교하며, 상기 비교 결과 비교 테이블에 존재하지 않는 단어일 경우 연관/파생 단어 테이블과 비교하여 해당 단어를 연관/파생 단어의 원천(근원) 단어로 환원하여 표준 문장을 생성한다.
상기 문장 생성기(420)의 문장 생성과정을 도 6의 신호 흐름도를 참조하여 설명하면 다음과 같다.
문장 생성기(420)에서 생성하고자 하는 문장은 대답과 질문에 대한 문장으로서 대답은 음성 질문에 대한 답으로 다수개의 문장으로 구성되고, 질문은 음성 질문에 대한 의문 사항을 다수개의 문장으로 만든다(S601).
상기 생성하고자 하는 문장의 품사 해석을 위해 그 문장의 각 단어에 대한 품사를 단어 연결 테이블과 파생 테이블로부터 확인하고, 이 과정에서 품사 불량 단어를 찾아 문장(단어)을 수정한다(S602).
이후, 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장(단어)을 수정한다(S603).
그리고 문장 내 완성된 단어 리스트를 만든다(S604).
이어서, 기 표현된 단어 연결 테이블에 일치하는 단어가 있는지의 여부를 확인하여 일치하는 단어가 있는 경우에는 대화자가 정확히 인지하고 있는 것으로 간주하여 대답이나 질문을 구성하는 문장에서 의미를 묻는 문장 즉 질문을 하지 않고 바로 사용할 수 있다.
하지만, 상기 일치하는 단어가 없는 경우에는 대화자가 정확히 인지하고 있지 않은 것으로 간주하여, 단어의 의미를 묻는 문장 즉 질문을 생성한다(S605).
이후, 상식 단어 테이블을 이용하여 상식 단어를 확인하게 되는데, 이 상식 단어 테이블은 일반적으로 대다수의 대화자가 알고 있다고 생각하는 단어 묶음이 다(S606).
이때, 문장 내의 단어들을 기준 단어 구성연결 표현 테이블과 비교하여 문의(Question) 단어가 존재하는지 확인하고, 확인 결과 문의 단어가 존재하면 대화문이 질문 대화문이고, 존재하지 않으면 대답 대화문이다(S607).
상기 상식 단어 테이블에 일치하는 단어가 있는 경우 대화자가 상식적으로 알고 있다고 간주하여, 대답이나 질문을 구성하는 문장에서 의미를 묻는 문장 즉, 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성한다(S608).
반면, 상기 상식 단어 테이블에 일치하는 단어가 없는 경우에는 대화자가 정확히 인지하고 있지 않은 것으로 간주하여 단어의 의미를 묻는 문장 즉 질문 문장을 생성한다(S609).
상기 대답문장을 생성하는 단계(S608)에 대하여 더욱 구체적으로 설명하면 다음과 같다.
문의(Question) 단어가 존재하여 대화문이 질문 대화문인 경우, 문의 단어와 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 단어 리스트를 만들고, 상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 대답 문장으로 설정한다.
그러나 상기 문의 단어가 존재하지 않아 대화문이 대답 대화문인 경우, 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾는다.
또한, 문장의 단어 구성연결 요소가 완비되었을 경우,
① 대화의 주제 단어 리스트로부터 단어를 추출한다.
② 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성한다.
③ 기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 상세 설명을 위한 대답 단어 구성연결 요소로 선정한다.
④ 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만든다.
⑤ 대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 대답 문장으로 정한다.
또한, 문장의 단어 구성연결 요소가 불비되었을 경우,
① 불비된 단어 구성연결 요소에 해당하는 기준 단어 내용 구성연결 요소 단어와 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만든다.
② 대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 대답 문장으로 정한다.
상기 질문 문장을 생성하는 단계(S609)에 대하여 더욱 구체적으로 설명하면 다음과 같다.
문의(Question) 단어가 존재하여 대화문이 질문 대화문인 경우, 문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 문의 단어를 포함한 단어 리스트를 만든다.
상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장 의 사용연결 값이 최대인 표준 문장을 부가 질문 문장으로 설정한다.
그러나 상기 문의 단어가 존재하지 않아 대화문이 대답 대화문인 경우, 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾는다.
문장의 단어 구성연결 요소가 완비되었을 경우,
① 대화의 주제 단어 리스트로부터 단어를 추출한다.
② 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성한다.
③ 기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 질문을 위한 문의 단어 구성연결 요소로 선정하고 이에 해당하는 문의 단어를 정한다.
④ 문의 단어에 해당하는 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어 리스트를 만든다.
⑤ 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 부가 질문 문장으로 정한다.
문장의 단어 구성연결 요소가 불비되었을 경우,
① 불비된 단어 구성연결 요소에 해당하는 단어를 기준 단어 구성연결 요소 테이블로부터 추출한다.
② 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 정하고 이에 해당하는 문의 단어를 정한다.
③ 문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어를 포함한 단어 리스트를 만든다.
④ 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결 값이 최대인 표준 문장을 대답 문장으로 정한다.
이후 문장의 진위를 판단(S610)하게 되는데 그 과정을 다음과 같다.
① 대화자의 문장의 단어 진위와 대화 시스템부(400B)가 생성한 문장의 단어 진위에 대한 테이블을 작성한다.
② 대화자의 문장의 진위와 대화 시스템부(400B)가 생성한 문장의 진위를 표시한다.
③ 최종 응답 작성시 논리적 배열을 접속사를 사용하여 조정할 수 있다.
이후, 세계관을 판단(S611)하게 되는데, 세계관이란 표준 문장의 단어 사용연결비가 상위 10%에 해당하는 표준문장이다.
이어서, 문장 완성 여부를 판단(S612)하게 되는데, 그 과정은 다음과 같다.
① 작성된 문장의 무게가 X 이고, 추출한 세계관 문장의 무게가 Y 일 때, 문장 완성 조건은 다음의 <수학식 1>로 표현된다.
문장 완성 조건 = Y × 0.9 ≤ X ≤ Y × 1.1
삭제
② 상기 [수학식 1]을 만족하거나 세계관 문장이 존재하지 않으면 하나의 문장이 완성되어 다음 단계(S613)로 진행한다.
③ 하지만, 상기 [수학식 1]을 만족하지 않으면 상기 대답 문장을 생성하는 단계(S608)부터 다시 시작한다.
따라서, 상기 단계(S612)에 의하여 누적 문장수가 결정된다.
상기와 같은 과정을 통해 완성된 문장을 누적 저장하고, 하나의 문장이 완성될 때는 도 6의 화살표와 같이 상기 생성할 문장 단계(S601)의 대화자 문장을 대체하여 남은 과정을 지속하고, 누적된 문장의 수가 10개 이상인 경우 그 누적된 문장을 응답 작성기(430)로 전달한다(S613).
도 7을 참조하여 상기 응답 작성기(430)의 작용을 설명하면 다음과 같다.
상기 응답 작성기(430)는, 대답과 질문의 문장은 다수개의 문장으로 구성될 수 있으며, 문장 생성기(420)로부터 완성된 문장이 대화의 주제에 맞는지 확인하여 선별하고, 상기와 같이 완성된 문장에 접속사를 삽입하여 선별된 문장을 논리 순위로 배열한다.
도 8을 참조하여 상기 음성 생성기(440)의 작용을 설명하면 다음과 같다.
상기 음성 생성기(440)는, 상기 응답 작성기(430)로부터 생성된 문장을 문장음성발생기(TTS: Text To Speech)(441)의 프로그램을 이용하여 음성 파일로 변환한다.
이렇게 변환된 음성파일은 음성출력부(400C)를 통해 대화음성으로 출력된다.
이때, 음성파일은 데이터는 도 8의 화살표와 같이 데이터 베이스(442)화되고 응답문자로 제공된다.
이상에서 본 발명의 바람직한 실시예에 대하여 상세히 설명하였지만, 본 발 명의 권리범위가 이에 한정되는 것이 아니라 다음의 청구범위에서 정의하는 본 발명의 기본 개념을 바탕으로 보다 다양한 실시예로 구현될 수 있으며, 이러한 실시예들 또한 본 발명의 권리범위에 속하는 것이다.
도 1은 대화의 기본 요소를 나타낸 예시도.
도 2는 단어 연결 사례를 나타낸 예시도.
도 3은 본 발명에 의한 문장 결정방법을 나타낸 순서도.
도 4는 본 발명에 의한 대화 시스템의 순서도.
도 5는 도 4에서 음성 인식기의 상세 순서도.
도 6은 도 4에서 문장 생성기의 신호 순서도.
도 7은 도 4에서 응답 작성기의 상세 순서도.
도 8은 도 4에서 음성 생성기의 상세 순서도.
***도면의 주요 부분에 대한 부호의 설명***
400A:음성 입력부 400B:대화 시스템부 400C:음성 출력부
410:음성 인식기 411:음성 인식부 412:문장 확인부
413:데이터 베이스 420:문장 생성기 430:응답 작성기
440:음성 생성기 441:문장음성발생기(TTS) 442:데이터 베이스

Claims (14)

  1. 음성 입력부를 통해 대화 대상자로부터 입력되는 질문이나 대답에 대한 음성을 문장으로 변환한 후 대화의 토픽이나 대화 중 예견된 문장과 비교 및 수정하여 문장을 완성하는 음성 인식기;
    상기 음성 인식기에서 출력되는 문장에 대응하여, 생성하고자 하는 대답과 질문에 대한 문장의 불량 단어를 찾아 수정한 후 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장을 수정한 다음 문장 내 완성된 단어 리스트를 작성하고, 기 표현된 단어 테이블에 일치하는 단어가 있는지의 여부에 따라, 일치하는 단어가 있는 경우 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성하거나, 일치하는 단어가 없는 경우 단어의 의미를 묻는 질문 문장을 생성하는 문장 생성기;
    상기 문장 생성기에서 완성된 문장이 대화의 주제에 맞는지 확인하여 선별한 후 완성된 문장에 접속사를 삽입하여 선별된 문장을 논리 순위로 배열하는 응답 작성기;
    상기 응답 작성기에서 생성된 문장을 문장음성발생기를 이용하여 음성 파일로 변환하여 음성출력부를 통해 대화음성으로 출력되게 하는 음성 생성기;로 구성되고,
    상기 음성 인식기는,
    통상의 음성 추출, 음향신호 처리 및 음소 인식 알고리즘을 사용하여 음성을 문장으로 변환하는 음성 인식부;
    상기 음성 인식부에서 생성된 음성 인식 문장을 예상 대답이나 예상 질문 테이블과 비교하고, 상기 음성 인식부에서 생성된 음성 인식 문장을 구성하는 단어를 예상 대답 혹은 예상 질문의 단어 테이블과 비교하여 비교 테이블에 존재하지 않는 단어일 경우 연관/파생 단어 테이블과 비교하여 해당 단어를 연관/파생 단어의 원천 단어로 환원하여 표준 문장을 완성하는 문장 확인부;를 포함하여 구성된 것을 특징으로 하는 대화 시스템.
  2. 청구항 1에 있어서,
    음성입력부는 대화 대상자의 음성을 마이크를 통해 전기적인 신호로 변환한 후 음성 파일로 변환하는 것을 특징으로 하는 대화 시스템.
  3. 삭제
  4. 청구항 1에 있어서,
    상기 음성 인식부는 음소 인식 시 토픽에 따른 예상 문장의 단어 음성 매핑 테이블을 사용하거나, 대화 예상 문장을 구성한 단어 음성 매핑 테이블을 사용하는 것을 특징으로 하는 대화 시스템.
  5. 생성하고자 하는 대답과 질문에 대한 문장의 각 단어에 대한 품사를 단어 연결 테이블과 파생 테이블로부터 확인하여 품사 불량 단어를 찾아 문장을 수정한 후 본 문장의 각 단어에 구성연결 요소를 할당하고, 기준 단어 구성연결 테이블과 단어 구성연결 요소를 비교하여 문장을 수정한 다음 문장 내 완성된 단어 리스트를 작성하는 제1 과정;
    기 표현된 단어 테이블에 일치하는 단어가 있는지의 여부를 확인하여 일치하는 단어가 없는 경우 단어의 의미를 묻는 질문 문장을 생성하고 상식 단어 테이블을 이용하여 상식 단어를 확인한 후 상기 상식 단어 테이블에 일치하는 단어가 있는지의 여부에 따라 질문을 하지 않고 바로 사용할 수 있는 대답문장을 생성하거나 단어의 의미를 묻는 질문 문장을 생성하는 제2 과정;
    대화자의 문장과 시스템에서 생성한 문장의 진위를 표시하고 세계관을 판단하는 제3 과정;
    문장 완성 조건을 만족하거나 세계관 문장이 존재하지 않으면 하나의 문장이 완성된 것으로 판단하고, 그렇지 않은 경우 상기 대답문장을 생성하는 과정으로 복귀하는 제4 과정;으로 이루어지고,
    상기 제4 과정의 문장 완성 조건은 아래의 [수학식]으로 표현되는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
    문장 완성 조건 = Y × 0.9 ≤ X ≤ Y × 1.1
    여기서, X : 작성된 문장의 무게, Y : 추출한 세계관 문장의 무게
  6. 청구항 5에 있어서, 제2과정의 상식 단어 테이블은 일반적으로 대다수의 대화자가 알고 있다고 생각하는 단어 묶음인 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  7. 청구항 5에 있어서, 제2과정은 대답문장을 생성하기 위하여,
    대화문이 질문 대화문인 경우, 문의 단어와 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 단어 리스트를 만드는 단계와;
    상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 설정하는 단계와;
    대화문이 대답 대화문인 경우, 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾아내는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  8. 청구항 5에 있어서, 제2과정은 문장의 단어 구성연결 요소가 완비된 경우,
    대화의 주제 단어 리스트로부터 단어를 추출하는 단계와;
    상기 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성하는 단계와;
    기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 상세 설명을 위한 대답 단어 구성연결 요소로 선정하는 단계와;
    기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만드는 단계와;
    대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  9. 청구항 5에 있어서, 제2과정은 문장의 단어 구성연결 요소가 불비된 경우,
    불비된 단어 구성연결 요소에 해당하는 기준 단어 내용 구성연결 요소 단어와 기 표현 단어와 정의/연관/파생 단어로부터 대답 단어 리스트를 만드는 단계와;
    대답 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  10. 청구항 5에 있어서, 질문 문장을 생성하기 위하여,
    대화문이 질문 대화문인 경우 문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 문의 단어를 포함한 단어 리스트를 만드는 단계와;
    상기 단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장 의 사용연결값이 최대인 표준 문장을 부가 질문 문장으로 설정하는 단계와;
    대화문이 대답 대화문인 경우 대화문 내 단어의 구성연결 요소에서 기준 단어 구성연결 테이블과 비교하여 존재하지 않는 단어 구성연결 요소를 찾아내는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  11. 청구항 5에 있어서, 제2과정은 문장의 단어 구성연결 요소가 완비된 경우,
    대화의 주제 단어 리스트로부터 단어를 추출하는 단계와;
    상기 추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 완성하는 단계와;
    기 표현된 단어 리스트로부터 빈번한 단어 구성연결 누락 요소를 부가 혹은 질문을 위한 문의 단어 구성연결 요소로 선정하고 이에 해당하는 문의 단어를 선정하는 단계와;
    문의 단어에 해당하는 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어 리스트를 만드는 단계와;
    단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 부가 질문 문장으로 선정하는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  12. 청구항 5에 있어서, 제2과정은 문장의 단어 구성연결 요소가 불비된 경우,
    불비된 단어 구성연결 요소에 해당하는 단어를 기준 단어 구성연결 요소 테이블로부터 추출하는 단계와;
    추출한 단어로 기준 단어 구성연결 요소 테이블을 참조하여 단어 구성연결 요소를 정하고 이에 해당하는 문의 단어를 선정하는 단계와;
    문의 단어에 해당하는 기준 단어 구성연결 내용 요소 테이블과 기 표현 단어와 정의/연관/파생 단어로부터 추가 문의 단어를 포함한 단어 리스트를 만드는 단계와;
    단어 리스트와 표준 문장 테이블로부터 사용연결비가 최대이거나 문장의 사용연결값이 최대인 표준 문장을 대답 문장으로 선정하는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 시스템의 문장 생성 방법.
  13. 삭제
  14. 삭제
KR1020090053816A 2009-06-17 2009-06-17 대화 시스템 및 대화 문장 생성 방법 KR100918644B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090053816A KR100918644B1 (ko) 2009-06-17 2009-06-17 대화 시스템 및 대화 문장 생성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090053816A KR100918644B1 (ko) 2009-06-17 2009-06-17 대화 시스템 및 대화 문장 생성 방법

Publications (1)

Publication Number Publication Date
KR100918644B1 true KR100918644B1 (ko) 2009-09-25

Family

ID=41356033

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090053816A KR100918644B1 (ko) 2009-06-17 2009-06-17 대화 시스템 및 대화 문장 생성 방법

Country Status (1)

Country Link
KR (1) KR100918644B1 (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190083629A (ko) 2019-06-24 2019-07-12 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
KR20190089128A (ko) 2019-07-10 2019-07-30 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
CN110289001A (zh) * 2019-06-21 2019-09-27 绿漫科技有限公司 一种基于多媒体语音图像识别的物业报事系统
KR20190118996A (ko) 2019-10-01 2019-10-21 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
KR20210044985A (ko) 2019-10-16 2021-04-26 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
KR20220037297A (ko) * 2020-09-17 2022-03-24 고려대학교 산학협력단 대화 수행 시스템, 장치 및 방법
US11403345B2 (en) 2019-02-28 2022-08-02 Naver Corporation Method and system for processing unclear intent query in conversation system
US11587547B2 (en) 2019-02-28 2023-02-21 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070605A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
KR20070090642A (ko) * 2006-03-03 2007-09-06 삼성전자주식회사 음성 대화 서비스 장치 및 방법
KR20080021486A (ko) * 2006-09-04 2008-03-07 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR20080052304A (ko) * 2006-12-06 2008-06-11 한국전자통신연구원 응답 문장 생성 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070605A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
KR20070090642A (ko) * 2006-03-03 2007-09-06 삼성전자주식회사 음성 대화 서비스 장치 및 방법
KR20080021486A (ko) * 2006-09-04 2008-03-07 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR20080052304A (ko) * 2006-12-06 2008-06-11 한국전자통신연구원 응답 문장 생성 장치 및 방법

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11587547B2 (en) 2019-02-28 2023-02-21 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
US11403345B2 (en) 2019-02-28 2022-08-02 Naver Corporation Method and system for processing unclear intent query in conversation system
CN110289001A (zh) * 2019-06-21 2019-09-27 绿漫科技有限公司 一种基于多媒体语音图像识别的物业报事系统
US11393459B2 (en) 2019-06-24 2022-07-19 Lg Electronics Inc. Method and apparatus for recognizing a voice
KR20190083629A (ko) 2019-06-24 2019-07-12 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
KR20190089128A (ko) 2019-07-10 2019-07-30 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
US11514902B2 (en) 2019-07-10 2022-11-29 Lg Electronics Inc. Speech recognition method and apparatus therefor
KR20190118996A (ko) 2019-10-01 2019-10-21 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
US11302324B2 (en) 2019-10-01 2022-04-12 Lg Electronics Inc. Speech processing method and apparatus therefor
US11373656B2 (en) 2019-10-16 2022-06-28 Lg Electronics Inc. Speech processing method and apparatus therefor
KR20210044985A (ko) 2019-10-16 2021-04-26 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
WO2022060050A1 (ko) * 2020-09-17 2022-03-24 고려대학교 산학협력단 대화 수행 시스템, 장치 및 방법
KR20220037297A (ko) * 2020-09-17 2022-03-24 고려대학교 산학협력단 대화 수행 시스템, 장치 및 방법
KR102491931B1 (ko) * 2020-09-17 2023-01-26 고려대학교 산학협력단 대화 수행 시스템, 장치 및 방법

Similar Documents

Publication Publication Date Title
KR100918644B1 (ko) 대화 시스템 및 대화 문장 생성 방법
US8126714B2 (en) Voice search device
US9767710B2 (en) Apparatus and system for speech intent recognition
US7860705B2 (en) Methods and apparatus for context adaptation of speech-to-speech translation systems
US20080071533A1 (en) Automatic generation of statistical language models for interactive voice response applications
US20030130847A1 (en) Method of training a computer system via human voice input
JP4516112B2 (ja) 音声認識プログラム
CN101373592A (zh) 语音翻译装置和方法
JP2007206888A (ja) 応答生成装置、方法及びプログラム
Seljan et al. Combined automatic speech recognition and machine translation in business correspondence domain for english-croatian
KR20180022156A (ko) 대화 관리 장치 및 방법
Córdoba et al. An interactive directory assistance service for Spanish with large-vocabulary recognition
CN111898342A (zh) 一种基于编辑距离的中文发音校验方法
Cruz-Ferreira Non-native comprehension of intonation patterns in Portuguese and in English
US20060136195A1 (en) Text grouping for disambiguation in a speech application
JP2005284209A (ja) 音声認識方式
KR100400220B1 (ko) 대화 모델을 이용한 자동 통역 장치 및 방법
Liao et al. Personalized Taiwanese speech synthesis using cascaded ASR and TTS framework
CN115019786A (zh) 模型训练方法和装置及语音含义的理解方法和装置
Schmidt et al. Evaluation of crowdsourced user input data for spoken dialog systems
KR20150111678A (ko) 자연어를 점진적으로 분석하는 장치와 이를 이용한 적응적인 응답 장치 및 방법
JP3576066B2 (ja) 音声合成システム、および音声合成方法
JP2003099089A (ja) 音声認識・合成装置および方法
JP5137588B2 (ja) 言語モデル生成装置及び音声認識装置
JP2007265131A (ja) 対話情報抽出装置,対話情報抽出方法およびプログラム

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120917

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130916

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141117

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160316

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee