KR20070058953A - 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 - Google Patents
음성 대화 시스템에서 답변 문장 생성 방법 및 장치 Download PDFInfo
- Publication number
- KR20070058953A KR20070058953A KR1020060060365A KR20060060365A KR20070058953A KR 20070058953 A KR20070058953 A KR 20070058953A KR 1020060060365 A KR1020060060365 A KR 1020060060365A KR 20060060365 A KR20060060365 A KR 20060060365A KR 20070058953 A KR20070058953 A KR 20070058953A
- Authority
- KR
- South Korea
- Prior art keywords
- vocabulary
- information database
- weather
- sentence
- answer
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000004044 response Effects 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 56
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 abstract description 15
- 230000008569 process Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 영역별 설명문 파일 정보 데이터베이스를 구축하고, 상기 사용자 질의에 대한 답변 정보가 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송하고, 상기 정보 검색 서버로부터 수신된 검색 결과가 명사형인 경우, 상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 각 어휘에 해당하는 설명문을 이용하여 답변 문장을 생성하는 것으로서, 웹사이트를 통하여 검색된 검색결과를 사용자에게 제공할 때, 검색 결과 그대로 사용자에게 답변하기보다는 사용자가 듣기에 자연스러운 표현으로 수정하여 답변 문장을 제공할 수 있다.
음성대화시스템, 답변문장, 정보검색
Description
도 1은 본 발명에 따른 음성 대화 시스템의 구성을 개략적으로 나타낸 블럭도.
도 2는 도 1에 도시된 대화 처리부의 세부적인 구성을 나타낸 블럭도.
도 3은 본 발명에 따른 날씨 설명문 파일 정보를 나타낸 예시도.
도 4는 본 발명에 따른 음성 인식 결과에 따른 답변 문장 생성 방법을 나타낸 흐름도.
도 5는 본 발명에 따른 음성 대화 시스템에서 날씨 검색 결과에 따른 답변 문장 생성 방법을 나타낸 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
100 : 음성 수신부 110 : 음성 인식부
120 : 대화 처리부 130 : 음성 합성부
200 : 입력문 처리부 205 : 대화 영역별 키워드 사전
210 : 대화 관리부 220 : 출력문 처리부
230 : 영역별 설명문 파일 정보 DB 240 : 사용자 정보 DB
250 : 통신부
본 발명은 음성 대화 시스템에서 사용자 질의에 대한 답변 문장을 서술형으로 제공하는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치에 관한 것이다.
지능형 로봇 또는 컴퓨터를 이용한 음성 대화 시스템은 사용자가 음성으로 질문한 것에 대하여 음성 인식, 질문에 대한 의도 분석 및 이해, 질문에 대한 적절한 답변 문장을 생성하여 음성 합성부를 통하여 답변을 제공한다.
음성 대화 시스템에서 제공될 수 있는 서비스 분야로는 뉴스 검색, 날씨 검색, 일정 등록 및 검색, 전화번호 등록 및 검색 등 사람의 일상 생활에 필요한 부분들에 대해 점차 영역을 확장할 수 있고, 이와 관련된 연구가 계속적으로 수행되고 있다.
예를 들어 날씨에 대한 검색 결과로는 흐림, 맑음, 눈, 비 등 날씨를 표현하는 다양한 종류가 있다. 또한, 날씨 웹사이트에서 제공하는 날씨 표현은 단순히 비, 맑음 등의 표현 외에도 '차차 흐려짐', '맑은 후 비 조금' 등 복잡한 표현도 존재한다.
상기 음성 대화 시스템은 검색 결과가 '맑음'이면 답변 문장을 '맑음'으로 출력, '차차 흐려짐'이면 답변 문장을 '차차 흐려짐'으로 출력한다.
상기와 같이 종래의 음성 대화 시스템에서 제공되는 답변 문장은 검색 결과 그대로 사용자에게 제공되므로 어색하고 부자연스러운 단점이 있다.
또한, 예측되지 못한 어휘의 표현으로 검색된 결과에 대해서는 설명문 형태의 답변 문장을 제공하지 못하는 단점이 있다.
따라서, 본 발명의 목적은 웹사이트를 통하여 검색된 검색결과를 사용자에게 제공할 때, 검색 결과 그대로 사용자에게 답변하기보다는 사용자가 듣기에 자연스러운 표현으로 수정하여 답변을 제공하는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치를 제공하는데 있다.
본 발명의 다른 목적은 기본적인 날씨표현과 복합된 날씨표현에 대한 날씨 답변 문장을 생성할 수 있는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치를 제공하는데 있다.
본 발명의 또 다른 목적은 음성 대화 시스템에서 사용자가 요구하는 영역에 대하여 검색된 다양한 정보를 자연스럽게 설명하는 문장으로 변환하여 답변 문장을 제공할 수 있는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치를 제공하는데 있다.
상기 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 사용자 정보 데이터베이스가 구축된 음성 대화 시스템에서 사용자 질의에 대한 답변 문장 생성 방법에 있어서, 영역별 설명문 파일 정보 데이터베이스를 구축하고, 상기 사용자 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송하고, 상기 정보 검색 서버로부터 수신된 검색 결과가 명사형인 경우, 상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 각 어휘에 해당하는 설명문을 이용하여 답변 문장을 생성하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법이 제공된다.
본 발명의 다른 측면에 따르면, 사용자 정보 데이터베이스와 날씨 설명문 파일 정보 데이터베이스가 구축된 음성 대화 시스템에서 날씨 질의에 대한 답변 문장 생성 방법에 있어서, 상기 날씨 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 날씨 정보 검색 요청 메시지를 전송하고, 상기 정보 검색 서버로부터 수신된 날씨 검색 결과가 명사형인 경우, 상기 수신된 날씨 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 날 씨 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 상기 통합된 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 각 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하면, 각 어휘에 의해 검색된 날씨 설명문을 이용하여 답변 문장을 생성하고, 존재하지 않으면, 상기 분리된 각 어휘를 그대로 답변 문장에 추가한 후, 마지막 어휘의 종성 존재 여부에 따라 다른 활용형 어미를 추가하여 답변 문장을 생성하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법이 제공된다.
본 발명의 또 다른 측면에 따르면, 사용자 정보 데이터베이스, 음성 인식부 및 음성 합성부가 구비된 음성 대화 시스템의 답변 문장 생성 장치에 있어서, 영역별로 키워드와 각 키워드에 대한 답변 문장 유형의 설명문이 저장된 영역별 설명문 파일 정보 데이터베이스, 네트워크를 통해 정보 검색 서버와의 접속을 위한 통신부, 상기 음성 인식부로부터 출력되는 음성 인식 결과 문장의 의미 구조를 이용하여 화행 또는 의도를 분석하는 입력문 처리부, 상기 입력문 처리부에서 분석된 화행 또는 의도가 질의인 경우, 상기 질의를 포함하는 답변 문장 요청 메시지를 생성하는 대화 관리부, 상기 대화 관리부에서 출력되는 답변 문장 요청 메시지에 포함된 질의에 대한 답변 정보를 상기 사용자 정보 데이터베이스 또는 상기 통신부를 통한 정보 검색 서버를 이용하여 검색하고, 상기 검색 결과에 포함된 어휘가 명사형인 경우 상기 영역별 설명문 파일 정보 데이터베이스를 이용하여 답변 문장을 생 성한 후, 상기 음성 합성부에 전송하는 출력문 처리부를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 장치가 제공된다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
도 1은 본 발명에 따른 음성 대화 시스템의 구성을 개략적으로 나타낸 블럭도이다.
도 1을 참조하면, 음성 대화 시스템은 음성 신호를 입력받는 음성 수신부(100), 상기 음성 수신부(100)에서 출력되는 음성 신호의 인식을 수행하는 음성 인식부(110), 상기 음성 인식부(110)에서 출력되는 음성 인식 결과의 의도를 분석하여 답변 문장을 생성하는 대화 처리부(120), 상기 대화 처리부(120)에서 출력되는 답변 문장을 음성으로 출력되게 하는 음성 합성부(130)를 포함한다.
상기 음성 수신부(100)는 마이크 등을 통하여 입력된 아날로그 음성 신호를 디지털 음성 신호로 변환하여 상기 음성 인식부(110)에 전송한다.
상기 음성 인식부(110)는 상기 음성 수신부(100)로부터 출력되는 음성 신호에서 특징 벡터를 추출하고, 상기 추출된 특징 벡터를 이용하여 음성 인식을 수행하여 음성 인식 결과를 출력한다.
즉, 상기 음성 인식부(110)는 상기 추출된 특징 벡터를 이용하여 미리 저장된 데이터베이스에 등록된 단어들에 대하여 유사도와 가장 유사한 단어들을 선정하는 비터비 탐색을 수행한다. 이때, 은닉 마르코프 모델(HMM)을 이용할 수 있는데, 이는 인식 대상 후보 단어들에 대하여 미리 훈련하여 구축한 HMM과 현재 입력된 음성의 특징 데이터들과의 차이를 비교하여 가장 유사한 후보 단어를 결정하는 것을 말한다.
그런 다음 상기 음성 인식부(110)는 음향 모델과 발음 사전을 탐색하여 상기 추출된 음향적 특징과 유사한 음소들을 찾아내어 단어나 문장으로 결합한다.
그런 다음 상기 음성 인식부(110)는 상기 결합하여 생성된 단어나 문장의 오류를 줄이기 위하여 언어 모델을 적용하여 음성 인식을 수행하고, 그 수행된 음성 인식 결과를 상기 대화 처리부(120)에 전송한다. 상기 음성 인식 결과는 텍스트 형태일 수 있다.
상기 대화처리부(120)는 상기 음성 인식부(110)로부터 전송된 음성 인식 결과의 키워드를 이용하여 의미와 의도를 분석한다. 상기 분석결과 그 의도가 질의인 경우, 상기 대화 처리부(120)는 상기 질의에 대한 답변을 검색하고, 상기 검색된 답변을 설명문 형태의 답변 문장으로 생성하여 상기 음성 합성부(130)에 전송한다.
상기와 같은 역할을 수행하는 대화 처리부(120)는 도 2에서 상세히 설명하기로 한다.
상기 음성 합성부(130)는 상기 대화 처리부(120)에서 생성된 답변 문장을 음성으로 변환하여 출력되게 한다.
도 2는 도 1에 도시된 대화 처리부의 세부적인 구성을 나타낸 블럭도, 도 3은 본 발명에 따른 날씨 설명문 파일 정보를 나타낸 예시도이다.
도 2를 참조하면, 대화 처리부(120)는 입력문 처리부(200), 대화 영역별 키 워드 사전(205), 대화 관리부(210), 출력문 처리부(220), 영역별 설명문 파일 정보 데이터베이스(230), 사용자 정보 데이터베이스(240), 통신부(250)를 포함한다.
상기 입력문 처리부(200)는 상기 음성 인식부(110)에서 출력되는 텍스트 형태의 음성 인식 결과를 구성하는 키워드를 토큰화한 후, 상기 대화 영역별 키워드 사전(205)을 이용하여 키워드의 의미/의도를 분석한다.
여기서, 상기 대화 영역별 키워드 사전(205)에는 영역별로 키워드가 구축되어 있어서, 음성 인식 결과의 정확도를 높이는 효과가 있다. 예를 들면, 상기 대화 영역별 키워드 사전(205)은 날씨 영역, 일정 영역, 뉴스 영역 등의 상위 분류로 키워드 사전이 구성되어 있고, 각 상위 분류별 하위 키워드 사전으로 구성되어 있다. 예를 들어, 날씨 영역의 경우는 지역, 습도, 온도 등의 하위 분류로 키워드 사전이 구축되어 있다.
상기 입력문 처리부(200)는 상기 음성 인식부(110)로부터 제공되는 음성 인식 결과 문장을 형태소들로 분리하고 그 분리된 형태소들을 태깅한 후, 각 형태소간의 의존관계를 분석하여 문장 구성 성분을 분석하고, 그 문장 구성 성분의 의미를 결정하는 의미 구조로 변환한다.
즉, 상기 입력문 처리부(200)는 상기 음성 인식부(110)로부터 제공되는 음성 인식 결과 문장을 실질 형태소와 형식 형태소로 분석하다. 그런 다음 상기 입력문 처리부(200)는 상기 분류된 실질 형태소와 형식 형태소를 기초로 하여 문형정보, 양상 정보 및 담화표지 정보 등과 같은 키워드를 추출한다. 여기서, 문형정보는 특정 화행이 실현될 때 사용되는 문장유형 예를 들면, 단언문, 질의문, 명령문 등을 의미하고, 상기 양상 정보는 '하고 싶', '아/어 주','할 수 있'등과 같은 서술어를 의미하고, 담화표지 정보는 '그런데', '그래서' 등과 같은 접속 부사를 의미한다.
그런 다음 상기 입력문 처리부(200)는 상기 대화 영역별 키워드 사전(205)을 이용하여 추출된 키워드에 해당하는 의미를 분석한다.
또한, 상기 입력문 처리부(200)는 시간 표현 정규화(specialist) 처리와 조응어(anaphora)처리가 필요한 경우 이를 처리하고, 의도와 화행을 분석한다.
여기서, 상기 시간 표현 정규화(specialist)처리는 예를 들어, '어린이날 날씨 알려줘'등의 질의에서 '어린이날은 5월 5일 금요일'이라는 실제 날짜 처리와 같은 기능을 말하고, 상기 조응어(anaphora)처리는 예를 들어, '그 사람 전화번호 알려줘'등의 질의에서 이전에 발화한 대화를 참조하여 '그 사람'이 누구인지를 찾는 기능을 말한다.
상기와 같이 키워드의 의미와 의도를 분석한 입력문 처리부(200)는 키워드의 의미/의도 분석 결과를 상기 대화 관리부(210)에 전송한다.
상기 대화 관리부(210)는 상기 입력문 처리부(200)에서 분석된 사용자의 화행 또는 의도에 대한 시스템의 응답을 위하여 응답, 거절 또는 승락 등의 화행 또는 의도를 생성한다.
즉, 상기 대화 관리부(210)는 상기 입력문 처리부(200)에서 출력되는 키워드의 의미/의도 분석 결과에 대하여 담화처리, 이력(history)관리, 부(SUB)대화 처리를 수행한다.
여기서, 상기 담화 처리에서는 대화의 상태가 변경되는 대화 전이망 처리가 수행된다. 즉, 상기 대화 관리부(210)는 상기 입력문 처리부(200)에서의 입력문 처리를 통해 얻어진 표층적 의도 분석 내용을 이용하여 담화처리에서 심층적인 의도 분석을 수행하여 의도를 구하고, 이러한 의도를 대화 이력에 보관중인 이전 대화 상태를 고려하여 현재의 대화 상태를 새로운 상태로 변경한다. 즉, 상기 담화 처리는 대화 전이망을 이용하여 입력된 대화의 흐름을 제어 및 처리하는 것을 말한다.
상기 이력 관리는 대화 이력을 답변 문장 처리 기능과 연계하여 사용자에게 재질의하거나 사용자의 질문에 대한 답변을 생성하는 과정이 연결된다.
하나의 영역(domain)에 속한 대화는 여러 개의 질문으로 구성된 부대화로 구성될 수 있는데, 상기 부대화 처리는 영역 정보를 관리하여 대화에 포함된 다양한 부대화를 처리하는 것을 말한다. 즉, 임의의 대화 영역에서 다른 영역으로 전이되기 전까지는 현재의 대화 영역에 대한 기본 정보를 계속 가지고 있어야 연속되는 사용자의 질문을 처리하기가 편리하다. 또한, 사용자는 하나의 영역에 대한 질문을 완료하지 않고, 계속 다른 영역에 대한 질문을 할 수 있고, 이전의 영역에 대한 질문으로 돌아갈 수도 있다.
따라서, 상기 대화 관리부(210)는 영역정보를 관리함으로써 대화에 포함된 다양한 부대화를 처리할 수 있어야 한다.
즉, 상기 대화 관리부(210)는 상기 입력문 처리부(200)에서 출력되는 키워드의 표층적인 의도를 분석하고, 그 의도 분석에 오류가 있는 경우 사용자에게 재질의하도록 하거나 사용자 질의에 대한 답변을 생성하도록 하는 답변 문장 요청 메시지를 상기 출력문 처리부(220)에 전송하는 역할을 수행한다. 여기서, 상기 답변 문 장 요청 메시지는 사용자 질의를 포함한다.
상기 출력문 처리부(220)는 상기 대화 관리부(210)로부터 답변 문장 요청 메시지가 수신되면, 상기 답변 문장 요청 메시지에 포함된 사용자 질의를 확인한다.
그런 다음 상기 출력문 처리부(220)는 상기 확인한 사용자 질의에 대한 답변을 미리 구축된 사용자 정보 데이터베이스(240) 또는 정보 검색 서버(미도시)를 이용하여 검색한다.
즉, 상기 출력문 처리부(220)는 상기 대화 관리부(210)에서 출력되는 질의에 대한 답변 수집을 위하여 상기 통신부(250)를 통해(인터넷을 이용하여) 정보 검색 서버에 접속한 후, 상기 질의문을 포함하는 정보 검색 요청 메시지를 전송한다. 그러면, 상기 정보 검색 서버는 상기 질의문에 해당하는 답변 정보를 수집하여 상기 출력문 처리부(220)에 전송한다.
상기 출력문 처리부(220)는 상기 수집된 답변 정보가 설명문 형태가 아닌 경우(명사형), 상기 답변 정보(검색 결과)에 대해 상기 영역별 설명문 파일 정보 데이터베이스(230)를 이용하여 설명문 형태의 답변 문장으로 바꾼 후, 상기 음성 합성부(130)에 전송한다.
상기 영역별 설명문 파일 정보 데이터베이스(230)는 영역별로 키워드와 각 키워드에 대한 답변 문장 유형으로 구성된 것으로서, 예를 들면, 날씨 설명문 파일 정보 데이터베이스, 뉴스 설명문 파일 정보 데이터베이스, 일정 설명문 파일 정보 데이터베이스, 전화번호 설명문 파일 정보 데이터베이스 등을 포함하는 데이터베이스일 수 있다.
이하에서는 상기 출력문 처리부(220)가 답변 문장을 생성하는 상세한 방법에 대하여 날씨 질의에 대한 답변 문장 생성 방법을 예로 들어 설명하기로 한다.
상기 출력문 처리부(220)는 상기 대화 관리부(210)로부터 날씨에 대한 답변 문장 요청 메시지가 수신되면, 상기 정보 검색 서버 또는 상기 사용자 정보 데이터베이스(240)를 이용하여 날씨 질의에 대한 답변 즉, 날씨 검색 결과를 수집한다.
상기 날씨 질의에 대한 답변이 상기 사용자 정보 데이터베이스(240)에 존재하면, 상기 출력문 처리부(220)는 상기 사용자 정보 데이터베이스(240)에서 해당 답변 정보를 추출하고, 상기 추출된 답변 정보를 답변 문장으로 생성하여 상기 음성 합성부(130)에 전송한다.
만약, 상기 날씨 질의에 대한 답변이 상기 사용자 정보 데이터베이스(240)에 존재하지 않으면, 상기 출력문 처리부(220)는 상기 통신부(250)를 통해 상기 정보 검색 서버에 접속하여 상기 정보 검색 서버로부터 날씨 검색 결과를 수집한다.
그런 다음 상기 출력문 처리부(220)는 상기 수집된 날씨 검색 결과에 포함된 어휘를 통합된 어휘로 만든다. 즉, 상기 출력문 처리부(220)는 상기 날씨 검색 결과에 포함된 어휘에서 띄어쓰기와 한글이 아닌 부분을 제거하여 통합된 어휘로 만든다.
그런 다음 상기 출력문 처리부(220)는 상기 생성된 통합된 어휘가 미리 구축된 날씨 설명문 파일 정보 데이터베이스(230)에 존재하는지를 판단하여 그 판단결과를 이용하여 답변 문장을 생성한다.
즉, 상기 출력문 처리부(220)는 상기 통합된 어휘가 날씨 설명문 파일 정보 데이터베이스(230)에 존재하면, 상기 통합된 어휘에 해당하는 답변 문장을 날씨 설명문 파일 정보 데이터베이스(230)에서 추출하여 음성 합성부(130)에 전송한다.
만약, 상기 판단결과 상기 통합된 어휘가 날씨 설명문 파일 정보 데이터베이스(230)에 존재하지 않으면, 상기 출력문 처리부(220)는 상기 통합된 어휘를 띄어쓰기 기준으로 각각의 어휘로 분리한다.
그런 다음 상기 출력문 처리부(220)는 상기 분리된 어휘의 개수만큼 반복하여 각 어휘가 상기 날씨 설명문 파일 정보 데이터베이스(230)에 존재하는지를 판단하여 상기 날씨 설명문 파일 정보 데이터베이스(230)에 존재하면, 해당 어휘에 해당하는 답변 문장을 상기 날씨 설명문 파일 정보 데이터베이스(230)에서 추출하여 상기 음성 합성부(130)에 전송한다.
만약, 상기 분리된 어휘 중 상기 날씨 설명문 파일 정보 데이터베이스(230)에 존재하지 않은 어휘가 존재하면, 상기 출력문 처리부(220)는 상기 분리된 어휘를 그대로 답변문장에 추가하고, 그 어휘가 마지막 어휘이면, 종성 존재 여부에 따른 활용형 어미를 붙여서 답변 문장을 생성한다.
상기 날씨 설명문 파일에 대하여 도 3을 참조하여 설명하면, 날씨 설명문 파일에는 날씨 키워드와 각 키워드에 대한 날씨 답변문장 유형의 설명문이 정의되어 있다.
즉, 상기 날씨 설명문 파일은 예측할 수 있는 날씨 키워드에 대한 날씨 문장을 생성하여 저장해 놓은 파일이기 때문에 날씨 정보 검색 서버로부터 예측하지 못한 날씨 키워드가 검색되거나, 두 종류 이상의 날씨가 복합되어 검색 결과로 올 경 우를 대비하여 답변 문장을 생성할 수 있어야 한다.
예를 들어, 날씨를 나타내는 어휘의 종류는 '갬', '눈', '맑음'과 같이 단순한 어휘의 표현도 존재하지만, '흐리고밤늦게부터비'와 같이 여러 어휘가 사용되어 복잡한 날씨를 표현하는 어휘도 존재한다. 따라서, 날씨 설명문 파일 정보 데이터베이스에는 단순한 어휘뿐만 아니라 예측할 수 있는 복잡한 어휘에 대해서도 설명문이 구축되어 있다.
상기 날씨 설명문 파일의 날씨 키워드를 '강한눈보라'와 같이 띄어쓰기 없이 붙여서 사용한 이유는 날씨 검색 결과로 입력되어 들어온 어휘에 어휘와 어휘 사이의 띄어쓰기가 1개 이상 존재하여 문자열 비교시 불일치가 발생할 가능성이 있으므로, 날씨 설명문 파일의 키(key)로 사용되는 날씨 키워드는 띄어쓰기를 제거하여 날씨 설명문 파일에 등록해 놓았다.
도 4는 본 발명에 따른 음성 인식 결과에 따른 답변 문장 생성 방법을 나타낸 흐름도이다.
도 4를 참조하면, 음성 대화 시스템은 마이크를 통해 사용자 음성이 입력되면(S400), 상기 입력된 음성 신호에서 특징 벡터를 추출하고 상기 추출된 벡터를 이용하여 음성을 인식을 수행한다(S402). 상기 수행된 음성 인식 결과는 텍스트 형태로 출력된다.
단계 402의 수행 후, 상기 음성 대화 시스템은 상기 음성 인식 결과 문장을 구성하는 키워드를 토큰화하여 의미와 의도를 분석하고(S404), 그 의도가 질의문인지를 판단한다(S406).
단계 406의 판단결과 상기 음성 인식 결과의 의도가 질의문이면, 상기 음성 대화 시스템은 상기 질의문에 대한 답변 정보가 미리 저장된 사용자 정보 데이터베이스에 존재하는지를 판단한다(S408).
단계 408의 판단결과 상기 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하면, 상기 음성 대화 시스템은 상기 사용자 정보 데이터베이스에서 해당 답변 정보를 추출하고(S410), 상기 추출된 답변 정보의 어휘가 명사형인지를 판단한다(S412).
단계 412의 판단결과 상기 답변 정보(검색 결과)의 어휘가 명사형이면, 상기 음성 대화 시스템은 미리 구축된 영역별 설명문 파일 정보 데이터베이스를 이용하여 서술형의 답변 문장을 생성하여 출력한다(S414).
만약, 단계 412의 판단결과 상기 답변 정보(검색 결과)의 어휘가 명사형이 아닌 서술형이면, 상기 음성 대화 시스템은 상기 답변 정보(검색 결과)를 그대로 답변 문장으로 출력한다(S416).
만약, 단계 408의 판단결과 상기 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않으면, 상기 음성 대화 시스템은 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송한다(S418).
즉, 상기 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않으면, 상기 음성 대화 시스템은 통신부를 통하여 정보 검색 서버에 접속한다. 그런다음 상기 음성 대화 시스템은 상기 질의문을 포함하는 정보 검색 요청 메시지를 상기 정보 검색 서버에 전송한다.
그러면, 상기 정보 검색 서버는 상기 정보 검색 요청 메시지에 포함된 질의에 대한 검색 결과를 추출하여 상기 음성 대화 시스템에 전송한다.
상기 음성 대화 시스템은 상기 정보 검색 서버로부터 검색 결과가 수신되면(S420), 단계 412부터 단계 416을 수행한다.
즉, 상기 음성 대화 시스템은 상기 정보 검색 서버로부터 전송된 검색 결과에 대해 띄어쓰기 등을 제거하여 통합된 어휘로 만든다. 그런 다음 상기 음성 대화 시스템은 상기 통합된 어휘를 상기 영역별 설명문 파일 정보 데이터베이스를 이용하여 서술형의 답변 문장을 생성한다.
예를 들어, 상기 검색 결과가 '갬', '맑음' 등과 같은 단순한 어휘이면, 상기 음성 대화 시스템은 날씨 설명문 파일 정보 데이터베이스를 이용하여 '갬'을 '개이겠어요'로, '맑음'을 '맑겠어요'등의 서술형 답변 문장을 생성한다.
상기 음성 대화 시스템이 상기 정보 검색 서버로부터 전송된 검색 결과에 대해 영역별 설명문 파일 정보 데이터베이스를 이용하여 답변 문장을 생성하는 방법에 대하여 도 5에서 상세히 설명하기로 한다.
도 5는 본 발명에 따른 음성 대화 시스템에서 날씨 검색 결과에 따른 답변 문장 생성 방법을 나타낸 흐름도이다.
도 5를 참조하면, 음성 대화 시스템은 정보 검색 서버로부터 날씨 검색 결과가 수신되면(S500), 상기 날씨 검색 결과에 포함된 어휘를 통합된 어휘로 만든다(S502).
즉, 상기 음성 대화 시스템은 날씨 검색 결과가 입력되면, 상기 날씨 검색 결과의 입력 어휘로부터 블랭크와 한글이 아닌 부분을 제거하여 통합된 어휘를 생성한다. 상기 날씨 검색 결과의 어휘에서 블랭크와 한글이 아닌 부분을 제거하는 이유는 한글을 스트링 비교할 경우 불일치가 발생하므로 제거한 후 어휘를 검색해야 하기 때문이다.
단계 502의 수행 후, 상기 음성 대화 시스템은 상기 생성된 통합된 어휘가 미리 저장된 날씨 설명문 파일 정보 데이터베이스에 존재하는지를 판단한다(S504).
단계 504의 판단결과 상기 통합된 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하면, 상기 음성 대화 시스템은 검색된 날씨 설명문을 답변 문장에 추가하여(S506), 출력되게 한다(S508).
예를 들어, '맑음'이란 어휘가 입력된 경우, '맑음'에 대한 표현은 날씨 설명문 파일에 존재하므로 '맑겠어요'라는 설명문을 얻을 수 있다. 또, '흐리고 밤 늦게부터 비'라는 어휘가 입력되면, 상기 어휘에서 블랭크를 제거하여 '흐리고밤늦게부터비'라는 통합된 어휘를 얻게 되고, 이 표현은 날씨 설명문 파일에 존재하므로 '흐리고 밤 늦게부터 비가 내리겠어요'라는 설명문을 얻을 수 있다.
만약, 단계 504의 판단결과 상기 통합된 어휘가 상기 날씨 설명문 파일에 존재하지 않으면, 상기 음성 대화 시스템은 상기 통합된 어휘에 대해 띄어쓰기를 기준으로 어휘를 분리한다(S510).
단계 510의 수행 후, 상기 음성 대화 시스템은 상기 분리된 어휘 각각이 상기 날씨 설명문 파일에 존재하는지를 판단한다(S512). 즉, 상기 음성 대화 시스템은 상기 분리된 어휘의 개수만큼 반복하여 각 어휘가 상기 날씨 설명문 파일에 존 재하는지를 판단한다.
단계 512의 판단결과 상기 분리된 어휘가 상기 날씨 설명문 파일에 존재하면, 상기 음성 대화 시스템은 해당 어휘에 대하여 상기 날씨 설명문 파일에서 검색된 날씨 설명문을 답변 문장에 추가하고(S516), 상기 어휘가 마지막 순서의 어휘인지를 판단한다(S516).
단계 516의 판단결과 해당 어휘가 마지막 순서의 어휘이면, 상기 음성 대화 시스템은 상기 답변 문장을 출력한다(S508).
예를 들어, 입력 어휘가 '맑은 후 밤부터 구름많아짐'이고, 날씨 설명문 파일이 표1과 같은 경우의 답변 문장생성 방법에 대하여 설명하기로 한다.
후 | 후에 |
구름많아짐 | 구름이 많아지겠어요. |
상기 '맑은 후 밤부터 구름많아짐'은 띄어쓰기를 기준으로 4의 어휘 즉, '맑은', '후', '밤부터', '구름많아짐'으로 분리된다. 상기 어휘 중에서 '후', '구름많아짐'의 어휘는 표1의 날씨 설명문 파일에 존재하므로, '후'는 '후에'로, '구름 많아짐'은 '구름이 많아지겠어요'로 답변 문장에 추가한다.
그리고 '맑은', '밤부터'는 그대로 답변 문장에 추가하여 답변 문장을 생성한다. 그러면, 최종 생성되는 답변 문장은 '맑은 후에 밤부터 구름이 많아지겠어요.'일 수 있다.
만약, 단계 516의 판단결과 해당 어휘가 마지막 순서의 어휘가 아니면, 상기음성 대화 시스템은 다음 순서의 어휘가 상기 날씨 설명문 파일에 존재하지는 비교하기 위하여 단계 512를 수행한다.
만약, 단계 512의 판단결과 상기 분리된 어휘가 상기 날씨 설명문 파일에 존재하지 않으면, 상기 음성 대화 시스템은 상기 분리된 어휘를 그대로 답변 문장에 추가한다(S518).
그런다음 상기 음성 대화 시스템은 상기 단계 518이 수행된 어휘가 마지막 순서의 어휘인지를 판단하여(S520), 마지막 순서의 어휘이면, 해당 어휘에 한글의 종성이 존재하는지를 판단한다(S522).
단계 522의 판단결과 해당 어휘에 한글의 종성이 존재하면, 상기 음성 대화 시스템은 해당 어휘에 대해 종성에 어울리는 활용형 어미를 추가하여 답변 문장을 생성한 후(S524), 출력한다(S508). 여기서, 상기 종성에 어울리는 활용형 어미는 '~이네요', '~이군요" 등을 말할 수 있다.
예를 들어, '비온 후 차차 맑아짐'의 경우 통합된 어휘가 날씨 설명문 파일에 존재하지 않고, 분리된 어휘중 '후'만 날씨 설명문 파일에 존재하는 경우에 대하여 설명하기로 한다.
상기 '비온', '차차', '맑아짐'은 날씨 설명문 파일에 존재하지 않으므로, '비온', '차차', '맑아짐'은 그대로 답변 문장에 추가된다. 이때, '맑아짐'은 마지막 어휘이고, 마지막 글자에 종성 'ㅁ'이 존재하므로, 상기 음성 인식 장치는 '맑아짐'에 '이에요'라는 활용형 어미를 추가하다. 그러면, 상기 음성 인식 장치는 최종적으로 '비온 후에 차차 맑아짐이에요'라는 서술형 답변 문장을 출력한다.
만약, 단계 522의 판단결과 해당 어휘에 한글의 종성이 존재하지 않으면, 상기 음성 대화 시스템은 해당 어휘에 대해 종성이 없는 경우에 어울리는 활용형 어미를 추가하여 답변 문장을 생성하고(S526), 상기 생성된 답변 문장을 출력한다(S508). 상기 종성이 없는 경우에 어울리는 활용형 어미는 '~네요', '~군요'등을 말할 수 있다.
예를 들어, '흐리고 밤 늦게부터 비'의 경우 통합된 어휘와 분리된 어휘가 모두 날씨 설명문 파일에 존재하지 않은 경우에 대하여 설명하기로 한다.
상기 '흐리고, '밤', '늦게부터', '비'는 날씨 설명문 파일에 존재하지 않으므로, '흐리고, '밤', '늦게부터', '비'는 그대로 답변 문장에 추가된다. 이때, '비'는 마지막 어휘이고, 종성이 존재하지 않으므로, 상기 음성 인식 시스템은 '비'에 '네요'라는 활용형 어미를 추가하여 '흐리고 밤 늦게부터 비네요'라는 서술형 답변 문장을 생성하여 출력한다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
본 발명은 상기 실시예에 한정되지 않으며, 많은 변형이 본 발명의 사상 내에서 당 분야에서 통상의 지식을 가진 자에 의하여 가능함은 물론이다.
상술한 바와 같이 본 발명에 따르면, 웹사이트를 통하여 검색된 검색결과를 사용자에게 제공할 때, 검색 결과 그대로 사용자에게 답변하기보다는 사용자가 듣기에 자연스러운 표현으로 수정하여 답변 문장을 제공할 수 있는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치를 제공할 수 있다.
또한, 본 발명에 따르면, 날씨 설명문 파일을 미리 생성하여 기본적인 날씨표현과 복합된 날씨표현에 대한 날씨 검색 답변 문장을 생성하여 제공하는 효과가 있고, 예측하지 못한 날씨 표현에 대해서도 서술형의 답변 문장을 생성하여 제공할 수 있는 음성 대화 시스템에서 답변 문장 생성 방법 및 장치를 제공할 수 있다.
Claims (15)
- 사용자 정보 데이터베이스가 구축된 음성 대화 시스템에서 사용자 질의에 대한 답변 문장 생성 방법에 있어서,영역별 설명문 파일 정보 데이터베이스를 구축하는 단계;상기 사용자 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송하는 단계;상기 정보 검색 서버로부터 수신된 검색 결과가 명사형인 경우, 상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하는 단계;상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하는 단계;상기 분리된 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하는 단계;및상기 판단결과 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 각 어휘에 해당하는 설명문을 이용하여 답변 문장을 생성하는 단계를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 영역별 설명문 파일 정보 데이터베이스는 날씨영역, 뉴스영역, 일정 영역, 전화번호 영역 중 적어도 하나의 영역에 대한 설명문 파일 정보 데이터베이스를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 영역별 설명문 파일 정보 데이터베이스는 영역별로 키워드와 각 키워드에 대한 답변 문장 유형의 설명문으로 구성된 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 사용자 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하면, 상기 사용자 정보 데이터베이스에 등록된 답변 정보를 이용하여 답변 문장을 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 정보 검색 요청 메시지는 상기 사용자 질의를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 정보 검색 서버로부터 수신된 검색 결과가 명사형이 아니고 설명문형태이면, 상기 검색 결과를 그대로 답변 문장으로 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하는 단계는,상기 검색 결과에서 블랭크와 한글이 아닌 부분을 제거하여 통합된 어휘를 만들고, 상기 만들어진 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스의 키워드에 존재하는지를 판단하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 통합된 어휘에 대해 상기 영역별 설명문 파일 정보 데이터베이스에서 검색된 설명문을 답변 문장에 추가하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제1항에 있어서,상기 판단결과 상기 분리된 어휘 중 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않은 어휘가 존재하면, 해당 어휘를 그대로 답변 문장에 추가하는 단계;상기 그대로 답변 문장에 추가된 어휘중에 마지막 어휘가 존재하면, 상기 마지막 어휘의 종성 존재 여부에 따라 다른 활용형 어미를 추가하여 답변 문장을 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 사용자 정보 데이터베이스와 날씨 설명문 파일 정보 데이터베이스가 구축된 음성 대화 시스템에서 날씨 질의에 대한 답변 문장 생성 방법에 있어서,상기 날씨 질의에 대한 답변 정보가 상기 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 날씨 정보 검색 요청 메시지를 전송하는 단계;상기 정보 검색 서버로부터 수신된 날씨 검색 결과가 명사형인 경우, 상기 수신된 날씨 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 날씨 설명문 파일 정보 데이터베이스에 존재하는지를 판단하는 단계;상기 판단결과 상기 통합된 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하는 지를 판단하는 단계;및상기 판단결과 각 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하면, 각 어휘에 의해 검색된 날씨 설명문을 이용하여 답변 문장을 생성하고, 존재하지 않으면, 상기 분리된 각 어휘를 그대로 답변 문장에 추가한 후, 마지막 어휘의 종성 존재 여부에 따라 다른 활용형 어미를 추가하여 답변 문장을 생성하는 단계를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제10항에 있어서,상기 날씨 설명문 파일 정보 데이터베이스는 날씨 키워드와 날씨 답변 유형의 설명문으로 구성된 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 제10항에 있어서,상기 판단결과 상기 통합된 어휘가 상기 날씨 설명문 파일 정보 데이터베이스에 존재하면, 상기 통합된 어휘에 대해 상기 날씨 설명문 파일 정보 데이터베이스에서 검색된 설명문을 답변 문장에 추가하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 방법.
- 사용자 정보 데이터베이스, 음성 인식부 및 음성 합성부가 구비된 음성 대화 시스템에서의 답변 문장 생성 장치에 있어서,영역별로 키워드와 각 키워드에 대한 답변 문장 유형의 설명문이 저장된 영역별 설명문 파일 정보 데이터베이스;네트워크를 통해 정보 검색 서버와의 접속을 위한 통신부;상기 음성 인식부로부터 출력되는 음성 인식 결과 문장의 의미 구조를 이용하여 화행 또는 의도를 분석하는 입력문 처리부;상기 입력문 처리부에서 분석된 화행 또는 의도가 질의인 경우, 상기 질의를 포함하는 답변 문장 요청 메시지를 생성하는 대화 관리부;및상기 대화 관리부에서 출력되는 답변 문장 요청 메시지에 포함된 질의에 대한 답변 정보를 상기 사용자 정보 데이터베이스 또는 상기 통신부를 통한 정보 검색 서버를 이용하여 검색하고, 상기 검색 결과에 포함된 어휘가 명사형인 경우 상기 영역별 설명문 파일 정보 데이터베이스를 이용하여 답변 문장을 생성한 후, 상기 음성 합성부에 전송하는 출력문 처리부를 포함하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 장치.
- 제13항에 있어서,상기 정보 검색 서버는 웹 서버인 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 장치.
- 제13항에 있어서,상기 출력문 처리부는 상기 검색 결과에 포함된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 해당 설명문을 답변 문장에 추가하여 답변 문장을 생성하고, 존재하지 않으면, 해당 어휘를 그대로 답변 문장에 추가한 후, 어휘 그대로 답변 문장에 추가된 어휘중에 마지막 어휘가 존재하면, 상기 마지막 어휘의 종성 존재 여부에 따라 다른 활용형 어미를 추가하여 답변 문장을 생성하는 것을 특징으로 하는 음성 대화 시스템에서 답변 문장 생성 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050117707 | 2005-12-05 | ||
KR20050117707 | 2005-12-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070058953A true KR20070058953A (ko) | 2007-06-11 |
KR100792208B1 KR100792208B1 (ko) | 2008-01-08 |
Family
ID=38355516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060060365A KR100792208B1 (ko) | 2005-12-05 | 2006-06-30 | 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100792208B1 (ko) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100957710B1 (ko) * | 2008-05-22 | 2010-05-13 | 주식회사 다날 | 스타 음성 메시지 청취 시스템 |
KR101252397B1 (ko) * | 2011-06-02 | 2013-04-08 | 포항공과대학교 산학협력단 | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 |
KR20150075191A (ko) | 2013-12-24 | 2015-07-03 | 서강대학교산학협력단 | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 |
WO2015102124A1 (ko) * | 2013-12-31 | 2015-07-09 | 엘지전자 주식회사 | 대화 서비스 제공 장치 및 방법 |
WO2019088638A1 (ko) * | 2017-11-03 | 2019-05-09 | 주식회사 머니브레인 | 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
KR101976841B1 (ko) * | 2018-10-29 | 2019-05-15 | 한경훈 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 의사 결정 서비스 제공 방법 |
KR20200079629A (ko) * | 2018-12-26 | 2020-07-06 | 지의소프트 주식회사 | 대화형 정보 제공 시스템 및 그 방법 |
KR20210007128A (ko) * | 2019-07-10 | 2021-01-20 | 주식회사 인텔로이드 | 대화 데이터베이스를 이용한 대화문장 추천 방법 및 그것이 적용된 음성대화장치 |
CN112530422A (zh) * | 2020-11-04 | 2021-03-19 | 联想(北京)有限公司 | 一种应答处理方法、智能设备及存储介质 |
CN115019777A (zh) * | 2022-06-20 | 2022-09-06 | 华南理工大学 | 一种在线学习语音识别应答装置及方法 |
CN117149983A (zh) * | 2023-10-30 | 2023-12-01 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019103200A1 (ko) * | 2017-11-23 | 2019-05-31 | 주식회사 모다 | 통합 음성비서 서비스 제공 방법 및 장치 |
KR101890704B1 (ko) | 2018-03-12 | 2018-08-22 | 미디어젠(주) | 음성 인식과 언어 모델링을 이용한 간편 메시지 출력장치 및 출력방법 |
KR20230120760A (ko) | 2022-02-10 | 2023-08-17 | 주식회사 빌리브커머스 | 음성 인식 및 언어 모델링 기술을 이용한 라이브 커머스 서비스용 메시지 출력 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999932B1 (en) * | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
KR100590553B1 (ko) * | 2004-05-21 | 2006-06-19 | 삼성전자주식회사 | 대화체 운율구조 생성방법 및 장치와 이를 적용한음성합성시스템 |
JP2008000003A (ja) * | 2004-10-01 | 2008-01-10 | Oncorex Inc | Pim−1活性/蛋白阻害医薬品 |
US7725449B2 (en) * | 2004-12-02 | 2010-05-25 | Microsoft Corporation | System and method for customization of search results |
KR20060070605A (ko) * | 2004-12-21 | 2006-06-26 | 한국전자통신연구원 | 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법 |
JP2008002005A (ja) * | 2006-06-21 | 2008-01-10 | Shimada Shoji Kk | 衣服用パッド |
-
2006
- 2006-06-30 KR KR1020060060365A patent/KR100792208B1/ko not_active IP Right Cessation
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100957710B1 (ko) * | 2008-05-22 | 2010-05-13 | 주식회사 다날 | 스타 음성 메시지 청취 시스템 |
KR101252397B1 (ko) * | 2011-06-02 | 2013-04-08 | 포항공과대학교 산학협력단 | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 |
KR20150075191A (ko) | 2013-12-24 | 2015-07-03 | 서강대학교산학협력단 | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 |
WO2015102124A1 (ko) * | 2013-12-31 | 2015-07-09 | 엘지전자 주식회사 | 대화 서비스 제공 장치 및 방법 |
CN111556999B (zh) * | 2017-11-03 | 2023-11-28 | 株式会社明芒科技 | 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质 |
CN111556999A (zh) * | 2017-11-03 | 2020-08-18 | 财富智慧股份有限公司 | 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质 |
US11302332B2 (en) | 2017-11-03 | 2022-04-12 | Deepbrain Ai Inc. | Method, computer device and computer readable recording medium for providing natural language conversation by timely providing substantial reply |
WO2019088638A1 (ko) * | 2017-11-03 | 2019-05-09 | 주식회사 머니브레인 | 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
KR101976841B1 (ko) * | 2018-10-29 | 2019-05-15 | 한경훈 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 의사 결정 서비스 제공 방법 |
KR20200079629A (ko) * | 2018-12-26 | 2020-07-06 | 지의소프트 주식회사 | 대화형 정보 제공 시스템 및 그 방법 |
KR20210007128A (ko) * | 2019-07-10 | 2021-01-20 | 주식회사 인텔로이드 | 대화 데이터베이스를 이용한 대화문장 추천 방법 및 그것이 적용된 음성대화장치 |
CN112530422A (zh) * | 2020-11-04 | 2021-03-19 | 联想(北京)有限公司 | 一种应答处理方法、智能设备及存储介质 |
CN115019777A (zh) * | 2022-06-20 | 2022-09-06 | 华南理工大学 | 一种在线学习语音识别应答装置及方法 |
CN115019777B (zh) * | 2022-06-20 | 2024-03-08 | 华南理工大学 | 一种在线学习语音识别应答装置及方法 |
CN117149983A (zh) * | 2023-10-30 | 2023-12-01 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
CN117149983B (zh) * | 2023-10-30 | 2024-02-27 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
KR100792208B1 (ko) | 2008-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100792208B1 (ko) | 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 | |
US10388274B1 (en) | Confidence checking for speech processing and query answering | |
CN1156821C (zh) | 具有互补语言模型的识别引擎 | |
KR100772660B1 (ko) | 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 | |
US10170107B1 (en) | Extendable label recognition of linguistic input | |
US20020087311A1 (en) | Computer-implemented dynamic language model generation method and system | |
JP2004005600A (ja) | データベースに格納された文書をインデックス付け及び検索する方法及びシステム | |
JP2001005488A (ja) | 音声対話システム | |
WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
JP2004133880A (ja) | インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
JP2015219583A (ja) | 話題決定装置、発話装置、方法、及びプログラム | |
CN113515616B (zh) | 一种基于自然语言的任务驱动系统 | |
CN105138864A (zh) | 基于生物医学文献的蛋白质交互关系数据库构建方法 | |
CN115292461B (zh) | 基于语音识别的人机交互学习方法及系统 | |
KR20060070605A (ko) | 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법 | |
JP5073024B2 (ja) | 音声対話装置 | |
US7085720B1 (en) | Method for task classification using morphemes | |
JP5360414B2 (ja) | キーワード抽出モデル学習システム、方法およびプログラム | |
US20100204982A1 (en) | System and Method for Generating Data for Complex Statistical Modeling for use in Dialog Systems | |
Bai et al. | Syllable-based Chinese text/spoken document retrieval using text/speech queries | |
JP5243325B2 (ja) | 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム | |
US20200372110A1 (en) | Method of creating a demographic based personalized pronunciation dictionary | |
JP2005284209A (ja) | 音声認識方式 | |
Lestari et al. | Adaptation to pronunciation variations in Indonesian spoken query-based information retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Publication of correction | ||
FPAY | Annual fee payment |
Payment date: 20101201 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |