KR20130108173A - 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 - Google Patents

유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 Download PDF

Info

Publication number
KR20130108173A
KR20130108173A KR1020130030762A KR20130030762A KR20130108173A KR 20130108173 A KR20130108173 A KR 20130108173A KR 1020130030762 A KR1020130030762 A KR 1020130030762A KR 20130030762 A KR20130030762 A KR 20130030762A KR 20130108173 A KR20130108173 A KR 20130108173A
Authority
KR
South Korea
Prior art keywords
voice
answer
question
sentence
text
Prior art date
Application number
KR1020130030762A
Other languages
English (en)
Inventor
윤재민
진삼순
Original Assignee
진삼순
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 진삼순 filed Critical 진삼순
Publication of KR20130108173A publication Critical patent/KR20130108173A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법에 관한 것으로, 더욱 상세하게는 사용자 단말기에서 사용자의 음성을 감지해서 질문을 입력받으면 질의응답서버로 전송하고, 질의응답서버에서 음성인식 후 질의응답을 수행하여, 질의응답에 의해서 입력한 문장에 대한 답변 음성과 답변 문장을 사용자 단말기로 전송하여 음성과 텍스트 형태로 출력하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법에 관한 것이다.
이를 위하여, 본 발명은 질문과 답변에 대한 사용자의 음성을 입력받아서, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하는 사용자 단말기; 및
질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변 문장 텍스트를 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하는 질의응답서버를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템을 제공한다.

Description

유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법{Question answering system using speech recognition by radio wire communication and its application method thereof}
본 발명은 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법에 관한 것으로, 더욱 상세하게는 사용자 단말기에서 사용자의 음성을 감지해서 질문을 입력받으면 질의응답서버로 전송하고, 질의응답서버에서 음성인식 후 질의응답을 수행하여, 질의응답에 의해서 입력한 문장에 대한 답변 음성과 답변 문장을 사용자 단말기로 전송하여 음성과 텍스트 형태로 출력하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법에 관한 것이다.
질의응답시스템은 사용자가 원하는 지식을 얻기 위해 시스템에게 질문을 하고, 시스템은 이를 분석하여 관련 답변을 출력하는 것으로써, 현재까지 다양한 방법으로 질의응답 시스템을 구현하여 왔다. 그러나, 기존 시스템은 모두 질문과 답변이 텍스트형태로 저장되고 표현되는 한계점을 가지고 있다.
본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위하여 제안된 것으로서, 음성으로 질문과 답변 문장을 저장하는 시스템 및 방법과, 음성으로 대화하는 시스템 및 방법을 제시하였다.
이와 같은 목적을 달성하기 위한 본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템은 질문과 답변에 대한 사용자의 음성을 입력받아서, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하는 사용자 단말기; 및
질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변 문장 텍스트를 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하는 질의응답서버를 포함하여 구성되는 것을 특징으로 한다.
한편, 본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템은 사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하고, 상기 질의응답서버로부터 답변음성과 답변문장 텍스트 정보를 전달 받아서, 음성과 텍스트 형태로 출력하는 사용자 단말기; 및
질문에 대한 음성을 인식해서 질문문장으로 변환하며, 질의응답을 수행하여, 상기 질문문장에 대한 답변문장 텍스트 정보를 상기 단말기로 전송하는 질의응답서버를 포함하여 구성되는 것을 특징으로 한다.
여기서, 상기 질의응답서버는 질문과 답변에 대한 음성파일을 저장하고, 상기 질문과 답변 음성파일을 인덱싱하여 저장하는 것을 특징으로 한다.
그리고, 상기 사용자 단말기는, 음성을 입력받는 음성입력장치; 상기 음성입력장치를 통해서 전달된 아날로그 음성을 디지털신호로 변환하는 음성입력부; 상기 음성입력부에서 수신된 음성정보를 질의응답서버로 전송하는 음성정보 송신부; 상기 질의응답서버로부터 수신된 답변음성 및 답변문장 텍스트를 수신하는 답변음성 및 답변문장 정보수신부; 답변 문장 텍스트를 출력하는 텍스트 출력부; 음성을 디지털 신호에서 아날로그 신호로 변환하는 음성출력부; 및 음성을 이어폰이나 스피커로 출력시키는 음성출력장치를 포함하여 구성되는 것을 특징으로 한다.
또한, 상기 사용자 단말기는 TTS를 이용해서 답변음성을 출력하는 것을 특징으로 한다.
또한, 상기 질의응답서버는 음성정보 수신부, 음성인식부, 자연어처리부, 답변관리부, 인덱싱DB, 질의응답DB로 구성되며, 음성정보 수신부는 유무선 네트워크를 통해서 전달되는 음성정보를 수신하고, 음성인식부에서는 상기 음성정보를 음성인식하여 음성을 인식한 텍스트 정보는 질의응답DB에 저장하며, 자연어처리부는 음성인식부에서 인식된 음성의 텍스트 정보를 인덱싱하여 인덱싱DB와 질의응답 DB에 저장하고, 입력음성이 질문일 경우에는 답변문장을 찾는 질의응답을 수행하며, 답변관리부는 자연어처리부에서 전달된 답변 문장을 관리하며, 이 정보를 답변문장 정보전달부로 전송하여, 답변 문장 텍스트 정보를 사용자 단말기로 전송하는 것을 특징으로 한다.
여기서, 상기 질의응답서버는 답변음성 정보전달부 및 음성DB를 더 포함하여 구성되며, 음성인식부에서는 상기 음성정보를 음성인식하여 음성은 음성DB에 저장하며, 답변관리부는 자연어처리부에서 전달된 답변 음성파일을 관리하며, 이 정보를 답변음성 정보전달부로 전송하여, 답변 음성정보를 사용자 단말기로 전송하는 것을 특징으로 한다.
또한, 상기 질의응답서버는 음성인식부에서 음성인식 후, 음성인식한 결과인 문장 텍스트정보는 질의응답DB에 저장하여, 상기 질의응답DB에 쌍으로 구성된 질문과 답변 문장의 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB에 저장하는 것을 특징으로 한다.
또한, 상기 질의응답서버는 상기 음성파일의 경로정보는 음성DB에 저장하며, 음성질의응답DB에 저장된 질문과 답변 문장 텍스트 정보와 음성DB에 저장된 음성파일의 경로정보는 질의응답DB에 삽입되는 것을 특징으로 한다.
또한, 상기 질의응답서버의 음성인식부는 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 문장 텍스트를 텍스트정보로 저장하는 것을 특징으로 한다.
또한, 상기 상기 질의응답서버의 음성인식부는 음성을 음성파일로 저장하는 것을 특징으로 한다.
또한, 상기 질의응답서버의 자연어처리부는, 상기 음성인식부에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 한다.
한편, 본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 운용방법에서 음성으로 질문과 답변문장을 저장하는 방법은, 사용자 단말기에서 음성으로 질문과 답변을 입력받는 1단계; 질의응답서버로 음성정보를 전달하는 2단계; 질의응답서버에서 음성인식하는 3단계; 음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계; 음성인식한 음성을 질문과 답변 음성파일로 저장하는 5단계; 음성인식한 문장을 질문과 답변 문장으로 저장하는 6단계; 및 상기 질문과 답변 문장, 질문과 답변 음성파일을 인덱싱하는 7단계를 포함하여 구성되는 것을 특징으로 한다.
그리고, 음성으로 질의응답 대화하는 방법은 사용자 단말기에서 음성으로 질문을 입력받는 1단계; 질의응답서버로 음성정보를 전달하는 2단계; 질의응답서버에서 음성인식하는 3단계; 상기 음성인식 후 발생한 문장정보로 질의응답처리하는 4단계; 상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트 형태로 사용자 단말기로 전송하는 5단계; 및 사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계를 포함하여 구성되는 것을 특징으로 한다.
이때, 상기 사용자 단말기에서 음성으로 질문을 입력받는 1단계는, 사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장과 답변음성을 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장을 표시하고, 답변음성을 출력하는 것을 특징으로 한다.
그리고, 상기 질의응답서버로 음성정보를 전달하는 2단계는, 음성 정보에서 잡음을 필터링하고 증폭하는 것을 특징으로 한다.
또한, 상기 질의응답서버에서 음성인식하는 3단계는, 음성인식 알고리즘에 의해 음성을 인식해서 텍스트로 변환하는 것을 특징으로 한다.
또한, 상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는, 음성에서 텍스트로 변환된 질문정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 한다.
또한, 상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트 형태로 사용자 단말기로 전송하는 5단계는, 기존 답변문장에서 추출한 답변은 해당 답변문장과 해당 답변문장의 음성파일이 사용자 단말기로 전송되고, 생성된 답변은 답변문장이 사용자 단말기로 전송되어서, 사용자 단말기의 TTS 엔진이 답변문장을 음성출력하는 것을 특징으로 한다.
또한, 상기 사용자단말기에서 답변음성과 텍스트를 출력하는 6단계는, 질의응답DB를 통해서 기존 답변문장이 추출되었을 경우에는, 상기 기존 답변문장을 음성파일을 통해서 음성을 출력하고 텍스트로 표시하며, 질의응답 DB를 통해서 새로운 답변문장이 생성되었을 경우에는, 해당 답변문장을 TTS를 통해서 음성을 출력하고 해당 답변문장을 텍스트로 표시하는 것을 특징으로 한다.
한편, 본 발명에서 음성으로 질문과 답변문장을 저장하는 방법은, 사용자 단말기에서 음성으로 질문과 답변을 입력받는 1단계; 질의응답서버로 음성정보를 전달하는 2단계; 질의응답서버에서 음성인식하는 3단계; 음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계; 음성인식한 문장을 질문과 답변 문장으로 저장하는 5단계; 및 상기 질문과 답변 문장을 인덱싱하는 6단계를 포함하여 구성되는 것을 특징으로 한다.
여기서, 상기 사용자 단말기에서 음성으로 질문을 입력 받는 1단계는, 사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장을 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장을 표시하고, 답변음성을 TTS로 출력하는 것을 특징으로 한다.
그리고, 상기 사용자 단말기에서 음성으로 질문을 입력 받는 1단계는, 별도의 음성입력장치가 단말기 외부에 부착되거나 내장된 음성입력장치를 이용하여 사용자의 질문 음성을 실시간으로 입력받는 것을 특징으로 한다.
또한, 상기 질의응답서버로 음성정보를 전달하는 2단계는, 음성 정보에서 잡음을 필터링하고 증폭하는 것을 특징으로 한다.
또한, 상기 질의응답서버에서 음성인식하는 3단계는, 음성인식 알고리즘에 의해 음성을 인식해서 텍스트로 변환하는 것을 특징으로 한다.
또한, 상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는, 음성에서 텍스트로 변환된 질문정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 한다.
또한, 상기 질의응답에 의해서 추출되거나 생성된 답변을 텍스트 형태로 사용자 단말기로 전송하는 5단계는, 기존 답변문장에서 추출한 답변은 해당 답변 문장이 사용자 단말기로 전송되고, 생성된 답변은 답변 문장이 사용자 단말기로 전송되어서, 사용자 단말기의 TTS 엔진이 답변문장을 음성 출력하는 것을 특징으로 한다.
또한, 사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계는, 질의응답서버의 질의응답에 의해서 추출되거나 생성된 답변문장을 전달받아서, TTS를 통해서 음성을 출력하고 해당 답변 문장을 텍스트로 표시하는 것을 특징으로 한다.
이와 같이 구성된 본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 방법은 음성으로 질문과 답변 문장을 저장하거나, 음성으로 대화하는 유용한 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템을 나타내는 도면;
도 2는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기의 내부 구성도를 나타내는 도면;
도 3은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 질의응답서버 내부 구성도를 나타내는 도면;
도 4는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도;
도 5는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면;
도 6은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도;
도 7은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면;
도 8은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기에서 음성으로 대화하는 화면;
도 9는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면;
도 10은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기의 내부 구성도를 나타내는 도면;
도 11은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 질의응답서버 내부 구성도를 나타내는 도면;
도 12는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도;
도 13은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면;
도 14는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도;
도 15는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면이다
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세하게 설명하면 다음과 같다.
본 발명은 여러 가지 상이한 형태로 구현될 수 있으므로, 여기에서 설명하는 실시예에 한정되지 않으며, 도면에서 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략하였다.
도 1은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템을 나타내는 도면이다.
도 1에 도시된 바와 같이, 본 발명은 사용자 단말기(100) 및 상기 사용자 단말기(100)와 유무선 통신 네트워크(200)로 연결되는 질의응답서버(300)를 포함한다.
사용자 단말기(100)는 개인용 컴퓨터(PC), 노트북, 스마트폰(아이폰, 안드로이드폰, 구글폰 등) 등 쌍방향 음성 및 데이터 통신이 가능한 매체를 말하며, 유무선 인터넷이나 유무선 전화(이동)통신을 통해서 질의응답서버(300)와 연결된다.
상기 유무선 통신 네트워크(200)는 본 발명의 속한 기술분야에서 통상의 지식을 가진 자에게 공지되어 있으므로 여기에서 상세히 설명하지 않는다.
본 발명에서 음성으로부터 질문과 답변을 저장할 때에는, 상기 사용자 단말기(100)는 질문과 답변에 대한 사용자의 음성을 입력받아서, 음성 아날로그 신호를 디지털신호로 변환하여 질의응답서버(300)로 전송한다.
상기 질의응답서버(300)는 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 음성파일과 상기 질문과 답변 문장 텍스트를 저장하고, 상기 질문과 답변문장, 상기 질문과 답변 음성파일을 인덱싱(Indexing)하여 저장한다.
본 발명에서 음성으로 질의응답 대화할 때에는, 사용자 단말기(100)는 사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그 신호를 디지털신호로 변환하여 질의응답서버(300)로 전송하고, 상기 질의응답서버(300)로부터 답변 음성과 답변 문장 텍스트 정보를 전달 받아서, 음성과 텍스트 형태로 출력한다.
상기 질의응답서버(300)는 질문에 대한 음성을 인식해서 질문 문장으로 변환하며, 질의응답을 수행하여, 상기 질문 문장에 대한 답변 음성과 답변 문장 텍스트 정보를 상기 사용자 단말기(100)로 전송한다.
도 2는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기의 내부 구성도를 나타내는 도면이다.
사용자 단말기(100)는 음성입력장치(110), 음성입력부(120), 음성정보 송신부(130), 답변음성 및 답변 문장 정보수신부(140), 텍스트 출력부(150), 음성출력부(170) 및 음성출력장치(180)를 포함하여 구성된다.
음성입력장치(110)는 음성을 입력받고, 음성입력부(120)는 상기 음성입력장치(110)를 통해서 전달된 아날로그음성을 디지털신호로 변환하며, 음성정보 송신부(130)는 상기 음성입력부(120)에서 수신된 음성정보를 질의응답서버(300)로 전송한다.
답변음성 및 답변문장 정보수신부(140)는 질의응답서버(300)로부터 수신된 답변 음성 및 답변문장 텍스트를 수신하고, 텍스트 출력부(150)는 모니터(160)에 답변 문장 텍스트를 출력하며, 음성출력부(170)는 음성을 디지털신호에서 아날로그 신호로 변환하고, 음성출력장치(180)는 음성을 이어폰이나 스피커로 출력시킨다.
상기 사용자 단말기(100)는 질문 입력부(151)와 답변 입력부(152)를 제공하고, 사용자에게 상기 질문 입력부(151)를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 질문음성을 질문문장으로 표시하고, 질의응답서버(300)는 상기 질문음성과 질문문장을 임시 저장한다.
그리고, 사용자에게 상기 답변 입력부(152)를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 답변음성을 답변문장으로 표시하고, 질의응답서버(300)는 상기 답변음성과 답변문장을 임시 저장한다.
또한, 사용자 단말기(100)로부터 질문과 답변의 음성입력이 완료되면(입력완료 버턴 클릭), 질의응답서버(300)는 임시 저장된 상기 질문문장과 답변문장, 상기 질문문장의 음성정보와 상기 답변문장의 음성정보를 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호), 상기 질문문장과 답변문장의 음성파일 경로정보를 DB에 저장한다.
상기 사용자 단말기(100)는 사용자의 음성을 감지해서 질의응답서버(300)로 전송하여 음성인식된 결과를 회신받아 사용자 단말기(100)의 질문입력창에 표시하고, 상기 질문에 대한 답변문장과 답변음성을 질의응답서버(300)에서 사용자 단말기(100)로 전송하여, 사용자 단말기(100)의 답변입력창에 답변문장을 표시하고, 답변음성을 출력한다.
또한, 상기 사용자 단말기(100)는 사용자의 음성을 감지해서, 유의미한 음성으로 감지된 음성데이터를 질의응답서버(300)로 전송하여 음성인식과정을 수행하고, 음성인식된 결과가 없을 경우, 사용자단말기(100)에 다시 음성을 입력하라는 메시지를 표시하여, 사용자에게 정확하게 음성을 입력하게 한다.
여기서, 유의미한 음성이란, 음성입력시 감지(detection)알고리즘에 의해서 일정프레임 구간 이상 음성이 입력될 경우를 말하는데, 16Khz로 음성을 샘플링했을 때, 최소한 3,000 프레임 이상 입력되었을 때를 말한다.
상기 사용자 단말기(100)는 외부 마이크나 단말기 내부 마이크인 음성입력장치(110)로 전달된 아날로그신호인 질문음성을 음성입력부(120)에서 디지털신호로 변환하고, 음성출력부(170)로 전달된 답변음성을 이어폰이나 스피커로 구성되는 음성출력장치(180)를 통해서 아날로그신호로 변환하여 출력한다.
상기 사용자 단말기(100)의 텍스트 출력부(150)는 답변음성 및 답변문장 정보수신부(140)를 통해서 전달된 텍스트정보를 단말기 화면상에 표시한다.
도 3은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 질의응답서버 내부 구성도를 나타내는 도면이다.
본 발명에서 음성으로부터 질문과 답변을 저장할 때에는, 상기 질의응답서버(300)는 음성정보 수신부(310), 음성인식부(320), 자연어처리부(340), 답변관리부(350), 답변음성 및 답변문장 정보 전달부(360), 음성DB(330), 음성질의응답DB(331), 인덱싱DB(332), 질의응답DB(333)를 포함하여 구성된다.
여기서, 음성정보 수신부(310)는 유무선 네트워크를 통해서 전달되는 음성정보를 수신하고, 음성인식부(320)에서는 상기 음성정보를 음성인식하여 음성은 음성DB(330)에, 음성을 인식한 텍스트 정보(문장)는 음성질의응답DB(331)에 저장한다.
그리고, 자연어처리부(340)는 음성인식부(320)에서 인식된 음성과 상기 음성의 텍스트 정보(문장)를 인덱싱하여 인덱싱DB(332)와 질의응답 DB(333)에 저장하고, 입력음성이 질문일 경우에는 답변문장을 찾는 질의응답을 수행한다.
또한, 답변관리부(350)는 자연어처리부(340)에서 전달된 답변 문장과 답변 음성파일을 관리하며, 이 정보를 답변음성 및 답변문장 정보전달부(360)로 전송하여, 답변 음성정보와 답변 문장 텍스트 정보를 사용자 단말기(100)로 전송하게 된다.
한편, 본 발명에서 음성으로 질의응답 대화할 때에는, 상기 질의응답서버(300)는 음성인식부(320)에서 음성인식 후, 음성파일을 생성시키고, 상기 음성파일의 경로정보는 음성DB(330)에 저장하며, 음성인식한 결과인 문장 텍스트정보는 음성질의응답DB(331)에 저장한다.
그리고, 상기 음성질의응답DB(331)에 질문과 답변 문장의 쌍으로 구성된 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB(332)에 저장하고, 음성질의응답DB(331)에 저장된 질문과 답변 문장 텍스트 정보와 음성DB(330)에 저장된 음성파일의 경로정보는 질의응답DB(333)에 삽입된다.
상기 질의응답서버(300)의 음성인식부(320)는 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 음성은 음성파일로, 문장 텍스트는 텍스트정보로 저장한다.
상기 질의응답서버(300)의 자연어처리부(340)는 상기 음성인식부(320)에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈(342)에 의해서 답변을 찾거나 답변을 생성한다.
상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성한다.
상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성한다.
도 4는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도이다.
본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질문과 답변문장을 저장하는 방법은, 사용자 단말기(100)에서 음성으로 질문과 답변을 입력받는 1단계(S100), 질의응답서버(300)로 음성정보를 전달하는 2단계(S110), 질의응답서버(300)에서 음성인식하는 3단계(S120), 음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계(S130), 음성인식한 음성을 질문과 답변 음성파일로 저장하는 5단계(S140), 음성인식한 문장을 질문과 답변 문장으로 저장하는 6단계(S150) 및 상기 질문과 답변 문장, 질문과 답변 음성파일을 인덱싱하는 7단계(S160)를 포함하여 구성된다.
그리고, 사용자 단말기(100)에서 음성으로 질문과 답변을 입력 받는 절차는, 질문 입력부(151)와 답변 입력부(152)를 제공하고, 사용자에게 상기 질문 입력부(151)를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 질문음성을 질문텍스트로 표시하고, 질의응답서버(300)는 상기 질문음성과 질문텍스트를 임시 저장한다.
그리고, 사용자에게 상기 답변 입력부(152)를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 답변음성을 답변텍스트로 표시하고, 질의응답서버(300)는 상기 답변음성과 답변텍스트를 임시 저장한다.
사용자 단말기(100)로부터 질문과 답변의 음성입력이 완료되면(입력완료 버턴 클릭), 질의응답서버(300)는 임시 저장된 상기 입력 텍스트와 답변텍스트 정보, 상기 입력 텍스트의 음성정보와 상기 답변 텍스트의 음성정보를 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호), 상기 질문문장과 답변문장의 음성파일 경로정보를 DB에 저장한다.
한편, 본 발명에서 질의응답서버(300)에서 음성인식하고 저장할 때에는, 질문입력음성과 답변입력음성을 각각 전달받아서 음성을 질문문장과 답변문장으로 변환하여 DB에 저장하고, 질문입력음성과 답변입력음성을 각각 음성파일로 저장하며, 형태소 분석 과정을 거쳐서 키워드별로 인덱싱하여, 상기 키워드별 상기 키워드가 나타난 질문문장과 답변문장의 위치정보(문장번호), 상기 질문문장과 답변문장의 음성파일 경로정보를 기록한다.
도 5는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면이다.
도 5은 도 4에서 설명한 음성으로부터 질문과 답변을 저장하는 방법을 나타내었다.
즉, 사용자 단말기(100)에서 질문과 답변에 대한 사용자의 음성을 입력받아서(S200), 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버(300)로 전송하면, 질의응답서버(300)에서 질문과 답변에 대한 음성을 인식(S210)해서 질문과 답변 문장으로 변환한다.
그리고, 상기 질문과 답변에 대한 음성파일을 추출해서(S230), 음성DB(S260)에 저장하고, 상기 질문과 답변에 대한 텍스트파일을 추출해서(S240), 질의응답DB(S270)에 저장하며, 상기 질문과 답변문장, 상기 질문과 답변 음성파일 경로정보를 음성질의정보DB(S280)에 저장한다. 상기 질문과 답변문장, 상기 질문과 답변 음성파일경로정보를 인덱싱하여 인덱싱DB(S250)저장한다.
상기 인덱싱DB(332)에는 질문과 답변 문장에 나타난 단어들의 형태소 정보리스트와 이 형태소가 발생한 질문문장과 답변문장의 위치정보(문장번호), 상기 질문문장과 답변문장의 음성파일 경로정보를 DB에 저장한다.
도 6은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도이다.
본 발명의 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질의응답 대화하는 방법은, 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300), 질의응답서버로 음성정보를 전달하는 2단계(S310), 질의응답서버에서 음성인식하는 3단계(S320), 상기 음성인식 후 발생한 문장정보(텍스트)로 질의응답처리하는 4단계(S330), 상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트 형태로 사용자 단말기로 전송하는 5단계(S340) 및 사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계(S350)를 포함하여 구성된다.
여기서, 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300)는, 사용자의 음성을 감지해서 질의응답서버(300)로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장과 답변음성을 질의응답서버(300)에서 사용자 단말기로 전송하여, 사용자 단말기(100)의 답변입력창에 답변문장을 표시한다.
상기 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300)는 별도의 음성입력장치(110)가 단말기 외부에 부착되거나 내장된 음성입력장치(마이크)(110)를 이용하여 사용자의 질문 음성을 실시간으로 입력받는다.
이때, 음성으로 질의응답 대화하는 방법에서 음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함할 수 있다.
그리고, 상기 질의응답서버(300)로 음성정보를 전달하는 2단계는(S310) 음성 정보(데이터)에서 잡음을 필터링하고 증폭하는 과정을 포함한다.
상기 질의응답서버(300)에서 음성인식하는 3단계(S320)는 음성인식 알고리즘에 의해 음성을 인식해서 텍스트(문장)로 변환한다.
상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 음성에서 텍스트(문장)로 변환된 질문정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈(342)에 의해서 답변을 찾거나 답변을 생성한다.
구체적으로, 상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 상기 질의응답서버(300)의 질의응답모듈(342)가 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는다.
또한, 상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 유무선 통신 네트워크(200)를 통해서 해당 정보를 가져와서 답변을 생성한다.
상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트(문장) 형태로 사용자 단말기(100)로 전송하는 5단계(S340)는 기존 답변문장에서 추출한 답변은 해당 답변 문장과 해당 답변 문장의 음성파일이 사용자 단말기(100)로 전송되고, 생성된 답변은 답변 문장이 사용자 단말기(100)로 전송되어서, 사용자 단말기(100)의 TTS 엔진이 답변문장을 음성 출력한다.
여기서, 티티에스(TTS)는 문자음성 자동변환 기술로써, Text to speech의 줄임말이다
마지막으로, 상기 사용자 단말기(100)에서 답변 음성과 텍스트(문장)를 출력하는 6단계(S350)는 질의응답DB(333)를 통해서 기존 답변 문장이 추출되었을 경우에는, 상기 기존 답변문장을 음성파일을 통해서 음성을 출력하고 텍스트(문장)로 표시하며, 질의응답 DB(333)를 통해서 새롭게 답변 문장이 생성되었을 경우에는, 해당 답변 문장을 TTS를 통해서 음성을 출력하고 해당 답변 문장을 텍스트(문장)로 표시한다.
한편, 음성으로 질의응답 대화하는 방법에서, 음성인식한 결과를 사용자 단말기로 전송해서 정확하게 입력되었는지 확인 받는 과정을 더 포함할 수 있다.
도 7은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면이다.
도 7은 도 6에서 설명한 음성으로 질의응답 대화하는 방법을 나타내었다.
즉, 사용자 단말기(100)에서 사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버(300)로 전송하고(S400), 상기 질의응답서버로(300)부터 답변 음성과 답변 텍스트 정보를 전달 받아서(S450), 음성과 텍스트 형태로 출력한다.
상기 질의응답서버(300)는 질문에 대한 음성을 인식해서(S410) 질문 문장으로 변환하며, 질의응답과정을 수행하여(S420), 상기 질문 문장에 대한 답변 음성과 답변 텍스트 정보를 상기 사용자 단말기(100)로 전송한다(S460).
상기 질의응답서버(300)의 질의응답(S420)은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변(S440)을 요구하는 질문은 미리 구축된 답변DB(S441)에서 답변을 가져오고, 특정 정보를 요청(S450)할 때는 해당 정보를 토대로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법(S430)을 이용하여 인덱싱DB(S431)와 음성질의정보DB(S432)를 이용해서 답변문장을 찾는다.
즉, 질문 문장에 포함되어 있는 형태소(단어)정보를 인덱싱 DB(332)에서 찾고, 해당 형태소 정보가 포함된 질문, 답변 문장 번호를 음성질의정보DB(331)에서 찾아서, 질문 문장에 포함된 형태소 정보가 가장 많이 나타난 질문이나 답변을 음성질의정보DB(331)에 찾아서, 해당 질문과 답변 쌍에서 답변을 추출하고, 상기 답변에 대한 음성파일을 가져와서 사용자 단말기(100)로 전달하여 음성을 출력하게 한다.
도 8은 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기에서 음성으로 대화하는 화면이다.
먼저, 음성으로 대화할 때에는 질문음성입력시작버턴(S500)을 클릭해서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 질문 음성입력창(S510)에 음성인식한 문장(예를 들어 너는 누구니?)이 표시된다.
그리고, 보내기(S520)를 클릭하면 질의응답서버(300)에서 답변문장과 답변문장의 음성정보를 리턴하고, 이 답변문장을 답변표시창(S540)에 표시하면 “예를 들어 나는 로봇입니다.”가 출력된다. 또한, 음성정보를 스피커나 이어폰으로 출력하게 되는데, 이때 TTS를 이용할 수 있다.
이때, 보내기 버턴은 눌러도 되고 디폴트로 설정하여 누르지 않아도 질문 음성입력창에 음성인식한 문장을 표시하자 마자 질의응답서버(300)로 송신하여 답변 문장을 수신 받을 수 있다.
그리고, 질의응답서버(300)에서 답변문장만 수신받았을 때에는 내부 TTS엔진을 이용해서 스피커나 이어폰으로 음성을 출력할 수도 있다.
도 9는 본 발명의 일 실시예에 따른 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 사용자 단말기에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면이다.
음성으로부터 질문과 답변을 저장하기 위해서는 먼저, 음성입력 전에, 질문음성입력시작 버턴(S600)을 눌러서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 질문 음성입력창(S610)에 음성인식한 문장(예를 들어 사랑해요)이 표시된다.
또한, 답변음성입력시작 버턴(S630)을 눌러서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 답변입력창(S620)에 음성인식한 문장(나도 사랑해요)이 표시된다.
입력완료버턴(S660)을 누르면, 질의응답서버(300)에서 음성으로부터 입력한 질문과 답변에 해당하는 음성은 음성파일로, 음성인식된 결과는 질문과 답변 문장 텍스트로 각각 저장된다.
이때, 초기화 버턴(S620, S650)을 누르면 음성입력창(S610)과 답변입력창(S620)에 입력된 문장을 삭제할 수 있다.
도 10은 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템의 사용자 단말기의 내부 구성도를 나타내는 도면이다.
본 실시예에서 사용자 단말기(100)는 음성입력장치(110), 음성입력부(120), 음성정보 송신부(130), 답변문장 정보수신부(140), 텍스트 출력부(160), TTS부(155), 음성출력부(180) 및 음성출력장치(190)를 포함하여 구성된다.
음성입력장치(110)는 음성을 입력받고, 음성입력부(120)는 상기 음성입력장치(110)를 통해서 전달된 아날로그음성을 디지털신호로 변환하며, 음성정보 송신부(130)는 상기 음성입력부(120)에서 수신된 음성정보를 질의응답서버(300)로 전송하다.
답변문장 정보송신부(140)는 질의응답서버(300)로부터 수신된 답변 문장 텍스트를 수신하고, 텍스트 출력부(160)는 모니터(170)에 답변 문장 텍스트를 출력하며, TTS부(155)는 상기 답변 문장을 음성으로 바꾸고, 음성출력부(180)는 음성을 디지털 신호에서 아날로그 신호로 변환하며, 음성출력장치(190)는 음성을 이어폰이나 스피커로 출력시킨다.
상기 사용자 단말기(100)는 질문 입력부(161)와 답변 입력부(162)를 제공하고, 사용자에게 상기 질문 입력부(161)를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 질문음성을 질문문장으로 표시한다.
그리고, 사용자에게 상기 답변 입력부(162)를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 답변음성을 답변문장으로 표시한다.
또한, 사용자단말기(100)로부터 질문과 답변의 음성입력이 완료되면(입력완료 버턴 클릭), 질의응답서버(300)에 상기 질문문장과 답변문장을 전송하여, 상기 질문문장과 상기 답변문장을 인덱싱(Indexing)하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
또한, 상기 사용자 단말기(100)는 소정의 질문 입력부(161)와 답변 입력부(162)를 제공하고, 사용자에게 상기 질문 입력부(161)를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 질문음성을 질문문장으로 표시하고, 질의응답서버(300)는 상기 질문문장을 임시 저장한다.
그리고, 사용자에게 상기 답변 입력부(162)를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 답변음성을 답변문장으로 표시하고, 질의응답서버(300)는 상기 답변문장을 임시 저장하고,
또한, 사용자단말기(100)로부터 질문과 답변의 음성입력이 완료되면(입력완료 버턴 클릭), 질의응답서버(300)는 임시 저장된 상기 질문문장과 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
상기 사용자 단말기(100)는 사용자의 음성을 감지해서 질의응답서버(300)로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장을 질의응답서버(300)에서 사용자 단말기(100)로 전송하여, 사용자 단말기의 답변입력창에 답변문장을 표시하고, TTS를 이용해서 답변음성을 출력한다.
그리고, 상기 사용자 단말기(100)에서 TTS를 이용해서 답변을 출력할 때에는 목소리 종류별, 나이별, 성별로 다양한 TTS목소리를 제공하여, 사용자가 선택할 수 있다.
또한, 상기 사용자 단말기(100)는 사용자의 음성을 감지해서, 유의미한 음성으로 감지된 음성데이터를 질의응답서버(300)로 전송하여 음성인식과정을 수행하고, 음성인식된 결과가 없을 경우, 사용자단말기(100)에 다시 음성을 입력하라는 메시지를 표시하여, 사용자에게 정확하게 음성을 입력하게 한다.
여기서, 유의미한 음성이란, 음성입력시 감지(detection)알고리즘에 의해서 일정프레임 구간 이상 음성이 입력될 경우를 말하는데, 16Khz로 음성을 샘플링했을 때, 최소한 3,000 프레임 이상 입력되었을 때를 말한다.
상기 사용자 단말기(100)는 외부 마이크나 단말기 내부 마이크인 음성입력장치(110)로 전달된 아날로그신호인 질문음성을 음성입력부(120)에서 디지털신호로 변환하고, 음성출력부(180)로 전달된 답변음성을 이어폰이나 스피커로 구성되는 음성출력장치(190)를 통해서 아날로그신호로 변환하여 출력한다.
상기 사용자 단말기(100)의 텍스트 출력부(160)는 답변문장 정보수신부(140)를 통해서 전달된 텍스트정보를 단말기 화면상에 표시한다.
도 11은 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템의 질의응답서버 내부 구성도를 나타내는 도면이다.
본 실시예에서 음성으로부터 질문과 답변을 저장할 때에는, 상기 질의응답서버(300)는 음성정보 수신부(310), 음성인식부(320), 자연어처리부(340), 답변관리부(350), 답변문장 정보 전달부(365), 질의응답DB(321), 인덱싱DB(322)를 포함하여 구성된다.
여기서, 음성정보 수신부(310)는 유무선 네트워크를 통해서 전달되는 음성정보를 수신하고, 음성인식부(320)에서는 상기 음성정보를 음성인식하여 음성을 인식한 텍스트 정보(문장)는 질의응답DB(321)에 저장한다.
그리고, 자연어처리부(340)는 음성인식부(320)에서 인식된 음성의 텍스트 정보(문장)를 인덱싱하여 인덱싱DB(322)와 질의응답 DB(321)에 저장하고, 입력음성이 질문일 경우에는 답변문장을 찾는 질의응답을 수행한다.
또한, 답변관리부(350)는 자연어처리부(340)에서 전달된 답변 문장을 관리하며, 이 정보를 답변문장 정보전달부(365)로 전송하여, 답변 문장 텍스트 정보를 사용자 단말기(100)로 전송하게 된다.
본 실시예에서 음성으로 질의응답 대화할 때에는, 상기 질의응답서버(300)는 음성인식부(320)에서 음성인식 후, 음성인식한 결과인 문장 텍스트정보는 질의응답DB(321)에 저장하여, 상기 질의응답DB(321)에 질문과 답변 문장의 쌍으로 구성된 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB(322)에 저장한다.
상기 질의응답서버(300)의 음성인식부(320)는 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 상기 문장 텍스트는 텍스트정보로 저장한다.
상기 질의응답서버(300)의 자연어처리부(340)는 상기 음성인식부(320)에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈(342)에 의해서 답변을 찾거나 답변을 생성한다.
상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 기반으로 답변을 생성한다.
상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크(200)를 통해서 해당 정보를 가져와서 답변을 생성한다.
도 12는 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도이다.
본 실시예에서 음성으로 질문과 답변문장을 저장하는 방법은, 사용자 단말기에서 음성으로 질문과 답변을 입력받는 1단계(S100), 질의응답서버로 음성정보를 전달하는 2단계(S110), 질의응답서버에서 음성인식하는 3단계(S120), 음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계(S130), 음성인식한 문장을 질문과 답변 문장으로 저장하는 5단계(S140) 및 상기 질문과 답변문장을 인덱싱하는 6단계(S150)를 포함하여 구성된다.
이때, 본 실시예에서 사용자 단말기(100)에서 음성으로 질문과 답변을 입력 받는 절차는, 질문 입력부(161)와 답변 입력부(162)를 제공하고, 사용자에게 상기 질문 입력부(161)를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신받아서, 질문음성을 질문텍스트로 표시한다.
그리고, 사용자에게 상기 답변 입력부(162)를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버(300)로 전송하여 음성인식 결과를 회신 받아서, 답변음성을 답변텍스트로 표시한다.
또한, 사용자 단말기(100)로부터 질문과 답변의 음성입력이 완료되면(입력완료 버턴 클릭), 질의응답서버(300)는 상기 질문문장과 답변문장을 전송하여, 상기 질문문장과 상기 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
본 실시예에서 질의응답서버(300)에서 음성인식하고 저장할 때에는, 질문입력음성과 답변입력음성을 각각 전달받아서 음성을 질문문장과 답변문장으로 변환하여 DB에 저장하고, 형태소 분석 과정을 거쳐서 키워드별로 인덱싱하여, 상기 키워드별 상기 키워드가 나타난 질문문장과 답변문장의 위치정보(문장번호)를 기록한다.
도 13은 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면이다.
도 13은 도 12에서 설명한 음성으로부터 질문과 답변을 저장하는 방법을 나타내었다.
즉, 사용자 단말기(100)에서 질문과 답변에 대한 사용자의 음성을 입력받아서(S200), 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버(300)로 전송하면, 질의응답서버(300)에서 질문과 답변에 대한 음성을 인식(S210)해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 추출해서(S220), 질의응답DB(S230)에 저장하며, 상기 질문과 답변문장을 인덱싱하여(S240) 인덱싱DB(S250)저장한다.
인덱싱DB(322)에는 질문과 답변 문장에 나타난 단어들의 형태소 정보리스트와 이 형태소가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
도 14는 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도이다.
본 실시예에서 음성으로 질의응답 대화하는 방법은 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300), 질의응답서버로 음성정보를 전달하는 2단계(S310), 질의응답서버에서 음성인식하는 3단계(S320), 상기 음성인식 후 발생한 문장정보(텍스트)로 질의응답처리하는 4단계(S330), 상기 질의응답에 의해서 추출되거나 생성된 답변을 텍스트 형태로 사용자 단말기로 전송하는 5단계(S340) 및 사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계(S350)를 포함하여 구성된다.
상기 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300)는 사용자의 음성을 감지해서 질의응답서버(300)로 전송하여 음성인식된 결과를 회신받아 사용자 단말기(100)의 질문입력창에 표시하고, 상기 질문에 대한 답변문장과 답변음성을 질의응답서버(300)에서 사용자 단말기(100)로 전송하여, 사용자 단말기(100)의 답변입력창에 답변문장을 표시하고, 답변음성을 TTS로 출력한다.
또한, 상기 사용자 단말기(100)에서 음성으로 질문을 입력 받는 1단계(S300)는 별도의 음성입력장치(110)가 사용자 단말기(100) 외부에 부착되거나 내장된 음성입력장치(마이크)(100)를 이용하여 사용자의 질문 음성을 실시간으로 입력받는다.
이때, 음성으로 질의응답 대화하는 방법에서 음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함할 수 있다.
그리고, 상기 질의응답서버(300)로 음성정보를 전달하는 2단계(S310)는 음성 정보(데이터)에서 잡음을 필터링하고 증폭하는 과정을 포함한다.
상기 질의응답서버(300)에서 음성인식하는 3단계(S320)는 소정의 음성인식 알고리즘에 의해 음성을 인식해서 텍스트(문장)로 변환한다.
상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 음성에서 텍스트(문장)로 변환된 질문정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈(342)에 의해서 답변을 찾거나 답변을 생성한다.
다음으로, 상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 기반으로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는다.
또한, 상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 4단계(S330)는 상기 질의응답서버(300)의 질의응답모듈(342)은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크(200)를 통해서 해당 정보를 가져와서 답변을 생성한다.
그리고, 상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트(문장) 형태로 사용자 단말기로 전송하는 5단계(S340)는 기존 답변문장에서 추출한 답변은 해당 답변 문장이 사용자 단말기(100)로 전송되고, 생성된 답변은 답변 문장이 사용자 단말기(100)로 전송되어서, 사용자 단말기(110)의 TTS 엔진이 답변문장을 음성 출력한다.
마지막으로, 사용자 단말기(100)에서 답변 음성과 텍스트(문장)를 출력하는 6단계(S350)는 질의응답서버(300)의 질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, TTS를 통해서 음성을 출력하고 해당 답변 문장을 텍스트(문장)로 표시한다.
또한, 질의응답서버(300)의 질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, TTS를 통해서 음성을 출력할 때에는, 목소리 종류별, 나이별, 성별로 다양한 TTS목소리를 제공하여, 사용자가 선택할 수 있다.
본 실시예의 음성으로 질의응답 대화하는 방법에서, 음성인식한 결과를 사용자 단말기(100)로 전송해서 정확하게 입력되었는지 확인 받는 과정을 더 포함할 수 있다.
도 15는 본 발명의 일 실시예에 따른 유무선 통신 네트워크(와 TTS)를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면이다.
도 15는 도 14에서 설명한 음성으로 질의응답 대화하는 방법을 나타내었다.
즉, 사용자 단말기(100)에서 사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버(300)로 전송하고(S400), 상기 질의응답서버(300)로부터 답변 텍스트 정보를 전달 받아서(S470), 음성과 텍스트 형태로 출력한다.
이때, 질의응답서버(300)는 질문에 대한 음성을 인식해서(S410) 질문 문장으로 변환하며, 질의응답과정을 수행하여(S420), 상기 질문 문장에 대한 답변 텍스트 정보를 상기 사용자 단말기(100)로 전송 한다(S460).
상기 질의응답서버(300)의 질의응답(S420)은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변(S440)을 요구하는 질문은 미리 구축된 답변DB(S441)에서 답변을 가져오고, 특정 정보를 요청(S450)할 때는 해당 정보를 기반으로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법(S430)을 이용하여 인덱싱DB(S431)와 음성질의정보DB(S432)를 이용해서 답변문장을 찾는다.
100 : 사용자 단말기 110 : 음성입력장치
120 : 음성입력부 130 : 음성정보 송신부
140 : 답변음성 및 답변 문장 정보 송신부
150 : 텍스트 출력부 155 : TTS
160 : 모니터 170 : 음성출력부
180 : 음성출력장치 200 : 유무선 통신 네트워크
300 : 질의응답서버 310 : 음성정보 수신부
320 : 음성인식부 340 : 자연어처리부
350 : 답변관리부
360 : 답변음성 및 답변문장 정보전달부
365: 답변문장 정보전달부

Claims (50)

  1. 질문과 답변에 대한 사용자의 음성을 입력받아서, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하는 사용자 단말기; 및
    질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변 문장 텍스트를 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하는 질의응답서버를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  2. 제 1항에 있어서,
    상기 질의응답서버는 추가적으로 질문과 답변에 대한 음성파일을 저장하고, 상기 질문과 답변 음성파일을 인덱싱하여 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  3. 사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하고, 상기 질의응답서버로부터 답변문장 텍스트 정보를 전달 받아서 상기 답변문장 텍스트를 표시하고, 상기 답변문장 텍스트를 TTS로 변환한 음성을 출력하는 사용자 단말기; 및
    질문에 대한 음성을 인식해서 질문문장 텍스트로 변환하며, 질의응답을 수행하여, 상기 질문문장 텍스트에 대한 답변문장 텍스트 정보를 상기 단말기로 전송하는 질의응답서버를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  4. 제 3항에 있어서,
    사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그신호를 디지털신호로 변환하여 질의응답서버로 전송하고, 상기 질의응답서버로부터 답변음성파일과 답변문장 텍스트 정보를 전달 받아서 상기 답변문장 텍스트를 표시하고, 상기 답변음성을 출력하는 사용자 단말기; 및
    질문에 대한 음성을 인식해서 질문문장 텍스트로 변환하여, 질의응답을 수행하고, 상기 질문문장 텍스트에 대한 답변음성파일과 답변문장 텍스트 정보를 상기단말기로 전송하는 질의응답서버를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는, 음성을 입력받는 음성입력장치; 상기 음성입력장치를 통해서 전달된 아날로그 음성을 디지털신호로 변환하는 음성입력부; 상기 음성입력부에서 수신된 음성정보를 질의응답서버로 전송하는 음성정보 송신부; 상기 질의응답서버로부터 답변음성 및 답변문장 텍스트를 수신하는 답변음성 및 답변문장 정보수신부; 답변 문장 텍스트를 출력하는 텍스트 출력부; 질의응답서버에서 답변문장 텍스트만 수신되면 상기 답변문장 텍스트를 음성으로 바꾸고(TTS), 질의응답서버에서 답변음성파일이 수신되면 음성을 출력하는 음성출력부; 및 음성을 이어폰이나 스피커로 출력시키는 음성출력장치를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는 사용자에게 질문 입력부를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버로 전송하여 음성인식 결과를 회신받아서, 질문음성을 질문문장텍스트로 표시하고, 사용자에게 답변 입력부를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버로 전송하여 음성인식 결과를 회신받아서, 답변음성을 답변문장 텍스트로 표시하고, 상기 사용자 단말기로부터 질문과 답변의 음성입력이 완료되면, 질의응답서버에 상기 질문문장과 답변문장을 전송하여, 상기 질문문장과 답변문장을 인덱싱하여, 특정 키워드가 발생한 질문문장과 답변문장의 위치정보를 DB에 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  7. 제6항에 있어서,
    상기 질의응답서버는 상기 질문음성과 상기 답변음성을 질문음성파일과 답변음성파일로 임시 저장하고, 사용자단말기로부터 질문과 답변의 음성입력이 완료되면, 상기 질의응답서버는 임시 저장된 상기 질문음성파일과 상기 답변음성파일을 상기 질문문장 텍스트 및 상기 답변문장 텍스트와 인덱싱하여, 특정 단어가 발생한 질문문장 텍스트와 답변문장 텍스트의 위치정보(문장번호), 상기 질문음성파일과 상기 답변음성파일의 경로정보를 DB에 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  8. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는 사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장 텍스트를 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장 텍스트를 표시하고, 답변음성을 TTS를 이용하여 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  9. 제8항에 있어서,
    상기 사용자 단말기에서 TTS를 이용해서 답변을 출력할 때에는 목소리 종류별, 나이별, 성별로 다양한 TTS목소리를 사용자가 선택할 수 있도록 제공하는 것을 특징으로 하는 유무선 통신 네트워크와 음성인식 질의응답 시스템.
  10. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는 사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장 텍스트와 답변문장파일을 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장 텍스트를 표시하고, 답변음성파일을 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  11. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는 사용자의 음성을 감지해서, 유의미한 음성으로 감지된 음성데이터를 질의응답서버로 전송하여 음성인식과정을 수행하고, 음성인식된 결과가 없을 경우, 사용자단말기에 다시 음성을 입력하라는 메시지를 표시하여, 사용자에게 정확하게 음성을 입력하게 하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  12. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기는 외부 마이크나 단말기 내부 마이크인 음성입력장치로 전달된 아날로그 신호인 질문음성을 음성입력부에서 디지털신호로 변환하고, 음성출력부로 전달된 답변음성을 이어폰이나 스피커로 구성되는 음성출력장치를 통해서 아날로그 신호로 변환하여 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  13. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사용자 단말기의 텍스트 출력부는 답변음성 및 답변문장 정보수신부를 통해서 전달된 텍스트정보를 단말기 화면상에 표시하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  14. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 질의응답서버는 음성정보 수신부, 음성인식부, 자연어처리부, 답변관리부, 인덱싱DB, 질의응답DB로 구성되며, 음성정보 수신부는 유무선 네트워크를 통해서 전달되는 음성정보를 수신하고, 음성인식부에서는 상기 음성정보를 음성인식하여 음성을 인식한 텍스트 정보는 질의응답DB에 저장하며, 자연어처리부는 음성인식부에서 인식된 음성의 텍스트 정보를 인덱싱하여 인덱싱DB와 질의응답 DB에 저장하고, 입력음성이 질문일 경우에는 답변문장을 찾는 질의응답을 수행하며, 답변관리부는 자연어처리부에서 전달된 답변 문장을 관리하며, 이 정보를 답변문장 정보전달부로 전송하여, 답변 문장 텍스트 정보를 사용자 단말기로 전송하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  15. 제14항에 있어서,
    상기 질의응답서버는 답변음성 정보전달부 및 음성DB를 더 포함하여 구성되며, 음성인식부에서는 상기 음성정보를 음성인식하여 음성은 음성DB에 저장하며, 답변관리부는 자연어처리부에서 전달된 답변 음성파일을 관리하며, 이 정보를 답변음성 정보전달부로 전송하여, 답변 음성정보를 사용자 단말기로 전송하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  16. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 질의응답서버는 음성인식부에서 음성인식 후, 음성인식한 결과인 문장 텍스트정보는 질의응답DB에 저장하여, 상기 질의응답DB에 쌍으로 구성된 질문과 답변 문장의 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB에 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  17. 제16항에 있어서,
    상기 질의응답서버는 상기 음성파일의 경로정보는 음성DB에 저장하며, 음성질의응답DB에 저장된 질문과 답변 문장 텍스트 정보와 음성DB에 저장된 음성파일의 경로정보는 질의응답DB에 삽입되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  18. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 질의응답서버의 음성인식부는 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 문장 텍스트를 텍스트정보로 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  19. 제18항에 있어서,
    상기 상기 질의응답서버의 음성인식부는 음성을 음성파일로 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  20. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 질의응답서버의 자연어처리부는, 상기 음성인식부에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  21. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 질의응답서버의 질의응답모듈은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 기반으로 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  22. 제21항에 있어서,
    상기 질의응답서버의 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템.
  23. 음성으로 질문과 답변문장을 저장하는 방법은,
    사용자 단말기에서 음성으로 질문과 답변을 입력받는 1단계;
    질의응답서버로 음성정보를 전달하는 2단계;
    질의응답서버에서 음성인식하는 3단계;
    음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계;
    음성인식한 음성을 질문과 답변 음성파일로 저장하는 5단계;
    음성인식한 문장을 질문과 답변 문장으로 저장하는 6단계; 및
    상기 질문과 답변 문장, 질문과 답변 음성파일을 인덱싱하는 7단계를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  24. 제23항에 있어서,
    상기 사용자 단말기에서 음성으로 질문과 답변을 입력 받는 절차는,
    질문 입력부와 답변 입력부를 제공하고, 사용자에게 상기 질문 입력부를 제공하여 질문을 음성으로 입력받으면, 질문음성을 데이터 형태로 질의응답서버로 전송하여 음성인식 결과를 회신받아서, 질문음성을 질문텍스트로 표시하고, 질의응답서버는 상기 질문음성과 질문텍스트를 임시 저장하고,
    사용자에게 상기 답변 입력부를 제공하여 답변을 음성으로 입력받으면, 답변음성을 데이터 형태로 질의응답서버로 전송하여 음성인식 결과를 회신받아서, 답변음성을 답변텍스트로 표시하고, 질의응답서버는 상기 답변음성과 답변텍스트를 임시 저장하고,
    상기 사용자단말기로부터 질문과 답변의 음성입력이 완료되면, 질의 응답서버는 임시 저장된 상기 입력 텍스트와 답변텍스트 정보, 상기 입력 텍스트의 음성정보와 상기 답변 텍스트의 음성정보를 인덱싱하여, 특정 키워드가 발생한 질문문장과 답변문장의 위치정보, 상기 질문문장과 답변문장의 음성파일 경로정보를 DB에 저장하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  25. 제23항에 있어서,
    상기 질의응답서버에서 음성인식하고 저장할 때에는,
    질문입력음성과 답변입력음성을 각각 전달받아서 음성을 질문문장과 답변문장으로 변환하여 DB에 저장하고, 질문입력음성과 답변입력음성을 각각 음성파일로 저장하며, 형태소 분석 과정을 거쳐서 키워드별로 인덱싱하여, 상기 키워드별 상기 키워드가 나타난 질문문장과 답변문장의 위치정보, 상기 질문문장과 답변문장의 음성파일 경로정보를 기록하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  26. 음성으로 질의응답 대화하는 방법은
    사용자 단말기에서 음성으로 질문을 입력받는 1단계;
    질의응답서버로 음성정보를 전달하는 2단계;
    질의응답서버에서 음성인식하는 3단계;
    상기 음성인식 후 발생한 문장정보로 질의응답처리하는 4단계;
    상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트 형태로 사용자 단말기로 전송하는 5단계; 및
    사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  27. 제26항에 있어서,
    상기 사용자 단말기에서 음성으로 질문을 입력받는 1단계는,
    사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장과 답변음성을 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장을 표시하고, 답변음성을 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  28. 제26항에 있어서,
    상기 사용자 단말기에서 음성으로 질문을 입력받는 1단계는,
    별도의 음성입력장치가 단말기 외부에 부착되거나 내장된 음성입력장치를 이용하여 사용자의 질문 음성을 실시간으로 입력받는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  29. 제26항에 있어서,
    음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  30. 제26항에 있어서,
    상기 질의응답서버로 음성정보를 전달하는 2단계는,
    음성 정보에서 잡음을 필터링하고 증폭하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  31. 제26항에 있어서,
    상기 질의응답서버에서 음성인식하는 3단계는,
    음성인식 알고리즘에 의해 음성을 인식해서 텍스트로 변환하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  32. 제26항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    음성에서 텍스트로 변환된 질문정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  33. 제26항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    상기 질의응답서버의 질의응답모듈은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 기반으로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  34. 제26항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    상기 질의응답서버의 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  35. 제26항에 있어서,
    상기 질의응답에 의해서 추출되거나 생성된 답변을 음성과 텍스트 형태로 사용자 단말기로 전송하는 5단계는,
    기존 답변문장에서 추출한 답변은 해당 답변문장과 해당 답변문장의 음성파일이 사용자 단말기로 전송되고, 생성된 답변은 답변문장이 사용자 단말기로 전송되어서, 사용자 단말기의 TTS 엔진이 답변문장을 음성출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  36. 제26항에 있어서,
    상기 사용자단말기에서 답변음성과 텍스트를 출력하는 6단계는,
    질의응답DB를 통해서 기존 답변문장이 추출되었을 경우에는, 상기 기존 답변문장을 음성파일을 통해서 음성을 출력하고 텍스트로 표시하며,
    질의응답 DB를 통해서 새로운 답변문장이 생성되었을 경우에는, 해당 답변문장을 TTS를 통해서 음성을 출력하고 해당 답변문장을 텍스트로 표시하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  37. 제26항에 있어서,
    상기 1단계 후에,
    음성인식한 결과를 사용자 단말기로 전송해서 정확하게 입력되었는지 확인받는 단계를 더 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  38. 음성으로 질문과 답변문장을 저장하는 방법은,
    사용자 단말기에서 음성으로 질문과 답변을 입력받는 1단계;
    질의응답서버로 음성정보를 전달하는 2단계;
    질의응답서버에서 음성인식하는 3단계;
    음성인식한 결과를 사용자 단말기로 전송해서 확인받는 4단계;
    음성인식한 문장을 질문과 답변 문장으로 저장하는 5단계; 및
    상기 질문과 답변 문장을 인덱싱하는 6단계를 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  39. 제38항에 있어서,
    상기 사용자 단말기에서 음성으로 질문을 입력 받는 1단계는,
    사용자의 음성을 감지해서 질의응답서버로 전송하여 음성인식된 결과를 회신받아 사용자 단말기의 질문입력창에 표시하고, 상기 질문에 대한 답변문장을 질의응답서버에서 사용자 단말기로 전송하여, 사용자 단말기의 답변입력창에 답변문장을 표시하고, 답변음성을 TTS로 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  40. 제38항에 있어서,
    상기 사용자 단말기에서 음성으로 질문을 입력 받는 1단계는,
    별도의 음성입력장치가 단말기 외부에 부착되거나 내장된 음성입력장치를 이용하여 사용자의 질문 음성을 실시간으로 입력받는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  41. 제38항에 있어서,
    음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  42. 제38항에 있어서,
    상기 질의응답서버로 음성정보를 전달하는 2단계는,
    음성 정보에서 잡음을 필터링하고 증폭하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  43. 제38항에 있어서,
    상기 질의응답서버에서 음성인식하는 3단계는,
    음성인식 알고리즘에 의해 음성을 인식해서 텍스트로 변환하는 것을 특징으로 하는 유무선 통신 네트워크와 TTS를 이용한 음성인식 질의응답 시스템의 운용방법.
  44. 제38항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    음성에서 텍스트로 변환된 질문정보를 기반으로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  45. 제38항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    상기 질의응답서버의 질의응답모듈은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 기반으로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  46. 제38항에 있어서,
    상기 음성인식 후 발생한 텍스트로 질의응답처리하는 4단계는,
    상기 질의응답서버의 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  47. 제38항에 있어서,
    상기 질의응답에 의해서 추출되거나 생성된 답변을 텍스트 형태로 사용자 단말기로 전송하는 5단계는,
    기존 답변문장에서 추출한 답변은 해당 답변 문장이 사용자 단말기로 전송되고, 생성된 답변은 답변 문장이 사용자 단말기로 전송되어서, 사용자 단말기의 TTS 엔진이 답변문장을 음성 출력하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  48. 제38항에 있어서,
    사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계는,
    질의응답서버의 질의응답에 의해서 추출되거나 생성된 답변문장을 전달받아서, TTS를 통해서 음성을 출력하고 해당 답변 문장을 텍스트로 표시하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  49. 제38항에 있어서,
    상기 사용자단말기에서 답변 음성과 텍스트를 출력하는 6단계는,
    질의응답서버의 질의응답에 의해서 추출되거나 생성된 답변문장 전달받아서, TTS를 통해서 음성을 출력할 때에는, 목소리 종류별, 나이별, 성별로 다양한 TTS목소리를 사용자가 선택할 수 있도록 제공하는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
  50. 제38항에 있어서,
    상기 1단계 후에,
    음성인식한 결과를 사용자 단말기로 전송해서 정확하게 입력되었는지 확인받는 단계를 더 포함하여 구성되는 것을 특징으로 하는 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템의 운용방법.
KR1020130030762A 2012-03-22 2013-03-22 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 KR20130108173A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20120029609 2012-03-22
KR1020120029609 2012-03-22
KR20120030282 2012-03-26
KR1020120030282 2012-03-26

Publications (1)

Publication Number Publication Date
KR20130108173A true KR20130108173A (ko) 2013-10-02

Family

ID=49631217

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130030762A KR20130108173A (ko) 2012-03-22 2013-03-22 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법

Country Status (1)

Country Link
KR (1) KR20130108173A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106610810A (zh) * 2016-12-06 2017-05-03 深圳市全智达科技有限公司 一种语音输入方法及装置
KR20190036463A (ko) * 2017-09-27 2019-04-04 한국전자통신연구원 MPEG IoMT 환경에서의 질의응답 시스템 및 방법
CN109582763A (zh) * 2017-09-27 2019-04-05 韩国电子通信研究院 运动图像专家组媒体物联网环境中的答疑系统及方法
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
CN112307156A (zh) * 2019-07-26 2021-02-02 北京宝捷拿科技发展有限公司 一种跨语种的智能辅助边检方法及系统
KR20220168074A (ko) * 2021-06-15 2022-12-22 엔디에스솔루션 주식회사 정보 제공 시스템 및 그 동작 방법
CN116385216A (zh) * 2023-04-11 2023-07-04 南北联合信息科技有限公司 一种结合口语化描述与问答的智能民事案件预测系统
WO2023163265A1 (ko) * 2022-02-24 2023-08-31 미디어젠 주식회사 Ai 기반의 질의 응답 챗봇을 이용한 언어 학습 시스템

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106610810A (zh) * 2016-12-06 2017-05-03 深圳市全智达科技有限公司 一种语音输入方法及装置
KR20190036463A (ko) * 2017-09-27 2019-04-04 한국전자통신연구원 MPEG IoMT 환경에서의 질의응답 시스템 및 방법
CN109582763A (zh) * 2017-09-27 2019-04-05 韩国电子通信研究院 运动图像专家组媒体物联网环境中的答疑系统及方法
CN109582763B (zh) * 2017-09-27 2023-08-22 韩国电子通信研究院 运动图像专家组媒体物联网环境中的答疑系统及方法
CN112307156A (zh) * 2019-07-26 2021-02-02 北京宝捷拿科技发展有限公司 一种跨语种的智能辅助边检方法及系统
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
KR20220168074A (ko) * 2021-06-15 2022-12-22 엔디에스솔루션 주식회사 정보 제공 시스템 및 그 동작 방법
WO2023163265A1 (ko) * 2022-02-24 2023-08-31 미디어젠 주식회사 Ai 기반의 질의 응답 챗봇을 이용한 언어 학습 시스템
CN116385216A (zh) * 2023-04-11 2023-07-04 南北联合信息科技有限公司 一种结合口语化描述与问答的智能民事案件预测系统

Similar Documents

Publication Publication Date Title
CN107895578B (zh) 语音交互方法和装置
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
US20190088262A1 (en) Method and apparatus for pushing information
KR101775559B1 (ko) 디스플레이 장치를 이용한 가상 상담 시스템 및 방법
KR101689290B1 (ko) 대화에서 정보를 추출하는 장치
US20200012724A1 (en) Bidirectional speech translation system, bidirectional speech translation method and program
JP5857090B2 (ja) 情報検索装置、情報検索プログラム、及び情報検索システム
WO2016194740A1 (ja) 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法
US10706845B1 (en) Communicating announcements
CN107844470B (zh) 一种语音数据处理方法及其设备
KR20160081995A (ko) 상태-종속 쿼리 응답
KR20130086971A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
KR20140123369A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
CN106713111B (zh) 一种添加好友的处理方法、终端及服务器
US20200211560A1 (en) Data Processing Device and Method for Performing Speech-Based Human Machine Interaction
CN113327609A (zh) 用于语音识别的方法和装置
WO2015102082A1 (ja) ユーザのデータ入力に応じて情報提供を行うための端末装置、プログラム、およびサーバ装置
WO2017208518A1 (ja) 情報処理装置
US20200026742A1 (en) Integrating communications into a social graph
US20180288109A1 (en) Conference support system, conference support method, program for conference support apparatus, and program for terminal
CN110998719A (zh) 信息处理设备和信息处理方法
JP6625772B2 (ja) 検索方法及びそれを用いた電子機器
EP3475720A1 (en) Audio augmented reality system
KR20130116128A (ko) 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법
KR20140123370A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application