KR102220894B1 - 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템 - Google Patents

통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템 Download PDF

Info

Publication number
KR102220894B1
KR102220894B1 KR1020190120434A KR20190120434A KR102220894B1 KR 102220894 B1 KR102220894 B1 KR 102220894B1 KR 1020190120434 A KR1020190120434 A KR 1020190120434A KR 20190120434 A KR20190120434 A KR 20190120434A KR 102220894 B1 KR102220894 B1 KR 102220894B1
Authority
KR
South Korea
Prior art keywords
query
data
database
answer
content
Prior art date
Application number
KR1020190120434A
Other languages
English (en)
Other versions
KR20200057611A (ko
Inventor
김영호
홍은영
Original Assignee
지의소프트 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지의소프트 주식회사 filed Critical 지의소프트 주식회사
Priority to KR1020190120434A priority Critical patent/KR102220894B1/ko
Publication of KR20200057611A publication Critical patent/KR20200057611A/ko
Application granted granted Critical
Publication of KR102220894B1 publication Critical patent/KR102220894B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 질의 답변 시스템에 관한 것으로 단말기, 송수신부, 분석부, 데이터베이스를 포함하는 질의 답변 시스템에 있어서, 상기 단말기는 사용자가 질의 내용을 입력할 수 있는 입력부와 상기 사용자의 질의 내용에 대한 답변을 확인할 수 있는 출력부를 포함하고, 상기 단말기로부터 질의 내용을 수신하고, 수신한 질의 내용에 대한 답변을 단말기로 송신하는 송수신부와 상기 질의를 하고자하는 질의 형식 데이터가 저장되어 있고, 적어도 하나의 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 저장하는 데이터베이스와 상기 분석부는 송수신부를 통해 단말기로부터 제공받은 질의 내용을 텍스트 데이터로 변환하는 텍스트 변환모듈과 상기 텍스트로 변환 및 저장되는 질의 내용 데이터를 명사 위주의 형태소 분해하여 키워드만 추출하는 키워드 추출모듈과 상기 추출된 키워드를 데이터 분석형 코드로 변환하는 코드변환모듈과 상기 변환된 데이터 분석형 코드를 데이터베이스에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 판단모듈 및 상기 판단모듈을 통해 매칭된 질의 내용에 대한 답변 데이터를 송신하는 답변생성모듈을 포함한다.

Description

통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템{a communication typed question and answer system with data supplying in statistic database}
본 발명은 통계 데이터베이스의 데이터와 그 구조 (스키마)를 수집하여 자연어 질의를 통해 질의에 해당하는 통계값을 제시할 수 있는 질의 답변 시스템에 관한 것으로서, 더욱 구체적으로는 키워드 추출모듈을 통하여 텍스트 변환모듈을 통해 저장된 질의 내용 데이터를 질의 내용과 질의 어구를 분해하여 질의 어구를 삭제하고 질의 어구가 삭제된 질의 내용을 명사 위주로 형태소를 분해하며, 조사 등은 제거하여 적어도 하나 이상의 핵심 키워드를 추출하도록 하는 것을 부가한 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템에 관한 것이다.
종래의 정보 검색 방법은 키워드 패턴 매칭 방식의 검색에 국한하고 형태적 동일성에 의존하여 검색 키위드와 모양이 같은 형태가 들어있는 모든 자료를 검색하여 제공한다.
이러한 정보 검색 방법은 키워드 패턴 매칭에 의한 과다한 검색 결과로 인하여 원하는 내용을 일일이 찾아야 하는 수고를 피할 수 없었다.
종래의 정보 검색 방법은 키워드 패턴 매칭 방식의 검색에 국한하고 형태적 동일 성에 의존하여 검색 키워드와 모양이 같은 형태가 들어있는 모든 자료를 검색하여 제공한다.
이러한 정보 검색 방법은 키워드 패턴 매칭에 의한 과다한 검색 결과로 인하여 원하는 내용을 일일이 찾아야 하는 수고를 피할 수 없다.
형태적 동일 여부에 의존하는 방식은 예를 들어, "트와이스는 인원수는?"이라는 질의에 "트와이스"와 "인원수"가 포함된 많은 자료를 나열식으로 보여주는 것에 불과할 뿐 "9명"이라는 정확한 답을 제공할 수 없었다.
또한, 종래의 정보 검색 방법은 예를 들어 "맛있는 배"의 검색 결과에 "타는 배", "신체 부위 배", "갑절 배" 등 잉여 정보를 끝없이 찾아 검색 결과로 제공한다. 따라서, 정보를 검색하는 이용자는 과다한 검색 결과로 인하여 자신이 원하는 정보를 신속하게 검색할 수 없는 문제점이 있었다.
대한민국 등록특허공보 제10-1832816호 대한민국 공개특허공보 제10-2017-0129352호 대한민국 공개특허공보 제10-2018-0086801호
본 발명은 상술한 바와 같은 문제점을 해결하기 위하여 안출한 것으로서 정보를 검색하는 이용자는 과다한 검색 결과로 인하여 자신이 원하는 정보를 신속하게 검색할 수 없는 문제점이 있었는바 본 발명은 이를 완전하게 해결하는 사용자의 질의에 대한 답변을 생성하기 위한 장치 또는 시스템을 제공하고자 한다.
또한 본 발명은 통계 관련 데이터베이스의 구조인 스키마의 컬럼과 데이터인 레코드 value를 구조체로 데이터를 수집하고, 사용자가 자연어 - 문장으로 질의하였을 때 수집한 데이터를 활용하여 통계 정보를 빠르게 전달 할 수 있는 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템을 제공하고자 한다.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 질의 답변 시스템에 따르면, 단말기, 송수신부, 분석부, 데이터베이스를 포함하는 질의 답변 시스템에 있어서, 상기 단말기는 사용자가 질의 내용을 입력할 수 있는 입력부와 상기 사용자의 질의 내용에 대한 답변을 확인할 수 있는 출력부를 포함하고, 상기 단말기로부터 질의 내용을 수신하고, 수신한 질의 내용에 대한 답변을 단말기로 송신하는 송수신부와 상기 질의를 하고자하는 질의 형식 데이터가 저장되어 있고, 적어도 하나의 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 저장하는 데이터베이스와 상기 분석부는 송수신부를 통해 단말기로부터 제공받은 질의 내용을 텍스트 데이터로 변환하는 텍스트 변환모듈과 상기 텍스트로 변환 및 저장되는 질의 내용 데이터를 명사 위주의 형태소 분해하여 키워드만 추출하는 키워드 추출모듈과 상기 추출된 키워드를 데이터 분석형 코드로 변환하는 코드변환모듈과 상기 변환된 데이터 분석형 코드를 데이터베이스에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 판단모듈 및 상기 판단모듈을 통해 매칭된 질의 내용에 대한 답변 데이터를 송신하는 답변생성모듈을 포함한다.
상기 키워드 추출모듈은 텍스트 변환모듈을 통해 저장된 질의 내용 데이터를 질의 내용과 질의 어구를 분해하여 질의 어구를 삭제하고 질의 어구가 삭제된 질의 내용을 명사 위주로 형태소를 분해하며, 조사 등은 제거하여 적어도 하나 이상의 핵심 키워드를 추출하도록 한다.
상기 코드변환모듈은 키워드 추출모듈에서 추출된 핵심 키워드를 데이터 분석형 코드로 변환하도록 하되, 상기 코드는 질의 내용의 핵심 키워드를 자음과 모음으로 분류하고 자음과 모음에 대한 각각의 코드 번호를 부여하여 나열된 모음과 자음을 부여되는 코드 번호로 변환하며, 받침에 따른 코드는 자음이 이중으로 사용되는 것으로 판단하여 해당 받침으로 쓰이는 자음을 분류하여 해당 두개의 알파벳 대문자로 이루어지는 코드로 변환이 되어 데이터베이스에 저장된다.
또한, 상기 데이터베이스에 저장되는 질의 형식 데이터는 사용자의 질의 내용 데이터와 매칭하여 질의 답변을 생성하기 위하여 질의어 매칭 컬럼과 답변 컬럼 Value를 구분하여 데이터 테이블로 변환하는 질의 매칭 데이터 변환부를 더 포함하여 형성한다.
본 발명은 단말기, 송수신부, 분석부, 데이터베이스를 포함하는 질의 답변 시스템에 있어서,
상기 단말기는 사용자가 질의 내용을 입력할 수 있는 입력부와;
상기 사용자의 질의 내용에 대한 답변을 확인할 수 있는 출력부;를 포함하고,
상기 단말기로부터 질의 내용을 수신하고, 수신한 질의 내용에 대한 답변을 단말기로 송신하는 송수신부와;
상기 질의를 하고자하는 질의 형식 데이터가 저장되어 있고, 적어도 하나의 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 저장하는 데이터베이스와;
상기 분석부는 송수신부를 통해 단말기로부터 제공받은 질의 내용을 텍스트 데이터로 변환하는 텍스트 변환모듈과;
상기 텍스트로 변환 및 저장되는 질의 내용 데이터를 명사 위주의 형태소 분해하여 키워드만 추출하는 키워드 추출모듈과;
상기 추출된 키워드를 데이터 분석형 코드로 변환하는 코드변환모듈과;
변환된 데이터 분석형 코드를 데이터베이스에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 판단모듈; 및 상기 판단모듈을 통해 매칭된 질의 내용에 대한 답변 데이터를 송신하는 답변생성모듈을 포함하는 것을 특징으로 하는 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템을 제공한다.
또한 본 발명은 상기 키워드 추출모듈은 텍스트 변환모듈을 통해 저장된 질의 내용 데이터를 질의 내용과 질의 어구를 분해하여 질의 어구를 삭제하고 질의 어구가 삭제된 질의 내용을 명사 위주로 형태소를 분해하며, 조사 등은 제거하여 적어도 하나 이상의 핵심 키워드를 추출하도록 하는 것을 특징으로 하는 질의 답변 시스템을 제공한다.
또한 본 발명은 상기 코드변환모듈은 키워드 추출모듈에서 추출된 핵심 키워드를 데이터 분석형 코드로 변환하도록 하되,
상기 코드는 질의 내용의 핵심 키워드를 자음과 모음으로 분류하고 자음과 모음에 대한 각각의 코드 번호를 부여하여 나열된 모음과 자음을 부여되는 코드 번호로 변환하며, 받침에 따른 코드는 자음이 이중으로 사용되는 것으로 판단하여 해당 받침으로 쓰이는 자음을 분류하여 해당 두개의 알파벳 대문자로 이루어지는 코드로 변환이 되어 데이터베이스에 저장되는 것을 특징으로 하는 질의 답변 시스템을 제공한다.
또한 본 발명은 상기 데이터베이스에 저장되는 질의 형식 데이터는 사용자의 질의 내용 데이터와 매칭하여 질의 답변을 생성하기 위하여 질의어 매칭 컬럼과 답변 컬럼 Value를 구분하여 데이터 테이블로 변환하는 질의 매칭 데이터 변환부를 더 포함하여 형성될 수 있는 것을 특징으로 하는 질의 답변 시스템을 제공한다.
또한 본 발명은 상기 텍스트 변환모듈(310)은 사용자가 입력장치를 통해 텍스트로 질의 내용을 입력 및 저장될 수 있고, 질의 내용이 음성으로 인식되면 음성 및 음성에 대응되는 텍스트들을 통해 학습되는 기계 학습 기반의 음성 인식 모델을 이용하여 텍스트로 변환할 수 있는 것을 특징으로 하는 질의 답변 시스템을 제공한다.
또한 본 발명은 상기 텍스트 변환모듈은 숫자에 대한 텍스트 또는 음성 데이터를 제공받을 때 숫자는 텍스트 입력시 로마숫자로 저장되도록 하되,
상기 로마숫자로 저장된 숫자데이터는 한글 표기법으로 변환되도록 하는 숫자 변환 모델을 더 포함하며, 음성으로 인식한 숫자 데이터는 사용자의 음성 인식에 따라 한글로 표기하도록 저장될 수 있도록 하는 것을 특징으로 하는 질의 답변 시스템을 제공한다.
본 발명에 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템은 시스템이 보유하고 있는 통계 데이터베이스의 정보를 손쉽게 구조체 데이터로 변환하여 사용자가 자연어 질의를 통해 요청하는 통계 정보에 대하여 통계값을 신속하게 제공할 수 있어, 기존의 1차 키워드 검색 후 사용자가 스스로 다시 통계값을 찾아가는 불편함을 없앨 수 있는 이점이 있다.
또한 본 발명의 효과는, 사용자의 질의에 대한 답변을 생성하기 위한 장치를 제공할 수 있다.
또한, 사용자의 질의에 대해 실시간으로 답변을 생성하여 제공할 수 있다.
도 1은 본 발명의 바람직한 실시예에 따른 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템의 구성을 도시한 구성도이다.
도 2는 본 발명의 바람직한 실시예에 따른 질의 답변 시스템의 코드를 도시한 표이다.
도 3은 본 발명의 바람직한 실시예에 따른 질의 답변 시스템의 질의 형식 데이터를 도시한 표이다.
도 3b는 본 발명의 실시예에 따른 통계 데이터베이스의 데이터를 대화형 데이터로 변환하여 구조체 데어터로 저장하는 것을 보여주는 도면이다.
도 3c는 도 3b에서 저장해놓은 구조체 데이터를 바탕으로 사용자의 질의에 구조체를 검색하고 결과를 제시하는 것을 보여주는 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 본 발명의 실시예들에 의하여 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템을 설명하기 위한 도면들을 참고하여 본 발명에 대해 설명하도록 한다.
상기한 데이터베이스는 통상의 데이터베이스 및 각종 통계 데이터베이스를 포함하는 개념이다.
도 1은 본 발명의 바람직한 실시예에 따른 질의 답변 시스템의 구성을 도시한 구성도이고 도 2는 본 발명의 바람직한 실시예에 따른 질의 답변 시스템의 코드를 도시한 표이며 도 3은 본 발명의 바람직한 실시예에 따른 질의 답변 시스템의 질의 형식 데이터를 도시한 표이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 질의 답변 시스템은 단말기(100), 송수신부(200), 분석부(300), 데이터베이스(400)를 포함한다.
상기 단말기(100)는 사용자가 질의 내용을 입력할 수 있는 입력부(110)와 사용자의 질의 내용에 대한 답변을 확인할 수 있는 출력부(120)를 포함한다.
상기 입력부(110)는 사용자의 질의 내용을 입력하여 입력 받은 질의 내용을 송수신부(200)를 통해 분석부(300)로 송신이 가능한 것이다.
또한, 상기 입력부(110)에 사용자가 입력하는 질의 내용은 음성 또는 텍스트로 입력받을 수 있는 것이다.
상기 출력부(120)는 사용자의 질의 내용에 대한 답변을 분석부(300)로부터 송수신부(200)로 수신이 가능한 것이다.
또한, 상기 출력부(120)에 질의 내용에 대한 답변은 음성 또는 텍스트로 출력될 수 있는 것이다.
한편, 사용자 단말기(100)는 예를 들어, 데스크톱 PC, 랩톱 PC, 태블릿 PC, 스마트폰, PDA(Personal Digital Assistant) 등과 같이 유무선 네트워크를 통한 데이터 통신 기능 및 정보 처리 기능을 구비한 다양한 형태의 장치를 포함할 수 있는 것이 바람직하다.
상기 송수신부(200)는 단말기(100)로부터 질의 내용을 수신하고, 수신한 질의 내용에 대한 답변을 단말기(100)로 송신한다.
구체적으로, 사용자가 단말기(100)를 통해 입력한 질의 내용을 분석부(300)로 제공하고, 분석부(300)를 통해 질의 내용에 대한 답변을 수신하여 단말기(100)를 통해 디스플레이 화면 상에 표시하기 위한 애플리케이션이 설치될 수 있다.
상기 데이터베이스(400)는 질의를 하고자하는 질의 형식 데이터가 저장되어 있고, 적어도 하나의 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 저장한다.
이때, 데이터베이스(400)는 예를 들어, 단말기(100)의 내부 또는 외부에 존재하는 하드디스크드라이브, ROM(Read Only Memory), RAM(Random Access Memory), 메모리카드 등일 수 있다. 또한, 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 텍스트 형태 및 코드 데이터로 저장될 수 있다.
상기 분석부(300)는 송수신부(200)를 통해 단말기(100)로부터 제공받은 질의 내용을 텍스트 데이터로 변환하는 텍스트 변환모듈(310)과, 텍스트로 변환 및 저장되는 질의 내용 데이터를 명사 위주의 형태소 분해하여 키워드만 추출하는 키워드 추출모듈(320)과, 상기 추출된 키워드를 데이터 분석형 코드로 변환하는 코드변환모듈(330)과; 변환된 데이터 분석형 코드를 데이터베이스(400)에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 판단모듈(340) 및 상기 판단모듈을 통해 매칭된 질의 내용에 대한 답변 데이터를 송신하는 답변생성모듈(350)을 포함한다.
상기 텍스트 변환모듈(310)은 송수신부(200)를 통해 단말기(100)로부터 제공받은 질의 내용을 텍스트 데이터로 변환하여 저장될 수 있다.
상기 텍스트 변환모듈(310)은 사용자가 입력장치를 사용하여 타이핑을 통해 텍스트로 질의 내용을 입력할 수 있는 것이다.
또는 음성 인식 모델을 이용하여 질의 내용이 음성으로 인식되면 텍스트로 변환할 수 있다.
이때, 음성 인식 모델은 음성 및 음성에 대응되는 텍스트들을 통해 학습되는 기계 학습 기반의 음성 인식 모델일 수 있다.
또한, 텍스트 변환모듈(310)은 사용자의 단말기(100)를 통해 제공받은 질의 내용이 음성일 경우는 음성 인식 모델을 통해 텍스트로 1차 변환하는 것이다.
단말기(100)를 통해 제공받은 질의 내용이 음성일 경우나 텍스트일 경우 텍스트 변환모듈(310)을 통해 질의 내용이 텍스트로 저장이 되는 것이다.
본 발명의 음성 인식 모델은 입력 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 추출된 음소별 특징벡터를 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 기능을 수행하는 것을 특징으로 한다.
본 발명의 음성 인식 모델은 상기한 텍스트 변환모듈(310)에 부가된 음성 인식 모듈(미도시)에서 수행하게 되며,
본 발명에 따른 음성인식 방법은, 사용자가 입력한 음성에 의해 생성된 각 음소별 특징벡터의 기준 모델을 생성하여 저장하는 단계와; 음성을 입력받는 단계와; 상기 입력된 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하는 단계와; 상기 추출된 음소별 특징벡터를 저장된 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성을 인식하는 단계;를 포함함을 특징으로 한다.
또한 본 발명의 음소 모델링 방법은 사용자가 발음하는 문자에 대한 음성을 최소 단위인 음소로 구분하고 각 음소별 기준 모델을 생성하여 데이터베이스화하는 단계와, 입력되는 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 그 추출된 음소별 특징벡터를 데이터베이스화된 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 단계로 구분할 수 있다.
상술한 방법을 통해 본 발명은 한글 자모 각각에 대한 기준 모델을 생성하여 놓을 수 있기 때문에, 사용자가 표시 문자에 대한 음성을 입력하는 것만으로 각 음소별 기준 모델이 지속적으로 갱신되기 때문에 결과적으로는 음성 인식률을 향상시
킬 수 있는 효과를 누릴 수 있다.
또한, 모든 한글 어휘에 대한 음성인식이 가능함으로서 사용자는 음성 인식을 위해 필요한 음성들을 반복 입력하여야만 하는 불편함으로부터 해방될 수 있는 이점도 있다.
또한 본 발명의 음성 인식 모델은 입력 음성이 외국어 또는 외래어가 혼합되어 입력이 되는 경우 외국어 또는 외래어에 대한 음성 인식을 구분하여 음성 인식 기능을 수행하고 그에 따라 외국어 또는 외래어에 대한 음성 인식에 대한 한국어 번역문을 제시하여 입력 음성이 번역 음성 인식되도록 하는 기능을 수행하는 것을 특징으로 한다.
본 발명의 상기한 외국어 또는 외래어에 대한 음성 인식에 대한 한국어 번역문을 제시하여 입력 음성이 번역 음성 인식되도록 하는 방법은 다음과 같이 수행되게 된다.
먼저 입력 음성에서 '외국어 또는 외래어'를 추출하는 단계를 수행한다.
상기한 입력 음성에서 '외국어 또는 외래어'를 추출하는 과정은 기설정된 한국어 데이터베이스 및 기설정된 '외국어 또는 외래어 데이터베이스'과 대비하여 한국어인지 '외국어 또는 외래어'인지 여부를 판단하여 '외국어 또는 외래어'로 추출되는 단계가 수행된다.
그리고, 상기 추출된 '외국어 또는 외래어'를 기설정된 외국어 데이터베이스에서 원문으로 변환하게 된다.
그리고, 상기 변환된 외국어 또는 외래어에 대한 번역문을 기설정된 번역 데이터베이스에서 선택하는 단계를 수행한 후, 상기 선택된 여러 개의 번역문 중에서 1번째 또는 선택 빈도수가 높은 번역문을 선택하는 단계를 수행한다.
상기 추출된 번역문을 입력 음성의 '외국어 또는 외래어'와 치환하는 단계를 수행하게 된다.
즉, 상기한 외국어 또는 외래어에 대한 음성 인식에 대한 한국어 번역문을 제시하여 입력 음성이 번역 음성 인식되도록 하는 방법에 대한 실시예는 아래와 같다.
즉, 사용자가 "서울의 가방 프라이스는 얼마인가?"라는 음성으로 입력을 했을 경우 "프라이스"가 한국어인지 '외국어 또는외래어'인지 여부는 기설정된 한국어 데이터베이스 및 기설정된 '외국어 또는 외래어 데이터베이스'에서 대비하여 판단하여 '프라이스'가 외국어로 판단되는바 외국어인 "프라이스"가 추출되는 단계를 수행된다.
그리고 추출된 "프라이스"에 대하여 "price"로 원문 변환을 하는 단계를 수행하게 된다.
그리고 상기 원문 변환된 "price"에 대한 기설정된 번역 데이터베이스의 번역문인 "1. 가격, 값, 물가 2. (치러야 할) 대가 3. (상금의) 배당률"을 선택하는 단계를 수행한다.
더불어 상기 선택된 여러 개의 번역문 중에서 1번째 번역문인 "가격"이 선택되어 추출되는 단계가 수행된다.
그리고 "프라이스"는 "프라이스"에 대한 추출된 번역문인 "가격"으로 치환되는 단계가 수행되게 된다.
따라서 "프라이스"는 영어의 "price"로 해당되고 "prcie"는 "가격"으로 번역되어 "서울의 가방 가격은 얼마인가?"라고 번역되어 음성 인식이 되게 된다.
본 발명은 이와 같이 입력 음성이 외국어 또는 외래어가 혼합되어 입력이 되는 경우 외국어 또는 외래어에 대한 음성 인식을 구분하여 음성 인식 기능을 수행하고 그에 따라 외국어 또는 외래어에 대한 음성 인식에 대한 한국어 번역문을 제시하여 입력 음성이 번역 음성 인식되도록 하는 기능을 수행하여, 사용자에 의하여 다양하게 쓰이는 외국어 또는 외래어에 대한 한국어 번역문으로 통일되어 입력하게 함으로써 사용자가 자연어 질의를 통해 요청하는 통계 정보에 대하여 통계값을 신속하게 제공할 수 있는 기술적 특징이 있다.
상기 키워드 추출모듈(320)은 텍스트 변환모듈(310)을 통해 저장된 질의 내용 데이터를 질의 내용과 질의 어구를 분해하여 질의 어구를 삭제하고 질의 어구가 삭제된 질의 내용을 명사 위주로 형태소를 분해하며, 조사 등은 제거하여 적어도 하나 이상의 핵심 키워드를 추출하도록 한다.
예를 들어, "삼척의 남성 인원수가 궁금합니다."라는 질의 내용 데이터가 생성되면, 키워드 추출모듈(320)은 "삼척의 남성 인원수가 궁금합니다."라는 질의 내용 중 "궁금합니다" 질의 어구를 판단하고 삭제한다. "궁금합니다"라는 질의 어구를 삭제하고 남은 질의 내용인 "삼척의 남성 인원수가"를 명사인 "삼척", "남성", "인원수"를 추출하고, "의", "가"인 조사를 제거한다.
이에 핵심 키워드는 "삼척", "남성", "인원수"로 추출되어 지는 것이다.
본 발명은 이와 같이 데이터베이스에서 추출된 질의 내용 데이터에 대한 핵심 키워드가 데이터베이스에 저장하게 되게 된다.
또한 상기한 질의 내용에 대하여 추출된 답변 데이터가 데이터베이스에 저장되게 된다.
이와 같은 데이터 베이스 저장 형식을 대화형 데이터 변환 저장 형식이라고 하고, 이와 같이 저장된 데이터를 구조체 저장 정보(구조체 데이터)라고 한다.
도 3b에서 보는 바와 같이, 통계 데이터 베이스 정보에서 1차로 질의 검색을 하는 질의 내용 데이터가 핵심 키워드로 추출되어 저장되고, 1차로 질의 검색을 하는 내용에 대한 답변 데이터가 검색되어 구조체 저장 정보(구조체 데이터)로 한 짝(a pairing) 또는 한 묶음(a set)으로 매칭되어 저장되게 된다.
아래에서 더 상세히 설명할 바와 같이 이와 같은 구조체 저장 정보(구조체 데이터)는 질의 매칭 데이터 변환부를 통하여 질의어 매칭 컬럼과 답변 컬럼 Value로 한 짝(a pairing) 또는 한 묶음(a set)으로 매칭되어 저장되게 된다.
도 3c는 상기에서 저장해 놓은 구조체 저장 정보를 통하여 사용자의 질의에 구조체 데이터를 검색하여 결과를 제시해주는 것을 나타내준다.
이와 같이 본 발명에 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템은 시스템이 보유하고 있는 통계 데이터베이스의 정보를 손쉽게 구조체 데이터로 변환하여 사용자가 자연어 질의를 통해 요청하는 통계 정보에 대하여 통계값을 신속하게 제공할 수 있어, 기존의 1차 키워드 검색 후 사용자가 스스로 다시 통계 값을 찾아가는 불편함을 없앨 수 있는 이점이 있다.
또한, 상기 코드변환모듈(330)은 키워드 추출모듈(320)에서 추출된 핵심 키워드를 데이터 분석형 코드로 변환하도록 한다.
상기 코드는 질의 내용의 핵심 키워드를 자음과 모음으로 분류하고 자음과 모음에 대한 각각의 코드 번호를 부여하여 나열된 모음과 자음을 부여되는 코드 번호로 변환하는 것이다.
도 2를 참조하여 코드 번호를 설명하면, 자음인 ㄱ, ㄴ, ㄷ, ... ㅆ, ㅉ 은 알파벳 대문자로 A, B, C, ... R, S 로 코드 변환이 가능하고, 모음인 ㅏ, ㅓ, ㅗ, ... ㅞ, ㅢ 는 알파벳 소문자로 a, b, c, ... t, u 로 코드 변환이 가능한 것이다.
또한, 받침에 따른 코는 자음이 이중으로 사용되는 것으로 판단하여 해당 받침으로 쓰이는 자음을 분류하여 해당 두개의 알파벳 대문자로 이루어지는 코드로 변환이 되어 사용하는 것이다.
예를 들면, "앉다"를 코드로 변환하면 "ㅇ", "ㅏ", "ㄴㅈ", "ㄷ", "ㅏ"로 분류되어 코드를 적용하면, "ㅇ=H", "ㅏ=a", "ㄴㅈ=BI", "ㄷ=C", "ㅏ=a"로 "HaBICa"로 변환될 수 있는 것이다.
상기 코드변환모듈(330)이 핵심 키워드를 코드로 변환하는 예를 들면, "삼척", "남성", "인원수"이라는 의 핵심키워드를 자음과 모음으로 분류하고 "ㅅ, ㅏ, ㅁ, ㅊ, ㅓ, ㄱ"과, "ㄴ, ㅏ, ㅁ, ㅅ, ㅓ"과, "ㅇ, ㅣ, ㄴ, ㅇ, ㅝ, ㄴ, ㅅ, ㅜ"로 분류하고 이를 도 2의 코드 표를 통하여 코드 번호를 생성하면, "GaEJbA"과, "BaEGbH"과, "HfBHsBGd"의 코드로 변환될 수 있는 것이다.
이렇게 변환된 코드 데이터들은 데이터베이스(400)에 저장되도록 한다.
또한, 상기 데이터베이스(400)에 저장되어 있는 질의 형식 데이터들도 텍스트 변환모듈(310)로 텍스트 데이터로 변환하고, 키워드 추출모듈(320)로 텍스트로 변환 및 저장되는 질의 형식 데이터를 명사 위주의 형태소를 분해하여 키워드만 추출하며, 코드변환모듈(330)을 통해 추출된 키워드를 데이터 분석형 코드로 변환하여 질의 내용 데이터와 마찬가지로 데이터베이스(400)에 저장되는 것이다.
상기 판단모듈(340)은 변환된 데이터 분석형 코드를 데이터베이스(400)에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 것이다.
구체적으로 도 2와, 도 3을 참고하여 설명하면, "삼척", "남성", "인원수"이라는 의 핵심키워드를 도 2의 코드 표를 통하여 코드 번호를 생성하면, "GaEJbA"과, "BaEGbH"과, "HfBHsBGd"의 코드로 변환하여 데이터 분석형 코드로 지정된다.
도 3의 제공되는 질의 형식 데이터는 사용자의 질의 내용 데이터와 매칭하여 질의 답변을 생성하기 위하여 질의어 매칭 컬럼과 답변 컬럼 Value를 구분하여 데이터 테이블로 변환하는 질의 매칭 데이터 변환부(미도시)를 더 포함하여 형성될 수 있다.
예를 들어 질의 형식 데이터는 다음 표 1와 같다.
항목 전체 남성 여성 남 비율 여 비율
삼척 1,570 702 868 45% 55%
상기 질의 형식 데이터가 생성되면, 질의 매칭 데이터 변환부(미도시)는 질의어 매칭 컬럼과 답변 컬럼 Value를 다음 표 2와 같이 생성된다.
col_list data_value
시도별 성별 인원수 : 삼척 : 전체 1,570
시도별 성별 인원수 : 삼척 : 남성 702
시도별 성별 인원수 : 삼척 : 여성 868
시도별 성별 인원수 : 삼척 : 남 비율 45%
시도별 성별 인원수 : 삼척 : 여 비율 55%
상기 표 2와 같이 질의 매칭 데이터로 변환되면 코드변환모듈(330)을 통해 키워드를 추출하고 질의어 매칭 컬럼 정보는 데이터 분석형 코드로 변환되어 표 3과 같이 생성된다.
col_list data_value
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : IbBJh 1,570
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : BaEGbH 702
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : HlGbH 868
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : BaE FfHnD 45%
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : Hl FfHnD 55%
상기 표 3과 같이 데이터 분석형 코드로 변환되는 데이터는 변환모듈(340)을 통해 질의 내용 데이터인 "GaEJbA"과, "BaEGbH"과, "HfBHsBGd"와 매칭하여 가장 유사 또는 적합한 답변 컬럼 Value의 중 질의 내용과 가장 적합한 매칭 데이터에 대한 답변 데이터를 추출하며 표 4와 같이 추출되는 것이다.
col_list data_value
GfCcFlD GbHFlD HfBHsBGd : GaEJbA : BaEGbH 702
상기 답변생성모듈(350)은 판단모듈(340)을 통해 질의 내용에 대한 가장 유사 또는 적합한 답변 컬럼 Value인 답변 데이터를 송수신부(200)로 송신한다.
"삼척의 남성 인원수가 궁금합니다."의 질의 내용에 대한 답변 데이터로 "702"가 추출되고 답변생성모듈(350)은 이를 송수신부(200)로 전달하고 송수신부(200)는 출력부(120)를 통해 사용자에게 답변 "702"를 제공하도록 한다.
또한, 동일한 것이 다수 개일 경우 최장일치된 1개의 답변 데이터를 제공하며, 유사한 정보는 후보로 제시될 수 있는 것이다.
유사도 산정 기준은 최장일치 1개 이외에 매칭 정확도가 90% 이상으로 나온 후보군이 나열될 수 있으며, 매칭 정확도는 사용자가 설정할 수 있다.
예를 들면, "삼척의 남성 인원수가 궁금합니다."에 대한 답변 데이터가 "702"로 제공되고 유사도에 따라 유사값으로 "2017년 삼척 남성 인원수 : 103명" 또는 "2018년 삼척 남성 인원수 : 200명" 등 유사도 설정값에 따라 더 제공될 수 있는 것이다.
상기 텍스트 변환모듈(310)은 숫자에 대한 텍스트 또는 음성 데이터를 제공받을 때 숫자는 텍스트 입력시 로마숫자로 저장되도록 하고 로마숫자로 저장된 숫자데이터는 한글로 읽혀지는 대로 변환되도록 하는 숫자 변환 모델을 이용하여 로마숫자를 한글 표기법으로 변환시키고 저장되는 것이다.
또한, 음성으로 인식한 숫자 데이터는 사용자의 음성 인식에 따라 한글로 표기하도록 저장 하는 것이 바람직할 것이다.
예를 들어, '2018년 삼척 남성 인원수"에서 "2018"은 텍스트 변환모듈(310)을 통해 "2018"이라는 로마숫자 표기법에서 "이천십팔"이라는 한글 표기법으로 변환 및 저장되도록 하고 키워드 추출모듈(320)로 텍스트로 변환 및 저장되는 질의 형식 데이터를 명사 위주의 형태소를 분해하여 키워드만 추출하며, 코드변환모듈(330)을 통해 추출된 키워드를 데이터 분석형 코드로 변환하여 질의 내용 데이터와 마찬가지로 데이터베이스(400)에 저장되는 것이다.
이와 같이 본 발명은 시스템이 보유하고 있는 통계 데이터베이스의 정보를 손쉽게 구조체 데이터로 변환하여 사용자가 자연어 질의를 통해 요청하는 통계 정보에 대하여 통계 값을 신속하게 제공할 수 있어, 기존의 1차 키워드 검색 후 사용자가 스스로 다시 통계 값을 찾아가는 불편함을 없앨 수 있는 효과가 나타나게 된다.
도 1에 도시된 단말기(100), 입력부(110), 출력부(120), 송수신부(200), 분석부(300), 텍스트 변환모듈(310), 키워드 추출모듈(320), 코드변환모듈(330), 판단모듈(340), 답변생성모듈(350) 및 데이터베이스(400)은 하나 이상의 프로세서 및 그 프로세서와 연결된 컴퓨터 판독 가능 기록 매체를 포함하는 하나 이상의 컴퓨팅 장치 상에서 구현될 수 있다. 컴퓨터 판독 가능 기록 매체는 프로세서의 내부 또는 외부에 있을 수 있고, 잘 알려진 다양한 수단으로 프로세서와 연결될 수 있다. 컴퓨팅 장치 내의 프로세서는 각 컴퓨팅 장치로 하여금 본 명세서에서 기술되는 예시적인 실시예에 따라 동작하도록 할 수 있다. 예를 들어 프로세서는 컴퓨터 판독 가능 기록 매체에 저장된 명령어를 실행할 수 있고, 컴퓨터 판독 가능 기록 매체에 저장된 명령어는 프로세서에 의해 실행되는 경우 컴퓨팅 장치로 하여금 본 명세서에 기술되는 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있는 것이다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. 더불어, 상술하는 과정에서 기술된 구성의 작동순서는 반드시 시계열적인 순서대로 수행될 필요는 없으며, 각 구성 및 단계의 수행 순서가 바뀌어도 본 발명의 요지를 충족한다면 이러한 과정은 본 발명의 권리범위에 속할 수 있음은 물론이다.
100 : 단말기
200 : 송수신부
300 : 분석부
400 : 데이터베이스

Claims (3)

  1. 단말기, 송수신부, 분석부, 데이터베이스를 포함하는 질의 답변 시스템에 있어서,
    상기 단말기는 사용자가 질의 내용을 입력할 수 있는 입력부와;
    상기 사용자의 질의 내용에 대한 답변을 확인할 수 있는 출력부;를 포함하고,
    상기 단말기로부터 질의 내용을 수신하고, 수신한 질의 내용에 대한 답변을 단말기로 송신하는 송수신부와;
    상기 질의를 하고자 하는 질의 형식 데이터가 저장되어 있고, 적어도 하나의 후보 질의들 및 후보 질의들 각각에 대응하는 답변들을 저장하는 데이터베이스와;
    상기 분석부는 송수신부를 통해 단말기로부터 제공받은 질의 내용을 텍스트 데이터로 변환하는 텍스트 변환모듈과;
    상기 텍스트로 변환 및 저장되는 질의 내용 데이터를 명사 위주의 형태소 분해하여 키워드만 추출하는 키워드 추출모듈과;
    상기 추출된 키워드를 데이터 분석형 코드로 변환하는 코드변환모듈을 포함하되;
    상기 코드변환모듈은 키워드 추출모듈에서 추출된 핵심 키워드를 데이터 분석형 코드로 변환하도록 하되,
    상기 코드는 질의 내용의 핵심 키워드를 자음과 모음으로 분류하고 자음과 모음에 대한 각각의 코드 번호를 부여하여 나열된 모음과 자음을 부여되는 코드 번호로 변환하며, 받침에 따른 코드는 자음이 이중으로 사용되는 것으로 판단하여 해당 받침으로 쓰이는 자음을 분류하여 해당 두 개의 알파벳 대문자로 이루어지는 코드로 변환이 되어 데이터베이스에 저장되고,
    상기 데이터베이스에 저장되는 질의 형식 데이터가 사용자의 질의 내용 데이터와 매칭되어 질의 답변으로 생성되기 위하여 질의어 매칭 컬럼과 답변 컬럼 Value로 구분되어 데이터 테이블로 변환되는 질의 매칭 데이터 변환부가 더 포함되어 구성되되,
    상기한 질의 매칭 데이터 변환부는 데이터베이스에서 추출된 질의 내용 데이터에 대한 핵심 키워드가 데이터베이스에 저장되게 하고, 상기한 질의 내용에 대하여 추출된 답변 데이터가 데이터베이스에 저장되게 하는 대화형 데이터 변환 저장 형식 기능을 수행하고,
    상기 변환된 데이터 분석형 코드를 데이터베이스에 저장되어 있는 질의 형식 데이터 코드와 비교 판단하여 해당 질의에 대한 답변을 판단 및 추출하는 판단모듈; 및 상기 판단모듈을 통해 매칭된 질의 내용에 대한 답변 데이터를 송신하는 답변생성모듈을 포함하되,
    상기의 데이터 분석형 코드로 변환되는 데이터는 변환모듈을 통해 질의 내용 데이터와 매칭하여 가장 유사 또는 적합한 답변 컬럼 Value의 중 질의 내용과 가장 적합한 매칭 데이터에 대한 답변 데이터가 추출되며,
    상기한 텍스트 변환모듈에 음성 인식 모델이 부가되되,
    입력 음성에서 '외국어 또는 외래어'를 추출하는 단계,
    상기 추출된 '외국어 또는 외래어'를 기설정된 외국어 데이터베이스에서 원문으로 변환하는 단계,
    상기 원문으로 변환된 외국어 또는 외래어에 대한 번역문을 기설정된 번역 데이터베이스에서 선택하는 단계,
    상기 선택된 여러 개의 번역문 중에서 1번째 또는 선택 빈도수가 높은 번역문을 선택하는 단계,
    상기 추출된 번역문을 입력 음성의 '외국어 또는 외래어'와 치환하는 단계를 수행하여,
    입력 음성이 외국어 또는 외래어가 혼합되어 입력이 되는 경우 외국어 또는 외래어에 대한 음성 인식을 구분하여 음성 인식 기능을 수행하고 그에 따라 외국어 또는 외래어에 대한 음성 인식에 대한 한국어 번역문을 제시하는 것을 특징으로 하는 질의 답변 시스템.
  2. 제 1항에 있어서,
    상기 키워드 추출모듈은 텍스트 변환모듈을 통해 저장된 질의 내용 데이터를 질의 내용과 질의 어구를 분해하여 질의 어구를 삭제하고 질의 어구가 삭제된 질의 내용을 명사 위주로 형태소를 분해하며, 조사 등은 제거하여 적어도 하나 이상의 핵심 키워드를 추출하도록 하는 것을 특징으로 하는 질의 답변 시스템.
  3. 제 1항에 있어서,
    상기 입력부는 사용자가 입력하는 질의 내용이 음성 또는 텍스트로 입력받을 수 있는 것을 특징으로 하는 질의 답변 시스템.


KR1020190120434A 2019-09-30 2019-09-30 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템 KR102220894B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190120434A KR102220894B1 (ko) 2019-09-30 2019-09-30 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190120434A KR102220894B1 (ko) 2019-09-30 2019-09-30 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180141511 Division 2018-11-16

Publications (2)

Publication Number Publication Date
KR20200057611A KR20200057611A (ko) 2020-05-26
KR102220894B1 true KR102220894B1 (ko) 2021-02-26

Family

ID=70915398

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190120434A KR102220894B1 (ko) 2019-09-30 2019-09-30 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템

Country Status (1)

Country Link
KR (1) KR102220894B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783398B (zh) * 2020-07-07 2022-10-11 中国人民解放军陆军防化学院 一种装备信息资源编码系统及编码自动生成方法
CN113626569B (zh) * 2021-08-02 2024-05-21 浪潮软件股份有限公司 一种基于政务事项与历史数据的便民办事方法及系统
CN115223722B (zh) * 2022-07-28 2023-03-24 医利捷(上海)信息科技有限公司 一种基于医疗的数据分析系统
CN117407515B (zh) * 2023-12-15 2024-04-30 湖南三湘银行股份有限公司 一种基于人工智能的答题系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100707970B1 (ko) * 2006-03-10 2007-04-16 (주)인피니티 텔레콤 이동통신단말기를 이용한 통역 서비스 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100434688B1 (ko) * 2000-05-25 2004-06-04 주식회사 다이퀘스트 대화형 db, faq리스트, 웹사이트에 대한 통합형 자연어 질의-응답 검색 방법
KR101282419B1 (ko) * 2011-07-22 2013-07-04 진용옥 중간 내부 정음 치환코드를 이용한 다국어 검색 방법
KR20130108173A (ko) * 2012-03-22 2013-10-02 진삼순 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
KR20170129352A (ko) 2016-05-17 2017-11-27 김문성 질의 응답 시스템
KR101832816B1 (ko) 2016-12-12 2018-02-27 동국대학교 산학협력단 질의에 대한 응답 생성 장치 및 방법
KR20180086801A (ko) 2017-01-23 2018-08-01 (주)센솔로지 Rdf 트리플 기반의 문장 의미 정형화 및 문장 생성 방법, 그리고 이를 구현한 문장 생성 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100707970B1 (ko) * 2006-03-10 2007-04-16 (주)인피니티 텔레콤 이동통신단말기를 이용한 통역 서비스 방법

Also Published As

Publication number Publication date
KR20200057611A (ko) 2020-05-26

Similar Documents

Publication Publication Date Title
KR102220894B1 (ko) 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
JP7127150B2 (ja) 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体
CN108287858B (zh) 自然语言的语义提取方法及装置
CN102982021B (zh) 用于消除语言转换中的多个读法的歧义的方法
KR102417045B1 (ko) 명칭을 강인하게 태깅하는 방법 및 시스템
Benajiba et al. Arabic named entity recognition: A feature-driven study
EP4109295A1 (en) Knowledge graph-based question answering method and apparatus, computer device, and medium
CN102663129A (zh) 医疗领域深度问答方法及医学检索系统
JPH0736882A (ja) 辞書検索装置
JP2005157524A (ja) 質問応答システムおよび質問応答処理方法
CN107967250B (zh) 一种信息处理方法及装置
CN107526721B (zh) 一种对电商产品评论词汇的歧义消除方法及装置
CN111414763A (zh) 一种针对手语计算的语义消歧方法、装置、设备及存储装置
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
CN112231537A (zh) 基于深度学习和网络爬虫的智能阅读系统
Nugraha et al. Typographic-based data augmentation to improve a question retrieval in short dialogue system
CN112215014A (zh) 基于用户评论的画像生成方法、装置、介质及设备
Khan et al. A clustering framework for lexical normalization of Roman Urdu
Hirpassa Information extraction system for Amharic text
KR101400548B1 (ko) 문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법
KR102534131B1 (ko) 대화 형식 기반의 도서 추천 서비스 제공 방법 및 그를 위한 장치
Zouidine et al. A comparative study of pre-trained word embeddings for Arabic sentiment analysis
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
Karimi et al. Natural language query and control interface for database using afghan language

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant