KR20160125375A - 지능 문답 구현 방법, 시스템 및 저장 매체 - Google Patents

지능 문답 구현 방법, 시스템 및 저장 매체 Download PDF

Info

Publication number
KR20160125375A
KR20160125375A KR1020167022492A KR20167022492A KR20160125375A KR 20160125375 A KR20160125375 A KR 20160125375A KR 1020167022492 A KR1020167022492 A KR 1020167022492A KR 20167022492 A KR20167022492 A KR 20167022492A KR 20160125375 A KR20160125375 A KR 20160125375A
Authority
KR
South Korea
Prior art keywords
search
answer
candidate
question
result
Prior art date
Application number
KR1020167022492A
Other languages
English (en)
Other versions
KR101895249B1 (ko
Inventor
옌준 마
구어화 리
싱우 선
싱젠 리
웨이멩 장
하오지에 웨이
멩 리아오
밍 종
시즈앙 장
후아 우
하이펑 왕
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20160125375A publication Critical patent/KR20160125375A/ko
Application granted granted Critical
Publication of KR101895249B1 publication Critical patent/KR101895249B1/ko

Links

Images

Classifications

    • G06F17/30539
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • G06F17/30657
    • G06F17/30864
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 따른 실시예는 지능 문답 구현 방법, 시스템 및 저장 매체를 제공한다. 상기 지능 문답 구현 방법은, 조회하고자 하는 문제를 수신하는 단계; 상기 문제에 대해 어의적 분석을 진행하는 단계; 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계; 및 검색 처리 결과에 근거하여 답안을 회송하는 단계를 포함하되, 상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함함으로써, 문제를 회답하는 정확도를 효과적으로 향상시킨다.

Description

지능 문답 구현 방법, 시스템 및 저장 매체 {METHOD, SYSTEM AND STORAGE MEDIUM FOR REALIZING INTELLIGENT ANSWERING OF QUESTIONS}
본원 발명은 출원번호가 201510017563.6이고, 출원일자가 2015년 1월 14일이며, 출원인이 바이두 온라인 네트워크기술(북경) 유한회사이고, 발명의 명칭이 "지능 문답 구현 방법 및 시스템"인 중국 특허 출원의 우선권을 주장하는 바, 상기 중국 특허 출원의 모든 내용은 참조로서 본원 발명에 원용된다.
본 발명에 따른 실시예들은 정보 조회 기술분야에 관한 것으로, 특히 지능 문답 구현 방법, 시스템 및 저장 매체에 관한 것이다.
지능 문답 시스템은 대량의 인터넷 데이터에 대한 추리 및 언어에 대한 심도적 어의적 이해를 기반으로 하는 지능 시스템이다. 지능 문답 시스템은 지식 유형의 문제를 회답할 수 있을 뿐만 아니라, 의료, 교육, 생활 및 과학기술 등 사람들의 생활과 밀접히 관련되는 각종 분야에 사용될 수도 있어, 사람들이 정보를 획득하는 효율을 대폭 향상시킨다.
기존의 지능 문답 시스템은 주로 커뮤니티(community)를 기반으로 하는 문답으로서, 기록된 사용자 문제와 회답 데이터에 대해 마이닝을 진행하여 사용자 문제와 회답 웹사이트 중에 이미 존재하는 문제 사이의 유사도를 산출하고, 유사도가 높은 사용자 회답을 회송한다.
상기 지능 문답 시스템에는, 문답 웹사이트의 지능 문답 시스템에 의존하여 문제에 대한 커버율이 낮아 중저 빈도 및 비인기 문제에 대한 사용자의 요구를 만족시킬 수 없고, 회답 수준이 참치부제하여 제시되는 답안의 정확성이 저하되는 결함들이 존재한다.
본 발명에 따른 실시예는 지능 문답 구현 방법, 시스템 및 저장 매체를 제공하여 문제를 회답하는 정확도를 향상시킨다.
제1양태에 있어서, 본 발명의 실시예는 지능 문답 구현 방법을 제공하며, 상기 지능 문답 구현 방법은,
조회하고자 하는 문제를 수신하는 단계;
상기 문제에 대해 어의적 분석을 진행하는 단계;
상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계; 및
검색 처리 결과에 근거하여 답안을 회송하는 단계를 포함하되, 상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함한다.
제2양태에 있어서, 본 발명의 실시예는 지능 문답 구현 시스템을 제공하며, 상기 지능 문답 구현 시스템은,
조회하고자 하는 문제를 수신하도록 구성된 중앙 제어 시스템;
상기 문제에 대해 어의적 분석을 진행하도록 구성된 문제 분석 시스템; 및
어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템을 포함하는 후단 시스템을 포함하되,
상기 중앙 제어 시스템은 상기 어의적 분석의 결과에 근거하여 상기 문제를 상응한 후단 시스템으로 배포하여 상응한 검색 처리를 진행하도록 더 구성되고,
상기 중앙 제어 시스템은 검색 처리 결과에 근거하여 답안을 회송하도록 더 구성된다.
제3양태에 있어서, 본 발명의 실시예는 비휘발성 컴퓨터 저장 매체를 제공하며, 상기 비휘발성 컴퓨터 저장 매체는 하나 또는 복수 개의 모듈이 저장하고, 상기 하나 또는 복수 개의 모듈이 지능 문답 구현 방법을 실행하는 기기에 의해 실행될 경우, 상기 기기로 하여금,
조회하고자 하는 문제를 수신하고,
상기 문제에 대해 어의적 분석을 진행하고,
상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고,
검색 처리 결과에 근거하여 답안을 회송하도록 하되, 상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함한다.
본 발명의 실시예가 제공하는 지능 문답 구현 방법, 시스템 및 저장 매체에 의하면, 조회하고자 하는 문제에 대해 어의적 분석을 진행하고, 어의적 분석에 근거하여 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 상응한 검색 처리를 진행하여 문제의 답안에 대한 검색 범위를 증가시킴으로써, 한편으로 문제에 대한 회답이 더욱 정확해지도록 하고, 다른 한편으로 문제의 커버면을 증가시키며, 특히 중저 빈도 및 비인기 문제에 관해서도 비교적 정확한 회답을 검색해 낼 수 있어 문제를 회답하는 정확도를 효과적으로 향상시킨다.
본 발명에 따른 실시예 중의 기술적 방안을 더욱 명확하게 설명하기 위하여, 이하 실시예들에 대한 설명 과정에 사용되는 도면들을 개략적으로 설명하기로 한다. 하기 설명 중의 도면은 단지 본 발명의 일부 실시예일 뿐, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 진보성 창출이 없이 이러한 도면을 보정 및 대체할 수도 있음을 자명할 것이다.
도 1a는 본 발명의 실시예의 지능 문답 구현 방법이 적용되는 지능 문답 구현 시스템의 네트워크의 체계구조 개략도이다.
도 1b는 본 발명의 제1 실시예에서 제공하는 지능 문답 구현 방법의 흐름도이다.
도 2a는 본 발명의 제2 실시예에서 제공하는 지능 문답 구현 방법의 흐름도이다.
도 2b는 본 발명의 제2 실시예에서 제공하는 지능 문답 구현 방법 중의 삼항 관계(ternary relation) 베이스를 구축하는 흐름도이다.
도 3은 본 발명의 제3 실시예에서 제공하는 지능 문답 구현 방법 중의 텍스트 베이스 검색 시스템에 의해 문제에 대해 검색 처리를 진행하는 흐름도이다.
도 4는 본 발명의 제4 실시예에서 제공하는 지능 문답 구현 방법 중의 검색 처리 결과에 근거하여 답안을 회송하는 흐름도이다.
도 5는 본 발명의 제5 실시예에서 제공하는 지능 문답 구현 시스템의 구조 개략도이다.
도6은 본 발명의 제7 실시예에서 제공하는 지능 문답 구현 방법을 실행하는 기기의 하드웨어의 구조 개략도이다.
이하, 첨부된 도면을 결부하여 본 발명에 따른 실시예 중의 기술적 방안에 대한 명확하고 완정한 설명을 진행하기로 한다. 설명되는 실시예들은 본 발명의 일부 구체적인 실시예일 뿐, 전부 실시예가 아니며, 이는 본 발명을 이러한 구체적인 실시예로 한정하고자 하는 것이 아니라 본 발명의 원리를 설명하기 위한 것이다. 본 발명 중의 실시예를 기초로, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자가 진보성 창출이 없이 획득한 모든 기타 실시예들은 모두 본 발명의 보호 범위에 포함된다.
본 발명의 실시예에 따른 방법은 하드웨어 및/또는 소프트웨어로 구현되는 지능 문답 구현 시스템을 배치함으로써 실행할 수 있다.
설명의 명확성을 위하여, 이하 도면 1a를 결부하여 우선 상기 지능 문답 구현 시스템의 네트워크 구조를 개략적으로 설명하기로 한다. 상기 지능 문답 구현 시스템은 중앙 제어 시스템, 문제 분석 시스템 및 후단 시스템을 포함한다.
여기서, 상기 중앙 제어 시스템은 조회하고자 하는 문제(즉, 도 1a 중의 query)를 수신하도록 구성된 것으로, 설정된 텍스트박스를 통해 사용자가 입력하는 조회하고자 하는 문제를 수신하거나, 설정된 동작 버튼을 통해 사용자가 입력하는 조회하고자 하는 문제를 수신할 수도 있다. 예를 들면, 사용자 음성을 수신하기 위한 동작 버튼을 통해 사용자가 입력하는 음성을 수신하고, 음성 식별을 통해 입력된 음성과 대응되는 내용을 획득하여 조회하고자 하는 문제로 간주한다. 상기 문제 분석 시스템은 상기 문제에 대해 어의적 분석을 진행하도록 구성되고, 상기 중앙 제어 시스템은 상응한 검색 처리를 진행하도록 상기 어의적 분석의 결과에 근거하여 상기 문제를 상응한 후단 시스템으로 배포하도록 더 구성된다. 상기 후단 시스템은 어의적 관계(Frame) 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템을 포함하고, 상기 중앙 제어 시스템은 검색 처리 결과에 근거하여 답안(즉, 도 1a 중의 Merge후의 결과)을 회송하도록 더 구성된다.
상기 중앙 제어 시스템은 상기 지능 문답 구현 시스템의 핵심 제어 시스템으로서, 조회하고자 하는 문제를 수신하고, 상기 문제를 문제 분석 시스템으로 전달하며, 상응한 검색 처리를 진행하도록 상기 문제 분석 시스템의 어의적 분석의 결과에 근거하여 기설정된 배포 책략에 의해 상기 문제를 상응한 후단 시스템으로 배포하되 구체적으로, 상응한 검색 처리를 진행하도록 상기 문제를 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 배포하고, 다음 검색 처리 결과에 근거하여 답안을 회송하여 중앙 제어 시스템의 전단 사용자가 상기 조회하고자 하는 문제에 대응되는 답안을 획득하도록 함으로써 지능 문답을 실현하는 것을 설명하고자 한다.
여기서, 상이한 후단 시스템은 상이한 자원 베이스에 대응되는 바, 이는 하기 실시예에서 상세하게 설명하기로 한다. 또한, 배포 책략도 이하에서 설명하기로 한다.
제1 실시예
도 1b를 참조하면, 본 실시예에서 제공하는 지능 문답 구현 방법은 단계(110)~단계(140)를 포함한다.
단계(110)에서, 조회하고자 하는 문제를 수신한다.
본 단계에서, 중앙 제어 시스템에 의하여 조회하고자 하는 문제를 수신한다. 사용자가 입력하는 조회하고자 하는 문제는 사용자 화면에 설정된 텍스트박스를 통해 수신되거나, 사용자 화면에 설정된 동작 버튼을 통해 수신될 수 있으며, 예를 들면, 사용자 음성을 수신하기 위한 동작 버튼을 통해 사용자가 입력하는 음성을 수신하고, 음성 식별을 통해 입력된 음성에 대응되는 내용을 획득하여 조회하고자 하는 문제로 간주한다.
상기 수신된 조회하고자 하는 문제의 커버면이 아주 광범위할 수 있음은 설명하고자 한다. 즉, 임의의 문제에 해당될 수 있으며, 출현 빈도가 비교적 높은 사용자가 관심 갖는 문제일 수 있고, 출현 빈도가 중등이며 기존의 문답 시스템에서 제공한 답안에 대한 사용자의 만족도가 비교적 낮은 문제일 수도 있으며, 출현 빈도가 아주 낮은 비인기 문제일 수도 있다.
단계(120)에서, 상기 문제에 대해 어의적 분석된다.
본 단계는 문제 분석 시스템에 의하여 실행되는 바, 상기 문제에 대해 기초 어휘 분석을 진행할 수 있다. 상기 기초 어휘 분석은 상기 문제에 대한 단어 분리 처리와 품사 표기 처리를 포함할 수 있고, 상기 문제 중의 검색어의 중요성을 확정하고 상기 문제에 대해 의존 문법 분석(dependency grammar analysis)을 진행하는 등을 포함할 수도 있다.
여기서, 의존 문법은 프랑스 언어학자 L.Tesniere가 1959년에 그의 저작<구조 문법 기초>에서 최초로 제기된 것으로, 이는 언어학의 발전에 큰 영향을 끼쳤는 바, 의존 문법 분석은 자연언어 처리 분야에서 문법 분석을 진행하는 중요한 분과이다. 의존 어법 분석은 문장을 한 그루의 의존 문법 트리로 분석을 진행하여, 각 단어 사이의 의존관계를 설명함으로써, 문장의 문법 구조를 개시하고, 문장 중의 핵심 동사는 기타 성분을 지배하는 중심 성분인 것을 주장하며, 핵심 동사 자체는 기타 어떤 성분의 지배를 받지 않고, 모든 피지배 성분은 모두 어떤 종류의 의존관계로 지배 성분에 종속된다.
상기 문제에 대해 기초 어휘 분석을 진행하는 이외에, 본 단계에는 바람직하게 상기 문제의 초점, 관점 및 관점 유형을 식별하는 것이 더 포함될 수 있다.
여기서, 상기 문제의 초점은 문제 답안의 인용으로써, 답안을 대체하여 완정한 서술문을 구성할 수 있다. 예를 들면, 문제 "2013년 윔블던테니스 여자 단식 우승자는 누구인가"의 초점은 "누구"이다. 상기 문제의 초점에 대한 식별은 주로 규칙을 통해 식별하고, 상기 식별 규칙은 다음과 같을 수 있다. 즉, 상기 문제가 의문사를 포함하는 문제이면, 상기 문제의 초점은 해당 의문사이고, 만약 상기 문제가 의문사를 포함하지 않는 문제이면, 상기 문제의 초점은 널(null)을 기본으로 한다.
여기서, 상기 문제의 관점을 식별한다는 것은 상기 문제의 관점의 수량을 식별하는 것을 의미하는 바, 즉 상기 문제가 구비하는 관점의 수량을 의미한다. 상기 문제의 관점의 수량은 폭 넓은 수요일 수 있고, 폭 넓은 수요의 관점 수량은 일반적으로 8개 이상이거나 또는 구체적인 수량일 수도 있다. 예를 들면, 문제 "야생동물에는 어떤 것들이 있는가"의 관점의 수량은 수천수만개가 있고, 상이한 야생동물에 각각 대응되므로, 해당 문제의 관점은 폭 넓은 수요로 정의된다. 또 예를 들면, 문제 "중국 고대 4대 미인"의 관점 수량은 4개인데, 이는 문제 중에 "4대"가 제시되었기 때문이다. 또 예를 들면, 문제 "2013년 윔블던테니스 여자 단식 우승자는 누구인가"의 관점 수량은 1개인데, 이는 현재 문제의 언어 환경에서 우승자는 개인이기 때문이다.
여기서, 상기 문제의 관점 유형을 식별한다는 것은 사용자가 필요하는 관점이 어느 유형에 속하는지를 식별하는 것을 의미한다. 예를 들면, 문제 "2013년 윔블던테니스 여자 단식 우승자는 누구인가"와 같이, 해당 문제의 관점의 유형은 "우승자"이다. 문제의 관점 유형의 식별 방법은 규칙 식별 방법과 모델 학습 모델 2가지로 구분될 수 있는 바, 규칙 식별 방법에서 관점의 유형은 초점의 바로 전의 단어이고, 모델 학습 모델은 의존 문법 분석 등 툴을 기초로 훈련 언어 자료와 훈련 모델 다이나믹을 생성하여 문제의 관점 유형을 식별한다.
나아가, 상기 문제의 관점 유형을 식별하는 단계 이후, 상기 문제의 관점 유형에 대해 정규화 처리를 진행하는 단계를 더 포함할 수 있다.
문제의 관점 유형을 정규화하는 것은 문제의 관점 유형을 고정 유형 체계로 반영하는 것이다. 예를 들면, 문제 "2013년 윔블던테니스 여자 단식 우승자는 누구인가"에서, 초점은 "누구"이고, 관점 유형은 "우승자"이며, 유형 "인물"로 정규화시키는 것이다. 문제의 관점 유형의 정규화 방법은 일반적으로 관점 규칙 또는 관점 단어 목록을 기반으로 정규화한다.
단계(130)에서, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고, 여기서, 상기 검색 처리는 상기 문제에 대한 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템의 검색 처리를 포함한다.
전술한 바와 같이, 본 단계는 중앙 제어 시스템과 후단 시스템으로 실행되고, 구체적으로, 상기 문제 분석 시스템의 어의적 분석의 결과에 근거하여 기설정된 배포 책략을 기반으로 상기 문제를 상응한 후단 시스템에 배포하여 상응한 검색 처리를 진행한다. 구체적으로, 상기 문제를 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템에 배포하여 상응한 검색 처리를 진행한다.
상기 각종 후단 시스템은 별도로 실행되거나 또는 조합되어 사용될 수도 있다.
여기서, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계에서 의거하는 배포 책략은 다음과 같은 것을 포함할 수 있다.
분석된 문제 유형이 구조적 의존 유형(즉, "이전 문장/다음 문장" 유형)이면, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하고, 아니면, 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행한다.
각 후단 시스템으로 상기 문제에 대해 검색 처리를 진행하는 것은 서로 독립적인 것임을 설명하고자 한다.
이하, 상이한 후단 시스템에 대응되는 자원 베이스에 대해 각각 설명하기로 한다.
어의적 관계 마이닝 시스템의 자원 베이스는 2개 부분을 포함할 수 있는 바, 하나는 역 색인(inverted index) 베이스이고, 다른 하나는 Kv(Key Value, 즉 키값) 자원 베이스이며, 해당 역 색인 베이스와 Kv자원 베이스는 오프라인 문서 처리 프로그램을 통해 구축할 수 있다. 여기서, 일반적으로, 문서 집합에서 많은 문서들이 어느 하나의 단어를 포함하고, 매 하나의 문서에는 문서 번호, 단어가 당해 문서에서 출현되는 횟수 및 단어가 문서 중 어느 위치에서 출현했었는지 등 정보가 기록되며, 이러한 하나의 문서에 관련되는 정보를 역 색인이라고 칭하고, 역 색인을 이용하여 검색 효율을 향상시킬 수 있다. Kv 자원 베이스는 마이닝한 시사 유형의 자원과 가사 유형의 자원 등을 포함하고, 의존 유형의 문제의 처리에 이용될 수 있다.
텍스트 베이스 검색 시스템의 자원 베이스는, 텍스트 베이스와 Kv자원 베이스를 포함할 수 있다. 여기서, 텍스트 베이스는 검색엔진이 대량의 비구조화된 웹페이지에 대한 색인, 분석 및 정렬 기술을 기반으로, 대량의 비구조화 웹페이지 데이터에 근거하여 구축된다. Kv자원 베이스는 바이두 백과 및 위키(wiki) 백과 등 문고에 근거하여 구축된다. 대량의 비구조화된 웹페이지 데이터와 바이두 백과 및 위키 백과 등 문고에는 풍부한 지식이 포함되어 있으므로, 텍스트 베이스 검색 시스템은 전체 후단 시스템의 핵심일 뿐만 아니라, 지능 문답을 실현하는 핵심 처리 시스템으로서, 사용자가 입력하는 조회하고자 하는 문제에 대한 답안 검색을 실현할 수 있다.
지식 베이스 검색 시스템의 자원 베이스는 오프라인의 마이닝된 구조화의 지식 베이스일 수 있고, <엔티티(entity), 속성, 값>의 트리플(triple) 형식으로 저장되며, 예를 들면 <장삼, 와이프, 미녀>, <미녀, 별자리, 양자리>, <아바타, 작가, 제임스·카메론> 등일 수 있고, 지식 베이스 정보를 기초로 추리하는 것을 책임진다. 문제 "장삼의 와이프의 별자리는 무엇인가"를 예로 들면, 장삼의 와이프는 미녀이고 미녀의 별자리는 양자리인 것을 통해 해당 문제의 답안이 "양자리"인 것으로 추리하여 획득된다.
문답 베이스 검색 시스템의 자원 베이스는 오프라인으로 마이닝된 고품질의 문답 데이터일 수 있는 바, 예를 들면, 바이두 지식인에서 과거 사용자의 질문과 회답으로 형성된 문답 커뮤니티 자원 베이스일 수 있다. 문답 베이스 검색 시스템의 처리 과정은 텍스트 베이스 검색 시스템의 처리 과정과 유사한 바, 이하 제3 실시예에서는 텍스트 베이스 검색 시스템의 구체적인 처리 과정에 대해 상세하게 설명기로 한다.
단계(140)에서, 검색 처리 결과에 근거하여 답안을 회송한다.
본 실시예의 기술적 방안에 있어서, 조회하고자 하는 문제에 대해 어의적 분석을 진행하고, 어의적 분석에 근거하여 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템을 이용하여 상기 문제에 대해 상응한 검색 처리를 진행하여 문제의 답안에 대한 검색 범위를 증가시킴으로써, 한편으로 문제에 대한 회답이 더욱 정확해지도록 하고, 다른 한편으로 문제의 커버면을 증가시키며, 특히 중저 빈도 및 비인기 문제에 관해서도 비교적 정확한 답안을 검색할 수 있어, 문제를 회답하는 정확도를 효과적으로 향상시킨다.
본 발명에 따른 실시예에서 제공하는 지능 문답 구현 방법의 실행 주체는 클라우드 시스템(Cloud System)을 사용할 수 있어, 모든 외형의 로봇에 탑재하고 모든 문답 유형의 상황에 응용될 수 있다. 예를 들면, 숙제 지도에 응용될 수 있는 바, 학생은 생소한 지식점에 관하여 지능 문답 구현 시스템과 직접 대화하여, 예컨데 "만유인력의 법칙은 누가 제출한 것인가? 이의 제출은 어떠한 의미가 있는가"와 같은 더욱 전면적이고 진실하며 유용한 정보 지도를 받을 수 있다. 또 예를 들면, 공공장소의 자동 고객 서비스에 응용될 수 있는 바, 백화점에서 의류를 선택할 때 지능 문답 구현 시스템과 대화하여 천연섬유와 화학섬유 중 어느 것이 더 좋은지를 알 수 있고, 각자 어떠한 우점과 결점이 존재하는지에 관한 정보를 얻을 수 있으며, 또는 공원을 유람할 때 관광객은 지능 문답 구현 시스템과 대화하여 장미의 개화기 등 정보를 얻을 수 있다. 또 예를 들면, 보조 의료에 응용될 수 있는 바, 인터넷 빅데이터와 사용자 병례 정보를 결합하고 지능 문답 구현 시스템의 분석 및 추리를 이용하여 참고 가능한 병례 원인 분석을 제출할 수 있다.
예시적으로, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계는,
분석된 문제 유형이 구조적 의존 유형이면, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하고, 아니면, 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 것을 포함한다.
예시적으로, 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하는 것은,
삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하는 것을 포함한다.
예시적으로, 상기 삼항 관계 베이스를 구축하는 것은,
네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하고,
의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하고,
상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하는 것을 포함한다.
예시적으로, 의존관계를 구비하는 문장을 획득하기 이전에,
문장 중의 괄호 내의 내용을 제거하는 것을 더 포함한다.
예시적으로, 삼항 관계 쌍을 획득하기 이전에,
상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하는 것을 더 포함한다.
예시적으로, 상기 텍스트 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 단계는,
상기 문제에 관련되는 문서 집합을 검색하고,
상기 문서 집합으로부터 후보 답안을 포함하는 후보 세그먼트를 조회하고,
상기 후보 세그먼트로부터 상기 후보 답안을 추출하여 1차 정렬을 진행하는 것을 포함한다.
예시적으로, 상기 1차 정렬을 진행하는 단계는,
URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하는 단계를 포함하고, 여기서, 상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이다.
예시적으로, 상기 검색 처리 결과에 근거하여 답안을 회송하는 단계는,
분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하고,
필터링 결과에 근거하여 답안을 회송하는 것을 포함한다.
예시적으로, 상기 필터링 결과에 근거하여 답안을 회송하는 것은,
상기 필터링 결과에 대해 2차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하는 것을 포함한다.
예시적으로, 상기 필터링 결과에 대해 2차 정렬을 진행하는 것은,
모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하는 것을 포함한다.
예시적으로, 상기 필터링 결과에 근거하여 답안을 회송하는 것은, 상기 필터링 결과에 대해 3차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하는 것을 포함한다.
예시적으로, 상기 필터링 결과에 대해 3차 정렬을 진행하는 단계는,
상기 후보 답안과 상기 문제의 매칭 정도를 검증하고,
상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하는 것을 포함한다.
제2 실시예
본 실시예는 상기 실시예의 기초 상에서, 다른 하나의 지능 문답 구현 방법의 기술적 방안을 제기한다.
도 2a를 참조하면, 본 실시예에서 제공하는 지능 문답 구현 방법은 단계(210)~단계(240)를 포함한다.
단계(210)에서, 조회하고자 하는 문제를 수신한다.
단계(220)에서, 상기 문제에 대해 어의적 분석을 진행하여 문제의 관점 유형이 "이전 문장" 또는 "다음 문장"임을 획득한다.
본 단계는 전술한 실시예 중의 상기 문제에 대해 기초 어휘 분석을 진행하는 단계 및 상기 문제의 초점, 관점 및 관점 유형을 식별하는 단계에도 동일하게 적용되는 바, 여기서 중복된 설명은 진행하지 않기로 한다.
단계(230)에서, 어의적 관계 마이닝 시스템으로 삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득한다.
본 단계에서, 삼항 관계 베이스 중의 삼항 관계는 동사를 핵심으로 하는 의존관계, 엔티티와 속성의 의존관계 및 상이한 엔티티 사이의 의존관계를 포함하고, 삼항 관계 베이스 중의 삼항 관계는 합리성 검증을 거친 것이다.
도 2b를 참조하면, 상기 삼항 관계 베이스의 구축은 단계(231)~단계(236)를 바람직하게 포함한다.
단계(231)에서, 전처리를 진행한다.
문장 중의 ‘()’와 같은 괄호 중의 내용을 제거하여 의존 문법 분석의 구조에 대해 미치는 영향을 피면한다.
단계(232)에서, 기초 단어/문법 분석을 진행한다.
원 웹페이지 중의 텍스트에 포함되는 문장 부분에 대해 단어 분리, 고유명칭 식별, 엔티티 식별, 품사 표기 및 의존 분석을 진행하여 의존관계를 구비하는 문장을 획득할 수 있다.
단계(233)에서, 부사어 세그먼트 식별을 진행한다.
예를 들면, 쉼표로 분리되는 세그먼트에 대해 세그먼트 유형 식별을 진행하되, 주로 시간성 부사어 세그먼트, 비시간성 부사어 세그먼트 및 기타 세그먼트로 구분한다.
단계(234)에서, 삼항 관계 쌍 추출을 진행한다.
본 단계는 구체적으로, 의존 분석의 매 하나의 부노드(father node)에 근거하여 관계 추출을 진행하여 삼항 관계 쌍을 획득한다. 상기 삼항 관계 쌍은 구체적으로, 동사를 핵심으로 하는 의존관계, 엔티티와 속성의 의존관계 및 상이한 엔티티 사이의 의존관계를 포함한다. 예를 들면, "학생A가 상을 받다"일 경우, "학생A"와 "상" 사이는 동사를 핵심으로 하는 의존관계이고, "황산이 아주 아름답다"일 경우, "황산"과 "아주 아름답다"는 엔티티와 속성 사이의 의존관계이며, "백일의산진"의 다음 문장은 "황하입해류"일 경우, 상이한 엔티티 사이의 의존관계로 이해할 수 있다.
단계(235)에서, 결여 성분 보충을 진행한다.
예를 들면, 주어 보충, 시간 및 지점의 부사어 보충, 목적어 보충 등을 진행한다.
단계(236)에서, 합리성 검증 및 필터링을 진행한다.
분석해 낸 삼항 관계 쌍에 대해 합리적인지 여부를 판정하고, 합리적이지 않을 경우, 해당 삼항 관계 쌍을 보류하지 않는다. 즉, 분석해 낸 삼항 관계 쌍에 대해 필터링을 진행하고, 단지 합리적인, 즉 검증 통과된 삼항 관계 쌍만 보류한다. 다음, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축한다.
예를 들면, 원 웹페이지로부터 "황하입해류, 백일의산진"을 추출하면, 단계(233)에서 해당 원 웹페이지로부터 추출된 "황하입해류"는 "백일의산진"의 이전 문장으로써, 기존의 시사 자원에 근거하여 이러한 삼항 관계 쌍은 합리적이지 않은 것으로 판정할 수 있고, 따라서 해당 삼항 관계 쌍을 필터링한다.
단계(240)에서, 검색 처리 결과에 근거하여 답안을 회송한다.
본 실시예의 기술적 방안에 의하면, 조회하고자 하는 문제에 대해 어의적 분석을 진행하고, 어의적 분석에 근거하여, 어의적 관계 마이닝 시스템을 사용하여 삼항 관계 베이스로부터 상기 문제에 대해 상응한 검색 처리를 진행함으로써, 상기 문제의 답안을 조회하여 획득한다. 삼항 관계 베이스 중의 삼항 관계는 동사를 핵심으로 하는 의존관계, 엔티티와 속성의 의존관계 및 상이한 엔티티 사이의 의존관계를 포함하므로 문제의 답안에 대한 검색 범위를 증가시켜 문제의 커버면을 증가시키고, 특히 중저 빈도 및 비인기 문제를 커버할 수 있으며, 삼항 관계 베이스 중의 삼항 관계는 합리성 검증을 진행하므로 문제에 대한 회답의 정확성을 향상시킨다.
삼항 관계 베이스를 구축하는 과정에서, 삼항 관계 쌍을 획득하기 이전에, 상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하는 단계를 더 포함할 수 있음을 설명하고자 한다.
구체적으로, 주어, 술어, 목적어 및 부사어 등을 포함하고 의존관계를 구비하는 문장의 세그먼트 유형을 식별하여 획득할 수 있으며, 부사어는 또한 시간 부사어, 지점 부사어, 원인 부사어 및 결과 부사어 등 유형을 포함할 수 있다. 술어는 동사로서, 전술한 바와 같이, 의존 어법 분석은 문장을 한 그루의 의존 문법 트리로 분석을 진행하여 매개 단어 사이의 의존관계를 설명함으로써, 문장의 문법 구조를 개시하고, 문장 중의 핵심 동사는 기타 성분을 지배하는 중심 성분인 것을 주장하며, 핵심 동사 자체는 기타 어떤 성분의 지배를 받지 않으며, 모든 피지배 성분은 모두 어떤 종류의 의존관계로 지배 성분에 종속된다. 동사를 핵심으로 하는 의존관계는 술어와 기타 유형의 세그먼트 사이의 의존관계를 의미한다.
본 방식에 의하면, 의존관계를 구비하는 문장 중에 결여된 술어 이외의 기타 성분을 보충함으로써, 삼항 관계 중의 동사를 핵심으로 하는 의존관계를 풍족시킴에 유리하고, 문제의 답안 검색 범위를 진일보 증가시키며, 문제의 커버면을 진일보 증가시키며, 특히 중저 빈도 및 비인기 문제를 커버할 수 있다.
제3 실시예
본 실시예는 제1 실시예를 기초로, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고, 이러한 단계를 상기 어의적 분석의 결과에 근거하여 상기 텍스트 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 것으로 최적화시킨다.
도 3을 참조하면, 도 3은 본 발명의 제3 실시예가 제공하는 지능 문답 구현 방법 중의 텍스트 베이스 검색 시스템으로 문제에 대해 검색 처리를 진행하는 흐름도이다. 구체적으로, 단계(310)~단계(330)를 포함한다.
단계(310)에서, 관련 문서를 검색한다.
자원 베이스에서 검색을 진행하여 검색결과, 웹페이지 텍스트 및 클릭 로그(click log)를 획득하고, 상기 문제에 관련되는 문서 집합을 검색한다.
본 단계는 검색엔진을 통해 상기 문제를 검색하고, 관련 웹페이지 집합을 리콜하여 상기 문제와 관련된 문서 집합으로 간주하며, 검색엔진의 관련성 정렬은 일정한 정도 상에서 각 문서의 중요성을 구현할 수 있다. 구체적으로, 검색엔진을 통해 상기 문제를 검색하여, 상기 문제에 관련되는 검색결과 및 기타 자원을 획득할 수 있고, 상기 기타 자원은 요약, 유니폼 리소스 로케이터(Uniform Resource Locator, URL), 문서 클릭 데이터 및 문서의 본문 정보 등을 포함할 수 있으며, 그 다음, URL을 통해 리콜 웹페이지와 대응되는 문서 내용을 획득하여 문제 및 답안에 대한 심도 분석에 사용한다. 클릭 로그를 통해 매개 문서가 문제에 대한 만족 정도를 분석한다.
여기서, 클릭 로그는 URL 레벨 평가 클릭된 각 문서로부터의 문제에 대한 만족 정도이다.
시간 유형인 "2010년 3월"과 "2010.03" 등과 같은, 표달 방법이 상이하나 실질적으로 동일한 자원을 병합하는 전처리 단계; 및 오류의 자원을 수정 표시하는 단계를 더 포함할 수 있다.
바람직하게, 문서 관련성 산출 및 문서 정렬을 진행하는 단계를 더 포함할 수 있다.
어의적 유사도 등 특징 산출을 결부하여 문서 관련성을 산출할 수 있다. 어의적 유사도 산출은 문제와 문서 타이틀의 유사도값을 산출하는 것을 의미하고, 여기서, 어의적 산출 방법은 주로 검색어의 중요성, 검색어의 동의어 대체, 검색어 수정 등 정보를 이용하여 산출을 진행한다.
문서 관련성 정렬은 검색엔진이 문제 중의 검색어에 근거하여 대량의 웹페이지 문서를 리콜하나, 그의 전의 리스크를 한정하지 않는 것을 의미한다. 문서 관련성 정렬방법은, 검색엔진(예를 들면, 바이두 검색엔진)의 검색 정렬 결과, 클릭 로그에서 분석된 웹페이지 사용자 만족 정도에 근거하고, 어의적 유사도 산출 등 특징을 결부하여 관련성 재정렬을 진행하여 내용 전의 문제를 해결한다. 여기서, 내용 전의는 소음 데이터를 도입할 가능성이 존재하므로 틀린 답안이 추출되거나, 정렬 단계에서 틀린 답안 정렬이 비교적 높게 되는 문제를 초래할 수 있다.
단계(320)에서, 후보 세그먼트의 추출 및 정렬을 진행한다.
상기 문서 집합으로부터 후보 답안이 포함된 후보 세그먼트를 조회한다.
우선 각 문서를 구분할 수 있는 바, 여기서, 문서 구분은 일반적으로 단락 또는 복수개의 문장을 단위로 하고, 그 다음, 설정된 키워드를 통해 각 문서로부터 상기 설정된 키워드와 대응되는 세그먼트를 검색하여 후보 세그먼트로 간주하여 후보 답안에 대한 진일보 추적에 사용한다.
후보 세그먼트에 대해 진일보 정렬할 수 있는 바, 구체적으로 소스 문서의 관련성 가중치, 후보 세그먼트의 내용 유사도, 후보 세그먼트의 관련성 등 특징에 근거하여 세그먼트 신뢰도를 산출하고, 신뢰도에 따라 후보 세그먼트를 정렬할 수 있다.
소스 문서의 관련성 가중치 산출은 문서 관련성 재정렬의 관련 특징을 사용하여 선형 피팅을 진행하여 획득할 수 있다. 후보 세그먼트의 내용 유사도는 문제와 후보 세그먼트의 내용 유사도를 산출하기 위한 것으로, 어의적 유사도 산출 방법을 사용할 수 있다. 후보 세그먼트의 관련성 산출은 문제와 후보 세그먼트의 관련성을 측정하기 위한 것으로, 산출 방법은 주로 문제 중의 각 검색어의 중요성, 각 검색어가 후보 세그먼트 중에서의 명중 수량 및 명중 위치 등 특징을 이용하여 피팅한다.
단계(330)에서, 후보 답안을 추출 및 정렬한다.
상기 후보 세그먼트로부터 상기 후보 답안을 추출하여 1차 정렬한다.
본 단계에서, 후보 답안 추출 단계는 오프라인으로 마이닝된 오픈 분야의 사전을 이용하여 엔티티 명명 식별 기술로 실현할 수 있고, 여기서, 오픈 분야의 사전은 종합 사전이다.
1차 정렬 단계에 있어서, 바람직하게는 URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하고, 여기서, 상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이다.
후보 답안과 문제 중의 키워드의 공기 가중치에 근거하여 후보 답안에 대해 1차 정렬을 진행할 수도 있다.
또한, 후보 답안이 후보 세그먼트에서 출현하는 위치, 검색결과에서 후보 답안의 역문서 빈도, 소스 문서의 관련성과 소스 후보 세그먼트의 관련성 및 상이한 후보 세그먼트로 동일한 답안(동의의 답안을 포함)에 대한 신뢰도 가중 투표 가중치 중 적어도 하나의 특징에 근거하여 후보 답안에 대해 1차 정렬을 진행할 수도 있다.
여기서, 소스 문서의 관련성은 문서 관련성 재정렬의 관련 특징을 사용하여 선형 피팅을 진행하여 획득할 수 있고, 소스 후보 세그먼트의 관련성은 소스 문서 관련성 및 소스 세그먼트와 문제 사이의 어의적 매칭도를 통해 선형 피팅을 진행하여 획득할 수 있다.
상술한 후보 답안에 대한 1차 정렬은 주로 후보 답안에 대한 리콜을 확보하여, 너무 많은 답안이 2차 정렬에 진입하여 정렬 성능과 소음 제어에 영향을 미치는 것을 방지한다.
후보 답안의 추출 및 정렬 이후, 후보 답안에 대해 진일보의 정렬을 진행하는 단계, 예를 들어 분야 내의 지식 필터링, 2차 정렬 및 3차 정렬 등을 이용하는 단계를 더 포함할 수 있음을 설명하고자 하며, 이는 이하의 실시예에서 상세히 설명하도록 한다.
제4 실시예
본 실시예는 상기 각 실시예를 기초로, 검색 처리 결과에 근거하여 답안을 회송하는 이러한 단계의 바람직한 방안을 제공한다.
도 4를 참조하면, 도 4는 본 발명의 제4 실시예가 제공하는 지능 문답 구현 방법 중의 검색 처리 결과에 근거하여 답안을 회송하는 흐름도이다. 구체적으로, 단계(410)~단계(420)을 포함한다.
단계(410)에서, 분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행한다.
상이한 문제와 상이한 답안 유형에 필요한 지식, 특징 및 정렬 알고리즘에는 모두 차별이 존재할 수 있다. 따라서, 상이한 분야의 지식을 이용하여 검색 처리 결과에 대해 필터링을 진행하여 문제와 매칭되는 검색 처리 결과를 획득할 수 있다.
분야 지식의 구축은 주로 정밀한 분야 지식 사전의 구축이다. 예를 들면, 골든리트리버는 개과에 속하고, 툭눈금붕어은 어류에 속한다. 문제 유형이 개라면, 후보 답안인 "툭눈금붕어"는 분야 사전에 의해 필터링된다.
분야 사전의 구축은 주로 정향 웹사이트 구조화 데이터 마이닝(예를 들면, qidian.com 소설 엔티티의 마이닝), 대규모 인터넷 무구조화/반구조화 데이터 마이닝과 검증(예를 들면, 백과 등 지식류 커뮤니티의 분류 태그를 사용한 엔티티 마이닝), 검색 로그 마이닝(예를 들면, 문제인 "천룡팔부 영화"와 대응되는 검색 로그로부터 천룡팔부를 영화로 하는 엔티티 마이닝) 등 알고리즘에 의해 실현된다.
단계(420)에서, 필터링 결과에 근거하여 답안을 회송한다.
본 단계는 여러가지 실현 방식으로 진행할 수 있으며, 아래와 같은 몇가지를 예로 들어 설명하도록 한다.
제1 실시양태에서, 필터링 결과에 근거하여 답안을 회송하는 단계는 구체적으로,
상기 필터링 결과에 대해 2차 정렬을 진행하는 단계; 및
정렬 후의 필터링 결과를 회송하는 단계를 포함한다.
여기서, 모니터링을 구비하는 로봇 학습 모델(예를 들면, GBRank 로봇 학습 모델)을 사용하여 상기 필터링 결과에 대해 2차 정렬을 진행할 수 있다.
상기 로봇 학습 모델은 이미 정렬된 샘플 답안을 포함하는 어구 및 대응되는 정렬 특징에 대해 학습 훈련을 진행하여 획득할 수 있고, 문제 매칭도, 오프셋 가중치, 답안과 문제의 공기 정보(co-occurrence Information), 답안 경계 특징 및 답안 신뢰도 중의 적어도 하나의 정렬 특징을 포함할 수 있다.
상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이고, 문제 매칭도의 산출방식은 일반적으로 대규모 언어자료 중에서 통계된 문제의 전의 벡터와 후보 답안의 전의 벡터의 매칭 정도를 이용하여 피팅 산출한다. 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이다. 답안과 문제의 공기 정보는 문제가 후보 답안의 주어 환경 중에서의 중요 정도를 가늠하기 위한 것으로, 엔티티 유형의 답안과 문제에 대한 공기 정보 산출은 후보 답안이 바이두 백과 중에서의 정보와 문제 중의 키워드 산출의 공기 정도를 이용할 수 있다. 상기 답안 경계 특징은 답안 좌측 경계 및 우측 경계의 정보를 의미하고, 예를 들면, 서적 명칭, 따옴표, 쉼표 등이다. 그 중, 답안 신뢰도는 소스 문서와 관련되고, 매 하나의 문서는 모두 하나의 증명 소스으로 간주되어 한번의 투표에 참여하며, 매 하나의 소스 문서는 매번 1표 투표하고, 이론적으로는 득표가 많은 문서와 대응되는 답안의 신뢰도가 더욱 높다. 또한, 답안이 속하는 후보 세그먼트에 근거하여 답안 신뢰도를 확정할 수 있는 바, 매 하나의 후보 세그먼트가 제시하는 문서는 모두 하나의 증명 소스로 간주되어 한번의 투표에 참여하고, 매 하나의 소스에 의해 매번 투표되는 가중치는 후보 세그먼트의 관련성에 의해 확정되며, 이론적으로 득표가 많은 답안일수록 신뢰도가 더욱 높다.
본 실시양태는 별도로 사용되거나 전술의 1차 정렬과 조합되어 사용될 수 있다. 바람직하게는, 후보 세그먼트로부터 후보 답안을 추출하여 1차 정렬을 진행하고, 분야 내의 지식을 이용하여 상기 필터링 단계를 실행한 후, 상기 필터링 결과에 대해 2차 정렬을 진행한다.
바람직한 본 실시양태에 의하면, 후보 세그먼트로부터 후보 답안을 추출한 후, URL 가중치, 오프셋 가중치와 문제 매칭도 중의 적어도 하나의 특징을 이용하여 1차 정렬함으로써, 선두에 정렬된 답안의 정확성을 향상시킨다. 또한, 전문 분야 지식을 이용하여 상이한 유형의 문제와 대응되는 답안에 대해 필터링함으로써, 상이한 유형의 문제와 대응되는 답안의 전문성과 권위성을 확보한다. 또한, 문제 매칭도, 오프셋 가중치, 답안과 문제의 공기 정보, 답안 경계 특징 및 답안 신뢰도 중의 적어도 하나의 특징을 이용하여 필터링 결과에 대해 2차 정렬함으로써, 문제와 대응되는 답안의 전문성과 권위성을 확보하는 동시에 선두에 정렬된 답안의 정확성을 진일보 최적화시킨다.
제2 실시양태에서, 필터링 결과에 근거하여 답안을 회송하는 단계는 구체적으로,
상기 필터링 결과에 대해 3차 정렬을 진행하는 단계; 및
정렬 후의 필터링 결과를 회송하는 단계를 포함한다.
나아가, 상기 필터링 결과에 대해 3차 정렬을 진행하는 단계는 바람직하게,
상기 후보 답안과 상기 문제의 매칭 정도를 검증하는 단계; 및
상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하는 단계를 포함한다.
구체적으로, 2차 검색을 이용하여 상기 후보 답안과 상기 문제의 매칭 정도를 검증할 수 있다. 2차 검색은 문제와 답안에 대한 더욱 풍부한 매칭 정보를 제공할 수 있는 바, 이는 후보 답안으로 원 문제의 초점을 대체하는 것을 의미한다. 즉, 원 문제에 후보 답안을 대입시켜 2차 검색을 진행하여, 신규 문제와 후보 답안의 관련 정보를 통계하는 것이다. 예를 들면, 신규 문제와 후보 답안이 2차 검색에서 회송하는 문서 중에 연관적으로 출현하는지 여부, 신규 문제와 후보 답안의 공기 정보, 신규 문제 중의 키워드의 명중 상황 등이다. 만약 현재 문서의 타이틀이 문제 유형의 타이틀이면, 초점 식별, 답안 유형 식별은 문서 타이틀에서 식별된다. 문제에 초점이 없으면, 답안을 원 문제의 말단에 추가하여 구분 문자로 분할한 후 2차 검색을 진행한다.
본 실시양태는 별도로 사용되거나 전술한 1차 정렬 및/또는 전술의 2차 정렬과 조합되어 사용될 수 있다.
별도로 사용될 경우, 원 문제에 후보 답안을 대입시켜 신규 문제로 하여 2차 검색을 진행하므로, 신규 문제와 후보 답안의 관련 정보에 근거하여 답안의 정렬 순서에 대해 최적화 조정을 진행함으로써, 선두에 정렬된 답안과 기존의 조회하고자 하는 문제의 매칭 정도를 향상시킬 수 있다.
후보 세그먼트로부터 후보 답안을 추출하여 1차 정렬을 진행하고 분야 내의 지식을 이용하여 상기 필터링 단계를 실행한 후, 상기 필터링 결과에 대해 2차 정렬을 진행하고, 다음 상기 3차 정렬을 진행한다. 이러한 조합 방식으로 후보 세그먼트로부터 후보 답안을 추출한 후, URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징을 이용하여 1차 정렬을 진행하여 선두에 정렬된 답안의 정확성을 향상시킨다. 또한, 전문 분야 지식을 이용하여 상이한 유형의 문제와 대응되는 답안에 대해 필터링함으로써, 상이한 유형의 문제와 대응되는 답안의 전문성과 권위성을 확보한다. 또한, 문제 매칭도, 오프셋 가중치, 답안과 문제의 공기 정보, 답안 경계 특징 및 답안 신뢰도 중의 적어도 하나의 특징을 이용하여 필터링 결과에 대해 2차 정렬함으로써, 문제와 대응되는 답안의 전문성과 권위성을 확보하는 동시에 선두에 정렬된 답안의 정확성을 진일보 최적화시킨다. 또한, 원 문제에 후보 답안을 대입시켜 신규 문제로 하여 2차 검색함을 진행하여 신규 문제와 후보 답안의 관련 정보에 근거하여 답안의 정렬 순서에 대해 최적화 조정함으로써 선두에 정렬된 답안과 기존의 조회하고자 하는 문제의 매칭 정도를 향상시킨다.
제5 실시예
본 실시예는 지능 문답 구현 시스템을 제공하는 바, 도5를 참조하면, 상기 지능 문답 구현 시스템은 중앙 제어 시스템(510), 문제 분석 시스템(520) 및 후단 시스템(530)을 포함한다.
여기서, 중앙 제어 시스템(510)은 조회하고자 하는 문제를 수신하도록 구성되고, 문제 분석 시스템(520)은 상기 문제에 대해 어의적 분석을 진행하도록 구성되고, 상기 중앙 제어 시스템(510)은 상기 어의적 분석의 결과에 근거하여 상기 문제를 상응한 후단 시스템(530)에 배포하여 상응한 검색 처리를 진행하도록 더 구성되며, 상기 후단 시스템(530)은 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템과 문답 베이스 검색 시스템 중의 적어도 하나의 시스템을 포함하며, 상기 중앙 제어 시스템(510)은 검색 처리 결과에 근거하여 답안을 회송하도록 더 구성된다.
본 실시예의 기술적 방안에 의하면, 조회하고자 하는 문제에 대해 어의적 분석을 진행하고, 어의적 분석에 근거하여 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 상응한 검색 처리를 진행하여 문제의 답안에 대한 검색 범위를 증가시킴으로써, 한편으로 문제에 대한 회답이 더욱 정확해지도록 하고, 다른 한편으로 문제의 커버면을 증가시키며, 특히 중저 빈도 및 비인기 문제에 관해서도 비교적 정확한 회답을 검색해 낼 수 있다.
상기 방안에 있어서, 상기 문제 분석 시스템(520)은 구체적으로 상기 문제의 초점, 관점 및 관점 유형을 식별하도록 구성될 수 있다.
나아가, 상기 문제 분석 시스템(520)은 상기 문제의 관점 유형을 식별한 이후, 상기 문제의 관점 유형에 대해 정규화 처리를 진행하도록 더 구성될 수 있다.
상기 방안에 있어서, 상기 중앙 제어 시스템(510)은 구체적으로 분석된 문제 유형이 구조적 의존 유형일 경우, 상기 문제를 상기 어의적 관계 마이닝 시스템으로 배포하여 검색 처리를 진행하고, 아니면, 상기 문제를 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템에 배포하여 검색 처리를 진행하도록 구성될 수 있다.
여기서, 상기 어의적 관계 마이닝 시스템은 구체적으로 삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하도록 구성될 수 있다.
상기 어의적 관계 마이닝 시스템은,
네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하고,
의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하며,
상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하도록 더 구성될 수 있다.
상기 어의적 관계 마이닝 시스템은 의존관계를 구비하는 문장을 획득하기 이전에, 문장 중의 괄호 내의 내용을 제거하도록 더 구성될 수 있다.
상기 어의적 관계 마이닝 시스템은 삼항 관계 쌍을 획득하기 이전에, 상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하도록 더 구성될 수 있다.
여기서, 상기 텍스트 베이스 검색 시스템은 구체적으로,
상기 문제에 관련되는 문서 집합을 검색하고,
상기 문서 집합으로부터 후보 답안을 포함하는 후보 세그먼트를 조회하며,
상기 후보 세그먼트로부터 상기 후보 답안을 추출하여 1차 정렬을 진행하도록 구성될 수 있다.
상기 텍스트 베이스 검색 시스템은 구체적으로, URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하도록 구성될 수 있고, 여기서, 상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이다.
상기 방안에 있어서, 상기 중앙 제어 시스템(510)은 구체적으로,
분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하고,
필터링 결과에 근거하여 답안을 회송하도록 구성될 수 있다.
바람직한 하나의 실시양태로서, 상기 중앙 제어 시스템(510)은 구체적으로,
상기 필터링 결과에 대해 2차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하도록 구성될 수 있다.
나아가, 상기 중앙 제어 시스템(510)은 구체적으로 모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하도록 구성될 수 있다.
바람직한 다른 하나의 실시양태로서, 상기 중앙 제어 시스템(510)은 구체적으로,
상기 필터링 결과에 대해 3차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하도록 구성될 수 있다.
나아가, 상기 중앙 제어 시스템(510)은 구체적으로,
상기 후보 답안과 상기 문제의 매칭 정도를 검증하고,
상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하도록 구성될 수 있다.
본 발명의 실시예에서 제공하는 지능 문답 구현 시스템은 본 발명의 임의의 실시예에서 제공하는 지능 문답 구현 방법을 실행할 수 있고, 방법을 실행하기 위한 상응한 기능적 모듈 및 유익한 효과를 구비한다.
제 6실시예
본 실시예는 비휘발성 컴퓨터 저장 매체를 제공하고, 상기 비휘발성 컴퓨터 저장 매체는 하나 또는 복수 개의 모듈이 저장되며, 상기 하나 또는 복수 개의 모듈이 지능 문답 구현 방법을 실행하는 기기에 의해 실행될 경우, 상기 기기로 하여금,
조회하고자 하는 문제를 수신하고,
상기 문제에 대해 어의적 분석을 진행하고,
상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고,
검색 처리 결과에 근거하여 답안을 회송하도록 하되, 상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함한다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 문제에 대해 어의적 분석을 진행하는 동작은 바람직하게,
상기 문제의 초점, 관점 및 관점 유형을 식별하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 문제의 관점 유형을 식별한 이후, 상기 방법은,
상기 문제의 관점 유형에 대해 정규화 처리를 진행하는 동작을 더 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 동작은 바람직하게,
분석된 문제 유형이 구조적 의존 유형일 경우, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하고, 아니면, 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 어의적 관계 마이닝 시스템에 의해 상기 문제에 대해 검색 처리를 진행하는 동작은 바람직하게,
삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하는 동작을 포함할 수 있다.
상기 저장 매체에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 삼항 관계 베이스의 구축은,
네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하고,
의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하고,
상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 의존관계를 구비하는 문장을 획득하기 이전에,
문장 중의 괄호 내의 내용을 제거하는 동작을 더 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 삼항 관계 쌍을 획득하기 이전에,
상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하는 동작을 더 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 텍스트 베이스 검색 시스템에 의해 상기 문제에 대해 검색 처리를 진행하는 동작은 바람직하게,
상기 문제에 관련되는 문서 집합을 검색하고,
상기 문서 집합으로부터 후보 답안이 포함된 후보 세그먼트를 조회하고,
상기 후보 세그먼트로부터 상기 후보 답안을 추출하고 1차 정렬을 진행하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 1차 정렬을 진행하는 동작은,
URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하는 동작을 포함할 수 있고, 여기서, 상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 검색 처리 결과에 근거하여 답안을 회송하는 동작은,
분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하고,
필터링 결과에 근거하여 답안을 회송하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 필터링 결과에 근거하여 답안을 회송하는 동작은,
상기 필터링 결과에 대해 2차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 필터링 결과에 대해 2차 정렬을 진행하는 동작은,
모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 필터링 결과에 근거하여 답안을 회송하는 동작은,
상기 필터링 결과에 대해 3차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하는 동작을 포함할 수 있다.
상기 저장 매체 중에 저장되는 모듈이 상기 기기에 의해 실행될 경우, 상기 필터링 결과에 대해 3차 정렬을 진행하는 동작은,
상기 후보 답안과 상기 문제의 매칭 정도를 검증하고,
상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하는 동작을 포함할 수 있다.
제7 실시예
도 6을 참조하면, 도 6은 본 발명의 제7 실시예에서 제공하는 지능 문답 구현 방법을 실행하는 기기의 하드웨어 구조 개략도이다.
상기 기기는,
하나 또는 복수개의 프로세서(610);
메모리(620); 및 하나 또는 복수개의 모듈을 포함하되, 도 6에서는 하나의 프로세서(610)를 예로 들어 설명한다.
상기 기기는 입력장치(630)와 출력장치(640)를 더 포함할 수 있다. 상기 기기 중의 프로세서(610), 메모리(620), 입력장치(630) 및 출력장치(640)는 버스라인 또는 기타 방식을 통해 연결될 수 있으며, 도 6에서는 버스라인을 통해 연결된 것을 예로 들어 설명한다.
메모리(620)는 컴퓨터 판독 가능한 저장 매체로서, 소프트웨어 프로그램, 컴퓨터 실행 가능한 프로그램 및 모듈을 저장할 수 있으며, 예컨데 본 발명의 실시예에서는 지능 문답 구현 방법과 대응되는 프로그램 인스트럭션/모듈(예를 들면, 도 5에 도시된 지능 문답 구현 시스템 중의 중앙 제어 시스템(510), 문제 분석 시스템(520)과 후단 시스템(530))을 저장할 수 있다. 프로세서(610)는 메모리(620)에 저장되는 소프트웨어 프로그램, 인스트럭션 및 모듈을 실행함으로써, 서버의 각종 기능 응용 및 데이터 처리를 실행한다. 즉, 상기 방법 실시예 중의 지능 문답 구현 방법을 실현한다.
메모리(620)는 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있으며, 여기서, 프로그램 저장 영역은 운영체제, 적어도 하나의 기능에 필요하는 응용 프로그램을 저장할 수 있고, 데이터 저장 영역은 단말기기의 사용에 근거하여 생성되는 데이터 등을 저장할 수 있다. 또한, 메모리(620)는 고속 랜덤 액세스 메모리를 포함하거나 비휘발성 메모리를 포함할 수 있으며, 예를 들면, 적어도 하나의 디스크 메모리 장치, 플래시 메모리 장치 또는 기타 비휘발성 솔리드 스테이트 메모리 장치를 포함할 수 있다. 일부 실시예에 있어서, 메모리(620)는 프로세서(610)에 대해 원격 설치되는 메모리를 더 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 단말기기에 연결될 수 있다. 상기 네트워크의 구현은 인터넷, 기업내부망, 근거리통신망, 이통통신망 및 이들의 조합을 포함하나, 이에 한정되지 않는다.
입력장치(630)는 입력된 숫자 또는 문자 정보를 수신하고, 단말기의 사용자 설정 및 기능 제어에 관련되는 키신호 입력을 발생하도록 구성될 수 있다. 출력장치(640)는 디스플레이 등 표시기기를 포함할 수 있다.
상기 하나 또는 복수개의 모듈은 상기 메모리(620)에 저장되고, 상기 하나 또는 복수 개의 프로세서(610)에 의해 실행될 경우,
조회하고자 하는 문제를 수신하고,
상기 문제에 대해 어의적 분석을 진행하고,
상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고,
검색 처리 결과에 근거하여 답안을 회송하는 동작을 실행하되, 상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함한다.
나아가, 상기 문제에 대해 어의적 분석을 진행하는 동작은,
상기 문제의 초점, 관점 및 관점 유형을 식별하는 동작을 더 포함할 수 있다.
나아가, 상기 문제의 관점 유형을 식별한 이후, 상기 방법은,
상기 문제의 관점 유형에 대해 정규화 처리를 진행하는 동작을 더 포함할 수 있다.
나아가, 상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 동작은,
분석된 문제 유형이 구조적 의존 유형일 경우, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하고, 아니면, 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 동작을 포함할 수 있다.
나아가, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하는 동작은,
삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하는 동작을 포함할 수 있다.
나아가, 상기 삼항 관계 베이스를 구축하는 동작은,
네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하고,
의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하고,
상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하는 동작을 포함할 수 있다.
나아가, 의존관계를 구비하는 문장을 획득하기 이전에,
문장 중의 괄호 내의 내용을 제거하는 동작을 더 포함할 수 있다.
나아가, 삼항 관계 쌍을 획득하기 이전에,
상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하는 동작을 더 포함할 수 있다.
나아가, 상기 텍스트 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 동작은,
상기 문제에 관련되는 문서 집합을 검색하고,
상기 문서 집합으로부터 후보 답안을 포함하는 후보 세그먼트를 조회하고,
상기 후보 세그먼트로부터 상기 후보 답안을 추출하고 1차 정렬을 진행하는 동작을 포함할 수 있다.
나아가, 1차 정렬을 진행하는 동작은,
URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하는 동작을 포함할 수 있고, 여기서, 상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도이다.
나아가, 검색 처리 결과에 근거하여 답안을 회송하는 동작은,
분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하고,
필터링 결과에 근거하여 답안을 회송하는 동작을 포함할 수 있다.
나아가, 필터링 결과에 근거하여 답안을 회송하는 동작은,
상기 필터링 결과에 대해 2차 정렬을 진행하고,
정렬 후의 필터링 결과를 회송하는 동작을 포함할 수 있다.
나아가, 상기 필터링 결과에 대해 2차 정렬을 진행하는 동작은,
모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하는 동작을 포함할 수 있다.
나아가, 필터링 결과에 근거하여 답안을 회송하는 동작은,
상기 필터링 결과에 대해 3차 정렬을 진행하고, 정렬 후의 필터링 결과를 회송하는 동작을 포함할 수 있다.
나아가, 상기 필터링 결과에 대해 3차 정렬을 진행하는 동작은,
상기 후보 답안과 상기 문제의 매칭 정도를 검증하고,
상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하는 동작을 포함할 수 있다.
이상의 실시예들에 대한 설명을 통해, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 소프트웨어 및 필요한 일반 하드웨어로 실현되거나 하드웨어로 실현될 수 있으나, 일반적으로 전자가 더욱 바람직한 실시예임을 명확히 이해할 수 있을 것이다. 이러한 이해를 기반으로, 본 발명의 기술적 방안은 본질적으로 또는 기존기술에 대해 기여된 부분은 소프트웨어 제품의 형식으로 구현될 수 있고, 이러한 컴퓨터 소프트웨어 제품은 컴퓨터 판독 가능한 저장 매체, 예컨데 컴퓨터의 플로피 디스켓, 판독 전용 기억 장치(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 플래시 메모리(FLASH), 하드 드라이버 또는 컴팩트 디스크 등에 저장될 수 있으며, 하나의 컴퓨터 기기(개인 컴퓨터, 서버 또는 네트워크 기기 등일 수 있음)이 본 발명에 따른 각 실시예의 상기 방법을 실행할 수 있도록 복수개의 인스트럭션을 포함한다.
상기 지능 문답 구현 시스템의 실시예에 있어서, 포함되는 각 시스템은 단지 기능적 로직에 따라 구분될 뿐, 상기 구분에 한정되는 것이 아니고, 상응한 기능을 실현할 수만 있다면 임의의 구분될 수 있음을 유의하여야 한다. 또한, 각 기능 유닛의 구체적인 명칭은 단지 상호 구분의 편의를 위한 것일 뿐, 본 발명의 보호범위를 한정하기 위한 것이 아니다.
이상의 설명은 단지 본 발명의 구체적인 실시예일 뿐, 본 발명의 보호범위는 이에 한정되지 않으며, 본 발명이 속하는 기술분양의 통상의 지식을 가진 자는 본 발명에서 개시한 기술범위를 벗어나지 않고서 용이하게 생각해낼 수 있는 모든 변화 또는 대체는 모두 본 발명의 보호범위에 포함되어야 한다. 따라서, 본 발명의 보호범위는 이하의 청구범위로 정의하여야 한다.

Claims (31)

  1. 조회하고자 하는 문제를 수신하는 단계;
    상기 문제에 대해 어의적 분석을 진행하는 단계;
    상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계; 및
    검색 처리 결과에 근거하여 답안을 회송하는 단계를 포함하되,
    상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  2. 제1항에 있어서,
    상기 문제에 대해 어의적 분석을 진행하는 단계는,
    상기 문제의 초점, 관점 및 관점 유형을 식별하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  3. 제2항에 있어서,
    상기 문제의 관점 유형을 식별하는 단계 이후,
    상기 문제의 관점 유형에 대해 정규화 처리를 진행하는 단계를 더 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  4. 제1항 내지 제3항 중 임의의 한 항에 있어서,
    상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하는 단계는,
    분석된 문제 유형이 구조적 의존 유형일 경우, 상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하고, 아니면, 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  5. 제1항 내지 제3항 중 임의의 한 항에 있어서,
    상기 어의적 관계 마이닝 시스템으로 상기 문제에 대해 검색 처리를 진행하는 단계는,
    삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  6. 제5항에 있어서,
    상기 삼항 관계 베이스의 구축은,
    네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하는 단계;
    의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하는 단계; 및
    상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  7. 제6항에 있어서,
    의존관계를 구비하는 문장을 획득하기 이전에,
    문장 중의 괄호 내의 내용을 제거하는 단계를 더 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  8. 제6항 또는 제7항에 있어서,
    삼항 관계 쌍을 획득하기 이전에,
    상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하는 단계를 더 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  9. 제1항 내지 제3항 중 임의의 한 항에 있어서,
    상기 텍스트 베이스 검색 시스템으로 상기 문제에 대해 검색 처리를 진행하는 단계는,
    상기 문제에 관련되는 문서 집합을 검색하는 단계;
    상기 문서 집합으로부터 후보 답안을 포함하는 후보 세그먼트를 조회하는 단계; 및
    상기 후보 세그먼트로부터 상기 후보 답안을 추출하고 1차 정렬을 진행하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  10. 제9항에 있어서,
    1차 정렬을 진행하는 단계는,
    URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하는 단계를 포함하되,
    상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이고, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중의 키워드와의 거리계수이며,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도인 것을 특징으로 하는 지능 문답 구현 방법.
  11. 제1항 내지 제3항 중 임의의 한 항에 있어서,
    검색 처리 결과에 근거하여 답안을 회송하는 단계는,
    분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하는 단계; 및
    필터링 결과에 근거하여 답안을 회송하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  12. 제11항에 있어서,
    필터링 결과에 근거하여 답안을 회송하는 단계는,
    상기 필터링 결과에 대해 2차 정렬을 진행하는 단계; 및
    정렬 후의 필터링 결과를 회송하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  13. 제12항에 있어서,
    상기 필터링 결과에 대해 2차 정렬을 진행하는 단계는,
    모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  14. 제11항 내지 제13항에 있어서,
    필터링 결과에 근거하여 답안을 회송하는 단계는,
    상기 필터링 결과에 대해 3차 정렬을 진행하는 단계; 및
    정렬 후의 필터링 결과를 회송하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  15. 제14항에 있어서,
    상기 필터링 결과에 대해 3차 정렬을 진행하는 단계는,
    상기 후보 답안과 상기 문제의 매칭 정도를 검증하는 단계; 및
    상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하는 단계를 포함하는 것을 특징으로 하는 지능 문답 구현 방법.
  16. 조회하고자 하는 문제를 수신하도록 구성된 중앙 제어 시스템;
    상기 문제에 대해 어의적 분석을 진행하도록 구성된 문제 분석 시스템; 및
    어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템을 포함하는 후단 시스템을 포함하되,
    상기 중앙 제어 시스템은 상기 어의적 분석의 결과에 근거하여 상기 문제를 상응한 후단 시스템으로 배포하여 상응한 검색 처리를 진행하도록 더 구성되고,
    상기 중앙 제어 시스템은 검색 처리 결과에 근거하여 답안을 회송하도록 더 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  17. 제16항에 있어서,
    상기 문제 분석 시스템은 구체적으로 상기 문제의 초점, 관점 및 관점 유형을 식별하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  18. 제17항에 있어서,
    상기 문제 분석 시스템은 상기 문제의 관점 유형을 식별한 이후, 상기 문제의 관점 유형에 대해 정규화 처리를 진행하도록 더 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  19. 제16항 내지 제18항 중 임의의 한 항에 있어서,
    상기 중앙 제어 시스템은 구체적으로 분석된 문제 유형이 구조적 의존 유형일 경우, 상기 문제를 상기 어의적 관계 마이닝 시스템으로 배포하여 검색 처리를 진행하고, 아니면, 상기 문제를 상기 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템으로 배포하여 검색 처리를 진행하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  20. 제16항 내지 제18항 중 임의의 한 항에 있어서,
    상기 어의적 관계 마이닝 시스템은 구체적으로 삼항 관계 베이스로부터 상기 문제의 답안을 조회하여 획득하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  21. 제20항에 있어서,
    상기 어의적 관계 마이닝 시스템은,
    네트워크 중의 원 웹페이지에 대해 어법 분석을 진행하여 의존관계를 구비하는 문장을 획득하고,
    의존관계의 노드를 추출하여 삼항 관계 쌍을 획득하며,
    상기 삼항 관계 쌍에 대해 합리성 검증을 진행하고, 검증 통과된 삼항 관계 쌍을 이용하여 상기 삼항 관계 베이스를 구축하도록 더 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  22. 제21항에 있어서,
    상기 어의적 관계 마이닝 시스템은 의존관계를 구비하는 문장을 획득하기 이전에, 문장 중의 괄호 내의 내용을 제거하도록 더 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  23. 제21항 또는 제22항에 있어서,
    상기 어의적 관계 마이닝 시스템은 삼항 관계 쌍을 획득하기 이전에, 상기 의존관계를 구비하는 문장 중에 결여되는 주어, 부사어 및 목적어 중의 적어도 하나를 보충하도록 더 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  24. 제16항 내지 제18항 중 임의의 한 항에 있어서,
    상기 텍스트 베이스 검색 시스템은 구체적으로,
    상기 문제에 관련되는 문서 집합을 검색하고,
    상기 문서 집합으로부터 후보 답안을 포함하는 후보 세그먼트를 조회하며,
    상기 후보 세그먼트로부터 상기 후보 답안을 추출하여 1차 정렬을 진행하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  25. 제14항에 있어서,
    상기 텍스트 베이스 검색 시스템은 구체적으로 URL 가중치, 오프셋 가중치 및 문제 매칭도 중의 적어도 하나의 특징에 근거하여 정렬을 진행하도록 구성되되,
    상기 URL 가중치는 상기 후보 답안이 속하는 문서가 속하는 웹사이트와 URL 링크의 가중치이며, 상기 오프셋 가중치는 상기 후보 답안이 상이한 후보 세그먼트 중에서 상기 문제 중 키워드와의 거리계수이고,상기 문제 매칭도는 상기 후보 답안과 상기 문제의 관점 유형의 어의적 매칭도인 것을 특징으로 하는 지능 문답 구현 시스템.
  26. 제16항 내지 제18항 중 임의의 한 항에 있어서,
    상기 중앙 제어 시스템은 구체적으로,
    분야 내의 지식을 이용하여 상기 검색 처리 결과에 대해 필터링을 진행하고,
    필터링 결과에 근거하여 답안을 회송하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  27. 제26항에 있어서,
    상기 중앙 제어 시스템은 구체적으로,
    상기 필터링 결과에 대해 2차 정렬을 진행하고,
    정렬 후의 필터링 결과를 회송하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  28. 제27항에 있어서,
    상기 중앙 제어 시스템은 구체적으로, 모니터링을 구비하는 로봇 학습 모델을 사용하여 상기 필터링 결과에 대해 정렬을 진행하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  29. 제26항 내지 제28항 중 임의의 한 항에 있어서,
    상기 중앙 제어 시스템은 구체적으로,
    상기 필터링 결과에 대해 3차 정렬을 진행하고,
    정렬 후의 필터링 결과를 회송하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  30. 제29항에 있어서,
    상기 중앙 제어 시스템은 구체적으로,
    상기 후보 답안과 상기 문제의 매칭 정도를 검증하고,
    상기 매칭 정도에 근거하여 상기 후보 답안에 대해 정렬을 진행하도록 구성되는 것을 특징으로 하는 지능 문답 구현 시스템.
  31. 하나 또는 복수 개의 모듈이 저장되어 있는 비휘발성 컴퓨터 저장 매체에 있어서,
    상기 하나 또는 복수 개의 모듈이 지능 문답 구현 방법을 실행하는 기기에 의해 실행될 경우, 상기 기기로 하여금,
    조회하고자 하는 문제를 수신하고,
    상기 문제에 대해 어의적 분석을 진행하고,
    상기 어의적 분석의 결과에 근거하여 상기 문제에 대해 상응한 검색 처리를 진행하고,
    검색 처리 결과에 근거하여 답안을 회송하도록 하되,
    상기 검색 처리는 어의적 관계 마이닝 시스템, 텍스트 베이스 검색 시스템, 지식 베이스 검색 시스템 및 문답 베이스 검색 시스템 중의 적어도 하나의 시스템으로 상기 문제에 대해 진행하는 검색 처리를 포함하는 것을 특징으로 하는 비휘발성 컴퓨터 저장 매체.
KR1020167022492A 2015-01-14 2015-08-05 지능 문답 구현 방법, 시스템 및 저장 매체 KR101895249B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510017563.6A CN104573028B (zh) 2015-01-14 2015-01-14 实现智能问答的方法和系统
CN201510017563.6 2015-01-14
PCT/CN2015/086094 WO2016112679A1 (zh) 2015-01-14 2015-08-05 实现智能问答的方法、系统和存储介质

Publications (2)

Publication Number Publication Date
KR20160125375A true KR20160125375A (ko) 2016-10-31
KR101895249B1 KR101895249B1 (ko) 2018-09-05

Family

ID=53089090

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167022492A KR101895249B1 (ko) 2015-01-14 2015-08-05 지능 문답 구현 방법, 시스템 및 저장 매체

Country Status (6)

Country Link
US (1) US10242049B2 (ko)
EP (1) EP3096246A4 (ko)
JP (1) JP6309644B2 (ko)
KR (1) KR101895249B1 (ko)
CN (1) CN104573028B (ko)
WO (1) WO2016112679A1 (ko)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699689B (zh) * 2014-01-09 2017-02-15 百度在线网络技术(北京)有限公司 事件知识库的构建方法及装置
CN104573028B (zh) 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN104881446A (zh) * 2015-05-14 2015-09-02 百度在线网络技术(北京)有限公司 搜索方法及装置
CN104933097B (zh) * 2015-05-27 2019-04-16 百度在线网络技术(北京)有限公司 一种用于检索的数据处理方法和装置
CN104850539B (zh) * 2015-05-28 2017-08-25 宁波薄言信息技术有限公司 一种自然语言理解方法及基于该方法的旅游问答系统
CN109241266B (zh) * 2015-07-23 2020-09-11 上海智臻智能网络科技股份有限公司 人机交互中基于标准问创建扩展问的方法和装置
CN105243120A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN105653576A (zh) * 2015-12-16 2016-06-08 上海智臻智能网络科技股份有限公司 信息搜索的方法及装置、人工座席服务方法及系统
CN105549949A (zh) * 2015-12-18 2016-05-04 合肥寰景信息技术有限公司 一种网络社区的语音帮助提示方法
CN105589844B (zh) * 2015-12-18 2017-08-08 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法
CN105653671A (zh) * 2015-12-29 2016-06-08 畅捷通信息技术股份有限公司 相似信息推荐方法及系统
CN105677896B (zh) * 2016-02-03 2019-08-02 北京光年无限科技有限公司 基于主动学习的交互方法及交互系统
CN105786794B (zh) * 2016-02-05 2018-09-04 青岛理工大学 一种问答对检索方法及社区问答检索系统
CN105843875B (zh) * 2016-03-18 2019-09-13 北京光年无限科技有限公司 一种面向智能机器人的问答数据处理方法及装置
CN105912645B (zh) * 2016-04-08 2019-03-05 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
CN105868179B (zh) * 2016-04-08 2018-07-13 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
US10902330B2 (en) * 2016-06-21 2021-01-26 International Business Machines Corporation Cognitive question answering pipeline calibrating
CN107818092B (zh) * 2016-09-12 2023-05-26 百度在线网络技术(北京)有限公司 文档处理方法及装置
CN106529268B (zh) * 2016-11-14 2019-05-24 上海智臻智能网络科技股份有限公司 一种校验方法及装置
CN106649761A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的搜索结果展现方法和装置
CN106649778B (zh) * 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN106844512B (zh) * 2016-12-28 2020-06-19 竹间智能科技(上海)有限公司 智能问答方法及系统
US10268680B2 (en) 2016-12-30 2019-04-23 Google Llc Context-aware human-to-computer dialog
CN106826876A (zh) * 2017-01-18 2017-06-13 北京爱情说科技有限公司 一种智能行动机器人
CN108345608A (zh) * 2017-01-24 2018-07-31 北京搜狗科技发展有限公司 一种搜索方法、装置及设备
CN108319627B (zh) * 2017-02-06 2024-05-28 腾讯科技(深圳)有限公司 关键词提取方法以及关键词提取装置
CN106874441B (zh) * 2017-02-07 2024-03-05 腾讯科技(上海)有限公司 智能问答方法和装置
CN106997376B (zh) * 2017-02-28 2020-12-08 浙江大学 一种基于多级特征的问题和答案句子相似度计算方法
CN106911812A (zh) * 2017-05-05 2017-06-30 腾讯科技(上海)有限公司 一种会话信息的处理方法、服务器及计算机可读存储介质
CN107977393A (zh) * 2017-05-22 2018-05-01 海南大学 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法
CN107329995B (zh) * 2017-06-08 2018-03-23 北京神州泰岳软件股份有限公司 一种语义受控的答案生成方法、装置及系统
CN107436916B (zh) * 2017-06-15 2021-04-27 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107248937A (zh) * 2017-06-30 2017-10-13 北京百度网讯科技有限公司 一种基于物联网的与用户进行交互的方法与系统
CN107506411A (zh) * 2017-08-10 2017-12-22 熊英 一种安全可信的知识服务方法与系统
CN107741976B (zh) * 2017-10-16 2021-07-09 泰康保险集团股份有限公司 智能应答方法、装置、介质和电子设备
US10691764B2 (en) * 2017-10-23 2020-06-23 International Business Machines Corporation Search engine optimization techniques
CN107766511A (zh) * 2017-10-23 2018-03-06 深圳市前海众兴电子商务有限公司 智能问答方法、终端及存储介质
CN110019705A (zh) * 2017-10-31 2019-07-16 北京搜狗科技发展有限公司 一种信息处理方法、装置和用于信息处理的装置
CN109829037A (zh) * 2017-11-22 2019-05-31 上海智臻智能网络科技股份有限公司 智能自动问答的方法、系统、服务器及存储介质
CN107895037B (zh) * 2017-11-28 2022-05-03 北京百度网讯科技有限公司 一种问答数据处理方法、装置、设备和计算机可读介质
JP7024364B2 (ja) * 2017-12-07 2022-02-24 富士通株式会社 特定プログラム、特定方法および情報処理装置
CN108304466B (zh) * 2017-12-27 2022-01-11 中国银联股份有限公司 一种用户意图识别方法以及用户意图识别系统
CN108170792B (zh) * 2017-12-27 2021-12-28 北京百度网讯科技有限公司 基于人工智能的问答引导方法、装置和计算机设备
US11663249B2 (en) * 2018-01-30 2023-05-30 Intel Corporation Visual question answering using visual knowledge bases
CN110569335B (zh) 2018-03-23 2022-05-27 百度在线网络技术(北京)有限公司 基于人工智能的三元组校验方法、装置及存储介质
CN108932278B (zh) * 2018-04-28 2021-05-18 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN108737530A (zh) * 2018-05-11 2018-11-02 深圳双猴科技有限公司 一种内容分享方法及系统
CN108491394A (zh) * 2018-06-27 2018-09-04 杭州贝店科技有限公司 一种语义分析方法、装置、计算机设备及存储介质
US10997222B2 (en) * 2018-06-29 2021-05-04 International Business Machines Corporation Conversational agent dialog flow user interface
CN109147934B (zh) * 2018-07-04 2023-04-11 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN110851560B (zh) * 2018-07-27 2023-03-10 杭州海康威视数字技术股份有限公司 信息检索方法、装置及设备
CN109242412B (zh) * 2018-08-14 2021-12-07 贵州华宁科技股份有限公司 考务管理系统
CN109189906A (zh) * 2018-08-17 2019-01-11 国家电网有限公司客户服务中心 智能客服对连贯语境下多问句完整语义的识别方法
CN109147793B (zh) * 2018-08-17 2020-11-10 南京星邺汇捷网络科技有限公司 语音数据的处理方法、装置及系统
CN110874400B (zh) * 2018-08-31 2023-06-13 比亚迪股份有限公司 在线客服的应答方法和装置、车辆客户端、客服服务端
CN109299231B (zh) * 2018-09-14 2020-10-30 苏州思必驰信息科技有限公司 对话状态跟踪方法、系统、电子设备及存储介质
CN109271459B (zh) * 2018-09-18 2021-12-21 四川长虹电器股份有限公司 基于Lucene和文法网络的聊天机器人及其实现方法
CN110931137B (zh) 2018-09-19 2023-07-07 京东方科技集团股份有限公司 机器辅助对话系统、方法及装置
CN109472305A (zh) * 2018-10-31 2019-03-15 国信优易数据有限公司 答案质量确定模型训练方法、答案质量确定方法及装置
CN109359215B (zh) * 2018-12-03 2023-08-22 江苏曲速教育科技有限公司 视频智能推送方法和系统
CN109740077B (zh) * 2018-12-29 2021-02-12 北京百度网讯科技有限公司 基于语义索引的答案搜索方法、装置及其相关设备
CN109739969A (zh) * 2018-12-29 2019-05-10 联想(北京)有限公司 答案生成方法和智能会话系统
US11132390B2 (en) * 2019-01-15 2021-09-28 International Business Machines Corporation Efficient resolution of type-coercion queries in a question answer system using disjunctive sub-lexical answer types
TWI703456B (zh) * 2019-01-19 2020-09-01 亞太智能機器有限公司 智能推薦系統與智能推薦方法
CN109918486B (zh) * 2019-01-24 2024-03-19 平安科技(深圳)有限公司 智能客服的语料构建方法、装置、计算机设备及存储介质
CN109783631B (zh) * 2019-02-02 2022-05-17 北京百度网讯科技有限公司 社区问答数据的校验方法、装置、计算机设备和存储介质
CN109885660B (zh) * 2019-02-22 2020-10-02 上海乐言信息科技有限公司 一种知识图谱赋能的基于信息检索的问答系统和方法
CN109960757A (zh) * 2019-02-27 2019-07-02 北京搜狗科技发展有限公司 网页检索方法及装置
CN109977204A (zh) * 2019-03-08 2019-07-05 科讯嘉联信息技术有限公司 一种基于知识库的智能问答系统和方法
CN110175585B (zh) * 2019-05-30 2024-01-23 北京林业大学 一种简答题自动批改系统及方法
CN110209768B (zh) * 2019-05-31 2021-08-10 中国联合网络通信集团有限公司 自动问答的问题处理方法和装置
CN112015852A (zh) * 2019-05-31 2020-12-01 微软技术许可有限责任公司 在关于事件的会话中提供响应
CN110176315B (zh) * 2019-06-05 2022-06-28 京东方科技集团股份有限公司 医疗问答方法及系统、电子设备、计算机可读介质
CN110377831B (zh) * 2019-07-25 2022-05-17 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110457459B (zh) * 2019-08-16 2022-04-08 达闼机器人有限公司 基于人工智能的对话生成方法、装置、设备及存储介质
CN110569343B (zh) * 2019-08-16 2023-05-09 华东理工大学 一种基于问答的临床文本结构化方法
CN110674271B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种问答处理方法及装置
CN110929016A (zh) * 2019-12-10 2020-03-27 北京爱医生智慧医疗科技有限公司 一种基于知识图谱的智能问答方法及装置
CN111160030B (zh) * 2019-12-11 2023-09-19 北京明略软件系统有限公司 一种信息抽取方法、装置、及存储介质
CN113051390B (zh) * 2019-12-26 2023-09-26 百度在线网络技术(北京)有限公司 知识库构建方法、装置、电子设备和介质
CN111125335B (zh) * 2019-12-27 2021-04-06 北京百度网讯科技有限公司 问答处理方法、装置、电子设备和存储介质
CN111340233B (zh) * 2020-02-20 2022-08-09 支付宝(杭州)信息技术有限公司 机器学习模型的训练方法及装置、样本处理方法及装置
CN111708870A (zh) * 2020-05-27 2020-09-25 盛视科技股份有限公司 基于深度神经网络的问答方法、装置及存储介质
CN111708873B (zh) * 2020-06-15 2023-11-24 腾讯科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
US11907670B1 (en) 2020-07-14 2024-02-20 Cisco Technology, Inc. Modeling communication data streams for multi-party conversations involving a humanoid
US11875362B1 (en) 2020-07-14 2024-01-16 Cisco Technology, Inc. Humanoid system for automated customer support
CN111859985B (zh) * 2020-07-23 2023-09-12 上海华期信息技术有限责任公司 Ai客服模型测试方法、装置、电子设备及存储介质
CN111858896B (zh) * 2020-07-30 2024-03-29 上海海事大学 一种基于深度学习的知识库问答方法
CN112101040B (zh) * 2020-08-20 2024-03-29 淮阴工学院 一种基于知识图谱的古代诗词语义检索方法
CN111931507A (zh) * 2020-08-21 2020-11-13 贝壳技术有限公司 获取用于实现会话的多元组集合方法、装置、介质及设备
CN112118311B (zh) * 2020-09-17 2023-10-27 阿波罗智联(北京)科技有限公司 信息车载交互方法、装置、设备以及存储介质
CN111831812B (zh) * 2020-09-21 2020-12-15 北京智源人工智能研究院 基于知识图谱的阅读理解数据集自动生成方法和设备
CN112256847B (zh) * 2020-09-30 2023-04-07 昆明理工大学 融合事实文本的知识库问答方法
US20220138170A1 (en) * 2020-10-29 2022-05-05 Yext, Inc. Vector-based search result generation
CN112035730B (zh) * 2020-11-05 2021-02-02 北京智源人工智能研究院 一种语义检索方法、装置及电子设备
CN112380328B (zh) * 2020-11-11 2024-02-06 广州知图科技有限公司 一种安全应急响应机器人交互方法及系统
CN112417100A (zh) * 2020-11-20 2021-02-26 大连民族大学 辽代历史文化领域知识图谱及其智能问答系统的构建方法
CN112417104B (zh) * 2020-12-04 2022-11-11 山西大学 一种句法关系增强的机器阅读理解多跳推理模型及方法
CN112541362B (zh) * 2020-12-08 2022-08-23 北京百度网讯科技有限公司 一种泛化处理的方法、装置、设备和计算机存储介质
CN112749265B (zh) * 2021-01-08 2022-08-19 哈尔滨工业大学 一种基于多信息源的智能问答系统
CN112948546B (zh) * 2021-01-15 2021-11-23 中国科学院空天信息创新研究院 面向多源异构数据源的智能问答方法及装置
CN113076466B (zh) * 2021-02-26 2024-05-24 广东电网有限责任公司广州供电局 一种最佳答案和兴趣感知推荐方法
CN113157885B (zh) * 2021-04-13 2023-07-18 华南理工大学 一种面向人工智能领域知识的高效智能问答系统
CN113094519B (zh) * 2021-05-07 2023-04-14 超凡知识产权服务股份有限公司 一种基于文档进行检索的方法及装置
CN113486152A (zh) * 2021-07-16 2021-10-08 上海淇馥信息技术有限公司 一种业务知识库构建方法、装置和电子设备
CN113722452B (zh) * 2021-07-16 2024-01-19 上海通办信息服务有限公司 一种问答系统中基于语义的快速知识命中方法及装置
WO2024015323A1 (en) * 2022-07-11 2024-01-18 Pryon Incorporated Methods and systems for improved document processing and information retrieval
CN115757727A (zh) * 2022-11-17 2023-03-07 北京语言大学 一种基于语法点进行检索的方法、装置及文心检索平台
CN116756347B (zh) * 2023-08-21 2023-10-27 中国标准化研究院 一种基于大数据的语义信息检索方法
CN116911312B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 一种任务型对话系统及其实现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040099109A (ko) * 2004-01-15 2004-11-26 엔에이치엔(주) 웹사이트 검색 서비스 제공 방법 및 그 시스템
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions
US20110301941A1 (en) * 2009-03-20 2011-12-08 Syl Research Limited Natural language processing method and system
US20140358890A1 (en) * 2013-06-04 2014-12-04 Sap Ag Question answering framework

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
ES2173716T3 (es) 1999-04-12 2002-10-16 Cit Alcatel Control de potencia mejorado, adaptable canales y rapido en cdma.
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
US7827125B1 (en) * 2006-06-01 2010-11-02 Trovix, Inc. Learning based on feedback for contextual personalized information retrieval
US20100318558A1 (en) * 2006-12-15 2010-12-16 Aftercad Software Inc. Visual method and system for rdf creation, manipulation, aggregation, application and search
JP5283208B2 (ja) * 2007-08-21 2013-09-04 国立大学法人 東京大学 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
US9396262B2 (en) * 2007-10-12 2016-07-19 Lexxe Pty Ltd System and method for enhancing search relevancy using semantic keys
JP5311002B2 (ja) * 2008-06-30 2013-10-09 日本電気株式会社 質問回答検索システム及びその方法とプログラム
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
WO2012047530A1 (en) * 2010-09-28 2012-04-12 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
JP5315368B2 (ja) * 2011-02-28 2013-10-16 株式会社日立製作所 文書処理装置
US8747115B2 (en) * 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
TWI469119B (zh) * 2012-08-06 2015-01-11 Au Optronics Corp 顯示器及其閘極驅動器
CN103914543B (zh) 2014-04-03 2017-12-26 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN104252533B (zh) * 2014-09-12 2018-04-13 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104199965B (zh) * 2014-09-22 2020-08-07 吴晨 一种语义信息检索方法
CN104573028B (zh) 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040099109A (ko) * 2004-01-15 2004-11-26 엔에이치엔(주) 웹사이트 검색 서비스 제공 방법 및 그 시스템
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions
US20110301941A1 (en) * 2009-03-20 2011-12-08 Syl Research Limited Natural language processing method and system
US20140358890A1 (en) * 2013-06-04 2014-12-04 Sap Ag Question answering framework

Also Published As

Publication number Publication date
CN104573028A (zh) 2015-04-29
CN104573028B (zh) 2019-01-25
KR101895249B1 (ko) 2018-09-05
JP6309644B2 (ja) 2018-04-11
US20170308531A1 (en) 2017-10-26
JP2017511922A (ja) 2017-04-27
EP3096246A1 (en) 2016-11-23
EP3096246A4 (en) 2017-11-29
WO2016112679A1 (zh) 2016-07-21
US10242049B2 (en) 2019-03-26

Similar Documents

Publication Publication Date Title
KR101895249B1 (ko) 지능 문답 구현 방법, 시스템 및 저장 매체
Dunn et al. Searchqa: A new q&a dataset augmented with context from a search engine
CN106663125B (zh) 提问句生成装置以及记录介质
US8756245B2 (en) Systems and methods for answering user questions
Cafarella et al. Structured data on the web
CN102262634B (zh) 一种自动问答方法及系统
US7933914B2 (en) Automatic task creation and execution using browser helper objects
CN102955848B (zh) 一种基于语义的三维模型检索系统和方法
CN104516949B (zh) 网页数据处理方法和装置、查询处理方法及问答系统
WO2017181834A1 (zh) 一种智能问答方法及装置
CN109960786A (zh) 基于融合策略的中文词语相似度计算方法
CN110443571A (zh) 基于知识图谱进行简历评估的方法、装置及设备
CN102597991A (zh) 文档分析与关联系统及方法
CN103229223A (zh) 使用多个候选答案评分模型提供问题答案
Van de Camp et al. The socialist network
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
CN105760514B (zh) 一种从社区问答网站自动获取知识领域短文本的方法
CN106164889A (zh) 用于内存数据库搜索的系统和方法
CN104484380A (zh) 个性化搜索方法及装置
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
Dulceanu et al. PhotoshopQuiA: A corpus of non-factoid questions and answers for why-question answering
Ritze Web-scale web table to knowledge base matching
Sunercan et al. Wikipedia missing link discovery: A comparative study
Damljanovic Natural language interfaces to conceptual models
US9984684B1 (en) Inducing command inputs from high precision and high recall data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant