JP2017511922A - スマート質問回答の実現方法、システム、および記憶媒体 - Google Patents

スマート質問回答の実現方法、システム、および記憶媒体 Download PDF

Info

Publication number
JP2017511922A
JP2017511922A JP2016552590A JP2016552590A JP2017511922A JP 2017511922 A JP2017511922 A JP 2017511922A JP 2016552590 A JP2016552590 A JP 2016552590A JP 2016552590 A JP2016552590 A JP 2016552590A JP 2017511922 A JP2017511922 A JP 2017511922A
Authority
JP
Japan
Prior art keywords
answer
search
candidate
question
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016552590A
Other languages
English (en)
Other versions
JP6309644B2 (ja
Inventor
マ,ヤンジン
リー,グオファ
サン,シンウ
リー,シンジャン
チャン,ウェイメン
ウェイ,ハオジ
リョウ,メン
ゾン,ミン
チャン,シファン
ウー,ファ
ワン,ハイフン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2017511922A publication Critical patent/JP2017511922A/ja
Application granted granted Critical
Publication of JP6309644B2 publication Critical patent/JP6309644B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本発明の実施例は、スマート質問回答の実現方法、システム、および記憶媒体を提供する。当該方法は、クエリの問題を受信するステップと、前記問題に対して意味解析を行うステップと、意味解析の結果に基づいて、前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、検索処理の結果に基づいて解答を返すステップとを含み、問題に答える場合の精度を効果的に向上させた。【選択図】図1b

Description

本特許出願は、2015年1月14日に提出された出願番号が201510017563.6で、出願人が百度在線網絡技術(北京)有限公司で、発明の名称が「スマート質問回答の実現方法、およびシステム」である中国特許出願に基づき優先権を主張し、当該出願の内容の全てを本出願に援用する。
本発明の実施例は、情報クエリの技術分野に関し、特に、スマート質問回答の実現方法、システム、および記憶媒体に関する。
スマート質問回答システムは、大規模なインターネットデータの推論、および言語に対する深い意味理解に基づくスマートシステムである。スマート質問回答システムは、知識類の問題に答えることができるだけでなく、医療、教育、生活、および科学技術などの人々の生活と緊密な関係にある様々な領域にも用いでき、情報を取得する効率を大幅に高めてきている。
従来のスマート質問回答システムは、主にコミュニティに基づく質問回答に関し、ユーザ問題および回答の履歴データを発掘することによって、ユーザ問題と質問回答サイトにおける既存の問題の間の類似度を計算し、類似度の高いユーザ回答を返すものである。
上記スマート質問回答システムは、質問回答サイトのスマート質問回答システムに頼り、問題に対するカバー率が低くて発生頻度の高くない問題、および人気のない問題を持っているユーザの需要に対応できず、回答が参差として(ばらばらで)揃わなく、与えられた解答が十分に正確ではないという欠陥が存在した。
本発明の実施例は、問題に答える精度を向上させるために、スマート質問回答の実現方法、システム、および記憶媒体を提供する。
第1の態様において、本発明の実施例は、
クエリの問題を受信するステップと、
前記問題に対して意味解析を行うステップと、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、
検索処理の結果に基づいて解答を返すステップと、
を含むスマート質問回答の実現方法を提供する。
第2の態様において、本発明の実施例は、
クエリの問題を受信するために構成される中央制御システムと、
前記問題に対して意味解析を行うために構成される問題解析システムと、を備え、
前記中央制御システムは、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成され、
前記バックエンドシステムは、発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを備え、
前記中央制御システムは、さらに、検索処理の結果に基づいて解答を返すために構成されるスマート質問回答の実現システムを提供する。
第3の態様において、本発明の実施例は、
1つ以上のモジュールが記憶される不揮発性コンピュータ記憶媒体であって、前記1つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返すように実行させる、
不揮発性コンピュータ記憶媒体を提供する。
本発明の実施例に係るスマート質問回答の実現方法、システム、および記憶媒体は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題に関する解答の検索範囲を広げ、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を行なって正確な解答を得ることが可能になり、問題に答える精度を効果的に向上させた。
以下、本発明の実施例の技術案をより明確に説明するために、実施例の説明に必要な図面を簡単に説明し、勿論、後述する図面が単に本発明のいくつかの実施例に過ぎず、当業者にとっては、創造的な労働をせずに、それらの図面を変更し、置換することができる。
本発明の実施例に係るスマート質問回答の実現方法に適用されるスマート質問回答の実現システムのネットワークアーキテクチャの模式図である。 本発明の実施例1に係るスマート質問回答の実現方法のフローチャートである。 本発明の実施例2に係るスマート質問回答の実現方法のフローチャートである。 本発明の実施例2に係るスマート質問回答の実現方法において三項関係ベースを確立するフローチャートである。 本発明の実施例3に係るスマート質問回答の実現方法において正文ベース検索システムが問題に対して検索処理を行うフローチャートである。 本発明の実施例4に係るスマート質問回答の実現方法において検索処理の結果に基づいて解答を返すフローチャートである。 本発明の実施例5に係るスマート質問回答の実現システムの構造模式図である。 本発明の実施例7に係るスマート質問回答の実現方法を実行する機器のハードウェア構造模式図である。
以下、図面を参照しながら本発明の実施例の技術案を明確で十分に説明するが、説明される実施例は、本発明の実施例の全てではなく、実施例の一部であり、且つ本発明を限定しなく、本発明の原理を説明するためのものであることは明らかである。本発明の実施例に基づき、当業者が創造的な労働をせずに得るほかの実施例は、いずれも本発明が保護しようとする保護範囲に属する。
本発明の実施例に係る方法は、ハードウェアおよび/またはソフトウェアで実現されるスマート質問回答の実現システムにより実行されることができる。
以下、明らかにするために、図1aに合わせて、まず当該システムのネットワークアーキテクチャを説明する。当該システムは、中央制御システム、問題解析システム、およびバックエンドシステムを含む。
そのうち、前記中央制御システムは、クエリの問題(すなわち、図1aのquery)を受信するために構成され、設定されたテキストボックスによりユーザから入力されたクエリの問題を受信してもよく、また、設定された動作ボタンによりユーザから入力されたクエリの問題を受信してもよく、例えば、ユーザ音声を受信するための動作ボタンによりユーザから入力された音声を受信し、音声認識により入力された音声に対応した内容を得てクエリの問題とする。前記問題解析システムは、前記問題に対して意味解析を行うために構成される。前記中央制御システムは、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成される。前記バックエンドシステムは、意味関係(Frame)発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを含む。前記中央制御システムは、さらに、検索処理の結果に基づいて解答(すなわち、図1aのMerge後の結果)を返すために構成される。
説明する必要があるのは、前記中央制御システムは、前記スマート質問回答の実現システムにおける中核制御システムであり、クエリの問題を受信し、前記問題を問題解析システムに転送し、そして前記問題解析システムによる意味解析の結果により、予め設定された配布ポリシーに基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行う役割を担い、具体的には、前記問題を意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムに配布して対応の検索処理を行なってから、検索処理の結果に基づいて解答を返し、中央制御システムのフロントエンド・ユーザに、前記クエリの問題に対応した解答を知らせ、スマート質問回答を実現する。
そのうち、異なるバックエンドシステムは、異なる資源プールに対応しており、これについては、下記の実施例において詳細に説明する。また、配布ポリシーについても後述する。
(実施例1)
図1bに示すように、本実施例に係るスマート質問回答の実現方法は、ステップ110〜ステップ140を含む。
ステップ110では、クエリの問題を受信する。
当該ステップにおいて、中央制御システムによりクエリの問題を受信する。ユーザインタフェースにおいて設定されたテキストボックスによりユーザから入力されたクエリの問題を受信してもよく、また、ユーザインタフェースにおいて設定された動作ボタンによりユーザから入力されたクエリの問題を受信してもよく、例えば、ユーザ音声を受信するための動作ボタンによりユーザから入力された音声を受信し、音声認識により入力された音声に対応した内容を得てクエリの問題とする。
説明する必要があるのは、受信される前記クエリの問題のカバー範囲は、非常に広くてもよく、言い換えると、任意の問題であってもよく、発生頻度が高いである、ユーザが関心を持っている問題であってもよければ、発生頻度が中等ぐらいである、質問回答システムで提供された既存の解答に対するユーザの満足度が低い問題であってもよく、さらに、人気のない問題、すなわち発生頻度が非常に低い問題であってもよい。
ステップ120では、前記問題に対して意味解析を行う。
当該ステップは、問題解析システムにより実行され、前記問題に対して基礎的な形態論(品詞論)解析を行うことができ、前記基礎的な形態論解析は、前記問題に対する単語分割処理および品詞タグ付け処理を含んでもよく、さらに、前記問題における検索語の重要性の確定および前記問題に対する依存関係構文解析等を含んでもよい。
そのうち、依存関係構文は、最初にフランス言語学者L.Tesniereが1959年にその著作『構造的統語論の基礎』により提出したものであり、言語学の発展に対して深い影響を与えてきており、依存関係構文解析は、自然言語処理の分野における構文解析の重要な分枝の1つとなっている。依存関係文法解析は、文(センテンス)を依存関係構文木として解析し、各語彙の間の依存関係を述べることによって、文の構文構造を解明するものであり、文における中核動詞が他の成分を支配する中心成分であるが、中核動詞自体が他の成分のいずれにも支配されておらず、被支配成分のいずれも、ある依存関係によって支配者に従属していることを主張する。
当該ステップにおいて、前記問題に対して基礎的な文法解析を行う以外、さらに、好ましくは、前記問題の焦点、観点および観点類型を認識することを含んでもよい。
そのうち、前記問題の焦点は、問題の解答の援用であり、解答の代わりに完全な平叙文を構成するために用いられることができる。例えば、「2013年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題の焦点は「誰か」となっている。前記問題の焦点は、主に規則により認識され、当該認識規則は、前記問題が疑問詞付き問題である場合、前記問題の焦点が当該疑問詞となり、前記問題が疑問詞のない問題である場合、前記問題の焦点がデフォルトとしてヌル(Null)となることであってもよい。
そのうち、前記問題の観点を認識することとは、前記問題の観点の個数、すなわち前記問題に含まれる観点の数を認識することを指す。前記問題の観点の数は、汎用需要(その観点の個数が一般的に8個より大きい)であってもよく、具体的な数であってもよい。例えば、「野生動物は、どれとどれがいるか」という問題の観点の数は、何千何万もあり、それぞれ異なる野生動物に対応しているため、当該問題の観点は汎用需要と定義され、また、例えば、「中国古代の有名な四大美人」という問題では、「四大」に言及しているため、その観点の個数が4となり、さらに、例えば、「2013年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、現在の問題のコンテキストにより、優勝者が個人であるため、その観点の個数が1となっている。
そのうち、前記質問の観点類型を認識することとは、ユーザの所望する観点がどんな類型に属するかを認識することを指す。例えば、「2013年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、その問題の観点類型が「優勝者」となっている。問題の観点類型の認識方法は、規則認識方法とモデル学習モデルとの2種類に分けられ、規則認識方法において、観点類型が焦点の前の1つの語彙であり、モデル学習モデルにおいて、依存関係構文解析などのツールを基にして訓練言語資料および訓練モデル動態を生成することによって問題の観点類型を認識する。
さらに、前記問題の観点類型を認識した後には、前記問題の観点類型に対して正規化処理を行うことをさらに含んでもよい。
問題の観点類型の正規化は、問題の観点類型を固定類別体系にマッピングすることである。例えば、「2013年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、焦点が「誰か」であり、観点類型が「優勝者」であるため、類別の「人物」に正規化される。問題の観点類型の正規化方法は、一般的に観点規則または観点用語集に基づいて正規化する。
ステップ130において、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行う。
前記したように、当該ステップは、中央制御システムおよびバックエンドシステムにより実行され、具体的には、前記問題解析システムによる意味解析の結果に応じて、予め設定された配布ポリシーに基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行い、具体的には、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムに、前記問題を配布して対応の検索処理を行う。
上記各種のバックエンドシステムは、単独で実行されてもよく、組み合わせて採用されてもよい。
そのうち、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うために準拠された配布ポリシーは、解析された問題の類型が構造的な依存類型(すなわち、「前の文/次の文」という類型)である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うことを含んでもよい。
説明する必要があるのは、各バックエンドシステムの前記問題に対する検索処理が互いに独立したものである。
以下、異なるバックエンドシステムに対応する資源プールのそれぞれについて説明する。
意味関係発掘システムの資源プールは、逆配列索引ライブラリと、Kv(Key Value、すなわち、キー値)資源プールとの2つの部分を含んでもよく、当該逆配列索引ライブラリおよびKv資源プールは、オフラインドキュメント処理プログラムにより構築されることができる。そのうち、通常、ドキュメント集合において多くのドキュメントにある単語を含み、各ドキュメントは、ドキュメント番号、単語がこのドキュメントに現した回数およびどの位置に現したなどの情報を記録しており、このような1つのドキュメントに関連する情報は、逆配列索引と称される。逆配列索引を利用すれば、検索効率を向上させることができる。Kv資源プールは、発掘された詩詞種類の資源および歌詞などの資源などを含んで、依存関係類型の問題を処理するために構成されてもよい。
正文ベース検索システムの資源プールは、正文ベースおよびKv資源プールを含んでもよい。そのうち、正文ベースは、検索エンジンによる大規模の非構造化ウェブページに対する索引、解析およびランキングの技術に基づいて、大規模の非構造化ウェブページデータから確立されたものである。Kv資源プールは、「百度百科」および「ウィキペディア(wiki)百科」等の文庫に基づいて確立されたものである。大規模の非構造化ウェブページデータと、百度百科およびウィキペディア百科等の文庫とが豊富な知識を含んでいるため、正文ベース検索システムは、バックエンドシステム全体の中核となり、すなわち、スマート質問回答を実現する中核処理システムとなり、ユーザから入力されたクエリの問題に対する解答検索を実現することができる。
知識ベース検索システムの資源プールは、オフラインで発掘された構造化知識ベースであってもよく、<エンティティ、属性、値>という三要素セット、例えば<張三、女房、美人>、<美人、星座、牡羊座>、<アバター、製作者、ジェームス・キャメロン>等として記憶されており、知識ベース情報を基にして推理する役割を担っている。例えば、「張三の女房はどの星座であるか」という問題の場合、張三の女房が美人で美人の星座が牡羊座であることに基づいて推理すると、当該問題の解答は「牡羊座」となる。
質問回答ベース検索システムの資源プールは、オフラインで発掘された高品質の質問回答データ、例えば「百度知道」における履歴のユーザ問題と回答に基づいて形成された質問回答コミュニティ資源プールであってもよい。質問回答ベース検索システムの処理フローは、正文ベース検索システムの処理フローに類似し、下記の実施例3では、正文ベース検索システムの具体的な処理フローについて詳細に説明する。
ステップ140において、検索処理の結果に基づいて解答を返す。
本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題の解答に関する検索範囲を広げて、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を行なって正確な解答を得ることが可能になり、問題に答える場合の精度を効果的に向上させた。
本発明の実施例に係るスマート質問回答の実現方法の実行主体は、クラウドシステムとされてもよく、任意外形のロボットに組み込んで、あらゆる質問回答種類の場面に適用されてもよい。例えば、宿題を補導することに適用される場合、学生はよく知らないナレッジポイントについてスマート質問回答の実現システムに、例えば、「万有引力の法則の創立者は誰か、その創立の意義は何か」と直接対話してもよく、これでより全面的かつ有用な情報の補導が得られる。また、例えば、公共の場所での自動的カスタマーサービスに適用される場合、マーケットにいる際に、または服を選択しようとする際に、スマート質問回答の実現システムと対話して天然繊維と化学繊維とどちらのほうがよいのか、それぞれなにかの長所や短所があるかという情報を知ることができる。あるいは、公園を見物する場合、観光客はスマート質問回答の実現システムと対話して、マイカイの開花期などの情報を知ることができる。さらに、例えば、医療を補助することに適用される場合、インターネットビッグデータおよびユーザの病例情報に合わせて、スマート質問回答の実現システムによる解析および推理により、参考になる病例の成因に対する解析を提供することができる。
例示的には、上記した前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含む。
例示的には、上記した意味関係発掘システムが前記問題に対して検索処理を行うステップは、
三項関係ベースから検索して前記問題の解答を得るステップを含む。
例示的には、上記した三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含む。
例示的には、上記した依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含む。
例示的には、上記した三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するステップを含む。
例示的には、上記した正文ベース検索システムが前記問題に対して検索処理を行うステップは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含む。
例示的には、上記した一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするステップを含む。
例示的には、上記した検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含む。
例示的には、上記したろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。
例示的には、上記した前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含む。
例示的には、上記したろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。
例示的には、上記した前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に応じて前記候補解答をランキングするステップと、を含む。
(実施例2)
本実施例は、上記実施例を基にして、スマート質問回答の実現方法の他の技術案を提供する。
図2aに示すように、本実施例に係るスマート質問回答の実現方法は、具体的に、ステップ210〜ステップ240を含む。
ステップ210において、クエリの問題を受信する。
ステップ220において、前記問題に対して意味解析を行い、「前の文」または「次の文」である問題の観点類型を得る。
当該ステップは、前述した実施例における前記問題に対して基礎的な文法解析を行うステップ、および、前記問題の焦点、観点および観点類型を認識するステップに同様に適用され、ここで贅言しない。
ステップ230において、意味関係発掘システムが三項関係ベースから検索して前記問題の解答を得る。
当該ステップでは、三項関係ベースにおける三項関係は、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を包括しており、そして合理的検証を通過したものである。
前記三項関係ベースを確立するステップは、図2bに示すように、好ましくはステップ231〜ステップ236を含む。
ステップ231において、前処理を行う。
依存関係構文解析の構造に影響しないように、文中の括弧例えば「()」中の内容を除去する。
ステップ232において、基礎的な詞/構文解析を行う。
元ウェブページにおけるテキストに含まれる文の部分に対して単語分割、固有名詞認識、エンティティ認識、品詞タグ付け、および依存関係解析を行うことにより、依存関係を持つ文を得ることができる。
ステップ233において、連用修飾語断片を認識する。
例えば、コンマで分断された断片に対して断片類型認識を行い、主に時間連用修飾語の断片、非時間連用修飾語の断片、および他の断片に分ける。
ステップ234において、三項関係対を抽出する。
当該ステップは、具体的に、依存関係解析における親ノード毎に関係抽出を行い、三項関係対を得る。前記三項関係対は、具体的に、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を含む。例えば、「学生Aが賞を受けた」の場合、「学生A」と「賞」との間に、動詞を中核とする依存関係があり、「黄山が非常に美しい」の場合、「黄山」と「非常に美しい」との間に、エンティティと属性との依存関係があり、また、「白日依山尽」の次の文が「黄河入海流」であるため、この両方は、異なるエンティティの間の依存関係として理解されることができる。
ステップ235において、欠失成分を補足する。
例えば、主語の補足、時間や場所の連用修飾語の補足、目的語の補足などを行う。
ステップ236において、合理的検証およびろ過を行う。
解析された三項関係対に対して合理であるか否かを判断し、不合理である場合、当該三項関係対を残さないことにし、すなわち、解析された三項関係対をろ過し、合理的な三項関係対、すなわち検証を通過した三項関係対のみを残すことにする。そして、検証を通過した三項関係対で前記三項関係ベースを確立する。
例えば、元ウェブページから「黄河入海流、白日依山尽」が抽出された場合、ステップ233にいて、当該元ウェブページに基づいて抽出して『「黄河入海流」は「白日依山尽」の前の文である』ということが得られ、既存の詩詞資源を参照して、この三項関係対が不合理であると判定することができるため、当該三項関係対をろ過して除去するようにした。
ステップ240において、検索処理の結果に基づいて解答を返す。
本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システムを採用して三項関係ベースから前記問題に対して対応の検索処理を行うことにより、前記問題の解答を検索して得る。三項関係ベースにおける三項関係は、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を包括しており、問題に関する解答の検索範囲を広げたため、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題をカバーすることができ、また、三項関係ベースにおける三項関係が合理的検証を通過したものであるため、問題に対する回答をより正確にした。
説明する必要があるのは、三項関係ベースを確立する過程において、三項関係対を得る前に、前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するステップをさらに含んでもよい。
具体的には、主語、述語、目的語、および連用修飾語などを含む、依存関係を持つ文の断片類型を認識し得ることができ、そのうち、連用修飾語は、時間連用修飾語、場所連用修飾語、原因連用修飾語、および結果連用修飾語などの類型を含んでもよい。述語は動詞とされており、前記したように、依存関係文法解析は、文を依存関係構文木として解析し、各語彙の間の依存関係を述べることによって、文の構文構造を解明するものであり、文における中核動詞が他の成分を支配する中心成分であるが、中核動詞自体が他の成分のいずれにも支配されておらず、被支配成分のいずれも、ある依存関係によって支配者に従属していることを主張する。動詞を中核とする依存関係とは、述語と他の類型の断片との間の依存関係を指す。
当該形態では、依存関係を持つ文における欠失した述語以外の他の成分を補足することにより、三項関係における動詞を中核とする依存関係を豊富にすることに役立ち、問題に関する解答の検索範囲や、問題のカバー範囲をさらに広げ、特に発生頻度の高くない問題および人気のない問題をカバーすることができる。
(実施例3)
本実施例は、実施例1を基にして、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うという動作を、前記意味解析の結果に基づいて、前記正文ベース検索システムが前記問題に対して検索処理を行うように最適化した。
図3に示すように、それは本発明の実施例3に係るスマート質問回答の実現方法において、正文ベース検索システムが問題に対して検索処理を行うフローチャートである。具体的には、ステップ310〜ステップ330を含む。
ステップ310において、関連するドキュメントを検索する。
資源プールから検索し、検索結果、ウェブページ正文およびクリックログを得、前記問題に関連するドキュメント集合を検索し出す。
当該ステップは、検索エンジンにより前記問題を検索し、関連するウェブページ集合を呼び戻して前記問題に関連するドキュメント集合とすることができ、検索エンジンによる関連性ランキングは、ある程度に各ドキュメントの重要性を具現している。具体的には、検索エンジンにより前記問題を検索し、前記問題に関連する検索結果および他の資源(例えば、要約、URL(Uniform Resource Locator、統一資源位置指定子)、ドキュメントクリックデータ、およびドキュメントの正文情報などを含んでもよい)を得た後、URLにより呼び戻されたウェブページに対応するドキュメント内容を取得して問題および解答の深い解析に用いることができ、そして、クリックログにより各ドキュメントの問題に対する満足度を解析することができる。
そのうち、クリックログは、クリックされた各ドキュメントの問題に対する満足度をURLレベルから評価するものである。
また、述べ方法が異なるが実質的に同様である資源、例えば時間種類の「2010年3月」と「2010.03」などを合併し、表示が誤った資源を修正する前処理をさらに含んでもよい。
また、好ましくは、ドキュメント関連性の計算、およびドキュメントのランキングをさらに含んでもよい。
意味類似度などの特性計算に合わせてドキュメント関連性を計算することができる。意味類似度の計算とは、問題とドキュメントテーマとの類似度値を計算することを指し、そのうち、意味計算方法は、主に検索語の重要性、検索語の同義語の交換、検索語の書直しなどの情報を利用して計算する。
ドキュメント関連性のランキングとは、検索エンジンが問題における検索語に基づいて多量のウェブページ・ドキュメントを呼び戻すが、その転義リスクを制限しないことを指す。ドキュメント関連性のランキング方法は、検索エンジン(例えば、「百度検索エンジン」)による検索ランキング結果、およびクリックログに解析されたユーザのウェブページに対する満足度に基づき、意味類似度の計算などの特性に合わせて関連性の再ランキングを行い、内容の転義問題を解決する。そのうち、内容の転義は、ノイズデータを引き入れる可能性があり、誤答(間違った解答)が抽出され、またはランキング段階で誤答の高いランキングを引き起こしてしまう。
ステップ320において、候補断片を抽出しランキングする。
前記ドキュメント集合から、候補解答が含まれている候補断片を検索する。
まず、段落または複数の文を単位として各ドキュメントを区画し、その後、設定されたキーワードに応じて各ドキュメントから検索して前記設定されたキーワードに対応した断片を得て候補断片とし、候補解答をさらに位置決めるために用いるようにしてもよい。
また、候補断片をさらにランキングしてもよく、具体的には、源ドキュメントの関連性重み、候補断片の内容類似度、候補断片の関連性等の特性に基づいて断片信頼度を計算し、信頼度に基づいて候補断片をランキングしてもよい。
源ドキュメントの関連性重みの計算は、ドキュメント関連性の再ランキングに関連の特性を用いて線形フィッティングして行われる。候補断片の内容類似度は、問題と候補断片との内容類似度の計算に用いられ、意味類似度計算の方法を採用することができる。候補断片の関連性計算は、問題と候補断片との関連性を計測するために用いられ、計算方法は、主に、問題における各検索語の重要性、各検索語の候補断片におけるヒット個数、およびヒット位置などの特性を利用してフィティングすることである。
ステップ330において、候補解答を抽出しランキングする。
前記候補断片から前記候補解答を抽出し、一回目のランキングを行う。
当該ステップにおいて、候補解答の抽出動作は、オフラインで発掘された総合辞書である開領域辞書を利用して、名前付きエンティティ認識技術により実現することができる。
一回目のランキングの動作は、前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングすることが好ましい。
候補解答と問題におけるキーワードとの共起重みに基づいて候補解答に対して一回目のランキングを行ってもよい。
また、候補解答の候補断片における出現位置、検索結果における候補解答の逆文書頻度、源ドキュメントの関連性、源候補断片の関連性、および、同一解答(同義解答を含み)に対する異なる候補断片の信頼度加重投票値の少なくとも1つの特性に基づいて、候補解答に対して一回目のランキングを行ってもよい。
そのうち、源ドキュメントの関連性は、ドキュメント関連性の再ランキングに関連の特性で線形フィッティングして取得されることができ、源候補断片の関連性は、源ドキュメント関連性および来源断片と問題との間の意味マッチング度で線形フィッティングして取得されることができる。
上記した候補解答に対する一回目のランキングは、主に候補解答に対する呼び戻しを確保し、多すぎる解答が二回目のランキングに入ってランキング性能やノイズ制御に影響することを回避した。
説明する必要があるのは、候補解答を抽出しランキングした後、候補解答をさらにランキングすること、例えば領域内知識によるろ過、二回目のランキング、および三回目のランキングなどを含んでもよく、これについて、下記実施例は詳細に説明する。
(実施例4)
本実施例は、上記の各実施例を基にして、検索処理の結果に基づいて解答を返すというステップの好ましい技術案を提供する。
図4に示すように、それは、本発明の実施例4に係るスマート質問回答の実現方法において検索処理の結果に基づいて解答を返すフローチャートである。具体的には、ステップ410〜ステップ420を含む。
ステップ410において、領域内知識で前記検索処理の結果をろ過する。
異なる問題および異なる解答類型に必要な知識、特性、およびランキングアルゴリズムのいずれにも差異がある。このため、異なる領域の知識で検索処理の結果をろ過し、問題とマッチングした検索処理の結果を得ることができる。
領域知識の構築は、主に精密で正確な領域知識辞書の構築である。例えば、ゴールデンレトリーバーが犬類に属し、黒出目金が魚の1種である。問題の類型が犬である場合、領域辞書により候補解答の「黒出目金」がろ過・除去される。
領域辞書の構築は、主に、指定されたサイトの構造化データの発掘(例えば、qidian.comで小説エンティティを発掘し)、大規模インターネットの非構造化/半構造化データの発掘およびチェック(例えば、百科などの知識種類のコミュニティの分類タグによりエンティティを発掘し)、検索ログの発掘(例えば、「天龍八部の映画」という問題に対応する検索ログから、「天龍八部」を映画エンティティとして発掘し)などのアルゴリズムにより実現される。
ステップ420において、ろ過結果に基づいて解答を返す。
当該ステップは、複数の実現形態があり、下記複数の種類を例として説明する。
第1種類の実施形態において、ろ過結果に基づいて解答を返すステップは、具体的に、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。
そのうち、教師付き機械学習モデル(例えば、GBRank機械学習モデル)で前記ろ過結果に対して二回目のランキングを行ってもよい。
前記機械学習モデルは、ランキングされたサンプル解答含有語句、および対応のランキング特性を学習・訓練して得られたものであり、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも1つのランキング特性を含んでもよい。
前記問題マッチング度は、前記候補解答と前記問題の観点類型との意味マッチング度であり、問題マッチング度の計算方式は、通常、大規模言語資料から統計された問題の拡張ベクターと候補解答の拡張ベクターとのマッチング程度でフィッティング計算を行うことである。前記オフセット重みは、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数である。解答と問題との共起情報は、問題の候補解答の主文脈における重要性を評価するために用いられ、エンティティ種類の解答と問題との共起情報の計算は、候補解答の百度百科における情報および問題におけるキーワードで共起程度を計算してもよい。前記解答境界特性とは、解答の左境界と右境界の情報、例えば二重山括弧、引用符、読点等を指す。そのうち、解答信頼度は源ドキュメントに関連しており、各ドキュメントは1つの挙証源と見なされて1回の投票に関与し、各源ドキュメントは1回あたり1票を投じ、理論的には、得票の高い方のドキュメントに対応する解答信頼度が高いことであり、また、解答の所属する候補断片に基づいて解答信頼度を決定してもよく、各候補断片の所属するドキュメントは1つの挙証源と見なされて1回の投票に関与し、各挙証源が毎回投票の重みは、候補断片の関連性により決定され、理論的には、得票の高い方の解答が信頼度が高いことである。
本実施形態は単独で使用されてもよく、前述一回目のランキングと組み合わせて使用されてもよく、好ましくは、候補断片から候補解答を抽出して一回目のランキングを行い、領域内知識を利用して前記ろ過の動作を実行してから、前記ろ過結果に対して二回目のランキングを行う。
当該好ましい実施形態は、候補断片から候補解答を抽出した後、URL重み、オフセット重みおよび問題マッチング度の少なくとも1つの特性で一回目のランキングを行うことによって、ランキングの高い解答の正確性を高め、また、専門領域内知識で異なる類別の問題に対応する解答をろ過することによって、異なる類別の問題に対応する解答の専門性と権威性を確保し、また、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも1つの特性でろ過結果に対して二回目のランキングを行うことによって、問題に対応する解答の専門性と権威性を確保したとともに、ランキングの高い解答の正確性をさらに最適化した。
第2種類の実施形態において、ろ過結果に基づいて解答を返すステップは、具体的に、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。
さらに、前記ろ過結果に対して三回目のランキングを行うステップは、好ましくは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含む。
具体的には、二次検索により前記候補解答と前記問題とのマッチング程度を検証することができる。二次検索は、より豊富な問題と解答とのマッチング情報を提供することができ、候補解答で元の問題の焦点を取替え、すなわち、候補解答を元の問題に代入して二次検索を行い、新しい問題と候補解答との関連情報を統計することを指す。例えば、二次検索により返されたドキュメントにおいて新しい問題と候補解答が連続して出現しているか否か、新しい問題と候補解答との共起情報、新しい問題におけるキーワードのヒット状況などがある。現在のドキュメントのテーマが問題種類のテーマである場合、ドキュメントテーマにおいて焦点認識、解答類型認識が認識される。問題に焦点がない場合、解答を元の問題の末尾に加え、分離符号で区切ってから二次検索を行う。
本実施形態は、単独で使用されてもよく、前述一回目のランキングおよび/または前述二回目のランキングと組み合わせて使用されてもよい。
単独使用の場合、候補解答を元の問題に代入し新しい問題として二次検索を行い、新しい問題と候補解答との関連情報に基づいて解答の配列順序に対して最適化調整を行うため、ランキングの高い解答と元のクエリの問題とのマッチング程度を高めることができる。
候補断片から候補解答を抽出して一回目のランキングを行い、領域内知識で前記ろ過動作を実行してから、前記ろ過結果に対して二回目のランキングを行い、そして前記三回目のランキングを行うような組合せ方式の場合、候補断片から候補解答を抽出した後に、URL重み、オフセット重み、および問題マッチング度の少なくとも1つの特性で一回目のランキングを行うことにより、ランキングの高い解答の正確性を高め、また、専門領域内知識で異なる類別の問題に対応する解答をろ過することにより、異なる類別の問題に対応する解答の専門性と権威性を確保し、また、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも1つの特性でろ過結果に対して二回目のランキングを行うことにより、問題に対応する解答の専門性と権威性を確保したとともに、ランキングの高い解答の正確性をさらに最適化し、また、候補解答を元の問題に代入し新しい問題として二次検索を行い、新しい問題と候補解答との関連情報に基づいて解答の配列順序に対して最適化調整を行うことにより、ランキングの高い解答と元のクエリの問題とのマッチング程度をさらに高めた。
(実施例5)
本実施例は、スマート質問回答の実現システムを提供し、図5に示すように、当該システムは、中央制御システム510、問題解析システム520、およびバックエンドシステム530を備える。
そのうち、中央制御システム510は、クエリの問題を受信するために構成され、問題解析システム520は、前記問題に対して意味解析を行うために構成され、前記中央制御システム510は、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステム530に配布し対応の検索処理を行うために構成され、前記バックエンドシステム530は、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを備え、前記中央制御システム510は、さらに、検索処理の結果に基づいて解答を返すために構成される。
本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題の解答に関する検索範囲を広げ、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を経てより正確な解答を得ることができる。
上記技術案において、前記問題解析システム520は、具体的に、前記問題の焦点、観点、および観点類型を認識するために構成されてもよい。
さらに、前記問題解析システム520は、前記問題の観点類型を認識した後、前記問題の観点類型に対して正規化処理を行うために構成されてもよい。
上記技術案において、前記中央制御システム510は、具体的に、解析された問題の類型が構造的な依存類型である場合、前記問題を前記意味関係発掘システムに配布して検索処理を行い、そうでない場合、前記問題を前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムに配布して検索処理を行うために構成されてもよい。
そのうち、前記意味関係発掘システムは、具体的に、三項関係ベースから検索して前記問題の解答を得るために構成されてもよい。
前記意味関係発掘システムは、さらに、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得、
依存関係のノードを抽出し、三項関係対を得、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するために構成されてもよい。
前記意味関係発掘システムは、依存関係を持つ文を得る前に、さらに、文中の括弧内の内容を除去するために構成されてもよい。
前記意味関係発掘システムは、三項関係対を得る前に、さらに、前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するために構成されてもよい。
そのうち、前記正文ベース検索システムは、具体的に、
前記問題に関連するドキュメント集合を検索し出し、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うために構成されてもよい。
前記正文ベース検索システムは、具体的に、前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みであるURL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするために構成されてもよい。
上記技術案において、前記中央制御システム510は、具体的に、
領域内知識で前記検索処理の結果をろ過し、
ろ過結果に基づいて解答を返すために構成されてもよい。
好ましい実施形態として、前記中央制御システム510は、具体的に、
前記ろ過結果に対して二回目のランキングを行い、
ランキングされたろ過結果を返すために構成されてもよい。
さらに、前記中央制御システム510は、具体的に、教師付き機械学習システムで前記ろ過結果をランキングするために構成されてもよい。
他の好ましい実施形態として、前記中央制御システム510は、具体的に、
前記ろ過結果に対して三回目のランキングを行い、
ランキングされたろ過結果を返すために構成されてもよい。
さらに、前記中央制御システム510は、具体的に、
前記候補解答と前記問題とのマッチング程度を検証し、
前記マッチング程度に基づいて前記候補解答をランキングするために構成されてもよい。
本発明の実施例に係るスマート質問回答の実現システムは、本発明の任意の実施例に係るスマート質問回答の実現方法を実行することができ、方法を実行するための対応の機能モジュールを備え、且つ対応の有益な効果を有する。
(実施例6)
本実施例は、不揮発性コンピュータ記憶媒体を提供する。そのうち、前記コンピュータ記憶媒体は、1つ以上のモジュールが記憶され、前記1つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返すように実行させる。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記問題に対して意味解析を行うステップは、好ましくは、
前記問題の焦点、観点および観点類型を認識するステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記問題の観点類型を認識した後、前記方法は、さらに、
前記問題の観点類型に対して正規化処理を行うステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、好ましくは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、好ましくは、
三項関係ベースから検索して前記問題の解答を得るステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、好ましくは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。
上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含んでもよい。
(実施例7)
図6に示すように、それは本発明の実施例7に係るスマート質問回答の実現方法を実行する機器のハードウェア構造模式図である。
当該機器は、
1つ以上のプロセッサ610(図6では1つのプロセッサ610を例とする)と、
メモリ620と、
1つ以上のモジュールと、を備える。
前記機器は、入力装置630と出力装置640とをさらに備えてもよい。前記機器におけるプロセッサ610、メモリ620、入力装置630、および出力装置640は、バスまたは他の方式で接続されてもよいが、図6ではバスによる接続を例としている。
コンピュータ可読記憶媒体として、メモリ620は、ソフトウェアプログラム、コンピュータ実行可能プログラム、およびモジュール、例えば、本発明の実施例に係るスマート質問回答の実現方法に対応するプログラム命令/モジュール(例えば、図5に示されるスマート質問回答の実現システムにおける中央制御システム510、問題解析システム520、およびバックエンドシステム530)を記憶するために構成されてもよい。プロセッサ610は、メモリ620に記憶されたソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの各機能アプリケーションおよびデータ処理を実行し、すなわち、上記方法の実施例に係るスマート質問回答の実現方法を実現する。
メモリ620は、オペレーティングシステムや、少なくとも1つの機能に必要なアプリケーションプログラムを記憶可能なプログラム記憶領域と、端末装置の使用に基づいて作成されたデータ等を記憶可能なデータ記憶領域とを備えてもよい。また、メモリ620は、高速ランダムアクセスメモリを備えてもよく、さらに、不揮発性メモリ、例えば、少なくとも1つの磁気ディスクメモリ、フラッシュメモリ、または他の不揮発性固体メモリデバイスを備えてもよい。いくつかの例において、メモリ620は、プロセッサ610に対して遠隔設置されたメモリをさらに備えてもよく、それらの遠隔メモリは、ネットワークを介して端末装置に接続されてもよい。上記ネットワークの例として、インターネット、社内イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組合せを備えるが、それらに限定されない。
入力装置630は、入力された数字または文字情報を受信し、端末のユーザ設定および機能制御に関連するキー信号の入力を生成するために構成されてもよい。出力装置640は、ディスプレイなどの表示装置を備えてもよい。
前記1つ以上のモジュールは、前記メモリ620に記憶されており、前記1つ以上のプロセッサ610により実行される場合、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返す動作を実行させる。
さらに、前記問題に対して意味解析を行うステップは、
前記問題の焦点、観点および観点類型を認識するステップを含んでもよい。
さらに、前記問題の観点類型を認識した後、前記方法は、さらに、
前記問題の観点類型に対して正規化処理を行うステップを含んでもよい。
さらに、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含んでもよい。
さらに、前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、
三項関係ベースから検索して前記問題の解答を得るステップを含んでもよい。
さらに、前記三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含んでもよい。
さらに、依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含んでもよい。
さらに、三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するステップを含んでもよい。
さらに、前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含んでもよい。
さらに、一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするステップを含んでもよい。
さらに、検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含んでもよい。
さらに、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。
さらに、前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含んでもよい。
さらに、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。
さらに、前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含んでもよい。
上記実施形態の説明によれば、当業者は、本発明がソフトウェア、および必要な汎用ハードウェアにより実現されてもよく、勿論ハードウェアにより実現されてもよいが、多くの場合、前者が好ましい実施形態であると明確に理解すべきである。ここのような理解に基づき、本発明の技術案は、実質的な部分、または従来技術を改良する部分をソフトウェア製品の形態で実現してもよい。当該コンピュータソフトウェア製品は、コンピュータ可読記憶媒体、例えばコンピュータのフロッピーディスク、読み出し専用メモリ(Read−Only Memor:ROM)、ランダムアクセスメモリ(Random Access Memory:RAM)、フラッシュ(FLASH)、ハードディスクや光ディスクなどに記憶されてもよく、且つコンピュータ機器(パソコン、サーバ、またはネットワーク機器などであってもよく)に本発明の各実施例に係る方法を実行させるための複数の命令を含んでいる。
注目に値することは、上記スマート質問回答の実現システムの実施例に含まれる各システムは、単に機能論理に基づいて区分されるものであり、上記の区分に限らず、対応する機能を実現することができればよく、また、各機能ユニットの具体的な名称も互いに区別しやすいためのものであり、本発明の保護範囲を制限するためのものではない。
以上で説明したのは、本発明の具体的な実施形態のみであり、本発明の保護範囲は、これらに限定されるものではない。本技術分野をよく知っている当業者のいずれも、本発明に開示された技術範囲内に容易に想到できる変更または置換の全ては、本発明の保護範囲内に入るべきである。従って、本発明の保護範囲は、添付する特許請求の範囲を基準としているものである。

Claims (31)

  1. クエリの問題を受信するステップと、
    前記問題に対して意味解析を行うステップと、
    前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、
    検索処理の結果に基づいて解答を返すステップと、
    を備えることを特徴とする、スマート質問回答の実現方法。
  2. 前記問題に対して意味解析を行うステップは、
    前記問題の焦点、観点および観点類型を認識するステップを含むことを特徴とする、請求項1に記載の方法。
  3. 前記問題の観点類型を認識した後、前記方法は、さらに、
    前記問題の観点類型に対して正規化処理を行うステップを含むことを特徴とする、請求項2に記載の方法。
  4. 前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
    解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含むことを特徴とする、請求項1〜3のいずれか一項に記載の方法。
  5. 前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、
    三項関係ベースから検索して前記問題の解答を得るステップを含むことを特徴とする、請求項1〜3のいずれか一項に記載の方法。
  6. 前記三項関係ベースを確立するステップは、
    ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
    依存関係のノードを抽出し、三項関係対を得るステップと、
    前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含むことを特徴とする、請求項5に記載の方法。
  7. 依存関係を持つ文を得る前に、さらに、
    文中の括弧内の内容を除去するステップを含むことを特徴とする、請求項6に記載の方法。
  8. 三項関係対を得る前に、さらに、
    前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するステップを含むことを特徴とする、請求項6または7に記載の方法。
  9. 前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、
    前記問題に関連するドキュメント集合を検索し出すステップと、
    前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
    前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含むことを特徴とする、請求項1〜3のいずれか一項に記載の方法。
  10. 一回目のランキングを行うステップは、
    前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするステップを含むことを特徴とする、請求項9に記載の方法。
  11. 検索処理の結果に基づいて解答を返すステップは、
    領域内知識で前記検索処理の結果をろ過するステップと、
    ろ過結果に基づいて解答を返すステップと、を含むことを特徴とする、請求項1〜3のいずれか一項に記載の方法。
  12. ろ過結果に基づいて解答を返すステップは、
    前記ろ過結果に対して二回目のランキングを行うステップと、
    ランキングされたろ過結果を返すステップと、を含むことを特徴とする、請求項11に記載の方法。
  13. 前記ろ過結果に対して二回目のランキングを行うステップは、
    教師付き機械学習モデルで前記ろ過結果をランキングするステップを含むことを特徴とする、請求項12に記載の方法。
  14. ろ過結果に基づいて解答を返すステップは、
    前記ろ過結果に対して三回目のランキングを行うステップと、
    ランキングされたろ過結果を返すステップと、を含むことを特徴とする、請求項11〜13のいずれか一項に記載の方法。
  15. 前記ろ過結果に対して三回目のランキングを行うステップは、
    前記候補解答と前記問題とのマッチング程度を検証するステップと、
    前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含むことを特徴とする、請求項14に記載の方法。
  16. クエリの問題を受信するために構成される中央制御システムと、
    前記問題に対して意味解析を行うために構成される問題解析システムと、を備え、
    前記中央制御システムは、さらに、前記解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成され、
    前記バックエンドシステムは、発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムを備え、
    前記中央制御システムは、さらに、検索処理の結果に基づいて解答を返すために構成されることを特徴とする、スマート質問回答の実現システム。
  17. 前記問題解析システムは、具体的に、
    前記問題の焦点、観点および観点類型を認識するために構成されることを特徴とする、請求項16に記載のシステム。
  18. 前記問題解析システムは、前記問題の観点類型を認識した後、さらに、
    前記問題の観点類型に対して正規化処理を行うために構成されることを特徴とする、請求項17に記載のシステム。
  19. 前記中央制御システムは、具体的に、
    解析された問題の類型が構造的な依存類型である場合、前記問題を前記意味関係発掘システムに配布して検索処理を行い、そうでない場合、前記問題を前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムに配布して検索処理を行うために構成されることを特徴とする、請求項16〜18のいずれか一項に記載のシステム。
  20. 前記意味関係発掘システムは、具体的に、
    三項関係ベースから検索して前記問題の解答を得るために構成されることを特徴とする、請求項16〜18のいずれか一項に記載のシステム。
  21. 前記意味関係発掘システムは、さらに、
    ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得、
    依存関係のノードを抽出し、三項関係対を得、
    前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するために構成されることを特徴とする、請求項20に記載のシステム。
  22. 前記意味関係発掘システムは、依存関係を持つ文を得る前に、さらに、
    文中の括弧内の内容を除去するために構成されることを特徴とする、請求項21に記載のシステム。
  23. 前記意味関係発掘システムは、三項関係対を得る前に、さらに、
    前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも1つを補足するために構成されることを特徴とする、請求項21または22に記載のシステム。
  24. 前記正文ベース検索システムは、具体的に、
    前記問題に関連するドキュメント集合を検索し出し、
    前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
    前記候補断片から前記候補解答を抽出し、一回目のランキングを行うために構成されることを特徴とする、請求項16〜18のいずれか一項に記載のシステム。
  25. 前記正文ベース検索システムは、具体的に、
    前記候補解答の所属するドキュメントの所属するサイトとURLリンクの重みである統一資源位置指定子URL重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも1つの特性に基づいてランキングするために構成されることを特徴とする、請求項14に記載のシステム。
  26. 前記中央制御システムは、具体的に、
    領域内知識で前記検索処理の結果をろ過し、
    ろ過結果に基づいて解答を返すために構成されることを特徴とする、請求項16〜18のいずれか一項に記載のシステム。
  27. 前記中央制御システムは、具体的に、
    前記ろ過結果に対して二回目のランキングを行い、
    ランキングされたろ過結果を返すために構成されることを特徴とする、請求項26に記載のシステム。
  28. 前記中央制御システムは、具体的に、
    教師付き機械学習システムで前記ろ過結果をランキングするために構成されることを特徴とする、請求項27に記載のシステム。
  29. 前記中央制御システムは、具体的に、
    前記ろ過結果に対して三回目のランキングを行い、
    ランキングされたろ過結果を返すために構成されることを特徴とする、請求項26〜28のいずれか一項に記載のシステム。
  30. 前記中央制御システムは、具体的に、
    前記候補解答と前記問題とのマッチング程度を検証し、
    前記マッチング程度に基づいて前記候補解答をランキングするために構成されることを特徴とする、請求項29に記載のシステム。
  31. 1つ以上のモジュールが記憶される不揮発性コンピュータ記憶媒体であって、
    前記1つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
    クエリの問題を受信し、
    前記問題に対して意味解析を行い、
    前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも1つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
    検索処理の結果に基づいて解答を返すように実行させることを特徴とする、
    不揮発性コンピュータ記憶媒体。
JP2016552590A 2015-01-14 2015-08-05 スマート質問回答の実現方法、システム、および記憶媒体 Active JP6309644B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510017563.6 2015-01-14
CN201510017563.6A CN104573028B (zh) 2015-01-14 2015-01-14 实现智能问答的方法和系统
PCT/CN2015/086094 WO2016112679A1 (zh) 2015-01-14 2015-08-05 实现智能问答的方法、系统和存储介质

Publications (2)

Publication Number Publication Date
JP2017511922A true JP2017511922A (ja) 2017-04-27
JP6309644B2 JP6309644B2 (ja) 2018-04-11

Family

ID=53089090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016552590A Active JP6309644B2 (ja) 2015-01-14 2015-08-05 スマート質問回答の実現方法、システム、および記憶媒体

Country Status (6)

Country Link
US (1) US10242049B2 (ja)
EP (1) EP3096246A4 (ja)
JP (1) JP6309644B2 (ja)
KR (1) KR101895249B1 (ja)
CN (1) CN104573028B (ja)
WO (1) WO2016112679A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021500650A (ja) * 2017-10-23 2021-01-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検索エンジン最適化技法

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699689B (zh) * 2014-01-09 2017-02-15 百度在线网络技术(北京)有限公司 事件知识库的构建方法及装置
CN104573028B (zh) 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN104881446A (zh) * 2015-05-14 2015-09-02 百度在线网络技术(北京)有限公司 搜索方法及装置
CN104933097B (zh) * 2015-05-27 2019-04-16 百度在线网络技术(北京)有限公司 一种用于检索的数据处理方法和装置
CN104850539B (zh) * 2015-05-28 2017-08-25 宁波薄言信息技术有限公司 一种自然语言理解方法及基于该方法的旅游问答系统
CN104991965B (zh) * 2015-07-23 2018-11-23 上海智臻智能网络科技股份有限公司 用于基于标准问创建扩展问的方法和装置
CN105243120A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN105653576A (zh) * 2015-12-16 2016-06-08 上海智臻智能网络科技股份有限公司 信息搜索的方法及装置、人工座席服务方法及系统
CN105589844B (zh) * 2015-12-18 2017-08-08 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法
CN105549949A (zh) * 2015-12-18 2016-05-04 合肥寰景信息技术有限公司 一种网络社区的语音帮助提示方法
CN105653671A (zh) * 2015-12-29 2016-06-08 畅捷通信息技术股份有限公司 相似信息推荐方法及系统
CN105677896B (zh) * 2016-02-03 2019-08-02 北京光年无限科技有限公司 基于主动学习的交互方法及交互系统
CN105786794B (zh) * 2016-02-05 2018-09-04 青岛理工大学 一种问答对检索方法及社区问答检索系统
CN105843875B (zh) * 2016-03-18 2019-09-13 北京光年无限科技有限公司 一种面向智能机器人的问答数据处理方法及装置
CN105868179B (zh) * 2016-04-08 2018-07-13 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
CN105912645B (zh) * 2016-04-08 2019-03-05 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
US10902330B2 (en) * 2016-06-21 2021-01-26 International Business Machines Corporation Cognitive question answering pipeline calibrating
CN107818092B (zh) * 2016-09-12 2023-05-26 百度在线网络技术(北京)有限公司 文档处理方法及装置
CN106529268B (zh) * 2016-11-14 2019-05-24 上海智臻智能网络科技股份有限公司 一种校验方法及装置
CN106649778B (zh) 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN106649761A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的搜索结果展现方法和装置
CN106844512B (zh) * 2016-12-28 2020-06-19 竹间智能科技(上海)有限公司 智能问答方法及系统
US10268680B2 (en) 2016-12-30 2019-04-23 Google Llc Context-aware human-to-computer dialog
CN106826876A (zh) * 2017-01-18 2017-06-13 北京爱情说科技有限公司 一种智能行动机器人
CN108345608A (zh) * 2017-01-24 2018-07-31 北京搜狗科技发展有限公司 一种搜索方法、装置及设备
CN106874441B (zh) * 2017-02-07 2024-03-05 腾讯科技(上海)有限公司 智能问答方法和装置
CN106997376B (zh) * 2017-02-28 2020-12-08 浙江大学 一种基于多级特征的问题和答案句子相似度计算方法
CN106911812A (zh) * 2017-05-05 2017-06-30 腾讯科技(上海)有限公司 一种会话信息的处理方法、服务器及计算机可读存储介质
CN107977393A (zh) * 2017-05-22 2018-05-01 海南大学 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法
CN107329995B (zh) * 2017-06-08 2018-03-23 北京神州泰岳软件股份有限公司 一种语义受控的答案生成方法、装置及系统
CN107436916B (zh) * 2017-06-15 2021-04-27 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107248937A (zh) * 2017-06-30 2017-10-13 北京百度网讯科技有限公司 一种基于物联网的与用户进行交互的方法与系统
CN107506411A (zh) * 2017-08-10 2017-12-22 熊英 一种安全可信的知识服务方法与系统
CN107741976B (zh) * 2017-10-16 2021-07-09 泰康保险集团股份有限公司 智能应答方法、装置、介质和电子设备
CN107766511A (zh) * 2017-10-23 2018-03-06 深圳市前海众兴电子商务有限公司 智能问答方法、终端及存储介质
CN110019705A (zh) * 2017-10-31 2019-07-16 北京搜狗科技发展有限公司 一种信息处理方法、装置和用于信息处理的装置
CN109829037A (zh) * 2017-11-22 2019-05-31 上海智臻智能网络科技股份有限公司 智能自动问答的方法、系统、服务器及存储介质
CN107895037B (zh) * 2017-11-28 2022-05-03 北京百度网讯科技有限公司 一种问答数据处理方法、装置、设备和计算机可读介质
JP7024364B2 (ja) * 2017-12-07 2022-02-24 富士通株式会社 特定プログラム、特定方法および情報処理装置
CN108304466B (zh) * 2017-12-27 2022-01-11 中国银联股份有限公司 一种用户意图识别方法以及用户意图识别系统
CN108170792B (zh) * 2017-12-27 2021-12-28 北京百度网讯科技有限公司 基于人工智能的问答引导方法、装置和计算机设备
WO2019148315A1 (en) * 2018-01-30 2019-08-08 Intel Corporation Visual question answering using visual knowledge bases
CN110569335B (zh) * 2018-03-23 2022-05-27 百度在线网络技术(北京)有限公司 基于人工智能的三元组校验方法、装置及存储介质
CN108932278B (zh) * 2018-04-28 2021-05-18 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN108737530A (zh) * 2018-05-11 2018-11-02 深圳双猴科技有限公司 一种内容分享方法及系统
CN108491394A (zh) * 2018-06-27 2018-09-04 杭州贝店科技有限公司 一种语义分析方法、装置、计算机设备及存储介质
US10997222B2 (en) * 2018-06-29 2021-05-04 International Business Machines Corporation Conversational agent dialog flow user interface
CN109147934B (zh) * 2018-07-04 2023-04-11 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN110851560B (zh) * 2018-07-27 2023-03-10 杭州海康威视数字技术股份有限公司 信息检索方法、装置及设备
CN109242412B (zh) * 2018-08-14 2021-12-07 贵州华宁科技股份有限公司 考务管理系统
CN109147793B (zh) * 2018-08-17 2020-11-10 南京星邺汇捷网络科技有限公司 语音数据的处理方法、装置及系统
CN109189906A (zh) * 2018-08-17 2019-01-11 国家电网有限公司客户服务中心 智能客服对连贯语境下多问句完整语义的识别方法
CN110874400B (zh) * 2018-08-31 2023-06-13 比亚迪股份有限公司 在线客服的应答方法和装置、车辆客户端、客服服务端
CN109299231B (zh) * 2018-09-14 2020-10-30 苏州思必驰信息科技有限公司 对话状态跟踪方法、系统、电子设备及存储介质
CN109271459B (zh) * 2018-09-18 2021-12-21 四川长虹电器股份有限公司 基于Lucene和文法网络的聊天机器人及其实现方法
CN110931137B (zh) * 2018-09-19 2023-07-07 京东方科技集团股份有限公司 机器辅助对话系统、方法及装置
CN109472305A (zh) * 2018-10-31 2019-03-15 国信优易数据有限公司 答案质量确定模型训练方法、答案质量确定方法及装置
CN109359215B (zh) * 2018-12-03 2023-08-22 江苏曲速教育科技有限公司 视频智能推送方法和系统
CN109740077B (zh) * 2018-12-29 2021-02-12 北京百度网讯科技有限公司 基于语义索引的答案搜索方法、装置及其相关设备
CN109739969A (zh) * 2018-12-29 2019-05-10 联想(北京)有限公司 答案生成方法和智能会话系统
US11132390B2 (en) * 2019-01-15 2021-09-28 International Business Machines Corporation Efficient resolution of type-coercion queries in a question answer system using disjunctive sub-lexical answer types
TWI703456B (zh) * 2019-01-19 2020-09-01 亞太智能機器有限公司 智能推薦系統與智能推薦方法
CN109918486B (zh) * 2019-01-24 2024-03-19 平安科技(深圳)有限公司 智能客服的语料构建方法、装置、计算机设备及存储介质
CN109783631B (zh) * 2019-02-02 2022-05-17 北京百度网讯科技有限公司 社区问答数据的校验方法、装置、计算机设备和存储介质
CN109885660B (zh) * 2019-02-22 2020-10-02 上海乐言信息科技有限公司 一种知识图谱赋能的基于信息检索的问答系统和方法
CN109960757A (zh) * 2019-02-27 2019-07-02 北京搜狗科技发展有限公司 网页检索方法及装置
CN109977204A (zh) * 2019-03-08 2019-07-05 科讯嘉联信息技术有限公司 一种基于知识库的智能问答系统和方法
CN110175585B (zh) * 2019-05-30 2024-01-23 北京林业大学 一种简答题自动批改系统及方法
CN112015852A (zh) * 2019-05-31 2020-12-01 微软技术许可有限责任公司 在关于事件的会话中提供响应
CN110209768B (zh) * 2019-05-31 2021-08-10 中国联合网络通信集团有限公司 自动问答的问题处理方法和装置
CN110176315B (zh) * 2019-06-05 2022-06-28 京东方科技集团股份有限公司 医疗问答方法及系统、电子设备、计算机可读介质
CN112231450A (zh) * 2019-06-28 2021-01-15 京东方科技集团股份有限公司 问答检索方法、问答检索装置、问答检索设备及介质
CN110377831B (zh) * 2019-07-25 2022-05-17 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110569343B (zh) * 2019-08-16 2023-05-09 华东理工大学 一种基于问答的临床文本结构化方法
CN110457459B (zh) * 2019-08-16 2022-04-08 达闼机器人有限公司 基于人工智能的对话生成方法、装置、设备及存储介质
CN110674271B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种问答处理方法及装置
CN110929016A (zh) * 2019-12-10 2020-03-27 北京爱医生智慧医疗科技有限公司 一种基于知识图谱的智能问答方法及装置
CN111160030B (zh) * 2019-12-11 2023-09-19 北京明略软件系统有限公司 一种信息抽取方法、装置、及存储介质
CN113051390B (zh) * 2019-12-26 2023-09-26 百度在线网络技术(北京)有限公司 知识库构建方法、装置、电子设备和介质
CN111125335B (zh) * 2019-12-27 2021-04-06 北京百度网讯科技有限公司 问答处理方法、装置、电子设备和存储介质
CN111858869A (zh) * 2020-01-03 2020-10-30 北京嘀嘀无限科技发展有限公司 一种数据匹配方法、装置、电子设备和存储介质
CN111340233B (zh) * 2020-02-20 2022-08-09 支付宝(杭州)信息技术有限公司 机器学习模型的训练方法及装置、样本处理方法及装置
CN111708870A (zh) * 2020-05-27 2020-09-25 盛视科技股份有限公司 基于深度神经网络的问答方法、装置及存储介质
CN111708873B (zh) * 2020-06-15 2023-11-24 腾讯科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
US11907670B1 (en) 2020-07-14 2024-02-20 Cisco Technology, Inc. Modeling communication data streams for multi-party conversations involving a humanoid
US11875362B1 (en) 2020-07-14 2024-01-16 Cisco Technology, Inc. Humanoid system for automated customer support
CN111859985B (zh) * 2020-07-23 2023-09-12 上海华期信息技术有限责任公司 Ai客服模型测试方法、装置、电子设备及存储介质
CN111858896B (zh) * 2020-07-30 2024-03-29 上海海事大学 一种基于深度学习的知识库问答方法
CN112101040B (zh) * 2020-08-20 2024-03-29 淮阴工学院 一种基于知识图谱的古代诗词语义检索方法
CN111931507A (zh) * 2020-08-21 2020-11-13 贝壳技术有限公司 获取用于实现会话的多元组集合方法、装置、介质及设备
CN112118311B (zh) * 2020-09-17 2023-10-27 阿波罗智联(北京)科技有限公司 信息车载交互方法、装置、设备以及存储介质
CN111831812B (zh) * 2020-09-21 2020-12-15 北京智源人工智能研究院 基于知识图谱的阅读理解数据集自动生成方法和设备
CN112256847B (zh) * 2020-09-30 2023-04-07 昆明理工大学 融合事实文本的知识库问答方法
US20220138170A1 (en) * 2020-10-29 2022-05-05 Yext, Inc. Vector-based search result generation
CN112035730B (zh) * 2020-11-05 2021-02-02 北京智源人工智能研究院 一种语义检索方法、装置及电子设备
CN112380328B (zh) * 2020-11-11 2024-02-06 广州知图科技有限公司 一种安全应急响应机器人交互方法及系统
CN112417100A (zh) * 2020-11-20 2021-02-26 大连民族大学 辽代历史文化领域知识图谱及其智能问答系统的构建方法
CN112417104B (zh) * 2020-12-04 2022-11-11 山西大学 一种句法关系增强的机器阅读理解多跳推理模型及方法
CN112541362B (zh) * 2020-12-08 2022-08-23 北京百度网讯科技有限公司 一种泛化处理的方法、装置、设备和计算机存储介质
CN112749265B (zh) * 2021-01-08 2022-08-19 哈尔滨工业大学 一种基于多信息源的智能问答系统
CN112948546B (zh) * 2021-01-15 2021-11-23 中国科学院空天信息创新研究院 面向多源异构数据源的智能问答方法及装置
CN113157885B (zh) * 2021-04-13 2023-07-18 华南理工大学 一种面向人工智能领域知识的高效智能问答系统
CN113094519B (zh) * 2021-05-07 2023-04-14 超凡知识产权服务股份有限公司 一种基于文档进行检索的方法及装置
CN113486152A (zh) * 2021-07-16 2021-10-08 上海淇馥信息技术有限公司 一种业务知识库构建方法、装置和电子设备
CN113722452B (zh) * 2021-07-16 2024-01-19 上海通办信息服务有限公司 一种问答系统中基于语义的快速知识命中方法及装置
WO2024015320A1 (en) * 2022-07-11 2024-01-18 Pryon Incorporated Visual structure of documents in question answering
CN115757727A (zh) * 2022-11-17 2023-03-07 北京语言大学 一种基于语法点进行检索的方法、装置及文心检索平台
CN116756347B (zh) * 2023-08-21 2023-10-27 中国标准化研究院 一种基于大数据的语义信息检索方法
CN116911312B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 一种任务型对话系统及其实现方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048441A (ja) * 2007-08-21 2009-03-05 Univ Of Tokyo 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
JP2010009471A (ja) * 2008-06-30 2010-01-14 Nec Corp 質問回答検索システム及びその方法とプログラム
JP2012178078A (ja) * 2011-02-28 2012-09-13 Hitachi Ltd 文書処理装置
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN104199965A (zh) * 2014-09-22 2014-12-10 吴晨 一种语义信息检索方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
DE69900975T2 (de) 1999-04-12 2002-11-28 Alcatel Sa Verbesserte kanaladaptive, schnelle Leistungsregelung in CDMA
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
KR100931772B1 (ko) * 2004-01-15 2009-12-14 엔에이치엔(주) 웹사이트 검색 서비스 제공 방법 및 그 시스템
US7870117B1 (en) * 2006-06-01 2011-01-11 Monster Worldwide, Inc. Constructing a search query to execute a contextual personalized search of a knowledge base
WO2008071002A1 (en) * 2006-12-15 2008-06-19 Aftercad Software Inc. Visual method and system for rdf creation, manipulation, aggregation, application and search
US9396262B2 (en) * 2007-10-12 2016-07-19 Lexxe Pty Ltd System and method for enhancing search relevancy using semantic keys
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
US20110301941A1 (en) * 2009-03-20 2011-12-08 Syl Research Limited Natural language processing method and system
US8898159B2 (en) * 2010-09-28 2014-11-25 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
US8747115B2 (en) * 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
TWI469119B (zh) * 2012-08-06 2015-01-11 Au Optronics Corp 顯示器及其閘極驅動器
CN104216913B (zh) * 2013-06-04 2019-01-04 Sap欧洲公司 问题回答方法、系统和计算机可读介质
CN104252533B (zh) * 2014-09-12 2018-04-13 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104573028B (zh) * 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048441A (ja) * 2007-08-21 2009-03-05 Univ Of Tokyo 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
JP2010009471A (ja) * 2008-06-30 2010-01-14 Nec Corp 質問回答検索システム及びその方法とプログラム
JP2012178078A (ja) * 2011-02-28 2012-09-13 Hitachi Ltd 文書処理装置
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN104199965A (zh) * 2014-09-22 2014-12-10 吴晨 一种语义信息检索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021500650A (ja) * 2017-10-23 2021-01-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検索エンジン最適化技法
JP7159305B2 (ja) 2017-10-23 2022-10-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 検索エンジン最適化技法

Also Published As

Publication number Publication date
EP3096246A4 (en) 2017-11-29
US20170308531A1 (en) 2017-10-26
KR20160125375A (ko) 2016-10-31
US10242049B2 (en) 2019-03-26
JP6309644B2 (ja) 2018-04-11
WO2016112679A1 (zh) 2016-07-21
CN104573028A (zh) 2015-04-29
KR101895249B1 (ko) 2018-09-05
EP3096246A1 (en) 2016-11-23
CN104573028B (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
JP6309644B2 (ja) スマート質問回答の実現方法、システム、および記憶媒体
US11521713B2 (en) System and method for generating clinical trial protocol design document with selection of patient and investigator
CN105528437B (zh) 一种基于结构化文本知识提取的问答系统构建方法
US9965726B1 (en) Adding to a knowledge base using an ontological analysis of unstructured text
CN108681574B (zh) 一种基于文本摘要的非事实类问答答案选择方法及系统
CN104516949B (zh) 网页数据处理方法和装置、查询处理方法及问答系统
CN106776797A (zh) 一种基于本体推理的知识问答系统及其工作方法
CN109948154B (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
CN112883182A (zh) 一种基于机器阅读的问答匹配方法及装置
Tohidi et al. Optimizing Persian multi-objective question answering system
Yusuf et al. Query expansion method for quran search using semantic search and lucene ranking
CN114722176A (zh) 一种智能答疑的方法、装置、介质及电子设备
Banerjee et al. Dblp-quad: A question answering dataset over the dblp scholarly knowledge graph
Li et al. Neural factoid geospatial question answering
Goslin et al. A Wikipedia powered state-based approach to automatic search query enhancement
Kessler et al. Extraction of terminology in the field of construction
Dulceanu et al. PhotoshopQuiA: A corpus of non-factoid questions and answers for why-question answering
Juan An effective similarity measurement for FAQ question answering system
CN105677684A (zh) 一种基于外部数据源对用户生成内容进行语义标注的方法
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法
Çelebi et al. Automatic question answering for Turkish with pattern parsing
Clifton et al. Bangor at TREC 2004: Question Answering Track.
Subhashini et al. A framework for efficient information retrieval using NLP techniques
Tamang et al. Adding smarter systems instead of human annotators: re-ranking for system combination
Dai et al. Qam: question answering system based on knowledge graph in the military

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180314

R150 Certificate of patent or registration of utility model

Ref document number: 6309644

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250