JP2017511922A

JP2017511922A - スマート質問回答の実現方法、システム、および記憶媒体

Info

Publication number: JP2017511922A
Application number: JP2016552590A
Authority: JP
Inventors: マ，ヤンジン; リー，グオファ; サン，シンウ; リー，シンジャン; チャン，ウェイメン; ウェイ，ハオジ; リョウ，メン; ゾン，ミン; チャン，シファン; ウー，ファ; ワン，ハイフン
Original assignee: バイドゥオンラインネットワークテクノロジー（ベイジン）カンパニーリミテッド
Priority date: 2015-01-14
Filing date: 2015-08-05
Publication date: 2017-04-27
Anticipated expiration: 2035-08-05
Also published as: EP3096246A4; US20170308531A1; KR20160125375A; US10242049B2; JP6309644B2; WO2016112679A1; CN104573028A; KR101895249B1; EP3096246A1; CN104573028B

Abstract

本発明の実施例は、スマート質問回答の実現方法、システム、および記憶媒体を提供する。当該方法は、クエリの問題を受信するステップと、前記問題に対して意味解析を行うステップと、意味解析の結果に基づいて、前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、検索処理の結果に基づいて解答を返すステップとを含み、問題に答える場合の精度を効果的に向上させた。【選択図】図１ｂ

Description

本特許出願は、２０１５年１月１４日に提出された出願番号が２０１５１００１７５６３．６で、出願人が百度在線網絡技術（北京）有限公司で、発明の名称が「スマート質問回答の実現方法、およびシステム」である中国特許出願に基づき優先権を主張し、当該出願の内容の全てを本出願に援用する。

本発明の実施例は、情報クエリの技術分野に関し、特に、スマート質問回答の実現方法、システム、および記憶媒体に関する。

スマート質問回答システムは、大規模なインターネットデータの推論、および言語に対する深い意味理解に基づくスマートシステムである。スマート質問回答システムは、知識類の問題に答えることができるだけでなく、医療、教育、生活、および科学技術などの人々の生活と緊密な関係にある様々な領域にも用いでき、情報を取得する効率を大幅に高めてきている。

従来のスマート質問回答システムは、主にコミュニティに基づく質問回答に関し、ユーザ問題および回答の履歴データを発掘することによって、ユーザ問題と質問回答サイトにおける既存の問題の間の類似度を計算し、類似度の高いユーザ回答を返すものである。

上記スマート質問回答システムは、質問回答サイトのスマート質問回答システムに頼り、問題に対するカバー率が低くて発生頻度の高くない問題、および人気のない問題を持っているユーザの需要に対応できず、回答が参差として（ばらばらで）揃わなく、与えられた解答が十分に正確ではないという欠陥が存在した。

本発明の実施例は、問題に答える精度を向上させるために、スマート質問回答の実現方法、システム、および記憶媒体を提供する。

第１の態様において、本発明の実施例は、
クエリの問題を受信するステップと、
前記問題に対して意味解析を行うステップと、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、
検索処理の結果に基づいて解答を返すステップと、
を含むスマート質問回答の実現方法を提供する。

第２の態様において、本発明の実施例は、
クエリの問題を受信するために構成される中央制御システムと、
前記問題に対して意味解析を行うために構成される問題解析システムと、を備え、
前記中央制御システムは、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成され、
前記バックエンドシステムは、発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを備え、
前記中央制御システムは、さらに、検索処理の結果に基づいて解答を返すために構成されるスマート質問回答の実現システムを提供する。

第３の態様において、本発明の実施例は、
１つ以上のモジュールが記憶される不揮発性コンピュータ記憶媒体であって、前記１つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返すように実行させる、
不揮発性コンピュータ記憶媒体を提供する。

本発明の実施例に係るスマート質問回答の実現方法、システム、および記憶媒体は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題に関する解答の検索範囲を広げ、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を行なって正確な解答を得ることが可能になり、問題に答える精度を効果的に向上させた。

以下、本発明の実施例の技術案をより明確に説明するために、実施例の説明に必要な図面を簡単に説明し、勿論、後述する図面が単に本発明のいくつかの実施例に過ぎず、当業者にとっては、創造的な労働をせずに、それらの図面を変更し、置換することができる。

本発明の実施例に係るスマート質問回答の実現方法に適用されるスマート質問回答の実現システムのネットワークアーキテクチャの模式図である。本発明の実施例１に係るスマート質問回答の実現方法のフローチャートである。本発明の実施例２に係るスマート質問回答の実現方法のフローチャートである。本発明の実施例２に係るスマート質問回答の実現方法において三項関係ベースを確立するフローチャートである。本発明の実施例３に係るスマート質問回答の実現方法において正文ベース検索システムが問題に対して検索処理を行うフローチャートである。本発明の実施例４に係るスマート質問回答の実現方法において検索処理の結果に基づいて解答を返すフローチャートである。本発明の実施例５に係るスマート質問回答の実現システムの構造模式図である。本発明の実施例７に係るスマート質問回答の実現方法を実行する機器のハードウェア構造模式図である。

以下、図面を参照しながら本発明の実施例の技術案を明確で十分に説明するが、説明される実施例は、本発明の実施例の全てではなく、実施例の一部であり、且つ本発明を限定しなく、本発明の原理を説明するためのものであることは明らかである。本発明の実施例に基づき、当業者が創造的な労働をせずに得るほかの実施例は、いずれも本発明が保護しようとする保護範囲に属する。

本発明の実施例に係る方法は、ハードウェアおよび／またはソフトウェアで実現されるスマート質問回答の実現システムにより実行されることができる。

以下、明らかにするために、図１ａに合わせて、まず当該システムのネットワークアーキテクチャを説明する。当該システムは、中央制御システム、問題解析システム、およびバックエンドシステムを含む。

そのうち、前記中央制御システムは、クエリの問題（すなわち、図１ａのｑｕｅｒｙ）を受信するために構成され、設定されたテキストボックスによりユーザから入力されたクエリの問題を受信してもよく、また、設定された動作ボタンによりユーザから入力されたクエリの問題を受信してもよく、例えば、ユーザ音声を受信するための動作ボタンによりユーザから入力された音声を受信し、音声認識により入力された音声に対応した内容を得てクエリの問題とする。前記問題解析システムは、前記問題に対して意味解析を行うために構成される。前記中央制御システムは、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成される。前記バックエンドシステムは、意味関係（Ｆｒａｍｅ）発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを含む。前記中央制御システムは、さらに、検索処理の結果に基づいて解答（すなわち、図１ａのＭｅｒｇｅ後の結果）を返すために構成される。

説明する必要があるのは、前記中央制御システムは、前記スマート質問回答の実現システムにおける中核制御システムであり、クエリの問題を受信し、前記問題を問題解析システムに転送し、そして前記問題解析システムによる意味解析の結果により、予め設定された配布ポリシーに基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行う役割を担い、具体的には、前記問題を意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムに配布して対応の検索処理を行なってから、検索処理の結果に基づいて解答を返し、中央制御システムのフロントエンド・ユーザに、前記クエリの問題に対応した解答を知らせ、スマート質問回答を実現する。

そのうち、異なるバックエンドシステムは、異なる資源プールに対応しており、これについては、下記の実施例において詳細に説明する。また、配布ポリシーについても後述する。

（実施例１）
図１ｂに示すように、本実施例に係るスマート質問回答の実現方法は、ステップ１１０〜ステップ１４０を含む。

ステップ１１０では、クエリの問題を受信する。

当該ステップにおいて、中央制御システムによりクエリの問題を受信する。ユーザインタフェースにおいて設定されたテキストボックスによりユーザから入力されたクエリの問題を受信してもよく、また、ユーザインタフェースにおいて設定された動作ボタンによりユーザから入力されたクエリの問題を受信してもよく、例えば、ユーザ音声を受信するための動作ボタンによりユーザから入力された音声を受信し、音声認識により入力された音声に対応した内容を得てクエリの問題とする。

説明する必要があるのは、受信される前記クエリの問題のカバー範囲は、非常に広くてもよく、言い換えると、任意の問題であってもよく、発生頻度が高いである、ユーザが関心を持っている問題であってもよければ、発生頻度が中等ぐらいである、質問回答システムで提供された既存の解答に対するユーザの満足度が低い問題であってもよく、さらに、人気のない問題、すなわち発生頻度が非常に低い問題であってもよい。

ステップ１２０では、前記問題に対して意味解析を行う。

当該ステップは、問題解析システムにより実行され、前記問題に対して基礎的な形態論（品詞論）解析を行うことができ、前記基礎的な形態論解析は、前記問題に対する単語分割処理および品詞タグ付け処理を含んでもよく、さらに、前記問題における検索語の重要性の確定および前記問題に対する依存関係構文解析等を含んでもよい。

そのうち、依存関係構文は、最初にフランス言語学者Ｌ．Ｔｅｓｎｉｅｒｅが１９５９年にその著作『構造的統語論の基礎』により提出したものであり、言語学の発展に対して深い影響を与えてきており、依存関係構文解析は、自然言語処理の分野における構文解析の重要な分枝の１つとなっている。依存関係文法解析は、文（センテンス）を依存関係構文木として解析し、各語彙の間の依存関係を述べることによって、文の構文構造を解明するものであり、文における中核動詞が他の成分を支配する中心成分であるが、中核動詞自体が他の成分のいずれにも支配されておらず、被支配成分のいずれも、ある依存関係によって支配者に従属していることを主張する。

当該ステップにおいて、前記問題に対して基礎的な文法解析を行う以外、さらに、好ましくは、前記問題の焦点、観点および観点類型を認識することを含んでもよい。

そのうち、前記問題の焦点は、問題の解答の援用であり、解答の代わりに完全な平叙文を構成するために用いられることができる。例えば、「２０１３年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題の焦点は「誰か」となっている。前記問題の焦点は、主に規則により認識され、当該認識規則は、前記問題が疑問詞付き問題である場合、前記問題の焦点が当該疑問詞となり、前記問題が疑問詞のない問題である場合、前記問題の焦点がデフォルトとしてヌル（Ｎｕｌｌ）となることであってもよい。

そのうち、前記問題の観点を認識することとは、前記問題の観点の個数、すなわち前記問題に含まれる観点の数を認識することを指す。前記問題の観点の数は、汎用需要（その観点の個数が一般的に８個より大きい）であってもよく、具体的な数であってもよい。例えば、「野生動物は、どれとどれがいるか」という問題の観点の数は、何千何万もあり、それぞれ異なる野生動物に対応しているため、当該問題の観点は汎用需要と定義され、また、例えば、「中国古代の有名な四大美人」という問題では、「四大」に言及しているため、その観点の個数が４となり、さらに、例えば、「２０１３年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、現在の問題のコンテキストにより、優勝者が個人であるため、その観点の個数が１となっている。

そのうち、前記質問の観点類型を認識することとは、ユーザの所望する観点がどんな類型に属するかを認識することを指す。例えば、「２０１３年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、その問題の観点類型が「優勝者」となっている。問題の観点類型の認識方法は、規則認識方法とモデル学習モデルとの２種類に分けられ、規則認識方法において、観点類型が焦点の前の１つの語彙であり、モデル学習モデルにおいて、依存関係構文解析などのツールを基にして訓練言語資料および訓練モデル動態を生成することによって問題の観点類型を認識する。

さらに、前記問題の観点類型を認識した後には、前記問題の観点類型に対して正規化処理を行うことをさらに含んでもよい。

問題の観点類型の正規化は、問題の観点類型を固定類別体系にマッピングすることである。例えば、「２０１３年ウィンブルドン選手権女子シングルス優勝者は誰か」という問題では、焦点が「誰か」であり、観点類型が「優勝者」であるため、類別の「人物」に正規化される。問題の観点類型の正規化方法は、一般的に観点規則または観点用語集に基づいて正規化する。

ステップ１３０において、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行う。

前記したように、当該ステップは、中央制御システムおよびバックエンドシステムにより実行され、具体的には、前記問題解析システムによる意味解析の結果に応じて、予め設定された配布ポリシーに基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行い、具体的には、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムに、前記問題を配布して対応の検索処理を行う。

上記各種のバックエンドシステムは、単独で実行されてもよく、組み合わせて採用されてもよい。

そのうち、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うために準拠された配布ポリシーは、解析された問題の類型が構造的な依存類型（すなわち、「前の文／次の文」という類型）である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うことを含んでもよい。

説明する必要があるのは、各バックエンドシステムの前記問題に対する検索処理が互いに独立したものである。

以下、異なるバックエンドシステムに対応する資源プールのそれぞれについて説明する。

意味関係発掘システムの資源プールは、逆配列索引ライブラリと、Ｋｖ（ＫｅｙＶａｌｕｅ、すなわち、キー値）資源プールとの２つの部分を含んでもよく、当該逆配列索引ライブラリおよびＫｖ資源プールは、オフラインドキュメント処理プログラムにより構築されることができる。そのうち、通常、ドキュメント集合において多くのドキュメントにある単語を含み、各ドキュメントは、ドキュメント番号、単語がこのドキュメントに現した回数およびどの位置に現したなどの情報を記録しており、このような１つのドキュメントに関連する情報は、逆配列索引と称される。逆配列索引を利用すれば、検索効率を向上させることができる。Ｋｖ資源プールは、発掘された詩詞種類の資源および歌詞などの資源などを含んで、依存関係類型の問題を処理するために構成されてもよい。

正文ベース検索システムの資源プールは、正文ベースおよびＫｖ資源プールを含んでもよい。そのうち、正文ベースは、検索エンジンによる大規模の非構造化ウェブページに対する索引、解析およびランキングの技術に基づいて、大規模の非構造化ウェブページデータから確立されたものである。Ｋｖ資源プールは、「百度百科」および「ウィキペディア（ｗｉｋｉ）百科」等の文庫に基づいて確立されたものである。大規模の非構造化ウェブページデータと、百度百科およびウィキペディア百科等の文庫とが豊富な知識を含んでいるため、正文ベース検索システムは、バックエンドシステム全体の中核となり、すなわち、スマート質問回答を実現する中核処理システムとなり、ユーザから入力されたクエリの問題に対する解答検索を実現することができる。

知識ベース検索システムの資源プールは、オフラインで発掘された構造化知識ベースであってもよく、＜エンティティ、属性、値＞という三要素セット、例えば＜張三、女房、美人＞、＜美人、星座、牡羊座＞、＜アバター、製作者、ジェームス・キャメロン＞等として記憶されており、知識ベース情報を基にして推理する役割を担っている。例えば、「張三の女房はどの星座であるか」という問題の場合、張三の女房が美人で美人の星座が牡羊座であることに基づいて推理すると、当該問題の解答は「牡羊座」となる。

質問回答ベース検索システムの資源プールは、オフラインで発掘された高品質の質問回答データ、例えば「百度知道」における履歴のユーザ問題と回答に基づいて形成された質問回答コミュニティ資源プールであってもよい。質問回答ベース検索システムの処理フローは、正文ベース検索システムの処理フローに類似し、下記の実施例３では、正文ベース検索システムの具体的な処理フローについて詳細に説明する。

ステップ１４０において、検索処理の結果に基づいて解答を返す。

本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題の解答に関する検索範囲を広げて、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を行なって正確な解答を得ることが可能になり、問題に答える場合の精度を効果的に向上させた。

本発明の実施例に係るスマート質問回答の実現方法の実行主体は、クラウドシステムとされてもよく、任意外形のロボットに組み込んで、あらゆる質問回答種類の場面に適用されてもよい。例えば、宿題を補導することに適用される場合、学生はよく知らないナレッジポイントについてスマート質問回答の実現システムに、例えば、「万有引力の法則の創立者は誰か、その創立の意義は何か」と直接対話してもよく、これでより全面的かつ有用な情報の補導が得られる。また、例えば、公共の場所での自動的カスタマーサービスに適用される場合、マーケットにいる際に、または服を選択しようとする際に、スマート質問回答の実現システムと対話して天然繊維と化学繊維とどちらのほうがよいのか、それぞれなにかの長所や短所があるかという情報を知ることができる。あるいは、公園を見物する場合、観光客はスマート質問回答の実現システムと対話して、マイカイの開花期などの情報を知ることができる。さらに、例えば、医療を補助することに適用される場合、インターネットビッグデータおよびユーザの病例情報に合わせて、スマート質問回答の実現システムによる解析および推理により、参考になる病例の成因に対する解析を提供することができる。

例示的には、上記した前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含む。

例示的には、上記した意味関係発掘システムが前記問題に対して検索処理を行うステップは、
三項関係ベースから検索して前記問題の解答を得るステップを含む。

例示的には、上記した三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含む。

例示的には、上記した依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含む。

例示的には、上記した三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するステップを含む。

例示的には、上記した正文ベース検索システムが前記問題に対して検索処理を行うステップは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含む。

例示的には、上記した一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするステップを含む。

例示的には、上記した検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含む。

例示的には、上記したろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。

例示的には、上記した前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含む。

例示的には、上記したろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。

例示的には、上記した前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に応じて前記候補解答をランキングするステップと、を含む。

（実施例２）
本実施例は、上記実施例を基にして、スマート質問回答の実現方法の他の技術案を提供する。

図２ａに示すように、本実施例に係るスマート質問回答の実現方法は、具体的に、ステップ２１０〜ステップ２４０を含む。

ステップ２１０において、クエリの問題を受信する。

ステップ２２０において、前記問題に対して意味解析を行い、「前の文」または「次の文」である問題の観点類型を得る。

当該ステップは、前述した実施例における前記問題に対して基礎的な文法解析を行うステップ、および、前記問題の焦点、観点および観点類型を認識するステップに同様に適用され、ここで贅言しない。

ステップ２３０において、意味関係発掘システムが三項関係ベースから検索して前記問題の解答を得る。

当該ステップでは、三項関係ベースにおける三項関係は、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を包括しており、そして合理的検証を通過したものである。

前記三項関係ベースを確立するステップは、図２ｂに示すように、好ましくはステップ２３１〜ステップ２３６を含む。

ステップ２３１において、前処理を行う。

依存関係構文解析の構造に影響しないように、文中の括弧例えば「（）」中の内容を除去する。

ステップ２３２において、基礎的な詞／構文解析を行う。

元ウェブページにおけるテキストに含まれる文の部分に対して単語分割、固有名詞認識、エンティティ認識、品詞タグ付け、および依存関係解析を行うことにより、依存関係を持つ文を得ることができる。

ステップ２３３において、連用修飾語断片を認識する。

例えば、コンマで分断された断片に対して断片類型認識を行い、主に時間連用修飾語の断片、非時間連用修飾語の断片、および他の断片に分ける。

ステップ２３４において、三項関係対を抽出する。

当該ステップは、具体的に、依存関係解析における親ノード毎に関係抽出を行い、三項関係対を得る。前記三項関係対は、具体的に、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を含む。例えば、「学生Ａが賞を受けた」の場合、「学生Ａ」と「賞」との間に、動詞を中核とする依存関係があり、「黄山が非常に美しい」の場合、「黄山」と「非常に美しい」との間に、エンティティと属性との依存関係があり、また、「白日依山尽」の次の文が「黄河入海流」であるため、この両方は、異なるエンティティの間の依存関係として理解されることができる。

ステップ２３５において、欠失成分を補足する。

例えば、主語の補足、時間や場所の連用修飾語の補足、目的語の補足などを行う。

ステップ２３６において、合理的検証およびろ過を行う。

解析された三項関係対に対して合理であるか否かを判断し、不合理である場合、当該三項関係対を残さないことにし、すなわち、解析された三項関係対をろ過し、合理的な三項関係対、すなわち検証を通過した三項関係対のみを残すことにする。そして、検証を通過した三項関係対で前記三項関係ベースを確立する。

例えば、元ウェブページから「黄河入海流、白日依山尽」が抽出された場合、ステップ２３３にいて、当該元ウェブページに基づいて抽出して『「黄河入海流」は「白日依山尽」の前の文である』ということが得られ、既存の詩詞資源を参照して、この三項関係対が不合理であると判定することができるため、当該三項関係対をろ過して除去するようにした。

ステップ２４０において、検索処理の結果に基づいて解答を返す。

本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システムを採用して三項関係ベースから前記問題に対して対応の検索処理を行うことにより、前記問題の解答を検索して得る。三項関係ベースにおける三項関係は、動詞を中核とする依存関係、エンティティと属性との依存関係、および、異なるエンティティの間の依存関係を包括しており、問題に関する解答の検索範囲を広げたため、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題をカバーすることができ、また、三項関係ベースにおける三項関係が合理的検証を通過したものであるため、問題に対する回答をより正確にした。

説明する必要があるのは、三項関係ベースを確立する過程において、三項関係対を得る前に、前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するステップをさらに含んでもよい。

具体的には、主語、述語、目的語、および連用修飾語などを含む、依存関係を持つ文の断片類型を認識し得ることができ、そのうち、連用修飾語は、時間連用修飾語、場所連用修飾語、原因連用修飾語、および結果連用修飾語などの類型を含んでもよい。述語は動詞とされており、前記したように、依存関係文法解析は、文を依存関係構文木として解析し、各語彙の間の依存関係を述べることによって、文の構文構造を解明するものであり、文における中核動詞が他の成分を支配する中心成分であるが、中核動詞自体が他の成分のいずれにも支配されておらず、被支配成分のいずれも、ある依存関係によって支配者に従属していることを主張する。動詞を中核とする依存関係とは、述語と他の類型の断片との間の依存関係を指す。

当該形態では、依存関係を持つ文における欠失した述語以外の他の成分を補足することにより、三項関係における動詞を中核とする依存関係を豊富にすることに役立ち、問題に関する解答の検索範囲や、問題のカバー範囲をさらに広げ、特に発生頻度の高くない問題および人気のない問題をカバーすることができる。

（実施例３）
本実施例は、実施例１を基にして、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うという動作を、前記意味解析の結果に基づいて、前記正文ベース検索システムが前記問題に対して検索処理を行うように最適化した。

図３に示すように、それは本発明の実施例３に係るスマート質問回答の実現方法において、正文ベース検索システムが問題に対して検索処理を行うフローチャートである。具体的には、ステップ３１０〜ステップ３３０を含む。

ステップ３１０において、関連するドキュメントを検索する。

資源プールから検索し、検索結果、ウェブページ正文およびクリックログを得、前記問題に関連するドキュメント集合を検索し出す。

当該ステップは、検索エンジンにより前記問題を検索し、関連するウェブページ集合を呼び戻して前記問題に関連するドキュメント集合とすることができ、検索エンジンによる関連性ランキングは、ある程度に各ドキュメントの重要性を具現している。具体的には、検索エンジンにより前記問題を検索し、前記問題に関連する検索結果および他の資源（例えば、要約、ＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ、統一資源位置指定子）、ドキュメントクリックデータ、およびドキュメントの正文情報などを含んでもよい）を得た後、ＵＲＬにより呼び戻されたウェブページに対応するドキュメント内容を取得して問題および解答の深い解析に用いることができ、そして、クリックログにより各ドキュメントの問題に対する満足度を解析することができる。

そのうち、クリックログは、クリックされた各ドキュメントの問題に対する満足度をＵＲＬレベルから評価するものである。

また、述べ方法が異なるが実質的に同様である資源、例えば時間種類の「２０１０年３月」と「２０１０．０３」などを合併し、表示が誤った資源を修正する前処理をさらに含んでもよい。

また、好ましくは、ドキュメント関連性の計算、およびドキュメントのランキングをさらに含んでもよい。

意味類似度などの特性計算に合わせてドキュメント関連性を計算することができる。意味類似度の計算とは、問題とドキュメントテーマとの類似度値を計算することを指し、そのうち、意味計算方法は、主に検索語の重要性、検索語の同義語の交換、検索語の書直しなどの情報を利用して計算する。

ドキュメント関連性のランキングとは、検索エンジンが問題における検索語に基づいて多量のウェブページ・ドキュメントを呼び戻すが、その転義リスクを制限しないことを指す。ドキュメント関連性のランキング方法は、検索エンジン（例えば、「百度検索エンジン」）による検索ランキング結果、およびクリックログに解析されたユーザのウェブページに対する満足度に基づき、意味類似度の計算などの特性に合わせて関連性の再ランキングを行い、内容の転義問題を解決する。そのうち、内容の転義は、ノイズデータを引き入れる可能性があり、誤答（間違った解答）が抽出され、またはランキング段階で誤答の高いランキングを引き起こしてしまう。

ステップ３２０において、候補断片を抽出しランキングする。

前記ドキュメント集合から、候補解答が含まれている候補断片を検索する。

まず、段落または複数の文を単位として各ドキュメントを区画し、その後、設定されたキーワードに応じて各ドキュメントから検索して前記設定されたキーワードに対応した断片を得て候補断片とし、候補解答をさらに位置決めるために用いるようにしてもよい。

また、候補断片をさらにランキングしてもよく、具体的には、源ドキュメントの関連性重み、候補断片の内容類似度、候補断片の関連性等の特性に基づいて断片信頼度を計算し、信頼度に基づいて候補断片をランキングしてもよい。

源ドキュメントの関連性重みの計算は、ドキュメント関連性の再ランキングに関連の特性を用いて線形フィッティングして行われる。候補断片の内容類似度は、問題と候補断片との内容類似度の計算に用いられ、意味類似度計算の方法を採用することができる。候補断片の関連性計算は、問題と候補断片との関連性を計測するために用いられ、計算方法は、主に、問題における各検索語の重要性、各検索語の候補断片におけるヒット個数、およびヒット位置などの特性を利用してフィティングすることである。

ステップ３３０において、候補解答を抽出しランキングする。

前記候補断片から前記候補解答を抽出し、一回目のランキングを行う。

当該ステップにおいて、候補解答の抽出動作は、オフラインで発掘された総合辞書である開領域辞書を利用して、名前付きエンティティ認識技術により実現することができる。

一回目のランキングの動作は、前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングすることが好ましい。

候補解答と問題におけるキーワードとの共起重みに基づいて候補解答に対して一回目のランキングを行ってもよい。

また、候補解答の候補断片における出現位置、検索結果における候補解答の逆文書頻度、源ドキュメントの関連性、源候補断片の関連性、および、同一解答（同義解答を含み）に対する異なる候補断片の信頼度加重投票値の少なくとも１つの特性に基づいて、候補解答に対して一回目のランキングを行ってもよい。

そのうち、源ドキュメントの関連性は、ドキュメント関連性の再ランキングに関連の特性で線形フィッティングして取得されることができ、源候補断片の関連性は、源ドキュメント関連性および来源断片と問題との間の意味マッチング度で線形フィッティングして取得されることができる。

上記した候補解答に対する一回目のランキングは、主に候補解答に対する呼び戻しを確保し、多すぎる解答が二回目のランキングに入ってランキング性能やノイズ制御に影響することを回避した。

説明する必要があるのは、候補解答を抽出しランキングした後、候補解答をさらにランキングすること、例えば領域内知識によるろ過、二回目のランキング、および三回目のランキングなどを含んでもよく、これについて、下記実施例は詳細に説明する。

（実施例４）
本実施例は、上記の各実施例を基にして、検索処理の結果に基づいて解答を返すというステップの好ましい技術案を提供する。

図４に示すように、それは、本発明の実施例４に係るスマート質問回答の実現方法において検索処理の結果に基づいて解答を返すフローチャートである。具体的には、ステップ４１０〜ステップ４２０を含む。

ステップ４１０において、領域内知識で前記検索処理の結果をろ過する。

異なる問題および異なる解答類型に必要な知識、特性、およびランキングアルゴリズムのいずれにも差異がある。このため、異なる領域の知識で検索処理の結果をろ過し、問題とマッチングした検索処理の結果を得ることができる。

領域知識の構築は、主に精密で正確な領域知識辞書の構築である。例えば、ゴールデンレトリーバーが犬類に属し、黒出目金が魚の１種である。問題の類型が犬である場合、領域辞書により候補解答の「黒出目金」がろ過・除去される。

領域辞書の構築は、主に、指定されたサイトの構造化データの発掘（例えば、ｑｉｄｉａｎ．ｃｏｍで小説エンティティを発掘し）、大規模インターネットの非構造化／半構造化データの発掘およびチェック（例えば、百科などの知識種類のコミュニティの分類タグによりエンティティを発掘し）、検索ログの発掘（例えば、「天龍八部の映画」という問題に対応する検索ログから、「天龍八部」を映画エンティティとして発掘し）などのアルゴリズムにより実現される。

ステップ４２０において、ろ過結果に基づいて解答を返す。

当該ステップは、複数の実現形態があり、下記複数の種類を例として説明する。

第１種類の実施形態において、ろ過結果に基づいて解答を返すステップは、具体的に、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。

そのうち、教師付き機械学習モデル（例えば、ＧＢＲａｎｋ機械学習モデル）で前記ろ過結果に対して二回目のランキングを行ってもよい。

前記機械学習モデルは、ランキングされたサンプル解答含有語句、および対応のランキング特性を学習・訓練して得られたものであり、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも１つのランキング特性を含んでもよい。

前記問題マッチング度は、前記候補解答と前記問題の観点類型との意味マッチング度であり、問題マッチング度の計算方式は、通常、大規模言語資料から統計された問題の拡張ベクターと候補解答の拡張ベクターとのマッチング程度でフィッティング計算を行うことである。前記オフセット重みは、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数である。解答と問題との共起情報は、問題の候補解答の主文脈における重要性を評価するために用いられ、エンティティ種類の解答と問題との共起情報の計算は、候補解答の百度百科における情報および問題におけるキーワードで共起程度を計算してもよい。前記解答境界特性とは、解答の左境界と右境界の情報、例えば二重山括弧、引用符、読点等を指す。そのうち、解答信頼度は源ドキュメントに関連しており、各ドキュメントは１つの挙証源と見なされて１回の投票に関与し、各源ドキュメントは１回あたり１票を投じ、理論的には、得票の高い方のドキュメントに対応する解答信頼度が高いことであり、また、解答の所属する候補断片に基づいて解答信頼度を決定してもよく、各候補断片の所属するドキュメントは１つの挙証源と見なされて１回の投票に関与し、各挙証源が毎回投票の重みは、候補断片の関連性により決定され、理論的には、得票の高い方の解答が信頼度が高いことである。

本実施形態は単独で使用されてもよく、前述一回目のランキングと組み合わせて使用されてもよく、好ましくは、候補断片から候補解答を抽出して一回目のランキングを行い、領域内知識を利用して前記ろ過の動作を実行してから、前記ろ過結果に対して二回目のランキングを行う。

当該好ましい実施形態は、候補断片から候補解答を抽出した後、ＵＲＬ重み、オフセット重みおよび問題マッチング度の少なくとも１つの特性で一回目のランキングを行うことによって、ランキングの高い解答の正確性を高め、また、専門領域内知識で異なる類別の問題に対応する解答をろ過することによって、異なる類別の問題に対応する解答の専門性と権威性を確保し、また、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも１つの特性でろ過結果に対して二回目のランキングを行うことによって、問題に対応する解答の専門性と権威性を確保したとともに、ランキングの高い解答の正確性をさらに最適化した。

第２種類の実施形態において、ろ過結果に基づいて解答を返すステップは、具体的に、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含む。

さらに、前記ろ過結果に対して三回目のランキングを行うステップは、好ましくは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含む。

具体的には、二次検索により前記候補解答と前記問題とのマッチング程度を検証することができる。二次検索は、より豊富な問題と解答とのマッチング情報を提供することができ、候補解答で元の問題の焦点を取替え、すなわち、候補解答を元の問題に代入して二次検索を行い、新しい問題と候補解答との関連情報を統計することを指す。例えば、二次検索により返されたドキュメントにおいて新しい問題と候補解答が連続して出現しているか否か、新しい問題と候補解答との共起情報、新しい問題におけるキーワードのヒット状況などがある。現在のドキュメントのテーマが問題種類のテーマである場合、ドキュメントテーマにおいて焦点認識、解答類型認識が認識される。問題に焦点がない場合、解答を元の問題の末尾に加え、分離符号で区切ってから二次検索を行う。

本実施形態は、単独で使用されてもよく、前述一回目のランキングおよび／または前述二回目のランキングと組み合わせて使用されてもよい。

単独使用の場合、候補解答を元の問題に代入し新しい問題として二次検索を行い、新しい問題と候補解答との関連情報に基づいて解答の配列順序に対して最適化調整を行うため、ランキングの高い解答と元のクエリの問題とのマッチング程度を高めることができる。

候補断片から候補解答を抽出して一回目のランキングを行い、領域内知識で前記ろ過動作を実行してから、前記ろ過結果に対して二回目のランキングを行い、そして前記三回目のランキングを行うような組合せ方式の場合、候補断片から候補解答を抽出した後に、ＵＲＬ重み、オフセット重み、および問題マッチング度の少なくとも１つの特性で一回目のランキングを行うことにより、ランキングの高い解答の正確性を高め、また、専門領域内知識で異なる類別の問題に対応する解答をろ過することにより、異なる類別の問題に対応する解答の専門性と権威性を確保し、また、問題マッチング度、オフセット重み、解答と問題との共起情報、解答境界特性、および解答信頼度の少なくとも１つの特性でろ過結果に対して二回目のランキングを行うことにより、問題に対応する解答の専門性と権威性を確保したとともに、ランキングの高い解答の正確性をさらに最適化し、また、候補解答を元の問題に代入し新しい問題として二次検索を行い、新しい問題と候補解答との関連情報に基づいて解答の配列順序に対して最適化調整を行うことにより、ランキングの高い解答と元のクエリの問題とのマッチング程度をさらに高めた。

（実施例５）
本実施例は、スマート質問回答の実現システムを提供し、図５に示すように、当該システムは、中央制御システム５１０、問題解析システム５２０、およびバックエンドシステム５３０を備える。

そのうち、中央制御システム５１０は、クエリの問題を受信するために構成され、問題解析システム５２０は、前記問題に対して意味解析を行うために構成され、前記中央制御システム５１０は、さらに、前記意味解析の結果に基づいて前記問題を対応のバックエンドシステム５３０に配布し対応の検索処理を行うために構成され、前記バックエンドシステム５３０は、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを備え、前記中央制御システム５１０は、さらに、検索処理の結果に基づいて解答を返すために構成される。

本実施例の技術案は、クエリの問題に対して意味解析を行い、意味解析の結果に基づいて、意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを採用して前記問題に対して対応の検索処理を行うことにより、問題の解答に関する検索範囲を広げ、問題に対する回答をより正確にする一方、問題のカバー範囲を広げ、特に発生頻度の高くない問題および人気のない問題に対しても、検索を経てより正確な解答を得ることができる。

上記技術案において、前記問題解析システム５２０は、具体的に、前記問題の焦点、観点、および観点類型を認識するために構成されてもよい。

さらに、前記問題解析システム５２０は、前記問題の観点類型を認識した後、前記問題の観点類型に対して正規化処理を行うために構成されてもよい。

上記技術案において、前記中央制御システム５１０は、具体的に、解析された問題の類型が構造的な依存類型である場合、前記問題を前記意味関係発掘システムに配布して検索処理を行い、そうでない場合、前記問題を前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムに配布して検索処理を行うために構成されてもよい。

そのうち、前記意味関係発掘システムは、具体的に、三項関係ベースから検索して前記問題の解答を得るために構成されてもよい。

前記意味関係発掘システムは、さらに、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得、
依存関係のノードを抽出し、三項関係対を得、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するために構成されてもよい。

前記意味関係発掘システムは、依存関係を持つ文を得る前に、さらに、文中の括弧内の内容を除去するために構成されてもよい。

前記意味関係発掘システムは、三項関係対を得る前に、さらに、前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するために構成されてもよい。

そのうち、前記正文ベース検索システムは、具体的に、
前記問題に関連するドキュメント集合を検索し出し、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うために構成されてもよい。

前記正文ベース検索システムは、具体的に、前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みであるＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするために構成されてもよい。

上記技術案において、前記中央制御システム５１０は、具体的に、
領域内知識で前記検索処理の結果をろ過し、
ろ過結果に基づいて解答を返すために構成されてもよい。

好ましい実施形態として、前記中央制御システム５１０は、具体的に、
前記ろ過結果に対して二回目のランキングを行い、
ランキングされたろ過結果を返すために構成されてもよい。

さらに、前記中央制御システム５１０は、具体的に、教師付き機械学習システムで前記ろ過結果をランキングするために構成されてもよい。

他の好ましい実施形態として、前記中央制御システム５１０は、具体的に、
前記ろ過結果に対して三回目のランキングを行い、
ランキングされたろ過結果を返すために構成されてもよい。

さらに、前記中央制御システム５１０は、具体的に、
前記候補解答と前記問題とのマッチング程度を検証し、
前記マッチング程度に基づいて前記候補解答をランキングするために構成されてもよい。

本発明の実施例に係るスマート質問回答の実現システムは、本発明の任意の実施例に係るスマート質問回答の実現方法を実行することができ、方法を実行するための対応の機能モジュールを備え、且つ対応の有益な効果を有する。

（実施例６）
本実施例は、不揮発性コンピュータ記憶媒体を提供する。そのうち、前記コンピュータ記憶媒体は、１つ以上のモジュールが記憶され、前記１つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返すように実行させる。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記問題に対して意味解析を行うステップは、好ましくは、
前記問題の焦点、観点および観点類型を認識するステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記問題の観点類型を認識した後、前記方法は、さらに、
前記問題の観点類型に対して正規化処理を行うステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、好ましくは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、好ましくは、
三項関係ベースから検索して前記問題の解答を得るステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、好ましくは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。

上記の記憶媒体に記憶されているモジュールが前記機器により実行される際に、前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含んでもよい。

（実施例７）
図６に示すように、それは本発明の実施例７に係るスマート質問回答の実現方法を実行する機器のハードウェア構造模式図である。

当該機器は、
１つ以上のプロセッサ６１０（図６では１つのプロセッサ６１０を例とする）と、
メモリ６２０と、
１つ以上のモジュールと、を備える。

前記機器は、入力装置６３０と出力装置６４０とをさらに備えてもよい。前記機器におけるプロセッサ６１０、メモリ６２０、入力装置６３０、および出力装置６４０は、バスまたは他の方式で接続されてもよいが、図６ではバスによる接続を例としている。

コンピュータ可読記憶媒体として、メモリ６２０は、ソフトウェアプログラム、コンピュータ実行可能プログラム、およびモジュール、例えば、本発明の実施例に係るスマート質問回答の実現方法に対応するプログラム命令／モジュール（例えば、図５に示されるスマート質問回答の実現システムにおける中央制御システム５１０、問題解析システム５２０、およびバックエンドシステム５３０）を記憶するために構成されてもよい。プロセッサ６１０は、メモリ６２０に記憶されたソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの各機能アプリケーションおよびデータ処理を実行し、すなわち、上記方法の実施例に係るスマート質問回答の実現方法を実現する。

メモリ６２０は、オペレーティングシステムや、少なくとも１つの機能に必要なアプリケーションプログラムを記憶可能なプログラム記憶領域と、端末装置の使用に基づいて作成されたデータ等を記憶可能なデータ記憶領域とを備えてもよい。また、メモリ６２０は、高速ランダムアクセスメモリを備えてもよく、さらに、不揮発性メモリ、例えば、少なくとも１つの磁気ディスクメモリ、フラッシュメモリ、または他の不揮発性固体メモリデバイスを備えてもよい。いくつかの例において、メモリ６２０は、プロセッサ６１０に対して遠隔設置されたメモリをさらに備えてもよく、それらの遠隔メモリは、ネットワークを介して端末装置に接続されてもよい。上記ネットワークの例として、インターネット、社内イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組合せを備えるが、それらに限定されない。

入力装置６３０は、入力された数字または文字情報を受信し、端末のユーザ設定および機能制御に関連するキー信号の入力を生成するために構成されてもよい。出力装置６４０は、ディスプレイなどの表示装置を備えてもよい。

前記１つ以上のモジュールは、前記メモリ６２０に記憶されており、前記１つ以上のプロセッサ６１０により実行される場合、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返す動作を実行させる。

さらに、前記問題に対して意味解析を行うステップは、
前記問題の焦点、観点および観点類型を認識するステップを含んでもよい。

さらに、前記問題の観点類型を認識した後、前記方法は、さらに、
前記問題の観点類型に対して正規化処理を行うステップを含んでもよい。

さらに、前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含んでもよい。

さらに、前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、
三項関係ベースから検索して前記問題の解答を得るステップを含んでもよい。

さらに、前記三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含んでもよい。

さらに、依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含んでもよい。

さらに、三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するステップを含んでもよい。

さらに、前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含んでもよい。

さらに、一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするステップを含んでもよい。

さらに、検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含んでもよい。

さらに、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。

さらに、前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含んでもよい。

さらに、ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含んでもよい。

さらに、前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含んでもよい。

上記実施形態の説明によれば、当業者は、本発明がソフトウェア、および必要な汎用ハードウェアにより実現されてもよく、勿論ハードウェアにより実現されてもよいが、多くの場合、前者が好ましい実施形態であると明確に理解すべきである。ここのような理解に基づき、本発明の技術案は、実質的な部分、または従来技術を改良する部分をソフトウェア製品の形態で実現してもよい。当該コンピュータソフトウェア製品は、コンピュータ可読記憶媒体、例えばコンピュータのフロッピーディスク、読み出し専用メモリ（Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒ：ＲＯＭ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ：ＲＡＭ）、フラッシュ（ＦＬＡＳＨ）、ハードディスクや光ディスクなどに記憶されてもよく、且つコンピュータ機器（パソコン、サーバ、またはネットワーク機器などであってもよく）に本発明の各実施例に係る方法を実行させるための複数の命令を含んでいる。

注目に値することは、上記スマート質問回答の実現システムの実施例に含まれる各システムは、単に機能論理に基づいて区分されるものであり、上記の区分に限らず、対応する機能を実現することができればよく、また、各機能ユニットの具体的な名称も互いに区別しやすいためのものであり、本発明の保護範囲を制限するためのものではない。

以上で説明したのは、本発明の具体的な実施形態のみであり、本発明の保護範囲は、これらに限定されるものではない。本技術分野をよく知っている当業者のいずれも、本発明に開示された技術範囲内に容易に想到できる変更または置換の全ては、本発明の保護範囲内に入るべきである。従って、本発明の保護範囲は、添付する特許請求の範囲を基準としているものである。

Claims

クエリの問題を受信するステップと、
前記問題に対して意味解析を行うステップと、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行うステップと、
検索処理の結果に基づいて解答を返すステップと、
を備えることを特徴とする、スマート質問回答の実現方法。
前記問題に対して意味解析を行うステップは、
前記問題の焦点、観点および観点類型を認識するステップを含むことを特徴とする、請求項１に記載の方法。
前記問題の観点類型を認識した後、前記方法は、さらに、
前記問題の観点類型に対して正規化処理を行うステップを含むことを特徴とする、請求項２に記載の方法。
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行うステップは、
解析された問題の類型が構造的な依存類型である場合、前記意味関係発掘システムが前記問題に対して検索処理を行い、そうでない場合、前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムが前記問題に対して検索処理を行うステップを含むことを特徴とする、請求項１〜３のいずれか一項に記載の方法。
前記意味関係発掘システムが前記問題に対して検索処理を行うステップは、
三項関係ベースから検索して前記問題の解答を得るステップを含むことを特徴とする、請求項１〜３のいずれか一項に記載の方法。
前記三項関係ベースを確立するステップは、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得るステップと、
依存関係のノードを抽出し、三項関係対を得るステップと、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するステップと、を含むことを特徴とする、請求項５に記載の方法。
依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するステップを含むことを特徴とする、請求項６に記載の方法。
三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するステップを含むことを特徴とする、請求項６または７に記載の方法。
前記正文ベース検索システムが前記問題に対して検索処理を行うステップは、
前記問題に関連するドキュメント集合を検索し出すステップと、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索するステップと、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うステップと、を含むことを特徴とする、請求項１〜３のいずれか一項に記載の方法。
一回目のランキングを行うステップは、
前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするステップを含むことを特徴とする、請求項９に記載の方法。
検索処理の結果に基づいて解答を返すステップは、
領域内知識で前記検索処理の結果をろ過するステップと、
ろ過結果に基づいて解答を返すステップと、を含むことを特徴とする、請求項１〜３のいずれか一項に記載の方法。
ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して二回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含むことを特徴とする、請求項１１に記載の方法。
前記ろ過結果に対して二回目のランキングを行うステップは、
教師付き機械学習モデルで前記ろ過結果をランキングするステップを含むことを特徴とする、請求項１２に記載の方法。
ろ過結果に基づいて解答を返すステップは、
前記ろ過結果に対して三回目のランキングを行うステップと、
ランキングされたろ過結果を返すステップと、を含むことを特徴とする、請求項１１〜１３のいずれか一項に記載の方法。
前記ろ過結果に対して三回目のランキングを行うステップは、
前記候補解答と前記問題とのマッチング程度を検証するステップと、
前記マッチング程度に基づいて前記候補解答をランキングするステップと、を含むことを特徴とする、請求項１４に記載の方法。
クエリの問題を受信するために構成される中央制御システムと、
前記問題に対して意味解析を行うために構成される問題解析システムと、を備え、
前記中央制御システムは、さらに、前記解析の結果に基づいて前記問題を対応のバックエンドシステムに配布し、対応の検索処理を行うために構成され、
前記バックエンドシステムは、発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムを備え、
前記中央制御システムは、さらに、検索処理の結果に基づいて解答を返すために構成されることを特徴とする、スマート質問回答の実現システム。
前記問題解析システムは、具体的に、
前記問題の焦点、観点および観点類型を認識するために構成されることを特徴とする、請求項１６に記載のシステム。
前記問題解析システムは、前記問題の観点類型を認識した後、さらに、
前記問題の観点類型に対して正規化処理を行うために構成されることを特徴とする、請求項１７に記載のシステム。
前記中央制御システムは、具体的に、
解析された問題の類型が構造的な依存類型である場合、前記問題を前記意味関係発掘システムに配布して検索処理を行い、そうでない場合、前記問題を前記正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムに配布して検索処理を行うために構成されることを特徴とする、請求項１６〜１８のいずれか一項に記載のシステム。
前記意味関係発掘システムは、具体的に、
三項関係ベースから検索して前記問題の解答を得るために構成されることを特徴とする、請求項１６〜１８のいずれか一項に記載のシステム。
前記意味関係発掘システムは、さらに、
ネットワークにおける元ウェブページに対して文法解析を行い、依存関係を持つ文を得、
依存関係のノードを抽出し、三項関係対を得、
前記三項関係対に対して合理的検証を行い、検証を通過した三項関係対で前記三項関係ベースを確立するために構成されることを特徴とする、請求項２０に記載のシステム。
前記意味関係発掘システムは、依存関係を持つ文を得る前に、さらに、
文中の括弧内の内容を除去するために構成されることを特徴とする、請求項２１に記載のシステム。
前記意味関係発掘システムは、三項関係対を得る前に、さらに、
前記依存関係を持つ文における欠失した主語、連用修飾語、および目的語の少なくとも１つを補足するために構成されることを特徴とする、請求項２１または２２に記載のシステム。
前記正文ベース検索システムは、具体的に、
前記問題に関連するドキュメント集合を検索し出し、
前記ドキュメント集合から、候補解答が含まれている候補断片を検索し、
前記候補断片から前記候補解答を抽出し、一回目のランキングを行うために構成されることを特徴とする、請求項１６〜１８のいずれか一項に記載のシステム。
前記正文ベース検索システムは、具体的に、
前記候補解答の所属するドキュメントの所属するサイトとＵＲＬリンクの重みである統一資源位置指定子ＵＲＬ重み、前記候補解答の異なる候補断片における前記問題のキーワードとの距離係数であるオフセット重み、および、前記候補解答と前記問題の観点類型との意味マッチング度である問題マッチング度の少なくとも１つの特性に基づいてランキングするために構成されることを特徴とする、請求項１４に記載のシステム。
前記中央制御システムは、具体的に、
領域内知識で前記検索処理の結果をろ過し、
ろ過結果に基づいて解答を返すために構成されることを特徴とする、請求項１６〜１８のいずれか一項に記載のシステム。
前記中央制御システムは、具体的に、
前記ろ過結果に対して二回目のランキングを行い、
ランキングされたろ過結果を返すために構成されることを特徴とする、請求項２６に記載のシステム。
前記中央制御システムは、具体的に、
教師付き機械学習システムで前記ろ過結果をランキングするために構成されることを特徴とする、請求項２７に記載のシステム。
前記中央制御システムは、具体的に、
前記ろ過結果に対して三回目のランキングを行い、
ランキングされたろ過結果を返すために構成されることを特徴とする、請求項２６〜２８のいずれか一項に記載のシステム。
前記中央制御システムは、具体的に、
前記候補解答と前記問題とのマッチング程度を検証し、
前記マッチング程度に基づいて前記候補解答をランキングするために構成されることを特徴とする、請求項２９に記載のシステム。
１つ以上のモジュールが記憶される不揮発性コンピュータ記憶媒体であって、
前記１つ以上のモジュールがスマート質問回答の実現方法を実行する機器により実行される際に、前記機器には、
クエリの問題を受信し、
前記問題に対して意味解析を行い、
前記意味解析の結果に基づいて前記問題に対して対応の検索処理を行い、すなわち意味関係発掘システム、正文ベース検索システム、知識ベース検索システム、および質問回答ベース検索システムの少なくとも１つのシステムによる前記問題に対する検索処理を含む検索処理を行い、
検索処理の結果に基づいて解答を返すように実行させることを特徴とする、
不揮発性コンピュータ記憶媒体。