JP2020123134A - 抽出方法,情報処理装置および抽出プログラム - Google Patents

抽出方法,情報処理装置および抽出プログラム Download PDF

Info

Publication number
JP2020123134A
JP2020123134A JP2019014459A JP2019014459A JP2020123134A JP 2020123134 A JP2020123134 A JP 2020123134A JP 2019014459 A JP2019014459 A JP 2019014459A JP 2019014459 A JP2019014459 A JP 2019014459A JP 2020123134 A JP2020123134 A JP 2020123134A
Authority
JP
Japan
Prior art keywords
faq
sentence
words
extracted
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019014459A
Other languages
English (en)
Inventor
曉 窪田
Akira Kubota
曉 窪田
片岡 正弘
Masahiro Kataoka
正弘 片岡
智範 大田
Tomonori Ota
智範 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019014459A priority Critical patent/JP2020123134A/ja
Publication of JP2020123134A publication Critical patent/JP2020123134A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】検索クエリに対応しない文書の出力を抑制できるようにする。【解決手段】複数の単語を含む検索クエリを受け付ける受付部111と、受け付けた検索クエリから複数の特徴単語を抽出する単語抽出部112と、それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部200を参照して、複数の文書210に含まれる各文書について、抽出した複数の単語の、各文書に含まれるセンテンスでの出現状況と、抽出した複数の単語の、検索クエリに含まれるセンテンスでの出現状況との関係性を特定する特定部131と、特定した関係性に基づき、複数の文書210の中から少なくともいずれかの文書を抽出する文書抽出部132とを備える。【選択図】図1

Description

本発明は、抽出方法,情報処理装置および抽出プログラムに関する。
近年、チャットボット(Chatbot)を用いた検索サービスとして、ユーザが入力した質問文(ユーザ質問文)に対してFAQ(Frequently Asked Questions)を応答するシステムが知られている。
ここで、チャットボットとは、チャット(会話)とボット(ロボット)とを組み合わせた言葉であり、人工知能(AI:Artificial Intelligence)を活用した自動会話プログラムである。
検索サービスで用いられる検索技術としては、例えば、利用者によって入力された質問文を構文解析した結果を用いて検索条件情報を作成し、作成した検索条件情報に対応する文書を検索結果として表示する検索技術が知られている(例えば、特許文献1)。
特開2011−113536号公報 特開2005−63158号公報
ところで、単にユーザ質問文の特徴単語が含まれるFAQが検索結果として抽出する検索システムでは、特徴単語と主語のみが一致するFAQや述語のみが一致するFAQ等、ユーザが回答として期待するものとは内容が異なるFAQが抽出されることも多い。すなわち、ユーザ質問文に対応しないFAQが出力されることがある。
1つの側面では、本発明は、検索クエリに対応しない文書の出力を抑制することを目的とする。
このため、この抽出方法は、複数の単語を含む検索クエリを受け付け、受け付けた前記検索クエリから前記複数の単語を抽出し、それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、処理を備える。
一実施形態によれば、検索クエリに対応しない文書の出力を抑制できる。
第1実施形態の一例としての情報処理装置の機能構成を模式的に示す図である。 第1実施形態の一例としての情報処理装置のハードウェア構成を例示する図である。 第1実施形態の一例としての情報処理装置におけるFAQ検索方法を説明するためのフローチャートである。 第2実施形態の一例としての情報処理装置の機能構成を模式的に示す図である。 第2実施形態の一例としての情報処理装置におけるユーザ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。 第2実施形態の一例としての情報処理装置におけるFAQ検索方法を説明するためのフローチャートである。 第3実施形態の一例としての情報処理装置におけるFAQ検索方法を説明するためのフローチャートである。 第3実施形態の一例としての情報処理装置におけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。 第3実施形態の一例としての情報処理装置におけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。 第3実施形態の一例としての情報処理装置におけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。 第3実施形態の一例としての情報処理装置におけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。 第3実施形態の一例としての情報処理装置におけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。
以下、図面を参照して本抽出方法,情報処理装置および抽出プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態および各変形例を組み合わせる等)して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
(I)第1実施形態の説明
(A)構成
図1は第1実施形態の一例としての情報処理装置1aの機能構成を模式的に示す図、図2はそのハードウェア構成を例示する図である。
本第1実施形態の情報処理装置1aは、ユーザによって入力された質問文(ユーザ質問文)に応答するFAQを検索し、ユーザに提供するチャットボット機能を実現する。ユーザ質問文は検索クエリに相当する。ユーザ質問文は1つ以上のセンテンス(文)を含み、特に、複数のセンテンスを含むことが望ましい。
FAQは、よくある(あるいはあると想定される)質問とその回答との組み合わせであり、よくある質問の質問文(FAQ質問文)が、それに対する答え(FAQ回答文)と関連付けられている。本情報処理装置1aにおいてFAQは抽出対象の文書である。FAQ質問文は1つ以上のセンテンスを含み、センテンスには複数の単語(特徴単語)が含まれる。FAQ質問文は複数のセンテンスを含むことが望ましい。
情報処理装置1aは、図1に示すように、制御部100a,記憶部200,入力部301,出力部302および通信部303を備える。
入力部301は、本情報処理装置1aに各種の情報を入力するための入力装置である。入力部301は、キーボードはマウス,タッチパネル等に対応する。例えば、ユーザは、入力部301を操作してユーザ質問文を入力してもよい。
出力部302は、制御部100aから出力される各種の情報を出力する装置であり、例えば、ディスプレイやタッチパネル等のモニタや、プリンタ,音声合成出力装置等に対応する。例えば、出力部302は、制御部100aによって出力(抽出)されるFAQをディスプレイに表示してもよい。
通信部303は、ネットワーク等を介して他の外部装置とデータ通信を実行する処理部である。通信部303は、LAN(Local Area Network)カード等の通信装置等に対応する。例えば、情報処理装置1aは、ユーザの使用する端末装置と通信部303を介したデータ通信を実行して、ユーザ質問文を受信してもよい。また、情報処理装置1aは、サーバ機能を備えたコンピュータ(サーバコンピュータ)と通信部303を介したデータ通信を実行して、後述するFAQデータ群210を構成するデータを受信してもよい。
記憶部200は、FAQデータ群210およびFAQ検索プログラム220を記憶する。記憶部200は、RAM(Random Access Memory),ROM(Read Only Memory),フラッシュメモリなどの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
FAQデータ群210は、複数のFAQを備え、複数の文書に相当する。また、記憶部200は複数の文書を記憶する記憶部に相当する。FAQデータ群210はデータベースとして構成されてもよい。
FAQ検索プログラム220は、本情報処理装置1aにFAQ検索機能を実現させるためのプログラム(抽出プログラム)である。
制御部100aは、質問文処理部110a,FAQ第1処理部120およびFAQ第2処理部130aとしての機能を有する。制御部100aは、CPU(Central Processing Unit)やMPU(Micro-processor Unit)などによって実現できる。また、制御部100aは、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによっても実現できる。
質問文処理部110aは、入力部301を解して入力されたユーザ質問文を処理する。質問文処理部110aは、図1に示すように、受付部111および質問文第1処理部112としての機能を備える。
受付部111は、ユーザが入力部301を介して入力するユーザ質問文を受け付ける。例えば、受付部111は、出力部302にユーザに対して質問文の入力を行なわせるメッセージを表示させ、このメッセージに応じてユーザが入力部301を用いて入力する質問文を取得する。ユーザ質問文は複数の特徴単語(単語)を含むことが望ましい。
質問文第1処理部112は、入力されたユーザ質問文から特徴単語を抽出する。文章中からの特徴単語の抽出は既知の種々の手法を用いて実現することができ、その詳細な説明は省略する。例えば、特徴単語の抽出にTF-IDF(Term Frequency - Inverse Document Frequency)手法を用いてもよい。また、TF-IDF手法に代えてOkapi BM25等の他の手法を用いてもよく、種々変形して実施することができる。
本情報処理装置1aにおいては、質問文第1処理部112は、ユーザ質問文から複数の特徴単語を抽出することが望ましい。
例えば、「WindowsのスケジュールサーバからLinuxの実行サーバへネットワークジョブを実行したら正常終了となるが、直ぐに終了する処理が完了までに約5〜6分かかります。原因と対処方法を教えてください。」とのユーザ質問文において、質問文第1処理部112は、[Windows],[スケジュールサーバ],[Linux],[実行サーバ],[ネットワークジョブ]および [対処方法]を特徴単語として抽出する。なお、WindowsおよびLinuxはいずれも登録商標である。
質問文第1処理部112は、ユーザ質問文が含む1つ以上のセンテンスのそれぞれに対して、特徴単語を抽出する。本第1実施形態において、ユーザ質問文のセンテンスに含まれる特徴単語が、検索クエリに含まれるセンテンスでの出現状況に相当する。
例えば、文頭から句点(。)までの文字列や、句点とこの句点に後続する次の句点との間の文字列を、一のセンテンスとして取り扱ってもよい。また、英文においては、文頭からピリオド(.)までの文字列や、ピリオドとこのピリオドに後続する次のピリオドとの間の文字列を、一のセンテンスとして取り扱ってもよい。
FAQ第1処理部120は、FAQデータ群210に含まれる複数のFAQに基づき転置インデックスを生成する。また、FAQ第1処理部120は、FAQ検索部121としての機能を備える。
FAQ検索部121は、入力されたユーザ質問文に対応するFAQの検索(一次検索)を行なう。FAQ検索部121は、質問文処理部110aの質問文第1処理部112によって抽出された特徴単語に基づいて転置インデックスでFAQデータ群210に対して全文検索を行ない、ユーザ質問文の特徴単語を含むFAQ(FAQ候補)を1つ以上抽出する。FAQ検索部121は、複数のFAQ候補を抽出することが望ましい。
FAQ検索部121は、例えば、FAQにおけるFAQ質問文の全文(テキスト)に対して、ユーザ質問文の特徴単語に基づき転置インデックスによる全文検索を行なうことで、FAQ候補の抽出を行なう。
なお、特徴単語をもとに転置インデックスでFAQ質問文を全文検索してFAQ候補を抽出する処理は、既知の手法を用いて実現することができ、その説明は省略する。
FAQ第2処理部130aは、FAQ第1処理部120によって検索されたFAQに対して、ユーザ質問文に基づく絞り込み(二次検索,抽出)を行なう。FAQ第2処理部130aは、FAQテキスト処理部131および絞込処理部132としての機能を備える。
FAQテキスト処理部131は、FAQ第1処理部120(FAQ検索部121)によって抽出されたFAQ候補のテキスト(FAQテキスト)をFAQデータ群210から取得する。例えば、FAQテキスト処理部131は、FAQ候補のFAQ質問文のテキストをFAQデータ群210から取得する。
また、FAQテキスト処理部131は、取得したFAQテキストから特徴単語を抽出する。FAQテキスト処理部131は、前述した質問文第1処理部112と同様の手法(例えば、TF-IDF手法やOkapi BM25手法)を用いて特徴単語の抽出を実現する。
FAQテキスト処理部131は、FAQ質問文が含む1つ以上のセンテンスのそれぞれに対して、特徴単語を抽出する。本第1実施形態において、FAQ質問文のセンテンスに含まれる特徴単語が、文書に含まれるセンテンスでの出現状況に相当する。
絞込処理部132は、FAQ検索部121によって抽出された各FAQ候補において、質問文第1処理部112によってユーザ質問文から抽出された特徴単語が、同一センテンス内にあるかを確認する。絞込処理部132は、ユーザ質問文から抽出された特徴単語が、同一センテンス(文)内にあるFAQ候補を、ユーザに提供するFAQとして選択(抽出)する。
すなわち、本第1実施形態において、FAQ候補においてユーザ質問文から抽出された特徴単語が、同一センテンス内にあることが、FAQデータ群210(複数の文書)に含まれる各FAQ質問文(文書)について、抽出した前記複数の特徴単語の、各FAQ質問文に含まれるセンテンスでの出現状況と、抽出した複数の特徴単語の、ユーザ質問文(検索クエリ)に含まれるセンテンスでの出現状況との関係性に相当する。
なお、ユーザ質問文が複数のセンテンスで構成されている場合には、絞込処理部132は、ユーザ質問文の一つのセンテンスに含まれる複数の特徴単語が、FAQ質問文の1つのセンテンスに含まれていることを確認することが望ましい。すなわち、絞込処理部132は、ユーザ質問文において1つのセンテンスに含まれる複数の特徴単語が、FAQ質問文における1つのセンテンスに含まれている当該FAQ質問文のFAQ候補をユーザに応答するFAQ(応答FAQ)として決定する。
同じ複数の特徴単語を一センテンス内に含む2つの文章は、互いに同様の内容を有する蓋然性が高いと考えられる。従って、ユーザ質問文において1つのセンテンスに含まれる複数の特徴単語がFAQ質問文の1つのセンテンスにも含まれている場合には、当該FAQ質問文はユーザ質問文と同様の内容を有する可能が高い。
絞込処理部132は、このようなFAQ質問文を含むFAQをユーザに応答する応答FAQとして決定する。
このようにして決定した応答FAQは、FAQ検索部121により検索されたユーザ質問文に対応する複数のFAQ候補(一次検索結果)から、ユーザに応答するFAQとして絞り込まれた絞り込み結果(二次検索結果)に相当する。
次に、図2を参照しながら、第1実施形態の一例としての情報処理装置(コンピュータ)1のハードウェア構成について説明する。図2は、当該ハードウェア構成の一例を示すブロック図である。
情報処理装置1aは、例えば、プロセッサ11,メモリ12,記憶装置13,グラフィック処理装置14,入力インタフェース15,光学ドライブ装置16,機器接続インタフェース17およびネットワークインタフェース18を構成要素として有する。これらの構成要素11〜18は、バス19を介して相互に通信可能に構成される。
プロセッサ(処理部)11は、情報処理装置1a全体を制御する。プロセッサ11は、マルチプロセッサであってもよい。プロセッサ11は、例えばCPU,MPU,DSP(Digital Signal Processor),ASIC,PLD(Programmable Logic Device),FPGAのいずれか一つであってもよい。また、プロセッサ11は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。そして、プロセッサ11がFAQ検索プログラム220を実行することにより、前述した制御部100aとして機能する。検索プログラム220は抽出プログラムに相当する。
なお、情報処理装置1aは、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム〔FAQ検索プログラム220やOS(Operating System)プログラム等〕を実行することにより、本第1実施形態のFAQ検索機能(抽出方法)を実現する。情報処理装置1aに実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置1aに実行させるプログラムを記憶装置13に格納しておくことができる。プロセッサ11は、記憶装置13内のプログラムの少なくとも一部をメモリ(RAM)12にロードし、ロードしたプログラムを実行する。
また、情報処理装置1a(プロセッサ11)に実行させるプログラムを、光ディスク16a,メモリ装置17a,メモリカード17c等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ11からの制御により、記憶装置13にインストールされた後、実行可能になる。また、プロセッサ11が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
メモリ12は、ROMおよびRAMを含む記憶メモリである。メモリ12のRAMは情報処理装置1aの主記憶装置として使用される。RAMには、プロセッサ11に実行させるOSプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ12には、プロセッサ11による処理に必要な各種データが格納される。アプリケーションプログラム(FAQ検索プログラム220)には、情報処理装置1aによって本第1実施形態のFAQ検索機能を実現するためにプロセッサ11によって実行されるFAQ検索プログラム(図1の符号220参照)が含まれてもよい。
記憶装置13は、ハードディスクドライブ(Hard Disk Drive:HDD)、SSD(Solid State Drive)、ストレージクラスメモリ(Storage Class Memory:SCM)等の記憶装置であって、種々のデータを格納するものである。記憶装置13は、情報処理装置1aの補助記憶装置として使用される。記憶装置13には、OSプログラム,アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、ストレージクラスメモリ(SCM:Storage Class Memory)や、フラッシュメモリ等の半導体記憶装置(SSD:Solid State Drive)を使用することもできる。この記憶装置13が前述した記憶部200に相当する。
グラフィック処理装置14には、モニタ14aが接続されている。グラフィック処理装置14は、プロセッサ11からの命令に従って、画像をモニタ14aの画面に表示させる。モニタ14aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置等が挙げられる。モニタ14aが前述した出力部302に相当する。
入力インタフェース15には、キーボード15aおよびマウス15bが接続されている。入力インタフェース15は、キーボード15aやマウス15bから送られてくる信号をプロセッサ11に送信する。なお、マウス15bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル,タブレット,タッチパッド,トラックボール等が挙げられる。これらのキーボード15aおよびマウス15bが、前述した入力部301に相当する。
光学ドライブ装置16は、レーザ光等を利用して、光ディスク16aに記録されたデータの読み取りを行なう。光ディスク16aは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク16aには、DVD(Digital Versatile Disc),DVD−RAM,CD−ROM(Compact Disc Read Only Memory),CD−R(Recordable)/RW(ReWritable)等が挙げられる。
機器接続インタフェース17は、本情報処理装置1aに周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース17には、メモリ装置17aやメモリリーダライタ17bを接続することができる。メモリ装置17aは、機器接続インタフェース17との通信機能を搭載した非一時的な記録媒体、例えばUSB(Universal Serial Bus)メモリである。メモリリーダライタ17bは、メモリカード17cへのデータの書き込み、またはメモリカード17cからのデータの読み出しを行なう。メモリカード17cは、カード型の非一時的な記録媒体である。
ネットワークインタフェース18は、図示しないネットワークに接続される。ネットワークインタフェース18は、ネットワークを介して、他の情報処理装置や通信機器等の外部装置との間でデータの送受信を行なう。ネットワークインタフェース18が前述した通信部303に相当する。
以上のようなハードウェア構成を有する情報処理装置1aによって、図1に示した本第1実施形態のFAQ検索機能を実現することができる。
(B)動作
上述の如く構成された第1実施形態の一例としての情報処理装置1aにおけるFAQ検索方法を、図3に示すフローチャート(ステップA1〜A8)に従って説明する。
以下に示す例においては、情報処理装置1aにおいてチャットボット機能が実行される場合について示す。すなわち、ユーザが入力する質問文(ユーザ質問文)に基づいてFAQデータ群210に対する検索を行ない、ユーザ質問文に合ったFAQ(応答FAQ)を抽出してユーザに応答する例について示す。
ステップA1において、受付部111は、出力部302(モニタ14a)にユーザに対して質問文の入力を行なわせるメッセージ(質問受付メッセージ)を表示させる。例えば、受付部111は、「問い合わせ内容を入力してください」とのメッセージをディスプレイ14aに表示させる。
ステップA2において、ユーザは入力部301(キーボード15a等)を操作してユーザ質問文を入力し、受付部111は入力されたユーザ質問文を取得する。入力されたユーザ質問文はメモリ12の所定の記憶領域等に格納される。
ステップA3において、質問文第1処理部112は、ユーザ質問文から特徴単語を抽出する。
ステップA4において、FAQ第1処理部120のFAQ検索部121は、抽出した特徴単語に基づきFAQデータ群210に対して転置インデックスを用いて検索を行ない(一次検索)、ユーザ質問文の特徴単語を含む複数のFAQ(FAQ候補)を抽出する。
ステップA5において、FAQ第2処理部130aのFAQテキスト処理部131は、抽出された複数のFAQ候補のそれぞれについて、FAQデータ群210からFAQ質問文の全文テキスト(FAQテキスト)を取得する。取得したFAQテキストはメモリ12の所定の記憶領域等に格納される。
ステップA6において、FAQテキスト処理部131は、取得したFAQテキストから特徴単語を抽出する。
ステップA7において、絞込処理部132は、FAQ検索部121によって抽出されたFAQ候補の中から、ユーザ質問文から抽出された特徴単語が、FAQ質問文の同一センテンス(文)内にあるFAQ候補を、FAQをユーザに応答するFAQ(応答FAQ)として決定する絞り込みを行なう(二次検索)。
ステップA8において、絞込処理部132は、抽出したFAQをディスプレイ14a(出力部302)に表示させる。例えば、絞込処理部132は、抽出したFAQのFAQ質問文とFAQ回答文とをディスプレイ14aに表示させる。その後、処理を終了する。
(C)効果
このように、第1実施形態の一例としての情報処理装置1aによれば、FAQ第1処理部120において、ユーザ質問文から抽出した特徴単語に基づき、FAQ検索部121がFAQデータ群210に対して転置インデックスで検索を行なう。そして、FAQ第2処理部130aにおいて、絞込処理部132が、FAQ検索部121によって抽出された複数のFAQ候補の中から、ユーザ質問文から抽出された特徴単語が、同一センテンス(文)内にあるFAQ候補をユーザに提供するFAQとして抽出(選択)する絞り込みを行なう。
これにより、絞込処理部132は、ユーザ質問文と同様の内容を有する可能性が高いFAQ質問文のFAQを抽出してユーザに提供するとともに、ユーザ質問文に対応しないFAQの出力を抑制することができる。従って、ユーザに対してユーザ質問文に合ったFAQを提供することができ、ユーザの満足度を向上させることができる。
一方、FAQ検索部121によって抽出された複数のFAQ候補の中から、ユーザ質問文から抽出された特徴単語が同一センテンス(文)内にないFAQ候補についてはユーザに提供しないことで、ユーザ質問文に対応しないFAQ候補のユーザへの出力を抑制でき、これによってもユーザの満足度を向上させることができる。
また、本情報処理装置1aにおいては、FAQのFAQ質問文やFAQ回答文に対して文要素間関係の分析を行なう必要がなく、システムが管理するデータ量やメモリ使用量が増大することがない。従って、これらの影響によるFAQ検索処理能力の低下が生じることもない。
例えば、上記特許文献1には、質問文に対応する検索結果を提示すべく、検索対象の文章に対して構文解析を行なうことで、文要素および当該文要素の関係を示す文要素間関係を抽出する一方、利用者によって入力された質問文を構文解析した結果を用いて検索条件情報を作成し、作成した検索条件情報に対応する文章を検索条件に対する検索結果として表示する手法が開示されている。
しかしながら、この特許文献1に開示の手法においては、検索対象の全ての文章について、各文章内の全ての単語に対して文要素間関係の生成を行なう。そのため、当該手法をFAQシステムに適用する場合に、FAQの全ての回答文章について文要素間関係の生成を行なうことで、FAQのソーステキストとほぼ同等サイズもしくはそれを超えるデータ量となる場合がある。
このようにシステムが管理するデータ量が増大することで、質問文に該当する単語の比較に時間がかかる。例えば、質問文に含まれる単語とその文要素関係を判定しようとすると、ほぼ全ソースファイルと同等のデータを照合させることと同等の処理が必要となるので、メモリ使用量が莫大となり、処理速度が低下し、FAQの検索機能に影響をきたす。
本情報処理装置1aにおいては、予めFAQデータ群210の全FAQのFAQ質問文やFAQ回答文に対して文要素間関係の分析を行なう必要がないので、システムが管理するデータ量やメモリ使用量が増大することがない。従って、これらの影響によるFAQ検索処理能力の低下が生じることもない。
(II)第2実施形態の説明
(A)構成
図4は本発明の第2実施形態の一例としての情報処理装置1bの機能構成を模式的に示す図である。
第2実施形態の情報処理装置1bは、図4に示すように、第1実施形態の情報処理装置1aの制御部100aに代えて制御部100bを備える。なお、その他の部分は第1実施形態の情報処理装置1aと同様に構成されている。また、本第2実施形態の情報処理装置1bは、第1実施形態の情報処理装置1aと同様のハードウェア構成(図2参照)を備える。
以下、図中、既述の符号と同一の符号は同様の部分を示しているので、その詳細な説明は省略する。
本第2実施形態の情報処理装置1bにおいて、プロセッサ11がFAQ検索プログラム220を実行することにより、制御部100bとして機能する。制御部100bは、質問文処理部110b,FAQ第1処理部120およびFAQ第2処理部130bを備える。
質問文処理部110bは、第1実施形態の質問文処理部110aの受付部111および質問文第1処理部112に加えて、質問文解析部113を備える。
質問文解析部113は、ユーザ質問文に対して構文解析と意味解析とを実行する。質問文解析部113は、ユーザ質問文に構文解析を行なうことで、ユーザ質問文中の単語の属性を特定する。単語の属性には、単語の品詞と単語のSVOCと単語の係り受けとを含んでもよい。単語の品詞は、名詞,代名詞,形容詞,動詞,副詞,前置詞,接続詞,感動詞等を含む。
単語のSVOCは、文章中に含まれる各単語の要素を区別するための記号である。質問文解析部113は、ユーザ質問文のテキストに含まれる各単語について、主語(S),動詞(V),目的語(O)および補語(C)や、単語同士の属性を特定する。
構文解析は、文を構成する単語の位置関係(係り受け等)を決める。構文解析を行なうことで、特徴単語を修飾している単語と修飾関係を規定するとともに、特徴単語により被修飾されている単語と被修飾関係を規定する。意味解析は、単語の意味を明らかにし、また、係り受け関係にある(文節の代表)語間の役割的関係を明らかにする。これらの構文解析および意味解析は既知手法を用いて実現することができ、その詳細な説明は省略する。
質問文解析部113は、ユーザ質問文に対して構文解析および意味解析を行なうことで、文を単語に分割し、単語の係り受けや意味的な関係を解析する。例えば、ユーザ質問文に含まれる特徴単語を修飾している単語と修飾関係や特徴単語に被修飾されている単語と非修飾関係を明確化する。以下、構文解析と意味解析とを実行することを構文・意味解析と表す。
質問文解析部113は、ユーザ質問文に対して構文・意味解析を行なうことで、文書構造情報を生成する。
図5は第2実施形態の一例としての情報処理装置1bにおけるユーザ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。
この図5においては、「WindowsのスケジュールサーバからLinuxの実行サーバへネットワークジョブを実行したら正常終了となるが、直ぐに終了する処理が完了までに約5〜6分かかります。原因と対処方法を教えてください。」というユーザ質問文に対して構文・意味解析を行なうことで得られる文書構造情報を例示する。
このユーザ質問文は、「WindowsのスケジュールサーバからLinuxの実行サーバへネットワークジョブを実行したら正常終了となるが、直ぐに終了する処理が完了までに約5〜6分かかります。」という第1センテンスと、「原因と対処方法を教えてください。」という第2センテンスとを備える。
また、このユーザ質問文においては、[Windows],[スケジュールサーバ],[Linux],[実行サーバ],[ネットワークジョブ]および[対処方法]が特徴単語に相当する。以下、単語の前後に“[”および“]”を付すことで特徴単語を表す場合がある。
質問文解析部113は、このようなユーザ質問文に対して構文・意味解析を行なうことで、図5に例示するような文書構造情報を生成する。文書構造情報は、文書に含まれる複数の単語(文要素)について、文要素の組み合わせの関係性を表す。
図5に例示する文書構造情報は、関係番号,文番号,要素間関係,文要素1および文要素2を項目として備え、これらの情報を相互に関連付けることで構成されている。文書構造情報は文書毎に作成される。従って、ユーザ質問文が複数入力された場合には、これらのユーザ質問文毎に文書構造情報が作成される。
文要素1および文要素2は、それぞれ文書内に含まれる単語(文要素)である。関係番号は、文要素の組み合わせを特定する識別情報であり、文書構造情報におけるエントリを特定する。文番号は文要素が含まれるセンテンスを特定する識別番号である。要素間関係は、文要素1の単語(文要素)と文要素2の単語(文要素)との間の関係を示す。
例えば、図5に示す例において、関係番号“P1”で表されるエントリは、“スケジュールサーバ(文要素1)”と“Windows(文要素2)”とが文番号“1”で特定されるセンテンスに含まれ、これらの文要素が連体修飾子である「の」によって接続されていることを表す。
また、図5に示す例において、例えば、関係番号“P7”で表されるエントリの文要素「教えてください」は特徴単語である[対処方法]に関連する単語として文書構造情報に登録されている。
質問文解析部113は、ユーザ質問文に構文解析を行なうことで、ユーザ質問文中の単語に対して、属性の特定や修飾/被修飾関係の規定を行なう。また、質問文解析部113は、ユーザ質問文に対して意味解析を行なうことで、単語の意味を明らかにし、また、係り受け関係にある語間の役割的関係を明らかにする。
質問文解析部113は、ユーザ質問文に対して構文・意味解析を行なうことで、文を単語に分割し、単語の係り受けや意味的な関係を解析する。すなわち、質問文解析部113は、ユーザ質問文のテキストに対して構文・意味解析を行なうことで、特徴単語の属性(SVOC)および係り受けを分析する。
質問文解析部113は、ユーザ質問文に対して構文・意味解析を行なうことで、文書構造情報を生成する。ユーザ質問文に対して構文・意味解析を行なうことで生成した文書構造情報(特徴単語の属性および係り受け)は、ユーザ質問文における複数の特徴単語の出現状況に相当する。
FAQ第2処理部130bは、第1実施形態のFAQ第2処理部130aにFAQ解析部133を備える。
FAQ解析部133は、FAQテキスト処理部131によって取得されたFAQ候補のFAQ質問文のテキストに対して構文解析と意味解析とを実行する。FAQ解析部133は、質問文解析部113と同様の手法を用いてFAQ質問文に対する構文・意味解析を行なう。
FAQ解析部133は、FAQ質問文に構文解析を行なうことで、FAQ質問文中の単語に対して、属性の特定や修飾/被修飾関係の規定を行なう。また、FAQ解析部133は、FAQ質問文に対して意味解析を行なうことで、単語の意味を明らかにし、また、係り受け関係にある語間の役割的関係を明らかにする。
FAQ解析部133は、FAQ質問文に対して構文・意味解析を行なうことで、文を単語に分割し、単語の係り受けや意味的な関係を解析する。すなわち、FAQ解析部133は、FAQ質問文のテキストに対して構文・意味解析を行なうことで、特徴単語の属性(SVOC)および係り受けを分析する。
質問文解析部113は、ユーザ質問文に対して構文・意味解析を行なうことで、文書構造情報を生成する。文書構造情報は文書毎に作成される。従って、FAQ候補が複数ある場合には、これらのFAQ候補毎に文書構造情報が作成される。FAQ質問文に対して構文・意味解析を行なうことで生成した文書構造情報(特徴単語の属性および係り受け)は、FAQ質問文における複数の特徴単語の出現状況に相当する。
また、第2実施形態においては、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、FAQ質問文中の特徴単語の属性(SVOC)および係り受けとを比較する。そして、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、特徴単語の属性(SVOC)および係り受けが一致するFAQ質問文を備えるFAQをユーザに応答するFAQ(応答FAQ)として決定する。
すなわち、絞込処理部132は、FAQ解析部133による構文・意味解析の結果、ユーザ質問文と特徴単語の属性および係り受けが一致するFAQ質問文を検索し、当該FAQ質問文のFAQを応答FAQとしてFAQデータ群210から抽出する。
FAQ質問文から抽出した複数の特徴単語の属性および係り受けが、ユーザ質問文から抽出した複数の特徴単語の属性および係り受けと一致するか否かは、複数の特徴単語の、各FAQ質問文に含まれるセンテンスでの出現状況と、ユーザ質問文に含まれるセンテンスでの出現状況との関係性に相当する。
このようにして決定した応答FAQは、FAQ検索部121により検索されたユーザ質問文に対応する複数のFAQ候補(検索結果)から、ユーザに応答するFAQとして絞り込まれた絞り込み結果である。
(B)動作
上述の如く構成された第2実施形態の一例としての情報処理装置1bにおけるFAQ検索方法を、図6に示すフローチャート(ステップB1〜B13)に従って説明する。なお、図6に示すフローチャート中において、ステップB1〜B6においては、図3に示したフローチャートのステップA1〜A6と同様の処理が行なわれる。
以下に示す例においても、情報処理装置1bにおいてチャットボット機能が実行される場合について示す。すなわち、ユーザが入力する質問文(ユーザ質問文)に基づいてFAQデータ群210に対する検索を行ない、ユーザ質問文に合ったFAQ(応答FAQ)を抽出してユーザに応答する例について示す。
ステップB1において、受付部111は、出力部302(モニタ14a)にユーザに対して質問文の入力を行なわせるメッセージ(質問受付メッセージ)を表示させる。
ステップB2において、ユーザは入力部301(キーボード15a等)を操作してユーザ質問文を入力し、受付部111は入力されたユーザ質問文を取得する。
ステップB3において、質問文第1処理部112は、ユーザ質問文から特徴単語を抽出する。
ステップB4において、FAQ第1処理部120のFAQ検索部121は、抽出した特徴単語に基づきFAQデータ群210に対して転置インデックスで検索を行ない(一次検索)、ユーザ質問文の特徴単語を含むFAQ(FAQ候補)を複数個、抽出する。図6においては、検出結果として、10個のFAQ(1)〜(10)がFAQ候補として抽出された例が示されている(符号T1参照)
ステップB5において、FAQ第2処理部130bのFAQテキスト処理部131は、抽出された複数のFAQ候補のそれぞれについて、FAQデータ群210からFAQ質問文の全文テキスト(FAQテキスト)を取得する。
ステップB6において、FAQテキスト処理部131は、取得したFAQテキストから特徴単語を抽出する。
ステップB7において、質問文解析部113は、ユーザ質問文に対して構文・意味解析を行ない、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けを分析する。
ステップB8において、FAQテキスト処理部131は、FAQ第1処理部120(FAQ検索部121)によって抽出されたFAQ候補のうち、絞込処理部132によるユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較が行なわれていないFAQ質問文のテキストをFAQデータ群210から取得(抽出)する。
ステップB9において、FAQ解析部133は、ステップB8において取得したFAQ質問文のテキストに対して、構文・意味解析を行ない、FAQ質問文中の特徴単語の属性(SVOC)および係り受けを分析する。
ステップB10において、絞込処理部132は、ステップB9において分析したFAQ質問文中の特徴単語の属性(SVOC)および係り受けと、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けとを比較し、一致するかを確認する(図6の符号T2参照)。
確認の結果、ユーザ質問文とFAQ質問文とで文中の特徴単語の属性(SVOC)および係り受けが一致する場合には(ステップB10のYESルート参照)、ステップB11に移行する。
ステップB11において、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと一致したFAQ質問文を備えるFAQを応答FAQとして確定する。
絞込処理部132は、確定した応答FAQを、ユーザに応答するFAQの絞り込み結果として、メモリ12等の所定の記憶領域に保存する(図6の符号T3参照)。
ステップB12において、絞込処理部132は、FAQ第1処理部120(FAQ検索部121)によって抽出されたFAQ候補のうち、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っているかを確認する。
確認の結果、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っていない場合には(ステップB12のNOルート参照)、ステップB13に移行する。
ステップB13において、絞込処理部132は、ステップB11において絞り込み結果として保存した応答FAQをディスプレイ14a等に表示させ、処理を終了する。
また、ステップB10における確認の結果、ユーザ質問文とFAQ質問文とで文中の特徴単語の属性(SVOC)および係り受けが一致しない場合には(ステップB10のNOルート参照)、ステップB8に戻る。また、ステップB12における確認の結果、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っている場合にも(ステップB12のYESルート参照)、ステップB8に戻る。すなわち、ステップB8において、質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較が行なわれていない次のFAQ質問文のテキストをFAQデータ群210から取得し、以下、同様の処理を繰り返し行なう。
(C)効果
このように、第2実施形態の一例としての情報処理装置1bによれば、FAQ第1処理部120において、ユーザ質問文から抽出した特徴単語に基づき、FAQ検索部121がFAQデータ群210に対して転置インデックスで検索を行なうことで複数のFAQ候補を検索する。
一方、質問文解析部113が、ユーザ質問文に対して構文・意味解析を行なうことで文書構造情報を取得し、FAQ解析部133が、FAQ候補の各FAQ質問文に対して構文・意味解析を行なうことで文書構造情報を取得する。
そして、絞込処理部132が、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、特徴単語の属性(SVOC)および係り受けが一致するFAQ質問文を備えるFAQをユーザに応答するFAQ(応答FAQ)として決定する。
これにより、絞込処理部132は、ユーザ質問文と同様の内容を有する可能性が高いFAQ質問文のFAQを抽出してユーザに提供することができる。すなわち、絞込処理部132は、ユーザ質問文に対応しないFAQ候補の出力を抑止することができる。これにより、ユーザに対してユーザ質問文と近い内容のFAQを提供することができ、顧客満足度を向上させることができる。
一方、FAQ検索部121によって抽出された複数のFAQ候補の中から、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、特徴単語の属性(SVOC)および係り受けが一致しないFAQ質問文を備えるFAQ候補についてはユーザに提供しないことで、ユーザ質問文に対応しないFAQ候補のユーザへの出力を抑制でき、これによってもユーザの満足度を向上させることができる。
FAQ解析部133は、FAQ検索部121によって抽出されたFAQ候補のFAQ質問文に対してだけ構文・意味解析を行なうので、構文・意味解析を行なうことで生じる文章索引情報のデータ量の増加を少なくすることができ、FAQ検索処理能力の低下を抑止することができる。
すなわち、本情報処理装置1bにおいても、予めFAQデータ群210の全FAQのFAQ質問文やFAQ回答文に対して文要素間関係の分析を行なう必要がないので、システムが管理するデータ量やメモリ使用量が増大することがない。従って、これらの影響によるFAQ検索処理能力の低下が生じることもない。
また、FAQ解析部133は、特徴単語と、当該特徴単語を修飾している単語と、その修飾関係という限定的な範囲に対して構文・意味解析を行なう。これによっても、構文・意味解析を行なうことで生じる文章索引情報のデータ量の増加を少なくすることができ、FAQ検索処理能力の低下を抑止することができる。
(III)第3実施形態の説明
(A)構成
第3実施形態の情報処理装置1cは、第1実施形態の情報処理装置1aの制御部100aと、第2実施形態の情報処理装置1bの制御部100bとの両方の機能を兼ね備える。また、本第3実施形態の情報処理装置1cは、第1実施形態の情報処理装置1aと同様のハードウェア構成(図2参照)を備える。
なお、第3実施形態の情報処理装置1cは、図4に例示した第2実施形態の情報処理装置1bと同様の機能構成を有する。本第3実施形態の情報処理装置1cにおいて、プロセッサ11がFAQ検索プログラム220を実行することにより、制御部100cとして機能する。
すなわち、情報処理装置1cにおいて、絞込処理部132は、第1実施形態の絞込処理部132と同様に、FAQ検索部121によって抽出された各FAQ候補において、質問文第1処理部112によってユーザ質問文から抽出された特徴単語が、同一センテンス内にあるかを確認する機能を有する。
そして、絞込処理部132は、ユーザ質問文から抽出された特徴単語が、FAQ質問文の同一センテンス(文)内にあるFAQ候補を、ユーザに応答する応答FAQとして決定する。
また、情報処理装置1cにおいて、質問文解析部113は、第2実施形態の質問文解析部113と同様に、ユーザ質問文に対して構文・意味解析を行ない、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けを分析する。
また、情報処理装置1cにおいて、FAQ解析部133は、FAQ質問文のテキストに対して構文・意味解析を行なうことで、特徴単語のSVOCおよび係り受けを分析する。
そして、情報処理装置1cにおいて、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、FAQ質問文中の特徴単語の属性(SVOC)および係り受けとを比較する。そして、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと、特徴単語の属性(SVOC)および係り受けが一致するFAQ質問文を備えるFAQをユーザに応答するFAQ(応答FAQ)として決定する。
(B)動作
上述の如く構成された第3実施形態の一例としての情報処理装置1cにおけるFAQ検索方法を、図5および図8〜図12を参照しながら、図7に示すフローチャート(ステップB1〜B9,A7,B10〜B13)に従って説明する。
この図7に示すフローチャートにおいては、図6に示した第2実施形態の情報処理装置1bにおけるFAQ検索方法のフローチャート(ステップB1〜B13)に、図3に示した第1実施形態の情報処理装置1cにおけるFAQ検索方法のフローチャートのステップA7の処理を備えるものである。
以下に示す例においても、情報処理装置1cにおいてチャットボット機能が実行される場合について示す。すなわち、ユーザが入力する質問文(ユーザ質問文)に基づいてFAQデータ群210に対する検索を行ない、ユーザ質問文に合ったFAQ(応答FAQ)を抽出してユーザに応答する例について示す。
また、以下においては、FAQ検索部121が5つのFAQ候補を検索結果として抽出し、FAQ第2処理部130がこれらの5つのFAQ候補(回答候補1〜5)の中から応答FAQを抽出する例について説明する。
図8〜図12は、それぞれ第3実施形態の一例としての情報処理装置1cにおけるFAQ質問文に対して構文・意味解析を行なった結果得られる文書構造情報を例示する図である。
なお、図8は回答候補1のFAQ候補のFAQ質問文に構文・意味解析を行なった結果得られる文書構造情報を例示する図である。同様に、図9〜図12は、回答候補2〜4のFAQ候補のFAQ質問文に構文・意味解析を行なった結果得られる文書構造情報をそれぞれ例示する図である。
なお、図中、既述の符号と同一の符号を付したステップは同様の処理を示している。すなわち、図7に示すフローチャート中において、ステップA7においては、図3に示したフローチャートのステップA7と同様の処理が行なわれ、ステップB1〜B9,B10〜B13においては、図6に示したフローチャートのステップB1〜B9,B10〜B13と同様の処理が行なわれる。
ステップB1において、受付部111は、出力部302(モニタ14a)にユーザに対して質問文の入力を行なわせるメッセージ(質問受付メッセージ)を表示させる。例えば、受付部111は、「問い合わせ内容を入力してください」とのメッセージをディスプレイ14aに表示させる。
ステップB2において、ユーザは入力部301(キーボード15a等)を操作してユーザ質問文の入力を行なう。本例においては、「WindowsのスケジュールサーバからLinuxの実行サーバへネットワークジョブを実行したら正常終了となるが、直ぐに終了する処理が完了までに約5〜6分かかります。原因と対処方法を教えてください。」とのユーザ質問文が入力されたものとする。入力されたユーザ質問文はメモリ12の所定の記憶領域等に格納される。受付部111は入力されたユーザ質問文を取得する。
ステップB3において、質問文第1処理部112は、ユーザ質問文から特徴単語を抽出する。質問文第1処理部112は、入力されたユーザ質問文から特徴単語の抽出を行なう。本例においては、[windows],[スケジュールサーバ],[Linux],[実行サーバ],[ネットワークジョブ]および[対処方法]がユーザ質問文の特徴単語として抽出されたものとする。
ステップB4において、FAQ第1処理部120のFAQ検索部121は、抽出した特徴単語に基づきFAQデータ群210に対して転置インデックスで検索を行ない(一次検索)、ユーザ質問文の特徴単語を含む1つ以上(本例では5つ)のFAQ(FAQ候補)を抽出する。
なお、本処理を行なうに際して、FAQ第1処理部120が、予め、FAQデータ群210に含まれる複数のFAQに基づき転置インデックスを生成しておくものとする。
ステップB5において、FAQ第2処理部130bのFAQテキスト処理部131は、抽出された複数のFAQ候補のそれぞれについて、FAQデータ群210からFAQ質問文の全文テキスト(FAQテキスト)を取得する。以下に回答候補1〜5のFAQ質問文を示す。
回答候補1: Windowsのスケジュールサーバから、Linuxの実行サーバへネットワークジョブを実行するときの注意点を教えてください。
回答候補2: Linux版のスケジュールサーバから、Windows版の実行サーバへネットワークジョブを投入できますか。
回答候補3: ネットワークジョブを実行したとき、毎回ジョブの終了を認識するまでに約5分かかります。原因と対処方法を教えてください。
回答候補4: スケジュールサーバがクラスタ環境で実行サーバがNAT変換した後のシングルサーバです。このときに実行サーバからの結果通知ができず、ジョブの完了までに5分かかります。原因と対処方法を教えて下さい。
回答候補5: スケジュールサーバがクラスタ構成の場合、ネットワークジョブが終了するまでに時間がかかる
ステップB6において、FAQテキスト処理部131は、取得したFAQテキストから特徴単語を抽出する。以下に回答候補1〜5の特徴単語をそれぞれ示す。
回答候補1の特徴単語:Windows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブ
回答候補2の特徴単語: Linux、スケジュールサーバ、Windows、実行サーバ、ネットワークジョブ
回答候補3の特徴単語:ネットワークジョブ、対処方法
回答候補4の特徴単語:スケジュールサーバ、クラスタ環境、実行サーバ、NAT変換、シングルサーバ、対処方法
回答候補5の特徴単語:スケジュールサーバ、クラスタ構成、ネットワークジョブ
ステップB7において、質問文解析部113は、ユーザ質問文に対して構文・意味解析を行ない、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けを分析する。
質問文解析部113は、ユーザ質問文に対して構文・意味解析を行なうことで、文書構造情報を作成する。
本例においては、質問文解析部113がユーザ質問文に対して構文・意味解析を行なうことで、図5に例示した文書構造情報を生成したものとする。
ステップB8において、FAQテキスト処理部131は、FAQ第1処理部120(FAQ検索部121)によって抽出されたFAQ候補のうち、絞込処理部132によるユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較が行なわれていないFAQ質問文のテキストをFAQデータ群210から取得(抽出)する。
ステップB9において、FAQ解析部133は、ステップB8において取得したFAQ質問文のテキストに対して、構文・意味解析を行ない、FAQ質問文中の特徴単語の属性(SVOC)および係り受けを分析する。
FAQ解析部133が回答候補1〜回答候補5に対して構文・意味解析を行なうことで図8〜図12に例示する文書構造情報が生成されたものとする。
ステップA7において、絞込処理部132は、FAQ検索部121によって抽出されたFAQ候補の中から、ユーザ質問文から抽出された特徴単語が、FAQ質問文の同一センテンス(文)内にあるFAQ候補を、FAQをユーザに応答するFAQ(応答FAQ)として決定する絞り込みを行なう(二次検索)。
絞込処理部132は、FAQ検索部121によって抽出された各FAQ候補のそれぞれについて、ユーザ質問文における1センテンス中の特徴単語とFAQ候補における1センテンス中の特徴単語とを比較する。
絞込処理部132は、ユーザ質問文の1センテンス中の特徴単語が、FAQ候補のFAQ質問文の1センテンス中に含まれるかを調べる。
本例においては、絞込処理部132は、ユーザ質問文の1センテンス中の複数の特徴単語が、FAQ候補において複数のセンテンスに分かれて配置されていないことを要件として判断を行なう。
絞込処理部132は、ユーザ質問文の一センテンス中に含まれる複数の特徴単語が、FAQ候補(回答候補)において異なるセンテンスに分散して配置されている場合、当該FAQ候補(回答候補)を応答FAQから除外する。
以下に、絞込処理部132によるステップA7の処理を例示する。
(1)ユーザ質問文中の特徴単語は以下の通り
第1センテンス中の特徴単語:Windows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブ
第2センテンス中の特徴単語:対処方法
(2)回答候補1中の特徴単語は以下の通り
第1センテンス中:Windows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブ
ユーザ質問文の第1センテンス中の特徴単語であるWindows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブが、回答候補1の第1センテンスに含まれているので、絞込処理部132は、この回答候補1を応答FAQの候補から除外しない。
(3)回答候補2中の特徴単語は以下の通り
第1センテンス中:Linux、スケジュールサーバ、Windows、実行サーバ、ネットワークジョブ
ユーザ質問文の第1センテンス中の特徴単語に含まれるWindows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブが、回答候補2の第1センテンスに含まれているので、絞込処理部132は、この回答候補2を応答FAQの候補から除外しない。
(4)回答候補3中の特徴単語は以下の通り
第1センテンス中:ネットワークジョブ
第2センテンス中:対処方法
ユーザ質問文の第1センテンス中の特徴単語であるネットワークジョブが回答候補3の第1センテンスに含まれており、また、ユーザ質問文の第2センテンス中の特徴単語である対処方法が回答候補3の第2センテンスに含まれている。ユーザ質問文の一センテンス中の特徴単語が回答候補3において複数のセンテンスに分かれているわけではないので、絞込処理部132は、この回答候補3を応答FAQの候補から除外しない。
(5)回答候補4中の特徴単語は以下の通り
第1センテンス中:スケジュールサーバ、クラスタ環境、実行サーバ、シングルサーバ
第2センテンス中:実行サーバ
第3センテンス中:対処方法
ユーザ質問文の第1センテンス中の特徴単語であるスケジュールサーバおよび実行サーバが回答候補4の第1センテンスに含まれており、また、ユーザ質問文の第1センテンス中の特徴単語である実行サーバが回答候補4の第2センテンスに含まれている。さらに、ユーザ質問文の第2センテンス中の特徴単語である対処方法が回答候補4の第3センテンスに含まれている。
ユーザ質問文の一センテンス中の特徴単語が回答候補4において複数のセンテンスに分かれているわけではないので、絞込処理部132は、この回答候補4を応答FAQの候補から除外しない。
(6)回答候補5中の特徴単語は以下の通り
第1センテンス中:スケジュールサーバ、クラスタ構成、ネットワークジョブ
ユーザ質問文の第1センテンス中の特徴単語に含まれるスケジュールサーバおよびネットワークジョブが、回答候補5の第1センテンスに含まれているので、絞込処理部132は、この回答候補5を応答FAQの候補から除外しない。
本例においては、ユーザ質問文の一センテンス中に含まれる複数の特徴単語が、いずれの回答候補においても異なるセンテンスに分散して配置されていることはないので、絞込処理部132は、各回答候補1〜5を応答FAQの候補から除外しない。
ステップB10において、絞込処理部132は、ステップB9において分析したFAQ質問文中の特徴単語の属性(SVOC)および係り受けと、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けとを比較し、一致するかを確認する。
確認の結果、ユーザ質問文とFAQ質問文とで文中の特徴単語の属性(SVOC)および係り受けが一致する場合には(ステップB10のYESルート参照)、ステップB11に移行する。
ステップB11において、絞込処理部132は、ユーザ質問文中の特徴単語の属性(SVOC)および係り受けと一致したFAQ質問文を備えるFAQを応答FAQとして確定する。
絞込処理部132は、ユーザ質問文とFAQ質問文の特徴単語の属性と係り受けが一致、且つ、各特徴単語の修飾関係がユーザ質問文と同じかを比較する。
具体的には、絞込処理部132は、ユーザ質問文についての文書構造情報(図5参照)と、回答候補1〜5についての文書構造情報(図8〜図12参照)とを比較する。本例における各回答候補1〜5についてのユーザ質問文との比較の結果は以下のとおり
回答候補1:図8のP1〜P5は図5のP1〜P5と比べて修飾関係で違いは見られないことから、回答候補1を応答FAQとする
回答候補2: [スケジュールサーバ]にかかる単語が[Linux]であり(図9のP1参照)、 [実行サーバ]にかかる単語が[Windows]であり(図9のP3参照)、図5のP1およびP3と相違するので、回答候補2を応答FAQから除外する
回答候補3:図10のP1〜P3は図5のP5〜P7と比べて特に共通する特徴語間で係り受けの関係に違いは見られないことから、回答候補3を応答FAQとする
回答候補4:[スケジュールサーバ]が[クラスタ構成]に修飾しており(図11のP1参照)、図5のP2と相違するので、回答候補4を応答FAQから除外する
回答候補5:[スケジュールサーバ]が[クラスタ構成]に修飾しているので(図12のP1参照)、図5のP2と相違するので、回答候補5を応答FAQから除外する
これらの比較の結果、回答候補1に対応するFAQ候補と、回答候補3に対応するFAQ候補とが応答FAQとして決定される。なお、本例においては、ユーザ質問文に対して最適な応答FAQは回答候補3に対応するFAQ候補である。
絞込処理部132は、確定した応答FAQを、ユーザに応答するFAQの絞り込み結果として、メモリ12等の所定の記憶領域に保存する(図7の符号T4参照)。
ステップB12において、絞込処理部132は、FAQ第1処理部120(FAQ検索部121)によって抽出されたFAQ候補のうち、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っているかを確認する。
確認の結果、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っていない場合には(ステップB12のNOルート参照)、ステップB13に移行する。
ステップB13において、絞込処理部132は、ステップB11において絞り込み結果として保存した応答FAQをディスプレイ14a等に表示させ、処理を終了する。
また、ステップB10における確認の結果、ユーザ質問文とFAQ質問文とで文中の特徴単語の属性(SVOC)および係り受けが一致しない場合には(ステップB10のNOルート参照)、ステップB8に戻る。また、ステップB12における確認の結果、ユーザ質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較を行なっていないFAQ質問文が残っている場合にも(ステップB12のYESルート参照)、ステップB8に戻る。すなわち、ステップB8において、質問文と特徴単語のSVOCおよび特徴単語の係り受けが一致するかの比較が行なわれていない次のFAQ質問文のテキストをFAQデータ群210から取得し、以下、同様の処理を繰り返し行なう。
なお、上記の回答候補1〜5を用いた例示のうち、ステップA7に関する記載は前述した第1実施形態にも同様に適用することができる。同様に、上記の回答候補1〜5を用いた例示のうち、ステップB1〜B9,B10〜B13に関する記載は前述した第2実施形態にも同様に適用することができる。
(C)効果
第3実施形態の一例としての情報処理装置1cによれば、上述した第1実施形態および第2実施形態と同様の作用効果を得ることができる。
(IV)その他
開示の技術は上述した実施形態に限定されるものではなく、各実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、各実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
また、上述した各実施形態において、制御部100a,100b,100cの一部の機能をネットワークを介して接続された他の情報処理装置に備えてもよい。また、上述した各実施形態において、記憶部200に記憶されたFAQデータ群210およびFAQ検索プログラムの少なくとも一部をネットワークを介して接続された外部ストレージに備えてもよい。
上述した各実施形態において、FAQ検索部121は、質問文第1処理部112によって抽出された特徴単語に基づいて転置インデックスでFAQデータ群210に対して全文検索を行ない、ユーザ質問文の特徴単語を含むFAQ候補を抽出しているが、これに限定されるものではない。FAQ検索部121は他の検索手法を用いてユーザ質問文の特徴単語を含むFAQ候補を抽出してもよい。例えば、FAQ検索部121は、類似語検索や類義語検索を組み合わせて行なってもよく、種々変形して実施することができる。
また、絞込処理部132は、特徴単語の属性(SVOC)および係り受けの一致の判断を行なうに際して、特徴単語の類似語や類義語を判断対象に含めてもよく、種々変形して実施することができる
また、上述した各実施形態においては、情報処理装置1にチャットボットを実現するに際して、ユーザが入力したユーザ質問文に応答する応答FAQを抽出するシステムについて示しているがこれに限定されるものではない。入力された検索クエリに対して、複数の文書に対して検索を行ない、検索クエリに応じた文書を応答する機能を有する種々のシステムに適用することができる。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
(V)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数のセンテンスを含む検索クエリを受け付け、
受け付けた前記検索クエリより複数の単語を抽出し、
それぞれが複数のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれる複数のセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれる前記複数のセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書より少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。
(付記2)
複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。
(付記3)
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
処理を前記コンピュータが実行することを特徴とする、付記1または2記載の抽出方法。
(付記4)
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、付記3記載の抽出方法。
(付記5)
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、付記3または4記載の抽出方法。
(付記6)
複数の単語を含む検索クエリを受け付ける受付部と、
受け付けた前記検索クエリから前記複数の単語を抽出する単語抽出部と、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定する特定部と、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する文書抽出部と
を備えることを特徴とする、情報処理装置。
(付記7)
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出する検索部を備え、
前記文書抽出部が、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
ことを特徴とする、付記6記載の情報処理装置。
(付記8)
前記文書抽出部が、
前記検索部が抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
ことを特徴とする、付記7記載の情報処理装置。
(付記9)
前記文書抽出部が、
前記検索部が抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
ことを特徴とする、付記7または8記載の情報処理装置。
(付記10)
複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータに実行させることを特徴とする抽出プログラム。
(付記11)
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記10記載の抽出プログラム。
(付記12)
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記11記載の抽出プログラム。
(付記13)
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記11または12記載の抽出プログラム。
1a,1b,1c 情報処理装置
100a,100b,100c 制御部
110 質問文処理部
111 受付部
112 質問文第1処理部(単語抽出部)
113 質問文解析部
120 FAQ第1処理部
121 FAQ検索部(検索部)
130 FAQ第2処理部
131 FAQテキスト処理部(特定部)
132 絞込処理部(文書抽出部)
133 FAQ解析部
200 記憶部
210 FAQデータ群(複数の単語)
220 FAQ検索プログラム
301 入力部
302 出力部
303 通信部
15 入力インタフェース
15a キーボード(入力部)
15b マウス(入力部)
16 光学ドライブ装置
16a 光ディスク
17 機器接続インタフェース
17a メモリ装置
17b メモリリーダライタ
17c メモリカード
18 ネットワークインタフェース
19 バス

Claims (7)

  1. 複数のセンテンスを含む検索クエリを受け付け、
    受け付けた前記検索クエリより複数の単語を抽出し、
    それぞれが複数のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれる複数のセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれる前記複数のセンテンスでの出現状況との関係性を特定し、
    特定した前記関係性に基づき、前記複数の文書より少なくともいずれかの文書を抽出する、
    処理をコンピュータが実行することを特徴とする抽出方法。
  2. 複数の単語を含む検索クエリを受け付け、
    受け付けた前記検索クエリから前記複数の単語を抽出し、
    それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
    特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
    処理をコンピュータが実行することを特徴とする抽出方法。
  3. 前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
    抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
    処理を前記コンピュータが実行することを特徴とする、請求項1または2記載の抽出方法。
  4. 抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
    処理を前記コンピュータが実行することを特徴とする、請求項3記載の抽出方法。
  5. 抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
    処理を前記コンピュータが実行することを特徴とする、請求項3または4記載の抽出方法。
  6. 複数の単語を含む検索クエリを受け付ける受付部と、
    受け付けた前記検索クエリから前記複数の単語を抽出する単語抽出部と、
    それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定する特定部と、
    特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する文書抽出部と
    を備えることを特徴とする、情報処理装置。
  7. 複数の単語を含む検索クエリを受け付け、
    受け付けた前記検索クエリから前記複数の単語を抽出し、
    それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
    特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
    処理をコンピュータに実行させることを特徴とする抽出プログラム。
JP2019014459A 2019-01-30 2019-01-30 抽出方法,情報処理装置および抽出プログラム Pending JP2020123134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019014459A JP2020123134A (ja) 2019-01-30 2019-01-30 抽出方法,情報処理装置および抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019014459A JP2020123134A (ja) 2019-01-30 2019-01-30 抽出方法,情報処理装置および抽出プログラム

Publications (1)

Publication Number Publication Date
JP2020123134A true JP2020123134A (ja) 2020-08-13

Family

ID=71992707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019014459A Pending JP2020123134A (ja) 2019-01-30 2019-01-30 抽出方法,情報処理装置および抽出プログラム

Country Status (1)

Country Link
JP (1) JP2020123134A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022209313A1 (ja) * 2021-03-29 2022-10-06 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129546A (ja) * 1994-10-31 1996-05-21 Toshiba Corp 文書作成装置及び方法
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JP2006195756A (ja) * 2005-01-13 2006-07-27 Just Syst Corp 情報検索装置、情報検索サイトの改善方法提示装置
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2009175826A (ja) * 2008-01-22 2009-08-06 Nippon Telegr & Teleph Corp <Ntt> テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体
JP2016053782A (ja) * 2014-09-03 2016-04-14 カシオ計算機株式会社 質問応答装置、質問応答方法、プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129546A (ja) * 1994-10-31 1996-05-21 Toshiba Corp 文書作成装置及び方法
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JP2006195756A (ja) * 2005-01-13 2006-07-27 Just Syst Corp 情報検索装置、情報検索サイトの改善方法提示装置
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2009175826A (ja) * 2008-01-22 2009-08-06 Nippon Telegr & Teleph Corp <Ntt> テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体
JP2016053782A (ja) * 2014-09-03 2016-04-14 カシオ計算機株式会社 質問応答装置、質問応答方法、プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022209313A1 (ja) * 2021-03-29 2022-10-06 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Similar Documents

Publication Publication Date Title
US10162885B2 (en) Automated self-service user support based on ontology analysis
US10303683B2 (en) Translation of natural language questions and requests to a structured query format
US20200285638A1 (en) Systems And Methods For Translating Natural Language Sentences Into Database Queries
US9639601B2 (en) Question answering system adapted to style of user requests
US9740685B2 (en) Generation of natural language processing model for an information domain
AU2012235939B2 (en) Real-time automated interpretation of clinical narratives
US10754886B2 (en) Using multiple natural language classifier to associate a generic query with a structured question type
US9734238B2 (en) Context based passage retreival and scoring in a question answering system
KR102285142B1 (ko) 챗봇을 위한 학습 데이터 추천 장치 및 방법
US9684726B2 (en) Realtime ingestion via multi-corpus knowledge base with weighting
RU2544739C1 (ru) Способ преобразования структурированного массива данных
US20190155912A1 (en) Multi-dimensional query based extraction of polarity-aware content
US8996357B2 (en) Method for generating diagrams, and information processing apparatus for same
US10534788B2 (en) Automatically determining a recommended set of actions from operational data
JP2020123134A (ja) 抽出方法,情報処理装置および抽出プログラム
JP2009128967A (ja) 文書検索装置
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
US11971887B2 (en) Identifying and replacing logically neutral phrases in natural language queries for query processing
US20230306022A1 (en) Identifying and replacing logically neutral phrases in natural language queries for query processing
WO2022123716A1 (ja) 述語項構造修正プログラム、述語項構造修正方法、および情報処理装置
EP4273738A1 (en) Semantic representation generation method, semantic representation generation device, and semantic representation generation program
US20220405488A1 (en) Providing a well-formed alternate phrase as a suggestion in lieu of a not well-formed phrase
US10268674B2 (en) Linguistic intelligence using language validator

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20221121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230307

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230905