JP2021056581A - 文書検索システムおよび文書検索プログラム - Google Patents

文書検索システムおよび文書検索プログラム Download PDF

Info

Publication number
JP2021056581A
JP2021056581A JP2019176650A JP2019176650A JP2021056581A JP 2021056581 A JP2021056581 A JP 2021056581A JP 2019176650 A JP2019176650 A JP 2019176650A JP 2019176650 A JP2019176650 A JP 2019176650A JP 2021056581 A JP2021056581 A JP 2021056581A
Authority
JP
Japan
Prior art keywords
search
document
faq
cluster
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019176650A
Other languages
English (en)
Inventor
彩香 鈴木
Ayaka Suzuki
彩香 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019176650A priority Critical patent/JP2021056581A/ja
Publication of JP2021056581A publication Critical patent/JP2021056581A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索結果の絞り込みを容易化するための文書検索システム及び文書検索プログラムを提供する。【解決手段】FAQ検索チャットボットシステム20の制御部25は、問い合わせに応じてFAQからQ&Aを検索する文書検索システム25dと、文書検索システム25dによる検索結果を通知するボット対話システム25aとを備える。文書検索システム25dは、検索結果をクラスタリングした後、クラスター毎の絞り込みキーワードを抽出する。ボット対話システム25aは、利用者にクラスターを選択させるためにクラスター毎の絞り込みキーワードを通知し、文書検索システム25dは、利用者によるクラスターの選択結果に応じて検索結果を絞り込む。【選択図】図2

Description

本発明は、文書を検索する文書検索システムおよび文書検索プログラムに関する。
従来の文書検索システムとして、文書の検索結果をクラスタリングして表示するものが知られている(例えば、特許文献1、2参照。)。
特開2010−009577号公報 特開2013−109606号公報
しかしながら、従来の文書検索システムにおいては、検索結果を絞り込むことができないという問題がある。
そこで、本発明は、検索結果の絞り込みを容易化することができる文書検索システムおよび文書検索プログラムを提供することを目的とする。
本発明の文書検索システムは、検索用の言葉に応じて文書を検索する文書検索部と、前記文書検索部による検索結果を通知する結果通知部とを備え、前記文書検索部は、前記検索結果をクラスタリングした後、クラスター毎の特徴語を抽出し、前記結果通知部は、利用者に前記クラスターを選択させるために前記クラスター毎の前記特徴語を通知し、前記文書検索部は、利用者による前記クラスターの選択結果に応じて前記検索結果を絞り込むことを特徴とする。
この構成により、本発明の文書検索システムは、検索用の言葉に応じた文書の検索結果をクラスタリングした後、利用者にクラスターを選択させるためにクラスター毎の特徴語を通知し、利用者によるクラスターの選択結果に応じて検索結果を絞り込むので、検索結果の絞り込みを容易化することができる。
本発明の文書検索システムにおいて、前記文書検索部は、前記特徴語が通知されたいずれかの前記クラスターが選択されたことが前記選択結果である場合に、選択された前記クラスターの前記特徴語の少なくとも1つをキーワードとして含む前記文書以外の前記文書を前記検索結果から除外することによって、前記検索結果を絞り込んでも良い。
この構成により、本発明の文書検索システムは、特徴語が通知されたいずれかのクラスターが選択された場合に、選択されたクラスターの特徴語の少なくとも1つをキーワードとして含む文書以外の前記文書を検索結果から除外することによって、検索結果を絞り込むので、利用者が検索結果の絞り込みに適切であると判断する特徴語を通知することができた場合に、利用者が意図した検索結果になる絞り込みを行う可能性を向上することができる。
本発明の文書検索システムにおいて、前記文書検索部は、前記特徴語が通知されたいずれの前記クラスターも選択されなかったことが前記選択結果である場合に、少なくとも1つの前記クラスターの前記特徴語の少なくとも1つをキーワードとして含む前記文書を前記検索結果から除外することによって、前記検索結果を絞り込んでも良い。
この構成により、本発明の文書検索システムは、特徴語が通知されたいずれのクラスターも選択されなかった場合に、少なくとも1つのクラスターの特徴語の少なくとも1つをキーワードとして含む文書を検索結果から除外することによって、検索結果を絞り込むので、利用者が検索結果の絞り込みに適切であると判断する特徴語を通知することができなかった場合に、利用者が意図した検索結果にならない絞り込みを行う可能性を低減することができる。
本発明の文書検索プログラムは、検索用の言葉に応じて文書を検索する文書検索部と、前記文書検索部による検索結果を通知する結果通知部とをコンピューターに実現させ、前記文書検索部は、前記検索結果をクラスタリングした後、クラスター毎の特徴語を抽出し、前記結果通知部は、利用者に前記クラスターを選択させるために前記クラスター毎の前記特徴語を通知し、前記文書検索部は、利用者による前記クラスターの選択結果に応じて前記検索結果を絞り込むことを特徴とする。
この構成により、本発明の文書検索プログラムを実行するコンピューターは、検索用の言葉に応じた文書の検索結果をクラスタリングした後、利用者にクラスターを選択させるためにクラスター毎の特徴語を通知し、利用者によるクラスターの選択結果に応じて検索結果を絞り込むので、検索結果の絞り込みを容易化することができる。
本発明の文書検索システムおよび文書検索プログラムは、検索結果の絞り込みを容易化することができる。
本発明の第1の実施の形態に係るシステムのブロック図である。 図1に示すFAQ検索チャットボットシステムのブロック図である。 図2に示すFAQデータベースの一例を示す図である。 FAQデータベースを生成する場合の図2に示すFAQ検索チャットボットシステムの動作のフローチャートである。 Q&Aの文書ベクトルを取得する場合の図2に示すFAQ検索チャットボットシステムの動作の一例を示すフローチャートである。 利用者によって問い合わせ内容が入力される場合の図2に示すFAQ検索チャットボットシステムの動作の一部のフローチャートである。 図6に示すフローチャートの続きのフローチャートである。 図7に示すフローチャートの続きのフローチャートである。 キーワード一致スコアを取得する場合の図2に示すFAQ検索チャットボットシステムの動作の一例を示すフローチャートである。 クラスターの特徴語を抽出する場合の図2に示すFAQ検索チャットボットシステムの動作の一例を示すフローチャートである。 図2に示すFAQ検索チャットボットシステムに利用者によって問い合わせ内容が入力される場合のチャットアプリケーションの画面の一例を示す図である。 キーワード一致スコアを取得する場合の図2に示すFAQ検索チャットボットシステムの動作の、図9に示す例とは異なる一例を示すフローチャートである。 図6〜図8に示す動作の一部の変形例を示すフローチャートである。 図6〜図8に示す動作の、図13に示す部分とは異なる一部の変形例を示すフローチャートである。 本発明の第2の実施の形態に係る文書検索チャットボットシステムが備える文書データベースの一例を示す図である。 本発明の第2の実施の形態に係る文書検索チャットボットシステムに利用者によって文書の検索用の言葉が入力される場合のチャットアプリケーションの画面の一例を示す図である。 本発明の第3の実施の形態に係る文書管理システムの検索画面の一例を示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。
(第1の実施の形態)
まず、本発明の第1の実施の形態に係るシステムの構成について説明する。
図1は、本実施の形態に係るシステム10のブロック図である。
図1に示すように、システム10は、利用者からの検索用の言葉としての問い合わせに応じてFAQから文書としてのQ&Aを検索する文書検索システムとしてのFAQ検索チャットボットシステム20と、利用者によって使用されるコンピューター30とを備えている。
コンピューター30は、FAQ検索チャットボットシステム20のチャットボットと対話するためのチャットアプリケーション31を備えている。コンピューター30は、例えば、PC(Personal Computer)、スマートフォン、タブレットなどによって構成されている。
システム10は、利用者によって使用されるコンピューターを、コンピューター30以外にも少なくとも1つ備えることが可能である。
FAQ検索チャットボットシステム20と、利用者によって使用されるコンピューターとは、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、互いに通信可能である。
図2は、FAQ検索チャットボットシステム20のブロック図である。
図2に示すように、FAQ検索チャットボットシステム20は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部21と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部22と、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部23と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部24と、FAQ検索チャットボットシステム20全体を制御する制御部25とを備えている。
FAQ検索チャットボットシステム20は、PCで実現されても良いし、ローカルサーバーで実現されても良いし、Webサーバーで実現されても良い。
記憶部24は、FAQに対する検索をサポートするチャットボットを実現するための文書検索プログラムとしてのFAQ検索チャットボット用プログラム24aを記憶可能である。FAQ検索チャットボット用プログラム24aは、例えば、FAQ検索チャットボットシステム20の製造段階でFAQ検索チャットボットシステム20にインストールされていても良いし、USB(Universal Serial Bus)メモリー、CD(Compact Disk)、DVD(Digital Versatile Disk)などの外部の記憶媒体からFAQ検索チャットボットシステム20に追加でインストールされても良いし、ネットワーク上からFAQ検索チャットボットシステム20に追加でインストールされても良い。
記憶部24は、FAQを格納するFAQデータベース24bを記憶している。
図3は、FAQデータベース24bの一例を示す図である。
図3に示すように、FAQデータベース24bは、Q&Aと、Q&Aに付されたタグなどの属性情報と、Q&Aの文書ベクトルと、Q&AのキーワードとをQ&A毎に格納している。Q&Aは、質問と、その質問に対する回答との組み合わせである。例えば、Q&Aが画像形成装置に関するものである場合、属性情報としては、Q&Aの対象の画像形成装置がMFP(Multifunction Peripheral)およびプリンター専用機のいずれであるかを示す情報や、Q&Aの対象の画像形成装置の製品名などが考えられる。
なお、図3に示すFAQデータベース24bは、回答、属性情報および文書ベクトルの具体的な内容を省略して描かれている。
図2に示す制御部25は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部25のCPUの作業領域として用いられる揮発性の記憶デバイスとしてのメモリーであるRAM(Random Access Memory)とを備えている。制御部25のCPUは、記憶部24または制御部25のROMに記憶されているプログラムを実行する。
制御部25は、FAQ検索チャットボット用プログラム24aを実行することによって、チャットボットを実現するボット対話システム25aと、FAQを検索する文書検索システム25dとを実現する。ボット対話システム25aは、利用者からのメッセージを解析するメッセージ解析部25bと、メッセージ解析部25bによる解析結果に応じて文書検索システム25dにFAQを検索させたり、文書検索システム25dによる検索結果に応じて対話シナリオ、すなわち、利用者へのメッセージを生成したりする対話シナリオ部25cとを備えている。文書検索システム25dは、FAQデータベース24bに格納されているFAQを検索する検索機能部25eを備えている。文書検索システム25dは、問い合わせに応じてFAQから文書としてのQ&Aを検索する文書検索部を構成している。ボット対話システム25aは、文書検索システム25dによる検索結果を通知する結果通知部を構成している。
次に、FAQ検索チャットボットシステム20の動作について説明する。
まず、FAQデータベース24bを生成する場合のFAQ検索チャットボットシステム20の動作について説明する。
FAQ検索チャットボットシステム20の管理者は、FAQを示すFAQ情報に基づいたFAQデータベース24bの生成を操作部21または通信部23を介してFAQ検索チャットボットシステム20に指示する。ここで、FAQ情報は、Q&Aと、Q&Aに付されたタグなどの属性情報とをQ&A毎に示す情報である。属性情報は、FAQ情報の作成者によって付される情報である。FAQ検索チャットボットシステム20は、FAQ情報に基づいたFAQデータベース24bの生成が指示されると、図4に示す動作を実行する。
図4は、FAQデータベース24bを生成する場合のFAQ検索チャットボットシステム20の動作のフローチャートである。
図4に示すように、検索機能部25eは、入力されたFAQ情報をFAQデータベース24bに格納する(S101)。
次いで、検索機能部25eは、S101においてFAQデータベース24bに格納したFAQ情報に示されるQ&Aのうち、未だ対象にしていない1つのQ&Aを対象にする(S102)。
次いで、検索機能部25eは、現在の対象のQ&Aにおける質問に対して形態素解析を実行する(S103)。
次いで、検索機能部25eは、現在の対象のQ&Aのキーワードを抽出する(S104)。すなわち、検索機能部25eは、S103において生成した形態素に基づいて、現在の対象のQ&Aにおける質問に含まれる名詞および名詞句を、現在の対象のQ&Aのキーワードとして抽出する。例えば、現在の対象のQ&Aにおける質問が「フィニッシャー(オプション)で紙詰まりがおきた」である場合、検索機能部25eは、現在の対象のQ&Aのキーワードとして、「フィニッシャー」、「オプション」、「紙詰まり」を抽出する。
検索機能部25eは、S104の処理の後、S104において抽出したキーワードを、現在の対象のQ&AのキーワードとしてFAQデータベース24bに格納する(S105)。
次いで、検索機能部25eは、現在の対象のQ&Aの文書ベクトルを取得する(S106)。
図5は、Q&Aの文書ベクトルを取得する場合のFAQ検索チャットボットシステム20の動作の一例を示すフローチャートである。
図5に示すように、検索機能部25eは、S103において生成した形態素に基づいて、現在の対象のQ&Aにおける質問に含まれる全ての単語の単語ベクトルを取得する(S121)。ここで、単語の分散表現の方法としては、例えば、Word2VecやSCDVなどの方法が採用されることが可能である。
次いで、検索機能部25eは、S121において取得した単語ベクトルを平均することによって文書ベクトルを取得して(S122)、図5に示す動作を終了する。
図4に示すように、検索機能部25eは、S106の処理の後、S106において取得した文書ベクトルを、現在の対象のQ&Aの文書ベクトルとしてFAQデータベース24bに格納する(S107)。
検索機能部25eは、S107の処理の後、S101においてFAQデータベース24bに格納したFAQ情報に示されるQ&Aのうち、未だ対象にしていないQ&Aが存在するか否かを判断する(S108)。
検索機能部25eは、S101においてFAQデータベース24bに格納したFAQ情報に示されるQ&Aのうち、未だ対象にしていないQ&Aが存在するとS108において判断すると、S102の処理を実行する。
検索機能部25eは、S101においてFAQデータベース24bに格納したFAQ情報に示されるQ&Aのうち、未だ対象にしていないQ&Aが存在しないとS108において判断すると、図4に示す動作を終了する。
検索機能部25eは、図4に示す動作において、Q&Aのキーワードを、そのQ&Aにおける質問に基づいて取得している。しかしながら、検索機能部25eは、Q&Aのキーワードを、そのQ&Aにおける質問、回答および属性情報の少なくとも1つに基づいて取得しても良い。
検索機能部25eは、図4に示す動作において、Q&Aの文書ベクトルを、そのQ&Aにおける質問に基づいて取得している。しかしながら、検索機能部25eは、Q&Aの文書ベクトルを、そのQ&Aにおける質問、回答および属性情報の少なくとも1つに基づいて取得しても良い。
次に、利用者によって問い合わせ内容が入力される場合のFAQ検索チャットボットシステム20の動作について説明する。
図6〜図8は、利用者によって問い合わせ内容が入力される場合のFAQ検索チャットボットシステム20の動作のフローチャートである。
利用者がコンピューター30のチャットアプリケーション31を介してFAQ検索チャットボットシステム20にアクセスすると、FAQ検索チャットボットシステム20は、図6〜図8に示す動作を実行する。
図6〜図8に示すように、対話シナリオ部25cは、利用者に問い合わせ内容の入力を要求するメッセージ(以下「問い合わせ入力要求メッセージ」という。)をチャットアプリケーション31を介して通知する(S141)。したがって、利用者は、チャットアプリケーション31を介してFAQ検索チャットボットシステム20に問い合わせ内容を入力することができる。
メッセージ解析部25bは、S141の処理の後、チャットアプリケーション31を介してメッセージが入力されたと判断するまで、チャットアプリケーション31を介してメッセージが入力されたか否かを判断する(S142)。
メッセージ解析部25bは、チャットアプリケーション31を介してメッセージが入力されたとS142において判断すると、チャットアプリケーション31を介して入力されたメッセージ、すなわち、問い合わせに対して形態素解析を実行する(S143)。
次いで、メッセージ解析部25bは、S104における方法と同様の方法によって、問い合わせのキーワードを抽出する(S144)。すなわち、メッセージ解析部25bは、S143において生成した形態素に基づいて、問い合わせに含まれる名詞および名詞句を、問い合わせのキーワードとして抽出する。
メッセージ解析部25bは、S144の処理の後、S106における方法と同様の方法によって、問い合わせの文書ベクトルを取得する(S145)。すなわち、メッセージ解析部25bは、S143において生成した形態素に基づいて、問い合わせに含まれる全ての単語の単語ベクトルを取得し、取得した単語ベクトルを平均することによって文書ベクトルを取得する。
対話シナリオ部25cは、S145の処理の後、S144において抽出されたキーワードと、S145において取得された文書ベクトルとに応じたFAQの検索を文書検索システム25dに指示する(S146)。
文書検索システム25dの検索機能部25eは、S146においてFAQの検索が指示されると、S145において取得された、問い合わせの文書ベクトルと、Q&Aの文書ベクトルとの類似度を示す類似度スコアを、FAQデータベース24bにおけるQ&A毎に取得する(S147)。ここで、検索機能部25eは、例えば、問い合わせの文書ベクトルと、Q&Aの文書ベクトルとのコサイン類似度を、類似度スコアとして取得する。
検索機能部25eは、S147の処理の後、FAQデータベース24bにおけるQ&Aのそれぞれに、S147において取得した類似度スコアを付与する(S148)。
検索機能部25eは、S148の処理の後、S148において付与した類似度スコアが特定の値以上のQ&Aを、利用者に回答するQ&Aの候補として抽出する(S149)。
次いで、検索機能部25eは、S144において抽出された、問い合わせのキーワードを示す問い合わせキーワードリストを生成する(S150)。
次いで、検索機能部25eは、問い合わせキーワードリストに含まれるキーワードと、Q&Aのキーワードとの一致度を示すキーワード一致スコアを、現在の候補毎に取得する(S151)。ここで、検索機能部25eは、図9に示す動作によってキーワード一致スコアを取得する。
図9は、キーワード一致スコアを取得する場合のFAQ検索チャットボットシステム20の動作の一例を示すフローチャートである。
図9に示すように、検索機能部25eは、対象のQ&Aのキーワードの総数を取得する(S201)。例えば、対象のQ&Aのキーワードが「ソータ」、「オプション」および「紙詰まり」の3つである場合、検索機能部25eは、S201において「3」を取得する。
検索機能部25eは、S201の処理の後、対象のQ&Aのキーワードのうち、問い合わせキーワードリストに含まれるキーワードのいずれかと一致するものの数としての一致数を取得する(S202)。例えば、対象のQ&Aのキーワードが「ソータ」、「オプション」および「紙詰まり」の3つである場合に、問い合わせキーワードリストに「オプション」および「紙詰まり」が含まれ、「ソータ」が含まれないとき、検索機能部25eは、S202において「2」を取得する。
検索機能部25eは、S202の処理の後、S202において取得した一致数を、S201において取得した総数で割ることによって、キーワード一致スコアを取得して(S203)、図9に示す動作を終了する。例えば、S202において取得した数が「2」であって、S201において取得した総数が「3」である場合、検索機能部25eは、S203において「0.67」をキーワード一致スコアとして取得する。
図6〜図8に示すように、検索機能部25eは、S151の処理の後、現在の候補のそれぞれに、S151において取得したキーワード一致スコアを付与する(S152)。
検索機能部25eは、S152の処理の後、現在の候補のうち、S148において付与した類似度スコアが特定の閾値以上のQ&Aが存在するか否かを判断する(S153)。
検索機能部25eは、類似度スコアが特定の閾値以上のQ&Aが存在しないとS153において判断すると、現在の候補のうち、S152において付与したキーワード一致スコアが特定の閾値以上のQ&Aが存在するか否かを判断する(S154)。
検索機能部25eは、キーワード一致スコアが特定の閾値以上のQ&Aが存在しないとS154において判断すると、現在の候補に対して文書ベクトルに基づいてクラスタリングを実行する(S155)。ここで、現在の候補に幾つのクラスターが存在するか不明であるので、検索機能部25eは、例えばDBSCANなど、クラスター数を事前に指定しないアルゴリズムを用いてクラスタリングを実行する。
検索機能部25eは、S155の処理の後、S155において生成された各クラスターの特徴語を抽出する(S156)。
図10は、クラスターの特徴語を抽出する場合のFAQ検索チャットボットシステム20の動作の一例を示すフローチャートである。
図10に示すように、検索機能部25eは、S155において生成されたクラスター毎に、クラスターに含まれる全てのQ&Aのキーワードを結合することによって、クラスターのキーワードを生成する(S221)。なお、検索機能部25eは、同一のクラスターに含まれる複数のQ&Aに同一のキーワードが含まれる場合であっても、そのキーワードを、同一のクラスターに含まれる数だけクラスターのキーワードに含める。
検索機能部25eは、S221の処理の後、S221において生成した、各クラスターの各キーワードのtf−idfのスコアを取得する(S222)。
検索機能部25eは、S222の処理の後、クラスター毎に、S222において取得したスコアが特定の値以上であるキーワードを特徴語として抽出し(S223)、図10に示す動作を終了する。
図10に示す動作によって、各クラスターに関して、対象のクラスターにおける出現回数が多く、他のクラスターにおける出現回数が少ないキーワードが、対象のクラスターの特徴語として抽出される。
図6〜図8に示すように、検索機能部25eは、S156の処理の後、S156において抽出された、各クラスターの特徴語を検索結果として対話シナリオ部25cに返す(S157)。
対話シナリオ部25cは、S157の処理の後、S157において文書検索システム25dから返された検索結果に示される、各クラスターの特徴語を、各クラスターの絞り込みキーワードとして利用者に選択を要求するためのメッセージ(以下「絞り込みキーワード選択要求メッセージ」という。)を生成する(S158)。
次いで、対話シナリオ部25cは、S158において生成した絞り込みキーワード選択要求メッセージをチャットアプリケーション31を介して通知する(S159)。
メッセージ解析部25bは、S159の処理の後、チャットアプリケーション31を介してメッセージが入力されたと判断するまで、チャットアプリケーション31を介してメッセージが入力されたか否かを判断する(S160)。
メッセージ解析部25bは、チャットアプリケーション31を介してメッセージが入力されたとS160において判断すると、チャットアプリケーション31を介して入力されたメッセージにおいて絞り込みキーワードが選択されたか否かを判断する(S161)。
対話シナリオ部25cは、絞り込みキーワードが選択されたとS161において判断されると、選択されたとS161において判断された絞り込みキーワードによって絞り込む、FAQの検索を文書検索システム25dに指示する(S162)。
文書検索システム25dの検索機能部25eは、S162においてFAQの検索が指示されると、現在の候補から、選択されたとS161において判断された絞り込みキーワードをキーワードとして含むQ&A以外のQ&Aを除外する(S163)。
次いで、検索機能部25eは、選択されたとS161において判断された絞り込みキーワードを問い合わせキーワードリストに追加する(S164)。
次いで、検索機能部25eは、S151の処理と同様に、問い合わせキーワードリストに含まれるキーワードと、Q&Aのキーワードとの一致度を示すキーワード一致スコアを、現在の候補毎に取得する(S165)。
次いで、検索機能部25eは、S165の処理の後、現在の候補のそれぞれに、S165において取得したキーワード一致スコアを付与する(S166)。
次いで、検索機能部25eは、S154の処理と同様に、現在の候補のうち、S166において付与したキーワード一致スコアが特定の閾値以上のQ&Aが存在するか否かを判断する(S167)。
検索機能部25eは、キーワード一致スコアが特定の閾値以上のQ&Aが存在しないとS167において判断すると、S155の処理を実行する。
対話シナリオ部25cは、絞り込みキーワードが選択されなかったとS161において判断されると、S159において通知した絞り込みキーワード選択要求メッセージに含まれていたいずれかの絞り込みキーワードをキーワードとして含むQ&Aを除外した、FAQの検索を文書検索システム25dに指示する(S168)。
文書検索システム25dの検索機能部25eは、S168においてFAQの検索が指示されると、現在の候補から、S159において通知した絞り込みキーワード選択要求メッセージに含まれていたいずれかの絞り込みキーワードをキーワードとして含むQ&Aを除外する(S169)。
次いで、検索機能部25eは、S155の処理を実行する。
検索機能部25eは、類似度スコアが特定の閾値以上のQ&Aが存在するとS153において判断すると、S148において付与した類似度スコアが特定の閾値以上のQ&A、すなわち、問い合わせに類似するQ&Aを検索結果として対話シナリオ部25cに返す(S170)。
検索機能部25eは、キーワード一致スコアが特定の閾値以上のQ&Aが存在するとS154またはS167において判断すると、S152において付与したキーワード一致スコアが特定の閾値以上のQ&A、すなわち、問い合わせに類似するQ&Aを検索結果として対話シナリオ部25cに返す(S171)。
対話シナリオ部25cは、S170またはS171の処理の後、文書検索システム25dから返された検索結果にQ&Aが複数含まれるか否かを判断する(S172)。
対話シナリオ部25cは、検索結果にQ&Aが複数含まれるとS172において判断すると、検索結果に示される複数のQ&Aからの1つのQ&Aの選択を利用者に要求するためのメッセージ(以下「Q&A選択要求メッセージ」という。)を生成する(S173)。ここで、S173において生成されるQ&A選択要求メッセージには、複数のQ&Aのそれぞれについて、Q&Aにおける質問のみが含まれる。
対話シナリオ部25cは、S173の処理の後、S173において生成したQ&A選択要求メッセージをチャットアプリケーション31を介して通知する(S174)。
メッセージ解析部25bは、S174の処理の後、チャットアプリケーション31を介してメッセージが入力されたと判断するまで、チャットアプリケーション31を介してメッセージが入力されたか否かを判断する(S175)。
メッセージ解析部25bは、チャットアプリケーション31を介してメッセージが入力されたとS175において判断すると、チャットアプリケーション31を介して入力されたメッセージにおいてQ&Aが選択されたか否かを判断する(S176)。
メッセージ解析部25bは、チャットアプリケーション31を介して入力されたメッセージにおいてQ&Aが選択されなかったとS176において判断すると、利用者からの問い合わせに対応するQ&Aが存在しないことを利用者に通知するためのメッセージ(以下「エラーメッセージ」という。)を生成する(S177)。
次いで、対話シナリオ部25cは、S177において生成したエラーメッセージをチャットアプリケーション31を介して通知して(S178)、図6〜図8に示す動作を終了する。
メッセージ解析部25bは、チャットアプリケーション31を介して入力されたメッセージにおいてQ&Aが選択されたとS176において判断すると、チャットアプリケーション31を介して入力されたメッセージにおいて選択されたQ&Aを特定する(S179)。
次いで、対話シナリオ部25cは、S179において特定したQ&Aを利用者に提示するためのメッセージであるQ&A提示メッセージを生成する(S180)。
対話シナリオ部25cは、検索結果にQ&Aが複数含まれないとS172において判断すると、検索結果に示されるQ&Aを利用者に提示するためのメッセージであるQ&A提示メッセージを生成する(S181)。
次いで、対話シナリオ部25cは、S180またはS181において生成したQ&A提示メッセージをチャットアプリケーション31を介して通知して(S182)、図6〜図8に示す動作を終了する。
図11は、FAQ検索チャットボットシステム20に利用者によって問い合わせ内容が入力される場合のチャットアプリケーション31の画面240の一例を示す図である。
図11に示す画面240では、まず、FAQ検索チャットボットシステム20の対話シナリオ部25cがS141の処理を実行することによって、問い合わせ入力要求メッセージ241がFAQ検索チャットボットシステム20から利用者に通知されている。
次いで、問い合わせ内容を示すメッセージ242が利用者からFAQ検索チャットボットシステム20に通知されている。
次いで、FAQ検索チャットボットシステム20の対話シナリオ部25cがS159の処理を実行することによって、絞り込みキーワード選択要求メッセージ243がFAQ検索チャットボットシステム20から利用者に通知されている。
図11に示す絞り込みキーワード選択要求メッセージ243においては、1〜4の番号が付された絞り込みキーワードの群が存在する。各群は、S155において生成された各クラスターの絞り込みキーワードの群である。すなわち、番号として「1」が付された「フィニッシャー」、「ジョブセパレーター」、「内蔵フィニッシャー」および「DF」という絞り込みキーワードの群は、S155において生成された1つ目のクラスターの絞り込みキーワードの群である。番号として「2」が付された「サイドフィーダー」、「ペーパーフィーダー」および「PF」という絞り込みキーワードの群は、S155において生成された2つ目のクラスターの絞り込みキーワードの群である。番号として「3」が付された「トレイ」、「MPトレイ」、「右トレイ」および「多目的トレイ」という絞り込みキーワードの群は、S155において生成された3つ目のクラスターの絞り込みキーワードの群である。番号として「4」が付された「カセット」、「オプションカセット」、「カセット1」および「カセット4」という絞り込みキーワードの群は、S155において生成された4つ目のクラスターの絞り込みキーワードの群である。
FAQ検索チャットボットシステム20のメッセージ解析部25bは、絞り込みキーワード選択要求メッセージ243に対して番号で答えられた場合、チャットアプリケーション31を介して入力されたメッセージにおいて絞り込みキーワードが選択されたとS161において判断する。一方、FAQ検索チャットボットシステム20のメッセージ解析部25bは、絞り込みキーワード選択要求メッセージ243に対して「いいえ」で答えられた場合、チャットアプリケーション31を介して入力されたメッセージにおいて絞り込みキーワードが選択されなかったとS161において判断する。
図11に示す画面240では、絞り込みキーワード選択要求メッセージ243に対して、番号を示すメッセージ244が利用者からFAQ検索チャットボットシステム20に通知されている。
次いで、FAQ検索チャットボットシステム20の対話シナリオ部25cがS174の処理を実行することによって、Q&A選択要求メッセージ245がFAQ検索チャットボットシステム20から利用者に通知されている。
図11に示すQ&A選択要求メッセージ245においては、1〜3の番号が付されたQ&Aの質問が含まれている。
FAQ検索チャットボットシステム20のメッセージ解析部25bは、Q&A選択要求メッセージ245に対して番号で答えられた場合、チャットアプリケーション31を介して入力されたメッセージにおいてQ&Aが選択されたとS176において判断する。一方、FAQ検索チャットボットシステム20のメッセージ解析部25bは、Q&A選択要求メッセージ245に対して「いいえ」で答えられた場合、チャットアプリケーション31を介して入力されたメッセージにおいてQ&Aが選択されなかったとS176において判断する。
図11に示す画面240では、Q&A選択要求メッセージ245に対して、番号を示すメッセージ246が利用者からFAQ検索チャットボットシステム20に通知されている。
次いで、FAQ検索チャットボットシステム20の対話シナリオ部25cがS182の処理を実行することによって、Q&A提示メッセージ247がFAQ検索チャットボットシステム20から利用者に通知されている。
以上に説明したように、FAQ検索チャットボットシステム20は、問い合わせに応じたQ&Aの検索結果をクラスタリングした(S155)後、利用者にクラスターを選択させるためにクラスター毎の絞り込みキーワードを通知し(S159)、利用者によるクラスターの選択結果に応じて検索結果を絞り込む(S163およびS169)ので、検索結果の絞り込みを容易化することができる。
FAQ検索チャットボットシステム20は、絞り込みキーワードが通知されたいずれかのクラスターが選択された場合(S161でYES)に、選択されたクラスターの絞り込みキーワードの少なくとも1つをキーワードとして含むQ&A以外のQ&Aを検索結果から除外することによって、検索結果を絞り込む(S163)ので、利用者が検索結果の絞り込みに適切であると判断する絞り込みキーワードを通知することができた場合に、利用者が意図した検索結果になる絞り込みを行う可能性を向上することができる。
FAQ検索チャットボットシステム20は、絞り込みキーワードが通知されたいずれのクラスターも選択されなかった場合(S161でNO)に、少なくとも1つのクラスターの絞り込みキーワードの少なくとも1つをキーワードとして含むQ&Aを検索結果から除外することによって、検索結果を絞り込む(S169)ので、利用者が検索結果の絞り込みに適切であると判断する絞り込みキーワードを通知することができなかった場合に、利用者が意図した検索結果にならない絞り込みを行う可能性を低減することができる。
一般的なFAQ検索チャットボットシステムには、シナリオ型と、一問一答型とが存在する。ここで、シナリオ型のFAQ検索チャットボットシステムは、シナリオの作成のコストが高いという問題がある。また、一問一答型のFAQ検索チャットボットシステムは、問い合わせに応じてQ&Aを一度で特定するので、利用者が期待するQ&Aを通知することができない場合があるという問題がある。しかしながら、FAQ検索チャットボットシステム20は、問い合わせに応じたQ&Aの検索結果をクラスタリングした後、利用者にクラスターを選択させるためにクラスター毎の絞り込みキーワードを通知し、利用者によるクラスターの選択結果に応じて検索結果を絞り込むので、シナリオを作成する必要もない。また、FAQ検索チャットボットシステム20は、問い合わせに応じたQ&Aの検索結果をクラスタリングした後、利用者にクラスターを選択させるためにクラスター毎の絞り込みキーワードを通知し、利用者によるクラスターの選択結果に応じて検索結果を絞り込むので、問い合わせに応じてQ&Aを一度で特定しないために、利用者が期待するQ&Aを通知することができる可能性が高い。
FAQ検索チャットボットシステム20は、本実施の形態において図9に示す動作によってキーワード一致スコアを取得するが、図9に示す動作以外の動作によってキーワード一致スコアを取得しても良い。例えば、FAQ検索チャットボットシステム20は、図12に示す動作によってキーワード一致スコアを取得しても良い。
図12は、キーワード一致スコアを取得する場合のFAQ検索チャットボットシステム20の動作の、図9に示す例とは異なる一例を示すフローチャートである。
図12に示すように、検索機能部25eは、対象のQ&Aのキーワードのそれぞれの重要度をtf−idfに基づいて設定する(S261)。すなわち、検索機能部25eは、対象のQ&Aにおける出現回数が多く、他のQ&Aにおける出現回数が少ないキーワードの重要度が高くなるように、対象のQ&Aのキーワードのそれぞれの重要度を設定する。
検索機能部25eは、S261の処理の後、対象のQ&Aのキーワードの重要度の合計としての全キーワード重要度合計を取得する(S262)。例えば、対象のQ&Aのキーワードが「ソータ」、「オプション」および「紙詰まり」の3つであって、「ソータ」、「オプション」、「紙詰まり」の重要度がS261においてそれぞれ「0.5」、「0.2」、「0.1」と設定された場合に、検索機能部25eは、S262において「0.8」を取得する。
検索機能部25eは、S262の処理の後、対象のQ&Aのキーワードのうち、問い合わせキーワードリストに含まれるキーワードのいずれかと一致するものの重要度の合計としての一致キーワード重要度合計を取得する(S263)。例えば、対象のQ&Aのキーワードが「ソータ」、「オプション」および「紙詰まり」の3つであって、「ソータ」、「オプション」、「紙詰まり」の重要度がS261においてそれぞれ「0.5」、「0.2」、「0.1」と設定された場合に、問い合わせキーワードリストに「オプション」および「紙詰まり」が含まれ、「ソータ」が含まれないとき、検索機能部25eは、S202において「0.3」を取得する。
検索機能部25eは、S263の処理の後、S263において取得した一致キーワード重要度合計を、S262において取得した全キーワード重要度合計で割ることによって、キーワード一致スコアを取得して(S264)、図12に示す動作を終了する。例えば、S263において取得した一致キーワード重要度合計が「0.3」であって、S262において取得した全キーワード重要度合計が「0.8」である場合、検索機能部25eは、S264において「0.38」をキーワード一致スコアとして取得する。
FAQ検索チャットボットシステム20は、本実施の形態において初期の候補の抽出(S149)にキーワード一致スコアを使用していないが、初期の候補の抽出にキーワード一致スコアを使用しても良い。例えば、FAQ検索チャットボットシステム20は、S149〜S152の処理に代えて、図13に示すS281〜S285の処理を実行しても良い。
図13は、図6〜図8に示す動作の一部の変形例を示すフローチャートである。
図13に示すように、検索機能部25eは、S148の処理の後、S144において抽出された、問い合わせのキーワードを示す問い合わせキーワードリストを生成する(S281)。
次いで、検索機能部25eは、問い合わせキーワードリストに含まれるキーワードと、Q&Aのキーワードとの一致度を示すキーワード一致スコアを、FAQデータベース24bにおけるQ&A毎に取得する(S282)。
次いで、検索機能部25eは、FAQデータベース24bにおけるQ&Aのそれぞれに、S282において取得したキーワード一致スコアを付与する(S283)。
次いで、検索機能部25eは、S148において付与した類似度スコアと、S283において付与したキーワード一致スコアとの調和平均をQ&A毎に求める(S284)。
次いで、検索機能部25eは、S284において求めた調和平均が特定の値以上のQ&Aを、利用者に回答するQ&Aの候補として抽出して(S285)、S153の処理を実行する。
問い合わせの文書ベクトルは、問い合わせのキーワードと比較して問い合わせの特徴を高精度に表している。同様に、Q&Aの文書ベクトルは、Q&Aのキーワードと比較してQ&Aの特徴を高精度に表している。そして、類似度スコアは、問い合わせの文書ベクトルと、Q&Aの文書ベクトルとの類似度を示しているので、問い合わせのキーワードと、Q&Aのキーワードとの類似度の一致度を示すキーワード一致スコアと比較して、問い合わせと、Q&Aとの類似の程度を高精度に表している。FAQ検索チャットボットシステム20は、利用者に提示するQ&Aを抽出する場合に、類似度スコア(S153)をキーワード一致スコア(S154およびS167)より重視するので、問い合わせに関連性が高いQ&Aを利用者に提示することができる。なお、FAQ検索チャットボットシステム20は、利用者に提示するQ&Aを抽出する場合に、キーワード一致スコアを類似度スコアより重視しても良い。
FAQ検索チャットボットシステム20は、本実施の形態において利用者に提示するQ&Aを抽出する場合に類似度スコア(S153)と、キーワード一致スコア(S154およびS167)とを別々に使用しているが、上述の調和平均を使用しても良い。例えば、FAQ検索チャットボットシステム20は、S153〜S154およびS170〜S171の処理に代えて、図14に示すS301〜S302の処理を実行しても良い。
図14は、図6〜図8に示す動作の、図13に示す部分とは異なる一部の変形例を示すフローチャートである。
図14に示すように、検索機能部25eは、S152の処理の後、現在の候補のうち、類似度スコアと、キーワード一致スコアとの調和平均が特定の閾値以上のQ&Aが存在するか否かを判断する(S301)。
検索機能部25eは、調和平均が特定の閾値以上のQ&Aが存在しないとS301において判断すると、S155の処理を実行する。
検索機能部25eは、調和平均が特定の閾値以上のQ&Aが存在するとS301において判断すると、調和平均が特定の閾値以上のQ&A、すなわち、問い合わせに類似するQ&Aを検索結果として対話シナリオ部25cに返す(S302)。
そして、対話シナリオ部25cは、S302の処理の後、S172の処理を実行する。
同様に、FAQ検索チャットボットシステム20は、S167およびS171の処理に代えて、図14に示すS301〜S302の処理を実行しても良い。すなわち、検索機能部25eは、S166の処理の後、S301の処理を実行する。そして、検索機能部25eは、調和平均が特定の閾値以上のQ&Aが存在しないとS301において判断すると、S155の処理を実行する。一方、検索機能部25eは、調和平均が特定の閾値以上のQ&Aが存在するとS301において判断すると、S302の処理を実行する。そして、対話シナリオ部25cは、S302の処理の後、S172の処理を実行する。
FAQ検索チャットボットシステム20は、検索結果をクラスタリングした後、各クラスターのキーワードを提示することによって、利用者にクラスターを選択させるので、検索結果を利用者に容易に絞り込ませることができる。したがって、FAQ検索チャットボットシステム20は、多数の検索結果を羅列して表示することに向いていないUI(User Interface)で実現されるチャットを利用するシステムであるにもかかわらず、利用者によるFAQの検索を容易化することができる。
なお、本実施の形態においては、チャットボットシステムによってFAQを検索している。しかしながら、本発明は、例えば、画面が小さいために多数の検索結果を羅列して表示することに向いていないスマートフォンなどのモバイル機器におけるFAQの検索や、音声で回答するために多数の検索結果を回答することに向いていない音声アシスタントによるFAQの検索においても効果的である。
FAQ検索チャットボットシステム20は、本実施の形態において1台のコンピューターによって構成されているが、複数台のコンピューターによって構成されても良い。
(第2の実施の形態)
第1の実施の形態においては、FAQ検索チャットボットシステムについて説明している。しかしながら、本発明の文書検索システムは、FAQの検索に限られない。本発明の第2の実施の形態として、文書を検索する文書検索チャットボットシステムについて説明する。
本実施の形態に係る文書検索チャットボットシステムの構成は、第1の実施の形態に係るFAQ検索チャットボットシステムがFAQに代えて文書を検索するように変更された構成と同様である。本実施の形態に係る文書検索チャットボットシステムは、FAQデータベース24b(図3参照。)の代わりに、図15に示す文書データベース424bを備えている。
図15は、本実施の形態に係る文書検索チャットボットシステムが備える文書データベース424bの一例を示す図である。
図15に示すように、文書データベース424bは、名前および内容を備えた文書と、文書に付されたタグなどの属性情報と、文書の文書ベクトルと、文書のキーワードとを文書毎に格納している。例えば、属性情報としては、文書に付与されているプロパティーなどが考えられる。
なお、図15に示す文書データベース424bは、文書の内容、属性情報および文書ベクトルの具体的な内容を省略して描かれている。
文書検索チャットボットシステムは、文書の文書ベクトルを、その文書の名前、内容および属性情報の少なくとも1つに基づいて取得しても良い。同様に、文書検索チャットボットシステムは、文書のキーワードを、その文書の名前、内容および属性情報の少なくとも1つに基づいて取得しても良い。
図16は、本実施の形態に係る文書検索チャットボットシステムに利用者によって文書の検索用の言葉が入力される場合のチャットアプリケーションの画面440の一例を示す図である。
図16に示す画面440では、まず、利用者に文書の検索用の言葉の入力を要求するメッセージ441が文書検索チャットボットシステムから利用者に通知されている。
次いで、文書の検索用の言葉を示すメッセージ442が利用者から文書検索チャットボットシステムに通知されている。
次いで、絞り込みキーワード選択要求メッセージ443が文書検索チャットボットシステムから利用者に通知されている。
図16に示す絞り込みキーワード選択要求メッセージ443においては、1〜3の番号が付された絞り込みキーワードの群が存在する。各群は、現在の候補に対して文書ベクトルに基づいてクラスタリングが実行された各クラスターの絞り込みキーワードの群である。すなわち、番号として「1」が付された「社外」および「商材」という絞り込みキーワードの群は、1つ目のクラスターの絞り込みキーワードの群である。番号として「2」が付された「社内」、「稟議」および「企画」という絞り込みキーワードの群は、2つ目のクラスターの絞り込みキーワードの群である。番号として「3」が付された「資料集」という絞り込みキーワードの群は、3つ目のクラスターの絞り込みキーワードの群である。
図16に示す画面440では、絞り込みキーワード選択要求メッセージ443に対して、番号を示すメッセージ444が利用者から文書検索チャットボットシステムに通知されている。
次いで、検索用の言葉に類似する複数の文書からの1つの文書の選択を利用者に要求するためのメッセージ(以下「文書選択要求メッセージ」という。)445が文書検索チャットボットシステムから利用者に通知されている。図16に示す文書選択要求メッセージ445においては、1〜3の番号が付された文書の名前が含まれている。
以上に説明したように、本実施の形態に係る文書検索チャットボットシステムは、検索結果をクラスタリングした後、各クラスターのキーワードを提示することによって、利用者にクラスターを選択させるので、検索結果を利用者に容易に絞り込ませることができる。したがって、本実施の形態に係る文書検索チャットボットシステムは、多数の検索結果を羅列して表示することに向いていないUIで実現されるチャットを利用するシステムであるにもかかわらず、利用者による文書の検索を容易化することができる。
なお、本実施の形態においては、チャットボットシステムによって文書を検索している。しかしながら、本発明は、例えば、画面が小さいために多数の検索結果を羅列して表示することに向いていないスマートフォンなどのモバイル機器における文書の検索や、音声で回答するために多数の検索結果を回答することに向いていない音声アシスタントによる文書の検索においても効果的である。
(第3の実施の形態)
上述の各実施の形態においては、チャットボットシステム、モバイル機器および音声アシスタントにおける検索について説明している。しかしながら、本発明の文書検索システムは、これらの検索以外の検索にも適用されることが可能である。本発明の第3の実施の形態として、文書を管理する文書管理システムに文書検索システムが適用された例について説明する。
図17は、本実施の形態に係る文書管理システムの検索画面500の一例を示す図である。
図17に示す検索画面500は、文書の検索用の言葉としてのキーワードが入力されるキーワード入力欄501と、絞り込みキーワードの選択を利用者に要求するためのボタン502a〜502eと、現在の候補を表示するための検索結果表示領域503とを備えている。
図17に示す例では、キーワード入力欄501には、キーワードとして、「5月」が入力されている。
ボタン502a〜502eは、それぞれ、現在の候補に対して文書ベクトルに基づいてクラスタリングが実行されたクラスターが対応している。ボタン502a〜502eには、各クラスターの絞り込みキーワードが表示されている。ボタン502a〜502eのいずれかが押されることによって、検索結果表示領域503に表示されている検索結果が絞り込まれる。
検索結果表示領域503には、現在の候補の文書が表示されている。例えば、図17に示す例では、「出張経費 5月」という名前の文書と、「物品注文書 5月」という名前の文書と、「ノートPC見積書 5月」という名前の文書とが表示されている。検索結果表示領域503には、文書毎に、名前と、内容の一部とが表示される。なお、文書の内容うち、検索結果表示領域503に表示される部分は、図17に示す例では、全て「サンプルテキスト」となっている。しかしながら、実際には、文書の内容うち、検索結果表示領域503に表示される部分は、キーワード入力欄501に入力されたキーワードを含む部分である。
20 FAQ検索チャットボットシステム(文書検索システム)
24a FAQ検索チャットボット用プログラム(文書検索プログラム)
25a ボット対話システム(結果通知部)
25d 文書検索システム(文書検索部)
242 メッセージ(検索用の言葉を示すメッセージ)
243 絞り込みキーワード選択要求メッセージ(特徴語を示すメッセージ)
245 Q&A選択要求メッセージ(絞り込まれた検索結果を示すメッセージ)
442 メッセージ(検索用の言葉を示すメッセージ)
443 絞り込みキーワード選択要求メッセージ(特徴語を示すメッセージ)
445 文書選択要求メッセージ(絞り込まれた検索結果を示すメッセージ)
501 キーワード入力欄(検索用の言葉の入力欄)
502a〜502e ボタン(特徴語を示すボタン)
503 検索結果表示領域(検索結果の表示領域)

Claims (4)

  1. 検索用の言葉に応じて文書を検索する文書検索部と、
    前記文書検索部による検索結果を通知する結果通知部と
    を備え、
    前記文書検索部は、前記検索結果をクラスタリングした後、クラスター毎の特徴語を抽出し、
    前記結果通知部は、利用者に前記クラスターを選択させるために前記クラスター毎の前記特徴語を通知し、
    前記文書検索部は、利用者による前記クラスターの選択結果に応じて前記検索結果を絞り込むことを特徴とする文書検索システム。
  2. 前記文書検索部は、前記特徴語が通知されたいずれかの前記クラスターが選択されたことが前記選択結果である場合に、選択された前記クラスターの前記特徴語の少なくとも1つをキーワードとして含む前記文書以外の前記文書を前記検索結果から除外することによって、前記検索結果を絞り込むことを特徴とする請求項1に記載の文書検索システム。
  3. 前記文書検索部は、前記特徴語が通知されたいずれの前記クラスターも選択されなかったことが前記選択結果である場合に、少なくとも1つの前記クラスターの前記特徴語の少なくとも1つをキーワードとして含む前記文書を前記検索結果から除外することによって、前記検索結果を絞り込むことを特徴とする請求項1または請求項2に記載の文書検索システム。
  4. 検索用の言葉に応じて文書を検索する文書検索部と、
    前記文書検索部による検索結果を通知する結果通知部と
    をコンピューターに実現させ、
    前記文書検索部は、前記検索結果をクラスタリングした後、クラスター毎の特徴語を抽出し、
    前記結果通知部は、利用者に前記クラスターを選択させるために前記クラスター毎の前記特徴語を通知し、
    前記文書検索部は、利用者による前記クラスターの選択結果に応じて前記検索結果を絞り込むことを特徴とする文書検索プログラム。
JP2019176650A 2019-09-27 2019-09-27 文書検索システムおよび文書検索プログラム Pending JP2021056581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019176650A JP2021056581A (ja) 2019-09-27 2019-09-27 文書検索システムおよび文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019176650A JP2021056581A (ja) 2019-09-27 2019-09-27 文書検索システムおよび文書検索プログラム

Publications (1)

Publication Number Publication Date
JP2021056581A true JP2021056581A (ja) 2021-04-08

Family

ID=75270718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019176650A Pending JP2021056581A (ja) 2019-09-27 2019-09-27 文書検索システムおよび文書検索プログラム

Country Status (1)

Country Link
JP (1) JP2021056581A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7558910B2 (ja) 2021-09-07 2024-10-01 株式会社東芝 検索システム及び検索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7558910B2 (ja) 2021-09-07 2024-10-01 株式会社東芝 検索システム及び検索方法

Similar Documents

Publication Publication Date Title
US20180373788A1 (en) Contrastive multilingual business intelligence
US20170357725A1 (en) Ranking content items provided as search results by a search application
US20170103439A1 (en) Searching Evidence to Recommend Organizations
Topaz et al. NimbleMiner: an open-source nursing-sensitive natural language processing system based on word embedding
US11023503B2 (en) Suggesting text in an electronic document
US11182540B2 (en) Passively suggesting text in an electronic document
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
JP2006073012A (ja) 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
US20120046937A1 (en) Semantic classification of variable data campaign information
JP2017134787A (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
US20170242851A1 (en) Non-transitory computer readable medium, information search apparatus, and information search method
Dalton et al. Local and global query expansion for hierarchical complex topics
JP2021056581A (ja) 文書検索システムおよび文書検索プログラム
US11720626B1 (en) Image keywords
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置
US20120047128A1 (en) Open class noun classification
JP2022136506A (ja) 検索システム、検索方法、及びプログラム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
US20180349358A1 (en) Non-transitory computer-readable storage medium, information processing device, and information generation method
JP6797618B2 (ja) 検索装置、検索方法、プログラムおよび検索システム
JP7314089B2 (ja) 検索支援システム、及び検索支援方法
US10909127B2 (en) Method and server for ranking documents on a SERP
JP7234078B2 (ja) 検索支援システム、学習システム、検索支援方法、及びプログラム
US20230043549A1 (en) Information processing system
JP6887002B2 (ja) 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム