JP7041177B2 - 情報検索装置、情報検索方法、および情報検索プログラム - Google Patents

情報検索装置、情報検索方法、および情報検索プログラム Download PDF

Info

Publication number
JP7041177B2
JP7041177B2 JP2020005822A JP2020005822A JP7041177B2 JP 7041177 B2 JP7041177 B2 JP 7041177B2 JP 2020005822 A JP2020005822 A JP 2020005822A JP 2020005822 A JP2020005822 A JP 2020005822A JP 7041177 B2 JP7041177 B2 JP 7041177B2
Authority
JP
Japan
Prior art keywords
case
word
candidate word
information retrieval
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020005822A
Other languages
English (en)
Other versions
JP2021114070A (ja
Inventor
健太郎 千種
亨 霜鳥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020005822A priority Critical patent/JP7041177B2/ja
Publication of JP2021114070A publication Critical patent/JP2021114070A/ja
Application granted granted Critical
Publication of JP7041177B2 publication Critical patent/JP7041177B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報を検索する情報検索装置、情報検索方法、および情報検索プログラムに関する。
顧客からの問い合わせにリモートで回答するコールセンターでは、顧客とのやり取りや調査内容が記録され、その内容が分析され、過去事例として以後の顧客対応や製品開発などに活用される。それらの過去事例はシステムに保管されており、コールセンターの担当者が顧客から問い合わせを受けた際に類似の事例を検索して回答の参考にする。近年は顧客からの問い合わせに対してチャットボットや音声認識などの自動応答システムで回答する事例も増加している。
下記特許文献1の音声自動応答ヘルプデスクシステムでは、問合せ者からの問合せ内容に含まれるキーワードを基に該当する過去事例があるかを過去類似検索機能部が検索し、この検索により過去事例がヒットせずに問合せが解決しなかったと解決確認機能部が判別したとき、前記問合せ内容の中で過去事例を検索するために不足している情報を不足情報分析機能部が切り分け、該切り分けた不足情報を問合せ者から入手するための依頼文を応答内容組み立て機能部が組み立て、問合せ者に再問合せを行う。
特開2015-56069号公報
たとえば、チャットボットでは、問い合わせ文がメールや電話での問い合わせと比べて短いため、1回の問い合わせ文からは状況が判断できない可能性がある。状況が正しく把握できないと正確な回答ができないため、状況を把握するために対応者(人やシステム)が聞き返しをおこなう。聞き返しの一つとして問い合わせ者に選択肢を提示して最も近い選択肢を選択してもらい状況を掘り下げる方法がある。
この場合に適切な選択肢を提示できないと状況の掘り下げが進まず、状況の把握が困難になる。たとえば、類似する選択肢を提示した場合、やり取りが堂々巡りし、いつまでたっても状況が把握できない可能性がある。コールセンターでの対応であっても担当者は問い合わせに類似する過去事例を検索して、問い合わせ者に対して問い合わせを掘り下げる質問(聞き返し)をする。しかし、事例が詳細で長文であるほど何を聞き返しにするのかを判断するのが困難である。
問い合わせ文に含まれておらず、かつ、類似する過去事例に含まれているキーワードが、問い合わせ文の内容の掘り下げに利用できるキーワードであるが、単純に類似度が上位の事例から抽出すると同傾向のキーワードとなる可能性が高く、問い合わせの掘り下げには不適である。本発明は、問い合わせに対する適切な聞き返しを行うことを目的とする。
本願において開示される発明の一側面となる情報検索装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する情報検索装置であって、過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能であり、前記プロセッサは、前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、前記事例特定処理によって特定された新規事例の中から前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、を実行することを特徴とする。
本発明の代表的な実施の形態によれば、問い合わせに対する適切な聞き返しを行うことができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
図1は、実施例1にかかる情報検索装置のハードウェア構成例を示すブロック図である。 図2は、実施例1にかかる事例管理テーブルの一例を示す説明図である。 図3は、実施例1にかかるクラスタ管理テーブルの一例を示す説明図である。 図4は、実施例1にかかる情報処理装置による情報検索処理手順例を示すフローチャートである。 図5は、実施例1にかかる特徴語抽出処理(ステップS402)の詳細な処理手順例を示すフローチャートである。 図6は、特徴語抽出処理(ステップS402)の具体例を示す説明図である。 図7は、実施例1にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。 図8は、ステップS701の具体例を示す説明図である。 図9は、実施例1にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。 図10は、実施例1にかかる候補語リストの一例を示す説明図である。 図11は、事例特定処理(ステップS702)の具体例1を示す説明図である。 図12は、事例特定処理(ステップS702)の具体例2を示す説明図である。 図13は、実施例1にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。 図14は、候補語抽出処理(ステップS703)の具体例を示す説明図である。 図15は、聞き返し文作成処理(ステップS404)の詳細な処理手順例を示すフローチャートである。 図16は、聞き返し文作成処理(ステップS404)の具体例を示す説明図である。 図17は、問い合わせ文の出力例1を示す説明図である。 図18は、問い合わせ文の出力例2を示す説明図である。 図19は、実施例2にかかる検索履歴管理テーブルの一例を示す説明図である。 図20は、実施例2にかかる候補語リストの一例を示す説明図である。 図21は、実施例2にかかる情報処理装置による情報検索処理手順例を示すフローチャートである。 図22は、実施例2にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。 図23は、一時特徴語リストの作成例を示す説明図である。 図24は、検索履歴テーブルおよび一時特徴語リストの利用例1を示す説明図である。 図25は、検索履歴テーブルおよび一時特徴語リストの利用例2を示す説明図である。 図26は、実施例2にかかる選択語記録処理(ステップS2005)の詳細な処理手順例を示すフローチャートである。 図27は、特徴語リストの追加例を示す説明図である。 図28は、選択特徴語グループのスコアの加算例を示す説明図である。 図29は、選択特徴語グループの検索履歴管理テーブルへの登録例を示す説明図である。 図30は、実施例3にかかる検索履歴管理テーブルの一例を示す説明図である。 図31は、実施例3にかかる選択語記録処理(ステップS2005)の詳細な処理手順例を示すフローチャートである。 図32は、実施例4にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。 図33は、選択履歴検索処理(ステップS3200)の詳細な処理手順例を示すフローチャートである。 図34は、選択履歴検索処理(ステップS3200)の具体例を示す説明図である。 図35は、実施例5にかかるクラスタ管理テーブルの一例を示す説明図である。 図36は、実施例5にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。 図37は、実施例5にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。 図38は、実施例6にかかる事例管理テーブルの一例を示す説明図である。
以下、添付図面を用いて情報検索装置について説明する。本明細書では、例として、情報検索装置は、たとえば、コールセンターで用いられ、問い合わせを受け付けると、データベースを検索して、聞き返し文や回答を出力するコンピュータとする。問い合わせとは、顧客からコールセンターに寄せられた質問や障害情報である。最初に寄せられる質問だけでなく、一連の対応の中で寄せられる質問に関連するシステムログなどの情報や、追加の質問なども問い合わせに含まれる。
問い合わせ文とは、問い合わせの内容が記載された電子文書である。聞き返し文とは、問い合わせ者からの問い合わせの背景や意図を掘り下げるために、問い合わせを受けた側が逆に尋ねる文章である。なお、問い合わせに対する聞き返し文や回答を出力するコンピュータであれば、コールセンターでの利用に限定されない。
<情報検索装置のハードウェア構成例>
図1は、実施例1にかかる情報検索装置のハードウェア構成例を示すブロック図である。情報検索装置100は、プロセッサ101と、記憶デバイス102と、入力デバイス103と、出力デバイス104と、通信インターフェース(通信IF)105と、を有する。プロセッサ101、記憶デバイス102、入力デバイス103、出力デバイス104、および通信IF105は、バス106により接続される。プロセッサ101は、情報検索装置100を制御する。記憶デバイス102は、プロセッサ101の作業エリアとなる。また、記憶デバイス102は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス102としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス103は、データを入力する。入力デバイス103としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス104は、データを出力する。出力デバイス104としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信IF105は、ネットワークと接続し、データを送受信する。
<テーブル>
つぎに、情報検索装置100がアクセス可能なテーブルについて、図2および図3を用いて説明する。
図2は、実施例1にかかる事例管理テーブルの一例を示す説明図である。事例管理テーブル200は、事例を管理する情報(事例管理情報)である。事例とは、過去にあった問い合わせやその後の回答までのやり取りを含む案件である。実施例1では、事例は、少なくとも問い合わせを含んでいればよい。事例管理テーブル200は、事例ID201と、特徴語202と、を対応付けた事例管理情報である。
事例ID201とは、事例を一意に特定する識別情報である。事例ID201は、たとえば、1以上の整数から昇順に採番されるため、事例ID201の数字が小さいほど古い事例となる。事例とは、過去の問い合わせ案件である。具体的には、たとえば、事例とは、顧客からコールセンターに来た問い合わせ単位で、最初のコンタクトからその問題の解決までをひとまとまりにした情報である。
特徴語202とは、対応する事例ID201で特定される事例(問い合わせ文だけでもよい)に含まれる語句のうち、特徴的な語句である。特徴語202は、たとえば、問い合わせ文を形態素解析することにより抽出された名詞や動詞、助動詞、形容詞、形容動詞など特定の品詞の単語でもよい。また、当該事例(問い合わせ文だけでもよい)で抽出された単語のうち、単語のスコアがしきい値以上、または、上位X(Xは1以上の整数)番目までの単語を特徴語202としてもよい。
この場合のスコアとは、たとえば、TF(Term Frequency)値でもよく、TF-IDF(Term Frequency-Inverse Document Frequency)値でもよい。IDF値は、当該事例と他の事例とを用いて算出される。特徴語202の語尾のカッコ数字は、スコアである。なお、スコアは、他の統計的なスコアでもよく、また、統計的なスコアではなく、人が設定した値でもよい。
図3は、実施例1にかかるクラスタ管理テーブルの一例を示す説明図である。クラスタ管理テーブル300は、クラスタを管理する情報(クラスタ管理情報)である。クラスタとは、類似する事例の集合である。クラスタ管理テーブル300は、クラスタ番号301と、所属事例ID302と、を対応付けたクラスタ管理情報である。
クラスタ番号301とは、クラスタを一意に特定する番号である。所属事例ID302とは、対応するクラスタ番号301で特定されるクラスタに所属する事例の事例ID201である。所属事例ID302で特定される事例群は、類似する事例群である。たとえば、事例Aを構成する特徴語群を規定するベクトルVAと事例B,C,D,…を構成する特徴語群を規定するベクトルVB,VC,VD,…との各コサイン類似度が所定のしきい値以上であれば、事例A,B,C,D,…は、同一クラスタに所属する類似事例となる。なお、所属事例ID302は、人によって設定されてもよい。
事例管理テーブル200およびクラスタ管理テーブル300はそれぞれ、図1に示した記憶デバイス102に記憶されていてもよく、通信IF105を介して通信可能な他のコンピュータの記憶デバイス102に記憶されていてもよい。
<情報検索処理手順例>
図4は、実施例1にかかる情報検索装置100による情報検索処理手順例を示すフローチャートである。情報検索装置100は、問い合わせ文を取得し(ステップS401)、特徴語抽出処理(ステップS402)、聞き返し候補語作成処理(ステップS403)および聞き返し文作成処理(ステップS404)を実行する。ステップS401~S404の処理は、具体的には、たとえば、プロセッサ101が、記憶デバイス102に記憶されたプログラムを実行することにより実現される。
なお、特徴語抽出処理(ステップS402)の詳細は、図5および図6で後述する。聞き返し候補語作成処理(ステップS403)の詳細は、図7~図14で後述する。聞き返し文作成処理(ステップS404)の詳細は、図15~図18で後述する。
[特徴語抽出処理(ステップS402)]
図5は、実施例1にかかる特徴語抽出処理(ステップS402)の詳細な処理手順例を示すフローチャートである。図6は、特徴語抽出処理(ステップS402)の具体例を示す説明図である。図5の特徴語抽出処理(ステップS402)を、図6の具体例を用いて説明する。情報検索装置100は、ステップS401で取得した問い合わせ文601から特徴語202を抽出する(ステップS501)。
特徴語202の抽出は、たとえば、上述したように、形態素解析やTF-IDFを用いて実行される。ここでは、問い合わせ文601から、「パソコン」、「ディスプレイ」、「故障」、および「映らない」が特徴語202として抽出されたとする。つぎに、情報検索装置100は、抽出した特徴語202で特徴語リスト602を作成する(ステップS502)。
なお、ステップS501で特徴語202が抽出されると、情報検索装置100は、事例管理テーブル200に新規エントリを作成して、新規の事例ID201を採番し、抽出した特徴語202を当該エントリに記録してもよい。そして、情報検索装置100は、新規の事例が、たとえば、コサイン類似度を用いて、いずれかのクラスタに類似する場合には、当該新規の事例ID201をクラスタ管理テーブル300において類似するクラスタの所属事例ID302に追加してもよい。いずれのクラスタにも類似しない場合には、情報検索装置100は、クラスタ管理テーブル300に新規エントリを作成して、新規のクラスタ番号301を採番し、当該新規の事例ID201を所属事例ID302に記録してもよい。
[聞き返し候補語作成処理(ステップS403)]
図7は、実施例1にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。図8は、ステップS701の具体例を示す説明図である。情報検索装置100は、特徴語抽出処理(ステップS402)で得られた特徴語リストを用いて、問い合わせ文601と類似する類似事例を事例管理テーブル200から検索する(ステップS701)。ステップS701を、図8の具体例を用いて説明する。
具体的には、たとえば、情報検索装置100は、特徴語リスト602の全特徴語202と事例管理テーブル200における各事例ID201に対応する特徴語202との一致数により類似度スコア801を算出する。類似度スコア801は、特徴語リスト602の全特徴語202が、事例ID201に対応する特徴語202とどのくらい類似しているかを示す指標値である。
類似度スコア801が高いほど、特徴語リスト602の全特徴語202が、事例ID201に対応する特徴語202と類似する。特徴語リスト602の全特徴語202と各事例ID201に対応する特徴語202との一致数が多いほど高くなる。また、類似度スコア801は、特徴語リスト602の全特徴語202と各事例ID201に対応する特徴語202との不一致数が多いほど低くなってもよい。また、類似度スコア801の算出例はこれに限らず、たとえば、コサイン類似度を用いてもよい。
情報検索装置100は、検索対象となる事例管理テーブル200の事例ID201が所属するクラスタのクラスタ番号301を特定する。なお、情報検索装置100は、類似度スコア801が所定のしきい値以上の事例ID201についてのみ、クラスタ番号301を特定してもよい。そして、情報検索装置100は、事例ID201と、類似度スコア801と、クラスタ番号301と、を対応付けた類似事例検索結果800を出力する。
図7に戻り、情報検索装置100は、事例特定処理(ステップS702)と候補語抽出処理(ステップS703)とを実行する。事例特定処理(ステップS702)は、類似事例検索結果800を用いて、聞き返し候補語を含む事例を特定する処理である。聞き返し候補語(以下、単に「候補語」)とは、聞き返し時に提示する候補となる特徴語202である。事例特定処理(ステップS702)の詳細については、図9~図12で後述する。
候補語抽出処理(ステップS703)は、事例特定処理(ステップS702)によって特定された事例に含まれる特徴語202から候補語を抽出する処理である。候補語抽出処理(ステップS703)の詳細については、図13および図14で後述する。
情報検索装置100は、候補語抽出処理(ステップS703)によって抽出された候補語がn個(nは1以上の整数で任意に設定可能)であるか否かを判断する(ステップS704)。n個以上でない場合(ステップS704:No)、事例特定処理(ステップS702)に戻る。この場合、既に特定された事例ID201は、事例特定処理(ステップS702)の対象から除外される。一方、n個以上である場合(ステップS704:Yes)、情報検索装置100は、聞き返し候補語作成処理(ステップS403)を終了し、聞き返し文作成処理(ステップS404)に移行する。
[事例特定処理(ステップS702)]
図9は、実施例1にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。図10は、実施例1にかかる候補語リストの一例を示す説明図である。候補語リスト1000とは、候補語1002の一覧情報である。初期状態では、候補語リスト1000には一件も候補語1002はない。候補語リスト1000は、候補語抽出処理(ステップS703)で作成される。
候補語リスト1000は、候補語No.1001と、候補語1002と、特定事例ID1003と、所属先クラスタ番号1004と、を対応付けた情報である。候補語No.1001は、候補語1002を一意に特定する識別番号である。候補語1002は、上述したように聞き返し時に提示する候補となる特徴語202である。特定事例ID1003は、事例特定処理(ステップS702)によって特定された事例ID201である。所属先クラスタ番号1004は、特定事例ID1003で特定される事例の所属先となるクラスタのクラスタ番号301である。
図9において、情報検索装置100は、候補語リスト1000から候補語No.1001が最大の特定事例ID1003を取得する(ステップS901)。候補語リスト1000に一件も候補語1002がない場合、特定事例ID1003を取得しないまま、ステップS902に移行する。ステップS901の実行時の候補語リスト1000が図10の状態だとすると、情報検索装置100は、候補語リスト1000から候補語No.1001が最大である「2」の特定事例ID1003である「100」を取得する。
情報検索装置100は、ステップS901で取得された特定事例ID1003に次いで類似度スコア801が高い事例ID201を類似事例検索結果800から取得する(ステップS902)。ステップS901で取得された特定事例ID1003が「100」の場合、情報検索装置100は、類似度スコア801が「8」に次いで高い事例ID201を類似事例検索結果800から取得する。候補語リスト1000には一件も候補語1002はない場合、情報検索装置100は、類似度スコア801が最高値の事例ID201を類似事例検索結果800から取得する。ステップS902以降の処理を、図11を用いて具体的に説明する。
図11は、事例特定処理(ステップS702)の具体例1を示す説明図である。図11では、たとえば、事例ID201:10に次いで類似度スコア801が高い事例ID201を、「139」とする。
図9において、情報検索装置100は、ステップS902で取得された該当事例ID201のクラスタ番号301を類似事例検索結果800から取得する(ステップS903)。具体的には、たとえば、図11において、情報検索装置100は、類似事例検索結果800の事例ID201が「139」のエントリのクラスタ番号301である「1」を取得する。
つぎに、情報検索装置100は、ステップS903で取得されたクラスタ番号301が、候補語リスト1000に存在するクラスタ番号301であるか否かを判断する(ステップS904)。候補語リスト1000に存在するクラスタ番号301であれば(ステップS904:Yes)、ステップS905に移行し、候補語リスト1000に存在しないクラスタ番号301であれば(ステップS904:No)、ステップS906に移行する。
具体的には、たとえば、図11において取得されたクラスタ番号301は「1」である。「1」は、候補語リスト1000の候補語No.1001が「1」のエントリの所属先クラスタ番号1004と一致する。したがって、「1」は候補語リスト1000に存在するクラスタ番号301であるため、ステップS905に移行する。
図9において、ステップS904:Yesの場合、情報検索装置100は、類似度スコア801が次に高い事例ID201を類似事例検索結果800から取得して(ステップS905)、ステップS903に戻る。この場合、たとえば、類似度スコア801が「8」である事例ID201:360が取得されたものとする。ステップS903に戻されてからの処理を、図12を用いて具体的に説明する。
図12は、事例特定処理(ステップS702)の具体例2を示す説明図である。図12では、ステップS905で類似度スコア801が「85」である事例ID201:360が取得されると、情報検索装置100は、当該事例ID201:360のクラスタ番号301を類似事例検索結果800から取得する(ステップS903)。具体的には、たとえば、図12において、情報検索装置100は、類似事例検索結果800の事例ID201が「360」のエントリのクラスタ番号301である「5」を取得する。
つぎに、情報検索装置100は、ステップS903で取得されたクラスタ番号301:が、候補語リスト1000に存在する所属先クラスタ番号1004であるか否かを判断する(ステップS904)。クラスタ番号301:は、図10に示した候補語リスト1000の所属先クラスタ番号1004として存在しない(ステップS904:No)。したがって、情報検索装置100は、事例ID201:360聞き返し候補語を含む事例として特定する(ステップS906)。これにより、情報検索装置100は、事例特定処理(ステップS702)を終了し、候補語抽出処理(ステップS703)に移行する。
[候補語抽出処理(ステップS703)]
図13は、実施例1にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。図14は、候補語抽出処理(ステップS703)の具体例を示す説明図である。図13の候補語抽出処理(ステップS703)を、図14の具体例を用いて説明する。
情報検索装置100は、事例特定処理(ステップS702)によって特定された事例ID201に対応する特徴語202を、事例管理テーブル200から抽出する(ステップS1301)。事例ID201:360が特定された事例ID201だとすると、情報検索装置100は、事例ID201が360のエントリの特徴語202を抽出する。
つぎに、情報検索装置100は、ステップS1301で抽出した特徴語202の中から、特徴語リスト602には存在しない特徴語202を候補語1002として抽出する(ステップS1302)。具体的には、たとえば、特徴語リスト602の特徴語202は、「パソコン」、「故障」、「ディスプレイ」、および「映らない」である。ステップS1301で抽出した事例ID201が360の特徴語202は、「故障」、「PC-1000」、「映らない」、および「接続」である。このうち、特徴語リスト602に存在しない特徴語202に、「PC-1000」がある。情報検索装置100は、「PC-1000」を候補語1002として抽出する。
なお、候補語1002として抽出する特徴語202は、1個以上であればよい。また、候補語1002となる特徴語202が複数存在する場合、情報検索装置100は、当該特徴語202に関連付けられているスコアがしきい値以上または上位x(xは1以上の整数)番目までのスコアの特徴語202を候補語1002として抽出してもよい。
情報検索装置100は、ステップS1302で抽出した候補語1002が既出の候補語1002と異なるか否かを判断する(ステップS1303)。ステップS1302で抽出した候補語1002が既出の候補語1002と同一である場合(ステップS1303:No)、ステップS1302に戻り、候補語1002を再抽出する(ステップS1302)。
一方、ステップS1302で抽出した候補語1002が既出の候補語1002と異なる場合(ステップS1303:Yes)、情報検索装置100は、当該候補語1002を候補語リスト1000に追加する(ステップS1304)。上記の例では、特徴語202である「PC-1000」が候補語1002として抽出されたため、情報検索装置100は、候補語リスト1000に新規エントリを作成し、候補語No.1001に新規の番号「3」を採番し、候補語1002として「PC-1000」を記録し、特定事例ID1003に「360」を記録し、所属先クラスタ番号1004に、事例ID201:360の事例が所属するクラスタのクラスタ番号301である「」を記録する。このように、情報検索装置100は、異なるクラスタに属する類似する過去事例から問い合わせ文601に不足している特徴語202を抽出することができる。
[聞き返し文作成処理(ステップS404)]
図15は、聞き返し文作成処理(ステップS404)の詳細な処理手順例を示すフローチャートである。図16は、聞き返し文作成処理(ステップS404)の具体例を示す説明図である。図15の聞き返し文作成処理(ステップS404)を、図16の具体例を用いて説明する。
情報検索装置100は、記憶デバイス102から導入文1601を取得し(ステップS1501)、また、候補語抽出処理(ステップS703)によって抽出された候補語1002を記録した候補語リスト1000を取得する(ステップS1502)。そして、情報検索装置100は、導入文1601と候補語リスト1000の候補語1002とを結合して、聞き返し文1602を作成する(ステップS1503)。聞き返し文1602は、出力デバイス104から出力される。
出力デバイス104がディスプレイであれば、聞き返し文1602が当該ディスプレイに表示される。出力デバイス104がプリンタであれば、聞き返し文1602が印刷出力される。出力デバイス104がスピーカであれば、聞き返し文1602が読み上げられる。また、聞き返し文1602は、通信IF105から送信されてもよい。この場合、通信IF105に接続された他のコンピュータの出力デバイス104から聞き返し文1602が出力される。
図17は、問い合わせ文601の出力例1を示す説明図である。図17は、情報検索装置100がチャットボットである場合の聞き返し文1602の表示例である。チャット画面1700において、吹き出し1701は、問い合わせ者から入力された問い合わせ文601であり、吹き出し1702は、問い合わせ文601に対応する聞き返し文1602である。
図18は、問い合わせ文601の出力例2を示す説明図である。図17は、問い合わせ者が直接チャットボットに問い合わせをして聞き返し文1602を受けている状況を示した。これに対し、図18は、問い合わせ者からの問い合わせを受けたコールセンターの受付担当者が、このようなチャットボットを利用して問い合わせ者への回答の検討に利用している状況を示す。コールセンターの受付担当者は、システム画面1800において、問い合わせ欄1801に問い合わせ文601を入力し、検索ボタン1802をクリックすると、情報検索装置100は、システム画面1800下部のキーワード表示領域1803に、掘り下げのためのキーワードを出力する。
このように、実施例1によれば、情報検索装置100は、過去事例の中から問い合わせ文601の内容を掘り下げるために利用できるキーワードを抽出し、特に問い合わせ文601の内容を掘り下げるためにできるだけ傾向が異なるキーワードを抽出する。これにより、入力された問い合わせに対して適切な聞き返しをおこなうことができる。すなわち、選択肢が重ならないように聞き返しの提示することで状況を把握するまでの問い合わせ者とのやり取りの回数の低減化を図ることができる。
図19~図29を用いて、実施例2について説明する。実施例2は、情報検索装置100が検索履歴を利用する例である。検索履歴を利用することにより、適切な候補語1002がより効率的に聞き返し文1602に出現するようになる。実施例1と同一構成には同一符号を付し、その説明を省略する。
図19は、実施例2にかかる検索履歴管理テーブルの一例を示す説明図である。検索履歴管理テーブル1900は、検索履歴を管理するテーブルである。検索履歴管理テーブル1900は、図1に示した記憶デバイス102に記憶されていてもよく、通信IF105を介して通信可能な他のコンピュータの記憶デバイス102に記憶されていてもよい。
検索履歴管理テーブル1900は、選択特徴語グループ1901とスコア1902とを対応付けた対応情報である。選択特徴語グループ1901とは、1以上の選択特徴語を含む集合である。選択特徴語とは、情報検索装置100による検索履歴となる特徴語202である。選択特徴語は、たとえば、過去の事例(問い合わせ文601)を構成する特徴語202を含む。また、選択特徴語は、過去の聞き返し文1602を構成する候補語1002を含んでもよい。特に、選択特徴語は、過去の聞き返し文1602からユーザによって選択された候補語1002を含んでもよい。
スコア1902は、選択特徴語の検索され易さ(ヒットし易さ)を示す指標値である。スコア1902の値が大きいほど、その選択特徴語は、問い合わせ文601の特徴語202に対してヒットしやすいことを示す。選択特徴語が設定された時のスコア1902の初期値は「1」であり、その後、後述の処理により増加する。
図20は、実施例2にかかる候補語リスト1000の一例を示す説明図である。図10との相違点は、図20の候補語リスト1000はスコア2005を有する点である。スコア2005は、その候補語1002が聞き返し文1602に組み込まれる特徴語202としての相応しさを示す指標値である。スコア2005が高いほど、聞き返し文1602に適切な特徴語202と言える。
スコア2005の初期値は0でもよく、また、たとえば、当該候補語1002が最初に登録された時に当該候補語1002を含む事例の比較対象となった特徴語リスト602の全特徴語202との類似度スコア801としてもよい。この場合、スコア2005は、候補語1002を含む特定事例ID1003の事例が、特徴語リスト602の全特徴語202と類似するほど高くなる。スコア2005は、その後、後述の処理により、候補語1002が選択特徴語グループ1901に含まれるほど高くなる。
<情報検索処理手順例>
図21は、実施例2にかかる情報検索装置100による情報検索処理手順例を示すフローチャートである。情報検索装置100は、問い合わせ文601を取得し(ステップS401)、特徴語抽出処理(ステップS402)、聞き返し候補語作成処理(ステップS403)聞き返し文1602作成処理(ステップS404)および選択語記録処理(ステップS2105)を実行する。選択語記録処理(ステップS2105)は、具体的には、たとえば、プロセッサ101が、記憶デバイス102に記憶されたプログラムを実行することにより実現される。なお、特徴語抽出処理(ステップS402)は実施例1と相違点があるため、その詳細は、図22~図25で後述する。また、選択語記録処理(ステップS2005)の詳細は、図26~図29で後述する。
[候補語抽出処理(ステップS703)]
図22は、実施例2にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。図23は、一時特徴語リストの作成例を示す説明図である。図24は、検索履歴テーブルおよび一時特徴語リストの利用例1を示す説明図である。図25は、検索履歴テーブルおよび一時特徴語リストの利用例2を示す説明図である。図22の特徴語抽出処理(ステップS402)を、図23~図25の具体例を用いて説明する。
ステップS1304の実行後、情報検索装置100は、一時特徴語リスト2300を作成する(ステップS2205)。具体的には、たとえば、図23に示したように、情報検索装置100は、特徴語リスト602と候補語リスト1000の候補語1002とを結合することにより、一時特徴語リスト2300を作成する。
つぎに、情報検索装置100は、候補語1002のスコア2005を、選択特徴語グループ1901のスコア1902に基づいて補正する(ステップS2206)。具体的には、たとえば、図24に示したように、情報検索装置100は、一時特徴語リスト2300の全特徴語202と選択特徴語グループ1901の各々とが完全一致するか判断する。図24の例では、一時特徴語リスト2300の全特徴語202に完全一致する選択特徴語グループ1901は存在しない。
図25の例では、一時特徴語リスト2500の全特徴語202に完全一致する選択特徴語グループ1901は存在する。この場合、情報検索装置100は、一時特徴語リスト2500のうち候補語リスト1000に存在する候補語1002である「DP-2810」のスコア2005の値「80」に、一時特徴語リスト2500に一致した選択特徴語グループ1901のスコア1902の値「3」を加算する。これにより、候補語1002である「DP-2810」のスコア2005の値は「83」になる。スコア2005の値が大きい候補語1002ほど、聞き返し文1602において上位に表示される。
[選択語記録処理(ステップS205)]
図26は、実施例2にかかる選択語記録処理(ステップS205)の詳細な処理手順例を示すフローチャートである。図26の選択語記録処理(ステップS205)を、図27~図29の具体例を用いて説明する。図26において、情報検索装置100は、情報検索装置100のユーザによって聞き返し文1602から選択された候補語1002を取得し(ステップS2601)、取得した候補語1002を特徴語リスト602に追加する(ステップS2602)。
図27は、特徴語リスト602の追加例を示す説明図である。図27では、聞き返し文1602から「PC-1000」が選択されたとする。この場合、情報検索装置100は、選択された候補語1002の「PC-1000」を特徴語リスト602に追加する。
図26に戻り、情報検索装置100は、ステップS2602での追加後の特徴語リスト602の全特徴語202が検索履歴管理テーブル1900の選択特徴語グループ1901の各々と完全一致するか否かを判断する(ステップS2603)。完全一致する場合(ステップS2603:Yes)、情報検索装置100は、完全一致した選択特徴語グループ1901のスコア1902の値に「1」加算する(ステップS2604)。なお、加算値は、「1」に限定されず、「1」以上であればよい。
図28は、選択特徴語グループ1901のスコア1902の加算例を示す説明図である。図28では、追加後の特徴語リスト602の全特徴語202と完全一致した選択特徴語グループ1901のスコア1902の値「1」に「1」が加算されて、「2」になる。
図26に戻り、情報検索装置100は、いずれの選択特徴語グループ1901にも完全一致しなかった場合(ステップS2603:No)、追加後の特徴語リスト602を、新規の選択特徴語グループ1901として検索履歴管理テーブル1900に登録する(ステップS2605)。
図29は、選択特徴語グループ1901の検索履歴管理テーブル1900への登録例を示す説明図である。追加後の特徴語リスト2900は、検索履歴管理テーブル1900のいずれの選択特徴語グループ1901にも完全一致しない。したがって、情報検索装置100は、追加後の特徴語リスト2900を検索履歴管理テーブル1900に登録する。この場合のスコア1902は、初期値の「1」に設定される。
このように、実施例2によれば、ユーザ選択による追加後の一時特徴語リスト2300に出現するような特徴語202で構成される選択特徴語グループ1901であるほど、スコア1902が高くなり、そのような選択特徴語グループ1901に存在する候補語1002であるほど、スコア2005が高くなる。したがって、情報検索装置100のユーザに選択される候補語1002ほどスコア2005が高くなって、聞き返し文1602に出現しやすくなる。
これにより、情報検索装置100は、問い合わせの入力が増加するほど、入力された問い合わせに対して適切な聞き返しを効率的におこなうことができ、選択肢が重ならないように聞き返しの提示することで状況を把握するまでの問い合わせ者とのやり取りの回数のさらなる低減化を図ることができる。
図30および図31を用いて、実施例3について説明する。実施例3は、実施例2の検索履歴管理テーブル1900に、時刻情報を追加した例である。時刻情報を追加することにより、候補語1002の新鮮度を加味することができるようになる。実施例1および実施例2と同一構成には同一符号を付し、その説明を省略する。
図30は、実施例3にかかる検索履歴管理テーブル1900の一例を示す説明図である。実施例3の検索履歴管理テーブル1900は、選択特徴語グループ1901およびスコア1902に、選択語の選択日時3000を対応付けた情報である。選択語とは、聞き返し文1602からユーザによって選択された候補語1002である。選択語の選択日時3000は、ステップS2601での選択された候補語1002の選択日時を示すタイムスタンプである。
[選択語記録処理(ステップS205)]
図31は、実施例3にかかる選択語記録処理(ステップS205)の詳細な処理手順例を示すフローチャートである。ステップS2603:Yesの場合、完全一致した選択特徴語グループ1901の選択語の選択日時3000は、現在時刻を基準にして直近所定期間(たとえば、1週間)以内であるか否かを判断する(ステップS3104)。直近所定期間以内に取得された選択語は、直近所定期間よりも前に取得された選択語よりも新鮮度が高い。新鮮度の高さは、スコア1902に加算する値の大きさで表現される。
直近所定期間以内でない場合(ステップS3104:No)、情報検索装置100は、そのスコア1902の値にA(Aは1以上の整数値。たとえば、A=1)を加算する(ステップS3105)。一方、直近所定期間以内である場合(ステップS3104:Yes)、情報検索装置100は、そのスコア1902の値にB(BはAよりも大きい整数値。たとえば、B=2)を加算する(ステップS3106)。
このように、実施例3によれば、情報検索装置100のユーザに選択される候補語1002(選択語)が新鮮であるほどスコア1902の値が高くなるため、スコア2005も高くなって、直近でよく検索されている特徴語202ほど聞き返し文1602に出現しやすくなる。
これにより、情報検索装置100は、問い合わせの入力が増加し、選択語の新鮮度が高いほど、入力された問い合わせに対して適切な聞き返しを効率的におこなうことができ、選択肢が重ならないように聞き返しの提示することで状況を把握するまでの問い合わせ者とのやり取りの回数のさらなる低減化を図ることができる。
図32~図34を用いて、実施例4について説明する。実施例4は、実施例1~実施例3の聞き返し候補語作成処理(ステップS403)の冒頭に、選択履歴検索処理(ステップS3200)を追加した例である。選択履歴検索処理(ステップS3200)を追加することにより、事例特定処理(ステップS702)および候補語抽出処理(ステップS703)に先立って候補語リスト1000に候補語1002を追加することができ、ユーザの選択肢の増加を図る。実施例1~実施例3と同一構成には同一符号を付し、その説明を省略する。
[聞き返し候補語作成処理(ステップS403)]
図32は、実施例4にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。情報検索装置100は、類似事例の検索(ステップS701)に先立って、選択履歴検索処理(ステップS3200)を実行する。つぎに、選択履歴検索処理(ステップS3200)によって追加された特徴語202がn個以上であるか否かを判断する(ステップS3201)。
追加された特徴語202がn個以上でない場合(ステップS3201:No)、ステップS701に移行する。一方、n個以上である場合(ステップS3201:Yes)、情報検索装置100は、聞き返し候補語作成処理(ステップS403)を終了し、聞き返し文作成処理(ステップS404)に移行する。
図33は、選択履歴検索処理(ステップS3200)の詳細な処理手順例を示すフローチャートである。図34は、選択履歴検索処理(ステップS3200)の具体例を示す説明図である。選択履歴検索処理(ステップS3200)を、図34の具体例を用いて説明する。
情報検索装置100は、特徴語リスト602で検索履歴管理テーブル1900を検索する(ステップS3301)。具体的には、たとえば、情報検索装置100は、特徴語リスト602の全特徴語202(パソコン、ディスプレイ、故障、映らない)を包含する選択特徴語グループ1901を検索する。図34の場合、{パソコン、ディスプレイ、故障、映らない、PC-1000}の選択特徴語グループ1901が検索される。特徴語リスト602の全特徴語202(パソコン、ディスプレイ、故障、映らない)を包含する選択特徴語グループ1901が検索された場合(ステップS3302:Yes)、ステップS3303に移行し、検索されなかった場合(ステップS3302:No)、図32のステップS3201に移行する。
ステップS3302:Yesの場合、情報検索装置100は、検索された選択特徴語グループ1901のうち、特徴語リスト602に存在しない特徴語202を候補語1002として取得して、候補語リスト1000に追加して(ステップS3303)、ステップS3302に戻る。図34の場合、「PC-1000」が候補語1002として候補語リスト1000に追加される。
このように、実施例4によれば、選択履歴検索処理(ステップS3200)によってn個以上の候補語1002が得られれば、類似事例検索(ステップS701)、事例特定処理(ステップS702)および候補語抽出処理(ステップS703)の実行が不要となるため、候補語1002の検索処理の高速化を図ることができる。
図35~図37を用いて、実施例5について説明する。実施例5は、実施例1~実施例4のクラスタ管理テーブル300に、事例管理テーブル200の特徴語202を追加した例である。クラスタ管理テーブル300に特徴語202を追加することにより、事例ではなくクラスタから候補語1002を抽出することができ、候補語1002の抽出数の増加を図ることができる。実施例1~実施例4と同一構成には同一符号を付し、その説明を省略する。
図35は、実施例5にかかるクラスタ管理テーブル300の一例を示す説明図である。実施例5のクラスタ管理テーブル300は、クラスタ番号301および所属事例ID302に、特徴語3500を対応付けた情報である。特徴語3500は、その所属事例ID302の特徴語202の集合である。情報検索装置100は、事例管理テーブル200の特徴語202を事例ID201ごとに取得して、クラスタ単位で、クラスタ管理テーブル300に特徴語3500として格納する。
[事例特定処理(ステップS702)]
図36は、実施例5にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。実施例1との相違点は、ステップS406がステップS3606に変更された点である。ステップS904:Noのあと、情報検索装置100は、事例ID201ではなく、候補語リスト1000に存在するクラスタ番号301を特定する(ステップS3606)。
[候補語抽出処理(ステップS703)]
図37は、実施例5にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。実施例1との相違点は、情報検索装置100は、事例特定処理(ステップS702)によって特定されたクラスタ番号301に対応する特徴語3500を、クラスタ管理テーブル300から抽出する(ステップS3701)点である。
これにより、情報検索装置100は、特定されたクラスタ内の全事例の特徴語202を抽出することになるため、1つの事例から特徴語202を抽出する場合に比べて、特徴語202の抽出数が増加する。したがって、候補語1002の抽出数の増加を図ることができ、ユーザの選択肢が増加する。
図38を用いて、実施例6について説明する。実施例6は、実施例1~実施例5の事例管理テーブル200に格納されている特徴語202の各々に、アノテーションが付与された例である。アノテーションとは、その特徴語202の属性を示す情報である。アノテーションを利用することにより、特定のアノテーションに限定した検索(ステップS701)が可能となる。実施例1~実施例4と同一構成には同一符号を付し、その説明を省略する。
図38は、実施例6にかかる事例管理テーブル200の一例を示す説明図である。特徴語202とそのスコアとの間の[]内の文字列がアノテーションである。アノテーションには、品詞を適用することができる。情報検索装置100は、問い合わせ文601を形態素解析する際に単語ごとの品詞を取得することができる。そして、情報検索装置100は、当該単語を特徴語202として事例管理テーブル200に登録する際、その品詞をアノテーションとして登録する。
また、情報検索装置100は、たとえば、人の操作入力により、特徴語202に個別にアノテーションを付与することができる。たとえば、[現象]、[機種名]といったアノテーションは、ユーザからの操作入力により付与されたアノテーションである。
情報検索装置100は、聞き返し候補語作成処理(ステップS403)において類似事例を検索する際(ステップS701)、たとえば、問い合わせ者またはコールセンターの受付担当者からのアノテーションの指定があれば、指定されたアノテーションの特徴語202に限定して、類似事例を検索する。
これにより、類似事例検索結果800は、指定されたアノテーションを含む特徴語202で構成された事例となる。したがって、候補語リスト1000に登録される候補語1002も、指定されたアノテーションが付与された特徴語202となる。このように、特徴語202にアノテーションを付与することにより、アノテーションが共通する候補語1002を聞き返し文1602として出力することができる。
なお、上述した実施例1~実施例6では、情報検索装置100は、完全一致により単語どうしを比較したが、単語には同義語が存在する。したがって、情報検索装置100は、同義語も検索でヒットさせるために、同義語辞書にアクセス可能としてもよい。同義語辞書は、見出し語と同義語とを対応付けた情報である。
情報検索装置100は、問い合わせ文601の形態素解析により得られた単語が同義語に該当すれば、対応する見出し語に変換する。これにより、情報検索装置100は、見出し語に変換された単語で類似事例検索(ステップS701)を実行することができる。これにより、情報検索装置100は、候補語1002の表記揺れを吸収して、聞き返し文1602を出力することができる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサ101がそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
100 情報検索装置
101 プロセッサ
102 記憶デバイス
104 出力デバイス
200 事例管理テーブル
202 特徴語
300 クラスタ管理テーブル
601 問い合わせ文
602 特徴語リスト
800 類似事例検索結果
801 類似度スコア
1000 候補語リスト
1002 候補語
1602 聞き返し文

Claims (13)

  1. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する情報検索装置であって、
    過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能であり、
    前記プロセッサは、
    前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
    前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
    前記事例特定処理によって特定された新規事例の中から前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
    前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
    を実行することを特徴とする情報検索装置。
  2. 請求項1に記載の情報検索装置であって、
    記事例特定処理では、前記プロセッサは、前記類似事例が所属するクラスタが前記所属先クラスタに該当しなくなるまで、前記類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定する、
    ことを特徴とする情報検索装置。
  3. 請求項1に記載の情報検索装置であって、
    前記プロセッサは、
    前記候補語抽出処理によって得られた前記聞き返し候補語を含む聞き返し文を作成する聞き返し文作成処理と、を実行し、
    前記出力処理では、前記プロセッサは、前記聞き返し文作成処理によって作成された聞き返し文を出力する、
    ことを特徴とする情報検索装置。
  4. 請求項1に記載の情報検索装置であって、
    前記候補語リスト前記聞き返し候補語は、前記聞き返し候補語としての適切さを示す第1スコアを有し、
    前記出力処理では、前記プロセッサは、前記第1スコアにしたがって前記聞き返し候補を出力する、
    ことを特徴とする情報検索装置。
  5. 請求項4に記載の情報検索装置であって、
    前記事例を構成する前記第1特徴語の集合である選択特徴語グループと前記選択特徴語グループの検索され易さを示す第2スコアとを対応付けた検索履歴情報にアクセス可能であり、
    前記候補語抽出処理では、前記プロセッサは、前記問い合わせ文を構成するすべての前記第2特徴語が前記選択特徴語グループと一致した場合、当該一致した選択特徴語グループの前記第2スコアを用いて、前記第2特徴語に一致する聞き返し候補語の前記第1スコアを補正し、
    前記出力処理では、前記プロセッサは、補正後の前記第1スコアにしたがって前記聞き返し候補を出力する、
    ことを特徴とする情報検索装置。
  6. 請求項5に記載の情報検索装置であって、
    前記プロセッサは、
    前記出力処理によって出力された聞き返し候補語から選択された聞き返し候補語を、前記第2特徴語に追加し、前記選択された聞き返し候補語が追加された追加後の第2特徴語に一致する選択特徴語グループが存在しない場合、当該追加後の第2特徴語を前記選択特徴語グループとして前記検索履歴情報に登録する登録処理、
    を実行することを特徴とする情報検索装置。
  7. 請求項に記載の情報検索装置であって、
    前記登録処理では、前記プロセッサは、前記追加後の第2特徴語に一致する選択特徴語グループが存在する場合、当該一致する選択特徴語グループの前記第2スコアを補正する、
    ことを特徴とする情報検索装置。
  8. 請求項7に記載の情報検索装置であって、
    前記検索履歴情報は、過去の聞き返し候補語である特定の選択特徴語グループと、その第2スコアと、ユーザによって前記過去の聞き返し候補語から選択された聞き返し候補語の選択日時と、を対応付けた特定の選択特徴語グループを有し、
    前記登録処理では、前記プロセッサは、前記追加後の第2特徴語に一致する前記特定の選択特徴語グループが存在する場合、当該一致する前記特定の選択特徴語グループの前記第2スコアを、前記選択日時に基づいて補正する、
    ことを特徴とする情報検索装置。
  9. 請求項1に記載の情報検索装置であって、
    前記事例を構成する前記第1特徴語の集合である選択特徴語グループと前記選択特徴語グループの検索され易さを示す第2スコアとを対応付けた検索履歴情報にアクセス可能であり、
    前記プロセッサは、
    前記第2特徴語が前記選択特徴語グループに包含された場合、前記第2特徴語を包含した前記選択特徴語グループのうち前記第2特徴語を除いた他の第1特徴語を、前記聞き返し候補語として前記候補語リスト追加する選択履歴検索処理を実行し、
    前記出力処理では、前記プロセッサは、前記選択履歴検索処理によって前記候補語リストに追加された聞き返し候補語を出力する、
    ことを特徴とする情報検索装置。
  10. 請求項9に記載の情報検索装置であって、
    前記プロセッサは、
    前記選択履歴検索処理によって追加された前記他の第1特徴語の数が所定数以上でない場合、前記類似例検索処理、前記事例特定処理、および前記候補語抽出処理を実行する、
    ことを特徴とする情報検索装置。
  11. 請求項1に記載の情報検索装置であって、
    前記事例管理情報は、前記第1特徴語に当該第1特徴語の属性情報が付与されており、
    前記類似事例検索処理では、前記プロセッサは、前記事例管理情報から、前記属性情報に基づいて、前記類似事例を検索する、
    ことを特徴とする情報検索装置。
  12. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する情報検索装置が実行する情報検索方法であって、
    前記情報検索装置は、過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能であり、
    前記プロセッサは、
    前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
    前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
    前記事例特定処理によって特定された新規事例の中から前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
    前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
    を実行することを特徴とする情報検索方法。
  13. 過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能なプロセッサに、
    前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
    前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
    前記事例特定処理によって特定された新規事例の中から前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
    前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
    を実行させるための情報検索プログラム。
JP2020005822A 2020-01-17 2020-01-17 情報検索装置、情報検索方法、および情報検索プログラム Active JP7041177B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020005822A JP7041177B2 (ja) 2020-01-17 2020-01-17 情報検索装置、情報検索方法、および情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020005822A JP7041177B2 (ja) 2020-01-17 2020-01-17 情報検索装置、情報検索方法、および情報検索プログラム

Publications (2)

Publication Number Publication Date
JP2021114070A JP2021114070A (ja) 2021-08-05
JP7041177B2 true JP7041177B2 (ja) 2022-03-23

Family

ID=77077024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020005822A Active JP7041177B2 (ja) 2020-01-17 2020-01-17 情報検索装置、情報検索方法、および情報検索プログラム

Country Status (1)

Country Link
JP (1) JP7041177B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101860066B1 (ko) * 2016-10-06 2018-05-24 주식회사 미로 공기청정기

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015036945A (ja) 2013-08-15 2015-02-23 株式会社インテリジェントウェイブ 質問回答制御プログラム、質問回答制御サーバ及び質問回答制御方法
WO2019202787A1 (ja) 2018-04-17 2019-10-24 株式会社Nttドコモ 対話システム
WO2019202788A1 (ja) 2018-04-16 2019-10-24 株式会社Nttドコモ 対話システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015036945A (ja) 2013-08-15 2015-02-23 株式会社インテリジェントウェイブ 質問回答制御プログラム、質問回答制御サーバ及び質問回答制御方法
WO2019202788A1 (ja) 2018-04-16 2019-10-24 株式会社Nttドコモ 対話システム
WO2019202787A1 (ja) 2018-04-17 2019-10-24 株式会社Nttドコモ 対話システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101860066B1 (ko) * 2016-10-06 2018-05-24 주식회사 미로 공기청정기

Also Published As

Publication number Publication date
JP2021114070A (ja) 2021-08-05

Similar Documents

Publication Publication Date Title
JP6284643B2 (ja) 非構造化テキストにおける特徴の曖昧性除去方法
US7533089B2 (en) Hybrid approach for query recommendation in conversation systems
US7343371B2 (en) Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus
US8595245B2 (en) Reference resolution for text enrichment and normalization in mining mixed data
US20150379018A1 (en) Computer-generated sentiment-based knowledge base
US11481417B2 (en) Generation and utilization of vector indexes for data processing systems and methods
US20070208732A1 (en) Telephonic information retrieval systems and methods
JP2021507350A (ja) 複雑な回答の補強証拠取り出し
CN112699303A (zh) 一种基于5g消息的医疗信息智能推送系统和方法
TWI735380B (zh) 自然語言處理方法與其計算裝置
US11455357B2 (en) Data processing systems and methods
Lommatzsch et al. An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases.
JPWO2016178337A1 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
JP7041177B2 (ja) 情報検索装置、情報検索方法、および情報検索プログラム
JP2009163358A (ja) 情報処理装置、情報処理方法、プログラムおよび音声チャットシステム
CN115062135B (zh) 一种专利筛选方法与电子设备
van Schooten et al. Handling speech input in the Ritel QA dialogue system
JP5078164B2 (ja) 関連用語取得装置、関連用語取得方法、及びプログラム
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
Lacatusu et al. Lite-gistexter at duc2004
Iswarya et al. Speech and text query based Tamil-English Cross Language Information Retrieval system
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
JP5138622B2 (ja) 情報処理装置及び不満抽出方法及びプログラム
KR101913344B1 (ko) 유사군 db를 이용한 임의명칭의 특정 국가용 후보명칭 추천 시스템 및 방법
Adafre et al. Fact discovery in Wikipedia

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220310

R150 Certificate of patent or registration of utility model

Ref document number: 7041177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150