JP7041177B2 - 情報検索装置、情報検索方法、および情報検索プログラム - Google Patents
情報検索装置、情報検索方法、および情報検索プログラム Download PDFInfo
- Publication number
- JP7041177B2 JP7041177B2 JP2020005822A JP2020005822A JP7041177B2 JP 7041177 B2 JP7041177 B2 JP 7041177B2 JP 2020005822 A JP2020005822 A JP 2020005822A JP 2020005822 A JP2020005822 A JP 2020005822A JP 7041177 B2 JP7041177 B2 JP 7041177B2
- Authority
- JP
- Japan
- Prior art keywords
- case
- word
- candidate word
- information retrieval
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施例1にかかる情報検索装置のハードウェア構成例を示すブロック図である。情報検索装置100は、プロセッサ101と、記憶デバイス102と、入力デバイス103と、出力デバイス104と、通信インターフェース(通信IF)105と、を有する。プロセッサ101、記憶デバイス102、入力デバイス103、出力デバイス104、および通信IF105は、バス106により接続される。プロセッサ101は、情報検索装置100を制御する。記憶デバイス102は、プロセッサ101の作業エリアとなる。また、記憶デバイス102は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス102としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス103は、データを入力する。入力デバイス103としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス104は、データを出力する。出力デバイス104としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信IF105は、ネットワークと接続し、データを送受信する。
つぎに、情報検索装置100がアクセス可能なテーブルについて、図2および図3を用いて説明する。
図4は、実施例1にかかる情報検索装置100による情報検索処理手順例を示すフローチャートである。情報検索装置100は、問い合わせ文を取得し(ステップS401)、特徴語抽出処理(ステップS402)、聞き返し候補語作成処理(ステップS403)および聞き返し文作成処理(ステップS404)を実行する。ステップS401~S404の処理は、具体的には、たとえば、プロセッサ101が、記憶デバイス102に記憶されたプログラムを実行することにより実現される。
図5は、実施例1にかかる特徴語抽出処理(ステップS402)の詳細な処理手順例を示すフローチャートである。図6は、特徴語抽出処理(ステップS402)の具体例を示す説明図である。図5の特徴語抽出処理(ステップS402)を、図6の具体例を用いて説明する。情報検索装置100は、ステップS401で取得した問い合わせ文601から特徴語202を抽出する(ステップS501)。
図7は、実施例1にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。図8は、ステップS701の具体例を示す説明図である。情報検索装置100は、特徴語抽出処理(ステップS402)で得られた特徴語リストを用いて、問い合わせ文601と類似する類似事例を事例管理テーブル200から検索する(ステップS701)。ステップS701を、図8の具体例を用いて説明する。
図9は、実施例1にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。図10は、実施例1にかかる候補語リストの一例を示す説明図である。候補語リスト1000とは、候補語1002の一覧情報である。初期状態では、候補語リスト1000には一件も候補語1002はない。候補語リスト1000は、候補語抽出処理(ステップS703)で作成される。
図13は、実施例1にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。図14は、候補語抽出処理(ステップS703)の具体例を示す説明図である。図13の候補語抽出処理(ステップS703)を、図14の具体例を用いて説明する。
図15は、聞き返し文作成処理(ステップS404)の詳細な処理手順例を示すフローチャートである。図16は、聞き返し文作成処理(ステップS404)の具体例を示す説明図である。図15の聞き返し文作成処理(ステップS404)を、図16の具体例を用いて説明する。
図21は、実施例2にかかる情報検索装置100による情報検索処理手順例を示すフローチャートである。情報検索装置100は、問い合わせ文601を取得し(ステップS401)、特徴語抽出処理(ステップS402)、聞き返し候補語作成処理(ステップS403)聞き返し文1602作成処理(ステップS404)および選択語記録処理(ステップS2105)を実行する。選択語記録処理(ステップS2105)は、具体的には、たとえば、プロセッサ101が、記憶デバイス102に記憶されたプログラムを実行することにより実現される。なお、特徴語抽出処理(ステップS402)は実施例1と相違点があるため、その詳細は、図22~図25で後述する。また、選択語記録処理(ステップS2005)の詳細は、図26~図29で後述する。
図22は、実施例2にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。図23は、一時特徴語リストの作成例を示す説明図である。図24は、検索履歴テーブルおよび一時特徴語リストの利用例1を示す説明図である。図25は、検索履歴テーブルおよび一時特徴語リストの利用例2を示す説明図である。図22の特徴語抽出処理(ステップS402)を、図23~図25の具体例を用いて説明する。
図26は、実施例2にかかる選択語記録処理(ステップS2105)の詳細な処理手順例を示すフローチャートである。図26の選択語記録処理(ステップS2105)を、図27~図29の具体例を用いて説明する。図26において、情報検索装置100は、情報検索装置100のユーザによって聞き返し文1602から選択された候補語1002を取得し(ステップS2601)、取得した候補語1002を特徴語リスト602に追加する(ステップS2602)。
図31は、実施例3にかかる選択語記録処理(ステップS2105)の詳細な処理手順例を示すフローチャートである。ステップS2603:Yesの場合、完全一致した選択特徴語グループ1901の選択語の選択日時3000は、現在時刻を基準にして直近所定期間(たとえば、1週間)以内であるか否かを判断する(ステップS3104)。直近所定期間以内に取得された選択語は、直近所定期間よりも前に取得された選択語よりも新鮮度が高い。新鮮度の高さは、スコア1902に加算する値の大きさで表現される。
図32は、実施例4にかかる聞き返し候補語作成処理(ステップS403)の詳細な処理手順例を示すフローチャートである。情報検索装置100は、類似事例の検索(ステップS701)に先立って、選択履歴検索処理(ステップS3200)を実行する。つぎに、選択履歴検索処理(ステップS3200)によって追加された特徴語202がn個以上であるか否かを判断する(ステップS3201)。
図36は、実施例5にかかる事例特定処理(ステップS702)の詳細な処理手順例を示すフローチャートである。実施例1との相違点は、ステップS406がステップS3606に変更された点である。ステップS904:Noのあと、情報検索装置100は、事例ID201ではなく、候補語リスト1000に存在するクラスタ番号301を特定する(ステップS3606)。
図37は、実施例5にかかる候補語抽出処理(ステップS703)の詳細な処理手順例を示すフローチャートである。実施例1との相違点は、情報検索装置100は、事例特定処理(ステップS702)によって特定されたクラスタ番号301に対応する特徴語3500を、クラスタ管理テーブル300から抽出する(ステップS3701)点である。
101 プロセッサ
102 記憶デバイス
104 出力デバイス
200 事例管理テーブル
202 特徴語
300 クラスタ管理テーブル
601 問い合わせ文
602 特徴語リスト
800 類似事例検索結果
801 類似度スコア
1000 候補語リスト
1002 候補語
1602 聞き返し文
Claims (13)
- プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する情報検索装置であって、
過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能であり、
前記プロセッサは、
前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
前記事例特定処理によって特定された新規事例の中から、前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語を前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
を実行することを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記事例特定処理では、前記プロセッサは、前記類似事例が所属するクラスタが前記所属先クラスタに該当しなくなるまで、前記類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定する、
ことを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記プロセッサは、
前記候補語抽出処理によって得られた前記聞き返し候補語を含む聞き返し文を作成する聞き返し文作成処理と、を実行し、
前記出力処理では、前記プロセッサは、前記聞き返し文作成処理によって作成された聞き返し文を出力する、
ことを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記候補語リストの前記聞き返し候補語は、前記聞き返し候補語としての適切さを示す第1スコアを有し、
前記出力処理では、前記プロセッサは、前記第1スコアにしたがって前記聞き返し候補語を出力する、
ことを特徴とする情報検索装置。 - 請求項4に記載の情報検索装置であって、
前記事例を構成する前記第1特徴語の集合である選択特徴語グループと前記選択特徴語グループの検索され易さを示す第2スコアとを対応付けた検索履歴情報にアクセス可能であり、
前記候補語抽出処理では、前記プロセッサは、前記問い合わせ文を構成するすべての前記第2特徴語が前記選択特徴語グループと一致した場合、当該一致した選択特徴語グループの前記第2スコアを用いて、前記第2特徴語に一致する聞き返し候補語の前記第1スコアを補正し、
前記出力処理では、前記プロセッサは、補正後の前記第1スコアにしたがって前記聞き返し候補語を出力する、
ことを特徴とする情報検索装置。 - 請求項5に記載の情報検索装置であって、
前記プロセッサは、
前記出力処理によって出力された聞き返し候補語から選択された聞き返し候補語を、前記第2特徴語に追加し、前記選択された聞き返し候補語が追加された追加後の第2特徴語に一致する選択特徴語グループが存在しない場合、当該追加後の第2特徴語を前記選択特徴語グループとして前記検索履歴情報に登録する登録処理、
を実行することを特徴とする情報検索装置。 - 請求項6に記載の情報検索装置であって、
前記登録処理では、前記プロセッサは、前記追加後の第2特徴語に一致する選択特徴語グループが存在する場合、当該一致する選択特徴語グループの前記第2スコアを補正する、
ことを特徴とする情報検索装置。 - 請求項7に記載の情報検索装置であって、
前記検索履歴情報は、過去の聞き返し候補語である特定の選択特徴語グループと、その第2スコアと、ユーザによって前記過去の聞き返し候補語から選択された聞き返し候補語の選択日時と、を対応付けた特定の選択特徴語グループを有し、
前記登録処理では、前記プロセッサは、前記追加後の第2特徴語に一致する前記特定の選択特徴語グループが存在する場合、当該一致する前記特定の選択特徴語グループの前記第2スコアを、前記選択日時に基づいて補正する、
ことを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記事例を構成する前記第1特徴語の集合である選択特徴語グループと前記選択特徴語グループの検索され易さを示す第2スコアとを対応付けた検索履歴情報にアクセス可能であり、
前記プロセッサは、
前記第2特徴語が前記選択特徴語グループに包含された場合、前記第2特徴語を包含した前記選択特徴語グループのうち前記第2特徴語を除いた他の第1特徴語を、前記聞き返し候補語として前記候補語リストに追加する選択履歴検索処理を実行し、
前記出力処理では、前記プロセッサは、前記選択履歴検索処理によって前記候補語リストに追加された聞き返し候補語を出力する、
ことを特徴とする情報検索装置。 - 請求項9に記載の情報検索装置であって、
前記プロセッサは、
前記選択履歴検索処理によって追加された前記他の第1特徴語の数が所定数以上でない場合、前記類似事例検索処理、前記事例特定処理、および前記候補語抽出処理を実行する、
ことを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置であって、
前記事例管理情報は、前記第1特徴語に当該第1特徴語の属性情報が付与されており、
前記類似事例検索処理では、前記プロセッサは、前記事例管理情報から、前記属性情報に基づいて、前記類似事例を検索する、
ことを特徴とする情報検索装置。 - プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する情報検索装置が実行する情報検索方法であって、
前記情報検索装置は、過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能であり、
前記プロセッサは、
前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
前記事例特定処理によって特定された新規事例の中から、前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語を前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
を実行することを特徴とする情報検索方法。 - 過去の問い合わせに関する事例ごとに前記事例を構成する第1特徴語を有する事例管理情報と、類似する前記事例が所属するクラスタを管理するクラスタ管理情報と、問い合わせ文に対する聞き返し候補語および当該聞き返し候補語の所属先クラスタの識別情報を管理する候補語リストと、にアクセス可能なプロセッサに、
前記事例管理情報から、前記問い合わせ文を構成する第2特徴語に類似する類似事例を検索するとともに、前記類似事例ごとに前記問い合わせ文との類似度を算出する類似事例検索処理と、
前記類似事例検索処理によって検索された類似事例の類似度が高い順に、前記類似事例および当該類似事例が所属するクラスタを特定し、当該特定したクラスタが前記候補語リストのいずれの所属先クラスタにも該当しなければ、前記類似事例を前記聞き返し候補語を含む新規事例として特定する事例特定処理と、
前記事例特定処理によって特定された新規事例の中から、前記第1特徴語であってかつ前記第2特徴語ではない第3特徴語を前記聞き返し候補語として抽出し、前記第3特徴語および当該第3特徴語の所属先クラスタの識別情報を前記候補語リストに追加する候補語抽出処理と、
前記候補語抽出処理によって前記候補語リストに追加された聞き返し候補語を出力する出力処理と、
を実行させるための情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005822A JP7041177B2 (ja) | 2020-01-17 | 2020-01-17 | 情報検索装置、情報検索方法、および情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005822A JP7041177B2 (ja) | 2020-01-17 | 2020-01-17 | 情報検索装置、情報検索方法、および情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021114070A JP2021114070A (ja) | 2021-08-05 |
JP7041177B2 true JP7041177B2 (ja) | 2022-03-23 |
Family
ID=77077024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020005822A Active JP7041177B2 (ja) | 2020-01-17 | 2020-01-17 | 情報検索装置、情報検索方法、および情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7041177B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101860066B1 (ko) * | 2016-10-06 | 2018-05-24 | 주식회사 미로 | 공기청정기 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015036945A (ja) | 2013-08-15 | 2015-02-23 | 株式会社インテリジェントウェイブ | 質問回答制御プログラム、質問回答制御サーバ及び質問回答制御方法 |
WO2019202787A1 (ja) | 2018-04-17 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
WO2019202788A1 (ja) | 2018-04-16 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
-
2020
- 2020-01-17 JP JP2020005822A patent/JP7041177B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015036945A (ja) | 2013-08-15 | 2015-02-23 | 株式会社インテリジェントウェイブ | 質問回答制御プログラム、質問回答制御サーバ及び質問回答制御方法 |
WO2019202788A1 (ja) | 2018-04-16 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
WO2019202787A1 (ja) | 2018-04-17 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101860066B1 (ko) * | 2016-10-06 | 2018-05-24 | 주식회사 미로 | 공기청정기 |
Also Published As
Publication number | Publication date |
---|---|
JP2021114070A (ja) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6284643B2 (ja) | 非構造化テキストにおける特徴の曖昧性除去方法 | |
US7533089B2 (en) | Hybrid approach for query recommendation in conversation systems | |
US7343371B2 (en) | Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus | |
US8595245B2 (en) | Reference resolution for text enrichment and normalization in mining mixed data | |
US20150379018A1 (en) | Computer-generated sentiment-based knowledge base | |
US11481417B2 (en) | Generation and utilization of vector indexes for data processing systems and methods | |
US20070208732A1 (en) | Telephonic information retrieval systems and methods | |
JP2021507350A (ja) | 複雑な回答の補強証拠取り出し | |
CN112699303A (zh) | 一种基于5g消息的医疗信息智能推送系统和方法 | |
TWI735380B (zh) | 自然語言處理方法與其計算裝置 | |
US11455357B2 (en) | Data processing systems and methods | |
Lommatzsch et al. | An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases. | |
JPWO2016178337A1 (ja) | 情報処理装置、情報処理方法及びコンピュータプログラム | |
JP7041177B2 (ja) | 情報検索装置、情報検索方法、および情報検索プログラム | |
JP2009163358A (ja) | 情報処理装置、情報処理方法、プログラムおよび音声チャットシステム | |
CN115062135B (zh) | 一种专利筛选方法与电子设备 | |
van Schooten et al. | Handling speech input in the Ritel QA dialogue system | |
JP5078164B2 (ja) | 関連用語取得装置、関連用語取得方法、及びプログラム | |
JP4057962B2 (ja) | 質問応答装置、質問応答方法及びプログラム | |
Lacatusu et al. | Lite-gistexter at duc2004 | |
Iswarya et al. | Speech and text query based Tamil-English Cross Language Information Retrieval system | |
JP2012243130A (ja) | 情報検索装置、方法、及びプログラム | |
JP5138622B2 (ja) | 情報処理装置及び不満抽出方法及びプログラム | |
KR101913344B1 (ko) | 유사군 db를 이용한 임의명칭의 특정 국가용 후보명칭 추천 시스템 및 방법 | |
Adafre et al. | Fact discovery in Wikipedia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200729 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7041177 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |