JPWO2015181962A1 - 検索方法及び装置並びに記憶媒体 - Google Patents

検索方法及び装置並びに記憶媒体 Download PDF

Info

Publication number
JPWO2015181962A1
JPWO2015181962A1 JP2016523067A JP2016523067A JPWO2015181962A1 JP WO2015181962 A1 JPWO2015181962 A1 JP WO2015181962A1 JP 2016523067 A JP2016523067 A JP 2016523067A JP 2016523067 A JP2016523067 A JP 2016523067A JP WO2015181962 A1 JPWO2015181962 A1 JP WO2015181962A1
Authority
JP
Japan
Prior art keywords
document
correspondence history
search
correspondence
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016523067A
Other languages
English (en)
Other versions
JP6216873B2 (ja
Inventor
千種 健太郎
健太郎 千種
土田 正士
正士 土田
幸生 中野
幸生 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2015181962A1 publication Critical patent/JPWO2015181962A1/ja
Application granted granted Critical
Publication of JP6216873B2 publication Critical patent/JP6216873B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を提案する。【解決手段】それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と問合せの内容が類似する対応履歴文書を検索する検索装置が、複数の対応履歴文書を内容に応じて複数のクラスタに分類し、クラスタごとに、当該クラスタの代表となる対応履歴文書を代表文書として抽出し、問合せ文と関連を有する対応履歴文書を検索し、当該検索により検出した対応履歴文書が属するクラスタの代表文書を検索結果として提示するようにした。

Description

本発明は検索方法及び装置並びに記憶媒体に関し、例えば、コールセンタなどにおいて顧客からの問合せに対する回答を作成するにあたり、過去の対応履歴文書の中からその問合せに類似する内容の対応履歴文書を検索する検索装置に適用して好適なものである。
顧客とのコンタクトを記録し、その内容を分析し、以後の顧客対応や製品開発などに活用する事例がある。このような事例自体は以前から存在するが、ビッグデータの活用例として、顧客と顧客から製品に対する問合せを受け付けるコールセンタとのやり取りをすべて記録した文書(問合せ/途中経過/最終回答を全て含むテキストであり、以下、これを対応履歴文書と呼ぶ)の分析及び活用が注目を浴びている。例えば、上記のようなコールセンタでは過去の対応履歴文書を、新たな問合せに対する適切な解決策を求める際に利用している。
特開2007−304793号公報
ところで、コールセンタ等の問題解決担当者は顧客からの新規の問合せに対する回答を作成するにあたり、過去の対応履歴文書から回答の参考となる類似の事例を探すために、まず、検索システム等でキーワード等を入力し、そのキーワードを含む過去の対応履歴文書を検索する。次に検索の結果の中から類似すると思われる過去の対応履歴文書の詳細を読む。そして、読んだ対応履歴文書が新規の問合せに対して有用かを判断するという履歴探索プロセスを実行している。
このうち検索プロセスではシステム等で過去の類似する対応履歴文書を検索し、この後の確認プロセス、選択プロセス及び判断プロセスでその検索結果から回答作成に有効な対応履歴文書があるかを見極める。見極めた結果、新規の問合せに対して参考になるような対応履歴文書が存在すればその対応履歴文書を参考に回答を作成するが、存在しない場合には、検索条件を変えるなどして、再度、上述の履歴探索プロセスを実行する。
顧客からの問合せに対して短時間で有効な回答を作成するためには、この履歴探索プロセスの実行回数を減らすことが望まれる。そして、履歴探索プロセスの実行回数を減らすためには、検索結果の回答の精度を上げることが求められる。
この場合において、かかる履歴探索プロセスの実行回数を減らすことを目的とした発明は従来から存在する。例えば、特許文献1では、問題解決担当者と顧客とのやり取りの内容からキーワードを機械的に抽出し、そのキーワードを含む過去の対応履歴文書を検索することで、問題解決担当者による検索プロセスを省略し、履歴探索プロセス自体を短くすることを目的としている。
しかしながら、このような従来技術によると、検索結果の回答の精度が問題解決担当者と顧客とのやり取りの内容の表現形態に依存することになる。すなわち、特許文献1に開示された技術によれば、抽出されたキーワードを含む文書を検索するため、問合せ内容に関連が深い過去履歴であっても、キーワードが一致又は類似していなければ検索の結果としてヒットせず、その結果、再度履歴探索プロセスを実行することになる。
本発明は以上の点を考慮してなされたもので、検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を提案しようとするものである。
かかる課題を解決するため本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において実行される検索方法であって、前記検索装置が、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第1のステップと、前記検索装置が、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第2のステップと、前記検索装置が、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第3のステップとを設けるようにした。
また本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する対応履歴文書分類部と、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する代表文書抽出部と、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する文書検索部とを設けるようにした。
さらに本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置に実行させるプログラムが格納された記憶媒体であって、前記検索装置に、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第1のステップと、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第2のステップと、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第3のステップとを備える処理を実行させるプログラムを格納するようにした。
本検索方法及び本検索装置と、本記憶媒体に格納されたプログラムとによれば、問合せ文と関連を有する対応履歴文書が属するクラスタの代表文書を提示するため、問合せ文における問合せ内容の表現形態等に依存することなく、問合せ文と関連が深い問合せ内容の対応履歴文書を提示することができる。
本発明によれば、検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を実現できる。
第1及び第2の実施の形態による検索装置の全体構成を示すブロック図である。 対応履歴文書の構成例を示す図である。 対応履歴文書の構成例を示す図である。 対応履歴文書の構成例を示す図である。 グラフの構成例を示す概念図である。 クラスタの説明に供する概念図である。 代表文書の説明に供する概念図である。 文書間関連情報の構成例を示す概念図である。 対応履歴文書間関連作成処理の処理手順を示すフローチャートである。 類似度スコア一覧の構成例を示す概念図である。 対応履歴文書検索処理の処理手順を示すフローチャートである。 検索文入力画面の構成例を示す略線図である。 第2の実施の形態による文書間関連情報を示す概念図である。 第2の実施の形態による対応履歴文書間関連作成処理の処理手順を示すフローチャートである。 第3の実施の形態による検索装置の全体構成を示すブロック図である。 参照履歴情報の構成例を示す概念図である。 第3の実施の形態による対応履歴文書間関連作成処理の処理手順を示すフローチャートである。 第3の実施の形態による対応履歴文書間関連作成処理の説明に供する図表である。 第3の実施の形態による対応履歴文書間関連作成処理の説明に供する図表である。 第3の実施の形態による対応履歴文書検索処理の処理手順を示すフローチャートである。 第4の実施の形態による検索装置の全体構成を示すブロック図である。 第4の実施の形態による対応履歴文書検索処理の処理手順を示すフローチャートである。 他の実施の形態の説明に供する概念図である。
以下図面について、本発明の一実施の形態を詳述する。
(1)第1の実施の形態
(1−1)本実施の形態による検索装置の構成
図1において、1は全体として本実施の形態による検索装置を示す。この検索装置1は、CPU(Central Processing Unit)2、メモリ3、記憶装置4、ネットワークインタフェース5、外部記憶媒体ドライブ6、入力装置7及び表示装置8を備えて構成され、これらが内部バス9を介して相互に接続されている。
CPU2は、検索装置1全体の動作制御を司るプロセッサである。またメモリ3は、例えば揮発性の半導体メモリから構成され、オペレーティングシステム(OS:Operating System)10を始めとする各種プログラムなどを保持するために利用される。後述の文書管理部11、文書間関連管理部12及び検索実行部13もこのメモリ3に格納されて保持される。またメモリ3は、CPU2のワークメモリとしても用いられる。このためメモリ3には、CPU2が各処理の実行時に利用するワークエリア14が設けられている。
記憶装置4は、例えばハードディスク装置やSSD(Solid State Drive)などから構成され、プログラムやデータを長期間保存するために利用される。本実施の形態の場合、記憶装置4には、過去のすべての対応履歴文書を含む対応履歴文書情報15と、後述する文書間関連情報16となどが格納される。
なお、本実施の形態における「対応履歴文書」とは、顧客からの問合せの内容を表す問合せ文とその問合せに対する回答とを含み、その一例として問合せ案件単位で下記の項目を記録した文書(テキスト)であり、以下の内容を含む。
1.問合せ(顧客からコールセンタのオペレータ等の担当者への連絡内容)
2.資料採取依頼(担当者から顧客への連絡内容)
3.資料(顧客から担当者への連絡内容)
4.調査依頼(担当者から製品部署への連絡内容)
5.調査回答(製品部署から担当者への連絡内容)
6.最終回答(担当者から顧客への連絡内容)
また対応履歴文書は、問合せに対する担当者からの確認、質問及び又は依頼などや、これらに対する顧客からの回答を含む場合もある。さらに対応履歴文書は、ひとつの対応履歴文書に複数の問合せと複数の回答とを含む場合もある。図2〜図4にこのような対応履歴文書の構成例を示す。
ネットワークインタフェース5は、例えばNIC(Network Interface Card)などから構成され、ネットワーク17を介した他の通信機器との通信時におけるプロトコル制御を行う。また外部記憶媒体ドライブ6は、例えば、CD(Compact Disk)若しくはDVD(Digital Versatile Disk)などのディスク媒体、又は、SDカードなどの半導体メモリカードといった、可搬性の記憶媒体18に対するドライブであり、CPU2の制御の下に、装填された記憶媒体18に対してデータを読み書きする。
入力装置7は、例えばキーボードやマウスなどから構成され、ユーザが各種情報やコマンドを入力するために利用される。また表示装置8は、例えば、液晶ディスプレイ装置などから構成され、各種情報や各種GUI(Graphical User Interface)を表示するために利用される。
(1−2)検索装置に搭載された各種機能
次に、本検索装置1に搭載されたデータ検索に関する各種機能について説明する。本検索装置1には、過去の対応履歴文書をその内容に応じて複数のクラスタに分類すると共に、クラスタごとに、そのクラスタの代表となる対応履歴文書(以下、これを代表文書と呼ぶ)をそれぞれ抽出する対応履歴文書間関連作成機能が搭載されている。
実際上、本検索装置1は、過去のすべての対応履歴文書を対応履歴文書情報15として記憶装置4に保持している。そして検索装置1は、定期的(例えば1週間又は1か月)に、又は、入力装置7を介して入力されたユーザからの指示に応じて非定期に、記憶装置4に格納された対応履歴文書情報15に含まれる対応履歴文書同士でその対応履歴文書に含まれる文字の成分比較(いわゆる概念検索)を行い、対応履歴文書同士の類似の度合を数値としてそれぞれ算出する。以下においては、この数値を類似度スコアと呼ぶものとする。
また検索装置1は、算出した類似度スコアが予め設定された閾値(以下、これを類似度スコア閾値と呼ぶ)以上の対応履歴文書間の関連構造を作成する。本実施の形態の場合、検索装置1は、対応履歴文書間の関連構造として、例えば図5に示すようなグラフ20を作成する。このグラフ20は、類似度スコアが類似度スコア閾値以上の対応履歴文書を表すノード21同士をエッジ22と呼ばれる線で繋いだものである。
さらに検索装置1は、このようにして作成したグラフ20に対して、各対応履歴文書に含まれる文字列の特徴ごとに分類する、いわゆるクラスタリングを行うことにより、図6に示すように、対応履歴文書情報15に含まれるすべての対応履歴文書を複数のクラスタ23に分類する。そして検索装置1は、この後、個々のクラスタ23について、そのクラスタ23に属する対応履歴文書の中から1つの対応履歴文書を代表文書して抽出する。
ここで、本実施の形態における「代表文書」とは、そのクラスタ内で他の対応履歴文書との関連を表す計算値の高い(本実施の形態では、そのクラスタ内で他の対応履歴文書との関連数が最も多い)対応履歴文書のことを指す。例えば、クラスタに属する対応履歴文書のうち、そのクラスタ内のより多くの対応履歴文書に記述されている回答を含む対応履歴文書が存在する場合、その対応履歴文書がそのクラスタの代表文書となる。具体的には、あるクラスタに図7に示すような4つの対応履歴文書24A〜24Dのみが属する場合、対応履歴文書24A〜24Cにそれぞれ記述されている回答を含む対応履歴文書24Dがそのクラスタの代表文書となる。
一方、検索装置1には、顧客からの問合せに対する回答例の検索指示が与えられた場合に、その問合せに内容が類似する問合せについての対応履歴文書を検索し、その対応履歴文書が属するクラスタの代表文書等をその検索結果としてユーザに提示する対応履歴文書検索機能も搭載されている。
実際上、検索装置1は、コールセンタのオペレータや問題解決担当者などのユーザにより入力装置7が操作されて、顧客からの問合せ内容を表す問合せ文と、その問合せに対する回答例の検索指示とが入力されると、当該問合せ文と類似する内容の問合せについての対応履歴文書を概念検索により検索する。
そして検索装置1は、この検索により問合せ文と最も内容が類似する問合せについての対応履歴文書を検出すると、その対応履歴文書が属するクラスタの代表文書のテキストを表示する画面へのリンクと、当該代表文書と問合せ内容が類似する対応履歴文書(例えば図5において代表文書のノード21とエッジ22を介して接続された各ノード21と対応する対応履歴文書)のテキストをそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置8に表示する。
例えば図7の例の場合、「サーバのバックアップが所定時間内に終わらない」といった問合せ文や、「バックアップが予定通り終了しない」といった問合せ文に対して、問合せ文と類似する内容の対応履歴文書として対応履歴文書24A〜24Dのいずれかが検出された場合、この対応履歴文書24A〜24Dが属するクラスタの代表文書である対応履歴文書24Dのテキストを表示する画面へのリンクと、当該対応履歴文書24Dと問合せ内容が類似する対応履歴文書24A〜24Cのテキストをそれぞれ表示する各画面へのリンクとが表示された検索結果画面が表示装置8に表示されることになる。
以上のような対応履歴文書間関連作成機能及び対応履歴文書検索機能(以下、適宜、この2つの機能をまとめてデータ検索機能と呼ぶ)を実現するための手段として、図1に示すように、検索装置1のメモリ3には対応履歴文書分類部19及び検索実行部13が格納され、記憶装置4には文書間関連情報16が格納されている。
対応履歴文書分類部19は、記憶装置4に格納された対応履歴文書情報に含まれる対応履歴文書を分類する機能を有するプログラムであり、文書管理部11及び文書間関連管理部12を備えて構成される。
文書管理部11は、対応履歴文書情報に含まれる対応履歴文書同士の関連を抽出する機能を有するモジュールである。この文書管理部11は、対応履歴文書管理部30及び対応履歴文書関連算出部31を備えて構成される。
対応履歴文書管理部30は、対応履歴文書のデータを対応履歴文書情報15として記憶装置4に書き込んだり、当該対応履歴文書情報15に含まれる対応履歴文書のデータをメモリ3のワークエリア14に読み込み、又は、対応履歴文書情報15から不要な対応履歴文書を削除するなど、対応履歴文書の管理を行うモジュールである。また対応履歴文書関連算出部31は、対応履歴文書同士の関連を上述の類似度スコアとして算出するモジュールである。
また文書間関連管理部12は、記憶装置4に格納された対応履歴文書を分類(クラスタリング)する機能を有するモジュールである。この文書間関連管理部12は、関連構造作成部32及び関連構造分析部33を備えて構成される。
関連構造作成部32は、文書管理部11の対応履歴文書関連算出部31により算出された対応履歴文書間の類似度スコアに基づいて、図5について上述したグラフ20を作成し、作成したグラフ20を文書間関連情報16として記憶装置4に格納するモジュールである。また関連構造分析部33は、記憶装置4に格納された文書間関連情報16に基づいて、対応履歴文書を複数のクラスタに分類する機能を有するモジュールである。
検索実行部13は、ユーザから与えられた顧客からの問合せ文に類似する問合せ内容の対応履歴文書を対応履歴文書情報15上で検索し、検出した対応履歴文書が属するクラスタの代表文書のテキストを表示する画面等へのリンクを含む検索結果画面を表示装置8に表示させる機能を有するプログラムである。この検索実行部13は、検索文受付・解析部34及び文書検索部35を備えて構成され、文書検索部35は、さらに類似文書検索部36、類似クラスタ検出部37及び代表文書抽出部38を備えて構成される。
このうち検索文受付・解析部34は、入力装置7を介してユーザにより入力された顧客からの問合せの問合せ文を受け付ける機能を有するモジュールである。また類似文書検索部36は、検索文受付・解析部34が受け付けた問合せ文と類似する対応履歴文書を対応履歴文書情報15上で検索する機能を有するモジュールである。
さらに類似クラスタ検出部37は、上述の検索により検出された対応履歴文書が含まれるクラスタを特定する機能を有するモジュールであり、代表文書抽出部38は、文書間関連管理部12の関連構造分析部33の分析結果に基づいて各クラスタの代表文書を抽出したり、類似クラスタ検出部37により特定されたクラスタの代表文書を抽出等する機能を有するモジュールである。
なお以下においては、各種処理の処理主体を「モジュール」として説明するが、そのモジュールに基づいてCPU2(図1)がその処理を実行することは言うまでもない。
一方、文書間関連情報16は、文書間関連管理部12の関連構造作成部32により作成され、記憶装置4に格納された対応履歴文書の関連構造(グラフ構造)と、文書間関連管理部12の関連構造分析部33により実行されたクラスタリングの結果とを保持するために利用される情報である。
この文書間関連情報16は、図8に示すように、エッジID欄16A、始点ノードID欄16B、終点ノードID欄16C及びクラスタ番号欄16Dを備えるテーブル構造を有する。そしてエッジID欄16Aには、図5について上述したグラフ20の各エッジ22にそれぞれ付与された識別子(エッジID)が格納される。
また始点ノードID欄16Bには、対応するエッジ22の始点側に接続されるノード21に付与された識別子(以下、これをノードIDと呼ぶ)が格納され、終点ノードID欄16Cには、対応するエッジ22の終点側に接続されるノード21に付与されたノードIDが格納される。
ただし、本実施の形態においては、図5からも明らかなように、対応履歴文書間の関連構造として無向グラフを用いており、エッジ22の始点及び終点という概念がないため、対応するエッジ22に接続される2つのノード21のうちの任意の一方のノード21のノードIDが始点ノードID欄16Bに格納され、他方のノード21のノードIDが終点ノードID欄16Cに格納されるだけであり、ノード21がエッジ22の始点及び終点のいずれが接続されているかは特に意味をもたない。
さらにクラスタ番号欄16Dには、対応するエッジ22の終点側に接続されるノード21と対応付けられた対応履歴文書が属するクラスタの識別番号(クラスタ番号)が格納される。
なお、後述のように、文書間関連情報16の各レコード(行)の情報のうち、エッジID欄16A、始点ノードID欄16B及び終点ノードID欄16Cの情報は文書管理部11の対応履歴文書関連算出部31により登録され、クラスタ番号欄16Dの情報は文書間関連管理部12の関連構造分析部33により登録される。
(1−3)対応履歴文書間関連作成処理
図9は、上述の対応履歴文書間関連作成機能に関連して対応履歴文書分類部19及び検索実行部13により実行される対応履歴文書間関連作成処理の具体的な処理手順を示す。この対応履歴文書間関連作成処理は、定期的に又はユーザからの処理実行指示を受けて非定期に実行される。
対応履歴文書間関連作成処理では、まず、文書管理部11の対応履歴文書管理部30が、記憶装置4に格納された対応履歴文書情報15に含まれる1つの対応履歴文書をメモリ3のワークエリア14に読み込み、その旨を対応履歴文書関連算出部31に通知する(SP1)。
対応履歴文書関連算出部31は、対応履歴文書管理部30からのかかる通知を受信すると、ワークエリア14に読み込まれた対応履歴文書(以下、これを対象対応履歴文書と呼ぶ)と、これ以外のすべての対応履歴文書との文字の成分比較(概念検索)をそれぞれ実行し、その類似度スコアをそれぞれ算出する(SP2)。この結果、このステップSP2の処理が完了した段階で、図10に示すような類似度スコア一覧40がメモリ3のワークエリア14上に作成される。
次いで、対応履歴文書関連算出部31は、ステップSP2で算出した対象対応履歴文書との類似度スコアが類似度スコア閾値(例えば70)以上のすべての対応履歴文書について、対象対応履歴文書との関連を文書間関連情報16(図8)にそれぞれ登録する(SP3)。
具体的に、対応履歴文書関連算出部31は、対象対応履歴文書に対応するノード21の識別子(ノードID)を文書間関連情報16の始点ノードID欄16B(図8)に格納すると共に、対象対応履歴文書と類似度スコアが類似度スコア閾値以上の対応履歴文書に対応するノード21のノードIDを文書間関連情報16の終点ノードID欄16C(図8)に格納し、これら対象対応履歴文書及び対応履歴文書にそれぞれ対応付けられたノード21間を接続するエッジ22に付与されるエッジIDを文書間関連情報16のそのレコードのエッジID欄16Aに格納するようにして、これらの対応履歴文書を文書間関連情報16に登録する。
さらに対応履歴文書関連算出部31は、対応履歴文書情報15に含まれるすべての対応履歴文書を対象対応履歴文書としてステップSP1〜ステップSP3の処理を実行し終えたか否かを判断する(SP4)。
そしてこの判断で否定結果が得られた場合、その旨を対応履歴文書関連算出部31が対応履歴文書管理部30に通知し、この後、対応履歴文書管理部30がステップSP1でメモリ3のワークエリア14に読み込む対応履歴文書を未処理の他の対応履歴文書に順次切り替えながら、ステップSP1〜ステップSP4の処理が繰り返される。
やがて、対応履歴文書情報15に含まれるすべての対応履歴文書を対象対応履歴文書としてステップSP1〜ステップSP3の処理を実行し終えることによりステップSP4で肯定結果が得られると、その旨が文書間関連管理部12の関連構造作成部32に通知される。そしてこの通知を受信した関連構造作成部32は、記憶装置4に格納されている文書間関連情報16に基づいて、対応履歴文書間の関連構造として、図5について上述したグラフ20を作成し、その旨を関連構造分析部33に通知する(SP5)。
そして、この通知を受信した関連構造分析部33は、ステップSP5で作成されたグラフ20を参照して、各エッジ22をそれぞれ介して接続された2つのノード21にそれぞれ対応する各対応履歴文書に対して文字列の特徴量分析(いわゆるクラスタリング)を実行することにより該当する対応履歴文書を複数のクラスタに分類する。そして関連構造分析部33は、このクラスタリング結果に基づいて、文書間関連情報16の各レコードのクラスタ番号欄16D(図8)に、対応するエッジ22の終点側に接続されたノード21と対応付けられた対応履歴文書が振り分けられたクラスタのクラスタ番号を格納し、この後、その旨を検索実行部13の代表文書抽出部38に通知する(SP6)。
代表文書抽出部38は、関連構造分析部33からのかかる通知を受信すると、ステップSP6で作成された各クラスタの代表文書をそれぞれ抽出する(SP7)。本実施の形態の場合、代表文書抽出部38は、クラスタごとに、接続されたエッジ22の数がそのクラスタ内で最も多いノード(中心性解析における次数中心性が最も高いノード)21と対応する対応履歴文書をそのクラスタの代表文書として抽出する。
以上の処理により、クラスタごとの代表文書が抽出され、この後、この対応履歴文書間関連作成処理が終了する。
(1−4)対応履歴文書検索処理
一方、図11は、上述の対応履歴文書検索機能に関連して検索実行部13により実行される対応履歴文書検索処理の具体的な処理手順を示す。この対応履歴文書検索処理は、ユーザからの検索指示を受けて実行される。
実際上、検索実行部13の検索文受付・解析部34(図1)は、入力装置7を介したユーザからの検索文入力画面の表示要求が与えられると、図12に示すような検索文入力画面50を表示装置8に表示させる(SP10)。
この検索文入力画面50は、ユーザが顧客からの問合せ文を検索文として入力するための画面であり、問合せ文入力フィールド51及び検索ボタン52を備えて構成される。そして検索文入力画面50では、ユーザが入力装置7を利用して問合せ文入力フィールド51に顧客からの問合せ文を入力し、その後、検索ボタン52をクリックすることにより、その問合せ文を検索文とした検索の実行を検索装置1に指示することができる。
そして検索文受付・解析部34は、上述のようにして検索文入力画面50に問合せ文が入力されて検索ボタン52がクリックされると、その問合せ文を検索文として取り込み、取り込んだ検索文のデータをメモリ3のワークエリア14に格納する(SP11)。そして検索文受付・解析部34は、その旨を文書検索部35の類似文書検索部36に通知する。
類似文書検索部36は、検索文受付・解析部34からのかかる通知を受信すると、メモリ3のワークエリア14にデータが格納されている検索文と内容が類似する問合せ文を含む対応履歴文書を概念検索で検索し、検索結果を類似クラスタ検出部37(図1)に通知する(SP12)。
また類似クラスタ検出部37は、類似文書検索部36からのかかる通知を受信すると、ステップSP12において検出された対応履歴文書が属するクラスタのクラスタIDを文書間関連情報16(図1)から取得し(SP13)、取得したクラスタIDを代表文書抽出部38に通知する(SP14)。
代表文書抽出部38は、類似クラスタ検出部37からかかるクラスタIDが与えられると、図9について上述した対応履歴文書間関連作成処理のステップSP7で抽出した各クラスタの代表文書のうちのそのクラスタIDが付与されたクラスタの代表文書を取得する。そして代表文書抽出部38は、取得した代表文書を表示する画面へのリンクと、当該代表文書と問合せ内容が類似する幾つかの対応履歴文書をそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置8に表示させる(SP14)。
そして、この後、この対応履歴文書検索処理が終了する。
(1−5)本実施の形態の効果
以上のように本実施の形態の検索装置1では、対応履歴文書を内容に応じて複数のクラスタに分類し、クラスタごとに、そのクラスタ内で他の対応履歴文書との関連数が最も多い対応履歴文書を代表文書として抽出し、問合せ文に類似する対応履歴文書の検索時には、当該問合せ文と関連を有する対応履歴文書を検索し、当該検索により検出した対応履歴文書が属するクラスタの代表文書を検索結果としてユーザに提示する。
従って、本検索装置1によれば、問合せ文における問合せ内容の表現形態等に依存することなく、問合せ文と関連が深い問合せ内容の対応履歴文書を提示することができ、かくして検索結果の回答の精度を向上することができる。よって、本検索装置1を利用することによって、顧客からの問合せに対して短時間で有効な回答を提示できるようになる。
(2)第2の実施の形態
図1において、60は全体として第2の実施の形態による検索装置を示す。この検索装置60は、対応履歴文書間関連作成処理において作成されるグラフ20(図5)の各エッジ22に、そのエッジ22が接続する2つのノード21とそれぞれ対応付けられた対応履歴文書同士の関連の強さに応じた重みがそれぞれ設定され、この重みを用いて対応履歴文書の各カテゴリの代表文書を抽出する点を除いて第1の実施の形態による検索装置1と同様に構成されている。
実際上、本実施の形態の検索装置60の場合、図13に示すように、文書間関連情報61には、エッジID欄61A、始点ノードID欄61B、終点ノードID欄61C及びクラスタ番号欄61Dに加えて、重み欄61Eが設けられている。そして、エッジID欄61A、始点ノードID欄61B、終点ノードID欄61C及びクラスタ番号欄61Dには、それぞれ第1の実施の形態の文書間関連情報16のエッジID欄16A、始点ノードID欄16B、終点ノードID欄16C及びクラスタ番号欄16Dに格納される情報とそれぞれ同じ情報が格納される一方、重み欄61Eには、対応するエッジ22(図5)に対して付与された重みが格納される。
本実施の形態の場合、エッジ22に設定する重みは、そのエッジ22が接続する2つのノード21とそれぞれ対応付けられた対応履歴文書間の類似度スコアの1/10に設定されるものとする。ただしこれ以外の方法により各エッジの重みを設定することもできる。例えば、ユーザが顧客からの問合せに対する回答を作成する際、検索装置60が提示した代表文書以外の複数の対応履歴文書を参照したときに、どのような順番で対応履歴文書を参照していったかというユーザの履歴探索プロセスを記憶しておき、よく辿られる(つまり一緒に参照されることが多い)対応履歴文書間のエッジ22の重みを高くするように各エッジ22の重みを設定するようにしても良い。この場合には、対応履歴文書間で一緒に参照された回数をそれぞれカウントしておき、そのカウント値をそのまま重みとして設定する。
図14は、上述のような構成を有する文書間関連情報61を用いて実行される本実施の形態による対応履歴文書間関連作成処理の具体的な処理手順を示す。この対応履歴文書間関連作成処理は、第1の実施の形態による対応履歴文書間関連作成処理(図9)と同様に、定期的に又はユーザからの処理実行指示を受けて開始される。
そして本実施の形態の対応履歴文書間関連作成処理では、ステップSP20〜ステップSP22の処理が第1の実施の形態の対応履歴文書間関連作成処理のステップSP1〜ステップSP3と同様に処理される。
続いて、対応履歴文書関連算出部31が、ステップSP22で文書間関連情報61に登録した各エッジ22について、そのエッジ22が接続する2つのノード21とそれぞれ対応付けられた対応履歴文書間の類似度スコアの値をSとして、次式
により重みWをそれぞれ算出し、算出した各エッジ22の重みをそれぞれ文書間関連情報61の対応するレコードの重み欄61Eに格納する(SP23)。
この後、本実施の形態の対応履歴文書間関連作成処理では、ステップSP24〜ステップSP26の処理が第1の実施の形態の対応履歴文書間関連作成処理のステップSP4〜ステップSP6と同様に処理される。
そして、さらにこの後、検索実行部62の文書検索部63の代表文書抽出部64が、ステップSP26で作成した各クラスタの中心となる文書を代表文書としてそれぞれ抽出する(SP27)。本実施の形態の場合、代表文書抽出部64は、クラスタごとに、接続された各エッジ22に設定された重みの平均値がそのクラスタ内で最も大きくなるノード21に対応する対応履歴文書をそのクラスタの代表文書として抽出する。
以上の処理により、クラスタごとの代表文書がエッジ22の重みを加味して抽出される。そして、この後、この対応履歴文書間関連作成処理が終了する。
以上のように本実施の形態の検索装置60では、グラフ20の各エッジ22に対して、当該エッジ22が接続する2つのノード21とそれぞれ対応付けられた対応履歴文書同士の関連の強さに応じた重みを設定する。従って、本検索装置60によれば、対応履歴文書間の関連をより精密に表すことができ、かくして第1の実施の形態の検索装置1と比して、検索結果の精度をより一層と向上させることができる。
(3)第3の実施の形態
第2の実施の形態では、文書間関連情報16に基づき作成されるグラフ20(図5)の各エッジ22(図5)に重みを設定することについて説明した。これに対して本実施の形態では、各対応履歴文書にその対応履歴文書の参照回数に応じた重みをそれぞれ設定し、中心性解析によって算出された各対応履歴文書の次数中心性をそれぞれその対応履歴文書の重みに基づいて補正した上で、その補正後の各対応履歴文書の次数中心性に基づいて代表文書を抽出する。このようにすることによって、実情に合致した代表文書を抽出することができる。
図1との対応部分に同一符号を付した図15は、このような本実施の形態による検索装置70の構成を示す。本実施の形態の検索装置70は、記憶装置4に対応履歴文書情報15及び文書間関連情報16に加えて参照履歴情報72が格納されている点と、メモリ3に格納された検索実行部73の文書検索部74に参照履歴登録部75が設けられている点と、当該文書検索部74の代表文書抽出部76の機能が異なる点とを除いて第1の実施の形態の検索装置1と同様に構成されている。
図16は、参照履歴情報72の構成例を示す。参照履歴情報72は、対応履歴文書ごとのユーザからの参照回数を管理するために利用される情報であり、文書ID欄72A及び参照回数欄72Bを備えるテーブル構造を有する。そして文書ID欄72Aには、各対応履歴文書の識別子(以下、これを文書IDと呼ぶ)がそれぞれ格納され、参照回数欄72Bには、対応する対応履歴文書の現在までの参照回数が格納される。この参照回数は、対応する対応履歴文書が参照されるごとに文書検索部74の参照履歴登録部75により1ずつカウントアップされる。
一方、図17は、本実施の形態の検索装置70により実行される対応履歴文書間関連作成処理の処理手順を示す。この対応履歴文書間関連作成処理では、ステップSP30〜ステップSP35が図9について上述した第1の実施の形態の対応履歴文書間関連作成処理のステップSP1〜ステップSP6と同様に処理される。
続いて、代表文書抽出部76が、ステップSP35で作成されたクラスタごとに、各対応履歴文書の次数中心性を算出する(SP36)。また、この後、代表文書抽出部76が、クラスタごとに、ステップSP36において算出した各対応履歴文書の次数中心性を正規化(全ノード数で除算)した後に、正規化した各対応履歴文書の次数中心性を参照履歴情報72に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出する(SP37)。
具体的に、代表文書抽出部76は、ステップSP36において算出した対応履歴文書の正規化した次数中心性をC、参照履歴情報72から得られるその対応履歴文書の参照回数をR、その対応履歴文書が属するすべての対応履歴文書の参照回数の合計値をTRとして、次式
により、各対応履歴文書の正規化した次数中心性の補正値C´をそれぞれ算出し、クラスタ内で正規化した次数中心性の補正値C´が最も大きい対応履歴文書をそのクラスタの代表文書として抽出する。
例えば、あるクラスタにおいて、ステップSP36において算出した各対応履歴文書の正規化した次数中心性が図18のような値であり、これらの対応履歴文書が属するクラスタの参照回数の合計値が100回であった場合、これら対応履歴文書の正規化した次数中心性はステップSP37においてそれぞれ図19のように補正される。従って、補正前の段階(図18)では「20140231_0232」という文書IDの対応履歴文書の正規化した次数中心性が最も大きかったにも関わらず、補正後の段階(図19)では「20131005_0002」という文書IDの対応履歴文書の正規化した次数中心性が最も大きくなったため、ステップSP37ではこの「20131005_0002」という文書IDの対応履歴文書がこのクラスタの代表文書として抽出されることになる。
図20は、本実施の形態の検索装置70により実行される対応履歴文書検索処理の処理手順を示す。この対応履歴文書検索処理では、ステップSP40〜ステップSP44が図11について上述した第1の実施の形態の対応履歴文書検索処理のステップSP10〜ステップSP14と同様に処理される。この結果、上述のように検索文入力画面50(図12)に入力された問合せ文と内容が類似する幾つかの対応履歴文書(代表文書を含む)をそれぞれ表示する画面への各リンクを含む検索結果画面が表示装置8(図15)に表示される。
続いて、検索結果画面上のユーザの操作を文書検索部74の参照履歴登録部75が監視し、当該検索結果画面においていずれかの対応履歴文書を表示する画面へのリンクがクリックされた場合に、その対応履歴文書の参照回数を1増加させるように参照履歴登録部75が参照履歴情報72を更新する(SP45)。
そして、この後、この検索結果画面がクローズされると、この対応履歴文書検索処理が終了する。
以上のように本実施の形態の検索装置70では、各対応履歴文書にその対応履歴文書の参照回数に応じた重みをそれぞれ設定し、中心性解析によって算出された各対応履歴文書の次数中心性をそれぞれその対応履歴文書の重みに基づいて補正した上で、その補正後の各対応履歴文書の次数中心性に基づいて代表文書を抽出する。従って、本検索装置70によれば、実情に合致した代表文書を抽出することができるため、第1の実施の形態の検索装置1と比して、検索結果の精度をより一層と向上させることができる。
(4)第4の実施の形態
第1の実施の形態による検索装置1では、対応履歴文書検索処理(図11)において、概念検索の検索対象(検索文と文字の成分比較を行う対象)をすべての対応履歴文書としている。しかしながら、このようにすべての対応履歴文書を概念検索の検索対象とした場合、対応履歴文書の数に応じて処理時間が長時間化するおそれがある。
そこで、本実施の形態においては、かかる対応履歴文書検索処理における概念検索の検索対象を対応履歴文書の各カテゴリの代表文書のみとする。このようにすることによって、検索対象の対応履歴文書数を低減させ、検索の高速化を図ることができる。
図1との対応部分に同一符号を付して示す図21は、このような本実施の形態による検索装置80の構成を示す。この検索装置80は、メモリ3に格納された検索実行部81の文書検索部82が類似文書検索部83及び代表文書抽出部38のみから構成されている点を除いて第1の実施の形態の検索装置1と同様に構成されている。
図22は、本実施の形態による対応履歴文書検索処理の具体的な処理手順を示す。この対応履歴文書検索処理は、ユーザからの検索指示を受けて実行される。
そして本実施の形態の対応履歴文書検索処理では、ステップSP50及びステップSP51が第1の実施の形態の対応履歴文書検索処理(図11)のステップSP10及びステップSP11と同様に処理される。
次いで、類似文書検索部83が、メモリ3のワークエリア14にデータが格納されている検索文と類似する代表文書を概念検索で検索する(SP52)。なお、この際の概念検索方法としては、例えばSQL(Structured Query Language)のWHERE句のように条件を付けて検索する方法のほか、予め代表文書のみをまとめた文書の集合を作成し、その文書の集合のみを対象に検索する方法を適用することができる。
この後、類似文書検索部83が、かかる検索により検出した代表文書を表示する画面へのリンクと、当該代表文書と問合せ内容が類似する他の幾つかの対応履歴文書をそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置8に表示させる(SP53)。そして、この後、この対応履歴文書検索処理が終了する。
以上のように本実施の形態による検索装置80では、対応履歴文書検索処理時、対応履歴文書の各カテゴリの代表文書のみを対象として概念検索を実行する。従って、本検索装置80によれば、検索対象の対応履歴文書数を低減させることができ、第1の実施の形態の検索装置1と比して検索の高速化を図ることができる。
(5)他の実施の形態
なお上述の第1〜第4の実施の形態においては、文書間関連管理部12の関連構造分析部33が作成するグラフが無向グラフである場合について述べたが、本発明はこれに限らず、関連構造分析部33が作成するグラフが例えば図23に示すような有向グラフ90を作成するようにしても良い。この場合において、エッジ92の向きは、検索元の対応履歴文書に対応するノード91から検索により検出された対応履歴文書に対応するノード91への向きとし、各ノード91の次数中心性は、自ノード91を向いているエッジ92の数を数える入次数中心性を適用すれば良い。
また上述の第1〜第4の実施の形態においては、対応履歴文書の各クラスタの代表文書を抽出する手法として次数中心性を利用するようにした場合について述べたが、本発明はこれに限らず、例えばグラフのどの点にも近い点を表す近接中心性や、グラフにおいてどれだけ重要な役割を果たすかを表す媒介中心性など、次数中心性以外の中心性を利用して各クラスタの代表文書を抽出するようにしても良い。この場合、クラスタごとに、当該クラスタ内で他の対応履歴文書との関連を表す計算値の高い対応履歴文書を代表文書として抽出すれば良い。
さらに上述の第1〜第4の実施の形態においては、対応履歴文書の各クラスタの情報をいわゆるリレーショナルデータベースに格納するようにした場合について述べたが、本発明はこれに限らず、各クラスタの情報を例えばグラフデータベースに直接保持するようにしても良い。ただし、各クラスタの情報をリレーショナルデータベースに格納することによって、各対応履歴文書を複数のクラスタに分類する際、かかる分類をより高速に行うことができる。
さらに上述の第1〜第4の実施の形態においては、対応履歴文書間関連作成処理を定期的に又はユーザからの処理実行指示を受けて非定期に実施するようにした場合について述べたが、本発明はこれに限らず、例えば対応履歴文書が追加されるごとに対応履歴文書間関連作成処理を実行するようにしても良く、対応履歴文書間関連作成処理の実行のタイミングとしては、この他種々のタイミングを広く適用することができる。
さらに上述の第1〜第4の実施の形態においては、対応履歴文書分類部19及び検索実行部13,62,73,81をそれぞれ別のプログラムとして作成するようにした場合について述べたが、本発明はこれに限らず、これらを1つのプログラムとして構成するようにしても良い。
さらに上述の第2の実施の形態においては、エッジ22に設定する重みを、類似度スコアの1/10とするようにした場合について述べたが、本発明はこれに限らず、エッジ22の重みの設定方法としては、この他種々の設定方法を広く適用することができる。
さらに上述の第3の実施の形態においては、対応履歴文書が閲覧された回数をその対応履歴文書の参照回数としてカウントするようにした場合について述べたが、本発明はこれに限らず、対応履歴文書が実際にコピー及びペーストされて問合せの回答として利用された回数(コピーされた回数)をその対応履歴文書の参照回数としてカウントするようにしても良い。このようにすることによって、例えば代表文書以外の対応履歴文書が新規問合せの回答として代表文書よりも多く利用された場合に、その対応履歴文書の参照回数が増加し、当該対応履歴文書が次の代表文書として抽出されることになるため、より実情に沿った情報(顧客からの新規問合せに対する検索結果)をユーザに提供することができる。
また、対応履歴文書が顧客からの問合せの回答に利用された回数を検索装置70が自動的にカウントするのではなく、例えば、検索結果画面に表示された代表画面を表示する画面へのリンクや、他の対応履歴文書を表示する画面へのリンクにそれぞれ対応させて検索結果画面内にチェックボックスを設け、顧客からの問合せに実際に利用した対応履歴文書に対応するチェックボックスにユーザがチェックを入れ、そのチェックが入れられた数を対応履歴文書ごとにカウントするようにしても良い。
さらに上述の第3の実施の形態においては、各対応履歴文書の次数中心性を正規化した後に、正規化した各対応履歴文書の次数中心性を参照履歴情報72に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出するようにした場合について述べたが、本発明はこれに限らず、各対応履歴文書の次数中心性を正規化することなく、各対応履歴文書の次数中心性を参照履歴情報72に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出するようにしても良い。
本発明は、文書検索を実行する検索装置に広く適用することができる。
1,60,70,80……検索装置、2……CPU、3……メモリ、4……記憶装置、7……入力装置、8……表示装置、11……文書管理部、12……文書間関連管理部、13,62,73,81……検索実行部、15……対応履歴文書情報、16,61……文書間関連情報、19……対応履歴文書分類部、20,90……グラブ、21,91……ノード、22,92……エッジ、23……クラスタ、30……対応履歴文書管理部、24A〜24D……対応履歴文書、25A,25B……問合せ文、31……対応履歴文書関連算出部、32……関連構造作成部、33……関連構造分析部、34……検索文受付・解析部、35,74,82……文書検索部、36,83……類似文書検索部、37……類似クラスタ検出部、38,64,76……代表文書抽出部、40……類似度スコア一覧、50……検索文入力画面、72……参照履歴情報、75……参照履歴登録部。

Claims (11)

  1. それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において実行される検索方法であって、
    前記検索装置が、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第1のステップと、
    前記検索装置が、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第2のステップと、
    前記検索装置が、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第3のステップと
    を備えることを特徴とする検索方法。
  2. 前記第1のステップは、
    前記対応履歴文書同士の関連を算出する対応履歴文書関連算出ステップと、
    算出した前記対応履歴文書同士の関連に基づいて前記対応履歴文書の関連構造を作成する関連構造作成ステップと、
    作成した前記対応履歴文書の前記関連構造に基づいて、複数の前記対応履歴文書を複数の前記クラスタに分類する対応履歴文書分類ステップと
    を備えることを特徴とする請求項1に記載の検索方法。
  3. 前記対応履歴文書関連算出ステップでは、
    前記対応履歴文書の文字の成分を比較する概念検索により、前記対応履歴文書間の関連を当該対応履歴文書同士の類似性の度合を表す数値として算出する
    ことを特徴とする請求項2に記載の検索方法。
  4. 前記関連構造分析ステップでは、
    各前記対応履歴文書を、前記対応履歴文書に含まれる文字列の特徴ごとに分類するクラスタリングにより複数のクラスタに分類する
    ことを特徴とする請求項2に記載の検索方法。
  5. 前記第3のステップでは、
    前記クラスタごとに、当該クラスタ内で他の前記対応履歴文書との関連を表す計算値の高い前記対応履歴文書を前記代表文書として抽出する
    ことを特徴とする請求項1に記載の検索方法。
  6. 前記クラスタ内で他の前記対応履歴文書との関連数が最も多い前記対応履歴文書とは、当該クラスタ内のより多くの前記対応履歴文書に記述されている回答を含む前記対応履歴文書である
    ことを特徴とする請求項5に記載の検索方法。
  7. 前記第1のステップは、
    前記対応履歴文書同士の関連を算出する対応履歴文書関連算出ステップと、
    算出した前記対応履歴文書同士の関連に基づいて前記対応履歴文書の関連構造を作成する関連構造作成ステップと、
    作成した前記対応履歴文書の前記関連構造に基づいて、複数の前記対応履歴文書を複数の前記クラスタに分類する対応履歴文書分類ステップと
    を有し、
    前記関連構造作成ステップでは、
    前記対応履歴文書の前記関連構造としてグラフを作成し、
    前記対応履歴文書関連算出ステップでは、
    前記グラフを構成する各エッジに対して、それぞれ算出した前記対応履歴文書同士の関連の強さ応じた重みを設定し、
    前記関連構造分析ステップでは、
    各前記エッジにそれぞれ設定された前記重みに基づいて、前記クラスタごとの前記代表文書を抽出する
    ことを特徴とする請求項5に記載の検索方法。
  8. 各前記対応履歴文書の参照回数をそれぞれ管理し、
    前記第2のステップでは、
    前記参照回数に基づいて前記代表文書を抽出する
    ことを特徴とする請求項5に記載の検索方法。
  9. 前記第3のステップでは、
    前記問合せ文と関連を有する前記対応履歴文書を、各前記クラスタの前記代表文書を検索対象として検索する
    ことを特徴とする請求項1に記載の検索方法。
  10. それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において、
    複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する対応履歴文書分類部と、
    前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する代表文書抽出部と、
    前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する文書検索部と
    を備えることを特徴とする検索装置。
  11. それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置に実行させるプログラムが格納された記憶媒体であって、
    前記検索装置に、
    複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第1のステップと、
    前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第2のステップと、
    前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第3のステップと
    を備える処理を実行させるプログラムが格納されたことを特徴とする記憶媒体。
JP2016523067A 2014-05-30 2014-05-30 検索方法及び装置並びに記憶媒体 Active JP6216873B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/064455 WO2015181962A1 (ja) 2014-05-30 2014-05-30 検索方法及び装置並びに記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2015181962A1 true JPWO2015181962A1 (ja) 2017-04-20
JP6216873B2 JP6216873B2 (ja) 2017-10-18

Family

ID=54698337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016523067A Active JP6216873B2 (ja) 2014-05-30 2014-05-30 検索方法及び装置並びに記憶媒体

Country Status (3)

Country Link
US (1) US10311111B2 (ja)
JP (1) JP6216873B2 (ja)
WO (1) WO2015181962A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019099894A1 (en) * 2017-11-16 2019-05-23 [24]7.ai, Inc. Method and system for facilitating collaboration among enterprise agents
US10878808B1 (en) * 2018-01-09 2020-12-29 Amazon Technologies, Inc. Speech processing dialog management
US20190251201A1 (en) * 2018-02-09 2019-08-15 Hitachi, Ltd. Information searching system and information searching method
CN113454954A (zh) * 2019-01-29 2021-09-28 推特股份有限公司 社交数据流上的实时事件检测
US11138530B2 (en) * 2019-03-19 2021-10-05 Servicenow, Inc. Action determination for case management
JP7272846B2 (ja) * 2019-03-28 2023-05-12 株式会社日立ソリューションズ東日本 文書分析装置および文書分析方法
US11816421B2 (en) 2019-05-17 2023-11-14 Aixs, Inc. Summary creation method, summary creation system, and summary creation program
US11055666B2 (en) * 2020-11-09 2021-07-06 The Abstract Operations Company Systems and methods for automation of corporate workflow processes via machine learning techniques
US11972441B2 (en) * 2022-03-10 2024-04-30 Dell Products, L.P. Intelligent product pedigree framework for product authenticity and verification
CN116112434B (zh) * 2023-04-12 2023-06-09 深圳市网联天下科技有限公司 一种路由器数据智能缓存方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276487A (ja) * 1999-03-26 2000-10-06 Mitsubishi Electric Corp 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
JP2002230005A (ja) * 2001-02-05 2002-08-16 Seiko Epson Corp サポートセンターシステム
JP2004102407A (ja) * 2002-09-05 2004-04-02 Dainippon Printing Co Ltd 検索システム、サーバコンピュータ、プログラム、及び記録媒体
JP2011170583A (ja) * 2010-02-18 2011-09-01 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、情報検索プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304793A (ja) 2006-05-10 2007-11-22 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置
JP5885689B2 (ja) * 2012-03-06 2016-03-15 株式会社オウケイウェイヴ Q&aシステム
TW201508525A (zh) * 2013-08-29 2015-03-01 Ubic Inc 文件分類系統、文件分類方法及文件分類程式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276487A (ja) * 1999-03-26 2000-10-06 Mitsubishi Electric Corp 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
JP2002230005A (ja) * 2001-02-05 2002-08-16 Seiko Epson Corp サポートセンターシステム
JP2004102407A (ja) * 2002-09-05 2004-04-02 Dainippon Printing Co Ltd 検索システム、サーバコンピュータ、プログラム、及び記録媒体
JP2011170583A (ja) * 2010-02-18 2011-09-01 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、情報検索プログラム

Also Published As

Publication number Publication date
WO2015181962A1 (ja) 2015-12-03
US10311111B2 (en) 2019-06-04
US20170116189A1 (en) 2017-04-27
JP6216873B2 (ja) 2017-10-18

Similar Documents

Publication Publication Date Title
JP6216873B2 (ja) 検索方法及び装置並びに記憶媒体
JP6200602B2 (ja) 関連情報取得方法及び装置並びに記憶媒体
US20230008175A1 (en) Systems and methods for selecting machine learning training data
JP6894534B2 (ja) 情報処理方法及び端末、コンピュータ記憶媒体
Kalmegh Analysis of weka data mining algorithm reptree, simple cart and randomtree for classification of indian news
US20180095867A1 (en) Software testing with minimized test suite
CN107784026B (zh) 一种etl数据处理方法及装置
US10255324B2 (en) Query modification in a database management system
AU2019201821B2 (en) Generating an execution script for configuration of a system
US20190228342A1 (en) Systems and methods for automated incident response
AU2020257140A1 (en) Detecting correlation among sets of time series data
AU2018205089A1 (en) Determination of task automation using natural language processing
US11954110B2 (en) Methods and apparatus for visualizing entity instance relationships in a database
JP6832903B2 (ja) 情報検索システムおよび方法
CN107004036B (zh) 用以搜索包含大量条目的日志的方法和系统
US20140067447A1 (en) Erp transaction recording to api system and method
JP2012138027A (ja) 情報検索システム、検索キーワード提示方法、およびプログラム
US9239867B2 (en) System and method for fast identification of variable roles during initial data exploration
CN110019547B (zh) 获取客户间的关联关系的方法、装置、设备及介质
JP5444071B2 (ja) 障害情報収集システムと方法およびプログラム
US10614083B2 (en) Method and system for identifying incipient field-specific entity records
CN112131215A (zh) 自底向上的数据库信息获取方法及装置
CN110851517A (zh) 一种源数据抽取方法、装置、设备及计算机存储介质
JP2017037381A (ja) 行動特性分析システムおよび行動特性分析方法
JP6730229B2 (ja) 問合せ対応支援装置および問合せ対応支援方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170925

R150 Certificate of patent or registration of utility model

Ref document number: 6216873

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150