JP2012252484A - 回答自動生成システム - Google Patents

回答自動生成システム Download PDF

Info

Publication number
JP2012252484A
JP2012252484A JP2011124071A JP2011124071A JP2012252484A JP 2012252484 A JP2012252484 A JP 2012252484A JP 2011124071 A JP2011124071 A JP 2011124071A JP 2011124071 A JP2011124071 A JP 2011124071A JP 2012252484 A JP2012252484 A JP 2012252484A
Authority
JP
Japan
Prior art keywords
answer
question
sentence
similarity
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011124071A
Other languages
English (en)
Inventor
Masayoshi Kono
全良 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2011124071A priority Critical patent/JP2012252484A/ja
Publication of JP2012252484A publication Critical patent/JP2012252484A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】問合せに対する回答を、人手を介さずに自動的に作成する。
【解決手段】
ネットワークを介して端末に接続されるサーバを有し、端末からの問合せをサーバで受け付けて問合せに対する回答を生成して端末へ提供する回答自動生成システムにおいて、質問者の端末から送られる問合わせ内容と、過去の問い合わせ内容とを比較し、一致率と参照率と語順一致率から類似度を算出し、算出されたこの類似度が高い過去の質問の回答を、問合わせに対する回答として生成する。
【選択図】図1

Description

本発明は、回答自動生成システムに係り、特に、ネットワークに接続された端末からの問い合わせに対する回答を自動的に作成する回答自動生成システムに関するものである。
コンピュータシステムの運用や保守のサポート、更にはコンピュータから提供されるサービスについての問い合わせに対して回答を作成して提供するシステムが実用化されている。例えば、特許文献1には、サポートサービス側の担当者が作成した回答を、顧客が予め指定した回答手段である電子メール又はFAXによって顧客側端末に送信する処理を行うヘルプデスクシステムが開示されている。
特開2004−30503公報
特許文献1に記載のように、従来のヘルプデスクシステムでは、サポートサービス側の担当者(人手)が、例えば過去のデータが蓄積されたデータベースを検索して、合致する事例を探して回答を作成するので、工数がかかるという課題がある。また、担当者の熟練度によって回答を作成する時間や回答の内容が異なるため、質問者に対して均一的なサポートサービスを提供できないという課題がある。
本発明の目的は、問合せに対する回答を、人手を介さずに自動的に作成することができる回答自動生成システムを提供することである。
本発明に係る回答自動生成システムは、ネットワークを介して端末に接続されるサーバを有し、該端末からの質問者による問合せをサーバで受け付けて該問合せに対する回答を生成して該端末へ提供する回答自動生成システムにおいて、
受け付けた該問合せの案件の質問文と、該質問文に対する回答文を格納する質問/回答DBと、過去の質問文に対する回答文の事例を蓄積して格納する回答事例DBと、
該サーバでプログラムを実行することで実現される;
問合せの質問文及びその回答文のデータ、及び回答事例のデータを、該質問/回答DB及び該回答事例DBに登録する質問/回答登録機能と、問合せの質問文に対する回答文を自動生成する回答自動生成機能と、該回答事例DBを検索して過去の質問文から回答を検索する検索機能とを有し、
該回答自動生成機能は、受け付けた該問合せの質問文と、該回答事例DBを検索して得られる過去の問合せの質問文を照合して、類似度が高い質問文に対する回答文を得て、該回答文を回答として、質問者の該端末へ提供すること特徴とする回答自動生成システムとして構成される。
好ましい例では、前記回答自動生成機能は、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部を有する前記回答自動生成システムとして構成される。
また、好ましい例では、前記類似度算出処理部は、(a)〜(d)の計算式をプロセッサで実行することによって、(a)一致率、(b)参照率、(c)語順一致率、(d)類似度を算出する前記回答自動生成システムとして構成される。
(a)一致率=全ての適合単語(回答事例DB質問文側)の文字数の総和/回答事例DB質問文の文字数
(b)参照率=回答事例DB参照回数/回答事例DB全参照回数
(c)語順一致率=適合単語中2単語の組でその順序関係が質問/回答DB質問文と一致する組の数/適合単語2単語の組み合わせ総数
(d)類似度=一致率×参照率×語順一致率
本発明によれば、質問者からの問い合わせに対する回答を自動的に作成するため、回答の作成工数を削減することができる。また、サポートサービス担当者の熟練度により異なる回答時間や内容が均一となる。
一実施例による回答自動生成システムの全体構成を示す図である。 一実施例による回答自動生成機能の処理動作を示すフローチャートである。 一実施例による類似度算出処理部の処理動作を示すフローチャートである。 一実施例による回答更新処理部の処理動作を示すフローチャートである。 一実施例における質問/回答DBの構成を示す図である。 一実施例における回答事例DBの構成を示す図である。 一実施例における質問ファイルの構成を示す図である。 一実施例における類似度ファイルの構成を示す図である。 一実施例における回答ファイルの構成を示す図である。
以下、図面を参照して本発明の一実施例について説明する。
図1は、回答自動生成システムの全体構成を示す。この回答自動作成システムは、ユーザ(質問者)からの問合せに対して回答を自動生成する管理サーバ(以下単にサーバという)1に、ネットワーク3を介して、1又は複数のユーザ(質問者)の端末2が接続して構成される。ユーザの端末2は、入力器及び表示器、情報処理するプロセッサを備えた、パーソナルコンピュータ(PC)や携帯端末等のクライアントである。質問者は、表示器の画面を見ながら、入力器より質問等の問合せを文章で入力する。入力された問合せ文章(質問文)のデータは、ネットワーク3を介してサーバ1へ送信される。
サーバ1は、所定のプログラムを実行させて情報処理するプロセッサ、メモリ及びデータベース(DB)等を保管する大容量の記憶装置を有する。サーバ1には、問合せに対する回答を提供するためのアプリケーションプログラムがプロセッサで実行されて、案件管理システム10が構築される。
案件管理システム10は、問合せの質問文及びその回答文のデータ更には回答事例のデータを、DB111,112に登録する質問/回答登録機能12と、問合せの質問文に対する回答文を自動生成する質問/回答自動生成機能13と、回答事例DB112を検索して過去の質問文から回答を検索する検索機能14から構成される。質問/回答自動生成機能14は更に、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部131と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部132より構成される。更に、案件管理システム10は、質問/回答DB111と、回答事例DB112と、質問ファイル113と、類似度ファイル114と、回答ファイル115を有する。
上記各機能及び各DB及びファイルの構成については、図2〜図4、及び図5〜9を参照して後述する。
図5は質問/回答DB111の構成を示す。
質問/回答DB111は、質問者の端末2から送信され、案件管理システム10で受け付けられた案件の質問文に対して回答された文を格納する。即ち、案件の受け付けの度に付与される固有の案件番号ごとに、質問文と、その質問文に対する回答文を格納する。なお、端末2からの質問文を受け付けた後であって回答を生成している段階では、当該質問文に案件番号が付与され、回答文は未だ格納されていない状況がある。
図6は回答事例DB112の構成図である。
回答事例DB112は、過去に収集された質問文とそれに対する回答文の事例を蓄積して格納する。
連続する番号(SEQ)ごとに、質問文から抽出されたキーワードとなる1又は複数の単語と、回答文と、その質問/回答文の対が参照された参照回数を格納する。参照回数は、この回答事例DB112が検索されて参照される度に、検索機能によって順次更新される。
図7は質問ファイル113の構成図である。
質問ファイル113は、質問/回答DB111の案件番号に対応して、質問文から抽出されたキーワードとなる1又は複数の単語を格納する。
図8は類似度ファイル114の構成図である。
類似度ファイル114は、回答事例DB112の番号(SEQ)に対応して、回答文と、その回答文に対して算出された類似度を格納する。類似度の計算については、後で詳述する。
図9は回答ファイル115の構成図である。
回答ファイル115は、質問/回答DB111の案件番号に対応して、回答文の内容を格納する。
次に、図2のフローチャートを参照して、回答自動生成機能13の処理動作について説明する。
本処理の前提として、質問者の端末2から送信された質問文は、質問/回答登録機能12によって案件番号が付与されて質問/回答DB111に格納されているとする(回答文はこれから生成される段階である)。また、回答事例DB112には、過去に収集された質問文とその回答文の事例が格納されているとする。
回答自動生成機能13は、まず、質問/回答DB111から質問文を読み込み、当該質問文について回答事例DB112の質問文と突合せて、類似度算出処理部131で類似度の計算を行い(S21)、その結果算出された類似度を類似度ファイル114に格納する。なお、類似度の算出処理(S21)については、図3を参照して後述する。
そして、類似度ファイル114に格納された回答事例をキーにして回答事例DB112を検索する。その検索の結果得られた回答事例は、質問/回答登録機能12によって質問/回答DB111の上記質問文に対応する「回答文」エリアに格納される(S22)。質問/回答DB111に格納された回答文は、その後読み出されて、ネットワーク3を介して質問者の端末2へ送信される(S24)。
ここで、S24の処理の前に(後でもよいが)、回答更新処理部132は回答事例DB112の参照回数を更新する(S23)。なお、更新処理(S22)については、図4を参照して後述する。
次に、図3のフローチャートを参照して、類似度算出処理部131の処理動作について説明する。
類似度算出処理部131は、質問/回答DB111を検索して、案件Noをキーに読み出しを行ない、読み出した案件Noを回答ファイル115に書き込む(S302)。また、読み出した質問文のデータを1又は複数の単語に分解して、その分解された単語を質問ファイル113に、質問Noに対応付けて書き込む(S303)。
次に、回答事例DB112に格納されたレコードをNULLまで順次に読み出す(S304)。そして、1レコードを読み込む度に以下の処理を行う。
まず、一致率の算出を行う(S305)。一致率は、全ての適合単語(回答事例DB質問文側)の文字数の総和を、回答事例DB質問文の文字数で割った値である。即ち、
一致率=全ての適合単語(回答事例DB質問文側)の文字数の総和/回答事例DB質問文の文字数
で表される。計算処理は次の工程(1)〜(4)で行われる。
(1)質問文の全単語をメモリ(#1〜#n)にセットする。
(2)メモリ(#1)からメモリ(#n)まで順に読み出しを行って、質問文の単語と一致した回答事例DB112の質問文単語の文字数をメモリ(#n+1)にプラスする。
(3)回答事例DB112の質問文単語の総文字数をメモリ(#n+2)に取り出す。
(4)一致した文字数(メモリ(#n+1))を総文字数(メモリ(#n+2))で割り、メモリ(#n+3)にセットする。
次に、参照率の算出を行なう(S306)。参照率は、回答事例DB112の参照回数を回答事例DBの全参照回数で割った値である。即ち、参照率=回答事例DB参照回数/回答事例DB全参照回数で表される。計算処理は次の工程(1)〜(2)で行われる。
(1)回答事例DB112のレコードを順次に読み出し、参照回数をメモリ(#n+4)上に加算する。
(2)回答事例DB112の参照回数をメモリ(#n+4)で割り、メモリ(#n+5)上にセットする。
次に、語順一致率の算出を行なう(S307)。語順一致率は、適合単語中2単語の組でその順序関係が質問/回答DB質問文と一致する組の数を、適合単語2単語の組み合わせ総数で割った値である。即ち、
語順一致率=適合単語中2単語の組でその順序関係が質問/回答DB質問文と一致する組の数/適合単語2単語の組み合わせ総数
で表される。計算処理は次の工程(1)〜(10)で行われる。
(1)一致した単語の質問文1番目の単語と2番目の単語をメモリ(#n+6)に取り出す。
(2)一致した単語の質問文n-1番目の単語とn番目の単語をメモリ(#n+7)に取り出す。
この(1)(2)は、一致した単語の終わり(n)まで繰り返し処理する。
(3)質問文の単語と一致した回答事例DB質問文単語をメモリ(1〜m)に取り出す。
この(3)は回答事例DBの単語の終わりまで繰り返し処理する。
下記(4)〜(10)はメモリ(m)まで繰り返し処理する。
(4)一致した単語の1番目の単語と2番目の単語をメモリ(#n+8)に取り出す。
(5)(1)の組合せ(メモリ(#n+6))と、(4)の組合せ(メモリ(#n+8))が一致した場合、メモリ(#n+9)に1を加算し、(7)へ行く。
(6)(2)の組合せ(メモリ(#n+7))と、(4)の組合せ(メモリ(#n+8))が一致した場合、メモリ(#n+9)に1を加算する。
(7)一致した単語の(m-1)番目の単語と(m)番目の単語をメモリ(#n+10)に取り出す。
(8)(1)の組合せ(メモリ(#n+6))と、(7)の組合せ(メモリ(#n+10))が一致した場合、メモリ(#n+9)に1を加算し、(10)へ行く。
(9)(2)の組合せ(メモリ(#n+7))と、(7)の組合せ(メモリ(#n+10))が一致した場合、メモリ(#n+9)に1を加算する。
(10)メモリ(#n+9)の値を2で割り、メモリ(#n+9)にセットする。
次に、類似度の算出を行なう(S308)。類似度は、一致率×参照率×語順一致率で表される。この計算処理は、メモリ(#n+3)とメモリ(#n+5)とメモリ(#n+9)を掛けることで行われる。
以上の計算処理が終わると、回答事例DB112のSEQと、回答事例と、算出した類似度を類似度ファイル114に書き込んで、一連の類似度算出処理を終了する(S309)。
次に、図4のフローチャートを参照して、回答更新処理部132の処理動作について説明する。
回答更新処理部132は、類似度ファイル114を検索して、類似度が最大の回答事例のデータを読み出して、それを回答ファイル115の回答文のレコードに書き込(S402)。
そして、回答ファイル115に格納された当該回答文に対応する質問Noと一致する、質問/回答DB111の回答文のレコードに当該回答文を追記して、質問/回答DB111を更新する(S403)。
回答更新処理部132はまた、類似度ファイル114の中で最大の類似度のデータからSEQを抽出して、当該SEQの一致する回答事例DB112のレコードの参照回数を1加算して更新する(S404)。これで一連の処理を終わる。
1:サーバ 2:端末 3:ネットワーク 10:案件管理システム
12:質問/回答登録機能 13:回答自動生成機能
131:類似度算出処理部 132:回答更新処理部
14:検索機能
111:質問/回答DB 112:回答事例DB 113:質問ファイル
114:類似度ファイル 115:回答ファイル

Claims (3)

  1. ネットワークを介して端末に接続されるサーバを有し、該端末からの質問者による問合せをサーバで受け付けて該問合せに対する回答を生成して該端末へ提供する回答自動生成システムにおいて、
    受け付けた該問合せの案件の質問文と、該質問文に対する回答文を格納する質問/回答DBと、
    過去の質問文に対する回答文の事例を蓄積して格納する回答事例DBと、
    該サーバでプログラムを実行することで実現される;
    問合せの質問文及びその回答文のデータ、及び回答事例のデータを、該質問/回答DB及び該回答事例DBに登録する質問/回答登録機能と、問合せの質問文に対する回答文を自動生成する回答自動生成機能と、該回答事例DBを検索して過去の質問文から回答を検索する検索機能とを有し、
    該回答自動生成機能は、受け付けた該問合せの質問文と、該回答事例DBを検索して得られる過去の問合せの質問文を照合して、類似度が高い質問文に対する回答文を得て、該回答文を回答として、質問者の該端末へ提供すること特徴とする回答自動生成システム。
  2. 前記回答自動生成機能は、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部を有することを特徴とする請求項1の回答自動生成システム。
  3. 前記類似度算出処理部は、(a)〜(d)の計算式をプロセッサで実行することによって、(a)一致率、(b)参照率、(c)語順一致率、(d)類似度を算出することを特徴とする請求項2の回答自動生成システム。
    (a)一致率=全ての適合単語(回答事例DB質問文側)の文字数の総和/回答事例DB質問文の文字数
    (b)参照率=回答事例DB参照回数/回答事例DB全参照回数
    (c)語順一致率=適合単語中2単語の組でその順序関係が質問/回答DB質問文と一致する組の数/適合単語2単語の組み合わせ総数
    (d)類似度=一致率×参照率×語順一致率
JP2011124071A 2011-06-02 2011-06-02 回答自動生成システム Withdrawn JP2012252484A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011124071A JP2012252484A (ja) 2011-06-02 2011-06-02 回答自動生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011124071A JP2012252484A (ja) 2011-06-02 2011-06-02 回答自動生成システム

Publications (1)

Publication Number Publication Date
JP2012252484A true JP2012252484A (ja) 2012-12-20

Family

ID=47525253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011124071A Withdrawn JP2012252484A (ja) 2011-06-02 2011-06-02 回答自動生成システム

Country Status (1)

Country Link
JP (1) JP2012252484A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017072822A1 (ja) * 2015-10-30 2017-05-04 株式会社Ubic 関連性評価システム、方法、プログラムおよび記録媒体
CN112948403A (zh) * 2021-01-25 2021-06-11 北京房江湖科技有限公司 一种用于自动更新房源数据的方法和装置
US11080480B2 (en) 2017-08-29 2021-08-03 Fujitsu Limited Matrix generation program, matrix generation apparatus, and plagiarism detection program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017072822A1 (ja) * 2015-10-30 2017-05-04 株式会社Ubic 関連性評価システム、方法、プログラムおよび記録媒体
JPWO2017072822A1 (ja) * 2015-10-30 2018-07-26 株式会社Fronteo 関連性評価システム、方法、プログラムおよび記録媒体
US11080480B2 (en) 2017-08-29 2021-08-03 Fujitsu Limited Matrix generation program, matrix generation apparatus, and plagiarism detection program
CN112948403A (zh) * 2021-01-25 2021-06-11 北京房江湖科技有限公司 一种用于自动更新房源数据的方法和装置
CN112948403B (zh) * 2021-01-25 2023-08-08 北京房江湖科技有限公司 一种用于自动更新房源数据的方法和装置

Similar Documents

Publication Publication Date Title
US9282162B2 (en) Processing user profiles of users in an electronic community
US9330418B2 (en) System and method for creating a family tree data structure
US6983282B2 (en) Computer method and apparatus for collecting people and organization information from Web sites
US9218568B2 (en) Disambiguating data using contextual and historical information
CN105045799A (zh) 可搜索索引
US6691122B1 (en) Methods, systems, and computer program products for compiling information into information categories using an expert system
US8515986B2 (en) Query pattern generation for answers coverage expansion
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111899822B (zh) 医疗机构数据库构建方法、查询方法、装置、设备和介质
US20140129569A1 (en) Address extraction from a communication
CN111899821A (zh) 处理医疗机构数据的方法、构建数据库的方法和装置
WO2020033117A1 (en) Dynamic and continous onboarding of service providers in an online expert marketplace
US20140244641A1 (en) Holistic customer record linkage via profile fingerprints
CN106202440B (zh) 数据处理方法、装置及设备
CN113051389B (zh) 知识推送方法及装置
CN111091883A (zh) 一种医疗文本处理方法、装置、存储介质及设备
CN104462377A (zh) 提供联系人信息的方法及装置
JP2012252484A (ja) 回答自動生成システム
CN111190965A (zh) 基于文本数据的即席关系分析系统及方法
JP2019139746A (ja) 情報検索システムおよび方法
CN110428342B (zh) 数据修复方法、服务器、客服端及存储介质
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
CN113609271A (zh) 基于知识图谱的业务处理方法、装置、设备及存储介质
US9317528B1 (en) Identifying geographic features from query prefixes
CN109408704B (zh) 基金数据关联方法、系统、计算机设备和存储介质

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130701

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140805