以下に、本願の開示する校閲方法、校閲プログラムおよび情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本実施例に係るシステムの構成を示す図である。図1に示すように、このシステムは、利用者端末15a,15b,15cと、運用者端末20a,20bと、情報処理装置100とを有する。利用者端末15a〜15cと、運用者端末20a,20bと、情報処理装置100とは、ネットワーク50を介して相互に接続される。
図1のシステムでは、利用者端末15a〜15cを有するが、その他の利用者端末を有していてもよい。利用者端末15a〜15cをまとめて、適宜、利用者端末15と表記する。また、図1のシステムでは、運用者端末20a,20bを有するが、その他の運用者端末を有していてもよい。運用者端末20a,20bをまとめて、適宜、運用者端末20と表記する。
利用者端末15は、サービスの利用者が使用する端末装置である。利用者は、利用者端末15を操作して、情報処理装置100にアクセスし、各種のサービス提供を受ける。また、利用者は、サービスに関する要望や質問の情報を利用者端末15に入力する。利用者端末15に入力される要望や質問の情報を「質問情報」と表記する。
たとえば、質問情報には、サービス情報と、利用者識別情報と、要望や質問の内容に関する情報(質問文章情報)が含まれる。ここで、サービス情報は、サービスを一意に識別する情報である。利用者識別情報は、利用者を一意に識別する情報である。利用者端末15は、質問情報を、情報処理装置100に送信する。質問情報は、情報処理装置100の記憶部に登録される。
運用者端末20は、サービスの運用者が使用する端末装置である。運用者は、運用者端末20を操作して、情報処理装置100にアクセスし、情報処理装置100の記憶部に登録された質問情報を参照して、質問情報に対する回答文章の情報を作成する。運用者は、回答文章の情報を、運用者端末20に入力する。
運用者端末20は、運用者から回答文章の情報の入力を受け付けると「運用者回答情報」を、情報処理装置100に送信する。運用者回答情報は、情報処理装置100の記憶部に登録される。たとえば、運用者回答情報には、運用者識別情報と、回答文章情報と、サービス情報と、利用者識別情報とが含まれる。運用者識別情報は、運用者を一意に識別する情報である。回答文章情報は、運用者が作成した回答文章の情報である。サービス情報および利用者識別情報は、回答文章を作成する場合に、運用者が参照した質問情報のサービス情報および利用者識別情報である。
情報処理装置100は、利用者端末15から要求されるサービスを提供する装置である。情報処理装置100は、利用者端末15から質問情報を受信した場合には、質問情報を、記憶部に登録する。情報処理装置100は、運用者端末20から質問情報に対するアクセスを受け付け、運用者端末20から送信される運用者回答情報を、記憶部に登録する。
ここで、情報処理装置100は、運用者端末20から送信される複数の運用者回答情報を、サービス情報と利用者識別情報との組に基づいて複数のグループに分類する。情報処理装置100は、グループ毎に、同一のグループに分類された複数の運用者回答情報を基にして、校閲ルールを生成しておく。
情報処理装置100は、運用者回答情報を受け付けた場合に、運用者回答情報に対応するグループを特定し、特定したグループに対応する校閲ルールを用いて、運用者回答情報(回答文章)の単語を修正する。情報処理装置100は、修正した回答文章の情報を、利用者端末15に送信する。
上記のように、情報処理装置100は、サービス情報および利用者識別情報の組に基づいて分類した回答文章毎に校閲ルールをそれぞれ生成し、校閲を行う場合には、校閲対象の回答文章に対応した校閲ルールを用いて修正を行う。これにより、回答文章の校閲精度を高めることができる。
なお、図1に示すシステムでは一例として、情報処理装置100が、利用者端末15にサービスを提供する場合について説明するが、これに限定されるものではない。たとえば、図1に示すシステムは、情報処理装置100とは別に、利用者端末15に対してサービスを提供するサーバを有していてもよい。
次に、本実施例に係る情報処理装置100の構成の一例について説明する。図2は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図2に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。
通信部110は、ネットワーク50を介して、利用者端末15および運用者端末20とデータ通信を実行する処理部である。通信部110は、通信装置の一例である。たとえば、通信部110は、利用者端末15からのアクセスを受け付け、質問情報等を、制御部130に出力する。通信部110は、運用者端末20からのアクセスを受け付け、運用者回答情報等を、制御部130に出力する。後述する制御部130は、通信部110を介して、利用者端末15および運用者端末20とデータをやり取りする。
記憶部120は、回答文章テーブル121、問合せテーブル122、分類テーブル123、運用者管理テーブル124、校閲ルールテーブル125、質問情報テーブル126を有する。記憶部120は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
回答文章テーブル121は、運用者に作成される回答文章の情報を保持するテーブルである。図3は、本実施例にかかる回答文章テーブルのデータ構造の一例を示す図である。図3に示すように、この回答文章テーブル121は、回答文章識別情報と、回答文章情報と、作成日時と、引用回数と、信頼度スコアとを対応付ける。
このうち、回答文章識別情報は、回答文章を一意に識別する情報である。回答文章情報は、回答文章の情報である。作成日時は、回答文章が作成された日時を示すものである。引用回数は、該当する回答文章が引用された回数を示すものである。信頼度スコアは、該当する回答文章の信頼度を示す値である。信頼度スコアに関する具体的な説明は後述する。
問合せテーブル122は、質問情報と、運用者回答情報とを紐付けるテーブルである。図4は、本実施例にかかる問合せテーブルのデータ構造の一例を示す図である。図4に示すように、この問合せテーブル122は、問合せ識別情報と、サービス情報と、利用者識別情報と、運用者識別情報と、回答文章識別情報とを対応付ける。
問合せ識別情報は、問合せテーブル122に登録された各レコードを一意に識別する情報である。以下の説明では適宜、問合せ識別情報のより識別されるレコードを、「問合せ情報」と表記する。サービス情報は、サービスを一意に識別する情報である。利用者識別情報は、利用者を一意に識別する情報である。運用者識別情報は、運用者を一意に識別する情報である。回答文章識別情報は、回答文章を一意に識別する情報である。
たとえば、図4の問合せ識別情報「R1001」のレコードについて説明する。サービス情報「サービスA」を利用した利用者識別情報「U101」の利用者が作成した質問情報に関して、運用者識別情報「OP102」の運用者が回答文章を作成している。この運用者が作成した回答文章の回答文章識別情報は「S1001」である。
分類テーブル123は、問合せ情報の分類結果を保持するテーブルである。後述するように、問合せ情報は、サービス情報と、利用者識別情報との組に基づき各グループに分類される。図5は、本実施例に係る分類テーブルのデータ構造の一例を示す図である。図5に示すように、分類テーブル123は、グループ識別情報と、問合せ識別情報群とを対応付ける。グループ識別情報は、グループを一意に識別する情報である。問合せ識別情報群は、同一のグループに分類される各問合せ識別情報を示すものである。
たとえば、グループ識別情報「G1」の問合せ識別情報群には、問合せ識別情報「R1001、R1002、R1003、・・・」が含まれる。
運用者管理テーブル124は、運用者に関する各種の情報を保持するテーブルである。図6は、本実施例に係る運用者管理テーブルのデータ構造の一例を示す図である。図6に示すように、この運用者管理テーブル124は、運用者識別情報と、グループ識別情報と、担当年数と、担当回数とを対応付ける。運用者識別情報は、運用者を一意に識別する情報である。グループ識別情報は、図5に示したグループを一意に識別する情報である。担当年数は、該当する運用者が、該当するグループ識別情報のグループに属する問合せ情報を担当した年数を示すものである。担当回数は、該当する運用者が、該当するグループ識別情報のグループに属する問合せ情報を担当した回数を示すものである。
たとえば、運用者識別情報「OP101」の運用者は、グループ識別情報「G1」のグループに分類された問合せ情報に関して、担当年数が「1年」であり、担当回数が「2回」であることが示されている。
校閲ルールテーブル125は、グループ毎に固有の校閲ルールの情報を保持するテーブルである。図7は、本実施例に係る校閲ルールテーブルのデータ構造の一例を示す図である。図7に示すように、この校閲ルールテーブル125は、グループ識別情報と、校閲ルールとを対応付ける。グループ識別情報は、図5に示したグループを一意に識別する情報である。校閲ルールは、校閲候補と、正解候補とを対応付ける情報である。たとえば、グループ識別情報G1〜G4に対応する校閲ルールをそれぞれ、校閲ルールg1〜g4とする。図示を省略するが、校閲ルールテーブル125には、他の構成ルールが含まれていてもよい。
図8は、校閲ルールの一例を示す図である。ここでは一例として、校閲ルールg1と、校閲ルールg2とを示す。校閲ルールg1,g2は、校閲候補と正解候補との組で表現される。校閲ルールg1,g2の内容は、グループ識別情報に応じて固有のものとなる。たとえば、校閲ルールg1を利用すると、回答文章に含まれる校閲候補「Webコンソール画面」は、「管理者画面」に修正される。一方、校閲ルールg2を利用すると、回答文章に含まれる校閲候補「管理者画面」は、「Webコンソール画面」に修正される。
質問情報テーブル126は、利用者に作成される質問情報を保持するテーブルである。図9は、本実施例に係る質問情報テーブルのデータ構造の一例を示す図である。図9に示すように、この質問情報テーブル126は、質問識別情報と、サービス識別情報と、利用者識別情報と、質問文章情報とを対応付ける。
質問識別情報は、質問情報を一意に識別する情報である。サービス識別情報は、サービスを一意に識別する情報である。利用者識別情報は、質問情報を作成した利用者を一意に識別する情報である。質問文章情報は、利用者に作成されるサービスに関する要望や質問の文章情報である。
図2の説明に戻る。制御部130は、サービス提供部131と、取得部132と、分類部133と、生成部134と、校閲部135とを有する。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などによって実現できる。また、制御部130は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによっても実現できる。
サービス提供部131は、利用者端末15からのサービスの提供依頼を受け付けた場合に、サービス(Webサービス等)の提供を行う処理部である。本実施例では、情報処理装置100が、サービス提供部131を有し、このサービス提供部131が、利用者端末15にサービスを提供する例を示すが、これに限定されるものでない。たとえば、情報処理装置100以外のサーバが、サービス提供部131の機能を有し、利用者端末15にサービスを提供してもよい。
取得部132は、利用者端末15および運用者端末20とデータ通信を実行し、各種の情報を取得する処理部である。取得部132は、利用者端末15から質問情報を受信すると、受信した質問情報を、質問情報テーブル126に登録する。たとえば、取得部132は、ユニークな質問識別情報と、サービス情報と、利用者識別情報と、質問文章情報とを対応付けて、質問情報テーブル126に登録する。
運用者は、質問情報に対応する回答文章の情報を作成する場合には、運用者端末20を操作して、質問情報に対するアクセス要求を、情報処理装置100に送信する。取得部132は、運用者端末20から、質問情報に対するアクセス要求を取得すると、質問情報テーブル126に登録された情報を、運用者端末20に通知する。
運用者は、質問情報に対応する回答文の情報を作成する場合には、過去に作成された回答文章を引用して利用する場合がある。運用者は、過去に作成された回答文章を引用する場合には、運用者端末20を操作して、過去に作成された回答文章情報に対するアクセス要求を、情報処理装置100に送信する。取得部132は、運用者端末20から、過去に作成された回答文章情報に対するアクセス要求を取得すると、回答文章テーブル121に登録された情報を、運用者端末20に通知する。
取得部132は、運用者端末20から、運用者回答情報を受信すると、受信した運用者回答情報を基にして、回答文章テーブル121および問合せテーブル122を更新する。
取得部132が、回答文章テーブル121を更新する処理の一例について説明する。取得部132は、運用者回答情報を受信すると、ユニークな回答文章識別情報を割り当て、運用者回答情報を取得した日時を、作成日時とする。取得部132は、図示しないタイマから、日時の情報を取得する。取得部132は、回答文章識別情報と、回答文章情報と、作成日時と、引用回数の初期値と、信頼度スコアの初期値とを対応付けた新たなレコードを、回答文章テーブル121に登録する。たとえば、引用回数の初期値は「0回」である。信頼度スコアの初期値は「0」である。
ここで、運用者が回答文章を作成する場合に、他の回答文章を引用している場合には、引用した回答文章の回答文章識別情報が、運用者回答情報に設定されているものとする。引用した回答文章の回答文章識別情報を「引用文章識別情報」と表記する。取得部132は、引用文章識別情報と、回答文章テーブル121の回答文章識別情報とを比較し、回答文章テーブル121のヒットしたレコードの引用回数に1を加算する。
取得部132が、問合せテーブル122を更新する処理の一例について説明する。取得部132は、運用者回答情報を受信すると、ユニークな問合せ識別情報を割り当てる。取得部132は、問合せ識別情報と、サービス情報と、利用者識別情報と、運用者識別情報と、回答文章識別情報とを対応付けた新たなレコードを、問合せテーブル122に登録する。登録されるレコードのサービス情報、利用者識別情報、運用者識別情報は、運用者回答情報に含まれるものである。回答文章識別情報は、回答文章テーブル121を更新する際に割り当てられる回答文章識別情報である。
分類部133は、問合せテーブル122のサービス情報と利用者識別情報との組を基にして、問合せ情報を分類する処理部である。分類部133は、分類結果を、分類テーブル123に登録する。問合せテーブル122の利用者識別情報は、質問情報の問合せ元に対応する情報である。
図10は、本実施例に係る分類部の処理を説明するための図である。図10に示すように、分類部133は、問合せ情報に含まれる利用者識別情報と、サービス情報との組から、グループを特定する。たとえば、問合せ情報の利用者識別情報が「U101」であり、かつ、サービス情報が「サービスA」である場合には、分類部133は、この問合せ情報を、グループ識別情報「G1」のグループに分類する。
分類部133は、問合せテーブル122に登録された各問合せ情報について、上記処理を繰り返し実行し、グループ識別情報と、問合せ識別情報との関係を特定し、分類テーブル123を生成する。
生成部134は、運用者管理テーブル124および校閲ルールテーブル125を生成する処理部である。まず、生成部134が、運用者管理テーブル124を生成する処理の一例について説明する。生成部134は、運用者識別情報に対応する運用者の担当年数および担当回数をグループ識別情報毎に算出する。
一例として、生成部134が、運用者識別情報「OP101」の運用者に対応する、グループ識別情報「G1」の担当年数を判定する処理について説明する。生成部134は、分類テーブル123を参照し、グループ識別情報「G1」に分類された問合せ識別情報群を特定する。生成部134は、特定した問合せ識別情報群に含まれる各問合せ識別情報および運用者識別情報「OP101」の組と、問合せテーブル122とを比較して、ヒットする回答文章識別情報を特定する。生成部134は、特定した各回答文章識別情報と、回答文章テーブル121とを比較して、運用者識別情報「OP101」が回答文章情報を作成した作成日時を特定し、最古の作成日時から、最新の作成日時までの期間を、担当年数として特定する。
生成部134が、運用者識別情報「OP101」の運用者に対応する、グループ識別情報「G1」の担当回数を判定する処理の一例について説明する。生成部134は、分類テーブル123を参照し、グループ識別情報「G1」に分類された問合せ識別情報群を特定する。生成部134は、特定した問合せ識別情報群に含まれる各問合せ識別情報および運用者識別情報「OP101」の組と、問合せテーブル122とを比較して、ヒットする回答文章識別情報を特定する。生成部134は、ヒットした回答文章識別情報の数を、担当回数として特定する。
生成部134は、運用者識別情報「OP101」の運用者に対応する他のグループ識別情報に関しても、グループ識別情報「G1」と同様にして、担当年数および担当回数を特定する。更に、生成部134は、他の運用者識別情報に対応する担当年数および担当回数についても、同様にして特定する。なお、本実施例では一例として、生成部134が、運用者管理テーブル124を生成する場合について説明したが、これに限定されるものではない。たとえば、運用者が運用者端末20を操作して、運用者管理テーブル124にアクセスし、担当年数および担当回数を登録または修正してもよい。
続いて、生成部134が、校閲ルールテーブル125を生成する処理の一例について説明する。生成部134は、校閲ルールテーブル125を生成する場合に、各回答文章識別情報に対応する信頼度スコアを算出する。たとえば、生成部134は、式(1)に基づいて、信頼度スコアを算出する。
信頼度スコア=担当年数×a+担当回数×b+引用回数×c・・・(1)
式(1)に含まれる担当年数は、回答文章識別情報の回答文章を作成した運用者の担当年数を示すものである。式(1)に含まれる担当回数は、回答文章識別情報の回答文章を作成した運用者の担当回数を示すものである。たとえば、担当年数と、担当回数とは、回答文章を作成した運用者の熟練度であると言える。
たとえば、回答文章識別情報「S1001」の回答文章を作成した運用者の担当年数および担当回数は次のように特定される。生成部134は、問合せテーブル122を基にして、回答文章識別情報「S1001」の運用者識別情報「OP102」と、問合せ識別情報「R1001」とを特定する。生成部134は、問合せ識別情報「R1001」と、分類テーブル123とを比較して、問合せ識別情報「R1001」が属するグループ識別情報「G1」を特定する。生成部134は、運用者識別情報「OP102」およびグループ識別情報「G1」の組と、運用者管理テーブル124とを比較して、担当年数「1」および担当回数「1」を特定する。
式(1)に含まれる引用回数は、回答文章識別情報が引用された回数を示すものである。生成部134は、回答文章識別情報と、回答文章テーブル121とを比較することで、引用回数を特定する。式(1)に含まれるa、b、cは、重み係数であり、予め値が設定されているものとする。
生成部134は、回答文章テーブル121に登録された各回答文章識別情報について、上記処理を繰り返し実行することで、各回答文章識別情報に対応する信頼度スコアを算出する。生成部134は、算出した信頼度スコアを、回答文章テーブル121に登録する。
生成部134は、信頼度スコアを算出した後に、グループ識別情報毎に、校閲ルールを生成し、グループ識別情報と、校閲ルールの情報とを対応付けることで、校閲ルールテーブル125を生成する。
一例として、生成部134が、グループ識別情報「G1」の校閲ルールを生成する処理について説明する。生成部134は、グループ識別情報「G1」と、分類テーブル123とを比較して、グループ識別情報「G1」に含まれる問合せ識別情報群「R1001,R1002,R1003,・・・」を特定する。
生成部134は、特定した問合せ識別情報群「R1001,R1002,R1003,・・・」と、問合せテーブル122と、回答文章テーブル121とを比較して、各問合せ識別情報群に対応する信頼度スコアを特定する。たとえば、問合せ識別情報「R1001」の回答文章識別情報は、図4より「S1001」であり、回答文章識別情報「S1001」の信頼度スコアは「11」である。このため、問合せ識別情報「R1001」に対応する信頼度スコアは「11」となる。生成部134は、他の問合せ識別情報「R1002,R1003,・・・」に対応する信頼度スコアも同様にして、特定する。
生成部134は、問合せ識別情報群「R1001,R1002,R1003,・・・」を、信頼度スコアの大きいものから順にソートし、上位N個の問合せ識別情報を「正解候補問合せ群」として特定する。また、生成部134は、グループ識別情報「G1」に対応する全ての問合せ識別情報を「校閲候補問合せ群」として特定する。
生成部134は、正解候補問合せ群に対応する各回答文章情報に対して同義語を抽出し、抽出した同義語群の中で最も多い用語(または単語)を「正解候補」として特定する。たとえば、生成部134は、同義語群「A1、A2、A3、A4」を抽出し、「A1」の出現頻度が最も多い場合には、「A1」を正解候補として特定する。
ここで、生成部134は、既存の同義語辞書作成支援ツールを用いて、同義語を抽出してもよい。たとえば、生成部134は、回答文章に対し、形態素解析を行い、文章中の各単語の抽出を行う。生成部134は、抽出した単語に対し、任意の単語の前後に出現する単語と出現頻度とから、任意の単語に対する文脈特徴ベクトルを算出する。生成部134は、各単語の文脈特徴ベクトルの類似度を算出し、類似度が閾値以上となる単語同士を、同義語として定義する。生成部134は、文献「寺田昭ほか”同義語辞書作成支援ツール”、[online]、平成30年1月15日検索、インターネット(URL:http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/academic-res/terada-ANLP08.pdf)」に記載された。
生成部134は、校閲候補問合せ群に対応する各回答文章情報に対して同義語を抽出し、抽出した同義語群を「校閲候補」とする。たとえば、校閲候補を「A1、A2、A3、A4、A5、A6」とする。
生成部134は、校閲候補の中から正解候補に含まれる同義語を取り出し、その同義語を含む正解候補と対応付けることで、グループ識別情報「G1」に対応する校閲ルールの情報を生成する。たとえば、「正解候補問合せ群」から抽出された同義語が「A1、A2、A3、A4」であり、正解候補が「A1」であり、「校閲候補問合せ群」から抽出された同義語群を「A1、A2、A3、A4、A5、A6」とする。この場合には、グループ識別情報「G1」に対応する校閲ルールは、正解候補「A1」と、校閲候補「A1、A2、A3、A4、A5、A6」とを対応付けた情報となる。
生成部134は、他のグループ識別情報「G2、G3、G4、・・・」についても、グループ識別情報「G1」と同様にして、校閲ルールの情報を生成する。生成部134は、上記処理を実行することで、校閲ルールテーブル125を生成する。たとえば、生成部134は、上記の処理を定期的に実行し、校閲ルールテーブル125を更新する。
校閲部135は、校閲ルールテーブル125を基にして、回答文章テーブル121に含まれる回答文章を修正する処理部である。校閲部135は、校閲対象となる回答文章情報(問合せ情報)の属するグループ識別情報を特定し、特定したグループ識別情報に対応する校閲ルールを用いて、回答文章情報を修正する。
一例として、校閲部135が、回答文章識別情報「S1001」に対応する回答文章情報を修正する処理を説明する。校閲部135は、回答文章識別情報「S1001」と、問合せテーブル122とを比較して、問合せ識別情報「R1001」を特定する。校閲部135は、問合せ識別情報「R1001」と、分類テーブル123とを比較して、問合せ識別情報「R1001」の属するグループ識別情報「G1」を特定する。このため、校閲部135は、グループ識別情報「G1」に対応する校閲ルールg1を、校閲ルールテーブル125から取得し、校閲ルールg1により、回答文章識別情報「S1001」を修正する。
たとえば、校閲部135は、回答文章識別情報「S1001」の回答文章の各単語と、校閲ルールg1の校閲候補とを比較し、回答文章の各単語のうち、校閲ルールg1の校閲候補と一致する単語が含まれるか否かを判定する。校閲部135は、校閲ルールg1の校閲候補と一致する単語が含まれる場合には、一致した単語と校閲候補の正解候補とを対応付けて表示する校閲確認画面の情報を生成し、運用者端末20に表示させる。
図11は、校閲確認画面の一例を示す図である。図11に示すように、校閲確認画面60は、表示領域61,62,63を有する。表示領域61は、指摘内容と、修正許可選択とを対応付ける。指摘内容は、校閲対象の回答文章に含まれる校閲候補および正解候補を示す項目である。修正許可選択は、校閲候補から正解候補への修正を許可するか否かを示す項目であり、修正を許可する場合には「許可」が設定され、許可しない場合には「否定」が設定される。
表示領域62は、校閲ルールによる修正前の回答文章のプレビューを表示する領域である。表示領域63は、校閲ルールによる修正後の回答文章のプレビューを表示する領域である。
運用者は、校閲確認画面60を参照し、運用者端末20を操作することで、表示領域61の修正許可選択の項目を、指摘内容毎に「許可」または「否定」を設定する。校閲部135は、運用者端末20で設定された修正許可選択の項目に応じて、回答文章を修正し、修正した回答文章のプレビューを、表示領域63に表示させる。運用者は、校閲確認画面60を参照し、表示領域63に表示された回答文章の内容を確定させる場合には、修正ボタン64を押下する。校閲部135は、修正ボタン64の押下を受け付けると、修正後の回答文章の情報により、修正前の回答文章の情報を更新する処理を行う。また、校閲部135は、修正した回答文章を、利用者端末15に通知する。
たとえば、校閲部135は、運用者端末20から、指摘内容毎の「許可」、「否定」に関する情報を受信し、受信した情報を基にして、修正する単語と、修正しない単語とを区別して、回答文章を修正するものとする。
次に、本実施例に係る情報処理装置100の処理手順の一例について説明する。図12は、本実施例に係る情報処理装置が校閲ルールを生成する処理手順を示すフローチャートである。図12に示すように、情報処理装置100の取得部132は、利用者端末15から質問情報を取得する(ステップS101)。取得部132は、運用者端末20から運用者回答情報を取得する(ステップS102)。
取得部132は、問合せ情報を生成し、問合せテーブル122に登録する(ステップS103)。情報処理装置10の分類部133は、サービス情報と利用者識別情報との組を基にして、問合せ情報を複数のグループに分類する(ステップS104)。
情報処理装置100の生成部134は、信頼度スコア算出処理を実行する(ステップS105)。生成部134は、未選択のグループを選択する(ステップS106)。生成部134は、選択したグループに含まれる回答文章について、信頼度スコアを基にして回答文章をソートし、上位N個の回答文章を正解候補問合せ群とする(ステップS107)。
生成部134は、グループ内の全ての回答文章を、校閲候補問合せ群とする(ステップS108)。生成部134は、正解候補組み合わせ群から同義語を抽出し、同義語群の中で最も出現頻度の多い用語(単語)を正解候補に設定する(ステップS109)。
生成部134は、校閲候補問合せ群に対して同義語を抽出し、抽出した同義語群を校閲候補とする(ステップS110)。生成部134は、校閲候補の中から正解候補に含まれる同義語を特定し、特定した同義語を含む正解候補と校閲候補とを対応付けることで、校閲ルールを生成する(ステップS111)。
生成部134は、グループ識別情報と、校閲ルールとを対応付ける(ステップS112)。生成部134は、未選択のグループが存在する場合には(ステップS113,Yes)、ステップS106に移行する。一方、生成部134は、未選択のグループが存在しない場合には(ステップS113,No)、処理を終了する。
続いて、図12のステップS105に示した信頼度スコア算出処理の処理手順について説明する。図13は、信頼度スコア算出処理の処理手順を示すフローチャートである。情報処理装置100の生成部134は、未選択の回答文章を選択する(ステップS201)。回答文章を作成した運用者の担当年数を特定する(ステップS202)。
生成部134は、回答文章を作成した運用者の担当回数を特定する(ステップS203)。生成部134は、回答文章の引用回数を特定する(ステップS204)。生成部134は、担当年数と、担当回数と、引用回数とを基にして、信頼度スコアを算出する(ステップS205)。
生成部134は、未選択の回答文章が存在する場合には(ステップS206,Yes)、ステップS201に移行する。生成部134は、未選択の回答文章が存在しない場合には(ステップS206,No)、信頼度スコア算出処理を終了する。
続いて、情報処理装置100が、校閲ルールに基づいて、回答文章を修正する処理手順について説明する。図14は、情報処理装置が回答文章を修正する処理手順を示すフローチャートである。図14に示すように、情報処理装置100の校閲部135は、運用者回答情報を取得し(ステップS301)、運用者回答情報の回答文章に対応するグループを特定する(ステップS302)。
校閲部135は、グループに対応する校閲ルールを校閲ルールテーブル125から取得する(ステップS303)。校閲部135は、校閲確認画面を生成し(ステップS304)、校閲確認画面を運用者端末20に通知する(ステップS305)。
校閲部135は、校閲確認画面の応答と、校閲ルールとを基にして、運用者回答情報の回答文章を修正する(ステップS306)。校閲部135は、運用者端末20から、運用者回答情報を取得する度に、上記処理を繰り返し実行する。
次に、本実施例に係る情報処理装置100の効果について説明する。情報処理装置100は、事前に、運用者端末20から送信される複数の運用者回答情報を、サービス情報と利用者識別情報との組に基づいて複数のグループに分類し、同一のグループに分類された複数の運用者回答情報を基にして、校閲ルールを生成しておく。そして、情報処理装置100は、校閲対等の運用者回答情報を受け付けた場合に、運用者回答情報に対応するグループを特定し、特定したグループに対応する校閲ルールを用いて、運用者回答情報(回答文章)の単語を修正する。このように、情報処理装置100は、回答文章の校閲精度を高めることができる。
たとえば、サービスAの質問に対する回答文章では「管理者画面」が正解候補で、サービスBの質問に対応する回答文章では「Webコンソール画面」が正解候補である場合でも、各正解候補を、各校閲ルールで区別して定義することができる。このため、サービスAの質問に対応する回答文章を「管理者画面」から「Webコンソール画面」に誤って修正することを抑止できる。
なお、サービスや利用者毎に校閲ルールを分けて作成したとしても、グループ内での出現回数の多さだけでは、適切でない用語が正解候補となる場合がある。たとえば、多数の未熟な運用者を含む複数の運用者で、「Webコンソール画面」を用語として用いるサービスBの運用を行っていた場合、サービスや利用者ごとに校閲ルールを作成するための問合せを抽出した中に、未熟な運用者による「管理者画面」を使用してしまった回答文章が多く含まれてしまうことがある。その結果、「管理者画面」が使用される用語の多数派を占めることとなり、誤った校閲ルールが作成されてしまう。この校閲ルールで校閲を行っても、本来望まれる校閲結果である「Webコンソール画面」ではなく「管理者画面」が候補として出力されてしまう。
これに対して、情報処理装置100は、校閲ルールを生成する場合に、運用者の担当年数、担当回数を用いて、回答文章の信頼度スコアを算出し、信頼度スコアの高い回答文章を基にして、校閲ルールを生成する。このため、未熟な運用者による誤った用語が、正解候補が、校閲ルールに定義されることを抑止して、回答文章の校閲精度を高めることができる。
情報処理装置100は、校閲ルールを生成する場合に、運用者の担当年数、担当回数の他に、回答文章の引用回数を基にして、信頼度スコアを算出し、信頼度スコアの高い回答文章を基にして、校閲ルールを生成する。引用回数の多い回答文章は、より適切な回答文章であると言えるので、より適切な回答文章を用いて、校閲ルールを作成することができる。
情報処理装置100は、校閲ルールを基にして回答文章を修正する場合に、校閲候補と、正解候補とを対応付けて表示を行う。これにより、運用者は、校閲候補を正解候補に修正することが適切か否かを確認することができる。
次に、上記実施例に示した情報処理装置100と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図15は、情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
図15に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザーからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る読み取り装置204と、有線または無線ネットワークを介して収録機器等との間でデータの授受を行うインタフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201〜207は、バス208に接続される。
ハードディスク装置207は、サービス提供プログラム07a、取得プログラム207b、分類プログラム207c、生成プログラム207d、校閲プログラム207eを有する。CPU201は、各プログラム207a〜207eを読み出してRAM206に展開する。
サービス提供プログラム207aは、サービス提供プロセス206aとして機能する。取得プログラム207bは、取得プロセス206bとして機能する。分類プログラム207cは、分類プロセス206cとして機能する。生成プログラム207dは、生成プロセス206dとして機能する。校閲プログラム207dは、校閲プロセス206dとして機能する。
サービス提供プロセス206aの処理は、サービス提供部131の処理に対応する。取得プロセス206bの処理は、取得部132の処理に対応する。分類プロセス206cの処理は、分類部133の処理に対応する。生成プロセス206dの処理は、生成部134の処理に対応する。校閲プロセス206eの処理は、校閲部135の処理に対応する。
なお、各プログラム207a〜207eについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が各プログラム207a〜207eを読み出して実行するようにしても良い。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)複数のサービスに関する複数の問合せに対してそれぞれ作成された複数の回答文を取得し、
取得した前記複数の回答文それぞれを、サービス及び問合せ元の組に応じた複数のグループに分類し、
前記複数のグループのうち、いずれかのグループに分類された回答文に基づき、校閲ルールを生成し、
生成した前記校閲ルールを、前記いずれかのグループに対応するサービス及び問合せ元の組に対応付けて記憶部に記憶し、
いずれかのサービスに関する問合せに対して作成された回答文を新たに受け付けると、前記記憶部を参照して、該サービスおよび該問合せの問合せ元の組に対応付けられた校閲ルールを取得し、
取得した校閲ルールに基づき、新たに受け付けた前記回答文を校閲する
処理をコンピュータが実行することを特徴とする校閲方法。
(付記2)前記校閲ルールを生成する処理は、前記いずれかのグループに分類された回答文に、意味が同じであり、かつ、表記が異なる複数の単語が含まれる場合、前記複数の単語のうち、出現頻度が基準を満たす第1の単語と、前記第1の単語以外の第2の単語とを対応付ける前記校閲ルールを生成することを特徴とする付記1に記載の校閲方法。
(付記3)サービス及び問合せ元が前記いずれかのグループに対応する回答文の校閲要求を受け付けると、生成した前記校閲ルールに基づき、受け付けた前記回答文に前記第2の単語が含まれるか否かの判定を行うとともに、判定結果が肯定的である場合、前記第1の単語を前記第2の単語に対応付けて表示する処理を更に実行することを特徴とする付記2に記載の校閲方法。
(付記4)前記校閲ルールを生成する処理は、回答文の引用履歴情報を記憶する記憶部を参照して、前記いずれかのグループに分類された前記回答文のうち、他の回答文の作成時に引用された回数が基準を満たす回答文を特定し、特定した前記回答文に基づき、前記校閲ルールを生成することを特徴とする付記1、2または3に記載の校閲方法。
(付記5)前記校閲ルールを生成する処理は、前記いずれかのグループに分類された各回答文に関して、前記回答文を作成した作成者の熟練度と、他の回答文の作成時に引用された回数を基にして信頼度を算出し、算出した信頼度に基づいて、前記校閲ルールを生成する際の回答文を特定することを特徴とする付記4に記載の校閲方法。
(付記6)サービスを特定する情報と、該サービスに関する問合せの問合せ元を特定する情報と、該問合せに対する回答文とを受け付け、
サービスを特定する情報及び問合せ元を特定する情報に対応付けて校閲ルールを記憶する記憶部を参照して、受け付けた前記サービスを特定する情報及び前記問合せ元を特定する情報に対応付けられた校閲ルールを取得し、
取得した前記校閲ルールに基づき、受け付けた前記回答文の校閲を実行する、
処理をコンピュータが実行することを特徴とする校閲方法。
(付記7)複数のサービスに関する複数の問合せに対してそれぞれ作成された複数の回答文を取得し、
取得した前記複数の回答文それぞれを、サービス及び問合せ元の組に応じた複数のグループに分類し、
前記複数のグループのうち、いずれかのグループに分類された回答文に基づき、校閲ルールを生成し、
生成した前記校閲ルールを、前記いずれかのグループに対応するサービス及び問合せ元の組に対応付けて記憶部に記憶し、
いずれかのサービスに関する問合せに対して作成された回答文を新たに受け付けると、前記記憶部を参照して、該サービスおよび該問合せの問合せ元の組に対応付けられた校閲ルールを取得し、
取得した校閲ルールに基づき、新たに受け付けた前記回答文を校閲する
処理をコンピュータに実行させることを特徴とする校閲プログラム。
(付記8)前記校閲ルールを生成する処理は、前記いずれかのグループに分類された回答文に、意味が同じであり、かつ、表記が異なる複数の単語が含まれる場合、前記複数の単語のうち、出現頻度が基準を満たす第1の単語と、前記第1の単語以外の第2の単語とを対応付ける前記校閲ルールを生成することを特徴とする付記7に記載の校閲プログラム。
(付記9)サービス及び問合せ元が前記いずれかのグループに対応する回答文の校閲要求を受け付けると、生成した前記校閲ルールに基づき、受け付けた前記回答文に前記第2の単語が含まれるか否かの判定を行うとともに、判定結果が肯定的である場合、前記第1の単語を前記第2の単語に対応付けて表示する処理を更に実行することを特徴とする付記8に記載の校閲プログラム。
(付記10)前記校閲ルールを生成する処理は、回答文の引用履歴情報を記憶する記憶部を参照して、前記いずれかのグループに分類された前記回答文のうち、他の回答文の作成時に引用された回数が基準を満たす回答文を特定し、特定した前記回答文に基づき、前記校閲ルールを生成することを特徴とする付記7、8または9に記載の校閲プログラム。
(付記11)前記校閲ルールを生成する処理は、前記いずれかのグループに分類された各回答文に関して、前記回答文を作成した作成者の熟練度と、他の回答文の作成時に引用された回数を基にして信頼度を算出し、算出した信頼度に基づいて、前記校閲ルールを生成する際の回答文を特定することを特徴とする付記10に記載の校閲プログラム。
(付記12)サービスを特定する情報と、該サービスに関する問合せの問合せ元を特定する情報と、該問合せに対する回答文とを受け付け、
サービスを特定する情報及び問合せ元を特定する情報に対応付けて校閲ルールを記憶する記憶部を参照して、受け付けた前記サービスを特定する情報及び前記問合せ元を特定する情報に対応付けられた校閲ルールを取得し、
取得した前記校閲ルールに基づき、受け付けた前記回答文の校閲を実行する、
処理をコンピュータに実行させることを特徴とする校閲プログラム。
(付記13)複数のサービスに関する複数の問合せに対してそれぞれ作成された複数の回答文を取得する取得部と、
取得した前記複数の回答文それぞれを、サービス及び問合せ元の組に応じた複数のグループに分類する分類部と、
前記複数のグループのうち、いずれかのグループに分類された回答文に基づき、校閲ルールを生成し、生成した前記校閲ルールを、前記いずれかのグループに対応するサービス及び問合せ元の組に対応付けて記憶部に記憶する生成部と、
いずれかのサービスに関する問合せに対して作成された回答文を新たに受け付けると、前記記憶部を参照して、該サービスおよび該問合せの問合せ元の組に対応付けられた校閲ルールを取得し、取得した校閲ルールに基づき、新たに受け付けた前記回答文を校閲する校閲部と
を有することを特徴とする情報処理装置。
(付記14)前記生成部は、前記いずれかのグループに分類された回答文に、意味が同じであり、かつ、表記が異なる複数の単語が含まれる場合、前記複数の単語のうち、出現頻度が基準を満たす第1の単語と、前記第1の単語以外の第2の単語とを対応付ける前記校閲ルールを生成することを特徴とする付記13に記載の情報処理装置。
(付記15)前記校閲部は、サービス及び問合せ元が前記いずれかのグループに対応する回答文の校閲要求を受け付けると、生成した前記校閲ルールに基づき、受け付けた前記回答文に前記第2の単語が含まれるか否かの判定を行うとともに、判定結果が肯定的である場合、前記第1の単語を前記第2の単語に対応付けて表示する処理を更に実行することを特徴とする付記14に記載の情報処理装置。
(付記16)前記生成部は、回答文の引用履歴情報を記憶する記憶部を参照して、前記いずれかのグループに分類された前記回答文のうち、他の回答文の作成時に引用された回数が基準を満たす回答文を特定し、特定した前記回答文に基づき、前記校閲ルールを生成することを特徴とする付記13、14または15に記載の情報処理装置。
(付記17)前記生成部は、前記いずれかのグループに分類された各回答文に関して、前記回答文を作成した作成者の熟練度と、他の回答文の作成時に引用された回数を基にして信頼度を算出し、算出した信頼度に基づいて、前記校閲ルールを生成する際の回答文を特定することを特徴とする付記16に記載の情報処理装置。
(付記18)サービスを特定する情報と、該サービスに関する問合せの問合せ元を特定する情報と、該問合せに対する回答文とを受け付ける取得部と、
サービスを特定する情報及び問合せ元を特定する情報に対応付けて校閲ルールを記憶する記憶部を参照して、受け付けた前記サービスを特定する情報及び前記問合せ元を特定する情報に対応付けられた校閲ルールを取得し、取得した前記校閲ルールに基づき、受け付けた前記回答文の校閲を実行する校閲部と
を有することを特徴とする情報処理装置。