JP6634515B2

JP6634515B2 - 自動質問応答システムにおける質問クラスタリング処理方法及び装置

Info

Publication number: JP6634515B2
Application number: JP2018513838A
Authority: JP
Inventors: 健宗王; 威強袁; 茂▲クン▼ 韓; 京肖
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2016-11-14
Filing date: 2017-08-30
Publication date: 2020-01-22
Anticipated expiration: 2037-08-30
Also published as: US20190073416A1; EP3540612A1; WO2018086401A1; CN107656948B; KR20180077261A; KR102113413B1; JP2019504371A; SG11201802373WA; AU2017329098A1; CN107656948A; AU2017329098B2; EP3540612A4

Description

本発明は、テキスト情報処理分野に関し、特に自動質問応答システムおける質問クラスタリング処理方法及び装置に関する。

自動質問応答システム（ＱｕｅｓｔｉｏｎａｎｄＡｎｓｗｅｒｉｎｇ、ＱＡと略称する）は、知識表示、情報検索と自然言語処理等の技術を綜合に運用し、ユーザによって、自然言語で入力された質問を受信すれば、簡潔で正確な応答をフィードバックすることができるシステムである。自動質問応答システムは、伝統的な検索エンジンと比べて、一層便利で正確という利点を有するので、現在の自然言語処理及び人工知能分野における研究ホット・スポットである。

自動質問応答システムにおいて、一般に、少なくとも一つの問答ペアを記憶する、頻繁に尋ねられる質問プール（Ｆｒｅｑｕｅｎｔｌｙ−ＡｓｋｅｄＱｕｅｓｔｉｏｎ、ＦＡＱと略称する）を事前に設置する必要がある。各問答ペアは、ユーザによって頻繁に尋ねられる質問と応答を含む。自動質問応答システムは、ユーザが質問を入力する時に、頻繁に尋ねられる質問プールに同じ質問があるか判断して、同じ質問が存在する場合、頻繁に尋ねられる質問プールにある相応な応答をユーザにフィードバックすることによって、自動質問応答システムの処理効率と正確率の向上に役立つが、同じ質問がない場合、相応な応答を直接にフィードバックできず、人工に返答したり、又はその他の処理を実施したりしなければならないので、自動質問応答システムの処理効率と正確率が低くなってしまう。自動質問応答システムは、質問返答の正確性及び適時性により、カスタマーサービス及びその他の人工知能分野において広く応用されている。自動質問応答システムが応答を適時に且つ正しく返答する前提は、頻繁に尋ねられる質問プールに相応な問答ペアがあることであり、従って、頻繁に尋ねられる質問プールにおける問答ペアが豊富であれば豊富であるほど且つ範囲が広ければ広いほど、自動質問応答システムにおける質問返答の正確率が高くなり、効率も良くなる。以上述べたところを総合すれば、問答ペアの作成は、自動質問応答システムの核心である。

既存の自動質問応答システムにおいて、問答ペアについて、通常の状況で、作成人員が質問を作成してから、返答人員が質問を解答することによって、質問と応答が対応する問答ペアを形成する。作成人員は、通常の状況で、質問作成時に、自身の経験、知識と記憶等の要素に基づいて考えるので、限界が存在する。従って、作成人員が作成した質問の範囲が制限され、ユーザが注目する質問を、完全に且つ速くカバーできなくなり、これで、頻繁に尋ねられる質問プールに記憶されている問答ペアがユーザニーズを良く満足できなくなり、それに加えて、作成人員が質問を作成するには、大量の人手と時間を掛ける必要があり、効率が低い。

本発明が解決しようとする課題としては、既存の自動質問応答システムにおいて作成人員が作成した質問に存在する質問範囲が制限される欠点に対して、ユーザが注目する質問に対してクラスタリング処理を行うことによって、質問設計の範囲を向上し、問答ペアのスマート化設計を実現する自動質問応答システムおける質問クラスタリング処理方法及び装置を提供することである。

本発明が前記課題を解決する為に採用する技術案は、下記の通りである。

作成人員が入力したクラスタリング請求を受信すること、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得すること、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力すること、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断すること、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断すること、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力することを含む、
自動質問応答システムおける質問クラスタリング処理方法である。

本発明は、作成人員が入力したクラスタリング請求を受信するクラスタリング請求受信ユニットと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するクラスタリング質問集合取得ユニットと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力する特徴抽出ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する分割判断ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する第一処理ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力する第二処理ユニットとを含む、
自動質問応答システムおける質問クラスタリング処理装置を更に提供する。

本発明は、コンピュータープログラムが記憶されたコンピューター可読記憶媒体であって、前記コンピュータープログラムがプロセッサにより実行される時に、
作成人員が入力したクラスタリング請求を受信するステップと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するステップと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力するステップと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力するステップとを実施する、
コンピューター可読記憶媒体を更に提供する。

本発明は、メモリー、プロセッサ、及び前記メモリーに記憶され、且つ前記プロセッサで運行できるコンピュータープログラムを含むサーバーであって、前記プロセッサが前記コンピュータープログラムを実行する時に、
作成人員が入力したクラスタリング請求を受信するステップと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するステップと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力するステップと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力するステップとを実施する、
サーバーを更に提供する。

従来技術と比較して、本発明の利点は下記の通りである。本発明が提供された自動質問応答システムおける質問クラスタリング処理方法及び装置において、クラスタリング請求に基づき、未返答質問のデータベースから、クラスタリング待ち質問集合を取得し、それに加えて、クラスタリング待ち質問集合に対して自動的にクラスタリングを行うことによって、作成人員に質問の問い合わせニーズを了解させ、作成する問答ペアの範囲を向上し、それに加えて、自動質問応答システムの全体的な問答性能を向上することができる。当該自動質問応答システムおける質問クラスタリング処理方法及び装置において、クラスタリング待ち質問集合に対して特徴抽出を行った後の質問特徴集合があらかじめ設定された分割条件に適合するか判断する必要があり、その上、あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して分割クラスタリングを行い、あらかじめ設定された分割条件に適合しない場合、分割クラスタリングを自動に停止することによって、質問特徴集合の動態的な変化の応用シナリオを満足し、階層化クラスタリング処理を実現し、これで、出力するクラスタリングのクラスクラスター内部の質問が比較的相似していることを保証でき、一層良好なクラスタリング効果を得ることができ、それに加えて、パラメータの人工調整に関する煩雑な操作を避けることができる。

以下で、添付図面及び実施形態を合わせて本発明を更に説明する。

本発明の実施形態１に係る自動質問応答システムおける質問クラスタリング処理方法のフローチャートである。本発明の実施形態２に係る自動質問応答システムおける質問クラスタリング処理装置のブロック図である。本発明の一つの実施形態により提供されたサーバーの模式図である。

次に、本発明の技術的特徴、目的及び効果を一層明確に理解する為に、添付図面と照合して本発明の具体的な実施態様を詳細に説明する。

（実施形態１）
図１は、本実施形態に係る自動質問応答システムおける質問クラスタリング処理方法を示す。当該自動質問応答システムは、サーバー、サーバーと通信的に接続するクライアント端末及びバックグラウンド・サービス端末を含む。その中で、サーバー上には、頻繁に尋ねられる質問プールが記憶されている。クライアント端末は、顧客によって自然言語・文字又はその他の形式で入力された質問を受信してサーバーに送信し、それに加えて、サーバーからフィードバックされる応答を受信して表示する。サーバーは、クライアント端末により送信された質問に基づき、頻繁に尋ねられる質問プールに相応な問答ペアがあるかについて問い合わせて、相応な問答ペアがある場合、その応答をクライアント端末に送信し、相応な問答ペアがない場合、質問をバックグランド・サービス端末に送信してバックグランド・サービス端末から送信される応答を受信し、クライアント端末に送信することになる。バックグランド・サービス端末は、作成人員が入力した質問を受信して表示するとともに、サーバーにより送信された質問を受信して表示し、更に、返答人員が入力した応答を受信してサーバーにアップロードする。本実施形態により提供された自動質問応答システムおける質問クラスタリング処理方法は、ユーザがサーバーにアップロードした質問に対してクラスタリングを行うことによって、作成人員が顧客の問い合わせニーズを一層了解するようにし、これで、自動質問応答システムにおける頻繁に尋ねられる質問プール中の問答ペアを完備化させ、自動質問応答システムの全体的な問答性能を向上する。ここで、クラスタリングとは、物理的又は抽象的なオブジェクトの集合を、類似するオブジェクトから構成される複数のクラスに分けるプロセスを指す。その一方で、類似するオブジェクトから構成されるクラスは、クラスタリングのクラスクラスターである。

当該自動質問応答システムおける質問クラスタリング処理方法は、下記ステップを含む。

Ｓ１：作成人員が入力したクラスタリング請求を受信する。作成人員がクラスタリング請求を入力する時に、自動質問応答システムは、クラスタリング請求に基づいてユーザの問い合わせニーズを取得し、これで、自動質問応答システムにおける頻繁に尋ねられる質問プール中の質問を設置することができる。具体的にいうと、バックグランド・サービス端末が、作成人員によって出力されたクラスタリング請求を受信してサーバーに送信する。ここで、クラスタリング請求はＨＴＴＰ請求である。

Ｓ２：クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得する。具体的にいうと、サーバーはクラスタリング請求を受信した後、クラスタリング請求に基づき、未返答質問のデータベースから未返答質問集合を取得し、クラスタリング待ち質問集合として出力する。ここで、クラスタリング待ち質問集合は、少なくとも一つのクラスタリング待ち質問を含み、そして、各クラスタリング待ち質問は、自動質問応答システムにおける未返答質問である。自動質問応答システムにおいて、顧客がクライアント端末を通じて自然言語で入力した質問は、サーバーにアップロードされた後、サーバーにおける頻繁に尋ねられる質問プールに相応な問答ペアがある場合、その応答を直接にクライアント端末にフィードバックし、サーバーにおける頻繁に尋ねられる質問プールに相応な問答ペアがない場合、その応答を直接にクライアント端末にフィードバックすることができない。従って、相応な質問に未返答タグを追加し、それに加えて、未返答タグ付き質問の全てを、未返答質問のデータベースに記憶する。

本実施形態において、クラスタリング請求に基づき、未返答質問のデータベースから、クラスタリング待ち質問集合を取得しており、クラスタリング待ち質問集合における各クラスタリング待ち質問は、それぞれ顧客によってクライアント端末を通じてアップロードされ、且つ自動に返答されていない未返答質問であるので、クラスタリング請求に基づいて取得されたクラスタリング待ち質問集合は顧客が注目する質問を一層表すことができるようにし、クラスタリング待ち質問集合に基いて問答ペアを作成する時に、問答ペアの作成範囲を一層広くすることができる。

一つの具体的な実施態様において、当該クラスタリング請求は時間範囲フィールドを含むことができる。クラスタリング請求に基づいて未返答質問のデータベースからクラスタリング待ち質問集合を取得する時に、クラスタリング請求の時間範囲フィールド内のすべての未返答質問だけを、クラスタリング待ち質問集合として抽出することによって、抽出するクラスタリング待ち質問集合が時間性を持つようにし、更に、作成人員がバックグラウンド・サービス端末を通じていずれかの時間帯内における顧客が注目する質問を了解できるようにする。作成人員がバックグランド・サービス端末を通じてアップロードしたクラスタリング請求は時間範囲フィールドを含んでいない場合、デフォルトとしては、未返答質問のデータベースにおけるすべての未返答質問を、クラスタリング待ち質問集合として取得することが理解できる。

Ｓ３：テキスト特徴抽出アルゴリズムを採用してクラスタリング待ち質問集合に対して、特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力。具体的にいうと、サーバーは、未返答質問のデータベースからクラスタリング待ち質問集合を取得した後、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問に対して特徴抽出を行うことによって、クラスタリング待ち質問集合における自然言語で記憶されているクラスタリング待ち質問を、構造化したコンピューターが識別し処理できる質問特徴集合に転換できる。質問特徴集合における各質問特徴は、それぞれコンピューターが識別できるテキスト情報である。

一つの具体的な実施態様において、ステップＳ３は具体的には下記事項を含む。

Ｓ３１：ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用してクラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力する。ＩＴ−ＩＤＦ（ｔｅｒｍｆｒｅｑｕｅｎｃｙ−ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ、即ち、単語の出現頻度−逆文書出現頻度）アルゴリズムは、情報検索とデータ発掘のためのよく使われる加重アルゴリズムである。ステップＳ３１は具体的には下記のステップを含む。クラスタリング待ち質問集合におけるすべてのクラスタリング待ち質問に含まれている全部の単語に対して、それぞれ単語の出現頻度（ＩＴ）及び逆文書出現頻度（ＩＤＦ）を計算してから、単語の出現頻度（ＩＴ）と逆文書出現頻度（ＩＤＦ）を利用してＩＴ−ＩＤＦ値を計算した後、ＩＴ−ＩＤＦ値に基づいてクラスタリング待ち質問集合に対応する初期特徴集合を確定する。単語の出現頻度（ＩＴ）とは、ある単語が文章に出現する回数と文章の総単語数との商の値を指す。逆文書出現頻度（ＩＤＦ）とは、言語の使用環境を模擬するコーパスの中で、コーパスの文書総数と当該単語を含む文書数との商の値の対数を指す。理解できるものとしては、分母が０である場合を避ける為に（即ち、コーパスの中のすべての文書が当該単語を含まない状況）、分母を、当該単語を含む文書数と一つの定数との和としても良い。ＩＴ−ＩＤＦ値は、単語の出現頻度（ＩＴ）と逆文書出現頻度（ＩＤＦ）との乗積である。理解できるものとしては、いずれかの単語のＩＴ−ＩＤＦ値が高ければ高いほど、その重要性が高くなる。

Ｓ３２：ＬＳＩモデルを採用して、初期特徴集合に対して特徴マッピングを行い、質問特徴集合を出力する。ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルは、一般に文書又はセンテンスを、一つの高次元のスパースベクトルに表す場合に用いられるので、長さが多い質問テキストの中で、ＩＴ−ＩＤＦアルゴリズムだけで、クラスタリング待ち質問集合に対して特徴抽出を行うと、出力する初期特徴集合が質問の特徴を良く表現できないので、ＬＳＩモデルを採用して、初期特徴集合に対して特徴マッピングを行うことによって、最終的な質問特徴集合を出力する必要がある。ここで、ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘ、潜在的意味索引）モデルとは、二つ又は二つ以上の単語が大量に一つの文書に出現すると、二つ又は二つ以上の単語が意味相互関連であると考えることを指す。ＬＳＩモデルで統計を行うことによって、関連単語で一つの潜在的なテーマを構成し、これで単語のクラスタリングを実現し、次元降下の目的を達成できる。

一つの具体的な実施態様において、ステップＳ３の前に、テキスト前処理アルゴリズムで、クラスタリング待ち質問集合に対して、前処理を行うことを更に含む。テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含む。中国語の単語分割（ＣｈｉｎｅｓｅＷｏｒｄＳｅｇｍｅｎｔａｔｉｏｎ）とは、一つの漢字配列を、一つ一つの単独的な単語に分割することを指す。ストップワード（ＳｔｏｐＷｏｒｄｓ）とは、自然言語データを処理する時に、自動的に濾過された一部分の字又は単語（例えば、英文字、数字、数字記号、標識記号及び使用頻度が特に高い単一な漢字等）を指す。テキスト前処理アルゴリズムを採用して、クラスタリング待ち質問に対して前処理を行うことによって、記憶スペースの節約及び処理効率の向上に有利である。本実施形態において、テキスト前処理アルゴリズムでクラスタリング待ち質問集合に対して前処理を行うことの良否は、その後、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問集合に対して特徴抽出を行うことの効果に直接に影響を与える。

Ｓ４：質問特徴集合が、あらかじめ設定された分割条件に適合するか判断する。具体的にいうと、サーバーが、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問に対して特徴抽出を行い、それに加えて、質問特徴集合を出力した後、質問特徴集合を若干の質問特徴部分集合に分割できるかどうか確定するために、質問特徴集合があらかじめ設定された分割条件に適合するか判断する必要がある。

一つの具体的な実施態様において、ステップＳ４は具体的には下記事項を含む。質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が、各質問特徴部分集合のすべての点から分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないことになる。ここで、最初クラスタリング中心が質問特徴集合のクラスタリング中心である。

その他の一つの具体的な実施態様において、ステップＳ４は具体的には下記事項を含む。質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことになる。当該具体的な実施態様に採用される策略は、一つの質問特徴集合における質問特徴数量が、あらかじめ設定された分割数量を上回るか判断する場合、質問特徴集合における質問特徴数量が、あらかじめ設定された分割数量を上回る場合だけで、継続的に分割できる。本実施形態において、あらかじめ設定された分割数量は、未返答質問のデータベースにおけるすべての質問数量の平方根であっても良い。

Ｓ５：あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、質問特徴部分集合を、質問特徴集合に更新し、それに加えて、質問特徴集合があらかじめ設定された分割条件に適合するか判断する。サーバーは、質問特徴集合があらかじめ設定された分割条件に適合すると判断する場合、Ｋ−ｍｅａｎｓアルゴリズム、Ｋ−ｍｅｄｏｉｄｓアルゴリズムとＣＬＡＲＡＮＳアルゴリズム等の分割クラスタリングアルゴリズムを採用して、質問特徴集合に対して分割クラスタリングを行うことによって、質問特徴集合を、少なくとも二つの質問特徴部分集合に分割し、それに加えて、いずれかの質問特徴部分集合を、質問特徴集合に更新し、更にステップＳ４を繰り返す。

本実施形態により提供された自動質問応答システムおける質問クラスタリング処理方法において、質問特徴集合での質問特徴が短いテキストであり、Ｋ−ｍｅａｎｓアルゴリズムを採用して質問特徴集合に対して分割クラスタリングを行う時に、Ｋの値を２にして、毎回質問特徴集合を、二つの質問特徴部分集合に区分し、それに加えて、各質問特徴部分集合を、質問特徴集合に更新した後、ステップＳ４を繰り返す。Ｋ−ｍｅａｎｓアルゴリズムでは、通常の状況で、Ｋの値を事前に指定する必要があり、運行中に動態的に調整できないが、クラスタリング請求に基づいて取得されたクラスタリング待ち質問集合が動態的に変化しており、相応的な質問特徴集合も動態的に変化しているので、事前に指定されたＫ値が、動態的に変化している質問特徴集合に適用できない。従って、当該具体的な実施態様の中で、質問特徴集合があらかじめ設定された分割条件に適合するか事前に判断する必要があり、そして、あらかじめ設定された分割条件に適合する場合だけで、Ｋ−ｍａｅｎｓアルゴリズムで分割クラスタリングを行うことによって、質問特徴集合の動態的な変化要求を満足するようにする。

Ｓ６：あらかじめ設定された分割条件に適合しない場合、質問特徴集合をクラスタリングのクラスクラスターとして出力する。サーバーは、質問特徴集合があらかじめ設定された分割条件に適合しないと判断する場合、質問特徴集合をクラスタリングのクラスクラスターとしてバックグランド・サービス端末に出力する。ここで、クラスタリングのクラスクラスターが最小単位の質問である。クラスタリングのクラスクラスターをバックグランド・サービス端末に送信した後、バックグランド・サービス端末が、クラスタリングのクラスクラスターを受信して表示することによって、作成人員がクラスタリングのクラスクラスターに基いて顧客の問い合わせニーズを一層了解するようにし、これで、作成人員が新しい問答ペアを設計し、それを、頻繁に尋ねられる質問プールに記憶する。

Ｓ７：クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶する。テキスト前処理アルゴリズムでクラスタリング待ち質問集合に対して前処理を行い、またテキスト特徴抽出アルゴリズムでクラスタリング待ち質問集合に対して特徴抽出を行った後、出力するクラスタリングのクラスクラスターは、未返答質問のデータベースから取得されたクラスタリング待ち質問とテキスト形式が異なるので、クラスタリングのクラスクラスターとクラスタリング待ち質問を関係付け、それに加えて、クラスタリングのクラスクラスターを、クラスタリング質問のデータベースにおけるフィールドと一致的な形式に処理するように、クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行う必要があり、これで、クラスタリングのクラスクラスターを、クラスタリング質問のデータベースに一層便利に記憶できる。

本実施形態により提供された自動質問応答システムおける質問クラスタリング処理方法において、クラスタリング請求に基づき、未返答質問のデータベースから、クラスタリング待ち質問集合を取得し、それに加えて、クラスタリング待ち質問集合に対して自動的にクラスタリングを行うことによって、作成人員に質問の問い合わせニーズを了解させ、作成する問答ペアの範囲を向上し、それに加えて、全体的な問答性能を向上することができる。当該自動質問応答システムおける質問クラスタリング処理方法において、クラスタリング待ち質問集合に対して特徴抽出を行った後の質問特徴集合があらかじめ設定された分割条件に適合するか判断する必要があり、その上、あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して分割クラスタリングを行い、あらかじめ設定された分割条件に適合しない場合、分割クラスタリングを自動に停止することによって、質問特徴集合の動態的な変化の応用シナリオを満足し、階層化クラスタリング処理を実現し、これで、出力するクラスタリングのクラスクラスター内部の質問が比較的相似していることを保証でき、一層良好なクラスタリング効果を得ることができ、それに加えて、パラメータの人工調整に関する煩雑な操作を避けることができる。

（実施形態２）
図２は、本実施形態に係る自動質問応答システムおける質問クラスタリング処理装置を示す。当該自動質問応答システムは、サーバー、サーバーと通信的に接続するクライアント端末及びバックグラウンド・サービス端末を含む。その中で、サーバー上には、頻繁に尋ねられる質問プールが記憶されている。クライアント端末は、顧客によって自然言語・文字又はその他の形式で入力された質問を受信してサーバーに送信し、それに加えて、サーバーからフィードバックされる応答を受信して表示する。サーバーは、クライアント端末により送信された質問に基づき、頻繁に尋ねられる質問プールに相応な問答ペアがあるかについて問い合わせて、相応な問答ペアがある場合、その応答をクライアント端末に送信し、相応な問答ペアがない場合、質問をバックグランド・サービス端末に送信してバックグランド・サービス端末から送信される応答を受信し、クライアント端末に送信することになる。バックグランド・サービス端末は、作成人員が入力した質問を受信して表示するとともに、サーバーにより送信された質問を受信して表示し、更に、返答人員が入力した応答を受信してサーバーにアップロードする。本実施形態により提供された自動質問応答システムおける質問クラスタリング処理装置は、ユーザがサーバーにアップロードした質問に対してクラスタリングを行うことによって、作成人員が顧客の問い合わせニーズを一層了解するようにし、これで、自動質問応答システムにおける頻繁に尋ねられる質問プール中の問答ペアを完備化させ、自動質問応答システムの全体的な応答性能を向上する。ここで、クラスタリングとは、物理的又は抽象的なオブジェクトの集合を、類似するオブジェクトから構成される複数のクラスに分けるプロセスを指す。その一方で、類似するオブジェクトから構成されるクラスは、クラスタリングのクラスクラスターである。当該自動質問応答システムおける質問クラスタリング処理装置は、クラスタリング請求受信ユニット１０と、クラスタリング質問集合取得ユニット２０と、特徴抽出ユニット３０と、分割判断ユニット４０と、第一処理ユニット５０と、第二処理ユニット６０と、前処理ユニット７０と、マッチング処理ユニット８０とを含む。

クラスタリング請求の受取ユニット１０は、作成人員が入力したクラスタリング請求を受信する。作成人員がクラスタリング請求を入力する時に、自動質問応答システムは、クラスタリング請求に基づいてユーザの問い合わせニーズを取得し、これで、自動質問応答システムにおける頻繁に尋ねられる質問プール中の質問を設置することができる。具体的にいうと、バックグランド・サービス端末が、作成人員によって出力されたクラスタリング請求を受信してサーバーに送信する。ここで、クラスタリング請求はＨＴＴＰ請求である。

クラスタリング質問集合取得ユニット２０は、クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得する。具体的にいうと、サーバーはクラスタリング請求を受信した後、クラスタリング請求に基づき、未返答質問のデータベースから未返答質問集合を取得し、クラスタリング待ち質問集合として出力する。ここで、クラスタリング待ち質問集合は、少なくとも一つのクラスタリング待ち質問を含み、そして、各クラスタリング待ち質問は、自動質問応答システムにおける未返答質問である。自動質問応答システムにおいて、顧客がクライアント端末を通じて自然言語で入力した質問は、サーバーにアップロードされた後、サーバーにおける頻繁に尋ねられる質問プールに相応な問答ペアがある場合、その応答を直接にクライアント端末にフィードバックし、サーバーにおける頻繁に尋ねられる質問プールに相応な問答ペアがない場合、その応答を直接にクライアント端末にフィードバックすることができない。従って、相応な質問に未返答タグを追加し、それに加えて、すべての未返答タグ付き質問を、未返答質問のデータベースに記憶する。

本実施形態において、クラスタリング請求に基づき、未返答質問のデータベースから、クラスタリング待ち質問集合を取得しており、クラスタリング待ち質問集合における各クラスタリング待ち質問は、それぞれ顧客によってクライアント端末を通じてアップロードされ、且つ自動に返答されていない未返答質問であるので、クラスタリング請求に基づいて取得されたクラスタリング待ち質問集合は、顧客が注目する質問を一層表すことができるようにし、クラスタリング待ち質問集合に基いて問答ペアを作成する時に、問答ペアの作成範囲を一層広くすることができる。

一つの具体的な実施態様において、当該クラスタリング請求は時間範囲フィールドを含むことができる。クラスタリング請求に基づいて未返答質問のデータベースからクラスタリング待ち質問集合を取得する時に、クラスタリング請求における時間範囲フィールド内のすべての未返答質問だけを、クラスタリング待ち質問集合として抽出することによって、抽出するクラスタリング待ち質問集合が時間性を持つようにし、更に、作成人員がバックグラウンド・サービス端末を通じていずれかの時間帯内における顧客が注目する質問を了解できるようにする。作成人員がバックグランド・サービス端末を通じてアップロードしたクラスタリング請求は時間範囲フィールドを含んでいない場合、デフォルトとしては、未返答質問のデータベースにおけるすべての未返答質問を、クラスタリング待ち質問集合として取得することが理解できる。

特徴抽出ユニット３０は、テキスト特徴抽出アルゴリズムを採用してクラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力する。具体的にいうと、サーバーは、未返答質問のデータベースからクラスタリング待ち質問集合を取得した後、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問に対して特徴抽出を行うことによって、クラスタリング待ち質問集合における自然言語で記憶されているクラスタリング待ち質問を、構造化したコンピューターが識別し処理できる質問特徴集合に転換できる。質問特徴集合における各質問特徴は、それぞれコンピューターが識別できるテキスト情報である。

一つの具体的な実施態様において、特徴抽出ユニット３０は特徴抽出サブユニット３１と特徴マッピング・サブユニット３２を含む。

特徴抽出サブユニット３１は、ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用してクラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力する。ＩＴ−ＩＤＦ（ｔｅｒｍｆｒｅｑｕｅｎｃｙ−ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ、即ち、単語の出現頻度−逆文書出現頻度）アルゴリズムは、情報検索とデータ発掘のためのよく使われる加重アルゴリズムである。特徴抽出サブユニット３１は、具体的には、クラスタリング待ち質問集合におけるすべてのクラスタリング待ち質問に含まれている全部の単語に対して、それぞれ単語の出現頻度（ＩＴ）と逆文書出現頻度（ＩＤＦ）を計算してから、単語の出現頻度（ＩＴ）と逆文書出現頻度（ＩＤＦ）を利用してＩＴ−ＩＤＦ値を計算した後、ＩＴ−ＩＤＦ値に基づいてクラスタリング待ち質問集合に対応する初期特徴集合を確定する。単語の出現頻度（ＩＴ）とは、ある単語が文章に出現する回数と文章の総単語数との商の値を指す。逆文書出現頻度（ＩＤＦ）とは、言語の使用環境を模擬するコーパスの中で、コーパスの文書総数と当該単語を含む文書数との商の値の対数を指す。理解できるものとしては、分母が０である場合を避ける為に（即ち、コーパスの中のすべての文書が当該単語を含まない状況）、分母を、当該単語を含む文書数と一つの定数との和としても良い。ＩＴ−ＩＤＦ値は、単語の出現頻度（ＩＴ）と逆文書出現頻度（ＩＤＦ）との乗積である。理解できるものとしては、いずれかの単語のＩＴ−ＩＤＦ値が高かければ高いほど、その重要性が高くなる。

特徴マッピング・サブユニット３２はＬＳＩモデルを採用して、初期特徴集合に対して特徴マッピングを行い、質問特徴集合を出力する。ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルは、一般に文書又はセンテンスを、一つの高次元のスパースベクトルに表す場合に用いられるので、長さが多い質問テキストの中で、ＩＴ−ＩＤＦアルゴリズムだけで、クラスタリング待ち質問集合に対して特徴抽出を行うと、出力する初期特徴集合が質問の特徴を良く表現できないので、ＬＳＩモデルを採用して、初期特徴集合に対して特徴マッピングを行うことによって、最終的な質問特徴集合を出力する必要がある。ここで、ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘ、潜在的意味索引）モデルとは、二つ又は二つ以上の単語が大量に一つの文書に出現すると、二つ又は二つ以上の単語が意味相互関連であると考えることを指す。ＬＳＩモデルで統計を行うことによって、関連単語で一つの潜在的なテーマを構成し、これで単語のクラスタリングを実現し、次元降下の目的を達成できる。

一つの具体的な実施態様において、当該自動質問応答システムおける質問クラスタリング処理装置は、テキスト前処理アルゴリズムを採用してクラスタリング待ち質問集合に対して前処理を行う前処理ユニット７０を更に含む。テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割（ＣｈｉｎｅｓｅＷｏｒｄＳｅｇｍｅｎｔａｔｉｏｎ）及びストップワードの除去の中の少なくとも一種を含む。中国語の単語分割（ＣｈｉｎｅｓｅＷｏｒｄＳｅｇｍｅｎｔａｔｉｏｎ）とは、一つの漢字配列を、一つ一つの単独的な単語に分割することを指す。ストップワード（ＳｔｏｐＷｏｒｄｓ）とは、自然言語データを処理する時に、自動的に濾過された一部分の字又は単語（例えば、英文字、数字、数字記号、標識記号及び使用頻度が特に高い単一な漢字等）を指す。テキスト前処理アルゴリズムを採用して、クラスタリング待ち質問に対して前処理を行うことによって、記憶スペースの節約及び処理効率の向上に有利である。本実施形態において、テキスト前処理アルゴリズムでクラスタリング待ち質問集合に対して前処理を行うことの良否は、その後、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問集合に対して特徴抽出を行うことの効果に直接に影響を与える。

分割判断ユニット４０は、質問特徴集合が、あらかじめ設定された分割条件に適合するか判断する。具体的にいうと、サーバーが、テキスト特徴抽出アルゴリズムを採用して、クラスタリング待ち質問に対して特徴抽出を行い、それに加えて、質問特徴集合を出力した後、質問特徴集合を若干の質問特徴部分集合に分割できるかどうか確定するために、質問特徴集合があらかじめ設定された分割条件に適合するか判断する必要がある。

一つの具体的な実施態様において、分割判断ユニット４０は第一判断ユニット４１であっても良い。第一判断ユニット４１は、質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が、各質問特徴部分集合のすべての点から分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないことになる。ここで、最初クラスタリング中心が質問特徴集合のクラスタリング中心である。

その他の一つの具体的な実施態様において、分割判断ユニット４０は第二判断ユニット４２であっても良い。第二判断ユニット４２は、質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことになる。当該具体的な実施態様に採用される策略は、一つの質問特徴集合における質問特徴数量が、あらかじめ設定された分割数量を上回るか判断する場合、質問特徴集合における質問特徴数量が、あらかじめ設定された分割数量を上回る場合だけで、継続に分割できる。本実施形態において、あらかじめ設定された分割数量は、未返答質問のデータベースにおけるすべての質問数量の平方根であっても良い。

第一処理ユニット５０は、質問特徴集合があらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、質問特徴部分集合を、質問特徴集合に更新し、それに加えて、質問特徴集合があらかじめ設定された分割条件に適合するか判断する。サーバーは、質問特徴集合があらかじめ設定された分割条件に適合すると判断する場合、Ｋ−ｍｅａｎｓアルゴリズム、Ｋ−ｍｅｄｏｉｄｓアルゴリズムとＣＬＡＲＡＮＳアルゴリズム等の分割クラスタリングアルゴリズムを採用して、質問特徴集合に対して分割クラスタリングを行うことによって、質問特徴集合を、少なくとも二つの質問特徴部分集合に分割し、それに加えて、いずれかの質問特徴部分集合を、質問特徴集合に更新し、更に分割判断ユニット４０に移行する。

本実施形態により提供された自動質問応答システムおける質問クラスタリング処理装置において、質問特徴集合での質問特徴が短いテキストであり、Ｋ−ｍｅａｎｓアルゴリズムを採用して質問特徴集合に対して分割クラスタリングを行う時に、Ｋの値を２にし、毎回質問特徴集合を、二つの質問特徴部分集合に区分し、それに加えて、各質問特徴部分集合を、質問特徴集合に更新した後、分割判断ユニット４０に移行する。Ｋ−ｍｅａｎｓアルゴリズムでは、通常の状況で、Ｋの値を事前に指定する必要があり、運行中に動態的に調整できないが、クラスタリング請求に基づいて取得されたクラスタリング待ち質問集合が動態的に変化しており、相応的な質問特徴集合も動態的に変化しているので、事前に指定されたＫ値が、動態的に変化している質問特徴集合に適用できない。従って、当該具体的な実施態様の中で、質問特徴集合があらかじめ設定された分割条件に適合するか事前に判断する必要があり、そして、あらかじめ設定された分割条件に適合する場合だけで、Ｋ−ｍａｅｎｓアルゴリズムで分割クラスタリングを行うことによって、質問特徴集合の動態的な変化要求を満足するようにする。

第二処理ユニット６０は、質問特徴集合があらかじめ設定された分割条件に適合しない場合、質問特徴集合をクラスタリングのクラスクラスターとして出力する。サーバーは、質問特徴集合があらかじめ設定された分割条件に適合しないと判断する場合、質問特徴集合をクラスタリングのクラスクラスターとしてバックグランド・サービス端末に出力する。ここで、クラスタリングのクラスクラスターが最小単位の質問である。クラスタリングのクラスクラスターをバックグランド・サービス端末に送信した後、バックグランド・サービス端末が、クラスタリングのクラスクラスターを受信して表示し、そして、質問特徴集合における質問特徴数量が、あらかじめ設定された分割数量を上回る場合だけで、継続的に分割できる。本実施形態において、あらかじめ設定された分割数量は、未返答質問のデータベースにおけるすべての質問数量の平方根であっても良い。

マッチング処理ユニット８０は、クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶する。テキスト前処理アルゴリズムでクラスタリング待ち質問集合に対して前処理を行い、またテキスト特徴抽出アルゴリズムでクラスタリング待ち質問集合に対して特徴抽出を行った後、出力するクラスタリングのクラスクラスターは、未返答質問のデータベースから取得されたクラスタリング待ち質問とテキスト形式が異なるので、クラスタリングのクラスクラスターとクラスタリング待ち質問を関係付け、それに加えて、クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行うことによって、クラスタリングのクラスクラスターを、クラスタリング質問のデータベースにおけるフィールドと一致的な形式に処理する必要がある。これで、クラスタリングのクラスクラスターを、クラスタリング質問のデータベースに一層便利に記憶できる。

本実施形態により提供された自動質問応答システムおける質問クラスタリング処理装置において、クラスタリング請求に基づき、未返答質問のデータベースから、クラスタリング待ち質問集合を取得し、それに加えて、クラスタリング待ち質問集合に対して自動的にクラスタリングを行うことによって、作成人員に質問の問い合わせニーズを了解させ、作成する問答ペアの範囲を向上し、それに加えて、全体的な問答性能を向上することができる。当該自動質問応答システムおける質問クラスタリング処理装置において、クラスタリング待ち質問集合に対して特徴抽出を行った後の質問特徴集合があらかじめ設定された分割条件に適合するか判断する必要があり、その上、あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して分割クラスタリングを行い、あらかじめ設定された分割条件に適合しない場合、分割クラスタリングを自動に停止することによって、質問特徴集合の動態的な変化の応用シナリオを満足し、階層化クラスタリング処理を実現し、これで、出力するクラスタリングのクラスクラスター内部の質問が比較的相似していることを保証でき、一層良好なクラスタリング効果を得ることができ、それに加えて、パラメータの人工調整に関する煩雑な操作を避けることができる。

図３は、本発明の一つの実施形態により提供されたサーバーの模式図である。図３に示すように、本実施形態のサーバー３は、プロセッサ３０、メモリー３１、及び前記メモリー３１に記憶され、且つ前記プロセッサ３０で運行できるコンピュータープログラム３２を含んでおり、ここで、コンピュータープログラム３２は、例えば前記自動質問応答システムにおける質問クラスタリング処理方法を実行するプログラムである。前記プロセッサ３０が前記コンピュータープログラム３２を実行する時に、前記各自動質問応答システムおける質問クラスタリング処理方法の実施形態でのステップ（例えば、図１に示すようなステップＳ１〜Ｓ７）を実施する。又は、前記プロセッサ３０が前記コンピュータープログラム３２を実行する時に、前記各装置の実施形態での各モジュール／ユニットの機能（例えば、図２に示すようなユニット１０〜８０の機能）を実施する。

例示としては、前記コンピュータープログラム３２を、前記メモリー３１に記憶され且つ前記プロセッサ３０で実行される一つ又は複数のモジュール／ユニットに分割することによって、本発明を達成する。前記一つ又は複数のモジュール／ユニットは、特定機能を完成できる一連のコンピュータープログラムの指令セグメントであっても良い。本指令セグメントは、前記コンピュータープログラム３２の前記サーバー３における実行プロセスを記述するためのものである。

前記サーバー３は、ローカル・サーバーやクラウドサーバー等のコンピューティング設備であっても良い。前記サーバーはプロセッサ３０とメモリー３１を含んでもよいが、これらに限らない。本分野の技術者が理解できるものとして、図３がサーバー３の例示だけであり、サーバー３に対する限定を構成しなく、図示するより多い又は少ない構成要素を含み、あるいは幾らかの構成要素又は異なる構成要素を組合せても良い。例えば、前記サーバーは入力・出力設備、ネットワーク・アクセス設備、バス等を含んでも良い。

前記プロセッサ３０は中央処理装置（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ，ＣＰＵ）であってもいいし、又はその他の汎用プロセッサ、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ，ＤＳＰ）、専用集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ，ＡＳＩＣ）、既存プログラマブル・ゲートアレイ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ，ＦＰＧＡ）又はその他のプログラマブルロジック素子、分割ゲート又はトランジスター・ロジック素子、分割ハードウェア部品等であってもよい。汎用プロセッサは、マイクロ・プロセッサであっても良いし、又は当該プロセッサが、如何なる通常のプロセッサ等であっても良い。

前記メモリー３１は、前記サーバー３の内部記憶ユニット（例えば、サーバー３のハードディスク又は内部メモリー）であっても良いし、前記サーバー３の外部記憶装置（例えば、サーバー３に配置されているソケット式ハードディスク又はスマートメディア・カード（ＳｍａｒｔＭｅｄｉａ（登録商標）Ｃａｒｄ，ＳＭＣ）、セキュアデジタル（ＳｅｃｕｒｅＤｉｇｉｔａｌ，ＳＤ）カード、フラッシュカード（ＦｌａｓｈＣａｒｄ）等）であっても良い。さらに、前記メモリー３１は、前記サーバー３の内部記憶ユニットと外部記憶装置を同時に含んでも良い。前記メモリー３１は、前記コンピュータープログラム及び前記サーバーに必要なその他のプログラムとデータを記憶する。前記メモリー３１も、すでに出力したデータ又は出力する予定のデータを暫時に記憶できる。

所属分野における技術者が明らかに了解するように、説明の便利性と簡潔さの為に、前記説明したシステム、装置とユニットの具体的な作動プロセスについて、前記方法の実施形態における相応なプロセスを参照できるので、ここではくどくど述べない。

以上に述べたように、前記実施形態は本発明の技術案を説明するだけで、これを制限するものではない。前記実施形態を参照して本発明を詳細に説明したが、本分野における普通の技術者にとって、前記各実施形態に記載されている技術案を修正し、又はその中の一部分の技術特徴に対して同等な置き換えを行うこともでき、そして、これらの修正又は置き換えが、相応な技術案の本質を、本発明の各実施形態の技術案の要旨と範囲から離脱させないことを理解すべきである。

（付記）
（付記１）
作成人員が入力したクラスタリング請求を受信することと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得することと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力することと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力することとを含む、
ことを特徴とする自動質問応答システムおける質問クラスタリング処理方法。

（付記２）
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することは、
前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないこと、
又は、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことを含む、
ことを特徴とする付記１に記載の自動質問応答システムおける質問クラスタリング処理方法。

（付記３）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、質問特徴集合を出力することは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力することと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力することとを含む、
ことを特徴とする付記１に記載の自動質問応答システムおける質問クラスタリング処理方法。

（付記４）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行う前に、テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行うことを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする付記１に記載の自動質問応答システムおける質問クラスタリング処理方法。

（付記５）
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶することを更に含む、
ことを特徴とする付記１に記載の自動質問応答システムおける質問クラスタリング処理方法。

（付記６）
作成人員が入力したクラスタリング請求を受信するクラスタリング請求受信ユニットと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するクラスタリング質問集合取得ユニットと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力する特徴抽出ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する分割判断ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する第一処理ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力する第二処理ユニットとを含む、
ことを特徴とする自動質問応答システムおける質問クラスタリング処理装置。

（付記７）
前記分割判断ユニットは第一判断ユニット又は第二判断ユニットを含んでおり、
前記第一判断ユニットが、前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないことになり、
前記第二判断ユニットが、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことになる、
ことを特徴とする付記６に記載の自動質問応答システムおける質問クラスタリング処理装置。

（付記８）
前記特徴抽出ユニットは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力する特徴抽出サブユニットと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力する特徴マッピング・サブユニットとを含む、
ことを特徴とする付記６に記載の自動質問応答システムおける質問クラスタリング処理装置。

（付記９）
テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行う前処理ユニットを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする付記６に記載の自動質問応答システムおける質問クラスタリング処理装置。

（付記１０）
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶するマッチング処理ユニットを更に含む、
ことを特徴とする付記６に記載の自動質問応答システムおける質問クラスタリング処理装置。

（付記１１）
コンピュータープログラムが記憶されたコンピューター可読記憶媒体であって、前記コンピュータープログラムがプロセッサにより実行される時に、
作成人員が入力したクラスタリング請求を受信するステップと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するステップと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力するステップと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力するステップとを実施する、
ことを特徴とするコンピューター可読記憶媒体。

（付記１２）
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップは、
前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないこと、
又は、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことを含む、
ことを特徴とする付記１１に記載のコンピューター可読記憶媒体。

（付記１３）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、質問特徴集合を出力するステップは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力することと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力することとを含む、
ことを特徴とする付記１１に記載のコンピューター可読記憶媒体。

（付記１４）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行う前に、テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行うステップを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする付記１１に記載のコンピューター可読記憶媒体。

（付記１５）
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶するステップを更に含む、
ことを特徴とする付記１１に記載のコンピューター可読記憶媒体。

（付記１６）
メモリー、プロセッサ、及び前記メモリーに記憶され、且つ前記プロセッサで運行できるコンピュータープログラムを含むサーバーであって、前記プロセッサが前記コンピュータープログラムを実行する時に、
作成人員が入力したクラスタリング請求を受信するステップと、
前記クラスタリング請求に基づき、未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するステップと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力するステップと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力するステップとを実施する、
ことを特徴とするサーバー。

（付記１７）
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップは、
前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないこと、
又は、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことを含む、
ことを特徴とする付記１６に記載のサーバー。

（付記１８）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、質問特徴集合を出力するステップは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力することと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力することとを含む、
ことを特徴とする付記１６に記載のサーバー。

（付記１９）
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行う前に、テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行うステップを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする付記１６に記載のサーバー。

（付記２０）
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶するステップを更に含む、
ことを特徴とする付記１６に記載のサーバー。

１０クラスタリング請求受信ユニット、
２０クラスタリング質問集合取得ユニット、
３０特徴抽出ユニット、
３１特徴抽出サブユニット、
３２特徴マッピング・サブユニット、
４０分割判断ユニット、
４１第一判断ユニット、
４２第二判断ユニット、
５０第一処理ユニット、
６０第二処理ユニット、
７０前処理ユニット、
８０マッチング処理ユニット。

Claims

作成人員が入力したクラスタリング請求を受信することと、
前記クラスタリング請求に基づき、質問プールの問答ペアを用いて自動的に返答できなかった質問である未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得することと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力することと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力することとを含む、
ことをコンピュータが実行することを特徴とする自動質問応答システムおける質問クラスタリング処理方法。
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断することは、
前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないこと、
又は、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことを含む、
ことを特徴とする請求項１に記載の自動質問応答システムおける質問クラスタリング処理方法。
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、質問特徴集合を出力することは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力することと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力することとを含む、
ことを特徴とする請求項１に記載の自動質問応答システムおける質問クラスタリング処理方法。
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行う前に、テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行うことを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする請求項１に記載の自動質問応答システムおける質問クラスタリング処理方法。
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶することを更に含む、
ことを特徴とする請求項１に記載の自動質問応答システムおける質問クラスタリング処理方法。
作成人員が入力したクラスタリング請求を受信するクラスタリング請求受信ユニットと、
前記クラスタリング請求に基づき、質問プールの問答ペアを用いて自動的に返答できなかった質問である未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するクラスタリング質問集合取得ユニットと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力する特徴抽出ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する分割判断ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断する第一処理ユニットと、
前記質問特徴集合があらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力する第二処理ユニットとを含む、
ことを特徴とする自動質問応答システムおける質問クラスタリング処理装置。
前記分割判断ユニットは第一判断ユニット又は第二判断ユニットを含んでおり、
前記第一判断ユニットが、前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないことになり、
前記第二判断ユニットが、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことになる、
ことを特徴とする請求項６に記載の自動質問応答システムおける質問クラスタリング処理装置。
前記特徴抽出ユニットは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力する特徴抽出サブユニットと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力する特徴マッピング・サブユニットとを含む、
ことを特徴とする請求項６に記載の自動質問応答システムおける質問クラスタリング処理装置。
テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行う前処理ユニットを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする請求項６に記載の自動質問応答システムおける質問クラスタリング処理装置。
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶するマッチング処理ユニットを更に含む、
ことを特徴とする請求項６に記載の自動質問応答システムおける質問クラスタリング処理装置。
メモリー、プロセッサ、及び前記メモリーに記憶され、且つ前記プロセッサで運行できるコンピュータープログラムを含むサーバーであって、前記プロセッサが前記コンピュータープログラムを実行する時に、
作成人員が入力したクラスタリング請求を受信するステップと、
前記クラスタリング請求に基づき、質問プールの問答ペアを用いて自動的に返答できなかった質問である未返答質問のデータベースから、少なくとも一つのクラスタリング待ち質問を含むクラスタリング待ち質問集合を取得するステップと、
テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、少なくとも一つの質問特徴を含む質問特徴集合を出力するステップと、
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合する場合、分割クラスタリングアルゴリズムを採用して、前記質問特徴集合に対して分割クラスタリングを行い、少なくとも二つの質問特徴部分集合を出力し、その上、前記質問特徴部分集合を、質問特徴集合に更新し、それに加えて、前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップと、
あらかじめ設定された分割条件に適合しない場合、前記質問特徴集合をクラスタリングのクラスクラスターとして出力するステップとを実施する、
ことを特徴とするサーバー。
前記質問特徴集合があらかじめ設定された分割条件に適合するか判断するステップは、
前記質問特徴集合を、少なくとも二つの分割クラスタリング中心に基づいて少なくとも二つの質問特徴部分集合に分割することによって、質問特徴集合のすべての点から、最初クラスタリング中心までの平均距離が各質問特徴部分集合のすべての点から、前記分割クラスタリング中心までの平均距離を上回るようにすることが可能かどうか判断して、可能であると、あらかじめ設定された分割条件に適合し、可能ではないと、あらかじめ設定された分割条件に適合しないこと、
又は、前記質問特徴集合の質問特徴数量が、あらかじめ設定された分割数量を上回るか判断して、上回ると、あらかじめ設定された分割条件に適合し、上回らないと、あらかじめ設定された分割条件に適合しないことを含む、
ことを特徴とする請求項１１に記載のサーバー。
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行い、質問特徴集合を出力するステップは、
ＩＴ−ＩＤＦアルゴリズムのベクトル空間モデルを採用して、前記クラスタリング待ち質問集合に対して、特徴抽出を行い、初期特徴集合を出力することと、
ＬＳＩモデルを採用して、前記初期特徴集合に対して特徴マッピングを行うことによって、前記質問特徴集合を出力することとを含む、
ことを特徴とする請求項１１に記載のサーバー。
前記テキスト特徴抽出アルゴリズムを採用して前記クラスタリング待ち質問集合に対して特徴抽出を行う前に、テキスト前処理アルゴリズムを採用して前記クラスタリング待ち質問集合に対して、前処理を行うステップを更に含み、
前記テキスト前処理アルゴリズムは、繁体字と簡体字との統一、大文字と小文字との統一、中国語の単語分割及びストップワードの除去の中の少なくとも一種を含有する、
ことを特徴とする請求項１１に記載のサーバー。
前記クラスタリングのクラスクラスターに対して、データベースのフィールド・マッチング処理を行い、それに加えて、処理後のクラスタリングのクラスクラスターを、クラスタリング質問のデータベースに記憶するステップを更に含む、
ことを特徴とする請求項１１に記載のサーバー。