WO2020022079A1

WO2020022079A1 - 音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法

Info

Publication number: WO2020022079A1
Application number: PCT/JP2019/027461
Authority: WO
Inventors: 亮太藤井
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2018-07-23
Filing date: 2019-07-11
Publication date: 2020-01-30
Also published as: JP2020016949A; JP7236669B2

Abstract

音声認識データ処理システムは、音声データの音声認識結果とテーブルに登録されたキーワードとの比較に応じて、相談内容のジャンル（種別）を含む複数の項目のそれぞれの内容を決定するとともに、決定されたジャンルに応じて、テーブルに登録された複数のキーワードのうち比較に用いるキーワードを絞り込む。音声認識データ処理システムは、テーブルに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目のそれぞれの内容を用いて、相談内容の要約レポートを生成する。

Description

音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法

　本開示は、音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法に関する。

　商品やサービスの問合せを受け付けるコールセンターあるいは自治体等の相談窓口での通話等において、その通話の発話音声を集音し、その発話音声を音声認識して文字列（つまり、テキストデータ）に変換して処理する音声認識データ処理システムが用いられるようになった。

　この種の音声認識データ処理システムとして、例えば特許文献１には、送話側チャネルからの音声を第１音声認識手段により音声認識し、交換機を介して送られてきた受話側チャネルの音声を第２音声認識手段により音声認識し、それぞれの音声認識結果を文字列に変換して表示する通話内容書き起こしシステムが開示されている。この通話内容書き起こしシステムは、表示された文字列を文字列編集手段により編集することが可能に構成される。これにより、編集者は、送話側および受話側の通話内容が時系列に並べられて表示されるのを確認しながら、通話内容を書き起こす（つまり、テキスト化する）ことが可能となる。

日本国特開２００５－１２３８６９号公報

　しかしながら、特許文献１では、通話内容の全てを書き起こすことは考慮されているものの、その通話内容の概略（つまり、要約）を作成することまでは考慮されていない。そのため、特許文献１の構成を、行政機関（例えば警察署）等の相談窓口で相談員が相談者からの相談に応対する際、その相談内容をテキスト化する場合に適用しても相談者および相談員の発話内容の全てがテキスト化された出力内容が作成されることになる。従って、相談員が出力内容を後で見返す際、相談内容を一目で概略を把握しにくいことがあり、その結果、相談員の利便性が低化し、相談窓口の相談対応能力の向上を妨げる可能性があった。

　本開示は、上述した従来の事情に鑑みて案出され、相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減し、相談窓口の相談対応能力を向上できる音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法を提供することを目的とする。

　本開示は、相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備える、音声認識データ処理装置を提供する。

　また、本開示は、相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備える、音声認識データ処理システムを提供する。

　また、本開示は、相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリを有する音声認識データ処理システムにおいて、前記相談者の発話音声を集音するマイクから入力された音声データを音声認識するステップと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するステップと、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込むステップと、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成するステップと、を有する、音声認識データ処理方法を提供する。

　本開示によれば、相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減でき、相談窓口の相談対応能力を向上できる。

音声認識データ処理のために保持されるカルテ表を示す図音声認識データ処理で生成される要約レポートの一例を示す図実施の形態１に係る音声認識データ処理システムの構成例を示す図図３に示す音声認識データ処理システムの構成の一例を示すブロック図実施の形態１に係る音声認識データ処理のメインルーチンを示すフローチャート図５に示す音声認識処理のサブルーチンを示すフローチャート図５に示すキーワード一致判定処理のサブルーチンを示すフローチャート図５に示すカルテ表登録処理のサブルーチンを示すフローチャート図５に示すカルテ表登録処理の処理前のカルテ表を例示する図図５に示すカルテ表登録処理の処理後のカルテ表を例示する図図５に示すカルテレポート生成処理のサブルーチンを示すフローチャート実施の形態１に係る音声認識データ処理システムの変形例を示すブロック図実施の形態２に係る音声認識データ処理のメインルーチンを示すフローチャート図１３に示す相談員提示処理のサブルーチンを示すフローチャート実施の形態３に係る相談員提示処理を示すフローチャート

（音声認識データ処理装置、その処理システムおよびその処理方法の概要）
　本開示に係る音声認識データ処理システムの具体的な説明を行う前に、図１および図２を参照して、先ず音声認識データ処理システムの概要について説明する。図１は、音声認識データ処理のために保持されるカルテ表を示す図である。図２は、音声認識データ処理で生成される要約レポートの一例を示す図である。

　以下に詳述する実施の形態１では、相談者からの相談内容のジャンル（種別）を含む複数の項目ＩＴとそれぞれの項目ＩＴに対応しかつその項目に関連する複数のキーワード（文章も含む。以下同様。）とが予め対応付けて登録されたテーブルＴＢが事前に登録設定され、そのテーブルＴＢがデータベースとしてメモリ１６に保持される（図１および図４参照）。テーブルＴＢは、項目ＩＴに対応するそれぞれのキーワードについて、相談内容のジャンルとして関連性の低い１つ以上のキーワードをさらに登録している。つまり、テーブルＴＢは、キーワードごとにジャンルとの観点で関連性の低い１つ以上のキーワードが指定されたキーワード関連性情報を保持している。このキーワード関連性情報において指定されている、キーワードごとの関連性の低い１つ以上のキーワードは、後述するキーワードの絞り込みの際に使用される。また、相談内容をテキスト入力するためのフォーマットとしてカルテ表ＲＴも同様に、メモリ１６に保持される（図１、図４、図９および図１０参照）。カルテ表ＲＴの形式は、テーブルＴＢに事前登録された各項目ＩＴに対応して事前に設定される。

　例えば相談窓口が行政機関のうち警察署である場合、その相談内容は、例えば犯罪、迷惑行為に関するものが主に想定される。カルテ表ＲＴには、図１に示すように、相談内容の項目ＩＴには項番ＮＯの順に「ジャンル（種別）」、「相談者」、「相手」、「被害状況」、「相談者の要求」、「警察からの提案内容」、「相談者の理解度・納得度」および「次のアクション」等が設定される。また、その項目ＩＴごとの具体的な相談内容を入力するための内容入力欄ＣＮもカルテ表ＲＴに設けられる。さらに、カルテ表ＲＴには、相談者Ｃ１の音声データに基づいて得られるキーワードを入力するための相談者側キーワード入力欄Ｋ１と、相談員Ｃ２の音声データに基づいて得られるキーワードを入力するための相談員側キーワード入力欄Ｋ２と、が項目ＩＴごとに設けられる（図９および図１０参照）。相談者側キーワード入力欄Ｋ１および相談員側キーワード入力欄Ｋ２にそれぞれ入力されている複数のキーワードは、テーブルＴＢにて規定されているキーワードから選択されて予め登録されているが、後述するように、人工知能（ＡＩ）を用いた学習処理によって使用頻度に応じて適宜更新（追加、変更、削除）されて構わない。

　なお、カルテ表ＲＴの初期状態では、各項目ＩＴの内容入力欄ＣＮは少なくとも空欄に設定される。また、カルテ表ＲＴは例示であり、図１の図示内容に限定されず、相談窓口の性質により適宜変更されて設定される。以降の図面も同様であり、本開示の理解を促すための例示である。

　実施の形態１に係る音声認識データ処理システム１は、相談者Ｃ１および相談員Ｃ２の発話音声を１フレーズごとに音声認識し、その音声認識結果とテーブルＴＢに登録されたキーワードとの比較に応じて、相談内容のジャンルを含む前述の項目ＩＴそれぞれの内容を決定してカルテ表ＲＴの各内容欄ＣＮにテキスト入力する。

　具体例として、図１中、項番ＮＯが１番目の「ジャンル」にはその内容に「近隣トラブル」のキーワードが、６番目の「警察からの提案内容」にはその内容に「まず注意する所からはじめてはどうか。我々が注意します。」のキーワードが、８番目の「次のアクション」にはその内容に「注意する日を連絡します」のキーワードが音声認識の結果としてテキスト入力される。またこのとき、音声認識データ処理システム１は、テーブルＴＢを用いて、決定されたジャンルに応じて、テーブルＴＢに登録された複数のキーワードのうち比較に用いるキーワードを絞り込む。この絞り込みにより、音声認識結果に対するキーワード一致判定の高速化を図ることが可能となる。

　カルテ表ＲＴの各項目ＩＴは音声データの１フレーズごとに逐次入力され、相談内容全体を示すリストとしてそれぞれの内容が順次決定される。その過程で各内容欄ＣＮが埋められ、カルテ表ＲＴが完成されていく。その際、図２に示すように、決定された項目ＩＴのそれぞれの内容に基づいて相談内容の要約レポートが生成される。

　具体例として、図２に示すように、図１に示すカルテ表ＲＴに基づいて「タイトル：近隣トラブル」および「相談者：○○」を表題にした要約レポートＡＢが生成される。その要約レポートＡＢの内容は「近隣トラブルで困っている。…（省略）…警察からの提案内容として、まずは注意する所から始めてはどうか。警察が（下線あり）注意する（下線あり）と提案。…（省略）…次のアクションとしては警察が（下線あり）注意する日を連絡。」とテキスト入力される。なお、要約レポートＡＢの内容では後述するように要確認項目に対応する内容に下線が付される。このように、要約レポートＡＢは、図２に示すような文章形式で生成されてもよいが、図１に示すカルテ表ＲＴのようなテーブル形式で生成されてもよい。

　このように、実施の形態１では、要約レポートＡＢの作成により、行政機関等（本説明では警察署）の相談窓口で相談者Ｃ１からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援することが可能となる。そこで、その作成を支援可能とするため、音声認識データ処理装置１０、音声認識データ処理システム１および音声認識データ処理方法は、以下に説明する複数の実施の形態に示す具体的構成を有する。

　以下、適宜図面を参照しながら、本開示に係る音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法を具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。

　また、実施の形態１，２，３でいう「部」または「装置」とは単にハードウェアによって実現される物理的構成に限定されず、その構成が有する機能をプログラム等のソフトウェアにより実現されるものも含む。また、１つの構成が有する機能が２つ以上の物理的構成により実現されても、または２つ以上の構成の機能が例えば１つの物理的構成によって実現されていても構わない。

（実施の形態１）
　図３および図４を参照して、実施の形態１に係る音声認識データ処理装置１０および音声認識データ処理システム１の構成について説明する。図３は、実施の形態１に係る音声認識データ処理システム１の構成の一例を示す模式図である。図４は、図３に示す音声認識データ処理システム１の構成の一例を示すブロック図である。

　図３および図４に示すように、実施の形態１に係る音声認識データ処理装置１０および音声認識データ処理システム１は、行政機関（例えば、警察署）に設置される相談窓口での使用が例示される。例えば地域住民である相談者Ｃ１が警察署の相談窓口に出向き、警察官等の相談員Ｃ２に面会して犯罪や迷惑行為等を直接相談する場面が想定される。

　実施の形態１では、その相談窓口に複数のマイクＭ１，Ｍ２および音声認識データ処理装置１０が設置されており、このマイクＭ１，Ｍ２を通じて相談者Ｃ１と相談員Ｃ２との発話音声を集音し、その音声データを音声認識データ処理装置１０に入力して音声認識させる。なお、実施の形態１では警察署の相談窓口での使用を想定して説明するが、これに限定されない。その他、市役所等での相談窓口、病院等の医療機関での相談窓口、さらには公共的機関に限定されず民間機関での相談窓口等にも適応可能である。

　実施の形態１の音声認識データ処理システム１は、相談者Ｃ１および相談員Ｃ２の発話音声を集音する複数（例えば、２本）のマイクＭ１，Ｍ２と、これらマイクＭ１，Ｍ２から入力された音声データに基づき相談内容の要約レポートＡＢ（図２参照）を生成する音声認識データ処理装置１０と、音声認識データ処理装置１０から送信される音声データに基づき自動で音声認識する音声認識サーバ２０と、音声認識データ処理装置１０と音声認識サーバ２０とを接続するネットワークＮＷと、を含んで構成される。

　複数のマイクＭ１，Ｍ２は、相談者Ｃ１および相談員Ｃ２の発話音声を集音して電気信号の音声データとしてそれぞれ出力する。音声データは、電気的な振動波形データとして音声認識データ処理装置１０に出力される。なお、実施の形態１ではマイクＭ１，Ｍ２を２本設置するが、これに限定されず１本でもよい。この場合、１つのマイクＭ１は相談者Ｃ１および相談員Ｃ２の両方の発話音声を識別可能に集音可能に構成されればよい。

　音声認識データ処理装置１０は、汎用のパーソナル・コンピュータで構成されており、プロセッサ１１と、メモリ１６と、ディスプレイ１７と、入出力インターフェイス回路１８と、通信回路１９と、を含んで構成される。図４では、入出力インターフェイス回路を便宜的に「入出力Ｉ／Ｆ」と示している。なお、音声認識データ処理装置１０は、パーソナル・コンピュータに限定されず、前述の各種回路を有するものであればタブレット端末、スマートフォン等の各種装置を用いてもよい。

　メモリ１６は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等の半導体メモリ等により構成される。メモリ１６は、プロセッサ１１で実行される所定のプログラムや各種の設定パラメータ等を記憶保持するとともに、デジタル変換された音声データやプロセッサが各種プログラムを実行する際に中間的に生成するデータを一時的に記憶する。

　また、実施の形態１では、メモリ１６は、前述のように、相談者Ｃ１からの相談内容のジャンルを含む複数の項目ＩＴとそれぞれの項目ＩＴに対応しかつその項目ＩＴに関連する複数のキーワードとが予め対応付けて登録されたテーブルＴＢを記憶保持する。つまり、前述したように、テーブルＴＢにおいて、キーワードは相談内容の項目ＩＴごとに事前に複数設定されており、この複数のキーワードは項目ＩＴごとにグループ登録され記憶保持される。また、メモリ１６には、相談内容の入力用のフォーマットとしてカルテ表ＲＴ（図９参照）も同様に記憶保持される。なお、これらテーブルＴＢおよびカルテ表ＲＴは半導体メモリの代わりにＳＳＤ（Solid State Drive）やＨＤＤ（Hard Disk Drive）等のストレージデバイス等の記憶回路内に記憶保持されてもよい。また、前述のように、テーブルＴＢは、項目ＩＴに対応するそれぞれのキーワードについて、相談内容のジャンルとして関連性の低い他のキーワードをさらに登録している。

　ディスプレイ１７は、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ等により構成される。ディスプレイ１７は、その表示部に音声データ、前述のカルテ表ＲＴおよび要約レポートＡＢ等を適宜切り替えて少なくとも相談員Ｃ２に表示する。

　入出力インターフェイス回路１８は、マイクＭ１，Ｍ２にて取得した音声データを各種信号処理可能なデジタル信号に変換するオーディオ用のインターフェイスである。入出力インターフェイス回路１８は、そのデジタル変換の際、所定の量子化ビットおよびサンプリング周波数によりアナログの音声データをデジタルに変換する。サンプリング周波数は、例えば４８ｋＨｚに設定される。また、入出力インターフェイス回路１８はバッファ回路を含み、このバッファ回路はマイクＭ１，Ｍ２の音声データをデジタル変換させるため、音声データを所定時間バッファリングする。入出力インターフェイス回路１８は、プロセッサ１１およびディスプレイ１７にデジタル変換した音声データを送信する。

　通信回路１９は、無線通信の機能を有しており、所定の無線通信回線を介してネットワークＮＷに接続され、音声認識サーバ２０との間で無線通信を行う。即ち、音声認識データ処理装置１０は通信回路１９およびネットワークＮＷを介して音声認識サーバ２０に接続され、音声データ等の所定のデータを送受信可能に構成される。なお、通信回路１９は、無線通信回路として携帯電話網（セルラー網）、無線ＬＡＮ等を使用することが可能である。また、通信回路１９は無線通信に限らず有線ＬＡＮ等を使用して有線通信可能に構成してもよい。

　プロセッサ１１は、例えば、ＣＰＵ（Central Processing Unit），ＭＰＵ（Micro Processor Unit），ＤＳＰ（Digital Signal Processor）あるいはＦＰＧＡ（Field Programmable Gate Array）等が用いられる。プロセッサ１１は、メモリ１６に格納されるプログラムや設定パラメータを適宜読み出し、読み出したプログラムに従って所定の処理を実行する。

　プロセッサ１１は、機能的構成として、マイクＭ１，Ｍ２から得られた音声データを音声認識する音声認識部１２と、音声認識結果とテーブルＴＢに登録されたキーワードとを比較して項目ＩＴのそれぞれの内容を決定するキーワード一致判定部１３（判定部の一例）と、各項目ＩＴの決定に基づいて相談内容の要約レポートＡＢを生成するカルテレポート生成部１４（生成部の一例）と、登録されている複数のキーワードとキーワード一致判定部１３の判定結果とを学習して、テーブルＴＢでのキーワードの登録内容を適宜更新するＡＩ（Artificial Intelligence）処理部１５と、を有する。

　音声認識部１２は、入出力インターフェイス回路１８からデジタル変換された音声データを取得する。音声認識部１２は、取得した音声データを例えば所定のコーパスに基づき音声認識してテキストデータ（文字列）に変換する。テキストデータの変換や解釈は、所定の自動音声認識アルゴリズムに従って実行される。自動音声認識アルゴリズムは、例えばＡＩ処理部１５に実装される人工知能（ＡＩ：Artificial Intelligence）エンジンを用いて生成される。

　ここで、音声認識データ処理装置１０の音声認識部１２は、音声認識データ処理装置１０のプロセッサの処理能力（つまり、性能）の制限を受ける。また、音声認識部１２は、プロセッサ１１のＡＩ処理部１５により生成される自動音声認識アルゴリズムに従うためその性能や精度は限定的になってしまう可能性がある。そのため、実施の形態１では、様々な相談窓口での相談内容の音声データを取得可能な音声認識サーバ２０を、ネットワークＮＷを介して通常使用して、後述する音声認識処理（例えば、図５に示すステップＳ２０参照）を実行する。但し、ネットワークＮＷのトラフィック量が過多になる等、ネットワークＮＷの接続が不調である場合、音声認識データ処理装置１０の音声認識部１２が音声認識サーバ２０の代わりに機能し、音声データを音声認識してよい。なお、音声認識サーバ２０でも同様に、人工知能の学習により自動音声認識アルゴリズムを生成して音声認識する。

　また、音声認識データ処理装置１０および音声認識サーバ２０に実行される人工知能の学習は、１つ以上の統計的な分類技術を用いて実行されてもよい。統計的分類技術としては、線形分類器（linear classifiers）、サポートベクターマシン（support vector machines）、二次分類器（quadratic classifiers）、カーネル密度推定（kernel estimation）、決定木（decision trees）、人工ニューラルネットワーク（artificial neural networks）、ベイジアン技術および／またはネットワーク（Bayesian techniques and/or networks）、隠れマルコフモデル（hidden Markov models）、バイナリ分類子（binary classifiers)、マルチクラス分類器（multi-class classifiers）、クラスタリング（a clustering technique）、ランダムフォレスト（a random forest technique）、ロジスティック回帰（a logistic regression technique）、線形回帰（a linear regression technique）、勾配ブースティング（a gradient boosting technique）等が例示される。但し、使用される統計的分類技術はこれらに限定されない。

　音声認識サーバ２０または音声認識データ処理装置１０の音声認識部１２は、音声認識結果であるテキストデータをキーワード一致判定部１３に逐次送信する。キーワード一致判定部１３は、その音声認識結果を１フレーズごとに取得し、テーブルＴＢに予め登録されたキーワードとの一致の有無を判定する。即ち、キーワード一致判定部１３は、相談者Ｃ１および相談員Ｃ２の発話音声の１フレーズに対応する音声データの音声認識結果を取得する度に、テーブルＴＢに登録された複数のキーワードとの比較を行う。また、キーワード一致判定部１３は、テーブルＴＢを用いて、決定されたジャンルに応じて、テーブルＴＢに登録された複数のキーワードのうち比較に用いるキーワードを絞り込む。

　カルテレポート生成部１４は、テーブルＴＢに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目ＩＴのそれぞれの内容を用いて、相談内容の要約レポートＡＢを生成する（図２参照）。

　次に図５～図１１を参照して、実施の形態１の音声認識データ処理方法の手順について説明する。図５は、実施の形態１に係る音声認識データ処理のメインルーチンを示すフローチャートである。図６は、図５に示す音声認識処理Ｓ２０のサブルーチンを示すフローチャートである。図７は、図５に示すキーワード一致判定処理Ｓ３０のサブルーチンを示すフローチャートである。図８は、図５に示すカルテ表登録処理Ｓ４０のサブルーチンを示すフローチャートである。図９は、図５に示すカルテ表登録処理Ｓ４０の処理前のカルテ表ＲＴを例示する図である。図１０は、図５に示すカルテ表登録処理Ｓ４０の処理後のカルテ表ＲＴを例示する図である。図１１は、図５に示すカルテレポート生成処理Ｓ５０のサブルーチンを示すフローチャートである。

　相談員Ｃ２は相談者Ｃ１に応対する際、音声認識データ処理システム１を稼働させる（図３参照）。各マイクＭ１，Ｍ２は、相談者Ｃ１または相談員Ｃ２の発話音声を集音し始め、アナログの音声データを音声認識データ処理装置１０に出力する。図５に示すように、音声認識データ処理装置１０は、その入力された音声データを入出力インターフェイス回路１８により１フレーズごとに取得するとともに、その音声データの振動波形をディスプレイ１７に表示させる（Ｓ１０）。

　次に、図５および図６に示すように、音声認識処理のサブルーチンが開始される（Ｓ２０）。音声認識処理Ｓ２０では、入出力インターフェイス回路１８はそのバッファ回路で音声データをバッファリングして音声データをデジタルに変換し、プロセッサ１１に出力する（Ｓ２１）。プロセッサ１１はデジタル変換された音声データを、通信回路１９を通じて音声認識サーバ２０に送信する（Ｓ２２）。音声認識サーバ２０は、音声データを受信し受信した音声データを自動音声認識アルゴリズムに従って音声認識し、音声認識結果としてテキストデータに変換する（Ｓ２３）。このとき、音声認識サーバ２０は、発話音声の１フレーズごとに音声認識結果を音声認識データ処理装置１０に送信する。音声認識データ処理装置１０は音声認識サーバ２０の音声認識結果を、通信回路１９を通じて受信する（Ｓ２４）。この受信により音声認識処理のサブルーチンが終了する。

　次に、図５および図７に示すように、音声認識処理Ｓ２０の終了後、キーワード一致判定処理のサブルーチンが開始される（Ｓ３０）。キーワード一致判定処理Ｓ３０では、プロセッサ１１のキーワード一致判定部１３は相談者Ｃ１および相談員Ｃ２の発話音声の１フレーズに対応する音声データの音声認識結果を取得する（Ｓ３１）。キーワード一致判定部１３は、その取得の際、音声認識結果を単語ごとに分解する（Ｓ３２）。ここでいう単語は、単語に限らず、句あるいは節等の文章でもよい。キーワード一致判定部１３は、音声認識結果とテーブルＴＢに予め登録された複数のキーワードとを比較して一致するか否かを、相談者Ｃ１および相談員Ｃ２のそれぞれの発話内容に対応する音声認識結果について個別で比較する（Ｓ３３）。比較の結果、キーワード一致判定部１３は、テーブルＴＢに登録されているキーワードと一致するか否かを判定する（Ｓ３４）。一致しないと判定する場合、キーワード一致判定処理Ｓ３０のサブルーチンは終了する。なお、キーワード一致判定部１３はキーワードの一致判定の際（Ｓ３４）、例えば「我々」の発話音声を「警察」に、または「私」の発話音声を「相談者」等に適宜補完変換して状況に応じた一人称の変換が可能に構成されてよい。

　また、このようなキーワード一致判定処理Ｓ３０の終了処理により、音声認識データ処理システム１は、マイクＭ１，Ｍ２の集音中において相談者Ｃ１または相談員Ｃ２が相談内容と無関係（例えば雑談や世間話等）なことを話していると推定し、次のカルテ表登録処理（ステップＳ４０）にそのまま進む。これにより、カルテ表ＲＴや要約レポートＡＢに相談内容と無関係な内容、即ちノイズ情報が混入するのを抑制することが可能となる。

　その一方、一致すると判定する場合、キーワード一致判定部１３はその一致した音声認識結果が相談内容のジャンルに対応するキーワードと一致するか否かをさらに判定する（Ｓ３５）。

　一致しないと判定する場合、キーワード一致判定処理Ｓ３０のサブルーチンは終了する。その一方、ジャンルに対応するキーワードと一致すると判定する場合、キーワード一致判定部１３は相談者Ｃ１の相談内容のジャンルが例えば「近隣トラブル」であるのか、「ストーカー被害」であるのか、あるいは「詐欺被害」であるのか等を決定して、その決定結果をカルテ表ＲＴに入力する。さらに、キーワード一致判定部１３は、決定されたジャンルに応じてテーブルＴＢに登録された複数のキーワードのうち前述のステップＳ３３で用いるキーワードを絞り込む（Ｓ３６）。例えば、前述したように、テーブルＴＢには、項目ＩＴに対応するそれぞれのキーワードごとに、相談内容のジャンルの観点からして関連性の低い１つ以上のキーワードが指定されたキーワード関連性情報を保持している。例えば、ジャンル「ストーカー」というキーワードは、キーワード「○○円振り込んだ」と関連性が低いと考えられる。また、ジャンル「詐欺被害」というキーワードは、キーワード「切りつけられた」と関連性が低いと考えられる。このように、キーワードごとに登録されている関連性の低い１つ以上のキーワードは、キーワード一致判定部１３におけるキーワードの絞り込み時に使用される。これにより、キーワード一致判定処理Ｓ３０のサブルーチンを終了する。

　次に、図５および図８に示すように、キーワード一致判定処理Ｓ３０の終了後、カルテ表登録処理のサブルーチンが開始される（Ｓ４０）。カルテ表登録処理Ｓ４０では、プロセッサ１１のキーワード一致判定部１３は、メモリ１６のテーブルＴＢを参照して、ステップＳ３３において一致したと判定されたキーワードに対応する項目ＩＴを検索する（Ｓ４１）。検索の結果、キーワード一致判定部１３は、該当する項目ＩＴにキーワードが入力済みか否かを判定する（Ｓ４２）。未入力であると判定する場合、キーワード一致判定部１３は、該当する項目ＩＴの内容欄ＣＮに、その一致したキーワードを決定して入力していく（Ｓ４５）。

　具体的には、図９に示すように、相談者Ｃ１の発話に基づく音声認識結果の単語の中に、相談者側キーワード入力欄Ｋ１のキーワード「隣の部屋の人が」がステップＳ３３において一致したと判定された場合、テーブルＴＢにて登録されているキーワード「隣の部屋の人が」に対応する項目（ジャンル）「近隣住民トラブル」が、ジャンルの内容欄ＣＮに入力される。

　また、別の例として、相談員Ｃ２の発話に基づく音声認識結果の単語の中に、相談員側キーワード入力欄Ｋ２のキーワード「ストーカー」がステップＳ３３において一致したと判定された場合、テーブルＴＢに登録されているキーワード「ストーカー」に対応する項目（ジャンル）「ストーカー」が、ジャンルの内容欄ＣＮに入力される。また、音声認識データ処理システム１により入力途中のカルテ表ＲＴは、音声認識データ処理装置１０のディスプレイ１７に表示されており、相談員Ｃ２はその入力状況を相談中に確認することが可能である。

　その一方、該当する項目ＩＴが入力済みと判定する場合（即ち、複数の項目ＩＴのうちいずれかの項目ＩＴに複数の内容が存在した場合）、キーワード一致判定部１３は、テーブルＴＢに保持されているキーワード関連性情報を参照し、入力済みである複数の内容が対応する項目ＩＴのジャンルとの関係で矛盾するか否かを判定する（Ｓ４３）。矛盾しないと判定する場合、カルテ表登録処理Ｓ４０のサブルーチンは終了する。

　その一方、矛盾すると判定する場合、キーワード一致判定部１３は要確認項目としてその旨をメモリ１６に記憶保持させる（Ｓ４４）。キーワード一致判定部１３は、逐次取得する音声認識結果ごとに、該当する項目ＩＴに対してキーワードを決定して入力する（Ｓ４５）。さらに、入力されたキーワードに基づいて項目ＩＴごとの内容に対する見出しを自動認識し、その見出しをカルテ表ＲＴの内容の内容欄ＣＮにそれぞれ入力する（図１０参照）。これにより、カルテ表登録処理Ｓ４０のサブルーチンが終了する。

　次に、図５および図１１に示すように、カルテ表登録処理Ｓ４０の終了後、カルテレポート生成処理のサブルーチンが開始される（Ｓ５０）。カルテレポート生成処理Ｓ５０では、プロセッサ１１のカルテレポート生成部１４は、メモリ１６に記憶保持されるカルテ表ＲＴを参照して、内容が入力済みの項目ＩＴを検索する（Ｓ５１）。検索の結果、カルテレポート生成部１４は、入力済みの項目ＩＴに対応するテキストを生成する（Ｓ５２）。またこのとき、カルテレポート生成部１４は、メモリ１６に記憶保持される要確認項目も同時に参照して、項目ＩＴのいずれかで矛盾があると判定された場合、該当する項目ＩＴの内容を要確認項目であることが識別可能にテキストを生成する。具体的には、カルテレポート生成部１４は、要確認項目に対応する内容に下線を付与して識別可能とする（図２参照）。

　さらにカルテレポート生成部１４は、生成したテキストにおいて前後の意味等で違和感が生じないに補正するとともに（Ｓ５３）、主語が抜けているテキストに対し主語を推測して補完挿入する（Ｓ５４）。このとき、カルテレポート生成部１４は主語を推測した場合、同様に要確認項目として下線を付して識別可能にテキストを生成する。

　このようにカルテレポート生成部１４はキーワードに基づいて決定された複数の項目ＩＴのそれぞれの内容を用いて相談内容の要約レポートＡＢを生成する（図２参照）。プロセッサ１１は入出力インターフェイス回路１８を介してその要約レポートＡＢをディスプレイ１７に表示させる（Ｓ５６）。

　図５に示すように、カルテレポート生成処理Ｓ５０の終了後、メイン処理に対する終了トリガが入力されたかが判定される（Ｓ６０）。判定の結果、終了トリガが入力されない限り、ステップＳ１０からステップＳ５０までの一連の処理ステップが繰り返して実行される。終了トリガが入力された場合、例えば相談窓口での相談が終了して音声認識データ処理システムのスイッチが相談員Ｃ２によりオフ（ＯＦＦ）された場合、音声認識データ処理システム１のメイン処理が終了する。

　以上により、実施の形態１に係る音声認識データ処理装置１０および音声認識データ処理システム１は、相談者Ｃ１の発話音声を集音するマイクＭ１から入力された音声データを音声認識する音声認識部１２を備える。音声認識データ処理装置１０および音声認識データ処理システム１は、相談者Ｃ１からの相談内容のジャンル（種別）を含む複数の項目ＩＴとそれぞれの項目ＩＴに対応するキーワードとが対応付けて登録されたテーブルＴＢを保持するメモリ１６を備える。音声認識データ処理装置１０および音声認識データ処理システム１は、音声データの音声認識結果とテーブルＴＢに登録されたキーワードとの比較に応じて、相談内容のジャンルを含む複数の項目ＩＴのそれぞれの内容を決定するとともに、決定されたジャンルに応じて、テーブルＴＢに登録された複数のキーワードのうち比較に用いるキーワードを絞り込むキーワード一致判定部１３（判定部の一例）を備える。音声認識データ処理装置１０および音声認識データ処理システム１は、テーブルＴＢに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目ＩＴのそれぞれの内容を用いて、相談内容の要約レポートＡＢを生成するカルテレポート生成部１４（生成部の一例）を備える。

　従って、実施の形態１では、音声認識データ処理装置１０は、音声データの音声認識結果とテーブルに登録されたキーワードとの比較に応じて、相談内容の種別を含む複数の項目のそれぞれの内容を決定する。音声認識データ処理装置１０は、決定された種別に応じて、テーブルＴＢに登録された複数のキーワードのうち比較に用いるキーワードを絞り込み、テーブルＴＢに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目のそれぞれの内容を用いて、相談内容の要約レポートＡＢを生成する。これにより、音声認識データ処理装置１０は、要約レポートＡＢの作成により、行政機関等の相談窓口で相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減する。その結果、相談窓口の相談対応能力を向上させることができる。

　また、音声認識データ処理装置１０および音声認識データ処理システム１は、生成された相談内容の要約レポートＡＢをディスプレイ１７に表示するプロセッサ１１（制御部の一例）をさらに備える。これにより、相談員Ｃ２は、相談窓口で相談の応対をしながら相談内容を確認することができるので、音声認識データ処理装置１０は相談員Ｃ２の負荷をさらに低減するとともに相談内容に関する相談員Ｃ２の問いかけの質も向上させることができる。

　また、音声認識データ処理装置１０および音声認識データ処理システム１では、キーワード一致判定部１３（判定部の一例）は、複数の項目ＩＴのうちいずれかの項目ＩＴに複数の内容が存在した場合に、複数の内容が対応する項目ＩＴとの関係で矛盾するか否かを判定する。カルテレポート生成部１４（生成部の一例）は、複数の内容が対応する項目ＩＴとの関係で矛盾すると判定された場合に、複数の内容のうち少なくとも１つの内容を要確認項目と識別可能に要約レポートＡＢを生成する。これにより、音声認識データ処理装置１０は、要約レポートＡＢの一貫性および整合性を高めて要約レポートの質を向上させ、相談員Ｃ２が後で見返す際、相談内容を一目で把握するのを容易にすることができる。

　また、音声認識データ処理装置１０および音声認識データ処理システム１では、カルテレポート生成部１４（生成部の一例）は、要確認項目に対応する内容に下線を付与して要約レポートＡＢを生成する。これにより、音声認識データ処理装置１０は、要約レポートＡＢでの要確認項目に対する視認性を高めるので、相談中での相談員Ｃ２に再確認を促したり、相談後での要約レポートの修正を容易にしたりすることができる。

　また、音声認識データ処理装置１０および音声認識データ処理システム１では、キーワード一致判定部１３（判定部の一例）は、相談者Ｃ１の発話音声の１フレーズに対応する音声データの音声認識結果を取得する度に、テーブルＴＢに登録されたキーワードとの比較を行う。これにより、相談窓口での相談の最中に音声認識およびキーワード比較が行われてカルテ表ＲＴに逐次入力されて表示されるので、相談員Ｃ２はカルテ表ＲＴの入力状況を把握しながら相談者Ｃ１の応対を行うことができる。このため、相談窓口での相談対応能力をより一層高めることができる。

（実施の形態１の変形例）
　実施の形態１の変形例として、音声認識データ処理システム１は、音声認識データ処理の機能を補完したり代行したりするＡＩ処理サーバ３０をさらに有して構成されてもよい。ＡＩ処理サーバ３０は、ネットワークＮＷに接続され、人工知能の性能が強化されて設けられる。ＡＩ処理サーバ３０は、汎用のサーバーシステム（高機能なコンピュータ）で構成されており、音声認識データ処理装置１０と同様に、プロセッサ３１と、メモリ３６と、通信回路３９と、を含んで構成される。

　ＡＩ処理サーバ３０のプロセッサ３１は、機能的構成として同様に、キーワード一致判定部３３と、カルテレポート生成部３４と、ＡＩ処理部３５と、を有する。但し、これらＡＩ処理サーバ３０は人工知能の性能が強化されており、また複数の相談窓口での音声データが取得可能に構成される。そのため、その人工知能のモデルは、音声認識データ処理装置１０と比較して精度が高く構築可能である。従って、実施の形態１の変形例では、より高速且つより精度良く相談内容の要約の作成を支援して、相談員Ｃ２の負荷を低減することができる。

（実施の形態２）
　次に、図１３および図１４を参照して、実施の形態２に係る音声認識データ処理装置１０および音声認識データ処理システム１の音声認識データ処理方法の手順について説明する。図１３は、実施の形態２に係る音声認識データ処理のメインルーチンを示すフローチャートである。図１４は、図１３に示す相談員提示処理Ｓ７０のサブルーチンを示すフローチャートである。なお、実施の形態１と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。

　図１３および図１４に示すように、実施の形態２では、カルテレポート生成処理（Ｓ５０）の終了後、相談員提示処理のサブルーチンが開始される（Ｓ７０）。なお、相談員提示処理Ｓ７０の終了後、プロセッサ１１は実施の形態１と同様に終了トリガが入力されたか否かが判定する（Ｓ６０）。また、相談員提示処理Ｓ７０はプロセッサ１１のＡＩ処理部１５（提示処理部の一例）により主に実行されるが、これに限定されず、前述のＡＩ処理サーバ３０のＡＩ処理部３５がその処理を補佐または代理可能なように構成してもよい。

　相談員提示処理Ｓ７０では、プロセッサ１１のＡＩ処理部１５は、カルテ表ＲＴの決定状況応じて、所定の優先順位に従って内容が未だ決定されていない未決定の項目ＩＴの項目ＩＴの有無を検索する（Ｓ７１）。検索の結果、ＡＩ処理部１５は未決定の項目ＩＴがあるか否かを判定する（Ｓ７２）。未決定の項目ＩＴがないと判定する場合、相談員提示処理Ｓ７０は終了する。

　その一方、未決定の項目ＩＴがあると判定する場合、ＡＩ処理部１５は「相談員（Ｃ２）が次に尋ねるべき項目」として未決定の項目ＩＴに関する情報を、ディスプレイ１７を通じて提示する。例えば、ＡＩ処理部１５は相談内容のジャンルが決定済みで被害状況の項目ＩＴが未決定である場合、「被害状況を尋ねて下さい。」と相談員Ｃ２に提示する。その提示後、相談員提示処理Ｓ７０は終了する。なお、優先順位に関する情報は事前に設定されており、音声認識データ処理装置１０のメモリ１６に記憶保持される。

　以上により、実施の形態２に係る音声認識データ処理装置１０および音声認識データ処理システム１は、複数の項目ＩＴのそれぞれの内容の決定状況に応じて、内容が未だ決定されていない項目ＩＴの有無を検索し、未決定の項目ＩＴに関する情報をディスプレイ１７に表示するＡＩ処理部（提示処理部の一例）を備える。これにより、相談員Ｃ２は、相談者Ｃ１からの相談内容を漏れなく聞き出せるので、相談内容の質をより高め、相談窓口の相談対応能力をさらに向上させることができる。その他の構成や作用効果については、上記実施の形態１と同様である。

（実施の形態３）
　次に、図１５を参照して、実施の形態３に係る音声認識データ処理装置１０および音声認識データ処理システム１の音声認識データ処理方法の手順について説明する。図１５は、実施の形態３に係る相談員提示処理Ｓ７０を示すフローチャートである。なお、実施の形態１および形態２と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。

　図１５に示すように、実施の形態３の相談員提示処理Ｓ７０では、音声認識データ処理装置１０のＡＩ処理部１５（提示処理部の一例）は、相談員Ｃ２から相談者Ｃ１へ提案するために必要な情報が揃っているか検索する（Ｓ７５）。検索の結果、ＡＩ処理部１５は、相談内容のジャンルを含む複数の項目ＩＴのそれぞれの内容の決定数が所定値で、且つ少なくともジャンルの内容が決定されているか否かを判定する（Ｓ７６）。例えばＡＩ処理部１５は、図１に示す項目ＩＴの項番ＮＯの第１～第５の内容が決定済みか否かを判定する。未決定と判定する場合、相談員提示処理Ｓ７０は終了する。

　その一方、決定済みと判定する場合、ＡＩ処理部１５は決定済みの内容に基づきジャンルに対応する対策の提案内容を生成する（Ｓ７７）。このとき、ＡＩ処理部１５はルール（規定）が事前に規定された所定のハッシュテーブルに従って提案内容を一意に決定する。ＡＩ処理部１５は、生成した提案内容のテキストをディスプレイ１７に提示し（Ｓ７８）、相談員提示処理Ｓ７０は終了する。

　なお、ＡＩ処理部１５は、ハッシュテーブル等のルールベースに従った手法に限定されず、人工知能を用いて過去の履歴を参照して提案内容を機械学習しておき、その機械学習で得た学習モデルに従って決定してもよい。また、学習モデルをＡＩ処理サーバ３０で生成してもよい。この場合、複数の相談窓口の相談内容から学習モデルが生成されるので、精度の良い学習モデルを生成することができる。

　以上により、実施の形態３に係る音声認識データ処理装置１０および音声認識データ処理システム１は、相談内容のジャンル（種別）を含む複数の項目ＩＴのそれぞれの内容の決定数が所定値で、かつ少なくともジャンルの内容が決定された場合に、ジャンルの内容に対応する対策の提案内容を生成してディスプレイ１７に表示するＡＩ処理部１５（提示処理部の一例）を備える。これにより、相談内容に基づいて提案内容を適切且つ自動的に導き出して相談員Ｃ２に提示するので、相談者Ｃ１に対する支援を容易にして相談員Ｃ２の負荷をより低減することができる。その他の構成や作用効果については、上記実施の形態１および形態２と同様である。

　以上、図面を参照しながら各種の実施の形態について説明したが、本開示はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した各種の実施の形態における各構成要素を任意に組み合わせてもよい。

　なお、本出願は、２０１８年７月２３日出願の日本特許出願（特願２０１８－１３７８７５）に基づくものであり、その内容は本出願の中に参照として援用される。

　本開示は、行政機関等の相談窓口で相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減して、相談対応能力を向上させることができる音声認識データ処理装置、音声認識データ処理システム、および音声認識データ処理方法として有用である。

１　音声認識データ処理システム
１０　音声認識データ処理装置
１１　プロセッサ
１２　音声認識部
１３　キーワード一致判定部
１４　カルテレポート生成部
１５　ＡＩ処理部
１６　メモリ
１７　ディスプレイ
１８　入出力インターフェイス回路
１９　通信回路
２０　音声認識サーバ
３０　ＡＩ処理サーバ
３１　プロセッサ
３３　キーワード一致判定部
３４　カルテレポート生成部
３５　ＡＩ処理部
３６　メモリ
３９　通信回路
Ｍ１　マイク
Ｍ２　マイク
ＮＷ　ネットワーク
ＴＢ　テーブル
ＡＢ　要約レポート

Claims

　相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、
　前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、
　前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、
　前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備える、
　音声認識データ処理装置。
　生成された前記相談内容の要約レポートをディスプレイに表示する制御部、をさらに備える、
　請求項１に記載の音声認識データ処理装置。
　前記判定部は、前記複数の項目のうちいずれかの項目に複数の内容が存在した場合に、前記複数の内容が対応する項目との関係で矛盾するか否かを判定し、
　前記生成部は、前記複数の内容が対応する項目との関係で矛盾すると判定された場合に、前記複数の内容のうち少なくとも１つの内容を要確認項目であることが識別可能に前記要約レポートを生成する、
　請求項１に記載の音声認識データ処理装置。
　前記生成部は、前記要確認項目に対応する内容に下線を付与して前記要約レポートを生成する、
　請求項３に記載の音声認識データ処理装置。
　前記判定部は、前記相談者の発話音声の１フレーズに対応する前記音声データの音声認識結果を取得する度に、前記テーブルに登録されたキーワードとの比較を行う、
　請求項１～４のうちいずれか一項に記載の音声認識データ処理装置。
　前記複数の項目のそれぞれの内容の決定状況に応じて、内容が未だ決定されていない項目の有無を検索し、未決定項目に関する情報をディスプレイに表示する提示処理部、をさらに備える、
　請求項１に記載の音声認識データ処理装置。
　前記相談内容の種別を含む複数の項目のそれぞれの内容の決定数が所定値で、かつ少なくとも前記種別の内容が決定された場合に、前記種別の内容に対応する対策の提案内容を生成してディスプレイに表示する提示処理部、をさらに備える、
　請求項１に記載の音声認識データ処理装置。
　相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、
　前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、
　前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、
　前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備える、
　音声認識データ処理システム。
　相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリを有する音声認識データ処理システムにおいて、
　前記相談者の発話音声を集音するマイクから入力された音声データを音声認識するステップと、
　前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するステップと、
　前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込むステップと、
　前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成するステップと、を有する、
　音声認識データ処理方法。