JP5099367B2 - 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム - Google Patents

要求内容識別システム、自然言語による要求内容の識別方法及びプログラム Download PDF

Info

Publication number
JP5099367B2
JP5099367B2 JP2008505100A JP2008505100A JP5099367B2 JP 5099367 B2 JP5099367 B2 JP 5099367B2 JP 2008505100 A JP2008505100 A JP 2008505100A JP 2008505100 A JP2008505100 A JP 2008505100A JP 5099367 B2 JP5099367 B2 JP 5099367B2
Authority
JP
Japan
Prior art keywords
request
sentence
score
analysis
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008505100A
Other languages
English (en)
Other versions
JPWO2007105615A1 (ja
Inventor
開 石川
享 赤峯
真一 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008505100A priority Critical patent/JP5099367B2/ja
Publication of JPWO2007105615A1 publication Critical patent/JPWO2007105615A1/ja
Application granted granted Critical
Publication of JP5099367B2 publication Critical patent/JP5099367B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、要求内容識別システム、自然言語による要求内容の識別方法及びプログラムに関し、特に、自然言語形式で入力された要求文(入力要求文)を解析し、該入力要求文の要求内容を識別・出力することのできる要求内容識別システム、自然言語による要求内容の識別方法及びプログラムに関する。
従来より、利用者が入力する情報要求に対して、内容の関連する文書集合を関連度の高いものから順に並べて出力するものが知られているが、近年では、単に情報要求に関連する文書を提示するのではなく、入力された質問文から情報要求の内容を識別し、回答情報を抽出して提示する、質問応答技術の研究が盛んに行われている。
この質問応答技術の一つの鍵となるのが、入力質問文に対する、情報要求内容の識別技術である。識別する情報要求内容は、対象とするドメインによって内容も粒度も異なるが、例えば、情報機器を対象とする質問応答においては、情報機器に関する様々な機能の使い方や疑問、トラブルの解決方法等といった、様々な質問と回答を想定することができる。この場合、入力された質問文がどれに該当するのかということを、必要に応じて大雑把に、あるいは、詳細に識別する。
このような従来の情報要求内容の識別技術の一例が特許文献1に開示されている。特許文献1記載の日本語質問メッセージ解析装置は、日本語質問メッセージを入力する入力手段と、メッセージから情報要求の核となる部分を述べている情報要求文を抽出する情報要求文抽出手段と、情報要求文を解析する日本語解析部と、さらに情報要求文の意味構造を求める意味構造解析部と、要求文の参照表現を解消する参照表現解消手段と、メッセージにおける主たる情報要求を構造化する情報要求構造化手段と、情報要求文を出力する出力手段とから構成される。
上記日本語質問メッセージ解析装置は、より具体的には、次のように動作する。前記情報要求文抽出手段が、入力された処理対象の日本語質問メッセージについて、特定の表現文字列に着目して、情報要求の核となる部分を述べている情報要求文を抽出すると、前記日本語解析部が、前記情報要求文の構文解析処理によって情報要求文の構文解析結果を生成する。そして、前記意味構造解析部が、前記日本語解析部で得られた情報要求文の構文解析結果と、予め情報要求文のバリエーションに対して構文構造を記述した意味構造パタン辞書との照合によって、情報要求文の意味構造を抽出する。また、前記参照表現解消手段が、前記情報要求文抽出手段により抽出された前記情報要求文に参照表現が含まれる場合に、該参照表現を前記情報要求文の特性に基づいて解消する。前記情報要求構造化手段が、抽出された複数の情報要求文が同一の対象物に対する情報要求を述べている場合に、該複数の情報要求文の構造を統合して、前記日本語質問メッセージにおける主たる情報要求内容を構造化する。最後に、前記出力手段が、前記情報要求構造化手段により統合された情報要求文を出力する。
特許第3358100号
しかしながら、上記従来技術には、未知の要求文が入力された場合に、要求文から誤った意味構造が抽出されたり、意味構造の抽出自体に失敗するという問題点が残されている。その理由は、未知の要求文が入力された場合、適切な意味構造パタンが存在しないために、意味構造の抽出に失敗し、あるいは、誤ったパタンの照合によって誤った意味構造が抽出されるためである。
また、上記した質問応答技術に限らず、音声入力された情報要求や操作要求から、要求内容を識別し、要求情報を提示する音声情報検索や音声質問応答、または、要求操作を実行する音声コマンドといった用途を視野に入れると、要求文が音声入力されることも考えねばならない。
加えて、要求文が音声によって入力される場合も、同様にして、意味構造の抽出に失敗し、あるいは、誤ったパタンの照合によって誤った意味構造が抽出されることが予想される。その理由は、音声認識処理によって得られる要求文テキストは誤り含みのため、要求文の誤りに起因して構文構造に誤りを生じ、さらに、要求文に対して正しい意味構造パタンが照合しなくなるためである。
本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、未知の要求文や、音声によって入力された要求文を、頑健かつ精度良く識別できる要求内容識別システムを提供することにある。
上記課題を解決する第1の発明は、自然言語形式で入力された要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容を識別する要求内容識別システムであって、
要求内容に依存しない非終端記号を生成する共通規則と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則とを用いて、入力要求文に対する構文構造を生成することにより前記入力要求文に対する構文解析を行い、入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別を行うことを特徴とする。
上記課題を解決する第2の本発明は、自然言語形式で入力された要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容を識別する要求内容識別システムであって、要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより入力要求文に対する構文解析を行う要求解析処理手段と、前記構文解析の結果入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成する要求識別結果生成手段とを備えたことを特徴とする。
上記課題を解決する第3の本発明は、上記第2の発明において、前記要求解析処理手段が、前記入力要求文に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成することを特徴とする。
上記課題を解決する第4の本発明は、上記第2又は第3の発明において、更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、前記要求解析処理手段が、前記音声認識結果候補に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成することを特徴とする。
上記課題を解決する第5の本発明は、上記第2から第4のいずれかの発明において、更に、前記解析スコアに加えて、音声認識結果と音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出する要求候補スコア計算手段を備え、前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。
上記課題を解決する第6の本発明は、上記第2から第5のいずれかの発明において、更に、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記入力要求文に類似するデータを検索する類似検索処理を行って、前記入力要求文との適合の度合いを示す検索スコアとともに検索結果候補を求める類似文書検索処理手段と、前記解析スコアに加えて、前記検索スコアを加味した統合スコアを算出する要求候補スコア計算手段とを備え、前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。
上記課題を解決する第7の本発明は、上記第2から第6のいずれかの発明において、更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、前記類似文書検索処理手段が、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記音声認識結果候補に類似するデータを検索する類似検索処理を行って、前記各音声認識結果候補との適合の度合いを示す検索スコアとともに検索結果候補を求め、前記要求候補スコア計算手段が、前記解析スコアと検索スコアに加えて、前記音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出し、前記要求識別結果生成手段が、該統合スコアに基づいて、最尤の解析結果候補を選択することを特徴とする。
上記課題を解決する第8の本発明は、上記第2から第7のいずれかの発明において、前記要求固有規則記憶手段は、前記要求固有規則を要求内容毎に区分けして記憶しており、前記要求解析処理手段は、前記共通規則と前記区分けされた要求固有規則を順次切り替えて入力要求文に対する構文解析を行うことを特徴とする。
上記課題を解決する第9の本発明は、上記第2から第8のいずれかの発明において、更に、類似する要求内容をクラスタ化した要求内容クラスタを記憶する要求内容クラスタ記憶手段を有し、前記要求識別結果生成手段が、前記要求内容クラスタ毎に、少なくとも前記解析スコアを集計して、最尤の解析結果候補クラスタを選択し、要求内容の識別結果として生成することを特徴とする。
上記課題を解決する第10の本発明は、要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに入力された自然言語形式による要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容識別方法であって、前記コンピュータが、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより要求文(入力要求文)に対する構文解析を行うステップと、前記コンピュータが、入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成するステップと、を含むことを特徴とする。
上記課題を解決する第11の本発明は、要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに実行されるプログラムであって、入力された自然言語による要求文(入力要求文)に対して、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより要求解析を行う処理と、前記構文解析の結果から入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成する処理とを前記コンピュータに実行させて、該コンピュータを、自然言語形式による要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する手段として機能させるためのプログラムである。
本発明によれば、未知の要求文が入力されたり、要求文が音声によって入力されたりした場合でも、これらの影響による要求識別の失敗や誤りが少ない、頑健で精度の高い情報要求識別結果を得ることが可能となる。その理由は、前記した共通ルールと要求固有ルールを適用し、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑え、要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られるよう構成したことにある。
本発明の第1の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第1の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の第2の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第2の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の第3の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第3の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の第4の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第4の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の第5の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第5の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の第6の実施形態に係る要求内容識別システムの構成を表したブロック図である。 本発明の第6の実施形態に係る要求内容識別システムの動作を表した流れ図である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)の例である。 本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの例(一部分)である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。 本発明に係る要求内容識別システムの要求候補スコアテーブル記憶手段に格納される情報(テーブル)の一例を表した図である。 本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。 図13の情報要求文と、回答要求データ記憶手段に記憶された内容との類似検索を行った場合の類似文書検索スコアとの関係を表した図である。 本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。 本発明に係る要求内容識別システムの要求候補スコアテーブル記憶手段に格納される情報(テーブル)の一例を表した図である。 本発明に係る要求内容識別システムの要求候補スコア計算手段によって算出される統合スコアを説明するための図である。 本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの別の例(一部分)である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)の別の例である。 本発明に係る要求内容識別システムの多階層要求内容クラスタ記憶手段に記憶される情報の具体例である。 本発明の実施例を説明するための、共通ルールおよび要求内容固有ルールの別の例(一部分)である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。 本発明の実施例を説明するための、情報要求文テキスト(情報要求文音声データ)rに対する要求解析結果の具体例を示す図である。
符号の説明
100a、100b 入力装置
200 出力装置
300 コンピュータ(中央処理装置;プロセッサ;データ処理装置)
301a、301b、301c、301d 要求解析処理手段
302a、302b、302c 要求識別結果生成手段
303 音声認識処理手段
304a、304b、304c 要求候補スコア計算手段
305a、305b 類似文書検索処理手段
306a、306b 規則切替手段
400 記録媒体
401 共通ルール記憶手段
402、402b 要求固有ルール記憶手段
403 要求候補スコアテーブル記憶手段
404 回答要求データ記憶手段
405 要求内容多階層クラスタ記憶手段
406 要求クラスタ固有ルール記憶手段
[第1の実施形態]
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図1は、本発明の第1の実施形態に係る要求内容識別システムの構成を表したブロック図である。図1を参照すると、本実施形態に係る要求内容識別システムは、入力装置100aと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
コンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された要求解析処理手段301aと、要求識別結果生成手段302aとを含んで構成される。
要求解析処理手段301aは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。
要求識別結果生成手段302aは、要求解析処理手段301aより出力されたリストの入力要求文に対する要求内容番号の候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力する手段である。
記憶媒体400は、共通ルール記憶手段401と、要求固有ルール記憶手段402とを含む。共通ルール記憶手段401は、要求解析処理手段301aにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しないように記述された構文解析用のルール(共通ルール)を記憶する。要求固有ルール記憶手段402は、要求解析処理手段301aにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール(要求固有ルール)を記憶する。
続いて、本実施形態の動作について図面を参照して詳細に説明する、図2は、本発明の第1の実施形態に係る要求内容識別システムの動作を表した流れ図である。図2を参照すると、まず、入力装置100aより情報要求文のテキストデータが入力されると(ステップA1)、要求解析処理手段301aが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号と各要求内容との構文解析上の適合の度合いを示す解析スコアのリスト(Nベスト)を出力する(ステップA2)。
続いて、要求識別結果生成手段302aが、要求解析処理手段301aで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力装置200に送る(ステップA3)。
以上のように、本実施形態によれば、上記解析スコアに基づいた選択が可能となるため、入力された情報要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られる。また、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑えることが可能であり、精度の良い情報要求文からの要求の識別を実現することが可能となっている。
[第2の実施形態]
続いて、音声で入力された情報要求文を識別可能とした本発明の第2の実施形態について図面を参照して詳細に説明する。図3は、本発明の第2の実施形態に係る要求内容識別システムの構成を表したブロック図である。図3を参照すると、本実施形態に係る要求内容識別システムは、入力装置100bと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
上記第1の実施形態との相違点は、入力装置100bが音声入力装置である点と、コンピュータ(中央処理装置;プロセッサ;データ処理装置)300の構成と、記憶媒体400に、要求候補スコアテーブル記憶手段403が追加されている点である。以下、上記した第1の実施形態と共通する部分は適宜省略して説明する。
本実施形態におけるコンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された音声認識処理手段303と、要求解析処理手段301bと、要求候補スコア計算手段304aと、要求識別結果生成手段302bとを含んで構成される。
音声認識処理手段303は、入力された情報要求文の音声データに対して音声認識処理を行い、入力要求文に対する音声認識結果として、予め用意された情報要求文テキストとの適合の度合いを示す音声認識スコアの付与された情報要求文テキストを複数候補出力する手段である。
要求解析処理手段301bは、音声認識処理手段303で得られた音声認識結果の各候補に対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する手段である。
要求候補スコア計算手段304aは、音声認識処理手段303で得られた音声認識結果の各候補とその音声認識スコアと、要求解析処理手段301bで得られた要求内容番号とその要求解析スコアとを、要求候補スコアテーブル記憶手段403に記録する。更に、要求候補スコア計算手段304aは、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアとを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号とともに要求識別結果生成手段302bに出力する手段である。
要求識別結果生成手段302bは、要求候補スコア計算手段304aより出力された入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。
要求候補スコアテーブル403は、要求候補スコア計算手段304aにおいて、音声認識処理手段303で得られた音声認識結果の各候補とその音声認識スコアを記録するとともに、音声認識結果の各候補に対して要求解析処理手段301bで得られた、要求内容番号とその要求解析スコアを記録する際に用いる、要求候補スコアテーブルを記憶する(図17参照)。
続いて、本実施形態の動作について図面を参照して詳細に説明する、図4は、本発明の第2の実施形態に係る要求内容識別システムの動作を表した流れ図である。図4を参照すると、まず、入力装置100bより情報要求文音声が入力されると(ステップB1)、音声認識処理手段303が、入力された情報要求文の音声データに対して音声認識処理を行い、入力された情報要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補(Nベスト)出力する(ステップB2;例:図13のr〜r)。
続いて、要求解析処理手段301bが、音声認識処理手段303で得られた音声認識結果の各候補に対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補(Nベスト)として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する(ステップB3)。
続いて、要求候補スコア計算手段304aが、音声認識処理手段303で得られた音声認識結果の各候補に対して、その音声認識スコアとともに、要求解析処理手段301bで得られた要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段403に記録し、さらに、音声認識結果の各候補に対して、音声認識スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する(ステップB4)。
最後に、要求識別結果生成手段302bが、要求候補スコア計算手段304aで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置200に送る(ステップB5)。
以上のように、本実施形態によれば、音声認識スコアと要求候補スコアを組み合わせた統合スコアを用いているため、音声認識と要求解析の結果を相補的に用いて最適な質問内容の識別結果を得ることが可能となる。また本実施形態によれば、音声認識処理のバラツキを考慮に入れているため、音声認識誤りの影響を最小限に抑えることが可能であり、精度の良い情報要求文からの要求の識別を実現することができる。
[第3の実施形態]
続いて、上記第1の実施形態に改良を加えた本発明の第3の実施形態について図面を参照して詳細に説明する。図5は、本発明の第3の実施形態に係る要求内容識別システムの構成を表したブロック図である。図5を参照すると、本実施形態に係る要求内容識別システムは、入力装置100aと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
上記第1の実施形態との相違点は、コンピュータ(中央処理装置;プロセッサ;データ処理装置)300の構成と、記憶媒体400に、回答要求データ記憶手段404が追加されている点である。以下、上記した第1、第2の実施形態と共通する部分は適宜省略して説明する。
本実施形態におけるコンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された要求解析処理手段301aと、要求候補スコア計算手段304bと、類似文書検索処理手段305aと、要求識別結果生成手段302bとを含んで構成される。
要求解析処理手段301aは、上記第1の実施形態と同様に、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。
類似文書検索処理手段305aは、入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段404に記憶された各要求内容に対する回答文書集合又は各要求内容に対する情報要求文集合又はその両方を対象に検索を行い、検索結果として要求内容番号と情報要求文との適合の度合いを示す類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する手段である。
本実施形態における要求候補スコア計算手段304bは、上記した第2の実施形態の要求候補スコア計算手段304aと略同様であるが、音声認識スコアに代えて、類似文書検索スコアを用い、統合スコアを計算する点で異なっている。即ち、要求候補スコア計算手段304bは、要求解析処理手段301aで得られた要求内容番号とその要求解析スコアの各候補に対して、類似文書検索処理手段305aで得られた要求内容番号とその類似文書検索スコアを、要求解析スコアと組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する手段である。
要求識別結果生成手段302bは、要求候補スコア計算手段304bで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。
回答要求データ記憶手段404は、類似文書検索処理手段305aが、入力要求文に類似するデータを検索する際に、検索対象となる文書データを記憶する手段である。例えば、各要求内容に対する回答文書集合又は/及び情報要求文集合が記憶される。
続いて、本実施形態の動作について図面を参照して詳細に説明する、図6は、本発明の第3の実施形態に係る要求内容識別システムの動作を表した流れ図である。図6を参照すると、まず、入力装置100aより情報要求文のテキストデータが入力されると(ステップA1)、要求解析処理手段301aが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補(Nベスト)として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する(ステップA2)。
続いて、類似文書検索処理手段305aが、ステップA1にて入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する(ステップC1)。
続いて、要求候補スコア計算手段304bが、入力された情報要求文のテキストデータに対して、要求解析処理手段301aで得られた要求内容番号とその要求解析スコアを、類似文書検索処理手段305aで得られた要求内容番号とその類似文書検索スコアと組み合わせることにより、入力要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する(ステップC2)。
最後に、要求識別結果生成手段302bが、要求候補スコア計算手段304bで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置200に送る(ステップB5)。
以上のように、本実施形態によれば、類似文書検索スコアと要求候補スコアを組み合わせた統合スコアを用いているため、要求解析、類似文書検索の結果を相補的に用いて最適な質問内容の識別結果を得ることが可能となる。また本実施形態によっても、未知の要求文や音声認識誤りに対する影響を最小限に抑えることが可能であり、精度の良い情報要求文からの要求の識別を実現することができる。
[第4の実施形態]
続いて、上記第2の実施形態に改良を加えた本発明の第4の実施形態について図面を参照して詳細に説明する。図7は、本発明の第4の実施形態に係る要求内容識別システムの構成を表したブロック図である。図7を参照すると、本実施形態に係る要求内容識別システムは、入力装置100bと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
上記第2の実施形態との相違点は、コンピュータ(中央処理装置;プロセッサ;データ処理装置)300の構成と、記憶媒体400に、上記第3の実施形態で説明した回答要求データ記憶手段404が追加されている点である。以下、上記した第2、第3の実施形態と共通する部分は適宜省略して説明する。
本実施形態におけるコンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された音声認識処理手段303と、要求解析処理手段301bと、要求候補スコア計算手段304cと、類似文書検索処理手段305bと、要求識別結果生成手段302bとを含んで構成される。
音声認識処理手段303は、上記第2の実施形態で説明したように、入力された情報要求文の音声データに対して音声認識処理を行い、入力要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補出力する手段である。
要求解析処理手段301bは、上記第2の実施形態で説明したように、音声認識処理手段303で得られた音声認識結果の各候補に対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する手段である。
類似文書検索処理手段305bは、音声認識処理手段303で得られた音声認識結果の各候補を検索要求として、回答要求データ記憶手段404に記憶された各要求内容に対する回答文書集合又は各要求内容に対する情報要求文集合又はその両方を対象に検索を行い、検索結果として要求内容番号とその類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する手段である。
要求候補スコア計算手段304cは、音声認識処理手段303で得られた音声認識結果の各候補とその音声認識スコアと、要求解析処理手段301bで得られた要求内容番号とその要求解析スコアと、類似文書検索処理手段305bで得られた要求内容番号とその類似文書検索スコアとを要求候補スコアテーブル記憶手段403に記録する。更に、要求候補スコア計算手段304cは、上記音声認識結果の各候補の音声認識スコアと、上記要求内容番号とその要求解析スコアと類似文書検索スコアとを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号とともに要求識別結果生成手段302bに出力する手段である。
要求識別結果生成手段302bは、要求候補スコア計算手段304cより出力された入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力する手段である。
要求候補スコアテーブル403及び回答要求データ記憶手段404は、それぞれ第2の実施形態及び第3の実施形態で説明しているので省略する。
続いて、本実施形態の動作について図面を参照して詳細に説明する。図8は、本発明の第4の実施形態に係る要求内容識別システムの動作を表した流れ図である。図8を参照すると、まず、入力装置100bより情報要求文音声が入力されると(ステップB1)、音声認識処理手段303が、入力された情報要求文の音声データに対して音声認識処理を行い、入力された情報要求文に対する音声認識結果として、音声認識スコアの付与された情報要求文テキストを複数候補(Nベスト)出力する(ステップB2;例:図13のr〜r)。
続いて、要求解析処理手段301bが、音声認識処理手段303で得られた音声認識結果の各候補に対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402に記憶された要求固有ルールとを用いて要求解析処理を行い、音声認識結果の各候補に対する構文構造を生成することにより、音声認識結果の各候補に対する要求解析結果の複数候補(Nベスト)として、認識結果の各候補に対する要求内容番号とその要求解析スコアのリストを出力する(ステップB3)。
続いて、類似文書検索処理手段305bが、音声認識処理手段303で得られた音声認識結果の各候補を検索要求として、回答要求データ記憶手段404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する(ステップD1)。
続いて、要求候補スコア計算手段304cが、音声認識処理手段303で得られた音声認識結果の各候補に対して、その音声認識スコアとともに、要求解析処理手段301bで得られた要求内容番号とその要求解析スコアと、類似文書検索処理手段305bで得られた要求内容番号とその類似文書検索スコアを、要求候補スコアテーブル記憶手段403に記録し、さらに、音声認識結果の各候補に対して、音声認識スコアと要求解析スコアと類似文書検索スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する(ステップD2)。
最後に、要求識別結果生成手段302bが、要求候補スコア計算手段304cで得られた入力要求文の全候補を統合スコア順にソートし、最も統合スコアの高い要求内容番号を識別結果として生成し、出力装置200に送る(ステップB5)。
以上のように、本実施形態によれば、音声認識スコアと要求候補スコアと類似文書検索スコアを組み合わせた統合スコアを用いているため、音声認識、要求解析、類似文書検索の結果を相補的に用いて音声認識誤りの影響を最小限に抑え、最適な質問内容の識別結果を得ることが可能となる。
[第5の実施形態]
続いて、本発明の第5の実施形態について図面を参照して詳細に説明する。図9は、本発明の第5の実施形態に係る要求内容識別システムの構成を表したブロック図である。図9を参照すると、本実施形態に係る要求内容識別システムは、入力装置100aと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
上記第1の実施形態との相違点は、コンピュータ(中央処理装置;プロセッサ;データ処理装置)300の構成に規則切替手段306aを追加した点と、上記第1の実施形態で説明した要求固有ルールを一括して記憶する要求固有ルール記憶手段402に代えて、要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNというように各要求内容毎に、対応する要求固有ルールを区別して記憶する、要求固有ルール記憶手段402bを備えた点である。
コンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された要求解析処理手段301cと、規則切替手段306aと、要求識別結果生成手段302aとを含んで構成される。
要求解析処理手段301cは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402bに、各要求内容毎に記憶された要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNのすべての要求固有ルールのうち、規則切替手段306aが順次切り替える要求固有ルールとを用いて要求解析処理を行い、入力要求文に対して共通ルールとすべての要求固有ルールからいずれかを順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する手段である。
要求識別結果生成手段302aは、要求解析処理手段301cより出力されたリストの入力要求文に対する要求内容番号の候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力する手段である。
規則切替手段306aは、要求固有ルール記憶手段402bに記憶された要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNの全N個の要求固有ルールのうち、いずれかの要求固有ルールに順次切り替えを行うことにより、要求解析処理手段301cに対して要求解析処理に用いる要求固有ルールを提供する。
記憶媒体400は、共通ルール記憶手段401と、要求固有ルール記憶手段402bとを含む。共通ルール記憶手段401は、要求解析処理手段301cにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しないように記述された構文解析用のルール(共通ルール)を記憶する。要求固有ルール記憶手段402bは、要求解析処理手段301cにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール(要求固有ルール)を各要求内容毎に、対応する要求固有ルールとして、要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNの全N個の要求固有ルールを区別して記憶する。
続いて、本実施形態の動作について図面を参照して詳細に説明する。図10は、本発明の第5の実施形態に係る要求内容識別システムの動作を表した流れ図である。図10を参照すると、まず、入力装置100aより情報要求文のテキストデータが入力されると(ステップA1)、要求解析処理手段301cが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402bに、各要求内容毎に記憶された要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNのすべての要求固有ルールのうち、規則切替手段306aが順次切り替える要求固有ルールとを用いて要求解析処理を行い、入力要求文に対して共通ルールとすべての要求固有ルールからいずれかを順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号と各要求内容との構文解析上の適合の度合いを示す解析スコアのリスト(Nベスト)を出力する(ステップE1)。
続いて、要求識別結果生成手段302aが、要求解析処理手段301cで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容番号を識別結果として生成し、出力装置200に送る(ステップA3)。
以上のように、本実施形態によれば、第1の実施例と同様、上記解析スコアに基づいた選択が可能となるため、入力された情報要求文の構文構造の妥当性や要求の識別結果の妥当性が保証された識別結果が得られる。また、未知の要求文に対しても、誤ったルールの適用による識別誤りを最小限に抑えることが可能であり、精度の良い情報要求文からの要求の識別を実現することが可能となっている。
[第6の実施形態]
続いて、本発明の第6の実施形態について図面を参照して詳細に説明する。図11は、本発明の第6の実施形態に係る要求内容識別システムの構成を表したブロック図である。
図11を参照すると、本実施形態に係る要求内容識別システムは、入力装置100aと、出力装置200と、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)300と、記憶媒体400とから構成されている。
上記第5の実施形態との相違点は、記憶媒体400に、後記する要求内容多階層クラスタ記憶手段405と、要求クラスタ固有ルール記憶手段406とが追加されている点である。
コンピュータ(中央処理装置;プロセッサ;データ処理装置)300は、それぞれコンピュータプログラムで構成された要求解析処理手段301dと、規則切替手段306bと、要求識別結果生成手段302cとを含んで構成される。
要求解析処理手段301dは、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402bに、各要求内容毎に記憶された要求固有ルール1、要求固有ルール2、・・・、要求固有ルールN、要求クラスタ固有ルール記憶手段406に各要求内容クラスタ毎に記憶された要求クラスタ固有ルール1、要求クラスタ固有ルール2、・・・、要求クラスタ固有ルールNのすべての要求固有ルールのうち、規則切替手段306bが順次切り替える要求内容クラスタに対応する要求固有ルールの集合とを用いて要求解析処理を行い、入力要求文に対して共通ルールとすべての要求固有ルールからいずれかの要求内容クラスタに対応する要求固有ルールの集合を順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタとその要求解析スコアのリストを出力する手段である。
要求識別結果生成手段302cは、要求解析処理手段301dより出力されたリストの入力要求文に対する要求内容クラスタの候補をスコア順にソートし、最もスコアの高い要求内容クラスタ(要求内容番号の集合で表現される)を識別結果として生成し、出力する手段である。
規則切替手段306bは、要求内容多階層クラスタ記憶手段405に記憶された内容に従って、要求固有ルール記憶手段402bに各要求内容毎に記憶された要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNの全N個の要求固有ルール及び要求クラスタ固有ルール記憶手段406に各要求内容クラスタ毎に記憶された要求クラスタ固有ルール1、要求クラスタ固有ルール2、・・・、要求クラスタ固有ルールNのうち、いずれかの要求内容クラスタに対応する要求固有ルールの集合に順次切り替えを行うことにより、要求解析処理手段301dに対して要求解析処理に用いる要求固有ルールの集合を提供する。
記憶媒体400は、共通ルール記憶手段401と、要求固有ルール記憶手段402bと、要求内容多階層クラスタ記憶手段405と、要求クラスタ固有ルール記憶手段406と、を含む。共通ルール記憶手段401は、要求解析処理手段301dにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に依存しないように記述された構文解析用のルール(共通ルール)を記憶する。要求固有ルール記憶手段402bは、要求解析処理手段301dにおいて、入力要求文に対して要求解析を行う際に用いる、固有の要求内容に固有の語彙や表現に特化して記述された構文解析用のルール(要求固有ルール)を各要求内容毎に、対応する要求固有ルールとして、要求固有ルール1、要求固有ルール2、・・・、要求固有ルールNの全N個の要求固有ルールを区別して記憶する。要求内容多階層クラスタ記憶手段405は、要求内容が互いに類似する質問内容の集合を多階層のクラスタ構造(要求内容番号の集合で表現される)で記述した要求内容クラスタ(要求内容カテゴリ)を記憶する。また、要求クラスタ固有ルール記憶手段406は、前記要求内容クラスタに固有の語彙や表現に特化して記述された構文解析用のルール(要求クラスタ固有ルール)を各クラスタ毎に、対応する要求固有ルールとして、要求クラスタ固有ルール1、要求クラスタ固有ルール2、・・・、要求クラスタ固有ルールNの全N個の要求クラスタ固有ルールを区別して記憶する。
続いて、本実施形態の動作について図面を参照して詳細に説明する。図12は、本発明の第6の実施形態に係る要求内容識別システムの動作を表した流れ図である。図12を参照すると、まず、入力装置100aより情報要求文のテキストデータが入力されると(ステップA1)、要求解析処理手段301dが、入力された情報要求文のテキストデータに対して、共通ルール記憶手段401に記憶された共通ルールと、要求固有ルール記憶手段402b及び要求クラスタ固有ルール記憶手段406に格納されたすべての要求固有ルールのうち、規則切替手段306bが順次切り替える要求内容クラスタに対応する要求固有ルールの集合とを用いて要求解析処理を行い、構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタと、各クラスタの要求内容との構文解析上の適合の度合いを示す解析スコアのリスト(Nベスト)を出力する(ステップF1)。
続いて、要求識別結果生成手段302cが、要求解析処理手段301dで得られた入力要求文の全候補をスコア順にソートし、最もスコアの高い要求内容クラスタ(要求内容番号の集合で表現される)を識別結果として生成し、出力装置200に送る(ステップF2)。
以上のように、本実施形態によれば、第5の実施形態の効果に加え、上記解析スコアに基づいた要求内容クラスタの選択が可能となるため、入力された情報要求文が未知の要求文で、直接対応する要求内容番号が存在しない場合においても、最も内容の近い適当な要求内容クラスタに対応する要求として識別することが可能となっている。
続いて、上記した各実施形態の作用効果をより具体的に説明すべく、本発明の実施例を説明する。
[実施例1]
以下、第1実施例として、上記した本発明の第1の実施形態の動作を、図1、図2と、図13〜図15の補助図面を参照して、具体的に説明する。
本実施例では、図2のステップA1にて、入力装置100aに、「ショートメール受信時の画面は設定できますか」(図13の表記記号r)との情報要求文が入力されたものとして説明する。図14は、共通ルール(a)及び(b)と、要求内容固有ルール(a)及び(b)の具体例を表した図である(各ルールは全体の一部を示す。)。なお、図14の要求内容固有ルール(a)及び(b)は、要求内容番号19に固有の要求固有ルールの一部である。
続いて、先に図2のステップA2で説明したように、要求解析処理手段301aが、共通ルール記憶手段401、要求固有ルール記憶手段402より、共通ルールと、要求固有ルールとを用いて、前記した図13の表記記号rの要求文について要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。
図15は、要求解析処理手段301aが、図14に示すような共通ルール(a)及び(b)、要求内容固有ルール(a)及び(b)を用いて、図13の表記記号rの情報要求文の要求解析により得られた候補とその解析スコアを表した図である。図15を参照すると、要求内容Q19を候補とする第1解析候補S(r)の解析スコアは−25であり、要求内容Q15を候補とする第2解析候補S(r)の解析スコアは−35であり、要求内容Qを候補とする第3解析候補S(r)の解析スコアは−40である。
そして、先に図2のステップA3で説明したように、要求識別結果生成手段302aが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置200に送る。図15に例示した要求解析結果の場合、上記スコア順に、要求内容Q19(解析スコア=−25)、要求内容Q15(解析スコア=−35)、要求内容Q(解析スコア=−40)が得られ、最もスコアの高い第1解析候補S(r)の要求内容Q19が識別結果として生成される。
[実施例2]
以下、第2実施例として、上記した本発明の第2の実施形態の動作を、図3、図4と、図13〜図18の補助図面を参照して、具体的に説明する。
本実施例では、図4のステップB1にて、入力装置100bに、「ショートメール受信時の画面は設定できますか」(図13の表記記号r)との音声にて情報要求文が入力されたものとして説明する。
そして、音声認識処理手段303における音声認識処理の結果(図4のステップB2)、情報要求文の第1候補として、図13の表記記号rの情報要求文(音声認識スコア=−20)と、第2候補として、図13の表記記号rの情報要求文(音声認識スコア=−22)とが得られたものとする。
そして、先に図4のステップB3で説明したように、要求解析処理手段301bが、共通ルール記憶手段401、要求固有ルール記憶手段402より、共通ルールと、要求固有ルールとを用いて、前記した図13の表記記号r、rの要求文について要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。
図16は、要求解析処理手段301bが、図14に示すような共通ルール(a)及び(b)、要求内容固有ルール(a)及び(b)を用いて、図13の表記記号rの情報要求文の要求解析により得られた候補とその解析スコアを表した図である。図16を参照すると、要求内容番号19で特定される要求内容Q15を候補とする第1解析候補S(r)の解析スコアは−35であり、要求内容Qを候補とする第2解析候補S2(r)の解析スコアは−40であり、要求内容Q19を候補とする第3解析候補S3(r)の解析スコアは−45である。
図13の表記記号rの情報要求文についての要求解析により得られた候補とその解析スコアは、先の実施例1で図15を用いて説明したとおりであり、要求番号19で特定される要求内容Q19を候補とする第1解析候補S(r)の解析スコアは−25であり、要求内容Q15を候補とする第2解析候補S(r)の解析スコアは−35であり、要求内容Qを候補とする第3解析候補S(r)の解析スコアは−40である。
従って、上記表記記号rの要求文(第1候補)の音声認識スコアとして−20が、要求解析結果として、要求内容Q15(解析スコア=−35)、要求内容Q(解析スコア=−40)、要求内容Q19(解析スコア=−45)が要求候補スコア計算手段304aに出力される。同様にして、上記表記記号rの要求文(第2候補)の音声認識スコアとして−22が、要求解析結果として、要求内容Q19(解析スコア=−25)、要求内容Q15(解析スコア=−35)、要求内容Q(解析スコア=−40)が要求候補スコア計算手段304aに出力されることとなる。
そして、先に図4のステップB4で説明したように、要求候補スコア計算手段304aが、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段403に記録する。
図17は、上記表記記号rの要求文(第1候補)と上記表記記号rの要求文(第2候補)について、各音声認識スコアと、要求内容番号とその要求解析スコアの記録したテーブルの一例である。
さらに、要求候補スコア計算手段304aは、上記したテーブルに記録された音声認識スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する。
上記統合スコアの計算には、例えば、下記(1)式を用いることができる。ここで、R_Scoreは音声認識スコア、P_Scoreは解析スコア、α,β(α>0,β>0)は結合パラメータ、Θは要求解析の解析スコアに対する閾値である。
Figure 0005099367
例えば、上記(1)式(但し、α=β=1,Θ=100)を用いて、音声認識結果の各候補に対する要求内容番号毎の統合スコアを計算すると、図18に示すとおりとなる。図18を参照すると、上記表記記号rの要求文(第1候補)に対して、・・・、−55(Q=Q15)、・・・、−65(Q=Q19)、・・・、−60(Q=Q)、と上記表記記号rの要求文(第2候補)に対して、・・・、−57(Q=Q15)、・・・、−47(Q=Q19)、・・・、−62(Q=Q)といった結果が得られている。
そして、先に図4のステップB5で説明したように、要求識別結果生成手段302bが、要求候補スコア計算手段304aで得られた入力要求文の全候補を統合スコア順にソートすると、図18の結果の場合、Score(Q19)=−47、Score(Q15)=−55、Score(Q)=−60・・・となる。そして、最尤の候補である、最もスコアの高いQ=Q19が生成・出力される。
ここで、注意すべきことは、入力音声が、図13の表記記号rであり、その音声認識結果として図13の表記記号rの方が音声認識スコアが高かったにもかかわらず、上記した要求解析結果を組み合わせることにより、第1実施例と同様に正しい結果が得られていることである。このように、本発明の第2の実施形態(実施例)では、音声認識誤りの影響を最小限に抑え、精度良く要求内容を識別することが可能となっている。
[実施例3]
以下、第3実施例として、上記した本発明の第3の実施形態の動作を、図5、図6と、図13、図14、図16、図19、図20の補助図面を参照して、具体的に説明する。
本実施例では、図6のステップA1にて、入力装置100aに、「ショートメール受信機能画面は設定できますか」(図13の表記記号r)との情報要求文が入力されたものとして説明する。
先に図6のステップA2で説明したように、要求解析処理手段301aが、共通ルール記憶手段401、要求固有ルール記憶手段402より、共通ルールと、要求固有ルールとを用いて、前記した図13の表記記号rの要求文について要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。
図13の表記記号rの情報要求文についての要求解析により得られた候補とその解析スコアは、先の実施例2で図16を用いて説明したとおりであり、要求番号19で特定される要求内容Q15を候補とする第1解析候補S(r)の解析スコアは−35であり、要求内容Qを候補とする第2解析候補S(r)の解析スコアは−40であり、要求内容Q19を候補とする第3解析候補S(r)の解析スコアは−45である。
先に図6のステップC1で説明したように、類似文書検索処理手段305aが、入力された情報要求文のテキストデータを検索要求として、回答要求データ記憶手段404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する。
図19は、表記記号r〜rの情報要求文と、回答要求データ記憶手段404に記憶された内容との類似検索を行った場合の類似文書検索スコアとの関係を表した図である。
以下、図19に示されたように、表記記号rの情報要求文に対し、各要求内容番号に対する類似文書検索スコアとして、・・・、+3(Q=Q15)、・・・、+15(Q=Q19)、・・・、が得られたものとして説明する。
そして、先に図6のステップC2で説明したように、要求候補スコア計算手段304bは、上記したテーブルに記録された類似文書検索スコアと要求解析スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する。
上記統合スコアの計算には、例えば、下記(2)式を用いることができる。ここで、P_Scoreは解析スコア、IR_Scoreは類似文書検索スコア、α,β(α>0,β>0)は結合パラメータ、Θは要求解析の解析スコアに対する閾値である。
Figure 0005099367
例えば、上記(2)式(但し、α=β=1,Θ=100)を用いて、要求内容番号毎の統合スコアScore(r,Q)を計算すると、図20に示すとおりとなる。図20を参照すると、上記表記記号rの要求文(第1候補)に対して、・・・、−32(Q=Q15)、・・・、−30(Q=Q19)、・・・、−40(Q=Q)、といった結果が得られている。
そして、先に図6のステップB5で説明したように、要求識別結果生成手段302bが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置200に送る。図20に例示した要求解析結果の場合、上記スコア順に、要求内容Q19(解析スコア=−30)、要求内容Q15(解析スコア=−32)、要求内容Q(解析スコア=−40)が得られ、最もスコアの高い要求内容Q19が識別結果として生成される。
本実施例においても、図13の表記記号rの入力テキストに対し、その類似文書検索結果と、要求解析結果を組み合わせることにより、第1実施例と同様に正しい結果が得られていることである。このように、本発明の第3の実施形態(実施例)でも、未知の要求文や音声認識誤りに対する影響を最小限に抑え、精度良く要求内容を識別することが可能となっている。
[実施例4]
以下、第4実施例として、上記した本発明の第4の実施形態の動作を、図7、図8と、図13、図14、図16、図19、図21〜図23の補助図面を参照して、具体的に説明する。
本実施例では、図8のステップB1にて、入力装置100bに、「ショートメール受信時の画面は設定できますか」(図13の表記記号r)との音声にて情報要求文が入力されたものとして説明する。
そして、音声認識処理手段303における音声認識処理の結果(図8のステップB2)、情報要求文の第1候補として、図13の表記記号rの情報要求文(音声認識スコア=−20)と、第2候補として、図13の表記記号rの情報要求文(音声認識スコア=−22)とが得られたものとする。
そして、先に図8のステップB3で説明したように、要求解析処理手段301bが、共通ルール記憶手段401、要求固有ルール記憶手段402より、共通ルールと、要求固有ルールとを用いて、前記した図13の表記記号r、rの要求文について要求解析処理を行い、入力要求文に対する構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。
図21は、要求解析処理手段301bが、図14に示すような共通ルール(a)及び(b)、要求内容固有ルール(a)及び(b)を用いて、図13の表記記号rの情報要求文の要求解析により得られた候補とその解析スコアを表した図である。図21を参照すると、要求内容Qを候補とする第1解析候補S(r)の解析スコアは−50である。
図13の表記記号rの情報要求文についての要求解析により得られた候補とその解析スコアは、先の実施例2で図16を用いて説明したとおりであり、要求内容番号19で特定される要求内容Q15を候補とする第1解析候補S(r)の解析スコアは−35であり、要求内容Qを候補とする第2解析候補S(r)の解析スコアは−40であり、要求内容Q19を候補とする第3解析候補S(r)の解析スコアは−45である。
続いて、先に図8のステップD1で説明したように、類似文書検索処理手段305bが、音声認識処理手段303で得られた音声認識結果の前記第1候補、第2候補を検索要求として、回答要求データ記憶手段404に記憶された文書データを対象に類似文書検索を行い、検索結果として要求内容番号と類似文書検索スコアを求め、要求内容番号とその類似文書検索スコアの組を出力する。
上記類似文書検索の結果、図19に示したように、表記記号rの情報要求文に対し、各要求内容番号に対する類似文書検索スコアとして、・・・、+2(Q=Q15)、・・・、+2(Q=Q19)、・・・、が得られ、表記記号rの情報要求文に対し、各要求内容番号に対する類似文書検索スコアとして、・・・、+3(Q=Q15)、・・・、+15(Q=Q19)、・・・、が得られたものとして説明する。
そして、先に図8のステップD2で説明したように、要求候補スコア計算手段304cが、上記音声認識結果の各候補の音声認識スコアと、要求内容番号とその要求解析スコアを、要求候補スコアテーブル記憶手段403に記録する。
図22は、上記表記記号rの要求文(第1候補)と上記表記記号rの要求文(第2候補)について、各音声認識スコアと、要求内容番号とその要求解析スコアを記録したテーブルの一例である。
さらに、要求候補スコア計算手段304cは、上記したテーブルに記録された音声認識スコアと要求解析スコアと類似文書検索スコアを組み合わせることにより、入力された情報要求文に対する要求内容の全候補に対して統合スコアを計算し、要求内容番号を統合スコアとともに出力する。
上記統合スコアの計算には、例えば、下記(3)式を用いることができる。ここで、R_Scoreは音声認識スコア、P_Scoreは解析スコア、IR_Scoreは類似文書検索スコア、α,β,γ(α>0,β>0,γ>0)は結合パラメータ、Θは要求解析の解析スコアに対する閾値である。
Figure 0005099367
例えば、上記(3)式(但し、α=β=γ=1,Θ=100)を用いて、要求内容番号毎の統合スコアScore(r,Q)を計算すると、図23に示すとおりとなる。図23を参照すると、音声認識結果の表記記号rの要求文(第1候補)に対して、・・・、−118(Q=Q15)、・・・、−118(Q=Q19)、・・・、−70(Q=Q)、といった結果が得られ、音声認識結果の表記記号rの要求文(第2候補)に対して、・・・、−54(Q=Q15)、・・・、−52(Q=Q19)、・・・、−62(Q=Q)、といった結果が得られている。
そして、先に図8のステップB5で説明したように、要求識別結果生成手段302bが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置200に送る。図23に例示した要求解析結果の場合、上記スコア順に、要求内容Q19(解析スコア=−52)、要求内容Q15(解析スコア=−54)、要求内容Q(解析スコア=−62)が得られ、最もスコアの高い要求内容Q19が識別結果として生成される。
上記したように、本実施例においても、比較的元の発声文を正しく認識している音声認識結果の第2候補rに対する要求解析結果と類似文書検索に基づいて、要求内容番号Q=Q19が最尤の識別結果であると判断している。このように、精度良く要求内容を識別できている理由は、音声入力された情報要求文に対し、その音声認識結果、その類似文書検索結果と、要求解析結果を相補的に用いて音声認識誤りの影響を最小限に抑えていることにある。
[実施例5]
以下、第5実施例として、上記した本発明の第5の実施形態の動作を、図9、図10と、図13、図24〜図25の補助図面を参照して、具体的に説明する。
本実施例では、図10のステップA1にて、入力装置100aに、「ショートメール受信時の画面は設定できますか」(図13の表記記号r)との情報要求文が入力されたものとして説明する。図24は、共通ルール(a)及び(b)と、要求固有ルール記憶手段402bに区別して格納された要求内容固有ルールの具体例を表した図である(各ルールは全体の一部を示す。)。なお、図24の要求内容固有ルール19(a)及び(b)は、要求内容番号19に固有の要求固有ルール19の一部であり、図14に例示した要求固有ルールとの相違点は、要求内容番号が省略されている点である。
続いて、先に図10のステップE1で説明したように、要求解析処理手段301cが、共通ルール記憶手段401、要求固有ルール記憶手段402bより、共通ルールと、規則切替手段306aが順次切り替える要求固有ルールとを用いて、前記した図13の表記記号rの要求文について要求解析処理を行い、入力要求文に対して共通ルールとすべての要求固有ルールからいずれかを順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容番号とその要求解析スコアのリストを出力する。
図25は、要求解析処理手段301cが、図24に示すような共通ルール(a)及び(b)、要求内容固有ルール19(a)及び(b)を用いて、図13の表記記号rの情報要求文の要求解析により得た第1解析候補S(19) (r)とその解析スコア、共通ルールと要求内容固有ルール15を用いた第1解析候補S(15) (r)とその解析スコア、共通ルールのみを用いた第1解析候補S(0) (r)を表した図である。図25を参照すると、要求内容Q19を候補とする第1解析候補S(19) (r)の解析スコアは−25であり、要求内容Q15を候補とする第1解析候補S(15) (r)の解析スコアは−35であり、要求内容Qを候補とする第1解析候補S(0) (r)の解析スコアは−40である。
そして、先に図10のステップA3で説明したように、要求識別結果生成手段302aが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容番号を識別結果として生成し、出力装置200に送る。図25に例示した要求解析結果の場合、上記スコア順に、要求内容Q19(解析スコア=−25)、要求内容Q15(解析スコア=−35)、要求内容Q(解析スコア=−40)が得られ、最もスコアの高い第1解析候補S(19) (r)の要求内容Q19が識別結果として生成される。
[実施例6]
以下、第6実施例として、上記した本発明の第6の実施形態の動作を、図11、図12と、図13、図24、図26〜図30の補助図面を参照して、具体的に説明する。
本実施例では、図12のステップA1にて、入力装置100aに、「ショートメール受信時の画面は設定できますか」(図13の表記記号r)との情報要求文が入力された場合と、「ショートメール受信時の設定はできますか」(図26の表記記号r)との情報要求文が入力された場合について説明する。
図27は、要求内容多階層クラスタ405の具体例を表した図であり、要求内容クラスタ番号(C1〜C121〜CN)と、各要求内容クラスタに含まれる要求内容番号が定義された構成となっている。例えば、要求内容クラスタ1(C1)は、互いに類似する要求内容番号1、5が定義付けられており、要求内容クラスタ3(C3)は、互いに類似する要求内容番号19、20が定義付けられている。
図28は、要求内容番号20および要求内容クラスタ3(C3)に対する要求クラスタ固有ルールの具体例を示した図である。なお、図28の要求内容固有ルール20(a)及び(b)は、要求内容番号20に固有の要求固有ルール20の一部であり、要求クラスタ固有ルール3は、要求内容クラスタ3(C3)に固有の要求固有ルールの一部である。
続いて、先に図12のステップF1で説明したように、要求解析処理手段301dが、共通ルールと、要求固有ルール記憶手段402b及び要求クラスタ固有ルール記憶手段406に記憶された要求固有ルールのうち、規則切替手段306bが順次切り替える要求固有ルールの集合とを用いて、前記した図13の表記記号rの要求文について要求解析処理を行い、入力要求文に対して共通ルールと、要求内容クラスタに対応する要求固有ルールの集合を順次用いて構文構造を生成することにより、入力要求文に対する要求解析結果の複数候補として、入力要求文に対する要求内容クラスタ(要求内容番号の集合で表現される)とその要求解析スコアのリストを出力する。
図29は、要求解析処理手段301dが、図24に示すような共通ルール(a)及び(b)、要求内容固有ルール19(a)及び(b)を用いて図13の表記記号rの情報要求文の要求解析により得た第1解析候補S(19) (r)とその解析スコア、共通ルールと図28に示すような要求内容固有ルール20(a)及び(b)を用いた第1解析候補S(20) (r)、要求内容クラスタ3(C3;図27参照)に対応する要求内容固有ルール19、要求内容固有ルール20及び図28に示すような要求クラスタ固有ルール3(C3)を用いた第1解析候補S(C3) (r)を表した図である。
図29を参照すると、要求内容Q19を候補とする第1解析候補S(19) (r)の解析スコアは−25であり、要求内容Q20を候補とする第1解析候補S(20) (r)の解析スコアは−35であり、要求内容クラスタ3(C3)を候補とする第1解析候補S(C3) (r)の解析スコアは−25である。
そして、先に図12のステップF2で説明したように、要求識別結果生成手段302cが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容クラスタを識別結果として生成し、出力装置200に送る。図29に例示した要求解析結果の場合、上記スコア順(同スコアの場合、クラスタ構成要素が少ない方から上位に並べる)に、要求内容Q19(解析スコア=−25)、要求内容クラスタ3(解析スコア=−25)、要求内容Q20(解析スコア=−35)が得られ、最もスコアの高いS(19) (r)の要求内容Q19が識別結果として生成される。
また、図12のステップA1にて、入力装置100aに、「ショートメール受信時の設定はできますか」(図26の表記記号r)との情報要求文が入力された場合も同様である。
図30は、要求解析処理手段301dが、図24に示すような共通ルール(a)及び(b)、要求内容固有ルール19(a)及び(b)を用いて図26の表記記号rの情報要求文の要求解析により得た第1解析候補S(19) (r)とその解析スコア、共通ルールと図28に示すような要求内容固有ルール20(a)及び(b)を用いた第1解析候補S(20) (r)、要求内容クラスタ3(C3)に対応する要求内容固有ルール19、要求内容固有ルール20及び図28に示すような要求クラスタ固有ルールC3を用いた第1解析候補S(C3) (r)を表した図である。
図30を参照すると、要求内容Q19を候補とする第1解析候補S(19) (r)と要求内容Q20を候補とする第1解析候補S(20) (r)は共通ルールのみに基づく同一構造で解析スコアも共に−45である。一方、要求内容クラスタC3を候補とする第1解析候補S(C3) (r)の解析スコアは−30である。
そして、先に図12のステップF2で説明したように、要求識別結果生成手段302cが、これら全候補をスコア順にソートし、最もスコアの高い候補を最尤とし、その要求内容クラスタを識別結果として生成し、出力装置200に送る。図30に例示した要求解析結果の場合、上記スコア順(同スコアの場合、クラスタ構成要素が少ない方から上位に並べる)に、要求内容クラスタ3(解析スコア=−30)、要求内容Q19(解析スコア=−45)、要求内容Q20(解析スコア=−45)が得られ、最もスコアの高いS(C3) (r)の要求内容クラスタC3が識別結果として生成される。
このように本実施例では、特定の要求内容番号に対応しない入力要求文であっても、その上位階層の要求内容クラスタに識別され、結果を出力することができる。
以上、本発明を実施するための形態及びこれに即応した各実施例を説明したが、本発明の技術的範囲は、上述した実施形態及び実施例の記載に限定されるものではなく、要求内容の識別を必要とするシステムの用途、仕様等に応じて、各種の変形を加えることが可能であることはいうまでもない。

Claims (11)

  1. 自然言語形式で入力された要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容を識別する要求内容識別システムであって、
    要求内容に依存しない非終端記号を生成する共通規則と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則とを用いて、入力要求文に対する構文構造を生成することにより前記入力要求文に対する構文解析を行い、入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別を行うこと、
    を特徴とする要求内容識別システム。
  2. 自然言語形式で入力された要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容を識別する要求内容識別システムであって、
    要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、
    事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、
    前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより入力要求文に対する構文解析を行う要求解析処理手段と、
    前記構文解析の結果入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成する要求識別結果生成手段と
    を備えたことを特徴とする要求内容識別システム。
  3. 前記要求解析処理手段が、前記入力要求文に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、
    前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成すること、
    を特徴とする請求項2に記載の要求内容識別システム。
  4. 更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、
    前記要求解析処理手段が、前記音声認識結果候補に対して、予め用意された要求内容との適合の度合いを示す解析スコアとともに解析結果候補を複数生成し、
    前記要求識別結果生成手段が、前記解析スコアに基づいて、最尤の解析結果候補を選択し、要求内容の識別結果を生成すること、
    を特徴とする請求項2に記載の要求内容識別システム。
  5. 更に、前記解析スコアに加えて、音声認識結果と音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出する要求候補スコア計算手段を備え、
    前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択すること、
    を特徴とする請求項3に記載の要求内容識別システム。
  6. 更に、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記入力要求文に類似するデータを検索する類似検索処理を行って、前記入力要求文との適合の度合いを示す検索スコアとともに検索結果候補を求める類似文書検索処理手段と、
    前記解析スコアに加えて、前記検索スコアを加味した統合スコアを算出する要求候補スコア計算手段とを備え、
    前記要求識別結果生成手段が、前記統合スコアに基づいて、最尤の解析結果候補を選択すること、
    を特徴とする請求項3に記載の要求内容識別システム。
  7. 更に、音声入力された入力要求文に対して音声認識処理を行って音声認識結果候補を生成する音声認識処理手段を備え、
    前記類似文書検索処理手段が、所定の回答文書データ集合及び要求文データ集合の少なくとも一方を検索対象として、前記音声認識結果候補に類似するデータを検索する類似検索処理を行って、前記各音声認識結果候補との適合の度合いを示す検索スコアとともに検索結果候補を求め、
    前記要求候補スコア計算手段が、前記解析スコアと検索スコアに加えて、前記音声認識結果候補との適合の度合いを示す認識スコアを加味した統合スコアを算出し、
    前記要求識別結果生成手段が、該統合スコアに基づいて、最尤の解析結果候補を選択すること、
    を特徴とする請求項6に記載の要求内容識別システム。
  8. 前記要求固有規則記憶手段は、前記要求固有規則を要求内容毎に区分けして記憶しており、
    前記要求解析処理手段は、前記共通規則と前記区分けされた要求固有規則を順次切り替えて入力要求文に対する構文解析を行うこと、
    を特徴とする請求項2から請求項7いずれかに記載の要求内容識別システム。
  9. 更に、類似する要求内容をクラスタ化した要求内容クラスタを記憶する要求内容クラスタ記憶手段を有し、
    前記要求識別結果生成手段が、前記要求内容クラスタ毎に、少なくとも前記解析スコアを集計して、最尤の解析結果候補クラスタを選択し、要求内容の識別結果として生成すること、
    を特徴とする請求項3から請求項8いずれか一に記載の要求内容識別システム。
  10. 要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに入力された自然言語形式による要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する要求内容識別方法であって、
    前記コンピュータが、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより要求文(入力要求文)に対する構文解析を行うステップと、
    前記コンピュータが、入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成するステップと、を含むこと、
    を特徴とする自然言語による要求内容の識別方法。
  11. 要求内容に依存しない非終端記号を生成する共通規則を記憶する共通規則記憶手段と、事前に定義された要求内容の識別子が入った非終端記号を生成する要求固有規則を記憶する要求固有規則記憶手段と、を備えるコンピュータに実行されるプログラムであって、
    入力された自然言語による要求文(入力要求文)に対して、前記共通規則と前記要求固有規則を用いて入力要求文に対する構文構造を生成することにより要求解析を行う処理と、
    前記構文解析の結果から入力要求文に対して要求内容の識別子が入った非終端記号を頂点とする文相当の構造が得られた場合に入力要求文の要求内容は当該要求内容に該当すると判断することにより要求内容の識別結果を生成する処理と、を前記コンピュータに実行させて、該コンピュータを、自然言語形式による要求文(入力要求文)を解析し、当該入力要求文の要求内容が、事前に定義された要求内容に該当するかどうかを判別し、定義された要求内容に該当する場合は当該要求内容の識別子を出力する手段として機能させるためのプログラム。
JP2008505100A 2006-03-10 2007-03-09 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム Active JP5099367B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008505100A JP5099367B2 (ja) 2006-03-10 2007-03-09 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006066097 2006-03-10
JP2006066097 2006-03-10
JP2008505100A JP5099367B2 (ja) 2006-03-10 2007-03-09 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム
PCT/JP2007/054632 WO2007105615A1 (ja) 2006-03-10 2007-03-09 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2007105615A1 JPWO2007105615A1 (ja) 2009-07-30
JP5099367B2 true JP5099367B2 (ja) 2012-12-19

Family

ID=38509438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008505100A Active JP5099367B2 (ja) 2006-03-10 2007-03-09 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム

Country Status (3)

Country Link
US (1) US8583435B2 (ja)
JP (1) JP5099367B2 (ja)
WO (1) WO2007105615A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6087333B2 (ja) 2014-11-26 2017-03-01 株式会社ユニバーサルエンターテインメント 情報提供システム、情報提供方法、及びプログラム
JP6345577B2 (ja) 2014-11-26 2018-06-20 株式会社ユニバーサルエンターテインメント 情報提供システム、情報提供方法、プログラム、及びデータ構造
JP6218057B1 (ja) * 2017-07-14 2017-10-25 Jeインターナショナル株式会社 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム
US11487945B2 (en) * 2019-07-02 2022-11-01 Servicenow, Inc. Predictive similarity scoring subsystem in a natural language understanding (NLU) framework
CN112417108B (zh) * 2020-10-26 2024-04-05 出门问问创新科技有限公司 一种请求类型识别方法、装置和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190453A (ja) * 1996-12-06 1997-07-22 Hitachi Ltd データベース装置
JPH09274495A (ja) * 1996-04-09 1997-10-21 Fuji Xerox Co Ltd 音声認識装置
JPH1011447A (ja) * 1996-06-21 1998-01-16 Ibm Japan Ltd パターンに基づく翻訳方法及び翻訳システム
JP2001157137A (ja) * 1999-08-26 2001-06-08 Matsushita Electric Ind Co Ltd 音声認識及び自然言語を用いたテレビジョン内容の自動的なフィルタリング
JP2003091298A (ja) * 2001-06-06 2003-03-28 Matsushita Electric Ind Co Ltd 音声認識及び自然言語を用いる家庭活動の自動制御
JP2003223185A (ja) * 2002-01-31 2003-08-08 Nippon Telegr & Teleph Corp <Ntt> 音声理解方法及び装置及び音声理解プログラム及び音声理解プログラムを格納した記憶媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3358100B2 (ja) 1995-04-17 2002-12-16 日本電信電話株式会社 日本語質問メッセージ解析方法及び装置
US5991712A (en) * 1996-12-05 1999-11-23 Sun Microsystems, Inc. Method, apparatus, and product for automatic generation of lexical features for speech recognition systems
CN1311881A (zh) * 1998-06-04 2001-09-05 松下电器产业株式会社 语言变换规则产生装置、语言变换装置及程序记录媒体
US6714905B1 (en) * 2000-05-02 2004-03-30 Iphrase.Com, Inc. Parsing ambiguous grammar
GB2365189A (en) * 2000-07-26 2002-02-13 Canon Kk Voice-controlled machine
US7302381B2 (en) * 2000-12-30 2007-11-27 Intel Corporation Specifying arbitrary words in rule-based grammars
US7302383B2 (en) * 2002-09-12 2007-11-27 Luis Calixto Valles Apparatus and methods for developing conversational applications

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09274495A (ja) * 1996-04-09 1997-10-21 Fuji Xerox Co Ltd 音声認識装置
JPH1011447A (ja) * 1996-06-21 1998-01-16 Ibm Japan Ltd パターンに基づく翻訳方法及び翻訳システム
JPH09190453A (ja) * 1996-12-06 1997-07-22 Hitachi Ltd データベース装置
JP2001157137A (ja) * 1999-08-26 2001-06-08 Matsushita Electric Ind Co Ltd 音声認識及び自然言語を用いたテレビジョン内容の自動的なフィルタリング
JP2003091298A (ja) * 2001-06-06 2003-03-28 Matsushita Electric Ind Co Ltd 音声認識及び自然言語を用いる家庭活動の自動制御
JP2003223185A (ja) * 2002-01-31 2003-08-08 Nippon Telegr & Teleph Corp <Ntt> 音声理解方法及び装置及び音声理解プログラム及び音声理解プログラムを格納した記憶媒体

Also Published As

Publication number Publication date
US8583435B2 (en) 2013-11-12
WO2007105615A1 (ja) 2007-09-20
JPWO2007105615A1 (ja) 2009-07-30
US20090099840A1 (en) 2009-04-16

Similar Documents

Publication Publication Date Title
KR102447513B1 (ko) 점증적 대화지식 자가학습 기반 대화장치 및 그 방법
KR100577387B1 (ko) 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
JP5175206B2 (ja) 草稿文書における編集パターンの自動検出及び適用
CN113836277A (zh) 用于数字助理的机器学习系统
JP4680714B2 (ja) 音声認識装置および音声認識方法
US6763331B2 (en) Sentence recognition apparatus, sentence recognition method, program, and medium
KR20190032498A (ko) 수정된 용어들을 사용하는 음향 모델 트레이닝
US20110202545A1 (en) Information extraction device and information extraction system
JP2007087397A (ja) 形態素解析プログラム、補正プログラム、形態素解析装置、補正装置、形態素解析方法および補正方法
JP5099367B2 (ja) 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム
CN104750677A (zh) 语音传译装置、语音传译方法及语音传译程序
JP2002132287A (ja) 音声収録方法および音声収録装置および記憶媒体
JP2010256498A (ja) 変換モデル生成装置、音声認識結果変換システム、方法およびプログラム
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
CN113626573A (zh) 一种销售会话异议及应对提取方法及系统
CN116127015A (zh) 基于人工智能自适应的nlp大模型分析系统
Andrés et al. Search for hyphenated words in probabilistic indices: a machine learning approach
KR20130126570A (ko) 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
JP4220151B2 (ja) 音声対話装置
JP2015200913A (ja) 話者分類装置、話者分類方法および話者分類プログラム
CN111429886B (zh) 一种语音识别方法及系统
CN111128181B (zh) 背诵题评测方法、装置以及设备
US11900072B1 (en) Quick lookup for speech translation
Hahn et al. Optimizing CRFs for SLU tasks in various languages using modified training criteria
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120829

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120911

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5099367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150