JP2014191246A - 認識処理制御装置、認識処理制御方法および認識処理制御プログラム - Google Patents

認識処理制御装置、認識処理制御方法および認識処理制御プログラム Download PDF

Info

Publication number
JP2014191246A
JP2014191246A JP2013067907A JP2013067907A JP2014191246A JP 2014191246 A JP2014191246 A JP 2014191246A JP 2013067907 A JP2013067907 A JP 2013067907A JP 2013067907 A JP2013067907 A JP 2013067907A JP 2014191246 A JP2014191246 A JP 2014191246A
Authority
JP
Japan
Prior art keywords
recognition
information
recognition processing
processing
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013067907A
Other languages
English (en)
Other versions
JP6050171B2 (ja
Inventor
Eiji Takada
英司 高田
Atsushi Uchimura
淳 内村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013067907A priority Critical patent/JP6050171B2/ja
Publication of JP2014191246A publication Critical patent/JP2014191246A/ja
Application granted granted Critical
Publication of JP6050171B2 publication Critical patent/JP6050171B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】認識処理性能を向上させる認識処理制御装置、認識処理制御方法および認識処理制御プログラムを提供する。
【解決手段】認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、所定の評価情報に基づいて結果情報を評価し、評価結果を出力する出力手段を備えることを特徴とする。
【選択図】 図7

Description

本発明は、認識処理性能を向上させる認識処理制御装置、認識処理制御方法および認識処理制御プログラムに関する。
近年、情報通信インフラの発展にともない、スマートフォンやタブレット端末などの情報端末の普及が進んでいる。さらに、これら情報端末を利用したクラウドサービスが始まっている。例えば、音声認識を用いたWeb検索システムや会話型応答システムがクラウドサービスとして利用可能となってきた。
特許文献1には、音声認識を使用した機械翻訳の技術が開示されている。特許文献1の技術は、原言語の用例に基づく音声認識結果と、原言語の文字列として音声認識結果の類似度を算定する。特許文献1の技術は、算定した類似度が所定の閾値を超えている場合に、用例に基づく音声認識結果を用いて翻訳を行うものである。
特許文献2には、特定の文法を定義し、定義された文法に適合する音声認識を行う技術が開示されている。「文法」とは、特許文献2では、単語または文の集合との意味である。特許文献2の技術は、音声認識対象として限定された単語または文の集合を与える特定の文法を定義する。その際、その文法は、音声認識対象となる単語または文を効率よく追加、削除できる記述方法で定義される。
特開2008−076865号公報(第6〜13頁、第1図) 特開2009−229529号公報(第6〜14頁、第1図)
特許文献1、2の技術は、特定の用例や特定の文法に基づいて音声認識を行う技術である。すなわち、特許文献1、2の技術では、特定の用例や特定の文法を用いて音声認識を行うため、音声認識を用いるサービスは、特定の用例や特定の文法に基づいた特定の分野やサービスに限定される。また、特許文献1、2の技術は、音声認識対象が特定の用例や特定の文法に基づいて限定されるため、認識不可能な音声が存在するという点で、音声認識の性能にも限界がある。
したがって、特許文献1、2の技術は、特定の用例や特定の文法を定義しているために、用例や文法によって特定の分野やサービスに限定され、認識対象が限定されてしまい、認識性能を向上させられないという課題がある。
この課題は、音声認識にとどまらず、一般に、ある入力情報に対する認識処理を行う場合にも当てはまる。例えば、文字認識を行う場合に、文字認識の対象となるイメージ画像には、どの言語の文字が記載されているかが不明であるときに、日本語の文字を認識する機能しかない文字認識エンジンでは対応ができない。
本発明の目的は、上記の課題に鑑みてなされたもので、効率的に認識処理を行って認識性能を向上させる認識処理制御装置、認識処理制御方法および認識処理制御プログラムを提供することにある。
本発明にかかる認識処理制御装置は、認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、所定の評価情報に基づいて結果情報を評価し、評価結果を出力する出力手段を備えることを特徴とする。
本発明にかかる認識処理制御方法は、認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を前記認識エンジンに送信し、
認識エンジンから認識処理の結果情報を受信し、所定の評価情報に基づいて結果情報を評価し、評価結果を出力することを特徴とする。
本発明にかかる認識処理制御プログラムは、認識処理制御装置が備えるコンピュータを、
認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を前記認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、所定の評価情報に基づいて結果情報を評価し、評価結果を出力する出力手段として動作させることを特徴とする。
本発明によれば、効率的に認識処理を行って認識性能を向上させることが可能となる。
本発明の第1の実施形態の認識処理システムの構成例を示す全体構成図である。 本発明の第1の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第1の実施形態の認識処理システムの属性情報を例示したものである。 本発明に第1の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第1の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第1の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第2の実施形態の認識処理制御装置の構成例を示すブロック図である。 本発明の第3の実施形態の認識処理システムの構成例を示す全体構成図である。 本発明の第3の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第3の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第3の実施形態の認識処理システムの属性情報を例示したものである。 本発明の第4の実施形態の認識処理システムの構成例を示す全体構成図である。 本発明に第4の実施形態の認識処理制御装置の動作例を示すフローチャートである。 本発明の第4の実施形態の通信処理装置の動作例を示すフローチャートである。
以下に、本発明の実施形態について図面を参照して詳細に説明する。
(第1の実施形態)
本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態の認識処理システムの構成例を示す全体構成図である。
図1を参照して、本実施形態の認識処理システム10の構成について説明する。認識処理システム10は、入力手段1、出力手段2、属性記憶手段3、配信手段4と認識制御手段5を備える。認識処理手段9は、配信手段4と接続された認識エンジン9−1〜n(nは、1以上の整数)を備える。
入力手段1は、認識処理を行うための認識処理対象信号の入力と、登録および操作設定を受け付ける。出力手段2は、認識処理結果情報の出力と、登録および操作設定に関わる表示および出力を行う。属性記憶手段3は、認識処理対象信号を判断するための処理属性情報、認識処理結果情報を評価するための評価情報と、認識処理手段9が備える認識エンジン9−1〜nに関わる配信先情報を含む属性情報を記憶する。配信手段4は、認識処理手段9が備える認識エンジン9−1〜nに認識処理対象情報を送信し、認識エンジン9−1〜nから認識処理結果情報を受信する。認識制御手段5は、入力手段1、出力手段2、属性記憶手段3、配信手段4の制御を行う。
図1を参照して、本実施形態の認識処理システム10の動作について説明する。入力手段1は、認識処理対象信号を入力し、認識処理対象情報に変換して認識制御手段5に送る。認識制御手段5は、入力手段1の種類と属性記憶手段3に予め記憶される属性情報に基づいて、認識処理対象情報の処理属性を判断する。「処理属性」とは、認識処理対象情報にどの認識処理を行うかを示すものである。認識制御手段5は、認識処理対象情報に対する処理の内容、例えば、音声認識あるいは画像認識等、を示す処理属性を判断する。
具体的には、認識制御手段5は、例えば、入力手段1がマイクであるとき、マイク入力に関わる処理属性を属性記憶手段3から取得する。属性記憶手段3には、マイク入力に関わる処理属性として、音声認識が記憶されているものとする。認識制御手段5は、属性記憶手段3のマイク入力に関わる処理属性に基づいて、処理属性を音声認識と判断する。すなわち、認識制御手段5は、入力手段1からの認識処理対象情報の処理属性を音声認識と判断する。
認識制御手段5は、認識処理対象情報の処理属性に基づいて、属性記憶手段3に記憶される配信先情報を取得する。
具体的には、認識制御手段5は、認識処理対象情報の処理属性が音声認識であることから、音声認識に関わる配信先情報を、属性記憶手段3から取得する。そして、認識制御手段5は、音声認識に関わる配信先情報に基づいて、認識処理対象情報の配信先である認識エンジンを、認識エンジン9−1〜nの中から選定する。例えば、認識制御手段5は、音声認識の処理属性に対応する認識エンジン9−1〜m(mは1以上で、n以下の整数)を選定する。
認識制御手段5は、認識処理対象情報から、選定された認識エンジン9−1〜mに対応する配信先認識処理対象情報#1〜#mを作成する。すなわち、認識制御手段5は、属性記憶手段3に記憶される配信先情報に基づいて、認識処理対象情報が認識エンジン9−1〜mに対応するように、それぞれ、配信先認識処理対象情報#1〜#mに変換する。
認識制御手段5は、各配信先向けに変換された配信先認識処理対象情報#1〜#mを、配信手段4を経由して認識エンジン9−1〜mに送信する。すなわち、認識制御手段5は、配信手段4を制御して、配信先認識処理対象情報#1〜#mを、それぞれ、認識エンジン9−1〜mに送信する。
このように、認識処理システム10の入力手段1に入力された認識処理対象信号は、認識制御手段5によって配信先認識処理対象情報#1〜mに変換されて、認識エンジン9−1〜mに送信される。
認識処理手段9の認識エンジン9−1〜mは、送信された配信先認識処理対象情報#1〜#mを受信して認識処理を行う。認識エンジン9−1〜mは、認識処理結果を認識処理結果情報#1〜#mとして、配信手段4に送付する。
配信手段4は、送付された認識処理結果情報#1〜#mを認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報#1〜#mを、属性記憶手段3に記憶される属性情報に基づいて評価する。例えば、認識制御手段5は、音声認識に関わる属性情報に基づいて、認識処理結果情報#1〜#mを評価する。
そして、認識制御手段5は、評価に基づいて、認識処理結果情報#1〜#mの内、最も高い評価の認識処理結果情報、例えば認識処理結果情報#5を出力手段2に出力する。
このように、本実施形態の認識処理システム10は、入力手段1が受け付けた認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジン9−1〜mに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。
認識処理システム10は、認識エンジン9−1〜mから認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。したがって、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを複数選択して認識処理を行い、認識処理結果情報を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上させることができる。
したがって、本実施形態は、効率的に認識処理を行って認識性能を向上することが可能となる。
図2〜6は、本実施形態の認識処理システムの属性情報を例示したものである。図2〜6を参照して、本実施形態の動作について説明する。
図2は、本実施形態の認識処理システムの属性記憶手段3に記憶される認識処理に関わる処理属性情報100を例示したものである。
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性を判断する。具体的には、認識制御手段5は、入力手段1に入力された認識処理対象信号が、例えば、マイク入力であるとき、マイク入力についての処理属性を属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の処理属性情報100を参照する。認識制御手段5は、入力デバイス欄101の「マイク」に関わる処理属性欄102に記載されている「音声認識」が、処理属性であると判断する。例えば、スキャナ入力であれば、「スキャナ」に関わる処理属性は、「画像認識」、「顔認識」、「文字認識」、「バーコード認識」と判断される。
図3は、本実施形態の認識処理システムの属性記憶手段3に記憶される認識処理に関わる配信先情報110を例示したものである。音声認識エンジン#1、画像認識エンジン#1、標識認識エンジン#1等は、認識エンジン9−1〜nのいずれかである。認識制御手段5は、認識エンジン9−1〜nの中から認識エンジンを指定するエンジン指定情報として、配信先情報を使用する。
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性の判断に基づいて、属性記憶手段3に記憶される配信先情報を取得する。具体的には、認識制御手段5は、認識処理対象信号の処理属性が、例えば、「音声認識」であるとき、「音声認識」に関わる配信先情報を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の配信先情報110を参照して、処理属性欄111の「音声認識」に関わる配信先欄112、入力条件欄113などに記憶されている配信先情報を取得する。
認識制御手段5は、配信先情報に基づいて、認識処理対象情報の配信先を選定する。具体的には、認識制御手段5は、例えば、処理属性が「音声認識」であれば、属性記憶手段3に予め記憶される認識処理の配信先情報110を参照して、処理属性欄111の「音声認識」に関わる配信先欄112、入力条件欄113などの配信先情報に基づいて、音声認識エンジンを選択する。例えば、処理属性が「画像認識」であれば、認識制御手段5は、「画像認識」に関わる配信先情報に基づいて、画像認識エンジンを選択すればよい。
認識制御手段5は、選択された認識処理エンジンに対応する配信先情報に基づいて、認識処理対象情報から、配信先認識処理対象情報を作成する。具体的には、認識制御手段5は、例えば、選択された音声認識エンジン#1であれば、音声認識エンジン#1の入力条件欄113などに基づいて、認識処理対象情報を、音声認識エンジン#1の入力条件に合致するように変換する。すなわち、認識制御手段5は、認識処理対象情報を、音声認識エンジン#1に入力できるように、例えば、情報のデータ形式やデータ長などを変換して、配信先認識処理対象情報#1を作成する。
認識制御手段5は、選択された認識処理エンジンに対応する配信先欄112に基づいて、作成された配信先認識対象情報を、配信先である認識エンジンに配信手段4を経由して送信する。すなわち、認識制御手段5は、例えば、配信先認識処理情報#1を、配信先である音声認識エンジン#1に、配信手段4を経由して送信する。
認識エンジンは、送信された配信先認識処理対象情報を受け付けて、認識処理を行った認識処理結果情報を配信手段4に送付する。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。
配信手段4は、送付された認識処理結果情報を認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報を、属性記憶手段3に記憶される属性情報に基づいて評価する。すなわち、認識制御手段5は、例えば、音声認識エンジン#1からの認識処理結果情報#1を、音声認識に関わる属性情報に基づいて評価する。
認識処理結果情報の評価については、音声認識を例として説明する。図4、5、6は、本実施形態の認識処理システムの属性記憶手段3に記憶される音声認識の評価に関わる属性情報を例示したものである。図4、5、6を参照して、各図の構成について説明する。
図4は、音声認識に関わる文法番号と文法の評価情報200を例示する。「文法」とは、特定の単語、または複数の単語群を組み合わせたものである。図4の文法欄202は、単語群を表すルール名、例えば、[MONTH]や[DAY]および特定の単語、例えば「を」や「再生」などを組み合わせた文法の具体例を、文法番号欄201と対応付けて示す。
図5は、音声認識に関わる単語群の評価情報210を例示する。図5では、ルール名欄211に単語群を表す名称がルール名として示され、表記欄212に各ルール名に対応する複数の単語が示される。図5の同音語・同意語欄213には、表記欄212に示された単語に対応する同音語(対応する単語の発声音が同じ単語)や同意語(対応する単語と発声音が異なるが意味が同じ単語)が記載される。
図6は、音声認識が利用される利用目的に対応する、文法の評価情報220を例示する。「利用目的」とは、入力手段1に認識処理対象信号が入力されたときの、認識処理システム10のユーザ(以下、ユーザという。)が利用していたサービス、アプリケーションや出力手段2で出力していた表示内容が示す、認識処理結果情報を利用する利用目的である。例えば、ユーザがカーナビゲーションシステムを操作して、目的地を入力している場合は、「利用目的」は、図6の利用目的欄221の「目的地入力」となる。利用目的が「目的地入力」であるとき、対応する文法として、文法番号欄222の「2」が設定される。
次に、図4、5、6を参照して、認識制御手段5が行う認識処理結果情報の評価について説明する。認識制御手段5は、入力手段1に認識処理対象信号が入力されたときの利用目的を確認する。例えば、利用目的が「目的地入力」であれば、認識制御手段5は、図6の音声認識に関わる属性情報の利用目的に基づいて、認識処理結果情報の評価に適用すべき文法番号「2」を選択する。認識制御手段5は、図4の音声認識に関わる文法に基づいて、文法番号「2」に対応する文法定義を選択する。認識制御手段5は、図5の音声認識に関わる単語群に基づいて、文法番号「2」に関わる単語群を選択する。
このように、認識制御手段5は、利用目的に基づいて、認識処理対象信号の認識結果の評価に用いる評価情報を選択する。そして、認識制御手段5は、選択された評価情報に基づいて、認識処理結果情報を評価する。すなわち、認識制御手段5は、音声認識エンジン#1の認識処理結果情報#1を、「目的地入力」に関わる文法番号「2」の文法定義と、文法定義に対応した特定の単語および単語群との適合度を評価すればよい。具体的には、認識制御手段5は、認識処理結果情報#1が、選択された文法定義、特定の単語および単語群と、完全一致するか否か、または含んでいるか否かを評価すればよい。
このとき、例えば、特定の分野や単語などの文法を定義しない音声認識エンジンの認識処理結果情報は、選択された評価情報に基づいて評価される。また、特定の分野や単語などの文法を定義して認識結果を出力する音声認識エンジンの認識結果情報も、選択された評価情報に基づいて、同様に評価される。
したがって、認識制御手段5は、利用目的に基づいて選択された評価情報を使用して評価を行う。すなわち、特定の分野や単語などの文法を定義しない音声認識エンジンの認識処理結果情報は、利用目的に基づいて選択された評価情報を使用して効率的に評価される。また、特定の分野や単語などの文法を定義して認識結果を出力する音声認識エンジンの認識結果情報は、例えば、利用目的に基づいて選択された評価情報が、音声認識エンジンの文法定義と合致していなければ、低い評価となり、合致していれば、高い評価を得る可能性がある。
そして、認識制御手段5は、認識処理結果情報の内、最も高い評価の認識処理結果情報を、出力手段2に出力する。あるいは、認識制御手段5は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を、出力手段2に出力してもよい。また、認識制御手段5は、認識処理結果情報の評価が所定の閾値に至らない場合や、所定の時間内で認識処理結果情報が送付されない場合には、認識処理結果なしとして、出力手段2に出力してもよい。
このように、本実施形態の認識処理システム10は、入力手段1から入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジンに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。
そして、認識処理システム10は、認識エンジンの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。したがって、本実施形態では、例えば、特定の分野や単語などの文法を定義しない汎用の音声認識エンジンと、特定の分野や単語などの文法を定義して認識結果を出力する専用の音声認識エンジンの両方を選択して使用することができる。すなわち、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを複数選択して認識処理を行い、認識処理結果を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上することができる。
したがって、本実施形態は、認識処理の属性、対象分野やサービスが限定されず、効率的に認識処理を行って認識性能を向上することが可能となる。
なお、本実施形態では、認識処理対象信号はマイク入力によるものとして説明したが、マイク入力に限定されない。例えば、カメラ入力でもよいし、スキャナ入力でもよいし、振動センサ入力でもよいし、タッチセンサでもよい。すなわち、認識処理対象信号は、認識処理システムの入力手段が備える入力デバイスから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。
また、本実施形態では、マイクから入力された認識処理対象情報の処理属性は、音声認識として説明したが、マイクに対応する処理属性は音声認識に限定されない。例えば、マイクに対応する処理属性は、話者識別(発声した話者が特定の話者であるか否かを識別する)でもよいし、楽曲識別(発声された音、例えばハミングから楽曲を識別する)でもよいし、DTMF認識(Dual Tone Muti Frequency:プッシュ式電話などのプッシュボタンを押すたびに発信される音から、押されたプッシュボタンを識別する)でもよい。すなわち、認識処理対象情報は、認識処理システムの入力手段が備えるマイクから入力されたものであって、入力された認識処理対象信号を認識処理対象情報として取り扱えるものであればよい。
また、本実施形態では、認識処理結果情報の評価は、音声認識のみの認識結果を評価するものとして説明したが、認識結果の評価は単一の認識結果の評価に限定されない。例えば、音声認識と話者識別の認識結果を併用して評価してもよい。すなわち、音声指令を受け付ける場合には、予め登録された話者の発声であるか否かを識別する話者識別の認識結果と、発声された指令を認識する音声認識の認識結果に基づいて、両者の認識結果を併用して評価してもよい。
また、認識処理対象情報がカメラによる画像である場合には、画像認識の認識結果として文字部分の位置が特定され、特定された部分に対応する文字認識の認識結果が評価してもよい。すなわち、認識結果の評価は、認識処理対象情報を認識処理した結果を併用して評価してもよい。
また、本実施形態では、認識処理対象情報の属性の異なる認識処理結果情報が併用され、評価されてもよい。例えば、予め記憶された個人を識別する際には、音声識別と画像識別が併用されてよい。すなわち、マイクまたは通話回線からの音声信号が音声識別された識別結果と、カメラからの映像信号が画像識別された識別結果が併用されて、個人識別の評価が行われてもよい。
また、本実施形態では、認識処理結果情報の評価に関わる属性情報は、音声認識に関わる評価に関わる属性情報を固定的なものとして説明したが、認識処理の評価に関わる属性情報は固定的なものに限定されない。
例えば、ユーザが利用しているサービスやアプリケーションなどに基づいて、評価に関わる属性情報は取得されて、更新されてもよい。つまり、ユーザがカーナビゲーションシステムを操作して「目的地入力」しているときに表示されている地図情報に基づいて、表示されている地図に関わる地名情報やランドマーク情報などが取得されて、[LOCATION](図5参照)に対応する単語群として評価情報に追加されてもよい。
また、カーナビゲーションシステムがCD(登録商標、Compact Disk:ディスク規格の1つ)プレーヤ機能を備える場合であれば、ユーザがCDプレーヤを操作しているときに、CDに記憶された楽曲名やアーティスト名が取得されて、[MUSIC](図5参照)に対応する単語群として評価情報に追加されてもよい。すなわち、認識処理結果情報の評価に関わる属性情報は、予め登録された固定的なものでもよく、ユーザが使用するサービスやアプリケーションなどが認識処理結果情報を利用する利用目的に基づいて取得される情報であって、評価に関わる属性情報として追加できる情報でもよい。
また、本実施形態では、認識処理結果情報の評価結果は、評価に基づいて、最も高い評価の認識処理結果情報を出力手段に出力すると説明したが、認識処理結果情報は最も高い評価結果には限定されない。例えば、認識制御手段は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を出力してもよい。また、認識制御手段は、認識処理結果情報の評価が所定の閾値以上の認識処理結果情報を出力してもよい。また、認識制御手段は、予め配布先情報に設定された優先度に基づいて、優先度の高い認識エンジンの認識処理結果情報を出力してもよい。また、ユーザが使用するサービスやアプリケーションに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。
また、本実施形態では、認識処理手段が備える認識エンジンは、固定的ではない。例えば、認識処理結果情報の評価結果に基づいて、ユーザは認識エンジンの評価や優先度付けを行って配信先情報に記憶させてもよい。認識制御手段は、予め設定された評価や優先度に基づいて認識エンジンを適宜選択すればよい。すなわち、予め設定された評価値が所定の閾値に至らない認識エンジンは認識処理の選択対象から外されてもよい。認識エンジンは予め設定された優先度に基づいて選択されてもよい。認識エンジンは新たに追加されてもよい。また、認識制御手段は、認識エンジンとの接続状態または認識エンジンの稼働状態の確認に基づいて、認識エンジンを選択してもよい。すなわち、認識エンジンは、認識処理の処理属性と配信先情報が明示され、認識処理対象情報を入力して認識処理結果情報を出力できるものであればよい。
(第2の実施形態)
本発明において、図1に示された本実施形態の認識処理システム10における入力手段1、出力手段2、配信手段4は必須ではない。すなわち、認識制御手段5が、認識処理対象情報を入力されて、外部の属性記憶手段3に記憶される属性情報に基づいて、外部の認識処理手段9が備える認識エンジン9−1〜nに送信して認識処理結果情報を取得して評価を行えればよい。したがって、本発明に必須の構成は、認識制御手段5のみである。
図7は、本発明の最小の構成を備える、第2の実施形態の認識処理制御装置20の構成例を示すブロック図である。
認識処理制御装置20は、認識制御手段21を備える。認識制御手段21は、情報送信部22と、結果受信部23と評価結果出力部24を備える。情報送信部22は、認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象情報を送信する。結果受信部23は、認識エンジンから認識処理結果情報を受信する。評価結果出力部24は、所定の評価情報に基づいて認識処理結果情報を評価し、評価結果を出力する。
なお、本実施形態では、認識処理結果情報の評価に基づいて、評価結果出力部は、最も高い評価の評価結果を出力すればよい。あるいは、評価結果出力部は、予め設定された条件を満足する評価結果を出力してもよい。例えば、予め設定された閾値を超える評価の評価結果が出力されてもよい。
また、本実施形態では、認識処理対象情報の属性は、1種類であってもよいし、複数種類であってもよい。すなわち、本実施形態は、認識処理対象情報の属性に基づいて、認識エンジンは選択されてもよい。本実施形態は、認識処理対象情報の属性に基づいて、評価情報は選択されてもよい。本実施形態は、複数の属性の異なる認識エンジンの結果情報を併用して評価してもよいし、同一の属性の認識エンジンの結果情報を併用して評価してもよい。例えば、話者識別エンジンの結果情報と顔認証の結果情報を併用して個人識別が評価されてもよいし、日本語音声認識エンジンの結果情報と英語音声認識エンジンの結果情報を併用して数字認識が評価されてもよい。
また、本実施形態では、評価結果の利用目的に基づいて、評価情報は選択されてもよい。すなわち、例えば、ユーザが利用するサービスやアプリケーションなどが評価結果を利用する利用目的に対応して評価情報が選択され、選択された評価情報に基づいて、結果情報が評価されてもよい。
(第3の実施形態)
本発明の第3の実施形態について説明する。図8は、本発明の第3の実施形態の認識処理システムの構成例を示す全体構成図である。図8の第3の実施形態は、認識処理システム11に履歴記憶手段6が追加されているところが、第1の実施形態と相違する。よって、第1の実施形態と同一の構成要素には同一の参照数字を付記して、その説明を省略する。
図8を参照して、本実施形態の認識処理システム11の構成について説明する。履歴記憶手段6は、認識処理に関わる履歴情報を記憶するとともに、認識処理対象情報、配信先認識対象情報と評価結果を記憶する。
図8を参照して、本実施形態の認識処理システム11の動作について説明する。入力手段1は、認識処理対象信号を入力して、認識処理対象情報して認識制御手段5に送る。認識制御手段5は、入力手段1の種類と属性記憶手段3に予め記憶される属性情報に基づいて、認識処理対象情報の処理属性を判断する。
具体的には、認識制御手段5は、例えば、入力手段1がカメラであるとき、カメラ入力に関わる処理属性を属性記憶手段3から取得する。属性記憶手段3には、カメラ入力に関わる処理属性として、標識認識が記憶されているものとする。認識制御手段5は、属性記憶手段3のカメラ入力に関わる処理属性に基づいて、処理属性を標識認識と判断する。すなわち、認識制御手段5は、入力手段1からの認識処理対象情報の処理属性を標識認識と判断する。
認識制御手段5は、認識処理対象情報の処理属性に基づいて、属性記憶手段3に記憶される配信先情報を取得する。
具体的には、認識制御手段5は、認識処理対象情報の処理属性が標識認識であることから、標識認識に関わる配信先情報を、属性記憶手段3から取得する。そして、認識制御手段5は、標識認識に関わる配信先情報に基づいて、認識処理対象情報の配信先である認識エンジンを、認識エンジン9−1〜nの中から選定する。例えば、認識制御手段5は、標識認識の処理属性に対応する認識エンジン9−d〜h(dは1以上で、n以下の整数、hはd以上で、n以下の整数)を選定する。
認識制御手段5は、認識処理対象情報から、選定された認識エンジン9−d〜hに対応する配信先認識処理対象情報#d〜#hを作成する。すなわち、認識制御手段5は、属性記憶手段3に記憶される配信先情報に基づいて、認識処理対象情報が認識エンジン9−d〜hに対応するように、それぞれ、配信先認識処理対象情報#d〜#hに変換する。
認識制御手段5は、各配信先向けに変換された配信先認識処理対象情報#d〜#hを、配信手段4を経由して認識エンジン9−d〜hに送信する。すなわち、認識制御手段5は、配信手段4を制御して、配信先認識処理対象情報#d〜#hを、それぞれ、認識エンジン9−d〜hに送信する。
このように、認識処理システム11の入力手段1に入力された認識処理対象信号は、配信先認識処理対象情報#d〜#hに変換されて、認識エンジン9−d〜hに送信される。
認識エンジン9−d〜hは、送信された配信先認識処理対象情報#d〜#hを受信して認識処理を行う。認識エンジン9−d〜hは、認識処理結果を認識処理結果情報#d〜#hとして、配信手段4に送付する。
配信手段4は、送付された認識処理結果情報#d〜#hを認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報#d〜#hを、属性記憶手段3に記憶される属性情報に基づいて評価する。例えば、認識制御手段5は、標識認識に関わる属性情報に基づいて、認識処理結果情報#d〜#hを評価する。
そして、認識制御手段5は、評価に基づいて、認識処理結果情報#d〜#hの内、最も高い評価の認識処理結果情報、例えば認識処理結果情報#fを出力手段2に出力する。
このように、本実施形態の認識システム11は、入力手段1に入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジン9−d〜hに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。
認識処理システム11は、認識エンジン9−d〜hの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価し、最も高い評価の認識処理結果情報を出力手段2に出力する。
履歴記憶手段6は、認識処理に関わる履歴情報を記憶する。例えば、履歴記憶手段6は、認識処理対象情報、認識処理結果情報とその評価結果を履歴情報として記憶する。認識制御手段5は、評価結果の履歴情報に基づいて、各処理属性に対応する認識エンジンを選定する際の優先度を設定する。例えば、認識制御手段5は、音声認識に関わる認識エンジンの「目的地入力」に対する履歴情報に基づいて優先度を設定する。認識制御手段5は、設定された優先度を、属性記憶手段3の配信先情報として記憶させる。認識制御手段5は、属性記憶手段3に記憶される配信先情報の優先度に基づいて、認識処理対象情報の配信先選定を行ってもよい。また、認識制御手段5は、配信先情報に記憶される優先度に基づいて認識処理結果情報の評価を行ってもよい。
また、ユーザは、履歴記憶手段6に記憶される認識処理対象情報、認識処理結果情報および評価結果を出力手段2に出力させて、認識処理対象情報に対する認識処理結果情報とその評価結果の妥当性を確認することができる。そして、ユーザは、評価結果の妥当性の確認に基づいて、認識エンジンの優先度を変更することができる。本実施形態は、認識処理に関わる履歴情報に基づいて、認識エンジンの評価に対応する優先度を用いて認識処理を行うことで、認識処理の効率化と精度の向上を図ることができる。
認識処理結果情報の評価については、標識認識を例として説明する。図9〜11は、本実施形態の認識処理システム11の属性情報を例示したものである。図2、3と図9〜11を参照して、本実施形態の動作について説明する。
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性を判断する。具体的には、認識制御手段5は、属性記憶手段3に記憶される認識処理に関わる処理属性情報100(図2参照)から、入力手段1に入力された認識処理対象信号の処理属性を判断する。例えば、認識制御手段5は、入力手段1に入力された認識処理対象信号が、カメラ入力であるとき、カメラ入力についての処理属性を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の処理属性情報100を参照する。認識制御手段5は、入力デバイス欄101の「カメラ」に関わる処理属性欄102に記載されている「標識認識」が処理属性であると判断する。カメラ入力に関わる処理属性は、標識認識に限定されない。カメラ入力に関わる処理属性は、「画像認識」、「顔認識」、「文字認識」、「バーコード認識」などがあげられるが、ここでは、標識認識として説明する。
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性の判断に基づいて、属性記憶手段3に記憶される配信先情報を取得する。具体的には、認識制御手段5は、認識処理対象信号の処理属性が、例えば、「標識認識」であるとき、「標識認識」に関わる配信先情報を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の配信先情報110(図3参照)を参照して、処理属性欄111の「標識認識」に関わる配信先欄112、入力条件欄113などに記憶される配信先情報を取得する。
認識制御手段5は、配信先情報に基づいて、認識処理対象情報の配信先を選定する。具体的には、認識制御手段5は、例えば、処理属性が「標識認識」であれば、属性記憶手段3に予め記憶される認識処理の配信先情報110(図3参照)を参照して、処理属性欄111の「標識認識」に関わる配信先欄112、入力条件欄113などの配信先情報に基づいて、標識認識エンジンを選択する。例えば、処理属性が「音声認識」であれば、認識制御手段5は、「音声認識」に関わる配信先情報に基づいて、音声認識エンジンを選択すればよい。
認識制御手段5は、選択された認識処理エンジンに対応する配信先情報に基づいて、認識処理対象情報から、配信先認識処理対象情報を作成する。具体的には、認識制御手段5は、例えば、選択された標識認識エンジン#1であれば、標識認識エンジン#1の入力条件欄113などに基づいて、認識処理対象情報を、標識認識エンジン#1の入力条件に合致するように変換する。すなわち、認識制御手段5は、認識処理対象情報を、標識認識エンジン#1が入力を受け付けられるように、例えば、情報のデータ形式やデータ長などを変換して、配信先認識処理対象情報#1を作成する。
認識制御手段5は、選択された認識エンジンに対応する配信先情報に基づいて、変換された配信先認識対象情報を、配信先である認識エンジンに配信手段4を経由して送信する。すなわち、認識制御手段5は、例えば、配信先認識処理情報#1を、配信先である標識認識エンジン#1に配信手段4を経由して送信する。
認識エンジンは、配信された配信先認識処理対象情報を受け付けて、認識処理を行った認識処理結果情報を配信手段4に送付する。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、対象分野やサービスは限定されない。
配信手段4は、送付された認識処理結果情報を認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報を、属性記憶手段3に記憶される属性情報に基づいて評価する。すなわち、認識制御手段5は、例えば、標識認識エンジン#1からの認識処理結果情報#1を、標識認識に関わる属性情報に基づいて評価する。
認識処理結果情報の評価については、標識認識を例として説明する。図9、10、11は、本実施形態の認識処理システムの属性記憶手段3に記憶される標識認識の評価に関わる属性情報を例示したものである。図9、10、11を参照して、各図の構成について説明する。
図9は、標識認識に関わる文法番号と文法の評価情報300を例示する。図9の文法欄302は、単語群を表すルール名、例えば、[KISEI]や[HOJO]などの組み合わせた文法の具体例を、文法番号欄301と対応付けて示す。[KISEI]とは、速度や重量、高さなどを規制する規制標識群を示すルール名である。[HOJO]とは、規制標識や案内標識、注意標識を補助する補助標識群を示すルール名である。例えば、補助標識は、規制区間の始まりや解除、時間規制の時刻などを示すものである。
図10は、標識認識に関わる単語群の評価情報310を例示する。図10では、ルール名欄311に単語群を表す名称がルール名として示され、表記欄312に各ルール名に対応する複数の単語が示される。そして、図10の同音語・同意語欄313には、表記欄312に示された単語に対応する同音語(対応する単語の発声音が同じ単語)や同意語(対応する単語と発声音が異なるが意味が同じ単語)が記載される。
図11は、標識認識が利用される利用目的に対応する、文法の評価情報320を例示する。「利用目的」とは、入力手段1に認識処理対象信号が入力されたときに、認識処理システム11のユーザが利用していたサービスや出力手段2で出力していた内容を示す。例えば、ユーザがカーナビゲーションシステムを操作して、道路の規制確認をしている場合は、図11の利用目的欄321が、「規制確認」となる。利用目的が「規制確認」であるとき、対応する文法は、文法番号欄322の「5」、「6」、「7」が設定される。
次に、図9、10、11を参照して、認識制御手段5が行う認識処理結果情報の評価について説明する。認識制御手段5は、入力手段1に認識処理対象信号が入力されたときの利用目的を確認する。例えば、利用目的が「規制確認」であれば、認識制御手段5は、図11の標識認識に関わる属性情報の利用目的に基づいて、認識処理結果情報の評価に適用すべき文法番号「5」、「6」、「7」を選択する。認識制御手段5は、図9の標識認識に関わる文法に基づいて、文法番号「5」、「6」、「7」に対応する文法定義を選択する。認識制御手段5は、図10の標識認識に関わる単語群に基づいて、文法番号「5」、「6」、「7」に関わる単語群を選択する。
このように、認識制御手段5は、利用目的に基づいて、認識処理対象信号の認識結果の評価に用いる評価情報を選択する。そして、認識制御手段5は、選択された評価情報に基づいて、認識処理結果情報を評価する。すなわち、認識制御手段5は、標識認識エンジン#1の認識処理結果情報#1を、「規制確認」に関わる文法番号「5」、「6」、「7」の文法定義と、文法定義に対応した特定の単語および単語群との適合度を評価すればよい。例えば、標識認識の結果である認識処理結果情報#1は、道路規制に関わる標識であるか否か、規制標識の中での種別と規制、補助標識の有無と補助標識の中での種別と規制などを示す単語および単語群などが内容として含まれる。よって、認識制御手段5は、認識処理結果情報#1が、選択された「規制確認」に関わる文法定義、特定の単語および単語群と、完全一致するか否か、または含んでいるか否かを評価すればよい。
そして、認識制御手段5は、認識処理結果情報の内、最も高い評価の認識処理結果情報を、出力手段2に出力する。あるいは、認識制御手段5は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を、出力手段2に出力してもよい。また、認識制御手段5は、認識処理結果情報の評価が所定の閾値に至らない場合や、所定の時間内で認識処理結果情報が送付されない場合には、認識処理結果なしとして、出力手段2に出力してもよい。
このように、本実施形態の認識処理システム11は、入力手段1から入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンをその優先度に基づいて選択して、選択された認識エンジンに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。
そして、認識処理システム11は、認識エンジンの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。認識制御手段5は、認識処理対象情報と認識処理結果情報および評価結果を履歴記憶手段6に記憶させる。さら、認識制御手段5は、履歴記憶手段6の履歴情報に基づいて、認識エンジンの優先度を設定する。したがって、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを優先度に基づいて複数選択して認識処理を行い、認識処理結果を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上することができる。
したがって、本実施形態は、第1の実施形態と同様の効果を得るとともに、認識処理に関わる認識エンジンを効果的に選択することができる効果が得られる。
なお、本実施形態では、認識制御手段は、履歴記憶手段に記憶される履歴情報に基づいて優先度を設定する。例えば、認識制御手段は、認識処理結果情報の評価が高い認識エンジンの優先度を高く設定し、認識処理結果情報の評価が低い認識エンジンの優先度を低く設定する。認識処理システムのユーザは、履歴記憶手段に記憶される履歴情報に基づいて、評価結果の妥当性を確認し、設定された優先度を変更することができる。したがって、本実施形態では、設定された優先度に基づいて、認識処理対象情報に適合した認識エンジンを効率的に選択して、認識処理の精度の向上を図ることができる。
なお、本実施形態では、認識処理対象信号はカメラ入力によるものとして説明したが、カメラ入力に限定されない。例えば、マイク入力でもよいし、スキャナ入力でもよいし、振動センサ入力でもよいし、タッチセンサでもよい。すなわち、認識処理対象信号は、認識処理システムの入力手段が備える入力デバイスから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。
また、本実施形態では、カメラから入力された認識処理対象信号の処理属性は標識認識として説明したが、カメラに対応する処理属性は標識認識に限定されない。例えば、カメラに対応する処理属性は、路面表示識別でもよいし、前方車両の車両番号認識でもよい。すなわち、認識処理システムの入力手段が備えるカメラから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。
また、本実施形態では、認識処理結果情報の評価は、標識認識のみの認識結果を評価するものとして説明したが、認識結果の評価は単一の認識結果の評価に限定されない。例えば、標識認識と文字認識の認識結果を併用して評価してもよい。すなわち、案内板の標識認識の場合には、案内板であるか否かを識別する標識認識の認識結果と、案内板に記載された文字を識別する文字認識の認識結果に基づいて、両者の認識結果を併用して評価してもよい。また、認識処理対象情報がカメラによる画像である場合には、画像処理の処理結果として車両番号部分の位置が特定され、特定された車両番号部分に対応する文字認識の認識結果が評価されてもよい。すなわち、認識結果の評価は、認識処理対象情報を認識処理した結果を併用して評価してもよい。
また、本実施形態では、認識処理結果情報の評価に関わる属性情報は、標識認識に関わる評価に関わる属性情報を固定的なものとして説明したが、認識処理の評価に関わる属性情報は固定的なものに限定されない。例えば、ユーザが利用しているサービスやアプリケーションなどが認識処理結果情報を使用する利用目的に基づいて、評価に関わる属性情報は取得されて、更新されてもよい。つまり、ユーザがカーナビゲーションシステムを操作して「目的地入力」しているときに表示されている地図情報に基づいて、表示されている地図に関わる地名情報やランドマーク情報、道路名称などが取得されて、案内標識情報の[ANNAI](図10参照)に対応する単語群として評価情報に追加され選択されてもよい。すなわち、認識処理結果情報の評価に関わる属性情報は、予め登録された固定的なものでもよく、ユーザが使用するサービスやアプリケーションなどに基づいて取得される情報であって、評価に関わる属性情報として追加され選択できる情報でもよい。
また、本実施形態では、認識処理結果情報の評価結果は、評価に基づいて、最も高い評価の認識処理結果情報を出力手段に出力すると説明したが、認識処理結果情報は最も高い評価結果には限定されない。例えば、予め設定された閾値以上の評価の情報処理結果情報を出力手段に出力してもよい。また、予め設定された数の情報処理結果情報を評価の高い順から選定して出力手段に出力してもよい。また、認識制御手段は、予め配布先情報に記憶された優先度に基づいて、優先度の高い認識エンジンの認識処理結果情報を出力してもよい。ユーザが使用するアプリケーションやサービスに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。
また、本実施形態では、認識処理手段が備える認識エンジンは、固定的ではない。例えば、認識処理結果情報の評価結果に基づいて、ユーザは認識エンジンの評価を行って配信先情報に記憶させてもよい。認識制御手段は、配信先情報に基づいて予め設定された評価の閾値に至らない認識エンジンを認識処理の選択対象から外してもよい。認識エンジンは新たに追加されてもよい。また、認識制御手段は、認識エンジンとの接続状態または認識エンジンの稼働状態の確認に基づいて、認識エンジンを選択してもよい。すなわち、認識エンジンは、認識処理の処理属性と配信先情報が明示され、認識処理対象情報を入力して認識処理結果情報を出力できるものであればよい。
(第4の実施形態)
本発明の第4の実施形態について説明する。図12は、本発明の第4の実施形態の認識処理システム12の構成例を示す全体構成図である。図12を参照して、本実施形態の認識処理システム12の構成について説明する。
認識処理システム12は、認識処理制御装置30と通信処理装置40を備える。認識処理システム12は、ネットワークを介して、認識処理手段9が備える認識エンジン9−1〜nと接続される。認識処理制御装置30は、入力部31、出力部32、属性記憶部33、通信部34、認識制御部35と認識エンジン91を備える。通信処理装置40は、通信部41、43と通信制御部42を備える。
入力部31は、認識処理を行うための認識処理対象信号の入力と、登録および操作設定を受け付ける。出力部32は、認識処理結果の出力と、登録および操作設定に関わる表示および出力を行う。属性記憶部33は、認識処理対象信号を判断するための処理属性情報、認識処理結果情報を評価するための評価情報と、認識処理手段9が備える認識エンジン9−1〜n、91に関わる配信先情報を含む属性情報を記憶する。通信部34は、通信処理装置40を経由して認識処理手段9の備える認識エンジン9−1〜nに接続される。また、通信部34は、認識処理制御装置30の内部の認識エンジン91に接続される。
通信処理装置40は、認識処理制御装置30と認識処理手段9の間の通信を中継する。すなわち、通信部41は、認識処理制御装置30の通信部34と、例えば、Bluetooth(登録商標)通信や無線LAN(Local Area Network)通信などの無線、または有線で接続される。通信部43は、認識処理手段9が備える認識エンジン9−1〜nに、公衆網や移動無線網など、または有線で接続される。通信制御部42は、通信部41と43の制御を行って、認識処理制御装置30と認識処理手段9の間の通信を中継する。
認識処理制御装置30の入力部31、出力部32、属性記憶部33、認識制御部35と認識エンジン91は、図8で示した第3の実施形態の入力手段1、出力手段2、属性記憶手段3、認識制御手段5と認識エンジン91に相当するので説明を省略する。
また、認識処理制御装置30の通信部34と通信処理装置40は、図8で示した配信手段4に相当するので説明を省略する。認識処理制御装置30は、ローカルに認識処理を行う認識エンジンとして、認識エンジン91を備えていてもよいが、なくてもよい。
図13は、本実施形態の認識処理制御装置30の動作例を示すフローチャートである。図14は、本実施形態の通信処理装置40の動作例を示すフローチャートである。
図13を参照して、認識処理制御装置30の認識処理の動作について説明する。
入力部31に認識処理対象信号が入力されると、入力部31は、入力された認識処理対象信号を認識処理対象情報に変換して認識制御部35に送る。認識制御部35は、属性記憶部33に記憶される属性情報に基づいて選択された配信先に、変換された認識処理対象情報を、通信部34と通信処理装置40を経由して送信する(A101)。ここで、配信先とは、認識制御部35が属性記憶部33に記憶される配信先情報に基づいて選択された認識エンジンである。配信先として選択された認識エンジンは、認識処理対象情報を受信して認識処理を行った認識処理結果情報を、通信処理装置40と通信部34を経由して認識処理制御装置30に送信する。
認識制御部35は、配信先から認識処理結果情報を受信する(A102)。そして、認識制御部35は、配信先からの認識処理結果情報の有無を確認する(A103)。
配信先からの認識処理結果情報がなければ(A103:NO)、認識制御部35は、処理結果なしと、出力部32に出力して処理を終了する(A111)。
配信先からの認識処理結果情報があれば(A103:YES)、認識制御部35は、現在の利用目的に対応する属性情報、例えば音声認識の「目的地入力」に対応する文法を選択する(A104)。
認識制御部35は、選択された属性情報に沿った認識処理結果情報があるかを確認する(A105)。具体的には、音声認識の「目的地入力」に対応する文法番号「2」(図4、5参照)の示す単語群および特定の単語が、認識処理結果情報に含まれているか否かを、認識制御部35は評価する。
そして、認識制御部35は、選択された属性情報に沿った認識処理結果情報があれば(A105:YES)、認識処理結果情報を処理結果として、出力部2に出力して処理を終了する(A121)。
一方、認識制御部35は、選択された属性情報に沿った認識処理結果情報がなければ(A105:NO)、現在の利用目的に対応するA104において未だ選択されていない未選択の属性情報があるかを確認する(A106)。認識制御部35は、未選択の属性情報がなければ(A106:NO)、処理結果なしと、出力部32に出力して処理を終了する(A111)。
認識制御部35は、未選択の属性情報があれば、次の属性情報を選択(A107)して、ステップA105の処理に戻る。
このように、本実施形態の認識処理装置30は、入力部31に入力された認識処理対象信号の認識処理を行うことができる。
図14を参照して、通信処理装置40の動作について説明する。
通信制御部42は、認識処理制御装置30の通信部34から認識処理対象情報を、通信部41で受信し、配信先である認識処理手段9の認識エンジン9−1〜nに、通信部43から送信する(B101)。そして、通信制御部42は、配信先の認識エンジン9−1〜nからの認識処理結果情報を、通信部43を経由して受信する(B102)。
通信制御部42は、認識処理結果情報を、通信部41を経由して認識処理制御装置30に送信して処理を終了する(B104)。
こうして、本実施形態の通信処理装置40は、認識処理制御装置30と認識処理手段9の間の通信を中継する。
このように、本実施形態の認識処理システム12は、情報処理制御装置30の入力部31に入力された認識処理対象情報を、認識制御部35は、属性記憶部33に記憶される属性情報に基づいて、認識エンジン9−1〜nの中から選択された認識エンジンに送信する。そして、選択された認識エンジンからの認識処理結果情報を受信して、認識制御部35は、属性記憶部33に記憶される属性情報に基づいて評価する。認識制御部35は、評価結果に基づいて、認識処理結果情報を出力部32に出力する。
したがって、本実施形態は、認識処理の属性、対象分野やサービスが限定されず、効率的に認識処理を行って認識性能を向上することが可能となる。
なお、本実施形態では、選択された属性情報に沿っている認識処理結果情報があれば、認識処理結果とすると説明したが、選択された属性情報に沿っていることに限定されない。例えば、認識制御部は、属性情報に基づいて、受信された認識処理結果情報を評価して、最も高い評価の認識処理結果情報を出力手段に出力してもよいし、予め設定された閾値以上の評価を得た情報処理結果情報を出力手段に出力してもよいし、予め設定された数の情報処理結果情報を評価の高い順から選定して出力手段に出力してもよい。また、ユーザが使用するサービスやアプリケーションなどに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。
また、本実施形態では、認識制御部は、予め配信先情報に設定された優先度に基づいて、認識エンジンを選定してもよいし、または認識処理結果情報の評価を行ってもよい。
また、本実施形態では、認識処理制御装置と通信処理装置を分離して説明したが、認識処理制御装置と通信処理装置は必ずしも分離される必要はない。ここで、認識処理制御装置は、車載システムであれば、例えばカーナビシステムやクルージングシステムなどに適用される。カーナビシステムやクルージングシステムなどの車載装置が公衆網や移動無線網などの広域通信機能を備えていれば、本実施形態の通信処理装置は不要となる。また、カーナビシステムやクルージングシステムなどの車載装置が広域通信機能を備えていなければ、例えば広域通信機能を備えた移動端末や情報端末が、車載装置と近接通信機能または有線で通信する。すなわち、移動端末や情報端末が本実施形態の通信処理装置として機能し、認識処理制御装置として機能するカーナビシステムやクルージングシステムなどの車載装置と連携することで、本実施形態が実現されればよい。このとき、カーナビシステムやクルージングシステムなどの車載装置が備えるマイク入力、各種センサ情報やカメラ映像、移動端末のマイク入力、センサ情報やカメラ映像を、本実施形態は、認識処理対象情報に適用する。また、認識処理制御装置は、移動端末や情報端末であってもよい。移動端末や情報端末が備えるマイク入力、カメラ映像や各種センサ情報を認識処理対象情報として、本実施形態は適用される。すなわち、本実施形態は、センサを備え、センサ情報を認識処理対象情報として送信し、認識処理結果情報を受信できるものであれば適用される。
また、本実施形態は、センサを備え、センサ情報を認識処理対象情報として、認識処理制御装置に入力する入力装置と、認識処理制御装置が組み合わされてもよい。
また、本実施形態では、認識処理制御装置または通信処理装置が認識エンジンを備え、認識処理対象信号の処理属性の判断に基づいて、その認識エンジンが選択されてもよいし、選択されなくてもよい。
なお、本願発明は、上述の各実施形態に限定されるものではなく、本願発明の要旨を逸脱しない範囲で種々変更、変形して実施することができる。
例えば、第3の実施形態で追加された履歴記憶手段は、第1の実施形態や第4の実施形態に追加されてもよい。
また、本願発明では、音声認識または標識認識を用いて認識処理を説明したが、認識処理は、音声認識と標識認識に限定されない。例えば、認識処理は、音を使用するものであれば、話者識別、楽曲識別、DTMF認識などがあげられる。また、画像を使用するものであれば、画像認識、顔認識、文字認識、バーコード認識、指紋認識、路面表示識別、車両番号認識などがあげられる。本願発明は、これらの認識処理の認識処理結果情報を組み合わせて評価されてもよい。すなわち、本願発明は、認識処理対象信号が入力されて、認識処理対象情報に変換されて送信でき、認識処理結果情報と属性情報が得られて、評価できるものであれば適用できる。そして、本願発明は、各種の処理属性に対応する認識エンジンを認識処理制御装置に備えていなくても、認識処理結果情報を受信して評価し取り扱うことができる効果がある。また、本願発明は、認識処理システムとして認識処理制御装置と接続できる認識エンジンであれば、既存の認識エンジンや最新のアルゴリズムを使用する認識エンジンを使用することができる効果が得られる。さらに、本願発明は、認識処理システムとしての構築コストを軽減できる効果があるとともに、認識処理の性能の向上を期待できる効果がある。
また、各実施形態で説明した属性記憶手段、属性記憶部、履歴記憶手段は、認識処理に関わる属性情報を記憶するハードディスク装置であってもよいし、ネットワークで接続されたサーバ装置であってもよいし、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体でもよい。すなわち、属性記憶手段、属性記憶部は、認識制御手段または認識制御部の制御を受けて、認識処理に関わる属性情報を記憶できるものであればよい。また、履歴記憶手段は、認識制御手段の制御を受けて、認識処理に関わる履歴情報を記憶できるものであればよい。
また、上述の各実施形態の認識制御手段または認識制御部による認識制御処理は、認識制御手段または認識処理制御装置が備えるコンピュータ(図示なし)を用いたソフトウェアによって実行されてもよい。すなわち、認識制御処理を行うコンピュータプログラムが、CPU(Central Processing Unit)によって読み込まれ、実行されることによって実現されてもよい。
なお、プログラムは、ROM、RAM、フラッシュメモリ等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体に格納されてもよい。
1 入力手段
2 出力手段
3 属性記憶手段
4 配信手段
5、21 認識制御手段
6 履歴記憶手段
9 認識処理手段
9−1〜n、91 認識エンジン
10、11、12 認識処理システム
20、30 認識処理制御装置
22 情報送信部
23 結果受信部
24 評価結果出力部
31 入力部
32 出力部
33 属性記憶部
34、41、43 通信部
35 認識制御部
40 通信処理装置
42 通信制御部
本発明にかかる認識処理制御装置は、認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、所定の評価情報に基づいて結果情報を評価し、評価結果を出力する出力手段を備えることを特徴とする。
本発明にかかる認識処理制御方法は、認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を前記認識エンジンに送信し、
認識エンジンから認識処理の結果情報を受信し、所定の評価情報に基づいて結果情報を評価し、評価結果を出力することを特徴とする。
本発明にかかる認識処理制御プログラムは、認識処理制御装置が備えるコンピュータを、
認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を前記認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、所定の評価情報に基づいて結果情報を評価し、評価結果を出力する出力手段として動作させることを特徴とする。
認識処理制御装置30の入力部31、出力部32、属性記憶部33と認識制御部35は、図8で示した第3の実施形態の入力手段1、出力手段2、属性記憶手段3と認識制御手段5に相当するので説明を省略する。

Claims (10)

  1. 認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、前記認識処理対象を前記認識エンジンに送信する送信手段と、
    前記認識エンジンから前記認識処理の結果情報を受信する受信手段と、
    所定の評価情報に基づいて前記結果情報を評価し、評価結果を出力する出力手段
    を備えることを特徴とする認識処理制御装置。
  2. 前記送信手段は、前記認識処理対象の属性に基づいて、前記認識処理対象を前記認識エンジンに送信する
    ことを特徴とする請求項1に記載の認識処理制御装置。
  3. 前記評価結果の利用目的に基づいて、前記評価情報が選択される
    ことを特徴とする請求項1または2に記載の認識処理制御装置。
  4. 前記出力手段は、所定の条件を満足する評価結果を出力する
    ことを特徴とする請求項1から3のいずれか1項に記載の認識処理制御装置。
  5. 前記エンジン指定情報に基づいて指定される認識エンジンを少なくとも一つ備える
    ことを特徴とする請求項1または4に記載の認識処理制御装置。
  6. 前記認識処理対象、前記結果情報または前記評価結果を履歴情報として記憶する履歴記憶手段を備え、
    前記エンジン指定情報は、前記履歴情報に基づいて認識エンジンを指定するときの優先度を示す優先度情報を含む
    ことを特徴とする請求項1〜5のいずれか1項に記載の認識処理制御装置。
  7. 前記出力手段が、複数の認識エンジンの結果情報を併用して評価する、
    ことを特徴とする請求項1から6のいずれか1項に記載の認識処理制御装置。
  8. 車載装置、移動端末または情報端末である
    ことを特徴とする請求項1から7のいずれか1項に記載の認識処理制御装置。
  9. 認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、前記認識処理対象を前記認識エンジンに送信し、
    前記認識エンジンから前記認識処理の結果情報を受信し、
    所定の評価情報に基づいて前記結果情報を評価し、評価結果を出力する
    ことを特徴とする認識処理制御方法。
  10. 認識処理制御装置が備えるコンピュータを、
    認識処理対象の認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、前記認識処理対象を前記認識エンジンに送信する送信手段と、
    前記認識エンジンから前記認識処理の結果情報を受信する受信手段と、
    所定の評価情報に基づいて前記結果情報を評価し、評価結果を出力する出力手段
    として動作させることを特徴とする認識処理制御プログラム。
JP2013067907A 2013-03-28 2013-03-28 認識処理制御装置、認識処理制御方法および認識処理制御プログラム Active JP6050171B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013067907A JP6050171B2 (ja) 2013-03-28 2013-03-28 認識処理制御装置、認識処理制御方法および認識処理制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013067907A JP6050171B2 (ja) 2013-03-28 2013-03-28 認識処理制御装置、認識処理制御方法および認識処理制御プログラム

Publications (2)

Publication Number Publication Date
JP2014191246A true JP2014191246A (ja) 2014-10-06
JP6050171B2 JP6050171B2 (ja) 2016-12-21

Family

ID=51837517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013067907A Active JP6050171B2 (ja) 2013-03-28 2013-03-28 認識処理制御装置、認識処理制御方法および認識処理制御プログラム

Country Status (1)

Country Link
JP (1) JP6050171B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156598A (ja) * 2017-03-21 2018-10-04 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム
WO2023139769A1 (ja) * 2022-01-21 2023-07-27 ファナック株式会社 文法調整装置、及びコンピュータが読み取り可能な記憶媒体

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07199379A (ja) * 1993-10-18 1995-08-04 Internatl Business Mach Corp <Ibm> 音声記録指標化装置及び方法
JP2002539480A (ja) * 1999-03-09 2002-11-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識方法
JP2005031758A (ja) * 2003-07-07 2005-02-03 Canon Inc 音声処理装置及び方法
JP2005524859A (ja) * 2001-12-29 2005-08-18 モトローラ・インコーポレイテッド 多重レベル分散型音声認識のための方法および装置
JP2008033198A (ja) * 2006-08-01 2008-02-14 Nec System Technologies Ltd 音声対話システム、音声対話方法、音声入力装置、プログラム
JP2008293354A (ja) * 2007-05-25 2008-12-04 Canon Inc 文書画像認識システム
WO2013001702A1 (ja) * 2011-06-29 2013-01-03 日本電気株式会社 情報処理装置
JP2013007764A (ja) * 2011-06-22 2013-01-10 Clarion Co Ltd 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07199379A (ja) * 1993-10-18 1995-08-04 Internatl Business Mach Corp <Ibm> 音声記録指標化装置及び方法
JP2002539480A (ja) * 1999-03-09 2002-11-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識方法
JP2005524859A (ja) * 2001-12-29 2005-08-18 モトローラ・インコーポレイテッド 多重レベル分散型音声認識のための方法および装置
JP2005031758A (ja) * 2003-07-07 2005-02-03 Canon Inc 音声処理装置及び方法
JP2008033198A (ja) * 2006-08-01 2008-02-14 Nec System Technologies Ltd 音声対話システム、音声対話方法、音声入力装置、プログラム
JP2008293354A (ja) * 2007-05-25 2008-12-04 Canon Inc 文書画像認識システム
JP2013007764A (ja) * 2011-06-22 2013-01-10 Clarion Co Ltd 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
WO2013001702A1 (ja) * 2011-06-29 2013-01-03 日本電気株式会社 情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156598A (ja) * 2017-03-21 2018-10-04 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム
WO2023139769A1 (ja) * 2022-01-21 2023-07-27 ファナック株式会社 文法調整装置、及びコンピュータが読み取り可能な記憶媒体

Also Published As

Publication number Publication date
JP6050171B2 (ja) 2016-12-21

Similar Documents

Publication Publication Date Title
US10991374B2 (en) Request-response procedure based voice control method, voice control device and computer readable storage medium
JP5234160B2 (ja) 車両用装置および情報表示システム
US20130179154A1 (en) Speech recognition apparatus
JP2010236858A (ja) ナビゲーション装置
JP7040449B2 (ja) 音声処理装置、情報処理装置、音声処理方法および情報処理方法
CN104050966A (zh) 终端设备的语音交互方法和使用该方法的终端设备
JP2013068532A (ja) 情報端末、サーバー装置、検索システムおよびその検索方法
CN102549654A (zh) 语音翻译系统、控制装置以及控制方法
KR20140112360A (ko) 음성 인식의 단어 통합 시스템 및 단어군 추가 방법
JP2018054790A (ja) 音声対話システムおよび音声対話方法
JPWO2016129276A1 (ja) 情報提供方法、サーバ、情報端末装置、システム及び音声対話システム
JP2013088477A (ja) 音声認識システム
US20220299335A1 (en) Content-aware navigation instructions
JP5606951B2 (ja) 音声認識システムおよびこれを用いた検索システム
WO2016174955A1 (ja) 情報処理装置、及び、情報処理方法
JP4401883B2 (ja) 車載端末、移動通信端末およびこれらを用いたメール送受信システム
JP6050171B2 (ja) 認識処理制御装置、認識処理制御方法および認識処理制御プログラム
JP5500100B2 (ja) 音声案内システム
JP6444128B2 (ja) 検索システム
JP6477648B2 (ja) キーワード生成装置およびキーワード生成方法
CN112242143B (zh) 一种语音交互方法、装置、终端设备及存储介质
JP6322125B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP2000076040A (ja) 音声入力ネットワーク端末装置
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
JP2020091416A (ja) 案内音声出力制御システムおよび案内音声出力制御方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150402

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150410

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20150605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161124

R150 Certificate of patent or registration of utility model

Ref document number: 6050171

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150