JP2005055606A - サーバ、情報処理端末、音声認識システム - Google Patents

サーバ、情報処理端末、音声認識システム Download PDF

Info

Publication number
JP2005055606A
JP2005055606A JP2003285250A JP2003285250A JP2005055606A JP 2005055606 A JP2005055606 A JP 2005055606A JP 2003285250 A JP2003285250 A JP 2003285250A JP 2003285250 A JP2003285250 A JP 2003285250A JP 2005055606 A JP2005055606 A JP 2005055606A
Authority
JP
Japan
Prior art keywords
information
voice
server
feature information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003285250A
Other languages
English (en)
Inventor
Kazuaki Minami
見並  一明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota InfoTechnology Center Co Ltd
Original Assignee
Toyota Motor Corp
Toyota InfoTechnology Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota InfoTechnology Center Co Ltd filed Critical Toyota Motor Corp
Priority to JP2003285250A priority Critical patent/JP2005055606A/ja
Publication of JP2005055606A publication Critical patent/JP2005055606A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 音声認識結果に応じて音声認識に必要な情報を用いて正確な音声認識結果を得る。
【解決手段】 音声認識を要求する情報処理端末200から音声の特徴情報を取得し、その特徴情報に基づいた音声認識結果を評価する。そして、サーバ100は、その評価に応じて、縮減レベルを緩和した特徴情報または音声情報自体を情報処理端末200に要求する。音声情報自体を取得後、サーバ100は、その情報に基づいた音声認識結果を生成する。
【選択図】 図1

Description

本発明は、音声認識技術に関する。
一般に、自動車に搭載されるカーナビゲーションシステムなどの、移動体用の情報端末において、端末操作のインタフェースとして音声認識手段が用いられている。上記情報端末が音声認識手段による操作を受け付けることで、ユーザは、キーボード等の入力手段からの複雑な入力操作を情報端末に対して行うことなく、地名検索の指示あるいは目的地の設定等を行い、当該情報端末を利用していた。
ところで、上記情報端末の音声認識に関して、音声認識結果を向上させるために、様々な技術が鑑みられてきた。このような、音声認識に関する技術として、通信ネットワーク上の装置間における音声データ認識性能を向上させることができる音声認識通信システムに関する技術(例えば、特許文献1参照。)が開示されている。
特開2001−142488号公報
ところで、上記移動体用の情報端末の音声認識技術では、情報端末側の処理能力にとらわれることなく処理を行うために、サーバ側で音声認識処理を行う、いわゆる分散型音声認識(Distributed Speech Recognition:以下DSRとする)が用いられていた。
上記DSRでは、情報端末が音声情報を抽出し、サーバに送信する。サーバは、受信した特徴情報により、音声を認識する。上記DSRでは、このような処理における通信データ量を抑えるために、情報端末は、音声情報から抽出した特徴情報を圧縮し、サーバ側に送信する。
しかしながら、圧縮した特徴情報では、ユーザが発した音声情報を正確に反映した音声認識結果を得ることができない場合があった。具体的には、端末によって音声情報の圧縮を行う際に、その音声情報に対する音声認識に必要な特徴情報が取り除かれてしまう場合があった。この場合、サーバでは、受信した特徴情報に基づいて音声認識を行うことができなかった。
本発明は、上記事項に鑑みて為されたものであり、音声認識結果に応じて音声認識に必要な情報を用いて正確な音声認識結果を得ることを、その解決すべき課題とする。
本発明は上記課題を解決するために、以下の手段を採用した。
本発明において、音声を認識する音声情報の特徴情報を、音声を認識するサーバ側の要求に応じて取得することが可能となれば、正確な音声認識結果を得ることが可能となる。
すなわち、本発明は、音声認識を要求する情報処理端末と接続するサーバであり、前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を、前記情報処理端末から受信する、特徴情報受信手段と、前記特徴情報に含まれる情報が不足している場合には、前記縮減のレベルを緩和した特徴情報を要求する、情報要求手段と、を備えるよう
にした。なお、本発明において、音声情報の縮減とは、例えば、音声情報のビット数を減少させる、データを圧縮する、周波数スペクトラムに変換して情報を抽出する、あるいはケプストラムによって情報を抽出する等、音声情報のうち特徴情報を抽出する様々な処理が挙げられる。そして、本発明において、縮減レベルとは、上記様々な処理によって抽出される特徴情報の情報量を示す。
本発明のサーバは、音声を認識する際に、この情報処理端末から送信された音声の特徴情報によって正確な音声認識結果を得ることができるか否かを判定する。そして、サーバは、この特徴情報の情報量が不足する場合には、情報処理端末側に不足する情報を補う縮減レベルを緩和した特徴情報を要求する。
従って、本発明のサーバによれば、音声認識結果に応じて音声認識に必要な情報を用いて正確な音声認識結果を得ることができる。
また、本発明のサーバは、前記特徴情報に対して音声認識を実行する手段と、音声認識結果の評価を算出する評価算出手段と、を備え、前記情報要求手段は、前記評価に基づいて縮減レベルを緩和した特徴情報を要求してもよい。
本発明のサーバでは、音声認識結果の評価に基づいて、要求する情報の縮減レベルを決定する。
従って、本発明のサーバによれば、正確な音声認識結果を得るための情報を確実に取得して音声を認識することができる。
本発明のサーバは、前記情報要求手段は、前記特徴情報に含まれる情報が不足している場合に、前記特徴情報に代え、前記音声情報自体を要求してもよい。
本発明のサーバでは、取得した特徴情報に基づいた音声認識結果に応じて、正確な音声認識結果を得るために音声情報自体を取得する。
従って、本発明のサーバによれば、必要に応じて、ユーザの音声を正確に反映した音声認識結果を得ることができる。
また、本発明は、音声を認識するサーバと接続する情報処理端末であり、音声を受け付ける音声入力手段と、前記前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を抽出する抽出手段と、前記特徴情報及び前記音声を記憶する音声情報記憶手段と、前記特徴情報を前記サーバに送信する送信手段と、前記サーバからの要求に応じて、縮減のレベルを緩和した特徴情報を提供する、情報提供手段と、を備えるようにした。
本発明の情報処理端末では、受け付けた音声から特徴情報を抽出して、特徴情報及び音声を記憶する。そして、本発明の情報処理端末では、音声を認識するサーバ側の要求に応じて、縮減レベルを緩和した特徴情報を提供する。
従って、本発明の情報処理端末によれば、正確な音声認識結果を得るために必要な情報を効率的にサーバ側に提供することができる。
また、本発明の情報処理端末は、前記情報提供手段は、前記サーバから前記音声情報自体を要求された場合には、この音声情報自体をサーバに提供してもよい。
本発明の情報処理端末では、正確な音声認識結果を得る際に音声情報自体が必要な場合
には、サーバ側の要求に応じてこの音声情報を提供する。
従って、本発明の情報処理端末によれば、サーバ側の要求に応じて、正確な音声認識結果を得る際に必要な情報を提供することができる。
以上のように、本発明によれば音声認識結果に応じて音声認識に必要な情報を用いて正確な音声認識結果を得ることができる。
以下、図面を参照して、本発明の一実施の形態に係る音声認識システム(以下、本システムとも称する)を、図1から図4の図面に基づいて説明する。本システムは、サーバ及び情報処理端末からなる。
〈本システムの概略〉
まず、本システムの概略を説明する。本システムのサーバ及び情報処理端末は、以下に示す特徴を備える。
本システムのサーバは、その特徴として、音声認識を要求する情報処理端末から音声の特徴情報を取得し、その特徴情報に基づいた音声認識結果を評価する。そして、本システムのサーバは、その評価に応じて、縮減レベルを緩和した音声認識に必要な情報を情報処理端末に要求する。必要な情報を取得後、本システムのサーバは、その情報に基づいた音声認識結果を生成する。
従って、本システムのサーバによれば、ユーザの音声を反映させた、正確な音声認識結果を得ることができる。
また、本システムの情報処理端末は、その特徴として、サーバ側で音声を認識するために、音声を取得して特徴情報を抽出する際に、その特徴情報及び音声を記憶する。そして、本システムの情報処理端末は、縮減レベルを緩和した音声認識をサーバ側で行う際に、サーバ側の要求に応じて、記憶する音声から縮減レベルを緩和した特徴情報を抽出する。また、本システムの情報処理端末は、縮減レベルを緩和した音声認識をサーバ側で行う際に、サーバが上記特徴情報あるいは縮減レベルを緩和した特徴情報に代えて音声を要求した場合には、その音声を提供する。
従って、本システムの情報処理端末によれば、正確な音声認識結果を得る際に、音声を認識するサーバに必要な情報を提供し、この正確な音声認識結果をサーバから得ることができる。
〈システム構成〉
図1は、本実施の形態に係る音声認識システムの概略構成図の一例である。図1に示すように、本実施の形態に係る音声認識システムは、本発明のサーバの一例であるサーバ100と、本発明の情報処理端末の一例である車載用情報端末200とを備える。そして、本音声認識システムでは、サーバ100と車載用情報端末200とが、既存の通信網を利用したネットワーク300を介して接続している。なお、このネットワーク300としては、公衆の携帯電話網、無線LAN(Local Area Network)用通信網、及びETC(Electronic Toll Collection System)用無線通信網等の、既存の様々な通信網を用いることができる。また、図1において、サーバ100に対して、一つの車載用情報端末200が接続されているが、本実施の形態に係る音声認識システムでは、図示しない複数の車載用情報端末200がネットワーク300を介して接続している。
〈装置構成〉
次に、本実施の形態に係る音声認識システムを構成する装置及び端末について説明する。
サーバ100は、パーソナルコンピュータやサーバ装置などの、既存の情報処理装置によって構成される。本実施の形態において、これら既存の情報処理装置には、本システムのサーバの機能を実現するプログラムが導入(インストール)される。そして、このプログラムをインストールすることによって、既存の情報処理装置は、本実施の形態に係るサーバ100として用いることができる。
図1に示すように、本実施の形態に係るサーバ100は、本発明のサーバの各機能を実現するために、以下の構成要素を備える。すなわち、本サーバ100は、CPU(Central Processing Unit)101、音声認識エンジン103,音声認識データベース104を有する音声認識手段102、音響分析手段105、及び通信手段106を備える。
次に、本サーバ100の上記の構成要素について説明する。
CPU101は、ハードディスク装置等の記憶装置(不図示)にインストールされたプログラムを実行して、本音声認識システムに係るサーバの各種機能、すなわち、本システムのサーバの各種機能を実現する。すなわち、CPU101に、上記記憶装置にインストールされたプログラムを実行させることで、本システムのサーバ100は、特徴情報受信手段、情報要求手段、どこまでの特徴情報を要求するかの判定手段、及び評価算出手段の、本発明のサーバの機能を実現する。CPU101は、どこまでの特徴情報を要求するかの判定手段、及び情報要求手段の機能を実現するために、車載用情報端末200に特徴情報または音声の送信要求を送信する際に、デシジョンテーブルを参照する。
図2は、本システムのデシジョンテーブルの一例である。このデシジョンテーブルには、受信した特徴情報に基づいて算出した音声認識結果の評価尺度と、その評価尺度に対応するサーバ100のアクション(処理)内容が予め定められて記憶されている。本システムのデシジョンテーブルにおいて、評価尺度とは、音声認識において一般的に行われている音声認識結果の一致度(マッチング)を所定の基準によって任意に分類して得点化したものである。
音声認識手段102は、音声認識処理に必要な情報である音声認識情報を用いて文字情報に基づいてユーザに発する音声情報を認識する、音声認識エンジン103を備える。また、音声認識手段102は、音声情報を生成するために参照する特徴情報等の音声特徴情報を格納する、音声認識データベース104を備える。なお、本音声認識システムにおいて、音声認識手段102の音声認識エンジン103は、CPU101によって実行されるプログラムによって実現される。
音声認識エンジン103は、車載用情報端末200の音声入力手段202に入力された音声から抽出した特徴情報を取得する。そして、音声認識エンジン103は、音声認識データベース104に格納されている特徴情報を参照して、取得した特徴情報から音声認識結果を生成する。なお、本音声認識システムにおいて、特徴情報は、音声情報のうちユーザが発した言葉を特定することのできる特徴となる情報である。なお、上記特徴情報の一例として、取得した音声情報からユーザが発した言語の音声情報のみを周波数スペクトラムに変換して抽出する処理、周波数の包絡線を抽出する処理(いわゆるケプストラム)などによって取得した情報が挙げられる。
音響分析手段105は、サーバ100側で音声情報から特徴情報を抽出する処理を実行する。すなわち、音響分析手段105は、車載用情報端末200から音声認識結果に応じて特徴情報抽出の対象となる音声情報自体を取得した場合に、上記周波数スペクトラムから抽出する処理、あるいはケプストラムによって抽出する処理などによってこの音声情報から特徴情報を抽出する。
通信手段106は、ネットワーク300を介して、個々のユーザの車載用情報端末200と通信する。この通信手段106は、車載用情報端末200から特徴情報、及び音声のいずれかの情報を受信する。また、通信手段106は、音声認識結果、及び音声認識に必要な情報に対する要求を送信する。
次に、本実施の形態に係る車載用情報端末200について説明する。
本実施の形態に係る車載用情報端末200は、本発明の情報処理端末の各機能を実現するために、以下の構成要素を備える。車載用情報端末200は、プログラムに基づいて各種情報処理を行うCPU201、ユーザの音声を取得するマイクなどの音声入力手段202、取得した音声に基づいて音声の特徴情報を抽出する音響分析手段203、取得した音声及び抽出した特徴情報を記憶する音声データ用メモリ(本発明の記憶手段に対応)204、文字情報を音声情報に合成する音声合成手段205、合成した音声を出力するスピーカなどの音声出力手段206、文字情報などを表示するディスプレイなどの表示手段207、及び通信手段208を備える。そして、車載用情報端末200の構成要素のうち、音響分析手段203,音声合成手段205は、CPUに実行させるプログラムによって実現される機能である。なお、CPU201は、本発明の情報処理端末の情報提供手段に対応する機能も実現する。
上記車載用情報端末200の構成要素のうち、音響分析手段203は、ユーザが発した特徴情報抽出に必要な音声を取得した場合に、音声の周波数スペクトラムから特徴情報を抽出する処理、あるいはケプストラムによって音声から特徴情報を抽出する処理によって、この音声から特徴情報を抽出する。なお、音響分析手段203は、本発明の情報処理端末の特徴情報抽出手段に対応する。
また、上記構成要素のうち、通信手段208は、音声認識のためにサーバ100へ特徴情報及び音声を送信する。また、通信手段208は、サーバ100が送信した特徴情報及び音声の送信要求を受信する。
〈処理フローチャート〉
次に、本音声認識システムに係る、サーバ100及び車載用情報端末200の処理について、フローチャートを用いて説明する。
図3は、本実施の形態に係るサーバ100の処理フローチャートである。
まず、サーバ100は、車載用情報端末(クライアント)200から、音声を認識する対象となる特徴情報のデータを受信する(図3におけるステップ101、以下S101のように省略する)。
受信した特徴情報を用いて、サーバ100は、音声認識手段102によって音声を認識する(S102)。
音声認識の結果を生成後、サーバ100は、所定の基準によって音声認識結果の評価尺度を算出する。そして、サーバ100は、その評価尺度に対応したサーバ100のアクシ
ョンを、図2に示したデシジョンテーブルを参照してどこまでの特徴情報を要求するかを判定する。
サーバ100は、デシジョンテーブルに基づいて、音声認識結果の評価尺度が例えば0.7以上であるか否かを判定する(S103)。このとき、音声認識結果の評価尺度が0.7以上であれば、サーバ100は、この音声認識結果は認容できる結果であると判定する。そして、サーバ100は、音声認識結果を車載用情報端末に送信するデータとして設定する(S104)。
また、S103において、認識結果の評価尺度が0.7以下である場合には、サーバ100は、その評価尺度が0.3以上であるか否かを判定する(S105)。このとき、評価尺度が0.3以上である場合には、サーバ100は、デシジョンテーブルに基づいて、車載用情報端末200が送信した特徴情報より縮減レベルを緩和した情報量を含む特徴情報の送信を、車載用情報端末200に要求する(S106)。
S105において、音声認識結果の評価尺度が0.3以下である場合、サーバ100は、サーバ100の音響分析手段105によって特徴情報の抽出を行うために、原音である音声の送信を、車載用情報端末200に要求する(S107)。
そして、サーバ100は、S104,106,107によって車載用情報端末200に送信する送信データ、または要求する送信要求データが決定した後、この送信データまたは送信要求データを車載用情報端末200に送信する(S108)。送信要求データ送信後、サーバ100は、本フローチャートの処理を終了する。
次に、本実施の形態の車載用情報端末200の処理について説明する。
図4は、本実施の形態に係る車載用情報端末200の処理フローチャートである。
車載用情報端末200は、音声入力手段202に入力された音声から特徴情報を抽出して特徴情報を生成する。そして、車載用情報端末200は、特徴情報を生成後、入力された音声を音声データ用メモリ204に記憶する(図4におけるステップ201、以下S201のように省略する)。
車載用情報端末200は、この特徴情報を、サーバ100に送信する(S202)。
特徴情報送信後、車載用情報端末200は、サーバ100からのデータ受信を完了するまで待つ(S203)。
S203において、サーバ100からのデータの受信を完了した場合には、車載用情報端末200は、この受信したデータをCPU201が読み込む。そして、車載用情報端末200は、この受信したデータが音声認識結果であるか否かを判定する(S205)。受信したデータが音声認識結果である場合には、車載用情報端末200は、本フローチャートの処理を終了し、この音声認識結果を出力する。
S205において、受信したデータが音声認識結果ではないと判定した場合には、車載用情報端末200は、このデータが送信済みの特徴情報よりさらに縮減レベルを緩和した特徴情報の送信要求であるか否かを判定する(S206)。このデータが、縮減レベルを緩和した特徴情報の送信要求である場合には、車載用情報端末200の音響分析手段203が音声から縮減レベルを緩和した特徴情報を抽出する。そして、車載用情報端末200は、縮減レベルを緩和した特徴情報をサーバ100に送信する(S207)。
なお、縮減レベルを緩和した特徴情報を抽出する際に、車載用情報端末200は、特徴情報の情報量を増やすために、例えば、情報の圧縮率を変更する、あるいは特徴情報の抽出方法を変更する等の方法が考えられる。具体的には、例えば、図2のデシジョンテーブルに示すように、評価尺度が「0.7以上」の場合のサーバ100側のアクション「通常の特徴情報(1次から12次までのケプストラム各8ビット)」に代えて、「より詳しい(縮減レベルを緩和した)特徴情報(1次から12次までのケプストラム各32ビット」を抽出すればよい。
また、S206において、縮減レベルを緩和した特徴情報の送信要求でないと判定した場合には、車載用情報端末200は、音声を認識する音声の原音データを、音声データ用メモリ204から検索して、サーバ100に送信する(S208)。
〈実施の形態の効果〉
本実施の形態に係る、サーバ100及び車載用情報端末200を備える音声認識システムを実現することにより、以下のような効果が得られる。
本システムでは、サーバ100が音声認識結果の評価尺度に応じて、この音声認識に必要な情報を、縮減レベルを緩和した特徴情報、または音声の原音データと判断して、これらの情報を車載用情報端末200に要求する。そして、この要求に応じた情報を、車載用情報端末200は、サーバ100に送信する。従って、本システムによれば、音声認識結果に応じて正確な音声認識結果を得ることができる。
本システムによれば、音声認識結果に応じて車載用情報端末200から送信する情報を変更するため、通信に必要なデータ量が抑制しつつ正確な音声認識結果を得ることができる。
また、本システムによれば、車載用情報端末200が抽出した音声認識結果の評価尺度が低い場合には、原音データを送信して、サーバ100が特徴情報を抽出して音声を認識するため、正確な音声認識結果を得ることができる。
〈変形例〉
本実施の形態において、本システムのサーバ及び情報処理端末は、主に車載用情報端末に対する音声認識処理の一例について説明したが、本発明ではこれに限らず、その他の音声認識システムに対して広く実施することができる。
例えば、本実施の形態に係る音声合成システムでは、本システムの情報処理端末は車載用情報端末200であったが、本発明ではこれに限定されない。すなわち、本発明の情報処理端末は、車載用以外の他の携帯情報端末(PDA)、各種携帯型電話機、あるいは既存のユーザ向けコンピュータなど、他のあらゆる情報処理装置の音声合成処理に適用することができる。
例えば、本システムでは、音声認識結果の評価尺度は、図2に示したデシジョンテーブルに基づいて判定したが、本発明の評価算出手段ではこれに限定されず、様々な算出方法で評価を算出することができる。
また、例えば、本システムでは、特徴情報の抽出方法は、周波数スペクトラムまたはケプストラムによる抽出を行ったが、本発明の特徴情報、及び縮減レベルを緩和した特徴情報はこれに限定されず、様々な音声の特徴情報抽出方法を用いることができる。
本発明は、情報処理端末の音声を認識する際に分散型音声を認識する産業に適用可能である。
本システムの一実施の形態に係る音声認識システムの概略構成図の一例である。 デシジョンテーブルのデータテーブルの一例である。 本実施の形態に係るサーバの処理フローチャートである。 本実施の形態に係る車載用情報端末の処理フローチャートである。
符号の説明
100 サーバ
101 CPU
102 音声認識手段
103 音声認識エンジン
104 音声認識データベース
105 音響分析手段
106 通信手段
200 車載用情報端末
201 CPU
202 音声入力手段
203 音響分析手段
204 音声データ用メモリ
205 音声合成手段
206 音声出力手段
207 表示手段
208 通信手段
300 ネットワーク

Claims (11)

  1. 音声認識を要求する情報処理端末と接続するサーバであり、
    前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を、前記情報処理端末から受信する、特徴情報受信手段と、
    前記特徴情報に含まれる情報が不足している場合には、前記縮減のレベルを緩和した特徴情報を要求する、情報要求手段と、を備える、サーバ。
  2. 前記特徴情報に対して音声認識を実行する手段と、
    音声認識結果の評価を算出する評価算出手段と、を備え、
    前記情報要求手段は、
    前記評価に基づいて縮減レベルを緩和した特徴情報を要求する、請求項1に記載のサーバ。
  3. 前記情報要求手段は、
    前記特徴情報に含まれる情報が不足している場合に、
    前記特徴情報に代え、前記音声情報自体を要求する、請求項1または2に記載のサーバ。
  4. 音声を認識するサーバと接続する情報処理端末であり、
    音声を受け付ける音声入力手段と、
    前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を抽出する抽出手段と、
    前記特徴情報及び前記音声を記憶する音声情報記憶手段と、
    前記特徴情報を前記サーバに送信する送信手段と、
    前記サーバからの要求に応じて、縮減のレベルを緩和した特徴情報を提供する、情報提供手段と、を備える、情報処理端末。
  5. 前記情報提供手段は、
    前記サーバから前記音声情報自体を要求された場合には、この音声情報自体をサーバに提供する、請求項4に記載の情報処理端末。
  6. 音声認識を要求する情報処理端末と接続するサーバに実行させるプログラムであり、
    前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を、前記情報処理端末から受信するステップと、
    前記特徴情報に含まれる情報が不足している場合には、前記縮減のレベルを緩和した特徴情報を要求するステップと、をコンピュータに実行させる、音声認識プログラム。
  7. 前記特徴情報に対して音声認識を実行するステップと、
    音声認識結果の評価を算出するステップと、
    前記評価に基づいて縮減レベルを緩和した特徴情報を要求するステップと、をさらに実行させる、請求項6に記載の音声認識プログラム。
  8. 前記特徴情報に含まれる情報が不足している場合に、
    前記特徴情報に代え、前記音声情報自体を要求するステップをさらに実行させる、請求項6または7に記載の音声認識プログラム。
  9. 音声を認識するサーバと接続する情報処理端末に実行させるプログラムであり、
    音声を受け付けるステップと、
    前記前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を抽出す
    るステップと、
    前記特徴情報及び前記音声を記憶するステップと、
    前記特徴情報を前記サーバに送信するステップと、
    前記サーバからの要求に応じて、縮減のレベルを緩和した特徴情報を提供するステップと、をコンピュータに実行させる、音声認識プログラム。
  10. 前記サーバから前記音声情報自体を要求された場合には、この音声情報自体をサーバに提供するステップをさらに実行させる、請求項9に記載の音声認識プログラム。
  11. 音声認識を要求する情報処理端末と、音声を認識するサーバとを有する音声認識システムであり、
    前記サーバは、
    前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を、前記情報処理端末から受信する、特徴情報受信手段と、
    前記特徴情報に含まれる情報が不足している場合には、前記縮減のレベルを緩和した特徴情報を要求する、情報要求手段と、を備え、
    前記情報処理端末は、
    音声を受け付ける音声入力手段と、
    前記前記音声認識の対象である音声情報を所定のレベルまで縮減した特徴情報を抽出する抽出手段と、
    前記特徴情報及び前記音声を記憶する音声情報記憶手段と、
    前記特徴情報を前記サーバに送信する送信手段と、
    前記サーバからの要求に応じて、縮減のレベルを緩和した特徴情報を提供する、情報提供手段と、を備える、音声認識システム。
JP2003285250A 2003-08-01 2003-08-01 サーバ、情報処理端末、音声認識システム Withdrawn JP2005055606A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003285250A JP2005055606A (ja) 2003-08-01 2003-08-01 サーバ、情報処理端末、音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003285250A JP2005055606A (ja) 2003-08-01 2003-08-01 サーバ、情報処理端末、音声認識システム

Publications (1)

Publication Number Publication Date
JP2005055606A true JP2005055606A (ja) 2005-03-03

Family

ID=34364939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003285250A Withdrawn JP2005055606A (ja) 2003-08-01 2003-08-01 サーバ、情報処理端末、音声認識システム

Country Status (1)

Country Link
JP (1) JP2005055606A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008529101A (ja) * 2005-02-03 2008-07-31 ボイス シグナル テクノロジーズ インコーポレイテッド 移動通信装置の音声語彙を自動的に拡張するための方法及び装置
JP2013007764A (ja) * 2011-06-22 2013-01-10 Clarion Co Ltd 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
JP2013011830A (ja) * 2011-06-30 2013-01-17 Fujitsu Ltd 異常状態検出装置、電話機、異常状態検出方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008529101A (ja) * 2005-02-03 2008-07-31 ボイス シグナル テクノロジーズ インコーポレイテッド 移動通信装置の音声語彙を自動的に拡張するための方法及び装置
JP2013007764A (ja) * 2011-06-22 2013-01-10 Clarion Co Ltd 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
JP2013011830A (ja) * 2011-06-30 2013-01-17 Fujitsu Ltd 異常状態検出装置、電話機、異常状態検出方法、及びプログラム

Similar Documents

Publication Publication Date Title
CN107623614B (zh) 用于推送信息的方法和装置
US20180218735A1 (en) Speech recognition involving a mobile device
US8831939B2 (en) Voice data transferring device, terminal device, voice data transferring method, and voice recognition system
JP3728177B2 (ja) 音声処理システム、装置、方法及び記憶媒体
JP5613335B2 (ja) 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
JP2003295893A (ja) 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
KR20040084759A (ko) 이동 통신 장치를 위한 분산 음성 인식
JP5283947B2 (ja) 携帯端末の音声認識装置、音声認識方法、音声認識プログラム
WO2001099096A1 (fr) Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
JPWO2008114708A1 (ja) 音声認識システム、音声認識方法、および音声認識処理プログラム
US8209167B2 (en) Mobile radio terminal, speech conversion method and program for the same
JP3969908B2 (ja) 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JP2000250576A (ja) 音声認識システムにおいて特徴を抽出する方法
CN110875036A (zh) 语音分类方法、装置、设备及计算机可读存储介质
CN111798821A (zh) 声音转换方法、装置、可读存储介质及电子设备
JP2009175630A (ja) 音声認識装置、携帯端末、音声認識システム、音声認識装置制御方法、携帯端末制御方法、制御プログラム、および該プログラムを記録したコンピュータ読み取り可能な記録媒体
US20150325252A1 (en) Method and device for eliminating noise, and mobile terminal
JP5606951B2 (ja) 音声認識システムおよびこれを用いた検索システム
KR20060018888A (ko) 캐시 특징을 갖는 분배형 음성 인식 시스템 및 방법
EP1239458A2 (en) Voice recognition system, standard pattern preparation system and corresponding methods
JP2005012377A (ja) 通信端末、通信端末の制御方法、音声認識処理装置、音声認識処理装置の制御方法、通信端末制御プログラム、通信端末制御プログラムを記録した記録媒体、音声認識処理装置制御プログラム、および、音声認識処理装置制御プログラムを記録した記録媒体
JP6549009B2 (ja) 通信端末及び音声認識システム
CN110600045A (zh) 声音转换方法及相关产品
JP5050175B2 (ja) 音声認識機能付情報処理端末

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061003