JP2004104757A - Voice input device - Google Patents
Voice input device Download PDFInfo
- Publication number
- JP2004104757A JP2004104757A JP2003129795A JP2003129795A JP2004104757A JP 2004104757 A JP2004104757 A JP 2004104757A JP 2003129795 A JP2003129795 A JP 2003129795A JP 2003129795 A JP2003129795 A JP 2003129795A JP 2004104757 A JP2004104757 A JP 2004104757A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- electronic device
- wireless communication
- voice input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、無線通信機能を備えた電子機器に外部接続して利用する音声入力装置に関する。
【0002】
【従来の技術】
従来、携帯電話機等の無線通信端末を音声入力機器として利用し、音声認識機能をセンター設備側に持たせて音声認識処理や認証処理を行う場合、無線通信端末からセンター設備に音声が送信される通信処理の過程で音声品質が劣化し、音声認識率及び認証率を上げることは難しかった。
【0003】
例えば、音声入力機器として携帯電話機を利用した場合、電話回線の周波数帯域幅の制限により音声品質が劣化し、音声認識ソフトウェアが実装されたパーソナルコンピュータに接続されたマイクから音声入力する場合等に比べて音声品質の劣化が顕著であり、音声認識率を低下させる一因となっている。
【0004】
このような通信による音質劣化を防ぐ方法としてDSR(Distributed Speech Recognition)方式が提案されている。このDSR方式は、音声認識処理のうち前段階の音響処理部分と後段階の音声認識処理部分とを分離して、音声入力機器側に音響処理部分を受け持たせ、センター設備側に音声認識処理部分を受け持たせて、入力音声を通信処理で劣化しないデータに加工してからセンター設備に送信するものである。
【0005】
このDSR方式に対応する音響処理機能を無線通信端末に実装する方法として、1)ソフトウェアとしてパーソナルコンピュータや携帯情報端末に実装する、2)LSI(Large Scale Integrated Circuit)化して無線通信端末に実装する、というものが実現されている。
【0006】
【発明が解決しようとする課題】
しかしながら、従来のDSR方式に対応する音響処理機能の無線通信端末への実装方法では、無線通信端末として最も普及している現行の携帯電話機に対しては実装することができず、DSR方式対応のLSIを組み込んだ新規の携帯電話機の登場を待たなければならない。
【0007】
この場合、既存の携帯電話機ユーザーに対して、DSR方式の音声認識機能を普及させることは難しくなり、携帯電話機ユーザーにとって最も簡便な入力環境の提供と、サービス提供者にとっても優位な音声認識サービスの普及を遅らせることになる。
【0008】
また、従来のDSR方式の音声認識サービスでは、センター設備が音声認識した後、応答を音声で携帯電話機に返すようにしていたため、返信するデータ量が多い割に実質的な情報量が少ないため、無駄な音声データの授受が多くなって、電話回線の利用効率を低下させるとともに、通信コストも高くなるという問題があった。
【0009】
また、近時、インターネット接続機能を備えた携帯電話機が普及しているが、インターネットから提供されるサービスと、音声認識サービスとを利用する場合、データと音声を別々のネットワーク(インターネットと電話回線)で授受しなければならず、通信コストが高くなるという問題があった。
【0010】
更に、DSR方式対応のLSIを携帯電話機に組み込んだ場合であっても、携帯電話機に内蔵されたマイクを利用することになり、元々周波数帯域が制限された電話回線用に搭載されたものなので、音声認識用のマイクとしては収音周波数帯域が不十分であり、その性能の個体差も大きいため、入力音声を音声認識に必要な周波数帯域で収音することが困難である。
【0011】
本発明の課題は、無線通信機能を備えた電子機器に外付けして、音声認識に必要な入力音声の特徴抽出機能と、通信回線を効率よく利用する通信制御機能とを有する音声入力装置を提供することである。
【0012】
【課題を解決するための手段】
上記課題を解決するため、請求項1記載の発明は、
無線通信機能及び外部機器用接続部を備えた電子機器の該外部機器用接続部に接続される音声入力装置であって、
利用者の音声を入力する音声入力手段と、
前記音声入力手段により入力された音声から音声特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段により抽出された音声特徴量を前記電子機器の無線通信機能に対応する情報形態に変換して送信情報として出力する変換手段と、
前記電子機器の外部機器用接続部を介して当該電子機器の無線通信機能を制御し、前記変換手段から出力された送信情報を当該電子機器から外部の音声認識装置に送信させる制御手段と、
を備えたことを特徴としている。
【0013】
請求項1記載の発明によれば、
無線通信機能及び外部機器用接続部を備えた電子機器の該外部機器用接続部に接続される音声入力装置であって、特徴量抽出手段が、音声入力手段により入力された利用者の音声から音声特徴量を抽出し、前記特徴量抽出手段により抽出された音声特徴量を変換手段で前記電子機器の無線通信機能に対応する情報形態に変換して送信情報として出力し、制御手段が、前記電子機器の外部機器用接続部を介して当該電子機器の無線通信機能を制御して、前記変換手段から出力された送信情報を当該電子機器から外部の音声認識装置に送信させる。
【0014】
したがって、既存の無線通信機能及び外部機器用接続部を備えた電子機器に音声認識機能を付加することができ、既存の電子機器のユーザーに対して音声入力環境を容易に提供できる。請求項2に記載したように、本発明の音声入力機器を無線通信機能及び外部機器用接続部を備えた電子機器と一体に構成することもできる。
【0015】
また、請求項3に記載する発明のように、請求項1あるいは2記載の音声入力装置において、前記利用者の生体特徴量を検出する生体特徴検出手投を備え、前記変換手段は、前記生体特徴検出手段により検出された生体特徴量及び前記抽出された音声特徴量を前記電子機器の無線通信機能に対応する情報形態に変換して送信情報として出力するようにしてもよい。
【0016】
請求項3記載の発明によれば、
前記利用者の生体特徴を検出する生体特徴検出手段を備え、前記変換手段は、前記生体特徴検出手段により検出された生体特徴量及び前記抽出された音声特徴量を前記電子機器の無線通信機能に対応する情報形態に変換して送信情報として出力することにより、音声認識に必要な音声特徴量のみを効率よく送信でき、無線通信資源を有効利用して音声認識にかかる通信コストを低減できるとともに、音声特徴と生体特徴とを組み合わせたユーザー認証サービスも容易に提供できる。
【0017】
また、請求項4に記載する発明のように、請求項1〜3記載の音声入力装置において、前記電子機器は、前記外部の音声認識装置との間の無線通信内容を表示する表示部を備え、前記音声認識装置は、前記送信情報に含まれた音声特徴量及び生体特徴量により前記利用者を認証するとともに音声内容を認識し、その認証結果及び音声認識結果を前記電子機器に応答する認証・認識機能を有し、前記制御手段は、前記電子機器の外部機器用接続部を介して前記音声認識装置から送信された認証結果及び音声認識結果を受信すると、この認証結果及び音声認識結果を前記電子機器の表示部に表示させるようにしてもよい。
【0018】
請求項4記載の発明によれば、
前記電子機器は、前記外部の音声認識装置との間の無線通信内容を表示する表示部を備え、前記外部の音声認識装置は、前記送信情報に含まれた音声特徴量及び生体特徴量により前記利用者を認証するとともに音声内容を認識し、その認証結果及び音声認識結果を前記電子機器に応答する認証・認識装置であり、前記制御手段は、前記電子機器の外部機器用接続部を介して前記認証・認識装置から送信された認証結果及び音声認識結果を受信すると、この認証結果及び音声認識結果を前記電子機器の表示部に表示させることにより、電子機器のユーザーは、応答結果を見ながら音声入力を行うことができ、その応答レスポンスも高速化でき、使い勝手の良い音声入力環境を提供できる。
【0019】
また、請求項5に記載する発明のように、請求項1〜4の何れか一項に記載の音声入力装置において、無線通信機能を備えた被制御機器との間で通信手順を実行する無線通信手段と、前記特徴量抽出手段により抽出された音声特徴量に基づいて入力された音声内容を認識して音声認識情報を出力する音声認識手段と、を備え、前記音声入力手段は、前記利用者の被制御機器に対する指示音声を入力し、前記特徴量抽出手段は、前記音声入力手段により入力された指示音声から指示音声特徴量を抽出し、前記音声認識手段は、前記特徴量抽出手段により抽出された指示音声特徴量に基づいて入力された指示音声内容を認識して指示情報を出力し、前記変換手段は、前記音声認識手段から出力された指示情報を前記被制御機器の無線通信機能に対応する情報形態に変換して送信情報として出力し、前記制御手段は、前記無線通信手段を制御して、前記変換手段から出力された送信情報を前記被制御機器に送信させるようにしてもよい。
【0020】
請求項5記載の発明によれば、無線通信機能を備えた被制御機器との間で通信手順を実行する無線通信手段と、前記特徴量抽出手段により抽出された音声特徴量に基づいて入力された音声内容を認識して音声認識情報を出力する音声認識手段と、を備え、前記音声入力手段は、前記利用者の被制御機器に対する指示音声を入力し、前記特徴量抽出手投は、前記音声入力手段により入力された指示音声から指示音声特徴量を抽出し、前記音声認識手段は、前記特徴量抽出手段により抽出された指示音声特徴量に基づいて入力された指示音声内容を認識して指示情報を出力し、前記変換手段は、前記音声認識手段から出力された指示情報を前記被制御機器の無線通信機能に対応する情報形態に変換して送信情報として出力し、前記制御手段は、前記無線通信手段を制御して、前記変換手段から出力された送信情報を前記被制御機器に送信させることにより、音声入力装置の利用形態を拡大でき、その利便性を向上できる。
【0021】
【発明の実施の形態】
以下、図を参照して本発明の実施の形態を詳細に説明する。
図1〜図5は、本発明を適用した音声認識システムの一実施の形態を示す図である。
まず、構成を説明する。
図1は、本実施の形態における音声認識システム100全体の概略構成を示す図である。この音声認識システム100は、アプリケーションサーバ10、認証・認識サーバ20、無線基地局30、携帯電話機40、音声入力ユニット50及び被制御機器60により構成され、認証・認識サーバ20、無線基地局30及び被制御機器60は、通信ネットワークNに接続されている。
【0022】
通信ネットワークNは、公衆電話回線網、ISDN網、インターネット、LAN(Local Area Network)又はWAN(Wide Area Network)等を含んで構成される。音声認識システム100では、無線基地局30は公衆電話回線網に接続され 認証・認識サーバ20はLAN又はWANに接続されるものとする。
【0023】
また、通信ネットワークNは、LAN又はWANと、公衆電話回線網、ISDN網及びインターネットとの間に、セキュリティ機能を搭載したネットワーク・サーバ等が接続されており、認証・認識サーバ20に対するハツキング行為や違法メールなどが送信されないように構成されているものとする。
【0024】
アプリケーションサーバ10は、予め登録された携帯電話機40のユーザーに対して、各種アプリケーションサービスを提供するためのサーバであり、携帯電話機40から送信されるアプリケーションサービスの要求内容に応じて、携帯電話機40で実行可能なアプリケーションプログラムを、認証・認識サーバ20、通信ネットワークN及び無線基地局30を介して携帯電話機40に送信する。
【0025】
認証・認識サーバ20は、携帯電話機40から送信される圧縮データからユーザーの音声特徴量及び生体特徴量を抽出し、その音声特徴量及び生体特徴量により当該ユーザーを認証するとともに、その音声特徴量により音声内容を認識し、その認証結果及び音声認識結果を応答情報として通信ネットワークN及び無線基地局30を介して携帯電話機40に送信する。
【0026】
また、認証・認識サーバ20は、携帯電話機40のユーザーを認証した後、携帯電話機40から送信されるアプリケーションに関する要求内容を含む音声特徴量を認識し、その音声認識結果に基づくアプリケーション要求指示をアプリケーションサーバ10に送信し、そのアプリケーション要求指示に応じてアプリケーションサーバ10から応答送信されるアプリケーションプログラムを通信ネットワークN及び無線基地局30を介して携帯電話機40に送信する。
なお、認証・認識サーバ20は、請求項に記載の外部の音声認識装置に相当する。
【0027】
無線基地局30は、自己の設置場所から通信可能範囲に存在する携帯電話機40から音声通話要求先の電話番号を受信すると、ネットワークNを介して接続された電話交換機(図示せず)に送信して、携帯電話機40と音声通話要求先の携帯電話機あるいは宅内固定電話機との間で音声通話処理に必要な通信プロトコルを実行する。
【0028】
また、無線基地局30は、自己の設置場所から通信可能範囲に存在する携帯電話機40からアプリケーションサービス要求を受信すると、ネットワークNを介して携帯電話機40の識別情報を認証・認識サーバ20に送信して、携帯電話機40と認証・認識サーバ20及びアプリケーションサーバ10との間でアプリケーションサービスに必要な通信プロトコルを実行する。
【0029】
携帯電話機40は、通常の音声通話機能と、アプリケーションサーバ10がネットワークNを介してインターネット上で開設するアプリケーションサービス用ホームページにアクセスするインターネットアクセス機能とを備える。
【0030】
また、携帯電話機40は、図2に示すように、外部機器と接続する外部機器接続部401、テンキーや各種機能キーを含むキー入力部402及びLCDにより構成された表示部403を備える。本実施の形態では、外部機器接続部401に音声入力ユニット50が接続される。なお、携帯電話機40の通信方式は、PDC方式、CDMA方式、GSM方式あるいはPHS方式などで利用される従来の携帯電話機である。なお、携帯電話機40は、請求項に記載の電子機器に相当する。
【0031】
音声入力ユニット50は、図2に示すように、携帯電話機40の外部機器接続部401に接続可能な携帯電話接続部509を備えており、携帯電話機40に外付けすることにより、主に入力音声の音声認識機能を追加するものである。また、音声入力ユニット50は、携帯電話機40に接続されない場合、指示音声を指示信号として外部機器通信部508により被制御機器60に無線送信して、被制御機器60をリモート操作するリモコンユニットとしての機能も有する。
【0032】
音声入力ユニット50は、その内部の機能的構成を図3に示すように、音声入力部501、生体センサ部502、A/D変換部503、特徴量抽出部504、音声認識部505、データ圧縮部506、携帯電話制御部507、外部機器通信部508及び携帯電話接続部509により構成される。
【0033】
音声入力部501は、収音指向性が狭く、音声認識に必要な収音周波数帯域を持つマイクを有し、ユーザーが発声する音声を収音し、アナログ音声信号としてA/D変換部503に出力する。なお、音声入力部501は、請求項に記載の音声入力手段としての機能を有する。
【0034】
生体センサ部502は、ユーザーの指紋、顔、又はアイリス等の生体特徴を検出する生体センサを有し、ユーザーの指紋、顔、又はアイリス等の生体特徴を検出し、その生体特徴量をデータ圧縮部506に出力する。なお、生体センサ部502は、請求項に記載の生体特徴検出手段としての機能を有する。
【0035】
A/D変換部503は、音声入力部501から入力されたアナログ音声信号を所定のサンプリング周波数でサンプリングし、そのサンプリングしたアナログ音声信号を所定の量子化数でデジタル変換してデジタル音声データとして特徴量抽出部504に出力する。
【0036】
特徴量抽出部504は、A/D変換部503から入力されたデジタル音声データから音声認識に必要な音声特徴量を抽出し、その音声特徴量を音声認識部505及びデータ圧縮部506に出力する。なお、特徴量抽出部504は、請求項に記載の特徴量抽出手段としての機能を有する。
【0037】
音声認識部505は、音声入力ユニット50が携帯電話機40に接続されていない場合に動作し、特徴量抽出部504から入力された指示音声特徴量から指示音声内容を認識し、その指示情報をデータ圧縮部506に出力する。なお、音声認識部505は、請求項に記載の音声認識手段としての機能を有する。
【0038】
データ圧縮部506は、特徴量抽出部504から入力された音声特徴量と、生体センサ部502から入力された生体特徴量とを携帯電話機40のデータ通信方式に適したデータ圧縮方式で圧縮し、また、音声認識部505から入力された指示情報を外部機器通信部508の通信方式に適したデータ圧縮方式で圧縮し、各圧縮データ(送信情報)を携帯電話制御部507に出力する。なお、データ圧縮部506は、請求項に記載の変換手段としての機能を有する。
【0039】
携帯電話制御部507は、音声入力ユニット50が携帯電話機40に接続されていた場合、データ圧縮部506から入力された圧縮データを携帯電話接続部509を介して携帯電話機40のデータ通信機能を制御して、認証・認識サーバ20に送信させる。そして、携帯電話制御部507は、送信した圧縮データに対する認証・認識サーバ20の応答信号(認証結果、音声認識結果、コンテンツ等)を携帯電話機40から携帯電話接続部509を介して受信すると、携帯電話機40の表示部403を制御して受信内容を表示させる。
【0040】
また、携帯電話制御部507は、音声入力ユニット50が携帯電話機40に接続されていない場合、データ圧縮部506から入力された圧縮データを被制御機器60を制御する制御信号として外部機器通信部508に出力し、外部機器通信部508を制御して制御信号を被制御機器60に送信させる。なお、携帯電話制御部507は、請求項に記載の制御手段としての機能を有する。
【0041】
外部機器通信部508は、IrDA(Infrared Data Association)、無線LAN、又はブルートゥース(Bluetooth)等の被制御機器60に対応した無線通信機能を有し、携帯電話制御部507から入力された制御信号を被制御機器60に無線送信する。なお、外部機器通信部508は、請求項に記載の無線通信手段としての機能を有する。電池部510は、充電可能な蓄電池と、音声入力ユニット50内の各部に必要な駆動電圧を生成する電圧生成回路とを内蔵し、その生成した駆動電圧を音声入力ユニット50内の各部に供給する。
【0042】
被制御機器60は、IrDA(Infrared Data Association)、無線LAN、又はブルートゥース(BIuetooth)等の無線通信機能と、通信ネットワークNに接続する有線通信機能とを有する家電製品等であり、音声入力ユニット50から無線送信される圧縮データを受信して、その圧縮データに含まれる指示情報に応じた動作を行うとともに、通信ネットワークNを介して認証・認識サーバ20から送信される指示信号を受信して、指示信号に応じた動作を行う。
【0043】
次に、本実施の形態の動作を説明する。
まず、音声認識システム100を携帯電話機40のユーザーが利用する際の前提としてユーザー認証のための音声特徴量と生体特徴量の登録が必要であり、音声入力ユニット50を携帯電話機40に接続し、ユーザーの音声特徴量情報と生体特徴量情報を認証・認識サーバ20に送信して登録しておくものとする。
【0044】
音声入力ユニット50が携帯電話機40に接続された場合の音声認識システム100の動作について、図4に示すフローチャートを参照して説明する。
音声入力ユニット50が携帯電話機40に接続されている場合、ユーザーの音声(例えば、名前等)が音声入力ユニット50の音声入力部501に向かって発声されると(ステップS101)、音声入力部501により収音されてアナログ音声信号としてA/D変換部503に出力される(ステップS102)。また、この時、生体センサ部502では、ユーザーの指紋、顔、又はアイリス等の生体特徴量が検出され(ステップS201)、その検出された生体特徴量がデータ圧縮部506に出力される(ステップS202)。
【0045】
次いで、A/D変換部503では、音声入力部501から入力されたアナログ音声信号がサンプリングされ、デジタル音声データに変換されて特徴量抽出部504に出力される(ステップS103)。特徴量抽出部504では、A/D変換部503から入力されたデジタル音声データから音声認識に必要な音声特徴量が抽出され、その音声特徴量がデータ圧縮部506に出力される(ステップS104)。
【0046】
データ圧縮部506では、特徴量抽出部504から入力された音声特徴量及び生体センサ部502から入力された生体特徴量が携帯電話機40のデータ通信方式に適したデータ圧縮方式で圧縮され、その圧縮データが携帯電話制御部507に出力される(ステップS105)。携帯電話制御部507では、データ圧縮部506から圧縮データが入力されると、携帯電話接続部509を介して携帯電話機40のデータ通信機能が制御されて、その圧縮データが無線基地局30及び通信ネットワークNを介して認証・認識サーバ20に送信される(ステップS106)。
【0047】
認証・認識サーバ20では、携帯電話機40から受信した圧縮データが伸長されて音声特徴量と生体特徴量が抽出され、この音声特徴量及び生体特徴量が、予め登録された該当ユーザーの音声特徴量及び生体特徴量と照合されて携帯電話機40のユーザー認証が行われるとともに、音声特徴量に基づいて音声認識が行われ、その認証結果及び音声認識結果が通信ネットワークN及び無線基地局30を介して携帯電話機に送信される。
【0048】
携帯電話制御部507では、認証・認識サーバ20から送信された認証結果及び音声認識結果が携帯電話機40により受信されると、携帯電話接続部509を介して携帯電話機40の表示部403が制御されて受信内容が表示される(ステップS107)。
【0049】
また、認証・認識サーバ20では、音声認識した音声内容にアプリケーションサーバ10へのサービス要求が含まていれるか否かが判別され、アプリケーションサーバー10へのサービス要求が含まていると、そのサービス要求内容がアプリケーションサーバ10に送信される。
【0050】
アプリケーションサーバ10では、認証・認織サーバ20から送信されたサービス要求内容に応じて、対応するコンテンツデータやアプリケーションプログラムが認証・認識サーバ20に送信される。認証・認識サーバ20では、アプリケ−ションサーバ10から送信されたコンテンツデータやアプリケーションプログラムが通信ネットワークN及び無線基地局30を介して携帯電話機40に送信される。
【0051】
携帯電話制御部507では、認証・認識サーバ20から送信されたコンテンツデータやアプリケーションプログラムが携帯電話機40により受信されると、携帯電話接続部509を介して携帯電話機40のアプリケーション実行部(図示せず)及び表示部403が制御されて、コンテンツや実行中のアプリケーション内容が表示される(ステップS107)。
【0052】
以後、続いて音声入力部501に入力された音声の認識は、音声入力ユニット50、携帯電話機40及び認証・認識サーバ20において実行される上記ステップS101〜ステップS107の処理手順により繰り返し行われ、その音声認識結果に基づく応答内容が携帯電話機40の表示部403に表示される。
【0053】
また、音声入力部501から入力された音声内容が被制御機器60に対する指示音声であった場合、認証・認識サーバ20は、その指示音声内容を認識し、対応する制御信号を通信ネットワークNを介して被制御機器60に制御信号を送信する。
【0054】
したがって、携帯電話機40に音声入力ユニット50を接続することにより、ユーザーは、携帯電話機40の表示部403を自分の正面に向けた状態で、音声入力しながら音声認識結果を表示郡403で確認することができ、携帯電話機40を用いて音声入力に対応するアプリケーションサービスを確実かつ容易に利用することができる。
【0055】
次に、音声入力ユニット50が携帯電話機40に接続されていない場合の音声認識システム100の動作について、図5に示すフローチャートを参照して説明する。
音声入力ユニット50が携帯電話機40に接続されていない場合、ユーザーの指示音声(例えば、電源オン等)が音声入力ユニット50の音声入力部501に向かって発声されると(ステップS301)、音声入力部501により収音されてアナログ指示音声信号としてA/D変換部503に出力される(ステップS302)。
【0056】
次いで、A/D変換部503では、音声入力部501から入力されたアナログ指示音声信号がサンプリングされ、デジタル指示音声データに変換されて特徴量抽出部504に出力される(ステップS303)。特徴量抽出部504では、A/D変換部503から入力されたデジタル指示音声データから音声認識に必要な指示音声特徴量が抽出され、その指示音声特徴量が音声認識部505に出力される(ステップS304)。
【0057】
音声認識部505では、特徴量抽出部504から入力された音声特徴量から指示音声内容が認識され、その指示情報がデータ圧縮部506に出力される(ステップS305)。データ圧縮部506では、音声認識部505から入力された指示情報が外部機器通信部508のデータ通信方式に適したデータ圧縮方式で圧縮されその圧縮データが携帯電話制御部507に出力される(ステップS306)。
携帯電話制御部507では、外部機器通信部508が制御されてデータ圧縮部506から入力された圧縮データが被制御機器60に送信される(ステップS307)。
【0058】
以後、続いて音声入力部501に入力された指示音声の認識は、音声入力ユニット50内において実行される上記ステップS301〜ステップS307の処理手順により繰り返し行われ、その音声認識結果に基づく指示情報が被制御機器60に送信されて、被制御機器60がリモート操作される。
【0059】
以上のように、本実施の形態の音声認識システム100では、従来の携帯電話機40の外部機器接続部401に音声入力ユニット50を接続し、音声入力ユニット50が、ユーザーの音声を収音して音声認識に必要な音声特徴量を抽出し、その音声特徴量を携帯電話機40のデータ通信方式に適した圧縮データに変換し、携帯電話機40のデータ通信機能を制御して認証・認識サーバ20に圧縮データを送信させ、認証・認識サーバ20から送信される音声認識結果を携帯電話機40の表示部403に表示させるようにした。
【0060】
したがって、従来は無線通信端末として最も普及している現行の携帯電話機に対して音声認識機能を実装することができなかったが、本実施の形態の音声入力ユニット50を現行の携帯電話機に接続することにより、現行の携帯電話機にも音声認識機能を付加することができ、従来の携帯電話機ユーザーに対して音声認識サービスを提供できる。
【0061】
このため、既存の携帯電話機ユーザーに対して、DSR方式の音声認識機能を普及させることが容易になり、携帯電話機ユーザーにとって最も簡便な入力環境の提供と、サービス提供者にとっても優位な音声認識サービスの普及を促進することができる。
【0062】
また、従来のDSR方式の音声認識サービスでは、センター設備が音声認識した後、応答を音声で携帯電話機に返すようにしていたが、本実施の形態の音声認識システム100では、入力音声を携帯電話機40のデータ通信方式に適した圧縮データに変換して認証・認識サーバ20に送信し、認証・認識サーバ20から送信される音声認識結果を携帯電話機40の表示部403に表示させるようにしたため、携帯電話機ユーザーは、音声認識結果及び応答内容を見ながら音声入力を継続することができ、その応答レスポンスも高速化でき、使い勝手の良い音声入力環境を提供できる。その結果、無駄な音声データの授受を無くして、通信ネットワークの利用効率を向上させるとともに通信コストも抑えることができる。
【0063】
また、本実施の形態の音声認識システム100では、現行の携帯電話機の通信方式のみを利用して音声認識サービス及びアプリケーションサービスを提供できるため、従来のように、インターネットから提供されるサービスと音声認識サービスとを利用する場合、データと音声を別々のネットワーク(インターネットと電話回線)で授受する必要が無くなり、通信コストを更に抑えることができる。
【0064】
更に、本実施の形態の音声入力ユニット50では、指向性の良いマイクなどを搭載した音声入力部501としたため、従来の携帯電話機に内蔵されたマイクを利用する場合に比べて、ユーザーが発声する音声の周波数帯域を十分カバーして確実に収音することができる。
【0065】
また、本実施の形態の音声入力ユニット50では、音声認識部505と被制御機器60に搭載された無線通信機能に対応した外部機器通信部508とを有するため、音声入力ユニット50が携帯電話機40に接続されず単体の場合は、指示音声を入力して被制御機器60をリモート操作することもでき、音声入力ユニット50の利用形態を拡大でき、利便性を向上できる。
【0066】
また、本実施の形態の音声入力ユニット50では、ユーザーの指紋、顔又はアイリス等の生体特徴量を検出する生体センサ部502を有し、検出された生体特徴量も認証・認識サーバ20に送信し、音声特徴量及び生体特徴量をユーザー認証時に利用するようにしたため、正規登録ユーザーか否かの認証を確実に行うことができ、音声特徴と生体特徴とを組み合わせたユーザー認証サービスを容易に提供できる。その結果、音声認識サービス及びアプリケーションサービスの不正使用を防止できる。
【0067】
なお、上記実施の形態では、音声入力ユニット50を携帯電話機40に接続するものとして説明したが、例えば、無線通信機能を備えた携帯型情報端末の外部機器接続部の仕様に合わせるようにしても良い。
【0068】
【発明の効果】
請求項1、2記載の発明によれば、既存の無線通信機能及び外部機器用接続部を備えた電子機器に音声認識機能を付加することができ、既存の電子機器のユーザーに対して音声入力環境を容易に提供できる。
【0069】
請求項3記載の発明によれば、音声認識に必要な音声特徴量のみを効率よく送信でき、無線通信資源を有効利用して音声認識にかかる通信コストを低減できるとともに、音声特徴と生体特徴とを組み合わせたユーザー認証サービスも容易に提供できる。
【0070】
請求項4記載の発明によれば、電子機器のユーザーは、応答結果を見ながら音声入力を行うことができ、その応答レスポンスも高速化でき、使い勝手の良い音声入力環境を提供できる。
【0071】
請求項5記載の発明によれば、音声入力装置の利用形態を拡大でき、その利便性を向上できる。
【図面の簡単な説明】
【図1】本発明を適用した一実施の形態における音声認識システム100の全体構成を示す図である。
【図2】本実施の形態における携帯電話機40と音声入力ユニット50の外観を示す図である。
【図3】図2の音声入力ユニット50内部の機能的構成を示すブロック図である。
【図4】図2の音声入力ユニット50が携帯電話機40に接続された場合に、音声入力ユニット50により実行される動作内容を示すフローチャートである。
【図5】図2の音声入力ユニット50が携帯電話機40に接続されない場合に、音声入力ユニット50により実行される動作内容を示すフローチャートである。
【符号の説明】
10 アプリケーションサーバ
20 認証・認識サーバ
30 無線基地局
40 携帯電話機
50 音声入力ユニット
60 被制御機器
100 音声認識システム
401 外部機器接続部
402 キー入力部
403 表示部
501 音声入力部
502 生体センサ部
503 A/D変換部
504 特徴量抽出部
505 音声認識部
506 データ圧縮部
507 携帯電話制御部
508 外部機器通信部
509 携帯電話接続部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice input device used by being externally connected to an electronic device having a wireless communication function.
[0002]
[Prior art]
Conventionally, when a wireless communication terminal such as a mobile phone is used as a voice input device and a voice recognition function is provided in the center facility to perform voice recognition processing and authentication processing, voice is transmitted from the wireless communication terminal to the center facility. In the course of communication processing, the voice quality deteriorates, and it has been difficult to increase the voice recognition rate and the authentication rate.
[0003]
For example, when a mobile phone is used as a voice input device, the voice quality is degraded due to the limitation of the frequency bandwidth of the telephone line, and compared with a case where voice is input from a microphone connected to a personal computer on which voice recognition software is installed. As a result, the voice quality is remarkably deteriorated, which is one of the causes of lowering the voice recognition rate.
[0004]
A DSR (Distributed Speech Recognition) method has been proposed as a method of preventing sound quality deterioration due to such communication. This DSR method separates a sound processing part at a preceding stage and a sound recognition processing part at a later stage in the sound recognition processing, and assigns the sound processing part to the sound input device side, and the sound recognition processing part to the center facility side. The part is assigned, the input voice is processed into data that does not deteriorate in the communication processing, and then transmitted to the center facility.
[0005]
As a method of mounting the sound processing function corresponding to the DSR method in a wireless communication terminal, 1) mounting it as a software on a personal computer or a portable information terminal, 2) converting it into an LSI (Large Scale Integrated Circuit) and mounting it on the wireless communication terminal. , Has been realized.
[0006]
[Problems to be solved by the invention]
However, the conventional method of mounting the sound processing function corresponding to the DSR method on a wireless communication terminal cannot be mounted on a current mobile phone that is most widely used as a wireless communication terminal, and is not compatible with the DSR method. We have to wait for a new mobile phone incorporating an LSI.
[0007]
In this case, it is difficult to disseminate the DSR-based voice recognition function to existing mobile phone users, providing the simplest input environment for mobile phone users and providing a voice recognition service that is superior to service providers. It will delay its spread.
[0008]
Also, in the conventional DSR-based voice recognition service, after the center facility performs voice recognition, a response is returned to the mobile phone by voice, so that the amount of data to be returned is large, but the actual information amount is small. There has been a problem that useless transmission and reception of voice data increases, which reduces the use efficiency of telephone lines and increases communication costs.
[0009]
In recent years, mobile phones with an Internet connection function have become widespread, but when using services provided from the Internet and voice recognition services, data and voice must be stored on separate networks (Internet and telephone lines). In such a case, communication costs increase.
[0010]
Furthermore, even when a DSR-compatible LSI is incorporated in a mobile phone, the microphone built into the mobile phone is used, and the microphone is originally mounted for a telephone line whose frequency band is limited. A microphone for voice recognition has an insufficient sound-collecting frequency band, and there is a large individual difference in performance. Therefore, it is difficult to collect input sound in a frequency band necessary for speech recognition.
[0011]
An object of the present invention is to provide a voice input device that is externally provided to an electronic device having a wireless communication function and has a feature extraction function of an input voice necessary for voice recognition and a communication control function that efficiently uses a communication line. To provide.
[0012]
[Means for Solving the Problems]
In order to solve the above problems, the invention according to claim 1 is:
An audio input device connected to the external device connection portion of an electronic device having a wireless communication function and an external device connection portion,
Voice input means for inputting a user's voice,
A feature amount extracting unit that extracts a voice feature amount from the voice input by the voice input unit,
A conversion unit that converts the audio feature amount extracted by the feature amount extraction unit into an information form corresponding to a wireless communication function of the electronic device and outputs the information form as transmission information;
A control unit that controls a wireless communication function of the electronic device via the external device connection unit of the electronic device, and transmits transmission information output from the conversion unit to the external voice recognition device from the electronic device.
It is characterized by having.
[0013]
According to the first aspect of the present invention,
An audio input device connected to the external device connection unit of an electronic device having a wireless communication function and an external device connection unit, wherein the feature amount extraction unit is configured to detect a user's voice input by the audio input unit. The voice feature amount is extracted, the voice feature amount extracted by the feature amount extraction unit is converted by a conversion unit into an information form corresponding to a wireless communication function of the electronic device, and output as transmission information. The wireless communication function of the electronic device is controlled via the external device connection unit of the electronic device, and the transmission information output from the conversion unit is transmitted from the electronic device to an external voice recognition device.
[0014]
Therefore, a voice recognition function can be added to an existing electronic device having a wireless communication function and an external device connection unit, and a voice input environment can be easily provided to a user of the existing electronic device. As described in claim 2, the voice input device of the present invention can be integrally formed with an electronic device having a wireless communication function and a connection portion for an external device.
[0015]
According to a third aspect of the present invention, there is provided the voice input device according to the first or second aspect, further comprising: a biometric feature detecting means for detecting a biometric feature amount of the user; The biological feature amount detected by the feature detection unit and the extracted voice feature amount may be converted into an information form corresponding to a wireless communication function of the electronic device and output as transmission information.
[0016]
According to the invention described in claim 3,
A biometric feature detection unit configured to detect a biometric feature of the user, wherein the conversion unit converts the biometric feature amount detected by the biometric feature detection unit and the extracted voice feature amount into a wireless communication function of the electronic device. By converting to the corresponding information form and outputting it as transmission information, only the speech features necessary for speech recognition can be transmitted efficiently, and the communication cost for speech recognition can be reduced by effectively utilizing wireless communication resources. A user authentication service combining voice features and biometric features can be easily provided.
[0017]
According to a fourth aspect of the present invention, in the voice input device according to the first to third aspects, the electronic device includes a display unit that displays wireless communication contents with the external voice recognition device. The voice recognition device authenticates the user based on voice features and biometric features included in the transmission information, recognizes voice content, and authenticates the authentication result and the voice recognition result to the electronic device. -Having a recognition function, the control means, upon receiving the authentication result and the voice recognition result transmitted from the voice recognition device via the external device connection unit of the electronic device, the control unit converts the authentication result and the voice recognition result You may make it display on the display part of the said electronic device.
[0018]
According to the invention described in claim 4,
The electronic device includes a display unit that displays the content of wireless communication with the external voice recognition device, the external voice recognition device, the external voice recognition device according to the voice feature and biometric feature included in the transmission information An authentication / recognition device that authenticates a user and recognizes voice content, and responds to the electronic device with the authentication result and the voice recognition result, wherein the control unit is connected to an external device connection unit of the electronic device. Upon receiving the authentication result and the voice recognition result transmitted from the authentication / recognition device, by displaying the authentication result and the voice recognition result on the display unit of the electronic device, the user of the electronic device can view the response result. Voice input can be performed, the response response can be speeded up, and a user-friendly voice input environment can be provided.
[0019]
According to a fifth aspect of the present invention, in the voice input device according to any one of the first to fourth aspects, the wireless input device executes a communication procedure with a controlled device having a wireless communication function. Communication means, and speech recognition means for recognizing the input speech content based on the speech feature quantity extracted by the feature quantity extraction means and outputting speech recognition information, wherein the speech input means comprises Inputting a command voice to a controlled device of the user, the feature amount extracting unit extracts a command voice feature amount from the command voice input by the voice input unit, and the voice recognition unit uses the feature amount extracting unit. Recognizing the instruction voice content input based on the extracted instruction voice feature amount and outputting the instruction information, the conversion unit converts the instruction information output from the voice recognition unit into a wireless communication function of the controlled device. To Is converted into information form output as transmission information to said control means, said controls the wireless communication unit, the transmission information outputted from the converting means may be caused to transmit the to the controlled apparatus.
[0020]
According to the fifth aspect of the present invention, a wireless communication unit that executes a communication procedure with a controlled device having a wireless communication function, and an input based on the audio feature amount extracted by the feature amount extraction unit. Voice recognition means for recognizing the voice content and outputting voice recognition information, wherein the voice input means inputs an instruction voice to the controlled device of the user, and The instruction voice feature amount is extracted from the instruction voice input by the voice input unit, and the voice recognition unit recognizes the input instruction voice content based on the instruction voice feature amount extracted by the feature amount extraction unit. Outputting instruction information, the conversion means converts the instruction information output from the voice recognition means into an information form corresponding to a wireless communication function of the controlled device, and outputs the information form as transmission information, and the control means, Previous It controls the wireless communication unit, by transmitting the transmission information outputted from said conversion means to the controlled device, can expand the usage of the voice input device can improve its convenience.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
1 to 5 are diagrams showing an embodiment of a speech recognition system to which the present invention is applied.
First, the configuration will be described.
FIG. 1 is a diagram showing a schematic configuration of the entire
[0022]
The communication network N includes a public telephone line network, an ISDN network, the Internet, a LAN (Local Area Network), a WAN (Wide Area Network), and the like. In the
[0023]
In the communication network N, a network server or the like equipped with a security function is connected between the LAN or WAN and a public telephone line network, an ISDN network, and the Internet. It is assumed that the system is configured not to send illegal e-mails.
[0024]
The
[0025]
The authentication /
[0026]
After authenticating the user of the
Note that the authentication /
[0027]
When receiving the telephone number of the voice call request destination from the
[0028]
Further, upon receiving an application service request from the
[0029]
The
[0030]
Further, as shown in FIG. 2, the
[0031]
As shown in FIG. 2, the
[0032]
As shown in FIG. 3, the
[0033]
The voice input unit 501 has a microphone with a narrow sound collection directivity and a sound collection frequency band necessary for voice recognition, collects a voice uttered by a user, and sends the voice to the A /
[0034]
The
[0035]
The A /
[0036]
The
[0037]
The
[0038]
The
[0039]
When the
[0040]
In addition, when the
[0041]
The external
[0042]
The controlled device 60 is a home appliance or the like having a wireless communication function such as IrDA (Infrared Data Association), wireless LAN, or Bluetooth (Bluetooth), and a wired communication function for connecting to the communication network N. Receiving the compressed data wirelessly transmitted from the server, performing an operation according to the instruction information included in the compressed data, and receiving the instruction signal transmitted from the authentication /
[0043]
Next, the operation of the present embodiment will be described.
First, as a premise when the user of the
[0044]
The operation of the
When the
[0045]
Next, in the A /
[0046]
In the
[0047]
In the authentication /
[0048]
In the mobile
[0049]
Further, the authentication /
[0050]
In the
[0051]
When the mobile
[0052]
Thereafter, the recognition of the voice input to the voice input unit 501 is repeatedly performed according to the processing procedure of steps S101 to S107 executed in the
[0053]
When the voice content input from the voice input unit 501 is the instruction voice for the controlled device 60, the authentication /
[0054]
Therefore, by connecting the
[0055]
Next, an operation of the
When the
[0056]
Next, in the A /
[0057]
The
In the mobile
[0058]
Thereafter, recognition of the instruction voice input to the voice input unit 501 is repeatedly performed by the processing procedure of the above-described steps S301 to S307 executed in the
[0059]
As described above, in the
[0060]
Therefore, the voice recognition function could not be mounted on the current mobile phone which is most widely used as a wireless communication terminal, but the
[0061]
As a result, it becomes easy to disseminate the DSR type voice recognition function to existing mobile phone users, providing the simplest input environment for mobile phone users and a voice recognition service that is superior to service providers. Can be promoted.
[0062]
Also, in the conventional DSR-based speech recognition service, after the center facility performs speech recognition, a response is returned to the mobile phone by voice. However, in the
[0063]
Further, in the
[0064]
Further, in the
[0065]
Further, since the
[0066]
In addition, the
[0067]
In the above-described embodiment, the
[0068]
【The invention's effect】
According to the first and second aspects of the present invention, a voice recognition function can be added to an existing electronic device having a wireless communication function and a connection unit for an external device, and voice input to a user of the existing electronic device can be performed. Environment can be easily provided.
[0069]
According to the third aspect of the present invention, it is possible to efficiently transmit only the voice feature amount necessary for voice recognition, to reduce the communication cost for voice recognition by effectively using wireless communication resources, and to reduce the voice feature and the biometric feature. Can easily provide a user authentication service.
[0070]
According to the fourth aspect of the present invention, the user of the electronic device can perform a voice input while watching the response result, the response response can be speeded up, and a user-friendly voice input environment can be provided.
[0071]
According to the fifth aspect of the invention, the usage of the voice input device can be expanded, and the convenience can be improved.
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall configuration of a
FIG. 2 is a diagram showing the appearance of a
FIG. 3 is a block diagram showing a functional configuration inside a
FIG. 4 is a flowchart showing an operation performed by the
FIG. 5 is a flowchart showing an operation performed by the
[Explanation of symbols]
10 Application server
20 Authentication / recognition server
30 wireless base stations
40 mobile phone
50 voice input unit
60 controlled equipment
100 voice recognition system
401 External device connection
402 key input section
403 Display
501 Voice input unit
502 Biological Sensor
503 A / D converter
504 Feature extraction unit
505 Voice Recognition Unit
506 Data compression unit
507 Mobile phone control unit
508 External device communication unit
509 Mobile phone connection
Claims (5)
利用者の音声を入力する音声入力手段と、
前記音声入力手段により入力された音声から音声特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段により抽出された音声特徴量を前記電子機器の無線通信機能に対応する情報形態に変換して送信情報として出力する変換手段と、
前記電子機器の外部機器用接続部を介して当該電子機器の無線通信機能を制御し、前記変換手段から出力された送信情報を当該電子機器から外部の音声認識装置に送信させる制御手段と、
を備えたことを特徴とする音声入力装置。An audio input device connected to the external device connection portion of an electronic device having a wireless communication function and an external device connection portion,
Voice input means for inputting a user's voice,
A feature amount extracting unit that extracts a voice feature amount from the voice input by the voice input unit,
A conversion unit that converts the audio feature amount extracted by the feature amount extraction unit into an information form corresponding to a wireless communication function of the electronic device and outputs the information form as transmission information;
A control unit that controls a wireless communication function of the electronic device via the external device connection unit of the electronic device, and transmits transmission information output from the conversion unit to the external voice recognition device from the electronic device.
A voice input device comprising:
前記音声認識装置は、前記送信情報に含まれた音声特徴量及び生体特徴量により前記利用者を認証するとともに音声内容を認識し、その認証結果及び音声認識結果を前記電子機器に応答する認証・認識機能を有し、
前記制御手段は、前記電子機器の外部機器用接続部を介して前記音声認識装置から送信された認証結果及び音声認識結果を受信すると、この認証結果及び音声認識結果を前記電子機器の表示部に表示させることを特徴とする請求項1〜3記載の音声入力装置。The electronic device includes a display unit that displays wireless communication content between the external voice recognition device,
The voice recognition device authenticates the user based on a voice feature and a biometric feature included in the transmission information, recognizes voice content, and authenticates the authentication result and the voice recognition result to the electronic device. Has a recognition function,
Upon receiving the authentication result and the voice recognition result transmitted from the voice recognition device via the external device connection unit of the electronic device, the control unit displays the authentication result and the voice recognition result on a display unit of the electronic device. The voice input device according to claim 1, wherein the voice input device is displayed.
前記特徴量抽出手段により抽出された音声特徴量に基づいて入力された音声内容を認識して音声認識情報を出力する音声認識手段と、を備え、
前記音声入力手段は、前記利用者の被制御機器に対する指示音声を入力し、
前記特徴量抽出手段は、前記音声入力手段により入力された指示音声から指示音声特徴量を抽出し、
前記音声認識手段は、前記特徴量抽出手段により抽出された指示音声特徴量に基づいて入力された指示音声内容を認識して指示情報を出力し、
前記変換手段は、前記音声認識手段から出力された指示情報を前記被制御機器の無線通信機能に対応する情報形態に変換して送信情報として出力し、
前記制御手段は、前記無線通信手段を制御して、前記変換手段から出力された送信情報を前記被制御機器に送信させることを特徴とする請求項1〜4の何れか一項に記載の音声入力装置。Wireless communication means for executing a communication procedure with a controlled device having a wireless communication function,
Speech recognition means for recognizing the input speech content based on the speech feature quantity extracted by the feature quantity extraction means and outputting speech recognition information,
The voice input means inputs an instruction voice to the controlled device of the user,
The feature amount extraction means extracts a command voice feature value from a command voice input by the voice input means,
The voice recognition unit outputs the instruction information by recognizing the input instruction voice content based on the instruction voice feature amount extracted by the feature amount extraction unit,
The conversion unit converts the instruction information output from the voice recognition unit to an information format corresponding to a wireless communication function of the controlled device, and outputs the information as transmission information.
The voice according to any one of claims 1 to 4, wherein the control unit controls the wireless communication unit to transmit transmission information output from the conversion unit to the controlled device. Input device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003129795A JP2004104757A (en) | 2002-07-16 | 2003-05-08 | Voice input device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002206715 | 2002-07-16 | ||
JP2003129795A JP2004104757A (en) | 2002-07-16 | 2003-05-08 | Voice input device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006010900A Division JP2006203900A (en) | 2002-07-16 | 2006-01-19 | Voice recognition server and voice recognition system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004104757A true JP2004104757A (en) | 2004-04-02 |
Family
ID=32300240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003129795A Pending JP2004104757A (en) | 2002-07-16 | 2003-05-08 | Voice input device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004104757A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006350090A (en) * | 2005-06-17 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | Client/server speech recognizing method, speech recognizing method of server computer, speech feature quantity extracting/transmitting method, and system and device using these methods, and program and recording medium |
JP2008154203A (en) * | 2006-11-22 | 2008-07-03 | Fuji Xerox Co Ltd | Print medium processing system, printing apparatus, information processing apparatus, and program |
JP2009300537A (en) * | 2008-06-10 | 2009-12-24 | Fujitsu Ten Ltd | Speech actuation system, speech actuation method and in-vehicle device |
US8705081B2 (en) | 2006-11-22 | 2014-04-22 | Fuji Xerox Co., Ltd. | System and method for including input method information on a printed document |
WO2014103035A1 (en) * | 2012-12-28 | 2014-07-03 | 株式会社レイトロン | Voice recognition device |
KR20190079922A (en) * | 2017-12-28 | 2019-07-08 | 삼성전자주식회사 | Sound output system and speech processing method |
US10666995B2 (en) | 2015-10-19 | 2020-05-26 | Sony Corporation | Information processing apparatus, information processing system, and program |
JPWO2019013349A1 (en) * | 2017-07-14 | 2020-08-27 | ダイキン工業株式会社 | Air conditioners, air conditioning systems, communication systems, control systems, equipment control systems, equipment management systems, and sound information analysis systems |
-
2003
- 2003-05-08 JP JP2003129795A patent/JP2004104757A/en active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006350090A (en) * | 2005-06-17 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | Client/server speech recognizing method, speech recognizing method of server computer, speech feature quantity extracting/transmitting method, and system and device using these methods, and program and recording medium |
JP4603429B2 (en) * | 2005-06-17 | 2010-12-22 | 日本電信電話株式会社 | Client / server speech recognition method, speech recognition method in server computer, speech feature extraction / transmission method, system, apparatus, program, and recording medium using these methods |
JP2008154203A (en) * | 2006-11-22 | 2008-07-03 | Fuji Xerox Co Ltd | Print medium processing system, printing apparatus, information processing apparatus, and program |
US8705081B2 (en) | 2006-11-22 | 2014-04-22 | Fuji Xerox Co., Ltd. | System and method for including input method information on a printed document |
JP2009300537A (en) * | 2008-06-10 | 2009-12-24 | Fujitsu Ten Ltd | Speech actuation system, speech actuation method and in-vehicle device |
CN104871241A (en) * | 2012-12-28 | 2015-08-26 | 株式会社雷特龙 | Voice recognition device |
WO2014103035A1 (en) * | 2012-12-28 | 2014-07-03 | 株式会社レイトロン | Voice recognition device |
JPWO2014103035A1 (en) * | 2012-12-28 | 2017-01-12 | 株式会社レイトロン | Speech recognition device |
US10666995B2 (en) | 2015-10-19 | 2020-05-26 | Sony Corporation | Information processing apparatus, information processing system, and program |
US11081136B2 (en) | 2015-10-19 | 2021-08-03 | Sony Corporation | Information processing apparatus, information processing system, and program |
JPWO2019013349A1 (en) * | 2017-07-14 | 2020-08-27 | ダイキン工業株式会社 | Air conditioners, air conditioning systems, communication systems, control systems, equipment control systems, equipment management systems, and sound information analysis systems |
JP2022058502A (en) * | 2017-07-14 | 2022-04-12 | ダイキン工業株式会社 | Air conditioning system |
JP7060812B2 (en) | 2017-07-14 | 2022-04-27 | ダイキン工業株式会社 | Air conditioner, air conditioning system, communication system, control system, equipment control system, equipment management system and sound information analysis system |
KR20190079922A (en) * | 2017-12-28 | 2019-07-08 | 삼성전자주식회사 | Sound output system and speech processing method |
KR102446637B1 (en) | 2017-12-28 | 2022-09-23 | 삼성전자주식회사 | Sound output system and speech processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4447045B2 (en) | Mobile communication terminal providing integrated management function of character message and method thereof | |
US20020077831A1 (en) | Data input/output method and system without being notified | |
CN108540655B (en) | Caller identification processing method and mobile terminal | |
JP2006203900A (en) | Voice recognition server and voice recognition system | |
US20080222551A1 (en) | Information processing apparatus | |
US20030051083A1 (en) | Wireless companion device that provides non-native function to an electronic device | |
JP2008544629A (en) | Mobile communication terminal and method for providing a hyperlink function to a telephone number included in a text message | |
CN102170617A (en) | Mobile terminal and remote control method thereof | |
CN201629037U (en) | Remote controller | |
US20050210064A1 (en) | Mobile terminal and method for remote control of a home gateway using same | |
EP1659767A1 (en) | System and method for offering wireless internet services | |
CN105677290A (en) | Voice application program control method and client side | |
KR20080036697A (en) | Method and apparatus for remote control in portable terminal | |
JP2004104757A (en) | Voice input device | |
KR20110051385A (en) | Communication terminal and method for communicating thereof | |
WO2005120016A1 (en) | Telephone apparatus | |
US20020082057A1 (en) | System and method for utilizing mobile conmunication terminal as wireless headset | |
CN107682360B (en) | Voice call processing method and mobile terminal | |
CA2397478A1 (en) | System and method for inputting a web-page input data into a web page by employing a wire/wireless telephone | |
CN109889665B (en) | Volume adjusting method, mobile terminal and storage medium | |
US11056106B2 (en) | Voice interaction system and information processing apparatus | |
CN108399918B (en) | Intelligent device connection method, intelligent device and terminal | |
KR20060038656A (en) | Data transfer method via mobile telecommunication terminal | |
CN111601364B (en) | Method for sending and receiving network identification information and communication equipment | |
JP5391982B2 (en) | Terminal device and power supply control method |