JP2009198554A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2009198554A
JP2009198554A JP2008037178A JP2008037178A JP2009198554A JP 2009198554 A JP2009198554 A JP 2009198554A JP 2008037178 A JP2008037178 A JP 2008037178A JP 2008037178 A JP2008037178 A JP 2008037178A JP 2009198554 A JP2009198554 A JP 2009198554A
Authority
JP
Japan
Prior art keywords
voice
unit
microphone
plug
earphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008037178A
Other languages
English (en)
Inventor
Satoshi Yokomizo
聡 横溝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008037178A priority Critical patent/JP2009198554A/ja
Publication of JP2009198554A publication Critical patent/JP2009198554A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 音声認識を行う機器において、特別なハードウェアを追加することなく操作性の向上を図る。
【解決手段】 音声認識モードに移行するトリガーとして外部マイク・イヤホンの挿入割り込みの検知を用いる。この挿入割り込みを検知して、自動で音声認識モードに移行する。
【選択図】 図1

Description

本発明は、マイクジャックと音声入出力を行う音声入出力制御装置を用いて、音声認識モード切り換えの操作性向上を実現する技術に関する。
現在の電子機器では、ユーザの操作性向上やディスアビリティの観点から、機器操作の音声ガイダンスや音声認識による操作を行うものがある。この音声ガイダンスや音声認識のモードに移行するには音声ボタンなどの押下で行い、またこのときの音声入出力部には、マイク・スピーカセットやハンドセットが用いられてきた。
この音声入出力装置にユーザ独自の外部マイクや外部イヤホンを挿入する際に、操作性向上の観点から複数の音声制御装置が提案されている。
例えば特開平10−145884号公報では、ヘッドホンジャックにヘッドホンプラグが挿入された際に音量レベルを調整する手段を設けている。ここでは、ヘッドホンジャックにヘッドホンプラグが挿入された状態であるか否かを検出し、検出結果を出力する検出手段と、入力された音声信号の音量レベルを調整する音量レベル調整手段と、前記ヘッドホーン挿入検出手段の検出結果に基づいて、前記音量レベル調整手段を制御して、出力する音声信号の音量レベルを可変にする制御手段とを具備したことを特徴としている。
また特開平7−38356号公報では、ヘッドホンジャックにプラグが挿入された場合に、音響効果部における設定値を変化させる手段が設けられている。ここでは、音声信号に対して所定の音響効果処理を施すことができる音響効果部と、この音響効果部を介した音声信号を増幅し、一体又は別体のスピーカー部及びヘッドホンジャックへ供給することができる信号増幅部と、ヘッドホンジャックにプラグが挿入されたことを検出するプラグ挿入検出部と、このプラグ挿入検出部から入力される検出信号に基づいて、ヘッドホンジャックにプラグが挿入されたと判別された場合には、音響効果部における設定値を変化させることができる制御手段を備えて音響機器を構成することを特徴としている。
また特開2003−204592号公報では、ヘッドホンプラグが抜かれたときに、設定(音質、音量等)を初期化する手段を設けている。ここでは、オーディオのヘッドホンジャックはヘッドホンプラグの有無を検出する検出手段を備え、ヘッドホンプラグが抜かれたとき検出手段の信号に基づいて入力ソース及び音響処理を初期化することを特徴としている。
また特開2000−196707号公報では、イヤホンマイク着脱で音声発生モード・非発生モードの切り換えを行う手段が提案されている。
特開平10−145884号公報 特開平7−38356号公報 特開2003−204592号公報 特開2000−196707号公報
上記に述べたように、従来技術には外部マイク・イヤホンの挿入をトリガーとして、動的に音量を変更する手段などが提案されているが、音声認識を開始するモードへの移行については述べられていない。音声ガイダンスや音声認識のモードに移行するには音声ボタンの押下などで行うが、このボタン押下に代わる手段を設けることで操作性を向上させる。
上記課題を解決するため本発明の請求項1の音声認識装置は、音声入力を行うマイク部と、音声入力部で得られるアナログ音声をデジタル音声データに変換する音声変換部と、音声変換部で得られる音声データから音声の特徴を抽出して認識・判定する音声認識部を有する装置において、マイクジャックにマイクプラグが挿入されたことを検出する手段と、音声認識を実行するモードに切り換える手段と、前記マイク接続検出手段の結果に基づいて前記音声認識モードを変更する手段を持つことを特徴とする。
また本発明の請求項2の音声認識装置では、請求項1に記載の音声認識装置において、前記マイク検出手段が前記マイクジャックに前記マイクプラグが挿入された状態と挿入されていない状態の状態変化を検出し、検出の結果を出力することを特徴とする。
また本発明の請求項3の音声認識装置では、請求項1に記載の音声認識装置において、前記音声認識モードを変更する手段は、前記マイクジャックに前記マイクプラグが挿入された状態を検出すると、予め定められた前記音声認識モードに移行し、前記マイクジャックから前記マイクプラグが抜かれた状態を検出すると、前記マイクジャックに前記マイクプラグが挿入される直前の音声認識モードに変更する手段を持つことを特徴とする。
また本発明の請求項4の音声認識装置では、音声入力を行うイヤホン部と、音声入力部で得られるアナログ音声をデジタル音声データに変換する音声変換部と、音声変換部で得られる音声データから音声の特徴を抽出して認識・判定する音声認識部を有する装置において、イヤホンジャックにイヤホンプラグが挿入されたことを検出する手段と、音声認識を実行するモードに切り換える手段と、前記イヤホン接続検出手段の結果に基づいて前記音声認識モードを変更する手段を持つことを特徴とする。
また本発明の請求項5の音声認識装置では、請求項4に記載の音声認識装置において、前記イヤホン検出手段は前記イヤホンジャックに前記イヤホンプラグが挿入された状態と挿入されていない状態の状態変化を検出し、検出の結果を出力することを特徴とする。
また本発明の請求項6の音声認識装置では、請求項4に記載の音声認識装置において、前記音声認識モードを変更する手段は前記イヤホンジャックに前記イヤホンプラグが挿入された状態を検出すると、予め定められた前記音声認識モードに移行し、前記イヤホンジャックから前記イヤホンプラグが抜かれた状態を検出すると、前記イヤホンジャックに前記イヤホンプラグが挿入される直前の音声認識モードに変更する手段を持つことを特徴とする。
以上の説明にあるように本発明によれば、マイク・イヤホン接続の検知で音声認識モードに移行することで、特別なハードウェアを追加することなくユーザの操作性を向上させることができる。
次に、本発明の詳細を実施例の記述に従って説明する。
以下、本発明の実施の形態を図面に基づいて詳説する。
図1は本発明に係る電子部品としてのコントローラ部が搭載された画像入出力装置(データ処理装置)の一実施の形態を示すブロック構成図であって、該画像入出力装置1は、LAN(Local Area Network)400にてのホストコンピュータ(本実施の形態では第一、第二のホストコンピュータ3,4)に接続されている。
即ち、上記画像入出力システム(装置)1は、画像データの読取処理を行うリーダ部2と、画像データの出力処理を行うプリンタ部6と、画像データの入出力操作を行うキーボード、及び画像データや各種機能の表示などを行う液晶パネルを備えた操作部7と、制御プログラムや画像データ等が予め書き込まれたハードディスクドライブ8と、ファクシミリの入出力処理を行うFAX部90とを装着し、これら各構成要素に接続されて該構成要素に接続されて該構成要素を制御する単一の電子部品からなるコントローラ部110とから構成されている。
さらにリーダ部2は原稿用紙を搬送する原稿給紙ユニット(部)10と、原稿画像を光学的に読み取って電気信号としての画像データに変換するスキャナ部11とを有し、プリンタ部6は記録用紙を収容する複数段の給紙カセットを備えた給紙ユニット(部)12と画像データを記録用紙に転写、定着するマーキングユニット(部)13と印字された記録用紙にソート処理やステイプル処理を施して、外部に排出する排紙ユニット(部)14とを有している。
図2はモノクロMFP(Multi Function Peripheral:マルチファンクション周辺機器)の構成である。
モノクロMFPは、スキャナ部201、レーザ露光部202、感光ドラム203、作像部204、定着部205、給紙/搬送部206及び、これらを制御する不図示のプリンタ制御部から構成される。
スキャナ部201は、原稿台に置かれた原稿に対して、照明を当てて原稿画像を光学的に読み取り、その像を電気信号に変換して画像データを作成する工程である。
レーザ露光部202は、前記画像データに応じて変調されたレーザ光などの光線を等角速度で回転する回転多面鏡(ポリゴンミラー210)に入射させ、反射走査光として感光ドラム203に照射する。
作像部204は、感光ドラム203を回転駆動し、帯電器によって帯電させ、前記レーザ露光部202によって感光ドラム203上に形成された潜像に対し、トナーによって現像化し、そのトナー像をシートに転写し、その際に転写されずに感光ドラム上に残った微小トナーを回収する、一連の電子写真プロセスを実行する。
定着部205は、ローラやベルトの組み合わせによって構成され、ハロゲンヒータなどの熱源を内蔵し、前記作像部205によってトナー像が転写されたシート上のトナーを、熱と圧力によって溶解、定着させる。
給紙/搬送部206は、シートカセットやペーパーデッキに代表されるシート収納庫を一つ以上持っており、前記プリンタ制御部の指示に応じてシート収納庫に収納された複数のシートの中から一枚分離し、作像部204・定着部205へ搬送する。シートの両面に画像形成する場合は、定着部205を通過したシートを再度作像部へ搬送する搬送経路を通るように制御する。
プリンタ制御部は、MFP全体を制御するMFP制御部と通信して、その指示に応じて制御を実行すると共に、前述のスキャナ201、レーザ露光202、作像204、定着205、給紙/搬送206の各部の状態を管理しながら、全体が調和を保って円滑に動作できるよう指示を行う。
図3はコントローラ部110の詳細を示すブロック図である。
すなわち、メインコントローラ32は、CPU33とバスコントローラ34と後述する各種コントローラ回路を含む機能ブロックとを内蔵すると共に、ROMI/F35を介してROM36と接続され、DRAMI/F37を介してDRAM38と接続され、コーデックI/F39を介してコーデック40と接続され、また、ネットワークI/F41を介してネットワークコントローラ42と接続されている。
ROM36は、メインコントローラ32のCPU33で実行される各種制御プログラムや演算データが格納されている。DRAM38は、CPU33が動作するための作業領域や画像データを蓄積するための領域として使用される。コーデック40はDRAM38に蓄積されたラスターイメージデータをMH/MR/MMR/JBIGなどの周知の圧縮方式で圧縮し、また圧縮されたデータをラスターイメージに伸長する。また、コーデック40にはSRAM43が接続されており、該SRAM43は前記コーデック40の一時的な作業領域として使用される。
ネットワークコントローラ42は、ネットワークコネクタ44を介してLAN2との間で所定の制御動作を行う。
また、前記メインコントローラ32はスキャナバス45を介してスキャナI/F46に接続され、プリンタバス47を介してプリンタI/F48に接続され、さらにPCIバス等の汎用高速バス49を介して拡張ボードを接続するための拡張コネクタ50及び入出力制御部(I/O制御部)51に接続されている。
I/O制御部51はリーダ部2やプリンタ部6との間で制御コマンドを送受信するための調歩同期式のシリアル通信コントローラ52が2チャンネル装備されており、該シリアル通信コントローラ52はI/Oバス53を介してスキャナI/F46及びプリンタI/F48に接続されている。
スキャナI/F48は、第一の調歩同期シリアルI/F54及び第一のビデオI/F55を介してスキャナコネクタ56に接続され、さらに該スキャナコネクタ56はリーダ部2のスキャナユニット11に接続されている。そして、スキャナI/F46はスキャナ部11から受信した画像データに対し所望の2値化処理や、主走査方向及び/又は副走査方向の変倍処理を行い、またスキャナ部11から送られてきたビデオ信号に基づいて制御信号を生成し、スキャナバス45を介してメインコントローラ32に転送する。
また、プリンタI/F48は、第2の調歩同期シリアルI/F57及び第2のビデオI/F58を介してプリンタコネクタ59に接続され、さらに該プリンタコネクタ59はプリンタ部6のマーキングユニット13に接続されている。そして、プリンタI/F48はメインコントローラ32から出力された画像データにスムージング処理を施して該画像データをマーキングユニット13に出力し、さらにマーキングユニット13から送られたビデオ信号に基づいて、生成された制御信号をプリンタバス47に出力する。
そして、CPU33は、ROM36からROMI/F35を介して読み込まれた制御プログラムに基づいて動作し、例えば、第1及び第2のホストコンピュータ3、4から受信したPDL(ページ記述言語)データを解釈し、ラスターイメージデータに展開処理を行う。
また、バスコントローラ34は、スキャナI/F46プリンタI/F48、その他拡張コネクタ50等に接続された外部機器から入出力されるデータ転送を制御するものであり、バス競合時のアービトレーション(調停)やDMAデータ転送の制御を行う。即ち、例えば、上述したDRAM38とコーデック40との間のデータ転送や、スキャナ部5からDRAM38へのデータ転送、DRAM38からマーキングユニット13へのデータ転送等は、バスコントローラ34によって制御され、DMA転送される。
また、I/O制御部51は、LCDコントローラ60などを介してパネルI/F62に接続されている。また、前記I/O制御部51は不揮発性メモリとしてのEEPROMに接続され、またE−IDEコネクタ63を介してハードディスクドライブ8に接続され、さらに、機器内で管理する日付と時刻を更新/保存するリアルタイムクロックモジュール64に接続されている。尚、リアルタイムクロックモジュール64はバックアップ用電池65に接続されて該バックアップ用電池65によりバックアップされている。
図4はメインコントローラ32の内部詳細を示すブロック構成図である。
バスコントローラ34は、4×4の64ビットクロスバススイッチで構成され、64ビットのプロセッサバス(Pバス)67を介してCPU33に接続され、またメモリ専用のローカルバス(Mバス)を介してキャッシュメモリを備えたメモリコントローラ69に接続されている。尚、メモリコントローラ69はROM36やDRAM38などのメモリ類と接続され、これらのメモリ類の動作を制御する。
さらに、該バスコントローラ34はグラフィックスバス(Gバス)70を介してGバスアービタ71及びスキャン・プリンタコントローラ72と接続され、また入出力バス(Bバス)73を介して、Bバスアービター74、Gバスアービタ71、インタラプトコントローラ、及び各種機能ブロック(電力管理ユニット76、UARTなどのシリアルI/Fコントローラ77、USB(Universal Serial Bus)コントローラ78、IEEE1284等のパラレルI/Fコントローラ79、LANコントローラ80汎用入出力コントローラ81、Bバス73と外部バスであるPCIバス(一例として49)との間でI/F動作を司るPCIバスI/F82、及びスキャナ・プリンタコントローラ72)と接続されている。
Bバスアービタ74はBバス73を協調制御するアービトレーションであり、Bバス73のバス使用要求を受け付け、調停の後、使用許可が選択された一つのマスタに与えられ、これにより同時に2つ以上のマスタがバスアクセスを行うのを禁止している。尚、アービトレーション方式は3段階の優先権を有し、それぞれの優先権に複数のマスタが割り当てられる。
インタラプトコントローラ75は、上述した各機能ブロック及びコントローラユニット110の外部からインタラプトを集積し、CPU33がサポートするコントローラ類72、77−82及びノンマスカブルインタラプト(NMI)に再配分する。
電力管理ユニット76は機能ブロック毎に電力を管理し、さらに1チップで構成されている電子部品としてコントローラユニット110の消費電力量の監視を行う。すなわち、コントローラユニット110は、CPU33を内蔵した大規模なASIC(特定用途向けIC)で構成されており、このため全ての機能ブロックが同時に動作すると大量の熱を発生して、コントローラ部110自体が破壊されてしまうおそれがある。
そこで、このような事態を防止するために各に機能ブロック毎に消費電力を管理し、各機能ブロックの消費電力量はパワーマネージメントレベルとして電力管理ユニット76に集積される。そして、該電力管理ユニット76では各機能ブロックの消費電力量を合計し、該消費電力量が限界消費電力を超えないように各機能ブロックの消費電力量を一括して、監視する。
Gバスアービタ71は中央アービトレーション方式によりGバス70を協調制御しており、各バスマスタに対して専用の要求信号と許可信号とを有する。尚、バスマスタへの優先権の付与方式として、全てのバスマスタを同じ優先権として、公平にバス権を付与する公平アービトレーションモードといずれか一つのバスマスタに対して優先的にバスを使用させる優先アービトレーションモードのいずれかを指定することができる。
図5に本件の構成の概念図を示す。
本件の一例として、音声入力を行うマイク部151と、音声入力の開始を指示する入力トリガー部153と、音声入力部で得られるアナログ音声をデジタル音声データに変換する音声認識ハードウェア(音声変換部)600と、音声変換部のメモリ転送などの動作制御を行う音声認識ドライバソフトウェア150と、音声変換部で得られる音声データから音声の特徴を抽出して認識・判定する音声認識エンジンソフトウェア700(音声認識部)という構成を図示した。また本件には直接関係しないが、音声合成時に使用するスピーカ部152も図示している。
図6に本件を実施する際の音声変換部のブロック構成図を示す。
音声合成時には、DMAチップ601はDRAM38に展開されている音声出力データをPCIバス経由でFIFO OUT0 602もしくはFIFO OUT1 603に交互に転送する。FIFO OUTへの出力データ転送が終了したら、FPGA606はFIFO OUTの出力データを順番にD/Aコンバータ607に送る。D/Aコンバータ607はデジタルデータである出力データをアナログに変換する。変換されたアナログ出力データは、周波数の低い信号だけ通す電気的なフィルタであるローパスフィルタ608、信号を増幅するアンプ620、信号を任意の大きさに変換する電子ボリューム621、さらに信号を増幅するアンプ622を経由し、スピーカ部152に送られ、音声としてユーザに伝わる。
音声認識は音声合成と逆の経路をたどる。ユーザからマイク部151に入力されたアナログ入力データは、信号を増幅するアンプ622、信号を任意の大きさに変換する電子ボリューム621、さらに信号を増幅するアンプ620、ローパスフィルタ608を経由し、A/Dコンバータ607に送られ、アナログ入力データはデジタルに変換される。FPGA606では、この変換された連続した入力データを、交互にFIFO IN0 604もしくはFIFO IN1 605に送る。DMAチップ601は、FIFO INに溜まった入力データを交互に選択し、PCIバス経由でDRAM38に転送する。
またFPGA606は、マイク部151もしくはスピーカ部152の検知も行う。マイク部151が音声変換部に挿入されると、FPGA606は挿入による電気信号を確認し、PCIバスを経由してメインコントローラ32に対し割込み信号を送る。この割込み信号により、音声認識ドライバ150は、マイク部151もしくはスピーカ部152が挿入されたことを検知する。さらにFPGA606の内部レジスタには、マイク部151もしくはスピーカ部152が挿入された/されないの状態を示すフラグを持つ。
図7に音声認識を行う際の音声認識エンジン概念図を示す。
音声認識技術とは、人間の声をコンピュータ処理し、テキストに変換する技術のことである。この技術により、機器の制御やコンピュータへの情報入力をキーボードやマウスに替えて「声」で行うことができるため、より便利なユーザインタフェースを実現できる。現在では、あらかじめ「声」の登録をしなくても、誰の声でも高精度で認識でき、単語だけでなく文のように連続して発声された「声」も高速に認識できるようになっている。100単語規模単語音声認識技術から数万語規模連続音声認識技術まで技術の幅は広く、CPU性能やメモリ容量、使用用途に応じて使い分けることができる。また日本語に加えて英語も扱える。
図7の例を参考に音声認識の流れを説明すると、入力された音声はデジタル化され、まず音響分析701により音響的な特徴が抽出される。入力音声の特徴は、音声の統計的な情報をモデル化した音声モデル711と音声データ721から尤度計算702され、言語知識722を用いて照合(言語探索703)され、入力音声にもっとも近い候補が認識結果として出力される。
不特定話者の音声モデルは、年代・性別の異なる数千人規模の声を収録した音声データベースを用いて学習しモデル化している。さらに、周囲の雑音に負けない雑音耐性技術を強化することで、オフィス・家庭・屋外でも、また誰の声でも円滑に認識できる音声認識エンジンの実現を可能にしている。
図8にプラグ挿入の検出および検出後の音声認識モード変更のフローを示す。
音声認識ハードウェア600にマイク部151のプラグが挿入(801)されると、FPGA606でプラグ挿入の電気信号を検知(802)する。この検知は信号の割込みでもポーリングでも良い。そしてFPGA606は、メインコントローラ32にPCIバス経由で割り込み信号を送る(803)。メインコントローラ32は音声認識ハードウェア600からの割込みをハンドリング(804)し、音声認識ドライバ150がプラグ挿入割込みを確認(805)する。そして音声認識ドライバ150は音声認識モードに切り換えるためのルーチン(806-809)を呼び出す。このルーチンは割り込みルーチン中やタスクで行われる。まず音声認識の動作許可フラグ(図示せず)を確認(806)する。このフラグはコントローラの動作設定で変更されるものであり、フラグが落ちている場合は例えば音声認識の起動ボタンを押下しても音声認識は動作しない。確認(806)の結果、許可フラグが落ちている場合は何もせずに終了する。次に現在の音声認識モードの起動状態(すでに動作しているか動作していないか)をメモリに記憶(807)する。この内容はプラグが取外されたときに使用する。そして現在すでに音声認識モードが動作しているかどうかを確認(808)し、動作中の場合は何もせずに終了する。動作中で無い場合は、音声認識エンジン700を初期化し「音声認識を開始します」というガイダンスをし(809)、音声認識(図7)を開始する。
図9にプラグ取外しの検出および検出後の音声認識モード変更のフローを示す。
音声認識ハードウェア600からマイク部151のプラグが取外される(901)と、FPGA606でプラグ取外しの電気信号を検知(902)する。この検知は信号の割込みでもポーリングでも良い。そしてFPGA606は、メインコントローラ32にPCIバス経由で割り込み信号を送る(903)。メインコントローラ32は音声認識ハードウェア600からの割込みをハンドリング(904)し、音声認識ドライバ150はプラグ取外し割込みを確認(905)する。そして現在すでに音声認識モードが動作しているかどうかを確認(906)し、動作していない場合は何もせずに終了する。動作中ならばプラグ挿入前の動作モード(807で記憶)を確認し、プラグ挿入前から音声認識モードが起動している場合は何もせずに終了する。プラグ挿入前は音声認識モードが起動していなかった場合は、音声認識エンジン700を終了化処理し「音声認識を終了します」というガイダンスをし(908)、音声認識モードの起動状態のメモリをクリア(909)して、音声認識を終了する。
画像入出力システムのブロック構成図 画像入出力装置の断面図 コントローラ部のブロック構成図 メインコントローラの詳細を示すブロック構成図 本件の構成を示す概念図 音声変換部のブロック構成図 音声認識エンジンの概念図 プラグ挿入時の音声認識モード変更フロー プラグ取外し時の音声認識モード変更フロー

Claims (6)

  1. 音声入力を行うマイク部と、音声入力部で得られるアナログ音声をデジタル音声データに変換する音声変換部と、音声変換部で得られる音声データから音声の特徴を抽出して認識・判定する音声認識部を有する音声認識装置において、
    マイクジャックにマイクプラグが挿入されたことを検出する手段と、音声認識を実行するモードに切り換える手段と、前記マイク接続検出手段の結果に基づいて前記音声認識モードを変更する手段を持つことを特徴とする音声認識装置。
  2. 前記マイク検出手段は、前記マイクジャックに前記マイクプラグが挿入された状態と挿入されていない状態の状態変化を検出し、検出の結果を出力することを特徴とする請求項1に記載の音声認識装置。
  3. 前記音声認識モードを変更する手段は、前記マイクジャックに前記マイクプラグが挿入された状態を検出すると、予め定められた前記音声認識モードに移行し、前記マイクジャックから前記マイクプラグが抜かれた状態を検出すると、前記マイクジャックに前記マイクプラグが挿入される直前の音声認識モードに変更する手段を持つことを特徴とする請求項1に記載の音声認識装置。
  4. 音声入力を行うイヤホン部と、音声入力部で得られるアナログ音声をデジタル音声データに変換する音声変換部と、音声変換部で得られる音声データから音声の特徴を抽出して認識・判定する音声認識部を有する装置において、
    イヤホンジャックにイヤホンプラグが挿入されたことを検出する手段と、音声認識を実行するモードに切り換える手段と、前記イヤホン接続検出手段の結果に基づいて前記音声認識モードを変更する手段を持つことを特徴とする音声認識装置。
  5. 前記イヤホン検出手段は、前記イヤホンジャックに前記イヤホンプラグが挿入された状態と挿入されていない状態の状態変化を検出し、検出の結果を出力することを特徴とする請求項4に記載の音声認識装置。
  6. 前記音声認識モードを変更する手段は、前記イヤホンジャックに前記イヤホンプラグが挿入された状態を検出すると、予め定められた前記音声認識モードに移行し、前記イヤホンジャックから前記イヤホンプラグが抜かれた状態を検出すると、前記イヤホンジャックに前記イヤホンプラグが挿入される直前の音声認識モードに変更する手段を持つことを特徴とする請求項4に記載の音声認識装置。
JP2008037178A 2008-02-19 2008-02-19 音声認識装置 Pending JP2009198554A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008037178A JP2009198554A (ja) 2008-02-19 2008-02-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008037178A JP2009198554A (ja) 2008-02-19 2008-02-19 音声認識装置

Publications (1)

Publication Number Publication Date
JP2009198554A true JP2009198554A (ja) 2009-09-03

Family

ID=41142143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008037178A Pending JP2009198554A (ja) 2008-02-19 2008-02-19 音声認識装置

Country Status (1)

Country Link
JP (1) JP2009198554A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778806A (zh) * 2012-10-23 2014-05-07 中国电信股份有限公司 有声阅读的方法、终端和系统
JP2020190637A (ja) * 2019-05-22 2020-11-26 キヤノン株式会社 電子機器、その制御方法、およびそのプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778806A (zh) * 2012-10-23 2014-05-07 中国电信股份有限公司 有声阅读的方法、终端和系统
CN103778806B (zh) * 2012-10-23 2016-04-13 中国电信股份有限公司 有声阅读的方法、终端和系统
JP2020190637A (ja) * 2019-05-22 2020-11-26 キヤノン株式会社 電子機器、その制御方法、およびそのプログラム
JP7353797B2 (ja) 2019-05-22 2023-10-02 キヤノン株式会社 電子機器、その制御方法、およびそのプログラム

Similar Documents

Publication Publication Date Title
JP4560463B2 (ja) データ処理装置、データ処理方法及びコンピュータプログラム
US20200076969A1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP6068266B2 (ja) 画像形成装置
JP2009198554A (ja) 音声認識装置
US20200366800A1 (en) Apparatus
JP2017129989A (ja) 情報処理システム、及び情報処理方法
JP2007021808A (ja) 画像形成装置
JP4280505B2 (ja) 情報処理装置及び情報処理方法
JP2008065789A (ja) 入力操作支援装置およびその制御方法
JP4054503B2 (ja) 画像処理装置
JP2002183165A (ja) デジタル複合機および文書格納システム
JP2010004271A (ja) 画像処理装置
JP2001022690A (ja) 装置間のデータ通信方法及びそのシステム
CN115811576A (zh) 带交互代理功能的图像形成系统及其控制方法和存储介质
US9031445B2 (en) Power saving modes in an image forming apparatus
JP2006163096A (ja) 単音の組み合せによる音声機器操作
JP2006039766A (ja) 画像入出力装置、制御方法、及びプログラム
JPH10226117A (ja) 印刷装置及び印刷装置における印刷制御方法
JP3897782B2 (ja) 画像形成装置
JP2007226463A (ja) 情報処理装置及び情報処理方法
JP2007079817A (ja) Cpuクロックとシリアルidによる装置の起動判定
JP2006229570A (ja) 画像表示装置
US7492479B2 (en) Image forming apparatus and image forming method
JP2003316466A (ja) 情報処理システムおよびそのリセット方法
JP2007102011A (ja) 画像形成装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630