JP2005148163A - 音声認識装置およびその制御方法 - Google Patents

音声認識装置およびその制御方法 Download PDF

Info

Publication number
JP2005148163A
JP2005148163A JP2003381635A JP2003381635A JP2005148163A JP 2005148163 A JP2005148163 A JP 2005148163A JP 2003381635 A JP2003381635 A JP 2003381635A JP 2003381635 A JP2003381635 A JP 2003381635A JP 2005148163 A JP2005148163 A JP 2005148163A
Authority
JP
Japan
Prior art keywords
speech recognition
operation mode
speech
utterance
acoustic model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003381635A
Other languages
English (en)
Inventor
Kohei Yamada
耕平 山田
Hiroki Yamamoto
寛樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003381635A priority Critical patent/JP2005148163A/ja
Publication of JP2005148163A publication Critical patent/JP2005148163A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 使用環境の変化に伴う発話スタイルの急な変化にも追従して音声認識性能を維持することのできる音声認識装置およびその制御方法を提供すること。
【解決手段】 複数の動作モードを有する音声認識装置の制御方法であって、現在の動作モードを検出する検出ステップ(S301)と、検出した動作モードに基づいて発話スタイルを予測する予測ステップ(S302)と、予測した発話スタイルに対応する音響モデルを、複数の発話スタイルにそれぞれ対応する複数の音響モデルから選択する選択ステップと(S303)、選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識ステップ(S304)とを有する。
【選択図】 図3

Description

本発明は、音声認識装置およびその制御方法に関し、特に、発話スタイルの変化に適応する音声認識装置およびその制御方法に関する。
近年のプリンタや携帯電話等は、サイレントモードやマナーモードなどとよばれる通常時より静粛化するための動作モードを、使用者がボタン一つで設定できるように設計されているものが多い。こうした動作モードでは、あらかじめ決められた複数の動作を行う機能を備えている。例えば、携帯電話をマナーモードに切り替えると、音ではなく振動により着信通知を行ったり、数回コールした後に早い段階で留守番電話モードに切り替えるなど、通常モードと異なった動作モードに瞬時に切り替わるような機能を有している。こうした動作モードの切り替えは使用者の使用環境が変化したことを意味しており、それに伴い使用者自身の装置を使用するスタイルも大きく変化したことを意味している。
音声認識機能を有する装置またはシステムの場合を考えると、上記のように使用環境の変化に伴って、使用者の発話スタイルも変化することが予想される。発話スタイルの大幅な変化は、音声認識率低下の大きな要因となるため、あらかじめおおよその発話スタイルを予測することが有効と考えられる。例えば、特開平8−30289号公報(特許文献1)には、入力された音声信号から発話スタイルの変動を学習して音響モデルを自動遷移することにより、高性能な音声認識を行う方法が開示されている。
特開平8−30289号公報
しかし、特許文献1に開示された方法は、入力音声信号から発話スタイルを学習し音響モデルを遷移するため、装置の使用環境の急な変化により発話スタイルも大きく変わったときに、その変化に追従できないと考えられる。
そこで本発明は、使用環境の変化に伴う発話スタイルの急な変化にも追従して音声認識性能を維持することのできる音声認識装置およびその制御方法を提供することを目的とする。
本発明の一側面によれば、例えば、複数の動作モードを有する音声認識装置であって、複数の発話スタイルにそれぞれ対応する複数の音響モデルと、現在の動作モードを検出する検出手段と、検出した動作モードに基づいて発話スタイルを予測する予測手段と、予測した発話スタイルに対応する音響モデルを、前記複数の音響モデルから選択する選択手段と、選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識手段とを有することを特徴とする音声認識装置が提供される。
本発明によれば、使用環境の変化に伴う発話スタイルの急な変化にも追従して音声認識性能を維持することができる。
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。
(実施形態1)
図1Aは、本発明の音声認識を適用可能な印刷システムの構成を示すブロック図である。この図1に示した印刷システムは例えば、音声認識プログラムをインストールしたパーソナルコンピュータとそれに接続されたプリンタで実現することができるものである。もっとも、パーソナルコンピュータのような汎用コンピュータではなく、専用のハードウェアロジックによって構成してもよい。
101は装置全体の制御を司る中央処理装置(CPU)、102は制御用各種データなどを記憶するメモリ(ROM)、103は主記憶装置として機能するメモリ(RAM)、104はハードディスク装置などで構成される外部記憶装置、105はボタンやキーボードなどの情報入力部、106は装置の状態などを表示する情報表示部、107は音声入力部(マイクロホン)、108はプリンタ2と通信を行うためのインタフェース(I/F)、110は上記の各部を接続するバスである。概ねこのような構成を有するパーソナルコンピュータは、I/F108を介してプリンタ2と接続されている。
また、外部記憶装置104には、図1Bに示すように、OSをはじめ、後述する音声認識プログラム、各種参照テーブル、および各種音響モデルが記憶されている。
プリンタ2は、レーザビームプリンタやインクジェットプリンタなどのいずれの印刷方式をとるものであってもよいが、通常モード、高速印刷モード、サイレントモード、マナーモードなどの複数の動作モードを有する。
本実施形態における印刷システムは、情報入力部105より入力された情報に基づいて、外部記憶装置104に格納された音声認識プログラムがCPU101によって実行され、その中で、発話スタイルを予測し、音声入力部107から入力される音声信号にもっとも適合した音響モデルをRAM103にロードして音声認識を行う。
この音声認識プログラムによるメカニズムをもう少し具体的に説明すると、次のとおりである。まず、CPU101は、I/F108を介して入力されてくるプリンタ2に関連する情報を解析して現在の動作モードを調べる。外部記憶装置104に格納された各種テーブルを参照して、プリンタ2の動作モードに対応する音響モデルをRAM103にロードする。そして、音声入力部107から入力される音声信号に対してRAM103にロードした音響モデルを用いて音声認識を行う。
図2は、本実施形態の音声認識処理に係る音声認識プログラムのモジュールの構成を示す図である。本実施形態の音声認識処理は、発話スタイルを予測し、それに応じて音響モデルを選択して音声認識を行うものである。
動作モード検出モジュール201は、I/F108を介してプリンタ2から送られてくる各種情報に基づいてプリンタ2の動作モードを検出する。発話スタイル予測モジュール202は、検出した動作モードに対応した発話スタイルを、外部記憶装置104に記憶されている動作モード−発話スタイル対応テーブル204を参照することにより予測する。また、音響モデル選択モジュール203は、予測した発話スタイルに対応した音響モデルを、外部記憶装置104に記憶されている発話スタイル−音響モデル対応テーブル205を参照することにより選択する。
図4は、動作モード−発話スタイル対応テーブル204の構造例を示す図である。401欄には、プリンタ2の動作モードが記述され、402欄には、各動作モードに対応する発話スタイルが記述されている。ここで、図示のように、発話スタイルが時刻ごとに区分されて記述されていると、使用する時間帯に応じた発話スタイルを予測することができるので好都合である。このテーブルによれば、例えば、検出された動作モードがサイレントモードで、その時の時刻が12時であった場合は、発話スタイルは「ささやき声発話スタイル」と予測することができる。
図5は、発話スタイル−音響モデル対応テーブル205の構造例を示す図である。図示のように、501欄には、発話スタイルが記述され、502欄には、各発話スタイルに対応する音響モデルが記述されている。このテーブルによれば、例えば、予測された発話スタイルが「ささやき声発話スタイル」であったときは「ささやき声音響モデル」が選択されることになる。
図3は、本実施形態における音声認識処理を示すフローチャートである。
まず、ステップS301で、プリンタ2の動作モードを検出する。この検出は例えば、プリンタ2を静かに動作させるサイレントモードへの切り替えボタンのオン/オフ情報や内部時間情報などに基づいて行われる。次に、ステップS302で、ステップS301で検出した動作モードに対応する発話スタイルを、外部記憶装置104に記憶されている動作モード−発話スタイル対応テーブル204を参照することにより予測する。次に、ステップS303で、ステップS302で予測された発話スタイルに対応した音響モデルを、発話スタイル−音響モデル対応テーブル205を参照することにより選択する。そして、ステップS304で、ステップS303で選択された音響モデルを用いて、音声入力部107を介して入力される音声の認識を行う。
なお、このステップS304では、例えば、音声入力部(マイクロホン)107の入力感度を、予測した発話スタイルに最も適合するように自動調整されることが望ましい。例えば、ひそひそ声音響モデルが選択された場合は、ひそひそ声に最も適したマイク感度に自動的に設定される。
また、ステップS304の音声認識処理中に、ステップS301〜S303の処理を繰り返すことが好ましい。そうすると音声認識処理中、例えば「ささやき声音響モデル」が選択されていたところ、動作モードが高速印刷モードに切り替わった場合は、それに応じて「大声発話スタイル」が予測され、それに伴い「大声音響モデル」が予測対象音響モデルと選択されて「ささやき声音響モデル」と入れ替えることが可能になる。
このようにして本実施形態では、プリンタの動作モードから発話スタイルを予測し、その発話スタイルに適合した音響モデルを選択して音声認識を行う。これにより発話スタイルの変化に適応する音声認識装置および方法が実現される。
なお、上述の実施形態はプリンタとそのプリンタを制御する情報処理装置とを含む印刷システムであって情報処理装置が音声認識機能を有しているものについて説明したが、このような印刷システムは本発明の音声認識装置および方法が適用されうるものの一例にすぎない。プリンタ以外にも複数の動作モードを備える周辺機器が接続されたシステムにも同様に適用可能であることはいうまでもない。また、上記のような情報処理装置と外部機器が接続されたシステムの他に、例えば複数の動作モードを有する携帯電話等の携帯型端末装置であって音声認識機能を有するものについても同様に本発明を適用することが可能である。
(実施形態2)
実施形態2の音声認識処理は、統計的に音響モデルを同定する処理を含む。図6は、本実施形態の音声認識処理に係る音声認識プログラムのモジュールの構成を示す図である。なお、本実施形態における印刷システムの構成については図1A,Bを援用する。
音声認識モジュール605は、音響モデル選択モジュール603により選択された音響モデルを用いて音声認識を行い、認識結果は動作機能モジュール607へ渡される。音響モデル選択モジュール603で適応した音響モデルによる音声認識の結果が正しい場合、動作モード検出モジュール601で検出した動作モードと、入力音声信号を、外部記憶装置104に時系列の統計データとして保存する。
音声情報記録モジュール606は、音声認識結果の正誤情報をユーザよりフィードバックし、認識結果が正しいとのフィードバックを受けた時にデータ保存を行う。外部記憶装置104に保存される音声信号は例えば、発話音量と発話速度の2つの特徴量を基底ベクトルとした2次元ベクトルとして表現され、24時間を一周期とした時系列分布として相関を持つようにする。外部記憶装置104に保存される音声信号は統計処理の対象データとなり、次回以降の統計処理を行う際に使用される。次回とは24時間後のことを言う。また統計処理とは、ある時間にどのような音声入力があったのかを処理することで、ある時間帯に入力された音声データの代表的なモデルのベクトルを統計的に一つ決定する。このように決定されるモデルを統計推定モデルと呼ぶことにする。ここで使用する時間帯とは、あらかじめ一意に決定される量ではなく、動作モードの変化に応じて変化する時間量を指す。つまり、頻繁に動作モードが変化する時間帯は短い時間間隔で上記の統計処理を行い、動作モードの変化がほとんどない時間帯は長い時間間隔で統計処理を行う。そして、各々の音響モデルも発話音量と発話速度の2つの基底ベクトルで一意に表現することで、音響モデルのベクトルと統計処理で得た統計推定モデルのベクトルの距離が最も近い音響モデルを発話スタイル予測における音響モデルとして、図9に示すような動作モード−音響モデル対応テーブルに保存する。
図7は、本実施形態における音声認識処理を示すフローチャートである。
まず、ステップS701で、プリンタ2の動作モード情報を検出する。この検出は例えば、プリンタ2を静かに動作させるサイレントモードへの切り替えボタンのオン/オフ情報や内部時間情報などに基づいて行われる。次に、ステップS702で、ステップS701で検出した動作モードに対応する発話スタイルを、動作モード−発話スタイル対応テーブル204を参照することにより予測する。次に、ステップS703で、ステップS702で予測された発話スタイルに対応する音響モデル、発話スタイル−音響モデル対応テーブル205を参照することにより選択する。そして、ステップS704で、ステップS703で選択された音響モデルを用いて、音声入力部107を介して入力される音声の認識を行う。その後、ステップS705で、入力された音声信号を外部記憶装置104に記録し、ステップS706で、外部記憶装置104に記録された音声データの統計処理を行う。
ステップS706での統計処理は具体的には次のように行う。
図8に示すように、各音響モデルを、発話音量と発話速度で定量的に表現し、2次元の直交座標系で表現する。801は発話速度を示す軸、802は発話音量を示す軸である。ある時間帯に入力された音声データを学習し、統計推定モデルを一意に決定し、その推定されたモデルを図8のような座標系に投影し、その投影したベクトルに最も距離の近いベクトルを持つ音響モデルを同定する。同図の場合、統計推定モデルのベクトルに最も距離の近いベクトルとしては音響モデルAのベクトルが該当するので、この場合は音響モデルAが同定される。この音響モデルの同定の結果は図9の動作モード−音響モデル対応テーブル206に反映される。このテーブルは、各動作モードに対応する発話スタイルが時刻別に記録されている。
さらに、このようなテーブル206の更新に応じて、動作モード−発話スタイル対応テーブル204の更新も行われる。この更新処理の例を、図10を用いて詳細に説明する。図9における動作モード−音響モデル対応テーブル206を参照すると、統計処理の結果、例えば14時でのサイレントモードに対しては通常音響モデルが最適な音響モデルとして同定されることが分かる(図10(a))。この場合、発話スタイル−音響モデル対応テーブル205を参照すれば、通常音響モデルに対応する発話スタイルは通常音声であることが分かる(同図(b))。これに応じて、動作モード−発話スタイル対応テーブル204の14時のサイレントモードに対応する音響モデルを、通常音響モデルで更新する。例えば現時点で動作モード−発話スタイル対応テーブル204を参照すると、14時のサイレントモードにはささやき声発話スタイルが対応している。したがって、これを通常音声発話スタイルに変更することになる。
(実施形態3)
本実施形態では、音声認識機能を有する携帯型端末装置で、GPS(Global Positioning System)が搭載されものについて説明する。この場合、携帯型端末装置の現在位置の情報が、図3に示したステップS301の動作モード検出処理において検出される。また、ステップS302において、位置情報から得られる場所情報をインターネットを介して獲得する。そして、場所情報に対応した動作モードを、あらかじめメモリに記録された場所−動作モード対応テーブルを参照して、装置の動作モードを決定する。なお、ユーザが既に別の動作モードを指定している場合には、そのユーザ指定の動作モードを優先するようにしてもよい。
図11に場所情報−動作モード対応テーブルの構造例を示す。図示のように、1101列に場所情報がきじゅつされ、1102列にその場所情報に対応する動作モードが記述される。たとえば、電車に乗っている場合には、その位置情報から、インターネットを介してその場所が線路上であるという情報が得られ、図11のテーブルを参照すると、対応する動作モードはマナーモードとなる。また、たとえば劇場や映画館、講演会場などの場所情報を物理的な位置情報から得た場合は、図11のテーブルを参照すると、対応する動作モードはサイレントモードとなる。このようにして動作モードが決定されると、図4に示したような動作モード−発話スタイル対応テーブルを参照して発話スタイルが予測され、さらに図5に示したような発話スタイル−音響モデル対応テーブルを参照して音響モデルが選択され、その音響モデルを用いて音声認識が行われることになる。
(他の実施形態)
以上、本発明の実施形態を詳述したが、本発明は、例えばシステム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。また、本発明は、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータがその供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、その形態はプログラムである必要はない。
従って、本発明の機能処理をコンピュータで実現するために、そのコンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の特許請求の範囲には、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、そのホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明のクレームに含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
本発明の音声認識を適用可能な印刷システムの構成を示すブロック図である。 外部記憶装置の記憶内容の例を示す模式図である。 実施形態1の音声認識処理に係る音声認識プログラムのモジュールの構成を示す図である。 実施形態1における音声認識処理を示すフローチャートである。 動作モード−発話スタイル対応テーブルの構造例を示す図である。 発話スタイル−音響モデル対応テーブルの構造例を示す図である。 実施形態2の音声認識処理に係る音声認識プログラムのモジュールの構成を示す図である。 実施形態2における音声認識処理を示すフローチャートである。 実施形態2における音響モデルの同定処理を説明するための図である。 実施形態2における動作モード−音響モデル対応テーブルの構造例を示す図である。 実施形態2における動作モード−発話スタイル対応テーブル更新処理を説明する図である。 実施形態3における場所情報−動作モード対応テーブルの構造例を示す図である。

Claims (10)

  1. 複数の動作モードを有する音声認識装置であって、
    複数の発話スタイルにそれぞれ対応する複数の音響モデルと、
    現在の動作モードを検出する検出手段と、
    検出した動作モードに基づいて発話スタイルを予測する予測手段と、
    予測した発話スタイルに対応する音響モデルを、前記複数の音響モデルから選択する選択手段と、
    選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識手段と、
    を有することを特徴とする音声認識装置。
  2. 前記予測手段は、動作モードと発話スタイルとの対応を記述したテーブルに基づいて予測することを特徴とする請求項1に記載の音声認識装置。
  3. 前記テーブルは各動作モードに対応する発話スタイルが時刻別に記述されており、
    前記検出手段は、現在時刻および現在の動作モードを検出し、
    前記予測手段は、前記テーブルに基づいて現在時刻に適した発話スタイルを予測する
    ことを特徴とする請求項2に記載の音声認識装置。
  4. 一の動作モードについて、実際に入力された音声データと、前記複数の音響モデルとをそれぞれ、発話音量および発話速度を基底ベクトルとする2次元空間で定量化し、前記実際に入力された音声データのベクトルと距離が最も近いベクトルの音響モデルを特定し、その特定された音響モデルに対応する発話スタイルで前記テーブルを更新することを、各動作モードについて行うテーブル更新手段を更に有することを特徴とする請求項3に記載の音声認識装置。
  5. 現在位置の情報を取得する手段と、
    前記現在位置に応じた動作モードを設定する手段と、
    を更に有することを特徴とする請求項1に記載の音声認識装置。
  6. 前記予測手段により予測された発話スタイルに応じて、音声を入力するマイクロホンの感度を調整する調整手段を更に有することを特徴とする請求項1に記載の音声認識装置。
  7. 複数の動作モードを有する音声認識装置の制御方法であって、
    現在の動作モードを検出する検出ステップと、
    検出した動作モードに基づいて発話スタイルを予測する予測ステップと、
    予測した発話スタイルに対応する音響モデルを、複数の発話スタイルにそれぞれ対応する複数の音響モデルから選択する選択ステップと、
    選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識ステップと、
    を有することを特徴とする音声認識装置の制御方法。
  8. コンピュータに、
    現在の動作モードを検出する検出ステップ、
    検出した動作モードに基づいて発話スタイルを予測する予測ステップ、
    予測した発話スタイルに対応する音響モデルを、複数の発話スタイルにそれぞれ対応する複数の音響モデルから選択する選択ステップ、
    選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識ステップ、
    を実行させるためのプログラム。
  9. 請求項8に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
  10. 複数の動作モードを有する外部機器に接続された音声認識装置であって、
    複数の発話スタイルにそれぞれ対応する複数の音響モデルと、
    前記外部機器の現在の動作モードを検出する検出手段と、
    検出した動作モードに基づいて発話スタイルを予測する予測手段と、
    予測した発話スタイルに対応する音響モデルを、前記複数の音響モデルから選択する選択手段と、
    選択した音響モデルに基づいて、入力された音声の音声認識を行う音声認識手段と、
    を有することを特徴とする音声認識装置。
JP2003381635A 2003-11-11 2003-11-11 音声認識装置およびその制御方法 Withdrawn JP2005148163A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003381635A JP2005148163A (ja) 2003-11-11 2003-11-11 音声認識装置およびその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003381635A JP2005148163A (ja) 2003-11-11 2003-11-11 音声認識装置およびその制御方法

Publications (1)

Publication Number Publication Date
JP2005148163A true JP2005148163A (ja) 2005-06-09

Family

ID=34690950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003381635A Withdrawn JP2005148163A (ja) 2003-11-11 2003-11-11 音声認識装置およびその制御方法

Country Status (1)

Country Link
JP (1) JP2005148163A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011064845A (ja) * 2009-09-16 2011-03-31 Yamaha Corp 音声認識装置およびプログラム
US8620388B2 (en) 2008-08-27 2013-12-31 Fujitsu Limited Noise suppressing device, mobile phone, noise suppressing method, and recording medium
JP2015215503A (ja) * 2014-05-12 2015-12-03 日本電信電話株式会社 音声認識方法、音声認識装置および音声認識プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8620388B2 (en) 2008-08-27 2013-12-31 Fujitsu Limited Noise suppressing device, mobile phone, noise suppressing method, and recording medium
JP2011064845A (ja) * 2009-09-16 2011-03-31 Yamaha Corp 音声認識装置およびプログラム
JP2015215503A (ja) * 2014-05-12 2015-12-03 日本電信電話株式会社 音声認識方法、音声認識装置および音声認識プログラム

Similar Documents

Publication Publication Date Title
JP4213008B2 (ja) 情報端末装置、操作支援方法及び操作支援プログラム
CN104394491B (zh) 一种智能耳机、云服务器以及音量调节方法和系统
KR101566379B1 (ko) 입력 신호 종류 별 사용자 기능 활성화 방법 및 이를 지원하는 휴대 단말기
KR20190042918A (ko) 전자 장치 및 그의 동작 방법
JP4679342B2 (ja) 仮想キー入力装置及び情報端末装置
US20040070591A1 (en) Information terminal device, operation supporting method, and operation supporting program
EP1450349A1 (en) In-vehicle controller and program for instructing computer to execute operation instruction method
JP2003076389A (ja) タッチスクリーン又は音声認識を通じて動作制御される情報端末及びその命令実行方法
JP2020038709A (ja) 人工知能機器における連続会話機能
JPWO2018135276A1 (ja) 言動制御装置、ロボット、制御プログラムおよび言動制御装置の制御方法
JP2005148163A (ja) 音声認識装置およびその制御方法
JP7456387B2 (ja) 情報処理装置、及び情報処理方法
US7249323B2 (en) Information processing apparatus, control apparatus and recording medium
CN102246497A (zh) 响应于消息内容控制示意消息接收的提示曲调的声音特性
JP2001042891A (ja) 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体
JP5842364B2 (ja) 音量制御装置及び音量制御方法
KR101675911B1 (ko) 외부음향에 따른 맞춤 정보를 표시하는 전자책
CN110244859A (zh) 一种自定义输入法候选项的方法以及装置
KR20090020265A (ko) 휴대 단말기 및 그 메시지 작성 방법
JP2005140860A (ja) 音声認識装置およびその制御方法
KR100488527B1 (ko) 컴퓨터시스템 및 그 제어방법
JP2002268683A (ja) 情報処理方法及び装置
JP2004072274A (ja) 音声処理システム及びその制御方法
US20210034079A1 (en) Personal space creation system, personal space creation method, personal space creation program
KR20080039704A (ko) 휴대용 오디오 플레이어 및 그 제어 방법

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070206