JPH1124695A - 音声認識処理装置および音声認識処理方法 - Google Patents

音声認識処理装置および音声認識処理方法

Info

Publication number
JPH1124695A
JPH1124695A JP9172123A JP17212397A JPH1124695A JP H1124695 A JPH1124695 A JP H1124695A JP 9172123 A JP9172123 A JP 9172123A JP 17212397 A JP17212397 A JP 17212397A JP H1124695 A JPH1124695 A JP H1124695A
Authority
JP
Japan
Prior art keywords
recognition
candidate
candidates
speech
narrowing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9172123A
Other languages
English (en)
Inventor
Masakazu Hattori
雅一 服部
Yasuhiko Kato
靖彦 加藤
Takashi Toyoda
崇 豊田
Naohiro Yokoo
直弘 横尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9172123A priority Critical patent/JPH1124695A/ja
Publication of JPH1124695A publication Critical patent/JPH1124695A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】音声入力を効率的に行い得るようにする。 【解決手段】入力音声を分析部23で分析して分析デー
タを得る。CPU24は、この分析データとRAM25
に記憶されている認識用辞書データとを比較し、所定個
数の認識候補を用意する。CPU31は、この所定個数
の認識候補の情報をRAM32に記憶させ、上位候補を
表示や音声でユーザに提示し、1個の認識候補を選択さ
せる。所望の認識候補がなく、ユーザが、アプリケーシ
ョン画面上でタッチペンによりある範囲を指定して認識
対象語を絞り、その後再処理を指示する場合、第1のモ
ードでは、認識対象語を絞る前と同じ分析データと絞っ
た後の認識用辞書データとを比較して所定個数の認識候
補を得、その上位候補を選択対象とし、第2のモードで
は、認識対象語を絞る前の所定個数の認識候補より認識
対象語を絞った結果残った認識候補のうち、上位候補を
選択対象とする。音声入力のやり直しは不要となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えばデータベ
ースより音声入力によって必要な情報を得る際に適用し
て好適な音声認識処理装置および音声認識処理方法に関
する。詳しくは、提示される複数個の認識候補の中に所
望の認識候補がなく、認識対象語を絞った後に再処理を
する際、音声入力のやり直しをせずに保存データを利用
して提示される複数の認識候補を得ることによって、音
声入力を効率的に行い得るようにした音声認識処理装置
および音声認識処理方法に係るものである。
【0002】
【従来の技術】従来、例えばデータベースより音声入力
によって必要な情報を得るデータベースシステムが提案
されている。例えば、地図情報を有するデータベース
に、地域名を音声で入力し、その地域名に該当する地図
情報を得るものである。また例えば、電話番号情報を有
するデータベースに企業名や個人名を音声で入力し、そ
の企業名や個人名に該当する電話番号情報を得るもので
ある。
【0003】
【発明が解決しようとする課題】音声認識は認識率が1
00%ではないため、音声認識を利用する上述したデー
タベースシステム等では、誤認識を修正する機能を持っ
ている。例えば、ある音声入力に対して所定個数の認識
候補を提示し、最終的な決定をユーザに任せる方法があ
る。この場合、提示された認識候補に所望の認識候補が
ないとき、音声入力のやり直しをする必要があった。ま
た、認識率を上げるために認識対象語を絞る場合であっ
ても、同様に音声入力のやり直しをする必要があった。
【0004】そこで、この発明では、音声入力を効率的
に行うことができ、ユーザの使い勝手を向上し得る音声
認識処理装置および音声認識処理方法を提供することを
目的とする。
【0005】
【課題を解決するための手段】この発明に係る音声認識
処理装置は、入力音声を分析して音声認識処理に必要な
分析データを得る音声分析手段と、分析データを認識対
象語に対応した認識用辞書データと比較し、認識対象語
より所定個数の認識候補を得る音声認識処理手段と、所
定個数の認識候補より1個の認識候補を選択するための
認識候補選択手段と、認識対象語を絞る認識対象絞り手
段とを備える音声認識処理装置であって、認識対象絞り
手段で認識対象語を絞る操作を行った場合、音声認識処
理手段は、認識対象語を絞る前と同じ分析データを使用
して所定個数の認識候補を得るものである。
【0006】この発明に係る音声認識処理方法は、入力
音声を分析して音声認識処理に必要な分析データを得る
音声分析ステップと、分析データを認識対象語に対応し
た認識用辞書データと比較し、認識対象語より所定個数
の認識候補を得る音声認識処理ステップと、所定個数の
認識候補より1個の認識候補を選択するための認識候補
選択ステップと、認識対象語を絞る認識対象絞りステッ
プとを備える音声認識処理方法であって、認識対象絞り
ステップで認識対象語を絞る操作を行った場合、音声認
識処理ステップでは認識対象語を絞る前と同じ分析デー
タを使用して所定個数の認識候補を得るものである。
【0007】入力音声が分析されて音声認識処理に必要
な分析データが得られる。例えば、マイクロホンからの
入力音声信号を所定の周波数帯域毎にフィルタリング
し、この各周波数帯域毎のフィルタリング結果から入力
音声信号の各周波数帯域毎の特徴量を得、この各周波数
帯域毎の特徴量をベクトル化することで分析データが得
られる。
【0008】この分析データと認識対象語に対応した認
識用辞書データとが比較され、分析データにできるだけ
近い辞書データに対応した所定個数の認識対象語が認識
候補とされる。そして、例えば、この所定個数の認識候
補のうち上位から一定個数の認識候補を選択対象として
1個の認識候補が選択される。
【0009】例えば、選択対象としての認識候補に所望
の認識候補がなく、認識確率を高くするために認識対象
語を絞って再処理を行わせる場合、認識対象語を絞る前
と同じ分析データと絞った後の認識対象語に対応した認
識用辞書データとが比較されて所定個数の認識候補が得
られる。そして、この所定個数の認識候補のうち上位か
ら一定個数の認識候補選択の対象として、再度認識候補
の選択が行われることとなる。
【0010】このように、認識対象語を絞って再処理を
行わせる場合、認識対象語を絞る前と同じ分析データを
使用して所定個数の認識候補を得るものであり、音声入
力のやり直しをする必要がなくなる。この場合、認識対
象語を絞ったことによって、選択対象となる一定個数の
認識候補が変化し、その一定個数の認識候補に所望の認
識候補が含まれることが期待される。
【0011】なお、認識候補選択手段は、所定個数の認
識候補のうち上位から一定個数の記載候補を1個ずつ表
示する認識候補表示部と、この認識候補表示部に表示さ
れる認識候補を次候補に変更する認識候補変更手段と、
この認識候補表示部に表示された認識候補を1個の認識
候補として確定する認識候補確定手段とを有してなるも
のであってもよい。
【0012】また、認識候補選択手段は、所定個数の認
識候補のうち上位から一定個数の認識候補を1個ずつ音
声出力する認識候補音声出力部と、この認識候補音声出
力部より音声出力される認識候補を次候補に変更する認
識候補変更手段と、この認識候補音声出力部より音声出
力された認識候補を1個の認識候補として確定する認識
候補確定手段とを有してなるものであってもよい。
【0013】この発明に係る音声認識処理装置は、入力
音声を分析して音声認識処理に必要な分析データを得る
音声分析手段と、分析データを認識対象語に対応した認
識用辞書データと比較し、認識対象語より所定個数の認
識候補を得る音声認識処理手段と、所定個数の認識候補
より1個の認識候補を選択するための認識候補選択手段
と、認識対象語を絞る認識対象絞り手段とを備える音声
認識処理装置であって、認識候補選択手段は所定個数の
認識候補のうち上位から一定個数の認識候補を対象とし
て1個の認識候補を選択し、認識対象絞り手段で認識対
象語を絞る操作を行った場合、認識候補選択手段は、所
定個数の認識候補より認識対象語を絞った結果残った認
識候補のうち上位から一定個数の認識候補を対象として
上記1個の認識候補を選択するものである。
【0014】この発明に係る音声認識処理装置は、入力
音声を分析して音声認識処理に必要な分析データを得る
音声分析ステップと、分析データを認識対象語に対応し
た認識用辞書データと比較し、認識対象語より所定個数
の認識候補を得る音声認識処理ステップと、所定個数の
認識候補より1個の認識候補を選択するための認識候補
選択ステップと、認識対象語を絞る認識対象絞りステッ
プとを備える音声認識処理方法であって、認識候補選択
ステップでは所定個数の認識候補のうち上位から一定個
数の認識候補を対象として1個の認識候補を選択し、認
識対象絞りステップで認識対象語を絞る操作を行った場
合、認識候補選択ステップでは、所定個数の認識候補よ
り認識対象語を絞った結果残った認識候補のうち上位か
ら一定個数の認識候補を対象として1個の認識候補を選
択するものである。
【0015】入力音声が分析されて音声認識処理に必要
な分析データが得られる。この分析データと認識対象語
に対応した認識用辞書データとが比較され、分析データ
にできるだけ近い辞書データに対応した所定個数の認識
対象語が認識候補とされる。そして、この所定個数の認
識候補のうち上位から一定個数の認識候補を対象として
1個の認識候補が選択される。
【0016】例えば、所定個数の認識候補に所望の認識
候補がなく、認識確率を高くするために認識対象語を絞
って再処理を行わせる場合、認識対象語を絞る前の所定
個数の認識候補より認識対象語を絞った結果残った認識
候補のうち上位から一定個数の認識候補が選択の対象と
される。
【0017】このように、認識対象語を絞って再処理を
行わせる場合、認識対象語を絞る前の所定個数の認識候
補より認識対象語を絞った結果残った認識候補のうち上
位から一定個数の認識候補が選択の対象とされるもので
あり、音声入力のやり直しをする必要がなく、また分析
データと認識対象語に対応した認識用辞書データとの比
較による音声認識処理をする必要もなくなる。この場
合、認識対象語を絞った結果残った認識候補の上位候補
に、所望の認識候補が含まれることが期待される。
【0018】この発明に係る音声認識処理装置は、入力
音声を分析して音声認識処理に必要な分析データを得る
音声分析手段と、分析データを認識対象語に対応した認
識用辞書データと比較し、認識対象語より所定個数の認
識候補を得る音声認識処理手段と、所定個数の認識候補
のうち上位から一定個数の認識候補より1個の認識候補
を選択するための認識候補選択手段と、認識対象語を絞
る認識対象絞り手段とを備える音声認識処理装置であっ
て、認識対象絞り手段で認識対象語を絞る操作を行った
後、第1のモードまたは第2のモードのいずれかを選択
するモード選択手段を有するものである。そして、第1
のモードが選択される場合、認識候補選択手段は所定個
数の認識候補より認識対象語を絞った結果残った認識候
補のうち上位から一定個数の認識候補を対象として1個
の認識候補を選択すると共に、第2のモードが選択され
る場合、音声認識処理手段は認識対象語を絞る前と同じ
分析データを使用して所定個数の認識候補を得るもので
ある。
【0019】この発明に係る音声認識処理方法は、入力
音声を分析して音声認識処理に必要な分析データを得る
音声分析ステップと、分析データを認識対象語に対応し
た認識用辞書データと比較し、認識対象語より所定個数
の認識候補を得る音声認識処理ステップと、所定個数の
認識候補のうち上位から一定個数の認識候補より1個の
認識候補を選択するための認識候補選択ステップと、認
識対象語を絞る認識対象絞りステップとを備える音声認
識処理方法であって、認識対象絞りステップで認識対象
語を絞る操作を行った後に、第1のモードまたは第2の
モードのいずれかを選択するモード選択ステップをさら
に有するものである。そして、第1のモードが選択され
る場合、認識候補選択ステップで所定個数の認識候補よ
り認識対象語を絞った結果残った認識候補のうち上位か
ら一定個数の認識候補を対象として1個の認識候補を選
択すると共に、第2のモードが選択される場合、音声認
識処理ステップで認識対象語を絞る前と同じ分析データ
を使用して所定個数の認識候補を得るものである。
【0020】入力音声が分析されて音声認識処理に必要
な分析データが得られる。この分析データと認識対象語
に対応した認識用辞書データとが比較され、分析データ
にできるだけ近い辞書データに対応した所定個数の認識
対象語が認識候補とされる。そして、所定個数の認識候
補のうち上位から一定個数の認識候補を対象として1個
の認識候補が選択される。
【0021】例えば、所定個数の認識候補に所望の認識
候補がなく、認識確率を高くするために認識対象語を絞
って再処理を行わせる場合を考える。第1のモードが選
択される場合、認識対象語を絞る前の所定個数の認識候
補より認識対象語を絞った結果残った認識候補のうち上
位から一定個数の認識候補が選択の対象とされる。一
方、第2のモードが選択される場合、認識対象語を絞る
前と同じ分析データと絞った後の認識対象語に対応した
認識用辞書データとが比較されて所定個数の認識候補が
得られ、その所定数の認識候補のうち上位から一定個数
の認識候補が選択の対象とされる。
【0022】このように、第1のモードが選択される場
合、認識対象語を絞る前の所定個数の認識候補より認識
対象語を絞った結果残った認識候補のうち上位から一定
個数の認識候補が選択の対象とされるものであり、音声
入力のやり直しをする必要がなく、また分析データと認
識対象語に対応した認識用辞書データとの比較による音
声認識処理をする必要もなくなる。この場合、認識対象
語を絞った結果残った認識候補の上位候補に、所望の認
識候補が含まれることが期待される。
【0023】一方、第2のモードが選択される場合、認
識対象語を絞って再処理を行わせる場合、認識対象語を
絞る前と同じ分析データを使用して所定個数の認識候補
を得るものであり、音声入力のやり直しをする必要がな
くなる。この場合、認識対象語を絞ったことによって、
選択の対象となる一定個数の認識候補が変化し、その一
定個数の認識候補に所望の認識候補が含まれることが期
待される。
【0024】
【発明の実施の形態】以下、図面を参照しながら、この
発明の実施の形態について説明する。図1は、この発明
の実施の形態としての音声入力機能を備えたデータベー
スシステム10の外観を示している。
【0025】このシステム10は、音声を入力するため
のマイクロホン11と、合成音声信号による音声を出力
するためのスピーカ12と、液晶表示素子等で構成さ
れ、アプリケーションプログラムのGUI(Graphical
User Interface)を表示するためのアプリケーション画
面表示部13と、この画面表示部13に表示されるアプ
リケーション画面内のメニューを選択したりするための
選択キー14と、選択した内容を確定するため等に使用
する決定キー15、アプリケーション画面内のメニュー
の選択をやり直したり、後述する認識候補表示部に表示
される認識候補を次候補に変更するため等に使用するキ
ャンセルキー16を有している。
【0026】また、システム10は、液晶表示素子等で
構成され、各項目毎に音声認識処理によって得られる認
識候補を順に1個ずつ表示する認識候補表示部17a〜
17eを有している。本実施の形態では、5個の認識候
補表示部17a〜17eを持っているため、最大5項目
の認識候補が同時に表示される。図示せずも、アプリケ
ーション画面表示部13および認識候補表示部17a〜
17eの表面にはタッチパネルが配されている。タッチ
ペン18によって、認識候補表示部17a〜17eより
いずれかの項目を選択できる。
【0027】また、アプリケーション画面上で、タッチ
ペン18により、メニューを選択できる。例えば、図1
に示すようなアプリケーション画面が表示されている場
合には、「電話番号」、「地図」、「英和」よりいずれ
かを選択できる。なお、「地図」が選択された場合に
は、アプリケーション画面表示部13には、例えば図2
に示すように日本全域の地図が表示される。
【0028】また、アプリケーション画面上で、タッチ
ペン18によりある範囲を指定することで、音声認識の
対象、すなわち認識対象語を絞ることができる。例え
ば、メニュで「地図」が選択され、図2に示すようにア
プリケーション画面表示部13に日本全域の地図が表示
されている場合には、日本全域の都市名が認識対象語と
なっているが、タッチペン18である地域が指定される
と、その指定された地域内の都市名のみが認識対象語と
なる。
【0029】図1に示すデータベースシステム10を使
用する場合、まず選択キー14またはタッチペン18で
メニューを選択する。そして、メニューが選択された状
態で、ユーザはマイクロホン11に向かってしゃべって
音声入力をする。最初は、認識対象語は画面表示部13
に表示されているアプリケーション画面に関連する全て
の語である。例えば、上述したようにメニューより「地
図」が選択され、画面表示部13に日本全域が表示され
ている場合には、日本全域の都市名が認識対象語となっ
ている。
【0030】音声入力があると、システム内部で音声認
識処理が起動し、終了したところで、その結果である認
識候補を出力する。図示せずも、画面表示部13に表示
されているアプリケーション画面上で、選択キー14ま
たはタッチペン18を使用して、音声出力モードまたは
表示出力モードが選択される。
【0031】音声認識は一般に誤認識を伴うため、認識
の結果として所定個数の認識候補が用意される。そし
て、ユーザによって所定個数の認識候補のうち一定個数
の上位候補より1個の認識候補が選択される。例えば、
音声認識処理によって50個の認識候補が決定され、上
位候補としての5個の認識候補が選択対象とされる。
【0032】表示出力モードが選択されている場合につ
いて説明する。この場合、上述した選択対象としての認
識候補のうち最上位のものが認識1位候補として認識候
補表示部17aに表示される。表示出力モードが選択さ
れている場合、ユーザはさらに4項目の音声入力を行う
ことができ、各項目における選択対象としての認識候補
のうち最上位のものが認識1位候補として認識候補表示
部17b〜17eにそれぞれ表示される。なお、その後
にユーザがさらに音声入力を行った場合には、古いもの
から順次更新されていく。ユーザは、選択キー14dや
タッチペン8を使用して、認識候補表示部17a〜17
eのいずれかを選択することで項目を選択し、その後に
選択操作をする。
【0033】例えば、認識候補表示部17aが選択され
た場合を例にとって選択操作を説明する。選択キー14
cを押す毎に、認識候補表示部17aには順次次候補が
表示され、選択対象としての認識候補の最下位候補まで
表示された次には最上位候補が表示された最初の状態に
戻る。認識候補表示部17aに所望の認識候補が表示さ
れている状態で決定キー15を押すことで、1個の認識
候補の選択が確定する。このように認識候補が確定した
状態で、再度決定キー15を押すことで、画面表示部1
3には、その認識候補に対応した情報が表示される。例
えば、メニューより「地図」が選択されているときは、
確定した1個の認識候補に対応した都市名の地図が画面
表示部13に表示されることとなる。なお、画面表示部
13には認識候補に対応した情報が表示されている状態
で、例えばキャンセルキー16を押すことで、前の画面
に戻り、他の項目に関しての選択操作等を行うことが可
能となる。そして、さらに例えばキャンセルキー15を
押すことで、画面表示部13は最初のメニュー画面に戻
る。
【0034】次に、音声出力モードが選択されている場
合について説明する。この場合、まず、上述した選択対
象としての認識候補のうち最上位のものが認識1位候補
としてスピーカ12より音声で出力される。この認識候
補が所望の認識候補でないとき、ユーザがキャンセルキ
ー16を押すことで、スピーカ12より次候補が音声で
出力される。以下同様に、キャンセルキー16を押す毎
にスピーカ12より次候補が音声で出力され、選択対象
としての認識候補の最下位候補まで音声出力された次に
は最上位候補が出力されて最初の状態に戻る。所望の認
識候補がスピーカ12より音声で出力された後に決定キ
ー15を押すことで、1個の認識候補の選択が確定す
る。このように認識候補が確定すると、画面表示部13
には、その認識候補に対応した情報が表示される。な
お、この音声出力モードが選択されている場合であって
も、画面表示部13に情報が表示された状態からキャン
セルキー16を押すことで前の画面に戻すことができ
る。
【0035】ところで、表示出力モードの場合であって
も音声出力モードの場合であっても、選択対象としての
認識候補に所望の認識候補がなかった場合、単純には、
ユーザがマイクロホン11に向かって言い直すという方
法がとられるが、ユーザの声の特性により音声認識しに
くい場合には、何度しゃべっても所望の音声認識結果は
得られない。
【0036】音声認識の精度が悪い場合、認識対象語を
減らせば認識率が上がるので、認識対象語を画面表示部
13に表示されているアプリケーション画面に関連する
全ての語から、その一部の語に絞って、もう一度しゃべ
るという方法もとることができる。この場合は、タッチ
ペン18でアプリケーション画面上のある範囲を指定し
てからもう一度マイクロホン11に向かってしゃべれば
よい。
【0037】しかし、いずれの方法の場合も、誤認識に
対して音声入力をやり直すものであり、ユーザに負担が
かかると共に、音声認識処理を最初からやり直すことに
なるので、システムにとっての負担も大きい。また、誤
認識を避けるために、しゃべる前に毎回、タッチペン1
8でアプリケーション画面上の範囲を指定するのも面倒
である。
【0038】そこで、本実施の形態では、タッチペン1
8でアプリケーション画面上のある範囲を指定して認識
対象語を絞った後に、選択キー14aまたは14bを押
して選択対象の再出力を指示した場合、以下のように動
作する。
【0039】選択キー14aを押した場合、第1のモー
ドが選択される。この場合、システム内部で音声認識処
理は起動せず、認識対象語を絞る前に音声認識処理で用
意された所定数の認識候補より認識対象語を絞った結果
残った認識候補のうち上位から一定個数の認識候補が選
択対象とされる。そして、上述したと同様に、ユーザ
は、この選択対象から1個の認識候補を選択する操作を
することになる。この場合、認識対象語を絞る前の所定
個数の認識候補より認識対象語を絞った結果残った認識
候補の上位候補を選択対象とするものであり、この選択
対象に所望の認識候補が含まれることが期待される。
【0040】一方、選択キー14bを押した場合、第2
のモードが選択される。この場合、システム内部で音声
認識処理が起動するが、この音声認識処理では認識対象
語を絞る前と同じ音声入力の分析データと認識対象語に
対応した認識用辞書データとを比較して所定数の認識候
補を用意する。そして、上述したと同様に、ユーザは、
その所定数の認識候補のうち上位から一定個数の認識候
補を対象として1個の認識候補を選択する操作をするこ
とになる。この場合、音声入力のやり直しをせずに、認
識対象語を絞る前の分析データを使用して音声認識処理
をするものであるが、認識対象語を絞っているので、用
意された所定数の認識候補に所望の認識候補が含まれる
ことが期待される。
【0041】図3は、図1に示すデータベースシステム
10の回路構成を示している。このデータベースシステ
ム10は、ユーザが音声を入力するためのマイクロホン
11と、このマイクロホン11からの入力音声信号をデ
ィジタル信号に変換するA/Dコンバータ22と、この
A/Dコンバータ22の出力信号を分析して音声認識処
理に必要な分析データを得るためのデータ分析部23と
を有している。データ分析部23では、例えば、マイク
ロホン11からの入力音声信号を所定の周波数帯域毎に
フィルタリングし、この各周波数帯域毎のフィルタリン
グ結果から入力音声信号の各周波数帯域毎の特徴量を
得、この各周波数帯域毎の特徴量をベクトル化すること
で分析データが得られる。
【0042】また、データベースシステム10は、デー
タ分析部23より出力される分析データを使用して音声
認識処理をするためのCPU(central processing uni
t)24、データを一時的に格納しておくためのRAM
(random access memory)25と、音声認識処理に必要
な音声学習データが記憶されているROM(read only
memory)26とを有している。RAM25およびROM
26は、CPU24に接続されている。
【0043】また、データベースシステム10は、選択
キー14、決定キー15、キャンセルキー16が配され
たキー操作部27と、このキー操作部27からのキー入
力を検出するためのキー入力検出部28と、アプリケー
ション画面表示部13および認識候補表示部17a〜1
7eの表面に配されたタッチパネル29と、このタッチ
パネル29からのパネル入力を検出するためのパネル入
力検出部30とを有している。
【0044】また、データベースシステム10は、キー
入力検出部28およびパネル入力検出部30の検出出力
に基づいて、アプリケーションプログラムや、後述する
ように複数の認識候補より1個の認識候補をユーザに選
択してもらうためのインタフェースプログラムを実行す
るCPU31と、データを一時的に格納しておくための
RAM32と、アプリケーションプログラムやインタフ
ェースプログラムが記憶されているROM33とを有し
ている。RAM32およびROM33は、CPU31に
接続されている。キー入力検出部28よりCPU31に
供給される検出出力は、キー操作部27に配されている
各キーが押されているか否かの情報を持っている。ま
た、パネル入力検出部30よりCPU31に供給される
検出出力は、タッチパネル29が押されたとき、その位
置座標の情報をもっている。
【0045】また、データベースシステム10は、アプ
リケーション画面表示部13および認識候補表示部17
a〜17eを構成する表示パネル34と、この表示パネ
ル34を駆動する表示回路35と、音声出力を行うため
のスピーカ12と、このスピーカ12に供給される音声
信号を合成して出力するための音声合成回路37とを有
している。この場合、CPU31より表示すべき文字、
記号、図形等の情報が表示回路35に供給され、この表
示回路35よりその情報が変換された駆動信号が表示パ
ネル34に供給される。一方、CPU31より音声出力
すべきテキスト情報が音声合成回路37に供給され、こ
の音声合成回路37よりそのテキスト情報が変換された
音声信号がスピーカ12に供給される。
【0046】次に、図3に示すデータベースシステム1
0の動作を説明する。
【0047】ユーザがマイクロホン11に向かってしゃ
べることによって音声を入力すると、マイクロホン11
よりその音声に対応した入力音声信号が得られ、この入
力音声信号はA/Dコンバータ22でディジタル信号に
変換されてデータ分析部23に供給される。データ分析
部23では入力音声信号の分析が行われて音声認識処理
に必要な分析データが得られ、この分析データはCPU
24に供給される。そして、CPU24は、その分析デ
ータをRAM25に記憶させ、後述する音声認識処理に
使用する。
【0048】また、CPU24には、CPU31より認
識対象語を特定するテキスト辞書情報が供給される。こ
こで、認識対象語は、選択キー14によって選択された
メニューによって異なると共に、各メニューのアプリケ
ーション画面上でタッチペン18によって範囲指定され
ることで絞られる。CPU24は、上述したテキスト辞
書情報に基づき、ROM26に記憶されている音声学習
データを用いて認識対象語に対応した認識用辞書データ
を生成してRAM25に記憶させる。
【0049】CPU24は、RAM25に記憶されてい
る認識対象語に対応した認識用辞書データを分析データ
と比較し、所定個数の認識候補を決定する。この場合、
CPU24は、分析データにできるだけ近い認識用辞書
データに対応した所定個数の認識対象語を認識候補とす
る。そして、CPU24よりCPU31に、その所定個
数の認識候補の情報が送られる。
【0050】CPU31は、CPU24より上述したよ
うに所定個数の認識候補の情報が供給されるとき、その
情報をRAM32に記憶させ、認識候補をユーザに示し
て選択してもらうためのインタフェースプログラムの実
行を開始する。この場合、上述した所定個数の認識候補
のうち上位から一定個数の認識候補のみが選択対象とな
る。
【0051】上述したように、表示出力モードが選択さ
れている場合、ユーザはマイクロホン11より複数項目
の音声を連続的に入力でき、各項目の音声入力信号に対
してCPU24は上述したように所定個数の認識候補を
決定し、その情報をCPU31に供給する。そして、C
PU31は、各項目の所定個数の認識候補の情報をRA
M32に記憶させ、同様に各項目毎に認識候補をユーザ
に示して選択してもらうためのインタフェースプログラ
ムの実行を開始する。
【0052】表示出力モードが選択されている場合の選
択動作を説明する。最初に、各項目における選択対象と
しての認識候補のうち最上位のものを認識1位候補とし
て認識候補表示部17a〜17eにそれぞれ表示するよ
うに表示回路35を制御する。この場合、選択操作をす
べき項目は、最後の音声入力に係る項目に自動的に移っ
ているが、ユーザによって選択キー14dが押される毎
に、CPU31は選択操作をすべき項目を移動させてい
く。また、タッチペン18で認識候補表示部17a〜1
7eのいずれかが押されるとき、CPU31は押された
認識候補表示部に対応する項目を選択操作すべき項目と
する。
【0053】例えば、認識候補表示部17aに対応する
項目が選択された場合を例にとって説明する。選択キー
14cが押される毎に、CPU31は認識候補表示部1
7aに次候補を表示するように表示回路35を制御し、
選択対象としての認識候補の最下位候補まで表示した次
には最上位候補を表示する最初の状態に戻るようにす
る。認識候補表示部17aに所望の認識候補が表示され
ている状態で決定キー15が押されるとき、CPU31
はそのとき認識候補表示部17aに表示されている認識
候補を1個の認識候補として確定する。
【0054】このように認識候補が確定した状態で、再
度決定キー15が押されると、CPU31は、アプリケ
ーション画面表示部13にその認識候補に対応した情報
を表示するように表示回路35を制御する。例えば、メ
ニューより「地図」が選択されているときは、確定した
1個の認識候補に対応した都市名の地図が画面表示部1
3に表示されることとなる。
【0055】なお、画面表示部13に認識候補に対応し
た情報を表示している状態で、キャンセルキー16が押
されると、CPU31は画面表示部13に前の画面を表
示するように表示回路35を制御する。これにより、ユ
ーザは、他の項目に関しての選択操作等を行うことが可
能となる。そして、さらにキャンセルキー16が押され
ると、画面表示部13に最初のメニュー画面を表示する
ように表示回路35を制御する。
【0056】次に、音声出力モードが選択されている場
合の選択動作について説明する。最初に、CPU31
は、選択対象としての認識候補のうち最上位候補に係る
音声信号が出力されるように音声合成回路37を制御
し、スピーカ12よりその最上位候補に対応した音声を
出力させる。その後、キャンセルキー16が押される
と、CPU31は音声合成回路37を制御し、スピーカ
12より次候補に対応した音声を出力させる。以下同様
に、キャンセルキー16が押される毎に、スピーカ12
より次候補に対応した音声を出力させ、選択対象として
の認識候補の最下位候補に対応した音声を出力させた次
には最上位候補に対応した音声を出力させる最初の状態
に戻るようにする。
【0057】また、スピーカ12より所定の認識候補に
対応する音声を出力させた後に、決定キー15が押され
ると、CPU31は、その所定の認識候補を1個の認識
候補として確定する。このように認識候補が確定した
後、CPU31は、アプリケーション画面表示部13に
その認識候補に対応した情報を表示するように表示回路
35を制御する。
【0058】なお、画面表示部13に認識候補に対応し
た情報を表示している状態で、キャンセルキー16が押
されると、CPU31は画面表示部13に前の画面を表
示するように表示回路35を制御する。これにより、ユ
ーザは、次の項目の音声入力を行うことが可能となる。
そして、さらにキャンセルキー16が押されると、それ
がキー入力検出部28で検出され、画面表示部13に最
初のメニュー画面を表示するように表示回路35を制御
する。
【0059】また、表示出力モードの場合であっても音
声出力モードの場合であっても、選択対象としての認識
候補に所望の認識候補がなく、ユーザがタッチペン18
でアプリケーション画面上のある範囲を指定して認識対
象語を絞った後に、認識候補の再処理を指示する場合に
ついて説明する。
【0060】アプリケーション画面上でタッチペン18
によって範囲が指定される場合、それがパネル入力検出
部30で検出され、その範囲情報がCPU31に供給さ
れる。CPU31は、この範囲情報に対応したテキスト
辞書情報をCPU24に供給する。CPU24は、その
テキスト辞書情報に基づき、ROM26に記憶されてい
る音声学習データを使用して、範囲指定によって絞られ
た認識対象語に対応した辞書データを生成してRAM2
5に記憶させる。
【0061】この状態で、選択キー14aが押され、再
処理(第1のモード)が指示されると、それがキー入力
部28で検出される。CPU31は、RAM32に記憶
されている所定個数の認識候補より認識対象語を絞った
結果残る認識候補のうち上位から一定個数の候補をユー
ザに示して選択してもらう、上述したインタフェースプ
ログラムの実行を開始する。
【0062】一方、選択キー14bが押され、再処理
(第2のモード)が指示されると、それがキー入力部2
8で検出され、CPU31は、CPU24に、再度音声
認識処理をして、所定個数の認識候補を決定するように
指示する。これに対して、CPU24は、RAM25に
記憶されている範囲指定で絞られた後の認識対象語に対
応した辞書データを、RAM25に記憶されている認識
対象語を絞る前と同じ入力音声の分析データと比較し、
所定個数の認識候補を決定する。この所定個数の認識候
補の情報は、CPU24よりCPU31に送られる。C
PU31は、その所定個数の認識候補の情報をRAM3
2に記憶させ、所定個数の認識候補のうち上位から一定
個数の認識候補をユーザに示して選択してもらう、上述
したインタフェースプログラムの実行を開始する。
【0063】以下、同様に、アプリケーション画面上で
タッチペン18により範囲が指定され、その後に選択キ
ー14aまたは14bが押されて再処理が指示される毎
に、上述した同様に、第1モードあるいは第2のモード
の動作をすることとなる。
【0064】図4は、上述したデータベースシステム1
0の処理の流れを示すオブジェクト相関図である。
【0065】音声入力処理オブジェクト41は、マイク
ロホン11から音声の入力があると、それをサンプリン
グ、A/D変換し、分析処理オブジェクト42に対して
Message1を送る。分析処理オブジェクト42は、Messa
ge1を受けると起動され、音声入力処理オブジェクト4
1のA/D変換データを、音声認識オブジェクト43で
使用できるように分析してデータ変換する。分析処理オ
ブジェクト42は、処理が終わると、音声認識オブジェ
クト43にMessage2を送る。
【0066】音声認識オブジェクト43は、Message2
を受けると起動され、分析処理オブジェクト42で生成
された分析データと認識用辞書オブジェクト49で生成
された辞書データを比較して認識処理を行い、認識結果
として複数の認識候補を用意する。音声認識オブジェク
ト43は、処理が終わると、その結果を添えてMessage
3を候補出力オブジェクト44に送る。なお、ここで使
用した分析データは後で再び必要になる場合があるの
で、RAM25に保存しておく。
【0067】候補出力オブジェクト44はMessage3を
受けると起動され、音声認識オブジェクト43から送ら
れてきた認識候補のデータをRAM32に保存すると共
に、認識候補表示部17a〜17eに表示し、あるいは
スピーカ12から音声出力し、その後のユーザのリアク
ションを待つ。
【0068】ユーザ選択オブジェクト45は、候補出力
オブジェクト44が起動しているときに、ユーザが選択
キー14a,14c,14d、決定キー15、キャンセ
ルキー16を押すか、認識候補表示部17a〜17eの
項目をタッチペン18で触るかした場合、そのアクショ
ンの情報を添えて、候補出力オブジェクト44にMessag
e4を送る。
【0069】また、ユーザ選択オブジェクト45は、ユ
ーザが選択キー14bを押した時は、音声認識オブジェ
クト43にMessage10を送り、それを受けた音声認識
オフジェクト43は、今RAM25にある分析処理オブ
ジェクト42と認識用辞書オブジェクト49の結果を使
って、認識処理を再実行する。
【0070】Message4を受けた候補出力オブジェクト
44は、決定キー15が押されたことを知らされたら、
その時点の認識1位候補を添えて、Message5をアプリ
ケーションプログラムのデータ入力オブジェクト46に
送ると共に、自身の処理を終了する。キャンセルキー1
6が押されたことを知らされたら、認識候補表示部17
a〜17eに認識候補を表示していた場合は、そのまま
自身の処理を終了し、認識候補を音声出力していた場合
は、次の候補を1位候補として音声出力する。
【0071】また、選択キー14aが押されたことを知
らされたら、今RAM32にある認識候補のうち、テキ
スト辞書オブジェクト48で生成されたテキスト辞書デ
ータに合まれるものだけを抽出して、再出力する。その
他の場合は、ユーザからの認識1位候補の変更要求なの
で、1位候補を対応するものに変更する。
【0072】フォーカス処理オブジェクト47は、ユー
ザがアプリケーション画面をタッチペン18で触った位
置情報を計算し、それを添えてMessage6をテキスト辞
書オブジェクト48に送る。テキスト辞書オブジェクト
48は、Message6を受けると、その時点のアプリケー
ション画面内でユーザの指定した部分に関連する語だけ
を含むテキスト辞書を再構築し、そのデータをRAM3
2に保存する。テキスト辞書が変わると、テキスト辞書
オブジェクト48は、候補出力オブジェクト44にはMe
ssage7を送り、認識用辞書オブジェクト49には再構
築したテキスト辞書の情報を添えてMessage8を送る。
【0073】なお、テキスト辞書オブジェクト48でテ
キスト辞書を変更するのはMessage6を受けたときだけ
なく、その時々のアプリケーションプログラムの実行状
態によっても変更処理を行う。
【0074】認識用辞書オブジェクト49は、Message
8を受けると起動し、アプリケーションのテキスト辞書
の変更に合わせて、認識用辞書を再構築する。処理終了
時には、音声認識オブジェクト43にMessage9を送っ
て、認識用辞書が変わったことを知らせる。
【0075】図5は、上述した図4に示すオブジェクト
相関図における各オブジェクトのアクション等をまとめ
て示したものである。
【0076】以上説明したように本実施の形態において
は、認識効率を上げるためにアプリケーション画面上で
タッチペン18により範囲を指定して認識対象語を絞っ
た後は、選択キー14aまたは14bを押して再処理を
指示するのみで、ユーザーの選択対象となる認識候補が
新たに得られる状態となる。したがって、音声入力のや
り直しをする必要がなく、音声入力を効率的に行うこと
ができ、ユーザの使い勝手が向上するという利益があ
る。
【0077】なお、上述実施の形態においては、アプリ
ケーション画面表示部13の上にタッチパネルが配さ
れ、音声認識の認識対象の絞り込み操作として、アプリ
ケーション画面上のある範囲をタッチペン18で指定す
るという方法をとったが、代わりにマウスやトラックボ
ールなどのポインティングデバイスを使用したり、キー
の操作性を工夫するなどして、タッチパネル無しでも、
別の手段で範囲指定を行うことが可能である。
【0078】
【発明の効果】この発明によれば、提示される複数個の
認識候補の中に所望の認識候補がなく、認識対象語を絞
った後に再処理をする際、音声入力のやり直しをせずに
保存データを利用して提示される複数の認識候補を得る
ものであり、音声入力を効率的に行うことができ、ユー
ザーの使い勝手が向上するという利益がある。
【0079】また、認識対象語を絞って再処理を行わせ
る場合、認識対象語を絞る前と同じ分析データを使用し
て所定個数の認識候補を得るようにすることで、認識対
象語を絞ったことにより選択対象としての一定個数の認
識候補が変化し、その一定個数の認識候補に所望の認識
候補が含まれることを期待できる。
【0080】また、認識対象語を絞って再処理を行わせ
る場合、認識対象語を絞る前の所定個数の認識候補より
認識対象語を絞った結果残った認識候補のうち一定個数
の上位候補を選択対象とすることで、その選択対象に所
望の認識候補が含まれることを期待でき、しかも音声認
識処理をしないためシステムの負担を軽減できる。
【図面の簡単な説明】
【図1】実施の形態としてのデータベースシステムの外
観を示す図である。
【図2】メニューで「地図」が選択された場合のアプリ
ケーション画面表示部の表示例を示す図である。
【図3】実施の形態としてのデータベースシステムの回
路構成を示すブロック図である。
【図4】実施の形態としてのデータベースシステムの処
理の流れを示すオブジェクト相関図である。
【図5】図4に示すオブジェクト相関図おける各オブジ
ェクトのアクション等をまとめて示した図である。
【符号の説明】
10・・・データベースシステム、11・・・マイクロ
ホン、12・・・スピーカ、13・・・アプリケーショ
ン画面表示部、14(14a〜14c)・・・選択キ
ー、15・・・決定キー、16・・・キャンセルキー、
17a〜17e・・・認識候補表示部、18・・・タッ
チペン、22・・・A/Dコンバータ、23・・・デー
タ分析部、24,31・・・CPU,25,32・・・
RAM、26,33・・・ROM、27・・・キー操作
部、28・・・キー入力検出部、29・・・タッチパネ
ル、30・・・パネル入力検出部、34・・・表示パネ
ル、35・・・表示回路、37・・・音声合成回路、4
1・・・音声入力処理オブジェクト、42・・・分析処
理オブジェクト、43・・・音声認識オブジェクト、4
4・・・候補出力オブジェクト、45・・・ユーザ選択
オブジェクト、46・・・データ入力オブジェクト、4
7・・・フォーカス処理オブジェクト、48・・・テキ
スト辞書オブジェクト、49・・・認識用辞書オブジェ
クト
フロントページの続き (72)発明者 横尾 直弘 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を分析して音声認識処理に必要
    な分析データを得る音声分析手段と、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理手段と、 上記所定個数の認識候補より1個の認識候補を選択する
    ための認識候補選択手段と、 上記認識対象語を絞る認識対象絞り手段とを備える音声
    認識処理装置であって、 上記認識対象絞り手段で上記認識対象語を絞る操作を行
    った場合、上記音声認識処理手段は、上記認識対象語を
    絞る前と同じ上記分析データを使用して上記所定個数の
    認識候補を得ることを特徴とする音声認識処理装置。
  2. 【請求項2】 上記認識候補選択手段は、 上記所定個数の認識候補のうち上位から一定個数の認識
    候補を1個ずつ表示する認識候補表示部と、 上記認識候補表示部に表示される認識候補を次候補に変
    更する認識候補変更手段と、 上記認識候補表示部に表示された認識候補を上記1個の
    認識候補として確定する認識候補確定手段とを有してな
    る請求項1に記載の音声認識処理装置。
  3. 【請求項3】 上記認識候補選択手段は、 上記所定個数の認識候補のうち上位から一定個数の認識
    候補を1個ずつ音声出力する認識候補音声出力部と、 上記認識候補音声出力部より音声出力される認識候補を
    次候補に変更する認識候補変更手段と、 上記認識候補音声出力部より音声出力された認識候補を
    上記1個の認識候補として確定する認識候補確定手段と
    を有してなる請求項1に記載の音声認識処理装置。
  4. 【請求項4】 入力音声を分析して音声認識処理に必要
    な分析データを得る音声分析ステップと、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理ステップと、 上記所定個数の認識候補より1個の認識候補を選択する
    ための認識候補選択ステップと、 上記認識対象語を絞る認識対象絞りステップとを備える
    音声認識処理方法であって、 上記認識対象絞りステップで上記認識対象語を絞る操作
    を行った場合、上記音声認識処理ステップでは、上記認
    識対象語を絞る前と同じ上記分析データを使用して上記
    所定個数の認識候補を得ることを特徴とする音声認識処
    理方法。
  5. 【請求項5】 入力音声を分析して音声認識処理に必要
    な分析データを得る音声分析手段と、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理手段と、 上記所定個数の認識候補より1個の認識候補を選択する
    ための認識候補選択手段と、 上記認識対象語を絞る認識対象絞り手段とを備える音声
    認識処理装置であって、 上記認識候補選択手段は上記所定個数の認識候補のうち
    上位から一定個数の認識候補を対象として1個の認識候
    補を選択し、 上記認識対象絞り手段で上記認識対象語を絞る操作を行
    った場合、上記認識候補選択手段は、上記所定個数の認
    識候補より上記認識対象語を絞った結果残った認識候補
    のうち上位から一定個数の認識候補を対象として上記1
    個の認識候補を選択することを特徴とする音声認識処理
    装置。
  6. 【請求項6】 上記認識候補選択手段は、 上記一定個数の認識候補を1個ずつ表示する認識候補表
    示部と、 上記認識候補表示部に表示される認識候補を次候補に変
    更する認識候補変更手段と、 上記認識候補表示部に表示された認識候補を上記1個の
    認識候補として確定する認識候補確定手段とを有してな
    る請求項5に記載の音声認識処理装置。
  7. 【請求項7】 上記認識候補選択手段は、 上記一定個数の認識候補を1個ずつ音声出力する認識候
    補音声出力部と、 上記認識候補音声出力部より音声出力される認識候補を
    次候補に変更する認識候補変更手段と、 上記認識候補音声出力部より音声出力された認識候補を
    上記1個の認識候補として確定する認識候補確定手段と
    を有してなる請求項5に記載の音声認識処理装置。
  8. 【請求項8】 入力音声を分析して音声認識処理に必要
    な分析データを得る音声分析ステップと、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理ステップと、 上記所定個数の認識候補より1個の認識候補を選択する
    ための認識候補選択ステップと、 上記認識対象語を絞る認識対象絞りステップとを備える
    音声認識処理方法であって、 上記認識候補選択ステップでは上記所定個数の認識候補
    のうち上位から一定個数の認識候補を対象として1個の
    認識候補を選択し、 上記認識対象絞りステップで上記認識対象語を絞る操作
    を行った場合、上記認識候補選択ステップでは、上記所
    定個数の認識候補より上記認識対象語を絞った結果残っ
    た認識候補のうち上位から一定個数の認識候補を対象と
    して上記1個の認識候補を選択することを特徴とする音
    声認識処理方法。
  9. 【請求項9】 入力音声を分析して音声認識処理に必要
    な分析データを得る音声分析手段と、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理手段と、 上記所定個数の認識候補のうち上位から一定個数の認識
    候補より1個の認識候補を選択するための認識候補選択
    手段と、 上記認識対象語を絞る認識対象絞り手段とを備える音声
    認識処理装置であって、 上記認識対象絞り手段で上記認識対象語を絞る操作を行
    った後、第1のモードまたは第2のモードのいずれかを
    選択するモード選択手段を有し、 上記第1のモードが選択される場合、上記認識候補選択
    手段は、上記所定個数の認識候補より上記認識対象語を
    絞った結果残った認識候補のうち上位から一定個数の認
    識候補を対象として上記1個の認識候補を選択すると共
    に、上記第2のモードが選択される場合、上記音声認識
    処理手段は、上記認識対象語を絞る前と同じ上記分析デ
    ータを使用して上記所定個数の認識候補を得ることを特
    徴とする音声認識処理装置。
  10. 【請求項10】 入力音声を分析して音声認識処理に必
    要な分析データを得る音声分析ステップと、 上記分析データを認識対象語に対応した認識用辞書デー
    タと比較し、上記認識対象語より所定個数の認識候補を
    得る音声認識処理ステップと、 上記所定個数の認識候補のうち上位から一定個数の認識
    候補より1個の認識候補を選択するための認識候補選択
    ステップと、 上記認識対象語を絞る認識対象絞りステップとを備える
    音声認識処理方法であって、 上記認識対象絞りステップで上記認識対象語を絞る操作
    を行った後に、第1のモードまたは第2のモードのいず
    れかを選択するモード選択ステップをさらに有し、 上記モード選択ステップで上記第1のモードが選択され
    る場合、上記認識候補選択ステップでは上記所定個数の
    認識候補より上記認識対象語を絞った結果残った認識候
    補のうち上位から一定個数の認識候補を対象として上記
    1個の認識候補を選択すると共に、上記モード選択ステ
    ップで上記第2のモードが選択される場合、上記音声認
    識処理ステップでは上記認識対象語を絞る前と同じ上記
    分析データを使用して上記所定個数の認識候補を得るこ
    とを特徴とする音声認識処理方法。
JP9172123A 1997-06-27 1997-06-27 音声認識処理装置および音声認識処理方法 Pending JPH1124695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9172123A JPH1124695A (ja) 1997-06-27 1997-06-27 音声認識処理装置および音声認識処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9172123A JPH1124695A (ja) 1997-06-27 1997-06-27 音声認識処理装置および音声認識処理方法

Publications (1)

Publication Number Publication Date
JPH1124695A true JPH1124695A (ja) 1999-01-29

Family

ID=15935989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9172123A Pending JPH1124695A (ja) 1997-06-27 1997-06-27 音声認識処理装置および音声認識処理方法

Country Status (1)

Country Link
JP (1) JPH1124695A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305590A (ja) * 1999-04-16 2000-11-02 Alpine Electronics Inc 音声認識方法
JP2001109492A (ja) * 1999-10-07 2001-04-20 Alpine Electronics Inc 音声認識方法
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
JP2003271192A (ja) * 2002-03-13 2003-09-25 Nissan Motor Co Ltd 音声認識装置
JP2004020883A (ja) * 2002-06-17 2004-01-22 Fujitsu Ten Ltd 音声認識装置及びナビゲーション装置
JP2004252121A (ja) * 2003-02-20 2004-09-09 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
WO2010061751A1 (ja) * 2008-11-25 2010-06-03 旭化成株式会社 重み係数生成装置、音声認識装置、ナビゲーション装置、車両、重み係数生成方法、及び重み係数生成プログラム
JP2020529032A (ja) * 2018-06-12 2020-10-01 深▲せん▼市合言信息科技有限公司Langogo Technology Co.,Ltd. 音声認識翻訳方法及び翻訳装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305590A (ja) * 1999-04-16 2000-11-02 Alpine Electronics Inc 音声認識方法
JP2001109492A (ja) * 1999-10-07 2001-04-20 Alpine Electronics Inc 音声認識方法
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
JP2003271192A (ja) * 2002-03-13 2003-09-25 Nissan Motor Co Ltd 音声認識装置
JP2004020883A (ja) * 2002-06-17 2004-01-22 Fujitsu Ten Ltd 音声認識装置及びナビゲーション装置
JP2004252121A (ja) * 2003-02-20 2004-09-09 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
WO2010061751A1 (ja) * 2008-11-25 2010-06-03 旭化成株式会社 重み係数生成装置、音声認識装置、ナビゲーション装置、車両、重み係数生成方法、及び重み係数生成プログラム
CN102224542A (zh) * 2008-11-25 2011-10-19 旭化成株式会社 权重系数生成装置、声音识别装置、导航装置、车辆、权重系数生成方法、以及权重系数生成程序
US8688449B2 (en) 2008-11-25 2014-04-01 Asahi Kasei Kabushiki Kaisha Weight coefficient generation device, voice recognition device, navigation device, vehicle, weight coefficient generation method, and weight coefficient generation program
JP2020529032A (ja) * 2018-06-12 2020-10-01 深▲せん▼市合言信息科技有限公司Langogo Technology Co.,Ltd. 音声認識翻訳方法及び翻訳装置

Similar Documents

Publication Publication Date Title
JP3943492B2 (ja) ディクテーションとコマンドの区別を向上させる方法
JP4012143B2 (ja) 情報処理装置およびデータ入力方法
JP3662780B2 (ja) 自然言語を用いた対話システム
JP6570651B2 (ja) 音声対話装置および音声対話方法
US7010490B2 (en) Method, system, and apparatus for limiting available selections in a speech recognition system
EP1739656B1 (en) Speech recognition method and speech recognition apparatus
JPWO2005101235A1 (ja) 対話支援装置
JP2006048628A (ja) マルチモーダル入力方法
JPH1124695A (ja) 音声認識処理装置および音声認識処理方法
JP6522009B2 (ja) 音声認識システム
JP2617527B2 (ja) 音声認識装置
KR20010015934A (ko) 음성인식을 이용한 응용프로그램의 메뉴 실행방법
JPH09258946A (ja) 情報処理装置
CN112424771A (zh) 信息处理设备、信息处理方法以及程序
JP2007127896A (ja) 音声認識装置及び音声認識方法
TWI582756B (zh) A method of switching input mode, a mobile communication device, and a computer readable medium
JP6746886B2 (ja) 学習支援装置及びその学習支援装置用のプログラム
JP4702081B2 (ja) 文字入力装置
JP3254977B2 (ja) 音声認識方法及び音声認識装置
JPH0944600A (ja) オンライン文字認識に於ける入力文字予測方法、及びその装置
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP4229627B2 (ja) ディクテーション装置、方法及びプログラム
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JPS6211731B2 (ja)
US11194466B2 (en) Procedure for entering commands for an electronic setup