JPH09237098A - 音声入力を用いた情報処理装置 - Google Patents

音声入力を用いた情報処理装置

Info

Publication number
JPH09237098A
JPH09237098A JP8071124A JP7112496A JPH09237098A JP H09237098 A JPH09237098 A JP H09237098A JP 8071124 A JP8071124 A JP 8071124A JP 7112496 A JP7112496 A JP 7112496A JP H09237098 A JPH09237098 A JP H09237098A
Authority
JP
Japan
Prior art keywords
voice
input
information
word
designated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8071124A
Other languages
English (en)
Inventor
Kenji Otoshi
健治 大年
Tomoyoshi Sato
友良 佐藤
Takumi Yamada
卓美 山田
Katsumi Kobayashi
克己 小林
Nobuo Hataoka
信夫 畑岡
Haru Andou
ハル 安藤
Youichi Shigino
陽一 鴫野
Jiyunko Tamura
潤子 田村
Hiroki Takeda
浩樹 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8071124A priority Critical patent/JPH09237098A/ja
Publication of JPH09237098A publication Critical patent/JPH09237098A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 情報入力処理を迅速、正確かつ簡便に行なう
に好適な音声入力を用いた情報処理装置を提供すること
にある。 【解決手段】 少くとも、情報を表示する情報表示手段
5と、表示画面の位置を入力する位置情報入力手段6
と、音声を入力する音声情報入力手段9と、位置及び音
声を記憶する記憶手段30と、標準パターンデータ記憶
手段209と、標準パターンデータ記憶手段に記憶され
ているデータを用いて入力音声の尤度を算出し、算出さ
れた尤度のうち最大値を持つ単語を入力単語の最有力候
補とする音声認識手段203を有する音声入力を用いた
情報処理装置であって、複数の音声情報を連続的に発声
し、同時に、画面上に複数の入力位置を指定すると、発
声内容を指定した入力位置の数から構成される複数の単
語とみなして音声認識し、認識された複数個の単語を指
定された指定位置に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パソコン、ワーク
ステーション、ワープロ等のOA機器に搭載された情報
編集システムや表示画面を有する音声応用システム等に
おける音声入力を用いた情報処理装置に関する。
【0002】
【従来の技術】従来、情報編集処理をするシステムの例
として、列車の運行に関する輸送総合システムが知られ
ている、その輸送総合システムの入力端末は、情報を入
力する場合に、ユーザが入力すべき情報をコード番号一
覧から捜し出し、このコード番号をキーボードより入力
している。そして、情報の入力結果をユーザによる確認
処理によって行っている。
【0003】
【発明が解決しようとする課題】上記の従来技術は、ユ
ーザが入力すべき情報をコード番号一覧から捜し出す作
業が必要であるため、情報入力に時間が掛かり過ぎた
り、入力ミスが発生するなどの問題があった。本発明の
課題は、情報入力処理を迅速、正確かつ簡便に行なうに
好適な音声入力を用いた情報処理装置を提供することに
ある。
【0004】
【課題を解決するための手段】上記課題は、少くとも、
情報を表示する情報表示手段と、表示画面の位置を入力
する位置情報入力手段と、音声を入力する音声情報入力
手段と、前記位置及び前記音声を記憶する記憶手段と、
標準パターンデータ記憶手段と、前記標準パターンデー
タ記憶手段に記憶されているデータを用いて前記音声の
尤度を算出し、該算出された尤度のうち最大値を持つ単
語を入力単語の最有力候補とする音声認識手段を有する
音声入力を用いた情報処理装置であって、複数の音声情
報を連続的に発声し、同時に、画面上に複数の入力位置
を指定すると、発声内容を指定した入力位置の数から構
成される複数の単語とみなして音声認識し、認識された
複数個の単語を指定された指定位置に順次あるいは一括
して表示することによって、解決される。ここで、この
場合、標準パターンデータ記憶手段に記憶される標準パ
ターン内容を指定した入力位置に対応して別々に構成す
る。また、地図等領域を表す図面またはシステム構成図
等の系統図を表示する手段を備え、図面上の任意の範囲
を指示すると、指示された範囲内に存在する単語を認識
するために必要な標準パターンデータ記憶手段の標準パ
ターン内容を再構成し、発声内容の音声認識結果を所定
の位置に表示することによって、解決される。ここで、
この場合、表示されている図面上の任意の範囲を指示
し、同時に発声した入力単語名を入力単語として音声認
識し、該認識された単語内容を含む全てあるいは一部の
単語情報を指定された図面上の範囲内に表示することに
よって、解決される。また、時刻、列車番号、番線、行
先等の情報を含む駅情報テーブルを具備し、該駅情報テ
ーブルに含まれている情報を項目別に別位置に表示する
と共に音声の入力位置を指定し、同時に駅情報を音声入
力すると、入力された音声情報と前記駅情報テーブルと
の照合を行ない、照合された情報を抽出して音声認識
し、指定位置に音声認識結果を表示することによって、
解決される。また、音声認識した結果と指定した入力位
置が合致しない場合、音声認識した結果を強制的に既指
定入力位置に表示した上で、該表示に基づいて該当する
入力位置を指定し、既認識結果を正しい入力位置に移動
させるエラー処理によって、解決される。
【0005】本発明は、ユーザが複数の音声情報を連続
的に発声し、同時に、複数の入力位置をポインティング
ジェスチャ等で指定すると、発声内容を複数の単語とみ
なして、認識された複数個の単語を指定位置に表示する
ため、情報入力処理を迅速、正確かつ簡便に行なうこと
が可能になる。また、地図等領域を表す図面やシステム
構成図などの系統図が表示されているディスプレイ上
で、ポインティングジェスチャにより範囲を指示するこ
とにより、指示された範囲内に存在する単語を再構成
し、さらに、単語情報の一部分を音声入力することによ
り、音声認識結果を含む単語情報を検索し、図面上に位
置と完全な単語情報を共に表示するため、ユーザは正し
い情報を迅速かつ容易に得ることができる。また、駅情
報テーブルに含まれている時刻、列車番号、番線、行先
等の情報を項目別に別位置に表示すると共に音声の入力
位置を指定し、同時に駅情報を音声入力すると、入力さ
れた音声情報と前記駅情報テーブルとの照合を行ない、
照合された情報を抽出して音声認識し、指定位置に音声
認識結果を表示するため、認識候補を絞って認識確度を
高めることが可能になる。また、音声認識結果と入力指
定位置が合致しない場合、音声認識結果を強制的に既指
定入力位置に表示した上で、音声とポインティングジェ
スチャ等により、既認識結果を正しい入力箇所へ移動さ
せるエラー処理を行なうため、エラー処理の工数を軽減
することが可能になる。
【0006】
【発明の実施の形態】以下、本発明の実施形態を図面を
用いて説明する。ここでは、輸送管理システムを想定し
て説明を行なう。ただし、本発明は、該システムに限ら
ず、CADシステム、画像処理システム、図形編集シス
テム等への応用が可能である。図1は、本発明の一実施
形態による音声入力を用いた情報処理装置を示す。図1
において、本実施形態は、主処理装置(CPU)1、デ
ィスク20、主記憶装置30、パネル制御装置40、デ
ィスプレイ5、タッチパネル6、表示制御装置7、A/
D変換装置8、マイク9からなる。ディスク20は、シ
ステムプログラム201、運行管理支援プログラム20
2、音声認識プログラム203、ポインティング領域読
み込みプログラム204、情報統合プログラム205、
音声出力制御プログラム206、画像表示プログラム2
07、音声波形辞書208、音声標準パターンデータ2
09、単語辞書210、運行管理知識データベース21
1を有し、また、主記憶装置30は、駅情報テーブル3
01、ポインティング領域テーブル302を有する。主
処理装置(CPU)1は、システム立ち上げ時に、ディ
スク20上の各プログラム201〜207、各辞書、デ
ータ208〜211を主記憶装置30にロードする。
【0007】図2は、主記憶装置30にロードされた運
行管理支援プログラム202を通じてディスプレイ5に
表示された情報編集画面の一例である。図2において
は、駅名101、区分102、着時刻103、発時刻1
04、番線105、番線2106、表示107、有効1
08が運行管理支援プログラム202によって主記憶装
置30に記憶された駅情報テーブル301に基づいて項
目別に表示される。ユーザは、画面上の項目のうちから
入力位置を1つもしくは複数指定し、編集作業を行な
う。いま、着時刻103と発時刻104と番線105の
項目にそれぞれ「11時3分着」、「11時3分45秒
発」、「2番線」という情報を入力する場合、それぞれ
の情報は、区切ることなく、「じゅういちじさんぷんち
ゃくじゅういちじさんぷんよんじゅうごびょうはつにば
んせん」と連続して発声し、同時に、着時刻103、発
時刻104、番線105をポインティングジェスチャ1
00等により指定する。音声により入力された情報は、
3つの単語によって構成されていると見做して、音声認
識を実行する。認識された3つの単語は、ポインティン
グジェスチャ100等で指定された指定位置に、順次あ
るいは一括して表示する。すなわち、「11時3分」を
着時刻103に、「11時3分45秒」を発時刻104
に、そして「2番線」を番線105に表示する。ここ
で、音声出力制御プログラム206および画像表示プロ
グラム207は、ディスプレイ5に出力される音声や画
像を制御し、音声波形辞書208は、マイク9から入力
される音声を照合特定し、また、運行管理知識データベ
ース211は、運行管理上必要に応じて参照する。
【0008】以下、本実施形態について詳細に説明す
る。図3は、音声認識プログラム203の構成の一例を
示す。音声認識プログラム203は、音声入力プログラ
ム2031、特徴抽出プログラム2032、標準パタン
マッチングプログラム2033、辞書マッチングプログ
ラム2034より構成する。まず、主処理装置1は、音
声認識プログラム203を起動し、さらにポインティン
グ領域読み込みプログラム204を起動する。音声認識
プログラム203が起動されると、最初に、音声入力プ
ログラム2031が起動する。ユーザは、タッチパネル
5上で入力位置等を指示しながら、同時にマイク4を用
いて音声により情報入力を行なう。その結果、該システ
ムはユーザの意図を理解し、情報編集を行なう。
【0009】本実施形態では、ユーザが図1のマイク4
に向かって「11時3分着、11時3分45秒発、2番
線」と発声しながら、同時にタッチパネル5上で入力位
置を指示する場合について述べる。入力された音声は、
音声入力プログラム2031によって、A/D変換装置
8に取り込まれ、ディジタル信号に変換された後、主記
憶装置30に送られる。続いて、特徴抽出プログラム2
032が起動し、該ディジタル信号を10msのフレー
ム周期で、特徴ベクトルとして、LPCケプストラム係
数(例えば、斎藤、中田「音声情報処理の基礎」(オー
ム社、昭56)に記載)の時系列に変換する。ここで、
フレーム周期は10msに限定されることなく、20m
s、30ms等任意に設定することができる。また、特
徴ベクトルも、LPCケプストラム係数のみに限定され
ず、バンドパスフィルタの出力などを使用することも可
能である。
【0010】一方、主記憶装置30上のポインティング
領域読み込みプログラム204は、音声認識プログラム
203が起動されるのと同時に起動され、並列処理が行
なわれる。このとき、主記憶装置30上のバッファメモ
リPおよびQ(図示せず)をゼロリセットする。該プロ
グラム204は、ユーザの指先あるいはペン等がタッチ
パネル6に触れている間、一定時間間隔で接触座標をパ
ネル制御装置4を通じて取り込み、座標を取り込む毎に
Pをインクリメントする。ここで、図4に、ポインティ
ング領域テーブル302の一例を示す。ポインティング
領域テーブル302は、座標番号3021、入力時刻T
3022、X座標3023、Y座標3024より構成す
る。ポインティング領域読み込みプログラム204は、
主記憶装置30のポインティング領域テーブル302中
に取り込んだX座標を配列メモリX[P]へ、Y座標を
配列メモリY[P]へ、座標入力時刻を配列メモリT
[P]へ、一定時間毎に、入力された順序で座標番号
“1”から格納していく。前記例では、100ms毎に
座標データを記憶する。また、指先あるいはペン等がタ
ッチパネル5から離れてから、ある一定時間Toが経過
すると、書き込みを終了する。次に、座標番号“1”
(X1,Y1)“2”(X2,Y2)“3”(X3,Y
3)・・を含む、予め決められた表示領域の個数を数
え、主記憶装置30に記憶する。
【0011】ユーザによるポインティング入力や音声入
力が終了すると、標準パタンマッチングプログラム20
33と辞書マッチングプログラム2034が起動する。
ここで、図5に、単語辞書210の一例を示す。単語辞
書210は、単語2101と、単語内容2102、概念
番号2103よりなる。概念番号2103は、意味が類
似している単語を分類した識別番号である。辞書マッチ
ングプログラム2034は、起動時に単語辞書210を
用いる。まず、先程求めた特徴ベクトルと音声標準パタ
ーンデータ(音響標準パターンデータもしくは単語デー
タもしくは文法データのうちの少なくとも一つのデータ
を記憶する。)209とのマッチングが行なわれ(例え
ば、北原他「音声入力による情報検索システムにおける
口語文受理方法の検討」(日本音響学会、3−5−7、
平3)に記載)、その結果、入力音声は文字列に変換さ
れる。例えば、“じゅう いち じ さん ぷん ちゃ
く じゅう いち じ さん ぷん よん じゅう ご
びょう はつ に ばん せん”となる。この時、各
単語毎に確度が計算され、候補の順位づけが行なわれ
る。さらに、前記文字列は、従来から行なわれている方
法すなわち最長一致法(例えば、相沢他「計算機による
カナ漢字変換」(NHK技術研究、25、5、昭48)
に記載)を用いて形態素解析され、さらに、単語辞書2
10とのマッチングを行なう。その際、音声標準パター
ンデータ209をポインティングジェスチャ100等で
指定した入力位置に対応して別々に構成し、ポインティ
ングジェスチャ等で指定した入力位置に入力される単語
内容を持つ単語とだけマッチングを行う。その結果、
(じゅういちじさんぷん、時刻、801)、(ちゃく、
名詞、12045)、(じゅういちじさんぷんよんじゅ
うごびょう、時刻、848)、(はつ、名詞、1204
6)、(にばんせん、番線、12002)のような形態
素情報が得られる。この形態素情報には、認識確度の高
い順に入力位置別に単語番号Wor[i,j](i=1
〜m,j=1〜n)が与えられる。本実施形態では“1
1時3分”がWor[1,1]=概念番号801とな
る。この時、マッチングされた単語数が、ポインティン
グジェスチャ100等により指定された表示領域の個数
に等しくなるように処理する。
【0012】次に、情報統合プログラム205が起動
し、概念番号801番の時刻、概念番号12045番の
名詞、概念番号848番の時刻、概念番号12046番
の名詞、概念番号10002番の番線の入力順序と複数
のポインティングの入力順序の時間的対応づけ(例え
ば、北原他「複合形態入力方式(特願平04−2212
34号公報)」に記載)を行なう。本実施形態では、座
標番号1が着時刻を、座標番号2が発時刻を、座標番号
3が番線を示す。次に、主記憶装置30上の座標番号
“1”(X1,Y1)、“2”(X2,Y2)、“3”
(X3,Y3)を含む予め定められた表示領域に、それ
ぞれ着時刻、発時刻及び番線が表示される。本実施形態
の場合は、概念番号801が着時刻の、概念番号848
が発時刻の、概念番号10002が番線の候補名称とし
て認識され、「11時3分」を着時刻103に、「11
時3分45秒」を発時刻104に、「2番線」を番線1
05に表示する。このように、本実施形態は、入力する
情報について、ユーザが複数の情報を連続的に発声し
て、同時に複数の入力位置をポインティングジェスチャ
等で指定すると、発声内容を指定した数で構成される複
数の単語とみなして音声認識を実行し、認識された複数
個の単語をポインティングジェスチャ等で指定された指
定位置に順次あるいは一括して表示する。これにより、
情報入力処理を簡便に行なうことができる。
【0013】図6は、本発明の入力操作の一概念を示す
画面表示例である。図2のように、音声とポインティン
グジェスチャにより情報入力を行なったにも拘らず、
「11時3分」の認識がなされなかった場合、まず、
(じゅういちじさんぷんよんじゅうごびょう、時刻、8
48)をWor[1,1]に認識結果として当て嵌め、
発時刻に対応するWor[2,n]は認識されなかった
ものとして、表示する。次に、ポインティングジェスチ
ャ等で着時刻と発時刻を指示することにより、Wor
[1,1]に当て嵌められていた情報(じゅういちじさ
んぷんよんじゅうごびょう、時刻、848)をWor
[2,1]に移動させる。このようにして、音声認識結
果と入力指定位置が合致しない場合、既認識結果を正し
い入力箇所へ移動させるエラー処理を行なう。
【0014】図7は、本発明の一概念を示すディスプレ
ィの画面表示例である。路線図上で東京、四谷、新宿の
各駅をポインティングジェスチャによって指示、あるい
は“東京”“四谷”“新宿”と音声入力したのち、音声
によって“高尾行き”などと条件を同時に指示する。こ
こで、図8に、駅情報テーブル301の一例を示す。駅
情報テーブル301は、各駅毎の区分3011、着時刻
3012、発時刻3013、番線3014、番線230
15、表示3016、有効3017の項目から構成す
る。指示された条件に基づき、該駅情報テーブル301
中の東京、四谷、新宿の各駅の駅情報から、“高尾”行
きの列車情報を抜き出して再構成し、ディスプレイ5に
表示する。また、条件を“高尾行き、10時台”とすれ
ば、図7のように、10時台に発車する“高尾”行きの
列車情報のみを表示する。
【0015】図9は、本発明の他の実施形態を示すシス
テム構成図である。図9は、図1のシステム構成におけ
るディスク20中に、地図情報データベース212を付
加したものであり、地図はディスプレイ5に表示され
る。なお、地図はディスプレイ5以外の表示装置で表示
してもよい。
【0016】図10は、本発明の他の実施形態の一概念
を示すディスプレィの画面表示例である。例えば、船橋
法典駅の駅情報を表示したいが、駅名が正確にわからな
いような場合、路線図上でポインティングジェスチャに
より範囲あるいは線区を指示すると、単語辞書210内
の単語内容2102における駅名のうちで、指示された
範囲あるいは線区に含まれる駅名のみを抜き出して、主
記憶装置30上で再構成する。その後“ふなばし”と音
声で入力すると、該単語辞書210から“ふなばし”を
含むものを検索し、検索結果の駅名称を全て路線図上に
位置関係が分かるように表示する。このようにして、路
線図上の範囲を指示することにより、指示された範囲内
に存在する標準パタン情報の内容を再構成し、さらに、
発声内容の音声認識結果を所定の位置に表示するので、
ユーザは正しい情報を迅速かつ容易に得ることができ
る。なお、本実施形態は、システム構成図などの系統図
にも適用できる。
【0017】
【発明の効果】以上説明したように、本発明によれば、
ユーザが複数の音声情報を連続的に発声し、同時に、複
数の入力位置をポインティングジェスチャ等で指定する
と、発声内容を複数の単語とみなして、認識された複数
個の単語を指定位置に表示するので、情報入力処理を迅
速、正確かつ簡便に行なうことが可能になる。また、標
準パタン情報記憶手段に記憶される標準パタン内容をポ
インティングジェスチャ等で指定した入力位置に対応し
て別々に構成するので、情報入力処理を簡便に行なうこ
とが可能である。また、地図等領域を表す図面やシステ
ム構成図などの系統図が表示されているディスプレイ上
で、ポインティングジェスチャ等により図面上の範囲を
指示することにより、指示された範囲内に存在するイン
デックスとしての単語を認識するのに必要な標準パタン
情報の内容を再構成し、さらに、単語情報の一部分を音
声入力することにより、音声認識結果を含む単語情報を
検索し、図面上に位置と完全な単語情報を共に表示する
ため、ユーザは正しい情報を迅速かつ容易に得ることが
できる。また、駅情報テーブルに含まれている時刻、列
車番号、番線、行先等の情報を項目別に別位置に表示す
ると共に音声の入力位置を指定し、同時に駅情報を音声
入力すると、入力された音声情報と前記駅情報テーブル
との照合を行ない、照合された情報を抽出して音声認識
し、指定位置に音声認識結果を表示するため、認識候補
を絞って認識確度を高めることが可能になる。また、音
声認識結果と入力指定位置が合致しない場合、音声認識
結果を強制的に既指定入力位置に表示したうえで、音声
とポインティングジェスチャ等により、既認識結果を正
しい入力箇所へ移動させるエラー処理を行なうので、エ
ラー処理の工数を軽減することが可能である。
【図面の簡単な説明】
【図1】本発明の一実施形態による音声入力を用いた情
報処理装置
【図2】本発明の情報編集画面の一例
【図3】音声認識プログラムの構成の一例
【図4】ポインティング領域テーブルの一例
【図5】単語辞書の一例
【図6】本発明の入力操作の一概念を示す画面表示例
【図7】本発明の一実施形態の一概念を示すディスプレ
ィの画面表示例
【図8】駅情報テーブルの一例
【図9】本発明の他の実施形態
【図10】本発明の他の実施形態による一概念を示すデ
ィスプレィの画面表示例
【符号の説明】
1 情報処理装置 20 ディスク 30 主記憶装置 4 パネル制御装置 5 ディスプレイ 6 タッチパネル 7 表示制御装置 8 A/D変換装置 9 マイク
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小林 克己 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所内 (72)発明者 畑岡 信夫 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 安藤 ハル 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 鴫野 陽一 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所情報システム事業部内 (72)発明者 田村 潤子 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所情報システム事業部内 (72)発明者 武田 浩樹 大阪府大阪市中央区北浜三丁目5番29号 日立西部ソフトウェア株式会社内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 少くとも、情報を表示する情報表示手段
    と、表示画面の位置を入力する位置情報入力手段と、音
    声を入力する音声情報入力手段と、前記位置及び前記音
    声を記憶する記憶手段と、標準パターンデータ記憶手段
    と、前記標準パターンデータ記憶手段に記憶されている
    データを用いて前記音声の尤度を算出し、該算出された
    尤度のうち最大値を持つ単語を入力単語の最有力候補と
    する音声認識手段を有する音声入力を用いた情報処理装
    置であって、複数の音声情報を連続的に発声し、同時
    に、画面上に複数の入力位置を指定すると、発声内容を
    指定した入力位置の数から構成される複数の単語とみな
    して音声認識し、認識された複数個の単語を指定された
    指定位置に順次あるいは一括して表示することを特徴と
    する音声入力を用いた情報処理装置。
  2. 【請求項2】 請求項1において、標準パターンデータ
    記憶手段に記憶される標準パターン内容を指定した入力
    位置に対応して別々に構成することを特徴とする音声入
    力を用いた情報処理装置。
  3. 【請求項3】 少くとも、情報を表示する情報表示手段
    と、表示画面の位置を入力する位置情報入力手段と、音
    声を入力する音声情報入力手段と、前記位置及び前記音
    声を記憶する記憶手段と、標準パターンデータ記憶手段
    と、前記標準パターンデータ記憶手段に記憶されている
    データを用いて前記音声の尤度を算出し、該算出された
    尤度のうち最大値を持つ単語を入力単語の最有力候補と
    する音声認識手段を有する音声入力を用いた情報処理装
    置であって、地図等領域を表す図面またはシステム構成
    図等の系統図を表示する手段を備え、図面上の任意の範
    囲を指示すると、指示された範囲内に存在する単語を認
    識するために必要な標準パターンデータ記憶手段の標準
    パターン内容を再構成し、発声内容の音声認識結果を所
    定の位置に表示することを特徴とする音声入力を用いた
    情報処理装置。
  4. 【請求項4】 請求項3において、表示されている図面
    上の任意の範囲を指示し、同時に発声した入力単語名を
    入力単語として音声認識し、該認識された単語内容を含
    む全てあるいは一部の単語情報を指定された図面上の範
    囲内に表示することを特徴とする音声入力を用いた情報
    処理装置。
  5. 【請求項5】 少くとも、情報を表示する情報表示手段
    と、表示画面の位置を入力する位置情報入力手段と、音
    声を入力する音声情報入力手段と、前記位置及び前記音
    声を記憶する記憶手段と、標準パターンデータ記憶手段
    と、前記標準パターンデータ記憶手段に記憶されている
    データを用いて前記音声の尤度を算出し、該算出された
    尤度のうち最大値を持つ単語を入力単語の最有力候補と
    する音声認識手段を有する音声入力を用いた情報処理装
    置であって、時刻、列車番号、番線、行先等の情報を含
    む駅情報テーブルを具備し、該駅情報テーブルに含まれ
    ている情報を項目別に別位置に表示すると共に音声の入
    力位置を指定し、同時に駅情報を音声入力すると、入力
    された音声情報と前記駅情報テーブルとの照合を行な
    い、照合された情報を抽出して音声認識し、指定位置に
    音声認識結果を表示することを特徴とする音声入力を用
    いた情報処理装置。
  6. 【請求項6】 請求項5において、地図等領域を表す図
    面またはシステム構成図等の系統図を表示する手段を備
    え、図面上の任意の範囲を指示すると、指示された範囲
    内に存在する単語を認識するために必要な標準パターン
    データ記憶手段の標準パターン内容を再構成し、発声内
    容の音声認識結果を所定の位置に表示することを特徴と
    する音声入力を用いた情報処理装置。
  7. 【請求項7】 請求項1、請求項3または請求項5にお
    いて、音声認識した結果と指定した入力位置が合致しな
    い場合、音声認識した結果を強制的に既指定入力位置に
    表示した上で、該表示に基づいて該当する入力位置を指
    定し、既認識結果を正しい入力位置に移動させ、エラー
    処理することを特徴とする音声入力を用いた情報処理装
    置。
JP8071124A 1996-03-01 1996-03-01 音声入力を用いた情報処理装置 Pending JPH09237098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8071124A JPH09237098A (ja) 1996-03-01 1996-03-01 音声入力を用いた情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8071124A JPH09237098A (ja) 1996-03-01 1996-03-01 音声入力を用いた情報処理装置

Publications (1)

Publication Number Publication Date
JPH09237098A true JPH09237098A (ja) 1997-09-09

Family

ID=13451513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8071124A Pending JPH09237098A (ja) 1996-03-01 1996-03-01 音声入力を用いた情報処理装置

Country Status (1)

Country Link
JP (1) JPH09237098A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251280A (ja) * 2001-02-22 2002-09-06 Canon Inc 電子黒板装置およびその制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251280A (ja) * 2001-02-22 2002-09-06 Canon Inc 電子黒板装置およびその制御方法
JP4632389B2 (ja) * 2001-02-22 2011-02-16 キヤノン株式会社 電子黒板装置およびその制御方法

Similar Documents

Publication Publication Date Title
CN106406806B (zh) 一种用于智能设备的控制方法及装置
JP3267047B2 (ja) 音声による情報処理装置
Klatt Review of the ARPA speech understanding project
JP3848319B2 (ja) 情報処理方法及び情報処理装置
CN111933129A (zh) 音频处理方法、语言模型的训练方法、装置及计算机设备
JP5386692B2 (ja) 対話型学習装置
US20080177541A1 (en) Voice recognition device, voice recognition method, and voice recognition program
US11328708B2 (en) Speech error-correction method, device and storage medium
JP3278222B2 (ja) 情報処理方法及び装置
JP2001005488A (ja) 音声対話システム
WO2012073275A1 (ja) 音声認識装置及びナビゲーション装置
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
CN112562640A (zh) 多语言语音识别方法、装置、系统及计算机可读存储介质
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
CN113327597A (zh) 语音识别方法、介质、装置和计算设备
JP3340163B2 (ja) 音声認識装置
JPH09237098A (ja) 音声入力を用いた情報処理装置
CN1965349A (zh) 多形式的非歧意性语音识别
CN1275174C (zh) 具有语音辨识辅助功能的中文输入方法及其系统
JPH08166966A (ja) 辞書検索装置、データベース装置、文字認識装置、音声認識装置、および文章修正装置
JP4511274B2 (ja) 音声データ検索装置
Komatani et al. Efficient dialogue strategy to find users’ intended items from information query results
CN113345442B (zh) 语音识别方法、装置、电子设备及存储介质
JP2008083165A (ja) 音声認識処理プログラム及び音声認識処理方法