JPH07219587A - 音声処理装置および方法 - Google Patents

音声処理装置および方法

Info

Publication number
JPH07219587A
JPH07219587A JP6008494A JP849494A JPH07219587A JP H07219587 A JPH07219587 A JP H07219587A JP 6008494 A JP6008494 A JP 6008494A JP 849494 A JP849494 A JP 849494A JP H07219587 A JPH07219587 A JP H07219587A
Authority
JP
Japan
Prior art keywords
word
voice
dictionary
command
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6008494A
Other languages
English (en)
Inventor
Yuji Ikeda
裕治 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6008494A priority Critical patent/JPH07219587A/ja
Publication of JPH07219587A publication Critical patent/JPH07219587A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声によりコマンドを入力する際に、認識結
果の代替語を表示し、選択させることで、誤認識やユー
ザによる入力の違いを吸収できるようにする。 【構成】 単語に対応する代替語の単語グループを記憶
する音声コマンド辞書105と、音声認識部110で認
識された単語を該辞書から検索する音声コマンド検索部
111と、検索された単語を表示する音声コマンド表示
部112を有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声によりコマンドを
入力して計算機を操作する装置及び方法に関するもので
ある。
【0002】
【従来の技術】近年、音声により入力されたコマンドを
認識し、計算機の操作を行うよう制御する音声処理装置
が研究開発されている。かかる従来の音声処理装置で
は、音声認識部の認識結果と音声コマンド辞書の対応付
けを、音声コマンド部で次のような、どちらかの方法で
行っていた。
【0003】・音声認識結果に対応する音声コマンド辞
書のコマンドを自動的にアプリケーションに送信する。
【0004】・音声認識処理において複数の候補が得ら
れたとき、その内容を全て表示して、ユーザに選択して
もらう。
【0005】
【発明が解決しようとしている問題点】しかしながら、
従来の技術では、音声コマンドとして登録された単語を
誤認識した場合に、以下のような問題点があった。
【0006】1.誤認識した単語に対応するコマンドが
アプリケーションに送信されてしまう。
【0007】2.複数候補が表示されても、その複数候
補の中に所望のコマンドが存在しない場合がある。
【0008】3.所望のコマンドが複数候補になるべく
入るようにするには、候補数を多くすればよいが、多す
ぎると一覧性が悪くなる。
【0009】4.単語によっては音声認識によってほと
んどの場合誤認識するものが存在する。このような場合
には常に別候補を選択する手間がかかる。
【0010】
【問題点を解決するための手段】上記課題を解決するた
めに、本発明の音声処理装置は、音声認識手段と、認識
対象の単語毎に、その代替語となる単語のグループを登
録する辞書と、単語認識の結果とそれに付属する単語の
グループを表示する音声コマンド表示手段とを有する。
【0011】また、好ましくは、単語のグループを編集
する単語グループ編集部を備える。
【0012】上記課題を解決するために、好ましくは前
記単語グループの個数は、可変とする。
【0013】上記課題を解決するために、好ましくは誤
認識しやすい単語のグループの判断は、単語登録時に計
算する。
【0014】上記課題を解決するために、好ましくは誤
認識しやすい単語のグループとグループ内の配置は、単
語追加・削除時に再計算し再配置する。
【0015】上記課題を解決するために、好ましくは誤
認識しやすい単語のグループ内の配置は、ユーザに指定
により明示的に変更可能にする。
【0016】上記課題を解決するために、好ましくは誤
認識しやすい単語のグループ内の配置は、ユーザの選択
により暗黙的に学習機能により自動的に再配置する。
【0017】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0018】図1は、本発明の一実施例に係る装置の構
成を示すブロック図である。
【0019】101は、ユーザから発声される音声を取
り込むマイクロホンなどの音声入力装置である。106
は、音声入力装置101から得られた音声を認識して、
ユーザが話した単語を認識して単語に対応するコマンド
を所望のアプリケーションに送る音声コマンド部であ
る。音声コマンド部106は、音声認識部110、音声
コマンド検索部111、音声コマンド表示部112、コ
マンド選択部113、コマンド送信部114からなる。
110は、音声入力部101から得られた音声を認識す
る音声認識部である。111は、音声認識部110から
得られた単語から、音声コマンド辞書105を検索して
コマンドを検索する音声コマンド検索部である。112
は、音声コマンド検索部111から得られた1つの入力
部に対する複数候補の音声コマンドを一覧表示する音声
コマンド表示部である。113は、音声コマンド表示部
112で表示したコマンド候補を、入力装置102から
入力されるユーザの指示を得て、音声コマンドを選択す
るコマンド選択部である。114は、コマンド選択部1
13から得られたコマンドを、アプリケーション103
に送信するコマンド送信部である。103は、音声コマ
ンド部106から送信されるコマンドに従った処理を行
うアプリケーションである。105は、音声コマンド部
106、音声コマンド辞書編集部107、単語グループ
編集部108、音声コマンド辞書表示部109から参
照、編集を受ける音声コマンド辞書であり、単語、読
み、コマンド、単語グループを対応付けて記憶してい
る。102は、ユーザの指示を入力する入力装置で、キ
ーボード、マウスからなる。107は入力装置102か
ら入力されるユーザの指示をもとに音声コマンド辞書を
編集する音声コマンド辞書編集部である。108は、音
声コマンド辞書の各単語に付随する単語グループを編集
する単語グループ編集部である。109は、入力装置1
02から入力される表示の指示及び音声コマンド辞書編
集部107の編集処理の指示に応じて、音声コマンド辞
書105の内容を表示する音声コマンド辞書表示部であ
る。104は、音声コマンド表示部112、音声コマン
ド辞書表示部109によって音声コマンドの辞書内容あ
るいは、検索された音声コマンドを表示する表示装置で
ある。
【0020】上記構成よりなる実施例の装置の動作処理
手順を図2、図3のフローチャートに従って説明する。
【0021】図2は、図1のように構成された音声コマ
ンド装置が、ユーザからの音声コマンドを処理する過程
を表したフローチャートである。まず、音声受け取り処
理ステップS1で音声入力装置101から入力されるユ
ーザからの音声を受け取り、音声認識処理ステップS2
に渡す。音声認識処理ステップS2は、ステップS1か
ら得た音声を音声認識部110において音声認識を行い
単語を認識した結果を音声コマンド検索処理ステップS
3に渡す。音声コマンド検索処理ステップS3は、音声
検索部111においてステップS2から渡された単語
を、音声コマンド辞書105の単語部分を検索して、ス
テップS4へ進む。ステップS4は、ステップS3で検
索した結果、単語が音声コマンド辞書105に存在した
場合にはステップS6へ進み、存在しなかったら認識失
敗表示処理ステップS5へ進む。認識失敗表示処理ステ
ップS5は、認識した単語が音声コマンド辞書105に
ないことを告げるメッセージを表示したり、音声で出力
するなどしてユーザに示し、ステップS1に戻る。
【0022】ステップS6は、ステップS4から、音声
コマンド辞書105からS3で検索された単語の情報を
受け取り、その単語に単語グループが存在するかどうか
を判断する。単語グループに単語が登録されている場合
には、音声コマンド表示処理ステップS7へ進み、単語
グループがない場合には、ステップS9へ進む。
【0023】ステップS9は、単語グループがないとき
であるので、音声認識した単語を選択して、それに対応
するコマンドをコマンド送信処理S12へ送る。
【0024】音声コマンド表示処理S7は、単語グルー
プが存在するときであるので、音声認識した単語と、単
語グループに登録された単語の情報をステップS8に送
る。判定処理ステップS8では、コマンド選択モードで
あるか否かを判定して、モードがONでない場合には、
ステップS9へ進む。モードがONである場合には、音
声認識した単語と、単語グループに登録された単語の一
覧を表示装置104に表示する。その後、制御をコマン
ド選択処理ステップS10へ移す。コマンド選択処理ス
テップS10は、表示装置104に表示された単語の候
補の一覧の中の一つを、入力装置102からのユーザの
指示によって選択する。そして、選択結果をステップS
11に送る。判断部S11では、S10で選択された単
語に対応するコマンドがあるか否かを判断して、ある場
合にはコマンド送信処理S12へコマンドを送り、ない
場合にはユーザがその音声コマンドを実行したくないも
のとして判断して、ステップS1へ戻る。
【0025】コマンド送信処理ステップS12は、ステ
ップS11あるいはステップS9から受け取ったコマン
ドをアプリケーション103へ送信する。これにより音
声コマンドが一つ実行される。その後、終了判断ステッ
プS13により、終了か否かを判定し、終了でないなら
ステップS1に戻り、終了なら処理を終了させる。
【0026】図4は、音声コマンド辞書105の内容の
一例であり、単語と読みとコマンドと、単語グループが
一項目として登録されている。例えば、「OK」という
単語には、読みとして「おーけー」、そのコマンドとし
て「〔Return〕」、単語グループには「表示」と
「登録」と「終了」が登録されているものである。
【0027】図5は、音声コマンド表示処理ステップS
7で表示装置104に表示されるコマンドの一覧であ
り、音声認識部110で「OK」と認識されたときの表
示例である。音声認識部110で認識された「OK」
は、音声コマンド辞書105において「表示」「登録」
「終了」が単語グループとして登録されている為、これ
らの単語が音声コマンド検索部111により検索され、
音声コマンド表示部112により一覧表示される。
【0028】図6は、コマンド選択処理S10でユーザ
からの指示を入力装置102から受けて、「OK」の替
わりに「登録」コマンド選択するときの表示例である。
この例では、例えばマウスを表わす矢印カーソルが「登
録」コマンドを選択している例である。
【0029】図3は、音声コマンド辞書105を編集す
る時の処理の過程を表したフローチャートである。ま
ず、入力装置102から音声コマンド辞書105の編集
を開始することをユーザから受け取ると、音声コマンド
辞書読み取り処理S14が、対象となる音声コマンド辞
書105をオープンする。そしてオープンした内容を音
声コマンド辞書表示部109に送り、表示装置104に
表示する。そののちユーザからの操作命令を待つ状態に
なり、入力装置102から入力される操作指示を判定す
る辞書編集操作判定処理ステップS15へ進む。辞書編
集操作判定処理ステップS15では、辞書編集の操作の
種類を判定して、「単語追加」ならステップS16、
「単語削除」ならステップS18、「単語グループ再配
置」ならステップS20、「辞書保存」ならステップS
22。「辞書削除」ならステップS24へ制御を渡す。
「単語追加」の操作の場合は、判定処理ステップS16
で判定され、単語追加処理ステップS17へ進む。単語
追加処理ステップS17は、追加すべく入力装置102
から入力される単語と読みとコマンドをユーザから受け
取り、音声コマンド辞書へ追加して、単語グループ再配
置処理ステップS21へ進む。「単語削除」の操作の場
合は、判定処理ステップS18で判定され、単語削除処
理ステップS19へ進む。単語削除処理ステップS19
は、音声コマンド辞書105の単語グループから指定さ
れた単語を削除して、単語グループ再配置処理ステップ
S21へ進む。「単語グループ再配置」の操作の場合
は、判定処理ステップS20で判定され、ステップS2
1へ進む。「辞書保存」の操作の場合は、判定処理ステ
ップS22で判定され、辞書保存処理ステップS23へ
進む。「辞書削除」の操作の場合は、判定処理ステップ
S24で判定され、辞書削除処理ステップS25へ進
む。判定処理ステップS26は、終了か否かを判定し、
終了なら処理を終了させ、そうでない場合にはステップ
S15へもどる。
【0030】単語グループ再配置処置ステップS21
は、ステップS17で単語が追加された場合と、ステッ
プS19で単語が削除された場合と、ステップS20で
単語グループ再配置の操作と判定されたときに行われる
処理である。この処理では、単語が追加されたときに
は、その単語を、編集が指示された単語の単語グループ
に追加登録する。また、単語が削除されたときには、そ
の単語を他の辞書項目の単語グループから削除する。再
配置操作の場合には、ユーザの指示によって単語グルー
プ内の順序を変更する。これらの処理を行った後、ステ
ップS15に戻る。
【0031】辞書保存処理ステップS23は、音声コマ
ンド辞書を保存して、ステップS15に戻る。辞書削除
ステップS25は、音声コマンド辞書を削除して、ステ
ップS15に戻る。
【0032】この処理の流れが音声コマンド辞書を編集
して、単語グループを更新する処理の流れである。
【0033】以上のように単語グループの情報が追加さ
れた音声コマンド辞書を元に、音声コマンド表示部とコ
マンド選択部を用いることによって、本実施例の装置で
は、所望のコマンドを含む複数候補のコマンドを得るこ
とができることが可能になった。
【0034】尚、本実施例では、音声コマンド辞書10
5の実施例として図4に示すように、単語グループとし
て4個以内の辞書を示していたが、これに限らず、個数
を可変にすることができる。
【0035】これにより、複数単語を表示する時の個数
を調整することができ、ユーザの好みの個数を設定する
ことで、ユーザが候補が多すぎて一覧性の悪さを感じる
ことがなくなる。
【0036】尚、本実施例では、単語のグループの判断
はユーザが指定しているが、これに限られず、単語登録
時にその読みによって自動的に判断することもできる。
この実施例では、単語グループの単語の指定の煩わしさ
をユーザに感じさせなくなる。
【0037】尚、本実施例では、登録時に、単語のグル
ープの判断をユーザに指定したり自動的に判断する実施
例を示したが、これに限られず、登録時以外に単語の追
加、グループ内の配置をユーザが指定することもでき
る。この実施例では、ユーザの好みにあった単語グルー
プの配置が常に変更可能な状態で実現できる。
【0038】尚、本実施例では、単語グループ内の再配
置をユーザの指定により行っていたが、これに限られ
ず、コマンド選択時に、選択された単語を単語グループ
内の上位順序に入れ替えることができる。これによりユ
ーザのコマンド選択による学習機能が実現できる。
【0039】
【発明の効果】以上説明したように、認識対象の単語毎
に、その代替語となる単語グループを登録することがで
きる単語辞書と、単語認識結果とそれに付随する単語グ
ループを表示する手段と、単語グループの編集手段を設
けることにより以下の効果が得られる。
【0040】1.誤認識された単語に対応するコマンド
がアプリケーションに送られることを防ぐ。
【0041】2.認識した単語とその代替語となる単語
グループを表示することで、受け付けられる単語が何で
あるかが容易にわかる。
【0042】3.認識した単語とその代替語となる単語
グループを表示することで、誤認識した場合でも、単語
を音声で再入力する必要が少なくなる。
【0043】4.単語グループの個数を指定できること
で、ユーザの所望の個数の一覧をもつコマンド一覧を表
示できる。
【0044】5.単語グループ内の配置をユーザが再配
置することができるので、誤認識しやすい単語に正しい
単語を先頭順位におくことで、誤認識の際の操作を簡単
化することができる。
【図面の簡単な説明】
【図1】本発明の実施例の音声コマンド装置のブロック
図。
【図2】本発明の実施例の音声コマンド装置の音声コマ
ンド処理過程を示すフローチャート。
【図3】本発明の実施例の音声コマンド装置の音声コマ
ンド辞書編集処理過程を示すフローチャート。
【図4】実施例の音声コマンド辞書例を示す図。
【図5】実施例の音声コマンド表示例を示す図。
【図6】実施例のコマンド選択例を示す図。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、 前記入力された音声を認識する認識手段と、 単語の代替語を単語グループとして記憶する辞書と、 前記認識結果に基づいて前記辞書から単語グループを検
    索する検索手段と、 前記検索された単語グループの単語を表示する表示手段
    と、 前記表示された単語から所望の単語を選択する選択手段
    とを有することを特徴とする音声処理装置。
  2. 【請求項2】 前記辞書に記憶する単語グループを編集
    する編集手段を有することを特徴とする請求項1に記載
    の音声処理装置。
  3. 【請求項3】 前語編集手段は、前記選択手段の選択に
    応じて編集を行うことを特徴とする請求項2に記載の音
    声処置装置。
  4. 【請求項4】 前記編集は、追加或は削除を含むことを
    特徴とする請求項2に記載の音声処理装置。
  5. 【請求項5】 音声を入力し、 前記入力した音声を認識し、 前記認識して得た単語に対応する代替語の単語グループ
    を検索し、 前記検索した単語グループの単語を表示し、 前記表示した単語から所望の単語を選択することを特徴
    とする音声処理方法。
  6. 【請求項6】 前記単語グループを編集可能とすること
    を特徴とする請求項5に記載の音声処理方法。
  7. 【請求項7】 前記選択に応じて、前記単語グループを
    編集することを特徴とする請求項5に記載の音声処理方
    法。
  8. 【請求項8】 前記編集は、追加或は削除を含むことを
    特徴とする請求項6に記載の音声処理方法。
JP6008494A 1994-01-28 1994-01-28 音声処理装置および方法 Withdrawn JPH07219587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6008494A JPH07219587A (ja) 1994-01-28 1994-01-28 音声処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6008494A JPH07219587A (ja) 1994-01-28 1994-01-28 音声処理装置および方法

Publications (1)

Publication Number Publication Date
JPH07219587A true JPH07219587A (ja) 1995-08-18

Family

ID=11694680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6008494A Withdrawn JPH07219587A (ja) 1994-01-28 1994-01-28 音声処理装置および方法

Country Status (1)

Country Link
JP (1) JPH07219587A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09258943A (ja) * 1996-03-19 1997-10-03 Brother Ind Ltd 機器の補助操作装置
JP2000200094A (ja) * 1998-12-16 2000-07-18 Internatl Business Mach Corp <Ibm> ディスプレイ上にフィ―ドバックを表示する方法および装置
GB2351637A (en) * 1998-12-11 2001-01-03 Nintendo Co Ltd Voice control of video game display
JP2002116854A (ja) * 2000-10-11 2002-04-19 Canon Inc 情報入力装置、情報入力方法及び記憶媒体
KR100464019B1 (ko) * 2000-12-29 2004-12-30 엘지전자 주식회사 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법
JP2012208508A (ja) * 1998-03-23 2012-10-25 Microsoft Corp オペレーティング・システムのアプリケーション・プログラム・インターフェース
JP2014021475A (ja) * 2012-07-24 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム
KR101456974B1 (ko) * 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09258943A (ja) * 1996-03-19 1997-10-03 Brother Ind Ltd 機器の補助操作装置
JP2012208508A (ja) * 1998-03-23 2012-10-25 Microsoft Corp オペレーティング・システムのアプリケーション・プログラム・インターフェース
GB2351637A (en) * 1998-12-11 2001-01-03 Nintendo Co Ltd Voice control of video game display
GB2351637B (en) * 1998-12-11 2003-03-12 Nintendo Co Ltd Image processing device
US6538666B1 (en) 1998-12-11 2003-03-25 Nintendo Co., Ltd. Image processing device using speech recognition to control a displayed object
JP2000200094A (ja) * 1998-12-16 2000-07-18 Internatl Business Mach Corp <Ibm> ディスプレイ上にフィ―ドバックを表示する方法および装置
JP2002116854A (ja) * 2000-10-11 2002-04-19 Canon Inc 情報入力装置、情報入力方法及び記憶媒体
KR100464019B1 (ko) * 2000-12-29 2004-12-30 엘지전자 주식회사 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법
JP2014021475A (ja) * 2012-07-24 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム
KR101456974B1 (ko) * 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법
US10629196B2 (en) 2013-05-21 2020-04-21 Samsung Electronics Co., Ltd. Apparatus, system, and method for generating voice recognition guide by transmitting voice signal data to a voice recognition server which contains voice recognition guide information to send back to the voice recognition apparatus
US11024312B2 (en) 2013-05-21 2021-06-01 Samsung Electronics Co., Ltd. Apparatus, system, and method for generating voice recognition guide by transmitting voice signal data to a voice recognition server which contains voice recognition guide information to send back to the voice recognition apparatus
US11869500B2 (en) 2013-05-21 2024-01-09 Samsung Electronics Co., Ltd. Apparatus, system, and method for generating voice recognition guide by transmitting voice signal data to a voice recognition server which contains voice recognition guide information to send back to the voice recognition apparatus

Similar Documents

Publication Publication Date Title
US6510412B1 (en) Method and apparatus for information processing, and medium for provision of information
US6385582B1 (en) Man-machine system equipped with speech recognition device
CN102549652B (zh) 信息检索装置
JP3278222B2 (ja) 情報処理方法及び装置
KR100438838B1 (ko) 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법
EP1405169B1 (en) Information processing apparatus and method, and program product
JP2006004274A (ja) 対話処理装置、対話処理方法及び対話処理プログラム
US7165066B2 (en) Systems and methods for associating system entities with descriptions
JPH11184670A (ja) ネットワークアクセスシステム、方法及び記録媒体
JPH07219587A (ja) 音声処理装置および方法
US20040010410A1 (en) System and method for processing voice command
JPH10283403A (ja) 情報処理装置及び記憶媒体
US20020010586A1 (en) Voice browser apparatus and voice browsing method
JP3615309B2 (ja) データ検索装置および方法、情報記憶媒体
JP4496581B2 (ja) 電子機器との通信機能を有する電子辞書及び電子辞書制御プログラムを記録した記録媒体
JP2002156996A (ja) 音声認識装置、認識結果修正方法及び記録媒体
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JP2003108566A (ja) エージェントを用いた情報検索方法および情報検索装置
JP2009301266A (ja) ユーザインタフェース装置
JP2005322148A (ja) ブラウザ装置
JP2002014751A (ja) オンラインヘルプシステム
JP2002304407A (ja) プログラム及び情報処理装置
JP2009116530A (ja) 電子機器、その制御方法およびコンピュータプログラム
JP4341390B2 (ja) ラベルの系列マッチングの誤り修正方法及び装置及びプログラム及びラベルの系列のマッチング誤り修正プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2588210B2 (ja) ヘルプガイド方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010403