JPH1152983A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH1152983A
JPH1152983A JP9212763A JP21276397A JPH1152983A JP H1152983 A JPH1152983 A JP H1152983A JP 9212763 A JP9212763 A JP 9212763A JP 21276397 A JP21276397 A JP 21276397A JP H1152983 A JPH1152983 A JP H1152983A
Authority
JP
Japan
Prior art keywords
dictionary
function
speech recognition
switching
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9212763A
Other languages
English (en)
Inventor
Osahisa Okamoto
長久 岡本
Koji Aizawa
浩二 相沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering and Services Co Ltd
Original Assignee
Hitachi Engineering and Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering and Services Co Ltd filed Critical Hitachi Engineering and Services Co Ltd
Priority to JP9212763A priority Critical patent/JPH1152983A/ja
Publication of JPH1152983A publication Critical patent/JPH1152983A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】音声指令によって最適な辞書で音声認識を行う
ことのできる音声認識装置を提供することを目的とす
る。 【解決手段】音声解析機能および辞書切替機能を持つよ
うに音声認識部を構成し、辞書検索機能および辞書切替
機能を持つようにコンピュータ装置を構成し、音声指令
によって辞書を選択できるようにした音声認識装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に関す
る。
【0002】
【従来の技術】音声認識装置は、辞書機能を備えた音声
認識部と同一の辞書機能を備えたコンピュータ装置とを
通信手段によって通信するようにして構成される。
【0003】従来装置にあっては、認識結果に相当する
インデックスをコンピュータ装置に送信していた。この
インデックスをコンピュータ装置がテキスト化して画面
に表示するため、音声認識部でアクティブになっている
辞書と、コンピュータ装置でアクティブになっている辞
書は常に同期させておく必要があった。このためシステ
ム的に辞書切替えを行う場合には別プログラムによって
両方の辞書の切替えを行っていた。
【0004】
【発明が解決しようとする課題】前述のように従来装置
にあっては、システム的に辞書切替えをする場合には別
プログラムによって両方の辞書を切替えてやる必要があ
った。このため、辞書切替えのための専用のプログラム
を必要とした。すなわち、従来装置にあっては「辞書に
あるテキスト情報を音声で選択してパソコン画面に表示
する」という概念であったため、使おうとするアプリケ
ーションソフト側にテキスト入力領域が無い場合には別
途専用プログラムを作成する必要があった。
【0005】従来から声でコンピュータ装置を操作でき
るシステムはあったが、これは「操作の登録が面倒」で
あったり、「アプリケーション毎に使える命令が固定
化」されてしまったりで、決して使い易いものではなか
った。
【0006】本発明はかかる点に鑑みてなされたもの
で、辞書切替えのための専用プログラムを不要とし、ア
プリケーションへの音声認識処理の適用を容易にして使
い易くすることによって最適な辞書で音声認識を行うこ
とのできる音声認識装置を提供することを目的とする。
【0007】
【課題を解決するための手段】辞書に、辞書切替え指示
を意味する特殊なテキストを登録しておき、これに相当
するインデックス値が認識部から送られた場合に、コン
ピュータ装置側ソフトにて画面に表示するような処理を
行うことに代えて、辞書切替処理を音声によって起動さ
せる構成とした。
【0008】具体的には、本発明は、複数の辞書機能を
備えた音声認識部と同数の辞書機能を備えたコンピュー
タ装置とを通信手段によって通信することによって音声
認識を行う音声認識装置において、前記音声認識部は音
声解析機能および該音声解析機能による音声解析信号に
より作動し、前記辞書機能の切替えを行う辞書切替機能
を有し、かつ前記コンピュータ装置は、該辞書切替機能
からの信号が前記通信手段を介して入力される辞書検索
機能および該辞書検索機能によって前記辞書機能の切替
えを行う辞書切替機能を有する音声認識装置によって前
述した技術課題を解決するものである。
【0009】更に、本発明は複数の辞書機能の内、少な
くとも1つは共通で使う発声を登録しておく制御辞書機
能となし、辞書機能の切替えは該制御辞書機能を除いた
辞書機能について行う音声認識装置を提供する。
【0010】更に本発明は、辞書機能切替えを20音以
内の音声により行う音声認識装置を提供する。
【0011】更に本発明は、前記コンピュータ装置の辞
書切替指令は、コンピュータ装置内に設けた指令発効機
能からも行える音声認識装置を提供する。
【0012】
【発明の実施の形態】以下、本発明にかかる一実施例を
図面に基づいて説明する。
【0013】図1において、音声認識装置100は、音
声認識部1およびコンピュータ装置(パソコン)2から
構成され、両者は通信手段3によって連結されている。
すなわち、音声認識部1とコンピュータ装置2とはそれ
ぞれに設けられた通信機能11,21で相互に連絡をと
りあって音声認識動作を行う。音声認識部1とコンピュ
ータ装置2にはそれぞれ同数の辞書13,23が登録さ
れており、音声認識部1の辞書には「読み」が、そして
コンピュータ装置2の辞書23には「表現」が辞書毎に
同じ並びで格納されている。すなわち、辞書13には
「読み」機能が、そして辞書23には「表現」機能が与
えられている。更に、音声認識部1およびコンピュータ
装置2はそれぞれ辞書切替機能12,22を有してい
る。音声認識部1は音声解析機能14を有し、マイクロ
フォン(MIC)15からの音声が入力される構成とさ
れている。音声認識処理に使われる辞書は、これら複数
の辞書のうちのいずれか1組であり、それらはそれぞれ
の辞書切替機能12,22を同期動作させることで切替
えることができ、状況に適した辞書で音声認識処理を行
うように構成される。マイクロフォン15から入力され
た音声は音声解析機能14で音声解析され、解析結果に
基づいて辞書切替機能12が動作する構成とされてい
る。
【0014】コンピュータ装置2は、通信機能21と辞
書切替機能22との間に辞書検索機能24を有してい
る。辞書切替機能22は、指令発効機能25によっても
動作する構成とされている。
【0015】システムとしては、音声認識部1から通信
機能11を介して送られた「読み」に対するインデック
ス値を通信機能21で受け、辞書検索機能24で「表
現」に変換して音声認識動作を行っている。すなわち、
音声認識部1で選択された辞書に対応する辞書がコンピ
ュータ装置2で選択され、同一組の辞書についての「読
み」に対する同一組の辞書についての「表現」が選択さ
れる。従って、音声入力とそれに伴う音声解析による制
御信号によって辞書13の内の1つの辞書が選択され、
それに対応する辞書23の内の1つの辞書が選択され
る。
【0016】辞書切替機能22に対する切替え指令は、
前述のようにコンピュータ装置内の指令発効機能25か
らも行うことができる。
【0017】辞書に、辞書切替指示を意味する特殊なテ
キストを登録しておき、これに相当するインデックス値
が認識装置から送られた場合にはコンピュータ装置ソフ
トにて画面表示すると言った従前の方法を採らずに、本
発明は辞書切替処理を起動させる処理構成とした。音声
認識装置100での辞書の「辞書切替処理」の記述は、
通常の単語としてはあまり用いられないような表現を用
いるのがよい。その例を示す。
【0018】 〔表現〕〔読み〕 ##01##,ひようじゆんじしようにきりかえ ##02##,すうちじしよにきりかえ ##05##,しめいじしよにきりかえ ##45##,ちめいじしよにきりかえ このようにこの例では、音声指令は11から15音で行
っているが、20音ぐらいまでの音声指令で行うように
構成するのが望ましい。これくらいの音声指令で充分に
辞書を切替えることができる。このようにすることで、
音声認識装置100の使用者は、状況に応じた辞書を動
的かつ自由に選択しながらこの装置を使うことができ
る。
【0019】辞書切替えのための専用プログラムが要ら
なくなるため、各種のアプリケーションへの音声認識処
理の適用が容易になって、既存のアプリケーションを何
等改造することなく最適な辞書で音声認識を行うことが
できる。
【0020】前述した実施例によれば、ユーザが音声指
令によって自由に辞書を切替えることができるようにな
るが、そのための辞書切替え命令は、使用するすべての
辞書に登録しておかないと、使う辞書を戻せなくなった
りして使い勝手がよくない場合がある。そこで、次のよ
うな辞書構成機能を付加してもよい。すなわち、辞書切
替命令やカーソル移動命令などすべての辞書に共通して
使いたい命令は一般の辞書とは別に作成し、コンピュー
タ装置上で管理するようにする。このようにして管理さ
れる辞書は制御辞書というべきものになる。コンピュー
タ装置2から音声認識部1に辞書を送る際には、各辞書
に制御辞書を付加して送信することになる。共通で使い
たい音声指令を登録しておく辞書、すなわち制御辞書を
設けて一般の辞書と分ける。辞書切替処理時には一般の
辞書だけを切替えることとし、制御辞書は切替えない。
こうすることで一般的に使用される音声指令(例えば、
キー操作やアプリケーションの起動など)は、制御辞書
に入れておき、その他のアプリケーション固有の音声指
令は一般辞書に入れておくといった使い方ができるよう
になって、使い勝手がよくなる。共通の操作命令や最低
限必要な単語を制御辞書に登録しておくことで、アプリ
ケーション専用辞書に新たに作成する場合の手間が大幅
に改善される。また、共通操作命令は一度覚えてしまえ
ば以後どんな局面でも使えるため、辞書を切替えた際に
混乱が生じない。
【0021】コンピュータ装置2から音声認識部1に各
辞書を転送処理する例を図3に基づいて説明する。
【0022】コンピュータ装置上の通信機能21が最初
に起動された時、この通信機能は音声認識部1に対して
使用するすべての辞書を転送する処理を行う。この場
合、あらかじめ定義された制御辞書32をその他の一般
辞書33,34,35にそれぞれ付加して通信手段3を
介して、例えば制御辞書/一般辞書Aの形36で送信
し、音声認識部1では付加された結果を1個の辞書3
8,39または40として格納する。こうすることで各
辞書は、制御辞書分大きくなるが、ユーザから見れば、
辞書を切替えても制御辞書の単語は常に使えることにな
るため、使い易いものとなる。
【0023】図3は、図1に示した音声認識システムの
認識動作を示すフローチャートであり、それぞれ(a)
は音声認識装置、(b)はコンピュータ装置の処理の流
れを示す。
【0024】音声入力部(ステップ1:以下ST1と記
す)から入った音声信号は、解析処理:ST2で発声が
分析され「読み」として構成され、辞書検索処理:ST
3で現在の有効な辞書にその「読み」があるかどうかが
判別される。「読み」が無ければ音声認識部のその回の
処理を終了するが、「読み」が辞書内にあった場合はそ
のインデックス値をコンピュータ装置に送信する(ST
4)。コンピュータ装置では、インデックスを受信(S
T5)した後、それに対応する「表現」を検索(ST
6)し、これが辞書切替指令でない場合は、認識結果を
アプリケーションソフトに送信してこの回の認識処理を
終わる(ST7)。もしST6における検索でこのイン
デックス値が辞書切替指令であると判定された場合は、
コンピュータ装置と音声認識部の双方に辞書切替指令を
発効する(ST8)。
【0025】
【発明の効果】本発明の音声による辞書切替機能によれ
ば、音声認識装置を使うユーザが自由に使う辞書を選択
することができるようになり、音声認識部を適用するア
プリケーション側の負担が軽減されるとともに、ユーザ
の自由度が高くなり、より使いやすいシステムとするこ
とができる。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図。
【図2】本発明の実施例の1つの作用を示すブロック
図。
【図3】本発明を説明するためのフローチャート図。
【符号の説明】
1…音声認識部、2…コンピュータ装置、3…通信手
段、11,21…通信機能、12,22…辞書切替機
能、13,23…辞書、24…辞書検索機能、25…指
令発効機能、32…制御辞書、36…制御辞構/一般辞
書A。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】複数の辞書機能を備えた音声認識部と同数
    の辞書機能を備えたコンピュータ装置とを通信手段によ
    って通信することによって音声認識を行う音声認識装置
    において、 前記音声認識部は音声解析機能および該音声解析機能に
    よる音声解析信号により作動し、前記辞書機能の切替え
    を行う辞書切替機能を有し、かつ前記コンピュータ装置
    は、該辞書切替機能からの信号が前記通信手段を介して
    入力される辞書検索機能および該辞書検索機能によって
    前記辞書機能の切替えを行う辞書切替機能を有すること
    を特徴とする音声認識装置。
  2. 【請求項2】請求項1において、 複数の辞書機能の内、少なくとも1つは共通で使う発声
    を登録しておく制御辞書機能となし、辞書機能の切替え
    は該制御辞書機能を除いた辞書機能について行うことを
    特徴とする音声認識装置。
  3. 【請求項3】請求項1において、 辞書機能切替えを20音以内の音声により行うことを特
    徴とする音声認識装置。
  4. 【請求項4】請求項1において、 前記コンピュータ装置の辞書切替指令は、コンピュータ
    装置内に設けた指令発効機能からも行えることを特徴と
    する音声認識装置。
JP9212763A 1997-08-07 1997-08-07 音声認識装置 Pending JPH1152983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9212763A JPH1152983A (ja) 1997-08-07 1997-08-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9212763A JPH1152983A (ja) 1997-08-07 1997-08-07 音声認識装置

Publications (1)

Publication Number Publication Date
JPH1152983A true JPH1152983A (ja) 1999-02-26

Family

ID=16628004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9212763A Pending JPH1152983A (ja) 1997-08-07 1997-08-07 音声認識装置

Country Status (1)

Country Link
JP (1) JPH1152983A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504675A (ja) * 1999-07-08 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 転送手段を有するスピーチ認識装置
JP2013512476A (ja) * 2009-12-01 2013-04-11 本田技研工業株式会社 複数の辞書を用いたスピーチ認識
JP2015045765A (ja) * 2013-08-28 2015-03-12 シャープ株式会社 制御装置、制御装置の制御方法、および、制御プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504675A (ja) * 1999-07-08 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 転送手段を有するスピーチ認識装置
JP4659311B2 (ja) * 1999-07-08 2011-03-30 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 転送手段を有するスピーチ認識装置
JP2013512476A (ja) * 2009-12-01 2013-04-11 本田技研工業株式会社 複数の辞書を用いたスピーチ認識
JP2015045765A (ja) * 2013-08-28 2015-03-12 シャープ株式会社 制御装置、制御装置の制御方法、および、制御プログラム

Similar Documents

Publication Publication Date Title
US8706495B2 (en) Synchronise an audio cursor and a text cursor during editing
US6999933B2 (en) Editing during synchronous playback
JP3705735B2 (ja) オンデマンド・インタフェース装置とそのウィンドウ表示装置
JP2002169588A (ja) テキスト表示装置、テキスト表示制御方法、記憶媒体、プログラム伝送装置及び応対支援方法
EP1095372B1 (en) Automatic speech recognition
JPH10222342A (ja) ハイパーテキスト音声制御方法及び装置
JPH1152983A (ja) 音声認識装置
KR100275607B1 (ko) 다단식 전치 처리기 시스템
JPH06337631A (ja) 手話対話における対話制御装置
JP2655086B2 (ja) 電話回線音声入力システム
JP4229627B2 (ja) ディクテーション装置、方法及びプログラム
JP2504779B2 (ja) 音声入力機能付き文書処理装置
JPH08137385A (ja) 会話装置
JP3700743B2 (ja) 記録媒体および文字入力装置
JP2001175320A (ja) プラント監視装置
JP4047323B2 (ja) 情報処理装置及びその方法、プログラム
CN114155847A (zh) 声音处理系统以及声音处理方法
JPH0876786A (ja) 情報処理装置
JPH10225886A (ja) ロボットの操作装置
JP2003131790A (ja) 情報機器
JP2003177860A (ja) かな文字入力方式および方法
JPH04118699A (ja) 音声入出力装置
JPH0370077A (ja) Cadの利用者補助方式
JPH04160529A (ja) 音声認識システム
JPS62150294A (ja) 認識結果確認方式