JP3245569B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3245569B2
JP3245569B2 JP04389999A JP4389999A JP3245569B2 JP 3245569 B2 JP3245569 B2 JP 3245569B2 JP 04389999 A JP04389999 A JP 04389999A JP 4389999 A JP4389999 A JP 4389999A JP 3245569 B2 JP3245569 B2 JP 3245569B2
Authority
JP
Japan
Prior art keywords
key code
time
silence
setting
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04389999A
Other languages
English (en)
Other versions
JP2000242465A (ja
Inventor
学 松本
浩文 牧角
Original Assignee
神戸日本電気ソフトウェア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神戸日本電気ソフトウェア株式会社 filed Critical 神戸日本電気ソフトウェア株式会社
Priority to JP04389999A priority Critical patent/JP3245569B2/ja
Publication of JP2000242465A publication Critical patent/JP2000242465A/ja
Application granted granted Critical
Publication of JP3245569B2 publication Critical patent/JP3245569B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、人が発声した言葉
を音声認識して文字としてコンピュータなどに入力する
音声認識装置に関する。さらにくわしく言えば発声と発
声の間の無音状態があらかじめ指定した時間以上続いた
場合、あらかじめ指定していたキーコードを自動的に挿
入する機能を持つ音声認識装置に関する。
【0002】
【従来の技術】人が発声した言葉を音声認識して文字と
してコンピュータなどに入力する音声認識装置は、数年
前まではきわめて実用化の難しい技術の1つであった。
しかし最近パソコン上で動作する音声認識ソフトウェ
ア、たとえばViaVoiceなどが使えるようになり、人間の
自然な発声に近い連続発声での入力が可能となった。音
声認識のマーケットはようやく発展期に入ったといえ
る。現在の音声認識に関するすべての操作は音声にて行
うか、または、文字入力だけを音声で行って、それ以外
の操作はマウスやキーボード、または、ボタンなどで行
っている。
【0003】
【発明が解決しようとする課題】この従来の技術におい
ては、発声を音声認識して文字としてコンピュータなど
に入力する際、入力するフォーマットが帳票や表計算ソ
フトウェアなどの特定フォーマットの場合、入力フィー
ルドの移動なども音声で行うか、マウスやキーボード、
ボタンを使って行う必要があり、面倒であるという問題
点がある。
【0004】本発明の目的は、発声を音声認識して文字
としてコンピュータなどに入力する際、あらかじめ指定
した時間無音状態(無発声状態)が続くと、あらかじめ
指定しておいたキーコードを自動的に挿入することによ
り、たとえば、そのキーコードが入力域移動のキーコー
ドの場合、入力域移動の操作を一定時間の無音状態が続
くことで行い、入力域を多く持つ特定フォーマットの帳
票などへの文字入力を効率良く行うことである。
【0005】本発明の他の目的は、発声を音声認識して
文字として表計算ソフトウェアなどに文字や数字を入力
する際、あらかじめ指定した時間無音状態(無発声状
態)が続くと、あらかじめ指定しておいたキーコードが
自動的に挿入されることにより、たとえば、そのキーコ
ードが入力セル移動のキーコードの場合、入力セルの移
動を一定時間の無音状態が続くことで行い、各セルへの
文字や数字の入力をテンポ良く効率的におこなうことで
ある。
【0006】
【課題を解決するための手段】音声入力の無音状態の時
間がどのくらい続けばどのようなキーコードを生成する
かという情報が記憶装置3中の無音時間設定4とキーコ
ード設定5に設定されている。発声された音声7を音声
認識装置9にて文字列10に変換して文字入力制御部1
1を通じてアプリケーションプログラム12に渡すとい
う流れの中で、音声7が途切れると無音判定手段14が
作動し、無音時間設定4で設定した時間が経つとキーコ
ード設定5で設定されたキーコード16をアプリケーシ
ョンプログラム12に送られる。このキーコードは、通
常、文字入力域の移動などのケースが多く、その場合、
このキーコードを受け取ったアプケーションプログラ
ムは文字入力域を次の入力域に移動させる。請求項1に
記載の発明は、人が発声した言葉を音声認識して文字と
してコンピュータなどに入力する音声認識装置におい
て、発声と発声の間の無音状態があらかじめ指定した時
間以上続いた場合、あらかじめ指定していたキーコード
を自動的に挿入する機能を持ち、利用前にあらかじめキ
ーボードまたはマウスによりコンピュータの記憶装置に
格納され上記無音時間設定で設定されている時間、およ
びキーコード設定で設定されているキーコードを持つこ
とを特徴としている。請求項2に記載の発明は、人が発
声した言葉を音声認識して文字としてコンピュータなど
に入力する音声認識装置において、発声と発声の間の無
音状態があらかじめ指定した時間以上続いた場合、あら
かじめ指定していたキーコードを自動的に挿入する機能
を持ち、発声が途切れて無音状態になった場合、上記音
声認識装置に設置されている無音判定手段が作動して、
無音時間設定で設定されている時間以上無音が続いてい
ることを確認すると、キーコード設定で設定されている
キーコードを生成して該キーコードを文字入力制御を通
じてアプリケーションプログラムに渡し、利用前にあら
かじめキーボードまたはマウスによりコンピュータの記
憶装置に格納され上記無音時間設定で設定されている時
間、およびキーコード設定で設定されているキーコード
を持つことを特徴としている。請求項3に記載の発明
は、請求項1または請求項2に記載の音声認識装置にお
いて、上記キーコード設定で設定されているキーコード
は、文字入力域を次の文字入力域に移動するためのキー
コードであることを特徴としている。請求項4に記載の
発明は、請求項3に記載の音声認識装置において、上記
無音時間設定に“連続”の設定を設けることにより、上
記無音時間設定で設定されている時間を経過するごとに
キーコードを挿入し、文字入力域を移動することを特徴
としている。請求項5に記載の発明は、請求項3記載の
音声認識装置において、上記キーコード設定で設定され
ているキーコードは、文字入力域の次の文字入力域に移
動するためのコードと文字をセットにしたキーコードで
あることを特徴としている。
【0007】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1を参照すると、
本発明の実施の形態は、コンピュータ1と、コンピュー
タ1の中にある記憶装置3と、音声認識装置9と、文字
入力制御部11と、アプリケーションプログラム12
と、タイマー15と、コンピュータ1に接続されている
キーボードまたはマウス2と、マイク8と、音声認識装
置9の中にある無音判定手段14とから構成されてい
る。
【0008】図2は本発明の音声認識装置の詳細な構成
を示す図である。図2を参照すると、本発明の一実施例
である音声認識装置は、コンピュータ1と、利用前にあ
らかじめ行っておく設定を入力するコンピュータ1に接
続されているキーボードまたはマウス2と、設定を記憶
しておくコンピュータ1の中にある記憶装置3と、記憶
装置の中にある無音時間設定4と、キーコード設定5
と、音声を発声する人6と、発声した音声7と、次に発
声した音声18と、コンピュータ1に接続された音声を
拾うマイク8と、コンピュータ1の中にある音声を文字
列に変換する音声認識装置9と、音声認識装置9の中に
ある無音時間の判定を行う無音判定手段14と、コンピ
ュータ1の中にある無音判定手段が判定のための時間測
定を行うタイマー15と、音声認識装置9が音声7を変
換した文字列10と、音声認識装置9が次の音声18を
変換した次の文字列19と、音声認識装置9の中の無音
判定手段が生成したキーコード16と、コンピュータ1
の中にあるアプリケーションプログラム12と、アプリ
ケーションプログラム12の中にある文字入力域13
と、次の文字入力域17と、音声認識装置9から出力さ
れた文字列10と次の文字列19とキーコード16をア
プリケーションプログラム12に渡す文字入力制御部1
1とから構成されている。
【0009】まず本発明の音声認識装置の動作の概略を
述べ、次いでその詳細について説明する。動作の概略は
次の通りである。発声された音声7を音声認識装置9に
て文字列10に変換して文字入力制御部11を通じてア
プリケーションプログラム12に渡すという流れの中
で、音声7が途切れると無音判定手段14が作動し、無
音時間設定4で設定した時間が経つとキーコード設定5
で設定されたキーコード16を文字入力制御部11に渡
す。キーコード16は文字入力制御部11を通じてアプ
リケーションプログラム12に送られる。キーコード1
6が文字入力域の移動のキーコードであれば、無音状態
が続くことによりアプリケーション12の文字入力域が
次の文字入力域に移動することになる。
【0010】次に本発明の一実施例の動作の詳細を示
す。音声認識装置利用者は、利用する前にあらかじめコ
ンピュータ1に接続されているキーボードまたはマウス
2を使って無音状態がどの程度の時間続いたらどのよう
なキーコードを挿入するかを指定して、その情報を記憶
装置3に書き込む。以上の操作により、利用前の状態と
して、無音時間設定4とキーコード設定5とが記憶装置
3に記憶されたことになる。
【0011】本実施例の音声認識装置を起動すると人6
が発声した音声7をコンピュータ1に接続されているマ
イク8で拾ってコンピュータ内にある音声認識装置9に
渡す。音声認識装置9はマイク8で拾った音声を音声認
識して文字列に変換し文字列10として出力して文字入
力制御部11に渡す。文字列10を受け取った文字入力
制御部11は文字列10をコンピュータ1で起動してい
るアプリケーションプログラム12に送り、アプリケー
ションプログラム12の文字入力域13に文字が入る。
以上の音声認識装置の動作は、人6が常に発声している
場合の動作である。
【0012】ここで人6が発声を止めてマイク8より音
声7が入力されなくなると、音声認識装置9の中にある
無音判定手段14は記憶装置3から無音時間設定4を読
み込み、タイマー15を使って無音状態が続く時間を測
定する。無音状態が無音時間設定4で設定されている時
間続くと無音判定手段14は記憶装置3よりキーコード
設定5を読み込み、キーコード設定5で設定されている
キーコード16を文字列制御部11に渡す。キーコード
16を受け取った文字入力制御部11はキーコード16
をコンピュータ1で起動しているアプリケーションプロ
グラム12に送る。アプリケーションプログラム12は
文字入力制御部11より送られてきたキーコード16に
応じた動作をする。通常、キーコード設定5で設定され
ているキーコード16は文字入力域13を次の文字入力
域17に移動するキーコードであるケースが多く、その
場合はアプリケションプログラムは文字入力域13を次
の文字入力域17に移動するという動作を行う。
【0013】前記のように無音状態が続いた後、キーコ
ード16を文字入力制御11に渡した音声認識装置9
は、さらに無音状態が続いたとしても続けて無音判定手
段14を使ってキーコード16を文字入力制御11に渡
すという動作は行わず、次の音声18を待つ。次の音声
18が入力されて次の文字列19を文字制御部11に渡
した後に無音状態になると無音判定手段14が動作し前
記と同様の動作を行うことになる。
【0014】また、前記の無音状態の時間が無音時間設
定4より短い時間で終わって次の音声18がマイク8よ
り入力された場合は、音声認識装置9はキーコード16
を文字入力制御11に渡すことは行わず、次の音声18
を音声認識して次の文字列19として文字入力制御部1
1に渡す。前記のケースでこのような状態になったとす
ると、文字入力域13に文字列10が入力された後、続
いて次の文字列19が入力されることになる。
【0015】本発明の他の実施の形態は、無音時間設定
とキーコード設定の条件を様々に変更したり拡張するこ
とにより得ることができる。本発明の他の実施の形態の
1つ目は、無音時間設定に”連続”の設定を設けること
により、無音時間設定に設定されている時間が経ってキ
ーコードを挿入して、さらに同時間が経つともう一度キ
ーコードを挿入するというように、次の発声までの間、
何回でもキーコードの挿入を行うような設定を認めるこ
とである。これにより、たとえばキーコードが文字入力
域の移動であれば、無発声の間に一定時間で文字入力域
が順次移動し、入力したい文字入力域に移動してきた時
に発声すれば、その文字入力域に音声認識して文字を入
力することができる。
【0016】本発明の他の実施の形態の2つ目は、キー
コード設定を単に文字入力域移動のコードだけではな
く、文字とセットにしたキーコードにすることである。
たとえば、文字入力域に数字と単位(たとえば、”万
円”とすると)を入力する場合、「”万円”+文字入力
域移動キーコード」をキーコード設定すれば、”万円”
の前の数字を発声して無音時間設定で設定した時間発声
を止めると、数字の後に”万円”という単位が自動的に
付いて文字入力域は次の入力域に移動する。同じ単位を
付ける入力を続けて行う場合などに便利な使い方であ
る。
【0017】
【発明の効果】第1の効果は、音声認識装置を使って入
力域が複数あるような特定フォーマットの帳票に文字を
入力していく作業の効率を良くすることである。 その
理由は、一定間隔の無発声時間を置きながら帳票の入力
域の順番に沿って発声していくだけで、帳票の文字入力
域に文字を入れていくことができるからである
【0018】第2の効果は、音声認識装置を使って表計
算ソフトウェアなどに文字または数字を入力していく作
業の効率を良くすることである。 その理由は、一定感
覚の無発声時間を置きながら表計算ソフトウェアの入力
セルの順に沿って発声していくだけで、表計算ソフトウ
ェアの各セルに文字または数字を入れていくことができ
るからである。
【図面の簡単な説明】
【図1】 図1は本発明の実施の形態を示すブロック図
である。
【図2】 図2は本発明の一実施例を示すブロック図で
ある。
【符号の説明】
1 コンピュータ 2 キーボードまたはマウス 3 記憶装置 4 無音時間設定 5 キーコード設定 6 人 7 音声 8 マイク 9 音声認識装置 10 音声認識装置9で音声7を文字に変換した文字列 11 文字入力制御部 12 アプリケーションプログラム 13 アプリケーシュンプログラム12の中の文字入力
域 14 無音判定手段 15 タイマー 16 キーコード設定5で設定されているキーコード 17 アプリケーシュンプログラム12の中の次の文字
入力域 18 次の音声 19 音声認識装置9で次の音声を文字に変換した次の
文字列
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 3/16 320 G06F 3/16 340 G10L 15/28

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 人が発声した言葉を音声認識して文字と
    してコンピュータなどに入力する音声認識装置におい
    て、 発声と発声の間の無音状態があらかじめ指定した時間以
    上続いた場合、あらかじめ指定していたキーコードを自
    動的に挿入する機能を持ち、 利用前にあらかじめキーボードまたはマウスによりコン
    ピュータの記憶装置に格納され上記無音時間設定で設定
    されている時間、およびキーコード設定で設定されてい
    るキーコードを持 つ音声認識装置。
  2. 【請求項2】 人が発声した言葉を音声認識して文字と
    してコンピュータなどに入力する音声認識装置におい
    て、 発声と発声の間の無音状態があらかじめ指定した時間以
    上続いた場合、あらかじめ指定していたキーコードを自
    動的に挿入する機能を持ち、 発声が途切れて無音状態になった場合、上記音声認識装
    置に設置されている無音判定手段が作動して、無音時間
    設定で設定されている時間以上無音が続いていることを
    確認すると、キーコード設定で設定されているキーコー
    ドを生成して該キーコードを文字入力制御を通じてアプ
    リケーションプログラムに渡し、 利用前にあらかじめキーボードまたはマウスによりコン
    ピュータの記憶装置に格納され上記無音時間設定で設定
    されている時間、およびキーコード設定で設定されてい
    るキーコードを持つ ことを特徴とする音声認識装置。
  3. 【請求項3】 上記キーコード設定で設定されているキ
    ーコードは、文字入力域を次の文字入力域に移動するた
    めのキーコードであることを特徴とする請求項1または
    請求項2のいずれかに記載の音声認識装置。
  4. 【請求項4】 上記無音時間設定に“連続”の設定を設
    けることにより、上記無音時間設定で設定されている時
    間を経過するごとにキーコードを挿入し、文字入力域を
    移動することを特徴とする請求項3記載の音声認識装
    置。
  5. 【請求項5】 上記キーコード設定で設定されているキ
    ーコードは、文字入力域の次の文字入力域に移動するた
    めのコードと文字をセットにしたキーコードであること
    を特徴とする請求項3に記載の音声認識装置。
JP04389999A 1999-02-22 1999-02-22 音声認識装置 Expired - Fee Related JP3245569B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04389999A JP3245569B2 (ja) 1999-02-22 1999-02-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04389999A JP3245569B2 (ja) 1999-02-22 1999-02-22 音声認識装置

Publications (2)

Publication Number Publication Date
JP2000242465A JP2000242465A (ja) 2000-09-08
JP3245569B2 true JP3245569B2 (ja) 2002-01-15

Family

ID=12676564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04389999A Expired - Fee Related JP3245569B2 (ja) 1999-02-22 1999-02-22 音声認識装置

Country Status (1)

Country Link
JP (1) JP3245569B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9355683B2 (en) 2010-07-30 2016-05-31 Samsung Electronics Co., Ltd. Audio playing method and apparatus

Also Published As

Publication number Publication date
JP2000242465A (ja) 2000-09-08

Similar Documents

Publication Publication Date Title
US6711543B2 (en) Language independent and voice operated information management system
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
Bell et al. Prosodic adaptation in human-computer interaction
WO2004036939A1 (fr) Appareil de communication mobile numerique portable, procede de commande vocale et systeme
WO2007148493A1 (ja) 感情認識装置
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
Karat et al. Conversational interface technologies
JP2007017620A (ja) 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体
EP1374228A1 (en) Method and processor system for processing of an audio signal
JPH11175082A (ja) 音声対話装置及び音声対話用音声合成方法
JP3245569B2 (ja) 音声認識装置
JPH10326176A (ja) 音声対話制御方法
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
CN100380442C (zh) 利用优化音素集进行普通话语音识别的系统和方法
KR20210000802A (ko) 인공지능 음성 인식 처리 방법 및 시스템
KR20120111510A (ko) 대화형 음성 인식을 통한 로봇 제어 시스템
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JP2001188788A (ja) 会話処理装置および方法、並びに記録媒体
JP2003044085A (ja) コマンド入力機能つきディクテーション装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP2005258235A (ja) 感情発話検知による対話修正機能を備えた対話制御装置
JP6759370B2 (ja) 呼出音認識装置および呼出音認識方法
Rudžionis et al. Assistive tools for the motor-handicapped people using speech technologies: Lithuanian case
Schramm et al. A Brazilian Portuguese language corpus development
US7353172B2 (en) System and method for cantonese speech recognition using an optimized phone set

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011002

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081026

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees