JPH07210186A - 音声登録装置 - Google Patents

音声登録装置

Info

Publication number
JPH07210186A
JPH07210186A JP6001241A JP124194A JPH07210186A JP H07210186 A JPH07210186 A JP H07210186A JP 6001241 A JP6001241 A JP 6001241A JP 124194 A JP124194 A JP 124194A JP H07210186 A JPH07210186 A JP H07210186A
Authority
JP
Japan
Prior art keywords
voice
input
registration
section
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6001241A
Other languages
English (en)
Inventor
Yasushi Yamazaki
泰 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6001241A priority Critical patent/JPH07210186A/ja
Publication of JPH07210186A publication Critical patent/JPH07210186A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声登録装置に関し、音声の登録の際、音声以
外の雑音が付加されたり、音声の一部が欠落した状態で
登録されることを防止することを目的とする。 【構成】音声入力部から入力された音声を、音声区間検
出部によって音声区間を検出し、音声記憶部に登録する
音声登録装置において、入力音声を一時記憶する音声一
時記憶部(4)と、音声長を計算する音声長計算部
(5)と、音声長に応じて提示音を出力する提示音出力
部(6)と、登録を行うか否かを確認する登録確認入力
部(7)を有することを特徴とする音声登録装置を構成
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声登録装置に関す
る。近年、音声認識装置を利用することが多くなり、装
置構成の簡素化と装置利用者の操作容易性が求められて
いる。それに対する一つの回答として、画像情報を用い
ないで、もっぱら音声によって音声の登録確認が可能な
シンプルなユーザインタフェースが期待されている。本
願発明は、かかるシンプルなユーザインタフェースを実
現するために有効な音声登録装置に関する。
【0002】
【従来の技術】従来の音声登録装置を図8に示す。音声
入力部(1)から入力された音声から、区間検出部
(2)で音声区間を検出し、音声記憶部(3)に登録す
る。
【0003】登録された音声は、音声認識の際の辞書
や、蓄積再生型の音声合成のデータとして利用されるた
め、入力音声からその音声パターンだけを抽出すること
が非常に重要である。音声区間を誤認して、その検出結
果に従って音声パターンを抽出してこれを音声認識の際
の辞書や、蓄積再生型の音声合成のデータとして利用し
た場合を想定すると、その後の音声認識における誤認
や、不自然な音声合成の原因となる。
【0004】このため、音声区間の検出の方法として、
入力音声レベルに対して一定の閾値を設定して音声区間
と無音声区間を区別する等の方法が採られている。具体
的には、登録音声の区間検出は、入力音声のパワーを逐
次計算し、予め定めた閾値を上回った区間を音声とする
方法が採られている。この場合、音声区間検出部によっ
て音声区間を決定する際に、前後に雑音が付加された
り、あるいは音声の先頭・語尾が脱落してしまうことが
ある。図9には「愛知」と登録した場合の音声の例を示
している。同図(1) の例は正しく区間検出が行われてい
るが、同図(2) の例では音声の後ろに雑音が付加され、
又、同図(3) の例では「愛知」の「チ」の発音が小さか
ったため脱落してしまっている。
【0005】このように、閾値によっては、入力音声と
雑音等の不要レベルとの完全な識別は困難でり、音声入
力のみによる音声の登録確認は不可能であった。
【0006】
【発明が解決しようとする課題】このように、従来の方
法では入力音声の音声区間の検出精度が充分でなく、従
って、正しく音声が登録される保障がないため、これを
音声認識の際の辞書として使用することができなかっ
た。
【0007】本願発明はかかる問題点を解決すべくなさ
れたもので、音声の登録の段階で雑音の付加や音声の脱
落がなく、必要とする音声のみを登録をする手段を提供
することを目的とするものである。
【0008】
【課題を解決するための手段】図1は本願発明の原理説
明図である。図中、1は音声入力部で、図示していない
が、マイクロホン、増幅器、濾波器等を含み、音声信号
を所定のレベルにするもの、2は音声区間検出部で、入
力された音声信号の音声区間を検出するもの、3は音声
記憶部で、音声を登録するもの、4は音声一時記憶部
で、音声を確認して登録するまで一時的に記憶しておく
もの、5は音声長計算部で、検出した音声長を計算する
もの、6は提示音出力部で音声長に応じて提示音を出力
するもの、7は登録確認入力部で、登録利用者が提示音
により登録するか否かを確認するもの、8は登録者が登
録すべき旨の確認をした場合に、一時記憶部に記憶され
た音声を音声記憶部に登録するものである。
【0009】本構成において、音声入力部(1)から入
力された音声を、区間検出部(2)で音声区間を検出
し、一時記憶部(4)に記憶する。検出した音声区間長
を計算(5)し、音声長に応じて提示音を出力(6)す
る。登録利用者が提示音により登録するか否かを確認
(7)し、登録するべきと判断した場合には、登録制御
部(8)によって、一時記憶部から音声記憶部(3)に
登録する。
【0010】
【作用】本願発明によれば、音声区間長に応じた提示音
を出力し、当該提示音によって登録者が直接登録の可否
判断を行い、登録可能の判断をした場合に限って、音声
記憶部(3)に登録される。
【0011】従って、雑音の付加や音声の脱落のある場
合には登録を効果的に防止することができ、その結果、
音声認識の際の辞書としての信頼度を高めることができ
る。
【0012】
【実施例】第1の実施例構成図を図2に示す。本実施構
成例は、本願発明を登録型音声認識装置の登録部に実施
したものである。図中、9は分析部で、音声の特徴を捉
えるために波形分析等を行うもの、10は認識部で、入
力された音声と記憶されている音声との比較を行いその
同否を判別するものである。その他の部分は図1の場合
と同じである。
【0013】以下では、図6を参照しつつ、利用者の行
動と装置の動作の関係を説明する。登録時には、利用者
が登録開始の意思表示として、例えば図2に示していな
い登録ボタンを押すことによって、登録装置は音声入力
受付状態となる。音声入力部(1)から入力された音声
は、区間検出部(2)でその音声区間が検出され、分析
部(9)で、例えば周波数帯域に分割され、一時記憶部
(4)に記憶される。検出された音声区間長が計算
(5)され、音声長に応じて提示音が出力(6)され
る。例えば、入力された音声の各音節に対応してレベル
等の異なる提示音成分を順次出力する。この間、登録利
用者は提示音を聴取している。登録利用者が提示音によ
り登録するか否かを確認(7)し、登録可能との判断を
した場合には、登録制御部(8)によって、一時記憶部
から音声記憶部(3)に登録する。
【0014】具体的には、先に示した「愛知」なる音声
の例によると、「チ」の発音が小さかった場合には、発
生終了後の提示音が比較的短くなるため(図6の例では
X2で終わりX3が存在しないため)、登録利用者は入
力音声の登録が「不可」と判断して、登録確認入力部
(7)に登録の指令の入力を行わない。「チ」の発音終
了後にノイズが含まれる場合には、逆に提示音が長くな
り(図6の例ではX3の後にX4等が続くために)、登
録利用者はやはり入力音声の登録が「不可」と判断し
て、登録確認入力部(7)に登録の指令の入力を行わな
い。
【0015】これに対して、「アイチ」と正しく区間検
出された場合には、提示音が適切な長さであるため(図
6の例ではX1、X2、X3のみが存在するため)、登
録利用者は入力音声の登録が「可能」と判断して、登録
確認入力部(7)に登録の指令の入力を行なう。登録の
指令が在った場合には、一時音声記憶部(4)に一時的
に記憶されていた音声の分析結果、例えば周波数帯域ご
とのパワー分布、を音声記憶部(3)に移動して正式に
登録する。
【0016】認識時には、音声入力部(1)から入力さ
れた音声を、区間検出部(2)で音声区間を検出し、分
析部(9)の分析結果と、登録音声(3)との比較を認
識部(10)で行い、認識結果を出力する。なお、上述
の例では、利用者が登録開始の意思表示として、登録ボ
タンを押すことによって、登録装置は音声入力受付状態
となるとして説明したが、利用者の発声によって、登録
装置は音声入力受付状態となる構成も同様に可能であ
る。図7は、利用者の発声によって登録装置が音声入力
受付状態となる場合の利用者の行動と装置の動作の関係
を説明するものである。図6の例では音声入力が終了し
て後提示音が出力されるのであるが、図7の本例では発
声とほぼ同時に提示音が出力され始める。本例は、音声
入力が長い場合に有効である。
【0017】第2の実施例構成図を図3に示す。本実施
例は、第1の実施例に加え、登録音声のパワーを計算
(11)し、音声パワーに応じて提示音の音量を変更
(12)する。これにより、登録された音声がはっきり
と確認することが可能となる。第3の実施例構成図を図
4に示す。本実施例は、第1の実施例に加え、登録音声
のピッチを計算(13)し、この結果に応じて提示音の
周波数を変更(14)するものである。これにより、登
録された音声がよりはっきりと確認することが可能とな
る。
【0018】第4の実施例構成図を図5に示す。本実施
例は、第2の実施例、第3の実施例を組み合わせたもの
で、音声パワー及びピッチに応じて提示音を変更するこ
とにより、登録された音声がよりはっきりと確認するこ
とが可能となる。以上の実施例の説明では、音声入力と
して、マイクに向かって人が発声する場合について説明
したが、その場合に限定されることなく、その他の音声
入力手段に関しても同様の効果が期待できる。例えば、
録音された音声の比較、音声以外に何らかの障害発生に
伴って発生する音響等の登録とそれを用いた障害診断
等、広い範囲に適用可能である。
【0019】
【発明の効果】以上説明したように、本願発明によれ
ば、登録音声の長さに応じた提示音を出力することによ
り、入力音声を過不足無く正確に登録することができ
る。又、装置からの画像出力等の補助手段を必要とせず
音声のみで装置への入出力が可能なため、シンプルなユ
ーザインタフェースを実現することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の第1の実施例構成図である。
【図3】本発明の第2の実施例構成図である。
【図4】本発明の第3の実施例構成図である。
【図5】本発明の第4の実施例構成図である。
【図6】利用者の行動と装置の動作の関係の第1の説明
図である。
【図7】利用者の行動と装置の動作の関係を第2の説明
図である。
【図8】従来の構成例である。
【図9】登録音声例である。
【符号の説明】
1 音声入力部 2 音声区間検出部 3 音声記憶部 4 音声一時記憶部 5 音声長計算部 6 提示音出力部 7 登録確認入力部 8 登録制御部 9 分析部 10 認識部 11 音声パワー検出部 12 音量変更部 13 ピッチ計算部 14 周波数変更部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声入力部から入力された音声を、音声区
    間検出部によって音声区間を検出し、音声記憶部に登録
    する音声登録装置において、 入力音声を一時記憶する音声一時記憶部(4)と、 音声長を計算する音声長計算部(5)と、 音声長に応じて提示音を出力する提示音出力部(6)
    と、 登録を行うか否かを確認する登録確認入力部(7)を有
    することを特徴とする音声登録装置。
  2. 【請求項2】請求項1において、 入力音声の強さを計算する音声パワー計算部(11)
    と、 音声パワーに応じて提示音の大きさを変える音量変更部
    (12)を有することを特徴とする音声登録装置。
  3. 【請求項3】請求項1において、 入力音声のピッチを計算するピッチ計算部(13)と、 ピッチに応じて提示音の周波数を変える周波数変更部
    (14)を有することを特徴とする音声登録装置。
  4. 【請求項4】請求項2において、 入力音声のピッチを計算するピッチ計算部(13)と、 ピッチに応じて提示音の周波数を変える周波数変更部
    (14)を有することを特徴とする音声登録装置。
JP6001241A 1994-01-11 1994-01-11 音声登録装置 Pending JPH07210186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6001241A JPH07210186A (ja) 1994-01-11 1994-01-11 音声登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6001241A JPH07210186A (ja) 1994-01-11 1994-01-11 音声登録装置

Publications (1)

Publication Number Publication Date
JPH07210186A true JPH07210186A (ja) 1995-08-11

Family

ID=11495970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6001241A Pending JPH07210186A (ja) 1994-01-11 1994-01-11 音声登録装置

Country Status (1)

Country Link
JP (1) JPH07210186A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097792A1 (ja) * 2003-04-28 2004-11-11 Fujitsu Limited 音声合成システム
JP2013134476A (ja) * 2011-12-27 2013-07-08 Yamaha Corp 音声合成装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097792A1 (ja) * 2003-04-28 2004-11-11 Fujitsu Limited 音声合成システム
US7143038B2 (en) 2003-04-28 2006-11-28 Fujitsu Limited Speech synthesis system
JP2013134476A (ja) * 2011-12-27 2013-07-08 Yamaha Corp 音声合成装置及びプログラム

Similar Documents

Publication Publication Date Title
JPS63301998A (ja) 音声認識応答装置
JPH0226240B2 (ja)
JP2996019B2 (ja) 音声認識装置
JPH07210186A (ja) 音声登録装置
JP2006039382A (ja) 音声認識装置
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JP3008593B2 (ja) 音声認識装置
JP4979336B2 (ja) 音声出力装置
JP3360978B2 (ja) 音声認識装置
JPH0481898A (ja) 音声認識装置
JPH03114100A (ja) 音声区間検出装置
JPH02103599A (ja) 音声認識装置
JPS60205600A (ja) 音声認識装置
JPS58125099A (ja) 音声認識装置
JPH039400A (ja) 音声認識装置
JP3125928B2 (ja) 音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法
JPS6239899A (ja) 会話音声理解方法
JPS59211100A (ja) 登録型音声認識方法
JPH04347898A (ja) 音声認識方法
JPS63306498A (ja) 音声区間検出方式
JPS6070497A (ja) 音声認識装置
JPH02272495A (ja) 音声認識装置
JPH11187117A (ja) 録音再生装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021008