JPH06139289A - 情報再生装置 - Google Patents

情報再生装置

Info

Publication number
JPH06139289A
JPH06139289A JP4287705A JP28770592A JPH06139289A JP H06139289 A JPH06139289 A JP H06139289A JP 4287705 A JP4287705 A JP 4287705A JP 28770592 A JP28770592 A JP 28770592A JP H06139289 A JPH06139289 A JP H06139289A
Authority
JP
Japan
Prior art keywords
voice
signal
terminal
main control
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4287705A
Other languages
English (en)
Inventor
Hideo Okano
秀生 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP4287705A priority Critical patent/JPH06139289A/ja
Publication of JPH06139289A publication Critical patent/JPH06139289A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

(57)【要約】 【目的】煩雑な操作を行わずに記録された音声情報中の
所望の記録箇所を検索可能にする。 【構成】音声登録モードで、特徴抽出部40は、マイク
10より入力された音声信号から音声パラメータを抽出
し、これを主制御部22により切り換え制御されるスイ
ッチ36を介して単語登録部38に登録する。検索モー
ドで、主制御部22は駆動制御部28を制御して高速再
生動作を行う。そして、特徴抽出部40は、ヘッド16
からの再生信号から音声パラメータを抽出し、スイッチ
36を介して、比較器42に送る。比較器42は、単語
登録部38に登録された音声パラメータと送られてきた
音声パターンとを比較し、一致する箇所が検出できる
と、主制御部22に検出信号を送る。主制御部22は、
この検出信号が入力されると、駆動制御部28に停止信
号を送り、高速再生動作を停止させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を記録,再生する
口述筆記装置や、電話回線や無線等で送られてきた音声
を記録蓄積,再生する装置などに用いられる情報再生装
置に関する。
【0002】
【従来の技術】最近、オフィスにおける事務合理化とと
もに特にマネージャ等の地位にあるものは多くの仕事量
をこなさなければならず、これにほとんどの時間が費や
されている。このため、手紙や報告書などの作成にあっ
ては、その都度原稿を手書きすることなどできず、これ
に代わって原稿内容を予めテープに録音し、これを秘書
が再生しながらタイプや筆記清書するようなことが行わ
れている。
【0003】このような場合に用いられるものとして、
例えば、特開昭60−25039号公報や特開昭63−
112886号公報に開示されているような口述筆記装
置がある。この口述筆記装置は、秘書がテープ内容を聞
きながらタイプ操作を行うのに便利なように考えられて
おり、このため多種多様にわたる諸機能が要求されてい
る。
【0004】例えば、このような口述筆記装置におい
て、口述者が筆記者に伝えようとするものに、予め記録
されたメッセージの形式や優先度の有無、諸注意等を区
別して伝えるようにしたいという要求がある。また口述
筆記装置においてさらに要望される特徴として、記録媒
体上に存在するメッセージの数、位置及び色々な形式が
識別できるとともに、記録媒体上で所望のメッセージを
容易に探索できるようにするというものがある。
【0005】そこで、従来、口述者は、例えば、テープ
レコーダ等の口述機を用いて後述した一連の文章の後
に、他の後続する文章と区別するために、識別信号とし
て、トーン又はキュー信号を記録するようにしていた。
さらに、関連メッセージを記録する必要がある場合に
は、その記録の際に、上記識別信号とは異なるトーン又
はキュー信号を記録するようにしていた。
【0006】識別信号を記録するための典型的な操作方
法は、口述者が口述による記録を行っているときに途中
で筆記者に伝えたいメッセージ等が発生した場合、キュ
ー釦を押し識別する信号としてキュー信号を記録し、ま
た口述メッセージ(一連の文章)記録の終了を示すとき
に別のキュー釦を押し上記識別信号とは異なる識別信号
を記録するというものである。
【0007】従って、筆記者は、筆記を行う前に、情報
の高速再生を行って予め口述者の諸注意を聞くことがで
きる。また、この高速再生時に、口述筆記装置の表示部
には、記録媒体とキュー信号の相対的位置関係なども表
示されるので、筆記者は聞きたい情報を視覚的に区別す
ることができる。
【0008】このような口述筆記装置のシステム構成
は、例えば図7の(B)に示すような構成をとる。な
お、この図は、上記特開昭60−25039号の第1図
を簡略化したものである。
【0009】即ち、録音動作においては、マイク10よ
り入力された音声信号は、マイクアンプ12で増幅さ
れ、録音再生アンプ14を通してヘッド16によって不
図示記録媒体に記録される。再生動作においては、記録
媒体からヘッド16によって検出された信号は、録音再
生アンプ14で増幅され、パワーアンプ18でさらに増
幅されてスピーカ20に送られる。これらの一連の動作
のコントロールは制御部22によって行われる。この制
御部22は、また、インターフェース24を介して録
音,再生のスイッチの状態を検出し、表示部26や駆動
制御部28に制御信号を送る。駆動制御部28はモータ
30の制御を行う。
【0010】録音時にキューボタンが押されると、イン
ターフェース24から信号が制御部22に送られ、制御
部22はこれに応じて、キュー制御信号をバイアス発振
回路32に送り、ヘッド16を介してキュー信号を記録
媒体に記録させる。再生または高速再生時には、キュー
信号がヘッド16を介してキュー信号検出部34より検
出され、それに応じて制御部22は表示部26又は駆動
制御部28に制御信号を送り前述したような所定の動作
を行わせる。
【0011】
【発明が解決しようとする課題】しかし、従来の口述筆
記装置においては、口述記録された文章中の所望箇所を
捜す場合、口述者は、再生又は倍速再生を行い、実際に
耳で聞いてその内容を確かめながら上記所望箇所を見つ
け出す操作を行わなければならない。一般に、このよう
なときは、再生,早送り,巻き戻しの操作を繰り返し行
わなければならず、所望の箇所を見つけ出すまでには煩
雑な操作が必要になる。
【0012】本発明は、上記の点に鑑みてなされたもの
で、記録された音声情報中の所望箇所を見つけ出すと
き、再生,早送り,巻き戻しの操作を繰り返すといった
煩雑な操作を行わずに、所望の箇所を検索することが可
能な情報再生装置を提供することを目的とする。
【0013】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明による情報再生装置は、検索情報として利
用する所定長さの音声情報の特徴的標準パターンを予め
登録する特徴的標準パターン登録手段と、上記所定長さ
の音声情報よりも長い音声情報が記録されている記録媒
体より読み出された所定の音声信号を分析し特徴パター
ンを抽出する特徴パターン抽出手段と、抽出された特徴
パターンと予め登録された所定長さの音声情報の特徴的
標準パターンとを比較しその類似度を判定する判定手段
とを備えることを特徴とする。
【0014】
【作用】即ち、本発明の情報再生装置によれば、記録媒
体に記録されている音声情報の所望の箇所を捜すため
に、検索情報として利用する所定長さの音声情報の特徴
的標準パターンを予め登録しておき、記録媒体より読み
出された所定の音声信号を分析し特徴パターンを抽出し
て、その抽出された特徴パターンと予め登録された所定
長さの音声情報の特徴的標準パターンとを比較しその類
似度を判定する。
【0015】
【実施例】以下、本発明の実施例を説明する。 (第1実施例)図1は、本発明の第1実施例の構成を示
す図で、同図において、従来と同様のものには、図7の
(B)におけるのと同様の参照番号を付す。
【0016】即ち、録音動作においては、マイク10よ
り入力された音声信号は、マイクアンプ12で増幅され
た後、録音再生アンプ14を通してヘッド16によって
不図示の記録媒体に記録される。また、再生動作におい
ては、上記不図示記録媒体から上記ヘッド16によって
検出された信号が、上記録音再生アンプ14で増幅され
た後、パワーアンプ18でさらに増幅されてスピーカ2
0に送られる。これらの一連の動作は、主制御部22に
よって制御される。この主制御部22はまた、インター
フェース24を介して、録音スイッチREC,再生スイ
ッチPLAY,キューボタンCUE1及びCUE2,音
声登録ボタンRRREC,検索ボタンSV,等の状態を
検出し、さらには表示部26や駆動制御部28に制御信
号を送る。主制御部22からの上記制御信号に応じて、
表示部26はキュー信号表示やカウンタ表示などの種々
の表示を行い、また駆動制御部28はモータ30の駆動
制御を行う。
【0017】一方、上記録音時において、上記キューボ
タンCUEが押されると、上記インターフェース24か
ら信号が上記主制御部22に送られる。主制御部22は
これに応じて、キュー制御信号をバイアス発振回路32
に送り、上記ヘッド16を介してキュー信号を不図示記
録媒体に記録させる。そして、再生又は高速再生時に
は、キュー信号が上記ヘッド16を介してキュー信号検
出部34によって検出され、その検出に応じて上記主制
御部22は、表示部26又は駆動制御部28に制御信号
を送り所定の動作を行わせる。以上は、従来の装置と同
様である。本実施例の情報再生装置は、さらに次のよう
な構成を有している。
【0018】即ち、音声登録ボタンRRRECが押され
ると、上記インターフェース24から信号が上記主制御
部22に送られる。主制御部22はこれに応じて、スイ
ッチ36を単語登録部38側に切り換える。そして、上
記マイク10より入力された音声信号は、マイクアンプ
12を通して音声の特徴抽出部40に入力され、この特
徴抽出部40で抽出された音声パラメータが、上記スイ
ッチ36を介して上記単語登録部38に入力されて、そ
こに登録される。
【0019】次に、検索ボタンSVが押されると、上記
インターフェース24から信号が送られ、上記主制御部
22は、高速再生動作信号を駆動制御部28に送り高速
再生動作を行う。このとき、上記ヘッド16により不図
示の磁気テープから再生信号が検出され、上記録音再生
アンプ14で増幅した後、上記特徴抽出部40で音声パ
ラメータが出力される。ここで、上記主制御部22が上
記スイッチ36を切換制御することにより、比較器42
にその音声パラメータが送られる。この比較器42は、
上記単語登録部38に登録された音声パラメータと、こ
の特徴抽出部40より送られてきた音声パターンとを比
較し、一致する箇所が検出できると、上記主制御部22
に検出信号を送る。主制御部22は、この検出信号が入
力されると、上記駆動制御部28に停止信号を送り、高
速再生動作を停止させる。
【0020】以上のようにして、倍速再生又は逆高速再
生を行いながら、口述者が記録し直したい箇所を見つけ
る際に、その希望の場所を、音声の登録によって見つけ
出すことによって、再生,早送り,巻き戻しの操作を繰
り返すといった煩雑な操作を行わずに、所望の音声記録
箇所を検索することができ、キューマークの追加や録音
した音声の編集を容易に行うことができるようになる。
【0021】ところで、上記不図示記録媒体として磁気
テープを使用し、高速再生を行いながら検索を行う場
合、高速再生で音声信号が変化してしまう。このため、
高速再生した信号と登録した音声が全く異なる音声信号
になるため、高速再生された信号でも検索できる何等か
の手法を盛り込む必要がある。そこで本実施例では、音
声登録のときのサンプリング周波数と高速再生のサンプ
リング周波数を変えることにより、登録した音声と高速
再生された音声をパターンマッチングさせるときに時間
軸を一致させるようにするものとする。具体的には、登
録時点ではサンプリング周波数を8HKzで、倍速再生
時は16kHzにする。このような手法を盛り込んだ本
第1実施例の具体的な構成を図2及び図3に示す。
【0022】即ち、マイク10にマイクアンプ12を接
続し、このマイクアンプ12に録音再生アンプ14を介
して磁気ヘッド16を接続し、また録音再生アンプ14
にパワーアンプ18を介してスピーカ20を接続してい
る。なお、参照番号32はバイアス発振回路、44は外
部マイク接続用端子である。
【0023】例えばマイクロコンピュータで構成される
主制御部22は、録音再生アンプ14やパワーアンプ1
8に接続され、録音,再生の制御を行う。この主制御部
22の出力ポートPDの各端子D0〜D3と入力ポート
PKの各端子K0〜K3の間にキーボード46、フート
スイッチやハンドコントローラなどのリモコン操作部4
8が接続されている。ここで、上記キーボード46は、
録音キーREC1、巻き戻しキーREW1、再生キーP
LAY1、早送りキーFF1、音声登録キーRRRE
C、キューキーCUE、消去キーERASE、停止キー
STOP、検索キーSVを有している。また、リモコン
操作部48は、録音キーREC2、巻き戻しキーREW
2、再生キーPLAY2,PLAY3、等を有してい
る。
【0024】上記主制御部22の入出力ポートPAの各
端子A0〜A3及び入出力ポートPBの端子B2,B3
には、表示回路26が接続されている。この表示回路2
6は、LEDにより録音,再生,巻き戻し,早送り,等
の状態表示ができるように構成されている。
【0025】上記主制御部22の出力ポートPEの各端
子E0〜E3には、上記駆動制御部28の一部を成すソ
レノイド駆動回路50を介して、ソレノイド52A,5
2Bを接続している。これらソレノイド52A,52B
はメカ部を各モードに駆動するためのもので、ソレノイ
ド52Aは録音再生モード時に駆動され、またソレノイ
ド52Bは早送り巻き戻しモード時に駆動される。ま
た、主制御部22の出力ポートPFの端子F0〜F3に
は、上記駆動制御部28の一部を成すモータ駆動回路5
4を介して、モータ30を接続している。
【0026】上記主制御部22の入出力ポートPBの端
子B0には、バックスペース設定部56を接続してい
る。このバックスペース設定部56は、再生モードで一
時停止し再び再生モードとした時に、所定の時間だけ巻
き戻す時間を設定するためのものである。
【0027】上記主制御部22の出力ポートPGの各端
子G0〜G3の内、端子G0はバイアス発振回路32に
接続しており、録音モード時に、上記キーボード46の
キューキーCUE操作に応じてCUE出力信号を発生す
る。また端子G1は、アラーム信号つまりAC出力を発
生する。端子G2は、録音再生アンプ14に接続し、録
音モードのとき、録音再生アンプ14の出力の立ち上が
りを所定の時間遅らせる信号を発生する。端子G3は、
バイアス発振回路32に接続しており、上記キーボード
46の録音スイッチREC1,REC2の操作に応じ
て、録音起動のREC出力信号を発生する。
【0028】上記主制御部22の入力ポートH0には、
プリエンド検出のためのREEL入力を与えるようにし
ている。この場合のREEL入力は、不図示のリールの
回転に応じたモータのパルス状回転信号が用いられてい
る。また、入力ポートINTには、切換スイッチ58を
接続し、このスイッチ58にキュー信号源としての上記
バイアス発振回路32を接続するとともに、上記キュー
信号検出部34を接続している。このキュー信号検出回
路34は、再生モード時、磁気ヘッド16の再生出力よ
りキュー信号を検出するもので、この検出出力を上記入
力ポートINTに入力するようにしている。そして、上
記主制御部22の端子OSC0,OSC1には、発振回
路60を接続している。
【0029】上記スイッチ58にはまた、デジタル信号
処理部(DSP)62の端子SRが接続されている。一
方、上記マイクアンプ12と録音再生アンプ14の結節
点にAD/DA変換器64が接続されている。そして、
このAD/DA変換器64と上記デジタル処理部62と
は、それぞれ端子DRと端子POUT、端子DXと端子
PIN、両CLK端子間、両FSX及びFSR端子間が
接続され、デジタル化された音響データの送受信を行
う。また、両CLK端子には、伝送速度を決めるクロッ
クを発生する発振回路66が接続されている。
【0030】この発振回路66は、上記主制御部22の
端子H3と接続されており、この端子H3から発生する
信号で、クロック周波数を内部分周回路66Aにて変化
させることができる。また、この発振回路66は、上記
AD/DA変換器64のFS端子、及びタイミング制御
回路68にも接続されている。このタイミング制御回路
68は、上記デジタル処理部62及びAD/DA変換器
64の端子FSX,FSRに接続され、伝送タイミング
を制御している。
【0031】上記デジタル信号処理部62は、メモリ7
0にアドレス端子とデータ端子が接続されている。ま
た、このデジタル信号処理部62の制御信号に接続され
たデコーダ72は、選択信号を発生し、それを上記メモ
リ70の端子CSに入力するよう接続されている。
【0032】上記デジタル信号処理部62のデータ端子
はまた、バッファ74に接続され、該バッファ74は上
記デコーダ72とも接続されている。このバッファ74
の端子D1〜D8は、上記主制御部22の入出力ポート
PCの端子C0〜C7に接続されている。このバッファ
74は、処理スピードの異なる上記主制御部22と上記
デジタル信号処理部62との間でデータの送受信を可能
にするために用いられている。次に、このような構成に
おける作用を、図4の処理の概略図を参照して説明す
る。
【0033】初めに、検索情報として利用する音声の特
徴的標準パターンを予め登録する音声登録モードとし
て、図4中の経路Aを通る。また、この音声登録モード
の処理の流れは、図5の(A)に示すフローチャートの
ようになる。
【0034】まず、キーボード46の音声登録スイッチ
RRRECをONすると、主制御部22は、そのことを
PDポートとPKポートより検知して、出力ポートH3
から発振回路66のFT端子にサンプリング切り換え制
御信号を入力する。この信号により、発振回路66は内
部分周切換回路66Aにより、サンプリング周波数を8
KHzに設定する(ステップS11)。
【0035】そして、マイク10から入力された音響信
号は、マイクアンプ12で増幅された後、AD/DA変
換器64に入力される。このAD/DA変換器64は、
サンプリング周波数8KHzで入力アナログ音響信号を
サンプリングしてデジタル信号に変換する。このデジタ
ル信号化された音響信号は、デジタル信号処理部62の
内部の前処理部76に送られる。この前処理部76で
は、入力した音響データを高域強調フィルタ(プリエン
ファシス)に通し、適応フィルタなどを利用して雑音除
去を行った後、マイク10から入力された音響信号が音
声であるかをスペクトラムやレベルなどより判定し、も
し無音(VOX)と判定するとVOX信号を出力する
(ステップS12)。このVOX信号が検出されなくな
ると(ステップS13)、音響データは10msec〜
30msec毎のブロックデータにまとめられて特徴パ
ラメータ抽出部40に送られる。
【0036】この特徴パラメータ抽出部40内部の処理
は、図6の(A)に示すようになる。即ち、前処理部7
6より送られてくるブロック音響データは、音響分析部
40Aに入力される。この音響分析部40Aは、線形予
測分析から自己相関関数を計算する。このとき、線形予
測係数{a1 ,a2 ,a3 ,…,ap }と自己相関関数
{r(1),r(2),r(3),…r(p)}が求ま
り、これを用いて逆スペクトル係数算出部40Bがブロ
ックデータ毎に特徴パラメータとしての逆スペクトル係
数{A1 ,A2 ,A3 ,…,Ap }を求め蓄積する(ス
テップS14)。この逆スペクトル係数は、単語登録部
38に、その記憶容量が一杯になるまで(数秒分)検索
データとして蓄積される(ステップS15)。そして、
記憶容量が一杯になったならば、マイク10からの音声
入力信号の受け付けを終える、即ち無視する(ステップ
S16)。ここで、線形予測法(線形予測分析)につい
て説明を加える。
【0037】線形予測法(linear prediction method)
による分析のことを、通常、LPC分析といっている。
LPCとは、線形予測係数(linear prediction coeffi
cients)のことで、スペクトルに関する情報が10個程
度の係数に集約されている。この方法の特徴は、音源で
発声した声の元になる音が声道を通って口から出てくる
までの音声の生成過程を音声波形から求めてしまうもの
であり、単にスペクトルの分析法としてだけでなく、音
声合成法としても最も有効な手段となっている。
【0038】連続した音声波形s(t)をΔt秒毎(通
常は100μs〜125μsが多い)にN個(150個
〜300個程度)を読み取る音声波形が{s(Δt),
s(2Δt),…,s(NΔt)}という数値データと
して得られる。このような波形を読み取る操作のことを
サンプリングと称し、読み取り間隔Δtのことをサンプ
リング周期と称する。複雑化を避けるためΔtを省略し
て、時刻t=nΔtにおける波形データをs(n)と書
く。ある時刻n(実際には時刻はnΔt)での値s
(n)をそれより過去の値をp個だけ使って次のような
予測すると考える(ここで、s’(n)をs(n)に対
する予測値として考える)。 s’(n)=−a1 s(n−1)−a2 s(n−2)−…ap s(n−p)
【0039】この式は、s(n)はそれよりも過去の値
の線形結合で表していることから、線形予測と呼ばれて
いる。この線形予測係数は予測値s’(n)ができるだ
けs(n)に近い値になるように決める。その有効方法
として最小2乗法が一般的に用いられている。即ち、い
ま予測誤差をε(n)とすれば、 ε(n)=s(n)−s’(n) =s(n)+a1 s(n−1) +a2 s(n−2)…+ap s(n−p)
【0040】ε2 (n)の時刻nについての総和y2
ε2 (1)+ε2 (2)+ε2 (3)+…が最小になる
ように係数を決めるわけである。その条件を求めると、
線形予測係数は、次のように求まる。
【0041】
【数1】 これは正規方程式と呼ばれて、r(0),r(1),…
は信号s(n)の自己相関関数と呼ばれる。この自己相
関関数は、
【0042】
【数2】
【0043】が定義式で、これは{s(n)}自身とそ
れをmサンプルだけ全体をずらしたものどうしを掛けて
加算したものである。m=0のときには、r(0)は信
号の2重和であるからs(n)のエネルギーである。従
って、サンプル値(s(1),s(2),…,s
(N)}から上式の自己相関関数を計算して、それで作
られる連立方程式を解いて線形予測係数を求める。
【0044】また、逆スペクトル係数は、この自己相関
関数{r(0),r(1),…,r(p)}と線形予測
係数{a1 ,a2 ,…ap }と予測誤差の総和のσ2
ら次の式から定まる。 σ2 =r(0)A0 +2r(1)A1 +2r(2)A2 +…+2r(p)Ap
【0045】次に、登録された音声を検索する音声検索
モードにする。この音声検索モードは、図4中の経路B
をとる。また、この音声検索モードの処理の流れは、図
5の(B)に示すフローチャートのようになる。
【0046】まず、キーボード46の検索キーSVをO
Nすると、主制御部22はそれをPDポートとPKポー
トより検知して、出力ポートH3より発振回路66のF
T端子にサンプリング切り換え制御信号を入力する。こ
れにより、高速再生に対応したサンプリング周波数に設
定される。この実施例では倍速再生で検索とすると、1
6KHzに設定される(3倍速では24KHzとなる)
(ステップS21)。また、主制御部22は、PEポー
トとPFポートに高速再生動作信号を出力し、例えば倍
速で再生を行うようにする(ステップS22)。
【0047】そして、ヘッド16から入力された音響信
号は録音再生アンプ14で増幅された後、AD/DA変
換器64に入力される。AD/DA変換器64は、サン
プリング周波数16KHzでサンプリングを行ってアナ
ログ音響信号をデジタル信号に変換する。このデジタル
信号化された音響信号は、デジタル信号処理部62の内
部の前処理部76に送られる。この前処理部76で、音
響データ区間は10msec〜30msec毎のブロッ
クデータにまとめられ、高域強調フィルタ(プリエンフ
ァシス)に通され、適応フィルタなどを利用して雑音除
去を行った後、特徴パラメータ抽出部40に送られる。
この特徴パラメータ抽出部40では、音声登録モードの
ときと同様に、この前処理部76から送られてくるブロ
ック音響データ信号Z(n)が音響分析部40Aに入力
されて、線形予測分析から自己相関関数か計算される。
このとき、線形予測係数{a1 ,a2 ,a3 ,…,
p }と自己相関関数{r(1),r(2),r
(3),…,r(p)}が求まり、次に、逆スペクトル
係数算出部40Bでこれを用いて逆スペクトル係数{A
1 ,A2 ,A3 ,…,Ap }を求め(ステップS2
3)、今度は、それを比較器としてのパターンマッチン
グ部42に送る。
【0048】パターンマッチング部42においては、標
準音声のパターンと検索する音声パターンとを照合する
ため、パターン同士のスペクトラムの形を評価するため
スペクトル距離を評価する。この距離尺度としては、L
PCケプストラム距離尺度や重み付け尤度比(WLR)
尺度最尤スペクトル距離尺度法などがある。この実施例
では、単語登録部38の標準音声パターンと再生音声パ
ターンのそれぞれ予測残差(予測誤差)の2乗和σ2
求め、この予測残差より尤度l=−logσ2 で導いた
値を類似度として使用し、再生音声パターンと標準音声
パターンのスペクトル距離を求めパターンマッチングを
行う。図6の(B)はこのパターンマッチングの処理を
示す図である。ここで、入力パターンAは10msec
〜30msecに区間分けされたブロックデータの特徴
ベクトルとして{a1,a2,a3,…,aI}で表さ
れ、単語登録部38の標準音声パターンBは{b1,b
2,b3,…,bJ}で表わす。これらパターンA,B
からなる平面を考えたとき、この平面上の格子点C=
(i,j)の系列は F=C1 ,C2 ,C3 ,…,Ck ,…,CK k =(ik ,jk
【0049】となる。また、aiとbjのスペクトル距
離をd(c)=d(i,j)とする。パターンマッチン
グでは、このスペクトル距離の最小のものを探索する
が、ここでは簡略化のために、パターンマッチングは動
的計画法のように考え累積距離gを求める問題に変え
る。
【0050】
【数3】 で計算が繰り返し行われる。
【0051】このように標準パターンと再生音声を1フ
レーム(10msec〜30msecのブロックデータ
単位)でシフトしながらパターンマッチングし、距離が
一定の条件を満たすとき、対応する単語が存在したこと
を判定する。
【0052】即ち、入力パターンに一致する標準パター
ンがなければ(ステップS24)、入力パターンをクリ
アした後(ステップS25)、上記ステップS23へ戻
り、また一致するパターンがあれば、図7の(A)に示
すような検索領域と傾斜制限を設け、マッチングの判定
を行う(ステップS26)。そして、この検索領域と傾
斜制限から外れていれば、上記ステップS25へ進み、
外れていなければ、そのパターンを蓄積、即ち累積距離
gを求める(ステップS27)。そして、累積距離gが
検索窓に到達していなければ(ステップS28)、上記
ステップS23に戻り、検索窓に達したと判断されたと
きには、パターンマッチング部42より主制御部22の
INT端子に検出信号が送られ、これにより主制御部2
2は再生停止を行うためPEポートとPFポートより駆
動制御部28に制御信号を送る(ステップS29)。ま
た検索中には、主制御部22のPAポートより表示部2
6に再生表示を点滅させるような表示を成させるための
制御信号が送られる。
【0053】以上のように、音声メッセージ及び音声メ
ッセージ識別信号を後から記録,追加する場合に口述者
の記録したい箇所を見つけ出すとき、希望の場所に記録
されている音声に相当する音声の登録を行って、倍速再
生または逆高速再生を行いながら希望の場所を音声認識
を行うことで、音声の記録によるテープ位置で見つけ検
索することができる。また、今までキュー信号をわざわ
ざ入れて秘書へ伝言や指示を行っていたものが、例えば
「秘書宛」と録音中にマイクロホンから音声を入力する
ことによって、その入力した音声を頼りに所望箇所の検
索することが可能になる。
【0054】なお、以上の説明では、高速再生された信
号でも検索できるように、音声登録のときと高速再生の
ときのサンプリング周波数を変える手法を用いるものと
して説明したが、例えば次のような手法を用いることも
可能である。 (1)パラメータ抽出前に単語登録音声または再生信号
の音程変換処理(周波数変換処理)を行う。 (2)パターンマッチング時の周波数軸変換演算処理を
行う。 (3)高速再生時にはゲインが上がるため利得補正を行
う。 (第2実施例)次に、本発明をデジタル録音再生装置に
適用した場合を説明する。
【0055】即ち、本第2実施例は、音声をデジタル信
号変換した後、デジタル信号処理によって音声を符号化
し音声の特徴パラメータを抽出してテープやディスクや
半導体メモリ等に記憶する。そして、音声検索は前記符
号化のときに求まるパラメータを変換し、音声のパター
ンマッチングを行い音声の検索を行う。
【0056】図8において、まずマイク80から入力さ
れた音声信号は、第1アンプ82に入力される。この第
1アンプ82の出力端子は、AD/DA変換部84の端
子ANALOGINに接続されている。また、AD/D
A変換部84の端子ANALOGOUTと第2アンプ8
6の入力端子が接続されていて、そして、この第2アン
プ86の出力端子にスピーカ88が接続されている。つ
まり、デジタル化されている音声信号は、AD/DA変
換部84にてアナログ信号に変換して第2アンプ86に
送られ、該アンプ86で増幅した後、スピーカ88に出
力される。
【0057】AD/DA変換部84とデジタル信号処理
部90間は、端子PCMINと端子DT、端子PCMO
UTと端子DR、端子CLKと端子SCLK、端子FS
Rや端子FSXと端子RFSや端子TFSとがそれぞれ
接続されていて、AD/DA変換部84でデジタル変換
された信号をデジタル信号処理部90に転送したり、デ
ジタル信号処理部90で処理された信号をAD/DA変
換部84に転送を行う。
【0058】上記デジタル信号処理部90の端子ADD
RESSは、第1バッファ92の端子ADDIと第2バ
ッファ94の端子ADDIに接続されている。また、デ
ジタル信号処理部90の端子DATAは、第1バッファ
92の端子DATAIと第2バッファ94の端子DAT
AIに接続されている。デジタル信号処理部90のそれ
ぞれ端子RD,WR,DMSは、第1バッファ92の端
子RD,WR,BMSと第2バッファ94の端子RD,
WR,BMSに接続されている。
【0059】第1バッファ92の端子ADDOと第3バ
ッファ96の端子ADDOと第1メモリ98のADDR
ESS端子とが接続され、第1バッファ92の端子DA
TAOと第3バッファ96の端子DATAOと第1メモ
リ98のDATA端子とが接続されている。同様に、第
2バッファ94の端子ADDOと第4バッファ100の
端子ADDOと第2メモリ102のADDRESS端子
とが接続され、第2バッファ94の端子DATAOと第
4バッファ100の端子DATAOと第2メモリ102
のDATA端子とが接続されている。また、上記第1バ
ッファ92と第3バッファ96の各CS端子と第1メモ
リ98のCS端子とが接続され、第2バッファ94と第
4バッファ100のCS端子と第2メモリ102のCS
端子とが接続されている。
【0060】主制御部104の端子ADRBは、第3バ
ッファ96の端子ADDIと第4バッファ100の端子
ADDIに接続されている。また、主制御部104の端
子DABは、第3バッファ96の端子DATAIと第4
バッファ100の端子DATAIに接続されている。主
制御部104のそれぞれ端子IR,IWは、第3バッフ
ァ96の端子RD,WRと第4バッファ100の端子R
D,WRに接続されている。
【0061】主制御部104の端子SB1と端子SB2
は、デコーダ106の端子Aと端子Bに接続されてい
る。このデコーダ106の端子Y0は、第1バッファ9
2の端子CEに接続されている。同様に、デコーダ10
6の端子Y1は第2バッファ94の端子CEに、端子Y
2は第3バッファ96の端子CEに、端子Y3は第4バ
ッファ100の端子CEにそれぞれ接続されている。
【0062】また、上記デジタル信号処理部90のIO
R端子は、主制御部104のINT端子に接続されてい
る。主制御部104のPAポート端子は、表示器108
に接続されていて、各動作状態を表示する。また、主制
御部104のPBポート端子は、キーボード110と接
続されている。そして、主制御部104とメモリカート
リッジ112の間は、端子IRQと端子INT、端子S
IOと端子SIO、端子SCLと端子CLKとが接続さ
れている。
【0063】また、第1バッファ92と第2バッファ9
4の端子BFは、論理回路114に接続されている。そ
して、この論理回路114出力端子と主制御部104の
端子FBが接続されている。次に、このような構成のデ
ジタル録音再生装置の動作を説明する。
【0064】初めに、録音モードでは、キーボード11
0のRECスイッチが押されると、主制御部104は、
PBポートを通じて録音開始を検知して、第3バッファ
96と第1バッファ92を通じてデジタル信号処理部9
0に圧縮処理準備をさせる命令コードを転送する。
【0065】ここで、マイク60より入力した音声信号
は、第1アンプ61で増幅された後、AD/DA変換部
84に送られ、該AD/DA変換部84でアナログ/デ
ジタル変換される。このAD/DA変換部84にてデジ
タル変換された信号は、デジタル信号処理部90に転送
される。デジタル信号処理部90では、デジタル化した
音声信号を10msec〜30msecのブロックデー
タにまとめた後、このブロックデータからCELP符号
化方式のような分析形音声符号化方式を利用して音声の
特徴パラメータを抽出し、パラメータの量子化を行う。
【0066】一方、主制御部104は、端子SB1とS
B2より制御信号をデコーダ106に送ることにより予
め第1バッファ92のCE端子に信号を送り、この第1
バッファ92がデータを受け付けられるようにする。
【0067】そして、デジタル信号処理部90は、デー
タ端子を通じて符号化したデータを第1バッファ92に
転送する。第1バッファ92は、第1メモリ98にこの
データを転送した後、端子BFよりメモリにデータを転
送したことを伝える信号を主制御部104のEB端子に
送る。
【0068】これに応じて、主制御部104は、端子S
B1,SB2の信号を送ることにより、デコーダ106
の端子Y1,Y3より第2バッファ94と第4バッファ
100のCE端子に制御信号を送り、データ入出力が可
能な状態にする。
【0069】そして、第3バッファ96を通じて第1メ
モリ98の符号化データを主制御部104が受取り、こ
れをシリアル端子IRQ,SIO,SCLを通じてメモ
リカートリッジ112に転送する。
【0070】主制御部104が上記の作業を行っている
間に、デジタル信号処理部90は、次の入力信号の音声
信号ブロックの演算を行い、符号化したデータを第2バ
ッファ94に転送する。
【0071】第2バッファ94から第2メモリ102に
符号化データが転送されると、BF端子から論理回路1
14に制御信号を出力し、該論理回路114の出力端子
から主制御部104のEB端子にデータ転送されたこと
を伝える。
【0072】主制御部104は、これに応じて、端子S
B1,SB2の信号を送ることにより、デコーダ106
の端子Y0,Y2より第1バッファ92と第3バッファ
96のCE端子に制御信号を送り、データ入出力が可能
な状態にする。
【0073】その後は、キーボード110のSTOPボ
タンが押され、主制御部104がそれを認識してバッフ
ァを通じてデジタル信号処理部90に停止信号を送るま
で、上記の操作を同様に繰り返し行う。即ち、デジタル
信号処理部90と主制御部104との間のデータ転送
は、第1バッファ92,第1メモリ98,第3バッファ
96による経路と、第2バッファ94,第2メモリ10
2,第4バッファ100による経路との2つの経路を交
互に介して行われる。
【0074】このように、符号化されたデータは、CE
LPのような分析符号化を利用したものは線形予測係数
がデータとして蓄積されているため、パターンマッチン
グのための音声の特徴パラメータに変換することが可能
で、音声検索も前述した第1実施例のテープレコーダと
比較して高速に検索できるところに特徴をもつ。
【0075】図9には、本実施例のデジタル録音再生装
置の機能ブロック図である。同図中の経路Aに示す流れ
は音声登録モードであり、経路Bは音声検索モードの流
れを示している。
【0076】音声録音モードでは、まずマイク80より
音声を入力して上記第1アンプ82に相当するマイクア
ンプで増幅された音声信号はAD/DA変換部84内に
構成されたA/D変換器84Aでデジタル信号に変換さ
れた後、デジタル信号処理部90に送られる。このデジ
タル信号処理部90は、同図に示すような構成をとり、
まず、符号化部116に信号が送られ、前記の分析符号
化される。そして、この符号化されたデータは、上記バ
ッファ及びデコーダで構成されるスイッチS1〜S3に
より上記メモリ98,102に相当する一時記憶部を介
して主制御部104に送られ、上記メモリカートリッジ
112に相当する記録媒体に記録される。そして、通
常、この記録媒体には、単語登録部122に登録される
音声情報よりもはるかに長い即ち多くの音声情報が記録
される。
【0077】音声再生モードでは、記録媒体112から
の符号化データが主制御部104、スイッチS1〜S
3、一時記憶部98,102を介して、デジタル信号処
理部90の復号化部118に送られて、復号される。そ
して、復号された音声信号AD/DA変換部84内に構
成されたD/A変換器84Bでアナログ信号に変換さ
れ、上記第2アンプ86に相当するパワーアンプで増幅
された後、スピーカ88に出力される。
【0078】音声登録モードでは、マイク80より音声
を入力して上記第1アンプ82に相当するマイクアンプ
で増幅された音声信号はAD/DA変換部84内に構成
されたA/D変換器84Aでデジタル信号に変換された
後、デジタル信号処理部90に送られる。このデジタル
信号処理部90では、まず、符号化部116に信号が送
られ、前記の分析符号化される。この符号化したデータ
を特徴パラメータ変換部120に送り、データの中に含
まれる線形予測係数を利用して特徴パラメータに変換し
て上記第1実施例と同様な逆スペクトル係数を得て、単
語登録部122に数秒間登録される。この時、上記第1
実施例と同様に音声起動によって登録が行われる。
【0079】また、音声検索モードでは、主制御部10
4より記録場所が管理された記録媒体(メモリカートリ
ッジ)112からの符号化データが、スイッチS1〜S
3と一時記憶部122A,112Bを介して、特徴パラ
メータ変換部120に転送され、前記と同様に特徴パラ
メータに変換され、パターンマッチング部124に送ら
れる。このパターンマッチングの方法は上記第1実施例
に示すような例と同様な方法を採る。パターンマッチン
グが検出されると、主制御部104のINT端子に検出
信号が送られ、記録場所を見つけたとして、所定の停止
処理を行う。
【0080】デジタル録音再生装置では、符号化された
データに線形予測のパラメータが含まれているためこれ
を利用し、線形予測係数からパターンマッチングのため
の音声の特徴パラメータに変換することが可能であり、
音声検索も上記第1実施例のテープレコーダと比較して
演算量が少ないことや、ランダムアクセスによる高速に
検索できる効果がある。
【0081】なお、本発明の考え方を推し進めれば、音
声認識された特定の言葉を消去したり、別の言葉に置換
するといった応用も可能である。例えば、消去の場合に
は、消去したい言葉を登録し、その言葉が含まれている
部分の再生中に消去釦を押すことにより、自動的に、登
録している言葉に対応する言葉の消去ができる。従っ
て、消去したい言葉が多い場合には、非常に有効であ
る。
【0082】
【発明の効果】以上詳述したように、本発明の情報再生
装置によれば、記録された音声情報の所望の箇所を見つ
け出すとき、希望の場所を音声の登録によって見つけ出
すことができるので、再生,早送り,巻戻しの操作を繰
り返すといった煩雑な操作を行わずに上記所望の箇所を
検索することができる。
【図面の簡単な説明】
【図1】第1実施例の情報再生装置のブロック構成図で
ある。
【図2】第1実施例の情報再生装置の詳細な回路構成図
の半分を示す図である。
【図3】第1実施例の情報再生装置の詳細な回路構成図
の残りの半分を示す図である。
【図4】第1実施例の情報再生装置の機能を説明するた
めのブロック構成図である。
【図5】(A)及び(B)はそれぞれ第1実施例の情報
再生装置の音声登録モード及び音声検索モードにおける
動作を示すフローチャートである。
【図6】(A)は図4中の特徴パラメータ抽出部の構成
を示す図であり、(B)はパターンマッチング処理を説
明するための図である。
【図7】(A)はパターンマッチングによる検索を説明
するための図であり、(B)は従来の音声再生装置のブ
ロック構成図である。
【図8】第2実施例の情報再生装置の詳細な回路構成図
である。
【図9】第2実施例の情報再生装置の機能を説明するた
めのブロック構成図である。
【符号の説明】 10…マイク、12…マイクアンプ、14…録音再生ア
ンプ、16…ヘッド、18…パワーアンプ、20…スピ
ーカ、22…主制御部、24…インターフェース、26
…表示部、28…駆動制御部、30…モータ、32…バ
イアス発振回路、34…キュー信号検出部、36…スイ
ッチ、38,122…単語登録部(特徴的標準パターン
登録手段)、40…特徴抽出部(特徴パターン抽出手
段)、42…比較器(判定手段)。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 検索情報として利用する所定長さの音声
    情報の特徴的標準パターンを予め登録する特徴的標準パ
    ターン登録手段と、 上記所定長さの音声情報よりも長い音声情報が記録され
    ている記録媒体より読み出された所定の音声信号を分析
    し特徴パターンを抽出する特徴パターン抽出手段と、 抽出された特徴パターンと予め登録された所定長さの音
    声情報の特徴的標準パターンとを比較しその類似度を判
    定する判定手段と、 を具備したことを特徴とする情報再生装置。
  2. 【請求項2】 デジタル化した音声信号を符号化し、こ
    の符号化されたデータを変換することで特徴パターンを
    抽出することを特徴とする請求項1に記載の情報再生装
    置。
  3. 【請求項3】 高速再生されたアナログ音声信号と所定
    長さの音声情報の特徴的標準パターンとを比較し、その
    類似度を判定できるように周波数軸を変換して高速再生
    信号を認識し検索することを特徴とする請求項1に記載
    の情報再生装置。
JP4287705A 1992-10-26 1992-10-26 情報再生装置 Pending JPH06139289A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4287705A JPH06139289A (ja) 1992-10-26 1992-10-26 情報再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4287705A JPH06139289A (ja) 1992-10-26 1992-10-26 情報再生装置

Publications (1)

Publication Number Publication Date
JPH06139289A true JPH06139289A (ja) 1994-05-20

Family

ID=17720675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4287705A Pending JPH06139289A (ja) 1992-10-26 1992-10-26 情報再生装置

Country Status (1)

Country Link
JP (1) JPH06139289A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125112A (ja) * 1997-07-04 1999-01-29 N T T Data:Kk 対話音声処理方法及び装置、記録媒体
JP2005148199A (ja) * 2003-11-12 2005-06-09 Ricoh Co Ltd 情報処理装置、画像形成装置、プログラム、及び記憶媒体
US7809241B2 (en) 2002-03-01 2010-10-05 Thomson Licensing Audio frequency scaling during video trick modes utilizing digital signal processing

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125112A (ja) * 1997-07-04 1999-01-29 N T T Data:Kk 対話音声処理方法及び装置、記録媒体
US7809241B2 (en) 2002-03-01 2010-10-05 Thomson Licensing Audio frequency scaling during video trick modes utilizing digital signal processing
JP2005148199A (ja) * 2003-11-12 2005-06-09 Ricoh Co Ltd 情報処理装置、画像形成装置、プログラム、及び記憶媒体

Similar Documents

Publication Publication Date Title
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
JP2004534326A (ja) 決済情報を提供する方法並びに口述の筆記のための方法及び装置
JPH06139289A (ja) 情報再生装置
JPS58102378A (ja) 情報検索装置
JPH0962296A (ja) 音声記録装置および音声再生装置
JPH0554960B2 (ja)
JPH10124099A (ja) 音声記録装置
JP2547611B2 (ja) 文章作成システム
JP2889573B2 (ja) 音声認識システム
JP2777366B2 (ja) 音声認識システム
JP2006323857A (ja) 音声認識処理装置および音声認識処理プログラムを記録した記録媒体
JP2547612B2 (ja) 文章作成システム
JP2609874B2 (ja) 音声認識システム
JPH01161299A (ja) 音声認識システム
JPH11212590A (ja) 音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体
JPH103300A (ja) ディジタル音声記録再生装置
JP2000148189A (ja) 音声処理装置
JP2555029B2 (ja) 音声認識装置
JPH0990994A (ja) 音声起動録音装置
JPH11184887A (ja) ディジタル情報記憶検索装置
JP3905181B2 (ja) 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体
JP2647873B2 (ja) 文章作成システム
JPH07104678B2 (ja) 音声認識システム
JPH05314740A (ja) 音声処理装置
JPH0264987A (ja) 情報検索装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021217