JPH0752357B2 - 音声データ蓄積装置 - Google Patents

音声データ蓄積装置

Info

Publication number
JPH0752357B2
JPH0752357B2 JP62227784A JP22778487A JPH0752357B2 JP H0752357 B2 JPH0752357 B2 JP H0752357B2 JP 62227784 A JP62227784 A JP 62227784A JP 22778487 A JP22778487 A JP 22778487A JP H0752357 B2 JPH0752357 B2 JP H0752357B2
Authority
JP
Japan
Prior art keywords
voice data
time
storage device
voice
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62227784A
Other languages
English (en)
Other versions
JPS6472198A (en
Inventor
林  泰仁
博哉 谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62227784A priority Critical patent/JPH0752357B2/ja
Publication of JPS6472198A publication Critical patent/JPS6472198A/ja
Publication of JPH0752357B2 publication Critical patent/JPH0752357B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は例えば音声蓄積サービスに用いられ、音声デ
ータを蓄積し、編集し、出力する音声データ蓄積装置に
関し、音声を読点と読点間毎にセグメント化する部分に
係わる。
「従来の技術」 音声データ蓄積装置として第4図に示すものが考えられ
る。すなわち音声入力装置11より入力された音声データ
を符号器12により符号化すると共に、入力された音声デ
ータを音声仮セグメント化回路13により、句点に相当す
る無音時間よりも充分短い時間(例えば400m sec)をし
きい値として仮セグメント化する。その後、タイマ14を
参照して、時刻情報付加回路15により仮セグメントごと
に時刻情報を付加し、ファイルメモリ16に蓄積する。出
力時には、ファイルメモリ16からバッファメモリ17に移
された音声データをタイマ14により時間監視し、仮セグ
メントごとに付加された時刻情報に基づいて復号器18に
より復号化し、音声出力装置19に出力する。
第5図は音声データ21〜23(それぞれ音声仮セグメント
1(AS1)〜3(AS3)に対応)が存在する時系列例を示
す。第6図は蓄積音声データの構造例を示す。同図にお
いて24〜26はタイムテーブルにかかれた仮セグメント対
応のセグメント情報を示しており、時刻情報と仮セグメ
ントデータの格納アドレスとよりなる。27〜29は符号化
された音声仮セグメントデータを示している。蓄積方式
としては、第5図中の音声データ例の場合は、第6図に
示すとおり、音声仮セグメントの時刻情報24〜26とその
音声仮セグメント27〜29の格納アドレスとをタイムテー
ブルとして、音声データ27〜29とは独立に管理する。出
力時には、タイムテーブルに従って、音声データを一仮
セグメントずつ出力する。
音声のセグメント化は、あるしきい値を設け、無音時間
がそのしきい値を超えたか否かにより判定し行うもので
あるが、従来の音声蓄積システムにおけるセグメント化
はデータの圧縮を目的とし、音声が不自然にならない程
度の長さのしきい値を設けていたため、一セグメントあ
たりの時間長が極めて短く、編集に適した単位であると
考えられる「文章を読んだ場合の、文に相当する長さ」
にセグメント化できず、そのセグメント化法を編集に用
いると編集効率の低下を招くという問題があった。また
セグメント化しきい値を固定的に定めると、個人差を吸
収できず、編集効率が低下するという欠点があった。
この発明の目的はいったん蓄積した読点と句点間または
句点と句点間に相当する単位の音声データに対し、蓄積
後の後処理として、その音声データを読点と読点間毎に
セグメント化する手段をもつ音声データ蓄積装置を提供
することにある。
「問題点を解決するための手段」 この発明の音声データ蓄積装置においては、蓄積された
音声データ間の無音時間分布が測定され、その測定した
無音時間分布にほぼ400ミリ秒〜ほぼ1秒間に極小値が
あれば、その極小値をとる時間をしきい値とし、極小値
がなければ1秒程度に予め決定した一定時間がしきい値
とされ、そのしきい値を用いて音声データのセグメント
化が行われる。
このようにすることにより一つの文章が小さくセグメン
ト化されるおそれがなく編集が容易になるようにセグメ
ント化され、しかも個人差が吸収される。
「実施例」 第1図はこの発明の実施例を示し、第4図と対応する部
分には同一番号を付けてあり、第4図に示した装置に対
し、破線で囲まれた音声データセグメント化部30が付加
されている。ファイルメモリ16に蓄積された音声データ
は第6図に示した構造をもっている。音声の本セグメン
ト化を行うにあたり、まずファイルメモリ16よりとりだ
した音声データに対して、無音時間分布測定回路31によ
り、仮セグメント間の無音時間分布が測定され、例えば
第2図に示す測定結果が得られる。その測定結果を基
に、読点に相当する無音時間の分布と句点に相当する無
音時間の分布との間に出現する極小値である時間的に小
さい方から第二の極小値をとる時間を本セグメント化し
きい値探索回路32によりさがし、その時間をもってセグ
メント化しきい値とする。音声データ編集時には、本セ
グメント化回路33によりそのしきい値以下の無音時間で
区切られる仮セグメント同士は、同一の本セグメント
に、そのしきい値を超える無音時間で区切られる仮セグ
メント同士は、別個の本セグメントに属するものと判定
し、音声を本セグメント化し、本セグメント単に編集を
行う。
第4図、第1図の装置を用いて音声のセグメント化を行
う際のセグメント化結果を比較すると、例えば「我輩は
猫である。」という文を読んだ場合、第4図の装置によ
ると、「我輩は」、「猫」、「である。」のように、本
来一つであるべきセグメントが複数に分割される可能性
が高いのに対し、第1図の装置によると、「我輩は猫で
ある。」のように、入力された音声データ対応に、編集
に適した文の単位でセグメント化される可能性が高くな
る。
セグメント化しきい値とセグメント誤認識率との関係は
第3図に示すようになる。第2図と第3図とから無音時
間分布において時間的に小さい方から第2番目に極小値
をとる時間をセグメント化のためのしきい値に用いれば
セグメント誤認識の発声もほぼ最小となることがわか
る。
なお第2図、第3図からしきい値の決定を次のようにし
てもよい。400m sec〜1secに無音時間分布において極小
値があればその極小値をとる時間をしきい値とし、極小
値がなければ1secをしきい値としてもよい。
「発明の効果」 以上述べたようにこの発明によれば無音時間分布からし
きい値を決めるため、システム利用者対応に文単位に音
声をセグメントすることができ、個人差を吸収し、編集
が容易になるように音声データをセグメント化すること
ができる。
【図面の簡単な説明】
第1図はこの発明の実施例を示す機能ブロック図、第2
図は無音時間分布図、第3図は音声セグメントの誤認識
率を示す図、第4図は提案されている音声データ蓄積装
置を示す機能ブロック図、第5図は音声データの時系列
例を示す図、第6図は蓄積音声データの構造例を示す図
である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】音声データを蓄積し、編集し、出力する音
    声データ蓄積装置において、 上記蓄積された音声データ間の無音時間分布を測定する
    手段と、 その測定した無音時間分布に、ほぼ400ミリ秒〜ほぼ1
    秒間に極小値があれば、その極小値をとる時間をしきい
    値とし、極小値がなければ1秒程度に予め決定した一定
    時間をしきい値とする手段と、 そのしきい値を用いて上記音声データを読点と読点間毎
    にセグメント化を行い、このセグメント化された音声デ
    ータを編集単位とする手段とを具備することを特徴とす
    る音声データ蓄積装置。
JP62227784A 1987-09-11 1987-09-11 音声データ蓄積装置 Expired - Lifetime JPH0752357B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62227784A JPH0752357B2 (ja) 1987-09-11 1987-09-11 音声データ蓄積装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62227784A JPH0752357B2 (ja) 1987-09-11 1987-09-11 音声データ蓄積装置

Publications (2)

Publication Number Publication Date
JPS6472198A JPS6472198A (en) 1989-03-17
JPH0752357B2 true JPH0752357B2 (ja) 1995-06-05

Family

ID=16866330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62227784A Expired - Lifetime JPH0752357B2 (ja) 1987-09-11 1987-09-11 音声データ蓄積装置

Country Status (1)

Country Link
JP (1) JPH0752357B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005148152A (ja) * 2003-11-11 2005-06-09 Mitsubishi Electric Corp メディア送信装置、メディア受信装置、メディア通信装置及びメディア再生装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5961900A (ja) * 1982-09-30 1984-04-09 シャープ株式会社 音声入力装置

Also Published As

Publication number Publication date
JPS6472198A (en) 1989-03-17

Similar Documents

Publication Publication Date Title
JPH0582599B2 (ja)
JPH0752357B2 (ja) 音声データ蓄積装置
KR0145470B1 (ko) 반도체 메모리 카드의 데이타 기록장치 및 방법
JP2860991B2 (ja) 音声蓄積再生装置
JPH0368399B2 (ja)
JP2002287800A (ja) 音声信号処理装置
JP2582762B2 (ja) 無音圧縮音声録音装置
JP2706255B2 (ja) 無音圧縮音声録音装置
JP3321578B2 (ja) 音声合成案内装置
JP2865714B2 (ja) 音声蓄積再生装置
JP2585241B2 (ja) 無音圧縮音声録音装置
JP2602641B2 (ja) 音声符号化方式
JPS60117292A (ja) 音声応答システム
JPS58158693A (ja) 音声符号化方法
KR890003194A (ko) 복합 우편장치의 안내 음성정보를 효율적으로 구현하는 방식
KR920002861B1 (ko) Lpc 음성합성장치 및 그 방법
JP2861005B2 (ja) 音声蓄積再生装置
JPS62102296A (ja) 音声編集装置
JPH0287199A (ja) 音声の有音起動方式および装置
JPH0535441A (ja) 文書自動作成装置
JPH0721720B2 (ja) 音声の無音圧縮方式および装置
JPS6382500A (ja) 規則合成音出力装置
JP2002108399A (ja) 音声編集システム
JPS62231300A (ja) 音声の処理単位への自動区分と処理の方法
JPS63115200A (ja) 音声分析方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080605

Year of fee payment: 13