JP2000305580A - 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体 - Google Patents

無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2000305580A
JP2000305580A JP11115849A JP11584999A JP2000305580A JP 2000305580 A JP2000305580 A JP 2000305580A JP 11115849 A JP11115849 A JP 11115849A JP 11584999 A JP11584999 A JP 11584999A JP 2000305580 A JP2000305580 A JP 2000305580A
Authority
JP
Japan
Prior art keywords
sound
level
determined
silence
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11115849A
Other languages
English (en)
Other versions
JP4202524B2 (ja
Inventor
Masaaki Katsumata
正昭 勝俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roland Corp
Original Assignee
Roland Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roland Corp filed Critical Roland Corp
Priority to JP11584999A priority Critical patent/JP4202524B2/ja
Publication of JP2000305580A publication Critical patent/JP2000305580A/ja
Application granted granted Critical
Publication of JP4202524B2 publication Critical patent/JP4202524B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】明瞭で滑らかな音声の再現を行うことができる
ようにし、かつ不要な部分における有音処理を排除して
データ量の圧縮率を向上させる。 【解決手段】音声データのレベルを第1のレベルとそれ
よりも大きい第2のレベルと比較し、第2のレベルより
も大きい第1種の区間に関しては有音と判断し、第1種
の区間ではない区間であって第1種の区間の始端から前
側に第1の距離内である第2種の区間に関しては、第2
種の区間のレベルが第1のレベルよりも大きいか否かに
基づいて有音であるか無音であるかを判断し、音声デー
タの第1種の区間ではない区間であって第1種の区間の
終端から後側に第2の距離内である第3種の区間に関し
ては、第3種の区間のレベルが第1のレベルよりも大き
いか否かに基づいて有音であるか無音であるかを判断
し、第1種の区間、第2種の区間および第3種の区間の
いずれにも該当しない第4種の区間に関しては無音であ
ると判断する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、無音判別方法、無
音判別装置およびコンピュータ読み取り可能な記録媒体
に関し、さらに詳細には、音声データ中の無音部分を検
出する無音判別方法、無音判別装置およびコンピュータ
読み取り可能な記録媒体に関する。
【0002】なお、本発明において「音声」とは、人間
の声の他に楽音や効果音などの可聴域の音を全て含む概
念を意味するものであって、人間の声の信号のみを指す
ものではない。
【0003】
【従来の技術】従来より、音声データを記憶媒体に記憶
したり、音声データを通信媒体を介して送受信すること
が広く行われている。
【0004】そして、こうした場合には、なるべく小さ
な記憶容量や少ない通信時間によって、なるべく長時間
の音声に相当するデータを記憶したり、送受信したりす
ることが経済的な面から望まれている。
【0005】一般に、音声には所々に無音の部分がある
が、こうした無音の部分と有音の部分とを区別すること
なしに、無音の部分と有音の部分とで同様の音声データ
を記憶したり、送受信したりする場合には、記憶媒体の
記憶容量や通信媒体における通信時間を無駄に使用する
ことになるということが指摘されていた。
【0006】このため、従来から、音声データの記憶や
送受信などを行う際において当該音声データが無音を表
している場合には、音声を表す通常の音声データに代え
て無音であることを示すより短いデータの記憶や送受信
などを行うことにより、記憶したり送受信したりするデ
ータ量の圧縮を図る技術が種々提案されている。
【0007】例えば、特開平11−52990号公報に
は、音声データの示す音声のレベル(本明細書において
は、「音声データの示す音声のレベル」を「音声データ
のレベル」あるいは単に「レベル」と適宜に称すること
とする。)が所定のスレッショルドレベルを越える場合
に有音と判断し、一方、音声データのレベルが所定のス
レッショルドレベルをよりも小さい場合に無音と判断す
ることにより、データ量の圧縮を図る技術が開示されて
いる(図1参照:なお、図1においては、理解を容易に
するために、音声データのエンベロープレベルを示して
いる。)。
【0008】しかしながら、この特開平11−5299
0号公報に開示された技術においては、音声データのレ
ベルが所定のスレッショルドレベルよりも小さいか否か
によってのみ無音であるか有音であるかを判断している
ため、所定のスレッショルドレベルが低いと無音と判断
され難くなってデータ量の圧縮率が上がらなくなり、ま
た、所定のスレッショルドレベルが高いと音声の語尾や
語頭の切れ目において実際には音声があるにも関わらず
無音と判断されてしまうようになって、音声の語尾や語
頭などにおいて音声が途切れてしまって滑らかな音声を
再現することができないという問題点があった。
【0009】即ち、所定のスレッショルドレベルが低い
場合には、無音処理すべき不必要な部分まで有音処理さ
れてデータ量の圧縮率が低下してしまい、また、所定の
スレッショルドレベルが高い場合には、アタックの長い
音の語頭やリリースの長い音の語尾が途切れて不明瞭に
なって滑らか再生を実現することができないという問題
点があった。
【0010】また、特公平3−68399号公報には、
音声データのレベルが所定のスレッショルドレベルを越
える部分を有音と判断するとともに、その前後の部分に
ついても所定の期間内にある部分を有音と判断するよう
にした技術が開示されている(図2参照:なお、図2に
おいては、理解を容易にするために、音声データのエン
ベロープレベルを示している。)。
【0011】しかしながら、この特公平3−68399
号公報に開示された技術においては、音声データのレベ
ルが所定のスレッショルドレベルを越える部分を有音と
判断するとともに、その前後の部分についても所定の期
間内にある部分は有音とみなすようにしているために、
所定の期間が短い場合には、語頭の立ち上がりや語尾の
立ち下がりの長い音声に関しては語頭や語尾が途切れて
しまって滑らかな音声を再現することができないことと
なり、所定の期間が長い場合には、語頭の立ち上がりや
語尾の立ち下がりの短い音声に関しては実際は無音の部
分まで有音として扱われてデータ量の圧縮率が上がらな
いという問題点があった。
【0012】即ち、所定の期間が短い場合には、アタッ
クの長い音の語頭やリリースの長い音の語尾が途切れて
不明瞭になって滑らか再生を実現することができず、所
定の期間が長い場合には、アタックやリリースの短い音
については無音処理すべき不必要な部分まで有音処理さ
れてデータ量の圧縮率が低下してしまうという問題点が
あった。
【0013】
【発明が解決しようとする課題】本発明は、上記したよ
うな従来の技術の有する種々の問題点に鑑みてなされた
ものであり、その目的とするところは、音声の語尾や語
頭が途切れることなく明瞭で滑らかな音声の再現を行う
ことができるようにするとともに、音声データの無音処
理することが好ましい不要な部分において有音処理を行
うことのないようにしてデータ量の圧縮率を向上させる
ようにした無音判別方法、無音判別装置およびコンピュ
ータ読み取り可能な記録媒体を提供しようとするもので
ある。
【0014】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、音声データのレベルに関する2つのスレ
ッショルドレベルと当該2つのスレッショルドレベルに
従って定義される音声データの区間とを用いて、音声デ
ータ中の無音部分の判別を行うようにしたものである。
【0015】即ち、本発明のうち請求項1に記載の発明
である無音判別方法は、音声データのレベルに基づい
て、音声データを構成する各部分を有音あるいは無音と
判断する無音判別方法であって、音声データのレベル
を、所定の第1のレベルと上記第1のレベルよりも大き
い所定の第2のレベルと比較し、音声データのレベルが
上記第2のレベルよりも大きいことにより定義される第
1種の区間に関しては有音と判断し、音声データの上記
第1種の区間ではない区間であって、音声データの上記
第1種の区間の始端から前側に第1の所定の距離内であ
ることにより定義される第2種の区間に関しては、上記
第2種の区間の音声データのレベルが上記第1のレベル
よりも大きいか否かに基づいて有音であるか無音である
かを判断し、音声データの上記第1種の区間ではない区
間であって、音声データの上記第1種の区間の終端から
後側に第2の所定の距離内であることにより定義される
第3種の区間に関しては、上記第3種の区間の音声デー
タのレベルが上記第1のレベルよりも大きいか否かに基
づいて有音であるか無音であるかを判断し、音声データ
の上記第1種の区間、上記第2種の区間および上記第3
種の区間のいずれにも該当しないことにより定義される
第4種の区間に関しては無音であると判断するようにし
たものである。
【0016】ここで、上記した「第1種の区間」、「第
2種の区間」、「第3種の区間」ならびに「第4種の区
間」におけるそれぞれの区間に関して、各区間の最小長
は音声データの処理上の最小単位であればよく、従っ
て、1サンプルでもよいし、あるいは1サンプル乃至複
数サンプルを1つのブロックとした1ブロックでもよ
い。
【0017】また、上記した「第1の所定の距離」と
「第2の所定の距離」とは同一であってもよいし、異な
っていてもよい。
【0018】なお、上記した請求項1に記載の発明にお
いて、隣り合う「第1種の区間」同士の距離が短く、
「第2種の区間」と「第3種の区間」とが隣接する場
合、あるいは、「第2種の区間」と「第3種の区間」と
の一部あるいは全てが重なる場合には、「第4種の区
間」が存在し得ない場合が有り得るが、こうした「第4
種の区間」が存在しないものも上記した請求項1に記載
の発明に含まれるものである。
【0019】さらに、上記した請求項1に記載の発明に
おいて、「音声データのレベルを、所定の第1のレベル
と上記第1のレベルよりも大きい所定の第2のレベルと
比較し」ているが、この意味するところは、全ての音声
データを「第1のレベル」および「第2のレベル」とそ
れぞれ比較することを意味するものではない。
【0020】即ち、音声データを先に「第2のレベル」
と比較して、当該音声データが「第2のレベル」よりも
大きいと判断された場合には、当該音声データは「第1
のレベル」よりも当然に大きいことになるので、その判
断の時点で当該音声データを「第1のレベル」と比較す
る必要はないものであり、こうしたものも上記した請求
項1に記載の発明に含まれるものである。これとは逆
に、音声データを先に「第1のレベル」と比較して、当
該音声データが「第1のレベル」以下であると判断され
た場合には、当該音声データは「第2のレベル」よりも
当然に小さいことになるので、その判断の時点で当該音
声データを「第2のレベル」と比較する必要はないもの
であり、こうしたものも上記した請求項1に記載の発明
に含まれるものである。
【0021】また、本発明のうち請求項2に記載の発明
である無音判別方法は、本発明のうち請求項1に記載の
発明において、音声データのレベルが上記第1のレベル
よりも大きくない状態が所定の長さよりも長く連続して
いる部分に関しては無音と判断し、音声データの上記第
2種の区間に含まれ、音声データのレベルが上記第1の
レベルよりも大きくかつ後側の最も近い上記第1種の区
間との間に無音と判断される部分がない部分に関しては
有音と判断するとともに、この条件で有音と判断された
部分の後側に有音と判断されていない部分が隣接する場
合はこれを全て有音と判断し、音声データの上記第3種
の区間に含まれ、音声データのレベルが上記第1のレベ
ルよりも大きくかつ前側の最も近い上記第1種の区間と
の間に無音と判断される部分がない部分に関しては有音
と判断するとともに、この条件で有音と判断された部分
の前側に有音と判断されていない部分が隣接する場合は
これを全て有音と判断するようにしたものである。
【0022】ここで、「第2種の区間」と「第3種の区
間」との一部あるいは全てが重なる場合には、「第2種
の区間」、「第3種の区間」のいずれかにおいて有音と
判断されるときには、その部分は有音として判断され
る。
【0023】また、上記した「所定の長さ」は、音声デ
ータの処理上の最小単位の長さ以上であれば任意の長さ
でよい。
【0024】また、本発明のうち請求項3に記載の発明
である無音判別方法は、本発明のうち請求項1に記載の
発明において、音声データの上記第2種の区間に含ま
れ、音声データのレベルが上記第1のレベルよりも大き
くない状態が上記第2種の区間の先頭から連続している
部分に関して、その部分の前側に上記第4の区間が隣接
する場合には無音と判断し、音声データの上記第3種の
区間に含まれ、音声データのレベルが上記第1のレベル
よりも大きくない状態が上記第3種の区間の末尾から連
続している部分に関して、その部分の後側に上記第4の
区間が隣接する場合には無音と判断するようにしたもの
である。
【0025】また、本発明のうち請求項4に記載の発明
である無音判別方法は、本発明のうち請求項2に記載の
発明において、上記のいずれの判断においても無音とも
有音とも判断されなかった部分に関しては無音と判断す
るようにしたものである。
【0026】また、本発明のうち請求項5に記載の発明
である無音判別装置は、本発明のうち請求項1、2、3
または4のいずれか1項に記載の無音判別方法を行う手
段を備えるようにしたものである。
【0027】即ち、本発明のうち請求項5に記載の発明
における本発明のうち請求項1に記載の無音判別方法を
行う手段を備えた無音判別装置は、音声データのレベル
に基づいて、音声データを構成する各部分を有音あるい
は無音と判断する無音判別装置であって、音声データの
レベルを、所定の第1のレベルと上記第1のレベルより
も大きい所定の第2のレベルと比較する手段と、音声デ
ータのレベルが上記第2のレベルよりも大きいことによ
り定義される第1種の区間に関しては有音と判断する手
段と、音声データの上記第1種の区間ではない区間であ
って、音声データの上記第1種の区間の始端から前側に
第1の所定の距離内であることにより定義される第2種
の区間に関しては、上記第2種の区間の音声データのレ
ベルが上記第1のレベルよりも大きいか否かに基づいて
有音であるか無音であるかを判断する手段と、音声デー
タの上記第1種の区間ではない区間であって、音声デー
タの上記第1種の区間の終端から後側に第2の所定の距
離内であることにより定義される第3種の区間に関して
は、上記第3種の区間の音声データのレベルが上記第1
のレベルよりも大きいか否かに基づいて有音であるか無
音であるかを判断する手段と、音声データの上記第1種
の区間、上記第2種の区間および上記第3種の区間のい
ずれにも該当しないことにより定義される第4種の区間
に関しては無音であると判断する手段とを有するように
したものである。
【0028】また、本発明のうち請求項5に記載の発明
における本発明のうち請求項2に記載の無音判別方法を
行う手段を備えた無音判別装置は、上記した本発明のう
ち請求項5に記載の発明における本発明のうち請求項1
に記載の無音判別方法を行う手段を備えた無音判別装置
の構成に加えて、音声データのレベルが上記第1のレベ
ルよりも大きくない状態が所定の長さよりも長く連続し
ている部分に関しては無音と判断する手段と、音声デー
タの上記第2種の区間に含まれ、音声データのレベルが
上記第1のレベルよりも大きくかつ後側の最も近い上記
第1種の区間との間に無音と判断される部分がない部分
に関しては有音と判断するとともに、この条件で有音と
判断された部分の後側に有音と判断されていない部分が
隣接する場合はこれを全て有音と判断する手段と、音声
データの上記第3種の区間に含まれ、音声データのレベ
ルが上記第1のレベルよりも大きくかつ前側の最も近い
上記第1種の区間との間に無音と判断される部分がない
部分に関しては有音と判断するとともに、この条件で有
音と判断された部分の前側に有音と判断されていない部
分が隣接する場合はこれを全て有音と判断する手段とを
有するようにしたものである。
【0029】また、本発明のうち請求項5に記載の発明
における本発明のうち請求項3に記載の無音判別方法を
行う手段を備えた無音判別装置は、上記した本発明のう
ち請求項5に記載の発明における本発明のうち請求項1
に記載の無音判別方法を行う手段を備えた無音判別装置
の構成に加えて、音声データの上記第2種の区間に含ま
れ、音声データのレベルが上記第1のレベルよりも大き
くない状態が上記第2種の区間の先頭から連続している
部分に関して、その部分の前側に上記第4の区間が隣接
する場合には無音と判断する手段と、音声データの上記
第3種の区間に含まれ、音声データのレベルが上記第1
のレベルよりも大きくない状態が上記第3種の区間の末
尾から連続している部分に関して、その部分の後側に上
記第4の区間が隣接する場合には無音と判断する手段と
を有するようにしたものである。
【0030】また、本発明のうち請求項5に記載の発明
における本発明のうち請求項4に記載の無音判別方法を
行う手段を備えた無音判別装置は、上記した本発明のう
ち請求項5に記載の発明における本発明のうち請求項2
に記載の無音判別方法を行う手段を備えた無音判別装置
の構成に加えて、上記のいずれの判断においても無音と
も有音とも判断されなかった部分に関しては無音と判断
する手段とを有するようにしたものである。
【0031】また、本発明のうち請求項6に記載の発明
であるコンピュータ読み取り可能な記録媒体は、本発明
のうち請求項1、2、3または4のいずれか1項に記載
の無音判別方法をコンピュータに実行させるためのプロ
グラムを記録するようにしたものである。
【0032】
【発明の実施の形態】以下、添付の図面を参照しなが
ら、本発明による無音判別方法、無音判別装置およびコ
ンピュータ読み取り可能な記録媒体の実施の形態の一例
を詳細に説明する。
【0033】図3には、本発明による無音判別方法を行
う手段を有する無音判別装置を備えた音声圧縮装置のブ
ロック構成図が示されている。
【0034】この音声圧縮装置10は、入力手段12
と、ブロック化手段14と、比較手段16と、圧縮・無
音処理手段18と、出力手段20とを有して構成されて
おり、全体の動作を図示しないマイクロ・コンピュータ
によって制御されているものである。
【0035】ここで、音声圧縮装置10においては、デ
ジタル化された音声データが入力手段12からブロック
化手段14へ供給されることになる。具体的には、入力
手段12によって、ハードディスクなどの図示されてい
ない外部の記憶媒体から本発明でいうところの音声デー
タの一例である、16ビットのビット長を有する2の補
数形式のPCMデータが連続して読み出されてブロック
化手段14に供給されるものである。
【0036】なお、この実施の形態においては、音声デ
ータとして16ビットのビット長を有する2の補数形式
のPCMデータが用いられる場合について説明したが、
音声データが16ビット長や2の補数形式のPCMデー
タに限定されるものではないことは勿論である。
【0037】また、入力手段12は、上記した実施の形
態に限定されるものではなく、音声データを記憶するメ
モリを備えていて当該メモリを読み出すことにより音声
データをブロック化手段14へ供給するものであっても
よいし、音声データをデジタル化するアナログ/デジタ
ル(A/D)コンバータであってもよいし、通信回線か
ら音声データを受け取るものであってもよい。
【0038】次に、ブロック化手段14は、図示されて
いない指令手段を介してユーザーから与えられた指令に
よって、供給された音声データを1個を含む所定個のサ
ンプル毎のブロックに分割し、音声データのブロック化
を行うものである。
【0039】そして、比較手段16は、後述する方法に
従って、ブロック化手段14によってブロック化された
音声データの各ブロック毎に、音声データのレベルと所
定のスレッショルドレベルとの比較判断を行うものであ
る。
【0040】また、圧縮・無音処理手段18は、ブロッ
ク化された音声データを圧縮するとともに、後述する方
法に従って、比較手段16の判断結果に基づいて音声デ
ータが有音であるか無音であるかを判断し、無音の部分
については所定のフォーマットにより圧縮処理を行うも
のである。
【0041】なお、本発明は、上記した比較手段16な
らびに圧縮・無音処理手段18における有音であるか無
音であるかの判断の処理に関するものである。
【0042】そして、圧縮・無音処理手段18において
処理された音声データは出力手段20へ送られて図示し
ないメモリに記憶され、それから適宜に出力されること
になる。
【0043】なお、出力手段20は、上記した実施の形
態に限定されるものではなく、圧縮・無音処理手段18
において処理された音声データをハードディスクなどの
外部の記憶媒体に書き込むものであってよいし、通信回
線へ送り出すものであってもよい。
【0044】ここで、上記した入力手段12、ブロック
化手段14ならびに出力手段20に関しては、特開平1
1−52990号公報に開示された技術を用いることが
できるので、ここに特開平11−52990号公報を引
用することによりその詳細な説明は省略する。
【0045】また、圧縮・無音処理手段18における音
声データを圧縮する際のフォーマットならびに無音部分
のデータのフォーマットに関しても、特開平11−52
990号公報に開示された技術を用いることができるの
で、ここに特開平11−52990号公報を引用するこ
とによりその詳細な説明は省略する。
【0046】なお、この実施の形態においては、特開平
11−52990号公報に開示された音声圧縮装置と同
様に、音声データが無音と判断された場合には、無音の
音声データであることを示すデータと無音部分の連続す
るブロック数を示すデータとにより音声データが構成さ
れることになり、こうした音声データが出力手段20か
ら出力されるものである。
【0047】そして、出力手段20から出力された音声
データは、例えば、特開平11−52990号公報に開
示された技術を用いた音声伸長装置により元の音声デー
タに復元されるものである。
【0048】以下、本発明に関する比較手段16ならび
に圧縮・無音処理手段18における処理の詳細について
説明する。
【0049】まず、比較手段16においては、音声デー
タの各ブロックに含まれるサンプルの絶対値をとり、そ
のなかの最も大きいものをそれぞれレベルの異なる所定
の2つのスレッショルドレベルと比較することになり、
その比較結果を処理変数lvlとして圧縮・無音処理手
段18へ送出する。
【0050】ここで、比較手段16は、比較対象となる
絶対値がレベルの大きい方のスレッショルドレベル(図
4におけるスレッショルドレベル2に対応する。)より
大きい場合には処理変数lvlとして「2」(lvl=
2)を圧縮・無音処理手段18へ送出し、比較対象とな
る絶対値がレベルの小さい方のスレッショルドレベル
(図4におけるスレッショルドレベル1に対応する。)
より小さい場合には処理変数lvlとして「0」(lv
l=0)を圧縮・無音処理手段18へ送出し、比較対象
となる絶対値がレベルの大きい方のスレッショルドレベ
ルより大きくもないしレベルの小さい方のスレッショル
ドレベルより小さくもない場合には処理変数lvlとし
て「1」(lvl=1)を圧縮・無音処理手段18へ送
出する。
【0051】ところで、大振幅の信号でもゼロクロス付
近だけに注目するとレベルが低くなっており、こうした
ゼロクロス付近の部分を無音処理すると音が途切れて汚
くなってしまうので、このような部分が無音処理される
ことを防止するために、圧縮・無音処理手段18におい
ては、後述するように、処理変数lvlが「0」である
ブロックが定数CNT(後述するように、定数CNT
は、無音とみなすために必要な連続している「lvl=
0」のブロック数を示している。)個以上連続する部分
を無音部分と判断するようになされている。なお、定数
CNTは、予め適当な値が設定されているものである。
【0052】即ち、圧縮・無音処理手段18において
は、まず、以下の(1)〜(3)に示すような判断の処
理が行われることになる。
【0053】(1)音声データのなかで「lvl=2」
であるブロックの区間は、有音部分として確定であると
判断する。なお、有音部分として確定する「lvl=
2」であるブロックの区間は、1個のブロックの区間で
もよいし、複数のブロックが連続する区間でもよい。
【0054】(2)音声データのなかで「lvl=0」
であるブロックが定数CNT個以上連続する区間は、無
音部分として確定であると判断する。
【0055】(3)上記した(1)ならびに(2)のど
ちらでもない区間(この区間は、「lvl=1」または
「lvl=0」の区間である。)は、有音であるか無音
であるか未定(以下、「有音であるか無音であるか未
定」を「有無未定」と称する。)であると判断する。
【0056】図4(b)には、比較手段16による比較
結果として圧縮・無音処理手段18へ送られた、音声デ
ータを構成する各ブロックの処理変数lvlが図4
(a)に示すような状態である場合において(図4
(a)においては、「○」が1つのブロックを示してい
る。)、定数CNTを「CNT=4」に設定した場合に
おける圧縮・無音処理手段18の有音確定、無音確定あ
るいは有無未定の判断結果が示されている。
【0057】なお、「カウントCNT=4」という値
は、説明のために便宜上設定した値であり、定数CNT
の値は、1ブロックに含まれるサンプル数、サンプリン
グ周波数などに応じて適宜決定するものである。
【0058】さらに、上記のようにして判断された有無
未定の区間については、さらに圧縮・無音処理手段18
において、以下の(4)〜(6)に示す条件で有音であ
るか無音であるかの判断を行うものである。
【0059】(4)有音確定区間の後に有無未定区間が
連接する場合には、当該有無未定区間内で前から順番に
最大で定数EXT(後述するように、定数EXTは、語
尾で有音処理する最大のブロック数を示している。)個
のブロックに関して、「lvl=1」であるブロックを
有音と判断するとともに、その「lvl=1」であるブ
ロックの前側に有音と判断されていない区間が連接する
場合はこの区間に含まれるブロックを全て有音と判断す
る。なお、定数EXTは、予め適当な値が設定されてい
るものとする。
【0060】(5)有音確定区間の前に有無未定区間が
連接する場合には、当該有無未定区間内で後ろから順番
に最大で定数SUS(後述するように、定数SUSは、
語頭で有音処理する最大のブロック数を示している。)
個のブロックに関して、「lvl=1」であるブロック
を有音と判断するとともに、その「lvl=1」である
ブロックの後側に有音と判断されていない区間が連接す
る場合はこの区間に含まれるブロックを全て有音と判断
する。なお、定数SUSは、予め適当な値が設定されて
いるものとする。
【0061】なお、上記した(4)の最大EXT個のブ
ロックの一部あるいは全てが上記した(5)の最大SU
S個のブロックでもある場合には、そのブロックは上記
した(4)あるいは(5)のいずれかの条件により有音
と判断される。
【0062】(6)上記した(4)ならびに(5)のい
ずれにも該当しない区間は無音と判断する。
【0063】従って、例えば、有無未定区間のうち、有
音確定区間の直後の定数EXT個のブロックおよび有音
確定区間の直前の定数SUS個のブロックのいずれにも
該当しないブロックは無音と判断されることになる。
【0064】また、例えば、有音確定区間の直後のEX
T個のブロックのなかに「lvl=1」であるブロック
があり、かつ、このEXT個のブロックのなかのこの
「lvl=1」であるブロックよりも前に上記した
(2)の条件により無音部分と判断される部分がない場
合には、この「lvl=1」であるブロックは有音と判
断されるとともに、この「lvl=1」であるブロック
と有音確定区間との間にある「lvl=0」であるブロ
ックも有音と判断されることになる。
【0065】同様に、有音確定区間の直前のSUS個の
ブロックのなかに「lvl=1」であるブロックがあ
り、かつ、このSUS個のブロックのなかのこの「lv
l=1」であるブロックよりも後に上記した(2)の条
件により無音部分と判断される部分がない場合には、こ
の「lvl=1」であるブロックは有音と判断されると
ともに、この「lvl=1」であるブロックと有音確定
区間との間にある「lvl=0」であるブロックも有音
と判断されることになる。
【0066】また、例えば、有音確定区間の直後のEX
T個のブロックのなかに上記した(2)の条件により無
音部分と判断される部分がある場合には、このEXT個
のブロックのうち(2)の条件により無音部分と判断さ
れる部分よりも後のブロックは有音確定区間と連接しな
いため、(4)の条件では有音と判断されない。そのブ
ロックが(5)の条件に該当する場合には有音と判断さ
れるが、そのブロックが(5)の条件にも該当しない場
合には無音と判断される。
【0067】同様に、有音確定区間の直前のSUS個の
ブロックのなかに上記した(2)の条件により無音部分
と判断される部分がある場合には、このSUS個のブロ
ックのうち(2)の条件により無音部分と判断される部
分よりも前のブロックは有音確定区間と連接しないた
め、(5)の条件では有音と判断されない。そのブロッ
クが(4)の条件に該当する場合には有音と判断される
が、そのブロックが(4)の条件にも該当しない場合に
は無音と判断される。
【0068】また、例えば、有音確定区間の直後のEX
T個のブロックに関して、それらのブロックの末尾のブ
ロックが「lvl=0」である場合には、その末尾のブ
ロックおよびその末尾のブロックから前側に連続する
「lvl=0」であるブロックは上記した(4)の条件
に該当しないため、(4)の条件では有音とは判断され
ない。それらのブロックが(5)の条件に該当する場合
には有音と判断されるが、それらのブロックが(5)の
条件にも該当しない場合には無音と判断される。
【0069】同様に、有音確定区間の直前のSUS個の
ブロックに関して、それらのブロックの先頭のブロック
が「lvl=0」である場合には、その先頭のブロック
およびその先頭のブロックから後側に連続する「lvl
=0」であるブロックは上記した(5)の条件に該当し
ないため、(5)の条件では有音とは判断されない。そ
れらのブロックが(4)の条件に該当する場合には有音
と判断されるが、それらのブロックが(4)の条件にも
該当しない場合には無音と判断される。
【0070】このため、例えば、上記した有音確定区間
の直後のEXT個のブロックの区間とその後の有音確定
区間の直前のSUS個のブロックの区間とが重複あるい
は連接しない場合、即ち、EXT個のブロックの区間と
SUS個のブロックの区間との間にEXT個のブロック
にもSUS個のブロックにも該当しないブロックが存在
する場合には、EXT個のブロックの末尾から連続する
「lvl=0」であるブロックおよびSUS個のブロッ
クの先頭から連続する「lvl=0」であるブロック
は、上記した(4)ならびに(5)のいずれの条件にも
該当しないため無音と判断される。
【0071】このように、有音確定区間の直後のEXT
個のブロックおよび有音確定区間の直前のSUS個のブ
ロックであっても、不要なブロックは無音とみなすよう
にしてデータ量の圧縮率を向上させている。
【0072】図4(c)には、比較手段16による比較
結果として圧縮・無音処理手段18へ送られた、音声デ
ータを構成する各ブロックの処理変数lvlが図4
(a)に示すような状態である場合において(図4
(a)においては、「○」が1つのブロックを示してい
る。)、定数CNTを「CNT=4」に設定し、定数E
XTを「EXT=8」に設定し、定数SUSを「SUS
=8」に設定した場合における圧縮・無音処理手段18
の有音または無音の判断結果が示されている。
【0073】なお、「EXT=8」および「SUS=
8」という値は、説明のために便宜上設定した値であ
り、定数EXTおよび定数SUSの値は、1ブロックに
含まれるサンプル数、サンプリング周波数などに応じて
適宜に決定するものである。
【0074】即ち、圧縮・無音処理手段18によって、
図4(c)に示されているように、音声データの示す音
声の語尾部分においては、有無未定区間の定数EXT個
(この実施の形態においては8個である。)のブロック
のうち末尾の「lvl=0」のブロックを除く7個のブ
ロックが有音と判断され、音声データの示す音声の語頭
部分において、有音確定区間の前の定数SUS個(この
実施の形態においては8個である。)のブロックのう
ち、有音確定区間に連接する有無未定区間に含まれる3
個のブロックのみが有音と判断されることになる。
【0075】次に、圧縮・無音処理手段18の構成の詳
細について説明すると、この圧縮・無音処理手段18
は、ブロック化手段14によってブロック化された音声
データを圧縮し、当該圧縮した各ブロックの音声データ
たる圧縮データを格納するためのバッファを備えてお
り、このバッファの空き領域の先頭アドレスを保持する
ポインタによって、バッファに保留されている各ブロッ
クの圧縮データを管理するようになされている。
【0076】なお、以下においては、「バッファに保留
されているブロック」を「保留ブロック」と称すること
とする。
【0077】ここで、上記した圧縮・無音処理手段18
のバッファは、最大で「SUS+1」個のブロック数の
圧縮データを格納できる容量が必要である。
【0078】そして、圧縮・無音処理手段18における
バッファならびにポインタに関する処理としては、次に
示す(1)〜(5)に示す処理が行われる。
【0079】なお、以下の(1)〜(5)に示す処理の
説明においては、各ブロックの圧縮データとともに処理
変数lvlの値を記憶しておき、出力手段20に渡すの
は純粋な圧縮データのみとする。
【0080】(1)ポインタの初期化処理 この処理においては、ポインタにバッファの先頭アドレ
スをセットする。
【0081】(2)処理対象のブロック(以下、「処理
対象のブロック」を「本ブロック」と称する。)の圧縮
データを保留する処理 この処理においては、ポインタの示すアドレス以降のバ
ッファの空き領域に本ブロックの圧縮データを追加し、
追加されたデータのサイズに従ってポインタを進める
(図5(a)参照)。
【0082】(3)保留中の全圧縮データを出力する バッファの先頭からポインタの示すアドレスの前までの
圧縮データを出力手段20に渡し、ポインタにバッファ
の先頭アドレスをセットする。
【0083】(4)保留中の先頭ブロックの圧縮データ
を廃棄する 後続ブロックの圧縮データの先頭からポインタの前まで
のデータをバッファの先頭以降にコピーし、廃棄された
データのサイズに従ってポインタを戻す(図5(b)参
照)。
【0084】(5)保留中の全圧縮データを廃棄する ポインタにバッファの先頭アドレスをセットする。
【0085】なお、圧縮・無音処理手段18は、上記し
たバッファならびにポインタに加えて、上記した定数E
XTならびに定数SUSを含む以下に示す内部変数およ
び定数を備えており、圧縮開始の処理に先立って上記し
たポインタの初期化とともに以下に示す内部変数の初期
化を行う。
【0086】(1)内部変数 flg:「0」で語頭を表し、「1」で語尾を表すフラ
グである。
【0087】blk:連続している無音のブロック数 sus:語頭で保留中のブロック数、即ち、語頭におけ
る保留ブロック数 ext:語尾で有音処理しているブロック数 cnt:連続している「lvl=0」のブロック数 (2)定数 BLK:一個の圧縮データで表せる最大の無音ブロック
数 SUS:語頭で有音処理する最大のブロック数 EXT:語尾で有音処理する最大のブロック数 CNT:無音とみなすために必要な連続している「lv
l=0」のブロック数 ここで、内部変数は、 flg=blk=sus=ext=0」 cnt=CNT に初期化される。
【0088】以下、添付のフローチャートを参照しなが
ら、圧縮・無音処理手段18における音声データの圧縮
処理ならびに有音部分と無音部分との判別処理の動作の
詳細を説明する。
【0089】なお、添付のフローチャートは、この音声
圧縮装置10の全体の動作を制御するマイクロコンピュ
ータの処理内容を示すものであり、音声圧縮装置10に
は、添付のフローチャートに示される処理を行うための
プログラムを記憶した記憶媒体およびこの記憶媒体に記
憶されたプログラムをマイクロコンピュータの制御に基
づいて読み出す図示しない再生装置が備えられており、
マイクロコンピュータによってこの記憶媒体に記憶され
たプログラムが読み取られるとともに読み取られたプロ
グラムに従って処理が実行される。
【0090】また、圧縮・無音処理手段18は、動作開
始後においては、以下において添付のフローチャートを
参照しながら説明する動作を、ブロック化手段16によ
ってブロック化された音声データのブロック毎に繰り返
し実行するものである。
【0091】図6には、圧縮・無音処理手段18により
実行されるメインルーチンのフローチャートが示されて
おり、圧縮・無音処理手段18の動作が開始されると、
まず、このメインルーチンのサブルーチンたる共通処理
ルーチン(図7参照)を実行することになる(ステップ
S602)。この共通処理ルーチンの詳細については、
図7を参照しながら後述する。
【0092】そして、ステップS602の処理を終了す
ると、ステップS604の処理へ進み、処理変数lvl
が「2」であるか否かについて判断する。
【0093】このステップS604の処理において、処
理変数lvlが「2」であると判断された場合には、こ
のメインルーチンのサブルーチンたる有音処理ルーチン
(図8参照)を実行することになる(ステップS60
6)。この有音処理ルーチンの詳細については、図8を
参照しながら後述する。
【0094】そして、ステップS606の処理を終了す
ると、このメインルーチンを終了する。
【0095】一方、ステップS604の処理において、
処理変数lvlが「2」ではないと判断された場合に
は、ステップS608の処理へ進み、内部変数cntの
値と定数CNTの値とが一致するか否かについて判断す
る。
【0096】このステップS608の処理において、内
部変数cntの値と定数CNTの値とが一致すると判断
された場合には、このメインルーチンのサブルーチンた
る無音処理ルーチン(図9参照)を実行することになる
(ステップS610)。この無音処理ルーチンの詳細に
ついては、図9を参照しながら後述する。
【0097】そして、ステップS610の処理を終了す
ると、このメインルーチンを終了する。
【0098】一方、ステップS608の処理において、
内部変数cntの値と定数CNTの値とが一致しないと
判断された場合には、ステップS612の処理へ進み、
内部変数flgが「0」であるか否かについて判断す
る。
【0099】このステップS612の処理において、内
部変数flgが「0」であると判断された場合には、こ
のメインルーチンのサブルーチンたる語頭処理ルーチン
(図10参照)を実行することになる(ステップS61
4)。この語頭処理ルーチンの詳細については、図10
を参照しながら後述する。
【0100】そして、ステップS614の処理を終了す
ると、このメインルーチンを終了する。
【0101】一方、ステップS612の処理において、
内部変数flgが「0」ではないと判断された場合に
は、このメインルーチンのサブルーチンたる語尾処理ル
ーチン(図11参照)を実行することになる(ステップ
S616)。この語尾処理ルーチンの詳細については、
図11を参照しながら後述する。
【0102】そして、ステップS616の処理を終了す
ると、このメインルーチンを終了する。
【0103】次に、図7に示す共通処理ルーチンのフロ
ーチャートを参照しながら、共通処理について説明する
と、まず、本ブロックの音声データたるPCMデータを
圧縮して圧縮データを得る処理を行う(ステップS70
2)。なお、PCMデータを圧縮する際のフォーマット
に関しては、上記したように特開平11−52990号
公報に開示されているので、その詳細な説明は省略す
る。
【0104】それから、ステップS702で得た本ブロ
ックの圧縮データを保留するとともに、内部変数sus
の値を「1」だけ増加する(ステップS704)。
【0105】上記したステップS704の処理を終了す
ると、処理変数lvlが「0」であるか否かについて判
断する(ステップS706)。
【0106】このステップS706の処理において、処
理変数lvlが「0」でないと判断された場合には、内
部変数cntの値を「0」にクリアし(ステップS70
8)、この共通処理ルーチンを終了する。
【0107】一方、ステップS706の処理において、
処理変数lvlが「0」であると判断された場合には、
ステップS710の処理へ進み、内部変数cntの値が
定数CNTの値より小さいか否かについて判断する。
【0108】このステップS710の処理において、内
部変数cntの値が定数CNTの値より小さくないと判
断された場合には、そのままこの共通処理ルーチンを終
了する。
【0109】一方、ステップS710の処理において、
内部変数cntの値が定数CNTの値より小さいと判断
された場合には、内部変数cntの値を「1」だけ増加
し(ステップS712)、その後にこの共通処理ルーチ
ンを終了する。
【0110】次に、図8に示す有音処理ルーチンのフロ
ーチャートを参照しながら、有音処理について説明する
と、まず、内部変数blkの値が「0」より大きいか否
かについて判断する(ステップS802)。
【0111】このステップS802の処理において、内
部変数blkの値が「0」より大きいと判断された場合
には、ブロック数が内部変数blkの値である区間の無
音部分のデータ(以下、無音部分のデータを「無音デー
タ」と称する。)を出力手段20へ出力するとともに、
内部変数blkの値を「0」にクリアし(ステップS8
04)、それからステップS806の処理へ進む。な
お、無音データのフォーマットに関しては、上記したよ
うに特開平11−52990号公報に開示されているの
で、その詳細な説明は省略する。
【0112】一方、ステップS802の処理において、
内部変数blkの値が「0」より大きくないと判断され
た場合には、そのままステップS806の処理へ進む。
【0113】そして、ステップS806の処理において
は、保留中の全圧縮データを出力手段20へ出力すると
ともに、内部変数flgに「1」を設定し、さらに内部
変数susおよび内分変数extをそれぞれ「0」にク
リアし、その後にこの有音処理ルーチンを終了する。
【0114】即ち、ステップS806の処理において
は、保留中の全ての圧縮データを出力している。
【0115】以上に示したように、処理変数lvlが
「2」であるブロックは、無条件に有音と判断され出力
される。
【0116】次に、図9に示す無音処理ルーチンのフロ
ーチャートを参照しながら、無音処理について説明する
と、まず、保留中の全圧縮データを廃棄するとともに、
内部変数blkの値に内部変数susの値を加算して内
部変数blkの値を更新し、さらに内部変数susと内
部変数flgとを「0」にクリアする(ステップS90
2)。
【0117】上記したステップS902の処理を終了す
ると、ステップS904の処理へ進み、内部変数blk
の値が定数BLKの値以上であるか否かを判断する。
【0118】このステップS904の処理において、内
部変数blkの値が定数BLKの値以上であると判断さ
れた場合には、ブロック数が定数BLKの値である無音
データを出力手段20へ出力するとともに、変数blk
の値から定数BLKの値を減算して変数blkの値を更
新し(ステップS906)、その後にステップS904
へ戻って処理を繰り返す。
【0119】なお、この無音処理ルーチンによって破棄
されたがまだ無音データとして出力されていないブロッ
クに関しては、後続するブロックにおいて実行される処
理ルーチンによって無音データとして出力されることに
なる。
【0120】以上に示したように、処理変数lvlが
「0」であるブロックが定数CNT個以上連続する場合
には、それらのブロックは無音と判断され無音データが
出力される。
【0121】一方、ステップS904の処理において、
内部変数blkの値が定数BLKの値以上ではないと判
断された場合には、そのまま無音処理ルーチンを終了す
る。
【0122】次に、図10に示す語頭処理ルーチンのフ
ローチャートを参照しながら、語頭処理について説明す
ると、まず、内部変数susの値と定数SUSの値とを
比較する(ステップS1002)。
【0123】このステップS1002の処理において、
内部変数susの値が定数SUSの値より小さいと判断
された場合には、そのままこの語頭処理ルーチンを終了
する。
【0124】また、ステップS1002の処理におい
て、内部変数susの値が定数SUSの値より大きいと
判断された場合には、保留中の先頭ブロックの圧縮デー
タを廃棄するとともに、内部変数susの値を「1」だ
け減算し、さらに内部変数blkの値を「1」だけ加算
し(ステップS1004)、その後にステップS100
6の処理へ進む。
【0125】また、ステップS1002の処理におい
て、内部変数susの値と定数SUSの値とが等しいと
判断された場合には、ステップS1006へジャンプし
て進む。
【0126】そして、ステップS1006の処理におい
ては、内部変数susが「0」であるか否かを判断する
とともに、内部変数susが「0」でないと判断された
場合、即ち、保留中のブロックが存在すると判断された
場合には、保留中の先頭ブロックの処理変数lvlが
「1」であるか否かを判断する。
【0127】このステップS1006の処理において、
内部変数susが「0」ではないと判断され、かつ、保
留中の先頭ブロックの処理変数lvlが「1」ではない
と判断された場合には、ステップS1004へ戻って処
理を繰り返す。
【0128】即ち、保留中のブロック数がいったんSU
S個と等しくあるいはSUS個より大きくなった後は、
保留する圧縮データの先頭のブロックは、必ず処理変数
lvlが「1」のものとなるように処理を行っている。
【0129】一方、ステップS1006の処理におい
て、内部変数susが「0」であると判断された場合、
または、保留中の先頭ブロックの処理変数lvlが
「1」であると判断された場合には、ステップS100
8の処理へ進み、内部変数blkの値が定数BLKの値
以上であるか否かを判断する。
【0130】このステップS1008の処理において、
内部変数blkの値が定数BLKの値以上ではないと判
断された場合には、そのままこの語頭処理ルーチンを終
了する。
【0131】一方、ステップS1008の処理におい
て、内部変数blkの値が定数BLKの値以上であると
判断された場合には、定数BLKの値のブロック数分の
無音データを出力手段20へ出力するとともに、内部変
数blkの値から定数BLKの値を減算して内部変数b
lkの値を更新し(ステップS1010)、その後にス
テップS1008へ戻って処理を繰り返す。
【0132】なお、この語頭処理ルーチンによって保留
されたブロックの有音であるか無音であるかの判断は、
後続のブロックの状態によって決定されることになる。
後続のブロックにおいて有音処理ルーチンが実行される
場合には保留されたブロックが有音と判断されて出力さ
れ、後続のブロックにおいて無音処理ルーチンが実行さ
れる場合には保留されたブロックが無音と判断され無音
データが出力される。
【0133】なお、ステップS1006における判断の
処理を省略して、ステップS1004の処理から無条件
にステップS1008の処理へ進むとともに、ステップ
S1002において処理変数susの値が定数SUSの
値と等しいと判断した場合にそのままこの語頭処理ルー
チンを終了するようにしても、この実施の形態は動作可
能であるが、図12に示すような場合において、「●」
で示す処理変数lvlが「0」である不要なブロックを
廃棄して圧縮率を向上させるために設けているものであ
る。
【0134】即ち、本実施の形態においては、保留して
いるブロックの数がSUS個に達した時点で、保留して
いるブロックのうち先頭部分の処理変数lvlが「0」
であるブロックが無音とみなされるようになっているた
め、処理変数lvlが「2」である区間の前に存在する
SUS個のブロックのうち先頭部分の処理変数lvlが
「0」である一連のブロックが無音とみなされて破棄さ
れる。
【0135】ここで、語頭処理ルーチンにおいては、い
ったん内部変数susが定数SUSに等しいかより大き
くなったときのみ、バッファの先頭の処理変数lvlが
「0」のブロックを廃棄しているので、図13に示すよ
うな場合において、「◎」で示す残すべき処理変数lv
lが「0」である必要なブロックは廃棄されないことに
なる(先に定数EXT個の個数のブロックが有音処理さ
れるので、「◎」が保留ブロックの先頭になる。)。
【0136】以上に示したように、語頭処理ルーチンに
おいては、最大SUS個のブロックを保留する処理を行
っている。保留したブロックが有音であるか無音である
かの判断は、後続のブロックの状態によって決定され
る。後続のブロックにおいて有音処理ルーチンが実行さ
れる場合には保留されたブロックが有音と判断されて出
力され、後続のブロックにおいて無音処理ルーチンが実
行される場合には保留されたブロックが無音と判断され
て無音データが出力される。
【0137】なお、処理変数lvlが「2」であるブロ
ックの前に存在するSUS個のブロックのうちに処理変
数lvlが「0」であるブロックが連続してCNT個以
上ある場合には、SUS個のブロックのうちそのCNT
個以上のブロックよりも前の保留されているブロックは
そのCNT個以上のブロックが無音処理ルーチンにおい
て無音とみなされて破棄される際に無音とみなされて破
棄され、SUS個のブロックのうちそのCNT個以上の
ブロックよりも後のブロックは処理変数lvlが「2」
であるブロックが有音処理ルーチンにおいて処理される
際に有音とみなされて処理される。
【0138】次に、図11に示す語尾処理ルーチンのフ
ローチャートを参照しながら、語尾処理について説明す
ると、まず、処理変数lvlが「1」であるか否かを判
断する(ステップS1102)。
【0139】このステップS1102の処理において、
処理変数lvlが「1」であると判断された場合には、
保留中の全圧縮データを出力手段20へ出力するととも
に、内部変数susを「0」にクリアし(ステップS1
104)、それからステップS1106へ進む。
【0140】一方、ステップS1102の処理におい
て、処理変数lvlが「1」ではないと判断された場合
には、そのままステップS1106の処理へ進む。
【0141】そして、ステップS1106の処理におい
ては、内部変数extの値を「1」だけ増加する。
【0142】上記したステップS1106の処理を終了
すると、ステップS1108の処理へ進み、内部変数e
xtの値が定数EXTの値と一致するか否かについて判
断する。
【0143】このステップS1108の処理において、
内部変数extの値が定数EXTの値と一致しないと判
断された場合には、そのままこの語尾処理ルーチンを終
了する。
【0144】一方、ステップS1108の処理におい
て、内部変数extの値が定数EXTの値と一致すると
判断された場合には、内部変数flgを「0」にクリア
し(ステップS1110)、それからこの語尾処理ルー
チンを終了する。
【0145】なお、ステップS1102における判断の
処理を省略して、無条件でステップS1104の処理に
おいて保留中の全圧縮データを出力手段20へ出力する
ようにした場合には、処理変数lvlが「0」のブロッ
クが連続する場合に、最初の「CNT−1」個のブロッ
クを有音処理してしまうことになる。このため、ステッ
プS1102における判断の処理を行うことが望ましい
ものである。
【0146】また、このステップS1102における判
断処理を行うことにより、図14に示すような場合に、
「●」で示す末尾の処理変数lvlが「0」のブロック
を保留状態に留めて圧縮率を向上させることができる。
【0147】なお、保留状態のブロックが有音であるか
無音であるかの判断は、後続のブロックの状態によって
決定されることになる。
【0148】後続のブロックにおいて有音処理ルーチン
が実行される場合には保留されたブロックが有音と判断
されて出力され、後続のブロックにおいて無音処理ルー
チンが実行される場合には保留されたブロックが無音と
判断されて無音データが出力される。
【0149】また、後続のブロックにおいて語頭処理ル
ーチンが実行される場合には、語尾処理ルーチンによっ
て保留されたブロックの数および語頭処理ルーチンによ
って保留されたブロックの数の合計がSUS個に達した
時点で、「●」で示すブロックが無音とみなされ破棄さ
れる。
【0150】以上に示したように、語尾処理ルーチンに
おいては、処理変数lvlが「2」であるブロックの後
の最大EXT個のブロックに関して、処理変数lvlが
「0」であるブロックは保留し、処理変数lvlが
「1」であるブロックが出現した時点で、当該ブロック
を含めて保留されていた全てのブロックを有音とみなし
て出力している。
【0151】なお、処理変数lvlが「2」であるブロ
ックの後のEXT個のブロックのうちに処理変数lvl
が「0」であるブロックが連続してCNT個以上ある場
合には、処理変数lvlが「0」であるブロックがCN
T個連続して出現した時点で語尾処理ルーチンに代えて
無音処理ルーチンが実行され内部変数flgの値が
「0」に書き換えられるため、これ以降は語尾処理ルー
チンは実行されなくなる。
【0152】このため、その処理変数lvlが「0」で
あるCNT個以上の連続するブロックよりも前の処理変
数lvlが「1」であるブロックによってのみ、語尾処
理ルーチンにおける有音化が行われることになる。
【0153】図15には、メインルーチンの実行中に動
作の停止を指示された場合において、末尾の無音を保存
する必要がある場合に実行される圧縮終了時処理ルーチ
ンのフローチャートが示されている。
【0154】なお、末尾の無音を保存する必要がある場
合とは、例えば、音声データの時間長を保つ必要がある
場合などである。末尾の無音を保存する必要がなけれ
ば、この処理を実行する必要はない。
【0155】即ち、この圧縮終了時処理ルーチンにおい
ては、まず、内部変数blkの値に処理変数susの値
を加算して内部変数blkの値を更新する(ステップS
1502)。
【0156】このステップS1502の処理を終了する
と、ステップS1504の処理へ進み、内部変数blk
の値が定数BLKの値以上であるか否かを判断する。
【0157】上記したステップS1504の処理におい
て、内部変数blkの値が定数BLKの値以上であると
判断された場合には、ブロック数が定数BLKの値の無
音データを出力手段20へ出力するとともに、内部変数
blkの値から定数BLKの値を減算して内部変数bl
kの値を更新し(ステップS1506)、それからステ
ップS1504へ戻って処理を繰り返す。
【0158】一方、ステップS1504の処理におい
て、内部変数blkの値が定数BLKの値以上ではない
と判断された場合には、ステップS1508の処理へ進
み、内部変数blkの値が0より大きいか否かを判断す
る。
【0159】このステップS1508の処理において、
内部変数blkの値が0より大きいとは判断されなかっ
た場合には、そのままこの圧縮終了時処理ルーチンを終
了する。
【0160】一方、ステップS1508の処理におい
て、内部変数blkの値が0より大きいと判断された場
合には、ブロック数が内部変数blkの無音データを出
力手段20へ出力し(ステップS1510)、それから
この圧縮終了時処理ルーチンを終了する。
【0161】なお、上記した実施の形態において、ブロ
ック化手段14は通常は複数のサンプルで1ブロックを
形成するものであるが、1サンプルで1ブロックとする
ものもブロック手段14で得られるブロックには含まれ
るものである。
【0162】また、上記した実施の形態に代えて、音声
データのレベルとして、各ブロックに含まれるサンプル
の絶対値の平均値や音声データのエンベロープのレベル
を採用するようにしてもよい。
【0163】また、上記した実施の形態に代えて、音声
データとして圧縮前のPCMデータをバッファに保存し
ておき、有音か無音かの確定後に圧縮するという手法を
用いてもよい。こうした場合には、圧縮データを保留す
るという上記した実施の形態の手法よりも大きいバッフ
ァが必要となるが、無音部分を圧縮するという無駄な処
理を行う必要がなくなる。
【0164】さらに、上記した実施の形態のように、音
声データの先頭から順番に処理するのではなく、音声デ
ータをメモリに記憶させておき、音声データの末尾から
先頭に向かって処理するようにしてもよい。
【0165】
【発明の効果】本発明は、以上説明したように構成され
ているので、音声の語尾や語頭が途切れることなく明瞭
で滑らかな音声の再現を行うことができるようになると
ともに、音声データのなかで無音処理することが好まし
い不要な部分において有音処理を行うことがなくなって
データ量の圧縮率の向上を図ることができるという優れ
た効果を奏する。
【図面の簡単な説明】
【図1】特開平11−52990号公報に開示された技
術の動作を説明するための説明図である。
【図2】特公平3−68399号公報に開示された技術
の動作を説明するための説明図である。
【図3】本発明による無音判別方法を行う手段を有する
無音判別装置を備えた音声圧縮装置のブロック構成図で
ある。
【図4】本発明の動作原理を説明するための説明図であ
る。
【図5】(a)は本発明における処理対象のブロック
(本ブロック)の圧縮データを保留する処理を説明する
ための説明図であり、(b)は本発明における保留中の
先頭ブロックの圧縮データを廃棄するための説明図であ
る。
【図6】本発明のメインルーチンのフローチャートであ
る。
【図7】本発明の共通処理ルーチンのフローチャートで
ある。
【図8】本発明の有音処理ルーチンのフローチャートで
ある。
【図9】本発明の無音処理ルーチンのフローチャートで
ある。
【図10】本発明の語頭処理ルーチンのフローチャート
である。
【図11】本発明の語尾処理ルーチンのフローチャート
である。
【図12】語頭処理ルーチンにおける動作を説明するた
めの説明図である。
【図13】語頭処理ルーチンにおける動作を説明するた
めの説明図である。
【図14】語尾処理ルーチンにおける動作を説明するた
めの説明図である。
【図15】本発明の圧縮終了時処理ルーチンのフローチ
ャートである。
【符号の説明】
10 音声圧縮装置 12 入力手段 14 ブロック化手段 16 比較手段 18 圧縮・無音処理手段 20 出力手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声データのレベルに基づいて、音声デ
    ータを構成する各部分を有音あるいは無音と判断する無
    音判別方法であって、 音声データのレベルを、所定の第1のレベルと前記第1
    のレベルよりも大きい所定の第2のレベルと比較し、 音声データのレベルが前記第2のレベルよりも大きいこ
    とにより定義される第1種の区間に関しては有音と判断
    し、 音声データの前記第1種の区間ではない区間であって、
    音声データの前記第1種の区間の始端から前側に第1の
    所定の距離内であることにより定義される第2種の区間
    に関しては、前記第2種の区間の音声データのレベルが
    前記第1のレベルよりも大きいか否かに基づいて有音で
    あるか無音であるかを判断し、 音声データの前記第1種の区間ではない区間であって、
    音声データの前記第1種の区間の終端から後側に第2の
    所定の距離内であることにより定義される第3種の区間
    に関しては、前記第3種の区間の音声データのレベルが
    前記第1のレベルよりも大きいか否かに基づいて有音で
    あるか無音であるかを判断し、 音声データの前記第1種の区間、前記第2種の区間およ
    び前記第3種の区間のいずれにも該当しないことにより
    定義される第4種の区間に関しては無音であると判断す
    るものである無音判別方法。
  2. 【請求項2】 請求項1に記載の無音判別方法におい
    て、 音声データのレベルが前記第1のレベルよりも大きくな
    い状態が所定の長さよりも長く連続している部分に関し
    ては無音と判断し、 音声データの前記第2種の区間に含まれ、音声データの
    レベルが前記第1のレベルよりも大きくかつ後側の最も
    近い前記第1種の区間との間に無音と判断される部分が
    ない部分に関しては有音と判断するとともに、この条件
    で有音と判断された部分の後側に有音と判断されていな
    い部分が隣接する場合はこれを全て有音と判断し、 音声データの前記第3種の区間に含まれ、音声データの
    レベルが前記第1のレベルよりも大きくかつ前側の最も
    近い前記第1種の区間との間に無音と判断される部分が
    ない部分に関しては有音と判断するとともに、この条件
    で有音と判断された部分の前側に有音と判断されていな
    い部分が隣接する場合はこれを全て有音と判断するもの
    である無音判別方法。
  3. 【請求項3】 請求項1に記載の無音判別方法におい
    て、 音声データの前記第2種の区間に含まれ、音声データの
    レベルが前記第1のレベルよりも大きくない状態が前記
    第2種の区間の先頭から連続している部分に関して、そ
    の部分の前側に前記第4の区間が隣接する場合には無音
    と判断し、 音声データの前記第3種の区間に含まれ、音声データの
    レベルが前記第1のレベルよりも大きくない状態が前記
    第3種の区間の末尾から連続している部分に関して、そ
    の部分の後側に前記第4の区間が隣接する場合には無音
    と判断するものである無音判別方法。
  4. 【請求項4】 請求項2に記載の無音判別方法におい
    て、 前記のいずれの判断においても無音とも有音とも判断さ
    れなかった部分に関しては無音と判断するものである無
    音判別方法。
  5. 【請求項5】 請求項1、2、3または4のいずれか1
    項に記載の無音判別方法を行う手段を有する無音判別装
    置。
  6. 【請求項6】 請求項1、2、3または4のいずれか1
    項に記載の無音判別方法をコンピュータに実行させるた
    めのプログラムを記録したコンピュータ読み取り可能な
    記録媒体。
JP11584999A 1999-04-23 1999-04-23 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4202524B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11584999A JP4202524B2 (ja) 1999-04-23 1999-04-23 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11584999A JP4202524B2 (ja) 1999-04-23 1999-04-23 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2000305580A true JP2000305580A (ja) 2000-11-02
JP4202524B2 JP4202524B2 (ja) 2008-12-24

Family

ID=14672668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11584999A Expired - Fee Related JP4202524B2 (ja) 1999-04-23 1999-04-23 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4202524B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006077626A1 (ja) * 2005-01-18 2006-07-27 Fujitsu Limited 話速変換方法及び話速変換装置
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置
JP2010266778A (ja) * 2009-05-18 2010-11-25 Panasonic Corp 再生装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006077626A1 (ja) * 2005-01-18 2006-07-27 Fujitsu Limited 話速変換方法及び話速変換装置
JPWO2006077626A1 (ja) * 2005-01-18 2008-06-12 富士通株式会社 話速変換方法及び話速変換装置
JP4630876B2 (ja) * 2005-01-18 2011-02-09 富士通株式会社 話速変換方法及び話速変換装置
US7912710B2 (en) 2005-01-18 2011-03-22 Fujitsu Limited Apparatus and method for changing reproduction speed of speech sound
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置
JP4758879B2 (ja) * 2006-12-14 2011-08-31 日本電信電話株式会社 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法
JP2010266778A (ja) * 2009-05-18 2010-11-25 Panasonic Corp 再生装置

Also Published As

Publication number Publication date
JP4202524B2 (ja) 2008-12-24

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
JP3145358B2 (ja) 無音期間圧縮方法
EP1160771A1 (en) Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals
JP5367932B2 (ja) オーディオ速度変換を可能にするシステムおよび方法
JP3881620B2 (ja) 話速可変装置及び話速変換方法
JP2000305580A (ja) 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体
JP2001053869A (ja) 音声蓄積装置及び音声符号化装置
JPS58205196A (ja) 音声処理装置における音声情報の自動編集方法
US6219636B1 (en) Audio pitch coding method, apparatus, and program storage device calculating voicing and pitch of subframes of a frame
WO2009090705A1 (ja) 記録再生装置
KR101349797B1 (ko) 전자기기에서 음성 파일 재생 방법 및 장치
JP2002258900A (ja) 音声再生装置及び音声再生方法
JPH09138698A (ja) 音声記録再生装置
JPH0368399B2 (ja)
JP2867744B2 (ja) 音声再生装置
JP5326796B2 (ja) 再生装置
JPH0573089A (ja) 音声再生方法
KR930002585B1 (ko) 음성우편장치의 음성정보 처리방법
KR20010085664A (ko) 화속 변환 장치
JP3252591B2 (ja) 音声蓄積装置
JPH0287199A (ja) 音声の有音起動方式および装置
JP2001117596A (ja) 音声信号再生方法および音声信号再生装置
CN114513577A (zh) 数据播放方法及装置
JPH08265337A (ja) 音声通信録音装置
KR20030000400A (ko) 음성 재생속도 실시간 변환 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081009

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees