JPH06161487A - Speech editor - Google Patents

Speech editor

Info

Publication number
JPH06161487A
JPH06161487A JP4314602A JP31460292A JPH06161487A JP H06161487 A JPH06161487 A JP H06161487A JP 4314602 A JP4314602 A JP 4314602A JP 31460292 A JP31460292 A JP 31460292A JP H06161487 A JPH06161487 A JP H06161487A
Authority
JP
Japan
Prior art keywords
signal
display
waveform
displayed
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4314602A
Other languages
Japanese (ja)
Inventor
Yoshihiro Mizuno
善弘 水野
Kunihiro Yanagi
邦宏 柳
Motoaki Satoyama
元章 里山
Toshio Moriya
俊夫 守屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4314602A priority Critical patent/JPH06161487A/en
Publication of JPH06161487A publication Critical patent/JPH06161487A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide the speech editor which can display and edit a speech waveform for a long period of time. CONSTITUTION:When an input signal is compared with a threshold value to recognize a voiceless sound signal (110) and the number of successive voiceless sound signals reaches to make a reduction display (114), the decided voiceless sound signal is saved in a buffer (118) and a return to processing for reading an input signal is made. When it is decided that the signal is not the voiceless sound signal in the 110 and a reduction display of the signal saved in the buffer so far is made, the reduction display is made (122). Then the signal which is decided not as the voiceless sound signal in the 110 is displayed regardless whether or not the reduction display is made (126). Consequently, the speech signal waveform for a long period of time can be displayed and edited without remarkably losing characteristic information on the speech signal waveform.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ディジタル音声波形の
表示方法および編集方法に関し、特に、マルチメディア
処理用等の音声を編集する音声エディタに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for displaying and editing a digital voice waveform, and more particularly to a voice editor for editing voice for multimedia processing and the like.

【0002】[0002]

【従来の技術】ディジタル音声波形を表示する場合、表
示させたい波形の長さはサンプリング周波数により決ま
る。また、一度に表示できる波形の長さは、それを表示
するディスプレイの分解能により制約される。例えば、
表示させるディジタル音声がナレーションのように長時
間にわたるものであると、一度に全体の波形を表示でき
ず、編集操作などがしづらくなる。このような問題を解
決する方法として「間引き表示」がある。これは、サン
プリング周波数ごとのディジタル信号を毎個表示するか
わりに、一定間隔おきに信号を抽出し、表示することに
より、時間軸を縮小し、表示可能な波形長をより長くす
る操作である。この間引き表示を効果的に行なう公知例
として特開平1−120598に記載された事項があ
る。これは、ディジタル信号の一定区間毎に特徴点を抽
出・表示することにより間引き表示を可能にするもので
ある。
2. Description of the Related Art When displaying a digital voice waveform, the length of the waveform to be displayed is determined by the sampling frequency. Also, the length of a waveform that can be displayed at one time is limited by the resolution of the display that displays it. For example,
If the digital voice to be displayed is for a long time like narration, the entire waveform cannot be displayed at one time, making it difficult to perform editing operations. There is "thinning-out display" as a method for solving such a problem. This is an operation of reducing the time axis and lengthening the displayable waveform length by extracting and displaying signals at regular intervals instead of displaying each digital signal for each sampling frequency. As a publicly known example of effectively performing this thinning-out display, there is a matter described in JP-A-1-120598. This enables thinning display by extracting and displaying feature points for each constant section of the digital signal.

【0003】[0003]

【発明が解決しようとする課題】かかる従来の方法にお
いては、次のような課題がある。すなわち、一定区間お
きに信号を抽出する間引き表示では、表示により得られ
る信号波形は、実際の信号波形と著しく異なる場合があ
る。なぜなら、たとえば前述の一定区間に激しく変動す
る波形が入力となる場合、その信号群のうちの一つがそ
の区間を代表する信号となり、表示の段階では、もはや
信号の変動は観察できなくなるためである。
The conventional method has the following problems. That is, in the thinned-out display in which signals are extracted at regular intervals, the signal waveform obtained by the display may be significantly different from the actual signal waveform. This is because, for example, when a waveform that fluctuates drastically in the above-mentioned certain section is input, one of the signal groups becomes a signal representative of that section, and the fluctuation of the signal can no longer be observed at the display stage. .

【0004】一方、前述の公知例は、一定区間毎に特徴
点を抽出・表示することにより、波形の特徴を損なうこ
となく間引き表示を可能にするものである。この方法に
おいては、表示する波形が入力と著しく異なることは防
ぐことができるものの、ある区間において観察者に非常
に重要な信号がある場合であっても特徴点で代表される
ことにより、正確な波形を表示するものではない。
On the other hand, in the above-mentioned known example, by extracting and displaying the characteristic points for each fixed section, it is possible to perform the thinning display without damaging the characteristics of the waveform. In this method, it is possible to prevent the displayed waveform from being significantly different from the input, but even if there is a very important signal to the observer in a certain section, it is represented by the feature points, so that it is accurate. It does not display a waveform.

【0005】本発明の一つの目的は、より長い区間の音
声信号を表示可能にする音声エディタを提供することに
ある。本発明の他の目的は、重要な音声信号を欠落させ
ることのない音声エディタを提供するにある。本発明の
さらに他の目的は、音声とそれに続く音声、すなわち文
章と文章の間の無音状態を把握することが可能な音声エ
ディタを提供することにある。
An object of the present invention is to provide an audio editor capable of displaying an audio signal in a longer section. Another object of the present invention is to provide an audio editor that does not drop important audio signals. Still another object of the present invention is to provide a voice editor capable of grasping a voice and a voice following it, that is, a silent state between sentences.

【0006】[0006]

【課題を解決するための手段】本発明は、無音状態と見
なされる信号がある程度の期間続く箇所を縮小して表示
するものである。また、縮小して表示する区間に対し、
他の区間と区別が可能な表示を行なうものである。さら
に、縮小して表示する区間に対し、その長さ、最大値、
最小値などの情報を与えるものである。
SUMMARY OF THE INVENTION The present invention is to reduce and display a portion where a signal regarded as a silent state continues for a certain period. Also, for the section to be reduced and displayed,
This is a display that can be distinguished from other sections. Furthermore, for the section to be reduced and displayed, its length, maximum value,
It provides information such as the minimum value.

【0007】[0007]

【作用】無音状態と見なされる音声信号の区間を縮小す
るして表示することにより、長期間にわたる音声信号波
形を表示することが可能となる。また、無音状態と見な
される信号の区間を縮小して間引き表示することによ
り、間引き操作により、その他の重要な信号の欠落を防
止することが可能となる。さらに、間引き表示する区間
に対し、他の区間と区別が可能な表示を行なうことによ
り、間引き操作が行なわれた区間を把握することが可能
となる。さらに、間引き表示する区間に対し、他の区間
と区別が可能な表示を行ない、その長さ、最大値、最小
値などの情報を与えることにより、音声とそれに続く音
声、すなわち文章と文章の間の無音状態を詳細に把握す
ることが可能となる。
By reducing and displaying the section of the audio signal which is considered to be in the silent state, it is possible to display the audio signal waveform for a long period of time. Further, by reducing the section of the signal which is considered to be in the silent state and performing thinning display, it is possible to prevent the loss of other important signals by the thinning operation. Further, by displaying the section to be thinned and displayed so as to be distinguishable from other sections, it is possible to grasp the section in which the thinning operation is performed. In addition, the section to be thinned out is displayed so that it can be distinguished from other sections, and information such as its length, maximum value, and minimum value is given, so that the voice and the following voice, that is, the space between sentences, It is possible to grasp the silent state of the in detail.

【0008】[0008]

【実施例】以下、本発明の一実施例を詳細に説明する。
図1は、本発明における無音声区間間引き表示の処理手
順の1実施例を示すフローチャートである。図2は、本
発明に係わる音声信号入力装置、音声エディタおよび音
声信号出力装置の構成を示すブロック図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described in detail below.
FIG. 1 is a flow chart showing an embodiment of a processing procedure of a non-voice section thinning-out display in the present invention. FIG. 2 is a block diagram showing the configurations of a voice signal input device, a voice editor, and a voice signal output device according to the present invention.

【0009】図2において、音声信号入力装置は、音声
信号の記録・取り出しを行なう音声信号ファイル装置1
0、音声信号を入力するマイク・CD・カセットテープ
など11、入力した音声を制御する音声信号入力制御装
置12から成る。また、音声エディタ13は、音声信号
を編集する編集部14、編集した音声信号の波形などを
表示する表示部15、再生する再生部16、その他マウ
ス17、キーボード18から成る。ここで、表示部15
には、無音区間間引き表示装置19が含まれる。さら
に、音声信号出力装置は、表示部15からの信号を画面
に出力するディスプレイ装置20、再生部からの信号を
再生する音声信号出力制御装置21およびスピーカ22
から成る。
In FIG. 2, an audio signal input device is an audio signal file device 1 for recording and extracting an audio signal.
0, a microphone / CD / cassette tape 11 for inputting an audio signal, and an audio signal input control device 12 for controlling the input audio. The voice editor 13 includes an editing unit 14 for editing a voice signal, a display unit 15 for displaying a waveform of the edited voice signal, a reproducing unit 16 for reproducing, a mouse 17, and a keyboard 18. Here, the display unit 15
Includes a silent interval thinning-out display device 19. Furthermore, the audio signal output device includes a display device 20 that outputs a signal from the display unit 15 to a screen, an audio signal output control device 21 that reproduces a signal from the reproduction unit, and a speaker 22.
Consists of.

【0010】次に、図1のフローチャートに基づいて図
2の無音区間間引き表示装置19において音声信号波形
を表示する動作を説明する。ここで、入力となる音声信
号は、音声信号ファイル装置10から得られ、出力波形
はディスプレイ装置20に出力されるものとする。
Next, the operation of displaying the audio signal waveform in the silent interval thinning-out display device 19 of FIG. 2 will be described based on the flowchart of FIG. Here, it is assumed that the input audio signal is obtained from the audio signal file device 10 and the output waveform is output to the display device 20.

【0011】まず、初期条件として、入力信号が無音か
どうかを判定するしきい値、縮小するに到る無音信号が
継続する期間を設定する。また、継続する無音信号を計
測するカウンタを初期化(零など)し、無音区間を縮小
表示させるか否かを記録しておくフラグを”縮小表示さ
せない”とし、継続する無音信号を待避させておくバッ
ファを用意する(102)。
First, as an initial condition, a threshold value for determining whether or not the input signal is silent, and a period during which the silent signal continues to be reduced are set. In addition, the counter that measures the continuous silence signal is initialized (zero, etc.), and the flag that records whether or not to reduce the silence interval is set to "Do not reduce" to save the continuous silence signal. A buffer to be placed is prepared (102).

【0012】次に、入力信号を音声信号ファイル装置1
0から読み込む(104)。そこで、入力信号が終わり
であるかどうか判定し(106)、終わりであれば一連
の処理を終了する(108)。入力信号が終わりでない
場合、それと無音信号のしきい値とを比較し、入力信号
が無音であるか否かを判定する(110)。無音信号と
判定された場合、継続する無音信号を計測するカウンタ
を1つ増加させる(112)。無音信号の継続個数が縮
小表示するに到る場合(114)、縮小表示させるか否
かを記録しておくフラグを”縮小表示させる”とする
(116)。次に、無音と判定された入力信号をバッフ
ァに待避し(118)、入力信号を読み込む処理(10
4)に戻る。
Next, the input signal is converted into the audio signal file device 1.
Read from 0 (104). Therefore, it is determined whether or not the input signal is the end (106), and if the input signal is the end, a series of processing is ended (108). If the input signal is not the end, it is compared with the threshold of the silence signal to determine if the input signal is silence (110). When it is determined that the signal is a silent signal, the counter for measuring the continuing silent signal is incremented by 1 (112). When the number of continuous silent signals reaches the reduced display (114), the flag for recording whether or not the reduced display is performed is set to "reduce" (116). Next, the input signal determined to be silent is saved in the buffer (118), and the input signal is read (10
Return to 4).

【0013】110において、無音信号でないと判定さ
れた場合、現時点までにバッファに待避されている信号
を縮小表示するか否かを判定する(120)。縮小表示
が必要な場合のみ縮小表示を行なう(122)。その
後、縮小表示を行なうか否かに、係わりなく、110に
おいて無音信号でないと判定された信号を表示し(12
4)、フラグを”縮小表示させない”とする(12
6)。また、継続する無音信号を計測するカウンタをク
リアし(128)、入力信号を読み込む処理(104)
に戻る。
When it is judged in 110 that the signal is not a silent signal, it is judged whether or not the signal saved in the buffer up to the present time is reduced and displayed (120). The reduced display is performed only when the reduced display is necessary (122). Thereafter, regardless of whether or not the reduced display is performed, the signal determined as not being a silent signal in 110 is displayed (12
4), the flag is set to "not be reduced" (12)
6). In addition, the counter for measuring the continuous silent signal is cleared (128) and the input signal is read (104)
Return to.

【0014】図3(a)に示す信号波形を本発明に基づく
図2のフローチャートに示す方法で縮小表示したものを
図3(b)に示す。ここで、無音信号を判定するためのし
きい値を30、縮小するに到る無音継続時間を31とす
る。
FIG. 3B shows the signal waveform shown in FIG. 3A in a reduced size by the method shown in the flowchart of FIG. 2 according to the present invention. Here, it is assumed that the threshold value for determining the silent signal is 30, and the silent duration time for reducing is 31.

【0015】以下、図3(a)に示す入力信号を図3(b)
のように縮小表示する過程を説明する。入力信号32の
区間は110において、しきい値30より大なる信号値
であるため、無音信号でないと判定される。また、その
間に縮小表示するべき無音信号がバッファに待避されて
いないため、35のように入力信号波形と同一の波形が
出力される。
Below, the input signal shown in FIG.
The process of displaying the reduced image will be described. In the section of the input signal 32, at 110, the signal value is larger than the threshold value 30, and therefore it is determined that the signal is not a silent signal. Further, since the silent signal to be reduced and displayed is not saved in the buffer during that time, the same waveform as the input signal waveform is output as in 35.

【0016】一方、入力信号33の区間は110におい
て、しきい値30より小なる信号値であるため、無音信
号と判定される。また、無音継続の区間は33の区間長
に等しく、それは縮小表示に到る長さであるため、36
のように縮小表示される。
On the other hand, in the section of the input signal 33, at 110, the signal value is smaller than the threshold value 30, so it is judged as a silent signal. In addition, the silent continuation section is equal to the section length of 33, which is the length up to the reduced display.
It is displayed in reduced size.

【0017】さらに、入力信号34の区間は32、35
の場合と同様に、入力波形と同一の波形37が出力され
る。
Further, the sections of the input signal 34 are 32, 35.
Similar to the case of, the same waveform 37 as the input waveform is output.

【0018】図1のフローチャートに示す例において
は、無音信号がどの位継続するかを予測しておき、待避
しておくバッファを用意しなければならないが、これを
縮小表示するに到る無音信号の継続個数と同じ数のバッ
ファで実施した場合のフローチャートを図4に示す。
In the example shown in the flow chart of FIG. 1, it is necessary to predict how long the silent signal will continue and prepare a buffer to save the silent signal. FIG. 4 shows a flow chart in the case where the same number of buffers as the continuous number of is executed.

【0019】まず、図1の場合と同じ様に初期条件とし
て、入力信号が無音かどうかを判定するしきい値、縮小
表示するに到る無音信号が継続する期間を設定する。ま
た、継続する無音信号を計測するカウンタを初期化(零
など)し、無音区間を縮小表示させるか否かを記録して
おくフラグを”縮小表示させない”とし、継続する無音
信号を待避させておくバッファを用意する。また、ここ
でバッファ用のカウンタを用意し、初期化(零など)し
ておく(202)。
First, as in the case of FIG. 1, as an initial condition, a threshold value for determining whether or not the input signal is silent, and a period during which the silent signal for reducing display is set are set. In addition, the counter that measures the continuous silence signal is initialized (such as zero), and the flag that records whether or not to display the silence section in a reduced size is set to "Do not display in a reduced size" to save the continuous silence signal. Prepare a buffer to store. In addition, a buffer counter is prepared and initialized (zero or the like) here (202).

【0020】次に、入力信号を音声信号ファイル装置1
0から読み込む(204)。そこで、入力信号が終わり
であるかどうか判定し(206)、終わりであれば一連
の処理を終了する(208)。入力信号が終わりでない
場合、それと無音信号のしきい値とを比較し、入力信号
が無音であるか否かを判定する(210)。無音信号と
判定された場合、継続する無音信号を計測するカウンタ
およびバッファ用カウンタを1つ増加させる(21
2)。無音信号の継続個数が縮小表示するに到る場合
(214)、縮小表示させるか否かを記録しておくフラ
グを”縮小表示させる”とする(216)。現時点まで
バッファに待避されている信号を縮小表示する(21
7)。次に、バッファ用のカウンタ値をクリアし(21
8)、無音と判定された入力信号をバッファに待避する
(220)。214において縮小表示させなくても良い
場合、バッファに無音信号を待避させる操作のみ行なう
(220)。その後、入力信号を読み込む処理(20
4)に戻る。
Next, the input signal is converted into the audio signal file device 1
Read from 0 (204). Therefore, it is determined whether or not the input signal is the end (206), and if it is the end, a series of processing is ended (208). If the input signal is not the end, it is compared with the threshold of the silence signal to determine if the input signal is silence (210). When it is determined that the signal is a silent signal, the counter for measuring the continuous silent signal and the buffer counter are incremented by 1 (21
2). When the number of continuous silent signals reaches the reduced display (214), the flag for recording whether or not the reduced display is performed is set to "reduce display" (216). The signal saved in the buffer up to the present time is reduced and displayed (21
7). Next, the counter value for the buffer is cleared (21
8) The input signal determined to be silent is saved in the buffer (220). If it is not necessary to display the reduced image at 214, only an operation of saving the silent signal in the buffer is performed (220). After that, the process of reading the input signal (20
Return to 4).

【0021】210において、無音信号でないと判定さ
れた場合、現時点までにバッファに待避されている信号
を縮小表示するか否かを判定する(222)。縮小表示
が必要な場合のみ縮小表示を行なう(224)。その
後、縮小表示を行なうか否かに係わりなく、210にお
いて無音信号でないと判定された信号を表示する(22
6)。また、フラグを”縮小表示させない”とし(22
8)。継続する無音信号を計測するカウンタをクリアし
(230)、入力信号を読み込む処理(204)に戻
る。
When it is judged in 210 that the signal is not a silent signal, it is judged whether or not the signal saved in the buffer up to the present time is reduced and displayed (222). Only when the reduced display is necessary, the reduced display is performed (224). Then, regardless of whether or not the reduced display is performed, the signal determined to be not the silent signal in 210 is displayed (22).
6). In addition, the flag is set to "not display reduced" (22
8). The counter for measuring the continuous silent signal is cleared (230), and the process returns to the process of reading the input signal (204).

【0022】前述の例では、図1のフローチャートに示
す方法に比べ、必要とされるバッファの数が少なくな
り、一定数のバッファを用意すればよい。しかしなが
ら、無音信号が長時間にわたる場合、図1のフローチャ
ートに示す方法では、無音区間が継続する無音信号をバ
ッファに待避しておき、最後にそれらを縮小表示させる
ため、無音区間が縮小表示に到る長さになる毎に、縮小
表示を繰り返す図4のフローチャートに示す方法に比べ
無音区間の縮小率が大きくなり、結果として長時間にわ
たる音声波形を表示することが可能になる。
In the above-mentioned example, the number of buffers required is smaller than that of the method shown in the flowchart of FIG. 1, and a fixed number of buffers may be prepared. However, when the silent signal is for a long time, the method shown in the flowchart of FIG. 1 saves the silent signal in which the silent section continues in the buffer and finally displays them in a reduced size, so that the silent section reaches a reduced display. The reduction ratio of the silent section is increased as compared with the method shown in the flowchart of FIG. 4 in which the reduced display is repeated every time the length becomes longer.

【0023】前述の実施例における102、110、2
02および210に係わるしきい値の変更・設定方法の
一実施例として、しきい値を設定するために現在表示さ
れている信号波形、あるいはその波形から表示可能な波
形を用いる。手順として、まずメニューなどでしきい値
を変更・設定するモードに入る。次に、信号波形が表示
されている画面上でその波形を目安にし、マウス、キー
ボードの少なくとも一つで設定・変更するものである。
この実施例では、表示されている波形を目安とするた
め、ユーザは視覚的にしきい値が設定しやすくなる。
102, 110, 2 in the above embodiment
As an example of the method of changing / setting the threshold values relating to 02 and 210, a signal waveform currently displayed for setting the threshold value or a waveform displayable from the waveform is used. As a procedure, first enter the mode to change / set the threshold value from the menu. Next, the waveform is used as a guide on the screen on which the signal waveform is displayed, and is set / changed with at least one of the mouse and the keyboard.
In this embodiment, since the displayed waveform is used as a guide, the user can easily set the threshold visually.

【0024】他の実施例として、しきい値を数値で指定
し、設定・変更する。この場合、前述の場合に比べて細
かい設定・変更が可能となる。また、前述の実施例にお
ける102、114、202および214に係わる縮小
表示させるに到る無音信号の継続期間の設定・変更方法
もしきい値の設定・変更方法の実施例と同様、表示され
ている信号波形を用いるか、数値により設定することで
同様の効果が得られる。
As another embodiment, a threshold value is designated by a numerical value and set / changed. In this case, it is possible to make detailed settings and changes as compared with the above case. Further, the method of setting / changing the duration of the silent signal for reducing the display of 102, 114, 202, and 214 in the above-described embodiment is also displayed as in the embodiment of the threshold setting / changing method. The same effect can be obtained by using a signal waveform or by setting a numerical value.

【0025】さらに、前述の実施例における122およ
び224に係わる縮小表示の方法の一実施例として、他
の縮小表示されない信号波形と区別して表示する。これ
には、縮小表示される波形、縮小表示される区間のスケ
ール、縮小表示される区間のエリアおよび、縮小表示さ
れる区間のスケールに記される目盛りの少なくとも一つ
の色、線種、背景のうち少なくとも一つを他のものと区
別することで実施可能である。これに加えて、縮小表示
される波形、縮小表示される区間のスケール、縮小表示
される区間のエリアおよび、縮小表示される区間のスケ
ールに記される目盛りの少なくとも一つにおいて区間の
始点と終点が認識可能な印をつけることで実施可能であ
る。さらにこれに加えて、縮小表示される区間のスケー
ルに記される目盛りの文字フォントを他のものと区別す
ることで実施可能である。さらにこれに加えて、縮小表
示される区間に表示波形から加工した波形図形、例えば
間引き表示、記号表示やゼロ表示(表示すべき信号をゼ
ロと見なして表示する)などで表示することで実施可能
である。図5は、上記実施例のうち縮小表示する区間の
背景を網かけとし(51)、縮小表示区間の始点52と
終点53に境界線を設け、さらに記号を記載し、波形表
示の表示には波形の特徴点を抽出して表示した(54)
例である。
Further, as one embodiment of the reduced display method related to 122 and 224 in the above-mentioned embodiment, the signal waveform is displayed separately from other signal waveforms which are not reduced. This includes the reduced waveform, the scale of the reduced section, the area of the reduced section, and at least one color, linetype, and background of the scale on the scale of the reduced display. It can be implemented by distinguishing at least one of them from the others. In addition to this, at least one of the reduced waveform, the scale of the reduced display section, the area of the reduced display section, and the scale on the reduced display section scale has a start point and an end point of the section. It is possible to put it on by making a mark that can be recognized. In addition to this, it is possible to implement by distinguishing the character font of the scale written on the scale of the reduced display section from other fonts. In addition to this, it can be performed by displaying a waveform figure processed from the displayed waveform in the reduced display section, such as thinning display, symbol display or zero display (display the signal to be displayed as zero) Is. In FIG. 5, the background of the section to be reduced and displayed in the above embodiment is shaded (51), a boundary line is provided at the start point 52 and the end point 53 of the reduced and displayed section, and symbols are further added to the waveform display. The characteristic points of the waveform are extracted and displayed (54)
Here is an example.

【0026】さらに、前述の実施例における122およ
び224に係わる縮小表示されている区間およびその他
の区間での波形観測における認知事項の欠落を補うため
の一実施例を説明する。この実施例では、表示されてい
る波形に関してその区間の長さ、振幅が最大、最小とな
る値および位置など通常の波形観測において可能な認知
事項のうち少なくとも一つが認知できるものとする。
Further, an embodiment for compensating for the lack of recognition items in the waveform observation in the reduced display section 122 and 224 in the above-mentioned embodiment and other sections will be described. In this embodiment, it is assumed that at least one of the recognition items that can be recognized in normal waveform observation such as the length, the value of the maximum and the minimum of the section and the position of the displayed waveform can be recognized.

【0027】これは、縮小表示が行われている画面また
はそれに関連して表示可能な画面のうち少なくとも一つ
の画面において、認知されるべき事項の定量的数値によ
る表示、認知されるべき事項が認知可能な記号による表
示、認知されるべき区間の拡大表示、または縮小表示を
行なわない波形表示のうち少なくとも一つの方法を実施
することにより認知可能である。図6は、図5の実施例
に加えて前記の実施例のうち、波形の振幅が最大になる
地点にその位置および振幅値を定量的に表示し(6
1)、最小となる地点にその位置および振幅値を定量的
に表示し(62)、縮小表示した区間の実時間を表示し
(63)、さらに縮小表示区間の真の波形を付加的に表
示した(64)例である。
This is a display of a matter to be recognized by a quantitative numerical value, and a matter to be recognized is recognized on at least one of the screens displayed in reduced size or the screens displayable in association therewith. It can be recognized by performing at least one method of display of possible symbols, enlarged display of a section to be recognized, and waveform display without reduced display. In addition to the embodiment of FIG. 5, FIG. 6 quantitatively displays the position and the amplitude value at the point where the amplitude of the waveform is maximum in the above-mentioned embodiment (6
1), the position and amplitude value are quantitatively displayed at the minimum point (62), the real time of the reduced display section is displayed (63), and the true waveform of the reduced display section is additionally displayed. This is an example of (64).

【0028】また、特に縮小表示される区間の長さを認
知する方法として、前述の縮小表示部分とその他の部分
を区別するものの少なくとも一つに段階を設けることに
より認知可能である。図7は、図5の実施例のうち始点
51および終点52の境界線を縮小表示した区間の実時
間に応じてその長さを決定し、実時間の推定を可能にす
るためスケ−ルを付加して表示した(71、72)例で
ある。
Further, as a method of recognizing the length of the reduced display section, it is possible to recognize it by providing a step in at least one of the above-mentioned reduced display portion and the other portion. In FIG. 7, the length is determined according to the real time of the section in which the boundary line between the start point 51 and the end point 52 is reduced and displayed in the embodiment of FIG. 5, and the scale is set to enable estimation of the real time. This is an example of (71, 72) additionally displayed.

【0029】前述の実施例の応用例として、本音声エデ
ィタで縮小表示した波形信号の成分を入力信号波形に代
えて音声信号ファイル装置に記録させることにより、フ
ァイル装置の記憶容量を節約し、さらに予め縮小表示に
対応した信号の形態で記憶させておくことにより、音声
信号を入力し縮小表示させるまでの時間の短縮が実現で
きる。また、ネットワ−クなどの通信において信号伝送
の効率を改善するものである。さらに、縮小波形を記録
させる別の方法として、縮小表示させる区間、縮小表示
の形態を入力信号波形に付加して記録するか、別途記録
することで、真の入力信号を保持しつつ縮小表示までの
時間を縮小することができる。
As an application example of the above-described embodiment, the component of the waveform signal reduced and displayed by the audio editor is recorded in the audio signal file device in place of the input signal waveform, thereby saving the storage capacity of the file device. By pre-storing in the form of a signal corresponding to the reduced display, it is possible to shorten the time until the voice signal is input and the reduced display is performed. It also improves the efficiency of signal transmission in communications such as networks. Furthermore, as another method of recording the reduced waveform, the section to be reduced and the reduced display mode are added to the input signal waveform and recorded, or separately recorded, so that the true input signal is held and the reduced display is performed. The time can be reduced.

【0030】さらに、その他の応用例を図8に示す。こ
れは、所望の観測区間の真の波形表示(81、82、8
3)から無音区間ではない区間(有音区間)を拡大表示
(84、85、86)したものである。ただし、有音区
間の開始地点は87、終了地点は88で認識可能とな
る。また、拡大表示された有音区間についても前述の無
音区間と同様に図3b、図5、図6および図7に示すよ
うな波形表示ができ、波形情報が得られるものである。
これにより、有音区間の詳細な情報を得ることができる
だけでなく、所望の区間全体の様子が観測可能となる。
Further, another application example is shown in FIG. This is a true waveform display (81, 82, 8) of the desired observation section.
3 () is an enlarged display (84, 85, 86) of a section (sound section) which is not a silent section. However, the start point of the voiced section is 87, and the end point is 88. Further, in the enlarged voiced section, the waveform display as shown in FIG. 3b, FIG. 5, FIG. 6 and FIG. 7 can be performed similarly to the silent section described above, and the waveform information can be obtained.
As a result, not only detailed information on the voiced section can be obtained, but also the appearance of the entire desired section can be observed.

【0031】[0031]

【発明の効果】以上で述べたように、本発明によれば、
無音区間を含む音声信号の表示において、無音区間と判
定された区間を縮小表示することにより、長期にわたる
信号波形を表示することができる。また、表示波形の波
形特性が得られることにより、音声信号編集が容易にな
る。
As described above, according to the present invention,
In the display of the audio signal including the silent section, the section determined to be the silent section is reduced and displayed, whereby the signal waveform over a long period can be displayed. Further, since the waveform characteristic of the display waveform is obtained, the audio signal editing becomes easy.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の処理手順の一実施例を示すフローチャ
ートである。
FIG. 1 is a flowchart showing an example of a processing procedure of the present invention.

【図2】本発明に係わる音声信号入力装置、音声エディ
タおよび音声信号出力装置の構成を示すブロック図であ
る。
FIG. 2 is a block diagram showing configurations of a voice signal input device, a voice editor, and a voice signal output device according to the present invention.

【図3】図1に示す実施例を説明するための入力音声信
号波形例、及び図1に示す処理手順で実施した場合の出
力音声信号波形例である。
FIG. 3 is an example of an input voice signal waveform for explaining the embodiment shown in FIG. 1 and an example of an output voice signal waveform when the processing procedure shown in FIG. 1 is performed.

【図4】本発明の処理手順の他の実施例を示すフローチ
ャートである。
FIG. 4 is a flowchart showing another embodiment of the processing procedure of the present invention.

【図5】図3(b)に示す出力音声信号波形に対し、縮小
表示区間を他の区間と区別する実施例および縮小表示の
実施例を適用したものである。
5A and 5B show an example in which a reduced display section is distinguished from other sections and a reduced display example is applied to the output audio signal waveform shown in FIG. 3B.

【図6】図5に示す出力音声信号波形の波形情報の欠
落、不足を補う実施例を適用したものである。
FIG. 6 is an example to which an embodiment for compensating for the lack and lack of waveform information of the output audio signal waveform shown in FIG. 5 is applied.

【図7】図5に示す出力音声信号波形に対し、縮小表示
区間の実時間を認知可能にする実施例を適用したもので
ある。
FIG. 7 is a diagram in which an embodiment is applied to the output audio signal waveform shown in FIG. 5 so that the real time of the reduced display section can be recognized.

【図8】本特許の実施例の応用例として、真の音声信号
出力波形、および有音信号を抽出して拡大表示したもの
である。
FIG. 8 shows, as an application example of the embodiment of the present patent, a true audio signal output waveform and a voiced signal which are enlarged and displayed.

【符号の説明】[Explanation of symbols]

10・・音声信号ファイル装置、11・・マイク、C
D、テープレコーダ、12・・音声信号入力制御装置、
13・・音声エディタ、14・・編集部、
15・・表示部16・・再生部、 17
・・マウス18・・キーボード、 19・・間
引き表示部、20・・ディスプレイ装置、 21・・
音声信号出力制御部22・・スピーカ
10 ... Voice signal file device, 11 ... Microphone, C
D, tape recorder, 12 ... Voice signal input control device,
13 ... Voice editor, 14 ... Editorial department,
Display unit 16 Playback unit 17
..Mouse 18..Keyboard, 19..Thinning display unit, 20..Display device, 21 ..
Audio signal output controller 22 ... Speaker

───────────────────────────────────────────────────── フロントページの続き (72)発明者 守屋 俊夫 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Toshio Moriya 1099, Ozenji, Aso-ku, Kawasaki-shi, Kanagawa Ltd. Hitachi, Ltd. System Development Laboratory

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】音声信号を入力とし、その波形を表示、編
集する機能を備え、音声信号を間引き表示することを特
徴とし、無音信号が継続する区間を縮小することで間引
き表示することを特徴とする音声エディタ。
1. A sound signal is input, a function of displaying and editing a waveform of the sound signal is provided, and the sound signal is decimated and displayed, and the decimated display is performed by reducing a section in which a silent signal continues. And a voice editor.
【請求項2】前記無音区間の判定を促すことを目的とし
て、無音信号であるか否かを判定するしきい値、縮小表
示するに到る無音信号の継続期間のうち少なくとも一つ
がユ−ザにより設定可能であることを特徴とする請求項
1記載の音声エディタ。
2. A user is provided with at least one of a threshold value for determining whether or not there is a silence signal and a duration of the silence signal for reducing display for the purpose of prompting the determination of the silence section. The audio editor according to claim 1, wherein the audio editor can be set by.
【請求項3】前記間引き表示を実施した箇所を他の箇所
と区別して表示することを特徴とした請求項1記載の音
声エディタ。
3. The voice editor according to claim 1, wherein the portion where the thinning display is performed is displayed separately from other portions.
【請求項4】前記表示波形の特性を示す数値を表示する
ことを特徴とした請求項1記載の音声エディタ。
4. The voice editor according to claim 1, wherein a numerical value indicating the characteristic of the displayed waveform is displayed.
JP4314602A 1992-11-25 1992-11-25 Speech editor Pending JPH06161487A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4314602A JPH06161487A (en) 1992-11-25 1992-11-25 Speech editor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4314602A JPH06161487A (en) 1992-11-25 1992-11-25 Speech editor

Publications (1)

Publication Number Publication Date
JPH06161487A true JPH06161487A (en) 1994-06-07

Family

ID=18055275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4314602A Pending JPH06161487A (en) 1992-11-25 1992-11-25 Speech editor

Country Status (1)

Country Link
JP (1) JPH06161487A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009037207A (en) * 2007-07-10 2009-02-19 Canon Inc Image display device, image display method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009037207A (en) * 2007-07-10 2009-02-19 Canon Inc Image display device, image display method, and program

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
US5634020A (en) Apparatus and method for displaying audio data as a discrete waveform
EP2079234A2 (en) Video searching apparatus, editing apparatus, video searching method, and program
US8150687B2 (en) Recognizing speech, and processing data
US4375083A (en) Signal sequence editing method and apparatus with automatic time fitting of edited segments
JPH01172900A (en) Voice data processor
US5671330A (en) Speech synthesis using glottal closure instants determined from adaptively-thresholded wavelet transforms
JP3279684B2 (en) Voice interface builder system
JP2741833B2 (en) System and method for using vocal search patterns in multimedia presentations
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JPH06161487A (en) Speech editor
Tadamura et al. Synchronizing computer graphics animation and audio
US5729657A (en) Time compression/expansion of phonemes based on the information carrying elements of the phonemes
JPH1078791A (en) Pitch converter
JP3488020B2 (en) Multimedia information presentation device
JPH09152889A (en) Speech speed transformer
KR100359988B1 (en) real-time speaking rate conversion system
JP2000259200A (en) Method and device for converting speaking speed, and recording medium storing speaking speed conversion program
JP3496565B2 (en) Audio processing device and audio processing method
JP2003131680A (en) Control method for optionally selecting display sentence and outputting spoken voice thereof
JP2022150777A (en) Section extraction device and program
JPH05303400A (en) Method and device for audio reproduction
KR0144024B1 (en) Multi-media karaoke system and method making use of it
JPH06131852A (en) Voice editing system
JP2003058199A (en) Method and device for reproducing data containing audio at high speed