JP2022089106A - Automatic voice adjustment device - Google Patents
Automatic voice adjustment device Download PDFInfo
- Publication number
- JP2022089106A JP2022089106A JP2020201374A JP2020201374A JP2022089106A JP 2022089106 A JP2022089106 A JP 2022089106A JP 2020201374 A JP2020201374 A JP 2020201374A JP 2020201374 A JP2020201374 A JP 2020201374A JP 2022089106 A JP2022089106 A JP 2022089106A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio signal
- voice
- unit
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 167
- 238000001228 spectrum Methods 0.000 claims abstract description 55
- 238000004458 analytical method Methods 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims description 29
- 230000000694 effects Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
本発明は、複数の音声信号の周波数特性を調整する自動音声調整装置に関する。 The present invention relates to an automatic voice adjusting device that adjusts the frequency characteristics of a plurality of voice signals.
従来より、ラジオやテレビジョンなどの放送スタジオや、音楽の録音スタジオなどでは、マイクなどから入力された複数の音声信号について、音質や音量等を調整した後、各音声信号をミキシングして出力する音声調整装置が使用されている。音声調整装置は、ミキシング装置、オーディオミキシングコンソール、コンソール、ミキシングボード、ミキサー、オーディオミキサー、音声調整卓、音響調整卓などとも呼ばれている。 Conventionally, in broadcasting studios such as radios and televisions, music recording studios, etc., after adjusting the sound quality and volume of multiple audio signals input from microphones, etc., each audio signal is mixed and output. A voice regulator is used. The audio adjustment device is also called a mixing device, an audio mixing console, a console, a mixing board, a mixer, an audio mixer, an audio adjustment console, an acoustic adjustment console, and the like.
音声調整装置に実装されているイコライザには、音声信号の周波数特性を複数の項目にわたってきめ細かく調整することが可能なパラメトリックイコライザ(PEQ)がある。このパラメトリックイコライザは、入力信号の周波数特性が均一になるように、又は、音楽的に好適な周波数になるように中心周波数、等価量、Q値(Quality Factor)などの設定パラメータを調整して使用する。 The equalizer mounted on the voice adjustment device includes a parametric equalizer (PEQ) that can finely adjust the frequency characteristics of a voice signal over a plurality of items. This parametric equalizer is used by adjusting setting parameters such as center frequency, equivalent amount, and Q value (Quality Factor) so that the frequency characteristics of the input signal become uniform or musically suitable. do.
パラメトリックイコライザの操作は、音声の調整を行う音声調整者(ミキシングエンジニア)によって、装置上に多数配置されているボタンスイッチ、調整つまみ、フェーダー及びタッチパネル(音量調整装置)等の各種操作子を操作することにより行われる。そのため、音声調整者には、限られた時間の中で迅速、且つ正確に多数の操作子を操作することが要求される。しかし、音声調整者は、実際に音を聞きながら音声調整装置を操作して、各音声信号のミキシングバランスが最適となるように手動で調整していることから、その調整には音声調整者の技術、経験などの熟練度が大きく影響し、放送番組、レコーディング、ビデオ編集など制作現場で作られる作品にはばらつきが生じてしまう。 The parametric equalizer is operated by a voice coordinator (mixing engineer) who adjusts the sound, and operates various controls such as button switches, adjustment knobs, faders, and a touch panel (volume control device) arranged on the device. It is done by. Therefore, the voice coordinator is required to operate a large number of controls quickly and accurately within a limited time. However, since the voice adjuster operates the voice adjustment device while actually listening to the sound and manually adjusts the mixing balance of each voice signal to be optimal, the voice adjuster adjusts the adjustment. Skills such as technique and experience have a great influence, and the works produced at the production site such as broadcast programs, recordings, and video editing will vary.
また、パラメトリックイコライザの操作に長けた音声調整者の育成には時間がかかる一方で、近年高齢化により熟練度の高い音声調整者が退職し、彼らが有するスキルも消失してしまうため、制作現場で作られる作品の質の低下が懸念されている。 In addition, while it takes time to train voice coordinators who are good at operating parametric equalizers, highly skilled voice coordinators will retire due to the aging of the population in recent years, and their skills will disappear. There is concern that the quality of the works made in Japan will deteriorate.
このような観点から、音声調整者の熟練度に関わらず、簡単な操作により聞き手にとって違和感のない音声信号を出力することができるようにするため、複数の音声信号を自動的にミックスする機能、いわゆるオートミキサーを搭載した自動音声調整装置に関する提案が、たとえば下記の特許文献に示されている。 From this point of view, a function that automatically mixes multiple audio signals so that the listener can output audio signals that are not uncomfortable for the listener with simple operations, regardless of the skill level of the audio adjuster. Proposals for an automatic audio regulator equipped with a so-called automixer are shown, for example, in the following patent documents.
しかし、特許文献1は、ミックスしたい音声信号をレベル制御のみで調整するため、ミックスしたい音声信号の周波数特性が同一又は類似する場合には、入力される複数の信号が相互に干渉してしまい、それぞれの音が聞きづらくなってしまう場合があった。このような場合、音声調整者が、各入力信号の特徴に合わせてパラメトリックイコライザにより音質を変えて、それぞれの入力信号をミックスした時でも聞きやすくなるように手動で調整しているが、音声調整者の調整は非常に複雑であり、音声調整者の熟練度によって調整後の音声の聞き取りやすさが左右されてしまう。また、特許文献2は、特定のチャンネルの音声を大きくすることはできるものの、入力レベルが小さい音声の音声出力が低下してしまい、聞き取りにくくなってしまうという問題があった。 However, in Patent Document 1, since the audio signal to be mixed is adjusted only by level control, if the frequency characteristics of the audio signal to be mixed are the same or similar, a plurality of input signals interfere with each other. In some cases, it became difficult to hear each sound. In such a case, the voice adjuster manually adjusts the sound quality by using a parametric equalizer according to the characteristics of each input signal so that it is easy to hear even when each input signal is mixed. The adjustment of the person is very complicated, and the audibility of the adjusted voice depends on the skill level of the voice adjuster. Further, Patent Document 2 has a problem that although it is possible to increase the sound of a specific channel, the sound output of the sound having a small input level is lowered and it becomes difficult to hear.
本発明は前記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、複数の周波数特性が同一又は類似する音声が入力された場合に、ピークの周波数が異なるようにパラメトリックイコライザの設定を調整することにより、音声調整者の熟練度に左右されず、聞き取りやすい音声信号を出力することができる自動音声調整装置を提供することにある。 The present invention has been proposed to solve the above-mentioned problems of the prior art. An object of the present invention is to adjust the parametric equalizer setting so that when a plurality of voices having the same or similar frequency characteristics are input, the peak frequencies are different, so that the skill level of the voice adjuster is not affected. It is an object of the present invention to provide an automatic voice adjusting device capable of outputting an easy-to-hear voice signal.
前記の目的を達成するために、本発明の自動音声調整装置は、次のような構成を有することを特徴とする。
(1)複数の音声信号入力部。
(2)前記各音声信号入力部から入力された音声信号を、設定された中心周波数に基づいて所定の周波数特性に調整する複数の音声信号調整部。
(3)任意に選択された複数の前記音声信号の周波数特性を比較し、解析演算処理を施す周波数解析演算部。
(4)前記各音声信号調整部により調整処理済みの音声信号を混合する音声信号混合部。
(5)前記音声信号混合部により混合された音声信号を出力する音声信号出力部。
(6)前記周波数解析演算部は、前記各音声信号の周波数特性の比較結果が同一又は類似する場合に、前記音声信号のいずれかについて、その音声信号の周波数特性を調整するために設定された前記音声信号調整部の中心周波数を、その音声信号の第1スペクトルの周波数に対して、予め設定された閾値以上になるように移動させる。
In order to achieve the above object, the automatic voice adjusting device of the present invention is characterized by having the following configuration.
(1) Multiple audio signal input units.
(2) A plurality of audio signal adjusting units that adjust the audio signal input from each of the audio signal input units to a predetermined frequency characteristic based on a set center frequency.
(3) A frequency analysis calculation unit that compares the frequency characteristics of a plurality of arbitrarily selected audio signals and performs analysis calculation processing.
(4) An audio signal mixing unit that mixes audio signals that have been adjusted by each of the audio signal adjusting units.
(5) An audio signal output unit that outputs an audio signal mixed by the audio signal mixing unit.
(6) The frequency analysis calculation unit is set to adjust the frequency characteristics of the audio signal for any of the audio signals when the comparison results of the frequency characteristics of the audio signals are the same or similar. The center frequency of the voice signal adjusting unit is moved so as to be equal to or higher than a preset threshold value with respect to the frequency of the first spectrum of the voice signal.
本発明において、次のような構成を採用することができる。
(1)前記波数解析演算部は、前記各音声信号の周波数特性の比較結果が同一又は類似する場合に、各音声信号について第2スペクトルの周波数を検出し、前記第1スペクトルの周波数と前記第2スペクトルの周波数の差異が大きい音声信号について、前記音声信号調整部の中心周波数を予め設定された閾値以上になるように移動させる。
(2)前記音声信号調整部の中心周波数を、予め設定された閾値以上になるように、前記第2スペクトル側に移動させる。
(3)前記周波数解析演算部は、前記音声信号調整部から出力された調整後の音声信号を入力して、その音声信号の周波数特性を調整するために設定された前記音声信号調整部の中心周波数を、その音声信号の第1スペクトルの周波数に対して、予め設定された閾値以上になるように移動させる。
In the present invention, the following configurations can be adopted.
(1) The wave number analysis calculation unit detects the frequency of the second spectrum for each voice signal when the comparison result of the frequency characteristics of each voice signal is the same or similar, and the frequency of the first spectrum and the first. For an audio signal having a large difference in frequency between the two spectra, the center frequency of the audio signal adjusting unit is moved so as to be equal to or higher than a preset threshold value.
(2) The center frequency of the audio signal adjusting unit is moved to the second spectrum side so as to be equal to or higher than a preset threshold value.
(3) The frequency analysis calculation unit is the center of the audio signal adjustment unit set to input the adjusted audio signal output from the audio signal adjustment unit and adjust the frequency characteristics of the audio signal. The frequency is moved so as to be equal to or higher than a preset threshold value with respect to the frequency of the first spectrum of the audio signal.
本発明によれば、複数の周波数特性が同一又は類似する音声が入力された場合に、ピークの周波数が異なるようにパラメトリックイコライザの設定を調整するため、音声調整者の熟練度に左右されず、聞き取りやすい音声信号を出力することができる効果を発揮することができる。 According to the present invention, when a plurality of voices having the same or similar frequency characteristics are input, the parametric equalizer setting is adjusted so that the peak frequencies are different, so that it is not affected by the skill level of the voice adjuster. It is possible to exert the effect of being able to output an audio signal that is easy to hear.
[1.第1実施形態]
[1-1.第1実施形態の構成]
以下、本発明の第1実施形態を図1に従って具体的に説明する。図1に示すとおり、本実施形態の装置は、複数の音声信号入力部1a,1b,1nと、各音声信号入力部1a,1b,1nから入力された音声信号を所定の周波数特性に調整する複数の音声信号調整部2a,2b,2nと、各音声信号調整部2a,2b,2nにより調整処理済みの音声信号を混合する音声信号混合部3と、音声信号混合部3により混合された音声信号を出力する音声信号出力部4を有する。
[1. First Embodiment]
[1-1. Configuration of the first embodiment]
Hereinafter, the first embodiment of the present invention will be specifically described with reference to FIG. As shown in FIG. 1, the apparatus of the present embodiment adjusts the audio signals input from the plurality of audio
音声信号入力部1a,1b,1nは、各チャンネルから音声信号が入力される。例えば、放送スタジオにおいては、男性アナウンサー、女性アナウンサー、複数のコメンテーターの音声など、また、バンド演奏の録音スタジオにおいては、ボーカルとその他の楽器の音声などが、各チャンネルの音声信号A、音声信号B、・・・、音声信号Nとして、それぞれ音声信号入力部1a,1b,1nに入力される。
Audio signals are input from each channel in the audio
音声信号調整部2a,2b,2nは、各音声信号入力部1a,1b,1nから入力された音声信号を所定の周波数特性に調整する。音声信号調整部2a,2b,2nは、いわゆるパラメトリックイコライザ(PEQ)であり、入力された音声信号A,B,Nの周波数特性が均一になるように、又は、音楽的に好適な周波数になるように中心周波数、等価量、Q値(Quality Factor)などの設定パラメータを調整する。特に、本実施形態において音声信号調整部2a,2b,2nは、それぞれの音声信号調整部2a,2b,2nごとに予め設定された中心周波数feqa,feqb,feqnに基づいて、入力された各音声信号A,B,Nの周波数特性を調整するもので、中心周波数feqa,feqb,feqnを移動させて、各音声信号のどの帯域の周波数のゲイン及びQ値を増減するかの調整が可能である。
The audio
各音声信号入力部1a,1b,1nと音声信号調整部2a,2b,2nには、音声調整者により任意に選択された複数の音声信号A,B,Nの周波数特性を比較し、解析演算処理を施す周波数解析演算部5が接続されている。本実施形態において、周波数解析演算部5は、音声信号調整部2a,2b,2nから出力されたゲイン等が調整された後の各音声信号を入力して、その周波数特性を解析している。すなわち、各音声信号調整部2a,2b,2nから出力された調整済みの音声信号は、音声信号混合部3によって混合された後、音声信号出力部4から出力されるが、複数の音声が干渉したり、聞き取り難くなったりするのは、調整後の音声信号に起因している。そこで、本実施形態では、調整後の音声信号を解析することで、音声の干渉や聞き取りが困難になることを防止している。
The frequency characteristics of a plurality of audio signals A, B, N arbitrarily selected by the audio adjuster are compared between the audio
周波数解析演算部5は、入力周波数解析部51と、入力周波数比較部52と、スペクトル間隔比較部53と、中心周波数設定部54とを有する。
The frequency
周波数解析演算部5は、音声信号A,B,Nの周波数特性を解析し、その特性を比較する。その比較結果が同一又は類似する場合に、各音声信号A,B,Nの第1スペクトルの周波数f1a,f2a,fnaを検出し、音声信号調整部2a,2b,2nの中心周波数feqa,feqb,feqnを予め設定された閾値以上になるように移動させる。そのため、周波数解析演算部5の出力側は音声信号調整部2a,2b,2nに接続され、各音声信号調整部2a,2b,2nが移動後の中心周波数に基づいて、音声信号のゲイン調整などを実行するように構成されている。
The frequency
入力周波数解析部51は、任意に選択された複数の音声信号、例えば、音声信号A,Bについて、FFT(高速フーリエ変換:Fast Fourier Transform)により解析し、それぞれの周波数を分析する。
The input
入力周波数比較部52は、入力周波数解析部51により解析された音声信号A,Bの周波数スペクトルが同一又は類似するか否か、両者を比較する。すなわち、図3(a)に示すように、音声信号A,Bの第1スペクトルの周波数f1a,f2a及び第2スペクトルの周波数f1b,f2bを検出し、これらの周波数を比較する。
The input
スペクトル間隔比較部53は、各音声信号A,Bについて、その第1スペクトルの周波数f1a、f2aと第2スペクトルの周波数f1b,f2bの差異を比較する。例えば、図3(b)に示すように、音声信号Aにおける第1スペクトルの周波数f1aと第2スペクトルの周波数f1bの距離L1と、音声信号Bにおける第1スペクトルの周波数f2aと第2スペクトルの周波数f2bの距離L2とを比較する。図3(b)では、L1<L2であるため、本実施形態では音声信号Bが、第1スペクトルの周波数f1と第2スペクトルの周波数f2の周波数の差異が大きい。
The spectrum
中心周波数設定部54は、入力周波数比較部52及びスペクトル間隔比較部53の比較結果に従って、各音声信号調整部2a,2b,2nに出力する中心周波数feqa,feqb,feqnの値を設定する。この場合、例えば、音声信号A,Bについて、第1スペクトルの周波数f1a,f2aの値が一定の閾値を越えて離れている場合には、各中心周波数feqa,feqbの値を第1スペクトルの周波数f1a,f2aの値と一致させる。
The center
一方、音声信号A,Bについて、第1スペクトルの周波数f1a,f2aの値が一定の閾値内で同一或いは近接している場合には、一方の音声信号を調整する音声信号調整部2a,2b,2nの中心周波数を移動させる。例えば、図3(b)のように、音声信号Aと音声信号Bを比較した場合に、第1スペクトルの周波数f2aと第2スペクトルの周波数f2bの周波数の差異が大きい音声信号Bについて、その音声信号調整部2bの中心周波数feqbを予め設定された閾値以上になるように第2スペクトル側f2bに移動させる。ここで閾値とは、相互のピークとなる周波数が任意のレベル差になる値であり、聞き手にとって違和感が生じない程度のレベル差をいう。
On the other hand, regarding the audio signals A and B, when the values of the frequencies f1a and f2a of the first spectrum are the same or close to each other within a certain threshold value, the audio
音声信号混合部3は、各音声信号調整部2a,2b,2nにより調整処理済みの音声信号を混合する。音声信号出力部4は、音声信号混合部3により混合された音声信号を出力する。
The audio
[1-2.第1実施形態の作用]
図2は、前記のような構成を有する第1実施形態の作用を説明するフローチャートである。図2に示すように、ステップS01では、音声信号入力部1a,1b,1nに対して各チャンネルの音声信号A,B,Nが入力される。
[1-2. Action of the first embodiment]
FIG. 2 is a flowchart illustrating the operation of the first embodiment having the above configuration. As shown in FIG. 2, in step S01, the audio signals A, B, and N of each channel are input to the audio
ステップS02では、複数の音声が被ってしまって聞き取りにくい場合や、男性アナウンサーと女性アナウンサーのように音声のピークが異なる周波数について増幅処理したい場合など、音声調整者の様々な要望に応じて、音声調整者が音声信号調整部2a,2b,2nを操作することにより、音声調整を実施する任意のチャンネルの音声信号A,B,Nが選択され、音声信号A,B,Nの調整が実施される。この場合、音声調整者が手動で音声調整を実施する代わりに、従来技術として示したような自動音声調整装置、例えば、入力された音声信号の態様に応じて自動的に音声信号調整部2a,2b,2nが調整を実行してもよい。
In step S02, the voice is responded to various requests of the voice adjuster, such as when a plurality of voices are covered and difficult to hear, or when it is desired to perform amplification processing for frequencies having different voice peaks such as a male announcer and a female announcer. When the adjuster operates the voice
ステップS03では、音声調整者により選択されたチャンネルの周波数特性を解析及び比較する。すなわち、各音声信号入力部1a,1b,1nから出力された各音声信号A,B,Nは、周波数解析演算部5に入力され、その入力周波数解析部51によってFFT解析される。
In step S03, the frequency characteristics of the channel selected by the voice coordinator are analyzed and compared. That is, each audio signal A, B, N output from each audio
また、ステップS03では、入力周波数解析部51より解析された各音声信号A,B,Nの解析結果は、入力周波数比較部52に出力され、入力周波数比較部52において各音声信号A,B,Nの周波数特性が比較される。比較された音声信号の周波数特性が予め定められた閾値以上に異なる場合(ステップS04のYES)、すなわち図3(a)に示すように、例えば、音声信号A,Bが比較された場合において、それらの第1スペクトルの周波数f1a,f2aが予め定められた閾値以上に異なる場合(f1a≠f2a)は、各音声信号A,Bの第1スペクトルの周波数f1a,f2aと一致するように、中心周波数設定部54において各音声信号調整部2a,2bの中心周波数feqa,feqbが決定される。
Further, in step S03, the analysis results of the voice signals A, B, and N analyzed by the input
中心周波数設定部54で決定された中心周波数feqa,feqbは各音声信号調整部2a,2bに出力され、各音声信号調整部2a,2bはその中心周波数feqa,feqbに基づいて、音声信号入力部1a,1bから入力された音声信号A,Bについて、音声調整者が入力したパラメータや、自動音声調整装置により決定されたパラメータに従って、音声調整が実施される(ステップS06)。
The center frequencies feqa and feqb determined by the center
前記のステップS06において、各音声信号調整部2a,2bにより音声調整された音声信号は、その後段に設けられた音声信号混合部3によって混合された後(ステップS07)、混合された音声信号は音声信号出力部4からスピーカや録音装置などの外部機器に出力される(ステップS08)。
In step S06, the audio signal adjusted by the audio
ステップS03において比較された音声信号の周波数特性が同一又は類似する場合(ステップS04のNO)、すなわち図3(b)に示すように、例えば、音声信号A,Bが比較された場合において、それらの第1スペクトルの周波数f1a,f2aが一定の閾値内で同一或いは近接している場合(f1a≒f2a)は、スペクトル間隔比較部53において、それぞれの音声信号A,Bについて、第1スペクトルの周波数f1a,f2aと第2スペクトルの周波数f1b,f2bの差異を比較する(ステップS09)。図3(b)では、音声信号Aの第1スペクトルの周波数f1aと第2スペクトルの周波数f1bの差L1と、音声信号Bの第1スペクトルの周波数f2aと第2スペクトルの周波数f2bの差L2とでは、L2>L1になっている。
When the frequency characteristics of the voice signals compared in step S03 are the same or similar (NO in step S04), that is, when the voice signals A and B are compared, for example, as shown in FIG. 3 (b), they. When the frequencies f1a and f2a of the first spectrum of the above are the same or close to each other within a certain threshold value (f1a≈f2a), the frequency of the first spectrum is used for the respective voice signals A and B in the spectrum
次のステップS10では、中心周波数設定部54により、第1スペクトルの周波数f2aと第2スペクトルの周波数f2bの差異が大きい音声信号Bの音声信号調整部2bの中心周波数feqbを、差異が小さい音声信号Aの音声信号調整部2aの中心周波数feqaに対して、予め設定された閾値以上になるように移動させる。移動の方向はいずれでもよいが、本実施形態では、差異が大きい音声信号Bの音声信号調整部2bの中心周波数feqbを、差異が小さい音声信号Aの音声信号調整部2aの中心周波数feqaから、予め設定された閾値以上離れるように、第2スペクトルの周波数f2b側に移動させる。
In the next step S10, the center
このようにして中心周波数設定部54により設定された移動後の中心周波数feqbは、該当する音声信号Bの音声信号調整部2bに送られる。一方、周波数解析演算部5によって中心周波数feqa,feqnを移動させることがなかった音声信号A,Nについては、音声信号調整部2a,2nに予め設定されている中心周波数feqa,feqnに基づいて、音声調整者や自動音声調整装置によって設定されたパラメータに従って、ゲインの調整などが実行される(ステップS06)。
The moved center frequency pheqb set by the center
前記のステップS06において、各音声信号調整部2a,2bにより音声調整された音声信号は、その後段に設けられた音声信号混合部3によって混合された後(ステップS07)、混合された音声信号は音声信号出力部4からスピーカや録音装置などの外部機器に出力される(ステップS08)。
In step S06, the audio signal adjusted by the audio
[1-3.第1実施形態の効果]
(1)本実施形態における自動音声調整装置によれば、複数の周波数特性が同一又は類似する音声が入力された場合に、ピークの周波数が異なるように音声信号調整部2a,2b,2nの設定を調整するため、音声調整者の熟練度に左右されず、聞き取りやすい音声信号を出力することができる。
[1-3. Effect of the first embodiment]
(1) According to the automatic voice adjusting device in the present embodiment, the voice
(2)本実施形態における自動音声調整装置によれば、差異が大きい音声信号Bの音声信号調整部2bの中心周波数feqbを、差異が小さい音声信号Aの音声信号調整部2aの中心周波数feqaから、予め設定された閾値以上離れるように移動させるので、複数の周波数特性が同一又は類似する音声が入力された場合でも、相互に干渉することがなく、聞き取りやすい音声信号を出力することができる。
(2) According to the automatic voice adjusting device in the present embodiment, the center frequency feqb of the voice signal adjusting unit 2b of the voice signal B having a large difference is derived from the center frequency feqa of the voice
(3)本実施形態における自動音声調整装置によれば、差異が大きい音声信号Bの音声信号調整部2bの中心周波数feqbを、差異が小さい音声信号Aの音声信号調整部2aの中心周波数feqaから、予め設定された閾値以上離れるように、第2スペクトルの周波数f2b側に移動させるので、強調されたスペクトルと第2スペクトルが近接することになり、違和感がなくなり、より聞き取りやすい音声信号を出力することが可能となる。
(3) According to the automatic voice adjusting device in the present embodiment, the center frequency feqb of the voice signal adjusting unit 2b of the voice signal B having a large difference is derived from the center frequency feqa of the voice
(4)本実施形態における自動音声調整装置によれば、周波数解析演算部5は、音声信号調整部2a,2b,2nから出力されたゲインの調整後の各音声信号を入力して、その周波数特性を解析しているため、複数の周波数特性が同一又は類似する音声が入力された場合でも、ピークの周波数が異なるように音声信号調整部2a,2b,2nの設定を移動させている。そのため、音声信号混合部3で音声信号がミックスされる前の状態において、それぞれの音声信号A,B,Nのピークの周波数が異なるよう調整されているため、各音声の干渉や聞き取りが困難になることを防止することができる。
(4) According to the automatic voice adjustment device in the present embodiment, the frequency
[2.第2実施形態]
[2-1.第2実施形態の構成]
以下、本発明の第2実施形態について説明する。第2実施形態の構成は、第1実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、周波数解析演算部5は、任意に選択された複数の音声信号A,B,Nの周波数特性を比較するのではなく、複数の音声信号A,B,Nのうち、ゲインが最大の音声信号と、ゲインが2番目に大きい音声信号を自動で選択し、周波数特性を比較し、解析演算処理を施す点である。
[2. Second Embodiment]
[2-1. Configuration of the second embodiment]
Hereinafter, a second embodiment of the present invention will be described. The configuration of the second embodiment is different from the configuration of the first embodiment in the following points, and is the same in other points. The difference is that the frequency
[2-2.第2実施形態の作用効果]
本実施形態によれば、音声調整者が任意に選択をすることなく、ゲインが最大の音声信号と、ゲインが2番目に大きい音声信号を自動で選択し、周波数特性の調整を施すため、より簡単に音声調整が可能となり、音声調整者の熟練度に左右されず、聞き取りやすい音声信号を出力することができる。
[2-2. Action effect of the second embodiment]
According to the present embodiment, the voice signal having the maximum gain and the voice signal having the second largest gain are automatically selected and the frequency characteristics are adjusted without the voice adjuster making any selection. The voice can be easily adjusted, and an easy-to-hear voice signal can be output regardless of the skill level of the voice adjuster.
[3.他の実施形態]
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。以下は、その一例である。
[3. Other embodiments]
The present invention is not limited to the above embodiment as it is, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof. In addition, various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. Furthermore, components over different embodiments may be combined as appropriate. The following is an example.
(1)周波数解析演算部は、各音声信号の周波数特性のスペクトルの比較結果が同一又は類似する場合に、各音声信号の第2スペクトルの周波数を検出し、第1スペクトルの周波数と第2スペクトルの周波数の差異が小さい音声信号について、音声信号調整部の中心周波数を予め設定された閾値以上になるように移動させることができる。その場合、差異が小さい方の音声信号を処理する音声信号調整部の中心周波数を、第2スペクトルと反対側に移動させてもよい。 (1) The frequency analysis calculation unit detects the frequency of the second spectrum of each voice signal when the comparison results of the frequencies of the frequency characteristics of each voice signal are the same or similar, and the frequency of the first spectrum and the second spectrum. For an audio signal having a small difference in frequency, the center frequency of the audio signal adjusting unit can be moved so as to be equal to or higher than a preset threshold value. In that case, the center frequency of the audio signal adjusting unit that processes the audio signal having the smaller difference may be moved to the side opposite to the second spectrum.
(2)周波数解析演算部に入力する各音声信号としては、各音声信号調整部2a,2b,2nを通過した調整後の音声信号の代わりに、音声信号入力部1a,1b,1nからの調整前の音声信号を使用することができる。
(2) As each audio signal to be input to the frequency analysis calculation unit, adjustment from the audio
(3)音声信号入力部、音声信号調整部は、入力チャンネル数に応じて適宜増減することができる。 (3) The audio signal input unit and the audio signal adjustment unit can be increased or decreased as appropriate according to the number of input channels.
(4)周波数解析演算部の構成は図示のものに限らず、各音声信号調整部内に周波数解析演算部を設けることができる。また、図示の実施形態では、周波数解析演算部で入力された音声信号の周波数特性の比較をしたが、音声信号調整部において周波数特性の比較を行い、周波数解析演算部はその結果に従って、音声信号処理部の中心周波数を予め設定された閾値以上になるように移動させてもよい。 (4) The configuration of the frequency analysis calculation unit is not limited to that shown in the figure, and a frequency analysis calculation unit can be provided in each audio signal adjustment unit. Further, in the illustrated embodiment, the frequency characteristics of the audio signal input by the frequency analysis calculation unit are compared, but the frequency characteristics are compared by the audio signal adjustment unit, and the frequency analysis calculation unit compares the frequency characteristics according to the result. The center frequency of the processing unit may be moved so as to be equal to or higher than a preset threshold value.
(5)閾値の設定部は、音声調整者が手動で設定する以外に、予めプログラムによって閾値を設定することも可能である。例えば、放送内容が複数の出演者が出演する時間帯にのみ本発明の処理を適用し、アナウンサーが1人で話している時間帯では本発明の処理を行わないように設定したり、複数の出演者が出演する主体の時間帯でも出演者の特性に応じて、閾値を自動的に変化させたりするように予め閾値変更用のプログラムを設定しておくこともできる。 (5) The threshold value setting unit can be set in advance by a program in addition to being manually set by the voice coordinator. For example, the processing of the present invention may be applied only to a time zone in which a plurality of performers appear in the broadcast content, and the processing of the present invention may not be performed in a time zone in which the announcer is speaking alone. It is also possible to set a program for changing the threshold in advance so that the threshold is automatically changed according to the characteristics of the performer even in the time zone of the main body in which the performer appears.
(6)音声信号が、男女、人数の増減などによって異なる場合には、例えば、聴感補正フィルタの逆数を手動で設定した閾値に乗じて補正後の閾値を決定するなど、各音声信号の特性に合わせた閾値を設定することで、男性の野太い声や女性の高い声を聞き取りやすくすることも可能である。 (6) When the voice signal differs depending on the gender and the number of people, for example, the inverse number of the hearing correction filter is multiplied by the manually set threshold value to determine the corrected threshold value. By setting a set threshold, it is possible to make it easier to hear the thick voice of men and the high voice of women.
(7)閾値を音声信号入力部ごとに異なる値に設定することもできる。例えば、第1実施形態において、音声信号Aの閾値をバックグラウンドノイズとなる値に設定することにより、音声信号Aで突発的に発生する大きな音声によるノイズの影響をなくすことができ、音声信号B、音声信号Nの音声に対し、効率的にバックグラウンドノイズをマスクことができる。 (7) The threshold value can be set to a different value for each audio signal input unit. For example, in the first embodiment, by setting the threshold value of the voice signal A to a value that becomes background noise, it is possible to eliminate the influence of noise caused by a large voice suddenly generated in the voice signal A, and the voice signal B can be eliminated. , Background noise can be efficiently masked with respect to the voice of the voice signal N.
A,B,N…音声信号
1a,1b,1n…音声信号入力部
2a,2b,2n…音声信号調整部
3…音声信号混合部
4…音声信号出力部
5…周波数解析演算部
51…入力周波数解析部
52…入力周波数比較部
53…スペクトル間隔比較部
54…中心周波数設定部
A, B, N ...
Claims (4)
前記各音声信号入力部から入力された音声信号を、設定された中心周波数に基づいて所定の周波数特性に調整する複数の音声信号調整部と、
任意に選択された複数の前記音声信号の周波数特性を比較し、解析演算処理を施す周波数解析演算部と、
前記各音声信号調整部により調整処理済みの音声信号を混合する音声信号混合部と、
前記音声信号混合部により混合された音声信号を出力する音声信号出力部と、
を備え、
前記周波数解析演算部は、前記各音声信号の周波数特性の比較結果が同一又は類似する場合に、前記音声信号のいずれかについて、その音声信号の周波数特性を調整するために設定された前記音声信号調整部の中心周波数を、その音声信号の第1スペクトルの周波数に対して予め設定された閾値以上になるように移動させることを特徴とする自動音声調整装置。 With multiple audio signal input units,
A plurality of audio signal adjusting units that adjust the audio signal input from each audio signal input unit to a predetermined frequency characteristic based on a set center frequency, and
A frequency analysis calculation unit that compares the frequency characteristics of a plurality of arbitrarily selected audio signals and performs analysis calculation processing, and a frequency analysis calculation unit.
An audio signal mixing unit that mixes audio signals that have been adjusted by each audio signal adjusting unit,
An audio signal output unit that outputs an audio signal mixed by the audio signal mixing unit, and an audio signal output unit.
Equipped with
The frequency analysis calculation unit is set to adjust the frequency characteristics of the audio signal for any of the audio signals when the comparison results of the frequency characteristics of the audio signals are the same or similar. An automatic voice adjustment device characterized in that the center frequency of the adjustment unit is moved so as to be equal to or higher than a preset threshold value with respect to the frequency of the first spectrum of the voice signal.
The wave number analysis calculation unit inputs the adjusted audio signal output from the audio signal adjustment unit, and sets the center frequency of the audio signal adjustment unit set to adjust the frequency characteristics of the audio signal. The automatic audio adjustment device according to any one of claims 1 to 3, wherein the frequency of the first spectrum of the audio signal is moved so as to be equal to or higher than a preset threshold value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020201374A JP2022089106A (en) | 2020-12-03 | 2020-12-03 | Automatic voice adjustment device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020201374A JP2022089106A (en) | 2020-12-03 | 2020-12-03 | Automatic voice adjustment device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022089106A true JP2022089106A (en) | 2022-06-15 |
Family
ID=81988108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020201374A Pending JP2022089106A (en) | 2020-12-03 | 2020-12-03 | Automatic voice adjustment device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022089106A (en) |
-
2020
- 2020-12-03 JP JP2020201374A patent/JP2022089106A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108781331B (en) | Audio enhancement for head mounted speakers | |
US9277322B2 (en) | System for optimizing the perceived sound quality in virtual sound zones | |
US9768751B2 (en) | Audio system including multiband audio dynamics processor | |
EP2052580B1 (en) | A device for and a method of processing an audio signal | |
CN102077609A (en) | Acoustic processing apparatus | |
WO2006051586A1 (en) | Sound electronic circuit and method for adjusting sound level thereof | |
US9386389B2 (en) | Audio signal processing device | |
Matz et al. | New Sonorities for Early Jazz Recordings Using Sound Source Separation and Automatic Mixing Tools. | |
JP2007336118A (en) | Surround producing apparatus | |
CN112995854A (en) | Audio processing method and device and electronic equipment | |
JP2022089106A (en) | Automatic voice adjustment device | |
JP2010212898A (en) | Sound signal processing device and television receiving set | |
KR101405847B1 (en) | Signal Processing Structure for Improving Audio Quality of A Car Audio System | |
KR101821396B1 (en) | Control system of audio mixer by speech recognition | |
US20140376726A1 (en) | Stereo headphone audio process | |
JP5998357B2 (en) | In-vehicle sound playback device | |
US11222649B2 (en) | Mixing apparatus, mixing method, and non-transitory computer-readable recording medium | |
US11877129B2 (en) | Apparatus having an input and an output and having an effect device with volume-regulated audio signals from an audio file | |
JP5289099B2 (en) | Karaoke system with singing volume adjustment function | |
US20140376725A1 (en) | Sound enhancement for powered speakers | |
JP2002101499A (en) | Acoustic reproducing device | |
US20150236664A1 (en) | Sound enhancement for television speakers | |
WO2014130738A1 (en) | Sound enhancement for powered speakers | |
US20040086132A1 (en) | Audio apparatus | |
KR940000106Y1 (en) | Simultaneous treatment circuit for very low frequency and surround sound |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231128 |