JP5948793B2 - Sound processing apparatus, sound processing method and program - Google Patents

Sound processing apparatus, sound processing method and program Download PDF

Info

Publication number
JP5948793B2
JP5948793B2 JP2011240596A JP2011240596A JP5948793B2 JP 5948793 B2 JP5948793 B2 JP 5948793B2 JP 2011240596 A JP2011240596 A JP 2011240596A JP 2011240596 A JP2011240596 A JP 2011240596A JP 5948793 B2 JP5948793 B2 JP 5948793B2
Authority
JP
Japan
Prior art keywords
frames
data
predetermined
additional data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011240596A
Other languages
Japanese (ja)
Other versions
JP2013097202A (en
Inventor
博信 山崎
博信 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011240596A priority Critical patent/JP5948793B2/en
Publication of JP2013097202A publication Critical patent/JP2013097202A/en
Application granted granted Critical
Publication of JP5948793B2 publication Critical patent/JP5948793B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、エコーハイディングされたデータを処理する音処理装置、音処理方法及びプログラムに関する。   The present invention relates to a sound processing apparatus, a sound processing method, and a program for processing echo-hided data.

従来、画像データや音声データに対して、人間が感知しにくい領域に所定データを埋め込むステガノグラフィーという技術がある。所定データは、以下では付加データとも呼ばれる。   Conventionally, there is a technique called steganography in which predetermined data is embedded in an area that is difficult for humans to detect image data and audio data. The predetermined data is also referred to as additional data below.

ステガノグラフィーは、既存の通信路のみで新たに情報を付加することができるため、
著作権保護や秘匿データの送信などに利用されている。
Steganography can add new information only on existing channels,
Used for copyright protection and transmission of confidential data.

例えば、音声データに付加データを付加する手段として、エコーハイディング法がある。この方法は、元の音声データに対し、人間が感知できない程度の遅延時間のエコーをかけ、遅延時間を付加データとして送る手法である。   For example, there is an echo hiding method as means for adding additional data to audio data. This method is a technique in which the original audio data is echoed with a delay time that cannot be detected by humans, and the delay time is sent as additional data.

音声データを受信する受信機側では、音声データのケプストラムを求めると、エコーがかけられた遅延時間のケフレンシーに有意な大きな値が得られ、予め送信側と定めた遅延時間とデータとの対応表から、付加データを再現することができる。   When the receiver that receives the audio data obtains the cepstrum of the audio data, a significant large value is obtained for the delay time quefrency with which the echo is applied, and a correspondence table between the delay time and the data determined as the transmission side in advance. Therefore, the additional data can be reproduced.

ケプストラムとは、フーリエ変換結果を対数変換し、さらにフーリエ変換をかけたもので、音声データのピッチなどを求めるときに使われるデータである。ケプストラムの各要素をケフレンシーと呼び、次元は時間と同じである。   The cepstrum is data obtained by logarithmically transforming a Fourier transform result and further applying a Fourier transform, and is used when obtaining the pitch of audio data. Each element of the cepstrum is called quefrency, and the dimension is the same as time.

エコーハイディング法では、付加データを更新する間隔は既知であるため、この更新タイミングと、音声データの読み出しタイミングとを合わせることで精度よく付加データを抽出することができる。   In the echo hiding method, since the interval for updating the additional data is known, the additional data can be extracted with high accuracy by combining the update timing with the readout timing of the audio data.

例えば、透かしが埋め込まれたセグメントの位相シフトの推定値とこの位相シフトの平均値との距離が所定の閾値以上であるか否かで、セグメントの境界を判定する技術がある   For example, there is a technique for determining a segment boundary based on whether a distance between an estimated value of phase shift of a segment in which a watermark is embedded and an average value of the phase shift is equal to or greater than a predetermined threshold.

特表2009−515371号公報Special table 2009-515371

ここで、エコーハイディング法により、音声データに付加データを連続して付加する場合、音声データが不連続になると音質の劣化が目立つ。そこで、実際は、付加データの更新タイミングでエコーが急に切り替わるのではなく、前のデータのエコーをフェードアウトさせ、次のデータのエコーをフェードインさせて、エコーが徐々に切り替わるようにする。   Here, when the additional data is continuously added to the audio data by the echo hiding method, the deterioration of the sound quality is conspicuous if the audio data becomes discontinuous. Therefore, in practice, the echo is not suddenly switched at the update timing of the additional data, but the echo of the previous data is faded out and the echo of the next data is faded in so that the echo is gradually switched.

この場合、受信装置側で、音声データの読み出しタイミングが、付加データの更新タイミングとずれてしまうと、異なるエコーが付加された音声データのケプストラム計算をすることになり、適切に付加データを抽出することができないという問題点があった。   In this case, when the read timing of the audio data deviates from the update timing of the additional data on the receiving device side, the cepstrum calculation of the audio data to which a different echo is added is performed, and the additional data is appropriately extracted. There was a problem that it was not possible.

そこで、開示の技術は、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる音処理装置、音処理方法及びプログラムを提供することを目的とする。   Therefore, the disclosed technique aims to provide a sound processing device, a sound processing method, and a program capable of improving the extraction accuracy of additional data with respect to the sound data subjected to echo hiding while suppressing the processing amount. To do.

開示の一態様における音処理装置は、所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、前記決定された所定データを出力する出力部と、前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心時刻を求める中心算出部と、求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第1決定部と、決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とを備える。 In a sound processing apparatus according to an aspect of the disclosure, audio data having a length corresponding to the update interval is divided into a plurality of audio data to which predetermined data is added at each update interval based on an echo signal delayed for a predetermined time. Determining whether the number of consecutive frames having the same predetermined data extracted based on the result of cepstrum calculation of each frame is equal to or greater than a predetermined value. of a first determination unit that determines the predetermined data for the update interval, and an output unit for outputting a predetermined data said determined out of the frames, the plurality for a plurality of frames with the same predetermined data continuously is extracted a center calculation unit for determining the center time for the entire frame, by adding the update interval to the center time obtained, the predetermined number used for the extraction of the following additional data Based on the determined cepstrum calculation results for a predetermined number of frames and a first determination unit that determines frames, the most extracted predetermined data is determined, and the most extracted predetermined data is output to the output unit. A second determination unit.

開示の技術によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。   According to the disclosed technology, it is possible to improve the extraction accuracy of additional data for echo-hided audio data while suppressing the processing amount.

実施例1における音処理装置の構成の一例を示すブロック図。1 is a block diagram illustrating an example of a configuration of a sound processing device according to Embodiment 1. FIG. エンコードフレームの一例を示す図。The figure which shows an example of an encoding frame. デコードフレームの一例を示す図。The figure which shows an example of a decoding frame. ケプストラム計算結果の一例を示す図。The figure which shows an example of a cepstrum calculation result. 実施例1における判定部の機能の一例を示すブロック図。FIG. 3 is a block diagram illustrating an example of a function of a determination unit according to the first embodiment. 実施例1における付加データの判定処理を説明するための図。FIG. 5 is a diagram for explaining additional data determination processing according to the first embodiment. 実施例1における音処理装置の処理の一例を示すフローチャート。3 is a flowchart illustrating an example of processing performed by the sound processing apparatus according to the first embodiment. 実施例2における判定部の機能の一例を示すブロック図。FIG. 9 is a block diagram illustrating an example of a function of a determination unit according to the second embodiment. 実施例2における付加データの判定処理を説明するための図。FIG. 10 is a diagram for explaining additional data determination processing according to the second embodiment. 実施例2における音処理装置の処理の一例を示すフローチャート。9 is a flowchart illustrating an example of processing of a sound processing device according to a second embodiment. 実施例3における判定部の機能の一例を示すブロック図。FIG. 10 is a block diagram illustrating an example of a function of a determination unit according to the third embodiment. 実施例3における付加データの判定処理を説明するための図。FIG. 10 is a diagram for explaining additional data determination processing according to the third embodiment. 実施例3における音処理装置の処理の一例を示すフローチャート。9 is a flowchart illustrating an example of processing of a sound processing device according to a third embodiment. 実施例4における音処理装置の構成の一例を示すブロック図。FIG. 10 is a block diagram illustrating an example of a configuration of a sound processing device according to a fourth embodiment. 実施例4における付加データの判定処理を説明するための図。FIG. 10 is a diagram for explaining additional data determination processing according to the fourth embodiment. 実施例4における音処理装置の処理の一例を示すフローチャート。10 is a flowchart illustrating an example of processing of a sound processing device according to a fourth embodiment. 実施例5における携帯端末装置のハードウェアの一例を示すブロック図。FIG. 10 is a block diagram illustrating an example of hardware of a mobile terminal device according to a fifth embodiment.

以下、音声データへの所定の遅延時間のエコーを所定データとして加えることをエンコードと呼び、1つの付加データを埋め込んだ一連の音声データ列をエンコードフレームと呼ぶ。所定データは、前述した通り付加データとも呼ぶ。また、音を受信する音処理装置側で音声データから付加データを抽出することをデコードと呼び、デコードする対象の一連の音声データ列をデコードフレームと呼ぶ。   Hereinafter, adding an echo having a predetermined delay time to audio data as predetermined data is referred to as encoding, and a series of audio data strings in which one additional data is embedded is referred to as an encoding frame. The predetermined data is also called additional data as described above. Further, extracting additional data from audio data on the sound processing device side that receives the sound is called decoding, and a series of audio data strings to be decoded is called a decoding frame.

[実施例1]
<構成>
図1は、実施例1における音処理装置1の構成の一例を示すブロック図である。図1に示す音処理装置1は、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15、判定部16、出力部17を有する。
[Example 1]
<Configuration>
FIG. 1 is a block diagram illustrating an example of the configuration of the sound processing device 1 according to the first embodiment. The sound processing device 1 illustrated in FIG. 1 includes a microphone unit 11, an audio data count unit 12, an audio data storage unit 13, a calculation unit 14, a decoding unit 15, a determination unit 16, and an output unit 17.

マイク部11は、音を電気信号の音声データに変換し、変換された音声データを音声データカウント部12及び音声データ記憶部13に出力する。なお、マイク部11は、音声データを受信する受信部などでもよい。   The microphone unit 11 converts sound into audio data of an electrical signal, and outputs the converted audio data to the audio data count unit 12 and the audio data storage unit 13. The microphone unit 11 may be a receiving unit that receives audio data.

ここで、入力される音には、付加データが付加されているとする。図2は、エンコードフレームの一例を示す図である。図2に示す原信号には、t1間隔で、所定時間遅延されたエコー信号が付加される。この所定時間の違いにより、どのデータが付加されたかを判定することができる。   Here, it is assumed that additional data is added to the input sound. FIG. 2 is a diagram illustrating an example of an encode frame. An echo signal delayed by a predetermined time is added to the original signal shown in FIG. It is possible to determine which data is added based on the difference in the predetermined time.

図2に示す1つのエンコードフレームは、原信号に1つの付加データを示すエコー信号が付加されたフレームである。また、t1間隔毎に、任意のΔtだけ遅延されたエコー信号が付加されることで、t1毎に付加データが1つずつ抽出される。   One encoded frame shown in FIG. 2 is a frame in which an echo signal indicating one additional data is added to the original signal. Further, by adding an echo signal delayed by an arbitrary Δt at every t1 interval, one additional data is extracted every t1.

図1に戻り、音声データカウント部12は、マイク部11から取得した音声データの数をカウントする。このとき、カウントされる音声データは、更新間隔t1が複数に分割されたデコードフレームとする。   Returning to FIG. 1, the audio data counting unit 12 counts the number of audio data acquired from the microphone unit 11. At this time, the audio data to be counted is a decoded frame in which the update interval t1 is divided into a plurality.

図3は、デコードフレームの一例を示す図である。図3に示すように、デコードフレームは、例えば1つのエンコードフレームを複数に分割したうちの1つのフレームである。音声データカウント部12は、このデコードフレームの数が例えば閾値以上になると、計算部14に対し、計算可能なデータが記憶されたことを通知する。閾値は、例えば1つのエンコードフレームに含まれるデコードフレームの数などである。   FIG. 3 is a diagram illustrating an example of a decoded frame. As shown in FIG. 3, the decode frame is, for example, one frame obtained by dividing one encode frame into a plurality of pieces. When the number of decoded frames reaches a threshold value or more, for example, the audio data count unit 12 notifies the calculation unit 14 that data that can be calculated is stored. The threshold is, for example, the number of decoded frames included in one encoded frame.

また、1つのデコードフレームは、例えば数10msec(ミリセック)などであり、また、1つのエンコードフレームは、例えばデコードフレームの16個分などである。デコードフレームのサイズやエンコードフレームのサイズは、あくまでも一例であり、この例に限らない。   Further, one decode frame is, for example, several tens of msec (millisec), and one encode frame is, for example, 16 decode frames. The size of the decode frame and the size of the encode frame are merely examples, and are not limited to this example.

計算部14は、音声データカウント部12から通知を受けると、音声データ記憶部13から音声データを読み出し、デコードフレーム毎にケプストラムを計算する。計算部14は、各デコードフレームのケプストラム計算結果をデコード部15に出力する。   When the calculation unit 14 receives the notification from the audio data count unit 12, the calculation unit 14 reads the audio data from the audio data storage unit 13 and calculates a cepstrum for each decoded frame. The calculation unit 14 outputs the cepstrum calculation result of each decoded frame to the decoding unit 15.

デコード部15は、計算部14から取得したケプストラム計算結果に基づき、ピーク値の間隔に対応する遅延時間を求める。   The decoding unit 15 obtains a delay time corresponding to the peak value interval based on the cepstrum calculation result acquired from the calculation unit 14.

図4は、ケプストラム計算結果の一例を示す図である。図4に示すように、1つのデコードフレームに対して図4に示すようなケプストラム計算結果が得られる。ケフレンシーのピーク値までの間隔がエコー信号の遅延時間に対応する。   FIG. 4 is a diagram illustrating an example of a cepstrum calculation result. As shown in FIG. 4, a cepstrum calculation result as shown in FIG. 4 is obtained for one decoded frame. The interval to the peak value of quefrency corresponds to the delay time of the echo signal.

図1に戻り、デコード部15は、求めた遅延時間に基づいて、付加データにデコードする。デコード部15は、遅延時間と付加データとの対応表を保持し、遅延時間を計算部14から取得する度に付加データにデコードし、付加データを示すデコード結果を判定部16に出力する。よって、デコード部15は、デコードフレーム毎に付加データを抽出することができる。   Returning to FIG. 1, the decoding unit 15 decodes the additional data based on the obtained delay time. The decoding unit 15 holds a correspondence table between the delay time and the additional data, decodes the delay time into additional data every time the delay time is acquired from the calculation unit 14, and outputs a decoding result indicating the additional data to the determination unit 16. Therefore, the decoding unit 15 can extract additional data for each decoded frame.

判定部16は、デコード部15からデコード結果を取得し、デコード結果に基づいて、1つの更新間隔に対して1つの付加データを判定する。付加データの更新間隔は、音処理装置1に予め設定されているとする。ここで、判定部16の詳細は図5を用いて説明する。判定部16は、判定した付加データを出力部17に出力する。   The determination unit 16 acquires a decoding result from the decoding unit 15 and determines one additional data for one update interval based on the decoding result. It is assumed that the update interval of the additional data is preset in the sound processing device 1. Details of the determination unit 16 will be described with reference to FIG. The determination unit 16 outputs the determined additional data to the output unit 17.

出力部17は、判定部16から取得した付加データを後段の処理部に出力する。後段の処理部は、例えば表示部である。これにより、付加データが表示されることで、音声データに付加されていたデータをユーザは把握することができる。   The output unit 17 outputs the additional data acquired from the determination unit 16 to a subsequent processing unit. The subsequent processing unit is, for example, a display unit. Thereby, the user can grasp the data added to the audio data by displaying the additional data.

<判定部の機能>
図5は、実施例1における判定部16の機能の一例を示すブロック図である。図5に示す判定部16は、最初の付加データを判定するための判定部101、2つ目以降の付加データを判定するための判定部102を有する。
<Function of determination unit>
FIG. 5 is a block diagram illustrating an example of the function of the determination unit 16 according to the first embodiment. The determination unit 16 illustrated in FIG. 5 includes a determination unit 101 for determining the first additional data, and a determination unit 102 for determining the second and subsequent additional data.

判定部101は、連続回数カウント部111、付加データ第1判定部112を有する。連続回数カウント部111は、例えば、デコード部15から、最初のエンコードフレーム内にある各デコードフレームのデコード結果を取得し、同じデコード結果(同じ付加データ)が続くデコードフレームの回数をカウントする。連続回数カウント部111は、連続回数を付加データ第1判定部112及び中心算出部121に出力する。   The determination unit 101 includes a continuous count unit 111 and an additional data first determination unit 112. The continuous number counting unit 111 acquires, for example, the decoding result of each decoding frame in the first encoding frame from the decoding unit 15 and counts the number of decoding frames followed by the same decoding result (the same additional data). The continuous number counting unit 111 outputs the continuous number to the additional data first determination unit 112 and the center calculation unit 121.

付加データ第1判定部112は、連続回数カウント部111から取得した連続回数が、所定値以上であるか否かを判定する。ここで、所定値をNとし、Nは、付加データの更新間隔t1に基づいて予め決定される。Nが取りうる最大値は、エンコードフレーム内にあるデコードフレーム数から、データ切替のフェードにかかるフレーム数を除いた数である。よって、Nは、この最大値よりも小さい値とする。   The additional data first determination unit 112 determines whether or not the continuous number obtained from the continuous number counting unit 111 is equal to or greater than a predetermined value. Here, the predetermined value is N, and N is determined in advance based on the update interval t1 of the additional data. The maximum value that N can take is the number obtained by subtracting the number of frames for data switching fade from the number of decoded frames in the encoded frame. Therefore, N is set to a value smaller than this maximum value.

付加データ第1判定部112は、連続回数がN以上である場合、この連続した付加データを、エンコードフレームに付加された所定データと決定する。付加データ第1判定部112は、決定した付加データを出力部17に出力する。   When the number of consecutive times is N or more, the additional data first determination unit 112 determines the continuous additional data as predetermined data added to the encoded frame. The additional data first determination unit 112 outputs the determined additional data to the output unit 17.

これにより、付加データの更新タイミングと、音声データの読み出しタイミングとを調整する必要がなく、読み出しタイミングが予め決められたデコードフレームを用いて適切に付加データを抽出することができる。   Thereby, it is not necessary to adjust the update timing of the additional data and the read timing of the audio data, and the additional data can be appropriately extracted using the decode frame whose read timing is determined in advance.

判定部16は、最初の付加データの判定が終わると、判定部102により、2つ目以降の付加データの判定を行う。よって、2つ目以降のエンコードフレームに対応するデコード部15のデコード結果は、判定部102に入力される。デコード結果の入力の切替については、例えばスイッチなどを用いればよい。   When the determination of the first additional data is completed, the determination unit 16 determines the second and subsequent additional data using the determination unit 102. Therefore, the decoding result of the decoding unit 15 corresponding to the second and subsequent encoded frames is input to the determination unit 102. For switching the decoding result input, for example, a switch or the like may be used.

判定部102は、中心算出部121、第1決定部122、付加データ第2判定部123を有する。中心算出部121は、連続回数カウント部111から取得した連続回数の中心を求める。中心算出部121は、例えば、同じデコード結果が連続したデコードフレームの中心時刻を算出する。中心算出部121は、求めた中心時刻を第1決定部122に出力する。   The determination unit 102 includes a center calculation unit 121, a first determination unit 122, and an additional data second determination unit 123. The center calculation unit 121 obtains the center of the continuous number obtained from the continuous number counting unit 111. For example, the center calculation unit 121 calculates the center time of the decoded frames in which the same decoding result is continuous. The center calculation unit 121 outputs the obtained center time to the first determination unit 122.

第1決定部122は、中心算出部121から取得した中心時刻に付加データの更新間隔を加算していく。第1決定部122は、加算した後の時刻を中心として所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。第1決定部122は、決定した判定位置に含まれる所定数のフレームを、付加データ第2判定部123に通知する。   The first determination unit 122 adds the update interval of the additional data to the center time acquired from the center calculation unit 121. The first determination unit 122 determines a predetermined number of frames centering on the time after the addition as determination positions for subsequent additional data. The predetermined number is N, for example, but is not limited to N, and an appropriate value may be set. The first determination unit 122 notifies the additional data second determination unit 123 of a predetermined number of frames included in the determined determination position.

付加データ第2判定部123は、第1決定部122により決定された判定位置のフレームを用いて、付加データを判定する。付加データ第2判定部122は、所定数のフレームのデコード結果で最も多く抽出された付加データを判定し、最も多く抽出された付加データを前記出力部17に出力する。   The additional data second determination unit 123 determines additional data using the frame at the determination position determined by the first determination unit 122. The additional data second determination unit 122 determines the additional data extracted most from the decoding results of the predetermined number of frames, and outputs the additional data extracted most to the output unit 17.

付加データ第2判定部123は、2つ目以降の付加データの判定については、第1決定部122により決定される判定位置に含まれるフレームを用いる。   The additional data second determination unit 123 uses a frame included in the determination position determined by the first determination unit 122 for determining the second and subsequent additional data.

これにより、2つ目以降の付加データの判定処理については、更新間隔の中心付近のデコードフレームを用いて付加データを判定することができるので、付加データの抽出精度を向上させることができる。また、2つ目以降の付加データの判定処理については、連続回数などをカウントする必要がないため、1つ目の付加データの判定処理よりも処理量を抑えることができる。   As a result, in the second and subsequent additional data determination processing, additional data can be determined using a decode frame near the center of the update interval, so that the accuracy of additional data extraction can be improved. In addition, since it is not necessary to count the number of consecutive times for the second and subsequent additional data determination processing, the processing amount can be reduced compared to the first additional data determination processing.

<付加データ判定処理の例>
次に、実施例1における付加データの判定処理の例について説明する。図6は、実施例1における付加データの判定処理を説明するための図である。図6に示す付加データEn11〜14は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図6に示す例では、付加データBからデコードするとする。
<Example of additional data determination processing>
Next, an example of the additional data determination process in the first embodiment will be described. FIG. 6 is a diagram for explaining the additional data determination processing according to the first embodiment. The additional data En11 to 14 shown in FIG. 6 represent an encoded frame in which the additional data B to E are encoded. In the example shown in FIG. 6, it is assumed that decoding is performed from the additional data B.

図6に示すDen(n=101〜)は、デコードフレームを表す。図6に示す例では、デコード部15によるデコード結果が、De101は「A」、De102〜107は「B」とする。連続回数カウント部111は、De102〜107でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。   Den (n = 101 to) shown in FIG. 6 represents a decoded frame. In the example shown in FIG. 6, it is assumed that the decoding result by the decoding unit 15 is “A” for De101 and “B” for De102 to 107. The continuous number counting unit 111 sets the number of continuous times to 6 because the decoding results are continuous with De 102 to 107 as “B”. Here, the predetermined value N is set to 3, for example.

付加データ第1判定部112は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。   The additional data first determination unit 112 outputs the decoding result “B” to the output unit 17 because the number of consecutive times is equal to or greater than the predetermined value N.

次に、中心算出部121は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe102〜107の中心時刻である。   Next, the center calculation part 121 calculates | requires the center T0 of the continuous frequency 6. FIG. The center T0 is, for example, the center time of the decoded frames De102 to 107.

第1決定部122は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第1決定部122は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。   The first determination unit 122 adds the update interval t1 of the additional data to the center time T0, and calculates the center time T1 of the next frame determination position. The first determination unit 122 determines a predetermined number N of frames centering on a frame including the update interval T1.

付加データ第2判定部123は、時刻T1を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「C」が3つなので、付加データ「C」が出力部17に出力される。   The additional data second determination unit 123 determines the most extracted additional data based on the decoding result of a predetermined number N of frames including the time T1. Here, since the additional data “C” is three, the additional data “C” is output to the output unit 17.

以降の付加データ判定については、第1決定部122は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。付加データ第2判定部123は、時刻T2を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「D」が出力部17に出力される。   For the subsequent additional data determination, the first determination unit 122 adds the update interval t1 to the time T1, and calculates the center time T2 of the next frame determination position. The additional data second determination unit 123 determines the most extracted additional data from the decoding result of the predetermined number N of frames including the time T2. Here, the additional data “D” is output to the output unit 17.

なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部121が算出し、第1決定部122は、中心算出部121から取得した中心時刻を含むフレームを中心とする所定数のフレームを決定するようにしてもよい。   The center calculation unit 121 calculates the center time of a predetermined frame used for determining each additional data, and the first determination unit 122 sets a predetermined number of frames centered on the frame including the center time acquired from the center calculation unit 121. A frame may be determined.

このようにして、最初の付加データの更新間隔の中心時刻T0を推定し、あとは更新間隔t1を加算していけば、更新間隔の中心付近で付加データの判定ができるようになり、付加データを適切に抽出することができる。   In this way, if the center time T0 of the update interval of the first additional data is estimated and then the update interval t1 is added, the additional data can be determined near the center of the update interval, and the additional data Can be appropriately extracted.

<動作>
次に、実施例1における音処理装置1の動作について説明する。図7は、実施例1における音処理装置1の処理の一例を示すフローチャートである。図7に示すステップS101で、マイク部11は、音声データを受信し、音声データカウント部12、音声データ記憶部13に出力する。
<Operation>
Next, the operation of the sound processing apparatus 1 in the first embodiment will be described. FIG. 7 is a flowchart illustrating an example of processing of the sound processing device 1 according to the first embodiment. In step S <b> 101 shown in FIG. 7, the microphone unit 11 receives the audio data and outputs it to the audio data count unit 12 and the audio data storage unit 13.

ステップS102で、音声データカウント部12は、デコードフレームを必要数受信したか否かを判定する。デコードフレームが必要数受信されれば(ステップS102−YES)ステップS103に進み、デコードフレームが必要数受信されなければ(ステップS102−NO)ステップS101に戻る。   In step S102, the audio data count unit 12 determines whether the required number of decoded frames has been received. If the required number of decoded frames has been received (step S102—YES), the process proceeds to step S103. If the required number of decoded frames has not been received (step S102—NO), the process returns to step S101.

ステップS103で、計算部14は、デコードフレーム毎にケプストラムを計算する。計算部14は、ケプストラム計算結果から遅延時間を求め、デコード部15に出力する。   In step S103, the calculation unit 14 calculates a cepstrum for each decoded frame. The calculation unit 14 obtains a delay time from the cepstrum calculation result and outputs it to the decoding unit 15.

ステップS104で、デコード部15は、ケプストラム計算結果からピークを検出し、エコー信号の遅延時間を求める。デコード部15は、求めた遅延時間に対応する付加データを対応表から取得する。対応表には、遅延時間と付加データとが対応付けられている。   In step S104, the decoding unit 15 detects a peak from the cepstrum calculation result and obtains a delay time of the echo signal. The decoding unit 15 acquires additional data corresponding to the obtained delay time from the correspondence table. The correspondence table associates the delay time with the additional data.

ステップS105で、判定部16の連続回数カウント部111は、同じデコード結果となるデコードフレームの連続回数をカウントする。   In step S105, the continuous number counting unit 111 of the determination unit 16 counts the continuous number of decoded frames that are the same decoding result.

ステップS106で、付加データ第1判定部112は、連続回数がN以上であるか否かを判定する。連続回数がN以上であれば(ステップS106−YES)ステップS107に進み、連続回数がN未満であれば(ステップS106−NO)ステップS101に戻る。   In step S106, the additional data first determination unit 112 determines whether or not the number of consecutive times is N or more. If the number of continuous times is N or more (step S106—YES), the process proceeds to step S107. If the number of continuous times is less than N (step S106—NO), the process returns to step S101.

ステップS107で、出力部17は、連続回数がN以上のデコード結果が示す付加データを出力する。   In step S107, the output unit 17 outputs the additional data indicated by the decoding result having the number of consecutive times of N or more.

ステップS108で、中心算出部121及び第1決定部122は、次のデコードフレームの判定位置を決定する。   In step S108, the center calculation unit 121 and the first determination unit 122 determine the determination position of the next decoded frame.

ステップS109で、マイク部11は、音声データを受信し、音声データカウント部12、音声データ記憶部13に出力する。   In step S <b> 109, the microphone unit 11 receives audio data and outputs it to the audio data counting unit 12 and the audio data storage unit 13.

ステップS110で、音声データカウント部12は、デコードフレームを必要数受信したか否かを判定する。デコードフレームが必要数受信されれば(ステップS110−YES)ステップS111に進み、デコードフレームが必要数受信されなければ(ステップS110−NO)ステップS109に戻る。   In step S110, the audio data count unit 12 determines whether the required number of decoded frames has been received. If the required number of decoded frames is received (step S110-YES), the process proceeds to step S111. If the required number of decoded frames is not received (step S110-NO), the process returns to step S109.

ステップS111で、計算部14は、デコードフレーム毎にケプストラムを計算する。計算部14は、ケプストラム計算結果から遅延時間を求め、デコード部15に出力する。   In step S111, the calculation unit 14 calculates a cepstrum for each decoded frame. The calculation unit 14 obtains a delay time from the cepstrum calculation result and outputs it to the decoding unit 15.

ステップS112で、デコード部15は、ケプストラム計算結果からピークを検出し、エコー信号の遅延時間を求める。デコード部15は、求めた遅延時間に対応する付加データを対応表から取得する。対応表には、遅延時間と付加データとが対応付けられている。   In step S112, the decoding unit 15 detects a peak from the cepstrum calculation result, and obtains a delay time of the echo signal. The decoding unit 15 acquires additional data corresponding to the obtained delay time from the correspondence table. The correspondence table associates the delay time with the additional data.

なお、ステップS109〜S112は、説明の都合上ステップS108の後に記載したが、実際は、ステップS101に続いてステップS109で次の音声データが受信され、ステップS110以降の処理が行われている。   Steps S109 to S112 have been described after step S108 for convenience of explanation. Actually, however, the next audio data is received in step S109 following step S101, and the processing after step S110 is performed.

ステップS113で、付加データ第2判定部123は、判定対象のデコード結果であるか否かを判定する。例えば、付加データ第2判定部123は、第1決定部122により決定された判定位置にあるデコードフレームのデコード結果であるかを判定する。デコード結果が判定対象であれば(ステップS113−YES)ステップS114に進み、デコード結果が判定対象でなければ(ステップS113−NO)ステップS109に戻り、次の音声データを受信する。   In step S113, the additional data second determination unit 123 determines whether or not the decoding result is a determination target. For example, the additional data second determination unit 123 determines whether the decoding result of the decoded frame at the determination position determined by the first determination unit 122 is obtained. If the decoding result is a determination target (step S113—YES), the process proceeds to step S114. If the decoding result is not a determination target (step S113—NO), the process returns to step S109, and the next audio data is received.

ステップS114で、付加データ第2判定部123は、判定対象のデコード結果の回数をカウントする。   In step S114, the additional data second determination unit 123 counts the number of decoding results to be determined.

ステップS115で、付加データ第2判定部123は、判定対象のカウント回数がN回であるか否かを判定する。カウント回数がN回であれば(ステップS115−YES)ステップS116に進み、カウント回数がN回でなければ(ステップS115−NO)ステップS109に戻り、次の音声データを受信する。   In step S115, the additional data second determination unit 123 determines whether or not the number of counts to be determined is N. If the number of counts is N (step S115—YES), the process proceeds to step S116. If the number of counts is not N (step S115—NO), the process returns to step S109 to receive the next audio data.

ステップS116で、付加データ第2判定部123は、N個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。   In step S116, the additional data second determination unit 123 determines a majority of the additional data extracted by taking the majority of N decoding results.

ステップS117で、付加データ第2判定部123は、カウントしていた回数をリセットする。   In step S117, the additional data second determination unit 123 resets the counted number.

ステップS117の処理後、ステップS107に進み、出力部17は、多数決の結果である付加データを出力する。   After the processing of step S117, the process proceeds to step S107, and the output unit 17 outputs additional data that is the result of the majority decision.

以降は、ステップS107〜S117の処理を繰り返し、判定された付加データを順に出力していく。   Thereafter, the processing of steps S107 to S117 is repeated, and the determined additional data is output in order.

以上、実施例1によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。   As described above, according to the first embodiment, it is possible to improve the extraction accuracy of additional data with respect to the audio data subjected to echo hiding while suppressing the processing amount.

[実施例2]
次に、実施例2における音処理装置について説明する。実施例2における音処理装置は、最初の付加データが複数のエンコードフレームに連続して付加される場合であっても、付加データを適切に抽出することができる。
[Example 2]
Next, the sound processing apparatus according to the second embodiment will be described. The sound processing apparatus according to the second embodiment can appropriately extract additional data even when the first additional data is continuously added to a plurality of encoded frames.

<構成>
実施例2における音処理装置の構成は、実施例1における音処理装置と同様の構成であるから、その説明を省略する。実施例2における音処理装置の構成を用いる場合は、図1に示す符号と同じ符号を用いて説明する。
<Configuration>
Since the configuration of the sound processing apparatus in the second embodiment is the same as that of the sound processing apparatus in the first embodiment, the description thereof is omitted. In the case of using the configuration of the sound processing apparatus in the second embodiment, description will be made using the same reference numerals as those shown in FIG.

<判定部の機能>
次に、実施例2における判定部16の機能について説明する。図8は、実施例2における判定部16の機能の一例を示すブロック図である。図8に示す判定部16は、最初の付加データを判定するための判定部201、2つ目以降の付加データを判定するための判定部202を有する。
<Function of determination unit>
Next, the function of the determination part 16 in Example 2 is demonstrated. FIG. 8 is a block diagram illustrating an example of the function of the determination unit 16 according to the second embodiment. The determination unit 16 illustrated in FIG. 8 includes a determination unit 201 for determining the first additional data and a determination unit 202 for determining the second and subsequent additional data.

判定部201は、連続回数カウント部211、付加データ第1判定部212を有する。連続回数カウント部211は、実施例1と同様に、デコード部15からのデコード結果を取得し、同じデコード結果が続く回数をカウントする。連続回数カウント部211は、連続回数を付加データ第1判定部212及び中心算出部221に出力する。   The determination unit 201 includes a continuous number counting unit 211 and an additional data first determination unit 212. Similar to the first embodiment, the continuous number counting unit 211 acquires the decoding result from the decoding unit 15 and counts the number of times that the same decoding result continues. The continuous count unit 211 outputs the continuous count to the additional data first determination unit 212 and the center calculation unit 221.

付加データ第1判定部212は、連続回数カウント部211から取得した連続回数が、エンコードフレーム内のデコードフレームの数の所定倍を超えるか否かを判定する。また、付加データ第1判定部212は、連続回数分のデコードフレームの時間が、エンコードフレームの更新間隔の所定倍を超えたか否かを判定してもよい。   The additional data first determination unit 212 determines whether or not the continuous number obtained from the continuous number counting unit 211 exceeds a predetermined multiple of the number of decoded frames in the encoded frame. Further, the additional data first determination unit 212 may determine whether or not the decoding frame time corresponding to the continuous number of times exceeds a predetermined multiple of the encoding frame update interval.

この判定は、1つ目の付加データが連続して複数のエンコードフレームに付加されたか否かを判定するために行う。付加データ第1判定部212は、連続回数が所定倍を超えるとき、(連続回数/エンコードフレームに含まれるデコードフレーム数)又は(連続回数分のデコードフレームの時間/エンコードフレームの更新間隔)の整数値に1を加算した整数値Mを算出する。付加データ第1判定部212は、整数値Mの分だけ、デコード結果が示す付加データを出力部17に出力する。   This determination is performed to determine whether or not the first additional data is continuously added to a plurality of encoded frames. When the number of consecutive times exceeds a predetermined multiple, the additional data first determination unit 212 adjusts (the number of consecutive times / the number of decoded frames included in the encoded frame) or (the time of the decoded frame for the number of consecutive times / the update interval of the encoded frame). An integer value M obtained by adding 1 to the numerical value is calculated. The additional data first determination unit 212 outputs the additional data indicated by the decoding result to the output unit 17 by the integer value M.

付加データ第1判定部212は、連続回数が所定倍を超えないときは、実施例1と同様にして、連続回数が所定値N以上であるか否かを判定する。   When the number of consecutive times does not exceed a predetermined multiple, the additional data first determination unit 212 determines whether or not the number of consecutive times is equal to or greater than a predetermined value N as in the first embodiment.

これにより、最初に判定する付加データが複数のエンコードフレームに連続して付加されている場合でも、付加データを適切に抽出することができる。   Thereby, even when the additional data to be determined first is continuously added to a plurality of encoded frames, the additional data can be appropriately extracted.

判定部16は、最初の付加データの判定が終わると、判定部202により、2つ目以降の付加データの判定を行う。よって、2つ目以降のエンコードフレームに対応するデコード部15のデコード結果は、判定部202に入力される。デコード結果の入力の切替については、例えばスイッチなどを用いればよい。   When the determination of the first additional data is completed, the determination unit 16 determines the second and subsequent additional data using the determination unit 202. Therefore, the decoding result of the decoding unit 15 corresponding to the second and subsequent encoded frames is input to the determination unit 202. For switching the decoding result input, for example, a switch or the like may be used.

判定部202は、中心算出部221、第2決定部222、付加データ第2判定部223を有する。中心算出部221は、連続回数カウント部211から取得した連続回数の中心を求める。中心算出部221は、例えば、同じデコード結果が連続したデコードフレームの中心時刻を算出する。中心算出部221は、求めた中心時刻を第2決定部222に出力する。   The determination unit 202 includes a center calculation unit 221, a second determination unit 222, and an additional data second determination unit 223. The center calculation unit 221 determines the center of the continuous number of times acquired from the continuous number of times counting unit 211. For example, the center calculation unit 221 calculates the center time of the decoded frames in which the same decoding result is continued. The center calculation unit 221 outputs the obtained center time to the second determination unit 222.

第2決定部222は、中心算出部221から取得した中心時刻に付加データの更新間隔を加算していく。第2決定部222は、中心時刻が所定倍を超えたときの中心である場合、Mが奇数の場合、取得した中心は、エンコードフレームの更新間隔の中心付近であると判断し、中心時刻に((M+1)/2)倍の更新間隔を加算した時刻を算出する。   The second determination unit 222 adds the update interval of the additional data to the center time acquired from the center calculation unit 221. When the center time is a center when the center time exceeds a predetermined multiple, and M is an odd number, the second determination unit 222 determines that the acquired center is near the center of the update interval of the encoded frame, and sets the center time as the center time. The time obtained by adding the ((M + 1) / 2) times update interval is calculated.

また、第2決定部222は、Mが偶数の場合、取得した中心は、エンコードフレームの更新タイミング付近であると判断し、この中心に更新間隔の半分を加算して更新間隔の中心付近を求める。第2決定部222は、更新間隔の半分を加算した中心に、さらに(M/2)倍の更新間隔を加算した時刻を算出する。   Further, when M is an even number, the second determination unit 222 determines that the acquired center is near the update timing of the encoded frame, and adds the half of the update interval to this center to obtain the vicinity of the center of the update interval. . The second determination unit 222 calculates a time obtained by adding (M / 2) times the update interval to the center obtained by adding half the update interval.

よって、第2決定部222は、整数値Mが偶数の場合も奇数の場合も、取得した中心に対し、((M+1)/2)倍の更新間隔を加算した時刻を算出する。第2決定部222は、一度((M+1)/2)倍の更新間隔を加算すると、次からは1倍の更新間隔を加算していく。   Therefore, the second determination unit 222 calculates a time obtained by adding an update interval of ((M + 1) / 2) times to the acquired center regardless of whether the integer value M is an even number or an odd number. The second determination unit 222 once adds ((M + 1) / 2) times update intervals, and then adds 1 time update intervals.

第2決定部222は、加算した後の時刻を中心とした所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。第2決定部222は、決定した判定位置に含まれる所定数のフレームを、付加データ第2判定部223に通知する。   The second determination unit 222 determines a predetermined number of frames centered on the time after the addition as determination positions for subsequent additional data. The predetermined number is N, for example, but is not limited to N, and an appropriate value may be set. The second determination unit 222 notifies the additional data second determination unit 223 of the predetermined number of frames included in the determined determination position.

付加データ第2判定部223は、第2決定部222により決定された判定位置のフレームを用いて、付加データを判定する。付加データ第2判定部222は、所定数のフレームのデコード結果で最も多く抽出された付加データを判定し、最も多く抽出された付加データを前記出力部17に出力する。   The additional data second determination unit 223 determines additional data using the frame at the determination position determined by the second determination unit 222. The additional data second determination unit 222 determines the additional data extracted the most from the decoding results of the predetermined number of frames, and outputs the additional data extracted the most to the output unit 17.

付加データ第2判定部223は、2つ目以降の付加データの判定については、第2決定部222により決定される判定位置に含まれるフレームを用いる。   The additional data second determination unit 223 uses a frame included in the determination position determined by the second determination unit 222 for determining the second and subsequent additional data.

これにより、1つ目の付加データが複数のエンコードフレームに連続して付加されている場合でも、2つ目以降の付加データの判定処理を、実施例1と同様に処理量を増やさずに適切に行うことができる。   As a result, even when the first additional data is continuously added to a plurality of encoded frames, the determination of the second and subsequent additional data is appropriately performed without increasing the processing amount as in the first embodiment. Can be done.

<付加データ判定処理の例>
次に、実施例2における付加データの判定処理の例について説明する。図9は、実施例2における付加データの判定処理を説明するための図である。図9に示す付加データEn21〜24は、各付加データB、D、Eがエンコードされたエンコードフレームを表す。図9に示す例では、付加データBからデコードするとする。
<Example of additional data determination processing>
Next, an example of the additional data determination process in the second embodiment will be described. FIG. 9 is a diagram for explaining additional data determination processing according to the second embodiment. The additional data En21 to 24 shown in FIG. 9 represents an encoded frame in which the additional data B, D, and E are encoded. In the example shown in FIG. 9, it is assumed that decoding is performed from the additional data B.

図9に示すDen(n=201〜)は、デコードフレームを表す。図9に示す例では、デコード部15によるデコード結果が、De201は「A」、De202〜214は「B」とする。連続回数カウント部211は、De202〜214でデコード結果が「B」で連続するので、連続回数を12とする。このとき、1つのエンコードフレームに含まれるデコードフレームの数を8とすると、連続回数は、この「8」の数を超えている。   Den (n = 201) shown in FIG. 9 represents a decoded frame. In the example shown in FIG. 9, it is assumed that the decoding result by the decoding unit 15 is “A” for De201 and “B” for De202 to 214. The continuous number counting unit 211 sets the number of continuous times to 12 because the decoding results continue to be “B” in De 202 to 214. At this time, if the number of decode frames included in one encode frame is 8, the number of consecutive times exceeds the number of “8”.

そこで、付加データ第1判定部212は、(12/8)の整数値(商)1に1を加算して整数値M=2を算出する。付加データ第1判定部212は、連続回数8のデコード結果が示す付加データ「B」をM=2回分、出力部17に出力する。   Therefore, the additional data first determination unit 212 calculates the integer value M = 2 by adding 1 to the integer value (quotient) 1 of (12/8). The additional data first determination unit 212 outputs the additional data “B” indicated by the decoding result of 8 consecutive times to the output unit 17 for M = 2 times.

次に、中心算出部221は、連続回数の中心T0を求める。図9に示す中心T0は、M=2であるため、エンコードフレームEn21、En22の更新タイミング付近になる。   Next, the center calculation part 221 calculates | requires the center T0 of continuous frequency | count. The center T0 shown in FIG. 9 is near the update timing of the encode frames En21 and En22 because M = 2.

第2決定部222は、まず、中心時刻T0に付加データの更新間隔の半分(t1/2)を加算し、更新間隔の中心付近を求める。第2決定部222は、次に、この(T0+(t1/2))の時刻に、(M/2)×t1を加算する。つまり、次のフレーム判定位置の中心時刻T1は、次の式を用いて算出される。
T1=T0+((M+1)/2)×t1
第2決定部222は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。
First, the second determination unit 222 adds half (t1 / 2) of the update interval of the additional data to the center time T0 to obtain the vicinity of the center of the update interval. Next, the second determination unit 222 adds (M / 2) × t1 to the time (T0 + (t1 / 2)). That is, the center time T1 of the next frame determination position is calculated using the following equation.
T1 = T0 + ((M + 1) / 2) × t1
The second determination unit 222 determines a predetermined number N of frames centering on the frame including the update interval T1.

付加データ第2判定部223は、時刻T1を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「D」が3つなので、付加データ「D」が出力部17に出力される。   The additional data second determination unit 223 determines the additional data extracted most by the decoding result of the predetermined number N of frames including the time T1. Here, since the additional data “D” is three, the additional data “D” is output to the output unit 17.

以降の付加データ判定については、第2決定部222は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。付加データ第2判定部223は、時刻T2を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「E」が出力部17に出力される。   For the subsequent additional data determination, the second determination unit 222 adds the update interval t1 to the time T1, and calculates the center time T2 of the next frame determination position. The additional data second determination unit 223 determines the additional data extracted most by the decoding result of the predetermined number N of frames including the time T2. Here, the additional data “E” is output to the output unit 17.

なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部221が算出し、第2決定部222は、中心算出部221から取得した中心時刻を含むフレームを中心とする所定数のフレームを決定するようにしてもよい。   The center time of a predetermined frame used for determining each additional data is calculated by the center calculation unit 221, and the second determination unit 222 has a predetermined number of frames centered on the frame including the center time acquired from the center calculation unit 221. A frame may be determined.

これにより、最初の付加データが複数のエンコードフレームに連続して付加された場合でも、付加データの判定に用いる所定数のフレームを適切に決定することができる。   Thereby, even when the first additional data is continuously added to a plurality of encoded frames, the predetermined number of frames used for determination of the additional data can be appropriately determined.

<動作>
次に、実施例2における音処理装置の動作について説明する。図10は、実施例2における音処理装置の処理の一例を示すフローチャートである。図10に示すステップS201〜S206の処理は、図7に示すステップS101〜S106の処理と同様であるため、その説明を省略する。
<Operation>
Next, the operation of the sound processing apparatus according to the second embodiment will be described. FIG. 10 is a flowchart illustrating an example of processing performed by the sound processing apparatus according to the second embodiment. The processing in steps S201 to S206 shown in FIG. 10 is the same as the processing in steps S101 to S106 shown in FIG.

ステップS207で、付加データ第1判定部212は、連続回数分のデコードフレームの時間を、エンコードフレームの更新間隔の整数値M倍に切り上げる。   In step S207, the additional data first determination unit 212 rounds up the decoding frame time corresponding to the continuous number of times to an integer value M times the encoding frame update interval.

ステップS208で、出力部17は、付加データ第1判定部212が判定したM個の付加データを出力する。   In step S208, the output unit 17 outputs the M additional data determined by the additional data first determination unit 212.

ステップS209で、中心算出部221及び第2決定部222は、次のデコードフレームの判定位置を決定する。2つ目の付加データの判定位置は、中心時刻T0+((M+1)/2)×更新間隔t1を中心とする所定数のフレームである。   In step S209, the center calculation unit 221 and the second determination unit 222 determine the determination position of the next decoded frame. The determination position of the second additional data is a predetermined number of frames centered at the central time T0 + ((M + 1) / 2) × update interval t1.

ステップS210〜S218の処理は、図7に示すステップS109〜S117の処理と同様であるため、その説明を省略する。   The processing of steps S210 to S218 is the same as the processing of steps S109 to S117 shown in FIG.

ステップS218の処理後、ステップS208に進み、出力部17は、多数決の結果である付加データを出力する。   After the process of step S218, the process proceeds to step S208, and the output unit 17 outputs additional data that is the result of the majority decision.

以降は、ステップS208〜S218の処理を繰り返し、判定された付加データを順に出力していく。なお、ステップS209で、3つ目以降の付加データを判定する際は、2つ目の付加データに対する中心時刻T1に更新間隔t1を加算していけばよい。   Thereafter, the processing of steps S208 to S218 is repeated, and the determined additional data is output in order. When determining the third and subsequent additional data in step S209, the update interval t1 may be added to the center time T1 for the second additional data.

以上、実施例2によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。また、実施例2によれば、最初の付加データが複数のエンコードフレームに連続して付加される場合であっても、付加データを適切に抽出することができる。   As described above, according to the second embodiment, it is possible to improve the extraction accuracy of the additional data with respect to the audio data subjected to echo hiding while suppressing the processing amount. Further, according to the second embodiment, even when the first additional data is continuously added to a plurality of encoded frames, the additional data can be appropriately extracted.

[実施例3]
次に、実施例3における音処理装置について説明する。実施例3における音処理装置は、2つ目以降の付加データを判定するために用いる中心時刻を修正することができる。
[Example 3]
Next, a sound processing apparatus according to the third embodiment will be described. The sound processing apparatus according to the third embodiment can correct the central time used for determining the second and subsequent additional data.

<構成>
実施例3における音処理装置の構成は、実施例1における音処理装置と同様の構成であるから、その説明を省略する。実施例3における音処理装置の構成を用いる場合は、図1に示す符号と同じ符号を用いて説明する。
<Configuration>
Since the configuration of the sound processing apparatus in the third embodiment is the same as that of the sound processing apparatus in the first embodiment, the description thereof is omitted. When the configuration of the sound processing apparatus in the third embodiment is used, the description will be made using the same reference numerals as those shown in FIG.

<判定部の機能>
次に、実施例3における判定部16の機能について説明する。図11は、実施例3における判定部16の機能の一例を示すブロック図である。図11に示す判定部16は、最初の付加データを判定するための判定部301、2つ目以降の付加データを判定するための判定部302を有する。
<Function of determination unit>
Next, the function of the determination part 16 in Example 3 is demonstrated. FIG. 11 is a block diagram illustrating an example of the function of the determination unit 16 according to the third embodiment. The determination unit 16 illustrated in FIG. 11 includes a determination unit 301 for determining the first additional data, and a determination unit 302 for determining the second and subsequent additional data.

判定部301は、連続回数カウント部311、付加データ第1判定部312を有する。連続回数カウント部311、付加データ第1判定部312は、実施例1に記載の連続回数カウント部111、付加データ第1判定部112と同様であるため、その説明を省略する。   The determination unit 301 includes a continuous number counting unit 311 and an additional data first determination unit 312. Since the continuous number counting unit 311 and the additional data first determination unit 312 are the same as the continuous number counting unit 111 and the additional data first determination unit 112 described in the first embodiment, the description thereof is omitted.

判定部302は、中心算出部321、第3決定部322、付加データ第3判定部323を有する。中心算出部321は、実施例1に記載の中心算出部121と同様であるため、その説明を省略する。   The determination unit 302 includes a center calculation unit 321, a third determination unit 322, and an additional data third determination unit 323. The center calculation unit 321 is the same as the center calculation unit 121 described in the first embodiment, and a description thereof will be omitted.

第3決定部322は、中心算出部321から取得した中心時刻に付加データの更新間隔を加算していく。第3決定部322は、加算した後の時刻を中心として所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。   The third determination unit 322 adds the update interval of the additional data to the center time acquired from the center calculation unit 321. The third determination unit 322 determines a predetermined number of frames centering on the time after the addition as determination positions for subsequent additional data. The predetermined number is N, for example, but is not limited to N, and an appropriate value may be set.

第3決定部322は、決定した所定数のフレームを第1群とし、この第1群を、1つのデコードフレーム分、前にずらしたデコードフレームの群を第2群とし、第1群を、1つのデコードフレーム分、後にずらしたデコードフレームの群を第3群とする。   The third determining unit 322 sets the determined predetermined number of frames as the first group, sets the first group as one decoded frame, sets the group of decoded frames shifted forward as the second group, and sets the first group as A group of decode frames shifted later by one decode frame is defined as a third group.

第3決定部322は、決定した所定数のフレームの3つの群を、付加データ第3判定部323に通知する。なお、群の数は3つに限らない。   The third determination unit 322 notifies the additional data third determination unit 323 of the determined three groups of the predetermined number of frames. Note that the number of groups is not limited to three.

付加データ第3判定部323は、第3決定部322により決定された3つの郡の判定位置のフレームを用いて、付加データを判定する。付加データ第3判定部323は、それぞれの群で、所定数のフレームのデコード結果で最も多く抽出された付加データを判定する。   The additional data third determination unit 323 determines additional data using the frames at the determination positions of the three counties determined by the third determination unit 322. The additional data third determination unit 323 determines additional data extracted most by decoding results of a predetermined number of frames in each group.

付加データ第3判定部323は、この3つの群で、同じ付加データの抽出数で多数決をとる。付加データ第3判定部323は、抽出数が一番多い付加データを出力部17に出力する。付加データ第3判定部323は、同じ付加データの抽出数が一番多い群の中に、第1群が含まれていれば、第1群の中心時刻を基準として以降の付加データの判定位置を決定させる。   The additional data third determination unit 323 decides the majority of the three groups with the same number of additional data extracted. The additional data third determination unit 323 outputs the additional data having the largest number of extractions to the output unit 17. If the first group is included in the group having the largest number of extractions of the same additional data, the additional data third determination unit 323 determines the subsequent additional data determination position based on the central time of the first group. Let me decide.

付加データ第3判定部323は、同じ付加データの抽出数が一番多い群の中に、第1群が含まれない場合、抽出数が一番多い郡の中心時刻を以降の付加データの判定位置の基準とするよう、第3決定部322に通知する。なお、付加データ第3判定部323は、第2群と第3群の両方で抽出数が一番多い場合、予め設定しておいたいずれかの群の中心時刻を用いればよい。   If the first group is not included in the group with the largest number of extractions of the same additional data, the additional data third determination unit 323 determines the center time of the county with the largest number of extractions as subsequent additional data. The third determination unit 322 is notified so that the position is used as a reference. Note that the additional data third determination unit 323 may use the central time of one of the groups set in advance when the number of extractions is the largest in both the second group and the third group.

これにより、付加データの判定に用いる中心時刻を修正することができる。この修正は、実際のエンコードフレームの中心時刻と、判定された中心時刻との間に少しのズレがあるので、このズレが蓄積されるのを防ぐのに役立つ。   Thereby, the center time used for determination of additional data can be corrected. This correction is useful for preventing this deviation from accumulating because there is a slight deviation between the center time of the actual encoding frame and the determined center time.

<付加データ判定処理の例>
次に、実施例3における付加データの判定処理の例について説明する。図12は、実施例3における付加データの判定処理を説明するための図である。図12に示す付加データEn31〜34は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図12に示す例では、付加データBからデコードするとする。
<Example of additional data determination processing>
Next, an example of the additional data determination process in the third embodiment will be described. FIG. 12 is a diagram for explaining the additional data determination process according to the third embodiment. Additional data En31 to 34 shown in FIG. 12 represents an encoded frame in which each additional data B to E is encoded. In the example shown in FIG. 12, it is assumed that the additional data B is decoded.

図12に示すDen(n=301〜)は、デコードフレームを表す。図12に示す例では、デコード部15によるデコード結果が、例えばDe301は「A」、De302〜307は「B」とする。連続回数カウント部311は、De302〜307でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。   Den (n = 301 to) shown in FIG. 12 represents a decoded frame. In the example illustrated in FIG. 12, the decoding result by the decoding unit 15 is, for example, that De301 is “A” and De302 to 307 are “B”. The continuous number counting unit 311 sets the number of continuous times to 6 because the decoding results continue to be “B” in De 302 to 307. Here, the predetermined value N is set to 3, for example.

付加データ第1判定部312は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。   The additional data first determination unit 312 outputs the decoding result “B” to the output unit 17 because the number of consecutive times is equal to or greater than the predetermined value N.

次に、中心算出部321は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe302〜307の中心時刻である。   Next, the center calculation part 321 calculates | requires the center T0 of the continuous frequency 6. FIG. The center T0 is, for example, the center time of the decode frames De302 to 307.

第3決定部322は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第3決定部322は、更新間隔T1を含むフレームを中心に所定数Nのフレームを第1群として決定する。   The third determination unit 322 adds the update interval t1 of the additional data to the center time T0, and calculates the center time T1 of the next frame determination position. The third determination unit 322 determines a predetermined number N frames as the first group around the frame including the update interval T1.

第3決定部322は、第1群から1デコードフレーム前にずらした第2群、第1群から1デコードフレーム後にずらした第3群を決定する。例えば、図12に示す例では、De310〜312が第1群、De309〜311が第2群、De311〜313が第3群となる。   The third determining unit 322 determines the second group shifted from the first group by one decoded frame and the third group shifted from the first group by one decoded frame. For example, in the example shown in FIG. 12, De310 to 312 are the first group, De309 to 311 are the second group, and De311 to 313 are the third group.

付加データ第3判定部323は、群毎に、所定数Nのフレームのデコード結果で、多数決をとる。例えば、付加データ第3判定部323は、同じ付加データの抽出数を用いて判定する。ここでは、いずれの群も付加データ「C」が3つずつ抽出されるので、付加データ「C」が出力部17に出力される。   The additional data third determination unit 323 determines a majority by decoding the predetermined number N of frames for each group. For example, the additional data third determination unit 323 determines using the same number of additional data extracted. Here, since the additional data “C” is extracted three by three in any group, the additional data “C” is output to the output unit 17.

以降の付加データ判定については、第3決定部322は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。第3決定部322は、中心時刻T2に基づき、第1群〜第3群のフレームを決定する。   For the subsequent additional data determination, the third determination unit 322 adds the update interval t1 to the time T1, and calculates the center time T2 of the next frame determination position. The third determination unit 322 determines the frames of the first group to the third group based on the central time T2.

付加データ第3判定部323は、第3群で、付加データ「D」が3つ抽出されるので、付加データ「D」を判定し、出力部17に出力する。ここでは、第3群の付加データ「D」の抽出数「3」が、第1群の付加データ「D」の抽出数「2」、第2群の付加データ「C」の抽出数「2」よりも大きい。   The additional data third determination unit 323 determines the additional data “D” and outputs it to the output unit 17 because three additional data “D” are extracted from the third group. Here, the extraction number “3” of the additional data “D” of the third group is the extraction number “2” of the additional data “D” of the first group, and the extraction number “2” of the additional data “C” of the second group. Is bigger than

よって、付加データ第3判定部323は、第3群の所定数のデコードフレームの中心を、中心時刻T2’とし、第3決定部322に通知する。第3決定部322は、中心時刻T2’を取得すると、このT2’に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T3を算出する。   Therefore, the additional data third determination unit 323 notifies the third determination unit 322 of the center of the predetermined number of decode frames in the third group as the center time T2 '. Upon obtaining the center time T2 ', the third determination unit 322 adds the update interval t1 to T2' and calculates the center time T3 of the next frame determination position.

なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部321が算出し、第3決定部322は、中心算出部321から取得した中心時刻に基づき、各群の所定数のフレームを決定するようにしてもよい。   The center calculation unit 321 calculates the center time of a predetermined frame used for determining each additional data, and the third determination unit 322 determines the predetermined number of frames of each group based on the center time acquired from the center calculation unit 321. May be determined.

これにより、2つ目以降の付加データの判定において、中心時刻を修正することができ、より適切な付加データを抽出することができる。   Thereby, in the determination of the second and subsequent additional data, the center time can be corrected, and more appropriate additional data can be extracted.

<動作>
次に、実施例3における音処理装置の動作について説明する。図13は、実施例3における音処理装置の処理の一例を示すフローチャートである。図13に示すステップS301〜S314の処理は、図7に示すステップS101〜S114の処理と同様であるため、その説明を省略する。
<Operation>
Next, the operation of the sound processing apparatus according to the third embodiment will be described. FIG. 13 is a flowchart illustrating an example of processing performed by the sound processing apparatus according to the third embodiment. The processes in steps S301 to S314 shown in FIG. 13 are the same as the processes in steps S101 to S114 shown in FIG.

ステップS315で、付加データ第3判定部323は、判定対象のカウント回数がN+2回であるか否かを判定する。カウント回数がN+2回であれば(ステップS315−YES)ステップS316に進み、カウント回数がN+2回でなければ(ステップS315−NO)ステップS309に戻り、次の音声データを受信する。   In step S315, the additional data third determination unit 323 determines whether or not the number of counts to be determined is N + 2. If the number of counts is N + 2 (step S315—YES), the process proceeds to step S316, and if the number of counts is not N + 2 (step S315—NO), the process returns to step S309 to receive the next audio data.

ステップS316で、付加データ第3判定部323は、第1群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。   In step S316, the additional data third determination unit 323 determines the majority of the additional data extracted by taking the majority of the N decoding results of the first group.

ステップS317で、付加データ第3判定部323は、第2群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。   In step S317, the additional data third determination unit 323 determines the majority of additional data extracted by taking the majority of the N decoding results of the second group.

ステップS318で、付加データ第3判定部323は、第3群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。   In step S318, the additional data third determination unit 323 determines the majority of the additional data extracted by taking the majority of the N decoding results of the third group.

ステップS319で、付加データ第3判定部323は、同じ付加データの抽出数が最も多い群を判定する。付加データ第3判定部323は、判定した群の最も多く抽出された付加データを出力部17に出力する。   In step S319, the additional data third determination unit 323 determines the group having the largest number of extractions of the same additional data. The additional data third determination unit 323 outputs the additional data extracted most in the determined group to the output unit 17.

ステップS320で、付加データ第3判定部323は、カウントしていた回数をリセットする。   In step S320, the additional data third determination unit 323 resets the counted number.

ステップS320の処理後、ステップS307に進み、出力部17は、多数決の結果である付加データを出力する。   After the process of step S320, the process proceeds to step S307, and the output unit 17 outputs additional data that is the result of the majority decision.

以降は、ステップS307〜S320の処理を繰り返し、判定された付加データを順に出力していく。なお、ステップS308で、3つ目以降の付加データを判定する際は、ステップS319で決定された群の中心時刻に対して更新間隔t1を加算していけばよい。   Thereafter, the processes in steps S307 to S320 are repeated, and the determined additional data is output in order. When determining the third and subsequent additional data in step S308, the update interval t1 may be added to the central time of the group determined in step S319.

以上、実施例3によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。また、2つ目以降の付加データの判定に用いる中心時刻を修正することができ、付加データの抽出精度をさらに向上させることができる。   As described above, according to the third embodiment, it is possible to improve the extraction accuracy of the additional data with respect to the audio data subjected to echo hiding while suppressing the processing amount. In addition, the central time used for determining the second and subsequent additional data can be corrected, and the additional data extraction accuracy can be further improved.

[実施例4]
次に、実施例4における音処理装置4について説明する。実施例4における音処理装置4は、付加データの判定に用いる音声データのみを取得するようにして、省電力を実現する。
[Example 4]
Next, the sound processing device 4 according to the fourth embodiment will be described. The sound processing device 4 according to the fourth embodiment achieves power saving by acquiring only audio data used for determination of additional data.

<構成>
図14は、実施例4における音処理装置4の構成の一例を示すブロック図である。図14に示す構成で、図1に示す構成と同様のものは同じ符号を付し、その説明を省略する。
<Configuration>
FIG. 14 is a block diagram illustrating an example of the configuration of the sound processing device 4 according to the fourth embodiment. In the configuration illustrated in FIG. 14, the same components as those illustrated in FIG. 1 are denoted by the same reference numerals, and description thereof is omitted.

判定部21は、付加データの判定が終わると、電源制御部22に電源切断を通知する。また、判定部21は、次の付加データの判定に用いるデコードフレームの読み込み開始時刻までの時間をタイマ部23に設定する。   When the determination of the additional data is completed, the determination unit 21 notifies the power control unit 22 of power off. Further, the determination unit 21 sets the time until the decode frame reading start time used for determination of the next additional data in the timer unit 23.

電源制御部22は、判定部21から電源切断を通知されると、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15に対して電源を切断する。   When the power control unit 22 is notified of the power off from the determination unit 21, the power control unit 22 turns off the power to the microphone unit 11, the audio data count unit 12, the audio data storage unit 13, the calculation unit 14, and the decoding unit 15.

また、電源制御部22は、タイマ部23から電源供給の指示を通知されると、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15に対して電源を供給する。よって、電源制御部22は、音声データの読み込み処理を含む各部の処理を行わせないようにする制御機能を有する。   When the power supply control unit 22 is notified of the power supply instruction from the timer unit 23, the power supply control unit 22 supplies power to the microphone unit 11, the audio data count unit 12, the audio data storage unit 13, the calculation unit 14, and the decoding unit 15. Supply. Therefore, the power supply control unit 22 has a control function that prevents the processing of each unit including the audio data reading processing from being performed.

タイマ部23は、時計を内蔵しており、判定部21から通知された時間が経過したら電源制御部22に対して電源供給を指示する。   The timer unit 23 has a built-in clock, and instructs the power supply control unit 22 to supply power when the time notified from the determination unit 21 has elapsed.

<判定部の機能>
実施例4における判定部21は、前述した以外の機能は、実施例1〜3のいずれかの機能を有していればよい。判定部21は、実施例1〜3のいずれかを用いて、次の付加データの判定に用いるデコードフレームの読み込み開始時刻までの時間を算出し、この時間をタイマ部23に通知する。
<Function of determination unit>
The determination part 21 in Example 4 should just have the function in any one of Examples 1-3 except the function mentioned above. The determination unit 21 uses any one of the first to third embodiments to calculate the time until the decode frame reading start time used for determination of the next additional data, and notifies the timer unit 23 of this time.

これにより、付加データを判定するデコードフレームのみを処理すればよいので、電力消費を抑えることができる。   As a result, only the decode frame for determining the additional data needs to be processed, so that power consumption can be suppressed.

<付加データ判定処理の例>
次に、実施例4における付加データの判定処理の例について説明する。図15は、実施例4における付加データの判定処理を説明するための図である。なお、図15に示す例では、判定部21の判定処理として実施例1で説明した図5の符号を用いて説明する。
<Example of additional data determination processing>
Next, an example of additional data determination processing according to the fourth embodiment will be described. FIG. 15 is a diagram for explaining additional data determination processing according to the fourth embodiment. In the example illustrated in FIG. 15, the determination process of the determination unit 21 will be described using the reference numerals in FIG. 5 described in the first embodiment.

図15に示す付加データEn41〜44は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図15に示す例では、付加データBからデコードするとする。   Additional data En41 to 44 shown in FIG. 15 represents an encoded frame in which each additional data B to E is encoded. In the example shown in FIG. 15, it is assumed that the additional data B is decoded.

図15に示すDen(n=401〜)は、デコードフレームを表す。図15に示す例では、デコード部15によるデコード結果が、De401は「A」、De402〜407は「B」とする。連続回数カウント部111は、De402〜407でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。   Den (n = 401 to) shown in FIG. 15 represents a decoded frame. In the example illustrated in FIG. 15, it is assumed that the decoding result by the decoding unit 15 is “A” for De 401 and “B” for De 402 to 407. The continuous number counting unit 111 sets the number of continuous times to 6 because the decoding results are continuous with “B” in De 402 to 407. Here, the predetermined value N is set to 3, for example.

付加データ第1判定部112は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。   The additional data first determination unit 112 outputs the decoding result “B” to the output unit 17 because the number of consecutive times is equal to or greater than the predetermined value N.

次に、中心算出部121は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe402〜407の中心時刻である。   Next, the center calculation part 121 calculates | requires the center T0 of the continuous frequency 6. FIG. The center T0 is, for example, the center time of the decode frames De402 to 407.

第1決定部122は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第1決定部122は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。判定部21は、De408のデコードフレームの判定処理が終了すると、電源制御部22に電源切断を通知する。また、判定部21は、De409のデコードフレームを読み込む開始時刻までの時間をタイマ部23に設定する。判定部21は、以降も同様の処理を行い、電源制御部22への電源切断の通知と、タイマ部23への時間の設定を行う。   The first determination unit 122 adds the update interval t1 of the additional data to the center time T0, and calculates the center time T1 of the next frame determination position. The first determination unit 122 determines a predetermined number N of frames centering on a frame including the update interval T1. The determination unit 21 notifies the power supply control unit 22 of power-off when the determination processing of the De408 decode frame is completed. Also, the determination unit 21 sets the time until the start time for reading the De409 decode frame in the timer unit 23. The determination unit 21 performs the same processing thereafter, and notifies the power supply control unit 22 of power-off and sets the time to the timer unit 23.

これにより、次の付加データの判定において、De409〜411のデコードフレーム以外のデコードフレームについて音声データについては処理されず、省電力を実現できる。   Thereby, in the determination of the next additional data, the audio data is not processed for the decoded frames other than the decoded frames of De409 to 411, and power saving can be realized.

<動作>
次に、実施例4における音処理装置1の動作について説明する。図16は、実施例4における音処理装置4の処理の一例を示すフローチャートである。なお、図16に示す処理は、実施例1の判定処理を行う場合の処理である。
<Operation>
Next, the operation of the sound processing apparatus 1 in the fourth embodiment will be described. FIG. 16 is a flowchart illustrating an example of processing of the sound processing device 4 according to the fourth embodiment. Note that the process shown in FIG. 16 is a process when the determination process of the first embodiment is performed.

図16に示すステップS401〜S408の処理は、図7に示すステップS101〜S108の処理と同様であるため、その説明を省略する。   The processes in steps S401 to S408 shown in FIG. 16 are the same as the processes in steps S101 to S108 shown in FIG.

ステップS409で、判定部21は、現在の時刻から次のデコードフレームの読み込み開始時刻までの時間を算出し、タイマ部23に設定する。   In step S409, the determination unit 21 calculates the time from the current time to the reading start time of the next decoded frame, and sets the time in the timer unit 23.

ステップS410で、判定部21は、電源制御部22に対し、電源切断を通知する。これにより、各部の不要な電源を切断することができる。   In step S410, the determination unit 21 notifies the power control unit 22 of power off. Thereby, the unnecessary power supply of each part can be cut | disconnected.

ステップS411で、タイマ部23は、設定された時間が経過したか否かを判定する。設定時間が経過すれば(ステップS411−YES)ステップS412に進み、設定時間が経過していなければ(ステップS411−NO)ステップS411に戻る。   In step S411, the timer unit 23 determines whether the set time has elapsed. If the set time has elapsed (step S411-YES), the process proceeds to step S412. If the set time has not elapsed (step S411-NO), the process returns to step S411.

ステップS412で、電源制御部22は、電源を切断した各部に対し、電源供給を開始する。これにより、付加データの判定処理が再開する。   In step S <b> 412, the power supply control unit 22 starts supplying power to each unit that has been turned off. As a result, the additional data determination process resumes.

ステップS413〜S420の処理は、図1に示すS109〜S117の処理と同様であるため、その説明を省略する。   The processing in steps S413 to S420 is the same as the processing in S109 to S117 shown in FIG.

以上、実施例4によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させ、かつ、電力消費を抑えることができる。   As described above, according to the fourth embodiment, it is possible to improve the extraction accuracy of additional data and reduce power consumption with respect to the audio data subjected to echo hiding while suppressing the processing amount.

[実施例5]
図17は、実施例5における携帯端末装置5のハードウェアの一例を示すブロック図である。携帯端末装置5は、アンテナ501、無線部502、ベースバンド処理部503、制御部504、端末インタフェース部505、主記憶部506、補助記憶部507、マイク508、表示部509を有する。
[Example 5]
FIG. 17 is a block diagram illustrating an example of hardware of the mobile terminal device 5 according to the fifth embodiment. The mobile terminal device 5 includes an antenna 501, a wireless unit 502, a baseband processing unit 503, a control unit 504, a terminal interface unit 505, a main storage unit 506, an auxiliary storage unit 507, a microphone 508, and a display unit 509.

アンテナ501は、送信アンプで増幅された無線信号を送信し、また、基地局から無線信号を受信する。無線部502は、ベースバンド処理部503で拡散された送信信号をD/A変換し、直交変調により高周波信号に変換し、その信号を電力増幅器により増幅する。無線部702は、受信した無線信号を増幅し、その信号をA/D変換してベースバンド処理部703に伝送する。   The antenna 501 transmits the radio signal amplified by the transmission amplifier and receives the radio signal from the base station. Radio section 502 performs D / A conversion on the transmission signal spread by baseband processing section 503, converts it to a high-frequency signal by orthogonal modulation, and amplifies the signal by a power amplifier. Radio section 702 amplifies the received radio signal, A / D converts the signal, and transmits the signal to baseband processing section 703.

ベースバンド部503は、送信データの誤り訂正符号の追加、データ変調、拡散変調、受信信号の逆拡散、受信環境の判定、各チャネル信号の閾値判定、誤り訂正復号などのベースバンド処理などを行う。   The baseband unit 503 performs baseband processing such as addition of an error correction code of transmission data, data modulation, spread modulation, despreading of a received signal, determination of a reception environment, threshold determination of each channel signal, error correction decoding, and the like. .

制御部504は、制御信号の送受信などの無線制御を行う。また、制御部504は、補助記憶部507などに記憶されている音処理プログラムを実行し、各実施例で説明した音処理を行う。   The control unit 504 performs wireless control such as transmission / reception of control signals. Further, the control unit 504 executes a sound processing program stored in the auxiliary storage unit 507 or the like, and performs the sound processing described in each embodiment.

端末インタフェース部505は、データ用アダプタ処理、ハンドセットおよび外部データ端末とのインタフェース処理を行う。   The terminal interface unit 505 performs data adapter processing, interface processing with a handset, and an external data terminal.

主記憶部506は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部504が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。   The main storage unit 506 is a ROM (Read Only Memory), a RAM (Random Access Memory) or the like, and stores or temporarily stores programs and data such as an OS (Operating System) and application software which are basic software executed by the control unit 504. It is a storage device to save.

補助記憶部507は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。補助記憶部507は、前述した音処理プログラムを記憶する。   The auxiliary storage unit 507 is an HDD (Hard Disk Drive) or the like, and is a storage device that stores data related to application software or the like. The auxiliary storage unit 507 stores the above-described sound processing program.

マイク508は、付加データが付加されたアナウンスなどを電気信号の音声データに変換する。表示部509は、例えば、LCD(Liquid Crystal Display)等であり、制御部504から入力される表示データに応じた表示が行われる。表示部509は、例えば、抽出された付加データを表示する。   The microphone 508 converts the announcement added with the additional data into audio data of an electrical signal. The display unit 509 is, for example, an LCD (Liquid Crystal Display) or the like, and performs display according to display data input from the control unit 504. For example, the display unit 509 displays the extracted additional data.

また、各実施例の音処理装置のマイク部11と音声データ記憶部13以外の各部の機能は、例えば制御部504、及びワークメモリとしての主記憶部506により実現されうる。音声データ記憶部13は、例えば主記憶部506などにより実現されうる。マイク部11は、例えばマイク508などにより実現されうる。   The functions of the units other than the microphone unit 11 and the audio data storage unit 13 of the sound processing apparatus of each embodiment can be realized by, for example, the control unit 504 and the main storage unit 506 as a work memory. The audio data storage unit 13 can be realized by the main storage unit 506, for example. The microphone unit 11 can be realized by a microphone 508, for example.

なお、各実施例における音処理装置の各部の一部をハードウェアで実装し、その他のソフトウェアで実装してもよい。例えば、マイク部11、デコード部15、音声データ記憶部13などをハードウェアで実装し、その他をソフトウェアで実装してもよい。   In addition, a part of each part of the sound processing apparatus in each embodiment may be implemented by hardware and may be implemented by other software. For example, the microphone unit 11, the decoding unit 15, the audio data storage unit 13, and the like may be implemented by hardware, and the others may be implemented by software.

以上、実施例5によれば、携帯端末装置5において、実施例1〜4での付加データ判定処理を行うことができる。   As described above, according to the fifth embodiment, the mobile terminal device 5 can perform the additional data determination process in the first to fourth embodiments.

また、開示の技術は、携帯端末装置5に限らず、他の機器にも実装することができる。例えば、前述した音処理装置は、付加データが付加された音声データを入力するマイクや受信部と制御部とを有する処理装置であれば適用可能である。   In addition, the disclosed technology can be implemented not only in the mobile terminal device 5 but also in other devices. For example, the sound processing apparatus described above can be applied to any processing apparatus having a microphone, a receiving unit, and a control unit for inputting audio data to which additional data is added.

また、前述した各実施例で説明した音処理を実現するためのプログラムを記録媒体に記録することで、各実施例での音処理をコンピュータに実施させることができる。   Further, by recording a program for realizing the sound processing described in each of the above-described embodiments on a recording medium, the sound processing in each of the embodiments can be performed by a computer.

また、このプログラムを記録媒体に記録し、このプログラムが記録された記録媒体をコンピュータや携帯端末装置に読み取らせて、前述した音処理を実現させることも可能である。なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。記録媒体は、搬送波を含まない。   It is also possible to record the program on a recording medium and cause the computer or portable terminal device to read the recording medium on which the program is recorded to realize the above-described sound processing. The recording medium is a recording medium for recording information optically, electrically or magnetically, such as a CD-ROM, flexible disk, magneto-optical disk, etc., and information is electrically recorded such as ROM, flash memory, etc. Various types of recording media such as a semiconductor memory can be used. The recording medium does not include a carrier wave.

なお、上記各実施例で説明した装置は、例えば、電車の車内アナウンスに、アナウンスと同じ内容を付加データで付加し、耳の不自由な人が、付加データが示すアナウンスを表示部に表示する際に用いられる。これにより、各実施例の装置は、アナウンスの内容を知ることなどに適用することができる。   The devices described in the above embodiments, for example, add the same contents as the announcement to the in-car announcement in the train as additional data, and a person with hearing impairment displays the announcement indicated by the additional data on the display unit. Used when. Thereby, the apparatus of each embodiment can be applied to knowing the contents of the announcement.

以上、実施例について詳述したが、上記の各実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。また、前述した各実施例同士を組み合わせたりすることもできる。   Although the embodiments have been described in detail, the present invention is not limited to the above-described embodiments, and various modifications and changes can be made within the scope described in the claims. It is also possible to combine all or a plurality of the components of the above-described embodiments. Moreover, the embodiments described above can be combined.

なお、以上の実施例に関し、さらに以下の付記を開示する。
(付記1)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、
を備える音処理装置。
(付記2)
連続して同じ所定データが抽出されるフレームの中心時刻を求める中心算出部と、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第1決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える付記1記載の音処理装置。
(付記3)
前記第1判定部は、
連続して同じ所定データが抽出されるフレームの時間が前記更新間隔の所定倍を超える場合、前記所定倍に1を加算した整数値の数だけ、該所定データを前記出力部に出力する付記1記載の音処理装置。
(付記4)
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔の(前記整数値+1)/2倍を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第2決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える付記3記載の音処理装置。
(付記5)
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームの群を複数決定する第3決定部と、
決定された各群で所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第3判定部とをさらに備え、
前記中心算出部は、
前記所定データが最も多く抽出された群のフレームの中心を求める付記1記載の音処理装置。
(付記6)
前記次の付加データの抽出に用いる所定数のフレーム以外のフレームでは、前記音声データの読み込みを行わないよう制御する制御部をさらに備える付記2、4及び5いずれか一項に記載の音処理装置。
(付記7)
前記エコー信号は、前記更新間隔の前後でフェードイン、フェードアウトされ、
前記所定値は、前記更新間隔から前記フェードイン及び前記フェードアウトされる時間を除いた時間に対するデコードフレームの数に基づいて決定される付記1乃至6いずれか一項に記載の音処理装置。
(付記8)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータが実行する音処理方法。
(付記9)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータに実行させるためのプログラム。
In addition, the following additional remarks are disclosed regarding the above Example.
(Appendix 1)
A calculation for performing cepstrum calculation on each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed by a predetermined time And
A first determination unit that determines whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determines predetermined data for one update interval When,
An output unit for outputting the determined predetermined data;
A sound processing apparatus comprising:
(Appendix 2)
A center calculation unit for obtaining a center time of frames from which the same predetermined data is extracted continuously;
A first determination unit that adds the update interval to the determined central time and determines a predetermined number of frames used for extraction of the next additional data;
Appendix 1 further comprising: a second determination unit that determines the most extracted predetermined data based on the determined cepstrum calculation results of the predetermined number of frames and outputs the most extracted predetermined data to the output unit. The sound processing apparatus as described.
(Appendix 3)
The first determination unit includes:
Note 1 that when the time of frames from which the same predetermined data is continuously extracted exceeds a predetermined multiple of the update interval, the predetermined data is output to the output unit by the number of integers obtained by adding 1 to the predetermined multiple The sound processing apparatus as described.
(Appendix 4)
A center calculation unit for obtaining the center of a frame from which the same predetermined data is extracted continuously;
A second determining unit that adds (the integer value + 1) / 2 times the update interval to the determined center and determines a predetermined number of frames used for extraction of the next additional data;
Supplementary note 3 further comprising: a second determination unit that determines the most extracted predetermined data based on the determined cepstrum calculation results of the predetermined number of frames and outputs the most extracted predetermined data to the output unit. The sound processing apparatus as described.
(Appendix 5)
A center calculation unit for obtaining the center of a frame from which the same predetermined data is extracted continuously;
A third determination unit for adding a plurality of groups of a predetermined number of frames to be used for extraction of the next additional data by adding the update interval to the determined center;
A third determination unit for determining the most extracted predetermined data based on the cepstrum calculation results of a predetermined number of frames in each determined group, and outputting the most extracted predetermined data to the output unit; Prepared,
The center calculator is
The sound processing apparatus according to supplementary note 1, wherein a center of a frame of a group in which the predetermined data is extracted most is obtained.
(Appendix 6)
The sound processing device according to any one of appendices 2, 4, and 5, further comprising a control unit that controls not to read the audio data in a frame other than a predetermined number of frames used for extraction of the next additional data. .
(Appendix 7)
The echo signal is faded in and out before and after the update interval,
The sound processing apparatus according to any one of appendices 1 to 6, wherein the predetermined value is determined based on a number of decode frames with respect to a time obtained by excluding the fade-in and fade-out times from the update interval.
(Appendix 8)
Performs cepstrum calculation for each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed for a predetermined time,
Determining whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determining predetermined data for one update interval;
A sound processing method in which a computer executes a process of outputting the determined predetermined data.
(Appendix 9)
Performs cepstrum calculation for each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed for a predetermined time,
Determining whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determining predetermined data for one update interval;
A program for causing a computer to execute a process of outputting the determined predetermined data.

1、4 音処理装置
5 携帯端末装置
11 マイク部
12 音声データカウント部
13 音声データ記憶部
14 計算部
15 デコード部
16、21 判定部
17 出力部
22 電源制御部
23 タイマ部
111、211、311 連続回数カウント部
112、212、312 付加データ第1判定部
121、221、321 中心算出部
122 第1決定部
123、223 付加データ第2判定部
222 第2決定部
322 第3決定部
323 付加データ第3判定部
504 制御部
506 主記憶部
507 補助記憶部
508 マイク
509 表示部
1, 4 Sound processing device 5 Portable terminal device 11 Microphone unit 12 Audio data counting unit 13 Audio data storage unit 14 Calculation unit 15 Decoding unit 16, 21 Determination unit 17 Output unit 22 Power supply control unit 23 Timer units 111, 211, 311 Continuous Number counting unit 112, 212, 312 Additional data first determination unit 121, 221, 321 Center calculation unit 122 First determination unit 123, 223 Additional data second determination unit 222 Second determination unit 322 Third determination unit 323 Additional data 3 determination unit 504 control unit 506 main storage unit 507 auxiliary storage unit 508 microphone 509 display unit

Claims (6)

所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、
前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心時刻を求める中心算出部と、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第1決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部と、
を備える音処理装置。
A calculation for performing cepstrum calculation on each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed by a predetermined time And
A first determination unit that determines whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determines predetermined data for one update interval When,
An output unit for outputting the determined predetermined data;
Of each frame, and the central calculation unit for a plurality of frames which the same predetermined data is extracted successively obtain the center time for the entire plurality of frames,
A first determination unit that adds the update interval to the determined central time and determines a predetermined number of frames used for extraction of the next additional data;
A second determination unit for determining the most extracted predetermined data based on the determined cepstrum calculation results of the predetermined number of frames, and outputting the most extracted predetermined data to the output unit;
A sound processing apparatus comprising:
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、を備え、
前記第1判定部は、
連続して同じ所定データが抽出されるフレームの時間が前記更新間隔の所定倍を超える場合、前記所定倍に1を加算した整数値の数だけ、該所定データを前記出力部に出力し、
前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心を求める中心算出部と、
求められた中心に前記更新間隔の(前記整数値+1)/2倍を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第2決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える音処理装置。
A calculation for performing cepstrum calculation on each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed by a predetermined time And
A first determination unit that determines whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determines predetermined data for one update interval When,
An output unit for outputting the determined predetermined data,
The first determination unit includes:
When the time of frames from which the same predetermined data is continuously extracted exceeds a predetermined multiple of the update interval, the predetermined data is output to the output unit by the number of integer values obtained by adding 1 to the predetermined multiple ,
A center calculation unit for obtaining a center for the whole of the plurality of frames for a plurality of frames from which the same predetermined data is continuously extracted,
A second determining unit that adds (the integer value + 1) / 2 times the update interval to the determined center and determines a predetermined number of frames used for extraction of the next additional data;
Sound processing further comprising: a second determination unit that determines the most extracted predetermined data based on the determined cepstrum calculation results of the predetermined number of frames and outputs the most extracted predetermined data to the output unit apparatus.
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、
前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心を求める中心算出部と、
求められた中心に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームの群を複数決定する第3決定部と、
決定された各群で所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第3判定部と、を備え、
前記中心算出部は、
前記所定データが最も多く抽出された群のフレームの中心を求める音処理装置。
A calculation for performing cepstrum calculation on each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed by a predetermined time And
A first determination unit that determines whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determines predetermined data for one update interval When,
An output unit for outputting the determined predetermined data;
Of each frame, and the central calculation unit for a plurality of frames which the same predetermined data is extracted successively obtain the center to the entire plurality of frames,
A third determination unit for adding a plurality of groups of a predetermined number of frames to be used for extraction of the next additional data by adding the update interval to the determined center;
A third determination unit for determining the most extracted predetermined data based on the cepstrum calculation results of a predetermined number of frames in each determined group, and outputting the most extracted predetermined data to the output unit; Prepared,
The center calculator is
A sound processing apparatus for obtaining a center of a group of frames from which the predetermined data is extracted most.
前記次の付加データの抽出に用いる所定数のフレーム以外のフレームでは、前記音声データの読み込みを行わないよう制御する制御部をさらに備える請求項1乃至3のいずれか一項に記載の音処理装置。 The next is a predetermined number of frames other than the frames used for extraction of the additional data, the sound processing apparatus according to any one of claims 1 to 3 further comprising a control unit for controlling not to perform the reading of the audio data . 所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力し、
前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心時刻を求め、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定し、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを出力する処理をコンピュータが実行する音処理方法。
Performs cepstrum calculation for each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed for a predetermined time,
Determining whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determining predetermined data for one update interval;
Outputting the determined predetermined data;
For each of the plurality of frames from which the same predetermined data is continuously extracted, a central time for the plurality of frames is obtained.
Adding the update interval to the determined central time to determine a predetermined number of frames used for extraction of the next additional data;
A sound processing method in which a computer executes a process of determining the most extracted predetermined data based on the determined cepstrum calculation results of a predetermined number of frames and outputting the most extracted predetermined data.
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力し、
前記各フレームのうち、連続して同じ所定データが抽出される複数のフレームについて前記複数のフレーム全体に対する中心時刻を求め、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定し、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを出力する処理をコンピュータに実行させるためのプログラム。
Performs cepstrum calculation for each frame in which audio data having a length corresponding to the update interval is divided into a plurality of frames for audio data to which predetermined data is added at each update interval based on an echo signal delayed for a predetermined time,
Determining whether or not the number of consecutive frames having the same predetermined data extracted based on the cepstrum calculation result of each frame is equal to or greater than a predetermined value, and determining predetermined data for one update interval;
Outputting the determined predetermined data;
For each of the plurality of frames from which the same predetermined data is continuously extracted, a central time for the plurality of frames is obtained.
Adding the update interval to the determined central time to determine a predetermined number of frames used for extraction of the next additional data;
A program for causing a computer to execute a process of determining the most extracted predetermined data based on the determined cepstrum calculation results of a predetermined number of frames and outputting the most extracted predetermined data.
JP2011240596A 2011-11-01 2011-11-01 Sound processing apparatus, sound processing method and program Expired - Fee Related JP5948793B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011240596A JP5948793B2 (en) 2011-11-01 2011-11-01 Sound processing apparatus, sound processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011240596A JP5948793B2 (en) 2011-11-01 2011-11-01 Sound processing apparatus, sound processing method and program

Publications (2)

Publication Number Publication Date
JP2013097202A JP2013097202A (en) 2013-05-20
JP5948793B2 true JP5948793B2 (en) 2016-07-06

Family

ID=48619185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011240596A Expired - Fee Related JP5948793B2 (en) 2011-11-01 2011-11-01 Sound processing apparatus, sound processing method and program

Country Status (1)

Country Link
JP (1) JP5948793B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893067A (en) * 1996-05-31 1999-04-06 Massachusetts Institute Of Technology Method and apparatus for echo data hiding in audio signals
US5940135A (en) * 1997-05-19 1999-08-17 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in analog signals
WO2000039955A1 (en) * 1998-12-29 2000-07-06 Kent Ridge Digital Labs Digital audio watermarking using content-adaptive, multiple echo hopping
PL1684265T3 (en) * 2005-01-21 2009-01-30 Unlimited Media Gmbh Method of embedding a digital watermark in a useful signal

Also Published As

Publication number Publication date
JP2013097202A (en) 2013-05-20

Similar Documents

Publication Publication Date Title
CN104410379B (en) A kind of volume adjusting method
US9875746B2 (en) Encoding device and method, decoding device and method, and program
JP4889729B2 (en) Diversity receiver
MX2007006484A (en) Equalization apparatus and method based on audiogram.
CN107527630B (en) Voice endpoint detection method and device and computer equipment
RU2008127062A (en) DECODING BINAURAL AUDIO SIGNALS
US9641660B2 (en) Modifying sound output in personal communication device
CN103929692B (en) Audio information processing method and electronic equipment
CN105657656B (en) A kind of transmission power adjustment method and user equipment
WO2009128663A3 (en) A method and an apparatus for processing an audio signal
CN111083289A (en) Audio playing method and device, storage medium and mobile terminal
US20120265543A1 (en) Multi-channel signal encoding and decoding method, apparatus, and system
JP5948793B2 (en) Sound processing apparatus, sound processing method and program
US8046094B2 (en) Audio reproducing apparatus
JP2014032364A (en) Sound processing device, sound processing method and program
JP2007141020A (en) Data processor and electronic equipment
KR101945816B1 (en) Device and method for adjusting volume in terminal
JP2009289385A (en) Digital audio signal processing device and method
EP3073653A1 (en) Low-power sound wave receiving method and mobile device using same
EP4044460A1 (en) Method and device for processing ultrasonic waves and equipment
JP2010258967A (en) Electronic device, control method of the same, and electroacoustic transducer
TWI256580B (en) Apparatus and method for measuring signal quality
CN109274826A (en) Switching method, device and the terminal of voice play mode
JP6212354B2 (en) Portable information terminal and control method thereof
JP2011075935A (en) Audio processing device, program, audio processing method, and recorder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151013

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160523

R150 Certificate of patent or registration of utility model

Ref document number: 5948793

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees