JP2009507261A - Audio signal playback system - Google Patents

Audio signal playback system Download PDF

Info

Publication number
JP2009507261A
JP2009507261A JP2008529667A JP2008529667A JP2009507261A JP 2009507261 A JP2009507261 A JP 2009507261A JP 2008529667 A JP2008529667 A JP 2008529667A JP 2008529667 A JP2008529667 A JP 2008529667A JP 2009507261 A JP2009507261 A JP 2009507261A
Authority
JP
Japan
Prior art keywords
signal
audio signal
audio
voice
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008529667A
Other languages
Japanese (ja)
Inventor
パージュ,ジャン−ダニエル
Original Assignee
デージーヴェー クリプテックス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デージーヴェー クリプテックス filed Critical デージーヴェー クリプテックス
Publication of JP2009507261A publication Critical patent/JP2009507261A/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Abstract

第1音声信号(4)と第2音声信号(5)を再生し、送信する装置および方法であり、−第2音声信号(5)のコード化手段(10)と、−第1音声信号(4)とコード化第2音声信号(5e)を結合して、第1音声再生手段(8)で再生できる合成音声信号(6)とする結合手段を有するプロデューサー(1)、−第1音声再生手段(8)をもつトランスミッター(2)、−合成音声信号(6)の受信手段(16)と抽出手段(17)をもつレシーバー(3)、とからなる。
【選択図】 図1
An apparatus and a method for reproducing and transmitting a first audio signal (4) and a second audio signal (5), a coding means (10) for a second audio signal (5), and a first audio signal ( 4) and the coded second audio signal (5e) are combined to produce a synthesized audio signal (6) that can be reproduced by the first audio reproduction means (8), producer (1), first audio reproduction It comprises a transmitter (2) having means (8), a receiver (16) for receiving a synthesized speech signal (6) and a receiver (3) having an extracting means (17).
[Selection] Figure 1

Description

本発明は、音声を再生し、音声信号を無線で送信するシステム、およびそのシステムを、音で聞こえず、目に見えない無線で送信された音声信号をテレビジョンで再生する“話す”玩具への応用に関する。   The present invention is directed to a system that plays audio and transmits audio signals wirelessly, and a “speaking” toy that reproduces audio signals that are inaudible and invisible wirelessly transmitted on television. Related to the application.

本発明のこれらに近い目的をもった話す玩具は、WO0169572〔クリエーター社(Creator Ltd.)〕、DE19520586〔シーメンス社(Siemens AG)〕、US2004/082255〔ピー・エス・エル フォンら(P.S.L.Fong et al.)〕、US6238262〔テクノヴェーション・オーストラリア・ピーティーワイ社(Technovation Australia Pty Ltd.)〕、US5191615〔ドルマー・グループ(The Drummer Group)〕、US4846693〔スミス・エンジニアリン社(Smith Engineering)〕、US4840602〔コレコ・インダストリー社(Coleco Industries,Inc.)〕の公報に開示されている。   Talking toys with similar objectives of the present invention are described in WO0169572 [Creator Ltd.], DE 1520586 [Siemens AG], US 2004/082255 [PSL et al. L. Fong et al.)], US 6238262 [Technology Australia Pty Ltd.], US 5191615 [The Drummer Group], US 4846693 (Smith Engineers). Smith Engineering)], U.S. Pat. No. 4,840,602 (Coleco Industries, Inc.) Which is incorporated herein by reference.

US5191615は、本発明に最も近いものであり、外部から受けたサウンドトラックを再生し、外部信号でコントロールされた動きをすることができる玩具(人形)について記述している。この対話型の玩具は、ビデオプログラムのサウンドトラックと同調して、動き、音声を再生することができ、その結果、玩具は、サウンドトラックに応答することによりビデオプログラムと対話しているように見える。   US Pat. No. 5,191,615 describes a toy (doll) that is closest to the present invention and that can play a soundtrack received from outside and can be controlled by external signals. This interactive toy can move and play audio in sync with the video program's soundtrack, so that the toy appears to interact with the video program by responding to the soundtrack .

US5191615のシステム/玩具は、テレビジョン送信信号または記録媒体(カセットまたはDVD)上のレコーディングいずれかのステレオシステムの2つの音声チャンネルを使用している。第1音声チャンネルは、テレビジョンで再生されることを意図したビデオプログラムの音声を伝え、第2音声チャンネルは、玩具によって再生されることを意図した音声信号を(玩具の駆動システムによって再生される動作指示をコード化した信号と一緒に)もっている。   The US 5916615 system / toy uses the two audio channels of a stereo system, either a television transmission signal or a recording on a recording medium (cassette or DVD). The first audio channel carries the audio of the video program intended to be played on the television, and the second audio channel plays the audio signal (played by the toy drive system) intended to be played by the toy. (With a coded signal).

テレビジョン信号がテレビジョンで受信され、あるいは記録媒体が再生されるとき、スプリッターにより、第1音声チャンネルは分離されてテレビジョンにより直接再生され、第2音声チャンネルは、玩具へ転送される。多重分離(demultiplexage)により、スピーカーにより玩具で再生される音声が、転送前あるいは転送後(つまり玩具中で)のいずれかで、動きの指示をコード化した信号から分離される。   When the television signal is received by the television or when the recording medium is reproduced, the first audio channel is separated by the splitter and directly reproduced by the television, and the second audio channel is transferred to the toy. By demultiplexing, the sound played by the speaker on the toy is separated from the signal encoding the motion indication either before transfer or after transfer (ie in the toy).

スプリッターと玩具の間の送信は、玩具が自由に動けるようにするため、無線であることが好ましい。US5191615は、周波数変調(FM)ラジオリンクあるいは赤外線リンクの使用を開示している。
この種の応用で赤外線リンクは、指向性が高過ぎ、また強度が弱いので、玩具を持って動き廻る子供の動きに付いていけない。
ラジオリンクは、行政認可の問題があり、例えば、ヨーロッパでは非常に厳しい規制があり、少なくとも、周波数の割当をする行政の規制に沿ってそれぞれの国に適合した開発が必須となる。
これらの2つの送信モードに共通してもつ別の欠点は、赤外線送信またはラジオ送信に特別に適合したトランスミッターを装備したテレビジョンの使用が必要なことである。
The transmission between the splitter and the toy is preferably wireless so that the toy can move freely. US Pat. No. 5,191,615 discloses the use of frequency modulation (FM) radio links or infrared links.
In this type of application, the infrared link is too directional and weak enough to keep up with the movement of children moving around with toys.
The radio link has a problem of administrative approval. For example, in Europe, there are very strict regulations, and at least development in conformity with the regulations of the government that assigns frequencies is essential.
Another drawback common to these two transmission modes is that it requires the use of a television equipped with a transmitter specially adapted for infrared or radio transmission.

本発明は、これらの欠点を改善するものであり、トランスミッター/テレビジョンが第1音声信号を再生するときに、第2音声信号は、聞こえないようにコード化されて第1音声信号と結合して再生されるという有利な送信形態を提供する。しかしながら、この音声信号は、レシーバー/玩具の中の受信手段で受けることができる。レシーバーは、第2音声信号を抽出し、デコード化してそれを聞こえるように再生する。   The present invention remedies these drawbacks, and when the transmitter / television reproduces the first audio signal, the second audio signal is coded so that it cannot be heard and combined with the first audio signal. It is possible to provide an advantageous transmission form of being reproduced. However, this audio signal can be received by the receiving means in the receiver / toy. The receiver extracts the second audio signal, decodes it, and plays it back so that it can be heard.

本発明は、第1音声信号及び第2音声信号から合成音声信号を作り出す方法であり、次の段階からなっている。
−第2音声信号を、音声再生手段により人の耳に聞き取れない方法で再生できるコード化第2音声信号とするコード化段階。
−第1音声信号が人の耳に聞こえ、第2音声信号が人の耳に聞こえない方法で、第1音声信号とコード化第2音声信号を結合して、音声再生手段で再生できる合成音声信号とする音声結合段階。
The present invention is a method for generating a synthesized voice signal from a first voice signal and a second voice signal, and includes the following steps.
Encoding the second audio signal into a coded second audio signal that can be reproduced in a manner inaudible to the human ear by the audio reproduction means;
The synthesized voice that can be reproduced by the voice reproduction means by combining the first voice signal and the coded second voice signal in such a way that the first voice signal can be heard by the human ear and the second voice signal cannot be heard by the human ear. The voice combining stage to be a signal.

この合成音声信号は、一般的な音声信号と互換性があり、その修正なしに既存の手段によって送信され、記録され、再生されることが好ましい。標準の音声再生手段で再生されるとき、第1音声信号は聞こえるように再生されるが、第2音声信号は、人の耳に聞こえない方法で送信される。従って、標準の第1再生手段を備えるトランスミッタ−は、第1音声信号を聞こえるように再生し、同時に、付加的な特別な手段なしに、第2音声信号を聞こえないように無線でレシーバーに送信できる。このレシーバーは、この第2音声信号を第2音声再生手段で聞こえるように再生することができる。このようにして、2つの再生手段が対話しているような印象を与えることができる。   This synthesized audio signal is compatible with general audio signals and is preferably transmitted, recorded and reproduced by existing means without modification. When reproduced by standard audio reproduction means, the first audio signal is reproduced so that it can be heard, but the second audio signal is transmitted in such a way that it cannot be heard by the human ear. Thus, the transmitter with the standard first reproduction means reproduces the first audio signal so that it can be heard, and at the same time, without additional special means, transmits the second audio signal wirelessly to the receiver so that it cannot be heard. it can. The receiver can reproduce the second audio signal so that it can be heard by the second audio reproduction means. In this way, it is possible to give the impression that the two playback means are interacting.

本発明の別の特徴によると、コード化段階は、第2音声信号の周波数を、音声再生手段の再生周波数スペクトルで人に聞こえない高周波にシフトさせる周波数シフト段階を有している。
このように、第2音声信号は、標準の音声再生手段で再生できる周波数スペクトルにはあるが人の耳に聞こえないようになり、無線で、秘密を守り、かつ追加の送信手段を必要とせずに再生することができる。
周波数シフトは、第1音声信号と第2音声信号の周波数スペクトルが重ならないようにして、両者の結合ができるようになる。
According to another feature of the invention, the encoding step comprises a frequency shift step of shifting the frequency of the second audio signal to a high frequency that is not audible to humans in the reproduction frequency spectrum of the audio reproduction means.
In this way, the second audio signal is in a frequency spectrum that can be reproduced by standard audio reproduction means, but becomes inaudible to human ears, is protected wirelessly, and does not require additional transmission means. Can be played.
In the frequency shift, the first audio signal and the second audio signal do not overlap with each other so that the two can be coupled.

本発明によれば、コード化段階は、第2音声信号の帯域縮小段階を有している。この縮小操作は、結合操作を容易にする。   According to the invention, the coding stage comprises a band reduction stage of the second audio signal. This reduction operation facilitates the join operation.

本発明発明は、さらにコード化段階が暗号化段階を有しているのがよい。この段階は、暗号の解読が必要であるが、第2音声信号がその送信先で聞こえるようにしている。   In the present invention, the encoding stage may further include an encryption stage. This stage requires decryption of the code, but allows the second audio signal to be heard at its destination.

本発明によれば、暗号化段階は、第2音声信号の周波数スペクトルのポジティブ部分を除去し、ネガティブ部分だけ残す段階を有している。
実施の形態は、例え超高感度の聴力を持つ人により感知されたとしても、その内容は理解できず、またより適応し易いスペクトル形状にして音声結合段階を容易にするという、二つの利益がある。
According to the invention, the encryption step comprises the step of removing the positive part of the frequency spectrum of the second audio signal and leaving only the negative part.
Even if the embodiment is perceived by a person with ultra-sensitive hearing, its contents cannot be understood, and it has two benefits of facilitating the speech combining step with a more adaptive spectral shape. is there.

本発明の別の特徴によれば、音声結合段階は、第1音声信号とコード化第2音声信号を結合させている。この段階は、実施するに容易であるという利点がある。   According to another feature of the invention, the speech combining stage combines the first speech signal and the coded second speech signal. This step has the advantage of being easy to implement.

本発明の別の特徴によれば、音声結合段階は、第1音声信号とコード化第2音声信号を結合させる前に、第1音声信号に第1ゲインを与え、第2音声信号に第2ゲインを与えている。   According to another feature of the invention, the speech combining stage provides a first gain to the first speech signal and a second to the second speech signal before combining the first speech signal and the coded second speech signal. Giving gain.

本発明によれば、第2ゲインは、第1ゲインより低いのがよい。これは、コードでマスクされた信号(第2音声信号)を一般的な聴覚曲線の下に配置して、隠す条件を良くするという長所がある。   According to the present invention, the second gain is preferably lower than the first gain. This has an advantage that the signal masked with the code (second audio signal) is placed under a general auditory curve to improve the concealment condition.

本発明の別の有利な特徴によれば、音声結合段階は、結合前の第1音声信号の周波数スペクトルの高周波部分を除去し、低周波部分だけを保持する段階を有している。
高周波部分を除去する操作により、第1音声信号は事実上聞えないようになり、再生周波数スペクトルの一部を解放して音声結合操作が非常に容易になる。
According to another advantageous characteristic of the invention, the speech combining step comprises the step of removing the high frequency part of the frequency spectrum of the first sound signal before combining and retaining only the low frequency part.
By the operation of removing the high frequency part, the first audio signal is virtually inaudible, and a part of the reproduction frequency spectrum is released, and the audio combining operation becomes very easy.

本発明の別の特徴によれば、結合段階は、さらに周波数Fcmdで指令信号を加える段階を有している。   According to another feature of the invention, the combining step further comprises the step of applying a command signal at a frequency Fcmd.

また、本発明は、周波数Fcmdが、コード化された第2音声信号より高波長で、PAL信号で15625Hzより低周波数であり、NTSC信号で15734Hzより低周波数である。   In the present invention, the frequency Fcmd is higher than that of the coded second audio signal, lower than 15625 Hz for the PAL signal, and lower than 15734 Hz for the NTSC signal.

本発明の別の特徴によれば、指令信号は、31.25ビット/秒でパルス幅変調されてコード化された2進指令である。   According to another feature of the invention, the command signal is a binary command coded with pulse width modulation at 31.25 bits / second.

また、別のオプションの特徴によれば、合成音声信号は、少なくとも目的のレシーバーを識別する識別コードをもって送信される。この特徴は、トランスミッターと、自身の音声信号それぞれが割り当てられている複数のレシーバーの間でやりとりしていることにある。   According to another optional feature, the synthesized speech signal is transmitted with an identification code identifying at least the intended receiver. This feature is that communication is performed between the transmitter and a plurality of receivers to which the respective audio signals are assigned.

また、別のオプションの特徴によれば、《ブロードキャスト》という語を付けた識別コードを、全てのレシーバーに与えている。《ブロードキャスト》というこの識別コードは、全てのレシーバーに対応し、全てのレシーバーで再生できるようにするのがよい。   Also, according to another optional feature, an identification code with the word “Broadcast” is given to all receivers. This identification code of << Broadcast >> should be compatible with all receivers and be reproducible by all receivers.

本発明は、さらに、上記の実施の形態による方法で得られた合成音声信号に関するものである。また、本発明は、合成音声信号の記録媒体にも及んでいる。   The present invention further relates to a synthesized speech signal obtained by the method according to the above embodiment. The present invention also extends to a recording medium for a synthesized audio signal.

本発明は、さらに、合成音声信号を作成するプロデューサーに関するものである。   The present invention further relates to a producer that creates a synthesized speech signal.

本発明は、さらに、第1音声信号の再生および第2音声信号の無線送信方法であって、第1音声信号、第2音声信号、さらに場合により指令信号から上述の実施形態による合成音声信号の生成と、音声再生手段による合成音声信号の音声再生の段階を有している。   The present invention further relates to a method of reproducing a first audio signal and wirelessly transmitting a second audio signal, wherein the synthesized audio signal according to the above-described embodiment is generated from the first audio signal, the second audio signal, and possibly a command signal. There are stages of generation and voice reproduction of the synthesized voice signal by the voice reproduction means.

本発明は、さらに、合成音声信号の受信方法であって、上述した実施形態による合成音声信号を受信し、合成音声信号からコード化第2音声信号を抽出し、コード化第2音声信号をデコードして、第2音声信号を再構築し、第2音声信号を再生する、の段階を有している。   The present invention further relates to a method for receiving a synthesized speech signal, which receives the synthesized speech signal according to the above-described embodiment, extracts a coded second speech signal from the synthesized speech signal, and decodes the coded second speech signal. The second audio signal is reconstructed and the second audio signal is reproduced.

本発明の別の特徴によれば、音声受信方法は、合成音声信号から指令信号を抽出し、指令信号を復調して2進法指令の再構築する、の段階を有している。   According to another feature of the invention, the speech receiving method includes the steps of extracting a command signal from the synthesized speech signal, demodulating the command signal, and reconstructing a binary command.

本発明の別の特徴によれば、デコード化段階または復調化段階は、上記実施形態の合成音声信号作成方法におけるコード化または変調段階に対して対称の段階を有している。   According to another feature of the present invention, the decoding stage or the demodulating stage has a stage that is symmetric with respect to the coding or modulation stage in the synthesized speech signal creation method of the above embodiment.

本発明の別の特徴によれば、暗号解読手段は、第2音声信号の周波数スペクトルのネガティブ部分から、第2音声信号のポジティブ部分を再構築する《鏡》変換を有している。   According to another characteristic of the invention, the decryption means comprises a << mirror >> transform that reconstructs the positive part of the second audio signal from the negative part of the frequency spectrum of the second audio signal.

本発明の別の特徴によれば、音声再生段階の前に、ゲイン利得制御段階が第2音声信号に適用される。音声受信信号は、トランスミッターとレシーバーの間の距離により変わるが、このゲイン利得制御段階は、音声受信信号の強さとは独立して、第2の音声信号を同じ音量で再生することができる。   According to another feature of the invention, a gain / gain control step is applied to the second audio signal prior to the audio reproduction step. The audio reception signal varies depending on the distance between the transmitter and the receiver, but this gain / gain control step can reproduce the second audio signal at the same volume independent of the intensity of the audio reception signal.

本発明の別の特徴によれば、音声受信信号は、再生前に、ノイズスペクトルの推定に基づいて第2音声信号のノイズ除去段階を有している。   According to another feature of the invention, the audio reception signal has a noise removal stage of the second audio signal based on the estimation of the noise spectrum before reproduction.

本発明の別の特徴によれば、ノイズスペクトルは、静寂期に規則的に測定されるか、ブランクノイズとして扱われる。   According to another feature of the invention, the noise spectrum is regularly measured during quiet periods or treated as blank noise.

本発明の別の特徴によれば、レシーバーはそれ自身の識別コードを持ち、少なくとも意図するレシーバーを識別する識別コードは、合成音声信号から抽出され、自身の識別コードと合成音声信号から抽出されたコードが対応しているときのみ、そのレシーバーは第2音声信号を再生する。   According to another feature of the invention, the receiver has its own identification code, and at least the identification code identifying the intended receiver is extracted from the synthesized speech signal and extracted from its own identification code and the synthesized speech signal. Only when the code is compatible, the receiver plays the second audio signal.

本発明の別の特徴によれば、識別コード《ブロードキャスト》は、全てのレシーバーに対応し、識別コード《ブロードキャスト》が抽出されて、第2音声信号が再生される。   According to another characteristic of the invention, the identification code << broadcast >> corresponds to all receivers, the identification code << broadcast >> is extracted and the second audio signal is reproduced.

本発明は、さらに、合成音声信号を受信し、上記の実施形態による音声受信方法を実施できるレシーバーに関するものである。   The present invention further relates to a receiver that can receive a synthesized speech signal and implement the speech receiving method according to the above-described embodiment.

本発明は、さらに、上記のレシーバーを有する玩具に関するものである。
これにより、《声》がわからないように無線でテレビジョンのような視聴覚手段に送られて再生され、視聴覚プログラムと対話しているように見える《話す》玩具が可能になる。
The present invention further relates to a toy having the above receiver.
This allows a “speaking” toy that appears to be interacting with the audiovisual program, being sent wirelessly to audiovisual means such as television so that the “voice” is not known.

本発明は、さらに、第1音声信号と第2音声信号とから合成音声を生成し、トランスミッターまたは第1音声再生装置に送信する上記実施形態によるプロデューサー、第1音声信号を再生し、第2音声信号を無線で送信する上記実施形態によるトランスミッターまたは第1音声再生機、第2音声信号を抽出し、デコード化して再生する上記実施形態によるレシーバーまたは第2音声再生機、を有する音声信号再生システムに関するものである。   The present invention further generates the synthesized voice from the first voice signal and the second voice signal and transmits the synthesized voice to the transmitter or the first voice playback device, plays back the first voice signal, and plays the second voice. The present invention relates to an audio signal reproduction system having a transmitter or a first audio player according to the above embodiment for transmitting a signal wirelessly, and a receiver or a second audio player according to the above embodiment for extracting a second audio signal and decoding and reproducing it. Is.

本発明の特徴、詳細および利点は、以下の詳細な説明および添付の図を参照すればより明らかになるであろう。   The features, details and advantages of the present invention will become more apparent with reference to the following detailed description and accompanying drawings.

図中、同じ参照番号は、同じまたは同様の項目を示している。参照文字および参照数字は、同じ対象物の異なる形態に使用されている。例えば、参照数字5a−5eは、送信される過程で、本発明の種々のプロセスによる種々の形態(縮小、暗号化、コード化)にある第2音声信号5を示している。
図5〜16は音声信号を示している。いずれも、周波数スペクトルで、横軸に周波数をHzまたはkHz、縦軸に音量をdBで表わしている。
In the figures, the same reference numerals indicate the same or similar items. Reference letters and reference numerals are used for different forms of the same object. For example, reference numerals 5a-5e indicate the second audio signal 5 in the various forms (reduction, encryption, coding) according to the various processes of the present invention as it is transmitted.
5 to 16 show audio signals. In either case, the frequency spectrum shows the frequency in Hz or kHz on the horizontal axis and the volume in dB on the vertical axis.

図1は、本発明のシステムにおける実施の形態の一つである。このシステムは、プロデューサー1、トランスミッタ−2、および少なくとも1つのレシーバー3でなっている。   FIG. 1 shows one embodiment of the system of the present invention. The system consists of a producer 1, a transmitter-2, and at least one receiver 3.

プロデューサー1は、第1音声信号4および第2音声信号5を受信する。第1音声信号4は、この段階では、図5に示された基本形式4aになっている。第2音声信号5は、この段階では、図8に示された基本形式5aになっており、第1音声信号4の基本形式4aと実質的に同じである。プロデューサー1は、信号処理ユニットであり、第1音声信号4と第2音声信号5から、後述する方法で合成音声信号6を作り出している。
合成音声信号6は、直接接続30、再生接続31、記録媒体24あるいは当業者にとって周知の同等の手段によってトランスミッタ−2へ送信される。
The producer 1 receives the first audio signal 4 and the second audio signal 5. At this stage, the first audio signal 4 is in the basic format 4a shown in FIG. At this stage, the second audio signal 5 is in the basic format 5 a shown in FIG. 8 and is substantially the same as the basic format 4 a of the first audio signal 4. The producer 1 is a signal processing unit, and generates a synthesized audio signal 6 from the first audio signal 4 and the second audio signal 5 by a method described later.
The synthesized audio signal 6 is transmitted to transmitter-2 by direct connection 30, playback connection 31, recording medium 24 or equivalent means well known to those skilled in the art.

トランスミッター2は、第1音声再生装置であり、第1音声再生手段8で合成音声信号6を再生しており、第1音声信号4を人の耳7に聞こえる形式で再生し、第2音声信号5を人の耳7に聞こえないコード化された形式5eで再生している。   The transmitter 2 is a first audio reproducing device, and the first audio reproducing means 8 reproduces the synthesized audio signal 6, reproduces the first audio signal 4 in a form that can be heard by the human ear 7, and the second audio signal. 5 is reproduced in a coded format 5e that cannot be heard by the human ear 7.

レシーバー3は、第2音声再生装置で1つまたは複数あり、トランスミッター2の音声再生範囲内に置かれ、合成音声信号6のうちのコード化第2音声信号5eを含む部分を受信する。レシーバー3は、コード化第2音声信号5eを抽出し、デコード化して第2音声信号の基本形式5aに再構築する、次いで、レシーバー3、あるいは第2音声再生装置は、第2音声再生手段9によって人の耳7に聞こえる第2音声信号5にして再生する。   One or a plurality of receivers 3 are provided in the second sound reproducing device, and the receiver 3 is placed within the sound reproduction range of the transmitter 2 and receives a portion of the synthesized sound signal 6 including the coded second sound signal 5e. The receiver 3 extracts the encoded second audio signal 5e, decodes it, and reconstructs it into the basic format 5a of the second audio signal. Next, the receiver 3 or the second audio reproduction device uses the second audio reproduction means 9 Thus, the second audio signal 5 that can be heard by the human ear 7 is reproduced.

図2は、プロデューサー1の一実施に形態の詳細である。プロデューサー1は、コード化手段10をもち、第2音声信号5をコード化してコード化第2音声信号5eに変えている。さらに、結合または多重化のための結合手段11を有して、第1音声信号4とコード化第2音声信号5eを結合して合成音声信号6としている。   FIG. 2 is a detail of one embodiment of the producer 1. The producer 1 has the encoding means 10, encodes the second audio signal 5 and converts it into the encoded second audio signal 5 e. Further, a combining unit 11 for combining or multiplexing is provided, and the first audio signal 4 and the encoded second audio signal 5e are combined to form a synthesized audio signal 6.

合成音声信号6を再生するとき、第2音声5を聞こえなくするために、コード化手段10は、第2音声信号5の周波数スペクトルを、人の耳7に聞こえる周波数より高い周波数にシフトさせる第1周波数シフト手段12をもつのがよい。   When reproducing the synthesized speech signal 6, the coding means 10 shifts the frequency spectrum of the second speech signal 5 to a frequency higher than the frequency audible to the human ear 7 in order to make the second speech 5 inaudible. It is preferable to have one frequency shift means 12.

図12は、周波数スペクトルの高周波数の方向にΔ量だけシフトさせたコード化音声信号5eを示している。図12で、曲線Cは、人の耳7で通常聞こえる周波数スペクトルの下限、一般的な聴覚曲線Cを示している。しかしながら、周波数シフトΔは、このようにして得られたコード化第2音声信号5eが従来の第1音声再生手段8によって再生できる周波数スペクトル内にあるようにしている。第1周波数シフト手段12は、コード化手段10には必須な手段である。第1周波数シフト手段12は、例えば、周波数多重化装置(multiplicateur de frequence)で実施できる。   FIG. 12 shows the coded audio signal 5e shifted by Δ amount in the high frequency direction of the frequency spectrum. In FIG. 12, a curve C indicates a lower limit of a frequency spectrum that can be normally heard by the human ear 7 and a general auditory curve C. However, the frequency shift Δ is set so that the coded second audio signal 5e thus obtained is within a frequency spectrum that can be reproduced by the conventional first audio reproduction means 8. The first frequency shift means 12 is an essential means for the encoding means 10. The first frequency shift means 12 can be implemented by, for example, a frequency multiplex device (multiplicator de frequency).

再生音声の周波数スペクトルを制限するために、コード化手段10は、さらに第2音声信号5の帯域を縮小する帯域縮小手段13を有することが好ましい。周波数スペクトルを縮小する方法あるいは手段は、信号により使用される周波数スペクトルの帯域を小さくすることを目的にしている。この縮小は、周波数スペクトルを圧縮する、あるいは周波数スペクトルを限られた帯域のみ残るように選択的及び意図的に削除して実行できる。それでも、残りの部分は、回復するのに十分な状態になっている。例えば、周波数を、最も多く使用される周波数を含んでいる約3kHzにすると、初期の音声信号を回復することは可能である。このような縮小方法で、図8に示す基本形式音声5aを、図9に示す縮小スペクトル音声5bに変換することができる。   In order to limit the frequency spectrum of the reproduced sound, it is preferable that the encoding unit 10 further includes a band reducing unit 13 that further reduces the band of the second audio signal 5. The method or means for reducing the frequency spectrum is aimed at reducing the bandwidth of the frequency spectrum used by the signal. This reduction can be performed by compressing the frequency spectrum or selectively and deliberately deleting the frequency spectrum so that only a limited band remains. Still, the rest is in good condition to recover. For example, if the frequency is about 3 kHz including the most frequently used frequency, it is possible to recover the initial audio signal. With such a reduction method, the basic format voice 5a shown in FIG. 8 can be converted into the reduced spectrum voice 5b shown in FIG.

一実施の形態において、周波数スペクトルの縮小は、遮断周波数Fc=3kHzで低域が通過するフィルターで行い、BLU変調で搬送周波数Fp=14.25kHzに変調し、次いでFpとFp+Fcの間の帯域を通過するフィルターを通して、最終的に3kHzの縮小スペクトルしかもたない音声信号にする。以下に述べるネガティブな帯域を用いる暗号化段階は、同時にFp−FcとFpの間の帯域を通過するフィルターを通して、帯域[11.25;14.25]kHzをもつ縮小化され暗号化された信号とするのが有利である。   In one embodiment, the frequency spectrum is reduced with a filter that passes a low band at a cutoff frequency Fc = 3 kHz, modulated to a carrier frequency Fp = 14.25 kHz with BLU modulation, and then the band between Fp and Fp + Fc is Through the filter that passes, the audio signal finally has a reduced spectrum of 3 kHz. The encryption step using the negative band, described below, simultaneously reduces the encrypted signal with band [11.25; 14.25] kHz through a filter that passes through the band between Fp-Fc and Fp. Is advantageous.

コード化手段10は、さらに、第2音声信号5の暗号化手段14をもつことができる。暗号化手段14は、第2音声信号5を内容が理解できないようにするもので、これにより正規の受け手のみが、信号の暗号を解読して、コピーあるいは再生することができるようになる。   The encoding means 10 can further comprise an encryption means 14 for the second audio signal 5. The encrypting means 14 prevents the contents of the second audio signal 5 from being understood, so that only a legitimate receiver can decrypt or encrypt or copy the signal.

図10は、音声信号のネガティブ部5cとポジティブ部5dからなる全周波数スペクトルをもつ縮小スペクトル音声信号5bを示している。周波数スペクトルのネガティブ部5cは、音声信号に常に存在して、縦軸に対してポジティブ部5dと対称となっている。ネガティブ部5cは、追加的な情報をもたないので、一般に周波数を表現するに省略される。暗号化手段14により行われる暗号化方法の1つの例は、第2音声信号5のポジティブ部5dを取除いて、周波数スペクトルのネガティブ部5cのみを保持するようにことである。このような暗号化は、周波数スペクトルのネガティブ部5cのみを保持する低域フィルターによる暗号化手段14で行うことができる。暗号化は、また、周波数スペクトルのポジティブ部5dのみに「鏡面」対称プロセスを適用して行うこともできる。   FIG. 10 shows a reduced spectrum speech signal 5b having a full frequency spectrum composed of a negative portion 5c and a positive portion 5d of the speech signal. The negative part 5c of the frequency spectrum is always present in the audio signal and is symmetrical to the positive part 5d with respect to the vertical axis. Since the negative part 5c has no additional information, it is generally omitted to express the frequency. One example of the encryption method performed by the encryption means 14 is to remove the positive part 5d of the second audio signal 5 and retain only the negative part 5c of the frequency spectrum. Such encryption can be performed by the encryption means 14 using a low-pass filter that holds only the negative portion 5c of the frequency spectrum. Encryption can also be performed by applying a “mirror” symmetry process to only the positive part 5d of the frequency spectrum.

暗号化の目的は、二つある。第1の目的は、暗号化そのものであり、例え超高感度の聴力を持つ人が暗号化された信号を感知したとしても、その内容を理解できないようにする。第2の目的は、新しい周波数スペクトル形状にして、音声結合段階を容易にすることであり、図12に示すように、音声信号のネガティブ部5cの新しい形状の周波数スペクトルは、コード化第2音声信号5eにシフトされて、容易に聴覚曲線Cの下に隠され、あるいは小さいシフトΔで聴覚曲線Cの下に隠せる。   There are two purposes for encryption. The first purpose is encryption itself, so that even if a person with ultra-sensitive hearing senses an encrypted signal, the contents cannot be understood. The second purpose is to create a new frequency spectrum shape to facilitate the speech combining stage, and as shown in FIG. 12, the new shape frequency spectrum of the negative part 5c of the speech signal is coded second speech. Shifted to signal 5e and easily hidden under the auditory curve C or hidden under the auditory curve C with a small shift Δ.

結合手段11は、第1音声信号4を一つの形式にし、第2音声信号5を、例えばコード化第2音声信号5eのような一つの形式にして合成音声信号6を構築することである。第1音声信号4と第2音声信号5のそれぞれは、図13に示すように、2つの音声信号の周波数スペクトルが完全に重ならないが、第1音声再生手段8により再生できる再生周波数スペクトルであるようにする。従って、周波数多重化である結合は、第1音声信号4と、好ましくはコード化された形式5eにある第2音声信号5を加算する加算器15をもつ結合手段11により行われることが望ましい。   The combining means 11 is to construct the synthesized speech signal 6 in the first audio signal 4 in one format and the second audio signal 5 in one format, for example, the coded second audio signal 5e. As shown in FIG. 13, each of the first audio signal 4 and the second audio signal 5 is a reproduction frequency spectrum that can be reproduced by the first audio reproduction means 8 although the frequency spectra of the two audio signals do not completely overlap. Like that. Therefore, the coupling which is frequency multiplexing is preferably performed by the coupling means 11 having an adder 15 which adds the first audio signal 4 and preferably the second audio signal 5 in the encoded form 5e.

加算する前に、第1音声信号4に第1ゲイン(gain)を、第2音声信号5に第2ゲインを適用するのが好ましい。ゲインは、その前後いずれかで、音声信号の一方が減衰するのを補うことができる。コード化第2音声信号5eを、一般的な聴覚曲線Cの下方にあって見えなくするため、第2ゲインは第1ゲインより低いことが望ましい。   Before the addition, it is preferable to apply a first gain to the first audio signal 4 and a second gain to the second audio signal 5. The gain can compensate for attenuation of one of the audio signals either before or after. In order to hide the coded second audio signal 5e below the general auditory curve C, the second gain is preferably lower than the first gain.

結合操作を行う前に、第1音声信号4は、周波数スペクトルを修正して高い周波数部分を取り除くのが好ましい。図6及び7に、この周波数スペクトル修正を説明している。この操作は、第1音声信号4の周波数スペクトルの高域部分4cを取り除き、低域部分4bだけにする。周波数F1は、周波数スペクトルの上限を決定して高域部分4cから低域部分4bを切り離すように選定される。F1の値を選定することで、第1音声信号4の品質の劣化、第2音声信号5で利用可能な「スペース」、及び第1音声信号4と第2音声信号5の間で干渉するリスクが決定される。固有振動数F1をもつ低域通過フィルター33で、この操作を良好に実行することができる。低域通過フィルター33は、結合手段11に組み込まれるか、あるいはさらに図2に示されているように、結合手段11の入力側に別の手段で組み込んでもよい。図7に示すように、第1音声信号の低域部分4bは、コード化された形式5eにある第2音声信号5と有利に結合される。   Prior to performing the combining operation, the first audio signal 4 is preferably freed from high frequency parts by modifying the frequency spectrum. 6 and 7 illustrate this frequency spectrum correction. This operation removes the high frequency part 4c of the frequency spectrum of the first audio signal 4 and makes only the low frequency part 4b. The frequency F1 is selected so as to determine the upper limit of the frequency spectrum and separate the low-frequency portion 4b from the high-frequency portion 4c. By selecting the value of F1, the quality degradation of the first audio signal 4, the “space” available for the second audio signal 5, and the risk of interference between the first audio signal 4 and the second audio signal 5 Is determined. This operation can be satisfactorily performed by the low-pass filter 33 having the natural frequency F1. The low-pass filter 33 may be incorporated in the coupling means 11 or may be incorporated by another means on the input side of the coupling means 11 as shown in FIG. As shown in FIG. 7, the low-frequency portion 4b of the first audio signal is advantageously combined with the second audio signal 5 in the encoded form 5e.

図13に示すように、高域部分4cを取り除くことにより空いた周波数スペクトル部分は、2つの音声信号が重ならず、そして従来の再生手段により再生できる再生周波数スペクトルの帯域幅と重ならずに、コード化形式5eにある第2音声信号5を配置するに利用される。周波数F1は、コード化第2音声信号5eが前記再生周波数スペクトルの中にあるように選定される。第2音声信号が予め縮小されているならば、基本形式4aから取り除かれる高域部分4cは、狭い幅であることが望ましい。さらに、高周波に相当する周波数スペクトルのこの領域は、人の耳7により感知される音質の点から大して重要ではない。このため、第1音声信号4の高域部分4cを取り除き、低域部分4bのみとすることは、人の耳7で感知される第1音声信号4を僅かに変えるのみであり、第2音声信号5と第1音声信号4との結合を非常に容易にすることになる。   As shown in FIG. 13, the frequency spectrum portion vacated by removing the high frequency portion 4c does not overlap the two audio signals and does not overlap the bandwidth of the reproduction frequency spectrum that can be reproduced by the conventional reproduction means. This is used to arrange the second audio signal 5 in the encoding format 5e. The frequency F1 is selected such that the coded second audio signal 5e is in the reproduction frequency spectrum. If the second audio signal has been reduced in advance, the high frequency portion 4c removed from the basic format 4a is preferably narrow. Furthermore, this region of the frequency spectrum corresponding to high frequencies is not very important in terms of the sound quality perceived by the human ear 7. For this reason, removing the high frequency portion 4c of the first audio signal 4 and using only the low frequency portion 4b only slightly changes the first audio signal 4 sensed by the human ear 7, and the second audio This makes it very easy to combine the signal 5 and the first audio signal 4.

特定の実施の形態において、合成音声信号6に、少なくとも所定のレシーバー3が識別することができる識別コードを加えることができる。この実施の形態において、本システムは、少なくともプロデューサー1、少なくともトランスミッター2、及び複数のレシーバー3を備えている。複数のレシーバー3は、それぞれそれ自身の識別コードにより識別される。その識別コードは、それぞれレシーバー3毎に異なるか、又は同じ第2音声信号5を再生することを意図する一つの「ファミリー」にある複数のレシーバー3に共通であってもよい。プロデューサー1により第2音声信号5を生成し、トランスミッター2により送信するときに、後者の音声信号には、第2音声信号5が再生される前にレシーバーに対応する識別コードが合成音声信号6中に加えられる。送信されてきた識別コードが、自身の識別コードと対応しないレシーバー3は、第2音声信号5を受信するが、それを再生しない。   In a particular embodiment, an identification code that can be identified by at least a given receiver 3 can be added to the synthesized speech signal 6. In this embodiment, the system includes at least a producer 1, at least a transmitter 2, and a plurality of receivers 3. Each of the plurality of receivers 3 is identified by its own identification code. The identification code may be different for each receiver 3 or may be common to a plurality of receivers 3 in one “family” intended to reproduce the same second audio signal 5. When the second audio signal 5 is generated by the producer 1 and transmitted by the transmitter 2, the latter audio signal has an identification code corresponding to the receiver in the synthesized audio signal 6 before the second audio signal 5 is reproduced. Added to. The receiver 3 in which the transmitted identification code does not correspond to its own identification code receives the second audio signal 5 but does not reproduce it.

別のオプションによる実施の形態では、《ブロードキャスト》という語の識別コードで限定している。この識別コードは、特定したレシーバー3に割り当てられていないが、合成音声信号6に挿入されてのみ使用される。その識別コードが正しいかどうかに拘わらず全てのレシーバー3が、同じレシーバー3に対応する識別コードとして認知し、そのレシーバー3が《ブロードキャスト》コードをもつ第2音声信号5を再生することができる。当業者であれば、例えばアドレス化あるいはマスキングの技術を用いて、複数のレシーバー3に部分集合するように識別コードを使用して、今示したことを一般化させるのは容易である。   In another optional embodiment, it is limited by an identification code of the word “Broadcast”. This identification code is not assigned to the specified receiver 3, but is used only by being inserted into the synthesized speech signal 6. Regardless of whether or not the identification code is correct, all receivers 3 can recognize the identification code corresponding to the same receiver 3, and the receiver 3 can reproduce the second audio signal 5 having the << broadcast >> code. It is easy for a person skilled in the art to generalize what has just been shown, using identification codes to subset into a plurality of receivers 3, for example using addressing or masking techniques.

合成音声信号6への識別コード挿入は、当業者に周知の全ての手段により行うことができる。一実施の形態において、この挿入は、指令信号35を形成する第3音声信号を結合することにより行うことができる。図15は、このような指令信号35の周波数スペクトルを示している。この信号は、以下に説明するように、二進指令にコード化して第3の音声信号の形態としている。図15に示すように、この信号は、限定され、高い周波数Fcmdをもつ周波数スペクトルであり、第1音声信号4と第2音声信号5と一緒になって合成音声信号6とすることができる。指令信号35の周波数Fcmdは、コード化第2音声信号5eの周波数スペクトルの高周波より高くなるように決定される。しかし、周波数Fcmdは、ブラウン管から出る周波数、すなわちPALモードで15625Hz及びNTSCモードで15734Hzより低くなるように決定される。次いで、指令信号35は、周波数多重化により第1音声信号4とコード化第2音声信号5eと結合して合成音声信号6を形成する。図16は、このような合成音声信号6を示している。以上説明したように、合成音声信号6は、これまで説明してきた合成音声信号6と同じく、従来の音声再生装置がもつ再生周波数スペクトルに完全に含まれる音声信号である。従って、スピーカーなどの再生機器は、人の耳に聞こえない方法で、しかし以下に説明するようにレシーバーで使用可能な方法で、第2音声信号5eと指令信号35の成分を完全に再生する。他の全ての観点で、合成音声信号6は、2つ又は3つの信号の結合による信号として理解しなければならない。   The identification code can be inserted into the synthesized speech signal 6 by any means known to those skilled in the art. In one embodiment, this insertion can be done by combining the third audio signal forming the command signal 35. FIG. 15 shows the frequency spectrum of such a command signal 35. As will be described below, this signal is coded into a binary command and is in the form of a third audio signal. As shown in FIG. 15, this signal is a limited frequency spectrum having a high frequency Fcmd, and can be combined with the first audio signal 4 and the second audio signal 5 to form a synthesized audio signal 6. The frequency Fcmd of the command signal 35 is determined to be higher than the high frequency of the frequency spectrum of the coded second audio signal 5e. However, the frequency Fcmd is determined to be lower than the frequency emanating from the cathode ray tube, that is, 15625 Hz in the PAL mode and 15734 Hz in the NTSC mode. The command signal 35 is then combined with the first audio signal 4 and the encoded second audio signal 5e by frequency multiplexing to form a synthesized audio signal 6. FIG. 16 shows such a synthesized speech signal 6. As described above, the synthesized audio signal 6 is an audio signal that is completely included in the reproduction frequency spectrum of the conventional audio reproducing apparatus, like the synthesized audio signal 6 described so far. Accordingly, a playback device such as a speaker completely reproduces the components of the second audio signal 5e and the command signal 35 in a manner that cannot be heard by human ears, but in a manner that can be used by a receiver as described below. In all other respects, the synthesized speech signal 6 must be understood as a signal resulting from the combination of two or three signals.

二進指令は、パルス幅変調により前記指令信号35をコード化するに適している。この変調は、AES−42規格に記載されている。Nbが“ビット時間”といわれる変調時間を決定する整数、F’pが変調搬送波の周波数、Feが信号のサンプルの周波数、gが可変パワーパラメータとすれば、ビット0は、パルスv(n)=g.cos(2nп(F’p/Fe))によりn=0..Nb/4−Iとコード化され、v(n)=0はn==Nb..Nb−Iにコード化され、ビット1は、パルスv(n)=g.cos(2nп(F’p/Fe))によりn=0..3Nb/4−1とコード化され、v(n)=0はn=3Nb/4..Nb−1とコード化される。従って、Fe=48kHz、Nb=1536と共に、F’p=14.625kHzを選ぶことにより、31.25bits/sの情報が得られる。   The binary command is suitable for encoding the command signal 35 by pulse width modulation. This modulation is described in the AES-42 standard. If Nb is an integer that determines the modulation time referred to as the “bit time”, F′p is the frequency of the modulated carrier, Fe is the frequency of the signal sample, and g is the variable power parameter, bit 0 is the pulse v (n) = G. cos (2nп (F'p / Fe)) where n = 0. . Nb / 4-I, v (n) = 0 is n == Nb. . Nb-I, bit 1 is pulse v (n) = g. cos (2nп (F'p / Fe)) where n = 0. . 3 (Nb / 4-1) and v (n) = 0 is n = 3Nb / 4. . It is encoded as Nb-1. Therefore, by selecting F′p = 14.625 kHz together with Fe = 48 kHz and Nb = 1536, information of 31.25 bits / s can be obtained.

図2を参照して、プロデューサー1で作られた合成音声信号6は、次いでトランスミッター2へ転送される。結合手段11の出力で、プロデューサー1は、選択により直接接続30、再生接続31するエメッター26、あるいは合成音声信号が後で使用されることを意図しないときは記録媒体24への記録手段32を選択してとる。再生接続31は、当業者には周知の如何なる接続方法でもよく、ケーブルまたは無線、アナログまたはデジタルタイプで実施できる。例として、ラジオやテレビジョンの放送、あるいはUSBやADSLなどで接続してのFM再生による送信がある。記録媒体24は、例えば、アナログまたはデジタル音声信号を記録することができる周知のオーディオカセット、ビデオカセット(VHSなど)、DVD、CD、CD−ROM、その他同等の媒体を使用することもできる。合成音声信号6は、その1つの形式でトランスミッター2へ送信される。   With reference to FIG. 2, the synthesized voice signal 6 produced by the producer 1 is then transferred to the transmitter 2. At the output of the coupling means 11, the producer 1 selects the direct connection 30, the emmetr 26 for playback connection 31, or the recording means 32 to the recording medium 24 when the synthesized audio signal is not intended for later use. Take it. The regenerative connection 31 can be any connection method known to those skilled in the art and can be implemented in a cable or wireless, analog or digital type. Examples include radio and television broadcasts, or transmission by FM playback connected via USB or ADSL. As the recording medium 24, for example, a well-known audio cassette, video cassette (such as VHS), DVD, CD, CD-ROM, or other equivalent medium capable of recording analog or digital audio signals can be used. The synthesized speech signal 6 is transmitted to the transmitter 2 in that one format.

図3は、トランスミッター2の詳細である。トランスミッター2の入口には、プロデューサー1で生成された合成音声信号6を受ける応答手段がある。この応答手段は、直接接続30、再生接続31するエメッター26に対応できるレシーバー27、あるいは記録媒体24を読み取ることができる読み取り手段25である。   FIG. 3 shows details of the transmitter 2. At the entrance of the transmitter 2, there is a response means for receiving the synthesized voice signal 6 generated by the producer 1. This response means is a receiver 27 that can correspond to the direct connection 30, the emmetter 26 that is the reproduction connection 31, or a reading means 25 that can read the recording medium 24.

別の実施の形態では、プロデューサー1は、トランスミッター2に統合されている。
トランスミッター2は、第1音声信号4を再生するために第1再生機能を持っている。これを実施するには、第1音声再生手段8が必須である。第1音声再生手段8は、通常、少なくとも1つのスピーカー、あるいは他の同様の装置を有している。さらに、音声を再生する前に音声信号を形成するに必要な要素をもつ処理手段29をもつのがよい。ここで、処理手段29は、記録媒体24を読み取り、信号を第1音声再生手段8によって再生できる形式にするに必要な手段を有している。これらの手段は、当業者には周知であり、従来技術であって、本発明の一部を構成するものではない。
In another embodiment, the producer 1 is integrated into the transmitter 2.
The transmitter 2 has a first reproduction function for reproducing the first audio signal 4. In order to implement this, the first sound reproduction means 8 is essential. The first sound reproduction means 8 usually has at least one speaker or other similar device. Furthermore, it is preferable to have a processing means 29 having elements necessary for forming an audio signal before reproducing the audio. Here, the processing means 29 has means necessary for reading the recording medium 24 and converting the signal into a format that can be reproduced by the first sound reproducing means 8. These means are well known to those skilled in the art and are prior art and do not form part of the present invention.

これらの要素は、従来からあるもので、本発明を実行するために変更する必要のないものであることに注意されたい。合成音声信号6は、従来の音声信号の基本形式4a(図5)あるいは5a(図8)の属性をすべて持っている。それ故、音声を再生する目的は、従来の第1音声再生手段8により達することができる。従って、トランスミッター2は、本発明により変更する必要がない。既存の全ての音声再生装置が、本発明で使用できる。カセットプレーヤー、テレビジョン、オーディオまたはビデオ音声再生装置が使用可能である。入力された音声信号を、オーディオビジュアル手段に入力して、合成音声信号6に変えるだけで十分である。従来のテレビジョンは、テレビ放送あるいはケーブル・ネットワークから受信した音声信号に代わって、合成音声信号6にすれば、合成音声信号6を再生することができる。同様にして、DVDプレーヤーは、合成音声信号6をサウンドトラックの代わりにDVDに記録して再生することができる。   It should be noted that these elements are conventional and need not be changed in order to practice the present invention. The synthesized speech signal 6 has all the attributes of the basic format 4a (FIG. 5) or 5a (FIG. 8) of the conventional speech signal. Therefore, the purpose of reproducing sound can be achieved by the conventional first sound reproducing means 8. Thus, the transmitter 2 does not need to be modified according to the present invention. All existing audio playback devices can be used with the present invention. Cassette players, televisions, audio or video audio playback devices can be used. It is sufficient to input the input audio signal to the audiovisual means and change it to the synthesized audio signal 6. The conventional television can reproduce the synthesized audio signal 6 by using the synthesized audio signal 6 instead of the audio signal received from the television broadcast or the cable network. Similarly, the DVD player can record and reproduce the synthesized audio signal 6 on a DVD instead of a sound track.

トランスミッター2の第1音声再生手段8で再生するとき、図13に示したような合成音声信号6の全成分、すなわち、第1音声信号4由来の成分4b、第2音声信号5由来の成分5e、場合よっては指令信号35由来の成分までもが再生される。しかしながら、図13に示した一般的な聴覚曲線Cを考慮して、曲線Cの上域に位置する部分だけが、人の耳7に聞こえて認識することができる。第1音声信号4の大部分は、低域部分4bをしていて曲線Cの上域にあり、人の耳7に聞こえる。さらに、曲線Cの上にある部分は、基本形式4a(図5)の形体にある第1音声信号4だけと実質同じである。その結果、人の耳7には、第1音声再生手段8が、基本形体4aの第1音声信号4だけを再生したのと実質的に同じ音声を聞くことになる。人の耳7には、トランスミッター2が第1音声信号4を再生したかのように聞こえる。この理由により、トランスミッター2は、また第1音声再生装置とも呼ばれる。
第2音声信号5は、コード化された形式5eにあり、指令信号35とともに一般的な聴覚曲線Cの完全に下域に位置して、通常、人の耳7に認識されず、聞き取れないままである。
When reproduction is performed by the first audio reproduction means 8 of the transmitter 2, all components of the synthesized audio signal 6 as shown in FIG. 13, that is, the component 4 b derived from the first audio signal 4 and the component 5 e derived from the second audio signal 5. In some cases, even components derived from the command signal 35 are reproduced. However, in consideration of the general auditory curve C shown in FIG. 13, only the portion located in the upper region of the curve C can be heard and recognized by the human ear 7. Most of the first audio signal 4 has a low frequency portion 4b and is above the curve C and is heard by the human ear 7. Further, the portion above the curve C is substantially the same as only the first audio signal 4 in the form of the basic format 4a (FIG. 5). As a result, the human ear 7 hears substantially the same sound as the first sound reproducing means 8 reproduces only the first sound signal 4 of the basic form 4a. The human ear 7 sounds as if the transmitter 2 had reproduced the first audio signal 4. For this reason, the transmitter 2 is also referred to as a first audio playback device.
The second audio signal 5 is in the encoded form 5e, and is located completely below the general auditory curve C together with the command signal 35 and is usually not recognized by the human ear 7 and remains inaudible. It is.

しかしながら、合成音声信号6において、第2音声信号5に由来し、人に聞こえないコード化第2音声信号5eにコード化された部分、および場合によっては指令信号35は、良好に再生されることは注目すべきである。   However, in the synthesized voice signal 6, the portion that is derived from the second voice signal 5 and coded in the coded second voice signal 5 e that cannot be heard by humans, and in some cases, the command signal 35 is reproduced well. Should be noted.

図4は、本発明によるレシーバー3、第2音声再生装置、の実施の形態の詳細である。レシーバー3は、合成音声信号6を受信し、第2音声信号5を場合によってはコード化された形式5eで抽出し、および指令信号35を抽出する。この目的のために、レシーバー3は、合成音声信号6の受信手段16と、合成音声信号6に結合されている第2音声信号5、5eと指令信号35を抽出する抽出手段17をもっている。この目的のために、受信手段16は、少なくとも第2音声信号5、5eおよび指令信号35を含んでいる合成音声信号の周波数スペクトル部分をカバーできる帯域を持っている。受信手段16は、第1音声信号4に相当するスペクトル部分をもつ必要がないことは指摘できる。反対に、受信手段16は、人の耳7と異なり、第2音声信号5、5eと指令信号35をもつ合成音声信号6の高周波数スペクトル部分を受け取ることができることは、本発明の本質的な特徴である。   FIG. 4 shows details of an embodiment of the receiver 3 and the second sound reproducing device according to the present invention. The receiver 3 receives the synthesized speech signal 6, extracts the second speech signal 5 in possibly coded form 5e, and extracts the command signal 35. For this purpose, the receiver 3 has a receiving means 16 for the synthesized speech signal 6 and an extracting means 17 for extracting the second speech signals 5 and 5e coupled to the synthesized speech signal 6 and the command signal 35. For this purpose, the receiving means 16 has a band that can cover the frequency spectrum part of the synthesized speech signal including at least the second speech signals 5, 5 e and the command signal 35. It can be pointed out that the receiving means 16 need not have a spectral portion corresponding to the first audio signal 4. On the contrary, the receiving means 16, unlike the human ear 7, can receive a high frequency spectral portion of the synthesized speech signal 6 having the second speech signals 5, 5 e and the command signal 35. It is a feature.

第1の実施の形態では、受信手段16は、第2音声信号5、5e由来の部分と指令信号35由来の部分を含む合成音声信号6の周波数スペクトルの一部を受信する。次いで、抽出手段17は、受信した信号から有用な部分だけを分離する。それ故、抽出手段17は、典型的には帯域フィルターである。図14は、抽出段階を示している。コード化第2音声信号5eとなっている第2音声信号5は、受信した周波数スペクトルから、2つの周波数F2とF3の間の周波数スペクトル部分のみが抽出される。ここに示していないが同様に、指令信号35は、暗号化された2つの周波数間の周波数スペクトル部分だけが抽出される。   In the first embodiment, the receiving means 16 receives a part of the frequency spectrum of the synthesized speech signal 6 including a portion derived from the second speech signals 5 and 5e and a portion derived from the command signal 35. The extraction means 17 then separates only useful parts from the received signal. Therefore, the extraction means 17 is typically a bandpass filter. FIG. 14 shows the extraction stage. In the second audio signal 5 which is the encoded second audio signal 5e, only the frequency spectrum portion between the two frequencies F2 and F3 is extracted from the received frequency spectrum. Similarly, although not shown here, only the frequency spectrum portion between two encrypted frequencies is extracted from the command signal 35.

別の第2の実施の形態では、抽出手段17は、前述の受信手段16と一緒にして、2つの周波数F2とF3間のスペクトル部分に相当する帯域を持っていて、受信手段16は、コード化第2音声信号5eおよび指令信号35の各々と関係付けることができる。受信手段16は、典型的にはマイクロホンである。   In another second embodiment, the extraction means 17 has a band corresponding to the spectral portion between the two frequencies F2 and F3 together with the reception means 16, and the reception means 16 The second audio signal 5e and the command signal 35 can be related to each other. The receiving means 16 is typically a microphone.

レシーバー3は、さらにデコード化手段18をもっている。デコード化手段18は、コード化第2音声信号5eをデコード処理することができ、第2音声信号5をその基本形式5aに再構築する。レシーバー3は、さらに、第2音声信号基本形式5aを聞こえるように再生する第2音声再生手段9をもっている。   The receiver 3 further has decoding means 18. The decoding means 18 can decode the encoded second audio signal 5e, and reconstructs the second audio signal 5 into its basic format 5a. The receiver 3 further has second sound reproduction means 9 for reproducing the second sound signal basic format 5a so as to be heard.

第2音声信号5に適用される種々の処理形態(コード化、暗号化、縮小化、送信、受理など)は、アナログあるいはデジタルで実行できることは、当業者の人は本発明から容易に推測できるであろう。同様に、どのような技術が採用されようと、処理時間が非常に短く、無視できる遅れであることは明らかである。第2音声再生手段9によって再生させるために、第2音声信号5をトランスミッター2からレシーバー3まで送信し、再生することは、リアルタイムで実質的に同時に行える。   Those skilled in the art can easily infer from the present invention that various processing forms (encoding, encryption, reduction, transmission, acceptance, etc.) applied to the second audio signal 5 can be executed in analog or digital form. Will. Similarly, no matter what technique is adopted, it is clear that the processing time is very short and can be ignored. The second audio signal 5 is transmitted from the transmitter 2 to the receiver 3 for reproduction by the second audio reproduction means 9 and can be reproduced substantially simultaneously in real time.

合成音声信号6中の第1音声信号4と第2音声信号5の周波数分離を行うことで、2つの音声信号4、5を同時に使用できるようにすることは、当業者は気が付くであろう。それ故、レシーバー/玩具は、トランスミッター/テレビジョンが、その音声信号を再生すると同時に、次に誰が誰に話すかの順番や取り決めなしに心いくまで「話す」または「歌う」ことができる。   Those skilled in the art will realize that the two audio signals 4 and 5 can be used simultaneously by performing frequency separation of the first audio signal 4 and the second audio signal 5 in the synthesized audio signal 6. Therefore, the receiver / toy can “speak” or “sing” until the transmitter / television plays its audio signal, and at the same time without any order or arrangement of who speaks to who.

デコード化手段18は、多様な形式で実施できるが、好ましくはコード化手段10と対応した対称操作で行い、コード化手段10でのコード化操作とは逆の順序でデコード操作を行う。   Although the decoding means 18 can be implemented in various forms, it is preferably performed by a symmetric operation corresponding to the encoding means 10, and the decoding operation is performed in the reverse order to the encoding operation in the encoding means 10.

周波数シフト段階は、コード化には不可欠であり、デコード化手段18には、コード化第2音声信号5eの第2周波数シフト手段21を必要としている。第1周波数シフト手段12は、高周波数方向にΔ周波数シフトを行うが、第2周波数シフト手段21は、低周波数方向に同じくΔ周波数シフトを行う。この段階は、音声信号を聞こえるように再構築するもので、第1周波数シフト手段12は、好ましくは周波数多重化装置で実行できるように、第2周波数シフト手段21は、周波数分割装置(diviseur de frequence)で有利に行える。デコード化手段18および関連するその他段階では、コード化手段10に対称の手段があると同じ程にその他要素があり、これらは任意に選択できる。   The frequency shift stage is indispensable for encoding, and the decoding means 18 requires the second frequency shift means 21 for the encoded second audio signal 5e. The first frequency shift means 12 performs Δ frequency shift in the high frequency direction, while the second frequency shift means 21 similarly performs Δ frequency shift in the low frequency direction. This stage reconstructs the audio signal so that it can be heard. The second frequency shift means 21 is preferably a frequency demultiplexer so that the first frequency shift means 12 can preferably be executed by a frequency multiplexer. frequency). In the decoding means 18 and other related stages, there are as many other elements as there are symmetrical means in the encoding means 10, which can be arbitrarily selected.

従って、コード化手段10が帯域縮小手段13を有しているとき、デコード手段18は、必要ならば帯域縮小手段13の逆である帯域回復手段20を有し、さらに、コード化手段10が暗号化手段14を有しているとき、デコード化手段18は前述の暗号化手段14の逆である暗合解読手段19を有している。   Therefore, when the encoding means 10 has the bandwidth reduction means 13, the decoding means 18 has a bandwidth recovery means 20 that is the reverse of the bandwidth reduction means 13 if necessary. When having the encryption means 14, the decoding means 18 has an encryption / decryption means 19 that is the reverse of the encryption means 14 described above.

コード化手段10の暗号化手段14が、第2音声信号5の周波数スペクトルのポジティブ部分5dを取り除き、ネガティブ部分5cだけを保持している場合、暗号解読手段19は、ポジティブ部分5dとネガティブ部分5cよりなる全周波数スペクトルをもつ縮小スペクトル音声信号5bの再構築手段22を有している。このような再構築手段22は、例えば、縦軸に対して対称であることを考慮してネガティブ部分5cからポジティブ部分5dを再構築できる《鏡》手段である。   When the encryption means 14 of the encoding means 10 removes the positive part 5d of the frequency spectrum of the second audio signal 5 and retains only the negative part 5c, the decryption means 19 uses the positive part 5d and the negative part 5c. The reconstructing means 22 for the reduced spectrum speech signal 5b having the entire frequency spectrum is provided. Such reconstruction means 22 is, for example, << mirror >> means that can reconstruct the positive part 5d from the negative part 5c in consideration of symmetry with respect to the vertical axis.

当業界の人は、帯域縮小手段13/帯域回復手段20、周波数シフト手段12/21、および暗号化手段14/暗合解読手段19におけるコード化/デコード化手段、およびその他関連する種々のコード化手段/デコード化手段の順序は、いろいろ変えられることができることに気が付くであろう。従って、周波数シフト段階を行う前か後に周波数スペクトルを縮小するおよび/または暗号化する。当業界の人は、利用可能な手段の機能と、低周波で作動するか高周波で作動するかで操作の順序を決める。しかしながら、いずれの場合においても、デコード化の手段/操作の順序は、好ましくはコード化の手段/操作の順序の反対である。コード化第2音声信号5eを復調する簡単な方法は、Fp−FcとFcの間で通過帯域をフィルターし、次いで、cos(2nпFp/Fe)で掛け算して復調できる。   Those skilled in the art will recognize that the band reduction means 13 / band recovery means 20, the frequency shift means 12/21, the encoding / decoding means in the encryption means 14 / encryption decryption means 19, and various other related encoding means. It will be noted that the order of the decoding / decoding means can be varied. Thus, the frequency spectrum is reduced and / or encrypted before or after performing the frequency shift step. Persons in the industry determine the order of operations depending on the function of available means and whether they operate at low or high frequencies. However, in any case, the order of decoding means / operations is preferably the opposite of the order of encoding means / operations. A simple method of demodulating the encoded second audio signal 5e can be demodulated by filtering the passband between Fp-Fc and Fc and then multiplying by cos (2nпFp / Fe).

レシーバー3は、さらに、指令信号35を復調する復調手段(示されていない)を有して、2進指令を抽出できる。ここで上述したパルス幅変調によるコード化の例に戻って、この抽出は、次の段階を順次行うことで実施できる。
すなわち、合成音声信号6を、Δ=(F’p−Fp)/2としてF’p−Δ/2とF’p+Δ/2の間の通過帯域をフィルターし、二乗し、積算型フィルターによりフィルターし、山の頂点を探し、山が出たとき+Nb/2−δ(ここで、δは安全ファクターであり、Nb/16に等しい)にサンプリングし、このように検出されたビットをバッファーに保存する。
The receiver 3 further has demodulation means (not shown) for demodulating the command signal 35 and can extract a binary command. Returning to the example of coding by pulse width modulation described above, this extraction can be performed by sequentially performing the following steps.
That is, the synthesized speech signal 6 is filtered by a square filter after the pass band between F′p−Δ / 2 and F′p + Δ / 2 is set as Δ = (F′p−Fp) / 2, and is filtered by an integrating filter. Then look for the peak of the mountain, sample it to + Nb / 2-δ (where δ is a safety factor, equal to Nb / 16) when the mountain comes out, and store the bits thus detected in a buffer To do.

さらに、図4に示す好ましい実施の形態によれば、レシーバー3は、ゲイン適応制御手段23を有している。ゲイン適応制御手段23は、公知のゲイン適応制御方法によりデコード化手段18からの第2音声信号5に適用して、第2音声再生手段9で再生される第2音声信号5の音量を、受信手段16により受ける信号の大きさとは関係しないようにする。このようにして、トランスミッター2とレシーバー3の間の距離が変わることによる音量変化をなくし、一定音量で第2音声信号5の再生が可能となる。   Further, according to the preferred embodiment shown in FIG. 4, the receiver 3 has gain adaptive control means 23. The gain adaptive control means 23 receives the volume of the second audio signal 5 reproduced by the second audio reproduction means 9 by applying it to the second audio signal 5 from the decoding means 18 by a known gain adaptive control method. It is not related to the magnitude of the signal received by the means 16. In this way, the volume change due to the change in the distance between the transmitter 2 and the receiver 3 is eliminated, and the second audio signal 5 can be reproduced with a constant volume.

1つの有利な実施の形態では、本発明の装置が置かれている部屋のノイズを補償するために、受信方法による第2音声信号5の再生の前に、以下の方法でノイズ低減段階を行うことができる。
先ず、周囲のノイズを算定する。この算定は、サイレント時のノイズをベースにして所定間隔で行う。ここで、サイレント時は、トランスミッターが第1音声信号を再生せず、レシーバーが第2音声信号を再生していないときである。簡単な算定方法は、使用される音声帯域にパラメーター累乗を付してブランクノイズを決め、次いで、高速フーリエ変換法でノイズスペクトルを決定する。エフレ(Ephraim)とマラー(Malah)の演算式を適用し、予め規定した81×81マトリックス(−40dBから+40dBを1dB間隔)を用いてゲインを計算できる。最終段階で、逆高速フーリエ変換によってノイズ除去信号が決定される。これにより、レシーバーによって受け取られた信号からノイズを取り去り、ノイズの撹乱影響を抑えることができる。
In one advantageous embodiment, in order to compensate for the noise of the room in which the device of the invention is placed, before the reproduction of the second audio signal 5 by the receiving method, the noise reduction step is performed in the following way: be able to.
First, the ambient noise is calculated. This calculation is performed at predetermined intervals based on the noise during silent operation. Here, the silent time is a time when the transmitter does not reproduce the first audio signal and the receiver does not reproduce the second audio signal. In a simple calculation method, parameter noise is added to a voice band to be used to determine blank noise, and then a noise spectrum is determined by a fast Fourier transform method. Applying Ephrim and Malah equations, gain can be calculated using a pre-defined 81 × 81 matrix (-40 dB to +40 dB at 1 dB intervals). At the final stage, the denoising signal is determined by inverse fast Fourier transform. Thereby, noise can be removed from the signal received by the receiver, and the disturbance effect of noise can be suppressed.

これまでに見てきたように、合成音声信号6は、目的のレシーバー3の識別コードをもつことができる。次いで、レシーバー3は、好ましくはそれ自身の識別コードが割り当てられる。レシーバー3は、合成音声信号6と一緒に送信された識別コードの抽出手段を有している。レシーバー3は、送信された識別コードをそれ自身の識別コードと比較し、2つの識別コードが合致する場合のみ第2音声信号5を再生する。   As has been seen so far, the synthesized speech signal 6 can carry the identification code of the intended receiver 3. The receiver 3 is then preferably assigned its own identification code. The receiver 3 has means for extracting an identification code transmitted together with the synthesized speech signal 6. The receiver 3 compares the transmitted identification code with its own identification code, and reproduces the second audio signal 5 only when the two identification codes match.

《ブロードキャスト》という用語で特別に標識した識別コードは、全レシーバー3により対応する聴覚可能なレシーバー3として知られ、《ブロードキャスト》のコードが付いた信号を受信する場合には、第2音声信号5は、それ自身の識別コードが何であってもレシーバー3によって再生される。   The identification code specially labeled with the term << Broadcast >> is known as the audible receiver 3 corresponding to all receivers 3, and when receiving a signal with the code << Broadcast >>, the second audio signal 5 Is reproduced by the receiver 3 whatever its own identification code.

特別の実施の形態では、レシーバー3は、玩具に組合わさっている。この玩具は、例えば人形である。   In a special embodiment, the receiver 3 is associated with a toy. This toy is, for example, a doll.

本発明のシステムの全ブロック図である。1 is a full block diagram of a system of the present invention. 本発明のプロデューサーのブロック図である。It is a block diagram of the producer of this invention. 本発明のトランスミッタ−のブロック図である。It is a block diagram of the transmitter of this invention. 本発明のレシーバーブロック図である。It is a receiver block diagram of the present invention. 第1音声信号の周波数スペクトルを示している。The frequency spectrum of the 1st voice signal is shown. 第1音声信号の周波数スペクトルで、その高周波部分を除去することを示している。In the frequency spectrum of the first audio signal, the high frequency portion is removed. 高周波部分を除去した後の第1音声信号の周波数スペクトルを示している。The frequency spectrum of the 1st audio | voice signal after removing a high frequency part is shown. 第2音声信号の周波数スペクトルを示している。The frequency spectrum of the 2nd voice signal is shown. 縮小された第2音声信号の周波数スペクトルを示している。The frequency spectrum of the 2nd audio | voice signal reduced is shown. 全第2音声信号(ネガティブ部分およびポジティブ部分)の周波数スペクトルを示している。The frequency spectrum of all the second audio signals (negative part and positive part) is shown. 第2音声信号のネガティブ部分の周波数スペクトルを示している。The frequency spectrum of the negative part of the 2nd voice signal is shown. 高周波数にシフトさせた第2音声信号の周波数スペクトルを示している。The frequency spectrum of the 2nd audio | voice signal shifted to the high frequency is shown. 第1音声信号と第2音声信号が結合した合成音声信号の周波数スペクトルを示している。The frequency spectrum of the synthetic | combination audio | voice signal which the 1st audio | voice signal and the 2nd audio | voice signal couple | bonded is shown. 合成音声信号から第2音声信号を抽出する操作を示している。An operation for extracting the second audio signal from the synthesized audio signal is shown. 指令信号の周波数スペクトルを示している。The frequency spectrum of the command signal is shown. 第1音声信号が第2音声信号および指令信号を結合した合成音声信号の周波数スペクトルを示している。The first audio signal shows the frequency spectrum of the synthesized audio signal obtained by combining the second audio signal and the command signal.

Claims (28)

第1音声信号(4)と第2音声信号(5)から合成音声信号(6)を作り出す方法であって、
−第2音声信号(5)を、第1音声再生手段(8)により人の耳(7)に聞き取れない方法で再生できるコード化第2音声信号(5e)とするコード化段階、
−第1音声信号(4)が人の耳(7)に聞こえ、第2音声信号(5)が人の耳(7)に聞こえない方法で、第1音声信号(4)とコード化第2音声信号(5e)を結合して、第1音声再生手段(8)で再生できる合成音声信号(6)とする音声結合段階、を有することを特徴とする合成音声信号作成方法。
A method of creating a synthesized voice signal (6) from a first voice signal (4) and a second voice signal (5),
A coding step in which the second audio signal (5) is made into a coded second audio signal (5e) that can be reproduced in a manner inaudible to the human ear (7) by the first audio reproduction means (8);
The first audio signal (4) and the second audio signal (4) are encoded in a manner in which the first audio signal (4) is heard by the human ear (7) and the second audio signal (5) is not heard by the human ear (7). A method for generating a synthesized speech signal, comprising: a speech combining step for combining the speech signal (5e) into a synthesized speech signal (6) that can be reproduced by the first speech reproduction means (8).
前記コード化段階が、第2音声信号(5)の周波数を、第1音声再生手段(8)の再生周波数スペクトルで人に聞こえない高周波にシフトさせる周波数シフト段階を有することを特徴とする請求項1に記載の合成音声信号作成方法。   The coding step comprises a frequency shift step of shifting the frequency of the second audio signal (5) to a high frequency that cannot be heard by humans in the reproduction frequency spectrum of the first audio reproduction means (8). The synthetic speech signal creation method according to 1. 前記コード化段階が、第2音声信号(5)の帯域縮小段階を有することを特徴とする請求項1または2に記載の合成音声信号作成方法。   The method according to claim 1 or 2, wherein the encoding step includes a band reduction step of the second audio signal (5). 前記コード化段階が、暗号化段階を有することを特徴とする請求項1乃至3のいずれか1項に記載の合成音声信号作成方法。   4. The method according to claim 1, wherein the encoding step includes an encryption step. 前記暗号化段階が、第2音声信号(5)の周波数スペクトルのポジティブ部分(5d)を除去し、ネガティブ部分だけ残す段階を有することを特徴とする請求項4に記載の合成音声信号作成方法。   5. A method according to claim 4, wherein the step of encrypting comprises removing the positive part (5d) of the frequency spectrum of the second speech signal (5) and leaving only the negative part. 前記音声結合段階が、第1音声信号(4)とコード化第2音声信号(5e)を結合させることを特徴とする請求項1乃至5のいずれか1項に記載の合成音声信号作成方法。   6. The method according to claim 1, wherein the voice combining step combines the first voice signal (4) and the coded second voice signal (5 e). 7. 前記音声結合段階が、前記第1音声信号(4)と前記コード化第2音声信号(5e)を結合させる前に、前記第1音声信号に第1ゲインを与え、前記コード化第2音声信号(5e)に第2ゲインを与えることを特徴とする請求項1乃至6のいずれか1項に記載の合成音声信号作成方法。   The voice combining step applies a first gain to the first voice signal before combining the first voice signal (4) and the coded second voice signal (5e), and the coded second voice signal. The method according to claim 1, wherein a second gain is given to (5e). 前記第2ゲインが、第1ゲインより低いことを特徴とする請求項7に記載の合成音声信号作成方法。   The method according to claim 7, wherein the second gain is lower than the first gain. 前記音声結合段階が、結合前の第1音声信号(4)の周波数スペクトルの高周波部分(4c)を除去し、低周波部分(4d)だけを保持する段階を有することを特徴とする請求項1乃至8いずれか1項に記載の合成音声信号作成方法。   2. The voice combining step includes the step of removing the high frequency portion (4c) of the frequency spectrum of the first audio signal (4) before combining and retaining only the low frequency portion (4d). The synthetic | combination audio | voice signal preparation method of any one of thru | or 8. 前記音声結合段階が、さらに周波数Fcmdで指令信号(35)を加える結合段階を有することを特徴とする請求項1乃至9いずれか1項に記載の合成音声信号作成方法。   10. The synthesized speech signal generation method according to claim 1, wherein the speech combining step further includes a combining step of adding a command signal (35) at a frequency Fcmd. 前記周波数Fcmdが、コード化第2音声信号(5e)より高波長で、PAL信号で15625Hzより低周波数であり、NTSC信号で15734Hzより低周波数であることを特徴とする請求項10に記載の合成音声信号作成方法。   11. Synthesis according to claim 10, characterized in that the frequency Fcmd has a higher wavelength than the coded second audio signal (5e), a frequency lower than 15625 Hz for the PAL signal and lower than 15734 Hz for the NTSC signal. Audio signal creation method. 前記指令信号(35)が、31.25ビット/秒でパルス幅変調されてコード化された2進指令であることを特徴とする請求項10または11に記載の合成音声信号作成方法。   12. A method according to claim 10 or 11, wherein the command signal (35) is a binary command coded by pulse width modulation at 31.25 bits / second. 請求項1乃至9のいずれか1項に記載の合成音声信号作成方法により得られたことを特徴とする合成音声信号(6)。   A synthesized speech signal (6) obtained by the synthesized speech signal creation method according to any one of claims 1 to 9. 請求項10によることを特徴とする合成音声信号(6)の記録媒体(24)。   Recording medium (24) of a synthesized speech signal (6), characterized in that it is according to claim 10. 請求項13による合成音声信号(6)を作成することを特徴とするプロデューサー(1)。   Producer (1), characterized in that it produces a synthesized speech signal (6) according to claim 13. 第1音声信号(4)の再生および第2音声信号(5)と指令信号(35)の無線送信方法であって、
第1音声信号(4)、第2音声信号(5)、さらに場合により指令信号(35)から請求項12による合成音声信号(6)の生成と、第1音声再生手段(8)による前記合成音声信号(6)の音声再生と、を有することを特徴とする音声再生および音声送信方法。
A method of reproducing the first audio signal (4) and wirelessly transmitting the second audio signal (5) and the command signal (35),
Generation of the synthesized voice signal (6) according to claim 12 from the first voice signal (4), the second voice signal (5), and possibly the command signal (35), and the synthesis by the first voice reproduction means (8). A voice reproduction and voice transmission method comprising: voice reproduction of an audio signal (6).
請求項13による合成音声信号(6)の受信方法であって、
―合成音声信号(6)を受信し、
―合成音声信号(6)からコード化第2音声信号(5e)を抽出し、
―コード化第2音声信号(5e)をデコードして、第2音声信号を再構築し、
―第2音声信号(5)を再生する、の段階を有することを特徴とする音声受信方法。
A method for receiving a synthesized speech signal (6) according to claim 13, comprising:
-Receive the synthesized voice signal (6)
-Extracting the encoded second audio signal (5e) from the synthesized audio signal (6),
-Decoding the encoded second audio signal (5e) and reconstructing the second audio signal;
An audio receiving method comprising the step of reproducing the second audio signal (5);
さらに、―合成音声信号(6)から指令信号(35)の抽出し、
―指令信号(35)を復調して2進法指令を再構築する、の段階を有することを特徴とする請求項17記載の音声受信方法。
Furthermore, the command signal (35) is extracted from the synthesized speech signal (6),
18. The method according to claim 17, further comprising the step of demodulating the command signal (35) to reconstruct a binary command.
前記デコード化段階または復調化段階が、請求項1乃至12のいずれか1項に記載の合成音声信号作成方法におけるコード化または変調段階に対して対称の段階を有することを特徴とする請求項17または18に記載の音声受信方法。   18. The decoding step or the demodulating step has a step symmetric with respect to a coding or modulation step in the synthetic speech signal creation method according to claim 1. Or the audio | voice receiving method of 18. 前記暗号解読手段は、第2音声信号(5)の周波数スペクトルのネガティブ部分(5c)から、第2音声信号(5)のポジティブ部分(5d)を再構築する《鏡》変換を有することを特徴とする請求項17乃至19のいずれか1項に記載の音声受信方法。   The decryption means has a << mirror >> transform that reconstructs the positive part (5d) of the second audio signal (5) from the negative part (5c) of the frequency spectrum of the second audio signal (5). The voice receiving method according to any one of claims 17 to 19. 前記音声再生段階の前に、ゲイン利得制御段階が第2音声信号(5)に適用されることを特徴とする請求項17乃至20のいずれか1項に記載の音声受信方法。   21. The audio receiving method according to claim 17, wherein a gain / gain control step is applied to the second audio signal (5) before the audio reproduction step. さらに、再生前に、ノイズスペクトルの推定から第2音声信号(5)のノイズ除去段階を有することを特徴とする請求項17乃至21のいずれか1項に記載の音声受信方法。   22. The audio receiving method according to any one of claims 17 to 21, further comprising a noise removing step of the second audio signal (5) from the estimation of the noise spectrum before reproduction. 前記ノイズスペクトルは、静寂期に規則的に測定されるか、ブランクノイズとして扱われることを特徴とする請求項22に記載の音声受信方法。   The voice receiving method according to claim 22, wherein the noise spectrum is regularly measured in a quiet period or treated as blank noise. レシーバー(3)は、それ自身の識別コードを持ち、少なくとも意図するレシーバー(3)を識別する識別コードは、合成音声信号(6)から抽出され、自身の識別コードと、合成音声信号(6)から抽出された識別コードとが対応しているときのみ、レシーバー(3)は第2音声信号(5)を再生することを特徴とする請求項17乃至23のいずれか1項に記載の音声受信方法。   The receiver (3) has its own identification code, and an identification code for identifying at least the intended receiver (3) is extracted from the synthesized speech signal (6), and the identification code and the synthesized speech signal (6) are identified. 24. Audio reception according to any one of claims 17 to 23, characterized in that the receiver (3) reproduces the second audio signal (5) only when the identification code extracted from is compatible. Method. 識別コード《ブロードキャスト》は全てのレシーバー(3)に対応し、識別コード《ブロードキャスト》が抽出されて、第2音声信号(5)が再生されることを特徴とする請求項22に記載の音声受信方法。   Audio reception according to claim 22, characterized in that the identification code << broadcast >> corresponds to all receivers (3), the identification code << broadcast >> is extracted and the second audio signal (5) is reproduced. Method. 請求項13によって合成音声信号(6)を受信し、請求項17乃至25のいずれか1項に記載の音声受信方法を実施できることを特徴とするレシーバー(3)。   Receiver (3), characterized in that it receives a synthesized speech signal (6) according to claim 13 and can implement the speech reception method according to any one of claims 17 to 25. 請求項26に記載のレシーバー(3)を有することを特徴とする玩具。   A toy comprising a receiver (3) according to claim 26. 第1音声信号(4)と第2音声信号(5)の再生システムであって、
−請求項13による合成音声信号(6)を生成し、この合成音声信号(6)を送信する請求項15のプロデューサー(1)、
−第1音声信号(4)を再生し、第2音声信号(5)と指令信号(35)を無線で送信するトランスミッター(2)、または第1音声再生機、
−第2音声信号(5)を抽出し、デコード化して再生し、同時に指令信号(35)を抽出し、変調する請求項26のレシーバー(3)、または第2音声再生機、
を有することを特徴とする音声信号再生システム。
A reproduction system for a first audio signal (4) and a second audio signal (5),
The producer (1) of claim 15, generating a synthesized speech signal (6) according to claim 13 and transmitting the synthesized speech signal (6);
A transmitter (2) for reproducing the first audio signal (4) and transmitting the second audio signal (5) and the command signal (35) wirelessly, or a first audio player,
27. The receiver (3) of claim 26, or the second audio player, wherein the second audio signal (5) is extracted, decoded and reproduced, and simultaneously the command signal (35) is extracted and modulated;
An audio signal reproduction system comprising:
JP2008529667A 2005-09-20 2006-08-31 Audio signal playback system Withdrawn JP2009507261A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0552824A FR2889347B1 (en) 2005-09-20 2005-09-20 SOUND SYSTEM
PCT/FR2006/050830 WO2007068833A1 (en) 2005-09-20 2006-08-31 Sound broadcasting system

Publications (1)

Publication Number Publication Date
JP2009507261A true JP2009507261A (en) 2009-02-19

Family

ID=36283046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008529667A Withdrawn JP2009507261A (en) 2005-09-20 2006-08-31 Audio signal playback system

Country Status (6)

Country Link
US (1) US20070064957A1 (en)
EP (1) EP1927103A1 (en)
JP (1) JP2009507261A (en)
CA (1) CA2616484A1 (en)
FR (1) FR2889347B1 (en)
WO (1) WO2007068833A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010288246A (en) * 2009-05-12 2010-12-24 Yamaha Corp Acoustic modulation method, acoustic demodulation method, modulation apparatus, demodulation apparatus, and communication system
JP5345133B2 (en) * 2008-04-04 2013-11-20 株式会社エヌ・ティ・ティ・ドコモ Mobile communication system, receiving apparatus and method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101439205B1 (en) * 2007-12-21 2014-09-11 삼성전자주식회사 Method and apparatus for audio matrix encoding/decoding
EP2312763A4 (en) * 2008-08-08 2015-12-23 Yamaha Corp Modulation device and demodulation device
FR2938717B1 (en) * 2008-11-14 2013-03-22 Serge Jean Galinaud SYSTEM FOR RESTITUTING AS ELECTRICAL CURRENTS OF MUSICAL OR OTHER RHYTHMS AND TIMES WHEN READING AUDIO OR VIDEO RECORDINGS RECORDED THROUGH THE SYSTEM.
KR101764926B1 (en) * 2009-12-10 2017-08-03 삼성전자주식회사 Device and method for acoustic communication
US9225822B2 (en) * 2011-04-26 2015-12-29 Digimarc Corporation Channelized audio watermarks
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4846693A (en) * 1987-01-08 1989-07-11 Smith Engineering Video based instructional and entertainment system using animated figure
US4840602A (en) * 1987-02-06 1989-06-20 Coleco Industries, Inc. Talking doll responsive to external signal
US5191615A (en) * 1990-01-17 1993-03-02 The Drummer Group Interrelational audio kinetic entertainment system
CA2225060A1 (en) * 1997-04-09 1998-10-09 Peter Suilun Fong Interactive talking dolls
US6125172A (en) * 1997-04-18 2000-09-26 Lucent Technologies, Inc. Apparatus and method for initiating a transaction having acoustic data receiver that filters human voice
AUPP170298A0 (en) * 1998-02-06 1998-03-05 Pracas, Victor Manuel Electronic interactive puppet
CA2358203A1 (en) * 1999-01-07 2000-07-13 Tellabs Operations, Inc. Method and apparatus for adaptively suppressing noise
EP1087377B1 (en) * 1999-03-19 2007-04-25 Sony Corporation Additional information embedding method and its device, and additional information decoding method and its decoding device
GB9917985D0 (en) * 1999-07-30 1999-09-29 Scient Generics Ltd Acoustic communication system
GB2345779B (en) * 1999-10-12 2004-08-11 Roke Manor Research Apparatus for controlling a remote item
US6947893B1 (en) * 1999-11-19 2005-09-20 Nippon Telegraph & Telephone Corporation Acoustic signal transmission with insertion signal for machine control
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
DE10227431A1 (en) * 2002-06-20 2004-05-19 Castel Gmbh Broadcasting system transmitting information as masked audio signal, divides spectrum of primary signal into bands and sub-bands for transmission of secondary signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5345133B2 (en) * 2008-04-04 2013-11-20 株式会社エヌ・ティ・ティ・ドコモ Mobile communication system, receiving apparatus and method
JP2010288246A (en) * 2009-05-12 2010-12-24 Yamaha Corp Acoustic modulation method, acoustic demodulation method, modulation apparatus, demodulation apparatus, and communication system

Also Published As

Publication number Publication date
WO2007068833A1 (en) 2007-06-21
CA2616484A1 (en) 2007-06-21
US20070064957A1 (en) 2007-03-22
EP1927103A1 (en) 2008-06-04
FR2889347A1 (en) 2007-02-02
FR2889347B1 (en) 2007-09-21

Similar Documents

Publication Publication Date Title
CN100367826C (en) Discrete multichannel audio with a backward compatible mix
JP2009507261A (en) Audio signal playback system
KR100717598B1 (en) Frequency-based coding of audio channels in parametric multi-channel coding systems
AU626605B2 (en) Coder for incorporating extra information in a digital audio signal having a predetermined format, decoder for extracting such extra information from a digital signal, device for recording a digital signal on a record carrier, comprising such a coder, and record carrier obtained by means of such a device
CN1930914B (en) Frequency-based coding of audio channels in parametric multi-channel coding systems
CN1739138B (en) Information transmission method and device, information recording or reproduction method and device, and recording medium
US20050004791A1 (en) Perceptual noise substitution
KR100331368B1 (en) Digital transmission system, transmitter, receiver, transmission medium, transmission method, complex voice signal
KR20050115800A (en) Exednded high resolution audio signal encoder and decoder thereof
EP1918928B1 (en) Signal processing system, signal transmission apparatus, signal receiving apparatus, and program with inline signalling of a low frequency effect channel (LFE) reproduction level
EP0540329B1 (en) Method for storing a multichannel audio signal on a compact disc
JP2000123481A (en) Information encoding device and method, information decoding device and method, recording medium, and providing medium
JP3304750B2 (en) Lossless encoder, lossless recording medium, lossless decoder, and lossless code decoder
JP2007149151A (en) Optical disk player, sound signal output device and av system
US6963860B1 (en) Information recording and reproducing system and method and distribution medium
EP0971350A1 (en) Information encoding device and method, information decoding device and method, recording medium, and provided medium
JP3304739B2 (en) Lossless encoder, lossless recording medium, lossless decoder, and lossless code decoder
JP2004088619A (en) Code string encryption method, apparatus and encryption release method, apparatus and recording medium
JP5482381B2 (en) Data transmission apparatus and data transmission method using acoustic signal
JP2008147840A (en) Voice signal generating device, sound field reproducing device, voice signal generating method, and computer program
JP2006279555A (en) Signal regeneration apparatus and method
US20100135641A1 (en) Method and device for encoding vibro-kinetic data onto an lpcm audio stream over an hdmi link
WO2003088075A1 (en) Redbook encoding/decoding conversion device
JP2006126465A (en) System and method for audio output
JP2000115897A (en) Sound processor

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090415