JP2022552119A - オーディオ信号における発話の敵対保護の提供 - Google Patents
オーディオ信号における発話の敵対保護の提供 Download PDFInfo
- Publication number
- JP2022552119A JP2022552119A JP2022519488A JP2022519488A JP2022552119A JP 2022552119 A JP2022552119 A JP 2022552119A JP 2022519488 A JP2022519488 A JP 2022519488A JP 2022519488 A JP2022519488 A JP 2022519488A JP 2022552119 A JP2022552119 A JP 2022552119A
- Authority
- JP
- Japan
- Prior art keywords
- adversarial
- audio signal
- audio
- noise
- adversarial noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 103
- 230000007123 defense Effects 0.000 claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000003860 storage Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 31
- 238000004891 communication Methods 0.000 claims description 24
- 238000010801 machine learning Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 description 39
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 21
- 230000006855 networking Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/1752—Masking
- G10K11/1754—Speech masking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/80—Jamming or countermeasure characterized by its function
- H04K3/82—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
- H04K3/825—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/80—Jamming or countermeasure characterized by its function
- H04K3/94—Jamming or countermeasure characterized by its function related to allowing or preventing testing or assessing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
- G10L2021/0135—Voice conversion or morphing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K2203/00—Jamming of communication; Countermeasures
- H04K2203/10—Jamming or countermeasure used for a particular application
- H04K2203/12—Jamming or countermeasure used for a particular application for acoustic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/40—Jamming having variable characteristics
- H04K3/45—Jamming having variable characteristics characterized by including monitoring of the target or target signal, e.g. in reactive jammers or follower jammers for example by means of an alternation of jamming phases and monitoring phases, called "look-through mode"
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Telephonic Communication Services (AREA)
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Description
オンデマンドのセルフ・サービス:クラウド消費者が、サービスのプロバイダとの人間対話を必要とすることなしに、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング能力を一方的にプロビジョニングすることができる。
広いネットワーク・アクセス:能力が、ネットワークを介して利用可能であり、かつ異種のシン・クライアント・プラットフォームまたはシック・クライアント・プラットフォーム(例えば、モバイル電話、ラップトップ、およびPDA)による使用を促進する標準の機構を介してアクセスされる。
リソース・プーリング:プロバイダのコンピューティング・リソースが、マルチテナント・モデルを使用して多数の消費者に役立てられるようにプールされ、様々な物理リソースおよび仮想リソースが、デマンドに応じて動的に割当てられ、かつ動的に再割当てされる。消費者が、提供されるリソースの厳密なロケーションを一般に支配することも、知ることもないが、抽象化のより高いレベル(例えば、国、州、またはデータセンタ)でロケーションを指定することができ得るという点でロケーション独立の感覚が存在する。
迅速な弾力性:能力は、急速にスケールアウトすること、および迅速にリリースされて、急速にスケールインすることが行われるように、迅速に、弾力的に、一部の事例においては自動的にプロビジョニングされることが可能である。消費者には、プロビジョニングのために利用可能な能力は、しばしば、無限であるように見え、任意の時点で任意の量で購入されることが可能である。
測定されるサービス:クラウド・システムが、サービスのタイプ(例えば、ストレージ、処理、帯域幅、および活性のユーザ・アカウント)に適切な抽象化の何らかのレベルで計測能力を活用することによってリソース使用を自動的に制御し、最適化する。リソース使用は、監視され、制御され、報告されて、利用されるサービスのプロバイダと消費者の両方に透明性をもたらすことが可能である。
SaaS(Software as a Service):消費者に提供される能力は、クラウド・インフラストラクチャ上で実行されるプロバイダのアプリケーションを使用することである。それらのアプリケーションは、ウェブ・ブラウザなどのシン・クライアント・インタフェース(例えば、ウェブ・ベースの電子メール)を介して様々なクライアント・デバイスからアクセス可能である。消費者は、限られたユーザ特有のアプリケーション構成設定を可能な例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション能力さえ含め、基礎をなすクラウド・インフラストラクチャを管理することも、制御することもしない。
PaaS(Platform as a Service):消費者に提供される能力は、プロバイダによってサポートされるプログラミング言語およびプログラミング・ツールを使用して作成された、消費者が作成した、または消費者が獲得したアプリケーションをクラウド・インフラストラクチャ上に展開することである。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含め、基礎をなすクラウド・インフラストラクチャを管理することも、制御することもしないが、展開されたアプリケーション、および、場合により、アプリケーション・ホスティング環境構成を支配する。
IaaS(Infrastructure as a Service):消費者に提供される能力は、消費者が、オペレーティング・システムと、アプリケーションとを含み得る任意のソフトウェアを展開して、実行することができる、処理、ストレージ、ネットワーク、および他の基本的な計算リソースをプロビジョニングすることである。消費者は、基礎をなすクラウド・インフラストラクチャを管理することも、制御することもしないが、オペレーティング・システム、ストレージ、展開されたアプリケーションを支配し、場合により、選定されたネットワーキング・コンポーネント(例えば、ホスト・ファイアウォール)の限られた支配を有する。
プライベート・クラウド:クラウド・インフラストラクチャが、専ら組織のために運用される。クラウド・インフラストラクチャは、その組織によって管理されても、サードパーティによって管理されてもよく、敷地内に存在しても、敷地外に存在してもよい。
コミュニティ・クラウド:クラウド・インフラストラクチャが、いくつかの組織によって共有され、共有される関心(例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンス配慮事項)を有する特定のコミュニティをサポートする。クラウド・インフラストラクチャは、その組織によって管理されても、サードパーティによって管理されてもよく、敷地内に存在しても、敷地外に存在してもよい。
パブリック・クラウド:クラウド・インフラストラクチャが、一般の公衆または大きい業界グループによる利用に供され、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:クラウド・インフラストラクチャは、独自のエンティティであるままであるが、データ移植性およびアプリケーション移植性を可能にする標準化された技術もしくは独自の技術(例えば、クラウド間で負荷分散するためのクラウド・バースティング)によって一緒に結び付けられた2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の合成である。
Claims (20)
- 1つまたは複数のプロセッサによる、オーディオ信号において敵対保護を提供するための方法であって、
1つまたは複数のオーディオ・デバイス上で、敵対ノイズを使用することによってオーディオ信号の自動化されたオーディオ解析を防ぐセキュリティ防御を提供することを含む、方法。 - デジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに前記敵対ノイズを適用することをさらに含む、請求項1に記載の方法。
- 通信においてデジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに対して適用すべき前記敵対ノイズのタイプを決定すること、または選択することをさらに含む、請求項1に記載の方法。
- ユーザからリアルタイムで、またはオーディオ・データベースに配置された記録メッセージから、通信され送信される前記オーディオ信号を、機械学習動作を使用して解析することをさらに含む、請求項1に記載の方法。
- 前記敵対ノイズの理論上のセキュリティ防御強度を推定することをさらに含む、請求項1に記載の方法。
- フィードバック・ループ動作を介して前記敵対ノイズの実際のセキュリティ防御強度を推定することをさらに含む、請求項1に記載の方法。
- 前記敵対ノイズのセキュリティ防御強度の度合を調整することをさらに含む、請求項1に記載の方法。
- オーディオ信号において敵対保護を提供するためのシステムであって、
実行可能命令を有する1つまたは複数のコンピュータを備え、
前記実行可能命令が、実行されると、システムに、
1つまたは複数のオーディオ・デバイス上で、敵対ノイズを使用することによってオーディオ信号の自動化されたオーディオ解析を防ぐセキュリティ防御を提供させる、システム。 - 前記実行可能命令が、デジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに前記敵対ノイズを適用する、請求項8に記載のシステム。
- 前記実行可能命令が、通信においてデジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに対して適用すべき前記敵対ノイズのタイプを決定する、または選択する、請求項8に記載のシステム。
- 前記実行可能命令が、ユーザからリアルタイムで、またはオーディオ・データベースに配置された記録メッセージから、通信され送信される前記オーディオ信号を、機械学習動作を使用して解析する、請求項8に記載のシステム。
- 前記実行可能命令が、前記敵対ノイズの理論上のセキュリティ防御強度を推定する、請求項8に記載のシステム。
- 前記実行可能命令が、フィードバック・ループ動作を介して前記敵対ノイズの実際のセキュリティ防御強度を推定する、請求項8に記載のシステム。
- 前記実行可能命令が、前記敵対ノイズのセキュリティ防御強度の度合を調整する、請求項8に記載のシステム。
- 1つまたは複数のプロセッサによる、オーディオ信号において敵対保護を提供するためのコンピュータ・プログラム製品であって、
コンピュータ・プログラム製品が、コンピュータ可読プログラム・コード部分を記憶している非一過性のコンピュータ可読記憶媒体を備え、前記コンピュータ可読プログラム・コード部分が、
1つまたは複数のオーディオ・デバイス上で、敵対ノイズを使用することによってオーディオ信号の自動化されたオーディオ解析を防ぐセキュリティ防御を提供する実行可能部分を含む、コンピュータ・プログラム製品。 - デジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに前記敵対ノイズを適用する実行可能部分をさらに含む、請求項15に記載のコンピュータ・プログラム製品。
- 通信においてデジタル・オーディオ信号、アナログ・オーディオ信号、またはその組合せに対して適用すべき前記敵対ノイズのタイプを決定する、または選択する実行可能部分をさらに含む、請求項15に記載のコンピュータ・プログラム製品。
- ユーザからリアルタイムで、またはオーディオ・データベースに配置された記録メッセージから、通信され送信される前記オーディオ信号を、機械学習動作を使用して解析する実行可能部分をさらに含む、請求項15に記載のコンピュータ・プログラム製品。
- 前記敵対ノイズの理論上のセキュリティ防御強度を推定する、またはフィードバック・ループ動作を介して前記敵対ノイズの実際のセキュリティ防御強度を推定する実行可能部分をさらに含む、請求項15に記載のコンピュータ・プログラム製品。
- 前記敵対ノイズのセキュリティ防御強度の度合を調整する実行可能部分をさらに含む、請求項15に記載のコンピュータ・プログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/601,468 US10896664B1 (en) | 2019-10-14 | 2019-10-14 | Providing adversarial protection of speech in audio signals |
US16/601,468 | 2019-10-14 | ||
PCT/IB2020/059262 WO2021074736A1 (en) | 2019-10-14 | 2020-10-02 | Providing adversarial protection of speech in audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022552119A true JP2022552119A (ja) | 2022-12-15 |
JPWO2021074736A5 JPWO2021074736A5 (ja) | 2022-12-22 |
Family
ID=74180615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022519488A Pending JP2022552119A (ja) | 2019-10-14 | 2020-10-02 | オーディオ信号における発話の敵対保護の提供 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10896664B1 (ja) |
JP (1) | JP2022552119A (ja) |
CN (1) | CN114600187A (ja) |
GB (1) | GB2604277A (ja) |
WO (1) | WO2021074736A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113362822B (zh) * | 2021-06-08 | 2022-09-30 | 北京计算机技术及应用研究所 | 一种具有听觉隐蔽性的黑盒语音对抗样本生成方法 |
US11856024B2 (en) | 2021-06-18 | 2023-12-26 | International Business Machines Corporation | Prohibiting voice attacks |
CN114528397B (zh) * | 2022-01-02 | 2024-02-02 | 西安电子科技大学 | 对抗文本攻击防御方法、系统、介质、计算机设备及终端 |
US20230281335A1 (en) * | 2022-03-03 | 2023-09-07 | Lenovo (Singapore) Pte. Ltd | Privacy system for an electronic device |
CN117877506B (zh) * | 2024-03-11 | 2024-05-10 | 北京建筑大学 | 一种对语音内容进行增强的对抗性攻击方法、装置和系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040125922A1 (en) * | 2002-09-12 | 2004-07-01 | Specht Jeffrey L. | Communications device with sound masking system |
US7643637B2 (en) * | 2004-02-10 | 2010-01-05 | Microsoft Corporation | Efficient code constructions via cryptographic assumptions |
JP4162620B2 (ja) * | 2004-03-18 | 2008-10-08 | 仁 水谷 | 動物の体動検出装置および体動検出方法 |
ATE373302T1 (de) | 2004-05-14 | 2007-09-15 | Loquendo Spa | Rauschminderung für die automatische spracherkennung |
US8032372B1 (en) | 2005-09-13 | 2011-10-04 | Escription, Inc. | Dictation selection |
JP2007150737A (ja) | 2005-11-28 | 2007-06-14 | Sony Corp | 音声信号ノイズ低減装置及び方法 |
US8510109B2 (en) | 2007-08-22 | 2013-08-13 | Canyon Ip Holdings Llc | Continuous speech transcription performance indication |
US9037113B2 (en) * | 2010-06-29 | 2015-05-19 | Georgia Tech Research Corporation | Systems and methods for detecting call provenance from call audio |
JP5991115B2 (ja) * | 2012-09-25 | 2016-09-14 | ヤマハ株式会社 | 音声マスキングのための方法、装置およびプログラム |
US9269363B2 (en) | 2012-11-02 | 2016-02-23 | Dolby Laboratories Licensing Corporation | Audio data hiding based on perceptual masking and detection based on code multiplexing |
US9390725B2 (en) | 2014-08-26 | 2016-07-12 | ClearOne Inc. | Systems and methods for noise reduction using speech recognition and speech synthesis |
US10540957B2 (en) | 2014-12-15 | 2020-01-21 | Baidu Usa Llc | Systems and methods for speech transcription |
US9998434B2 (en) * | 2015-01-26 | 2018-06-12 | Listat Ltd. | Secure dynamic communication network and protocol |
US9704509B2 (en) | 2015-07-29 | 2017-07-11 | Harman International Industries, Inc. | Active noise cancellation apparatus and method for improving voice recognition performance |
US10242673B2 (en) * | 2016-12-07 | 2019-03-26 | Google Llc | Preventing of audio attacks using an input and an output hotword detection model |
US9954803B1 (en) | 2017-01-30 | 2018-04-24 | Blackberry Limited | Method of augmenting a voice call with supplemental audio |
CN107846259A (zh) * | 2017-11-19 | 2018-03-27 | 天津光电安辰信息技术股份有限公司 | 一种全向录音屏蔽装置及其实现方法 |
CN108831471B (zh) * | 2018-09-03 | 2020-10-23 | 重庆与展微电子有限公司 | 一种语音安全保护方法、装置和路由终端 |
CN109617644A (zh) * | 2018-12-14 | 2019-04-12 | 点阵纵横科技(北京)有限责任公司 | 一种录音干扰器装置 |
-
2019
- 2019-10-14 US US16/601,468 patent/US10896664B1/en active Active
-
2020
- 2020-10-02 WO PCT/IB2020/059262 patent/WO2021074736A1/en active Application Filing
- 2020-10-02 CN CN202080072357.4A patent/CN114600187A/zh active Pending
- 2020-10-02 JP JP2022519488A patent/JP2022552119A/ja active Pending
- 2020-10-02 GB GB2206097.4A patent/GB2604277A/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
GB2604277A (en) | 2022-08-31 |
GB202206097D0 (en) | 2022-06-08 |
WO2021074736A1 (en) | 2021-04-22 |
US10896664B1 (en) | 2021-01-19 |
CN114600187A (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10733384B2 (en) | Emotion detection and expression integration in dialog systems | |
JP2022552119A (ja) | オーディオ信号における発話の敵対保護の提供 | |
JP2021505032A (ja) | オーディオ・ストリームに含まれるセンシティブ・データの自動ブロッキング | |
US10971168B2 (en) | Dynamic communication session filtering | |
US10249320B2 (en) | Normalizing the speaking volume of participants in meetings | |
US20200092339A1 (en) | Providing device control instructions for increasing conference participant interest based on contextual data analysis | |
US11158210B2 (en) | Cognitive real-time feedback speaking coach on a mobile device | |
CN112118215A (zh) | 基于话题确定的方便实时会话 | |
US11688412B2 (en) | Multi-modal framework for multi-channel target speech separation | |
JP2023541879A (ja) | 分離されたオーディオ入力からの音声内容のデータ解析およびダイレーションを使用する音声認識 | |
US10991361B2 (en) | Methods and systems for managing chatbots based on topic sensitivity | |
US20230395091A1 (en) | Neural-echo: an unified deep neural network model for acoustic echo cancellation and residual echo suppression | |
US11257510B2 (en) | Participant-tuned filtering using deep neural network dynamic spectral masking for conversation isolation and security in noisy environments | |
JP2023507703A (ja) | キュー内で待機する呼に関する最適化 | |
US20220284885A1 (en) | All deep learning minimum variance distortionless response beamformer for speech separation and enhancement | |
US20230085012A1 (en) | Ai based system and method for corners of trust for a caller | |
JP2023540479A (ja) | データ解析を使用した音声認識及びインターレース方式のオーディオ入力の拡張 | |
US11676599B2 (en) | Operational command boundaries | |
US10904025B2 (en) | Web meeting bookmarking system based on level of relevancy and importance | |
US10795671B2 (en) | Audiovisual source code documentation | |
US9514745B2 (en) | Voice focus enabled by predetermined triggers | |
US11967332B2 (en) | Method and system for automatic detection and correction of sound caused by facial coverings | |
US20230419047A1 (en) | Dynamic meeting attendee introduction generation and presentation | |
US20230152758A1 (en) | Dynamic mitigation of fan noise during e-conference based on real-time and retroactive data | |
US20230069628A1 (en) | External language model fusing method for speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221209 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240409 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20240520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240709 |