JP7005045B2 - ナイーブベイズ分類器に対する限界攻撃方法 - Google Patents
ナイーブベイズ分類器に対する限界攻撃方法 Download PDFInfo
- Publication number
- JP7005045B2 JP7005045B2 JP2020150717A JP2020150717A JP7005045B2 JP 7005045 B2 JP7005045 B2 JP 7005045B2 JP 2020150717 A JP2020150717 A JP 2020150717A JP 2020150717 A JP2020150717 A JP 2020150717A JP 7005045 B2 JP7005045 B2 JP 7005045B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- classifier
- sample
- category
- text category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の第1の側面は、テキスト分類器によって分類されたテキストカテゴリを取得し、2つのテキストカテゴリ間の頻度比を計算するステップと、
前記頻度比をインデックスとして語彙表を順位付けして敏感語彙セットが得られるステップと、
複数の敏感語彙をランダムに選択して原始サンプルに追加し、敵対的サンプルが得られるステップと、
前記敵対的サンプルをテキスト分類器に入力して、誤分類されたテキストカテゴリが得られるステップとを含むナイーブベイズ分類器に対する限界攻撃方法を提供する。
テキスト分類器から得られた2つのテキストカテゴリの同次元における頻度比は、次式によって計算される:
任意のテキストに対して語彙分類、無効語彙を削除する処理を行った後に、サンプルX=[x1,x2,…,xm]が得られ、mはサンプルXの語彙数を表し、
複数の敏感語彙をランダムに選択してサンプルXの末尾に追加し、敵対的サンプルX’=[x1,x2,…,xm,wr,ws,…]が得られる。
前記敵対的サンプルをテキスト分類器に入力された後、前記敵対的サンプルの各テキストカテゴリに対応する分類確率が得られ、
最大分類確率に対応するテキストカテゴリを誤分類カテゴリとして選択され、誤分類カテゴリと原始テキストの最大分類確率に対応するテキストカテゴリを比較し、対比結果が不一致である場合、テキスト分類器上に誤分類が発生させる。
前記頻度比をインデックスとして語彙表を順位付けして敏感語彙セットが得られる用順序付けモジュールと、
複数の敏感語彙をランダムに選択して原始サンプルに追加し、敵対的サンプルが得られる用生成モジュールと、
前記敵対的サンプルをテキスト分類器に入力して、誤分類されたテキストカテゴリが得られる用出力モジュールとを含むナイーブベイズ分類器に対する限界攻撃装置を提供する。
任意のテキストに対して語彙分類、無効語彙を削除する処理を行った後に、サンプルX=[x1,x2,…,xm]が得られ、mはサンプルXの語彙数を表し、
複数の敏感語彙をランダムに選択してサンプルXの末尾に追加し、敵対的サンプルX’=[x1,x2,…,xm,wr,ws,…]が得られることに用いられる。
前記敵対的サンプルをテキスト分類器に入力して、前記敵対的サンプルが各テキストカテゴリに対応する分類確率が得られ、最大分類確率に対応するテキストカテゴリを誤分類カテゴリとして選択され、誤分類カテゴリと原始テキストの最大分類確率に対応するテキストカテゴリを比較し、対比結果が不一致である場合、テキスト分類器上に誤分類が発生させるのに用いられる。
本発明は、ナイーブベイズ分類器に対する限界攻撃方法、装置、および記憶媒体を提供し、前記ナイーブベイズ分類器に対する限界攻撃方法は、テキスト分類器によって分類されたテキストカテゴリを取得し、2つのテキストカテゴリ間の頻度比を計算する。前記頻度比をインデックスとして語彙表を順位付けして敏感語彙セットが得られ、複数の敏感語彙をランダムに選択して原始サンプルに追加し、敵対的サンプルが得られ、原始サンプルに対して処理はきわめて微小であるため、サンプルが修正されたことを気づけることは困難であり、テキストの読解に大きく影響を与えないとともに、この手法の時間複雑さが低いため、敵対的サンプル生成の効率がさらに向上している。この手法は、ナイーブベイズ分類器の広く使われるおよび仮定目標の各属性が互いに独立している性質に対して、ナイーブベイズ手法に基づく分類器を攻撃するための敵対的サンプルを迅速に構築することができる。この敵対的サンプルをテキスト分類器に入力することで、ナイーブベイズ分類器がテキストを誤分類にし、誤分類されたテキストカテゴリを得ることができる。この手法の攻撃手段は簡単で、実現容易で、テキストに敏感語をごく少ない加えても、テキストを最小限に修正することでテキスト分類器の分類精度を大きく低下させることができる。
S101、テキスト分類器によって分類されたテキストカテゴリを取得し、2つのテキストカテゴリ間の頻度比を計算するステップと、
S102、前記頻度比をインデックスとして語彙表を順位付けして敏感語彙セットが得られるステップと、
S103、複数の敏感語彙をランダムに選択して原始サンプルに追加し、敵対的サンプルが得られるステップと、
S104、前記敵対的サンプルをテキスト分類器に入力して、誤分類されたテキストカテゴリが得られるステップとを含む。
テキスト分類器から得られた2つのテキストカテゴリの同次元における頻度比は、次式によって計算される:
前記頻度比をインデックスとして語彙表を順位付けしてW=[w1,w2,…,wq]敏感語彙セットが得られ、qは敏感語彙セットの数である。
任意のテキストに対して語彙分類、無効語彙を削除する処理を行った後に、サンプルX=[x1,x2,…,xm]が得られ、mはサンプルXの語彙数を表し、
複数の敏感語彙をランダムに選択してサンプルXの末尾に追加し、敵対的サンプルX’=[x1,x2,…,xm,wr,ws,…]が得られる。
以下で説明するように、
前記敵対的サンプルをテキスト分類器に入力された後、前記敵対的サンプルの各テキストカテゴリに対応する分類確率が得られ、
最大分類確率に対応するテキストカテゴリを誤分類カテゴリとして選択され、誤分類カテゴリと原始テキストの最大分類確率に対応するテキストカテゴリを比較し、対比結果が不一致である場合、テキスト分類器上に誤分類が発生させる。
具体的には、X’は分類器Fを経た後、F(X’)=[b1,b2,…,bn]が得られ、ここで、biは敵対的サンプルX’がiカテゴリに分類される確率を表す。bj’=max{bi}、i∈[1,n]を取ると、j’は敵対的サンプルX’が分類器Fを経て得られたカテゴリであり、j’≠jであれば、敵対的サンプルX’が分類器Fに誤分類されることを表す。
なお、原始のテキストまたは修正されたテキストをテキスト分類器に入力し、ナイーブベイズアルゴリズムによりテキスト分類を行う際に、以下のステップに分類することができる。
テキスト分類器によって分類されたテキストカテゴリを取得し、2つのテキストカテゴリ間の頻度比を計算する用計算モジュール201と、
前記頻度比をインデックスとして語彙表を順位付けして敏感語彙セットが得られる用順序付けモジュール202と、
複数の敏感語彙をランダムに選択して原始サンプルに追加し、敵対的サンプルが得られる用生成モジュール203と、
前記敵対的サンプルをテキスト分類器に入力して、誤分類されたテキストカテゴリが得られる用出力モジュール204とを含む。
テキスト分類器から得られた2つのテキストカテゴリの同次元における頻度比は、次式によって計算される:
任意のテキストに対して語彙分類、無効語彙を削除する処理を行った後に、サンプルX=[x1,x2,…,xm]が得られ、mはサンプルXの語彙数を表し、
複数の敏感語彙をランダムに選択してサンプルXの末尾に追加し、敵対的サンプルX’=[x1,x2,…,xm,wr,ws,…]が得られることに用いられる。
前記敵対的サンプルをテキスト分類器に入力された後、前記敵対的サンプルの各テキストカテゴリに対応する分類確率が得られ、最大分類確率に対応するテキストカテゴリを誤分類カテゴリとして選択され、誤分類カテゴリと原始テキストの最大分類確率に対応するテキストカテゴリを比較し、対比結果が不一致である場合、テキスト分類器上に誤分類が発生させる。
具体的には、X’は分類器Fを経た後、F(X’)=[b1,b2,…,bn]が得られ、ここで、biは敵対的サンプルX’がiカテゴリに分類される確率を表す。bj’=max{bi}、i∈[1,n]を取ると、j’は敵対的サンプルX’が分類器Fを経て得られたカテゴリであり、j’≠jであれば、敵対的サンプルX’が分類器Fに誤分類されることを表す。
なお、原始のテキストまたは修正されたテキストをテキスト分類器に入力し、ナイーブベイズアルゴリズムによりテキスト分類を行う際に、以下のステップに分類することができる。
具体的には、清華新聞文書データセット(THUCNews)から金融類のテキスト「国内 初 債券 指数基金 承認された」をランダムに抽出し、6つのフレーズを含み、X=[x1,x2,x3,x4,x5,x6]と表すことができる。Xはナイーブベイズテキスト分類器Fを経てXが各カテゴリに分類される確率を出力した。
F(X)=[a1=0.8,a2=0.02,a3=0.05,a4=0.06,a5=0.02,a6=0.01,a7=0.01,a8=0.01,a9=0.01, a10=0.01]
F(X) 計10カテゴリ。aj=max{ai}=0.8,j=1を取る場合、このテキストXは1種類(金融類)に分類された。
本発明のナイーブベイズ分類器に対する限界攻撃方法により、テキストXの末尾に少量の敏感語、例えば「平方」「別荘」などの不動産類敏感語を追加する場合、敵対的サンプル「国内、初、債券 指数基金 承認された、平方」を生成し、X’=[x1,x2,x3,x4,x5,x6,x7]と表し、
X’はナイーブベイズテキスト分類器Fを経て
F(X’)=[a1=0.32,a2=0.5,a3=0.05,a4=0.01,a5=0.02,a6=0.04,a7=0.03,a8=0.01,を出力した。
a9=0.01,a10=0.01]、aj=max{ai}=0.5,j=2を取る場合、テキストX’は2種類(不動産類)に誤分類された。
ここで、不動産類敏感語は以下のような方法で得られた。
2つの異なるカテゴリ金融類および不動産類の間、語彙表中のhk同次元における頻度比を算出すると、
頻度比F12をインデックスとして語彙表を順位付けした。頻度比の順位付けにより、topQを取ることで敏感語セットW=[“平方”、“別荘”、“内装済”、…]が得られた。敏感語を原始サンプルXの末尾に加えると、敵対的サンプルX’が得られた。
Claims (1)
- 新聞に掲載される語彙を産業分野テキストカテゴリ毎に集めた言葉の集合である語彙表を有し、特定文書から読みだした語彙により、前記特定文書がどの産業分野テキストカテゴリに分類されるかを決定するナイーブベイズ分類器に対する限界攻撃方法であって、
テキスト分類器によって分類された前記産業分野テキストカテゴリを取得し、第1の前記産業分野テキストカテゴリと、第2の前記産業分野テキストカテゴリにおいて、前記第1の産業分野テキストカテゴリである言葉が現れる第1頻度と、前記第2の産業分野テキストカテゴリである言葉が現れる第2頻度と、前記第1頻度と前記第2頻度との比である頻度比を計算する第1ステップと、
ここで、前記頻度比は、前記ある言葉の、前記第1の産業分野テキストカテゴリと、前記第2の産業分野テキストカテゴリでの関連度を表していること、
前記頻度比をインデックスとして、前記第1の産業分野テキストカテゴリと、前記第2の産業分野テキストカテゴリでの関連度の低い1つの敏感語彙セットが得られる第2ステップと、
前記第2ステップで得られた複数の前記敏感語彙をランダムに選択して、前記第2の産業分野テキストカテゴリから得られた前記敏感語彙を、前記第1の産業分野テキストカテゴリに追加し、敵対的サンプルが得られる第3ステップと、
前記敵対的サンプルを前記テキスト分類器に入力して、誤分類された前記産業分野テキストカテゴリが得られる第4ステップとを含むことを特徴とするナイーブベイズ分類器に対する限界攻撃方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010342065.X | 2020-04-24 | ||
CN202010342065.XA CN111522953B (zh) | 2020-04-24 | 2020-04-24 | 一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021174503A JP2021174503A (ja) | 2021-11-01 |
JP7005045B2 true JP7005045B2 (ja) | 2022-01-21 |
Family
ID=71905205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020150717A Active JP7005045B2 (ja) | 2020-04-24 | 2020-09-08 | ナイーブベイズ分類器に対する限界攻撃方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7005045B2 (ja) |
CN (1) | CN111522953B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266247A (zh) * | 2021-12-20 | 2022-04-01 | 中国农业银行股份有限公司 | 一种敏感词过滤方法、装置、存储介质及电子设备 |
CN116738333B (zh) * | 2023-06-09 | 2023-12-05 | 北京航空航天大学 | 一种飞行器小样本朴素贝叶斯的电信号多分类及预测方法 |
CN117473511B (zh) * | 2023-12-27 | 2024-04-02 | 中国联合网络通信集团有限公司 | 边缘节点漏洞数据处理方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020009140A (ja) | 2018-07-06 | 2020-01-16 | 株式会社東芝 | 情報検索システム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299255A (zh) * | 2018-09-12 | 2019-02-01 | 东莞数汇大数据有限公司 | 基于朴素贝叶斯的案件文本分类方法、系统和存储介质 |
-
2020
- 2020-04-24 CN CN202010342065.XA patent/CN111522953B/zh active Active
- 2020-09-08 JP JP2020150717A patent/JP7005045B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020009140A (ja) | 2018-07-06 | 2020-01-16 | 株式会社東芝 | 情報検索システム |
Non-Patent Citations (1)
Title |
---|
▲高▼橋 翼,敵対的サンプルの脅威と対策,電子情報通信学会2019年総合大会講演論文集 基礎・境界/NOLTA,日本,一般社団法人電子情報通信学会,2019年03月05日,SS-62~SS-63,(ISSN 1349-1369) |
Also Published As
Publication number | Publication date |
---|---|
CN111522953B (zh) | 2023-04-07 |
CN111522953A (zh) | 2020-08-11 |
JP2021174503A (ja) | 2021-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959246B (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
JP6799800B2 (ja) | 意味情報生成方法、意味情報生成装置、およびプログラム | |
JP7005045B2 (ja) | ナイーブベイズ分類器に対する限界攻撃方法 | |
CN109471945B (zh) | 基于深度学习的医疗文本分类方法、装置及存储介质 | |
CN111523119B (zh) | 漏洞检测的方法和装置、电子设备及计算机可读存储介质 | |
US11562203B2 (en) | Method of and server for training a machine learning algorithm for estimating uncertainty of a sequence of models | |
CN110580292A (zh) | 一种文本标签生成方法、装置和计算机可读存储介质 | |
CN110968725B (zh) | 图像内容描述信息生成方法、电子设备及存储介质 | |
Sikdar et al. | MODE: multiobjective differential evolution for feature selection and classifier ensemble | |
CN112100377B (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
US11481734B2 (en) | Machine learning model for predicting litigation risk on construction and engineering projects | |
CN112380344B (zh) | 文本分类的方法、话题生成的方法、装置、设备及介质 | |
CN116257406A (zh) | 用于智慧城市的网关数据管理方法及其系统 | |
CN112329476A (zh) | 一种文本纠错方法及装置、设备、存储介质 | |
CN112287672A (zh) | 文本意图识别方法及装置、电子设备、存储介质 | |
US20220269939A1 (en) | Graph-based labeling rule augmentation for weakly supervised training of machine-learning-based named entity recognition | |
CN116150698B (zh) | 一种基于语义信息融合的drg自动分组方法及系统 | |
WO2014073206A1 (ja) | 情報処理装置、及び、情報処理方法 | |
CN110688479A (zh) | 一种用于生成式摘要的评估方法及排序网络 | |
JP2010272004A (ja) | 判別装置及び判別方法、並びにコンピューター・プログラム | |
JP2005182696A (ja) | 機械学習システム及び機械学習方法、並びにコンピュータ・プログラム | |
CN116630714A (zh) | 多标签识别的类别自适应标签发现与噪声拒绝方法及设备 | |
CN111488400A (zh) | 数据分类方法、装置和计算机可读存储介质 | |
CA3066337A1 (en) | Method of and server for training a machine learning algorithm for estimating uncertainty of a sequence of models | |
Malik et al. | Automated Fake News Detection: Approaches, Challenges, and Future Directions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200908 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200908 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210118 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7005045 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |