JP2022535165A - 多数の分類モジュールから集約された情報を使用するデータ分類 - Google Patents
多数の分類モジュールから集約された情報を使用するデータ分類 Download PDFInfo
- Publication number
- JP2022535165A JP2022535165A JP2022510100A JP2022510100A JP2022535165A JP 2022535165 A JP2022535165 A JP 2022535165A JP 2022510100 A JP2022510100 A JP 2022510100A JP 2022510100 A JP2022510100 A JP 2022510100A JP 2022535165 A JP2022535165 A JP 2022535165A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- data
- module
- final
- proposed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
Description
本出願は、2019年8月15日に出願された米国特許出願第16/542,016号の優先権を主張し、同出願は参照によりその全体が本明細書に援用される。
下に提示される実施形態は、当業者が実施形態を実践すると共に実施形態を実践する最良の態様を示すのに必要な情報を表す。添付図と照らし合わせて以下の記載を読むと、当業者は開示の概念を理解し、本明細書で特に記されていないこれらの概念の適用例を認識するだろう。これらの概念および適用例は本開示及び添付請求項の範囲に内含される。
本明細書で使用される用語の目的は、実施形態を説明することのみであり、開示の範囲を限定する意図はない。文脈的に可能であれば、単数又は複数形を使用する単語は、それぞれ複数形又は単数形も含み得る。
計算システムは、一以上のデータストリーム(例えば構造化データ)を受信及び処理して、データの特性を識別し、データの特性に基づく動作を実施できる。例えば、計算システムはデータベースを取り入れて、データベースに含まれるデータベース列の様々な特性(例えば、名前、住所、電話番号)を識別できる。データベースの特性は、計算システムにより取り入れられるデータストリームの一部分として含まれ得る。
本実施形態は、多数の分類モジュールから受信した集約済み分類情報を使用してデータ部分を分類することに関係する。多数の分類モジュールは、様々な技術(例えば、辞書、正規表現(Regex)パターン整合、ニューラルネットワーク)を使用して受信データを検査し、データの分類案と各分類案の信頼レベルとを判断し得る。分類モジュールにより利用される可変技術は、各分類案に多様な信頼度を含む一以上の分類案を提供し得る。
図6には、様々な実施形態による、集約装置により最終分類を判断する為のフローチャートが図示されている。集約装置は、分類モジュール集合の各分類モジュールから分類案及び信頼レベルを受信できる(ブロック602)。分類案及び信頼値に基づいて、集約装置は、受信データの正確な分類を表す最終分類を判断できる。
評価メトリクスは、生産アーキテクチャに含まれるコンポーネントを訓練又は再訓練するのに使用され得る。訓練プロセスでは、生成された分類の品質を定量化するのに評価メトリクスが利用され得る。言い換えると、評価メトリクスは、生成された分類の総確度を識別するのに利用され得る。
図8は、本明細書に記載の少なくとも幾つかの操作が遂行され得る処理システム800の例を図示するブロック線図である。図8に示されているように、処理システム800は、一以上の中央処理ユニット(「プロセッサ」)802、メインメモリ806、不揮発性メモリ810、ネットワークアダプタ812(例えばネットワークインタフェース)、ビデオディスプレイ818、入力/出力デバイス820、制御デバイス822(例えばキーボード及びポインティングデバイス)、記憶媒体826を含むドライブユニット824、そしてバス816に通信接続される信号生成デバイス830を含み得る。バス816は、一以上の独立した物理バス、ポイントツーポイント接続、あるいは適切なブリッジ、アダプタ、又は制御装置により接続された両者を表す抽象的なものとして図示されている。それ故、バス816は、例えば、システムバス、周辺コンポーネント相互接続(PCI)バス又はPCIエクスプレスバス、ハイパートランスポート又は業界標準アーキテクチャ(ISA)バス、小型コンピュータシステムインタフェース(SCSI)バス、ユニバーサルシリアルバス(USB)、IIC(I2C)バス、あるいは「ファイアワイヤ」とも呼ばれる電気電子学会(IEEE)規格1394バスを含み得る。
102 制御装置
104 外部デバイス
106 ブローカ
108,108a,108b,…,108n 分類モジュール
110 集約装置
112 データベース
200 分類モジュール
202 辞書モジュール
204 正規表現モジュール
206 機械学習モジュール
208 分類リスト
212a,212b,…,212n 辞書
214a,214b,…,214n 正規表現パターン
306 機械学習モジュール
308 データサンプル
310 文字埋め込み
312 ニューラルネット
314 コンテキストデータ
316 マージ層
318 ドロップアウト層
320 デンス層
322 出力
402 点
404a,404b,404c,404d,404e クラスタ
500 分類
800 処理システム
802 プロセッサ
804 命令
806 メインメモリ
808 命令
810 不揮発性メモリ
812 ネットワークアダプタ
814 ネットワーク
816 バス
818 ビデオディスプレイ
820 入力/出力デバイス
822 制御デバイス
824 ドライブユニット
826 記憶媒体
828 命令
830 信号生成デバイス
Claims (20)
- データを分類するシステムにより実施される方法であって、
分類モジュール集合に含まれる各分類モジュールにより、データストリームを取得することと、
前記データストリームに含まれる第1データ部分を検査して前記第1データ部分の特性を識別することと、
前記分類モジュール集合の各分類モジュールにより、前記識別済み特性を分類リストと比較して分類案及び信頼値を判断することであって、前記分類リストに含まれて、第1類似度閾値を超える第1類似度を持つ前記第1データ部分の前記特性と整合する分類タイプを各分類案が識別することと、
集約モジュールにより、前記分類案及び前記信頼値を各分類タイプで集約することと、
前記集約モジュールにより、集約された前記分類案及び前記信頼値に基づいて最終分類を生成することと、
前記最終分類を外部デバイスへ送信して後続動作を実施することと、
を包含する方法。 - データベースに含まれるテーブルで構造化されたデータを前記データストリームが含み、前記データストリームの各部分が、前記データベースに含まれる前記テーブルの列を表す、請求項1に記載の方法。
- 前記分類モジュール集合が、
前記第1データ部分の前記識別済み特性を少なくとも一つの辞書に含まれるエントリと比較するように構成される辞書モジュールと、
前記第1データ部分の前記識別済み特性を、少なくとも一つの正規表現パターンリストに含まれる正規表現パターンと比較するように構成される正規表現モジュールと、
前記第1データ部分の前記識別済み特性を訓練データ集合と比較するように構成される学習モジュールと、
を含む、請求項1に記載の方法。 - 各データ列及び前記分類案を、各データ列及び各分類案の定量化特性を識別する少なくとも一つの数値ベクトルに変換すること、
を更に包含する、請求項2に記載の方法。 - 前記学習モジュールが、
前記第1データ部分及び前記分類リストの前記特性と前記訓練データ集合との比較に基づいて、第1分類案と第1信頼値とを生成し、
前記第1データ部分及び前記生成済み第1分類案の前記特性に対応する少なくとも一つのルールを判断し、
前記訓練データ集合に少なくとも一つのルールを導入する、
ように構成される、請求項2に記載の方法。 - 前記最終分類の生成が更に、
各分類タイプについての前記集約済み分類案及び前記集約済み信頼値を、前記集約モジュールにより利用されるルール集合と比較して、第1分類を判断することと、
前記集約済み分類案と前記最終分類との間の共通特性に対応する少なくとも一つのルールを判断することと、
前記ルール集合に少なくとも一つのルールを導入することと、
を包含する、請求項1に記載の方法。 - 前記最終分類を検査して、個人を示す情報を前記最終分類が含むかどうかを判断することと、
前記個人を示す情報を前記最終分類が含むとの判断に基づいて、前記第1データ部分にタグを付加することと、
を更に包含する、請求項1に記載の方法。 - 前記分類モジュール集合と前記集約モジュールとが、ブローカを介して前記外部デバイスへ情報を転送する、請求項1に記載の方法。
- 前記外部デバイスにより実施される前記後続動作が、前記第1データ部分を少なくとも一つのメモリの第1位置に記憶することと、前記第1データ部分を外部デバイスへ送信することと、前記第1データ部分を削除することと、個人を示すものと識別されるデータと関連する少なくとも一つのメモリの第2位置に前記第1データ部分を記憶することとのうちいずれかを含む、請求項1に記載の方法。
- フィードバックリクエストを外部デバイスへ送信することであって、前記フィードバックリクエストが前記最終分類及び前記第1データ部分のいずれかを含むことと、
フィードバック情報を含むレスポンスを前記外部デバイスから受信することであって、後続の最終分類の生成の為に前記集約モジュールにより利用される集約装置訓練データ集合に前記フィードバック情報が追加されることと、
を更に包含する、請求項1に記載の方法。 - 前記最終分類及び前記第1データ部分の定量化特性を表す少なくとも一つの数値ベクトルに前記最終分類及び前記第1データ部分を変換すること、
を更に包含する、請求項1に記載の方法。 - 辞書モジュールと正規表現モジュールと学習モジュールとを含む分類モジュール集合であって、各分類モジュールが、
データベースでデータ列に構造化される第1データ集合を取得し、
前記第1データ集合に含まれる前記データベースの第1データ列の特性を識別し、
分類リスト及び第1信頼値から第1分類案を判断して、前記第1分類案が、前記第1列の前記識別済み特性と整合する前記分類リストの分類を識別する、
ように構成される、分類モジュール集合と、
集約モジュールであって、
前記分類モジュール集合の各々により判断される前記分類案及び前記信頼値を受信し、
前記分類案及び前記信頼値を分類タイプで集約し、
前記集約済み分類案及び前記信頼値に基づいて最終分類を判断し、
前記最終分類に基づいて前記第1データ集合に後続動作を実施するように構成される外部デバイスへ前記最終分類を送信する、
ように構成される集約モジュールと、
を具備するシステム。 - 前記分類モジュール集合及び前記集約モジュールに接続されるブローカであって、
前記第1データ集合を前記分類モジュール集合の各々へ送信し、
前記分類案を前記分類モジュール集合から前記集約モジュールへ転送し、
前記最終分類を前記集約モジュールから受信する、
ように構成されるブローカと、
前記ブローカ及び前記外部デバイスに接続される制御装置であって、前記ブローカから前記外部デバイスへ前記最終分類を転送するように構成される制御装置と、
を更に具備する、請求項12に記載のシステム。 - 前記辞書モジュールが、
前記辞書モジュールに含まれる少なくとも一つの辞書に挙げられて前記第1データ列の前記特性と整合するエントリを識別し、
前記分類リストに挙げられた各分類と前記識別済みエントリを比較して、類似度閾値を超える前記エントリとの類似度を含む第1分類を判断する、
ように構成されて、前記辞書モジュールの前記分類案が前記第1分類を含み、
前記正規表現モジュールが、
前記第1データ列の前記特性と整合する前記正規表現モジュールに含まれる少なくとも一つの正規表現パターンリストに挙げられたパターンを識別し、
前記分類リストに挙げられた各分類と前記識別済みパターンを比較して、前記類似度閾値を超える前記パターンとの類似度を含む第2分類を判断する、
ように構成されて、前記正規表現モジュールの前記分類案が前記第2分類を含む、
請求項12に記載のシステム。 - 前記学習モジュールが、
前記第1データ列及び前記分類リストの特性と、前記学習モジュールと関連する訓練データ集合との比較に基づいて、前記分類案と前記信頼値とを生成し、
前記第1データ列の前記特性と前記生成済み分類案とに対応する少なくとも一つのルールを判断し、
前記訓練データ集合に少なくとも一つのルールを導入する、
ように構成される、請求項12に記載のシステム。 - 前記集約モジュールが更に、
前記最終分類を検査して、個人を示す情報を含む分類に前記最終分類が関係しているかどうかを判断し、
前記最終分類にタグを付加する、
ように構成されて、
前記タグを含む前記最終分類の受信に基づいて前記第1データ集合で後続動作の部分集合のいずれかを実施するように前記外部デバイスが構成される、
請求項12に記載のシステム。 - データを分類する集約モジュールにより実施される方法であって、
第1構造化データ集合に含まれるデータ列についての分類案及び信頼値を分類モジュール集合の各々から受信することであって、各分類案が、分類リストに含まれる分類を示し、各信頼値が、前記データ列の特性に関係するものとしての前記分類案の確度を示すことと、
前記分類リストに挙げられた各分類タイプに基づいて前記受信済み分類案及び信頼値を集約することと、
前記集約済み分類案を比較して最終分類を識別することと、
前記最終分類に基づいて前記データ列に後続動作を実施するように構成される外部デバイスへ前記最終分類を送信することと、
を包含する方法。 - 辞書モジュールであって、
辞書モジュールに含まれる少なくとも一つの辞書に挙げられて前記データ列の前記特性と整合するエントリを識別し、
前記分類リストに挙げられた各分類と前記識別済みエントリを比較して、類似度閾値を超える前記エントリとの類似度を含む第1分類を判断し、前記辞書モジュールの前記分類案が前記第1分類を含む、
ように構成される辞書モジュールと、
正規表現モジュールであって、
正規表現モジュールに含まれる少なくとも一つの正規表現パターンリストに挙げられて前記データ列の前記特性と整合するパターンを識別し、
前記分類リストに挙げられた各分類と前記識別済みパターンを比較して、前記類似度閾値を超える前記パターンとの類似度を含む第2分類を判断し、正規表現モジュールの前記分類案が前記第2分類を含む、
ように構成される正規表現モジュールと、
学習モジュールであって、
前記データ列及び前記分類リストの前記特性と、学習モジュールと関連する訓練データ集合との比較に基づいて、第3分類案を生成し、
前記データ列及び前記生成済み分類案の前記特性に対応する少なくとも一つのルールを判断し、
前記訓練データ集合に前記少なくとも一つのルールを導入する、
ように構成される学習モジュールと、
を前記分類モジュール集合が含む、請求項17に記載方法。 - フィードバックリクエストを前記外部デバイスへ送信することであって、前記フィードバックリクエストが前記最終分類と前記データ列とを含むことと、
フィードバック情報を含むレスポンスを前記外部デバイスから受信することと、
を更に包含する、請求項17に記載の方法。 - 再訓練プロセスを通して前記分類モジュール集合により利用されて他のデータ部分の後続分類案を改善するように構成される訓練データ集合のいずれかに、前記受信済みフィードバック情報を導入すること、
を更に包含する、請求項19に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/542,016 US11138477B2 (en) | 2019-08-15 | 2019-08-15 | Classification of data using aggregated information from multiple classification modules |
US16/542,016 | 2019-08-15 | ||
PCT/IB2020/057603 WO2021028855A1 (en) | 2019-08-15 | 2020-08-12 | Classification of data using aggregated information from multiple classification modules |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022535165A true JP2022535165A (ja) | 2022-08-04 |
Family
ID=72178845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022510100A Pending JP2022535165A (ja) | 2019-08-15 | 2020-08-12 | 多数の分類モジュールから集約された情報を使用するデータ分類 |
Country Status (11)
Country | Link |
---|---|
US (1) | US11138477B2 (ja) |
EP (1) | EP4014133A1 (ja) |
JP (1) | JP2022535165A (ja) |
KR (1) | KR20220045035A (ja) |
CN (1) | CN114930318B (ja) |
AU (1) | AU2020327704B2 (ja) |
BR (1) | BR112022002855A2 (ja) |
CA (1) | CA3148191A1 (ja) |
IL (1) | IL290642B (ja) |
MX (1) | MX2022001970A (ja) |
WO (1) | WO2021028855A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7058941B2 (ja) * | 2017-01-16 | 2022-04-25 | キヤノン株式会社 | 辞書生成装置、辞書生成方法、及びプログラム |
US11961046B2 (en) * | 2018-05-22 | 2024-04-16 | Micro Focus Llc | Automatic selection of request handler using trained classification model |
GB201916801D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Identifying data relationships from a spreadsheet |
GB201916804D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Generating an OLAP model from a spreadsheet |
GB201916803D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Identifying content and structure of olap dimensions from a spreadsheet |
GB201916800D0 (en) * | 2019-11-19 | 2020-01-01 | Ibm | Detecting errors in spreadsheets |
CN114064350A (zh) * | 2020-08-07 | 2022-02-18 | 伊姆西Ip控股有限责任公司 | 数据保护方法、电子设备和计算机程序产品 |
US20220222484A1 (en) * | 2021-01-08 | 2022-07-14 | Salesforce.Com, Inc. | Ai-enhanced data labeling |
TWI817106B (zh) * | 2021-04-14 | 2023-10-01 | 台達電子工業股份有限公司 | 查詢回饋裝置以及方法 |
EP4254216A1 (en) * | 2022-03-31 | 2023-10-04 | Feedzai - Consultadoria e Inovação Tecnológica, S.A. | Method and system for obtaining a datasource schema comprising column-specific data-types and/or semantic-types from received tabular data records |
US20230334169A1 (en) | 2022-04-15 | 2023-10-19 | Collibra Belgium Bv | Systems and methods for generating synthetic data |
WO2024059801A2 (en) * | 2022-09-15 | 2024-03-21 | Covid Cough, Inc. | Systems and methods for machine learning-based classification of signal data signatures featuring using a multi-modal oracle |
CN115801483B (zh) * | 2023-02-10 | 2023-05-19 | 北京京能高安屯燃气热电有限责任公司 | 一种信息共享处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785277A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方式 |
JP2010039593A (ja) * | 2008-08-01 | 2010-02-18 | Mitsubishi Electric Corp | テーブル分類装置、テーブル分類方法及びテーブル分類プログラム |
WO2015056436A1 (ja) * | 2013-10-15 | 2015-04-23 | 国立大学法人広島大学 | 認識システム |
WO2016200667A1 (en) * | 2015-06-12 | 2016-12-15 | Microsoft Technology Licensing, Llc | Identifying relationships using information extracted from documents |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251131A (en) * | 1991-07-31 | 1993-10-05 | Thinking Machines Corporation | Classification of data records by comparison of records to a training database using probability weights |
US5537488A (en) * | 1993-09-16 | 1996-07-16 | Massachusetts Institute Of Technology | Pattern recognition system with statistical classification |
US6324531B1 (en) * | 1997-12-12 | 2001-11-27 | Florida Department Of Citrus | System and method for identifying the geographic origin of a fresh commodity |
US6341369B1 (en) * | 1998-12-03 | 2002-01-22 | International Business Machines Corporation | Method and data processing system for specifying and applying rules to classification-based decision points in an application system |
US6697799B1 (en) * | 1999-09-10 | 2004-02-24 | Requisite Technology, Inc. | Automated classification of items using cascade searches |
US6751600B1 (en) * | 2000-05-30 | 2004-06-15 | Commerce One Operations, Inc. | Method for automatic categorization of items |
AU2001277932A1 (en) * | 2000-07-21 | 2002-02-05 | Ohio University | System and method for identifying an object |
US7043492B1 (en) * | 2001-07-05 | 2006-05-09 | Requisite Technology, Inc. | Automated classification of items using classification mappings |
US7715591B2 (en) * | 2002-04-24 | 2010-05-11 | Hrl Laboratories, Llc | High-performance sensor fusion architecture |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7912246B1 (en) * | 2002-10-28 | 2011-03-22 | Videomining Corporation | Method and system for determining the age category of people based on facial images |
US7711174B2 (en) * | 2004-05-13 | 2010-05-04 | The Charles Stark Draper Laboratory, Inc. | Methods and systems for imaging cells |
US7627154B2 (en) * | 2004-11-23 | 2009-12-01 | Carestream Health, Inc. | Automated radiograph classification using anatomy information |
US7648460B2 (en) * | 2005-08-31 | 2010-01-19 | Siemens Medical Solutions Usa, Inc. | Medical diagnostic imaging optimization based on anatomy recognition |
US10089287B2 (en) * | 2005-10-06 | 2018-10-02 | TeraDact Solutions, Inc. | Redaction with classification and archiving for format independence |
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
IL188726A (en) * | 2008-01-10 | 2013-05-30 | Deutsche Telekom Ag | A stacking scheme for tasks was classified |
US8160975B2 (en) * | 2008-01-25 | 2012-04-17 | Mcafee, Inc. | Granular support vector machine with random granularity |
US8131118B1 (en) * | 2008-01-31 | 2012-03-06 | Google Inc. | Inferring locations from an image |
KR101607224B1 (ko) * | 2008-03-03 | 2016-03-29 | 아비길론 페이턴트 홀딩 2 코포레이션 | 동적 물체 분류 방법 및 장치 |
US8611677B2 (en) * | 2008-11-19 | 2013-12-17 | Intellectual Ventures Fund 83 Llc | Method for event-based semantic classification |
US20110099199A1 (en) * | 2009-10-27 | 2011-04-28 | Thijs Stalenhoef | Method and System of Detecting Events in Image Collections |
US9317613B2 (en) * | 2010-04-21 | 2016-04-19 | Yahoo! Inc. | Large scale entity-specific resource classification |
US8315453B2 (en) * | 2010-07-27 | 2012-11-20 | Applied Materials Israel, Ltd. | Defect classification with optimized purity |
US20120106854A1 (en) * | 2010-10-28 | 2012-05-03 | Feng Tang | Event classification of images from fusion of classifier classifications |
US8468111B1 (en) * | 2010-11-30 | 2013-06-18 | Raytheon Company | Determining confidence of object identification |
US9147129B2 (en) * | 2011-11-18 | 2015-09-29 | Honeywell International Inc. | Score fusion and training data recycling for video classification |
US8990327B2 (en) * | 2012-06-04 | 2015-03-24 | International Business Machines Corporation | Location estimation of social network users |
US9158970B2 (en) * | 2012-11-16 | 2015-10-13 | Canon Kabushiki Kaisha | Devices, systems, and methods for visual-attribute refinement |
WO2014075174A1 (en) * | 2012-11-19 | 2014-05-22 | Imds America Inc. | Method and system for the spotting of arbitrary words in handwritten documents |
US9098552B2 (en) * | 2013-02-05 | 2015-08-04 | Google Inc. | Scoring images related to entities |
US9268399B2 (en) * | 2013-03-01 | 2016-02-23 | Qualcomm Incorporated | Adaptive sensor sampling for power efficient context aware inferences |
US9760803B2 (en) * | 2013-05-15 | 2017-09-12 | Google Inc. | Associating classifications with images |
US9317785B1 (en) * | 2014-04-21 | 2016-04-19 | Video Mining Corporation | Method and system for determining ethnicity category of facial images based on multi-level primary and auxiliary classifiers |
US20160189055A1 (en) * | 2014-12-31 | 2016-06-30 | Applied Materials Israel Ltd. | Tuning of parameters for automatic classification |
US9530082B2 (en) * | 2015-04-24 | 2016-12-27 | Facebook, Inc. | Objectionable content detector |
US9603123B1 (en) * | 2015-06-04 | 2017-03-21 | Apple Inc. | Sending smart alerts on a device at opportune moments using sensors |
US10528889B2 (en) * | 2016-03-25 | 2020-01-07 | Futurewei Technologies, Inc. | Stereoscopic learning for classification |
US10585121B2 (en) * | 2016-09-12 | 2020-03-10 | Tektronix, Inc. | Recommending measurements based on detected waveform type |
US10313348B2 (en) * | 2016-09-19 | 2019-06-04 | Fortinet, Inc. | Document classification by a hybrid classifier |
US11017272B2 (en) * | 2017-11-30 | 2021-05-25 | Facebook, Inc. | Random and active learning for classifier training |
CN108764292B (zh) * | 2018-04-27 | 2022-03-18 | 北京大学 | 基于弱监督信息的深度学习图像目标映射及定位方法 |
EP3815040A4 (en) * | 2018-05-21 | 2022-03-02 | Corista LLC | MULTIPLE SAMPLE BULK SLIDE IMAGE PROCESSING USING MULTIPLE RESOLUTION REGISTRATION |
-
2019
- 2019-08-15 US US16/542,016 patent/US11138477B2/en active Active
-
2020
- 2020-08-12 EP EP20760548.6A patent/EP4014133A1/en active Pending
- 2020-08-12 IL IL290642A patent/IL290642B/en unknown
- 2020-08-12 KR KR1020227008608A patent/KR20220045035A/ko unknown
- 2020-08-12 WO PCT/IB2020/057603 patent/WO2021028855A1/en unknown
- 2020-08-12 MX MX2022001970A patent/MX2022001970A/es unknown
- 2020-08-12 CA CA3148191A patent/CA3148191A1/en active Pending
- 2020-08-12 AU AU2020327704A patent/AU2020327704B2/en active Active
- 2020-08-12 CN CN202080072820.5A patent/CN114930318B/zh active Active
- 2020-08-12 BR BR112022002855A patent/BR112022002855A2/pt active Search and Examination
- 2020-08-12 JP JP2022510100A patent/JP2022535165A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785277A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方式 |
JP2010039593A (ja) * | 2008-08-01 | 2010-02-18 | Mitsubishi Electric Corp | テーブル分類装置、テーブル分類方法及びテーブル分類プログラム |
WO2015056436A1 (ja) * | 2013-10-15 | 2015-04-23 | 国立大学法人広島大学 | 認識システム |
WO2016200667A1 (en) * | 2015-06-12 | 2016-12-15 | Microsoft Technology Licensing, Llc | Identifying relationships using information extracted from documents |
Also Published As
Publication number | Publication date |
---|---|
US20210049421A1 (en) | 2021-02-18 |
MX2022001970A (es) | 2022-06-09 |
EP4014133A1 (en) | 2022-06-22 |
AU2020327704A1 (en) | 2022-04-07 |
WO2021028855A1 (en) | 2021-02-18 |
BR112022002855A2 (pt) | 2022-08-09 |
IL290642B (en) | 2022-09-01 |
IL290642A (en) | 2022-04-01 |
AU2020327704B2 (en) | 2022-11-10 |
US11138477B2 (en) | 2021-10-05 |
CA3148191A1 (en) | 2021-02-18 |
CN114930318B (zh) | 2023-09-01 |
KR20220045035A (ko) | 2022-04-12 |
CN114930318A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022535165A (ja) | 多数の分類モジュールから集約された情報を使用するデータ分類 | |
US20230073695A1 (en) | Systems and methods for synthetic database query generation | |
US20230013306A1 (en) | Sensitive Data Classification | |
JP5364578B2 (ja) | トランスダクティブデータ分類のための方法およびシステム、ならびに機械学習手法を用いたデータ分類方法 | |
US10637826B1 (en) | Policy compliance verification using semantic distance and nearest neighbor search of labeled content | |
US20200286112A1 (en) | Hashing-based effective user modeling | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
WO2023108980A1 (zh) | 基于文本对抗样例的信息推送方法及装置 | |
US11620558B1 (en) | Iterative machine learning based techniques for value-based defect analysis in large data sets | |
CN111783126B (zh) | 一种隐私数据识别方法、装置、设备和可读介质 | |
CN115698977A (zh) | 上下文驱动的数据剖析 | |
WO2023024408A1 (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN112035449A (zh) | 数据处理方法及装置、计算机设备、存储介质 | |
Giri et al. | Performance analysis of annotation detection techniques for cyber-bullying messages using word-embedded deep neural networks | |
CA3164857A1 (en) | Supervised machine learning method for matching unsupervised data | |
CN113688206A (zh) | 基于文本识别的趋势分析方法、装置、设备及介质 | |
Khan et al. | Towards Fairness in Multimodal Scene Graph Generation: Mitigating Biases in Datasets, Knowledge Sources and Models. | |
Zhang et al. | A hybrid approach for network rumor detection based on attention mechanism and bidirectional GRU model in big data environment | |
Li et al. | Ptr4BERT: Automatic Semisupervised Chinese Government Message Text Classification Method Based on Transformer‐Based Pointer Generator Network | |
CN118093881B (zh) | 一种基于知识图谱的审计对象画像建模方法和系统 | |
Assegaff et al. | Experimental of vectorizer and classifier for scrapped social media data | |
US20220342922A1 (en) | A text classification method | |
Sureshkumar et al. | AN EFFICIENT PRIVACY MANAGEMENT SYSTEM INONLINE SOCIAL NETWORKS | |
Sureshkumar et al. | An Efficient Privacy Management System in Online Social Networks | |
Kilic et al. | Unveiling the impact of machine learning algorithms on the quality of online geocoding services: a case study using COVID-19 data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220412 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230105 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230314 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20230707 |