JP2018084953A - 情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム - Google Patents
情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム Download PDFInfo
- Publication number
- JP2018084953A JP2018084953A JP2016227589A JP2016227589A JP2018084953A JP 2018084953 A JP2018084953 A JP 2018084953A JP 2016227589 A JP2016227589 A JP 2016227589A JP 2016227589 A JP2016227589 A JP 2016227589A JP 2018084953 A JP2018084953 A JP 2018084953A
- Authority
- JP
- Japan
- Prior art keywords
- user
- character string
- identification information
- unit
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 74
- 238000000605 extraction Methods 0.000 claims abstract description 42
- 238000001514 detection method Methods 0.000 claims abstract description 21
- 238000010801 machine learning Methods 0.000 claims description 53
- 239000000284 extract Substances 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 40
- 238000010586 diagram Methods 0.000 description 13
- 238000012706 support-vector machine Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 9
- 238000007477 logistic regression Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000005057 finger movement Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
実施形態の情報解析装置は、一以上のプロセッサによって実現される。情報解析装置は、ユーザIDを取得し、このユーザIDが示す文字列から、文字列または文字の存在確率に関する特徴量、文字列に含まれる特定の記号に関する特徴量、および地域によって異なるキーボードの配列に関する特徴量を抽出する。本実施形態におけるユーザIDは、例えば、アルファベットなどの文字、数字、アンダーバーなどの記号のうち一部または全部を含む文字列によって表されるユーザの識別情報である。
図1は、実施形態における情報解析装置100を含む情報解析システム1の一例を示す図である。実施形態における情報解析システム1は、一つ以上の端末装置10と、サーバ装置50と、情報解析装置100とを備える。これらの装置は、ネットワークNWを介して互いに接続される。ネットワークNWは、例えば、無線基地局、Wi−Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
以下、各装置の構成について説明する。図2は、実施形態における端末装置10の構成の一例を示す図である。図示のように、端末装置10は、例えば、端末側通信部11と、受付部12と、表示部13と、端末側記憶部14と、端末側制御部15とを備える。
図3は、実施形態におけるサーバ装置50の構成の一例を示す図である。図示のように、サーバ装置50は、例えば、サーバ側通信部51と、サーバ側記憶部52と、サーバ側制御部55とを備える。サーバ側制御部55は、「認証部」の一例である。
図5は、実施形態における情報解析装置100の構成の一例を示す図である。図示のように、情報解析装置100は、例えば、解析装置側通信部102と、解析装置側制御部110と、解析装置側記憶部130とを備える。
まず、機械学習において、二値分類問題を解くためのパターン識別モデルを生成する処理についてフローチャートを用いて説明する。本実施形態における二値分類問題とは、学習対象のユーザIDを、そのユーザIDの取得が正常(通常)であるのか、またはユーザIDの取得が不正であるのかのいずれかに分類することをいう。ユーザIDの取得が正常である例については「正例」として扱われ、ユーザIDの取得が不正である例については「負例」として扱われる。
(2)ユーザIDの文字列に含まれる数字の数
(3)QWERTY配列のTopRowにある文字がユーザIDに含まれている割合
(4)DVORAK配列のTopRowにある文字がユーザIDに含まれている割合
(5)ユーザIDの文字列に含まれる数字の割合
(6)DVORAK配列でユーザIDをタイプしたときの想定される指の移動量[m]
(7)QWERTY配列のHomeRowにある文字がユーザIDに含まれている割合
(8)QWERTY配列でユーザIDをタイプしたときの想定される指の移動量[m]
(9)DVORAK配列のBottomRowにある文字がユーザIDに含まれている割合
(10)ユーザIDのエントロピー(シャノン情報量)
上述したフローチャートの処理により学習条件を決定した後、解析装置側制御部110は、生成したパターン認識モデルを用いて、サーバ装置50により登録されたユーザIDのうち、教師データ132として利用しなかったユーザIDを正例または負例に分類する。
上述した実施形態の端末装置10、サーバ装置50、および情報解析装置100は、例えば、図14に示すようなハードウェア構成により実現される。図14は、実施形態の端末装置10、サーバ装置50、および情報解析装置100のハードウェア構成の一例を示す図である。本図は、端末装置10がスマートフォンである例を示している。
Claims (12)
- ユーザの識別情報を取得する取得部と、
前記取得部により取得された前記ユーザの識別情報が示す文字列から、文字列または文字の存在確率に関する特徴量、文字列に含まれる特定の記号に関する特徴量、および地域によって異なるキーボードの配列に関する特徴量のうち少なくとも一部を抽出する抽出部と、
前記抽出部により前記文字列から抽出された特徴量の中から、不正に取得されたユーザの識別情報を検出するための特徴量を、機械学習を用いて選択する機械学習部と、
を備える情報解析装置。 - 前記文字列または文字の存在確率に関する特徴量は、前記文字列または文字の存在確率のエントロピー値に基づく特徴量である、
請求項1に記載の情報解析装置。 - 前記機械学習部は、
前記抽出部により抽出された複数の特徴量のそれぞれを素性として、前記素性を正例および負例に分類する2値分類問題を解き、
前記2値分類問題におけるスコアが最も高い特徴量の組み合わせを、前記不正に取得されたユーザの識別情報を検出するための特徴量として選択する、
請求項1または2に記載の情報解析装置。 - 前記文字列または文字の存在確率に関する特徴量は、前記文字列の長さに応じて値が変動する特徴量であり、
前記機械学習部は、前記ユーザの識別情報が示す文字列の長さに制限を設けて前記スコアを導出する、
請求項3に記載の情報解析装置。 - 前記地域が日本国である場合、前記キーボードの配列に関する特徴量を、QWERTY配列に関する特徴量とする、
請求項1から4のうちいずれか1項に記載の情報解析装置。 - 前記機械学習部により選択された特徴量に基づいて、前記取得部により取得された複数のユーザの識別情報の中から、前記不正に取得されたユーザの識別情報を検出する検出部を更に備える、
請求項1から5のうちいずれか1項に記載の情報解析装置。 - 前記抽出部により抽出された複数の特徴量のうち、前記文字列または文字の存在確率に関する特徴量に基づいて、前記取得部により取得された複数のユーザの識別情報の中から、前記不正に取得されたユーザの識別情報を検出する検出部を更に備える、
請求項1から5のうちいずれか1項に記載の情報解析装置。 - 前記検出部は、前記文字列または文字の存在確率に関する特徴量が閾値を超える場合に、閾値を超えた前記文字列または文字の存在確率に関する特徴量の抽出元であるユーザの識別情報を、前記不正に取得されたユーザの識別情報として検出する、
請求項7に記載の情報解析装置。 - ユーザの識別情報を取得する取得部と、
前記取得部により取得された前記ユーザの識別情報が示す文字列から、文字列または文字の存在確率に関する特徴量を抽出する抽出部と、
前記文字列または文字の存在確率に関する特徴量が閾値を超える場合に、閾値を超えた前記文字列または文字の存在確率に関する特徴量の抽出元であるユーザの識別情報を、不正に取得されたユーザの識別情報として検出する検出部と、
を備える情報解析装置。 - 請求項7から9のうちいずれか1項に記載の情報解析装置と、
前記ユーザの識別情報の入力操作を受け付ける受付部と、
前記受付部により受け付けられた前記ユーザの識別情報の入力操作に基づいて、ユーザの認証を行う認証部と、を備え、
前記認証部は、前記検出部により前記不正に取得されたユーザの識別情報として検出されたユーザの識別情報が、前記受付部によって受け付けられた場合、前記認証の難易度を変更する、
情報解析システム。 - コンピュータが、
ユーザの識別情報を取得し、
前記取得した前記ユーザの識別情報が示す文字列から、文字列または文字の存在確率に関する特徴量、文字列に含まれる特定の記号に関する特徴量、および地域によって異なるキーボードの配列に関する特徴量のうち少なくとも一部を抽出し、
前記文字列から抽出した特徴量の中から、不正に取得されたユーザの識別情報を検出するための特徴量を、機械学習を用いて選択する、
情報解析方法。 - コンピュータに、
ユーザの識別情報を取得させ、
前記取得させた前記ユーザの識別情報が示す文字列から、文字列または文字の存在確率に関する特徴量、文字列に含まれる特定の記号に関する特徴量、および地域によって異なるキーボードの配列に関する特徴量のうち少なくとも一部を抽出させ、
前記文字列から抽出させた特徴量の中から、不正に取得されたユーザの識別情報を検出するための特徴量を、機械学習を用いて選択させる、
情報解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016227589A JP6680666B2 (ja) | 2016-11-24 | 2016-11-24 | 情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016227589A JP6680666B2 (ja) | 2016-11-24 | 2016-11-24 | 情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018084953A true JP2018084953A (ja) | 2018-05-31 |
JP6680666B2 JP6680666B2 (ja) | 2020-04-15 |
Family
ID=62238406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016227589A Active JP6680666B2 (ja) | 2016-11-24 | 2016-11-24 | 情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6680666B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008192122A (ja) * | 2007-01-09 | 2008-08-21 | Nec Corp | 悪意メール検出装置、検出方法およびプログラム |
JP2010102690A (ja) * | 2008-09-24 | 2010-05-06 | Canon Inc | 情報処理装置及び方法 |
JP2011164779A (ja) * | 2010-02-05 | 2011-08-25 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
JP2014192687A (ja) * | 2013-03-27 | 2014-10-06 | Ricoh Co Ltd | 画像処理システム、操作部、制御方法及びプログラム |
JP2015170219A (ja) * | 2014-03-07 | 2015-09-28 | 株式会社日立システムズ | アクセス管理方法およびアクセス管理システム |
-
2016
- 2016-11-24 JP JP2016227589A patent/JP6680666B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008192122A (ja) * | 2007-01-09 | 2008-08-21 | Nec Corp | 悪意メール検出装置、検出方法およびプログラム |
JP2010102690A (ja) * | 2008-09-24 | 2010-05-06 | Canon Inc | 情報処理装置及び方法 |
JP2011164779A (ja) * | 2010-02-05 | 2011-08-25 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
JP2014192687A (ja) * | 2013-03-27 | 2014-10-06 | Ricoh Co Ltd | 画像処理システム、操作部、制御方法及びプログラム |
JP2015170219A (ja) * | 2014-03-07 | 2015-09-28 | 株式会社日立システムズ | アクセス管理方法およびアクセス管理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6680666B2 (ja) | 2020-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11475143B2 (en) | Sensitive data classification | |
US10839790B2 (en) | Sequence-to-sequence convolutional architecture | |
CN105279405B (zh) | 触屏用户按键行为模式构建与分析系统及其身份识别方法 | |
US10733387B1 (en) | Optimizing machine translations for user engagement | |
US11516210B1 (en) | Image-based authentication systems and methods | |
JP2020030868A (ja) | 画像ベースのcaptchaチャレンジ | |
US20140095308A1 (en) | Advertisement distribution apparatus and advertisement distribution method | |
US20170371866A1 (en) | Language model using reverse translations | |
US20180067920A1 (en) | Dictionary updating apparatus, dictionary updating method and computer program product | |
US20100228804A1 (en) | Constructing image captchas utilizing private information of the images | |
CN109033798B (zh) | 一种基于语义的点选验证码识别方法及其装置 | |
US20180268307A1 (en) | Analysis device, analysis method, and computer readable storage medium | |
US11361068B2 (en) | Securing passwords by using dummy characters | |
US11748578B1 (en) | Predictive text system | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
US10133859B2 (en) | Managing registration of user identity using handwriting | |
JP6719399B2 (ja) | 解析装置、解析方法、およびプログラム | |
US8752144B1 (en) | Targeted biometric challenges | |
JP2018156473A (ja) | 解析装置、解析方法、およびプログラム | |
US10318640B2 (en) | Identifying risky translations | |
CN113641767A (zh) | 实体关系抽取方法、装置、设备及存储介质 | |
US20220083910A1 (en) | Learning model applying system, a learning model applying method, and a program | |
Kim et al. | Spyware resistant smartphone user authentication scheme | |
JP6680666B2 (ja) | 情報解析装置、情報解析システム、情報解析方法、および情報解析プログラム | |
Thao et al. | Human factors in homograph attack recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6680666 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |