JP7042236B2 - ウェブサイト判定装置 - Google Patents
ウェブサイト判定装置 Download PDFInfo
- Publication number
- JP7042236B2 JP7042236B2 JP2019089155A JP2019089155A JP7042236B2 JP 7042236 B2 JP7042236 B2 JP 7042236B2 JP 2019089155 A JP2019089155 A JP 2019089155A JP 2019089155 A JP2019089155 A JP 2019089155A JP 7042236 B2 JP7042236 B2 JP 7042236B2
- Authority
- JP
- Japan
- Prior art keywords
- website
- image
- determination
- reduced image
- homepage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Description
本発明の一態様は、前記判定部は、前記特定ウェブサイトのホームページの前記縮小画像と、学習用ウェブサイトのホームページの前記縮小画像とを使用して機械学習されたものである、上記のウェブサイト判定装置である。
本発明の一態様は、前記判定データは、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するフィッシング詐欺サイトであることの判定データである、上記のウェブサイト判定装置である。
図1は、一実施形態に係るウェブ(Web)サイト判定装置の構成例を示すブロック図である。図1において、Webサイト判定装置10は、縮小画像生成部11と判定部12と判定結果出力部13とを備える。図1に示されるWebサイト判定装置10の各機能は、Webサイト判定装置10が備えるCPU(Central Processing Unit:中央演算処理装置)がコンピュータプログラムを実行することにより実現される。なお、Webサイト判定装置10として、汎用のコンピュータ装置を使用して構成してもよく、又は、専用のハードウェア装置として構成してもよい。
まず図2を参照して判定部12の学習段階を説明する。学習段階は、後述するWebサイト判定段階で使用される判定部12の学習を行う段階である。判定部12の学習段階は、Webサイト判定装置10により実施されてもよく、又は、Webサイト判定装置10とは異なるコンピュータにより実施されてもよい。なお、図2に示される縮小画像生成部11は、図1に示されるWebサイト判定装置10の縮小画像生成部11と同様の機能を有する。
学習用Webサイト120の探索方法について以下に説明する。学習用Webサイト120のドメイン情報の取得方法の例として、特定Webサイト110に関連する固有名詞を使用してWeb検索により固有名詞辞書を検索し、当該検索結果から学習用Webサイト120へのリンク情報を取得することによって学習用Webサイト120のドメイン情報を取得する。又は、学習用Webサイト120のドメイン情報の取得方法の他の例として、Webサイトアクセスランキングを公表するWebサイトから、学習用Webサイト120として使用するWebサイトのドメイン情報を取得する。
Webサイトのホームページのスクリーンショット方法について以下に説明する。通常、Webサイトは複数のページから構成されている。このため、以下の手順1,2,3によりWebサイトのページ構成情報(WebサイトURLリスト)を生成する。
(手順1)ドメインのページにアクセスし、htmlデータを取得する。
(手順2)htmlデータからリンク(a要素のhref属性の値)を抽出し、同じドメイン内であるか否かを判定し、同じドメイン内である場合にWebサイトURLリストに追記する。
(手順3)Webサイトリストに基づいて上記手順1,2を所定回数だけ繰り返し、Webサイトを構成するページのURLのリスト(WebサイトURLリスト)を生成する。
図4、図5及び図6を参照して本実施形態に係る縮小画像生成方法を説明する。図4、図5及び図6は、本実施形態に係る縮小画像生成方法を説明するための説明図である。図4には、縮小画像生成対象Webサイトのホームページの全体画面の画像200が示される。画像200は、当該ホームページにおいて、先頭領域の画像210と、中間領域の画像220と、最終領域の画像230とから構成される。先頭領域は、ホームページの全体画面において先頭に位置する所定サイズの領域である。最終領域は、ホームページの全体画面において最終に位置する所定サイズの領域である。先頭領域及び最終領域のサイズは、予め設定される。中間領域は、ホームページの全体画面において先頭領域と最終領域の間の領域である。以下、縮小画像生成方法の例1,例2を説明する。
図4及び図5を参照して縮小画像生成方法の例1を説明する。縮小画像生成部11は、縮小画像生成対象Webサイトのホームページの全体画面の画像200(図4参照)から、先頭領域の画像210と最終領域の画像230とを取得する。次いで、縮小画像生成部11は、図5に示されるように、先頭領域の画像210と最終領域の画像230とを連結した縮小画像240を生成する。縮小画像240は、図4に示される画像200から中間領域の画像220が切り取られて表示画面上の縦方向の長さが短くされたものになる。
図4及び図6を参照して縮小画像生成方法の例2を説明する。縮小画像生成部11は、縮小画像生成対象Webサイトのホームページの全体画面の画像200(図4参照)から、先頭領域の画像210と中間領域の画像220と最終領域の画像230とを取得する。次いで、縮小画像生成部11は、中間領域の画像220に対して表示画面上の縦方向の長さを短くするように縮小した画像220aを生成する。中間領域の画像220の縮小サイズ(縦方向の縮小サイズ)は、予め設定される。次いで、縮小画像生成部11は、図6に示されるように、先頭領域の画像210と中間領域の画像220aと最終領域の画像230とを連結した縮小画像240aを生成する。縮小画像240aにおいて、中間領域の画像220aは、先頭領域の画像210と最終領域の画像230との間に配置される。縮小画像240aは、図4に示される画像200において中間領域の画像220が縮小されて表示画面上の縦方向の長さが短くされたものになる。
判定部12には、機械学習アルゴリズムのモデルを使用する。例えば、ニューラルネットワークのモデルを適用してもよい。ニューラルネットワークのモデルの例として画像認識に使用される「VGG16」や「InceptionV4」と呼ばれるモデルを適用してもよい。
判定部12の機械学習では、判定部12が出力した判定データと正解データとの乖離値によって、判定部12の機械学習アルゴリズムのモデルのパラメータを調整する。
次に図3を参照してWebサイト判定段階を説明する。Webサイト判定段階は、上述した図2に示す学習段階により学習済みの判定部12を使用して、判定対象Webサイト130が特定Webサイト110に対応するサイトであるか否かを判定する段階である。例えば、判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトであるか否かを判定する段階である。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disc)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Claims (3)
- 縮小画像生成対象ウェブサイトのホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、前記先頭領域の画像と前記最終領域の画像とを含む前記ホームページの縮小画像を生成する縮小画像生成部と、
特定ウェブサイトに対応するサイトであるか否かを判定したい判定対象ウェブサイトのホームページの前記縮小画像に基づいて、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するサイトであることの判定データを出力する判定部と、
を備え、
前記縮小画像生成部は、前記縮小画像生成対象ウェブサイトのホームページの全体画面の画像から前記先頭領域の画像と前記最終領域の画像との間の中間領域の画像をさらに取得し、前記縮小画像において、前記中間領域の画像を縮小した画像を前記先頭領域の画像と前記最終領域の画像との間に配置する、
ウェブサイト判定装置。 - 前記判定部は、前記特定ウェブサイトのホームページの前記縮小画像と、学習用ウェブサイトのホームページの前記縮小画像とを使用して機械学習されたものである、
請求項1に記載のウェブサイト判定装置。 - 前記判定データは、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するフィッシング詐欺サイトであることの判定データである、
請求項1又は2のいずれか1項に記載のウェブサイト判定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019089155A JP7042236B2 (ja) | 2019-05-09 | 2019-05-09 | ウェブサイト判定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019089155A JP7042236B2 (ja) | 2019-05-09 | 2019-05-09 | ウェブサイト判定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020184278A JP2020184278A (ja) | 2020-11-12 |
JP7042236B2 true JP7042236B2 (ja) | 2022-03-25 |
Family
ID=73045468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019089155A Active JP7042236B2 (ja) | 2019-05-09 | 2019-05-09 | ウェブサイト判定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7042236B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180115573A1 (en) | 2016-10-26 | 2018-04-26 | International Business Machines Corporation | Phishing detection with machine learning |
CN108566399A (zh) | 2018-04-23 | 2018-09-21 | 中国互联网络信息中心 | 钓鱼网站识别方法及系统 |
CN109510815A (zh) | 2018-10-19 | 2019-03-22 | 杭州安恒信息技术股份有限公司 | 一种基于有监督学习的多级钓鱼网站检测方法及检测系统 |
-
2019
- 2019-05-09 JP JP2019089155A patent/JP7042236B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180115573A1 (en) | 2016-10-26 | 2018-04-26 | International Business Machines Corporation | Phishing detection with machine learning |
CN108566399A (zh) | 2018-04-23 | 2018-09-21 | 中国互联网络信息中心 | 钓鱼网站识别方法及系统 |
CN109510815A (zh) | 2018-10-19 | 2019-03-22 | 杭州安恒信息技术股份有限公司 | 一种基于有监督学习的多级钓鱼网站检测方法及检测系统 |
Non-Patent Citations (3)
Title |
---|
中山 真敬,1分でも早く帰りたい人のための パソコン仕事術の教科書,初版第1刷,日本,株式会社技術評論社,2017年03月28日,p.144 |
山本 一真 ほか,顔・人物認識、行動追跡技術とソリューション,画像ラボ,日本,日本工業出版株式会社,2015年03月10日,第26巻 第3号,p.50-54 |
高橋 啓伸 ほか,画像局所特徴量を利用したフィッシングサイト検知手法の実装と評価,CSS2016 コンピュータセキュリティシンポジウム2016 論文集,日本,一般社団法人情報処理学会 コンピュータセキュリティ研究会 セキュリティ心理学とトラスト研究会,2016年10月04日,Vol.2016,No.2,p.1234-1239 |
Also Published As
Publication number | Publication date |
---|---|
JP2020184278A (ja) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6530786B2 (ja) | Webページの悪意のある要素を検出するシステム及び方法 | |
JP6633188B2 (ja) | 画像ベースのcaptchaチャレンジ | |
US20220150279A1 (en) | Real-Time Detection and Redirection from Counterfeit Websites | |
JP6347487B2 (ja) | 機械挙動の決定 | |
WO2019236520A1 (en) | Systems and methods for machine learning based application security testing | |
US8838786B2 (en) | System, method and computer readable medium for determining an event generator type | |
US11301560B2 (en) | Real-time detection and blocking of counterfeit websites | |
CN110490773B (zh) | 一种基于区块链的录屏取证方法、装置及电子设备 | |
WO2013189216A1 (zh) | 网页检测方法与扫描引擎 | |
CN107294918B (zh) | 一种钓鱼网页检测方法及装置 | |
US11637863B2 (en) | Detection of user interface imitation | |
JP6140904B2 (ja) | 端末標記方法、端末標記装置、プログラム及び記録媒体 | |
US20210105302A1 (en) | Systems And Methods For Determining User Intent At A Website And Responding To The User Intent | |
JP2018041442A (ja) | Webページの異常要素を検出するためのシステム及び方法 | |
CN111224923A (zh) | 一种仿冒网站的检测方法、装置及系统 | |
JPWO2020044469A1 (ja) | 不正Webページ検出装置、不正Webページ検出装置の制御方法及び制御プログラム | |
JP7042236B2 (ja) | ウェブサイト判定装置 | |
CN114218574A (zh) | 一种数据检测方法、装置、电子设备以及存储介质 | |
RU2702081C2 (ru) | Система и способ обнаружения модификации веб-ресурса | |
JP2022065878A (ja) | 情報処理プログラム、情報処理方法、および情報処理装置 | |
JP2016194684A (ja) | キュレーション学習における課題指導 | |
JP7438383B2 (ja) | ウェブアプリケーションの信頼性の検証 | |
US11068569B2 (en) | Method and apparatus for human activity tracking and authenticity verification of human-originated digital assets | |
CN107480179B (zh) | 检测方法及装置和电子设备 | |
JP5183331B2 (ja) | 通信再現装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7042236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |