JP7042236B2 - ウェブサイト判定装置 - Google Patents

ウェブサイト判定装置 Download PDF

Info

Publication number
JP7042236B2
JP7042236B2 JP2019089155A JP2019089155A JP7042236B2 JP 7042236 B2 JP7042236 B2 JP 7042236B2 JP 2019089155 A JP2019089155 A JP 2019089155A JP 2019089155 A JP2019089155 A JP 2019089155A JP 7042236 B2 JP7042236 B2 JP 7042236B2
Authority
JP
Japan
Prior art keywords
website
image
determination
reduced image
homepage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019089155A
Other languages
English (en)
Other versions
JP2020184278A (ja
Inventor
秀明 川端
歩 窪田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2019089155A priority Critical patent/JP7042236B2/ja
Publication of JP2020184278A publication Critical patent/JP2020184278A/ja
Application granted granted Critical
Publication of JP7042236B2 publication Critical patent/JP7042236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Description

本発明は、ウェブサイト判定装置関する。
近年、電子商取引サイト等の本物のウェブ(Web)サイトのホームページに似せたホームページを提供する偽のWebサイトによって、個人情報を入力させて搾取するフィッシング詐欺が知られている。そのフィッシング詐欺に使用されるウェブサイト(以下、フィッシング詐欺サイトと称する)を検知する従来技術として、例えば非特許文献1が知られている。
非特許文献1に記載の従来技術では、WebサイトのURL(Uniform Resource Locator)やコンテンツのコーディング内容から特徴を抽出し、機械学習によりフィッシング詐欺サイトを検知している。
S. Marchal, G. Armano, T. Grondahl, K. Saari, N. Singh, and N. Asokan, "Off-the-hook: An efficient and usable client-side phishing prevention application," IEEE Trans. Comput., vol. 66, no. 10, pp. 1717-1733, 2017.
しかし、非特許文献1に記載の従来技術では、WebサイトのURLやコンテンツの記述方法には様々なものが考えられるので、それらすべてを網羅することは難しい。
本発明は、このような事情を考慮してなされたものであり、その目的は、特定ウェブサイトに対応する例えばフィッシング詐欺サイト等のサイトであることの判定精度を向上させることにある。
本発明の一態様は、縮小画像生成対象ウェブサイトのホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、前記先頭領域の画像と前記最終領域の画像とを含む前記ホームページの縮小画像を生成する縮小画像生成部と、特定ウェブサイトに対応するサイトであるか否かを判定したい判定対象ウェブサイトのホームページの前記縮小画像に基づいて、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するサイトであることの判定データを出力する判定部と、を備え、前記縮小画像生成部は、前記縮小画像生成対象ウェブサイトのホームページの全体画面の画像から前記先頭領域の画像と前記最終領域の画像との間の中間領域の画像をさらに取得し、前記縮小画像において、前記中間領域の画像を縮小した画像を前記先頭領域の画像と前記最終領域の画像との間に配置する、ウェブサイト判定装置である。
本発明の一態様は、前記判定部は、前記特定ウェブサイトのホームページの前記縮小画像と、学習用ウェブサイトのホームページの前記縮小画像とを使用して機械学習されたものである、上記のウェブサイト判定装置である。
本発明の一態様は、前記判定データは、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するフィッシング詐欺サイトであることの判定データである、上記のウェブサイト判定装置である。
(5)本発明の一態様は、コンピュータに、縮小画像生成対象ウェブサイトのホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、前記先頭領域の画像と前記最終領域の画像とを含む前記ホームページの縮小画像を生成する縮小画像生成ステップと、特定ウェブサイトに対応するサイトであるか否かを判定したい判定対象ウェブサイトのホームページの前記縮小画像に基づいて、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するサイトであることの判定データを出力する判定ステップと、を実行させるためのコンピュータプログラムである。
(6)本発明の一態様は、ウェブサイト判定装置が、縮小画像生成対象ウェブサイトのホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、前記先頭領域の画像と前記最終領域の画像とを含む前記ホームページの縮小画像を生成する縮小画像生成ステップと、前記ウェブサイト判定装置が、特定ウェブサイトに対応するサイトであるか否かを判定したい判定対象ウェブサイトのホームページの前記縮小画像に基づいて、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するサイトであることの判定データを出力する判定ステップと、を含むウェブサイト判定方法である。
本発明によれば、特定ウェブサイトに対応する例えばフィッシング詐欺サイト等のサイトであることの判定精度を向上させることができるという効果が得られる。
一実施形態に係るWebサイト判定装置の構成例を示すブロック図である。 一実施形態に係る学習段階の手順を示すフロー図である。 一実施形態に係るWebサイト判定段階の手順を示すフロー図である。 一実施形態に係る縮小画像生成方法を説明するための説明図である。 一実施形態に係る縮小画像生成方法を説明するための説明図である。 一実施形態に係る縮小画像生成方法を説明するための説明図である。 一実施形態に係るWebサイト判定方法の一実施例を示すフローチャートである。
以下、図面を参照し、本発明の実施形態について説明する。
図1は、一実施形態に係るウェブ(Web)サイト判定装置の構成例を示すブロック図である。図1において、Webサイト判定装置10は、縮小画像生成部11と判定部12と判定結果出力部13とを備える。図1に示されるWebサイト判定装置10の各機能は、Webサイト判定装置10が備えるCPU(Central Processing Unit:中央演算処理装置)がコンピュータプログラムを実行することにより実現される。なお、Webサイト判定装置10として、汎用のコンピュータ装置を使用して構成してもよく、又は、専用のハードウェア装置として構成してもよい。
縮小画像生成部11は、縮小画像を生成する対象のWebサイト(以下、縮小画像生成対象Webサイトと称する)のホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、当該先頭領域の画像と当該最終領域の画像とを含む当該ホームページの縮小画像を生成する。
判定部12は、特定Webサイトに対応するサイトであるか否かを判定したいWebサイト(以下、判定対象Webサイトと称する)のホームページの縮小画像に基づいて、当該判定対象Webサイトが当該特定Webサイトに対応するサイトであることの判定データを出力する。判定対象Webサイトのホームページの縮小画像は、縮小画像生成部11によって生成される。
判定結果出力部13は、判定部12から出力された判定データに基づいて、判定対象Webサイトが特定Webサイトに対応するサイトであるか否かを示す判定結果データを出力する。
次に図2及び図3を参照して本実施形態に係るWebサイト判定方法を説明する。図2は、本実施形態に係る学習段階の手順を示すフロー図である。図3は、本実施形態に係るWebサイト判定段階の手順を示すフロー図である。
[学習段階]
まず図2を参照して判定部12の学習段階を説明する。学習段階は、後述するWebサイト判定段階で使用される判定部12の学習を行う段階である。判定部12の学習段階は、Webサイト判定装置10により実施されてもよく、又は、Webサイト判定装置10とは異なるコンピュータにより実施されてもよい。なお、図2に示される縮小画像生成部11は、図1に示されるWebサイト判定装置10の縮小画像生成部11と同様の機能を有する。
図2において、学習段階(S10)は、4つのステップS11、S12、S13及びS14を含む。学習段階(S10)では、特定Webサイト110のホームページの縮小画像と、学習用Webサイト120のホームページの縮小画像とを使用して、判定部12の機械学習を行う。特定Webサイト110のホームページの縮小画像及び学習用Webサイト120のホームページの縮小画像は、縮小画像生成部11によって生成される。
(ステップS11) 特定Webサイト110のホームページの全体画面の画像が縮小画像生成部11に入力される。特定Webサイト110は、自己に対応するサイトを検知したいWebサイトである。例えば、特定Webサイト110は、自己に対応するフィッシング詐欺サイトを検知したいWebサイトである。特定Webサイト110は、ユーザ等によって指定される。特定Webサイト110のホームページの全体画面の画像は、例えば、当該ホームページの全体画面が表示された表示画面をスクリーンショットすることにより取得される。なお、縮小画像生成部11が、特定Webサイト110のホームページの全体画面が表示された表示画面をスクリーンショットすることにより、特定Webサイト110のホームページの全体画面の画像を取得してもよい。
また、学習用Webサイト120のホームページの全体画面の画像が縮小画像生成部11に入力される。学習用Webサイト120は、特定Webサイト110に対応するサイトを判定するための機械学習に使用されるWebサイトである。学習用Webサイト120のホームページの全体画面の画像は、例えば、当該ホームページの全体画面が表示された表示画面をスクリーンショットすることにより取得される。なお、縮小画像生成部11が、学習用Webサイト120のホームページの全体画面が表示された表示画面をスクリーンショットすることにより、学習用Webサイト120のホームページの全体画面の画像を取得してもよい。
学習用Webサイト120は、手作業により指定されてもよく、又は、コンピュータによりインターネット上から探索されてもよい。
[学習用Webサイト探索方法]
学習用Webサイト120の探索方法について以下に説明する。学習用Webサイト120のドメイン情報の取得方法の例として、特定Webサイト110に関連する固有名詞を使用してWeb検索により固有名詞辞書を検索し、当該検索結果から学習用Webサイト120へのリンク情報を取得することによって学習用Webサイト120のドメイン情報を取得する。又は、学習用Webサイト120のドメイン情報の取得方法の他の例として、Webサイトアクセスランキングを公表するWebサイトから、学習用Webサイト120として使用するWebサイトのドメイン情報を取得する。
[Webサイトのホームページのスクリーンショット方法]
Webサイトのホームページのスクリーンショット方法について以下に説明する。通常、Webサイトは複数のページから構成されている。このため、以下の手順1,2,3によりWebサイトのページ構成情報(WebサイトURLリスト)を生成する。
(手順1)ドメインのページにアクセスし、htmlデータを取得する。
(手順2)htmlデータからリンク(a要素のhref属性の値)を抽出し、同じドメイン内であるか否かを判定し、同じドメイン内である場合にWebサイトURLリストに追記する。
(手順3)Webサイトリストに基づいて上記手順1,2を所定回数だけ繰り返し、Webサイトを構成するページのURLのリスト(WebサイトURLリスト)を生成する。
次いで、WebサイトURLリストに基づいてWebサイトにアクセスし、当該Webサイトのホームページの全体画面が表示された表示画面をスクリーンショットする。
(ステップS12) 縮小画像生成部11は、特定Webサイト110のホームページの全体画面の画像から、特定Webサイト110のホームページの縮小画像を生成する。また、縮小画像生成部11は、学習用Webサイト120のホームページの全体画面の画像から、学習用Webサイト120のホームページの縮小画像を生成する。
[縮小画像生成方法]
図4、図5及び図6を参照して本実施形態に係る縮小画像生成方法を説明する。図4、図5及び図6は、本実施形態に係る縮小画像生成方法を説明するための説明図である。図4には、縮小画像生成対象Webサイトのホームページの全体画面の画像200が示される。画像200は、当該ホームページにおいて、先頭領域の画像210と、中間領域の画像220と、最終領域の画像230とから構成される。先頭領域は、ホームページの全体画面において先頭に位置する所定サイズの領域である。最終領域は、ホームページの全体画面において最終に位置する所定サイズの領域である。先頭領域及び最終領域のサイズは、予め設定される。中間領域は、ホームページの全体画面において先頭領域と最終領域の間の領域である。以下、縮小画像生成方法の例1,例2を説明する。
(縮小画像生成方法の例1)
図4及び図5を参照して縮小画像生成方法の例1を説明する。縮小画像生成部11は、縮小画像生成対象Webサイトのホームページの全体画面の画像200(図4参照)から、先頭領域の画像210と最終領域の画像230とを取得する。次いで、縮小画像生成部11は、図5に示されるように、先頭領域の画像210と最終領域の画像230とを連結した縮小画像240を生成する。縮小画像240は、図4に示される画像200から中間領域の画像220が切り取られて表示画面上の縦方向の長さが短くされたものになる。
(縮小画像生成方法の例2)
図4及び図6を参照して縮小画像生成方法の例2を説明する。縮小画像生成部11は、縮小画像生成対象Webサイトのホームページの全体画面の画像200(図4参照)から、先頭領域の画像210と中間領域の画像220と最終領域の画像230とを取得する。次いで、縮小画像生成部11は、中間領域の画像220に対して表示画面上の縦方向の長さを短くするように縮小した画像220aを生成する。中間領域の画像220の縮小サイズ(縦方向の縮小サイズ)は、予め設定される。次いで、縮小画像生成部11は、図6に示されるように、先頭領域の画像210と中間領域の画像220aと最終領域の画像230とを連結した縮小画像240aを生成する。縮小画像240aにおいて、中間領域の画像220aは、先頭領域の画像210と最終領域の画像230との間に配置される。縮小画像240aは、図4に示される画像200において中間領域の画像220が縮小されて表示画面上の縦方向の長さが短くされたものになる。
以上が縮小画像生成方法の例1,例2の説明である。説明を図2に戻す。縮小画像生成部11によって生成された特定Webサイト110のホームページの縮小画像と学習用Webサイト120のホームページの縮小画像とを使用して、判定部12の機械学習を行う。
(ステップS13) 縮小画像生成部11によって生成された特定Webサイト110のホームページの縮小画像と学習用Webサイト120のホームページの縮小画像とを判定部12へ入力する。この入力において、当該各縮小画像のサイズを判定部12の入力サイズに合わせるリサイズが行われる。当該各縮小画像を判定部12へ入力した結果として、判定データが判定部12から出力される。当該判定データは、当該学習用Webサイト120が当該特定Webサイト110に対応するサイトであることの判定データである。
本実施形態に係る判定データの例として、判定データは、判定対象Webサイトが特定Webサイトに対応するサイトであるか否かを示す所属確率である。例えば、本学習段階における判定データが「0.98,0.02」である場合、当該判定データは、学習用Webサイト120が特定Webサイト110に対応するサイトである確率が98%であり、そうではない確率が2%であることを示す。
(ステップS14) 判定部12から出力された学習用Webサイト120についての判定データを、当該学習用Webサイト120の正解データに基づいて検証する。学習用Webサイト120の正解データは、当該学習用Webサイト120が特定Webサイト110に対応するサイトであるか否かを示すデータである。例えば、学習用Webサイト120が特定Webサイト110に対応するサイトである場合に正解データ「1」であり、そうではない場合に正解データ「0」である。この検証では、判定データと正解データとの乖離値が計算される。次いで、当該計算結果の乖離値を判定部12に反映させる。当該検証の結果が所定の学習終了条件を満足するまで、判定部12の機械学習は繰り返し行われる。所定の学習終了条件は、例えば、所定の正解率以上若しくは所定の不正解率以下を満足すること、又は、所定の正解率以上及び所定の不正解率以下を両方満足すること、である。又は、所定の学習終了条件は、判定部12の機械学習の繰り返し回数が所定の回数に達したことである。
[判定部の構成例]
判定部12には、機械学習アルゴリズムのモデルを使用する。例えば、ニューラルネットワークのモデルを適用してもよい。ニューラルネットワークのモデルの例として画像認識に使用される「VGG16」や「InceptionV4」と呼ばれるモデルを適用してもよい。
判定部12の機械学習では、判定部12が出力した判定データと正解データとの乖離値によって、判定部12の機械学習アルゴリズムのモデルのパラメータを調整する。
[Webサイト判定段階]
次に図3を参照してWebサイト判定段階を説明する。Webサイト判定段階は、上述した図2に示す学習段階により学習済みの判定部12を使用して、判定対象Webサイト130が特定Webサイト110に対応するサイトであるか否かを判定する段階である。例えば、判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトであるか否かを判定する段階である。
図3において、Webサイト判定段階(S20)は、3つのステップS21、S22及びS23を含む。Webサイト判定段階(S20)では、Webサイト判定装置10は、上述した図2に示す学習段階により学習済みの判定部12を備える。当該学習済みの判定部12は、判定対象Webサイト130のホームページの縮小画像に基づいて、当該判定対象Webサイトが特定Webサイト110に対応するサイトであることの判定データを出力する。例えば、当該学習済みの判定部12は、判定対象Webサイト130のホームページの縮小画像に基づいて、当該判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトであることの判定データを出力する。
(ステップS21) 判定対象Webサイト130の全体画面の画像が縮小画像生成部11に入力される。縮小画像生成部11は、判定対象Webサイト130のホームページの全体画面の画像から、判定対象Webサイト130のホームページの縮小画像を生成する。
(ステップS22) 縮小画像生成部11によって生成された判定対象Webサイト130のホームページの縮小画像を判定部12へ入力する。この入力において、当該縮小画像のサイズを判定部12の入力サイズに合わせるリサイズが行われる。当該縮小画像を判定部12へ入力した結果として、判定データが判定部12から出力される。当該判定データは、当該判定対象Webサイト130が特定Webサイト110に対応するサイトであることの判定データである。本実施形態に係る例として、当該判定データは、判定対象Webサイト130が特定Webサイト110に対応するサイトであるか否かを示す所属確率である。
(ステップS23) 判定結果出力部13は、判定部12から出力された判定データに基づいて、判定対象Webサイト130が特定Webサイト110に対応するサイトであるか否かを示す判定結果データを出力する。具体的には、判定結果出力部13は、判定データの所属確率において、判定対象Webサイト130が特定Webサイト110に対応するサイトである確率が閾値以上である場合に、判定対象Webサイト130が特定Webサイト110に対応するサイトであることを示す判定結果データを出力する。一方、判定結果出力部13は、判定データの所属確率において、判定対象Webサイト130が特定Webサイト110に対応するサイトである確率が閾値未満である場合には、判定対象Webサイト130が特定Webサイト110に対応するサイトではないことを示す判定結果データを出力する。なお、判定結果出力部13は、判定対象Webサイト130のドメインが特定Webサイト110のドメインと同じである場合には、当該判定対象Webサイト130が特定Webサイト110であることを示す判定結果データを出力する。
例えば、判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトであるか否かを判定する場合、判定データの所属確率において判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトである確率が閾値以上であり、且つ、判定対象Webサイト130のドメインが特定Webサイト110のドメインと異なるときに、判定結果出力部13は、判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトであることを示す判定結果データを出力する。一方、そうではないときには、判定結果出力部13は、判定対象Webサイト130が特定Webサイト110に対応するフィッシング詐欺サイトではないことを示す判定結果データを出力する。
次に図7を参照して本実施形態に係るWebサイト判定方法の一実施例を説明する。図7は、本実施形態に係るWebサイト判定方法の一実施例を示すフローチャートである。ここでは、ユーザがアクセスするWebサイトがフィッシング詐欺サイトであるか否かを判定する場合の実施例を説明する。
本実施例において、図1に示されるWebサイト判定装置10の機能(以下、Webサイト判定機能と称する)は、ユーザが使用するWebブラウザに組み込まれたソフトウェアによって実現される。当該Webブラウザが起動されることによって、Webサイト判定機能が実現される。
(ステップS101) ユーザがWebブラウザによりWebサイトにアクセスし、当該Webサイトのログインフォームにおいてユーザ識別子(ユーザID)及びパスワードを入力し、当該Webサイトにログインする。Webブラウザは、フィッシング詐欺を防止するために、ユーザがログインしたWebサイトのURLを特定WebサイトURLリストに登録する。
(ステップS102) 特定WebサイトURLリストに登録されたURLのWebサイトを特定Webサイトとして判定部12の学習段階を実行する。判定部12の学習段階は、Webブラウザ内のWebサイト判定機能により実施されてもよく、又は、Webブラウザとは異なるコンピュータにより実施されてもよい。例えば、Webブラウザとは異なるサーバが判定部12の学習段階を実施してもよい。この場合、サーバは、学習済みの判定部12のモデルをWebブラウザに送信する。
(ステップS103) ユーザがWebブラウザによりWebサイトにアクセスする。Webブラウザは、当該アクセス先のWebサイトがログインフォームを有し且つユーザがまだアクセスしたことのないWebサイトである場合、当該アクセス先のWebサイトのURLを判定対象WebサイトURLリストに登録する。
(ステップS104) Webブラウザは、Webサイト判定機能により、判定対象WebサイトURLリストに登録されたURLのWebサイトを判定対象WebサイトとしてWebサイト判定段階を実行する。
(ステップS105) Webブラウザは、Webサイト判定機能により出力された判定結果データに基づいて、ユーザがアクセスするWebサイトがフィッシング詐欺サイトであるか否かを報知する。例えば、判定結果データがフィッシング詐欺サイトであることを示す場合、その旨を報知する警告画面をWebブラウザ表示画面上に表示させる。これにより、ユーザに対して、現在アクセスしているWebサイトがフィッシング詐欺サイトであるかもしれないことを認識させて、フィッシング詐欺にあわないように注意を促すことができる。
上述した実施形態によれば、ホームページの全体画面の画像における先頭領域の画像と最終領域の画像とを含む当該ホームページの縮小画像を使用することにより、特定ウェブサイトに対応する例えばフィッシング詐欺サイト等のサイトであることの判定精度を向上させることができる。これは、ホームページの全体画面の画像における先頭領域の画像と最終領域の画像との間の中間領域の画像には、誤判定の要因になる情報が含まれる確率が高いので、ホームページの縮小画像に中間領域の画像を含めない又は中間領域の画像を縮小した画像を含めることによって、誤判定の要因になる情報を削減することができるからである。
なお、ホームページの縮小画像に中間領域の画像を縮小した画像を含めることによって、誤判定の要因になる情報を削減するとともに、正しい判定に役立つ情報を残すことができるので、さらなる判定精度の向上効果が得られる。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
上述した各装置の機能を実現するためのコンピュータプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するようにしてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disc)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
10…Webサイト判定装置、11…縮小画像生成部、12…判定部、13…判定結果出力部

Claims (3)

  1. 縮小画像生成対象ウェブサイトのホームページの全体画面の画像から先頭領域の画像と最終領域の画像とを取得し、前記先頭領域の画像と前記最終領域の画像とを含む前記ホームページの縮小画像を生成する縮小画像生成部と、
    特定ウェブサイトに対応するサイトであるか否かを判定したい判定対象ウェブサイトのホームページの前記縮小画像に基づいて、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するサイトであることの判定データを出力する判定部と、
    を備え
    前記縮小画像生成部は、前記縮小画像生成対象ウェブサイトのホームページの全体画面の画像から前記先頭領域の画像と前記最終領域の画像との間の中間領域の画像をさらに取得し、前記縮小画像において、前記中間領域の画像を縮小した画像を前記先頭領域の画像と前記最終領域の画像との間に配置する、
    ウェブサイト判定装置。
  2. 前記判定部は、前記特定ウェブサイトのホームページの前記縮小画像と、学習用ウェブサイトのホームページの前記縮小画像とを使用して機械学習されたものである、
    請求項に記載のウェブサイト判定装置。
  3. 前記判定データは、前記判定対象ウェブサイトが前記特定ウェブサイトに対応するフィッシング詐欺サイトであることの判定データである、
    請求項1又は2のいずれか1項に記載のウェブサイト判定装置。
JP2019089155A 2019-05-09 2019-05-09 ウェブサイト判定装置 Active JP7042236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019089155A JP7042236B2 (ja) 2019-05-09 2019-05-09 ウェブサイト判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019089155A JP7042236B2 (ja) 2019-05-09 2019-05-09 ウェブサイト判定装置

Publications (2)

Publication Number Publication Date
JP2020184278A JP2020184278A (ja) 2020-11-12
JP7042236B2 true JP7042236B2 (ja) 2022-03-25

Family

ID=73045468

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019089155A Active JP7042236B2 (ja) 2019-05-09 2019-05-09 ウェブサイト判定装置

Country Status (1)

Country Link
JP (1) JP7042236B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180115573A1 (en) 2016-10-26 2018-04-26 International Business Machines Corporation Phishing detection with machine learning
CN108566399A (zh) 2018-04-23 2018-09-21 中国互联网络信息中心 钓鱼网站识别方法及系统
CN109510815A (zh) 2018-10-19 2019-03-22 杭州安恒信息技术股份有限公司 一种基于有监督学习的多级钓鱼网站检测方法及检测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180115573A1 (en) 2016-10-26 2018-04-26 International Business Machines Corporation Phishing detection with machine learning
CN108566399A (zh) 2018-04-23 2018-09-21 中国互联网络信息中心 钓鱼网站识别方法及系统
CN109510815A (zh) 2018-10-19 2019-03-22 杭州安恒信息技术股份有限公司 一种基于有监督学习的多级钓鱼网站检测方法及检测系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
中山 真敬,1分でも早く帰りたい人のための パソコン仕事術の教科書,初版第1刷,日本,株式会社技術評論社,2017年03月28日,p.144
山本 一真 ほか,顔・人物認識、行動追跡技術とソリューション,画像ラボ,日本,日本工業出版株式会社,2015年03月10日,第26巻 第3号,p.50-54
高橋 啓伸 ほか,画像局所特徴量を利用したフィッシングサイト検知手法の実装と評価,CSS2016 コンピュータセキュリティシンポジウム2016 論文集,日本,一般社団法人情報処理学会 コンピュータセキュリティ研究会 セキュリティ心理学とトラスト研究会,2016年10月04日,Vol.2016,No.2,p.1234-1239

Also Published As

Publication number Publication date
JP2020184278A (ja) 2020-11-12

Similar Documents

Publication Publication Date Title
JP6530786B2 (ja) Webページの悪意のある要素を検出するシステム及び方法
JP6633188B2 (ja) 画像ベースのcaptchaチャレンジ
US20220150279A1 (en) Real-Time Detection and Redirection from Counterfeit Websites
JP6347487B2 (ja) 機械挙動の決定
WO2019236520A1 (en) Systems and methods for machine learning based application security testing
US8838786B2 (en) System, method and computer readable medium for determining an event generator type
US11301560B2 (en) Real-time detection and blocking of counterfeit websites
CN110490773B (zh) 一种基于区块链的录屏取证方法、装置及电子设备
WO2013189216A1 (zh) 网页检测方法与扫描引擎
CN107294918B (zh) 一种钓鱼网页检测方法及装置
US11637863B2 (en) Detection of user interface imitation
JP6140904B2 (ja) 端末標記方法、端末標記装置、プログラム及び記録媒体
US20210105302A1 (en) Systems And Methods For Determining User Intent At A Website And Responding To The User Intent
JP2018041442A (ja) Webページの異常要素を検出するためのシステム及び方法
CN111224923A (zh) 一种仿冒网站的检测方法、装置及系统
JPWO2020044469A1 (ja) 不正Webページ検出装置、不正Webページ検出装置の制御方法及び制御プログラム
JP7042236B2 (ja) ウェブサイト判定装置
CN114218574A (zh) 一种数据检测方法、装置、电子设备以及存储介质
RU2702081C2 (ru) Система и способ обнаружения модификации веб-ресурса
JP2022065878A (ja) 情報処理プログラム、情報処理方法、および情報処理装置
JP2016194684A (ja) キュレーション学習における課題指導
JP7438383B2 (ja) ウェブアプリケーションの信頼性の検証
US11068569B2 (en) Method and apparatus for human activity tracking and authenticity verification of human-originated digital assets
CN107480179B (zh) 检测方法及装置和电子设备
JP5183331B2 (ja) 通信再現装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220314

R150 Certificate of patent or registration of utility model

Ref document number: 7042236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150