JP7628266B2 - データ分析システム及び分類処理方法 - Google Patents
データ分析システム及び分類処理方法 Download PDFInfo
- Publication number
- JP7628266B2 JP7628266B2 JP2024117155A JP2024117155A JP7628266B2 JP 7628266 B2 JP7628266 B2 JP 7628266B2 JP 2024117155 A JP2024117155 A JP 2024117155A JP 2024117155 A JP2024117155 A JP 2024117155A JP 7628266 B2 JP7628266 B2 JP 7628266B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- page
- information
- text
- processing means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1を参照し、本実施の形態1におけるデータ分析システム及びその周辺機器等の構成例について説明する。図1に示すように、データ分析システム100は、分類装置10と、分析装置20と、を有している。データ分析システム100と、管理装置30と、サービス提供システム40と、解析システム50と、端末装置80とは、インターネットなどのネットワークNを介して通信可能に接続されている。すなわち、データ分析システム100は、管理装置30、サービス提供システム40、解析システム50、及び端末装置80との間で有線又は無線による通信を行うことができる。
ここで、ページ情報としてのアドレス情報の、分類装置10による取得パターンについて説明する。分類装置10は、サービス提供システム40が提供するサイトとの間で、解析システム50を介しての連携(例えばサイトとのGA連携:以下システム連携という。)がとれている場合、解析システム50のAPI(Application Programming Interface)を利用し、サイト内に含まれるページのURLを列挙させて取得することができる。その際、分類装置10は、各ページのPV数(ページビュー数)などの情報も取得することができ、こうした情報をグルーピングに利用することができる。
(1) サイト内のページを再帰的にクロールする手法:
例えば、サイトのトップページを最初にクロールし、そこに含まれるサイト内のリンクを収集し、それらもクロールする、というように、再帰的にクロールすることによりアドレス情報を収集することができる。かかる手法を採る場合、サイト内のページを再帰的にクロールするクローリング機能を収集処理手段12aにもたせてもよく、クローリング機能をもつ外部サーバなどからクローリング後のアドレス情報を収集処理手段12aが収集してもよい。
(2)サイトマップを活用する手法:
幾つかのサイトは、XMLサイトマップ(sitemap.xml)にサイト内のページのURLが列挙されている場合がある。すなわち、このような場合、収集処理手段12aは、XMLサイトマップからアドレス情報を収集することができる。
図6及び図7を参照して、本実施の形態2におけるデータ分析システム200及びその周辺機器等の構成例について説明する。前述した実施の形態1と同等の構成及び構成部材については同一の符号を付して説明は省略する。
図6、図8~図10を参照して、本実施の形態3におけるデータ分析システム300及びその周辺機器等の構成例について説明する。上述した実施の形態1及び2と同等の構成及び構成部材については同一の符号を付して説明は省略する。
図11を参照して、本実施の形態4におけるデータ分析システム400及びその周辺機器等の構成例について説明する。上述した実施の形態1~3と同等の構成及び構成部材については同一の符号を付して説明は省略する。
図12に示すように、収集処理手段312aは、外部から逐次又は定期的にアドレス情報、テキストデータ、及び表示関連データを収集し、収集した各データを分類用記憶部13に記憶させる。その際、収集処理手段312aは、同じウェブページに対応するアドレス情報とテキストデータと表示関連データとを紐付けて分類用記憶部13に記憶させる。
前処理手段312bは、テキストデータに対する形態素解析をもとに解析データを生成する。あるいは前処理手段312bは、テキストデータ中から不要データを削除して解析データを生成する(テキスト前処理工程)。
前処理手段312bは、分類対象のページに対応する表示関連データから、オブジェクトごとの、種別情報と配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいてフレーム特徴量を生成する(ページ前処理工程)。
分類処理手段312dは、アドレス分類手段D1により、分類対象のページに対応するアドレス情報をアドレス分類モデルM10の入力としてアドレス特徴量を抽出する(アドレス分類工程)。
分類処理手段312dは、テキスト分類手段D2により、分類対象のページに対応する解析データをテキスト分類モデルM20の入力としてテキスト特徴量を抽出する(テキスト分類工程)。
分類処理手段312dは、ページ分類手段D3により、分類対象のページに対応するフレーム特徴量をページ分類モデルM30の入力としてページ特徴量を抽出する(ページ分類工程)。
図13を参照して、実施の形態4の変形例4aにおけるデータ分析システム400Aの構成例について説明する。本変形例4aにおける制御部312は、収集処理手段312aと、テキスト前処理手段B2と、学習処理手段312cと、分類処理手段312dと、を有している。本変形例4aの学習処理手段312cは、アドレス学習手段C1と、テキスト学習手段C2と、統括学習手段Cxaと、を有している。本変形例4aの分類処理手段312dは、アドレス分類手段D1と、テキスト分類手段D2と、統括分類手段Dxaと、を有している。本変形例4aの収集処理手段312aは、ページ情報としてのアドレス情報と、テキストデータとを、逐次又は定期的に収集し、収集した各情報を分類用記憶部13に記憶させる。
図14を参照して、実施の形態4の変形例4bにおけるデータ分析システム400Bの構成例について説明する。本変形例4bにおける制御部312は、収集処理手段312aと、ページ前処理手段B3と、学習処理手段312cと、分類処理手段312dと、を有している。本変形例4bの学習処理手段312cは、アドレス学習手段C1と、ページ学習手段C3と、統括学習手段Cxbと、を有している。本変形例4bの分類処理手段312dは、アドレス分類手段D1と、ページ分類手段D3と、統括分類手段Dxbと、を有している。本変形例4bの収集処理手段312aは、ページ情報としてのアドレス情報と、表示関連データとを、逐次又は定期的に収集し、収集した各情報を分類用記憶部13に記憶させる。
図15を参照して、実施の形態4の変形例4cにおけるデータ分析システム400Cの構成例について説明する。本変形例4cにおける制御部312は、収集処理手段312aと、前処理手段312bと、学習処理手段312cと、分類処理手段312dと、を有している。本変形例4cの学習処理手段312cは、テキスト学習手段C2と、ページ学習手段C3と、統括学習手段Cxcと、を有している。本変形例4bの分類処理手段312dは、テキスト分類手段D2と、ページ分類手段D3と、統括分類手段Dxcと、を有している。本変形例4cの収集処理手段312aは、テキストデータと表示関連データとを逐次又は定期的に収集し、収集した各情報を分類用記憶部13に記憶させる。
図16を参照して、本実施の形態5におけるデータ分析システム500及びその周辺機器等の構成例について説明する。上述した実施の形態1~4と同等の構成及び構成部材については同一の符号を付して説明は省略する。
かかる構成において、分類装置410がテキスト前処理手段B2を有する場合、学習処理手段412cは、過去におけるウェブページごとの解析データ及びフレーム特徴量を入力とする機械学習により、入力とした各情報に紐付くウェブページを分類する分類モデルM5を構築する。そして、分類処理手段412dは、ウェブページごとの解析データ及びフレーム特徴量を、ページ情報として分類モデルM5の入力とし、入力とした各情報に紐付くウェブページを複数のグループのうちの何れかに分類する。
かかる構成において、分類装置410がテキスト前処理手段B2を有しない場合、学習処理手段412cは、過去におけるウェブページごとのテキストデータ及びフレーム特徴量を入力とする機械学習により、入力とした各情報に紐付くウェブページを分類する分類モデルM5を構築する。分類処理手段412dは、ウェブページごとのテキストデータ及びフレーム特徴量を、ページ情報として分類モデルM5の入力とし、入力とした各情報に紐付くウェブページを複数のグループのうちの何れかに分類する。
図17を参照して、本実施の形態5の変形例5aにおけるデータ分析システム500Aの構成例について説明する。本変形例5aの収集処理手段312aは、変形例4aと同様、アドレス情報とテキストデータとを逐次又は定期的に収集する。したがって、学習処理手段412cは、過去における複数組の、ウェブページの位置を示すアドレス情報、及び該ウェブページに対応する解析データを入力とする機械学習により、入力とした各情報に紐付くウェブページを分類する分類モデルM5を構築する。分類処理手段412dは、ウェブページの位置を示すアドレス情報、及び該ウェブページに対応する解析データを、ページ情報として分類モデルM5の入力とし、入力としたページ情報に紐付くウェブページを複数のグループのうちの何れかに分類する。
図18を参照して、本実施の形態5の変形例5bにおけるデータ分析システム500Bの構成例について説明する。本変形例5bの収集処理手段312aは、変形例4bと同様、アドレス情報と表示関連データとを逐次又は定期的に収集する。したがって、学習処理手段412cは、過去における複数組の、ウェブページの位置を示すアドレス情報、及び該ウェブページに対応するフレーム特徴量を入力とする機械学習により、入力とした各情報に紐付くウェブページを分類する分類モデルM5を構築する。分類処理手段412dは、ウェブページごとのアドレス情報及びフレーム特徴量を、ページ情報として分類モデルM5の入力とし、入力としたページ情報に紐付くウェブページを複数のグループのうちの何れかに分類する。
Claims (12)
- ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を前記ページ情報として生成する前処理手段を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成する前処理手段を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報を、過去における複数の前記アドレス情報を用いた機械学習により生成されたアドレス分類モデルの入力としてアドレス特徴量を抽出するアドレス分類手段と、
前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成されたページ分類モデルの入力としてページ特徴量を抽出するページ分類手段と、
前記ウェブページごとの前記アドレス特徴量及び前記ページ特徴量を前記ページ情報として前記分類モデルに入力して各ウェブページのグルーピングを行う統括分類手段と、を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成する前処理手段を有し、
前記分類処理手段は、
前記ウェブページ内のテキストの情報であるテキストデータを、過去における複数の前記テキストデータを用いた機械学習により生成されたテキスト分類モデルの入力としてテキスト特徴量を抽出するテキスト分類手段と、
前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成されたページ分類モデルの入力としてページ特徴量を抽出するページ分類手段と、
前記ウェブページごとの前記テキスト特徴量及び前記ページ特徴量を前記ページ情報として前記分類モデルに入力して各ウェブページのグルーピングを行う統括分類手段と、を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページ内のテキストの情報であるテキストデータに解析処理を施して解析データを生成するテキスト前処理手段と、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段と、を有し、
前記分類処理手段は、
前記解析データを、過去における複数の前記解析データを用いた機械学習により生成されたテキスト分類モデルの入力としてテキスト特徴量を抽出するテキスト分類手段と、
前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成されたページ分類モデルの入力としてページ特徴量を抽出するページ分類手段と、
前記ウェブページごとの前記テキスト特徴量及び前記ページ特徴量を前記ページ情報として前記分類モデルに入力して各ウェブページのグルーピングを行う統括分類手段と、を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成する前処理手段を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報を、過去における複数の前記アドレス情報を用いた機械学習により生成されたアドレス分類モデルの入力としてアドレス特徴量を抽出するアドレス分類手段と、
前記ウェブページ内のテキストの情報であるテキストデータを、過去における複数の前記テキストデータを用いた機械学習により生成されたテキスト分類モデルの入力としてテキスト特徴量を抽出するテキスト分類手段と、
前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成されたページ分類モデルの入力としてページ特徴量を抽出するページ分類手段と、
前記ウェブページごとの前記アドレス特徴量、前記テキスト特徴量、及び前記ページ特徴量を前記ページ情報として前記分類モデルに入力して各ウェブページのグルーピングを行う統括分類手段と、を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページ内のテキストの情報であるテキストデータに解析処理を施して解析データを生成するテキスト前処理手段と、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段と、を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報を、過去における複数の前記アドレス情報を用いた機械学習により生成されたアドレス分類モデルの入力としてアドレス特徴量を抽出するアドレス分類手段と、
前記解析データを、過去における複数の前記解析データを用いた機械学習により生成されたテキスト分類モデルの入力としてテキスト特徴量を抽出するテキスト分類手段と、
前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成されたページ分類モデルの入力としてページ特徴量を抽出するページ分類手段と、
前記ウェブページごとの前記アドレス特徴量、前記テキスト特徴量、及び前記ページ特徴量を前記ページ情報として前記分類モデルに入力して各ウェブページのグルーピングを行う統括分類手段と、を有する、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報、及び該ウェブページに対応する前記フレーム特徴量を、前記ページ情報として前記分類モデルの入力とし、入力とした前記ページ情報を複数の前記グループのうちの何れかに分類するものである、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段を有し、
前記分類処理手段は、
前記ウェブページ内のテキストの情報であるテキストデータ、及び該ウェブページに対応する前記フレーム特徴量を、前記ページ情報として前記分類モデルの入力とし、入力とした前記ページ情報を複数の前記グループのうちの何れかに分類するものである、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページ内のテキストの情報であるテキストデータに解析処理を施して解析データを生成するテキスト前処理手段と、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段と、を有し、
前記分類処理手段は、
前記ウェブページに対応する前記解析データ、及び該ウェブページに対応する前記フレーム特徴量を、前記ページ情報として前記分類モデルの入力とし、入力とした前記ページ情報を複数の前記グループのうちの何れかに分類するものである、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成する前処理手段を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報、該ウェブページ内のテキストの情報であるテキストデータ、及び該ウェブページに対応する前記フレーム特徴量を、前記ページ情報として前記分類モデルの入力とし、入力とした前記ページ情報を複数の前記グループのうちの何れかに分類するものである、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を、過去における複数の前記ページ情報を用いた機械学習により生成された分類モデルの入力とし、入力とした前記ページ情報を性質の類似性に基づく複数のグループのうちの何れかに分類する分類処理手段を有する分類装置と、
前記分類装置による分類で得られたデータに分析処理を施す分析装置と、を有し、
前記分類装置は、
前記ウェブページ内のテキストの情報であるテキストデータに解析処理を施して解析データを生成するテキスト前処理手段と、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を生成するページ前処理手段と、を有し、
前記分類処理手段は、
前記ウェブページの位置を示すアドレス情報、該ウェブページに対応する前記解析データ、及び該ウェブページに対応する前記フレーム特徴量を、前記ページ情報として前記分類モデルの入力とし、入力とした前記ページ情報を複数の前記グループのうちの何れかに分類するものである、データ分析システム。 - ウェブサイトにおけるウェブページに紐付くページ情報を分類する分類装置が、
前記ウェブページにおける、表示画面上に配置される各オブジェクトの情報を含む表示関連データを用いて、該ウェブページを各オブジェクトの種別に対応するパーツ情報を含むワイヤフレーム画像に変換し、該ワイヤフレーム画像から、オブジェクトごとの、該オブジェクトの種別を示す種別情報と、該オブジェクトの位置及びサイズを示す配置情報との組み合わせによる識別情報を生成し、
生成したオブジェクトごとの識別情報に基づいて固定長のベクトル表現であるフレーム特徴量を前記ページ情報として生成し、
生成した前記フレーム特徴量を、過去における複数の前記フレーム特徴量を用いた機械学習により生成された分類モデルの入力とし、入力とした前記フレーム特徴量を性質の類似性に基づく複数のグループのうちの何れかに分類し、
前記分類装置による分類で得られたデータに分析装置が分析処理を施す、分類処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024117155A JP7628266B2 (ja) | 2020-06-04 | 2024-07-22 | データ分析システム及び分類処理方法 |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020097382A JP2021189984A (ja) | 2020-06-04 | 2020-06-04 | 分類装置、データ分析システム、分類処理プログラム、及び分類処理方法 |
| JP2024117155A JP7628266B2 (ja) | 2020-06-04 | 2024-07-22 | データ分析システム及び分類処理方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020097382A Division JP2021189984A (ja) | 2020-06-04 | 2020-06-04 | 分類装置、データ分析システム、分類処理プログラム、及び分類処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024160705A JP2024160705A (ja) | 2024-11-14 |
| JP7628266B2 true JP7628266B2 (ja) | 2025-02-10 |
Family
ID=78849696
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020097382A Pending JP2021189984A (ja) | 2020-06-04 | 2020-06-04 | 分類装置、データ分析システム、分類処理プログラム、及び分類処理方法 |
| JP2024117155A Active JP7628266B2 (ja) | 2020-06-04 | 2024-07-22 | データ分析システム及び分類処理方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020097382A Pending JP2021189984A (ja) | 2020-06-04 | 2020-06-04 | 分類装置、データ分析システム、分類処理プログラム、及び分類処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (2) | JP2021189984A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102571350B1 (ko) * | 2023-03-24 | 2023-08-29 | (주)유알피 | 딥러닝 모델 기반 태깅 기술을 활용한 맞춤형 분석보고서 제공방법 및 그 장치 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176511A (ja) | 2007-01-17 | 2008-07-31 | Fukuoka Institute Of Technology | コンピュータネットワークにおける情報処理方法および情報処理装置 |
| US20140040723A1 (en) | 2012-07-31 | 2014-02-06 | International Business Machines Corporation | Enriching website content |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101399818B (zh) * | 2007-09-25 | 2012-08-29 | 日电(中国)有限公司 | 基于导航路径信息的主题相关网页过滤方法和系统 |
| US8863000B2 (en) * | 2010-04-07 | 2014-10-14 | Yahoo! Inc. | Method and system for action suggestion using browser history |
| JP6056094B2 (ja) * | 2015-04-14 | 2017-01-11 | 株式会社Wacul | サイト分析システム、サイト分析方法、サーバ装置、及びプログラム |
| JP6749865B2 (ja) * | 2017-06-07 | 2020-09-02 | 日本電信電話株式会社 | 情報収集装置、および、情報収集方法 |
-
2020
- 2020-06-04 JP JP2020097382A patent/JP2021189984A/ja active Pending
-
2024
- 2024-07-22 JP JP2024117155A patent/JP7628266B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176511A (ja) | 2007-01-17 | 2008-07-31 | Fukuoka Institute Of Technology | コンピュータネットワークにおける情報処理方法および情報処理装置 |
| US20140040723A1 (en) | 2012-07-31 | 2014-02-06 | International Business Machines Corporation | Enriching website content |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024160705A (ja) | 2024-11-14 |
| JP2021189984A (ja) | 2021-12-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Amado et al. | Research trends on Big Data in Marketing: A text mining and topic modeling based literature analysis | |
| KR102155739B1 (ko) | 질의응답 데이터 셋을 적응적으로 재사용하는 챗봇 서비스 제공 방법, 서버, 및 시스템 | |
| US7987417B2 (en) | System and method for detecting a web page template | |
| CN107506402B (zh) | 搜索结果的排序方法、装置、设备及计算机可读存储介质 | |
| CN113822067A (zh) | 关键信息提取方法、装置、计算机设备及存储介质 | |
| CN111859149A (zh) | 资讯信息推荐方法、装置、电子设备及存储介质 | |
| WO2019024755A1 (zh) | 网页信息提取方法、装置、系统及电子设备 | |
| CA3088695A1 (en) | Method and system for decoding user intent from natural language queries | |
| US10831809B2 (en) | Page journey determination from web event journals | |
| US10678831B2 (en) | Page journey determination from fingerprint information in web event journals | |
| US20180096067A1 (en) | Creation and optimization of resource contents | |
| Das et al. | A CV parser model using entity extraction process and big data tools | |
| CN113918794B (zh) | 企业网络舆情效益分析方法、系统、电子设备及存储介质 | |
| KR101667199B1 (ko) | 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치 | |
| CN111259220A (zh) | 一种基于大数据的数据采集方法和系统 | |
| Feng et al. | InterSentiment: combining deep neural models on interaction and sentiment for review rating prediction | |
| JP7628266B2 (ja) | データ分析システム及び分類処理方法 | |
| JP7213568B2 (ja) | トレジャーキーワードの判断及び再分類方法並びにシステム | |
| CN120163632A (zh) | 产品推荐策略生成方法、装置、计算机设备及存储介质 | |
| WO2017070672A1 (en) | Methods and systems for targeted advertising | |
| Singh et al. | Python-powered web scraping for data extraction | |
| Garg et al. | AI Insights: Navigating Education News Ethically Through Aggregation and Sentiment Analysis | |
| CN120123816B (zh) | 一种用于情报数据溯源分析的数据处理方法及装置 | |
| Dhara | AI-Enabled Predictive Analytics for Collection Development in College Libraries. | |
| Somadasa et al. | Online learning resources finder based on computer programming domain |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240722 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240722 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240911 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20241108 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241212 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241225 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250121 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7628266 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |