JP2010072727A - 履歴処理装置、履歴処理方法および履歴処理プログラム - Google Patents
履歴処理装置、履歴処理方法および履歴処理プログラム Download PDFInfo
- Publication number
- JP2010072727A JP2010072727A JP2008236758A JP2008236758A JP2010072727A JP 2010072727 A JP2010072727 A JP 2010072727A JP 2008236758 A JP2008236758 A JP 2008236758A JP 2008236758 A JP2008236758 A JP 2008236758A JP 2010072727 A JP2010072727 A JP 2010072727A
- Authority
- JP
- Japan
- Prior art keywords
- history data
- history
- processing
- data
- groups
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】履歴処理装置は、まず、時系列で記録されたユーザの行動履歴データに含まれる各履歴データを履歴集合に分類するため第一の条件に基づいて、各履歴データをいくつかの履歴集合に分類する第一処理を実行する。第一処理終了後、履歴処理装置は、履歴データの記録時点および履歴データ間の類似度に関する第二の条件に基づいて、第一処理により集合に分類されずに残された孤立データを集合のいずれかに組み込む第二処理を実行する。
【選択図】 図2
Description
まず、以下の実施例で登場する主要な用語について簡単に説明する。以下の実施例の中で登場する「行動履歴」とは、ウェブページ閲覧、機械操作や位置情報などユーザのある瞬間の所作に伴って、時系列で記録される履歴をいう。
図1〜3を参照しつつ、本発明に係る履歴処理装置の骨子について説明する。本発明に係る履歴処理装置の骨子は、以下に説明する実施例に共通する概念である。図1〜3は、本発明に係る履歴処理装置の骨子を説明するための図である。
まず、図4〜図7を参照しつつ、実施例1に係る履歴処理装置の概要および特徴を説明する。図4〜図7は、実施例1に係る履歴処理装置の概要および特徴を説明するための図である。
次に、図8〜図10を用いて、実施例1に係る履歴処理装置の構成を説明する。図8は、実施例1に係る全体構成を説明するための図である。図9は、実施例1に係るユーザPCの構成を示す図である。図10は、実施例1に係る履歴処理装置の構成を示す図である。
続いて、図11を用いて、ユーザPC10による処理を説明した後に、図12および図13を用いて、実施例1に係る履歴処理装置による処理を説明する。図11は、実施例1に係るユーザPC10による処理の流れを示す図である。図12および図13は、実施例1に係る履歴処理装置による処理の流れを示す図である。
図11に示すように、ブラウザなどのソフトウェア上の処理開始トリガーを通じて、ユーザから履歴処理要求があると(ステップS1肯定)、履歴取得部11は、通信網1等を利用してユーザにより閲覧されたウェプページの閲覧履歴データを取得し(ステップS2)、取得した閲覧履歴データの一覧(例えば、図7参照)を履歴処理装置20に送信する(ステップS3)。
図12に示すように、ユーザPC10から閲覧履歴データの一覧(図7参照)を受信すると(ステップS1肯定)、履歴間類似度算出部21は、各閲覧履歴データに対応するURLにアクセスしてソースを取得し、取得したソースからHTMLタグやメニュー、広告といったテキストを除去したウェブページ本文を取得する(ステップS2)。
上述してきたように、実施例1によれば、閲覧履歴データを閲覧履歴集合に分類するための融合基準が移動して誤解析が連鎖することを防止しつつ、閲覧履歴データを高精度に分類できる。さらに、例えば、図7に示すように、Y地域で繋がりを有する集合、電磁気学で繋がりを有する集合、化学で繋がりを有する集合など、複数の閲覧履歴集合が並存する場合のクラスタリング処理を実現する。
図15は、実施例3に係る全体構成を示す図である。同図に示すように、実施例3に係る履歴処理装置20は、情報提供装置30および他の履歴処理装置20’に接続されるとともに、プロキシ40を介して複数のユーザが同一のユーザIDを用いてアクセスするアクセス先サーバ50に接続される。
図16は、実施例3に係る履歴処理装置による処理の流れを示す図である。同図に示すように、履歴処理装置20の履歴間類似度算出部21は、ユーザIDが同一である閲覧履歴データをアクセス先サーバ50から取得する(ステップS1)。
図17は、実施例4に係る全体構成を示す図である。同図に示すように、実施例4に係る履歴処理装置20は、行動履歴作成部23をさらに有し、ユーザPC10や情報提供装置30、通信網1だけでなく、ユーザが所有する端末60と通信可能な状態で接続される点が上記の実施例1とは異なる。
図18は、実施例4に係る履歴処理装置による処理の流れを示す図である。同図に示すように、履歴処理装置20の行動履歴作成部23は、端末60から位置情報を受信すると、位置データベースサーバに問い合わせて、位置情報に関する情報を取得し、位置情報(緯度や経度)と対応づけたものをユーザの行動履歴データとして作成する(ステップS1)。
上記の実施例で説明してきた履歴処理装置20は、特定のウェブサイト内でも同様に利用することができる。
また、上記の実施例で説明してきた履歴処理装置20の各種処理機能(例えば、図12、図13等参照)をユーザPC10に適用して、ユーザPC10において、上記の実施例で説明してきた履歴処理装置20と同様の処理を実行させるようにしてもよい。
また、上記の実施例で説明してきた履歴処理装置20の各種処理機能(例えば、図13および図14等参照)が適用されたユーザPC10が、各種外部機器(CD、DVD、USB、携帯電話、PDAやPHSなど)などから履歴データを取得するようにしてもよい。
また、例えば、図10に示した履歴処理装置20の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、履歴処理装置20の分散・統合の具体的形態は図示のものに限られず、例えば、履歴間類似度算出部21と分散処理部22とを統合するなど、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、履歴処理装置20にて行なわれる各処理機能(図12、図13等参照)は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、上記の実施例で説明した履歴処理装置20の各種の処理(例えば、図12、図13等参照)は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、図19を用いて、上記の実施例と同様の機能を有する履歴処理プログラムを実行するコンピュータの一例を説明する。図19は、履歴処理プログラムを実行するコンピュータを示す図である。
上記の実施例で説明した履歴処理装置20により、以下のような履歴処理方法が実現される。
10 ユーザPC
11 履歴取得部
20、20’ 履歴処理装置
21 履歴間類似度算出部
22 分類処理部
23 行動履歴作成部
30 情報提供装置
40 プロキシ
50 アクセス先サーバ
60 端末
61 位置情報取得部
70 コンピュータ(履歴処理装置)
71 通信制御部
72 HDD(Hard Disk Drive)
72a 履歴処理プログラム
72b 履歴処理用データ
73 RAM(Random Access Memory)
73a 履歴処理プロセス
74 CPU(Central Processing Unit)
80 バス
Claims (8)
- 時系列で記録されたユーザの行動履歴データに関する処理を行う履歴処理装置であって、
全行動履歴データに含まれる各履歴データを所定のグループに分類するための履歴データの記録時点および前記履歴データ間の類似度に関する第一の条件に基づいて、前記各履歴データをいくつかのグループに分類する第一処理手段と、
前記記録時点および前記類似度に関する第二の条件に基づいて、前記第一処理手段により前記グループに分類されずに残された各履歴データを前記グループのいずれかに組み込むが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の条件を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行する第二処理手段と、
を備えたことを特徴とする履歴処理装置。 - 前記第一処理手段は、前記記録時点が第一の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が第一の閾値を超えているという第一の条件を満足するか否かに基づいて、全行動履歴データに含まれる各履歴データをいくつかのグループに分類し、
前記第二処理手段は、前記グループに分類されずに残された履歴データについて、前記記録時点が第二の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が前記第一の閾値よりも小さな第二の閾値を超えているという第二の条件を満足する履歴データ数が所定の割合以上を占める前記グループを特定して、特定されたグループへの組み込みを実行するが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の閾値よりも小さな値に当該第二の閾値を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行することを特徴とする請求項1に記載の履歴処理装置。 - 前記第一処理手段は、前記記録時点が第一の範囲内にあり、かつ所定の指標に基づいて算出された前記履歴データのテキストデータ間の意味的類似度が第一の閾値を超えているという第一の条件を満足するか否かに基づいて、全行動履歴データに含まれる各履歴データをいくつかのグループに分類し、
前記第二処理手段は、前記グループに分類されずに残された履歴データについて、前記記録時点が第二の範囲内にあり、かつ所定の指標に基づいて算出された前記意味的類似度が前記第一の閾値よりも小さな第二の閾値を超えているという第二の条件を満足する履歴データ数が所定の割合以上を占める前記グループを特定して、特定されたグループへの組み込みを実行することを特徴とする請求項2に記載の履歴処理装置。 - ユーザの移動に伴って記録される位置情報と、当該位置情報に紐付けるための付与情報とを対応付けたデータを前記行動履歴データとして生成する行動履歴データ生成手段をさらに備え、
前記第一処理手段は、前記位置情報の記録時点が第一の範囲内にあり、かつ前記位置情報および/または前記付与情報を用いて、所定の指標に基づいて算出された行動履歴データ間の類似度が第一の閾値を超えているという第一の条件を満足するか否かに基づいて、前記行動履歴データ生成手段により生成された全行動履歴データに含まれる各履歴データをいくつかのグループに分類し、
前記第二処理手段は、前記グループに分類されずに残された履歴データについて、前記記録時点が第二の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が前記第一の閾値よりも小さな第二の閾値を超えているという第二の条件を満足する履歴データ数が所定の割合以上を占める前記グループを特定して、特定されたグループへの組み込みを実行することを特徴とする請求項1に記載の履歴処理装置。 - 時系列で記録されたユーザの行動履歴データに関する処理を行う履歴処理方法であって、
全行動履歴データに含まれる各履歴データを所定のグループに分類するための履歴データの記録時点および前記履歴データ間の類似度に関する第一の条件に基づいて、前記各履歴データをいくつかのグループに分類する第一処理ステップと、
前記記録時点および前記類似度に関する第二の条件に基づいて、前記第一処理ステップにより前記グループに分類されずに残された各履歴データを前記グループのいずれかに組み込むが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の条件を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行する第二処理ステップと、
を含んだことを特徴とする履歴処理方法。 - 前記第一処理ステップは、前記記録時点が第一の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が第一の閾値を超えているという条件を満足するか否かに基づいて、全行動履歴データに含まれる各履歴データをいくつかのグループに分類し、
前記第二処理ステップは、前記グループに分類されずに残された履歴データについて、前記記録時点が第二の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が前記第一の閾値よりも小さな第二の閾値を超えているという第二の条件を満足する履歴データ数が所定の割合以上を占める前記グループを特定して、特定されたグループへの組み込みを実行するが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の閾値よりも小さな値に当該第二の閾値を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行することを特徴とする請求項5に記載の履歴処理方法。 - 時系列で記録されたユーザの行動履歴データに関する処理をコンピュータに実行させる履歴処理プログラムであって、
全行動履歴データに含まれる各履歴データを所定のグループに分類するための履歴データの記録時点および前記履歴データ間の類似度に関する第一の条件に基づいて、前記各履歴データをいくつかのグループに分類する第一処理手順と、
前記記録時点および前記類似度に関する第二の条件に基づいて、前記第一処理手順により前記グループに分類されずに残された各履歴データを前記グループのいずれかに組み込むが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の条件を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行する第二処理手順と、
をコンピュータに実行させることを特徴とする履歴処理プログラム。 - 前記第一処理手順は、前記記録時点が第一の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が第一の閾値を超えているという条件を満足するか否かに基づいて、全行動履歴データに含まれる各履歴データをいくつかのグループに分類し、
前記第二処理手順は、前記グループに分類されずに残された履歴データについて、前記記録時点が第二の範囲内にあり、かつ所定の指標に基づいて算出された前記類似度が前記第一の閾値よりも小さな第二の閾値を超えているという第二の条件を満足する履歴データ数が所定の割合以上を占める前記グループを特定して、特定されたグループへの組み込みを実行するが、前記グループのいずれかに組み込まれずに残された履歴データが存在する場合には、当該残された履歴データが前記グループのいずれかへ組み込まれるまで、前記第二の閾値よりも小さな値に当該第二の閾値を変更して、前記残された履歴データの前記グループのいずれかへの組み込みを実行することを特徴とする請求項7に記載の履歴処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008236758A JP5079642B2 (ja) | 2008-09-16 | 2008-09-16 | 履歴処理装置、履歴処理方法および履歴処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008236758A JP5079642B2 (ja) | 2008-09-16 | 2008-09-16 | 履歴処理装置、履歴処理方法および履歴処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010072727A true JP2010072727A (ja) | 2010-04-02 |
JP5079642B2 JP5079642B2 (ja) | 2012-11-21 |
Family
ID=42204481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008236758A Expired - Fee Related JP5079642B2 (ja) | 2008-09-16 | 2008-09-16 | 履歴処理装置、履歴処理方法および履歴処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5079642B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093803A (ja) * | 2010-10-22 | 2012-05-17 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
JP2013058176A (ja) * | 2011-09-09 | 2013-03-28 | Kddi Corp | 通信サービスにおける地理的領域の価値を判定するサーバ装置及びプログラム |
WO2013094426A1 (ja) * | 2011-12-22 | 2013-06-27 | 株式会社日立製作所 | 行動属性分析方法および装置 |
JP2014502392A (ja) * | 2010-11-25 | 2014-01-30 | サムスン エレクトロニクス カンパニー リミテッド | コンテンツ提供方法及びそのシステム |
WO2016194909A1 (ja) * | 2015-06-02 | 2016-12-08 | 日本電信電話株式会社 | アクセス分類装置、アクセス分類方法、及びアクセス分類プログラム |
US20210110403A1 (en) * | 2019-10-15 | 2021-04-15 | Microsoft Technology Licensing, Llc | Semantic sweeping of metadata enriched service data |
-
2008
- 2008-09-16 JP JP2008236758A patent/JP5079642B2/ja not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093803A (ja) * | 2010-10-22 | 2012-05-17 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
JP2014502392A (ja) * | 2010-11-25 | 2014-01-30 | サムスン エレクトロニクス カンパニー リミテッド | コンテンツ提供方法及びそのシステム |
US9465863B2 (en) | 2010-11-25 | 2016-10-11 | Samsung Electronics Co., Ltd. | Content-providing method and system |
KR101802332B1 (ko) | 2010-11-25 | 2017-12-29 | 삼성전자주식회사 | 컨텐츠 제공 방법 및 그 시스템 |
JP2013058176A (ja) * | 2011-09-09 | 2013-03-28 | Kddi Corp | 通信サービスにおける地理的領域の価値を判定するサーバ装置及びプログラム |
WO2013094426A1 (ja) * | 2011-12-22 | 2013-06-27 | 株式会社日立製作所 | 行動属性分析方法および装置 |
JP2013131170A (ja) * | 2011-12-22 | 2013-07-04 | Hitachi Ltd | 行動属性分析方法および装置 |
WO2016194909A1 (ja) * | 2015-06-02 | 2016-12-08 | 日本電信電話株式会社 | アクセス分類装置、アクセス分類方法、及びアクセス分類プログラム |
JPWO2016194909A1 (ja) * | 2015-06-02 | 2018-04-05 | 日本電信電話株式会社 | アクセス分類装置、アクセス分類方法、及びアクセス分類プログラム |
US10462168B2 (en) | 2015-06-02 | 2019-10-29 | Nippon Telegraph And Telephone Corporation | Access classifying device, access classifying method, and access classifying program |
US20210110403A1 (en) * | 2019-10-15 | 2021-04-15 | Microsoft Technology Licensing, Llc | Semantic sweeping of metadata enriched service data |
US11587095B2 (en) * | 2019-10-15 | 2023-02-21 | Microsoft Technology Licensing, Llc | Semantic sweeping of metadata enriched service data |
Also Published As
Publication number | Publication date |
---|---|
JP5079642B2 (ja) | 2012-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8051080B2 (en) | Contextual ranking of keywords using click data | |
US7716216B1 (en) | Document ranking based on semantic distance between terms in a document | |
US7496581B2 (en) | Information search system, information search method, HTML document structure analyzing method, and program product | |
US8965894B2 (en) | Automated web page classification | |
KR101644817B1 (ko) | 탐색 결과들을 생성하는 방법 | |
US9251249B2 (en) | Entity summarization and comparison | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN104899322A (zh) | 搜索引擎及其实现方法 | |
JP5079642B2 (ja) | 履歴処理装置、履歴処理方法および履歴処理プログラム | |
Li et al. | Mining user reviews for mobile app comparisons | |
JP2014106661A (ja) | ユーザ状態予測装置及び方法及びプログラム | |
Shawon et al. | Website classification using word based multiple n-gram models and random search oriented feature parameters | |
US10198497B2 (en) | Search term clustering | |
CN110245357B (zh) | 主实体识别方法和装置 | |
US8365064B2 (en) | Hyperlinking web content | |
Sabri et al. | WEIDJ: Development of a new algorithm for semi-structured web data extraction | |
Selvadurai | A natural language processing based web mining system for social media analysis | |
Rose et al. | Efficient Webpage Retrieval Using WEGA | |
Ojokoh et al. | Online question answering system | |
KR102625347B1 (ko) | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 | |
US8832082B2 (en) | Presentation of search results with diagrams | |
JP2013084216A (ja) | 定型文判別装置及び定型文判別方法 | |
Liu et al. | User Behaviors in Related Word Retrieval and New Word Detection: A Collaborative Perspective | |
JP2011086278A (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム | |
Singh et al. | Clustering of blogs with enhanced semantics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100723 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110520 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120612 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120829 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5079642 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |