JP2013242804A - Id割当装置、方法及びプログラム - Google Patents
Id割当装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2013242804A JP2013242804A JP2012116893A JP2012116893A JP2013242804A JP 2013242804 A JP2013242804 A JP 2013242804A JP 2012116893 A JP2012116893 A JP 2012116893A JP 2012116893 A JP2012116893 A JP 2012116893A JP 2013242804 A JP2013242804 A JP 2013242804A
- Authority
- JP
- Japan
- Prior art keywords
- personal
- cluster
- websites
- index
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】ID割当装置1は、複数の個人ウェブサイト、及び複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶するサイト管理DB22と、リンク情報に基づいて2つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第1の指標を算出するメトリック算出部12と、第1の指標に基づいて、1以上の個人ウェブサイトからなるクラスタの集合を生成するメトリッククラスタ生成部13cと、複数の個人ウェブサイトに対して、クラスタ毎に異なり、かつ、クラスタ内で同一の管理者IDを割り当てるID割当部14と、を備える。
【選択図】図3
Description
ここで、オフラインの個人とは、ネットワーク(インターネット)を利用する現実のユーザそれぞれをいい、ネットワーク上でオンラインの個人を管理している。オンラインの個人とは、ネットワークを通じて所定のサービス群の提供を受ける仮想のユーザをいい、オフラインの個人とオンラインの個人とは、1対1又は1対多の関係にある。
近年、特に中学生や高校生の間では、各人が複数のオンラインの個人を操り、それぞれのオンラインの個人で複数の個人ウェブサイトを作成し、自身のサイト間のみならず、他者とのサイト間で互いにハイパーリンクを設け、情報やメッセージの公開及び交換を行うことが多い。
しかしながら、この仮定された条件に合致しない事例が出現すると、分類の精度が低下してしまうという課題があった。
この結果、ID割当装置は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
本実施形態に係るID割当装置1は、オンラインの個人が管理する個人ウェブサイトに対して、このオンラインの個人を識別するオンラインIDを割り当てる装置である。なお、ID割当装置1は、サーバ装置やPC(Personal Computer)等、様々な情報処理装置(コンピュータ)であってよい。
現実の人物であるオフラインの個人は、ネットワーク(インターネット)上で、1又は複数のオンラインの個人を管理している。また、オンラインの個人は、1又は複数の個人ウェブサイトを管理している。
ゲスブ(ゲストブック)・・・訪問者が履歴としてコメントを投稿できるサイト。
リアル(リアルタイム)・・・個人の現況を短い文章で投稿できるサイト。
ブログ・・・日々更新される日記を公開できるサイト。
マイリンク・・・他者の個人ウェブサイトへのリンクを掲載できるサイト。
ホムペ(ホームページ)・・・個人用のサイト。
クラスB(ゲスブ、マイリンク)・・・オンラインの個人がクラスAのサイトに付随して作成する個人ウェブサイト。
クラスC(リアル、ブログ)・・・オンラインの個人が他者と識別するために単体で、又はクラスAのサイトに付随して作成する個人ウェブサイト。
ID割当装置1は、制御部10と、記憶部20と、通信部30と、入力部40と、出力部50とを備える。
まず、本実施形態において使用する記号を説明する。
−個人ウェブサイトのネットワーク(有向グラフ):G=(V,E)
・個人ウェブサイト(ノード):vi∈V,(i=1,2,・・・,|V|)
個人ウェブサイトの数(グラフのサイズ):|V|
・viからvjへのハイパーリンク:(vi,vj)∈E, (vi,vj∈V)
ハイパーリンクの数:|E|
−個人ウェブサイトの属性
・URL:URL(vi)
・タイプ:TYPE(vi)
・クラス:C(vi)
・サービスプロバイダ:SP(vi)
・アカウントID:ACID(vi)
・管理者のID(OnID):ONID(vi)
−ハイパーリンクの属性
・ハイパーリンクの強さ:|(vi,vj)|
具体的には、viからvjへのハイパーリンクの本数を表す。
・時刻t0,t1間のハイパーリンクの強さ:|(vi,vj)|t0→t1
ブログ、リアル、ゲスブでのコメント投稿で発生するハイパーリンク等、時刻情報を持つハイパーリンクのうち、指定された期間内(時刻t0からt1まで)のハイパーリンクの本数を表す。ただし、プロフ、ホムペ、マイリンクで発生するハイパーリンク等、時刻情報を持たないハイパーリンクは、全期間において発生しているものとみなす。
(1)Similarity=|Γ(vi)∩Γ(vj)|/|V|
ただし、
Γ(vi)={w|(vi,w)∈E or (w,vi)∈E}
は、隣接する個人ウェブサイト(隣接ノード)の集合であり、ハイパーリンクの向きに依存しない。また、
|Γ(vi)∩Γ(vj)|
は、共通の隣接ノードの数である。
ただし、
Γ+(vi)={w|(vi,w)∈E or (w,vi)∈E}∪{vi}
は、Γ(vi)と同様に隣接ノードの集合であるが、自ノード(vi)を含む。また、
|Γ+(vi)∩Γ+(vj)|
は、共通の隣接ノードの数である。
7つのノードが図のようにハイパーリンクによって隣接している。具体的には、算出方法(1)の場合、ノードv1及びノードv2の隣接ノードは、
Γ(v1)={v2,v3,v4,v5,v6}
Γ(v2)={v1,v3,v4,v5}
である。このとき、共通の隣接ノードは、
Γ(v1)∩Γ(v2)={v3,v4,v5}
である。したがって、
Similarity=3/7
となる。
Γ+(v1)={v1,v2,v3,v4,v5,v6}
Γ+(v2)={v1,v2,v3,v4,v5}
である。このとき、共通の隣接ノードは、
Γ+(v1)∩Γ+(v2)={v1,v2,v3,v4,v5}
である。したがって、
Similarity=5/7
となる。
以下、自ノードを含む(2)の算出方法を用いて説明する。
ここで、入次数又は出次数は、隣接する個人ウェブサイトが所定のクラス又はタイプである場合のハイパーリンクの数に限定してもよい。
さらに、メトリック算出部12は、リンク情報のうち、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの強さが所定値に満たない場合、このハイパーリンクを除いて、Similarityを算出する。なお、所定値は、ハイパーリンクのリンク元のクラス又はタイプ毎に設定される。
(A)管理者は、クラスAの個人ウェブサイトから他者の個人ウェブサイトへハイパーリンクを張らない。
(B)管理者は、自身の個人ウェブサイトから他者のクラスBの個人ウェブサイトへハイパーリンクを張らない。
ノードv1及びv2からなるクラスタCL(v1,v2)と、ノードv3及びv4からなるクラスタCL(v3,v4)との組み合わせに関するSimilarity(第2の指標)は、各ノード間のSimilarity(第1の指標)から求められる。
|Γ+(v1)∩Γ+(v3)|/|V|=4/7
|Γ+(v2)∩Γ+(v3)|/|V|=4/7
|Γ+(v1)∩Γ+(v4)|/|V|=5/7
|Γ+(v2)∩Γ+(v4)|/|V|=5/7
である。したがって、これらの最大値を用いて、クラスタ間のSimilarityは、
Similarity=5/7
となる。
図8は、本実施形態に係る制御部10における処理を示すフローチャートである。
なお、処理対象とする範囲の個人ウェブサイトの収集は終了し、サイト管理DB22に記憶されているものとする。ただし、収集履歴管理テーブルのOnIDは空欄である。
図9のように、7つの個人ウェブサイト(ノード)がハイパーリンクによってリンクされているものとする。
V={v1,v2,v3,v4,v5,v6,v7}
ただし、v1,v7:クラスA、v2,v6:クラスB、v3,v4,v5:クラスC
E={(v1,v2),(v2,v3),(v2,v4),(v2,v5),(v3,v1),(v3,v4),(v4,v1),(v4,v5),(v5,v1),(v6,v1),(v6,v7),(v7,v6)}
以下、クラスタ生成時の閾値は、「Th=5/7」であるとする。
このとき、Similarityの表において、ノードv1及びv2が削除されると共に、これらがクラスタCL(v1,v2)に結合される。
このとき、Similarityの表において、ノードv6及びv7が削除されると共に、これらがクラスタCL(v6,v7)に結合される。
そして、図13のように、各ノード及びクラスタに対して、4つのOnIDが割り当てられる。
この結果、ID割当装置1は、同一のオンラインの個人が管理する個人ウェブサイトに関する情報を容易に取得できるので、教師や保護者等は、このID割当装置1を子供達(特に中高生)が作成した個人ウェブサイトの監視に役立てることができる。
さらに、ID割当装置1は、クラスタが生成された際に、このクラスタとの組み合わせに関する第2の指標を、クラスタに属する個人ウェブサイトとの組み合わせに関する指標の最大値として容易に求めることができる。
さらに、ID割当装置1は、サイトのクラスに基づいてOnIDの割り当て対象外であるサイトをノイズとして、より確実に除去できる。
さらに、ID割当装置1は、リンク元の種別毎にハイパーリンクの強さの閾値であるStrengthを設定するので、利用形態によって異なるハイパーリンクの発生傾向に対応して、より確実にノイズを除去できる。
(3)Similarity=|Γ(vi)∩Γ(vj)|/|Γ(vi)∪Γ(vj)|
又は、
(4)Similarity=|Γ+(vi)∩Γ+(vj)|/|Γ+(vi)∪Γ+(vj)|
としてもよい。このように、分母をvi又はvjに隣接したノードの総数とすることにより、ID割当装置1は、収集したノードの数|V|に依存しない閾値を設定することができる。
10 制御部
11 サイト収集部(収集部)
12 メトリック算出部(算出部)
13a アカウントクラスタ生成部(第3の生成部)
13b 種別クラスタ生成部(第2の生成部)
13c メトリッククラスタ生成部(第1の生成部)
14 ID割当部(割当部)
15 アプリケーション部
20 記憶部
21 サイト保存DB
22 サイト管理DB
30 通信部
40 入力部
50 出力部
Claims (14)
- 複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶する記憶部と、
前記リンク情報に基づいて、2つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第1の指標を算出する算出部と、
前記第1の指標に基づいて、1以上の個人ウェブサイトからなるクラスタの集合を生成する第1の生成部と、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者IDを割り当てる割当部と、を備えるID割当装置。 - 前記算出部は、前記隣接する個人ウェブサイトとして自身を含めて、前記第1の指標を算出する請求項1に記載のID割当装置。
- 前記第1の生成部は、前記第1の指標が所定以上に大きい個人ウェブサイトの組み合わせを同一のクラスタに含める請求項1又は請求項2に記載のID割当装置。
- 前記第1の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第1の指標を、所定の規則に従ってクラスタとクラスタ、又はクラスタと個人ウェブサイトの組み合わせに関する第2の指標に統合し、前記第1の指標又は前記第2の指標に基づいて、個人ウェブサイトと個人ウェブサイト、個人ウェブサイトとクラスタ、又はクラスタとクラスタとを結合したクラスタを生成する処理を、前記第1の指標及び前記第2の指標が所定値に満たなくなるまで繰り返す請求項1又は請求項2に記載のID割当装置。
- 前記第1の生成部は、前記クラスタに属する個人ウェブサイトと当該クラスタ外の個人ウェブサイトとの組み合わせに関する前記第1の指標の最大値を前記第2の指標とする請求項4に記載のID割当装置。
- 前記複数の個人ウェブサイトそれぞれのURLに基づいて分類される利用形態を表す所定数の種別、及び前記ハイパーリンクの入出力関係の構造に基づいて、予め設定されている所定の入出力の関係にある所定種別の個人ウェブサイトの組み合わせを結合して前記クラスタを生成する第2の生成部を備える請求項1から請求項5のいずれかに記載のID割当装置。
- 前記複数の個人ウェブサイトそれぞれのURLにより識別可能なサービスプロバイダのアカウントに基づいて、当該アカウントが同一の個人ウェブサイトを結合して前記クラスタを生成する第3の生成部を備える請求項1から請求項6のいずれかに記載のID割当装置。
- 前記算出部は、前記ハイパーリンクの入次数及び出次数が所定の条件を満たす個人ウェブサイト、及び当該個人ウェブサイトに関する前記リンク情報を除いて、前記第1の指標を算出する請求項1から請求項7のいずれかに記載のID割当装置。
- 前記入次数又は前記出次数は、隣接する個人ウェブサイトが当該個人ウェブサイトのURLに基づいて分類される利用形態を表す所定の種別である場合のハイパーリンクの数である請求項8に記載のID割当装置。
- 前記算出部は、前記リンク情報のうち、所定の期間以外に発生したハイパーリンクを除いて、前記第1の指標を算出する請求項1から請求項9のいずれかに記載のID割当装置。
- 前記算出部は、前記リンク情報のうち、所定の期間に同一の個人ウェブサイト間で発生したハイパーリンクの数が所定数に満たない場合、当該ハイパーリンクを除いて、前記第1の指標を算出する請求項1から請求項10のいずれかに記載のID割当装置。
- 前記所定数は、前記ハイパーリンクのリンク元の個人ウェブサイトのURLに基づいて分類される利用形態を表す種別毎に設定される請求項11に記載のID割当装置。
- 複数の個人ウェブサイトそれぞれに対して、コンピュータが管理者IDを割り当てるID割当方法であって、
前記コンピュータが前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、
前記リンク情報に基づいて、2つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第1の指標を算出する算出ステップと、
前記第1の指標に基づいて、1以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者IDを割り当てる割当ステップと、を実行する方法。 - 複数の個人ウェブサイトそれぞれに対して、コンピュータに管理者IDを割り当てさせるためのID割当プログラムであって、
前記コンピュータは、前記複数の個人ウェブサイト、及び当該複数の個人ウェブサイト間におけるハイパーリンクによる隣接関係を示したリンク情報を記憶し、
前記リンク情報に基づいて、2つの個人ウェブサイトが共通の隣接する個人ウェブサイトを有する程度を示す第1の指標を算出する算出ステップと、
前記第1の指標に基づいて、1以上の個人ウェブサイトからなるクラスタの集合を生成する生成ステップと、
前記複数の個人ウェブサイトに対して、前記クラスタ毎に異なり、かつ、当該クラスタ内で同一の管理者IDを割り当てる割当ステップと、を実行させるためのID割当プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116893A JP5959308B2 (ja) | 2012-05-22 | 2012-05-22 | Id割当装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116893A JP5959308B2 (ja) | 2012-05-22 | 2012-05-22 | Id割当装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013242804A true JP2013242804A (ja) | 2013-12-05 |
JP5959308B2 JP5959308B2 (ja) | 2016-08-02 |
Family
ID=49843612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012116893A Active JP5959308B2 (ja) | 2012-05-22 | 2012-05-22 | Id割当装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5959308B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019159934A (ja) * | 2018-03-14 | 2019-09-19 | 富士通株式会社 | クラスタリングプログラム、クラスタリング方法およびクラスタリング装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011237978A (ja) * | 2010-05-10 | 2011-11-24 | Kddi Corp | Id割当装置、方法及びプログラム |
-
2012
- 2012-05-22 JP JP2012116893A patent/JP5959308B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011237978A (ja) * | 2010-05-10 | 2011-11-24 | Kddi Corp | Id割当装置、方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
JPN6015050793; 大野 成義他: 'Max Flowアルゴリズムを用いたWebページのクラスタリング方法とその評価' 情報処理学会論文誌 第47巻 No.SIG4(TOD29), 20060315, p.65〜75, 社団法人情報処理学会 * |
JPN6015050794; 中田 豊久: '個人ホームページのハイパーリンク分析による暗示的コミュニティの抽出' 第53回 知識ベースシステム研究会資料 , 20010914, 19〜24頁, 社団法人人工知能学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019159934A (ja) * | 2018-03-14 | 2019-09-19 | 富士通株式会社 | クラスタリングプログラム、クラスタリング方法およびクラスタリング装置 |
JP7006403B2 (ja) | 2018-03-14 | 2022-01-24 | 富士通株式会社 | クラスタリングプログラム、クラスタリング方法およびクラスタリング装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5959308B2 (ja) | 2016-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614077B2 (en) | Computer system for automated assessment at scale of topic-specific social media impact | |
Basole et al. | Supply network structure, visibility, and risk diffusion: A computational approach | |
Lu et al. | The emergence of opinion leaders in a networked online community: A dyadic model with time dynamics and a heuristic for fast estimation | |
Hu et al. | Reputation management in an open source developer social network: An empirical study on determinants of positive evaluations | |
Tang et al. | Ranking user influence in healthcare social media | |
JP6216929B2 (ja) | 検出装置、検出方法及び検出プログラム | |
CN106204142A (zh) | 用于识别具有动机的评论者的系统和方法 | |
JP6247775B2 (ja) | 時系列予測装置、及び時系列予測方法 | |
Murthy et al. | Understanding cancer-based networks in Twitter using social network analysis | |
Yin et al. | Measuring pair-wise social influence in microblog | |
Hossain et al. | Social networks and coordination performance of distributed software development teams | |
Büyüktahtakın et al. | Parallel asset replacement problem under economies of scale with multiple challengers | |
Emanuel et al. | What does your profile really say about you? Privacy warning systems and self-disclosure in online social network spaces | |
US9720975B2 (en) | Dynamic influence tracking engine and method | |
JP5959308B2 (ja) | Id割当装置、方法及びプログラム | |
JP5513251B2 (ja) | Id割当装置、方法及びプログラム | |
JP5535787B2 (ja) | 分類装置、分類方法及び分類プログラム | |
JP5529790B2 (ja) | 収集装置、収集方法及び収集プログラム | |
Sharples et al. | The field becomes the laboratory? The impact of the contextual digital footprint on the discipline of E/HF | |
Monsen et al. | Development of a public health nursing data infrastructure | |
JP6157395B2 (ja) | リンク補完装置、リンク補完方法及びリンク補間プログラム | |
JP5988371B2 (ja) | 収集装置、収集方法及び収集プログラム | |
Jain et al. | Trust-and reputation-based opinion dynamics modelling over temporal networks | |
JP5623983B2 (ja) | Id割当装置、方法及びプログラム | |
Ji et al. | Service collaboration network: A novel mechanism for web service management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5959308 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |