JP2009110301A - オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体 - Google Patents

オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2009110301A
JP2009110301A JP2007282329A JP2007282329A JP2009110301A JP 2009110301 A JP2009110301 A JP 2009110301A JP 2007282329 A JP2007282329 A JP 2007282329A JP 2007282329 A JP2007282329 A JP 2007282329A JP 2009110301 A JP2009110301 A JP 2009110301A
Authority
JP
Japan
Prior art keywords
score
personal page
online personal
references
ownership
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007282329A
Other languages
English (en)
Inventor
Akihiro Miyata
章裕 宮田
Harumi Kawashima
晴美 川島
Hidenori Okuda
英範 奥田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007282329A priority Critical patent/JP2009110301A/ja
Publication of JP2009110301A publication Critical patent/JP2009110301A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】オンライン個人ページ上のコミュニケーションログの中から、上記ページの所有者を容易に特定することができるオンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体を提供することを目的とする。
【解決手段】オンライン個人ページにおける大勢のインターネットユーザ相互のコメントのやりとりのようなコミュニケーションのログに基づいて、これらのインターネットユーザの中から、上記個人ページの所有者を特定する。
【選択図】図1

Description

本発明は、オンライン個人ページ所有型サービスにおいてページ所有者を特定する手法に関する。より詳細には、オンライン個人ページ所有型サービスにおけるコミュニケーションの特徴を分析することによって、オンライン個人ページの所有者を、一意または複数に特定する手法およびその装置に関する。なお、所有者を厳密に一意に特定することが求められていない場合、または、本当に複数の所有者がいる場合(複数人で共同執筆しているブログが存在する)には、オンライン個人ページの所有者を複数に特定する。
オンライン個人ページ所有型サービスとして、ウェブログが代表的であるが、各ユーザが自身のページを、オンラインに保持する環境を提供するサービスであれば、本技術の利用分野に含まれる。
近年、オンライン個人ページ所有型サービスが大幅に普及したので、コメント等を利用したオンラインコミュニケーションが数多く行われている。ウェブログのあるページに、大勢がコメントを送信して会話することが、上記オンライン個人ページ所有型サービスの例である。
多くの場合、オンライン個人ページ所有型サービスによるコミュニケーションの記録(以下、「コミュニケーションログ」という)は、オンライン個人ページ上に、または上記ページとハイパーリンク等によって関連付けられている場所に、保存され、コミュニケーション参加者、または第三者が閲覧することができる。これらのコミュニケーションログには、有益な情報が蓄積されている場合が多く、特にコミュニケーションログから、上記ページ所有者が発言した内容を特定するニーズが高まっている。
つまり、オンライン個人ページにおけるコミュニケーションログには、ハンドルネーム(各送信者が独自に定義した識別子)が使用され、使用されている複数のハンドルネームのうちで、どのハンドルネームがオンライン個人ページの所有者であるかを知りたいという要望がある。オンライン個人ページの所有者のハンドルネームが分かれば、オンライン個人ページの所有者の発言を容易に特定することができる。
ところで、オンラインコミュニケーションに参加している人物を分析する手法は、いくつか知られている。
たとえば、コミュニケーションログの中から、特定人物の発言記録を抽出・分析することによって、上記人物の評価を行う手法が提案されている(たとえば、非特許文献1参照)。この従来例において、評価の際に、「発言内容」と、「それが肯定的であるか、否定的であるか」との対応を格納している辞書を事前に作成し、この辞書と分析対象の発言内容とが比較される。
しかし、上記従来例は、コミュニケーション参加者の発言が肯定的であるか否定的であるかを評価するか、または、それを参加者毎に集約し、参加者の人物評価にするので、コミュニケーションが発生しているページの所有者そのものを特定する発明ではない。
一方、オンラインコミュニケーションにおける各ユーザの行動を分析し、コミュニケーションの活性化に貢献しているユーザや、コミュニケーションのきっかけを提供するユーザ等を抽出する発明が知られている(たとえば、特許文献1参照)。この従来例を利用すれば、コミュニケーションに参加しているユーザが果たしている役割を判定することができる。しかし、この従来例は、コミュニケーションが発生しているページの所有者そのものを特定する発明ではない。
緒方進、池田真司、牟田高信、木本勝敏著「Web上のテキスト情報を用いた人物評価手法」情報処理学会研究報告、自然言語処理研究会報告、Vol.2005、No.1、p.9−14 特開2005−235118号公報
オンライン個人ページ上のコミュニケーションログを閲覧・分析する際に、上記オンライン個人ページの所有者による発言がどれであるかが分からない場合がある。
たとえば、ウェブログの場合、ウェブログの所有者が作成したページ上で、このページの所有者と読者とが、コメントを使ってコミュニケーションを行うことがある。しかし、コメント送信者名は、ハンドルネーム(各送信者が独自に定義した識別子)等で表示されている場合が多く、他者(特にコミュニケーションを閲覧しているだけの第三者)にとっては、上記ページの所有者による発言がどれであるかを判断することが難しい。
上記ページに送信された全てのコメントに、人間が実際に目を通し、内容・文脈の理解を行えば、上記ページの所有者による発言がどれであるかを推測することができる場合もある。しかし、コメントの文章内容だけでは、所有者であるかどうかを推測できない場合があるので、分析対象の数が多い場合、オンライン個人ページの所有者を特定する作業を人手で行うことが困難であるという問題がある。
本発明は、オンライン個人ページ上のコミュニケーションログの中から、上記ページの所有者を容易に特定することができるオンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体を提供することを目的とする。
本発明は、オンライン個人ページにおける大勢のインターネットユーザ相互のコメントのやりとりのようなコミュニケーションのログに基づいて、これらのインターネットユーザの中から、上記個人ページの所有者を特定する。
本発明によれば、従来は人手をかけて行っていたオンライン個人ページの所有者特定作業を、自動化することができ、作業を省力化・短時間化することができるという効果を奏する。
発明を実施するための最良の形態は、以下の実施例である。
図1は、本発明の実施例1であるオンライン個人ページ所有者特定装置100を示すブロック図である。
オンライン個人ページ所有者特定装置100は、個人ページ収集手段11と、オンライン個人ページデータベース12とに接続され、オンライン個人ページ情報入力部13と、コミュニケーションログ抽出部14と、所有者性スコア評価部15と、所有者性分析結果出力部18と、コミュニケーション情報データベース19とを有し、所有者性分析結果を出力する。所有者性スコア評価部15は、言及マトリックス分析部16と、基本情報分析部17とを有する。
個人ページ収集手段11は、分析対象であるページを収集する手段であり、一般装置であり、ウェブクローラ等である。
オンライン個人ページデータベース12は、分析対象であるオンライン個人ページを格納するデータベースである。
なお、以降の処理に必要な情報が含まれていれば、オンライン個人ページデータベース12のように、ページがデータベース化されたものを、個人ページ収集手段11の代わりに使用するようにしてもよい。
オンライン個人ページ情報入力部13は、個人ページ収集手段11またはオンライン個人ページデータベース12から、分析対象であるページを取り込み、オンライン個人ページ所有者特定装置100内におけるページIDを、取り込んだページに付与する。また、オンライン個人ページ情報入力部13は、付与したページIDと、取り込んだページに表示されている情報とから成るページ生情報を、コミュニケーション情報データベース19に格納する。
コミュニケーションログ抽出部14は、オンライン個人ページ情報入力部13から渡された分析対象ページのページIDに基づいて、コミュニケーション情報データベース19から上記ページのページ生情報を取得し、上記ページ生情報から、コミュニケーションログを、抽出し、この抽出されたコミュニケーションログを、上記ページのページIDと対応付け、コミュニケーション情報データベース19に格納する。
図2は、各コメントの例と、各参加者IDに対するハンドルネームの例とを示す図である。
ウェブログにおけるコメントスレッドの例であれば、図2(1)に示すように、各コメントには、送信された順に、ページIDが付与され、「コメント送信者のハンドルネーム」、「コメント送信者のURL」、「コメントタイトル・本文中に出現する上記ハンドルネーム」等(図2(1)において、下線が引かれている部分)が、コミュニケーションログの構成要素として抽出される。抽出元のページIDとコメントのIDとが対応付けられ、コミュニケーション情報データベース19に格納される。
なお、スレッドは、記事の下に記載されているコメントである。
上記各要素(「コメント送信者のハンドルネーム」、「コメント送信者のURL」、「コメントタイトル・本文中に出現する上記ハンドルネーム」等)を抽出する場合、ウェブログの場合であれば、HTMLタグの構造分析等の一般的手法を用いて各要素を抽出する。また、ハンドルネームが同一または一定以上の類似度を持つ参加者は、同一の参加者であるとみなし、図2(2)に示すように、分析対象であるページ内で、一意の参加者IDが付与され、コミュニケーション情報データベース19に格納される。
所有者性スコア評価部15は、コミュニケーションログ抽出部14から渡された分析対象ページのページIDに基づいて、コミュニケーション情報データベース19から、上記ページのコミュニケーションログを取得し、言及マトリックス分析部16を利用し、上記ページ上で発生したコミュニケーションの各参加者に対して、第1の所有者性スコアSC1を導出する。
これと同様に、コミュニケーション情報データベース19から、上記ページのコミュニケーションログと上記ページ生情報とを取得し、基本情報分析部17を利用して、所有者性を示す第3の所有者性スコアSC3を導出する。たとえば、第1の所有者性スコアSC1と、第2の所有者性スコアSC2とを用い、下記の式(1)によって、各参加者について、第3の所有者性スコアSC3を導出する。そして、上記ページのページIDと各参加者の参加者IDとを対応付けて、導出された上記第3の所有者性スコアSC3を、コミュニケーション情報データベース19に格納する。
第3の所有者性スコアSC3=W(第1の所有者性スコアSC1)×第1の所有者性スコアSC1+W(第2の所有者性スコアSC2)×第2の所有者性スコアSC2 ……… 式(1)
なお、W(x)は、xの重みである。
言及マトリックス分析部16は、コミュニケーション参加者が、自分また他者のハンドルネームに言及した履歴を利用し、互いの言及関係を、マトリックス化し、各参加者について、後述の式(2)によって、第1の所有者性スコアSC1を導出する。
基本情報分析部17は、「初回被言及順番」、「最終発言者」、「文字列一致性」を分析し、各参加者について、後述の式(3)によって、第2の所有者性スコアSC2を導出する。
所有者性分析結果出力部18は、所有者性スコア評価部15から渡された分析対象ページのページIDと、上記ページ上でコミュニケーションを行った参加者達の参加者IDとに基づいて、コミュニケーション情報データベース19から第3の所有者性スコアSC3を取得し、所有者性分析結果20の形式に変換し、出力する。
上記「所有者性分析結果」は、たとえば上記ページにおいて、第3の所有者性スコアSC3が最も高い参加者のハンドルネームを示す結果である。全参加者のハンドルネームと第3の所有者性スコアSC3との対応表や、その他の形式を、上記所有者性分析結果として使用するようにしてもよい。
次に、上記実施例の動作について説明する。
図3は、言及マトリックス分析部16の動作を示すフローチャートである。
図4は、コメントの例と、言及者と被言及者とのマトリックスとを示す図である。
上記「マトリックス化」は、ウェブログにおけるコメントスレッドの例であれば、図4(1)に示すように、コミュニケーションログにおいて各参加者の言及・被言及の回数を集計し、図4(2)に示す表を、装置内で概念的に構築することである。
図4(2)において、「言及者」は、自分が送信したコメントのタイトルまた本文において、他者のハンドルネームを記載した者である。「被言及者」は、逆に、他者が送信したコメントのタイトルまた本文において、自分のハンドルネームが記載された者である。なお、簡単のために、図4では、言及者、被言及者としてのハンドルネームとコメントの本文とのみを記載してある。
言及マトリックス分析部16は、S1で、上記マトリックスを用いて、各参加者の言及数、言及先数(言及した相手の人数)、被言及数、被言及元数を集計する。上記「言及先数」は、言及した相手の人数であり、上記「被言及元数」は、言及された相手の人数であり、オンライン個人ページに言及を受けた場合における言及の行為者の数である。
ページ所有者は、他の参加者に言及する頻度が高く、他の参加者から言及される頻度が高い傾向にあるので、言及数、被言及数が、それぞれ多い程、第1の所有者性スコアSC1は高い。
さらに、ページ所有者は、自身のページにおいて発言してくれた参加者には、満遍なく挨拶・返答する場合が多い傾向にあり、所有者以外の参加者の大半は、上記ページ上で発言する前に、所有者に挨拶・言及する場合が多いので、言及先数・被言及元数が、それぞれ多く、言及先数・被言及元数が多い程、第1の所有者性スコアSC1が高い。
次に、第1の所有者性スコアSC1を実際に求めてみる。
ここで、S2で、各重みを設定する。たとえば、重みW(言及数)=1、重みW(言及先数)=2、重みW(被言及数)=1、重みW(被言及元数)=2とする。
そして、S3で、第1の所有者性スコアSC1を、次の式(2)によって導出する。
第1の所有者性スコアSC1=W(言及数)×言及数+W(言及先数)×言及先数+W(被言及数)×被言及数+W(被言及元数)×被言及元数 …… 式(2)
なお、W(x)は、xの重みである。
次に、具体例に基づいて、第1の所有者性スコアSC1を求める。
図4に示すハンドルネームAliceの場合、言及数が3であるので、言及数が3であり、言及先数が2であるので、言及先数が2であり、被言及数が3であるので、被言及数が3であり、被言及元数が1であるので、被言及元数が1である。
これらを、上記式(2)に代入すると、ハンドルネームAliceの第1の所有者性スコアSC1=W(言及数)×言及数+W(言及先数)×言及先数+W(被言及数)×被言及数+W(被言及元数)×被言及元数=1×3+2×2+1×3+2×1=12である。つまり、図4に示すハンドルネームAliceの場合、その第1の所有者性スコアSC1は、12である。
図4に示すハンドルネームBobの場合、言及数が、5であり、言及先数が、3であり、被言及数が、1であり、被言及元数が、1である。したがって、ハンドルネームBobの第1の所有者性スコアSC1=W(言及数)×言及数+W(言及先数)×言及先数+W(被言及数)×被言及数+W(被言及元数)×被言及元数=1×5+2×3+1×1+2×1=14である。つまり、図4に示すハンドルネームBobの場合、その第1の所有者性スコアSC1は、14である。
図4に示すハンドルネームChrisの場合、言及数は、0、言及先数は、0、被言及数は、3、被言及元数は、2であるので、第1の所有者性スコアSC1は、7である。Dickは、言及数は、0、言及先数は、0、被言及数は、1、被言及元数は、1であるので、第1の所有者性スコアSC1は、3である。
次に、基本情報分析部17の動作について説明する。
図5は、基本情報分析部17の動作を示すフローチャートである。
第2の所有者性スコアSC2は、たとえば、次の式(3)を使用して導出する。
第2の所有者性スコアSC2=W(初回被言及順番)×初回被言及順番スコア+W(最終発言者)×最終発言者スコア+W(文字列一致性)×文字列一致性スコア …… 式(3)
なお、W(x)は、xの重みである。
また、上記「初回被言及順番スコア」は、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示すスコアである。自分以外の参加者が送信したコメントのタイトルまた本文において、自分のハンドルネームが記載されているコメントIDのうちで、最も小さいコメントIDである。そして、初回被言及順番スコアが、自分が初めて送信したコメントのID(以降、「初回発言位置」とする)よりも小さい参加者は、自分が発言する前に、他の参加者に言及されている。
初回被言及順番スコアは、初回被言及順序であれば、「1」であり、そうでなければ、「0」であるとすることが考えられる。
つまり、まず、S11で、初回被言及順番スコア、最終発言者スコア、文字列一致性スコアを集計する。S12で、初回被言及順番スコア、最終発言者、文字列一致性のそれぞれの重みを設定する。そして、S13で、初回被言及順番スコア、最終発言者スコア、文字列一致性スコアをカウントする。S14で、第2の所有者性スコアSC2=W(初回被言及順番)×初回被言及順番スコア+W(最終発言者スコア)×最終発言者スコア+W(文字列一致性スコア)×文字列一致性スコアを算出する。
図6は、上記実施例において、コメントIDにおけるハンドルネーム、URL、タイトル、本文を示す図である。
図6に示す例では、Bobは、自分がコメントを送信する前に、Aliceに言及しているので、Bobは、初回被言及順番スコアが初回発言位置よりも前にある。このように、コミュニケーションに参加する前に、他の参加者から名前を呼ばれる参加者が、コミュニケーションの発端になっているページ所有者である可能性が高く、上記参加者の第2の所有者性スコアSC2は、高い値である。
上記「最終発言者」は、コミュニケーションログの中で最後に発言した参加者であり、上記「最終発言者スコア」は、上記オンライン個人ページにおける最終発言者であるか否かを示すスコアである。最終発言者のスコアは、コミュニケーションログの中で最後に発言した参加者であれば、「1」、コミュニケーションログの中で最後に発言した参加者でなければ、「0」とすることが考えられる。
ウェブログ等のオンライン個人ページで発生するコミュニケーションは、上記ページ所有者以外の参加者達が、ページに関連する意見等を述べることによって始まり、上記意見に対して、上記ページ所有者が返答する事例が多く見受けられる。
また、ページ上にコメント等を送信する参加者は、上記ページ所有者から「お客様」と見なされる傾向があり、所有者が他の参加者のコメント等に対して返答せずに放置することは少ない。この結果、自ずと、コミュニケーションログの中で最後に発言する参加者は、上記ページ所有者である可能性が高く、上記参加者の第2の所有者性スコアSC2が、高い値になる傾向にある。
上記「文字列一致性」は、ページ生情報に含まれている文字列と、参加者のURL・ハンドルネームとが一致しているかどうかを示す指標であり、上記「文字列一致性スコア」は、上記オンライン個人ページにおける文字列一致性を示すスコアである。文字列一致性のスコアは、完全一致であれば、「1」、完全一致でなければ、「0」とすることが考えられる。また、文字列一致性のスコアは、文字列の一致度合いを、たとえば、8段階に分け、完全一致であれば、「7」とし、全く一致していなければ、「0」とし、その間を、按分して、「6」、「5」、「4」、「3」、「2」、「1」とすることが考えられる。
URLに関して、ページのURLとコメント送信者のURLとを比較し、一致、または似通っていれば、上記コメント送信者が上記ページ所有者である可能性が高く、第2の所有者性スコアSC2が高い値になる。
ハンドルネームに関して、ウェブログであれば、ウェブログのタイトルやプロフィール欄等と、コメント送信者のハンドルネームとを比較し、一致、または似通っていれば、上記コメント送信者が上記ページ所有者である可能性が高く、上記参加者の第2の所有者性スコアSC2が高い値になる。なお、文字列の一致、または類似性を判定する際、一般的なテキスト分析技術を利用する。
上記実施例において、第1の所有者性スコアSC1だけで、所有者性を判断するようにしてもよい。また、言及数と言及先数との2要素のみによって、所有者性を判断するようにしてもよい。この場合、重みを考慮するようにしてもよい。また、被言及数と被言及元数との2要素のみによって、所有者性を判断するようにしてもよい。この場合、重みを考慮するようにしてもよい。
さらに、第2の所有者性スコアSC2だけで、所有者性を判断するようにしてもよい。また、初回被言及順番スコア、最終発言者スコア、文字列一致性スコアのうちの少なくとも1つのスコアによって、所有者性を判断するようにしてもよい。この場合、重みを考慮するようにしてもよい。
上記実施例によれば、従来は人手をかけて行っていたオンライン個人ページ所有者特定作業を、自動化することができ、作業を省力化・短時間化することができる。
上記実施例によれば、上記ページ所有者を特定する場合、コミュニケーションにおける所有者の振る舞い等を考慮するので、上記ページ所有者を特定する精度が高い。
また、上記実施例によれば、言語に依存した属性を利用していないので、コミュニケーションの発言内容に人間が目を通しても所有者が特定できない場合や、上記ページが分析者の母国語以外で書かれている場合にも、適用可能であり、分析対象を拡大することができる。
すなわち、上記実施例において、全参加者について、言及者と被言及者とを、マトリックス化し、言及数・被言及数をスコア化する。つまり、各言及者が各被言及者に言及した数をスコア化する。すなわち、ページ所有者は、他の参加者に言及する頻度が高く、他の参加者から言及される頻度が高い傾向があるので、全参加者の言及・被言及の関係を、マトリックス化し、言及数・被言及数をスコア化すれば、ページ所有者を判断することができる。
また、ページ所有者は、自身のページにおいて発言してくれた参加者には、満遍なく挨拶・返答する場合が多く、所有者以外の参加者の大半は、上記ページ上で発言する前に所有者に挨拶・言及する場合が多いので、言及先数・被言及元数をスコア化すれば、ページ所有者を判断することができる。
たとえば、所有者以外の参加者2名が、局所的に会話を繰り返し、互いに言及しあった結果、ページ所有者よりも言及数・被言及数が多くなったとしても、言及先数・被言及元数を考慮すれば、これら2名を所有者と誤認する可能性が低くなる。
さらに、上記実施例は、第3の所有者性スコアSC3を、複数要素からなる指標とする。つまり、上記式(1)において、第3の所有者性スコアSC3が、第1の所有者性スコアSC1と第2の所有者性スコアSC2との線形和で表現され、第1の所有者性スコアSC1と第2の所有者性スコアSC2とのどちらか一方が欠けても、第3の所有者性スコアSC3を導出することができる。なお、線形和であるのは、この実施例に限定される。本来の定義としては、第1の所有者性スコアSC1と第2の所有者性スコアSC2とを利用し、適切な演算を実行することによって、第3の所有者性スコアSC3を導出する。これによって、いくつかの要素が利用できない場合でも、スコアの導出が可能である。
なお、上記実施例において、W(言及数)は、言及数に重みを付けることであるが、このように、言及数に重みを付ける代わりに、log(言及数)、言及数の2乗等、重み付け以外の所定の演算を言及数に行うようにしてもよい。また、言及数の代わりに、言及先数、被言及数、被言及元数、初回被言及順番、最終発言者、文字列一致性についても、重み付け以外の所定の演算を行うようにしてもよい。
つまり、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数とを取得する取得手段と、上記取得した言及数と言及先数とに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段とを有するオンライン個人ページ所有者特定装置の例である。また、上記実施例は、オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得する取得手段と、上記取得した被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段とを有するオンライン個人ページ所有者特定装置の例である。さらに、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得する取得手段と、上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段とを有するオンライン個人ページ所有者特定装置の例である。
この場合、上記所有者性スコア演算手段は、上記取得した言及数と言及先数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段である。また、上記所有者性スコア演算手段は、上記取得した被言及数と被言及元数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段である。さらに、上記所有者性スコア演算手段は、上記取得した言及数と言及先数と被言及数と被言及元数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段である。
また、上記実施例は、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得するスコア取得手段と、上記取得したスコアに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段とを有するオンライン個人ページ所有者特定装置の例である。
この場合、上記所有者性スコア演算手段は、上記取得したスコアに所定の演算を行った後に、所有者性スコアを演算する手段である。
さらに、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数と、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得するスコア取得手段と、上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す第1の所有者性スコアを演算する第1の所有者性スコア演算手段と、上記取得した初回被言及順番スコアと最終発言者スコアと文字列一致性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第2の所有者性スコアを演算する第2の所有者性スコア演算手段と、上記演算された第1の所有者性スコアと第2の所有者性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第3の所有者性スコアを演算する第3の所有者性スコア演算手段とを有するオンライン個人ページ所有者特定装置の例である。
この場合、上記所有者性スコア演算手段は、上記所有者性スコアを演算する元となる要素に所定の演算を行った後に、上記所有者性スコアを演算する手段である。また、上記第3の所有者性スコア演算手段は、上記取得した上記第1の所有者性スコアと上記第2の所有者性スコアとのそれぞれに所定の演算を行った後に、上記第3の所有者性スコアを演算する手段である。
上記実施例を方法の発明として把握することができる。つまり、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数とを取得する取得工程と、上記取得した言及数と言及先数とに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算工程とを有するオンライン個人ページ所有者特定方法の例である。また、上記実施例は、オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得し、記憶装置に記憶する取得工程と、上記取得した被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程とを有するオンライン個人ページ所有者特定方法の例である。さらに、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得し、記憶装置に記憶する取得工程と、上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程とを有するオンライン個人ページ所有者特定方法の例である。
そして、上記実施例は、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得し、記憶装置に記憶するスコア取得工程と、上記取得したスコアに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程とを有するオンライン個人ページ所有者特定方法の例である。
しかも、上記実施例は、オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数と、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得し、記憶装置に記憶するスコア取得工程と、上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す第1の所有者性スコアを演算し、記憶装置に記憶する第1の所有者性スコア演算工程と、上記取得した初回被言及順番スコアと最終発言者スコアと文字列一致性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第2の所有者性スコアを演算し、記憶装置に記憶する第2の所有者性スコア演算工程と、上記演算された第1の所有者性スコアと第2の所有者性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第3の所有者性スコアを演算し、記憶装置に記憶する第3の所有者性スコア演算工程とを有するオンライン個人ページ所有者特定方法の例である。
また、上記実施例である載のオンライン個人ページ所有者特定装置を構成する各手段としてコンピュータを機能させるプログラムを想定することができる。
さらに、このプログラムを、コンピュータ読取可能な記録媒体に記録するようにしてもよい。CD、DVD、HD、光ディスク、光磁気ディスク、半導体メモリ等が上記記録媒体の例である。
ウェブログのコメントは、非常にくだけた口語が用いられる場合が多く、内容の分析には、高度な言語処理技術が必要であるが、上記実施例では、この過程が不要である。言語非依存の情報のみを利用するので、多言語対応も容易である。
上記実施例は、ウェブログであるが、ウェブログの代わりに、オンライン掲示板(BBS)が設置された個人ホームページ等、コミュニケーション機能を備えたオンライン個人所有ページを使用するようにしてもよい。
本発明の実施例1であるオンライン個人ページ所有者特定装置100を示すブロック図である。 各コメントの例と、各参加者IDに対するハンドルネームの例とを示す図である。 言及マトリックス分析部16の動作を示すフローチャートである。 コメントの例と、言及者と被言及者とのマトリックスとを示す図である。 基本情報分析部17の動作を示すフローチャートである。 各コメントにおけるハンドルネーム、URL、タイトル、本文を示す図である。
符号の説明
100…オンライン個人ページ所有者特定装置、
11…個人ページ収集手段、
12…オンライン個人ページデータベース、
13…オンライン個人ページ情報入力部、
14…コミュニケーションログ抽出部、
15…所有者性スコア評価部、
16…言及マトリックス分析部、
17…基本情報分析部、
18…所有者性分析結果出力部、
19…コミュニケーション情報データベース。

Claims (17)

  1. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数とを取得する取得手段と;
    上記取得した言及数と言及先数とに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段と;
    を有することを特徴とするオンライン個人ページ所有者特定装置。
  2. オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得する取得手段と;
    上記取得した被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段と;
    を有することを特徴とするオンライン個人ページ所有者特定装置。
  3. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得する取得手段と;
    上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段と;
    を有することを特徴とするオンライン個人ページ所有者特定装置。
  4. 請求項1において、
    上記所有者性スコア演算手段は、上記取得した言及数と言及先数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段であることを特徴とするオンライン個人ページ所有者特定装置。
  5. 請求項2において、
    上記所有者性スコア演算手段は、上記取得した被言及数と被言及元数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段であることを特徴とするオンライン個人ページ所有者特定装置。
  6. 請求項3において、
    上記所有者性スコア演算手段は、上記取得した言及数と言及先数と被言及数と被言及元数とのそれぞれに所定の演算を行った後に、上記所有者性スコアを演算する手段であることを特徴とするオンライン個人ページ所有者特定装置。
  7. オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得するスコア取得手段と;
    上記取得したスコアに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算手段と;
    を有することを特徴とするオンライン個人ページ所有者特定装置。
  8. 請求項7において、
    上記所有者性スコア演算手段は、上記取得したスコアに所定の演算を行った後に、所有者性スコアを演算する手段であることを特徴とするオンライン個人ページ所有者特定装置。
  9. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数と、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得するスコア取得手段と;
    上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す第1の所有者性スコアを演算する第1の所有者性スコア演算手段と;
    上記取得した初回被言及順番スコアと最終発言者スコアと文字列一致性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第2の所有者性スコアを演算する第2の所有者性スコア演算手段と;
    上記演算された第1の所有者性スコアと第2の所有者性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第3の所有者性スコアを演算する第3の所有者性スコア演算手段と;
    を有することを特徴とするオンライン個人ページ所有者特定装置。
  10. 請求項9において、
    上記第3の所有者性スコア演算手段は、上記取得した上記第1の所有者性スコアと上記第2の所有者性スコアとのそれぞれに所定の演算を行った後に、上記第3の所有者性スコアを演算する手段であることを特徴とするオンライン個人ページ所有者特定装置。
  11. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数とを取得する取得工程と;
    上記取得した言及数と言及先数とに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算する所有者性スコア演算工程と;
    を有することを特徴とするオンライン個人ページ所有者特定方法。
  12. オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得し、記憶装置に記憶する取得工程と;
    上記取得した被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程と;
    を有することを特徴とするオンライン個人ページ所有者特定方法。
  13. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数とを取得し、記憶装置に記憶する取得工程と;
    上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程と;
    を有することを特徴とするオンライン個人ページ所有者特定方法。
  14. オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得し、記憶装置に記憶するスコア取得工程と;
    上記取得したスコアに基づいて、オンライン個人ページの所有者性の度合いを示す所有者性スコアを演算し、記憶装置に記憶する所有者性スコア演算工程と;
    を有することを特徴とするオンライン個人ページ所有者特定方法。
  15. オンライン個人ページに言及した数である言及数と、上記オンライン個人ページに言及した先の数である言及先数と、上記オンライン個人ページに言及を受けた数である被言及数と、上記オンライン個人ページに言及を受けた場合における言及の行為者の数である被言及元数と、オンライン個人ページにおいて最初に言及を受けた順番であって、スレッドを通しての順番を示す初回被言及順番スコアと、上記オンライン個人ページにおける最終発言者であるか否かを示す最終発言者スコアと、上記オンライン個人ページにおける文字列一致性を示す文字列一致性スコアのうちの少なくとも1つのスコアを取得し、記憶装置に記憶するスコア取得工程と;
    上記取得した言及数と言及先数と被言及数と被言及元数とに基づいて、上記オンライン個人ページの所有者性の度合いを示す第1の所有者性スコアを演算し、記憶装置に記憶する第1の所有者性スコア演算工程と;
    上記取得した初回被言及順番スコアと最終発言者スコアと文字列一致性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第2の所有者性スコアを演算し、記憶装置に記憶する第2の所有者性スコア演算工程と;
    上記演算された第1の所有者性スコアと第2の所有者性スコアとに基づいて、上記オンライン個人ページの所有者性の度合いを示す第3の所有者性スコアを演算し、記憶装置に記憶する第3の所有者性スコア演算工程と;
    を有することを特徴とするオンライン個人ページ所有者特定方法。
  16. 請求項1〜請求項10のいずれか1項記載のオンライン個人ページ所有者特定装置を構成する各手段としてコンピュータを機能させるプログラム。
  17. 請求項16記載のプログラムを記録したコンピュータ読取可能な記録媒体。
JP2007282329A 2007-10-30 2007-10-30 オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体 Pending JP2009110301A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007282329A JP2009110301A (ja) 2007-10-30 2007-10-30 オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007282329A JP2009110301A (ja) 2007-10-30 2007-10-30 オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2009110301A true JP2009110301A (ja) 2009-05-21

Family

ID=40778727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007282329A Pending JP2009110301A (ja) 2007-10-30 2007-10-30 オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2009110301A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045322A (ja) * 2011-08-25 2013-03-04 Kddi Corp ユーザのアカウントと、そのユーザの端末の加入者識別子とを関連付ける識別方法、識別サーバ及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045322A (ja) * 2011-08-25 2013-03-04 Kddi Corp ユーザのアカウントと、そのユーザの端末の加入者識別子とを関連付ける識別方法、識別サーバ及びプログラム

Similar Documents

Publication Publication Date Title
US10347250B2 (en) Utterance presentation device, utterance presentation method, and computer program product
Adams et al. Topic detection and extraction in chat
US8983962B2 (en) Question and answer data editing device, question and answer data editing method and question answer data editing program
JP2019053126A (ja) 成長型対話装置
KR20080068825A (ko) 디스플레이를 위한 고품질 리뷰 선택
US9075870B2 (en) System, method and apparatus for detecting related topics and competition topics based on topic templates and association words
JP2005122726A5 (ja)
US20100125531A1 (en) System and method for the automated filtering of reviews for marketability
CN105005630B (zh) 全媒体中多维检测特定目标的方法
Tan et al. Lost in propagation? Unfolding news cycles from the source
JPWO2019156103A1 (ja) Faq整備支援装置、faq整備支援方法、及びプログラム
JP2021192237A (ja) 関連スコア算出システム、方法およびプログラム
JP2013105436A (ja) 対話モデル構築装置、方法、及びプログラム
TW201415402A (zh) 取證系統、取證方法及取證程式
TW201118619A (en) An opinion term mining method and apparatus thereof
Jagtap et al. Misinformation detection on YouTube using video captions
JPWO2011018867A1 (ja) 情報分類装置、情報分類方法、及びプログラム
KR20190065194A (ko) 회의록 열람 문서 생성 방법 및 그 장치
JP2010211575A (ja) 情報評価支援システム
JP2009110301A (ja) オンライン個人ページ所有者特定装置、オンライン個人ページ所有者特定方法、プログラムおよび記録媒体
JP5271863B2 (ja) 情報分析装置、情報分析方法および情報分析プログラム
Hiemstra et al. SIGIR's 30th Anniversary: An Analysis of Trends in IR Research and the Topology of its Community
KR20090126862A (ko) 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체
JP4525433B2 (ja) 文書集約装置及びプログラム
JP5180894B2 (ja) 属性表現獲得方法及び装置及びプログラム