JP2012221222A - 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 - Google Patents
情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 Download PDFInfo
- Publication number
- JP2012221222A JP2012221222A JP2011086407A JP2011086407A JP2012221222A JP 2012221222 A JP2012221222 A JP 2012221222A JP 2011086407 A JP2011086407 A JP 2011086407A JP 2011086407 A JP2011086407 A JP 2011086407A JP 2012221222 A JP2012221222 A JP 2012221222A
- Authority
- JP
- Japan
- Prior art keywords
- text data
- data
- generated
- predetermined
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 20
- 238000007794 visualization technique Methods 0.000 title claims description 5
- 238000007689 inspection Methods 0.000 title abstract 2
- 238000012544 monitoring process Methods 0.000 claims abstract description 102
- 238000012800 visualization Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 43
- 239000000284 extract Substances 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 abstract 1
- 230000003044 adaptive effect Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 24
- 238000006243 chemical reaction Methods 0.000 description 17
- 238000001914 filtration Methods 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 15
- 230000008451 emotion Effects 0.000 description 14
- 238000000605 extraction Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 9
- 235000013305 food Nutrition 0.000 description 7
- 238000012806 monitoring device Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 235000015927 pasta Nutrition 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 235000021438 curry Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 235000012149 noodles Nutrition 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006996 mental state Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000004081 narcotic agent Substances 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
嗜好情報のように、検閲の場において抑圧されたり変形して放出されたりしている情報に対しても適切に対応できる監視システム、あるいはこの監視システムを実現するために必要となる当該情報の可視化システムや当該情報の可視化機能を提供する。
【解決手段】
基幹システムに参加し構成する多数の個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解した分解テキストデータから、対象についてコミュニティ毎に特徴付けられる所定の関連条件と対象の属性についてコミュニティ毎に特徴付けられる所定の特徴条件とを満たすデータを抽出し、対象に関してコミュニティ毎に特徴付けられる所定の特異性を示す特異条件を満たすデータを抽出して、所定の特異性を検出して可視化し、監視すべき個人と監視の制御をする監視内容とを決定する。
【選択図】 図1
Description
個人によって生成された個人生成データを意味識別可能な複数の分解データに分解し、前記分解データのそれぞれが示す対象について所定の関連条件と前記対象について所定の特徴条件とを満たすデータを抽出し、抽出した第1抽出データの集まりを検閲の場として生成する検閲の場生成手段と、
前記第1抽出データの集まりから、前記対象に関して所定の特異性を示す特異条件を満たすデータを抽出し、抽出した第2抽出データから前記所定の特異性を検出して可視化する可視化手段と、を有する。
図1(a)は、本実施の形態による可視化システム及び検閲システムを用いた基幹システムの概略を示すブロック図である。
本実施の形態の第1の態様によれば、
複数の文字列からなるテキストデータを含む一つの外部情報を、入力インターフェイスを通じて受信し、その内容の特異な情報を抽出するためのプログラムを実行するコンピュータを備えたシステムであって、このコンピュータは前記プログラムを実行して以下の処理を実行する。
入力されたテキストデータを捨象して予め用意された複数の関連テキストデータに変換する処理と、
その一つの外部情報に関連テキストデータが示す対象に関して所定の特異性を示す特異条件を満たす場合には、その関連データを特異な関連テキストデータとして判定する処理と、
特異な関連テキストデータとして判定した関連テキストデータを、その外部情報に含まれる個人を識別するためのユーザID及び特異条件に関わる条件と関連して記憶する処理とを含む。
また、本実施の形態の第2の態様によれば、
個人によって生成された個人生成データに基づくテキストデータから所定の内容を含むデータを捨象し、捨象したテキストデータを意味識別可能な分解テキストデータに分解する工程と、
前記分解テキストデータを、個人生成データを生成した個人を識別できるユーザIDに関連づけて記憶する工程と、を含む。
また、本実施の形態の第3の態様によれば、
個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータのうち、前記分解テキストデータが示す所定の対象について所定の関連条件を満たす関連対象を示す関連テキストデータを抽出する工程と、
前記関連テキストデータを前記所定の関連条件に関連づけて記憶する工程と、を含む。
また、本実施の形態の第4の態様によれば、
個人によって生成された個人生成データに基づくテキストデータのうち、テキストデータが示す対象について所定の特徴条件を満たす特徴テキストデータを抽出する工程と、
前記特徴テキストデータを前記所定の特徴条件に関連づけて記憶する工程と、を含む。
特に、第3の態様で抽出した関連テキストデータから特徴テキストデータを抽出するのが好ましい。関連テキストデータから特徴テキストデータを抽出することで、部分空間が生成される。この場合には、属性は、所定の対象だけでなく、所定の対象と関連対象との双方の特性や特色などの各種の特徴である。この各種の特徴は、客観的な特徴だけでなく、感情や心理などに基づく主観的に表現される特徴でもよい。このようにすることで、所定の対象の属性を示す特徴テキストデータを抽出するだけでなく、所定の対象と関連対象との双方の属性を示す特徴テキストデータを抽出することができる。
また、本実施の形態の第5の態様によれば、
個人によって生成された個人生成データに基づくテキストデータのうち、テキストデータが示す対象に関して所定の特異性を示す特異条件を満たす特異テキストデータを抽出する工程を含む。
また、本実施の形態の第6の態様によれば、
個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータのうち、前記分解テキストデータが示す対象について所定の関連条件を満たす関連対象を示す関連テキストデータを抽出する工程と、
前記関連テキストデータのうち、テキストデータが示す対象の属性について所定の特徴条件を満たす特徴テキストデータを抽出する工程と、
特徴テキストデータが示す対象に関して所定の特異性を示す特異条件を満たす特異テキストデータを抽出する工程と、を含む。
また、本実施の形態の第7の態様によれば、
個人によって生成された個人生成データに基づくテキストデータが示す対象の履歴に関する履歴情報を生成し、前記個人生成データに基づくテキストデータのうち、前記履歴情報について所定の履歴条件を満たす履歴テキストデータを抽出する工程と、
前記個人生成データに基づくテキストデータが参照された参照数を、個人生成データを生成した個人を識別できるユーザIDに関連づけて生成し、前記個人生成データに基づくテキストデータのうち、前記参照数について所定の参照条件を満たす参照テキストデータを抽出する工程と、を含む。
特に、第6の態様で抽出した特徴テキストデータから履歴テキストデータを抽出するのが好ましい。特徴テキストデータから履歴テキストデータを抽出することで、候補空間から監視空間が生成される。すなわち、図3(a)に示すように、第3の態様によってドメインが生成され、第4の態様によって部分空間が生成され、第5の態様によって候補空間が生成され、この第7の態様によって監視空間が生成される。
また、本実施の形態の第8の態様によれば、
前記履歴テキストデータに基づいて監視情報を生成する工程をさらに有する。
また、本実施の形態の第9の態様によれば、
前記監視情報に基づいて検閲制御コマンドを生成する工程をさらに有する。
情報処理システムは、
個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータから、前記分解テキストデータが示す対象について所定の関連条件と前記対象について所定の特徴条件とを満たすデータを抽出し、抽出した第1抽出データの集まりを検閲の場として生成する検閲の場生成手段と、
前記第1抽出データの集まりから、前記対象に関して所定の特異性を示す特異条件を満たすデータを抽出し、抽出した第2抽出データから前記所定の特異性を検出して可視化する可視化手段と、を有する。
前記第2抽出データに基づいて、監視すべき個人と監視の制御をする監視内容とを決定する監視手段とを有することが好ましい。
図4は、本実施の形態の監視システム(検閲システム)が接続されたネットワークの例を示す図である。
ネットワーク10には、各種の端末装置や、監視システム100が通信可能に接続されている。ネットワーク10には、ルータやハブなどの各種の通信機器(図示せず)によって構成されるノードが相互に接続されて通信網を形成している。ネットワーク10は、有線、無線、専用回線、交換回線、ローカル・エリア・ネットワーク(LAN)などの種類を問わず、ネットワーク10に接続されている各種の端末装置や監視システム100との間で通信することができる。ネットワーク10を流れる各種の情報は、複数のパケットなどに分割されてノード間を転送される。このようにすることで、発信元の端末装置から送信先の端末装置に至るまで、情報を送信することができる。
ネットワーク10に通信可能に接続されている各種の端末装置には、コンピュータ12や携帯電話14や固定電話機(IP電話機を含む)16や携帯端末装置(図示せず)などがある。携帯端末装置は、無線通信網(図示せず)を介してネットワーク10に接続されている。また、固定電話機16は、固定電話網(図示せず)を介してネットワーク10に接続されている。端末装置は、主として、個人が操作するものであり、個人が入力したり生成したりした各種のデータをネットワーク10に送り出すことができる。
サーバ20は、各種の端末装置で入力又は生成された各種のデータを保存する。サーバ20は、たとえば、ウェブサーバやメールサーバやデータベースサーバなどの各種のサーバがある。サーバ20は、その種類や機能や数は問わないが、ネットワーク10を介して、端末装置から送信されたデータを監視システム100が読み出し可能に記憶するものであればよい。
監視システム100は、ネットワーク10に常時又は所定のタイミングごとに接続される。監視システム100は、主として、サーバ20に蓄えられた各種のデータを収集して取得する。なお、サーバ20からではなく、各種の端末装置から発せられた各種のデータを収集してもよい。いずれにしても、個人が各種の端末装置を操作することによって入力・生成された各種のデータを、ネットワークを介して取得できればよい。以下では、サーバ20から各種のデータを取得する場合について説明する。
監視システム100は、中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、入出力インターフェイス(I/O)及び外部記憶装置を有する。これらが所定のプログラムに従って機能することによって、後述する検閲の場生成装置、監視情報抽出装置、候補空間生成装置などを構成する。
監視システム100は、入出力インターフェイス(I/O)を有する。監視システム100は、入出力インターフェイス(I/O)を介してネットワーク10に接続されている。監視システム100は、ネットワーク10を介して各種のデータを収集する。変換装置は、収集したデータがテキストデータである場合には、テキストデータを加工しない。一方、変換装置は、収集したデータが音声データや画像データ等である場合には、データの形式に応じた認識処理を選択し、テキストデータに変換する。なお、上述したように、データの変換は、監視システム100において実行しても、監視システム100の外部において実行してもよい。
上述したように、サーバ20は、作成者識別データ及び日時データも監視システム100が読み出し可能に記憶する。作成者識別データ及び日時データを処理用テキストデータに対応付ける。このようにすることで、処理用テキストデータを作成した作成者や、処理用テキストデータが作成された日時を用いた検索をすることが可能になる。
処理用テキストデータは、様々な個人が入力したり生成したりしたものである。このため、処理用テキストデータに各種の個人情報が含まれている可能性がある。本実施の形態の監視システム100は、個人情報を保護する観点から、処理用テキストデータから個人情報を捨象する処理をする。たとえば、個人を特定する人名やその個人の住所、電話番号、メールアドレスなどを判別し、処理用テキストデータからそれらを捨象し処理用テキストデータを加工する。
処理用テキストデータは、作成者が表現する各種の対象を示すデータである。たとえば、対象は、有名な人物、食品、車、音楽、旅行など、各種の分野にわたる概念を示す。この対象を示すデータにするために、処理用テキストデータを、所定の意味を有する最小の文字列からなる単位データに分割する処理を実行する。たとえば、処理用テキストデータに対して形態素解析をすることによって形態素という単位データに分解することができる。なお、対象を示すデータに分割する処理は、形態素解析には限られず、処理用テキストデータから所望する文字列のデータに分離する処理ならばよい。
第1段階として、捨象プログラムを実行することによって、入力される様々な表現(テキストデータ)を、例えば、ジャンルや嗜好あるいは方言や感情などの複数のカテゴリからなる関連詞(意味識別可能な複数の分解テキストデータを予め定められた関連テキストデータに変換したもの)に加工する。この加工処理は、関連詞の群の中に予め用意された監視したい特異な関連詞が存在するかどうかを分析する処理のための前処理である。この加工処理をすることによって、関連詞の群自体が外部に流出しても個人情報が流出する問題を回避できる。
次に、第2段階として、第1段階で生成したドメインに対して、第2のフィルタリング処理を実行することによって、第2のフィルタリング処理ごとに応じた部分空間を生成する。第2のフィルタリング処理においても、検閲者と関連詞との紐付けを維持するので、第2のフィルタリング処理によって生成される部分空間においても、検閲者と関連詞とは紐付けされている。検閲者と関連詞とを対で扱いつつ、予め用意された複数種類のジャンルごとに適合する第2のフィルタリング処理を実行する。第2のフィルタリング処理の複数種類のフィルタは、数百とか数千の多数のフィルタであってもよい。
さらに、第3段階として、第2段階で生成した部分空間に対して、第3のフィルタリング処理を実行する。第3のフィルタリング処理は、部分空間に含まれる関連詞に関して特異な状況である否かを判断するために適したフィルタリング処理である。つまり、ある監視レベルの異なる関連詞ごとに、所定の特異条件を満たしたかどうかの判定処理を実行し、特異条件を満たす関連詞を候補空間として抽出する。抽出した候補空間には、ユーザIDごとに関連テキストデータがふくまれる。
加えて、第4段階として、候補空間の前記入力日時データに基づく履歴情報から、前記候補対象のユーザIDを監視対象に設定するかどうかを判定し、この監視対象として設定したユーザIDの前記特異な因子が含まれる候補空間、および、同ユーザIDの前記入力日時データの異なる他の部分空間の関連テキストデータ群に基づいて監視空間の設定を決定するために、第4のフィルタリング処理プログラムを実行する。そして、前記監視空間に設定された関連テキストデータ及び監視対象となるユーザIDを前記監視情報として、後の監視のために取り出し可能な状態でデータベースに格納する。「後の監視のために取り出し可能な状態でデータベースに格納する」とは、監視情報を記憶した監視情報データベースが監視装置と接続されており、外部から外部情報が入力された場合において、が監視対象者のユーザIDからの外部情報である場合には、それに関連する検閲コマンドを外部に出力する一方、監視対象者のユーザIDでない場合であっても、監視対象者が使用する特異な因子とした関連詞が含まれる部分空間が存在した場合に、それに関連する検閲コマンドを外部に出力するようにしている。
<<検閲>>
本実施の形態による検閲システムにより、基幹システムの利用者から形成される場を検閲の場とするような検閲の概念が生成される。したがって、本実施の形態による検閲システムにおける検閲とは、単なる検閲とは異なり、検閲システムが提供する機能やサービスによって特徴付けられるものである。
本実施の形態において、発話とは、主として、メール、SMS、ブログ、Twitter、Web画面上の入力Box、掲示板などに様々な情報を書き込むことをいう。この発話の内容が、本実施の形態による検閲システムにおける検閲の対象である。本実施の形態の検閲システムは、メール、SMS、ブログ、Twitter、Web画面上の入力Box、掲示板などに書き込まれた情報を取得して、発話の内容を解析する。メール、SMS、ブログ、Twitter、Web画面上の入力Box、掲示板などに書き込まれた情報は、主として、テキストデータの形式である。
本実施の形態において対象となる個人情報は、その情報のみで個人を特定できる情報である。たとえば、氏名や住所などである。一方、その情報のみでは個人を特定できず、他の情報を参照することで個人を特定できる場合には、その情報を個人情報として扱わない。本実施の形態における検閲システムは、個人が発した発話の内容に含まれている個人情報を捨象して扱う。
本実施の形態による検閲システムは、関連詞と呼ぶキーワードを基礎として構成されており、関連詞が保持している関連情報に基づいて、検閲システムが提供する機能やサービスが実現されている。したがって、関連詞は、通常の検索処理などに用いられるいわゆるキーワードとは異なる。関連詞は、単なるキーワードと異なり、後述する履歴情報や監視情報などの情報を構成するために、たとえば、ドメインや嗜好などの各種の情報を互いに関連づけることができる。
uniqueIDは、発話をした個人を特定するための情報である。検閲システムは、uniqueIDを発話の内容と関連づけて関連詞として管理する。uniqueIDは、個人情報そのものではない。uniqueIDは、たとえば、電話番号や免許証番号やIPアドレスや掲示板におけるハンドル名などがある。uniqueIDは他の情報を参照することで個人を特定できる。したがって、検閲システムから外部に個人情報が漏れることはないが、検閲システムの運用者は、uniqueIDを用いて個人を特定することができる。
日時情報は、個人によって発話されたときを示す年月日及び時分秒などの情報である。検閲システムは、uniqueIDと同様に、日時情報を発話の内容と関連づけて関連詞として管理する。なお、年月日及び時分秒の全ての情報を用いる必要はなく、検閲システムの運用者が所望する情報を適宜選択して用いればよい。たとえば、メールが送信された日時や、掲示板に書き込まれた日時から日時情報を取得できる。
本実施の形態における検閲システムでは、個人が発話した内容から、検閲システムの運用者が所望する所定の対象を示す関連詞を抽出して検閲の対象とする。個人の発話の内容から所定の対象を示す関連詞を抽出するために、検閲システムでは、まず、基本フィルタを用いる。
本実施の形態における検閲システムでは、個人が発話した内容について、その感情を含めて検閲する。一般に、所定の対象について個人が発話するときに、所定の対象に対してよい感情をもって発話して場合と、よくない感情をもって発話している場合とがある。たとえば、ある商品について発話しているときに、その商品に対して、購入したくないとか、絶対に使いたくないなどの不満を感じている場合と、是非購入したいなどの満足している場合とがある。したがって、同じ対象について個人が発話している場合であっても、単にキーワードで検索をしただけでは、検索結果が参考になるものもあれば、参考にならないものもある。このような観点から、所定の対象についての感情を発話の内容から取得し、感情についても検閲の対象にできるようにする。
図6は、基本フィルタと適合フィルタと部分空間の概要を示す図である。
基本フィルタは、個人の発話のうち、本実施の形態による検閲システムが検閲の対象とする関連詞を抽出するためのフィルタである。たとえば、個人の発話は、図6に示すように、蓄積された多数の個人データである。個人データは、所定のサーバに蓄積されたデータでも、検閲システムが収集して蓄積したものでもよい。
適合フィルタは、個人の発話の内容から所定の対象に対する嗜好を抽出するためのフィルタである。上述したように、嗜好は、個人の発話に含まれている所定の対象に対する感情や心理に基づく主観的に表現される特徴である。すなわち、嗜好は、個人が所定の対象に対して感じたことや考えたことや思ったりしたことなどである。嗜好は、特徴パラメータ化されて、演算可能に数値として処理できるようにされている。
上述したように、基本フィルタに応じて個人の発話からドメインuiが生成される。ドメインuiに対してj番目の適合フィルタCjを用いて、ui∩Cjを演算することによって、ドメインuiに含まれている関連詞から、適合フィルタCjを満たす関連詞を抽出し、抽出した関連詞によって部分空間eijが生成される。このように処理することで、部分空間eijは、個人の発話に含まれる関連詞のうち、基本フィルタ(i番目のドメイン)と適合フィルタCjとの双方によって抽出された関連詞によって構成される集まりとなる。また、部分空間は、ドメインと同様に、抽出された関連詞にuniqueIDを紐付け、検閲の対象とすべき関連詞と検閲者との対の集まりを含む空間である。
図7は、構成フィルタと候補空間生成装置の概要を示す図である。
図8は、平衡フィルタと監視空間生成装置の概要を示す図である。
図10は、オンライン利用可能な嗜好可視化システム(検閲システム)の概要を示すブロック図である。
検閲制御コマンドは、検閲をした結果、検閲の対象となった個人に警告の情報を発したり、励ましの情報を発したりするためのコマンドである。また、検閲制御コマンドは、個人が使用している装置やシステムに対して制御するためのコマンドである。このように検閲制御コマンドを発することで、反社会的な発話や反常識的な発話をしている個人が使用している装置やシステムの通信回線を切断することができる。このような検閲制御コマンドは、検閲の結果に応じて検閲システムの運用者が所望する内容を定められる。
to B」(Business to Business)、企業と消費者の間の取引を「B to C」(Business to Consumer)、消費者同士の取引を「C to C」(Consumer
to Consumer)と呼ばれている。
基幹システムに参加する多数の個人によって生成された個人生成データを意味識別可能な複数の分解データに分解し、前記分解データのそれぞれが示す対象についてコミュニティ毎に特徴付けられる所定の関連条件と前記対象についてコミュニティ毎に特徴付けられる所定の特徴条件とを満たすデータを抽出し、抽出した第1抽出データの集合を検閲の場として生成する検閲の場生成手段と、
前記第1抽出データの集合から、前記対象に関してコミュニティ毎に特徴付けられる所定の特異性を示す特異条件を満たすデータを抽出し、抽出した第2抽出データから前記所定の特異性を検出して可視化する可視化手段と、を有することができる。
個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータから前記分解テキストデータが示す対象についてコミュニティ毎に特徴付けられる所定の関連条件と前記対象についてコミュニティ毎に特徴付けられる所定の特微条件とを満たすデータを抽出し、抽出した第1抽出データの集まりを検閲の場として生成する検閲の場生成手段と、
前記第1抽出データの集まりから、前記対象に関してコミュニティ毎に特徴付けられる所定の特異性を示す特異条件を満たすデータを抽出し、抽出した第2抽出データから前記所定の特異性を検出して可視化する可視化手段と、
前記第2抽出データに基づいて、監視すべき個人と監視の制御をする監視内容とを決定する監視手段とを有するものにできる。
20 サーバ
100 監視システム、検閲システム、嗜好可視化システム
Claims (10)
- 個人によって生成された個人生成データを意味識別可能な複数の分解データに分解し、前記分解データのそれぞれが示す対象について所定の関連条件と前記対象について所定の特徴条件とを満たすデータを抽出し、抽出した第1抽出データの集まりを検閲の場として生成する検閲の場生成手段と、
前記第1抽出データの集まりから、前記対象に関して所定の特異性を示す特異条件を満たすデータを抽出し、抽出した第2抽出データから前記所定の特異性を検出して可視化する可視化手段と、を有する情報処理システム。 - 複数の文字列からなるテキストデータを含む一つの外部情報を、入力インターフェイスを通じて受信し、その内容の特異な情報を抽出するためのプログラムを実行するコンピュータを備えたシステムであって、このコンピュータは前記プログラムを実行して以下の処理を実行する。
入力されたテキストデータを捨象して予め用意された複数の関連テキストデータに変換する処理と、
その一つの外部情報に関連テキストデータが示す対象に関して所定の特異性を示す特異条件を満たす場合には、その関連データを特異な関連テキストデータとして判定する処理と、
特異な関連テキストデータとして判定した関連テキストデータを、その外部情報に含まれる個人を識別するためのユーザID及び特異条件に関わる条件と関連して記憶する処理とを含む。 - 個人によって生成された個人生成データに基づくテキストデータから所定の内容を含むデータを捨象し、捨象したテキストデータを意味識別可能な分解テキストデータに分解する工程と、
前記分解テキストデータを、個人生成データを生成した個人を識別できるユーザIDに関連づけて記憶する工程と、を含む嗜好可視化方法。 - 個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータのうち、前記分解テキストデータが示す対象について所定の関連条件を満たす関連対象を示す関連テキストデータを抽出する工程と、
前記関連テキストデータを前記所定の関連条件に関連づけて記憶する工程と、を含む嗜好可視化方法。 - 個人によって生成された個人生成データに基づくテキストデータのうち、テキストデータが示す対象の属性について所定の特徴条件を満たす特徴テキストデータを抽出する工程と、
前記特徴テキストデータを前記所定の特徴条件に関連づけて記憶する工程と、を含む嗜好可視化方法。 - 個人によって生成された個人生成データに基づくテキストデータのうち、テキストデータが示す対象に関して所定の特異性を示す特異条件を満たすテキストデータを抽出する工程を含む嗜好可視化方法。
- 個人によって生成された個人生成データに基づくテキストデータを意味識別可能な分解テキストデータに分解し、前記分解テキストデータのうち、前記分解テキストデータが示す対象について所定の関連条件を満たす関連対象を示す関連テキストデータを抽出する工程と、
前記関連テキストデータのうち、テキストデータが示す対象の属性について所定の特徴条件を満たす特徴テキストデータを抽出する工程と、
特徴テキストデータが示す対象に関して所定の特異性を示す特異条件を満たす特異テキストデータを抽出する工程と、を含む嗜好可視化方法。 - 個人によって生成された個人生成データに基づくテキストデータが示す対象の履歴に関する履歴情報を生成し、前記個人生成データに基づくテキストデータのうち、前記履歴情報について所定の履歴条件を満たす履歴テキストデータを抽出する工程と、
前記個人生成データに基づくテキストデータが参照された参照数を、個人生成データを生成した個人を識別できるユーザIDに関連づけて生成し、前記個人生成データに基づくテキストデータのうち、前記参照数について所定の参照条件を満たすテキストデータを抽出する工程と、を含む嗜好可視化方法。 - 前記履歴テキストデータに基づいて監視情報を生成する工程を、さらに有することを特徴とする請求項8に記載の嗜好可視化方法。
- 個人によって生成された個人生成データに基づくテキストデータが示す対象の履歴に関する履歴情報を生成し、前記個人生成データに基づくテキストデータのうち、前記履歴情報について所定の履歴条件を満たす履歴テキストデータを抽出する工程と、
前記個人生成データに基づくテキストデータが参照された参照数を、個人生成データを生成した個人を識別できるユーザIDに関連づけて生成し、前記個人生成データに基づくテキストデータのうち、前記参照数について所定の参照条件を満たすテキストデータを抽出する工程と、
前記履歴テキストデータに基づいて監視情報を生成する工程と、
前記監視情報に基づいて検閲制御コマンドを生成する工程と、を含む検閲方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011086407A JP5872183B2 (ja) | 2011-04-08 | 2011-04-08 | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 |
CN201280016719.3A CN103635898B (zh) | 2011-04-08 | 2012-04-03 | 喜好可视化系统和审查系统 |
PCT/JP2012/059093 WO2012137782A1 (ja) | 2011-04-08 | 2012-04-03 | 嗜好可視化システム及び検閲システム |
US14/006,217 US10055487B2 (en) | 2011-04-08 | 2012-04-03 | Preference visualization system and censorship system |
US16/028,478 US20190012376A1 (en) | 2011-04-08 | 2018-07-06 | Preference visualization system and censorship system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011086407A JP5872183B2 (ja) | 2011-04-08 | 2011-04-08 | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012221222A true JP2012221222A (ja) | 2012-11-12 |
JP5872183B2 JP5872183B2 (ja) | 2016-03-01 |
Family
ID=46969178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011086407A Active JP5872183B2 (ja) | 2011-04-08 | 2011-04-08 | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10055487B2 (ja) |
JP (1) | JP5872183B2 (ja) |
CN (1) | CN103635898B (ja) |
WO (1) | WO2012137782A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577510A (zh) * | 2012-07-23 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 搜索结果数据的展现方法,搜索服务器及移动终端 |
JP5958237B2 (ja) * | 2012-09-25 | 2016-07-27 | 富士通株式会社 | 熱流体シミュレーション方法及び熱流体シミュレーション装置 |
US8909656B2 (en) * | 2013-03-15 | 2014-12-09 | Palantir Technologies Inc. | Filter chains with associated multipath views for exploring large data sets |
CN104809229B (zh) * | 2015-05-07 | 2018-12-04 | 北京京东尚科信息技术有限公司 | 一种文本特征词提取方法及系统 |
WO2020202314A1 (ja) * | 2019-03-29 | 2020-10-08 | 株式会社Aill | コミュニケーション支援サーバ、コミュニケーション支援システム、コミュニケーション支援方法、及びコミュニケーション支援プログラム |
CN113033577B (zh) * | 2021-03-26 | 2022-06-03 | 山东科技大学 | 一种基于伴方差修正模型的海洋目标特征提取方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115468A (ja) * | 2003-10-03 | 2005-04-28 | Mitsubishi Electric Corp | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
JP2006146567A (ja) * | 2004-11-19 | 2006-06-08 | Internatl Business Mach Corp <Ibm> | 表現検出システム、表現検出方法、及びプログラム |
JP2006236379A (ja) * | 2006-04-26 | 2006-09-07 | Nec Corp | 情報分類装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9183306B2 (en) * | 1998-12-18 | 2015-11-10 | Microsoft Technology Licensing, Llc | Automated selection of appropriate information based on a computer user's context |
JP2001028006A (ja) | 1999-07-15 | 2001-01-30 | Kdd Corp | 情報自動フィルタリング方法および装置 |
US6976070B1 (en) * | 1999-02-16 | 2005-12-13 | Kdd Corporation | Method and apparatus for automatic information filtering using URL hierarchical structure and automatic word weight learning |
JP4479366B2 (ja) * | 2004-06-14 | 2010-06-09 | ソニー株式会社 | 番組情報処理システム,番組情報管理サーバ,番組情報利用端末およびコンピュータプログラム。 |
US7549119B2 (en) * | 2004-11-18 | 2009-06-16 | Neopets, Inc. | Method and system for filtering website content |
US7783622B1 (en) * | 2006-07-21 | 2010-08-24 | Aol Inc. | Identification of electronic content significant to a user |
US7930302B2 (en) * | 2006-11-22 | 2011-04-19 | Intuit Inc. | Method and system for analyzing user-generated content |
US8024280B2 (en) * | 2006-12-21 | 2011-09-20 | Yahoo! Inc. | Academic filter |
JP5243783B2 (ja) * | 2007-12-27 | 2013-07-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コミュニティ・システム、コミュニティ・システムの活動記録方法、及びコミュニティ・システムの活動記録用プログラム |
US8763087B2 (en) * | 2008-10-09 | 2014-06-24 | Yahoo! Inc. | System and method for content access control |
US20100169313A1 (en) * | 2008-12-30 | 2010-07-01 | Expanse Networks, Inc. | Pangenetic Web Item Feedback System |
US20110119130A1 (en) * | 2009-07-10 | 2011-05-19 | Agan Thomas E | Methods, systems, and apparatus to manage meal planning and coupon dispensing |
EP2454712A4 (en) * | 2009-07-16 | 2013-01-23 | Bluefin Labs Inc | DETERMINATION AND DISPLAY OF SOCIAL INTERESTS IN TIME-BASED MEDIA |
US20110087737A1 (en) * | 2009-10-14 | 2011-04-14 | Cbs Interactive, Inc. | Systems and methods for living user reviews |
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
US8688691B2 (en) * | 2011-01-13 | 2014-04-01 | International Business Machines Corporation | Relevancy ranking of search results in a network based upon a user's computer-related activities |
-
2011
- 2011-04-08 JP JP2011086407A patent/JP5872183B2/ja active Active
-
2012
- 2012-04-03 WO PCT/JP2012/059093 patent/WO2012137782A1/ja active Application Filing
- 2012-04-03 US US14/006,217 patent/US10055487B2/en active Active
- 2012-04-03 CN CN201280016719.3A patent/CN103635898B/zh active Active
-
2018
- 2018-07-06 US US16/028,478 patent/US20190012376A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115468A (ja) * | 2003-10-03 | 2005-04-28 | Mitsubishi Electric Corp | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
JP2006146567A (ja) * | 2004-11-19 | 2006-06-08 | Internatl Business Mach Corp <Ibm> | 表現検出システム、表現検出方法、及びプログラム |
JP2006236379A (ja) * | 2006-04-26 | 2006-09-07 | Nec Corp | 情報分類装置 |
Also Published As
Publication number | Publication date |
---|---|
US20190012376A1 (en) | 2019-01-10 |
US10055487B2 (en) | 2018-08-21 |
US20140019464A1 (en) | 2014-01-16 |
JP5872183B2 (ja) | 2016-03-01 |
WO2012137782A1 (ja) | 2012-10-11 |
CN103635898A (zh) | 2014-03-12 |
CN103635898B (zh) | 2016-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
García-Díaz et al. | Detecting misogyny in Spanish tweets. An approach based on linguistics features and word embeddings | |
Shiha et al. | The effects of emoji in sentiment analysis | |
Yeomans et al. | The politeness Package: Detecting Politeness in Natural Language. | |
Teso et al. | Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective | |
JP5872183B2 (ja) | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 | |
Gianfortoni et al. | Modeling of stylistic variation in social media with stretchy patterns | |
CN113704451A (zh) | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 | |
JP2009099088A (ja) | Snsユーザプロファイル摘出装置、摘出方法並びに摘出プログラム、及び該ユーザプロファイルを利用する装置 | |
Badugu et al. | Emotion detection on twitter data using knowledge base approach | |
JP7096172B2 (ja) | キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法 | |
Onyenwe et al. | The impact of political party/candidate on the election results from a sentiment analysis perspective using# AnambraDecides2017 tweets | |
Baker | Corpora and gender studies | |
Vaziripour et al. | Analyzing the political sentiment of tweets in Farsi | |
JP6649318B2 (ja) | 言語情報分析装置および方法 | |
Cajueiro et al. | A comprehensive review of automatic text summarization techniques: method, data, evaluation and coding | |
JP2005309907A (ja) | ユーザコメントダイジェストの生成方法・装置・プログラム | |
Hoek et al. | Automatic coherence analysis of Dutch: Testing the subjectivity hypothesis on a larger scale | |
Soni et al. | Comparative analysis of rotten tomatoes movie reviews using sentiment analysis | |
KR20090126862A (ko) | 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 | |
Raut et al. | Enhancing hate speech detection with user characteristics | |
Najafi et al. | Comparing analysis of social media content with traditional survey methods of predicting opening night box-office revenues for motion pictures | |
Gelbukh | Sentiment analysis and opinion mining: Keynote address | |
Lee | Use-centric mining of customer reviews | |
Timm et al. | Dynamic analysis of communication processes using twitter data | |
Akkineni et al. | Hybrid Method for Framing Abstractive Summaries of Tweets. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140115 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140606 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150122 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150410 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151214 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20151221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5872183 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |