JP5133294B2 - Spatio-temporal search device, method and program - Google Patents
Spatio-temporal search device, method and program Download PDFInfo
- Publication number
- JP5133294B2 JP5133294B2 JP2009098279A JP2009098279A JP5133294B2 JP 5133294 B2 JP5133294 B2 JP 5133294B2 JP 2009098279 A JP2009098279 A JP 2009098279A JP 2009098279 A JP2009098279 A JP 2009098279A JP 5133294 B2 JP5133294 B2 JP 5133294B2
- Authority
- JP
- Japan
- Prior art keywords
- polarity
- spatio
- region
- people
- emotions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000008451 emotion Effects 0.000 claims description 91
- 238000004458 analytical method Methods 0.000 claims description 41
- 230000002996 emotional effect Effects 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、時空間検索装置及び方法及びプログラムに係り、特に、個人の経験が自然言語で記述され、さらにそれを経験した(または、そこに記述されている経験を実際にした)日時、場所を一意に識別可能な数値情報がそれに付与された構造を持つデータを対象として、人間の感情と、時空間領域との関係性を分析するための時空間検索装置及び方法及びプログラムに関する。 The present invention relates to a spatio-temporal search apparatus, method, and program, and in particular, the date, time, and place where an individual's experience is described in natural language and experienced (or the experience described therein is actually realized). The present invention relates to a spatio-temporal search device, method, and program for analyzing the relationship between human emotions and spatio-temporal regions for data having a structure with numerical information that can be uniquely identified as a target.
近年、ブログやSNS(ソーシャルネットワークサービス)、インターネット掲示板などのいわゆるCGM(Consumer Generated Media)と呼ばれるメディアの普及が著しい。これらのメディアは、企業が発する広告情報や、客観的なデータとは異なり、人間の経験、つまり、個人の行動履歴や、主観的な記述を多く含むという特徴がある。そのため、マーケティングや企業経営、消費行動などの様々な分野で、これらのメディアの利用の必要性が高まっている。また、携帯電話などのGPSを搭載したモバイル端末の普及により、位置情報(緯度、経度)や時間情報(日付)が付与されたCGM、ウェブテキストが発信される機会も増えてきている。 In recent years, media called so-called CGM (Consumer Generated Media) such as blogs, SNSs (social network services), and Internet bulletin boards have been widely used. Unlike advertising information and objective data issued by companies, these media are characterized by including many human experiences, that is, individual behavior histories and subjective descriptions. Therefore, the necessity of using these media is increasing in various fields such as marketing, corporate management, and consumption behavior. In addition, with the spread of mobile terminals equipped with GPS such as mobile phones, opportunities to transmit CGM and web text with location information (latitude, longitude) and time information (date) are increasing.
従来の第1の技術として、このようなCGM、特に、ブログを対象として、時間、もしくは空間に特有な人々の行動や感情を発見する経験マイニング技術が知られている。この技術は、ブログに付与された時間情報と、ブログ中に存在する地名、行動語、感情語の共起関係を利用して時間、空間、行動、感情の関係性を導出している(例えば、非特許文献1参照)。 As a first conventional technique, there is known an experience mining technique for discovering behaviors and feelings of people peculiar to time or space for such CGM, in particular, a blog. This technology derives the relationship between time, space, action, and emotion using the co-occurrence relationship between the time information given to the blog and the place name, action word, and emotion word existing in the blog (for example, Non-Patent Document 1).
従来の第2の技術として、ある単語の極性(ポジティブ/ネガティブ)を自動抽出する技術が知られている。この技術は、Web検索エンジンのヒット件数を使い、ある単語が、ポジティブな単語(good)とネガティブな単語(bad)のどちらと共起しやすいかという情報をもとに、その単語の極性を自動で決定する。この技術によれば、単語「事故」が、ポジティブよりネガティブの意味を強く持つということがわかる(例えば、非特許文献2参照)。 As a conventional second technique, a technique for automatically extracting the polarity (positive / negative) of a word is known. This technology uses the number of hits of a Web search engine and determines the polarity of a word based on information about whether a word is likely to co-occur with a positive word (good) or a negative word (bad). Determine automatically. According to this technique, it can be seen that the word “accident” has a negative meaning stronger than positive (for example, see Non-Patent Document 2).
従来の第3の技術は、単語の評価極性を一軸で評価する第1の技術を拡張し、単語の極性を人間の感情を構成する四軸(<嬉しい,哀しい>、<驚き,予期>、<受容,嫌悪>、<怒り,恐れ>)で評価する技術である(例えば、非特許文献3参照)。 The conventional third technique is an extension of the first technique that evaluates the evaluation polarity of a word in one axis, and the polarity of the word is composed of four axes (<happy, sad>, <surprise, anticipation>, <Acceptance, disgust>, <anger, fear>) (see, for example, Non-Patent Document 3).
また、従来の第2、第3の技術に依れば、最も単純には、ある文書においてポジティブな単語が、ネガティブな単語よりも多く出現している場合に、その内容が全体としてポジティブであると判断するといったように、文書分類にも応用することが可能である。 Further, according to the second and third techniques of the prior art, most simply, when a positive word appears more than a negative word in a document, the content is positive as a whole. It can be applied to document classification as well.
従来の第1の技術は、時間属性(日付)や空間属性が数値データとして与えられた場合に、これら数値属性をカテゴリ属性に帰着して解くため、得られる解が最適性を持っていなかった。ここでは、血液型、性別のような2つ以上の値をとる属性をカテゴリ属性、時間、緯度/経度、体重、身長といった、一般の数値を取る属性を数値属性と呼ぶ。カテゴリ属性に帰着するということは、つまり、数値属性の連続性を無視することを意味する。例えば、数値属性「日付」の値「2008年11月06日」を、単純なカテゴリ属性「日付」の値「2008年11月6日」として扱った瞬間に、11月5日、11月6日、11月7日…といった連続性が失われ、その結果11月1日から11月7日までの一週間に起こった傾向といった、複数のカテゴリ属性値に跨って起きる傾向を得られなくなる。空間属性についても同様で、従来の第1の技術は、地名で表される領域の一つの単位として傾向を発見するため、地名で表される領域に跨る、もしくは、地名で表される領域の一部で起きている傾向を発見できなかった。 In the first conventional technique, when time attributes (dates) and spatial attributes are given as numerical data, these numerical attributes are reduced to category attributes and solved, so the obtained solution has not been optimal. . Here, attributes that take two or more values such as blood type and gender are called category attributes, and attributes that take general numerical values such as time, latitude / longitude, weight, and height are called numerical attributes. Reducing to a category attribute means ignoring the continuity of numeric attributes. For example, at the moment when the value “November 06, 2008” of the numerical attribute “date” is treated as the value “November 6, 2008” of the simple category attribute “date”, November 5, November 6 As a result, it becomes impossible to obtain a tendency to occur across a plurality of category attribute values such as a tendency that occurred in one week from November 1 to November 7. The same applies to the spatial attribute. The first conventional technique finds a trend as one unit of the area represented by the place name, and therefore spans the area represented by the place name or the area represented by the place name. I couldn't find a trend that happened in some areas.
また、従来の第2・第3の技術は、時間に左右されない固定的な単語と極性との関係を発見するための技術であり、時間的/空間的要因によって変化する関係を発見することができない。 In addition, the conventional second and third techniques are techniques for discovering a relationship between a fixed word and polarity that is not influenced by time, and it is possible to discover a relationship that changes depending on temporal / spatial factors. Can not.
本発明は、上記の点に鑑みなされたもので、個人の経験が自然言語で記述され、さらに、それを経験した(または、そこに記述されている経験を実際にした)日時、場所を一意に識別可能な数値情報がそれに付与された構造を持つデータを対象として、ある感情を抱く人々を最もよく特徴付ける最適な時空間領域を求めることが可能な時空間検索装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and the personal experience is described in natural language, and the date, time, and place where the experience was experienced (or the experience described therein was actually made) are unique. A spatio-temporal search device, method, and program capable of obtaining an optimal spatio-temporal region that best characterizes people who have a certain emotion are targeted for data having a structure in which numerical information that can be identified is assigned thereto For the purpose.
図1は、本発明の原理構成図である。 FIG. 1 is a principle configuration diagram of the present invention.
本発明(請求項1)は、個人の経験が自然言語で記述された文書と、該文書に対して、経験をした位置情報、時間情報が数値データで与えられた構造の解析対象データから、特定の人々を最もよく特徴付ける最適な時空間領域を求める時空間検索装置であって、
解析対象データと、求める時空間領域に対する制約と、人々を特徴付ける条件を入力し、入力情報記憶手段11に格納する入力手段10と、
入力手段10で与えられた人々を特徴付ける条件を、最適な時空間領域を求める目的値とする目的値導出手段30と、
解析対象データのテキストの内容が、人々を特徴付ける条件に該当する人々によって書かれたものかを判定する文書極性判定手段21と、
文書極性判定手段21の判定結果と、解析対象データに付与された位置情報、時間情報に基づいて、位置情報、時間情報、判定結果を要素として持つトランザクションを生成し、トランザクション記憶手段15に格納するトランザクション生成手段22と、
トランザクション記憶手段15のトランザクションの集合から、目的値に該当するトランザクションの出現確率を最大化する時空間領域条件を、求める時空間領域に対する制約に基づいて、数値属性相関ルールを抽出することで導出する数値属性相関ルール抽出手段40と、
を有する。
The present invention (Claim 1) is based on a document in which an individual's experience is described in a natural language, and analysis target data having a structure in which position information and time information on which the experience has been given are given as numerical data. A spatio-temporal search device for finding an optimal spatio-temporal region that best characterizes a specific person,
Input means 10 for inputting data to be analyzed, constraints on the spatiotemporal area to be obtained, conditions for characterizing people, and storing them in the input information storage means 11;
A target
Document polarity determination means 21 for determining whether the content of the text of the analysis target data is written by people corresponding to the conditions characterizing people;
Based on the determination result of the document
A space-time region condition that maximizes the appearance probability of the transaction corresponding to the target value is derived from the set of transactions stored in the
Have
また、本発明(請求項2)は、請求項1の時空間検索装置において、
入力手段10は、
人々を特徴付ける条件として、反対の意味を持つ二つの感情からなる感情極性を指定することで、ある感情、もしくは、その逆の感情を抱くかどうかという観点で人々を特徴付けする手段を含み、
目的値導出手段30は、
入力手段10で与えられた二つの感情を、それぞれ、最適な時空間領域を求める目的値とする手段を含み、
文書極性判定手段21は、
解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する手段を含む。
Further, the present invention (Claim 2) is the spatio-temporal search device according to
The input means 10
As a condition that characterizes people, by specifying emotional polarity consisting of two emotions with opposite meanings, including means to characterize people in terms of whether they have one emotion or the opposite,
The target value deriving means 30
Means for setting the two emotions given by the input means 10 as target values for obtaining an optimal space-time region,
The document polarity determination means 21
Means for determining which content of the text of the analysis target data belongs to which of the two emotions which are the polarity values of the emotion polarity.
また、本発明(請求項3)は、請求項1の時空間検索装置において、
入力手段10は、
人々を特徴付ける条件として、指定された反対の意味を持つ二つの感情からなる複数の感情極性の入力を受け付け、複数の感情を同時に抱くかという観点で人々を特徴付けする手段を含み、
目的値導出手段30は、
入力手段で与えられたそれぞれの感情極性について、感情極性を構成する二つの反意の感情を元とする集合の直積集合を目的値とする手段を含み、
文書極性判定手段21は、それぞれの感情極性について、解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する手段を含む。
Further, the present invention (Claim 3) is the spatio-temporal search device according to
The input means 10
As a condition to characterize people, it includes means for characterizing people from the perspective of accepting multiple emotional polarities that consist of two emotions with specified opposite meanings,
The target value deriving means 30
For each emotional polarity given by the input means, including means for setting the objective value to a Cartesian product set of sets based on two opposing emotions constituting the emotion polarity,
The document
また、本発明(請求項4)は、請求項1乃至3の何れか1項記載の時空間検索装置において、特定の人々を最も良く特徴付ける最適な時空間領域を出力する出力手段を更に有する。
The present invention (Claim 4) further comprises output means for outputting an optimum spatio-temporal region that best characterizes a specific person in the spatio-temporal search device according to any one of
図2は、本発明の原理を説明するための図である。 FIG. 2 is a diagram for explaining the principle of the present invention.
本発明(請求項5)は、個人の経験が自然言語で記述された文書と、該文書に対して、経験をした位置情報、時間情報が数値データで与えられた構造の解析対象データから、特定の人々を最もよく特徴付ける最適な時空間領域を求める時空間検索方法であって、
解析対象データと、求める時空間領域に対する制約と、人々を特徴付ける条件を入力し、入力情報記憶手段に格納する入力ステップ(ステップ1)と、
入力ステップ(ステップ1)で与えられた人々を特徴付ける条件を、最適な時空間領域を求める目的値とする目的値導出ステップ(ステップ2)と、
解析対象データのテキストの内容が、人々を特徴付ける条件に該当する人々によって書かれたものかを判定する文書極性判定ステップ(ステップ3)と、
文書極性判定ステップ(ステップ3)の判定結果と、解析対象データに付与された位置情報、時間情報に基づいて、位置情報、時間情報、判定結果を要素として持つトランザクションを生成し、トランザクション記憶手段に格納するトランザクション生成ステップ(ステップ4)と、
トランザクション記憶手段のトランザクションの集合から、目的値に該当するトランザクションの出現確率を最大化する時空間領域条件を、求める時空間領域に対する制約に基づいて、数値属性相関ルールを抽出することで導出する数値属性相関ルール抽出ステップ(ステップ5)と、を行う。
The present invention (Claim 5) includes a document in which an individual's experience is described in a natural language, and analysis target data having a structure in which the positional information and time information on which the experience is given are given as numerical data, A spatio-temporal search method that finds the optimal spatio-temporal region that best characterizes a particular person,
An input step (step 1) for inputting analysis target data, constraints on the space-time region to be obtained, conditions for characterizing people, and storing them in the input information storage means;
A target value deriving step (step 2) in which the conditions characterizing the people given in the input step (step 1) are set as target values for obtaining an optimal spatiotemporal region;
A document polarity determination step (step 3) for determining whether the text content of the analysis target data is written by people corresponding to the conditions characterizing people;
Based on the determination result of the document polarity determination step (step 3) and the position information and time information given to the analysis target data, a transaction having the position information, time information, and determination result as elements is generated and stored in the transaction storage means. A transaction generation step (step 4) to store;
A numerical value derived by extracting a numerical attribute correlation rule from a set of transactions in the transaction storage means, based on the constraints on the spatiotemporal domain to obtain the spatiotemporal domain condition that maximizes the appearance probability of the transaction corresponding to the target value An attribute correlation rule extraction step (step 5) is performed.
また、本発明(請求項6)は、請求項5記載の時空間検索方法の入力ステップ(ステップ1)では、人々を特徴付ける条件として、反対の意味を持つ二つの感情からなる感情極性を指定することで、ある感情、もしくは、その逆の感情を抱くかどうかという観点で人々を特徴付けし、
目的値導出ステップ(ステップ2)では、入力ステップで与えられた反対の意味を持つ二つの感情を、それぞれ、最適な時空間領域を求める目的値とし、
文書極性判定ステップ(ステップ3)では、解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する。
Further, according to the present invention (Claim 6), in the input step (Step 1) of the spatio-temporal search method according to
In the target value derivation step (step 2), two emotions having opposite meanings given in the input step are set as target values for obtaining the optimum spatiotemporal region,
In the document polarity determination step (step 3), it is determined which of the two emotions, which is the polarity value of the emotion polarity, the content of the text of the analysis target data.
また、本発明(請求項7)は、請求項5記載の時空間検索方法の入力ステップ(ステップ1)では、人々を特徴付ける条件として、指定された反対の意味を持つ二つの感情からなる複数の感情極性の入力を受け付け、複数の感情を同時に抱くかという観点で人々を特徴付けし、
目的値導出ステップ(ステップ2)では、入力ステップで与えられたそれぞれの感情極性について、感情極性を構成する二つの反意の感情を元とする集合の直積集合を目的値とし、
文書極性判定ステップ(ステップ3)では、それぞれの感情極性について、解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する。
Further, according to the present invention (Claim 7), in the input step (Step 1) of the spatio-temporal search method according to
In the objective value deriving step (step 2), for each emotion polarity given in the input step, the objective value is a Cartesian product set of a set based on two opposing emotions constituting the emotion polarity,
In the document polarity determination step (step 3), for each emotion polarity, it is determined which of the two emotions, which are the polarity values of the emotion polarity, the content of the text of the analysis target data belongs to.
また、本発明(請求項8)は、請求項5乃至7のいずれか1項に記載の時空間検索方法において、特定の人々を最も良く特徴付ける最適な時空間領域を表示手段に出力する出力ステップを更に行う。
Further, according to the present invention (Claim 8), in the spatiotemporal search method according to any one of
本発明(請求項9)は、請求項1乃至4記載の何れか1項記載の時空間検索装置を構成する各手段としてコンピュータを機能させるための時空間検索プログラムである。
The present invention (Claim 9) is a spatiotemporal search program for causing a computer to function as each means constituting the spatiotemporal search apparatus according to any one of
本発明によれば、個人の経験が自然言語で記述されたテキストと、それに対して経験した位置情報、時間情報が数値データで与えられた構造のデータから、ある感情を抱く人々を最もよく特徴付ける最適な時空間領域を求めることが可能である。 According to the present invention, a person who has a certain emotion is best characterized from text in which personal experience is described in natural language, and positional information and time information experienced in the form of numerical data. It is possible to obtain an optimal spatiotemporal region.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態における時空間検索装置の構成を示す。 FIG. 3 shows the configuration of the spatio-temporal search device in one embodiment of the present invention.
時空間検索装置は、入力部10、解析対象データ記憶部11、閾値記憶部12、感情極性記憶部13、領域族記憶部14、トランザクション記憶部15、最適解記憶部16、トランザクション生成機能部20、目的値導出部30、数値属性相関ルール抽出部40、出力部50からなり、ある特定の人々、代表的には、ある感情を抱く人々を最もよく特徴付ける最適な時空間領域を求める。本発明において、時空間領域とは、時間、または、空間領域、または、時空間領域を含む概念であると定義する。
The spatiotemporal search device includes an
図4は、本発明の一実施の形態における時空間検索装置の概要動作のフローチャートである。 FIG. 4 is a flowchart of the schematic operation of the spatio-temporal search device in one embodiment of the present invention.
ステップ100) 入力部10は、ユーザから入力された解析対象データ、閾値(最小支持度)、感情極性(<ポジティブ,ネガティブ>のような反対の意味を持つ二つの感情)、領域族(二つの数値属性が張る平面、及び、三つの数値属性が張る空間の種類)をそれぞれ、解析対象データ記憶部11、閾値記憶部12、感情極性記憶部13、領域族記憶部14に格納する。
Step 100) The
ステップ200) 目的値導出部30は、感情極性記憶部13から感情極性を読み出して、最適な時間、空間領域、時空間領域を求める対象となる目的値を求める。または、それぞれの感情極性について、感情極性を構成する二つの範囲の感情を元とする集合の直積集合を求め、目的値とする。
Step 200) The objective
ステップ300) トランザクション生成機能部20は、感情極性記憶部13から単一、または複数の感情極性を、解析対象データ記憶部11から解析対象データを、それぞれ読み出して、それぞれの感情極性について、解析対象データが極性値である二つの感情のどちらに属するかを判定する。
Step 300) The transaction
ステップ400) トランザクション生成機能部20は、ステップ300で判定された解析対象データの感情極性と、解析対象データの日付、緯度、経度、感情極性値を要素に持つトランザクションを生成し、トランザクション記憶部15に格納する。
Step 400) The transaction
ステップ500) 数値属性相関ルール抽出部40は、トランザクション記憶部15に格納されているトランザクション、目的値導出部30で求められた目的値、領域族記憶部14に格納されている領域族、閾値記憶部12に格納されている最小支持度を取得して、特定の人々を最も特徴付ける最適な空間領域、時空間領域を求め、最適解として、最適解記憶部16に格納する。
Step 500) The numerical attribute correlation
ステップ600) 出力部50は、最適解記憶部16に格納されている最適解を出力する。
Step 600) The
以下に、各構成要素毎に詳細な動作を説明する。 Below, detailed operation | movement is demonstrated for every component.
入力部10は、解析対象データと、相関ルール抽出の際に用いる閾値と、感情極性、領域族とをユーザから受け付ける。入力部10は、例えば、キーボード、OCR、ペン入力、音声認識装置、GPSなどを搭載した端末等や、ネットワーク上に置かれたテキストファイルを読み込む手段等によって構成されている。
The
解析対象データは、個人の経験の履歴や経験に基づく感想、評価が自然言語で記述され、さらに、それを記述した、または、そこに記述されている経験を実際に行った時間、位置を一意に識別可能な数値情報がそれに付与されたデータであるものとする。本実施の形態では、時間情報として日付が、位置情報として緯度、経度が指定されたものとする。 The analysis target data is a personal experience history, impressions and evaluations based on the experience are described in natural language, and the time and position at which the experience is described or actually performed are described. It is assumed that the numerical information that can be identified is the data attached thereto. In the present embodiment, it is assumed that the date is specified as time information and the latitude and longitude are specified as position information.
上記の閾値としては、最小支持度が与えられる。当該最小支持度は、後述する相関ルールの有用性を示す尺度の一つである支持度に対する閾値である。 As the threshold value, a minimum support level is given. The minimum support level is a threshold value for the support level, which is one of the measures indicating the usefulness of the association rule described later.
上記の感情極性は、<ポジティブ,ネガティブ>のような、逆の意味を持つ二つの概念を指定することで、ある特徴を持つ人々を絞り込むための極性を示すためのものである。ここで、<ポジティブ,ネガティブ>のような反意を持つ2概念からなる感情軸を『感情極性』(あるいは略して『極性』)、"ポジティブ"、"ネガティブ"をそれぞれ「極性値」と呼ぶこととする。<ポジティブ,ネガティブ>以外の代表的な感情極性として、
(1)<嬉しい,悲しい>
(2)<驚き,予期>
(3)<怒り,恐れ>
(4)<受容,嫌悪>
の4種類を挙げることができる。また、これらの4軸は直交する概念であることが知られているが、ユーザは複数の直交する感情極性を指定して、混合した感情を問い合わせすることも可能である。本実施の形態においては、ユーザはm個の感情極性Q1={p1,n1},…,Qm={Pm,Nm}を指定したとする。また、ここに示した感情極性以外にも例えば、<良い,悪い>、<明るい,暗い>など、形容詞の反意語のペアを入力してもよい。また、あるキーワードや概念を<含む,含まない>としたりしてもよい。
The above emotional polarities are intended to show the polarities to narrow down people with certain characteristics by specifying two concepts with opposite meanings, such as <positive, negative>. Here, the emotional axis consisting of two concepts with affirmatives such as <positive, negative> is called "emotional polarity" (or "polarity" for short), and "positive" and "negative" are called "polarity values", respectively. I will do it. Typical emotional polarities other than <positive, negative>
(1) <happy and sad>
(2) <Surprise, anticipation>
(3) <Anger, fear>
(4) <Acceptance, disgust>
Can be mentioned. Moreover, although it is known that these four axes are orthogonal concepts, the user can inquire about mixed emotions by specifying a plurality of orthogonal emotion polarities. In the present embodiment, it is assumed that the user designates m emotion polarities Q 1 = {p 1 , n 1 },..., Q m = {P m , N m }. In addition to the emotional polarity shown here, antonym pairs of adjectives such as <good, bad> and <bright, dark> may be input. A certain keyword or concept may be <included, not included>.
上記の領域族とは、二つの数値属性が張る平面、及び、三つの数値属性が張る空間の種類である。ユーザが、最適な空間領域(二次元)、時空間領域(三次元)を求める際にはこの領域族を指定する。時間を求める際には、単一の数値属性を扱うことになるため指定する必要はない。例えば、二値属性が張る平面における領域族の例としては、
(1)矩形領域、
(2)x単調領域、
(3)直方凸領域
が挙げられる。
The above-mentioned region group is a type of plane on which two numerical attributes are stretched and a space on which three numerical attributes are stretched. The user designates this region group when obtaining the optimum space region (two-dimensional) and space-time region (three-dimensional). When calculating the time, it is not necessary to specify a single numeric attribute. For example, as an example of a region family in the plane where the binary attribute extends,
(1) rectangular area,
(2) x monotonic region,
(3) A rectangular convex region is mentioned.
(1)の矩形領域とは、図5(a)に示すように、二つの数値属性の区間の直積によって表現され、二つの数値属性がつくる平面上の軸に平行な領域である。 As shown in FIG. 5A, the rectangular area (1) is an area that is expressed by the direct product of two numerical attribute sections and is parallel to the axis on the plane formed by the two numerical attributes.
(2)のx単調領域とは、図5(b)に示すように、x軸(もしくはy軸)に垂直な直線との交わりが一つの区間か空であるような連結領域である。 The x monotonic region in (2) is a connected region in which the intersection with a straight line perpendicular to the x axis (or y axis) is one section or empty, as shown in FIG.
(3)の直方凸領域とは、図5(c)に示すように、x単調かつ、y単調な連結領域である。 As shown in FIG. 5C, the rectangular convex area (3) is an x monotone and y monotone connected area.
解析対象データ記憶部11は、入力部10で入力された上記の解析対象データを格納する。解析対象データ記憶部11は、入力データの構造が保存され、復元可能なものであれば何でもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The analysis target
閾値記憶部12は、入力部10で入力された、上記閾値を格納する。閾値記憶部12は、解析対象データ記憶部11と同様に、最小支持度を保存し、復元可能なものであれば何でもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The
感情極性記憶部13は、入力部10で入力された感情極性を格納する。感情極性記憶部13は、感情極性を保存し、復元可能なものであれば何でもよい。例えば、データベースや予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The emotion polarity storage unit 13 stores the emotion polarity input by the
領域族記憶部14は、入力部10で入力された領域族を格納する。入力された領域族を保存し、復元可能なものであれば何でもよい。例えば、データベースや予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The region
トランザクション生成機能部20は、文書極性判定部21とトランザクション生成部22とを有する。文書極性判定部21は、感情極性記憶部13に記憶されている極性に基づき、解析対象データ記憶部11に格納されている上記解析対象データのテキスト部分の内容の極性値を判定する。例えば、テキストを<ポジティブ,ネガティブ>という軸で評価する場合には、『店員の態度が悪かったです』というテキストを「ネガティブ」に、『料理が非常においしかったです』を「ポジティブ」に分類する。また、m個の極性に対して、一テキストをm回、異なる極性で判定する。
The transaction
文書極性判定部21は、機械学習を用いた文書分類技術、前述の非特許文献2、非特許文献3や、評価表現辞書、感情辞書等のシソーラスを利用した方法等で実現できる。
The document
トランザクション生成部22は、文書極性判定部21の結果と、解析対象データ記憶部11に記憶された解析対象データの日付、緯度、経度とから、以下の形式のトランザクションを生成する。
The
R={ID,日付,緯度,経度,感情極性1,…,感情極性m}
上記のIDは、トランザクションの識別子である。感情極性は、文書極性判定部21で得られた極性値を値として持つ。図6に2つの感情極性<嬉しい,悲しい>、<驚き,予期>が入力された場合の結果の例を示す。
R = {ID, date, latitude, longitude, emotion polarity 1 ,..., Emotion polarity m }
The ID is a transaction identifier. The emotion polarity has a polarity value obtained by the document
トランザクション記憶部15は、トランザクション生成部22で生成したトランザクションを格納する。トランザクション記憶部15は、トランザクションの構造を保存するものであればなんでもよい。例えば、データベースや予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The
目的値導出部30は、評価極性記憶部13に記憶されたユーザが入力したm個の感情極性から、最適な時間、空間領域、時空間領域を求める対象となる目的値の集合Pを導出する。
The target
目的値集合Pは、以下の通り、m個の集合Q1,…,Qmの直積集合である。 The target value set P is a Cartesian product set of m sets Q1,..., Qm as follows.
ステップ201) 目的値導出部30は、評価極性記憶部13から感情極性O1,…,Omを読み込む。
Step 201) The target
ステップ202) m≧2であれば、ステップ103に移行し、そうでない場合はステップ208に移行する。 Step 202) If m ≧ 2, proceed to Step 103, otherwise proceed to Step 208.
ステップ203) 一次変数iを初期化(i←1)する。 Step 203) The primary variable i is initialized (i ← 1).
ステップ204) i≦mである場合にはステップ205に移行し、そうでない場合はステップ207に移行する。
Step 204) If i ≦ m, go to
ステップ205) 感情極性Oiの極性値を元とする集合Qiを生成する。 Step 205) generates a set Q i to the original polarity value of semantic orientation O i.
ステップ206) i=i+1としてステップ204に戻る。 Step 206) Set i = i + 1 and return to Step 204.
ステップ207) ステップ204においてi>mである場合には、Q1,…,Qmの直積集合を目的値集合Pに設定し、ステップ209に移行する。
Step 207) If i> m in Step 204, set the Cartesian product set of Q 1 ,..., Q m to the target value set P, and go to
ステップ208) ステップ202において、m<2であれば感情極性O1の極性値を元とする目的値集合Pを生成する。
Step 208) In
ステップ209) 目的値集合Pを目的値導出部30内のメモリ(図示せず)に記憶する。
Step 209) The target value set P is stored in a memory (not shown) in the target
数値属性相関ルール抽出部40は、トランザクション記憶部15に記憶されたトランザクションと、目的値導出部30が導出した目的値集合Pと、領域族記憶部14に記憶された領域族と、閾値記憶部12に記憶された最小支持度に基づいて、最適確信度数値属性相関ルールを抽出する。
The numerical attribute correlation
数値属性相関ルール抽出部40は、目的値導出部30によって得られた目的値集合Pの全ての要素について、最適な時間、空間領域、時空間領域を順々に求めていく。
The numerical attribute correlation
目的値集合Pのある要素p=[q1,…,qm]│q1∈Q1,…,qm∈Qmについて最適な時間、空間領域、時空間領域を求める場合を考える。数値属性相関ルール導出部40は、最初に、トランザクション記憶部15に記憶されたトランザクションに対して、トランザクションの極性属性部分p'=[q'1,…,q'm]│q'1∈Q1,…,q'm∈Qmが、pに等しいか否かを判別するための目的属性Eを付与する。本実施の形態においては、目的属性Eは、p=p'の場合には1を、そうでない場合には0をとるものとする。図8に、図6の例に目的属性を付与した例を示す。
Element p = [q 1, ..., q m] of the target value set P │q 1 ∈Q 1, ..., optimum time for q m ∈Q m, consider the case of obtaining the spatial domain, the space-time region. First, the numerical attribute correlation
数値属性相関ルール抽出部40は、最適な時間を求める場合には、一次元数値属性相関ルールを抽出する。また、最適な空間領域を求める場合には、二次元数値属性相関ルールを抽出する。また、最適な時空間領域を求める際には、三次元数値属性相関ルールを抽出する。数値属性相関ルールは以下の形式で表される。
The numerical attribute correlation
(A∈(v1,v2))→(E=1)
上記のAは数値属性で、v1≦v2はAの定義域中の値、Eは目的属性である。矢印左の項を条件部、右の項を結論部と呼ぶ。相関ルールの有用性を示す尺度としては、支持度と確信度を用いる。全トランザクション数をN、属性Aの値がv1≦v2に含まれるトランザクション数をs、属性Aの値がv1≦v2に含まれ、かつ、属性Eの値として1を持つトランザクション数をhとすると、支持度はh/N、確信度はh/sで計算できる。また、設定のし易さを考えて、支持度をhと考えて計算してもよい。また、条件部に1,2,3個の数値属性を持つルールをそれぞれ、一次元、二次元、三次元数値属性相関ルールと呼ぶこととする。
(A∈ (v 1 , v 2 )) → (E = 1)
A is a numerical attribute, v 1 ≦ v 2 is a value in the domain of A, and E is a target attribute. The term on the left of the arrow is called the condition part, and the term on the right is called the conclusion part. Support and confidence are used as a measure of the usefulness of the association rule. Number of transactions where N is the total number of transactions, s is the number of transactions whose attribute A is included in v 1 ≦ v 2 , the number of transactions whose attribute A is included in v 1 ≦ v 2 , and 1 is the value of attribute E If h is h, the support can be calculated by h / N and the certainty can be calculated by h / s. Further, in consideration of ease of setting, the degree of support may be calculated as h. Further, rules having 1, 2, and 3 numeric attributes in the condition part are referred to as one-dimensional, two-dimensional, and three-dimensional numeric attribute correlation rules, respectively.
最適な時間を求めるには、以下の形式の一次元数値属性相関ルールを抽出する。 In order to obtain the optimum time, a one-dimensional numerical attribute correlation rule of the following format is extracted.
(T∈[t1,t2])→(E=1)
ここで、Tは時間属性、t1≦t2はTの定義域中の値である。例えば、「2008年1月1日から2008年1月2日に、人は高い確率で嬉しいという感情を持つ」という事実は、以下の相関ルールで表現される。
(Tε [t1, t2]) → (E = 1)
Here, T is a time attribute, and t1 ≦ t2 is a value in the T domain. For example, the fact that “a person has a high probability of being happy from January 1, 2008 to January 2, 2008” is expressed by the following association rule.
(T∈[2008-01-01,2008-01-02])→(E=1)
前述の通り、目的属性Eは、極性値が"嬉しい"の場合に1をとる属性である。トランザクション記憶部15に格納されているトランザクション集合の中から、ある一定以上(最小支持度以上)の支持度を持ち、その中で確信度が最も高くなるルール(最適確信度相関ルール)を選択する。もし、確信度を最大とするルールが複数存在する場合には、支持度を最大にするものを優先的に選ぶ。そのルールの条件部が示す時間領域を、目的属性の値を最も良く特徴付ける最適領域とする。
(T∈ [2008-01-01,2008-01-02]) → (E = 1)
As described above, the target attribute E is an attribute that takes 1 when the polarity value is “happy”. From the transaction set stored in the
最適な空間領域を求めるには、以下の形式の二次元数値属性相関ルールを抽出する。 In order to obtain the optimum spatial region, a two-dimensional numerical attribute correlation rule having the following format is extracted.
(<L,A>∈R)→(E=1)
ここで、Lは緯度属性、Aは経度属性である。Rは数値属性L,Aとそれらが張る平面状の領域である。この領域Rの形式は、領域族記憶部14に記憶された領域族である。前記の通り、二次元の数値属性における代表的な領域族は、
1)矩形領域、
2)x単調領域、
3)直方凸領域
である。
(<L, A> ∈R) → (E = 1)
Here, L is a latitude attribute, and A is a longitude attribute. R is the numerical attributes L and A and the planar area that they stretch. The format of the region R is a region group stored in the region
1) rectangular area,
2) x monotonic region,
3) A rectangular convex region.
1)の矩形領域は、二つの数値属性の区間の直積によって表現され、二つの数値属性がつくる平面上の軸に平行な領域であるため、一次元数値属性相関ルールを単純に拡張した以下の形式の相関ルールが矩形領域に該当する。 The rectangular area of 1) is expressed by the direct product of the sections of two numerical attributes, and is an area parallel to the axis on the plane created by the two numerical attributes. The association rule of the format corresponds to the rectangular area.
(L∈[35.0000,36.0000])∧(A∈[140.0000,141.0000])→(E=1)
トランザクション記憶部15に記憶されているトランザクション集合の中から、ある一定以上(最小支持度以上)を選択する。もし、確信度を最大とするルールが複数存在するとき、支持度を最大にするものを優先的に選ぶ。そのルールの条件部が示す空間領域<L,A>を、目的属性の値を最も良く特徴付ける最適領域とする。この方法は想定する領域族を(1)矩形領域、(2)x単調領域、(3)直方凸領域のどれにするかによって、異なる最適解を導き出す可能性がある。
(L∈ [35.0000,36.0000]) ∧ (A∈ [140.0000,141.0000]) → (E = 1)
From a transaction set stored in the
最適な時空間領域を求めるには、以下の形式の三次元数値属性相関ルールを考える。 To find the optimal spatio-temporal region, consider a three-dimensional numerical attribute correlation rule of the form
(<T,L,A>∈R)→(E=1)
ここで、Rは数値属性T,L,Aとそれらが張る三次元空間領域である。この領域Rの形式は、領域族記憶部14に記憶された領域族である。領域の形としては、三つの数値属性がつくる空間上の軸に平行な領域や、ある一つの軸に垂直な直線との交わりが一つの区間か空であるような連結領域や、ある二つの軸に垂直な直線との交わりがひとつの区間か空であるような連結領域や、全ての軸に垂直な直線との交わりが一つの区間か空であるような連結領域が考えられる。
(<T, L, A> ∈R) → (E = 1)
Here, R is a numerical attribute T, L, A and a three-dimensional space region spanned by them. The format of the region R is a region group stored in the region
トランザクション記憶部15に格納されているトランザクション集合の中から、ある一定以上(最小支持度以上)の支持度を持ち、その中で確信度が最も高くなるルール(最適確信度ルール)を選択する。もし、確信度を最大とするルールが複数存在するとき、支持度を最大にするものを優先的に選ぶ。そのルールの条件部が示す時空間領域<T,L,A>を、目的属性の値を最も良く特徴付ける最適領域とする。この方法は想定する領域族によって、異なる最適解を導き出す可能性がある。
From the transaction set stored in the
全ての区間、領域を列挙して最大の確信度となる区間を選ぶ素朴な手法から、より効率的な既存技術など、それぞれの数値属性相関ルールを求める具体的な手法は問わない。 There is no limitation on a specific method for obtaining each numerical attribute correlation rule, such as a simple method of enumerating all the sections and areas and selecting a section having the highest certainty factor, or a more efficient existing technique.
例えば、一次元数値属性相関ルールは、数値属性を偏りのないM個の区画に分割し、k=1,…,Mに対して二次元平面上における点の列、 For example, a one-dimensional numerical attribute correlation rule divides a numerical attribute into M sections without bias, and a sequence of points on a two-dimensional plane for k = 1,.
最適解記憶部16は、数値属性相関ルール抽出部40で得られた、目的値、数値属性相関ルール、各種ルールの優位性を示す指標(支持度、確信度)の組み合わせを格納する。最適解(最も高い確信度を持つルール)のみを記憶しても良いし、最小支持度以上の支持度を持つ数値属性相関ルールの全てを記憶しても良い。つまり、数値属性相関ルール抽出部40で得られた全ての情報を記憶可能なものである。例えば、データベースや予め備えられた汎用的な記憶装置(メモリやハードディスク装置等)の特定領域に記憶される。
The optimal
出力部50は、最適解記憶部16に格納されている目的値、数値属性相関ルール(または、相関ルールの条件部の、時間領域、空間領域、時空間領域)、相関ルールの優位性を示す指標(支持度、確信度)を出力する。ここで、出力とはディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積等を含む概念である。出力部50は、ディスプレイやスピーカ等の出力デバイスを含むと考えても、含まないと考えてもよい。出力部50は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現することができる。
The
上記の実施の形態において、数値属性相関ルール抽出部40が、数値属性相関ルールを生成する動作について、最適空間領域を求める例を用いて説明する。ここでは、トランザクションの位置情報として緯度属性L,経度属性Aという二つの数値属性が付与されているとする。また、ユーザから指定された領域族は直方凸領域であるとする。また、最小支持度としては頻度「6」が指定されたとする(説明の簡略化のため、支持度を頻度ベースで定義)。
In the above embodiment, the operation in which the numerical attribute correlation
まず、最適化領域を求めるために、二つの数値属性L,Aが張る平面の定義域を適当な粒度のグリッドに分割し、グリッド上のピクセルをつなぎ合わせて領域を作る。次に、トランザクション記憶部15に記憶されたそれぞれのトランザクションを、位置(緯度、経度)情報に基づいて、L,Aが張る平面上にマッピングする。この際に、目的属性の値が「1」のトランザクションと「0」のトランザクションとを判別可能な形式でマッピングする。図9は、目的属性の値が「1」のトランザクションを黒い丸で、「0」のトランザクションを白い丸で表現し、緯度、経度に基づいてマッピングした領域の例である。
First, in order to obtain an optimized region, a domain defined by a plane formed by two numerical attributes L and A is divided into grids of appropriate granularity, and pixels on the grid are connected to create a region. Next, each transaction stored in the
図9に示した領域から、数値属性相関ルールアルゴリズムを用いて、最小支持度以上の支持度を持つ直方凸領域を求めると、図10に示すように、三つの領域(直方凸領域A,直直方凸領域B,直方凸領域C)が得られる。この中で最も確信度の高い直方凸領域、つまり、直方凸領域Aが最適空間領域となる。 When a rectangular convex area having a support level equal to or higher than the minimum support level is obtained from the area shown in FIG. 9 using the numerical attribute correlation rule algorithm, as shown in FIG. A rectangular convex area B and a rectangular convex area C) are obtained. Of these, the rectangular convex region with the highest certainty, that is, the rectangular convex region A is the optimal space region.
なお、上記の時空間検索装置の構成要素の動作をプログラムとして構築し、時空間検索装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 The operations of the components of the spatio-temporal search device described above can be constructed as a program, installed in a computer used as the spatio-temporal search device, executed, or distributed via a network.
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、ブログ等の個人発信情報を時空間上で分類する技術に適用可能である。 The present invention can be applied to a technique for classifying personally transmitted information such as a blog in space-time.
10 入力手段、入力部
11 入力情報記憶手段、解析対象データ記憶部
12 閾値記憶部
13 感情極性記憶部
14 領域族記憶部
15 トランザクション記憶手段、トランザクション記憶部
16 最適解記憶部
20 トランザクション生成機能部
21 文書極性判定部
22 トランザクション生成手段、トランザクション生成部
30 目的値算出手段、目的値導出部
40 数値属性相関ルール抽出手段、数値属性相関ルール抽出部
50 出力部
DESCRIPTION OF
Claims (9)
前記解析対象データと、求める時空間領域に対する制約と、人々を特徴付ける条件を入力し、記憶手段に格納する入力手段と、
前記入力手段で与えられた前記人々を特徴付ける条件を、最適な時空間領域を求める目的値とする目的値導出手段と、
前記解析対象データのテキストの内容が、前記人々を特徴付ける条件に該当する人々によって書かれたものかを判定する文書極性判定手段と、
前記文書極性判定手段の判定結果と、前記解析対象データに付与された位置情報、時間情報に基づいて、位置情報、時間情報、判定結果を要素として持つトランザクションを生成し、トランザクション記憶手段に格納するトランザクション生成手段と、
前記トランザクション記憶手段のトランザクションの集合から、前記目的値に該当するトランザクションの出現確率を最大化する時空間領域条件を、前記求める時空間領域に対する制約に基づいて、数値属性相関ルールを抽出することで導出する数値属性相関ルール抽出手段と、
を有することを特徴とする時空間検索装置。 The most suitable for characterizing a specific person from a document in which personal experience is described in a natural language and the analysis target data of the structure in which the experienced location information and time information are given as numerical data. A spatio-temporal search device for obtaining a spatio-temporal region,
Input means for inputting the analysis target data, constraints on the space-time region to be obtained, conditions for characterizing people, and storing them in storage means;
A target value deriving unit that sets a condition characterizing the people given by the input unit as a target value for obtaining an optimal space-time region;
Document polarity determination means for determining whether the content of the text of the analysis target data is written by people who meet the conditions characterizing the people;
Based on the determination result of the document polarity determination means and the position information and time information given to the analysis target data, a transaction having the position information, time information, and determination result as elements is generated and stored in the transaction storage means. Transaction generation means;
Extracting a numerical attribute correlation rule from a set of transactions in the transaction storage means based on a constraint on the spatio-temporal region to determine a spatio-temporal region condition that maximizes the appearance probability of the transaction corresponding to the target value. Numeric attribute association rule extraction means for deriving;
A spatio-temporal search device characterized by comprising:
前記人々を特徴付ける条件として、反対の意味を持つ二つの感情からなる感情極性を指定することで、ある感情、もしくは、その逆の感情を抱くかどうかという観点で人々を特徴付けする手段を含み、
前記目的値導出手段は、
前記入力手段で与えられた前記二つの感情を、それぞれ、最適な時空間領域を求める目的値とする手段を含み、
前記文書極性判定手段は、
前記解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する手段を含む
請求項1記載の時空間検索装置。 The input means includes
The means for characterizing the people includes means for characterizing people in terms of whether they have a certain emotion, or vice versa, by specifying an emotion polarity consisting of two emotions having opposite meanings,
The target value deriving means includes
Each of the two emotions given by the input means includes means for obtaining a target value for obtaining an optimal spatiotemporal region,
The document polarity determination means includes
The spatio-temporal search device according to claim 1, further comprising means for determining which of the two emotions, which are polar values of emotion polarity, the content of the text of the analysis target data belongs to.
前記人々を特徴付ける条件として、指定された反対の意味を持つ二つの感情からなる複数の感情極性の入力を受け付け、複数の感情を同時に抱くかという観点で人々を特徴付けする手段を含み、
前記目的値導出手段は、
前記入力手段で与えられたそれぞれの感情極性について、感情極性を構成する二つの反意の感情を元とする集合の直積集合を目的値とする手段を含み、
前記文書極性判定手段は、
それぞれの感情極性について、前記解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する手段を含む
請求項1記載の時空間検索装置。 The input means includes
Means for characterizing people in terms of accepting multiple emotional polarities consisting of two emotions with opposite specified meanings as conditions for characterizing the people,
The target value deriving means includes
For each emotion polarity given by the input means, including means for setting a direct product set of a set based on two opposing emotions constituting the emotion polarity as a target value,
The document polarity determination means includes
The spatio-temporal search device according to claim 1, further comprising means for determining, for each emotional polarity, the content of the text of the analysis target data belongs to two emotions which are polarity values of the emotional polarity.
請求項1乃至3の何れか1項記載の時空間検索装置。 4. The spatio-temporal search device according to claim 1, further comprising output means for outputting an optimal spatiotemporal region that best characterizes a specific person.
前記解析対象データと、求める時空間領域に対する制約と、人々を特徴付ける条件を入力し、記憶手段に格納する入力ステップと、
前記入力ステップで与えられた前記人々を特徴付ける条件を、最適な時空間領域を求める目的値とする目的値導出ステップと、
前記解析対象データのテキストの内容が、前記人々を特徴付ける条件に該当する人々によって書かれたものかを判定する文書極性判定ステップと、
前記文書極性判定ステップの判定結果と、前記解析対象データに付与された位置情報、時間情報に基づいて、位置情報、時間情報、判定結果を要素として持つトランザクションを生成し、トランザクション記憶手段に格納するトランザクション生成ステップと、
前記トランザクション記憶手段のトランザクションの集合から、前記目的値に該当するトランザクションの出現確率を最大化する時空間領域条件を、前記求める時空間領域に対する制約に基づいて、数値属性相関ルールを抽出することで導出する数値属性相関ルール抽出ステップと、
を行うことを特徴とする時空間検索方法。 The most suitable for characterizing a specific person from a document in which personal experience is described in a natural language and the analysis target data of the structure in which the experienced location information and time information are given as numerical data. A spatiotemporal search method for obtaining a spatiotemporal region,
An input step for inputting the analysis target data, restrictions on the space-time region to be obtained, conditions for characterizing people, and storing them in storage means;
A target value deriving step in which the conditions characterizing the people given in the input step are set as target values for obtaining an optimal spatiotemporal region;
A document polarity determination step for determining whether the text content of the analysis target data is written by people corresponding to a condition characterizing the people;
Based on the determination result of the document polarity determination step and the position information and time information given to the analysis target data, a transaction having the position information, time information, and determination result as elements is generated and stored in the transaction storage means. A transaction generation step;
Extracting a numerical attribute correlation rule from a set of transactions in the transaction storage means based on a constraint on the spatio-temporal region to determine a spatio-temporal region condition that maximizes the appearance probability of the transaction corresponding to the target value. A numerical attribute association rule extraction step to be derived;
A spatio-temporal search method characterized by:
前記人々を特徴付ける条件として、反対の意味を持つ二つの感情からなる感情極性を指定することで、ある感情、もしくは、その逆の感情を抱くかどうかという観点で人々を特徴付けし、
前記目的値導出ステップにおいて、
前記入力ステップで与えられた前記二つの感情を、それぞれ、最適な時空間領域を求める目的値とし、
前記文書極性判定ステップにおいて、
前記解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する
請求項5記載の時空間検索方法。 In the input step,
Characterize people in terms of whether they have a certain emotion, or vice versa, by specifying an emotion polarity consisting of two emotions with opposite meanings as a condition that characterizes the people,
In the target value derivation step,
Each of the two emotions given in the input step is set as a target value for obtaining an optimal spatiotemporal region,
In the document polarity determination step,
The spatio-temporal search method according to claim 5, wherein the text content of the analysis target data is determined to belong to one of two emotions, which is a polarity value of emotion polarity.
前記人々を特徴付ける条件として、指定された反対の意味を持つ二つの感情からなる複数の感情極性の入力を受け付け、複数の感情を同時に抱くかという観点で人々を特徴付けし、
前記目的値導出ステップにおいて、
前記入力ステップで与えられたそれぞれの感情極性について、感情極性を構成する二つの反意の感情を元とする集合の直積集合を目的値とし、
前記文書極性判定ステップにおいて、
それぞれの感情極性について、前記解析対象データのテキストの内容が、感情極性の極性値である二つの感情のどちらに属するかを判定する
請求項5記載の時空間検索方法。 In the input step,
As a condition for characterizing the people, it accepts input of a plurality of emotion polarities consisting of two emotions having opposite meanings specified, and characterizes people in terms of whether to hold a plurality of emotions simultaneously,
In the target value derivation step,
For each emotion polarity given in the input step, the objective value is a Cartesian product set of a set based on two opposing emotions constituting the emotion polarity,
In the document polarity determination step,
6. The spatiotemporal search method according to claim 5, wherein, for each emotion polarity, the content of the text of the analysis target data is determined to belong to two emotions which are polarity values of the emotion polarity.
請求項5乃至7のいずれか1項記載の時空間検索方法。 8. The spatio-temporal search method according to claim 5, further comprising an output step of outputting an optimal spatio-temporal region that best characterizes a specific person.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009098279A JP5133294B2 (en) | 2009-04-14 | 2009-04-14 | Spatio-temporal search device, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009098279A JP5133294B2 (en) | 2009-04-14 | 2009-04-14 | Spatio-temporal search device, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250496A JP2010250496A (en) | 2010-11-04 |
JP5133294B2 true JP5133294B2 (en) | 2013-01-30 |
Family
ID=43312761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009098279A Expired - Fee Related JP5133294B2 (en) | 2009-04-14 | 2009-04-14 | Spatio-temporal search device, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5133294B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5510341B2 (en) * | 2011-01-13 | 2014-06-04 | 富士通株式会社 | Region discovery apparatus, region discovery program, and region discovery method |
WO2013046435A1 (en) * | 2011-09-30 | 2013-04-04 | 富士通株式会社 | Observation information processing device, observation information processing program, and observation information processing method |
JP5704249B2 (en) * | 2011-09-30 | 2015-04-22 | 富士通株式会社 | Observation information processing apparatus, observation information processing program, and observation information processing method |
JP5741705B2 (en) * | 2011-10-28 | 2015-07-01 | 富士通株式会社 | Optimal region extraction method and apparatus |
JP6487204B2 (en) * | 2014-12-25 | 2019-03-20 | Kddi株式会社 | Program, apparatus, and method for detecting a place that affects a person's psychological state from comment text |
CN113761227A (en) * | 2020-08-12 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | Text data searching method and device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005108054A (en) * | 2003-09-30 | 2005-04-21 | Eiichi Ehata | Natural language processing system |
JP4726683B2 (en) * | 2006-04-06 | 2011-07-20 | 日本電信電話株式会社 | EXPERIENCE INFORMATION EXTRACTION METHOD AND DEVICE, PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM |
JP2008092163A (en) * | 2006-09-29 | 2008-04-17 | Brother Ind Ltd | Situation presentation system, server, and server program |
-
2009
- 2009-04-14 JP JP2009098279A patent/JP5133294B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010250496A (en) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Streaming feature selection for multilabel learning based on fuzzy mutual information | |
US10783361B2 (en) | Predictive analysis of target behaviors utilizing RNN-based user embeddings | |
CN107273438B (en) | Recommendation method, device, equipment and storage medium | |
US10713317B2 (en) | Conversational agent for search | |
Bhuvaneshwari et al. | Spam review detection using self attention based CNN and bi-directional LSTM | |
Toba et al. | Discovering high quality answers in community question answering archives using a hierarchy of classifiers | |
US20230022845A1 (en) | Model for textual and numerical information retrieval in documents | |
Hammad et al. | An approach for detecting spam in Arabic opinion reviews | |
Chen et al. | General functional matrix factorization using gradient boosting | |
US8032469B2 (en) | Recommending similar content identified with a neural network | |
US20100185623A1 (en) | Topical ranking in information retrieval | |
JP5133294B2 (en) | Spatio-temporal search device, method and program | |
US11182540B2 (en) | Passively suggesting text in an electronic document | |
US20200192921A1 (en) | Suggesting text in an electronic document | |
US11308146B2 (en) | Content fragments aligned to content criteria | |
Kilroy et al. | Using machine learning to improve lead times in the identification of emerging customer needs | |
Fagni et al. | Fine-grained prediction of political leaning on social media with unsupervised deep learning | |
You et al. | Exploring public sentiments for livable places based on a crowd-calibrated sentiment analysis mechanism | |
Liu et al. | Unveiling consumer preferences in automotive reviews through aspect-based opinion generation | |
Iram et al. | Anatomy of Sentiment Analysis of Tweets Using Machine Learning Approach: Anatomy of Sentiment Analysis of Tweets | |
CN116882414B (en) | Automatic comment generation method and related device based on large-scale language model | |
Bhatia et al. | Strategies for mining opinions: A survey | |
Mazzoleni et al. | Unsupervised learning of fundamental emotional states via word embeddings | |
Farhadloo | Statistical Methods for Aspect Level Sentiment Analysis | |
Qin et al. | Recommender resources based on acquiring user's requirement and exploring user's preference with Word2Vec model in web service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5133294 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |