JP2006190196A - Device and method for evaluating person - Google Patents

Device and method for evaluating person Download PDF

Info

Publication number
JP2006190196A
JP2006190196A JP2005003000A JP2005003000A JP2006190196A JP 2006190196 A JP2006190196 A JP 2006190196A JP 2005003000 A JP2005003000 A JP 2005003000A JP 2005003000 A JP2005003000 A JP 2005003000A JP 2006190196 A JP2006190196 A JP 2006190196A
Authority
JP
Japan
Prior art keywords
evaluation
value
data
person
inner product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005003000A
Other languages
Japanese (ja)
Inventor
Susumu Ogata
進 緒方
Takanobu Muta
高信 牟田
Katsutoshi Kimoto
勝敏 木本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2005003000A priority Critical patent/JP2006190196A/en
Publication of JP2006190196A publication Critical patent/JP2006190196A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform highly precise evaluation of users of an Internet community not only by unit of data but by unit of person. <P>SOLUTION: A person evaluation server 10 has a dictionary construction unit 10a which creates a dictionary data base 15 in which evaluation criteria are unified to be referred by every evaluation content and a person-based evaluation unit 10b. The person-based evaluation unit 10b refers to article data about an object for evaluation and the dictionary data base 15 and adopts an inner product value (for example, an affirmative inner product value) of an evaluation content having the maximum value among inner product values of dictionaries and articles of each evaluation content as a basic value. Then, the person-based evaluation unit 10b uses the basic value and registered user IDs to calculate evaluation values by unit of user. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、コミュニケーションログを用いて人物を評価する技術に関する。   The present invention relates to a technique for evaluating a person using a communication log.

近年、インターネットの普及とユーザ数の増大に伴い、多様な情報をネットワーク上で共有するインターネットコミュニティが構築されている(例えば、特許文献1参照)。インターネットコミュニティにおいては、不特定多数の仮想的な人が、掲示板やチャット、あるいは投稿付のウェブログといった、コミュニケーションを実現するためのサービスを利用している。このため、かかるサービスの利用者は、インターネットを介して不特定多数の人とコミュニケーションをとることになる。したがって、コミュニケーションの相手が信頼できるか否かを判断できる仕組みのないコミュニティでは、利用者が安心してコミュニケーションを行うことができないという問題が懸念される。
特開2002−163220号公報
In recent years, with the spread of the Internet and the increase in the number of users, an Internet community for sharing various information on a network has been constructed (for example, see Patent Document 1). In the Internet community, an unspecified number of virtual people use services such as bulletin boards, chats, and web logs with posts to realize communication. For this reason, users of such services communicate with an unspecified number of people via the Internet. Therefore, in a community that does not have a mechanism for determining whether a communication partner can be trusted, there is a concern that the user cannot communicate with peace of mind.
JP 2002-163220 A

上記懸念を解消すべく、コミュニケーション相手を評価する手法が提案されている。例えば、掲示板やチャット上の文章、第三者からの投稿などのテキストデータを基にした人物評価については、利用者が、他人若しくは自己に対する主観的評価を入力し、蓄積された評価結果から各人物の評価を行う。しかし、このような人物評価では、客観的な尺度が規定されないことから、評価の正確性及び普遍性に欠け、評価情報としての利用範囲が限定されてしまうという問題がある。   In order to eliminate the above concerns, a method for evaluating a communication partner has been proposed. For example, for person evaluations based on text data such as text on bulletin boards and chats, postings from third parties, etc., the user inputs subjective evaluations for others or self, and each evaluation result is based on the accumulated evaluation results. Perform person evaluation. However, in such a person evaluation, since an objective scale is not defined, there is a problem that the accuracy and universality of the evaluation are lacking and the range of use as evaluation information is limited.

上記問題点に鑑みて、まず評価の尺度を統一した上で、テキスト中に現れた特徴を抽出して評価するテキストマイニングの適用が有効である。しかし、テキストマイニングの技術は、テキストデータから文字検索や傾向抽出を行うことを目的としていることから、データ単位での評価には適している反面、人物単位での評価には適さないという難点がある。   In view of the above problems, it is effective to apply text mining that first unifies the evaluation scale and then extracts and evaluates the features that appear in the text. However, since the technology of text mining is intended to perform character search and trend extraction from text data, it is suitable for evaluation in units of data, but it is not suitable for evaluation in units of persons. is there.

そこで、本発明の課題は、インターネットコミュニティの利用者に関して、データ単位のみならず人単位で、高精度な評価を行うことである。   Therefore, an object of the present invention is to perform highly accurate evaluation on the Internet community users not only in data units but also in human units.

本発明に係る人物評価装置は、統一された評価尺度に準じた評価内容ごとに、学習用データに含まれる特徴語と、該特徴語に対するスコアとが対応付けられた辞書を構築する辞書構築手段と、前記学習用データを構成する、複数ユーザのデータ(例えば、記事)と、前記辞書とを参照することにより、前記複数ユーザの識別情報と基礎値とに基づくユーザ単位の評価を行う評価手段とを備える。   The person evaluation device according to the present invention is a dictionary construction means for constructing a dictionary in which a feature word included in learning data and a score for the feature word are associated with each evaluation content according to a unified evaluation scale. And evaluation means for evaluating each user based on identification information and basic values of the plurality of users by referring to data (for example, articles) of the plurality of users constituting the learning data and the dictionary With.

本発明に係る人物評価方法は、学習用データに含まれる特徴語と、該特徴語に対するスコアとを対応付けて、統一された評価尺度に準じた評価内容ごとに辞書を構築するステップと、前記学習用データを構成する、複数ユーザのデータと、構築された前記辞書とを参照することにより、前記複数ユーザの識別情報と基礎値とに基づくユーザ単位の評価を行うステップとを含む。   The person evaluation method according to the present invention relates to a feature word included in learning data and a score for the feature word, and builds a dictionary for each evaluation content according to a unified evaluation scale; A step of evaluating each user based on the identification information and the basic value of the plurality of users by referring to the data of the plurality of users constituting the learning data and the constructed dictionary.

これらの発明によれば、辞書には、統一された評価尺度を用いて、学習用データ中の特徴語と、その出現頻度に応じたスコアとが、評価内容ごとに登録されている。また、上記学習用データを構成するデータへの評価は、上記辞書を参照しながら、ユーザの識別情報を基にして行われる。したがって、これらの発明を、ユーザの入力したデータの集まるインターネットコミュニティに適用することで、その利用者に関して、データ単位のみならず人単位の高精度な評価が実現される。   According to these inventions, feature words in the learning data and scores according to their appearance frequencies are registered for each evaluation content in the dictionary using a unified evaluation scale. The evaluation of the data constituting the learning data is performed based on the user identification information while referring to the dictionary. Therefore, by applying these inventions to the Internet community where the data input by the user is gathered, high-accuracy evaluation not only in data units but also in human units is realized for the user.

なお、辞書の構築は、ユーザ単位評価の事前作業であり、辞書構築と人物評価は、それぞれ独立に行われる。したがって、人単位評価の対象となるユーザに関しても、辞書の構築に携わったユーザ(例えば、学習用データを書いたユーザ)に限るものではない。   It should be noted that the construction of the dictionary is a prior work for the user unit evaluation, and the dictionary construction and the person evaluation are performed independently. Therefore, the user who is the target of the person-unit evaluation is not limited to the user who is involved in the construction of the dictionary (for example, the user who wrote the learning data).

上記辞書構築手段は、辞書を構築する具体的手段として、前記学習用データを、前記評価内容ごとに分類するデータ分類手段と、前記データ分類手段により分類された前記学習用データを単語に分解するデータ解析手段と、前記データ解析手段による分解の結果得られた単語に対して、その出現頻度に応じたスコアを付与するスコア算出手段と、前記スコア算出手段により付与された各単語のスコアに基づいて、前記評価内容ごとに分類された前記学習用データから、特徴語を抽出する特徴語抽出手段とを備える。
本発明によれば、学習用データから、データを評価する際に比較の対象となる特徴語が複数登録された辞書の構築が可能となる。
The dictionary construction means, as specific means for constructing a dictionary, decomposes the learning data into words, data classification means for classifying the learning data for each evaluation content, and the learning data classified by the data classification means. Based on data analysis means, score calculation means for assigning a score corresponding to the appearance frequency to a word obtained as a result of decomposition by the data analysis means, and a score of each word given by the score calculation means And feature word extracting means for extracting feature words from the learning data classified for each evaluation content.
According to the present invention, it is possible to construct a dictionary in which a plurality of feature words to be compared when data is evaluated are registered from learning data.

例えば、前記特徴語抽出手段は、前記スコア算出手段によりスコアの付された単語のうち、idf値(全データにおける重要度を表す値)が閾値以上の単語を特徴語として抽出する。
また、前記特徴語抽出手段は、前記スコア算出手段によりスコアの付された単語のうち、前記学習用データ中における出現総数が閾値以上の単語を特徴語として抽出するものとしてもよい。
更には、前記特徴語抽出手段は、特徴語として抽出された単語の中から、評価値の算出に際して不要な記号(「 」、( )、・など)を特徴語から除外することもできる。
For example, the feature word extraction unit extracts, as a feature word, a word having an idf value (a value representing importance in all data) that is equal to or greater than a threshold among the words scored by the score calculation unit.
In addition, the feature word extraction unit may extract, as a feature word, a word whose total number of appearances in the learning data is greater than or equal to a threshold value among the words scored by the score calculation unit.
Furthermore, the feature word extraction means can exclude symbols (“”, (),...) Unnecessary for calculating the evaluation value from the feature words from the words extracted as feature words.

上記評価手段は、データから人単位の評価を行う具体的手段として、前記辞書に登録された特徴語の特徴ベクトルと、評価対象のデータの特徴ベクトルとの内積値を、評価内容ごとに基礎値として算出する内積値算出手段と、前記複数ユーザの識別情報と算出された前記基礎値とを用いて、ユーザごとの評価値を算出する評価値算出手段とを備える。   The above-mentioned evaluation means is a concrete means for evaluating each person from data, and calculates the inner product value of the feature vector of the feature word registered in the dictionary and the feature vector of the data to be evaluated for each evaluation content. And an evaluation value calculation means for calculating an evaluation value for each user using the identification information of the plurality of users and the calculated basic value.

本発明によれば、内積値から、辞書に登録された特徴語と、評価対象のデータとの類似度を推定することができる。したがって、人物評価装置は、評価内容ごとに特徴語を辞書に登録しておき、評価対象のデータをユーザ別に分類することで、データの評価内容の推定、すなわち、統一された基準によるデータのユーザ別評価が可能となる。   According to the present invention, the similarity between the feature word registered in the dictionary and the data to be evaluated can be estimated from the inner product value. Therefore, the person evaluation device registers feature words in the dictionary for each evaluation content, and classifies the evaluation target data for each user, thereby estimating the evaluation content of the data, that is, the user of the data based on a unified standard. Another evaluation is possible.

上記内積値差分算出手段は、前記内積値算出手段により算出された評価内容ごとの内積値から、一の評価内容の内積値と他の評価内容の内積値との差分を基礎値として算出するものとしてもよい。
一の評価内容の内積値とは、例えば、「肯定」の辞書に登録されている特徴語の特徴ベクトルと、評価対象データの特徴ベクトルとの内積値であり、他の評価内容の内積値とは、例えば、「否定」の辞書に登録されている特徴語の特徴ベクトルと、評価対象データの特徴ベクトルとの内積値である。
このように、特定の評価内容の内積値を基準にとることで、基礎値から算出される評価値は簡易化され、ユーザによる評価結果の把握が容易になるという効果が期待できる。
The inner product value difference calculating means calculates a difference between the inner product value of one evaluation content and the inner product value of another evaluation content as a basic value from the inner product value for each evaluation content calculated by the inner product value calculating means. It is good.
The inner product value of one evaluation content is, for example, the inner product value of the feature vector of the feature word registered in the “affirmation” dictionary and the feature vector of the evaluation target data, and the inner product value of the other evaluation content Is, for example, the inner product value of the feature vector of the feature word registered in the “No” dictionary and the feature vector of the evaluation target data.
Thus, by taking the inner product value of the specific evaluation content as a reference, the evaluation value calculated from the basic value is simplified, and an effect that the user can easily grasp the evaluation result can be expected.

前記評価値算出手段は、例えば、評価対象のユーザ及びデータに対応する前記基礎値の総和を用いて、前記評価値を算出する。
より具体的には、前記評価値算出手段は、評価対象のユーザ及びデータに対応する前記基礎値の総和に、前記ユーザに対応する評価内容ごとのデータ数を乗算し、前記ユーザに対応するデータ総数を除すことにより、前記評価値を算出することができる。つまり、同一のユーザに関して、評価の基準として用いられる評価内容のデータの数が、全データ数に占める割合を係数とし、基礎値の総和に乗算する。
The evaluation value calculation means calculates the evaluation value using, for example, the sum of the basic values corresponding to the user to be evaluated and the data.
More specifically, the evaluation value calculation means multiplies the sum of the basic values corresponding to the user and data to be evaluated by the number of data for each evaluation content corresponding to the user, and data corresponding to the user. The evaluation value can be calculated by dividing the total number. That is, for the same user, the sum of the basic values is multiplied with the ratio of the number of evaluation contents data used as the evaluation reference to the total number of data as a coefficient.

本発明によれば、評価値を算出する際に、ある評価内容(例えば、肯定、否定、無し)を得たデータ数が全体のデータ数に占める比率を、基礎値の総和に乗算する手法が採られる。これにより、評価の対象となるユーザに関して、投稿した全てのデータが評価値に反映されるため、インターネットコミュニティの利用者は、より効率的かつ適確な評価結果を閲覧することができる。   According to the present invention, when calculating an evaluation value, there is a method of multiplying the sum of basic values by the ratio of the number of data obtained with a certain evaluation content (for example, affirmation, denial, or none) to the total number of data. Taken. Thereby, since all the posted data is reflected in the evaluation value for the user to be evaluated, the user of the Internet community can browse the evaluation result more efficiently and accurately.

これらの発明によれば、統一された基準かつ人単位での人物評価が為されるため、評価精度、ひいては、コミュニケーション相手に対する信頼性が向上する。その結果、インターネットコミュニティの利用者は、評価を参考にすることで、不特定多数の人と安心してコミュニケーションを図ることができる。   According to these inventions, since the person evaluation is performed in a unified standard and in units of persons, the evaluation accuracy and, consequently, the reliability with respect to the communication partner is improved. As a result, Internet community users can communicate with a large number of unspecified people by referring to the evaluation.

(第1の実施形態)
以下、添付図面を参照して、本発明の第1の実施形態における人物評価システムについて説明する。
図1は、本実施の形態における人物評価システムの機能的構成を説明するための図である。図1に示すように、人物評価システム1は、後述の人物評価サーバ10(人物評価装置に対応)と、インターネットコミュニティのユーザが保持する携帯端末20,30,40とを少なくとも備える。携帯端末20,30,40からは、基地局B及びネットワークNを経由して、コミュニティ上に掲載されている記事の閲覧やコメントの書込みが可能になっている。
(First embodiment)
Hereinafter, a person evaluation system according to a first embodiment of the present invention will be described with reference to the accompanying drawings.
FIG. 1 is a diagram for explaining a functional configuration of a person evaluation system in the present embodiment. As shown in FIG. 1, the person evaluation system 1 includes at least a person evaluation server 10 (corresponding to a person evaluation apparatus), which will be described later, and portable terminals 20, 30, and 40 held by users of the Internet community. From the mobile terminals 20, 30, and 40, it is possible to browse articles posted on the community and write comments via the base station B and the network N.

人物評価サーバ10は、辞書構築ユニット10a(辞書構築手段に対応)と人単位評価ユニット10b(評価手段に対応)とを備える。更に、辞書構築ユニット10aは、データ分類部11(データ分類手段に対応)と、データ解析部12(データ解析手段に対応)と、スコア算出部13(スコア算出手段に対応)と、特徴語抽出部14(特徴語抽出手段に対応)と、辞書データベース15とを備える。人単位評価ユニット10bは、内積値算出部16(内積値算出手段に対応)と、記事分類部17と、記事データベース18と、ユーザデータベース19と、評価値算出部110(評価値算出手段に対応)と、評価値出力部111とを備える。これら各構成要素は、図示しないバスを介して、相互に信号の入出力が可能なように接続されている。   The person evaluation server 10 includes a dictionary construction unit 10a (corresponding to dictionary construction means) and a person unit evaluation unit 10b (corresponding to evaluation means). Further, the dictionary construction unit 10a includes a data classification unit 11 (corresponding to the data classification unit), a data analysis unit 12 (corresponding to the data analysis unit), a score calculation unit 13 (corresponding to the score calculation unit), and a feature word extraction. A unit 14 (corresponding to feature word extraction means) and a dictionary database 15 are provided. The human unit evaluation unit 10b includes an inner product value calculation unit 16 (corresponding to an inner product value calculation unit), an article classification unit 17, an article database 18, a user database 19, and an evaluation value calculation unit 110 (corresponding to an evaluation value calculation unit). ) And an evaluation value output unit 111. These components are connected to each other through a bus (not shown) so that signals can be input and output.

データ分類部11は、肯定、否定、無しの三種類の評価内容ごとに学習用データを分類する。
データ解析部12は、分類された学習用データを形態素解析により単語に分解する。
The data classification unit 11 classifies the learning data for each of the three types of evaluation contents: affirmation, denial, and none.
The data analysis unit 12 decomposes the classified learning data into words by morphological analysis.

スコア算出部13は、分解の結果得られた単語に対して、その出現頻度が高いほどスコアが高くなるように、スコアを付与する。
特徴語抽出部14は、付与された各単語のスコアに基づいて、上記評価内容ごとに分類された学習用データから、記事の評価内容を決定するために特徴的な単語(特徴語)を抽出する。
The score calculation unit 13 assigns a score to the word obtained as a result of the decomposition so that the higher the appearance frequency, the higher the score.
The feature word extraction unit 14 extracts a characteristic word (feature word) for determining the evaluation content of the article from the learning data classified for each evaluation content based on the score of each given word. To do.

辞書データベース15は、図2に示すように、評価尺度ごとに構築される。さらに、各評価尺度の辞書には、三種類の評価内容ごとに、特徴語と評価値とが対応付けて格納される。例えば、評価尺度として「共通因子」が設定された辞書151において、評価内容が「肯定」の特徴語“a”にはスコア“5.28”が付与され、同じく特徴語“b”にはスコア“2.24”が付与されている。また、評価尺度として「自己認識因子」が設定された辞書152において、評価内容が「否定」の特徴語“i”にはスコア“2.30”が付与され、同じく特徴語“j”にはスコア“3.71”が付与される。   The dictionary database 15 is constructed for each evaluation scale as shown in FIG. Further, the feature word and the evaluation value are stored in the dictionary of each evaluation scale in association with each of the three types of evaluation contents. For example, in the dictionary 151 in which “common factor” is set as the evaluation scale, the score “5.28” is assigned to the feature word “a” whose evaluation content is “Yes”, and the score is also assigned to the feature word “b”. “2.24” is assigned. In addition, in the dictionary 152 in which “self-recognition factor” is set as the evaluation scale, the score “2.30” is assigned to the feature word “i” whose evaluation content is “No”, and the feature word “j” is also assigned to the feature word “j”. Score “3.71” is given.

内積値算出部16は、辞書データベース15に登録されている特徴語の特徴ベクトルと、評価対象のデータの特徴ベクトルとの内積値を、評価内容ごとに基礎値として算出する。
記事分類部17は、記事に付されたユーザIDを基に、評価対象となる全ての記事をユーザIDごとに分類する。
The inner product value calculation unit 16 calculates the inner product value of the feature vector of the feature word registered in the dictionary database 15 and the feature vector of the data to be evaluated as a basic value for each evaluation content.
The article classification unit 17 classifies all articles to be evaluated for each user ID based on the user ID attached to the article.

記事データベース18には、図3に示すように、記事単位の内積値が、評価内容ごとに格納される。例えば、記事ID“a−29”を有する記事に関して、その記事を投稿したユーザのIDとして“ogata”が格納され、その記事の内容として“今日は○○に行きました。…”なる文字列が格納される。さらに、これらの情報に関連付けられて、内積値算出部16によって算出された三種類の内積値、すなわち、肯定の内積値である“5.28”、否定の内積値である“3.26”、無しの内積値である“0.89”がそれぞれ格納される。また、記事データベース18には、ある評価内容の内積値(例えば、肯定の内積値“5.28”)と、別の評価内容の内積値(例えば、否定の“3.26”)との差分値(例えば、2.02)が格納されている。   In the article database 18, as shown in FIG. 3, the inner product value in units of articles is stored for each evaluation content. For example, for an article having the article ID “a-29”, “ogata” is stored as the ID of the user who posted the article, and the content of the article “Today went to ○○…” Is stored. Further, three types of inner product values calculated by the inner product value calculation unit 16 in association with these pieces of information, that is, “5.28” which is a positive inner product value and “3.26” which is a negative inner product value. , “0.89”, which is the inner product value without, is stored. The article database 18 also includes a difference between an inner product value of a certain evaluation content (eg, positive inner product value “5.28”) and an inner product value of another evaluation content (eg, negative “3.26”). A value (for example, 2.02) is stored.

ユーザデータベース19におけるデータ格納例を図4に示す。ユーザデータベース19には、評価尺度ごとに算出された評価値が、ユーザID単位で格納される。本実施の形態では、上述のように、評価尺度として“共感因子”と“自己認識因子”を想定し、評価内容として“肯定”、“否定”、“無し”を想定する。例えば、ユーザIDが“ogata”の人物に対する評価値としては、評価尺度に“共感因子”を用いた場合には“3.29”、“自己認識因子”を用いた場合には“0.98”の数値がそれぞれ格納されることになる。   An example of data storage in the user database 19 is shown in FIG. The user database 19 stores evaluation values calculated for each evaluation scale in units of user IDs. In the present embodiment, as described above, “sympathy factor” and “self-recognition factor” are assumed as evaluation scales, and “affirmation”, “denial”, and “none” are assumed as evaluation contents. For example, as an evaluation value for a person whose user ID is “ogata”, “3.29” is used when the “sympathy factor” is used as the evaluation scale, and “0.98” is used when the “self-recognition factor” is used. "" Is stored.

評価値算出部110は、複数のユーザIDと算出された基礎値とを用いて、ユーザごとの評価値を算出する。評価値算出処理の詳細に関しては、動作説明において後述するが、記事内容から人単位の評価を行うには、統一された評価尺度により規準を統一させることが有効である。評価尺度の統一には、EQ(Emotional Intelligence Quotient)モデルを採用することができる。EQは、心内知性(自己認識、ストレス共生、気力創出など)、対人関係知性(自己表現、アサーション、対人関係など)、状況判断知性(対人受容、共感など)を始めとする8つの因子から構成され、個人の総合的な能力に関する指標となる。EQを構成する因子の中から、例えば、共感因子、自己認識因子などを評価尺度として選定することで、基準の統一された人評価を実現する。
評価モデルとしては、EQ以外にも「5因子モデル(参考文献:性格の心理 −ビッグファイブと臨床からみたパーソナリティ− 丹野義彦 2003年4月初版発行、サイエンス社)」を採用することができる。
The evaluation value calculation unit 110 calculates an evaluation value for each user using a plurality of user IDs and the calculated basic value. The details of the evaluation value calculation processing will be described later in the explanation of the operation, but it is effective to unify the criteria by a unified evaluation scale in order to perform the evaluation for each person from the article content. An EQ (Emotional Intelligence Quotient) model can be adopted to unify the evaluation scale. EQ is based on 8 factors including intra-intelligence (self-recognition, stress coexistence, energy creation, etc.), interpersonal intelligence (self-expression, assertion, interpersonal relationship, etc.), and situation judgment intelligence (interpersonal acceptance, empathy, etc.). Constructed and an indicator of the individual's overall ability. By selecting, for example, a sympathetic factor, a self-recognition factor, or the like as an evaluation scale from factors constituting the EQ, a human evaluation with a standardized standard is realized.
As an evaluation model, besides the EQ, a “five factor model (reference: personality psychology—personality from the perspective of Big Five and clinical practice—Yoshihiko Tanno, first published in April 2003, Science Inc.)” can be adopted.

評価値出力部111は、評価値算出部110により算出された評価値をユーザIDとともに、ネットワークN及び基地局Bを介して、提示要求のあった携帯端末宛に送信する。評価値を受信した携帯端末のユーザは、提示された評価値をユーザIDとともに参照することで、そのユーザに対する人物評価を知る。   The evaluation value output unit 111 transmits the evaluation value calculated by the evaluation value calculation unit 110 together with the user ID to the mobile terminal that has made the presentation request via the network N and the base station B. The user of the portable terminal that has received the evaluation value refers to the presented evaluation value together with the user ID to know the person evaluation for the user.

続いて、フローチャートを参照しながら、本実施の形態における人物評価システム1の動作を説明し、併せて、本発明に係る人物評価方法を構成する各ステップについて説明する。
まず、図5のフローチャートを参照しながら、辞書を構築する処理を説明する。この辞書は、人単位の評価に際して特徴度合いを数値化するために参照される。
S1では、事前準備として、複数の記事から成る学習用データを評価内容ごとに3つのデータに分類する。この分類は、複数人が目視によって行う。例えば、学習用データを構成する各記事の本文の内容について、複数人中、三分の二以上が評価内容“有り”と判断した場合には、その記事は「肯定」に分類される。反対に、複数人中、三分の二以上が評価内容“無し”と判断した場合には、その記事は「否定」に分類される。それ以外の判断が為された記事に関しては、「無し」に分類される。
Subsequently, the operation of the person evaluation system 1 according to the present embodiment will be described with reference to a flowchart, and each step constituting the person evaluation method according to the present invention will be described.
First, the process of constructing a dictionary will be described with reference to the flowchart of FIG. This dictionary is referred to in order to quantify the characteristic degree in the evaluation for each person.
In S1, as pre-preparation, learning data composed of a plurality of articles is classified into three data for each evaluation content. This classification is performed visually by multiple persons. For example, regarding the content of the text of each article constituting the learning data, if more than two-thirds of a plurality of persons determine that the evaluation content is “present”, the article is classified as “affirmed”. On the other hand, if more than two-thirds of the plurality of people judge that the evaluation content is “none”, the article is classified as “negative”. Articles for which other judgments have been made are classified as “none”.

各人の判断ミスを極力減らすために、上記判断は、以下の観点から行われることが望ましい。
・発言相手の意図や状況を正確に汲み取っていることが本文から読み取れること
・上記を踏まえて、相手の立場にたった発言が行われていること
In order to reduce each person's judgment error as much as possible, it is desirable to make the above judgment from the following viewpoints.
・ It can be read from the main text that the intention and the situation of the other party are accurately picked up ・ The person who is speaking in the position of the other party based on the above

S2では、S1にて「肯定」に分類された記事中の本文に相当するテキストデータに対して、形態素解析が施される。形態素解析は、周知慣用の自然言語処理技術の一つであるので、その詳細な説明及び図示は省略するが、S2では、自然言語で書かれた文章を形態素(本実施の形態では、単語)の列に分割し、その品詞を見分ける作業が行われる。形態素解析の結果、本文から、品詞分解された単語が抽出される。
形態素解析は、「否定」、「無し」に分類された記事に関しても同様に実行され、その結果、評価内容ごとに分類された全ての記事に関して、単語が抽出される。
In S2, morphological analysis is performed on the text data corresponding to the body text in the article classified as “Yes” in S1. Since morphological analysis is one of well-known and commonly used natural language processing techniques, detailed description and illustration thereof will be omitted, but in S2, sentences written in natural language are converted into morphemes (in this embodiment, words). The work is done to divide the line into parts and identify the part of speech. As a result of the morphological analysis, a part-of-speech decomposed word is extracted from the text.
The morphological analysis is similarly executed for articles classified as “Negative” and “None”, and as a result, words are extracted for all articles classified for each evaluation content.

S3では、S2で抽出された各単語を対象として、その出現頻度を基に、出現のし易さを数値化(スコア算出)する。この処理は、評価内容ごとに分類された全ての記事、すなわち「肯定」、「否定」、「無し」の各データに関して同様に行われる。単語に付与されるスコアの差は、特徴語を含むデータの評価内容を判定する基準となる。したがって、特徴語の抽出を容易にするためには、単語のスコアは、上記分類ごとに差異が生じ易く、かつ、特徴的な単語には高いスコアが付与され、特徴的でない単語には低いスコアが付与されることが望ましい。   In S3, the ease of appearance is quantified (score calculation) based on the appearance frequency for each word extracted in S2. This process is similarly performed for all articles classified by evaluation contents, that is, data of “affirmation”, “denial”, and “none”. The difference in the scores given to the words serves as a reference for determining the evaluation contents of the data including the feature words. Therefore, in order to facilitate the extraction of feature words, the score of the word is likely to be different for each classification, and a high score is assigned to a characteristic word, and a low score is given to a non-character word. Is desirable.

上述の観点から、スコア付けの手法として、tfidf法を用いることが好適である。分類k(肯定、否定、無し)における単語iの総出現回数をwikとすると、分類kにおける単語iの出現頻度tfikは、分類kにおける総特徴語数を用いて、下記数式(1)のように表すことができる。

Figure 2006190196
また、学習用データの記事総数をM、単語iを含む記事の数をViとすると、全記事からみた単語iの重要度は、下記数式(2)のように表すことができる。
Figure 2006190196
その結果、下記数式(3)を得る。
Figure 2006190196
From the above viewpoint, it is preferable to use the tfidf method as a scoring method. Assuming that the total number of occurrences of the word i in the category k (affirmation, negation, none) is wik, the appearance frequency tfik of the word i in the category k is expressed by the following equation (1) using the total number of feature words in the category k. Can be represented.
Figure 2006190196
Further, when the total number of articles in the learning data is M and the number of articles including the word i is Vi, the importance of the word i viewed from all the articles can be expressed as the following formula (2).
Figure 2006190196
As a result, the following mathematical formula (3) is obtained.
Figure 2006190196

S4では、S3で算出された各単語のスコアに基づいて、評価内容ごとに分類された3つのデータから特徴語が抽出される。特徴語の抽出は、例えば以下の観点から行うことができる。
1.idfi値(idf値に対応)が所定の閾値以上の単語を特徴語として抽出する。
2.全データ中における出現総数が所定回数以上の単語を特徴語として抽出する。
3.評価尺度として意味のない記号(「」、()、・、など)は、特徴語から除外する。
In S4, based on the score of each word calculated in S3, feature words are extracted from the three data classified for each evaluation content. The feature word can be extracted from the following viewpoints, for example.
1. A word having an idfi value (corresponding to the idf value) equal to or greater than a predetermined threshold is extracted as a feature word.
2. Words whose total number of appearances in all data is a predetermined number or more are extracted as feature words.
3. Symbols that have no meaning as an evaluation scale (“”, (),..., Etc.) are excluded from feature words.

従来のテキストマイニングでは、文章の主題との関連性の高い品詞(名詞や動詞)のみを抽出対象の特徴語として扱うため、構築された辞書には、その他の品詞が必ずしも記録されなかった。しかし、本実施の形態は、インターネットコミュニティのユーザの内面的な特徴を判断することを目的としているため、名詞や動詞以外の品詞に関しても抽出の対象とする。
S2で抽出された単語の中には、評価内容の判定に必要のない、若しくは判定に悪影響を及ぼす単語も含まれているが、上述の処理を施すことで、単語の篩い分けが為される。そして、S4で抽出された特徴語とそのスコアがデータベースに格納されることにより、辞書が構築される(S5)。
In conventional text mining, only parts of speech (nouns and verbs) that are highly relevant to the subject of a sentence are treated as feature words to be extracted, so other parts of speech are not necessarily recorded in the constructed dictionary. However, since this embodiment is intended to determine the internal characteristics of users in the Internet community, parts of speech other than nouns and verbs are also extracted.
The words extracted in S2 include words that are not necessary for determining the evaluation contents or that have an adverse effect on the determination. However, the above processing is performed to screen the words. . Then, the feature word extracted in S4 and its score are stored in the database, thereby constructing a dictionary (S5).

続いて、図6のフローチャートを参照しながら、構築された辞書を用いての人単位での評価処理を説明する。
評価処理の前提として、まず、評価対象のデータに対して、当該データの評価内容が「肯定」、「否定」、「無し」の何れであるかの判定が行われる。次いで、上記判定された評価内容の辞書を参照して、評価対象データに含まれる特徴語を数値化(スコアリング)する。特徴語の数値化は、内積値を用いて記事毎に行われる。すなわち、辞書に登録されている特徴語の特徴ベクトル(上記のtfidfik)と、評価される記事の特徴ベクトル(上記のtfik)との内積値を算出することにより、辞書と記事との類似度を推定し、数値化する。数値化は、各記事に関して、評価内容の異なる三種類の辞書を用いて行われる。
Next, an evaluation process for each person using the constructed dictionary will be described with reference to the flowchart of FIG.
As a premise of the evaluation process, first, for the data to be evaluated, it is determined whether the evaluation content of the data is “Yes”, “No”, or “None”. Next, the characteristic words included in the evaluation target data are digitized (scored) with reference to the dictionary of the determined evaluation contents. The digitization of feature words is performed for each article using the inner product value. That is, by calculating the inner product value of the feature vector of the feature word (above tfidfik) registered in the dictionary and the feature vector of the article to be evaluated (above tfik), the similarity between the dictionary and the article can be calculated. Estimate and digitize. Digitization is performed using three types of dictionaries with different evaluation contents for each article.

S11では、「肯定」の辞書と記事との内積値と、「否定」の辞書と記事との内積値と、「無し」の辞書と記事との内積値とをそれぞれ算出する。これらの内積値は、対応する評価内容の基礎値として、評価値の算出に使用される。再び図3を参照すると、本実施の形態では、ID“a−29”を有する記事に関して、評価内容毎の内積値は、それぞれ“5.28”、“3.26”、“0.89”であるので、基礎値(後述のyik)はこれらの値となる。   In S11, an inner product value between the “affirmation” dictionary and the article, an inner product value between the “no” dictionary and the article, and an inner product value between the “none” dictionary and the article are calculated. These inner product values are used for calculation of evaluation values as basic values of the corresponding evaluation contents. Referring to FIG. 3 again, in the present embodiment, for the article having ID “a-29”, the inner product values for each evaluation content are “5.28”, “3.26”, and “0.89”, respectively. Therefore, the basic values (yik described later) are these values.

但し、三種類の内積値のうち、特に一種類の内積値のみを代表的に基礎値として用いることもできる。すなわち、各評価内容の辞書と記事との内積値のうち、最大の値を有する評価内容の内積値を、基礎値として採用することもできる。例えばID“a−29”を有する記事に関して、評価内容毎の内積値は、前述のように、それぞれ“5.28”、“3.26”、“0.89”である。したがって、最大値である「肯定」の内積値“5.28”が、ユーザ“ogata”の基礎値の一つとして使用される。なお、この場合、ユーザに提示される評価値(後述のHk)も、肯定に関するもの一種類になる。   However, among the three types of inner product values, only one type of inner product value can be representatively used as a basic value. That is, the inner product value of the evaluation content having the maximum value among the inner product values of the dictionary of each evaluation content and the article can be adopted as the basic value. For example, for an article having ID “a-29”, the inner product values for each evaluation content are “5.28”, “3.26”, and “0.89”, respectively, as described above. Therefore, the inner product value “5.28” of “affirmation” that is the maximum value is used as one of the basic values of the user “ogata”. In this case, an evaluation value (Hk to be described later) presented to the user is also one type regarding affirmation.

続いて、データ単位での数値化結果から、ユーザIDを基にした人単位での集計を行うために、評価対象となる全ての記事をユーザID毎に分類する処理が実行される(S12)。
S13では、人物評価サーバ10は、評価値算出部110により、同一のユーザIDを有する記事の基礎値を、所定の評価式に当てはめて、人単位の評価値を算出する。評価値の算出に際しては、投稿記事総数に占める、評価内容ごとの記事数の割合を係数として評価し、その値を評価式に組み込むものとしてもよい。
Subsequently, a process for classifying all articles to be evaluated for each user ID is performed in order to perform a tabulation based on a user ID from a numerical result in a data unit (S12). .
In S13, the person evaluation server 10 uses the evaluation value calculation unit 110 to apply the basic value of articles having the same user ID to a predetermined evaluation formula, and calculates an evaluation value for each person. In calculating the evaluation value, the ratio of the number of articles for each evaluation content in the total number of posted articles may be evaluated as a coefficient, and the value may be incorporated into the evaluation formula.

この場合、評価値Hkは、yik、Nk、Akを用いて、下記評価式(4)から算定される。

Figure 2006190196
ここで、yikは、人物kの記事iにおける基礎値(本第1の実施形態では、内積値そのもの)である。また、Nkは、人物kの発信した、ある評価内容の記事数(例えば、“肯定”の評価内容を得た記事数)であり、Akは人物kの発信した記事総数である。 In this case, the evaluation value Hk is calculated from the following evaluation formula (4) using yik, Nk, and Ak.
Figure 2006190196
Here, yik is a basic value in the article i of the person k (inner product value itself in the first embodiment). Further, Nk is the number of articles with a certain evaluation content (for example, the number of articles having an evaluation content of “Yes”) transmitted by the person k, and Ak is the total number of articles transmitted by the person k.

S14で得られた評価値Hkは、要求に応じて、対応するユーザIDとともに、インターネットコミュニティを利用する各ユーザの端末に表示される(S15)。評価値が表示される端末は、例えば、携帯端末20,30,40である。   The evaluation value Hk obtained in S14 is displayed on the terminal of each user who uses the Internet community together with the corresponding user ID in response to the request (S15). The terminals on which the evaluation values are displayed are, for example, portable terminals 20, 30, and 40.

以上説明したように、第1の実施形態の人物評価システム1における、統一された評価尺度を用いて構築された辞書を参照した評価値の算出は、公平で信頼性の高い人物評価に寄与する。また、評価内容に応じた内積値を用いたユーザIDごとの評価値の算出は、記事単位のみならず、人単位での評価に寄与する。したがって、人物評価システム1が適用されたインターネットコミュニティの利用者は、携帯端末に提示される評価値を参照することで、不特定かつ多数の人と安心して、ネットワーク上のコミュニケーションを図ることができる。   As described above, the calculation of the evaluation value with reference to the dictionary constructed using the unified evaluation scale in the person evaluation system 1 of the first embodiment contributes to a person evaluation that is fair and highly reliable. . Moreover, the calculation of the evaluation value for each user ID using the inner product value corresponding to the evaluation content contributes to the evaluation not only for the article but also for each person. Therefore, a user of the Internet community to which the person evaluation system 1 is applied can communicate with the unspecified and many people with confidence by referring to the evaluation value presented on the mobile terminal. .

(第2の実施の形態)
次に、図7を参照して、本発明の第2の実施形態について説明する。
第1の実施形態では、人単位評価処理の実行に際して、内積値自体を基礎値として用いたが、本実施の形態では、評価内容の異なる記事の内積値の差分を算出する。このため、本実施の形態における人物評価サーバは、図7に示すように、内積値差分算出部112を更に備える。なお、図7において、第2の実施形態における人物評価サーバの構成は、第1の実施形態において詳述した人物評価サーバ1の構成と類似するので、共通する構成要素には同一の符号を付しその説明は省略するとともに、第1の実施形態との差異について詳述する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described with reference to FIG.
In the first embodiment, the inner product value itself is used as a basic value when executing the person-unit evaluation process. However, in the present embodiment, the difference between the inner product values of articles having different evaluation contents is calculated. For this reason, the person evaluation server in the present embodiment further includes an inner product value difference calculation unit 112 as shown in FIG. In FIG. 7, the configuration of the person evaluation server in the second embodiment is similar to the configuration of the person evaluation server 1 described in detail in the first embodiment. The description thereof is omitted, and differences from the first embodiment are described in detail.

詳細な機能に関しては、動作説明において後述するが、特有の構成要素である内積値差分算出部112(内積値差分算出手段に対応)は、内積値算出部16により算出された評価内容ごとの内積値のうち、評価内容が「肯定」の内積値と、評価内容が「否定」の内積値との差分を基礎値として算出する。   Although the detailed function will be described later in the explanation of the operation, the inner product value difference calculating unit 112 (corresponding to the inner product value difference calculating unit) which is a specific component is an inner product for each evaluation content calculated by the inner product value calculating unit 16. Among the values, a difference between an inner product value with an evaluation content of “affirmation” and an inner product value with an evaluation content of “no” is calculated as a basic value.

続いて、図8を参照して、第2の実施形態における人単位評価処理について説明する。併せて、本発明に係る人物評価方法を構成する各ステップについて説明する。なお、本人単位評価処理は、第1の実施形態において詳述した人単位評価処理(図6参照)と基本的に同様である。具体的には、図8のS21,S23〜S25は、図6に示したS11,S12〜S14に相当する。   Next, a person unit evaluation process in the second embodiment will be described with reference to FIG. In addition, each step constituting the person evaluation method according to the present invention will be described. The personal unit evaluation process is basically the same as the personal unit evaluation process (see FIG. 6) described in detail in the first embodiment. Specifically, S21 and S23 to S25 in FIG. 8 correspond to S11 and S12 to S14 shown in FIG.

以下、図8のフローチャートを参照し、各人単位評価処理の差異であるS22について説明する。すなわち、S22では、内積値差分算出部112により、「肯定」の辞書に登録されている特徴語の特徴ベクトルと評価対象の記事の特徴ベクトルとの内積値と、「否定」の辞書に登録されている特徴語の特徴ベクトルと上記記事の特徴ベクトルとの内積値と、の差分が基礎値として算出される。なお、「否定」の辞書の代わりに、「無し」の辞書と記事との内積値を使用してもよい。
その後、評価値算出部110は、S22で算出された基礎値を上記評価式(4)のyikに代入し、以下、第1の実施形態と同様の手法で、評価値の算出を行う。
Hereinafter, with reference to the flowchart of FIG. 8, S22 which is the difference of each person evaluation process is demonstrated. That is, in S22, the inner product value difference calculation unit 112 registers the inner product value of the feature vector of the feature word registered in the “affirmation” dictionary and the feature vector of the article to be evaluated, and the “no” dictionary. The difference between the inner product value of the feature vector of the feature word and the feature vector of the article is calculated as a basic value. Instead of the “negative” dictionary, an inner product value between the “none” dictionary and the article may be used.
Thereafter, the evaluation value calculation unit 110 substitutes the basic value calculated in S22 into yik in the evaluation formula (4), and thereafter calculates the evaluation value by the same method as in the first embodiment.

以上説明したように、第2の実施形態における人物評価システム1によれば、内積値を用いて、肯定の辞書と評価対象記事との類似度を推定した上で、それらの差分が反映された評価値を携帯端末20,30,40のユーザに提示することができる。この評価値は、肯定の評価内容を基準とした評価値であり、提示される評価値はこの一種類であるので、ユーザは、この評価値を参考にして、評価対象の人物の評価を簡易迅速に把握することができる。   As described above, according to the person evaluation system 1 in the second embodiment, the inner product value is used to estimate the similarity between the positive dictionary and the article to be evaluated, and the difference between them is reflected. The evaluation value can be presented to the user of the mobile terminal 20, 30, 40. This evaluation value is an evaluation value based on a positive evaluation content, and the evaluation value to be presented is this one type. Therefore, the user can easily evaluate the person to be evaluated with reference to this evaluation value. It is possible to grasp quickly.

なお、上記各実施の形態に記載の態様は、本発明に係る人物評価装置の好適な一例であり、本発明は、かかる態様に限定されるものではない。
例えば、上記実施の形態では、辞書構築機能を有するサーバ装置と人単位評価機能を有するサーバ装置とを、一体の装置として記載及び図示したが、これらの機能は、二以上のサーバ装置に分散させてもよく、システムを構成する装置の物理的構成や運用態様は任意である。
また、携帯端末は、例えば、携帯電話であるが、これに限らず、PDA(Personal Digital Assistants)やPC(Personal Computer)であってもよい。
In addition, the aspect described in each said embodiment is a suitable example of the person evaluation apparatus which concerns on this invention, and this invention is not limited to this aspect.
For example, in the above embodiment, the server device having the dictionary construction function and the server device having the human unit evaluation function are described and illustrated as an integrated device, but these functions are distributed to two or more server devices. The physical configuration and operation mode of the devices constituting the system may be arbitrary.
The mobile terminal is, for example, a mobile phone, but is not limited thereto, and may be a PDA (Personal Digital Assistants) or a PC (Personal Computer).

第1の実施形態における人物評価システムの機能的構成を示す図である。It is a figure which shows the functional structure of the person evaluation system in 1st Embodiment. 辞書データベースにおけるデータ格納例を示す図である。It is a figure which shows the example of data storage in a dictionary database. 記事データベースにおけるデータ格納例を示す図である。It is a figure which shows the example of data storage in an article database. ユーザデータベースにおけるデータ格納例を示す図である。It is a figure which shows the example of data storage in a user database. 第1の実施形態における辞書構築処理を説明するためのフローチャートである。It is a flowchart for demonstrating the dictionary construction process in 1st Embodiment. 第1の実施形態における人単位評価処理を説明するためのフローチャートである。It is a flowchart for demonstrating the person unit evaluation process in 1st Embodiment. 第2の実施形態における人物評価システムの機能的構成を示す図である。It is a figure which shows the functional structure of the person evaluation system in 2nd Embodiment. 第2の実施形態における人単位評価処理を説明するためのフローチャートである。It is a flowchart for demonstrating the person unit evaluation process in 2nd Embodiment.

符号の説明Explanation of symbols

1,2…人物評価システム、10…人物評価サーバ、10a…辞書構築ユニット、10b…人単位評価ユニット、11…データ分類部、12…データ解析部、13…スコア算出部、14…特徴語抽出部、15…辞書データベース、16…内積値算出部、17…記事分類部、18…記事データベース、19…ユーザデータベース、110…評価値算出部、111…評価値出力部、112…内積値差分算出部、B…基地局、N…ネットワーク、20,30,40…携帯端末   DESCRIPTION OF SYMBOLS 1, 2 ... Person evaluation system, 10 ... Person evaluation server, 10a ... Dictionary construction unit, 10b ... Person unit evaluation unit, 11 ... Data classification part, 12 ... Data analysis part, 13 ... Score calculation part, 14 ... Feature word extraction , 15 ... Dictionary database, 16 ... Inner product value calculation unit, 17 ... Article classification unit, 18 ... Article database, 19 ... User database, 110 ... Evaluation value calculation unit, 111 ... Evaluation value output unit, 112 ... Inner product value difference calculation Part, B ... base station, N ... network, 20, 30, 40 ... mobile terminal

Claims (10)

統一された評価尺度に準じた評価内容ごとに、学習用データに含まれる特徴語と、該特徴語に対するスコアとが対応付けられた辞書を構築する辞書構築手段と、
前記学習用データを構成する、複数ユーザのデータと、前記辞書とを参照することにより、前記複数ユーザの識別情報と基礎値とに基づくユーザ単位の評価を行う評価手段と
を備えることを特徴とする人物評価装置。
A dictionary construction means for constructing a dictionary in which a feature word included in the learning data and a score for the feature word are associated for each evaluation content according to a unified evaluation scale;
An evaluation means for evaluating each user based on identification information and basic values of the plurality of users by referring to the data of the plurality of users constituting the learning data and the dictionary; Person evaluation device.
前記辞書構築手段は、
前記学習用データを、前記評価内容ごとに分類するデータ分類手段と、
前記データ分類手段により分類された前記学習用データを単語に分解するデータ解析手段と、
前記データ解析手段による分解の結果得られた単語に対して、その出現頻度に応じたスコアを付与するスコア算出手段と、
前記スコア算出手段により付与された各単語のスコアに基づいて、前記評価内容ごとに分類された前記学習用データから、特徴語を抽出する特徴語抽出手段と
を備えることを特徴とする請求項1に記載の人物評価装置。
The dictionary construction means includes
Data classification means for classifying the learning data for each evaluation content;
Data analysis means for decomposing the learning data classified by the data classification means into words;
Score calculation means for assigning a score corresponding to the appearance frequency to a word obtained as a result of decomposition by the data analysis means;
2. A feature word extraction unit that extracts a feature word from the learning data classified for each evaluation content based on the score of each word given by the score calculation unit. The person evaluation device described in 1.
前記特徴語抽出手段は、前記スコア算出手段によりスコアの付された単語のうち、idf値が閾値以上の単語を特徴語として抽出することを特徴とする請求項2に記載の人物評価装置。   3. The person evaluation device according to claim 2, wherein the feature word extraction unit extracts, as a feature word, a word having an idf value equal to or greater than a threshold among the words given a score by the score calculation unit. 前記特徴語抽出手段は、前記スコア算出手段によりスコアの付された単語のうち、前記学習用データ中における出現総数が閾値以上の単語を特徴語として抽出することを特徴とする請求項2に記載の人物評価装置。   3. The feature word extraction unit extracts, as a feature word, a word whose total number of appearances in the learning data is greater than or equal to a threshold among the words scored by the score calculation unit. Person evaluation device. 前記特徴語抽出手段は、特徴語として抽出された単語の中から、評価値の算出に際して不要な記号を特徴語から除外することを特徴とする請求項2に記載の人物評価装置。   3. The person evaluation device according to claim 2, wherein the feature word extraction unit excludes, from the feature words, unnecessary symbols for calculating an evaluation value from words extracted as feature words. 前記評価手段は、
前記辞書に登録された特徴語の特徴ベクトルと、評価対象のデータの特徴ベクトルとの内積値を、評価内容ごとに基礎値として算出する内積値算出手段と、
前記複数ユーザの識別情報と算出された前記基礎値とを用いて、ユーザごとの評価値を算出する評価値算出手段と
を備えることを特徴とする請求項1に記載の人物評価装置。
The evaluation means includes
Inner product value calculating means for calculating the inner product value of the feature vector of the feature word registered in the dictionary and the feature vector of the data to be evaluated as a basic value for each evaluation content;
The person evaluation apparatus according to claim 1, further comprising: an evaluation value calculation unit that calculates an evaluation value for each user using the identification information of the plurality of users and the calculated basic value.
前記内積値算出手段により算出された評価内容ごとの内積値から、一の評価内容の内積値と他の評価内容の内積値との差分を基礎値として算出する内積値差分算出手段を更に備えることを特徴とする請求項6に記載の人物評価装置。   It further comprises an inner product value difference calculating means for calculating a difference between an inner product value of one evaluation content and an inner product value of another evaluation content as a basic value from the inner product value for each evaluation content calculated by the inner product value calculating means. The person evaluation device according to claim 6. 前記評価値算出手段は、評価対象のユーザ及びデータに対応する前記基礎値の総和を用いて、前記評価値を算出することを特徴とする請求項6または7に記載の人物評価装置。   The person evaluation apparatus according to claim 6, wherein the evaluation value calculation unit calculates the evaluation value by using a sum of the basic values corresponding to a user to be evaluated and data. 前記評価値算出手段は、評価対象のユーザ及びデータに対応する前記基礎値の総和に、前記ユーザに対応する評価内容ごとのデータ数を乗算し、前記ユーザに対応するデータ総数を除すことにより、前記評価値を算出することを特徴とする請求項6または7に記載の人物評価装置。   The evaluation value calculation means multiplies the sum of the basic values corresponding to the user and data to be evaluated by the number of data for each evaluation content corresponding to the user, and divides the total number of data corresponding to the user The person evaluation device according to claim 6, wherein the evaluation value is calculated. 学習用データに含まれる特徴語と、該特徴語に対するスコアとを対応付けて、統一された評価尺度に準じた評価内容ごとに辞書を構築するステップと、
前記学習用データを構成する、複数ユーザのデータと、構築された前記辞書とを参照することにより、前記複数ユーザの識別情報と基礎値とに基づくユーザ単位の評価を行うステップと
を含むことを特徴とする人物評価方法。
Associating a feature word included in the learning data with a score for the feature word and constructing a dictionary for each evaluation content according to a unified evaluation scale;
Performing evaluation in units of users based on the identification information and basic values of the plurality of users by referring to the data of the plurality of users constituting the learning data and the constructed dictionary. Character evaluation method.
JP2005003000A 2005-01-07 2005-01-07 Device and method for evaluating person Pending JP2006190196A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005003000A JP2006190196A (en) 2005-01-07 2005-01-07 Device and method for evaluating person

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005003000A JP2006190196A (en) 2005-01-07 2005-01-07 Device and method for evaluating person

Publications (1)

Publication Number Publication Date
JP2006190196A true JP2006190196A (en) 2006-07-20

Family

ID=36797330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005003000A Pending JP2006190196A (en) 2005-01-07 2005-01-07 Device and method for evaluating person

Country Status (1)

Country Link
JP (1) JP2006190196A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013536468A (en) * 2010-08-20 2013-09-19 ヒ ユン,ヒョク Language learning system and control method thereof
CN103353924A (en) * 2013-06-28 2013-10-16 国家电网公司 Power-grid-based evaluation method for safety and stability of time sequence construction
CN107430824A (en) * 2015-02-06 2017-12-01 意识教育以色列公司 For evaluating the automanual system and method for response

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120183A (en) * 1997-10-08 1999-04-30 Ntt Data Corp Method and device for extracting keyword
JP2003248681A (en) * 2001-11-20 2003-09-05 Just Syst Corp Information processor, processing method, and program
JP2003316925A (en) * 2002-04-23 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> Information reliability evaluating device and information ranking system
JP2004258723A (en) * 2003-02-24 2004-09-16 Nippon Telegr & Teleph Corp <Ntt> Topic extraction device, topic extraction method and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120183A (en) * 1997-10-08 1999-04-30 Ntt Data Corp Method and device for extracting keyword
JP2003248681A (en) * 2001-11-20 2003-09-05 Just Syst Corp Information processor, processing method, and program
JP2003316925A (en) * 2002-04-23 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> Information reliability evaluating device and information ranking system
JP2004258723A (en) * 2003-02-24 2004-09-16 Nippon Telegr & Teleph Corp <Ntt> Topic extraction device, topic extraction method and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013536468A (en) * 2010-08-20 2013-09-19 ヒ ユン,ヒョク Language learning system and control method thereof
CN103353924A (en) * 2013-06-28 2013-10-16 国家电网公司 Power-grid-based evaluation method for safety and stability of time sequence construction
CN107430824A (en) * 2015-02-06 2017-12-01 意识教育以色列公司 For evaluating the automanual system and method for response
JP2018510438A (en) * 2015-02-06 2018-04-12 センス エデュケーション イスラエル リミテッド Semi-automatic system and method for response assessment
CN107430824B (en) * 2015-02-06 2021-05-04 意识教育以色列公司 Semi-automatic system and method for evaluating responses

Similar Documents

Publication Publication Date Title
Boyd et al. Did Shakespeare write Double Falsehood? Identifying individuals by creating psychological signatures with text analysis
Malheiro et al. Emotionally-relevant features for classification and regression of music lyrics
El-Beltagy et al. KP-Miner: A keyphrase extraction system for English and Arabic documents
JP5825676B2 (en) Non-factoid question answering system and computer program
US20160171095A1 (en) Identifying and Displaying Relationships Between Candidate Answers
US7783476B2 (en) Word extraction method and system for use in word-breaking using statistical information
US9230035B2 (en) Pushing specific content to a predetermined webpage
Ramiandrisoa et al. IRIT at e-Risk 2018
Gil et al. Combining machine learning techniques and natural language processing to infer emotions using Spanish Twitter corpus
Sciandra COVID-19 outbreak through Tweeters’ words: Monitoring Italian social media communication about COVID-19 with text mining and word embeddings
Skaik et al. Suicide ideation estimators within Canadian provinces using machine learning tools on social media text
CN113571196A (en) Method and device for constructing medical training sample and method for retrieving medical text
JP2006190196A (en) Device and method for evaluating person
Kumamoto et al. Proposal of impression mining from news articles
JP4525433B2 (en) Document aggregation device and program
CN105787101B (en) A kind of information processing method and electronic equipment
Mercado et al. Political alignment identification: a study with documents of Argentinian journalists
Pandey et al. Exploring Automated Q&A Support System for Maternal and Child Health in Rural India
Su et al. Health care spoken dialogue system for diagnostic reasoning and medical product recommendation
JP5614687B2 (en) Information analysis device for analyzing time-series text data including time-series information and text information
JP4326713B2 (en) News topic analysis device
JP6043460B2 (en) Data analysis system, data analysis method, and data analysis program
Li et al. Twitter sentiment analysis of the 2016 US Presidential Election using an emoji training heuristic
Toews et al. Determining Domain-Specific Differences of Polysemous Words Using Context Information.
KR101712507B1 (en) Smart delivery system and method using wearable device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100713