JP2008097286A - Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program - Google Patents
Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program Download PDFInfo
- Publication number
- JP2008097286A JP2008097286A JP2006277866A JP2006277866A JP2008097286A JP 2008097286 A JP2008097286 A JP 2008097286A JP 2006277866 A JP2006277866 A JP 2006277866A JP 2006277866 A JP2006277866 A JP 2006277866A JP 2008097286 A JP2008097286 A JP 2008097286A
- Authority
- JP
- Japan
- Prior art keywords
- opinion
- sentence
- index
- likeness
- related expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、意見が記述されている複数の電子化された文から、意見文を出力する意見文検索装置、意見文検索方法および意見文検索プログラム並びにそのプログラムを記録した記録媒体に関する。 The present invention relates to an opinion sentence search device, an opinion sentence search method and an opinion sentence search program that output an opinion sentence from a plurality of electronic sentences in which opinions are described, and a recording medium on which the program is recorded.
インターネットやアンケート調査等に存在する自然言語で意見が含まれている文書から、意見情報を検索する方法が知られている。例えば、下記特許文献1では、意見対象を限ったアンケート(例えば、道路行政に関するアンケート)の調査結果に対して、あらかじめ用意した解析パターンを利用して意見かどうかの判断を行い、意見文を出力している。
There is a known method for retrieving opinion information from documents containing opinions in natural language existing on the Internet or questionnaire surveys. For example, in
また、下記特許文献2では、意見ではなく評判情報(事物に対する価値を定めることのできる表現を含む情報)を検索する方法であるが、評判に関する各ルールに対して、その文が満足するか否かを示す値の組み合わせ毎に、人が入力したスコアを利用して評判らしさのスコアを付与し、その評判らしさ順に検索結果を出力している。
Further, in
また、意見文を収集する方法として、例えば下記特許文献3では、意見らしさを構文的適性もしくは客観的適性によって判定することによって、正確な意見を抽出している。
意見が記述された文書には、アンケート調査結果、映画や商品などのレビュー、個人が参加したイベントの感想、観光地や人物などの個人見解、出来事に関する個人の主張など幅広い分野において様々な形式の文書が多数存在する。 There are various forms of documents that describe opinions in a wide range of fields, including questionnaire survey results, reviews of movies and products, impressions of events attended by individuals, personal views of tourist spots and people, and individual claims regarding events. There are many documents.
しかしながら、前記特許文献1では、あらかじめ意見対象分野を限った文書からの検索なので、意見らしさの指標を入れた解析パターンを作成することによって、その分野における意見らしさを付与することは可能であるが、幅広い分野の様々な形式の文書全てに対応した解析パターンを網羅的に用意するのは現実的ではない問題があった。
However, in the above-mentioned
また、前記特許文献2では、評判らしさに関するルールを意見らしさ用のルールにすることは可能で、人手で作成できる量のルールであれば、人手で意見らしさのスコアを付与できるが、照合範囲の広い少量のルールでは同じ意見らしさとなる可能性が高く、同じ意見らしさの文は適切な意見らしさ順に表示することができない問題があった。個別の膨大なルールの組み合わせに意見らしさを付与すれば、対象文が同じ意見らしさのスコアとなる可能性は低くなり、この問題は解決するが、膨大なルールを作成し、その全組み合わせ毎に意見らしさのスコアを人手で付与するのは現実的ではない。
Further, in
また、前記特許文献3では、意見らしさを構文的適性もしくは客観的特性によって判定しており、構文的特性については、対象分野や形式に依存しない少量のルールで判定されるので適用範囲は広いが、同じ意見らしさのスコアとなる可能性が高く、同じ意見らしさの文は適切な意見らしさ順に表示することができない問題があった。客観的特性については、対象文が第三者によって記述されているかどうかを判定するだけなので、客観的特性だけでは、意見らしさを順位付けることはできない問題があった。
Further, in
本発明は上記の問題点に鑑みてなされたものであり、検索語の分野や文書の形式に係わらず、細かな意見らしさの度合いに応じた検索結果を出力することができる意見文検索装置、意見文検索方法および意見文検索プログラム並びにそのプログラムを記録した記録媒体を提供することを目的としている。 The present invention has been made in view of the above problems, and an opinion sentence search device capable of outputting a search result according to the degree of fineness of opinion regardless of the field of the search word or the format of the document, An object is to provide an opinion sentence search method, an opinion sentence search program, and a recording medium in which the program is recorded.
具体的には、事前に人手による意見性判定(意見かどうかの判定)の結果が文単位に付与されたデータから、意見に関係する表現(あるいは、全ての表現)毎に、その出現具合と意見性の判定結果に応じた意見性寄与度(意見と判断するのに寄与する度合い)を計算し、その値を付与することによって、人手を使うことなく、データに応じた適切な意見性寄与度が各表現に付与され、入力された検索語を含む文書の文に対して、表現毎に付与されているこの意見性寄与度を基に、その文の意見らしさを計算することによって、任意の分野用に意見らしさに関する膨大な単語の組み合わせルールを人手で作成せずに、意見らしさが算出され、その結果に応じてより細かく適切に意見らしさが順位付けられた意見文検索結果を表示することができる意見文検索装置、意見文検索方法および意見文検索プログラム並びにそのプログラムを記録した記録媒体を提供するものである。 Specifically, from the data in which the result of manual opinionality determination (determination of whether or not it is an opinion) is given in advance, for each expression (or all expressions) related to the opinion, Appropriate contribution to the opinion according to the data without using manpower by calculating the degree of opinion contribution according to the judgment result of the opinion (degree that contributes to judging the opinion) and assigning the value A degree is given to each expression, and for a sentence of a document that includes the input search term, an arbitrary likelihood is calculated by calculating the likelihood of the sentence based on the degree of opinion contribution given to each expression. Opinion sentence search results are displayed in such a way that the likelihood of opinion is calculated and the opinion likelihood is ranked more finely and appropriately according to the result, without manually creating a huge number of word combination rules for the field of opinion. It is possible Opinion text search apparatus, there is provided a recording medium recording the opinion text search method and sentiments search program and a program.
上記課題を解決するための請求項1に記載の意見文検索装置は、複数の文から検索語に関連する意見文を出力する装置において、検索語を入力する検索語入力手段と、該検索語入力手段によって入力された検索語が出現している文を、複数の文が格納されている文記憶装置から取得する検索結果文取得手段と、前記文記憶装置の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶装置に格納する意見らしさ指標付与手段と、前記検索結果文取得手段によって取得された検索結果の文から、前記意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得手段と、該意見文取得手段によって取得された意見文を、該意見らしさの指標に基づいて意見文を出力する意見文出力手段とを有することを特徴としている。
The opinion sentence search device according to
また請求項2に記載の意見文検索装置は、請求項1に記載の意見文検索装置において、前記意見らしさ指標付与手段は、意見に関連する表現が格納されている意見関連表現記憶装置から1つの意見関連表現を取得する意見関連表現取得手段と、該意見関連表現取得手段によって取得された1つの意見関連表現を含む文とその文に付与されている意見らしさの指標を学習用意見らしさの指標付き文記憶装置から取得する意見らしさの指標取得手段と、該意見らしさの指標取得手段によって取得された意見らしさの指標から、文中の意見関連表現が、その文を意見と判断するのにどの程度影響を与えているかの度合いを示す意見寄与度を計算し、該意見寄与度を付与した意見関連表現を前記意見関連表現記憶装置へ格納する意見寄与度算出手段と、前記意見関連表現記憶装置に格納されている、前記意見寄与度付与処理が未処理の意見関連表現の有無を調べる意見関連表現終了判定手段と、該意見関連表現終了判定手段によって終了と判定された場合、前記文記憶装置から全文を取得する文取得手段と、該文取得手段によって取得された文に対して、前記意見関連表現記憶装置に格納されている一文に出現している意見関連表現の意見寄与度から、該一文の意見らしさを計算し、該一文と意見らしさを意見らしさ指標付き文記憶装置へ格納する意見らしさの指標算出手段とを含むことを特徴としている。
Further, the opinion sentence search device according to
また請求項3に記載の意見文検索方法は、複数の文から検索語に関連する意見文を出力する方法において、検索語入力手段が検索語を入力する検索語入力ステップと、検索結果文取得手段が、前記検索語入力ステップによって入力された検索語が出現している文を、複数の文が格納されている文記憶装置から取得する検索結果文取得ステップと、意見らしさ指標付与手段が、前記文記憶装置の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶装置に格納する意見らしさ指標付与ステップと、意見文取得手段が、前記検索結果文取得ステップによって取得された検索結果の文から、意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得ステップと、意見文出力手段が、前記意見文取得ステップによって取得された意見文を、該意見らしさの指標に基づいて意見文を出力する意見文出力ステップとを有することを特徴としている。
The opinion sentence search method according to
また請求項4に記載の意見文検索方法は、請求項3に記載の意見文検索方法において、前記意見らしさ指標付与ステップは、意見関連表現取得手段が、意見に関連する表現が格納されている意見関連表現記憶装置から1つの意見関連表現を取得する意見関連表現取得ステップと、意見らしさの指標取得手段が、前記意見関連表現取得ステップによって取得された1つの意見関連表現を含む文とその文に付与されている意見らしさの指標を意見らしさの指標付き文記憶装置から取得する意見らしさの指標取得ステップと、意見寄与度算出手段が、前記意見らしさの指標取得ステップによって取得された意見らしさの指標から、文中の意見関連表現が、その文を意見と判断するのにどの程度影響を与えているかの度合いを示す意見寄与度を計算し、該意見寄与度を付与した意見関連表現を前記意見関連表現記憶装置へ格納する意見寄与度算出ステップと、意見関連表現終了判定手段が、前記意見関連表現記憶装置に格納されている、前記意見寄与度付与処理が未処理の意見関連表現の有無を調べる意見関連表現終了判定ステップと、文取得手段が、前記意見関連表現終了判定ステップによって終了と判定された場合、前記文記憶装置から全文を取得する文取得ステップと、意見らしさの指標算出手段が、前記文取得ステップによって取得された文に対して、前記意見関連表現記憶装置に格納されている一文に出現している意見関連表現の意見寄与度から、該一文の意見らしさを計算し、該一文と意見らしさを意見らしさ指標付き文記憶装置へ格納する、意見らしさの指標算出ステップとを含むことを特徴としている。
The opinion sentence search method according to
上記構成において、意見らしさ指標付与手段(意見らしさ指標付与ステップ)で付与される意見らしさの指標とは、入力された文が意見を表明する文であるかを示す指標であり、文が、個人の主義、主張、見解、感想、評価などの意見文であるとどの程度判断できるかの度合いのことである。 In the above configuration, the opinion-like index given by the opinion-likeness index assigning means (opinion-likeness index assigning step) is an index indicating whether the inputted sentence is a sentence expressing an opinion, and the sentence is an individual It is the degree to which it can be judged that it is an opinion sentence such as the principle, assertion, opinion, impression, and evaluation.
例えば、意見らしさの値(指標)を、意見ではないと判断できる場合、どちらとも判断がつかない場合、意見であると判断できる場合の3段階に設定する。 For example, the value (indicator) of the likelihood of opinion is set in three stages: when it can be determined that it is not an opinion, when neither can be determined, and when it can be determined that it is an opinion.
さらに前記意見らしさ指標付与手段(意見らしさ指標付与ステップ)は、意見関連表現に意見寄与度を付与し、該意見寄与度を利用して意見らしさを計算する。 Further, the opinion-likeness index giving means (an opinion-likeness index giving step) assigns an opinion contribution to the opinion-related expression, and calculates the opinion-likeness using the opinion contribution.
このため、文に出現した意見関連表現毎に付与された意見寄与度の組み合わせにより意見らしさの指標が細かく算出されるので、文の意見らしさの評価粒度(意見らしさの指標をどの程度細かく表すことができるかの度合い)が細かくなり(例えば前記3段階指標よりも粒度が細かくなり)、これによって適切に意見らしさを順序付けることができる。 For this reason, since the index of opinion-likeness is calculated in detail by the combination of opinion contributions given for each opinion-related expression that appears in the sentence, the evaluation granularity of the opinion-likeness of the sentence (how much the index of opinion-likeness is expressed (For example, the granularity is finer than that of the three-stage index), and accordingly, the likelihood of opinion can be appropriately ordered.
また請求項5に記載の意見文検索プログラムは、請求項3又は4に記載の意見文検索方法をコンピュータに実行させるためのプログラムとしたことを特徴としている。
An opinion sentence search program according to
また請求項6に記載の記録媒体は、請求項5に記載のプログラムを当該コンピュータが読み取りできる記録媒体に記録したことを特徴としている。
A recording medium according to claim 6 is characterized in that the program according to
(1)請求項1〜6に記載の発明によれば、検索語を入力し、文書から意見文を出力する意見文検索において、検索語の分野や文書の形式に係わらず、意見らしさ(文が意見文であるとどの程度判断できるかの度合い)の度合いに応じた検索結果を出力することができる。
(2)請求項2,4に記載の発明によれば、検索語の分野や文書の形式に係わらず、意見らしさ(文が意見文であるとどの程度判断できるかの度合い)の評価粒度(意見らしさをどの程度細かく表すことができるかの度合い)を細かくでき、より細かく意見らしさの度合いに応じた検索結果を出力することができる。
(1) According to the inventions described in
(2) According to the second and fourth aspects of the invention, the evaluation granularity of the likelihood of opinion (how much it can be determined that the sentence is an opinion sentence) regardless of the field of the search term or the format of the document ( The degree to which the degree of opinion can be expressed in detail) can be made finer, and the search results corresponding to the degree of opinion-likeness can be output more finely.
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。まず本発明の原理を図1、図2と共に説明する。図1は本発明を説明するためのフローチャートである。 Hereinafter, embodiments of the present invention will be described with reference to the drawings, but the present invention is not limited to the following embodiments. First, the principle of the present invention will be described with reference to FIGS. FIG. 1 is a flowchart for explaining the present invention.
図1において、本発明は、検索語を入力し(ステップS1)、入力した検索語が出現している文を、複数の文が格納されている文記憶装置から検索結果文を取得し(ステップS2)、取得された検索結果の文から、意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得し(ステップS3)、取得された意見らしさの指標付き意見文の意見らしさの指標に基づいて意見文集合を出力する(ステップS4)。 In FIG. 1, the present invention inputs a search word (step S1), acquires a sentence in which the input search word appears, and obtains a search result sentence from a sentence storage device in which a plurality of sentences are stored (step S1). S2) An opinion-like index is assigned based on the opinion-like index necessary for judging the degree of the opinion sentence stored in the sentence storage device with the opinion-like index from the acquired search result sentence. The obtained opinion sentence is acquired (step S3), and an opinion sentence set is output based on the acquired opinion likelihood index of the opinion sentence with the index of opinion likelihood (step S4).
前記意見らしさの指標とは、入力された文が意見を表明する文であるかを示す指標であり、文が、個人の主義、主張、見解、感想、評価などの意見文であるとどの程度判断できるかの度合いのことである。 The opinion-like index is an index indicating whether the input sentence is a sentence expressing an opinion, and to what extent the sentence is an opinion sentence such as an individual's principle, claim, opinion, impression, evaluation, etc. It is the degree of judgment.
図2は本発明の原理構成図を示している。 FIG. 2 shows a principle configuration diagram of the present invention.
図2において、本発明は、検索語を入力する検索語入力手段1と、検索語入力手段1によって入力された検索語が出現している文を、複数の文が格納されている文記憶装置5から取得する検索結果文取得手段2と、文記憶装置5の全文に対して一文毎に意見らしさ指標を付与し、意見らしさの指標が付与された全ての文を意見らしさの指標付き文記憶装置6に格納する意見らしさ指標付与手段7と、検索結果文取得手段2によって取得された検索結果の文から、意見らしさ指標付き文記憶装置6に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得手段3と、意見文取得手段3によって取得された意見文を、意見らしさの指標に基づいて意見文を出力する意見文出力手段4とを含む。
In FIG. 2, the present invention provides a search word input means 1 for inputting a search word, and a sentence storage device in which a plurality of sentences are stored as a sentence in which the search word input by the search word input means 1 appears. Search result sentence acquisition means 2 acquired from 5 and the sentence-likeness index for every sentence given to the whole sentence of the
図3は、本発明の一実施例である意見文検索装置を示すブロック図である。意見文検索装置は、検索語入力部11、検索結果文取得部12、意見文取得部13、意見文出力部14、文記憶部15、意見らしさ指標付き文記憶部16および意見らしさ指標付与部17から構成される。
FIG. 3 is a block diagram showing an opinion sentence search apparatus according to an embodiment of the present invention. The opinion sentence search device includes a search word input unit 11, a search result
検索語入力部11は、検索語を入力する。 The search word input unit 11 inputs a search word.
検索結果文取得部12は、検索語入力部11によって入力された検索語が出現している文を、複数の電子化された文が格納されている文記憶部15から取得する。
The search result
意見らしさ指標付与部17は、文記憶部15の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶部16に格納する。
The opinion-likeness
意見文取得部13は、検索結果文取得部12によって取得された検索結果の文から、意見らしさ指標付き文記憶部16に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する。
The opinion sentence acquisition unit 13 uses the search result sentence acquired by the search result
意見文出力部14は、意見文取得部13によって取得された意見文を、意見らしさの指標に基づいて出力する。 The opinion sentence output unit 14 outputs the opinion sentence acquired by the opinion sentence acquisition unit 13 based on the index of opinion likelihood.
上記意見文検索装置を構成する、検索語入力部11、検索結果文取得部12、意見文取得部13、意見文出力部14、文記憶部15、意見らしさ指標付き文記憶部16および意見らしさ指標付与部17の各機能は、例えばコンピュータによって実行されるものである。
Search word input unit 11, search result
次に、上記意見文検索装置の動作について説明する。 Next, the operation of the opinion sentence search apparatus will be described.
図4は、本発明の一実施例である意見文検索処理を示すフローチャートである。以下、このフローチャートに基づいて、検索語「車B」を入力した場合に、意見文を出力する意見文検索の例について説明する。 FIG. 4 is a flowchart showing opinion sentence search processing according to an embodiment of the present invention. Hereinafter, an example of an opinion sentence search that outputs an opinion sentence when the search word “car B” is input will be described based on this flowchart.
ステップS11では、検索語入力部11によって検索語を入力する。この例の場合、「車B」が入力される。 In step S <b> 11, a search word is input by the search word input unit 11. In this example, “car B” is input.
ステップS12では、検索結果文取得部12が文記憶部15に格納されている各文に対して、検索語が含まれている文書を取得する。例えば、図10に示す文書が文記憶部15に格納されているとすると、検索語「車B」を含んだ文書であるので、この文書を取得する。
In step S <b> 12, the search result
ステップS13では、意見文取得部13が、検索結果文取得部12で取り出された複数の文のうち、あらかじめ決めた数以上の意見らしさが付与されている文を、意見らしさ指標付き文記憶部16から取得する。ここで利用する意見らしさ指標付き文は、ステップS13の後に意見らしさ指標を付与部17によって、文記憶部15にある全ての文に対して意見らしさを付与しても良いが、以下にあらかじめ準備する場合の一例を図面により説明する。
In step S <b> 13, the opinion sentence acquisition unit 13 uses a sentence storage unit with an opinion-likeness index as a sentence to which a predetermined number or more of opinion-likeness is assigned among the plurality of sentences extracted by the search result
図5は、本発明の一実施例である意見らしさ付与手段の構成図である。 FIG. 5 is a configuration diagram of opinion-likeness imparting means according to an embodiment of the present invention.
意見らしさ指標付与手段7(意見らしさ指標付与部17)は、意見関連表現取得部71、意見らしさの指標取得部72、意見寄与度算出部73、意見関連表現終了判定部74、文取得部75、意見らしさの指標算出部76、意見関連表現記憶装置としての意見関連表現記憶部77、学習用意見らしさの指標付き文記憶部78、意見関連表現記憶装置としての意見寄与度付き意見関連表現記憶部79、文記憶部15、意見らしさ指標付き文記憶部16、から構成される。
Opinion-likeness index giving means 7 (opinion-likeness index giving unit 17) includes opinion-related
意見関連表現取得部71は、意見関連表現記憶部77に格納されている意見関連表現を1つ取得する。ここで意見関連表現とは、意見と判定するのに必要な意見に関係のある表現のことで、あらかじめ意見が記述されている文書から人手によって抽出したものを意見関連表現記憶部77に格納しておく。意見関連表現を定義し抽出するのが困難な場合は、意見が記述されている文書に出現した全単語としても良い。
The opinion related
意見らしさの指標取得部72は、意見関連表現取得部71によって取得された意見関連表現を含む文と意見らしさの指標を、学習用意見らしさの指標付き文記憶部78から取得する。学習用意見らしさの指標付きの文は、意見が記述されている文書を、人がどの程度意見なのかを付与したデータである。
The opinion-likeness
意見寄与度算出部73は、意見らしさの指標取得部72によって取得された意見らしさの指標から、当該意見関連表現の意見寄与度を計算し、その意見寄与度を付与した意見関連表現を意見寄与度付き意見関連表現記憶部79へ格納する。ここで意見寄与度とは、その意見関連表現が意見性の判定にどの程度寄与しているかを示す指標である。
The opinion contribution
尚本実施例においては、意見寄与度付き意見関連表現記憶部79には、予め、意見関連表現記憶部77に格納される意見関連表現と同じデータ(意見関連表現)が格納されているものである。
In the present embodiment, the opinion related
意見関連表現終了判定部74は、意見寄与度付き意見関連表現記憶部79に格納されている未処理の意見関連表現の有無を調べる。
The opinion related expression
文取得部75は、文記憶部15に格納されている文を全て取得する。
The
意見らしさの指標算出部76は、文取得部75によって取得された各文に対して、意見寄与度付き意見関連表現記憶部79に格納されている一文に出現している意見関連表現の意見性寄与度からその文の意見らしさを計算する。また、計算された意見らしさの指標を、意見らしさ指標付き文記憶部16に、その文とともに格納する。
The opinion-likeness
図6は、本発明の一実施例である意見らしさ付与のフローチャートである。以下、このフローチャートに基づいて、意見らしさ指標の付与方法について説明する。 FIG. 6 is a flowchart for giving an opinion likeness according to an embodiment of the present invention. Hereinafter, based on this flowchart, a method of giving an opinion-likeness index will be described.
ステップS71では、意見関連表現取得部71によって意見関連表現記憶部77に格納されている意見関連表現を1つ取得する。例えば図7に示す意見関連表現が意見関連表現記憶部77に格納されている場合、先ず「高い」を取り出す。
In step S <b> 71, the opinion related
ステップS72では、意見らしさの指標取得部72が、ステップS71によって取得された意見関連表現を含む文と意見らしさの指標を、学習用意見らしさの指標付き文記憶部78から全て取得する。学習用意見らしさの指標付き文記憶部78には、例えば図8に示す文と意見らしさの指標が格納されている。
In step S72, the opinion-likeness
例えば、意見らしさの値(指標)を次の3段階、すなわち、意見ではないと判断できる場合を1、どちらとも判断がつかない場合を2、意見であると判断できる場合を3、と設定した時、図8の「100円高い」は、意見ではないと判断したので意見らしさは1、「ビルが高い」は、どちらとも判断がつかなかったので意見らしさは2、「プライドが高い」は、意見であると判断したので意見らしさは3、となる。 For example, the value (indicator) of the likelihood of opinion is set to the following three stages: 1 when it can be judged that it is not an opinion, 2 when neither can be judged, and 3 when it can be judged as an opinion At that time, “100 yen high” in FIG. 8 is not an opinion, so the likelihood of opinion is 1, “Bill is high”, because neither could be judged, the likelihood of opinion is 2, “Pride is high” Since it was judged as an opinion, the likelihood of opinion is 3.
図8から「高い」を含む文と意見らしさの指標を取得すると、「100円高い」と意見らしさ「1」、「値段が高い」と意見らしさ「2」、「ビルが高い」と意見らしさ「2」、「プライドが高い」と意見らしさ「3」が取得される。なお、この意見らしさは、人がその文に、数値化された意見らしさの度合いをあらかじめ付与しておく。本実施例の場合、「1」または「2」または「3」の数値を付与している。意見ではないと判断したものは「1」、意見だと判断したものは「3」、どちらでもないと判断したものは「2」とした。 If you get a sentence that contains “high” and an index of opinion from FIG. 8, it is “100 yen high”, the opinion is “1”, “the price is high”, the opinion is “2”, and “the building is expensive” “2” and “3” are obtained that are “pride is high”. Note that this opinion-likeness is given in advance by a person to the sentence in advance. In the present embodiment, a numerical value “1”, “2” or “3” is given. “1” was determined to be not an opinion, “3” was determined to be an opinion, and “2” was determined to be neither.
前記指標については、人が意見らしさとして付与できる数値であれば、本実施例に限らず、例えば、5段階にするなど、どんな値でも良い。また、1人で付与したデータだけを使う必要はなく、複数人で付与したデータの平均値を取るなど、意見らしさを付与する人は何人でも良い。 The index is not limited to the present embodiment as long as it is a numerical value that can be given to a person as an opinion. For example, the index may be any value such as five levels. Further, it is not necessary to use only the data given by one person, and any number of people who give a feeling of opinion, such as taking an average value of data given by a plurality of people, may be used.
ステップS73では、意見寄与度算出部73が、意見らしさの指標取得部72によって取得された意見らしさの指標から、当該意見関連表現の意見寄与度を計算し、その意見寄与度を付与した意見関連表現を意見寄与度付き意見関連表現記憶部79へ格納する。
In step S73, the opinion
例えば、意見寄与度を、全体の平均に対して値が0〜1になるように正規化した数値と定義すると、「高い」の場合、平均が(1+2+2+3)/4=2なので、正規化すると2/3=0.67となる。意見寄与度の算出方法は、他に、意見らしさの値の合計値や、意見関連表現の全体の出現分布に応じて重み付けするなど、意見関連表現がどの程度意見と判定するのに寄与しているかが分かる指標であれば、本実施例に限らず何でも良い。 For example, if the opinion contribution is defined as a numerical value that is normalized so that the value is 0 to 1 with respect to the overall average, if “high”, the average is (1 + 2 + 2 + 3) / 4 = 2, and thus normalization is performed. 2/3 = 0.67. There are other methods for calculating the opinion contribution, such as weighting according to the total value of opinion-like values and the overall appearance distribution of opinion-related expressions. Any index can be used as long as it is an indicator that can be determined.
ステップS74a,S74bでは、意見関連表現終了判定部74が、意見寄与度付き関連表現記憶部79に格納されている未処理の意見関連表現の有無を調べる。今の例の場合、未処理の意見関連表現が残されているので、「有る」と判断され、意見関連表現記憶部77に格納されている未処理の意見関連表現を取得する。図7から、次の未処理の意見関連表現は「お勧めします」となる。
In steps S74a and S74b, the opinion related expression
このように、ステップS71〜ステップS74bまでを繰り返すことにより、例えば、図9に示す各意見関連表現に対して、意見寄与度が付与される。未処理の意見関連表現が無くなった場合、「無い」と判断され、次のステップS75へ処理が進む。 In this way, by repeating steps S71 to S74b, for example, an opinion contribution degree is given to each opinion related expression shown in FIG. When there is no unprocessed opinion-related expression, it is determined that there is no expression, and the process proceeds to the next step S75.
ステップS75では、文取得部75が、文記憶部15に格納されている文を全て取得する。例えば、図10に示す文が格納されている場合、これら文を全て取得する。
In step S75, the
ステップS76では、意見らしさの指標算出部76が、文取得部75によって取得された各文に対して、意見寄与度付き意見関連表現記憶部79に格納されている文に出現した意見関連表現の意見性寄与度からその文の意見らしさを計算する。また、計算された意見らしさの指標を、意見らしさ指標付き文記憶部16に、その文とともに格納する。
In step S76, the opinion-likeness
この「意見らしさ」とは、入力された文が意見を表明する文であるかを示す指標であり、例えば、出現した意見関連表現に付与されている意見寄与度の平均値と定義する。これにより、例えば、図10の文ID1の「A社で車Bを試乗しました。」は、図9の意見関連表現を含んでいないので、意見らしさは0となる。また、図10の文ID2の「車高が高いです。」は、図9の意見関連表現「高い」を含んでいるので、0.67となり、文ID3「大きい人にはお勧めします。」は、図9の意見関連表現「大きい」、「ぜひ」、「お勧めします」を含んでいるので、(0.67+1+1)/3=0.89となる。同様に、文ID4の「値段はすごーく高いと思う。」は、図9の意見関連表現「すごーく」、「高い」、「と思う」を含んでいるので、(1+0.67+0.9)/3=0.86となり、全ての文に対しては、図11に示す結果が得られる。
This “likeness of opinion” is an index indicating whether or not the input sentence is a sentence expressing an opinion, and is defined as, for example, an average value of the degree of opinion contribution assigned to the appearing opinion-related expression. Thus, for example, the
上記のように本実施例では、図11のような0〜1の実数値を意見らしさの指標としているので、図8に示す1,2,3の3段階の意見らしさの指標よりも粒度(意見らしさの指標をどの程度細かく表すことができるかを示す、意見らしさの評価粒度)が細かい。 As described above, in the present embodiment, real values of 0 to 1 as shown in FIG. 11 are used as indicators of opinion likeness. Therefore, the granularity (3, 1, and 3) shown in FIG. The evaluation granularity of opinion-likeness indicating how finely the opinion-likeness index can be expressed is fine.
意見らしさの指標は、意見関連表現に付与されている意見寄与度を用いてその文の意見らしさが分かるような指標であれば、例えば、意見寄与度の合計値や意見関連表現の出現頻度に応じて意見寄与度を重み付けするなど、算出方法はこの例に限らない。 If the index of opinion-likeness is an index that can be used to understand the opinion-likeness of the sentence using the opinion contributions assigned to the opinion-related expressions, for example, the total value of opinion contributions and the appearance frequency of opinion-related expressions The calculation method is not limited to this example, such as weighting opinion contributions accordingly.
以上の例のような方法を用いて意見らしさの指標が付与された意見文(この例では、意見らしさが0でない文)が意見らしさ指標付き文記憶装置16に格納される。
An opinion sentence (in this example, a sentence whose opinion likelihood is not 0) to which an opinion likelihood index is assigned is stored in the opinion storage index-added
尚図5の実施例では、本発明の意見関連表現記憶装置として、意見関連表現記憶部77と、意見寄与度付き意見関連表現記憶部79(書き換え可能なメモリ)の2個の記憶部で構成していたが、これに限らず、1個の書き換え可能な意見関連表現記憶部で構成しても良い。
In the embodiment of FIG. 5, the opinion related expression storage device of the present invention is composed of two storage units, an opinion related
このように構成した場合は、意見関連表現取得部71の意見関連表現取得処理(図6のステップS71)、意見寄与度算出部73が計算した意見寄与度付き意見関連表現を格納する処理(図6のステップS73)、意見関連表現終了判定部74が未処理の意見関連表現の有無を調べる処理(図6のステップS74a,S74b)および意見らしさの指標算出部76が意見らしさを計算する際の処理(図6のステップS76)は、前記1個の意見関連表現記憶部に対して行われる。
When configured in this way, the opinion related expression acquisition process of the opinion related expression acquisition unit 71 (step S71 in FIG. 6), the process of storing the opinion related expression with the opinion contribution calculated by the opinion contribution degree calculation unit 73 (FIG. 6 in step S73), the opinion-related expression
次に、図4を用いて、ステップS13の後の処理について説明する。 Next, the process after step S13 is demonstrated using FIG.
ステップS14では、ステップS13で取得された意見らしさが付与された文に対して、意見らしさの高い順に出力する。図10の例文には、図11の意見らしさが付与されているので(図10の文IDと図11の文IDが同じものは、同じ文を示している)、意見文(この例の場合意見らしさが0以外の文)を意見らしさの高い順に出力すると図12に示す順で表示される。この例では、意見らしさが高い順に出力するとしたが、例えば、意見らしさの閾値を高く設定して、より意見らしい意見文だけを出力するように設定する方法や、意見文が多い場合には、出力する意見文の数を制限する方法など、意見らしさの値を利用した出力方法であれば、何でも良い。 In step S14, the sentences with the opinion-likeness acquired in step S13 are output in descending order of opinion-likeness. Since the example sentence of FIG. 10 is given the opinion-likeness of FIG. 11 (the same sentence ID of FIG. 10 and the sentence ID of FIG. 11 indicate the same sentence), the opinion sentence (in this example) If sentences with opinion-likeness other than 0) are output in descending order of opinion-likeness, they are displayed in the order shown in FIG. In this example, it was output in order of high opinion opinion, but for example, if you set a high threshold of opinion likeness and set to output only opinion sentences that seem more opinion, or if there are many opinion sentences, Any output method that uses opinion-like values, such as a method of limiting the number of opinion sentences to be output, may be used.
上記のように意見寄与度を利用して意見らしさを計算すると、文に出現した表現毎に付与された意見寄与度の組み合わせで意見らしさが細かく計算されるので、文の意見らしさの評価粒度が細かくなる。これにより、同点(同じ値)になる場合が減って、より適切に意見らしさを順序付けることができる。 When calculating the opinion likeness using the opinion contribution as described above, the opinion likeness is calculated in detail by the combination of the opinion contribution given for each expression that appears in the sentence, so the evaluation granularity of the opinion likeness of the sentence It becomes fine. Thereby, the case where it becomes the same point (same value) decreases, and it is possible to order opinions more appropriately.
すなわち図5の意見寄与度算出部73で、表現毎に意見寄与度を付与することができ、意見らしさの指標算出部76で、文に出現した表現毎に付与されている意見寄与度の組み合わせによって、意見らしさの指標が算出されるので、従来手法に較べてどんな文に対しても自動的に意見らしさの評価粒度を細かくすることができる。これにより、同じ表現が出現しても、他の表現との組み合わせによって、意見らしさの値が変わる。
That is, the opinion
例えば、同じ「高い」が出現しても、他の語の出現状況から意見らしさの指標の粒度を細かくすることができる。図10の例では、文ID4の「値段はすごーく高いと思う。」と文ID2の「車高が高いです。」の両方に「高い」が出現しているが、図9のように「すごーく」や「と思う」にも意見寄与度が付与されているので、意見寄与度を利用して算出されたそれぞれの文の意見らしさの値が異なり、より意見だと判断できる文ID4の文のほうが、文ID2よりも上位に順位付けられている。これにより、本発明は、より適切に意見らしさを順位付けして表示することができる。
For example, even when the same “high” appears, the granularity of the index of opinion can be reduced from the appearance status of other words. In the example of FIG. 10, “high” appears in both of the
なお、上記実施例は、プログラムの発明として把握することができる。 In addition, the said Example can be grasped | ascertained as invention of a program.
つまり、上記実施例では、複数の文から検索語に関連する意見文を出力するプログラムにおいて、検索語を入力する検索語入力ステップと、その検索語入力ステップによって入力された検索語が出現している文を、複数の文が格納されている文記憶装置から取得する検索結果文取得ステップと、前記文記憶装置の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶装置に格納する意見らしさ指標付与ステップと、前記検索結果文取得ステップによって取得された検索結果の文から、意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得ステップと、前記意見文取得ステップによって取得された意見文を、該意見らしさの指標に基づいて意見文を出力する意見文出力ステップとをコンピュータに実行させるプログラムの例である。 That is, in the above embodiment, in a program that outputs an opinion sentence related to a search word from a plurality of sentences, a search word input step for inputting the search word and a search word input by the search word input step appear. A search result sentence acquisition step of acquiring a sentence from a sentence storage device storing a plurality of sentences, and assigning an opinion-like index for each sentence to the whole sentence of the sentence storage device, From the retrieval result sentence obtained by the opinion-likeness index adding step for storing all the given sentences in the opinion-likeness-indexed sentence storage device and the search result sentence obtaining step, the sentence is stored in the sentence-likeness index-added sentence storage device. An opinion sentence obtaining step for obtaining an opinion sentence to which an opinion-like index is assigned based on an opinion-like index necessary for judging the degree of the opinion sentence; and A is opinion sentence obtaining by Mibun acquiring step is an example of a program for executing an opinion sentence output step of outputting an opinion statement based on the indication of the opinion likeness to the computer.
また、前記意見らしさ指標付与ステップは、意見に関連する表現が格納されている意見関連表現記憶装置から1つの意見関連表現を取得する意見関連表現取得ステップと、前記意見関連表現取得ステップによって取得された1つの意見関連表現を含む文とその文に付与されている意見らしさの指標を意見らしさの指標付き文記憶装置から取得する意見らしさの指標取得ステップと、前記意見らしさの指標取得ステップによって取得された意見らしさの指標から、文中の意見関連表現が、その文を意見と判断するのにどの程度影響を与えているかの度合いを示す意見寄与度を計算し、該意見寄与度を付与した意見関連表現を前記意見関連表現記憶装置へ格納する意見寄与度算出ステップと、前記意見関連表現記憶装置に格納されている、前記意見寄与度付与処理が未処理の意見関連表現の有無を調べる意見関連表現終了判定ステップと、前記意見関連表現終了判定ステップによって終了と判定された場合、前記文記憶装置から全文を取得する文取得ステップと、前記文取得ステップによって取得された文に対して、前記意見関連表現記憶装置に格納されている一文に出現している意見関連表現の意見寄与度から、該一文の意見らしさを計算し、該一文と意見らしさを意見らしさ指標付き文記憶装置へ格納する、意見らしさの指標算出ステップとを含み、コンピュータに実行させるプログラムの例である。 The opinion-likeness index assigning step is acquired by an opinion-related expression acquisition step of acquiring one opinion-related expression from an opinion-related expression storage device storing expressions related to an opinion, and the opinion-related expression acquisition step. An opinion likelihood index acquisition step of acquiring a sentence including one opinion related expression and an opinion likelihood index assigned to the sentence from a sentence storage device with an opinion likelihood index, and the opinion likelihood index acquisition step. The opinion contribution that indicates the degree to which the opinion-related expression in the sentence has an influence on the judgment of the sentence as an opinion is calculated from the index of the likelihood of opinion, and the opinion that has been given the opinion contribution An opinion contribution degree calculating step of storing a related expression in the opinion related expression storage device, and the meaning stored in the opinion related expression storage device Opinion related expression end determination step for examining presence / absence of unprocessed opinion related expression in the contribution degree giving process, and sentence acquisition step for acquiring a full sentence from the sentence storage device when it is determined to be ended by the opinion related expression end determination step And, for the sentence acquired by the sentence acquisition step, the opinion likeness of the sentence is calculated from the opinion contribution degree of the opinion related expression appearing in the sentence stored in the opinion related expression storage device, It is an example of a program to be executed by a computer, including an opinioniness index calculation step of storing the sentence and the likelihood of opinion in a sentence storage device with an opinioniness index.
また前記プログラムを記録した記録媒体を、システム、又は装置に供給し、そのシステム又は装置のCPU(MPU)が記録媒体に格納されたプログラムを読み出し実行することも可能である。この場合記録媒体から読み出されたプログラム自体が上記実施形態の機能を実現することになり、このプログラムを記録した記録媒体としては、例えば、CD−ROM,DVD−ROM,CD−R,CD−RW,MO及びHDD等がある。 It is also possible to supply a recording medium recording the program to a system or apparatus, and the CPU (MPU) of the system or apparatus reads and executes the program stored in the recording medium. In this case, the program itself read from the recording medium realizes the functions of the above-described embodiment, and examples of the recording medium on which the program is recorded include CD-ROM, DVD-ROM, CD-R, CD- There are RW, MO, and HDD.
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments and examples, and various modifications and applications can be made within the scope of the claims.
1…検索語入力手段、2…検索結果文取得手段、3…意見文取得手段、4…意見文出力手段、5…文記憶装置、6…意見らしさ指標付き文記憶装置、7…意見らしさ指標付与手段、11…検索語入力部、12…検索結果文取得部、13…意見文取得部、14…意見文出力部、15…文記憶部、16…意見らしさ指標付き文記憶部、17…意見らしさ指標付与部、71…意見関連表現取得部、72…意見らしさの指標取得部、73…意見寄与度取得部、74…意見寄与度終了判定部、75…文取得部、76…意見らしさ指標算出部、77…意見関連表現記憶部、78…学習用意見らしさの指標付き文記憶部、79…意見寄与度付き意見関連表現記憶部。
DESCRIPTION OF
Claims (6)
検索語を入力する検索語入力手段と、
該検索語入力手段によって入力された検索語が出現している文を、複数の文が格納されている文記憶装置から取得する検索結果文取得手段と、
前記文記憶装置の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶装置に格納する意見らしさ指標付与手段と、
前記検索結果文取得手段によって取得された検索結果の文から、前記意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得手段と、
該意見文取得手段によって取得された意見文を、該意見らしさの指標に基づいて意見文を出力する意見文出力手段と
を有することを特徴とする意見文検索装置。 In a device that outputs an opinion sentence related to a search word from a plurality of sentences,
A search term input means for inputting a search term;
Search result sentence acquisition means for acquiring a sentence in which a search word input by the search word input means appears from a sentence storage device storing a plurality of sentences;
An opinion-likeness index giving means for assigning an opinion-like index for each sentence to the whole sentence of the sentence storage device, and storing all sentences given the opinion-likeness index in the sentence storage device with the opinion-likeness index;
Based on the opinion-like index necessary for judging the degree of the opinion sentence stored in the sentence storage device with the opinion-like index from the sentence of the search result obtained by the search result sentence obtaining means Opinion sentence acquisition means for acquiring an opinion sentence with an index of uniqueness,
An opinion sentence search device, comprising: an opinion sentence output means for outputting an opinion sentence obtained by the opinion sentence acquisition means based on the opinion likelihood index.
意見に関連する表現が格納されている意見関連表現記憶装置から1つの意見関連表現を取得する意見関連表現取得手段と、
該意見関連表現取得手段によって取得された1つの意見関連表現を含む文とその文に付与されている意見らしさの指標を学習用意見らしさの指標付き文記憶装置から取得する意見らしさの指標取得手段と、
該意見らしさの指標取得手段によって取得された意見らしさの指標から、文中の意見関連表現が、その文を意見と判断するのにどの程度影響を与えているかの度合いを示す意見寄与度を計算し、該意見寄与度を付与した意見関連表現を前記意見関連表現記憶装置へ格納する意見寄与度算出手段と、
前記意見関連表現記憶装置に格納されている、前記意見寄与度付与処理が未処理の意見関連表現の有無を調べる意見関連表現終了判定手段と、
該意見関連表現終了判定手段によって終了と判定された場合、前記文記憶装置から全文を取得する文取得手段と、
該文取得手段によって取得された文に対して、前記意見関連表現記憶装置に格納されている一文に出現している意見関連表現の意見寄与度から、該一文の意見らしさを計算し、該一文と意見らしさを意見らしさ指標付き文記憶装置へ格納する意見らしさの指標算出手段と
を含むことを特徴とする請求項1に記載の意見文検索装置。 The opinion-likeness index giving means is:
An opinion related expression acquisition means for acquiring one opinion related expression from an opinion related expression storage device in which an expression related to the opinion is stored;
Opinion-like index acquisition means for acquiring a sentence including one opinion-related expression acquired by the opinion-related expression acquiring means and an opinion-like index assigned to the sentence from the sentence storage device with an opinion-like index for learning When,
From the opinion-like index acquired by the opinion-likeness index acquisition means, an opinion contribution degree indicating the degree to which the opinion-related expression in the sentence affects the judgment of the sentence as an opinion is calculated. , An opinion contribution degree calculating means for storing the opinion related expression assigned the opinion contribution degree in the opinion related expression storage device;
Opinion-related expression end determination means for checking whether or not there is an unprocessed opinion-related expression stored in the opinion-related expression storage device;
A sentence acquisition means for acquiring a full sentence from the sentence storage device when the opinion related expression end determination means determines an end;
For the sentence acquired by the sentence acquisition means, the opinion likelihood of the sentence is calculated from the opinion contribution of the opinion related expression appearing in the sentence stored in the opinion related expression storage device, and the sentence 2. The opinion sentence search device according to claim 1, further comprising: an opinion likeness index calculation unit that stores the opinion likeness in the opinion storage index-added sentence storage device.
検索語入力手段が検索語を入力する検索語入力ステップと、
検索結果文取得手段が、前記検索語入力ステップによって入力された検索語が出現している文を、複数の文が格納されている文記憶装置から取得する検索結果文取得ステップと、
意見らしさ指標付与手段が、前記文記憶装置の全文に対して一文毎に意見らしさの指標を付与し、意見らしさの指標が付与された全ての文を意見らしさ指標付き文記憶装置に格納する意見らしさ指標付与ステップと、
意見文取得手段が、前記検索結果文取得ステップによって取得された検索結果の文から、意見らしさ指標付き文記憶装置に格納されている、意見文の程度を判断するのに必要な意見らしさの指標を基に、意見らしさの指標が付与された意見文を取得する意見文取得ステップと、
意見文出力手段が、前記意見文取得ステップによって取得された意見文を、該意見らしさの指標に基づいて意見文を出力する意見文出力ステップと
を有することを特徴とする意見文検索方法。 In a method for outputting an opinion sentence related to a search word from a plurality of sentences,
A search term input step in which the search term input means inputs a search term;
A search result sentence acquisition unit that acquires a sentence in which the search word input in the search word input step appears from a sentence storage device in which a plurality of sentences are stored;
Opinion-likeness index assigning means assigns an opinion-likeness index to every sentence of the sentence storage device, and stores all sentences with the opinion-likeness index in the sentence storage device with the opinion-likeness index A uniqueness index assigning step;
Opinion-likeness index required for the opinion-sentence acquisition means to determine the degree of opinion sentence stored in the sentence storage device with the opinion-likeness index from the search result sentence acquired by the search result sentence acquisition step. Based on the above, an opinion sentence acquisition step for acquiring an opinion sentence with an index of opinion likeness,
An opinion sentence search method, wherein the opinion sentence output means includes an opinion sentence output step of outputting the opinion sentence acquired by the opinion sentence acquisition step based on the opinion likelihood index.
意見関連表現取得手段が、意見に関連する表現が格納されている意見関連表現記憶装置から1つの意見関連表現を取得する意見関連表現取得ステップと、
意見らしさの指標取得手段が、前記意見関連表現取得ステップによって取得された1つの意見関連表現を含む文とその文に付与されている意見らしさの指標を意見らしさの指標付き文記憶装置から取得する意見らしさの指標取得ステップと、
意見寄与度算出手段が、前記意見らしさの指標取得ステップによって取得された意見らしさの指標から、文中の意見関連表現が、その文を意見と判断するのにどの程度影響を与えているかの度合いを示す意見寄与度を計算し、該意見寄与度を付与した意見関連表現を前記意見関連表現記憶装置へ格納する意見寄与度算出ステップと、
意見関連表現終了判定手段が、前記意見関連表現記憶装置に格納されている、前記意見寄与度付与処理が未処理の意見関連表現の有無を調べる意見関連表現終了判定ステップと、
文取得手段が、前記意見関連表現終了判定ステップによって終了と判定された場合、前記文記憶装置から全文を取得する文取得ステップと、
意見らしさの指標算出手段が、前記文取得ステップによって取得された文に対して、前記意見関連表現記憶装置に格納されている一文に出現している意見関連表現の意見寄与度から、該一文の意見らしさを計算し、該一文と意見らしさを意見らしさ指標付き文記憶装置へ格納する、意見らしさの指標算出ステップと
を含むことを特徴とする請求項3に記載の意見文検索方法。 The opinion-likeness index assigning step includes
Opinion related expression acquisition means for acquiring one opinion related expression from an opinion related expression storage device in which expressions related to opinions are stored;
Opinion-likeness index acquisition means acquires a sentence including the one opinion-related expression acquired by the opinion-related expression acquisition step and an opinion-like index assigned to the sentence from the sentence storage device with an opinion-likeness index. An opinion-likeness acquisition step,
The degree to which the opinion-related expression in the sentence affects the opinion contribution degree calculation means from the opinion-like index acquired in the opinion-like index acquisition step affects the determination of the sentence as an opinion. An opinion contribution degree calculating step of calculating an opinion contribution degree to be indicated, and storing the opinion related expression assigned the opinion contribution degree in the opinion related expression storage device;
Opinion-related expression end determination means is stored in the opinion-related expression storage device, and the opinion-related expression end determination step for checking whether or not there is an unprocessed opinion-related expression in the opinion contribution degree granting process;
If the sentence acquisition unit is determined to be ended by the opinion related expression end determination step, a sentence acquisition step of acquiring a full sentence from the sentence storage device;
Opinion-likeness index calculation means, for the sentence acquired by the sentence acquisition step, from the opinion contribution degree of the opinion-related expression appearing in one sentence stored in the opinion-related expression storage device, The opinion sentence search method according to claim 3, further comprising: calculating an opinion likeness and storing the sentence and the opinion likeness in a sentence storage device with an opinion likeness index.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006277866A JP2008097286A (en) | 2006-10-11 | 2006-10-11 | Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006277866A JP2008097286A (en) | 2006-10-11 | 2006-10-11 | Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008097286A true JP2008097286A (en) | 2008-04-24 |
Family
ID=39380072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006277866A Pending JP2008097286A (en) | 2006-10-11 | 2006-10-11 | Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008097286A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257155A (en) * | 2009-04-23 | 2010-11-11 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device, method, program, and computer-readable recording medium |
JP2016527612A (en) * | 2013-06-19 | 2016-09-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Ranking comments by search engines |
-
2006
- 2006-10-11 JP JP2006277866A patent/JP2008097286A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257155A (en) * | 2009-04-23 | 2010-11-11 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device, method, program, and computer-readable recording medium |
JP2016527612A (en) * | 2013-06-19 | 2016-09-08 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Ranking comments by search engines |
US10242105B2 (en) | 2013-06-19 | 2019-03-26 | Alibaba Group Holding Limited | Comment ranking by search engine |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mohammad et al. | Wikiart emotions: An annotated dataset of emotions evoked by art | |
TWI598755B (en) | Data analysis system, data analysis method, computer program product storing data analysis program, and storage medium storing data analysis program | |
Platz et al. | When the eye listens: A meta-analysis of how audio-visual presentation enhances the appreciation of music performance | |
Bjørkelund et al. | A study of opinion mining and visualization of hotel reviews | |
Van Wesel et al. | What a difference a colon makes: How superficial factors influence subsequent citation | |
JP5885875B1 (en) | Data analysis system, data analysis method, program, and recording medium | |
US11004019B2 (en) | Method of matching employers with job seekers | |
Golbeck | Predicting personality from social media text | |
Gillings et al. | Corpus-assisted discourse studies | |
Jänicke et al. | Interactive visual profiling of musicians | |
US9640085B2 (en) | System and method for automated content generation for enhancing learning, creativity, insights, and assessments | |
Brunner | Automatic recognition of speech, thought, and writing representation in German narrative texts | |
Lathrop et al. | Two approaches to estimation of classification accuracy rate under item response theory | |
Barbu et al. | Reliability and validity of the Devereux Early Childhood Assessment (DECA) as a function of parent and teacher ratings | |
Hammond et al. | Modeling modernist dialogism: Close reading with big data | |
Krueger et al. | Detecting false positives in AB designs: Potential implications for practitioners | |
Chen et al. | COVID risk narratives: a computational linguistic approach to the econometric identification of narrative risk during a pandemic | |
JP2019046289A (en) | Evaluation device, evaluation method, noise removal device and program | |
Jasso et al. | The utility of an English semantics measure for identifying developmental language disorder in Spanish–English bilinguals | |
JP2008097286A (en) | Apparatus for retrieving opinion sentence, method for retrieving opinion sentence, program for retrieving opinion sentence, and recording medium recording the program | |
JP6070951B2 (en) | Apparatus and method for supporting analysis of evaluation | |
JP5877775B2 (en) | Content management apparatus, content management system, content management method, program, and storage medium | |
Zhang et al. | How many is enough?—Statistical principles for lexicostatistics | |
KR20090126862A (en) | System and method for analyzing emotional information from natural language sentence, and medium for storaging program for the same | |
Zimmerman et al. | EmotionVis: Designing an emotion text inference tool for visual analytics |