JP4293145B2 - Word-of-mouth information determination method, apparatus, and program - Google Patents
Word-of-mouth information determination method, apparatus, and program Download PDFInfo
- Publication number
- JP4293145B2 JP4293145B2 JP2005061390A JP2005061390A JP4293145B2 JP 4293145 B2 JP4293145 B2 JP 4293145B2 JP 2005061390 A JP2005061390 A JP 2005061390A JP 2005061390 A JP2005061390 A JP 2005061390A JP 4293145 B2 JP4293145 B2 JP 4293145B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- experience
- word
- mouth
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、クチコミ情報判定方法及び装置及びプログラムに係り、特に、インターネットのような、あらゆる種類の情報が混在するような状況の中から、その情報に含まれる文章を解析し、ある物事に関する体験談や利用した感想、苦情などが書かれている「ユーザの声、つまりクチコミ情報」を見分けて判定することができる、体験表現を利用したクチコミ情報判定方法及び装置及びプログラムに関する。 The present invention relates to a word-of-mouth information determination method, apparatus, and program, and in particular, from a situation where all types of information such as the Internet are mixed, the sentence included in the information is analyzed, and an experience related to a certain thing The present invention relates to a word-of-mouth information determination method, an apparatus, and a program using experience expressions, which can distinguish and determine “user's voice, that is, word-of-mouth information” in which talks, comments used, and complaints are written.
近年、ホテルや旅行、電化製品など様々な事柄に関して、多くの人々がインターネット上で個人の意見を公開している。この公開場所は、ショッピングサイト自身が運営しているような様々な人の意見が集まる掲示板や、個人の意見をまとめたWeblogや個人のホームページのような場所等がある。こういったユーザの声は、ユーザの声や評判(以下、クチコミ情報と記す)としてマーケティングや商品開発、商品の購入検討などの支援として利用価値が高い。 In recent years, many people have published their opinions on the Internet regarding various matters such as hotels, travel, and electrical appliances. This public place includes a bulletin board where opinions of various people gathered, such as a shopping site itself, a weblog where personal opinions are gathered, and a personal homepage. Such user's voice is highly useful as support for marketing, product development, product purchase examination, etc. as user's voice and reputation (hereinafter referred to as word-of-mouth information).
現在、クチコミ情報の分析として、ある特定の商品や情報収集先(URLなど)を限定し、文章中からその対象となる物事に依存した記述表現を抽出する以下のような技術が提案されている。 Currently, the following technologies have been proposed for analyzing word-of-mouth information, in which specific products and information collection destinations (URLs, etc.) are limited, and descriptive expressions depending on the subject matter are extracted from sentences. .
第1の技術として、ユーザが入力した商品名と予め辞書として用意した評価表現を近接演算する方法を用いて、インターネットのWebページから意見を抽出する技術がある(例えば、非特許文献1参照)。ここで用いる評価表現とは、物事に対する人の評価を示す表現であり、その辞書は、予め作成した商品カテゴリ毎に用意するものである。この商品カテゴリとは、例えば「書籍」「コンピュータ」「車」等がある。 As a first technique, there is a technique for extracting an opinion from a Web page on the Internet by using a method for calculating a proximity between a product name input by a user and an evaluation expression prepared in advance as a dictionary (see, for example, Non-Patent Document 1). . The evaluation expression used here is an expression indicating a person's evaluation of things, and the dictionary is prepared for each product category created in advance. Examples of the product category include “book”, “computer”, and “car”.
一方、第2の技術として、インターネット検索においては、あるキーワードに関わる企業などのオフィシャルページやショッピングサイト、クチコミ情報など様々なWebページが区別なく、しばしば膨大に出力される。こういった膨大な情報から利用者の欲する情報へナビゲーションするために、出力結果を分析する方法が提案されている。その方法は、検索エンジンで収集したWebページの文書内を解析し、その文書から人名・地名などの特徴的な固有表現を抽出し、それを検索結果に対するインデックスとしてユーザに提示するという、Webページを分類する技術である(例えば、非特許文献2参照)。 On the other hand, as a second technique, in the Internet search, various web pages such as an official page of a company related to a certain keyword, a shopping site, and word-of-mouth information are often output without distinction. In order to navigate from such a vast amount of information to information desired by the user, a method of analyzing the output result has been proposed. The method analyzes a web page document collected by a search engine, extracts a characteristic specific expression such as a person name and a place name from the document, and presents it to a user as an index for a search result. Is a technique for classifying (see, for example, Non-Patent Document 2).
また、第3の技術として、検索結果のURLをもとに、そのコンテンツのタイプ分類をするための提案がある。検索結果で出力されたWebページAのリンク(URL)を含むようなWebページBを分析する。Bの中でAのリンクが埋め込まれている周辺の情報(アンカーテキスト)を解析して、もとのWebコンテンツの形式推定を行う技術である。ユーザは、情報検索時に検索の目的に応じて、コンテンツの機能:「Webコンテンツそのものを得ることで目的を満たす」「Webコンテンツが示す書籍、セミナー等の案内情報によって目的を満たす」等の選択をする必要がある。ここでのコンテンツのタイプとは、「論文」「解説記事」「ニュース」「掲示板」「日記」「サイト」「リンク集」「ガイド」である(例えば、非特許文献3参照)。 As a third technique, there is a proposal for classifying the content type based on the URL of the search result. The Web page B including the link (URL) of the Web page A output as the search result is analyzed. This is a technique for analyzing the surrounding information (anchor text) in which the link of A is embedded in B and estimating the format of the original Web content. The user selects a function of the content at the time of information search, such as the function of the content: “satisfy the purpose by obtaining the web content itself”, “satisfy the purpose by guide information such as a book or seminar indicated by the web content”. There is a need to. The types of content here are “paper”, “commentary article”, “news”, “bulletin board”, “diary”, “site”, “link collection”, and “guide” (for example, see Non-Patent Document 3).
また、上記の第1の技術や第3の技術を利用する場合は、文章の形態素解析を行う必要がある。形態素解析の技術としては、語の共起を用いて同形語の読み分けを行う日本語形態素解析システムである。語の共起は人にとって識別しやすいため、間違えにくく、確実にシステムの精度を上げることができる(例えば、非特許文献4参照)。
本明細書では、「クチコミ情報」を次のように定義する。クチコミ情報は、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものである。例えば、「最近、渋谷に新しくできた○○レストランへ行ってみた。○○レストランは、うわさのカルボナーラが非常に美味しかった。」という文章からは、「行ってみた」という体験と「美味しかった」という意見が入っていることから、○○レストランに対するクチコミ情報といえる。こういったクチコミ情報は、企業において商品開発や商品改良の参考とすることができ、また、一般のユーザが見たときには、購入や旅行先等、選定する際の検討に役立つ有益な情報となる。 In this specification, “review information” is defined as follows. Word-of-mouth information is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.). A person who has experienced or experienced describes their opinions such as their experiences and their experiences. For example, from the sentence, “I recently went to a new restaurant in Shibuya. The restaurant was very delicious with rumored carbonara.” From the sentence “I tried it” and “It was delicious.” It can be said that it is word-of-mouth information for XX restaurant. This kind of word-of-mouth information can be used as a reference for product development and product improvement in companies, and when general users see it, it is useful information useful for consideration when selecting purchases, travel destinations, etc. .
ある文章がクチコミ情報かどうかを判定するとき、上記の従来の第1〜第3の方法では、次のような問題がある。 When determining whether or not a certain sentence is word-of-mouth information, the above-described conventional first to third methods have the following problems.
第1の技術では、評判情報として次の2種類を区別なく扱っている。 In the first technology, the following two types are treated as reputation information without distinction.
1)他の人の体験やレポート、マシンスペックなど提示された条件で、書き手が予想・判断した意見・評価:
(例)「商品Aは、スペックの割には安い」、「Bでは、最近スリが増加していて、治安が悪い」
2)実際に対象となる物事を体験した人の意見・評価(本発明におけるクチコミ情報の定義と同義)
(例)「商品Aを使ってみたら、ディスプレイが暗かった」、「Bへ行ってみたら、街中はそれほど治安が悪くなかった」
しかし、商品購入や旅行先の検討、ダイエット方法の選択など、実際の利用シーンでは、実体験に基づく意見の方が、より重視されることが多いと考えられる。また、第1の技術では、ある特定の商品カテゴリとそれに合わせた辞書を事前に作成しておく必要がある。現在、インターネット上でも様々な物事に関しての意見が公開されているため、それに合わせた全ての辞書を作成することは、非常にコストがかさんでしまう問題がある。
1) Opinions and evaluations predicted and judged by the writer under the conditions presented by other people's experiences, reports, machine specifications, etc .:
(Example) “Product A is cheap for specs”, “In B, the number of pick-ups has increased recently and the security is poor”
2) Opinions and evaluations of people who actually experienced the subject matter (synonymous with the definition of word-of-mouth information in the present invention)
(Example) “When I used Product A, the display was dark”, “When I went to B, the city was not so safe”
However, in actual usage scenes such as purchasing products, considering travel destinations, and selecting dieting methods, opinions based on actual experiences are often considered more important. In the first technique, it is necessary to create a specific product category and a dictionary corresponding to the category beforehand. At present, opinions on various things are published on the Internet, and it is very expensive to create all the dictionaries according to it.
また、第2の技術では、人名や会社名など固有表現で分類しているため、クチコミ情報を判定することはできない。 Further, in the second technique, word-of-mouth information cannot be determined because classification is performed using a unique expression such as a person name or a company name.
また、第3の技術では、掲示板や日記というタイプでは分類はできるが、その中に部分的に含まれている「クチコミ情報」という観点での分類は行っていない。 In the third technique, the bulletin board and diary types can be classified, but classification is not performed from the viewpoint of “word-of-mouth information” partially included therein.
また、前述したクチコミ情報の定義を満たしている情報であっても、ある一個人の意見のみであると、その個人の見解の偏りがクチコミ情報の中に生じている問題もある。しかしながら、閲覧者は、筆者がどのような嗜好を持った人物であるかは不明なため、閲覧者にとっての参考情報になるか否かを判断することが難しい。 Further, even if the information satisfies the above-described definition of the review information, if there is only one opinion, there is a problem that the bias of the opinion of the individual occurs in the review information. However, it is difficult for the viewer to determine whether or not the author has a preference, and thus it is difficult to determine whether or not it is reference information for the viewer.
本発明は上記の点に鑑みなされたもので、分野や対象物を限定せず、インターネットのような、あらゆる種類の情報が混在するような状況の中から、その情報に含まれる文章を解析し、体験表現や評価表現の有無を利用して、ある物事に関する体験談や利用した感想、苦情などが書かれている「ユーザの声、つまりクチコミ情報」を見分けて、判定することが可能なクチコミ情報判定方法及び装置及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and does not limit the fields and objects, and analyzes sentences contained in the information from situations where all kinds of information such as the Internet are mixed. Reviews that can be identified by distinguishing "user's voice, that is, word-of-mouth information" that contains experiences, impressions, complaints, etc. related to certain things by using the presence or absence of experience expressions and evaluation expressions It is an object to provide an information determination method, apparatus, and program.
図1は、本発明の原理構成図である。 FIG. 1 is a principle configuration diagram of the present invention.
本発明(請求項1)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段20と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段21と、
入力されたテキストに、評価表現記憶手段20を参照して、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段501に格納する評価表現検査手段520と、
入力されたテキストに、体験表現記憶手段21を参照して、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段501に格納する体験表現検査手段530と、
データ記憶手段501の情報を読み出して、評価表現検査手段520で評価表現が記述されていると判定され、かつ、体験表現検査手段530で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段540と、を有する。
The present invention (Claim 1) is a word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from an input text, and complaints,
An evaluation expression storage means 20 for storing an evaluation expression that is a phrase that evaluates the quality of things;
Experience expression storage means 21 for storing experience expressions, which are phrases representing the use or experience / experience of things;
The input text is referred to the evaluation expression storage means 20 to determine whether or not an evaluation expression that is a phrase that evaluates the quality of things is described, and the determination result is stored in the data storage means 501. Evaluation expression checking means 520 for performing,
The input text is referred to the experience expression storage means 21 to determine whether or not an experience expression that is a phrase that represents the use or experience / experience of a thing is described, and the determination result is stored in the data storage means 501. Experiential expression inspection means 530 stored in
When the information stored in the
本発明(請求項2)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
評価表現記憶手段を参照して、本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、本文の中に物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、を有する。
The present invention (Claim 2) is a word-of-mouth information determination apparatus that determines word-of-mouth information including experiences and complaints about a certain thing, complaints, and complaints from the input text or the structure of a Web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or , A multi-writer inspection means for inspecting whether the text, the name or the set of symbols appears repeatedly;
An evaluation expression that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a word that evaluates the quality of things is described in the text, and stores the determination result in the data storage means Inspection means;
An experience that refers to experience expression storage means, determines whether the experience expression, which is a phrase that expresses the use or experience / experience of things, is described in the text, and stores the determination result in the data storage means Expression inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth determination means for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項3)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキスト全体のうちのクチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、を有する。
The present invention (Claim 3) is a word-of-mouth information determination apparatus for determining word-of-mouth information including experiences and complaints about a certain thing from the input text, complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
An evaluation that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the input text, and stores the determination result in the data storage means Expression inspection means;
Referring to the experience expression storage means, determine whether the input text contains an experience expression that is a phrase that expresses the use, experience, or experience of things, and stores the determination result in the data storage means An experiential expression inspection means,
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth rate calculating means for calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information in the entire input text, by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項4)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
評価表現記憶手段を参照して、本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、本文中に物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストまたはWebページの全体のうちの、クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、を有する。
The present invention (Claim 4) is a word-of-mouth information determination apparatus that determines word-of-mouth information including experiences and complaints about a certain thing in the input text or the structure of the Web page, complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or , A multi-writer inspection means for inspecting whether the text, the name or the set of symbols appears repeatedly;
An evaluation expression that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a word that evaluates the quality of things is described in the text, and stores the determination result in the data storage means Inspection means;
Experience expression that refers to experience expression storage means, determines whether experience expression that is a phrase that expresses the use or experience / experience of things in the text is described, and stores the determination result in data storage means Inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth rate calculation means for calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information, of the input text or the entire Web page by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
図2は、本発明の原理を説明するための図である。 FIG. 2 is a diagram for explaining the principle of the present invention.
本発明(請求項5)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップ(ステップ1)と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップ(ステップ2)と、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップ(ステップ3)と、を行う。
The present invention (Claim 5) is a review information determination method for determining review information including experiences, complaints, and complaints related to certain things from the input text.
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step (step 1) stored in the means;
Refers to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, determines whether the experience expression is described in the input text, and the determination result as data An experiential expression inspection step (step 2) to be stored in the storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth determination step (step 3) for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項6)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、を行う。
The present invention (Claim 6) is a word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints related to certain things from the input text or the structure of a Web page.
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or A multi-author inspection step for inspecting whether the text, the name or symbol pair repeatedly appears;
Refers to the evaluation expression storage means for storing the evaluation expression, which is a phrase that evaluates the quality of things, determines whether the evaluation expression is described in the text, and stores the determination result in the data An evaluation expression checking step stored in the means;
Refers to the experience expression storage means for storing the experience expression that is a phrase representing the use or experience / experience of things, determines whether the experience expression is described in the text, and the determination result as a data storage means And the experience expression inspection step to be stored in
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth determination step for determining whether or not the word-of-mouth is a word of mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項7)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストの全体のうちのクチコミ情報が占める比率であるクチコミ率を計算するクチコミ率算出ステップと、を行う。
The present invention (Claim 7) is a review information determination method for determining review information including experiences, complaints, and complaints related to certain things from the input text.
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Refers to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, determines whether the experience expression is described in the input text, and the determination result as data An experiential expression inspection step stored in a storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information in the entire input text, using a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項8)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、本文の中に該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストまたはWebページの全体のうちの、クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出ステップと、を行う。
The present invention (Claim 8) is a word-of-mouth information determination method for determining word-of-mouth information including experience stories, impressions used, and complaints related to certain things from the input text or the structure of a Web page.
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or A multi-author inspection step for inspecting whether the text, the name or symbol pair repeatedly appears;
Refers to an evaluation expression storage means for storing an evaluation expression that is a word that evaluates the quality of things, determines whether or not the evaluation expression is described in the text, and determines the determination result as a data storage means An evaluation expression checking step to be stored in
Refers to the experience expression storage means for storing the experience expression that is a phrase representing the use or experience / experience of things, determines whether the experience expression is described in the text, and the determination result as a data storage means And the experience expression inspection step to be stored in
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information, of the input text or the entire Web page by a word-of-mouth determination function represented by a calculation formula based on the experience expression.
本発明(請求項9)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムであって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムである。
The present invention (Claim 9) is a word-of-mouth information determination program for determining word-of-mouth information including input from an input text or an experience story about a certain thing from the structure of a Web page, a complaint,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
9. A process for realizing the word-of-mouth information determination method according to
本発明(請求項10)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムを格納した記憶媒体であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムを格納した記憶媒体である。
The present invention (Claim 10) stores a word-of-mouth information determination program for determining word-of-mouth information including experience stories, impressions used, and complaints related to certain things from the input text or the structure of a Web page. A medium,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
9. A process for realizing the word-of-mouth information determination method according to
クチコミ情報は、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものである。例えば、「最近、渋谷に新しくできた○○レストランへ行ってみた。○○レストランは、うわさのカルボナーラが非常に美味しかった。」という文章からは、「行ってみた」という体験と「美味しかった」という意見が入っていることから、○○レストランに対するクチコミ情報といえる。このようにクチコミ情報は、対象となる物事とともに、上記に述べたような体験表現(例:行ってみた)やそれを評価している評価表現(例:美味しかった)を含んでいるものといえる。また、クチコミ情報は、あらゆる物事に関して記述されているため、分野や対象物に依存せず判定できることが望ましい。 Word-of-mouth information is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.). A person who has experienced or experienced describes their opinions such as their experiences and their experiences. For example, from the sentence, “I recently went to a new restaurant in Shibuya. The restaurant was very delicious with rumored carbonara.” From the sentence “I tried it” and “It was delicious.” It can be said that it is word-of-mouth information for XX restaurant. Thus, it can be said that the word-of-mouth information includes not only the subject matter but also the experience expression as described above (eg: I tried it) and the evaluation expression (eg: it was delicious) that evaluates it. . In addition, since the word-of-mouth information is described with respect to all things, it is desirable that it can be determined without depending on the field or the object.
本発明によれば、今まで利用されることのなかった体験表現の有無の検査を用いることで、前述の発明が解決しようとする課題の欄で挙げた2種類の評判情報を区別し、クチコミ情報「利用者の体験・経験による意見が書き込まれている情報」かどうかを判断することができる。この体験表現は、クチコミ情報の対象となる物事に依存しない。評価表現と体験表現の両者が記述されているかどうかを確認することで、対象となる物事が何であるかに関わらず、クチコミ情報かどうかを判断することができる。 According to the present invention, it is possible to distinguish two kinds of reputation information mentioned in the column of the problem to be solved by the above-mentioned invention by using the presence / absence of the experience expression that has not been used so far. It is possible to determine whether the information is “information in which opinions based on the user's experience / experience are written”. This expression of experience does not depend on the subject matter of the word of mouth information. By confirming whether both the evaluation expression and the experience expression are described, it is possible to determine whether or not the information is word-of-mouth information regardless of what the object is.
また、上記に加えて、ある対象となる物事について、複数の人のクチコミ情報が集まっているようなWebページもしくは、テキストをクチコミ情報として判定することもできる。通常、クチコミ情報を閲覧する場合、ある個人の1つのクチコミ情報のみを見て満足することは少なく、複数のクチコミ情報を参照し、多面的な情報を得ることが多い。つまり、先に述べた効果によって、閲覧者が一度に複数の人の意見を見ることができ、複数のクチコミ情報ページを参照する手間も省くことができる。この判定方法においては、筆者を特定するような名前やニックネームなどを示す「名前」と1文以上で構成された「本文」の2つの情報、もしくは、これに加えてその情報が公開された「日付情報」の3つの情報を一人分の情報として判断している。日付情報や名前を追加することにより、情報の信頼性が高まり、また情報の新しさを知ることができる。また、これにより、先に述べた一個人の見解の偏りがクチコミ情報の中に生じている問題も回避することができる。 In addition to the above, it is also possible to determine, as word-of-mouth information, a Web page or text in which word-of-mouth information of a plurality of people is gathered for a certain target object. Normally, when reviewing word-of-mouth information, it is rarely satisfied to see only one word-of-mouth information of a certain individual, and a plurality of word-of-mouth information is referred to to obtain multifaceted information. In other words, due to the effects described above, the viewer can see the opinions of a plurality of people at a time, and the trouble of referring to a plurality of word-of-mouth information pages can be saved. In this determination method, there are two pieces of information, ie, “name” indicating a name or nickname for identifying the author and “text” composed of one or more sentences, or in addition to this information “ Three pieces of information “date information” are determined as information for one person. By adding date information and name, the reliability of the information can be improved and the newness of the information can be known. In addition, this can also avoid the above-described problem in which the bias of one person's opinion occurs in the word-of-mouth information.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
以下では、「クチコミ情報」を、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものと定義し、テキストもしくはWebページなどの入力があったときに、それがクチコミ情報かどうかを判定する装置を「クチコミ判定装置」として説明する。 In the following, “word-of-mouth information” is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.) It is defined that a person who has experienced / experienced something in some way describes an opinion such as his / her experiences and impressions, and when there is input such as text or web page, whether or not it is word-of-mouth information The determination device will be described as a “word-of-mouth determination device”.
図3は、本発明の一実施の形態における概要を説明するための図である。 FIG. 3 is a diagram for explaining the outline in one embodiment of the present invention.
クチコミ判定装置にテキストやWebページが入力されると、
1)A「筆者の名前」とB「1つ以上の文で構成される本文」とC「日付」を1つのクチコミセットとし、このA,B,Cからなるセットまたは、A,Bからなるセットが繰り返されているかを判定する。
When text or a web page is input to the review determination device,
1) A “writer's name” and B “text consisting of one or more sentences” and C “date” are one review set, and this A, B, C set or A, B Determine whether the set is repeated.
2)1)でクチコミセットと判定された中から本文と判断された文章のまとまりを抽出する。 2) Extract a group of sentences determined to be the text from the word-of-mouth set determined in 1).
3)2)で抽出された本文(テキスト)に評価表現が記述されているかを検査する。 3) Check whether the evaluation expression is described in the body (text) extracted in 2).
4)本文(テキスト)に体験表現が記述されているかを検査する。 4) Check whether experience expression is described in the text.
5)上記の3)と4)の結果からクチコミ情報かどうかを判定し、判定結果を出力する。 5) From the results of 3) and 4) above, it is determined whether or not it is word-of-mouth information, and the determination result is output.
図4は、本発明の一実施の形態におけるクチコミ情報判定装置の構成を示す。 FIG. 4 shows the structure of the word-of-mouth information determination apparatus in one embodiment of the present invention.
同図に示すクチコミ判定装置は、コンピュータ10と、このコンピュータ10にネットワーク40を介して接続される評価表現記憶部20と体験表現記憶部21から構成される。
The word-of-mouth determination device shown in FIG. 1 includes a
コンピュータ10は、RAM,ROM、磁気ディスク等からなるメモリ等で構成されるデータ記憶部501、CPU、ディスプレイによる表示部11、及びマウスやキーボードなどからなる指示入力部12から構成されており、CPUが実行するソフトウェアプログラムによって実現される複数筆者検査処理部500、本文抽出処理部510、評価表現検査処理部520、体験表現検査処理部530、クチコミ情報判定処理部540を有する。
The
データ記憶部501は、複数筆者検査処理部500、本文抽出処理部510、評価表現検査処理部520、体験表現検査処理部530、クチコミ情報判定処理部540によってデータの格納や読み出しが行われる。
In the
評価表現記憶部20には、物事に対して、良いイメージや悪いイメージを表すような語句が格納されている。良いイメージの例としては、「良い、美しい、美味しい、面白い、楽しい、心地よい、便利、華やか、豊富、気に入る」などがあげられる。また、悪いイメージの例としては、「悪い、汚い、まずい、面白くない、つまらない、不便、うるさい、くさい、ろこつ、最悪、困難」などが挙げられる。これらは主に形容詞、形容動詞、名詞等が当てはまる。
The evaluation
体験表現記憶部21には、物事を体験・経験したことを表すような語句が格納されている。例えば、「行ってみた、試した、実行した、感じた、実感した、チャレンジした」などがあげられる。これらは、主に動詞の過去形「〜た」「〜した」「〜してみた」「〜したことがある」等が当てはまる。体験表現記憶部21では、体験表現に該当する語句{実感した、チャレンジした、等}が格納されていることもあれば、表現形態{してみた、したことがある、等}や形態素解析した後の品詞の組み合わせのルール{動詞語幹+動詞活用語尾+動詞接尾辞+動詞語幹の連用「みる」+動詞接尾辞の終止「ました」等}、またはそれらの混合された情報が格納されている場合もある。体験表現の例を図5に示す。
The experience
図6は、本発明の一実施の形態におけるクチコミ情報判定処理の概要動作のフローチャートである。 FIG. 6 is a flowchart of the outline operation of the word-of-mouth information determination process according to the embodiment of the present invention.
ステップ100) 複数筆者検査処理:
複数筆者検査処理部500にテキストまたは、Webページが入力されると、当該テキストもしくはWebページの構造の中に、1つ以上の文で構成された本文と、本文の筆者名やニックネームなどを示す名前もしくは記号、本文を記述した日付情報の3つの情報、または、本文と名前もしくは記号の2つの情報が繰り返し出現するかどうかを検査し、その結果をデータ記憶部501に格納する。
Step 100) Multiple writer inspection process:
When a text or a web page is input to the multi-author
図7は、本発明の一実施の形態におけるクチコミ情報入力の例を示す。同図(A)は、Webページ(htmlファイル)の例であり、同図(B)は、テキストの例である。入力される文書と本文、文章、文の関係は図8に示すように、筆者名、日付、1つ以上の文で構成された本文が1セットとなる。 FIG. 7 shows an example of word-of-mouth information input in one embodiment of the present invention. FIG. 4A is an example of a Web page (html file), and FIG. 4B is an example of text. As shown in FIG. 8, the relationship between the input document and the text, text, and text is one set of text composed of the author name, date, and one or more texts.
ステップ200) 本文抽出処理:
本文抽出処理部510において、データ記憶部501からステップ100での3つの情報が繰り返し出現する情報を読み出してその中から本文を抽出し、データ記憶部501に格納する。
Step 200) Text extraction processing:
In the text
ステップ300) 評価表現検査処理:
評価表現検査処理部520は、データ記憶部501からステップ200において抽出された本文を読み出して、その中に評価表現が記述されているかを評価表現記憶部20を参照することにより検査し、その結果をデータ記憶部501に格納する。
Step 300) Evaluation expression inspection processing:
The evaluation expression
ステップ400) 体験表現検査処理:
体験表現検査処理部530は、データ記憶部501からステップ200において抽出された本文を読み出して、その中に体験表現が記述されているかを体験表現記憶部21を参照することにより検査し、その結果をデータ記憶部501に格納する。
Step 400) Experience expression inspection processing:
The experience expression
ステップ500) クチコミ判定処理:
クチコミ情報判定処理部540は、データ記憶部501からステップ300、ステップ400における検査結果を読み出して、評価表現と体験表現が記述されており、所定のクチコミ判定関数によってクチコミか否かを判定する、または、クチコミ率を判定する。
Step 500) Review determination processing:
The word-of-mouth information
[第1の実施の形態]
本実施の形態では、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。本実施の形態では、クチコミ表現のあり/なしが出力される。
[First Embodiment]
In the present embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body. In this embodiment, presence / absence of word-of-mouth expression is output.
最初に、第1の実施の形態における複数筆者検査処理(ステップ100)について説明する。 First, the multi-writer inspection process (step 100) in the first embodiment will be described.
図9は、本発明の第1の実施の形態におけるクチコミ情報入力html構造の例を示す。 FIG. 9 shows an example of a word-of-mouth information input html structure according to the first embodiment of the present invention.
複数筆者検査処理部500では、図3に示すように、A「筆者の名前」とB「1つ以上の文で構成される本文」とC「日付」を1つのクチコミセットとし、その繰り返しがあるかどうかを判断する。但し、C「日付」は、必ずしも必要ではなく、AとBでクチコミセットを形成することも可能である。ここで、A,B,Cもしくは、A,Bが出現する順序は問わないものとする。以下では、A,B,Cの3つが存在する場合の例を説明する。出現順序は、A→B→C、B→C→A、C→A→B、A→C→B、B→A→C、C→B→Aのいずれでもよい。しかし、繰り返し出現するのは1つの形式のみとする。例えば、A→B→Cの繰り返しであれば、C→B→Aが途中で出現したら、異なる形式が出現したということになり、繰り返しは終了したとみなされる。繰り返しの判定は、種々あるが、ここでは、AまたはCを探すことからスタートする。図7や図8は、A→C→Bの例である。
As shown in FIG. 3, the multiple writer
図10は、本発明の第1の実施の形態における複数筆者検査処理のフローチャートであり、名前からスタートする例を示す。 FIG. 10 is a flowchart of the multi-writer inspection process according to the first embodiment of the present invention, and shows an example starting from a name.
ステップ101) 複数筆者検査処理部500は、入力されたhtmlファイル、テキストファイル、または、テキスト等から筆者の名前だと特定できるような文字列を探す。このとき特定できるような文字列は様々であるが、例えば「名前、投稿者、by、ニックネーム」などの文字列とセットで筆者の名前もしくは筆者を特定するような記号が記述されていることがある。
Step 101) The multi-author
ステップ102) 複数筆者検査処理部500は、ステップ101で特定した名前の前後において、日付があるかどうかを検査する。
Step 102) The multi-author
日付は、例えば、2004年12月20日を示すときに、「2004.12.20、2004/12/20、04.12.20、2004 12 20、Dec.20,2004」など様々な記述方法がある。また、「日付、投稿日、質問日、」などの文字列と共に日付が記述されている場合や、時間と共に日付が記述されている場合もある。但し、日付は、必ずしも必要ではないため、本ステップを省略することもできる。 For example, when the date indicates December 20, 2004, there are various description methods such as “2004.12.20, 2004/12/20, 04.12.20, 2004 12 20, Dec. 20, 2004”. In addition, a date may be described together with a character string such as “date, posting date, question date”, or a date may be described along with a time. However, since the date is not necessarily required, this step can be omitted.
名前の前後両者において、日付がある場合、図9のように入力がhtmlファイルであった場合は、タグ構造を確認し、名前と同じタグで囲まれている方を採用する方法がある。このとき、図9では、htmlの<table>タグでクチコミセットが区切られている。また、最も名前の情報から近い方(名前を示す文字列から日付を示す文字列までの全文字数が少ない方)を採用する方法などもある。 If there is a date before and after the name, or if the input is an html file as shown in FIG. 9, there is a method of checking the tag structure and adopting the one surrounded by the same tag as the name. At this time, in FIG. 9, the word-of-mouth communication set is delimited by html <table> tags. There is also a method of adopting the one closest to the name information (the one with the smaller total number of characters from the character string indicating the name to the character string indicating the date).
ステップ103) ステップ101で採取した名前とステップ102で採取した日付と一緒に1つ以上の文で構成される本文(=クチコミセット)があるかどうかを検査する。 Step 103) It is checked whether or not there is a body (= review set) composed of one or more sentences together with the name collected in Step 101 and the date collected in Step 102.
図7のようにステップ101で「名前:Keiko」、ステップ102で「投稿日:2004.12.20」という記述が見つかった場合は、これと共に1つ以上の文で構成される本文があるかどうかを検査する。但し、ステップ102を省略した場合は、クチコミセットは、ステップ101で採取した名前と1つ以上の文で構成される本文の2つの情報で形成される。よって、ここでの検査は、前述の2つの情報のセットがあるかどうかを検査することになる。 If a description “name: Keiko” is found in step 101 and “post date: 2004.12.20” is found in step 102 as shown in FIG. 7, whether or not there is a text composed of one or more sentences. inspect. However, if step 102 is omitted, the word-of-mouth set is formed with two pieces of information, that is, the name collected in step 101 and a body text composed of one or more sentences. Therefore, the inspection here is to check whether or not there is the above-described two sets of information.
ステップ104) ステップ103で取得したクチコミセットの順序構造が繰り返し出現するかどうかを検査する。 Step 104) It is checked whether or not the order structure of the review set acquired in Step 103 appears repeatedly.
図7のように「名前: 」と「投稿日:yyyy.mm.dd」という記述と共に1つ以上の文で構成される本文がある場合は、そのクチコミセットの構造が繰り返し2つ以上あるかどうかを検査する。ここで、yyyyは年号(例:2004)、mmは月(例:12)、ddは日(例:20)を表す。但し、ステップ102の処理を省略した場合は、日付を示す「投稿日:yyyy.mm,dd」を除いたクチコミセットの繰り返しが2つ以上存在するかどうかを検査すればよい。 If there is a body consisting of one or more sentences with the description “Name:” and “Posted Date: yyyy.mm.dd” as shown in FIG. 7, is the structure of the review set repeated two or more times? Inspect whether. Here, yyyy represents the year (example: 2004), mm represents the month (example: 12), and dd represents the day (example: 20). However, if the processing in step 102 is omitted, it may be checked whether there are two or more reviews set repetitions excluding “post date: yyyy.mm, dd” indicating the date.
本文とみなせるような1文以上の文章のまとまりが複数点在する場合、例えば、図9のように入力がhtmlファイルであった場合は、タグ構造を確認し、名前や日付と同じタグで区切られている文章のまとまりを本文として採用する方法がある。また、最も名前や日付から近い文章のまとまりを採用する方法、もしくは、最も長い文章のまとまりの候補を本文として採用する方法などがある。 If there are multiple groups of one or more sentences that can be regarded as the body text, for example, if the input is an html file as shown in Fig. 9, check the tag structure and separate it with the same tag as the name and date There is a method of adopting a set of sentences as text. In addition, there is a method of adopting a group of sentences closest to the name or date, or a method of adopting a candidate of a group of sentences having the longest sentence as the text.
ステップ105) ステップ104でクチコミセットが、繰り返し出現する場合、ステップ104で取得したクチコミセットの繰り返し数を算出する。ここで、クチコミセットのデータそれぞれと、クチコミセットの数をデータ記憶部501に格納する。
Step 105) If the review set appears repeatedly in Step 104, the number of repetitions of the review set acquired in Step 104 is calculated. Here, each data of the review set and the number of review sets are stored in the
ステップ106) データ記憶部501に格納されているクチコミセットの名前のそれぞれを比較し、それが複数種類存在するかどうかを検査する。図7のような場合、名前に該当するのは「Keiko」「温泉大好き」「秘密」の3つである。このとき、3つとも同一でないため、「名前は複数種類存在する」と判定される。
Step 106) Each name of the word-of-mouth communication set stored in the
つまり、入力が複数筆者によって書かれたものかどうかを判定する。当該判定は、クチコミセットが繰り返し出現し、それらの名前が2種類以上存在するときに、複数筆者であると判定される。このステップ106は、省略することもできる。但し、ステップ106を省略した場合は、クチコミセットが繰り返し出現していれば、複数筆者であると判定される。このとき、出力情報(複数筆者であるか否か、複数筆者である場合はそれぞれのクチコミセットとその数)は、データ記憶部501に格納する。
That is, it is determined whether or not the input is written by a plurality of writers. This determination is determined to be a multiple writer when word-of-mouth sets appear repeatedly and there are two or more names. This
上記では、名前からスタートした場合の例を示したが、C「日付」からスタートした場合も上記に述べたステップ101とステップ102の順序が入れ替わる程度である。最初に日付を探し、次に日付の前後から名前を探すというステップを踏むことになる。但し、Cを省略したクチコミセットを利用する場合には、Cからスタートする処理は適用できない。 In the above, an example of starting from a name is shown, but even when starting from C “date”, the order of steps 101 and 102 described above is switched. The first step is to look for the date, and then look for the name around the date. However, when a review set in which C is omitted is used, processing starting from C cannot be applied.
次に、本文抽出部510におけるステップ200の本文抽出処理について説明する。
Next, the text extraction process in step 200 in the
図11は、本発明の第1の実施の形態における本文抽出処理のフローチャートである。 FIG. 11 is a flowchart of text extraction processing according to the first embodiment of this invention.
ステップ201) 本文抽出部510は、複数筆者検査処理部500で取得されたデータ記憶部501に格納されているクチコミセットの各本文と本文の数S(S>0)を読み出し、HTMLタグ等の記号があるかを判定する。ない場合はステップ203に移行する。
Step 201) The
ステップ202) 各本文について、文章以外であるHTMLタグ等の不要な記号を除去する。 Step 202) For each body, unnecessary symbols such as HTML tags other than sentences are removed.
ステップ203) sに1を代入する。ここでsは本文のカウントである。
Step 203)
ステップ204) sがSより大きければ処理を終了する。 Step 204) If s is larger than S, the process is terminated.
ステップ205) s番目の本文をデータ記憶部501に格納する。
Step 205) The sth body is stored in the
ステップ206) sに1を加算してステップ204に移行する。 Step 206) Add 1 to s and proceed to Step 204.
上記のように、本文抽出部510は、本文と判断された文章のまとまりを抽出し、データ記憶部501に格納しておく。本文の蓄積・出力形式は、上記の例に限定されることなく、選択可能であるが、統一した形式で実行される。
As described above, the
なお、ステップ201においてHTMLタグが入っていない場合には、当該処理は不要である。 If no HTML tag is included in step 201, this processing is not necessary.
次に、評価表現検査処理部520におけるステップ300の評価表現検査処理について説明する。
Next, the evaluation expression inspection process in
図12は、本発明の第1の実施の形態における評価表現検査処理のフローチャートである。以下の処理では、予め形態素解析処理を行うとされているものとする。 FIG. 12 is a flowchart of the evaluation expression checking process according to the first embodiment of this invention. In the following processing, it is assumed that morphological analysis processing is performed in advance.
ステップ301) データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。
Step 301) The text of each word-of-mouth set and the number S of text are input from the
ステップ302) 評価表現検査処理部520は、sに1を代入する。
Step 302) The evaluation expression
ステップ303) s>S(本文の数)であれば、処理を終了する。 Step 303) If s> S (the number of texts), the process ends.
ステップ304) 評価表現検査処理部520は、s番目の本文について形態素解析を行う。形態素解析において、評価表現に該当するような名詞や形容詞、形容動詞、連体詞等の特定の品詞を抽出する。
Step 304) The evaluation expression
ステップ305) 形態素解析結果と評価表現記憶部20に格納されている評価表現とを照合し、合致する表現があるか否かを判定する。なお、活用する品詞が検査対象となるときは、記述されている語句を原形に戻した後に検査する方が効率的である。
Step 305) The morphological analysis result and the evaluation expression stored in the evaluation
ステップ306) 合致する表現がある場合には、ステップ307に移行し、ない場合には、ステップ308に移行する。 Step 306) If there is a matching expression, the process proceeds to step 307; otherwise, the process proceeds to step 308.
ステップ307) 「s番目の本文に評価表現あり」と判定し、判定結果(評価表現あり)をデータ記憶部501に格納し、ステップ309に移行する。
Step 307) It is determined that “the s-th body has an evaluation expression”, the determination result (with an evaluation expression) is stored in the
ステップ308) 「s番目の本文に評価表現なし」と判定し、判定結果(評価表現なし)をデータ記憶部501に格納し、ステップ309に移行する。
Step 308) It is determined that “the s-th body has no evaluation expression”, the determination result (no evaluation expression) is stored in the
ステップ309) sに1を加算しステップ303に移行する。 Step 309) Add 1 to s and proceed to Step 303.
上記の処理の結果、データ記憶部501に出力されるのは、各本文中の評価表現の有無である。
As a result of the above processing, what is output to the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ304とステップ305の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。
In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of
次に、体験表現検査処理部530におけるステップ400の体験表現検査処理について説明する。
Next, the experience expression inspection process in
図13は、本発明の第1の実施の形態における体験表現検査処理のフローチャートである。以下の処理では、予め形態素解析処理を行うとされているものとする。 FIG. 13 is a flowchart of the experience expression inspection process in the first embodiment of the present invention. In the following processing, it is assumed that morphological analysis processing is performed in advance.
ステップ401) 体験表現検査処理部530に、データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。
Step 401) The experience expression
ステップ402) 1をsに代入する。
Step 402)
ステップ403) s>Sとなった場合には処理を終了する。 Step 403) If s> S, the process is terminated.
ステップ404) s番目の本文に対して形態素解析を行う。形態素解析では、体験表現に該当するような名詞、形容詞、形容動詞等の特定の品詞を抽出することが望ましい。 Step 404) Perform morphological analysis on the sth body. In morphological analysis, it is desirable to extract specific parts of speech such as nouns, adjectives and adjective verbs that correspond to the experiential expression.
ステップ405) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現があるかを調べる。なお、活用する品詞が検査対象となるときは、記述されている語句を原型に戻した後に検査する方が効率的である。また、体験表現は、動詞の過去形であることが多いため、「行ってみた」「試してみました」等の終止形の「た」「しました」が付属する動詞に注目する方法もある。
Step 405) The morphological analysis result and the experience expression stored in the experience
ステップ406) 合致する表現がある場合はステップ407に移行し、ない場合にはステップ408に移行する。 Step 406) If there is a matching expression, the process proceeds to step 407; otherwise, the process proceeds to step 408.
ステップ407) 「s番目の本文に体験表現あり」と判定し、その結果(体験表現あり)をデータ記憶部501に格納し、ステップ409に移行する。
Step 407) It is determined that “the s-th body has experience expression”, and the result (with experience expression) is stored in the
ステップ408) 「s番目の本文に体験表現なし」と判定し、その結果(体験表現なし)をデータ記憶部501に格納する。
Step 408) It is determined that “the s-th body has no experience expression”, and the result (no experience expression) is stored in the
ステップ409) sに1を加算し、ステップ403に移行する。
Step 409) Add 1 to s, and go to
上記の処理でデータ記憶部501に出力されるのは、各本文中の体験表現の有無である。
What is output to the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ404とステップ405の代わりに、s番目の本文と体験表現記憶部21に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。
In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 404 and step 405. And the evaluation expression stored in the experience
なお、上記の評価表現検査処理(ステップ300)と、体験表現検査処理(ステップ400)の処理に前後関係はないため、同時に実施することも、どちらか先に実行することも可能である。 Note that the evaluation expression test process (step 300) and the experience expression test process (step 400) are not related to each other, and can be performed at the same time or can be executed first.
また、評価表現検査処理部520と体験表現検査処理部530で両者共形態素解析を行う場合は、処理を高速化するために、両者の処理を実行する前に形態素解析を行うことが望ましい。
Further, when both the morphological analysis is performed by the evaluation expression
上記の図12、図13で示した一連の流れを例を用いて示す。 An example of the series of flows shown in FIGS. 12 and 13 will be described.
図14は、本発明の第1の実施の形態における形態素解析結果の例を示す。同図に示す形態素解析結果の例は、図7のクチコミ情報入力例にある3つのクチコミセットのうち、1つ目のクチコミセットの本文
「私も昨日…とてもよかったです。」
を、前述の「渕武志他、「保守性を考慮した日本語形態素解析システム」、情報処理学会自然言語処理研究会報告、117-09, vol.1997-no.004, pp.59-66」に挙げた形態素解析システムにより、形態素解析した結果を示している。この結果例では、形態素解析により「切り出された語」とその語が分類された「品詞」とその語の「読み」、その語の「原形」がスペース区切りで示されている。例えば、「私」は、「名詞の代名詞」という品詞に分類され、「ワタシ」という読みで、原形が「私」である。
FIG. 14 shows an example of a morphological analysis result in the first embodiment of the present invention. The example of the morphological analysis result shown in the figure is the text of the first review set of the three review sets in the review information input example of FIG. 7 “I was also very good yesterday…”
, "Takeshi Tsuji et al.," Japanese Morphological Analysis System Considering Conservativeness ", Report of the Society for Natural Language Processing, Information Processing Society of Japan, 117-09, vol.1997-no.004, pp.59-66 The results of morphological analysis using the morphological analysis system listed in Fig. 5 are shown. In this result example, “words extracted” by morphological analysis, “parts of speech” in which the words are classified, “reading” of the words, and “original form” of the words are shown separated by spaces. For example, “I” is classified as a part of speech called “pronoun of noun”, and it reads “I” and the original form is “I”.
その後、評価表現検査処理部520において、上記で原形として出力された語と評価表現記憶部20に格納されている評価表現と照合する。図14のような評価表現記憶部20の例がある場合、「良い」が一致する。
Thereafter, the evaluation expression
体験表現検査処理部530においては、体験表現記憶部21に格納されている体験表現と形態素解析結果を照合する。図14のような体験表現記憶部21の例があった場合、動詞の過去形が体験表現記憶部21に格納されているという特徴から、動詞として形態素解析された語に着目する。図14の形態素解析結果例で、動詞に関わるのは、「動詞語幹、動詞活用語尾、動詞接尾辞、動詞語幹の連用、動詞接尾辞の終止」の「行ってみました」である。「行ってみました」は、過去形であり、また、「行ってみた」の丁寧な表現であるので、同一のものと見なされることから、体験表現記憶部21の例に格納されている「行ってみた」と一致する。
In the experience expression
次に、クチコミ情報判定処理部540におけるステップ500のクチコミ情報判定処理について説明する。
Next, the word-of-mouth information determination processing in
図15は、本発明の第1の実施の形態におけるクチコミ情報判定処理のフローチャートである。 FIG. 15 is a flowchart of word-of-mouth information determination processing according to the first embodiment of this invention.
ステップ501) クチコミ情報判定処理部540は、データ記憶部501から、各本文の数S、各本文に含まれる体験表現のあり/なし、各本文に含まれる評価表現のあり/なしを読み込む。ここでは、図16に示すようなデータが読み込まれたものとする。
Step 501) The word-of-mouth information
ステップ502) sに1を代入し、kに0を代入する。ここで、sは文書数のカウントであり、kはクチコミ表現と判定された情報セット数である。
Step 502)
ステップ503) s>Sであればステップ507に移行する。
Step 503) If s> S, go to
ステップ504) s番目の本文にクチコミ表現があるかを判定し、ない場合にはステップ506に移行する。 Step 504) It is determined whether there is a word of mouth expression in the sth body.
ステップ505) ステップ504においてクチコミ表現がある場合は、kに1を加算する。
Step 505) If there is a word-of-mouth expression in
ステップ506) sに1を加算し、ステップ503に移行する。
Step 506) Add 1 to s, and go to
ステップ507) k/S≧X(Xは事前に設定した閾値)である場合はステップ508に移行し、そうでない場合はステップ509に移行する。 Step 507) If k / S ≧ X (X is a preset threshold value), the process proceeds to Step 508, and otherwise, the process proceeds to Step 509.
ステップ508) 入力文書がクチコミ情報であると判定する。 Step 508) It is determined that the input document is word-of-mouth information.
ステップ509) 入力文書がクチコミ情報でないと判定する。 Step 509) It is determined that the input document is not word-of-mouth information.
次に、上記のステップ504の処理について詳細に説明する。 Next, the processing in step 504 will be described in detail.
図17は、本発明の第1の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。 FIG. 17 is a flowchart for determining whether or not there is a word-of-mouth expression according to the first embodiment of this invention.
ステップ5041) データ記憶部501(例えば、図16の例)から読み出した、s番目の本文に評価表現と体験表現の両方があるか判定し、両方ある場合には、ステップ5042に移行し、ない場合にはステップ5043に移行する。 Step 5041) It is determined whether there is both an evaluation expression and an experience expression in the s-th body read from the data storage unit 501 (for example, the example of FIG. 16). In the case, the process proceeds to step 5043.
ステップ5042) s番目の本文には「クチコミ表現があり」と判定する。 Step 5042) It is determined that “there is a word of mouth” in the sth body.
ステップ5043) s番目の本文には「クチコミ表現なし」と判定する。 Step 5043) It is determined that there is no word-of-mouth expression in the sth body.
なお、上記の第1の実施の形態における図10に示す複数筆者検査処理及び、図11に示す本文抽出処理は省略することも可能である。 Note that the multi-writer inspection process shown in FIG. 10 and the text extraction process shown in FIG. 11 in the first embodiment may be omitted.
[第2の実施の形態]
本実施の形態でも、第1の実施の形態と同様に、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。
[Second Embodiment]
Also in the present embodiment, as in the first embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body.
本実施の形態では、複数筆者検査処理については、前述の第1の実施の形態と同様の動作であるため、説明を省略する。なお、複数筆者検査処理を行うか否かは任意であり、省略することも可能である。 In the present embodiment, the multi-writer inspection process is the same operation as that of the first embodiment described above, and thus the description thereof is omitted. It should be noted that whether or not to perform the multi-writer inspection process is arbitrary and can be omitted.
図18は、本発明の第2の実施の形態における本文抽出のフローチャートである。同図において、図11と同一の動作については同一のステップ番号を付し、その説明を省略する。 FIG. 18 is a flowchart of text extraction in the second embodiment of this invention. In the figure, the same operations as those in FIG. 11 are denoted by the same step numbers, and the description thereof is omitted.
ステップ204において、s>Sであるかを判定し、s≦Sであれば、s番目の本文に含まれる文章数N(s)を検出し、N(s)をデータ記憶部501に格納する(N(s)>0)(ステップ221)。以降の処理については図11と同様である。但し、データ記憶部501に出力されるのは、各クチコミセットの本文に加えて、本文それぞれに含まれる文章数N(1),…,N(S)が出力される。
In
次に、本実施の形態における評価表現検査処理について説明する。 Next, the evaluation expression inspection process in this embodiment will be described.
図19は、本発明の第2の実施の形態における評価表現検査処理のフローチャートである。 FIG. 19 is a flowchart of the evaluation expression checking process in the second embodiment of the present invention.
ステップ321) データ記憶部501から各クチコミセットの本文と本文の数Sが評価表現検査処理部520に入力される。
Step 321) The text of each word-of-mouth set and the number S of text are input from the
ステップ322) 評価表現検査処理部520は、1をsに代入する。
Step 322) The evaluation expression
ステップ323) s>Sであれば処理を終了する。 Step 323) If s> S, the process ends.
ステップ324) s番目の本文に対して形態素解析を行う。 Step 324) Perform morphological analysis on the sth body.
ステップ325) 形態素解析結果と評価表現記憶部20に格納されている評価表現を照合し、合致する表現と、合致する表現の数h(s)を調べる。
Step 325) The morpheme analysis result and the evaluation expression stored in the evaluation
ステップ326) ステップ325において評価表現記憶部20に合致する表現があり、合致する表現の数h(s)>0である場合には、ステップ327に移行し、そうでない場合には、ステップ328に移行する。
Step 326) If there is a matching expression in the evaluation
ステップ327) 「s番目に本文に評価表現あり」と判定し、合致した表現と、合致した表現の数h(s)をデータ記憶部501に格納し、ステップ329に移行する。
Step 327) It is determined that “the s-th body has an evaluation expression”, the matched expression and the number h (s) of the matched expressions are stored in the
なお、合致する表現をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。
Note that storing matching expressions in the
ステップ328) 「s番目に本文に評価表現なし」と判定し、判定結果(評価表現なし)をデータ記憶部501に格納する。
Step 328) It is determined that “the s-th body has no evaluation expression”, and the determination result (no evaluation expression) is stored in the
ステップ329) sに1を加算し、ステップ323に移行する。 Step 329) Add 1 to s and proceed to Step 323.
上記の処理において、データ記憶部501に出力されるのは、各本文中の評価表現の有無、評価表現がある本文中の評価表現、及び、評価表現がある本文中の評価表現の数h(s)である。
In the above processing, the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ324とステップ325の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。
In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the s-th is used instead of
図20は、本発明の第2の実施の形態における体験表現検査処理のフローチャートである。 FIG. 20 is a flowchart of the experience expression inspection process in the second embodiment of the present invention.
ステップ421) 体験表現検査処理部530に、データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。
Step 421) The text of each word-of-mouth set and the number S of text are input from the
ステップ422) 1をsに代入する。
Step 422)
ステップ423) s>Sとなった場合には処理を終了する。 Step 423) If s> S, the process is terminated.
ステップ424) s番目の本文に対して形態素解析を行う。形態素解析では、体験表現に該当するような名詞、形容詞、形容動詞等の特定の品詞を抽出することが望ましい。 Step 424) Morphological analysis is performed on the sth body. In morphological analysis, it is desirable to extract specific parts of speech such as nouns, adjectives and adjective verbs that correspond to the experiential expression.
ステップ425) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現及び合致する表現の数を調べる。
Step 425) The morphological analysis result and the experience expression stored in the experience
ステップ426) 合致する表現がある場合(t(s)>0)はステップ427に移行し、ない場合にはステップ428に移行する。 Step 426) If there is a matching expression (t (s)> 0), the process proceeds to step 427, and if not, the process proceeds to step 428.
ステップ427) 「s番目の本文に体験表現あり」と判定し、(合致した表現と)合致した表現の数t(s)をデータ記憶部501に格納し、ステップ409に移行する。また、データ記憶部501に格納されるデータとしては、「体験表現あり」の他に、体験表現とその数t(s)を蓄積する。
Step 427) It is determined that “the s-th body has an experience expression”, the number of matched expressions t (s) (with the matched expression) is stored in the
なお、合致する表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。
Note that storing the number of matching expressions in the
ステップ428) 「s番目の本文に体験表現なし」と判定し、データ記憶部501に格納する。
Step 428) It is determined that “the s-th body has no experience expression” and is stored in the
ステップ429) sに1を加算し、ステップ423に移行する。 Step 429) Add 1 to s and proceed to Step 423.
当該処理において、データ記憶部501に出力されるのは、図21に示すように、各本文中の体験表現の有無、体験表現がある本文中の体験表現及び、体験表現がある本文中の体験表現の数t(s)である。
In this processing, as shown in FIG. 21, the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ424とステップ425の代わりに、s番目の本文と体験表現記憶部21に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるか、合致する表現がある場合には、その数t(s)を調べる。
In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of
また、評価表現検査処理部520と体験表現検査処理部530で両者共、形態素解析を行う場合は、処理を高速化するために、両者の処理を実行する前に形態素解析を行うことが望ましい。
When both the evaluation expression
図22は、本発明の第2の実施の形態におけるクチコミ情報判定処理のフローチャートである。 FIG. 22 is a flowchart of the word-of-mouth information determination process in the second embodiment of the present invention.
クチコミ判定処理については、前述の第1の実施の形態における図15の動作のステップ501とステップ504以外の処理については同様である。
The review determination process is the same for the processes other than
ステップ501においては、データ記憶部501から
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文に含まれる体験表現とその数:t(1),…,t(S);
・各本文に含まれる評価表現とその数:h(1),…,h(S);
が入力される。
In
・ The number of sentences included in each text: N (1), ..., N (S);
・ Experience expressions included in each text and the number thereof: t (1), ..., t (S);
-Evaluation expressions included in each text and the number thereof: h (1), ..., h (S);
Is entered.
以下に、本実施の形態における、図22におけるステップ504の処理について説明する。 Hereinafter, the processing in step 504 in FIG. 22 in the present embodiment will be described.
図23は、本発明の第2の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。 FIG. 23 is a flowchart for determining whether or not there is a word-of-mouth expression in the second embodiment of the present invention.
ステップ5051) クチコミ情報判定処理部540は、データ記憶部501から読み出したs番目の本文に評価表現と体験表現の両者があるかを判定し、両方ある場合には、ステップ5053に移行し、ない場合にはステップ5043に移行する。
Step 5051) The word-of-mouth information
ステップ5052) 各本文に含まれる評価表現の出現数h(s)と体験表現の出現数t(s)とを加算し、その数が各クチコミセットの本文それぞれに含まれる文章の数N(s)で除した数が所定の数Y以上であるかを判定する((h(s)+t(s))/N(s)≧Y)。そうであれば、ステップ5053に移行し、そうでなければステップ5054に移行する。 Step 5052) The number of appearances of evaluation expressions h (s) included in each body and the number of appearances of experience expressions t (s) are added, and the number is the number of sentences N (s) included in each body of each review set. ) Is determined whether or not the number divided by a predetermined number Y is equal to or greater than ((h (s) + t (s)) / N (s) ≧ Y). If so, the process proceeds to step 5053, and if not, the process proceeds to step 5054.
ステップ5053) s番目の本文には「クチコミ表現あり」と判定する。 Step 5053) It is determined that “the word-of-mouth expression is present” in the sth body.
ステップ5054) s番目の本文には「クチコミ表現なし」と判定する。 Step 5054) It is determined that there is no word-of-mouth expression in the sth body.
図24に、本実施の形態における出力例を示す。 FIG. 24 shows an output example in the present embodiment.
また、本実施の形態では、
本文の数S;
s番目の本文に含まれる文章の数N(s);
s番目の本文に含まれる体験表現とその数t(s);
s番目の本文に含まれる評価表現とその数h(s);
としたとき、
クチコミ表現あり/なしを判定する式f(H,T)について、評価表現や体験表現全体に重みを付けて計算することもできる。
In the present embodiment,
Number of text S;
the number N (s) of sentences contained in the sth body;
Experience expression included in the sth body and its number t (s);
Evaluation expressions included in the sth body and their number h (s);
When
The formula f (H, T) for determining whether or not there is a wording expression can also be calculated by weighting the entire evaluation expression and experience expression.
例えば、評価表現の重みをE,体験表現の重みをGとしたとき、
f(H,T)=(E×h(s)+G×t(s))/N(s) 式(1)
となる。
For example, when the weight of evaluation expression is E and the weight of experience expression is G,
f (H, T) = (E × h (s) + G × t (s)) / N (s) Equation (1)
It becomes.
また、表現全体ではなく、ある特定の語句のみ重みをつけて計算することも可能である。 It is also possible to calculate by weighting only a specific word, not the entire expression.
それぞれの体験表現もしくは、評価表現の出現数は、評価表現検査処理部520や体験表現検査処理部530にて検出されているため、次のような式ができる。
Since the number of appearances of each experience expression or evaluation expression is detected by the evaluation expression
評価表現の出現種類もしくは、評価表現記憶部20にある評価表現の総数:AH;
体験表現の出現種類もしくは、体験表現記憶部21にある体験表現の総数:AT
ある特定の評価表現:nH(0<n<AH);
ある特定の体験表現:mT(0<m<AT);
s番目の本文の中に出現するnHの数:nH(s) (0≦nH(s)≦h(s));
s番目の本文の中に出現するmtの数:mT(s) (0≦mT(s)≦t(s));
ある特定の表現nHにかかる重み:ne;
ある特定の表現nTにかかる重み:ng;
としたとき、
f(H,T)=Σ(ne×nH(s))+Σ(ng×mT(s)) 式(2)
各表現に対する重みがそれぞれ1である場合は、
h(s)=ΣnH(s),
t(s)=ΣmT(s)
となる。つまり、s番目の本文に含まれる評価表現と体験表現の数と等しくなる。
Appearance types of evaluation expressions or the total number of evaluation expressions in the evaluation expression storage unit 20: AH;
Appearance types of experience expressions or total number of experience expressions in the experience expression storage unit 21: AT
A specific evaluation expression: nH (0 <n <AH);
A specific experience expression: mT (0 <m <AT);
the number of nH appearing in the sth body: nH (s) (0 ≦ nH (s) ≦ h (s));
number of mts appearing in the sth body: mT (s) (0 ≦ mT (s) ≦ t (s));
The weight on a particular expression nH: ne;
Weight on a particular expression nT: ng;
When
f (H, T) = Σ (ne × nH (s)) + Σ (ng × mT (s)) Equation (2)
If the weight for each representation is 1,
h (s) = ΣnH (s),
t (s) = ΣmT (s)
It becomes. That is, it is equal to the number of evaluation expressions and experience expressions included in the sth body.
また、s番目の本文に含まれる文章の数N(s)のとき、
f(H,T)={Σ(ne×nH(s))+Σ(ng×mT(s))}÷N(s) 式(3)
で表すこともできる。式(1)、(2)、(3)ともf(H,T)≧Y(Yは予め設定した閾値)であれば入力がクチコミ表現であると判定することができる。
Also, when the number of sentences included in the sth body text N (s),
f (H, T) = {Σ (ne × nH (s)) + Σ (ng × mT (s))} ÷ N (s) Equation (3)
It can also be expressed as If the expressions (1), (2), and (3) are f (H, T) ≧ Y (Y is a preset threshold value), it can be determined that the input is a word-of-mouth expression.
[第3の実施の形態]
本実施の形態でも、第1の実施の形態と同様に、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。
[Third Embodiment]
Also in the present embodiment, as in the first embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body.
本実施の形態では、複数筆者検査処理については、前述の第1の実施の形態と同様の動作であるため、説明を省略する。なお、複数筆者検査処理を行うか否かは任意であり、省略することも可能である。 In the present embodiment, the multi-writer inspection process is the same operation as that of the first embodiment described above, and thus the description thereof is omitted. It should be noted that whether or not to perform the multi-writer inspection process is arbitrary and can be omitted.
図25は、本発明の第3の実施の形態における本文抽出のフローチャートである。同図において、図11と同一の動作については同一のステップ番号を付し、その説明を省略する。 FIG. 25 is a flowchart of text extraction in the third embodiment of the present invention. In the figure, the same operations as those in FIG. 11 are denoted by the same step numbers, and the description thereof is omitted.
ステップ201〜ステップ204までの処理は、図11と同様であるため、その説明を省略する。 The processing from step 201 to step 204 is the same as that in FIG.
ステップ211) 本文抽出部510は、s番目の本文に含まれる文章数N(s)を検出し、N(s)をデータ記憶部501に格納する(N(s)>0)。
Step 211) The
ステップ212) zに1を代入する。但し、zは本文中の文章のカウントである。
Step 212)
ステップ213) z>N(s)であるかを判定し、そうである場合にはステップ2114に移行し、そうでない場合には、ステップ215に移行する。 Step 213) It is determined whether z> N (s). If so, the process proceeds to Step 2114. If not, the process proceeds to Step 215.
ステップ214) sに1を加算しステップ204に移行する。 Step 214) Add 1 to s and proceed to Step 204.
ステップ215) s番目の本文のz番目の文章に含まれる文の数n(s)(z)を検出し、n(s)(z)をデータ記憶部501に格納する(n(s)(z)>0)。 Step 215) The number n (s) (z) of sentences included in the zth sentence of the sth body is detected, and n (s) (z) is stored in the data storage unit 501 (n (s) ( z)> 0).
ステップ216) s番目の本文のz番目の文章をデータ記憶部501に格納する。
Step 216) The z-th sentence of the s-th body is stored in the
ステップ217) zに1を加算し、ステップ213に移行する。 Step 217) Add 1 to z and go to Step 213.
上記のフローチャートに示す動作により、データ記憶部501に出力される内容は、各クチコミセットの本文それぞれに含まれる文章、各クチコミセットの本文それぞれに含まれる文章の数N(1),…,N(S)、及び、各クチコミセットの本文それぞれに含まれる文章それぞれに含まれる文の数n(1)(1),…,n(S)(N(S))である。
Through the operation shown in the flowchart, the contents output to the
次に、本実施の形態における評価表現検査処理について説明する。 Next, the evaluation expression inspection process in this embodiment will be described.
図26は、本発明の第3の実施の形態における評価表現検査処理のフローチャートである。 FIG. 26 is a flowchart of the evaluation expression checking process in the third embodiment of the present invention.
ステップ341) 評価表現検査処理部520には、本文の数S、本文に含まれる文章と文章数N(1),…,N(S)が入力される。
Step 341) The evaluation expression
ステップ342) sに1を代入し、zに0を代入する。ここで、sは本文の数、zは文章の数である。
Step 342)
ステップ343) sがSより大きければ処理を終了する。 Step 343) If s is larger than S, the process is terminated.
ステップ344) zに1を加算する。 Step 344) Add 1 to z.
ステップ345) zがN(s)より大きければステップ351に移行する。 Step 345) If z is larger than N (s), the process proceeds to Step 351.
ステップ346) s番目の本文のz番目の文章に対して形態素解析を行う。 Step 346) Morphological analysis is performed on the zth sentence of the sth body.
ステップ347) 形態素解析結果と評価表現記憶部20に格納されている評価表現を照合し、合致する表現と合致する表現の数h(s)(z)を調べる。
Step 347) The morpheme analysis result and the evaluation expression stored in the evaluation
ステップ348) 合致する表現があるか(h(s)(z)>0)を判定し、ある場合には、ステップ349に移行し、ない場合にはステップ350に移行する。 Step 348) It is determined whether there is a matching expression (h (s) (z)> 0). If there is, the process proceeds to Step 349, and if not, the process proceeds to Step 350.
ステップ349) 合致する表現と表現の数h(s)(z)をデータ記憶部501に格納し、ステップ344に移行する。なお、合致する表現と表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。
Step 349) The matching expression and the number of expressions h (s) (z) are stored in the
ステップ350) 合致する表現の数=0をデータ記憶部501に格納し、ステップ344に移行する。
Step 350) Store the number of matching expressions = 0 in the
ステップ351) s番目の本文に含まれる文章中に一つでも評価表現が含まれれば、「評価表現あり」とし、含まれなければ「評価表現なし」と判定する。 Step 351) If at least one evaluation expression is included in the sentence included in the sth body, it is determined that there is “evaluation expression”, and if it is not included, it is determined that there is no evaluation expression.
ステップ352) sに1を加算し、zに0を代入し、ステップ343に移行する。 Step 352) Add 1 to s, substitute 0 for z, and go to Step 343.
上記の処理により、データ記憶部501に出力されるのは、各本文中の評価表現の有無、評価表現のある本文中の各文章に含まれる評価表現及び、評価表現がある本文中の各文章に含まれる評価表現の数h(s)(z)である。
As a result of the above processing, the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ346とステップ347の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現、及び評価表現がある本文中の各文章に含まれる評価表現の数h(s)(z)があるかを調べる。 In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 346 and step 347. The number of evaluation expressions h (s) (z) included in each sentence in the body with the matching expression and the evaluation expression. )
図27は、本発明の第3の実施の形態における体験表現検査処理のフローチャートである。 FIG. 27 is a flowchart of the experience expression inspection process in the third embodiment of the present invention.
ステップ441) 体験表現検査処理部530に、本文の数S,本文に含まれる文章と文章数N(1),…,N(S)がデータ記憶部501から入力される。
Step 441) The experience expression
ステップ442) sに1を代入し、zに0を代入する。ここで、sは本文のカウントであり、zは文章数のカウントである。 Step 442) 1 is substituted into s, and 0 is substituted into z. Here, s is a text count, and z is a text count.
ステップ443) s>Sであるかを判定し、そうである場合には処理を終了する。 Step 443) It is determined whether or not s> S. If so, the process ends.
ステップ444) zに1を加算する。 Step 444) Add 1 to z.
ステップ445) z>N(s)であるかを判定し、そうである場合には、ステップ451に移行する。 Step 445) It is determined whether z> N (s). If so, the process proceeds to Step 451.
ステップ446) s番目の本文のz番目の文章に対して形態素解析を行う。 Step 446) Perform morphological analysis on the zth sentence of the sth body.
ステップ447) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現と、合致する表現の数t(s)(z)を調べる。
Step 447) The morpheme analysis result and the experience expression stored in the experience
ステップ448) 合致する表現があるか(t(s)(z)>0)を判定し、ある場合には、ステップ449に移行し、ない場合にはステップ450に移行する。 Step 448) It is determined whether there is a matching expression (t (s) (z)> 0). If there is a matching expression, the process proceeds to Step 449, and if not, the process proceeds to Step 450.
ステップ449) 合致する表現と合致する表現の数t(s)(z)をデータ記憶部501に格納し、ステップ444に移行する。なお、合致する表現と合致する表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。
Step 449) The number t (s) (z) of the matching expressions and the matching expressions are stored in the
ステップ450) 合致する表現の数(t(s)(z)=0)をデータ記憶部501に格納し、ステップ444に移行する。
Step 450) The number of matching expressions (t (s) (z) = 0) is stored in the
ステップ451) s番目の本文に含まれる文章中に1つでも体験表現が含まれてていれば、「体験表現あり」、その体験表現、体験表現の数をデータ記憶部501に格納し、含まれなければ「体験表現なし」と判定し、「体験なし」をデータ記憶部501に格納する。
Step 451) If at least one experiential expression is included in the text included in the sth body, “experience expression is present”, the experiential expression and the number of experiential expressions are stored in the
ステップ452) sに1を加算し、zに0を代入する。 Step 452) Add 1 to s and substitute 0 for z.
上記の処理の結果、データ記憶部501には、各本文中の体験表現の有無、体験表現がある本文中の各文章に含まれる体験表現、および、体験表現がある本文中の各文章に含まれる体験表現の数t(s)(z)が格納される。
As a result of the above processing, the
なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ446とステップ447の代わりに、s番目の本文と体験表現記憶部21に格納されている体験表現について文字列マッチングにより照合し、合致する表現、及び体験表現がある本文中の各文章に含まれる体験表現の数t(s)(z)があるかを調べる。
In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of
次に、クチコミ情報判定処理を行う。クチコミ判定処理については、前述の第1の実施の形態における図15のステップ501、ステップ504以外の処理について同様である。
Next, word-of-mouth information determination processing is performed. The review determination process is the same for the processes other than
図28は、本発明の第3の実施の形態におけるクチコミ情報判定処理のフローチャートである。ステップ501において、
・本文の数S;
・各本文に含まれる文章の数N(1),…,N(S);
・各本文の各文章に含まれる文の数n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数h(1)(1),…,h(S)(N(S));
が入力される。
FIG. 28 is a flowchart of the word-of-mouth information determination process in the third embodiment of the present invention. In
-Number of text S;
・ The number of sentences included in each text N (1), ..., N (S);
The number of sentences included in each sentence of each body text n (1) (1),..., N (S) (N (S));
・ Experience expressions and their numbers t (1) (1),..., T (S) (N (S)) included in each sentence of each text;
・ Evaluation expressions included in each sentence of each body and the number h (1) (1),..., H (S) (N (S));
Is entered.
以下に、本実施の形態における、図15におけるステップ504の処理について図29を用いて説明する。 The processing in step 504 in FIG. 15 in the present embodiment will be described below with reference to FIG.
図29は、本発明の第3の実施の形態におけるクチコミ表現有無の判定のフローチャートである。 FIG. 29 is a flowchart of the determination of the presence / absence of word-of-mouth expression in the third embodiment of the present invention.
なお、本実施の形態では、図28のステップ501において、クチコミ情報判定処理部540にデータ記憶部501から上記の内容が入力されるものとする。上記の例として例えば、図30に示すような内容が入力される。
In the present embodiment, it is assumed that the above-described contents are input from the
以下に、ステップ504の処理について説明する。 Hereinafter, the processing of step 504 will be described.
ステップ5061) クチコミ情報判定処理部540は、s番目の本文に評価表現と体験表現の両者があるかを判定し、ある場合にはステップ5062に移行し、ない場合には、ステップ5067に移行する。
Step 5061) The word-of-mouth information
ステップ5062) zに1を代入する。
Step 5062)
ステップ5063) z>N(s)であるかを判定し、そうであればステップ5067に移行し、そうでなければステップ5064に移行する。
Step 5063) It is determined whether z> N (s). If so, the process goes to Step 5067, and if not, the process goes to
ステップ5064) (h(s)(z)+t(s)(z))/n(s)(z)≧Y(但し、Yは予め設定された閾値)であるかを判定し、そうであれば、ステップ5065に移行し、そうでなければステップ5066に移行する。 Step 5064) It is determined whether (h (s) (z) + t (s) (z)) / n (s) (z) ≧ Y (where Y is a preset threshold value). If not, the process proceeds to step 5065. Otherwise, the process proceeds to step 5066.
なお、上記の(h(s)(z)+t(s)(z))/n(s)(z)≧Yの条件の代わりに、h(s)(z)+t(s)(z)≧Yを用いて判定してもよい。 In addition, instead of the above condition (h (s) (z) + t (s) (z)) / n (s) (z) ≧ Y, h (s) (z) + t (s) (z) It may be determined using ≧ Y.
ステップ5065) s番目の本文には「クチコミ表現あり」と判定する。 Step 5065) It is determined that “the word-of-mouth expression is present” in the sth body.
ステップ5067) s番目の本文には「クチコミ表現なし」と判定する。 Step 5067) It is determined that the s-th body has no word-of-mouth expression.
上記の処理により前述の図24のような出力が得られる。 With the above processing, the output as shown in FIG. 24 is obtained.
また、本実施の形態では、
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文の各文章に含まれる文の数:n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数:t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数:h(1)(1),…,h(S)(N(S));
としたとき、
f(H,T)は、評価表現や体験表現全体に重みを付けて計算することもできる。
In the present embodiment,
・ Number of text: S;
・ The number of sentences included in each text: N (1), ..., N (S);
-Number of sentences included in each sentence of each body: n (1) (1), ..., n (S) (N (S));
・ Experience expressions included in each sentence of each body and the number thereof: t (1) (1),..., T (S) (N (S));
-Evaluation expressions included in each sentence of each body and the number thereof: h (1) (1), ..., h (S) (N (S));
When
f (H, T) can also be calculated by weighting the entire evaluation expression and experience expression.
例えば、評価表現の重みをE、体験表現の重みをGとしたとき、
f(H,T)=(E×h(s)(z)+G×t(s)(z))/n(s)(z) 式(4)
また、表現全体ではなく、ある特定の語句にのみ重みを付けて計算することも可能である。それぞれの体験表現もしくは評価表現の出現数は、評価表現検査処理部520や体験表現検査処理部530にて検出されているため、次のような式ができる。
For example, when the weight of evaluation expression is E and the weight of experience expression is G,
f (H, T) = (E × h (s) (z) + G × t (s) (z)) / n (s) (z) Equation (4)
It is also possible to calculate by weighting only a specific phrase, not the entire expression. Since the number of appearances of each experience expression or evaluation expression is detected by the evaluation expression
評価表現の出現種類もしくは、評価表現記憶部20にある評価表現の総数:AH;
体験表現の出現種類もしくは、体験表現記憶部21にある体験表現の総数:AT;
ある特定の評価表現:nH(0<n<AH);
ある特定の体験表現:mT(0<m<AT);
s番目の本文のある文章zの中に出現するnHの数:nH(s)(z)
(0≦nH(s)(z)≦h(s)(z))
s番目の本文にある文章zの中に出現するmTの数:mT(s)(z)
(0≦mT(s)(z)≦t(s)(z))
ある特定の表現nHにかかる重み:ne;
ある特定の表現nTにかかる重み:ng;
としたとき、
f(H,T)=Σ(ne×nH(s)(z))+Σ(ng×mT(s)(z)) 式(5)
各表現に対する重みがそれぞれ1である場合は、
h(s)(z)=ΣnH(s)(z),
t(s)(z)=ΣmT(s)(z)
となる。つまり、s番目の本文のz番目の文章に含まれる評価表現と体験表現の数と等しくなる。
Appearance types of evaluation expressions or the total number of evaluation expressions in the evaluation expression storage unit 20: AH;
Type of appearance of experience expression or total number of experience expressions in experience expression storage unit 21: AT;
A specific evaluation expression: nH (0 <n <AH);
A specific experience expression: mT (0 <m <AT);
The number of nH appearing in the sentence z with the sth body: nH (s) (z)
(0 ≦ nH (s) (z) ≦ h (s) (z))
The number of mTs that appear in the sentence z in the sth body: mT (s) (z)
(0 ≦ mT (s) (z) ≦ t (s) (z))
The weight on a particular expression nH: ne;
Weight on a particular expression nT: ng;
When
f (H, T) = Σ (ne × nH (s) (z)) + Σ (ng × mT (s) (z)) Equation (5)
If the weight for each representation is 1,
h (s) (z) = ΣnH (s) (z),
t (s) (z) = ΣmT (s) (z)
It becomes. That is, it is equal to the number of evaluation expressions and experience expressions included in the zth sentence of the sth body.
また、
f(H,T)={Σ(ne×nH(s)(z))+Σ(ng×mT(s)(z))}
÷n(s)(z) 式(6)
で表すこともできる。式(4)(5)(6)、ともf(H,T)≧Y(Yは予め設定した閾値)であれば、入力がクチコミ表現であると判定することができる。
Also,
f (H, T) = {Σ (ne × nH (s) (z)) + Σ (ng × mT (s) (z))}
÷ n (s) (z) Equation (6)
It can also be expressed as If both formulas (4), (5), and (6) are f (H, T) ≧ Y (Y is a preset threshold value), it can be determined that the input is a word-of-mouth expression.
このf(H,T)は、上記の例に限定されることなく、HとTを用いた計算式で表すことができる。 This f (H, T) is not limited to the above example, and can be expressed by a calculation formula using H and T.
[第4の実施の形態]
本実施の形態は、第1の実施の形態とクチコミ情報判定処理のみが異なる。本実施の形態におけるクチコミ情報判定処理では、入力文書のクチコミ率を求めるものである。他の処理については、第1の実施の形態と同様であるので、以下では、クチコミ情報判定処理のみを説明する。
[Fourth Embodiment]
This embodiment is different from the first embodiment only in word-of-mouth information determination processing. In the word-of-mouth information determination process in the present embodiment, the word-of-mouth rate of the input document is obtained. Since other processes are the same as those in the first embodiment, only the word-of-mouth information determination process will be described below.
図31は、本発明の第4の実施の形態におけるクチコミ情報判定処理のフローチャートである。 FIG. 31 is a flowchart of the word-of-mouth information determination process in the fourth embodiment of the present invention.
ステップ701) クチコミ情報判定処理部540に、データ記憶部501から以下の内容が入力される。
・各本文の数S;
・各本文に含まれる体験表現のあり/なし;
・各本文に含まれる評価表現のあり/なし;
ステップ702) sに1を代入し、kに0を代入する。ここで、sは本文のカウントであり、kはクチコミ表現と判定されたクチコミ情報セット数である。
Step 701) The following information is input from the
・ The number S of each text;
・ With / without experience expression included in each text;
・ With / without evaluation expression included in each text;
Step 702)
ステップ703) s>Sであればステップ707に移行する。 Step 703) If s> S, go to Step 707.
ステップ704) s番目の本文にクチコミ表現があるかを判定し、ない場合には、ステップ706に移行し、ある場合はステップ705に移行する。本ステップの詳細な処理については、前述の図17の処理を行う。 Step 704) It is determined whether there is a word-of-mouth expression in the s-th body. For the detailed processing of this step, the above-described processing of FIG. 17 is performed.
ステップ705) kに1を加算する。 Step 705) Add 1 to k.
ステップ706) sに1を加算し、ステップ703に移行する。
Step 706) Add 1 to s, and go to
ステップ707) 入力文書のクチコミ率を、K/S*100(%)により計算し、出力する。但し、上記のk,Kは、クチコミ表現と判定された情報セット数である。 Step 707) The word-of-mouth rate of the input document is calculated by K / S * 100 (%) and output. However, the above k and K are the number of information sets determined as word-of-mouth expressions.
上記のステップ707について説明する。当該ステップ707は、入力文書全体がクチコミ情報かどうか、もしくは、クチコミ率は何%かを判定する。この判定方法は、次のような関数で表すことができる。 The above step 707 will be described. In step 707, it is determined whether the entire input document is word-of-mouth information or the word-of-mouth rate is what percentage. This determination method can be expressed by the following function.
f(K,S)
K:クチコミ表現と判定されたクチコミ情報セット数≧0
S:入力されたクチコミ情報セット数(=本文の数)≧1
例えば、
f(K,S)=K÷Sとし、
f(K,S)は、クチコミ率として次のように表現することができる。
f (K, S)
K: Number of word-of-mouth information sets determined as word-of-mouth expression ≧ 0
S: Number of input review information sets (= number of texts) ≧ 1
For example,
f (K, S) = K ÷ S,
f (K, S) can be expressed as a word-of-mouth rate as follows.
f(K,S)=K÷S×100
本実施の形態では、クチコミ率のみが出力される。
f (K, S) = K ÷ S × 100
In this embodiment, only the word-of-mouth rate is output.
[第5の実施の形態]
本実施の形態は、第2の実施の形態とクチコミ情報判定処理のみが異なる。本実施の形態におけるクチコミ情報判定処理では、入力文書のクチコミ率を求めるものである。他の処理については、第2の実施の形態と同様であるので、以下では、クチコミ情報判定処理のみを説明する。
[Fifth Embodiment]
This embodiment is different from the second embodiment only in the word-of-mouth information determination process. In the word-of-mouth information determination process in the present embodiment, the word-of-mouth rate of the input document is obtained. Since other processes are the same as those in the second embodiment, only the word-of-mouth information determination process will be described below.
図32は、本発明の第5の実施の形態におけるクチコミ情報判定処理のフローチャートである。 FIG. 32 is a flowchart of word-of-mouth information determination processing in the fifth embodiment of the present invention.
ステップ801において、
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文に含まれる体験表現とその数:t(1),…,t(S);
・各本文に含まれる評価表現とその数:h(1),…,h(S);
が入力される。
In
・ Number of text: S;
・ The number of sentences included in each text: N (1), ..., N (S);
・ Experience expressions included in each text and the number thereof: t (1), ..., t (S);
-Evaluation expressions included in each text and the number thereof: h (1), ..., h (S);
Is entered.
クチコミ情報判定処理においては、前述の第4の実施の形態における図31の処理と同様である。但し、ステップ704において、図23のステップ゜5052に示すクチコミ表現あり/なしを判定するための式((h(s)+t(s))/N(s)≧Y)を用いる。
The review information determination process is the same as the process of FIG. 31 in the fourth embodiment described above. However, in
上記の処理により、本実施の形態では、図33に示すような結果が出力される。 With the above processing, in the present embodiment, a result as shown in FIG. 33 is output.
また、本実施の形態において、前述の第2の実施の形態と同様にクチコミ判定処理において、重みを付けることも可能である。 In the present embodiment, it is also possible to add a weight in the word-of-mouth determination process as in the second embodiment described above.
[第6の実施の形態]
本実施の形態では、前述の第3の実施の形態とは、クチコミ情報判定処理において入力文書のクチコミ率を求める点のみが異なる。
[Sixth Embodiment]
This embodiment is different from the above-described third embodiment only in that the word-of-mouth rate of the input document is obtained in the word-of-mouth information determination process.
図34は、本発明の第6の実施の形態におけるクチコミ判定処理のフローチャートである。同図に示すフローチャートは、前述の第4の実施の形態における図31のフローチャートのステップ701のみが異なり、他の処理については第4の実施の形態と同様であるため、説明を省略する。 FIG. 34 is a flowchart of the word-of-mouth determination process in the sixth embodiment of the present invention. The flowchart shown in the figure is different from the flowchart of FIG. 31 in the above-described fourth embodiment only, and the other processes are the same as those of the fourth embodiment, and thus description thereof is omitted.
ステップ901) クチコミ情報判定処理部540に、データ記憶部501から以下の内容が入力される。
・各本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文の各文章に含まれる文の数n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数:t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数:h(1)(1),…,h(S)(N(S));
また、本実施の形態では、ステップ704の処理として、前述の第3の実施の形態と同様に図29の処理を行うものであるので、その説明を省略する。
Step 901) The following information is input from the
・ Number of texts: S;
・ The number of sentences included in each text: N (1), ..., N (S);
The number of sentences included in each sentence of each body text n (1) (1),..., N (S) (N (S));
・ Experience expressions included in each sentence of each body and the number thereof: t (1) (1),..., T (S) (N (S));
-Evaluation expressions included in each sentence of each body and the number thereof: h (1) (1), ..., h (S) (N (S));
Further, in the present embodiment, as the processing in
上記の処理の結果、図33に示す結果が出力される。 As a result of the above processing, the result shown in FIG. 33 is output.
また、本実施の形態において、前述の第3の実施の形態と同様にクチコミ判定処理において、重みを付けることも可能である。 In the present embodiment, it is also possible to add a weight in the word-of-mouth determination process as in the third embodiment.
なお、上記の第1〜第6の実施の形態に示す動作をプログラムとして構築し、評価表現記憶部20、体験表現記憶部21、データ記憶部501を有するコンピュータに実行させる、または、ネットワークを介して流通させることが可能である。
The operations shown in the first to sixth embodiments are constructed as a program and executed by a computer having the evaluation
また、構築されたプログラムをクチコミ情報判定装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールする、または、配布することが可能である。 Also, the constructed program is stored in a hard disk device connected to a computer used as a word-of-mouth information determination device, a portable storage medium such as a flexible disk, a CD-ROM, etc., and installed in a computer or distributed. Is possible.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、ある物事に関するユーザの声や、評判などを判定する技術や、Web検索の分類技術に適用可能である。 The present invention can be applied to a technique for determining a user's voice and reputation regarding a certain thing, and a Web search classification technique.
10 コンピュータ
11 表示部
12 指示入力部
20 評価表現記憶手段、評価表現記憶部
21 体験表現記憶手段、体験表現記憶部
40 ネットワーク
501 データ記憶手段、データ記憶部
500 複数筆者検査処理部
510 本文抽出処理部
520 評価表現検査手段、評価表現検査部
530 体験表現検査手段、体験表現検査部
540 クチコミ情報判定手段、クチコミ情報判定部
10 Computer 11
Claims (10)
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段の情報を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、
を有することを特徴とするクチコミ情報判定装置。 A word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from the input text,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression, which is a word that evaluates the quality of things, is described in the input text, and the determination result is stored in the data storage means. Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the input text, and the determination result is a data storage means The experiential expression inspection means stored in the
When the information of the data storage means is read out, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth determination means for determining whether or not a word-of-mouth is based on a word-of-mouth determination function represented by an evaluation expression and a calculation formula based on the experience expression;
The word-of-mouth information determination apparatus characterized by having.
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
前記評価表現記憶手段を参照して、前記本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果を前記データ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記本文の中に、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果を前記データ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、
を有することを特徴とするクチコミ情報判定装置。 A word-of-mouth information determination device that determines word-of-mouth information including experiences and complaints about a certain thing in the text entered or the structure of a web page, and complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection means for inspecting whether the text, the name or the symbol set repeatedly appears;
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the text, and the determination result is stored in the data storage means Evaluation expression inspection means to
With reference to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the text, and the determination result is the data storage means The experiential expression inspection means stored in the
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth determination means for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
The word-of-mouth information determination apparatus characterized by having.
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストの全体のうち、前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、
を有することを特徴とするクチコミ情報判定装置。 A word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from the input text,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression, which is a word that evaluates the quality of things, is described in the input text, and the determination result is stored in the data storage means. Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the input text, and the determination result is a data storage means The experiential expression inspection means stored in the
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth rate calculation means for calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information, of the whole of the input text by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
The word-of-mouth information determination apparatus characterized by having.
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
前記評価表現記憶手段を参照して、前記本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記本文の中に、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストまたは前記Webページの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、
を有することを特徴とするクチコミ情報判定装置。 A word-of-mouth information determination device that determines word-of-mouth information including experiences and complaints about a certain thing in the text entered or the structure of a web page, and complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection means for inspecting whether the text, the name or the symbol set repeatedly appears;
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the text, and the determination result is stored in the data storage means Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of things is described in the text, and the determination result is stored in the data storage means Storing experiential expression inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means The word-of-mouth rate calculation that calculates the word-of-mouth rate, which is the ratio occupied by the word-of-mouth information in the input text or the entire Web page, by the word-of-mouth determination function represented by the calculation expression based on the evaluation expression and the experience expression Means,
The word-of-mouth information determination apparatus characterized by having.
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、
を行うことを特徴とするクチコミ情報判定方法。 In the word-of-mouth information determination method for determining word-of-mouth information including experiences related to certain things, comments used, and complaints from the entered text,
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Referring to the experience expression storage means for storing the experience expression, which is a phrase representing the use or experience / experience of things, it is determined whether the experience expression is described in the input text, and the determination result is obtained. An experiential expression inspection step stored in the data storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth determination step for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、前記本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記本文の中に、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、
を行うことを特徴とするクチコミ情報判定方法。 In the word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints about certain things from the text entered or the structure of the web page,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection step for inspecting whether the text, the name or the symbol pair appears repeatedly;
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the text, and the determination result is data An evaluation expression checking step to be stored in the storage means;
Referring to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, it is determined whether the experience expression is described in the text, and the determination result is data An experiential expression inspection step stored in a storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth determination step for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を計算するクチコミ率算出ステップと、
を行うことを特徴とするクチコミ情報判定方法。 In the word-of-mouth information determination method for determining word-of-mouth information including experiences related to certain things, comments used, and complaints from the entered text,
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Referring to the experience expression storage means for storing the experience expression, which is a phrase representing the use or experience / experience of things, it is determined whether the experience expression is described in the input text, and the determination result is obtained. An experiential expression inspection step stored in the data storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information in the whole of the input text, by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、前記本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストまたは前記Webページの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出ステップと、
を行うことを特徴とするクチコミ情報判定方法。 In the word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints about certain things from the text entered or the structure of the web page,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection step for inspecting whether the text, the name or the symbol pair appears repeatedly;
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the text, and the determination result is data An evaluation expression checking step to be stored in the storage means;
Refers to experience expression storage means for storing experience expressions that are words representing use or experience / experience of things, determines whether the experience expressions are described in the text, and stores the determination results as data An experiential expression inspection step stored in the means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step The word-of-mouth rate calculation that calculates the word-of-mouth rate, which is the ratio occupied by the word-of-mouth information in the input text or the entire Web page, by the word-of-mouth determination function represented by the calculation expression based on the evaluation expression and the experience expression Steps,
A word-of-mouth information determination method characterized by:
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、
前記請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させることを特徴とするクチコミ情報判定プログラム。 A word-of-mouth information determination program for determining word-of-mouth information including experience stories, impressions used, and complaints from the text entered or the structure of a web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
In a computer equipped with experience expression storage means for storing experience expressions that are words representing use or experience / experience of things,
A word-of-mouth information determination program for executing the word-of-mouth information determination method according to any one of claims 5 to 8.
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、
前記請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムを格納したことを特徴とするクチコミ情報判定プログラムを格納した記憶媒体。 A storage medium storing a word-of-mouth information determination program for determining word-of-mouth information including experiences, complaints, and complaints related to certain things from the input text or the structure of a web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
In a computer equipped with experience expression storage means for storing experience expressions that are words representing use or experience / experience of things,
9. A storage medium storing a word-of-mouth information determination program, wherein a program for executing a process for realizing the word-of-mouth information determination method according to claim 5 is stored.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061390A JP4293145B2 (en) | 2005-03-04 | 2005-03-04 | Word-of-mouth information determination method, apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061390A JP4293145B2 (en) | 2005-03-04 | 2005-03-04 | Word-of-mouth information determination method, apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006244305A JP2006244305A (en) | 2006-09-14 |
JP4293145B2 true JP4293145B2 (en) | 2009-07-08 |
Family
ID=37050644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005061390A Active JP4293145B2 (en) | 2005-03-04 | 2005-03-04 | Word-of-mouth information determination method, apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4293145B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5070281B2 (en) * | 2007-03-23 | 2012-11-07 | パイオニア株式会社 | Information providing system, information management server, information management method, information management program, and storage medium |
US20090248484A1 (en) * | 2008-03-28 | 2009-10-01 | Microsoft Corporation | Automatic customization and rendering of ads based on detected features in a web page |
JP5187187B2 (en) * | 2008-12-25 | 2013-04-24 | 大日本印刷株式会社 | Experience information search system |
US9152625B2 (en) * | 2011-11-14 | 2015-10-06 | Microsoft Technology Licensing, Llc | Microblog summarization |
US20130238971A1 (en) | 2012-03-07 | 2013-09-12 | Google, Inc. | Propagating user feedback on shared posts |
JP6486760B2 (en) * | 2015-04-30 | 2019-03-20 | Kddi株式会社 | Dialog pattern automatic generation apparatus, method and program |
JPWO2016199401A1 (en) * | 2015-06-11 | 2018-03-29 | 日本電気株式会社 | Information processing apparatus, information analysis apparatus, information processing method, information analysis method, information processing program, and information analysis program |
CN111079026B (en) * | 2019-11-28 | 2023-11-24 | 北京秒针人工智能科技有限公司 | Method, storage medium and device for determining character impression data |
-
2005
- 2005-03-04 JP JP2005061390A patent/JP4293145B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006244305A (en) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Oueslati et al. | A review of sentiment analysis research in Arabic language | |
Kuzman et al. | Automatic genre identification: a survey | |
CN101887414B (en) | Server for automatically scoring opinion conveyed by text message containing pictorial-symbols | |
Hosseini et al. | SentiPers: a sentiment analysis corpus for Persian | |
JP4293145B2 (en) | Word-of-mouth information determination method, apparatus, and program | |
JP4347226B2 (en) | Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method | |
JPWO2009096523A1 (en) | Information analysis apparatus, search system, information analysis method, and information analysis program | |
Itani et al. | Corpora for sentiment analysis of Arabic text in social media | |
JP2010211594A (en) | Text analysis device and method, and program | |
Rahate et al. | Feature selection for sentiment analysis by using svm | |
Serigos | Using distributional semantics in loanword research: A concept-based approach to quantifying semantic specificity of Anglicisms in Spanish | |
Ädel | Corpus compilation | |
Serigos | Applying corpus and computational methods to loanword research: new approaches to Anglicisms in Spanish | |
Park et al. | Web content summarization using social bookmarks: a new approach for social summarization | |
Itani | Sentiment analysis and resources for informal Arabic text on social media | |
Tariku et al. | Sentiment Mining and Aspect Based Summarization of Opinionated Afaan Oromoo News Text | |
Alawami | Aspect terms extraction of Arabic dialects for opinion mining using conditional random fields | |
van der Meer et al. | A framework for automatic annotation of web pages using the Google rich snippets vocabulary | |
Litvak et al. | Multilingual Text Analysis: Challenges, Models, and Approaches | |
JP4539616B2 (en) | Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof | |
JP4726683B2 (en) | EXPERIENCE INFORMATION EXTRACTION METHOD AND DEVICE, PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM | |
KR101265467B1 (en) | Method for extracting experience and classifying verb in blog | |
Lin et al. | The secret to popular Chinese web novels: A corpus-driven study | |
Arora et al. | Web‐Based News Straining and Summarization Using Machine Learning Enabled Communication Techniques for Large‐Scale 5G Networks | |
Nelli | Textual Data Analysis with NLTK |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090330 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4293145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140417 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |