JP4293145B2 - Word-of-mouth information determination method, apparatus, and program - Google Patents

Word-of-mouth information determination method, apparatus, and program Download PDF

Info

Publication number
JP4293145B2
JP4293145B2 JP2005061390A JP2005061390A JP4293145B2 JP 4293145 B2 JP4293145 B2 JP 4293145B2 JP 2005061390 A JP2005061390 A JP 2005061390A JP 2005061390 A JP2005061390 A JP 2005061390A JP 4293145 B2 JP4293145 B2 JP 4293145B2
Authority
JP
Japan
Prior art keywords
expression
experience
word
mouth
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005061390A
Other languages
Japanese (ja)
Other versions
JP2006244305A (en
Inventor
佳代 池田
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005061390A priority Critical patent/JP4293145B2/en
Publication of JP2006244305A publication Critical patent/JP2006244305A/en
Application granted granted Critical
Publication of JP4293145B2 publication Critical patent/JP4293145B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、クチコミ情報判定方法及び装置及びプログラムに係り、特に、インターネットのような、あらゆる種類の情報が混在するような状況の中から、その情報に含まれる文章を解析し、ある物事に関する体験談や利用した感想、苦情などが書かれている「ユーザの声、つまりクチコミ情報」を見分けて判定することができる、体験表現を利用したクチコミ情報判定方法及び装置及びプログラムに関する。   The present invention relates to a word-of-mouth information determination method, apparatus, and program, and in particular, from a situation where all types of information such as the Internet are mixed, the sentence included in the information is analyzed, and an experience related to a certain thing The present invention relates to a word-of-mouth information determination method, an apparatus, and a program using experience expressions, which can distinguish and determine “user's voice, that is, word-of-mouth information” in which talks, comments used, and complaints are written.

近年、ホテルや旅行、電化製品など様々な事柄に関して、多くの人々がインターネット上で個人の意見を公開している。この公開場所は、ショッピングサイト自身が運営しているような様々な人の意見が集まる掲示板や、個人の意見をまとめたWeblogや個人のホームページのような場所等がある。こういったユーザの声は、ユーザの声や評判(以下、クチコミ情報と記す)としてマーケティングや商品開発、商品の購入検討などの支援として利用価値が高い。   In recent years, many people have published their opinions on the Internet regarding various matters such as hotels, travel, and electrical appliances. This public place includes a bulletin board where opinions of various people gathered, such as a shopping site itself, a weblog where personal opinions are gathered, and a personal homepage. Such user's voice is highly useful as support for marketing, product development, product purchase examination, etc. as user's voice and reputation (hereinafter referred to as word-of-mouth information).

現在、クチコミ情報の分析として、ある特定の商品や情報収集先(URLなど)を限定し、文章中からその対象となる物事に依存した記述表現を抽出する以下のような技術が提案されている。   Currently, the following technologies have been proposed for analyzing word-of-mouth information, in which specific products and information collection destinations (URLs, etc.) are limited, and descriptive expressions depending on the subject matter are extracted from sentences. .

第1の技術として、ユーザが入力した商品名と予め辞書として用意した評価表現を近接演算する方法を用いて、インターネットのWebページから意見を抽出する技術がある(例えば、非特許文献1参照)。ここで用いる評価表現とは、物事に対する人の評価を示す表現であり、その辞書は、予め作成した商品カテゴリ毎に用意するものである。この商品カテゴリとは、例えば「書籍」「コンピュータ」「車」等がある。   As a first technique, there is a technique for extracting an opinion from a Web page on the Internet by using a method for calculating a proximity between a product name input by a user and an evaluation expression prepared in advance as a dictionary (see, for example, Non-Patent Document 1). . The evaluation expression used here is an expression indicating a person's evaluation of things, and the dictionary is prepared for each product category created in advance. Examples of the product category include “book”, “computer”, and “car”.

一方、第2の技術として、インターネット検索においては、あるキーワードに関わる企業などのオフィシャルページやショッピングサイト、クチコミ情報など様々なWebページが区別なく、しばしば膨大に出力される。こういった膨大な情報から利用者の欲する情報へナビゲーションするために、出力結果を分析する方法が提案されている。その方法は、検索エンジンで収集したWebページの文書内を解析し、その文書から人名・地名などの特徴的な固有表現を抽出し、それを検索結果に対するインデックスとしてユーザに提示するという、Webページを分類する技術である(例えば、非特許文献2参照)。   On the other hand, as a second technique, in the Internet search, various web pages such as an official page of a company related to a certain keyword, a shopping site, and word-of-mouth information are often output without distinction. In order to navigate from such a vast amount of information to information desired by the user, a method of analyzing the output result has been proposed. The method analyzes a web page document collected by a search engine, extracts a characteristic specific expression such as a person name and a place name from the document, and presents it to a user as an index for a search result. Is a technique for classifying (see, for example, Non-Patent Document 2).

また、第3の技術として、検索結果のURLをもとに、そのコンテンツのタイプ分類をするための提案がある。検索結果で出力されたWebページAのリンク(URL)を含むようなWebページBを分析する。Bの中でAのリンクが埋め込まれている周辺の情報(アンカーテキスト)を解析して、もとのWebコンテンツの形式推定を行う技術である。ユーザは、情報検索時に検索の目的に応じて、コンテンツの機能:「Webコンテンツそのものを得ることで目的を満たす」「Webコンテンツが示す書籍、セミナー等の案内情報によって目的を満たす」等の選択をする必要がある。ここでのコンテンツのタイプとは、「論文」「解説記事」「ニュース」「掲示板」「日記」「サイト」「リンク集」「ガイド」である(例えば、非特許文献3参照)。   As a third technique, there is a proposal for classifying the content type based on the URL of the search result. The Web page B including the link (URL) of the Web page A output as the search result is analyzed. This is a technique for analyzing the surrounding information (anchor text) in which the link of A is embedded in B and estimating the format of the original Web content. The user selects a function of the content at the time of information search, such as the function of the content: “satisfy the purpose by obtaining the web content itself”, “satisfy the purpose by guide information such as a book or seminar indicated by the web content”. There is a need to. The types of content here are “paper”, “commentary article”, “news”, “bulletin board”, “diary”, “site”, “link collection”, and “guide” (for example, see Non-Patent Document 3).

また、上記の第1の技術や第3の技術を利用する場合は、文章の形態素解析を行う必要がある。形態素解析の技術としては、語の共起を用いて同形語の読み分けを行う日本語形態素解析システムである。語の共起は人にとって識別しやすいため、間違えにくく、確実にシステムの精度を上げることができる(例えば、非特許文献4参照)。
立石健二他、「インターネットからの評判情報検索」、情報処理学会研究報告、2001-NL-144, pp.75-82, 2001 戸田浩之他、「特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案」、情報処理学会研究報告、Vol.2004-no.45, 2004-FI-75, pp.99-106 川前徳章他、「Webコンテンツの機能に着目した検索結果の構造化に関する提案」、人口知能学会研究会 SGI-SWO-A303-10 渕武志他、「保守性を考慮した日本語形態素解析システム」、情報処理学会自然言語処理研究会報告、117-09, vol.1997-no.004, pp.59-66
Moreover, when using said 1st technique and 3rd technique, it is necessary to perform the morphological analysis of a sentence. The morpheme analysis technology is a Japanese morpheme analysis system that reads homomorphic words using word co-occurrence. Since co-occurrence of words is easy to identify for a person, it is difficult to make a mistake and the accuracy of the system can be surely improved (see, for example, Non-Patent Document 4).
Kenji Tateishi et al., "Reputation Information Retrieval from the Internet", IPSJ Research Report, 2001-NL-144, pp.75-82, 2001 Hiroyuki Toda et al., “Proposal of Label Oriented Navigation Method Using Characteristic Specific Expression”, Information Processing Society of Japan, Vol.2004-no.45, 2004-FI-75, pp.99-106 Noriaki Kawamae et al., “Proposal on Structuring Search Results Focusing on Web Content Functions”, Institute of Population Intelligence SGI-SWO-A303-10 Takeshi Tsuji et al., "Japanese Morphological Analysis System Considering Conservativeness", Report of the Natural Language Processing Study Group of Information Processing Society of Japan, 117-09, vol.1997-no.004, pp.59-66

本明細書では、「クチコミ情報」を次のように定義する。クチコミ情報は、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものである。例えば、「最近、渋谷に新しくできた○○レストランへ行ってみた。○○レストランは、うわさのカルボナーラが非常に美味しかった。」という文章からは、「行ってみた」という体験と「美味しかった」という意見が入っていることから、○○レストランに対するクチコミ情報といえる。こういったクチコミ情報は、企業において商品開発や商品改良の参考とすることができ、また、一般のユーザが見たときには、購入や旅行先等、選定する際の検討に役立つ有益な情報となる。   In this specification, “review information” is defined as follows. Word-of-mouth information is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.). A person who has experienced or experienced describes their opinions such as their experiences and their experiences. For example, from the sentence, “I recently went to a new restaurant in Shibuya. The restaurant was very delicious with rumored carbonara.” From the sentence “I tried it” and “It was delicious.” It can be said that it is word-of-mouth information for XX restaurant. This kind of word-of-mouth information can be used as a reference for product development and product improvement in companies, and when general users see it, it is useful information useful for consideration when selecting purchases, travel destinations, etc. .

ある文章がクチコミ情報かどうかを判定するとき、上記の従来の第1〜第3の方法では、次のような問題がある。   When determining whether or not a certain sentence is word-of-mouth information, the above-described conventional first to third methods have the following problems.

第1の技術では、評判情報として次の2種類を区別なく扱っている。   In the first technology, the following two types are treated as reputation information without distinction.

1)他の人の体験やレポート、マシンスペックなど提示された条件で、書き手が予想・判断した意見・評価:
(例)「商品Aは、スペックの割には安い」、「Bでは、最近スリが増加していて、治安が悪い」
2)実際に対象となる物事を体験した人の意見・評価(本発明におけるクチコミ情報の定義と同義)
(例)「商品Aを使ってみたら、ディスプレイが暗かった」、「Bへ行ってみたら、街中はそれほど治安が悪くなかった」
しかし、商品購入や旅行先の検討、ダイエット方法の選択など、実際の利用シーンでは、実体験に基づく意見の方が、より重視されることが多いと考えられる。また、第1の技術では、ある特定の商品カテゴリとそれに合わせた辞書を事前に作成しておく必要がある。現在、インターネット上でも様々な物事に関しての意見が公開されているため、それに合わせた全ての辞書を作成することは、非常にコストがかさんでしまう問題がある。
1) Opinions and evaluations predicted and judged by the writer under the conditions presented by other people's experiences, reports, machine specifications, etc .:
(Example) “Product A is cheap for specs”, “In B, the number of pick-ups has increased recently and the security is poor”
2) Opinions and evaluations of people who actually experienced the subject matter (synonymous with the definition of word-of-mouth information in the present invention)
(Example) “When I used Product A, the display was dark”, “When I went to B, the city was not so safe”
However, in actual usage scenes such as purchasing products, considering travel destinations, and selecting dieting methods, opinions based on actual experiences are often considered more important. In the first technique, it is necessary to create a specific product category and a dictionary corresponding to the category beforehand. At present, opinions on various things are published on the Internet, and it is very expensive to create all the dictionaries according to it.

また、第2の技術では、人名や会社名など固有表現で分類しているため、クチコミ情報を判定することはできない。   Further, in the second technique, word-of-mouth information cannot be determined because classification is performed using a unique expression such as a person name or a company name.

また、第3の技術では、掲示板や日記というタイプでは分類はできるが、その中に部分的に含まれている「クチコミ情報」という観点での分類は行っていない。   In the third technique, the bulletin board and diary types can be classified, but classification is not performed from the viewpoint of “word-of-mouth information” partially included therein.

また、前述したクチコミ情報の定義を満たしている情報であっても、ある一個人の意見のみであると、その個人の見解の偏りがクチコミ情報の中に生じている問題もある。しかしながら、閲覧者は、筆者がどのような嗜好を持った人物であるかは不明なため、閲覧者にとっての参考情報になるか否かを判断することが難しい。   Further, even if the information satisfies the above-described definition of the review information, if there is only one opinion, there is a problem that the bias of the opinion of the individual occurs in the review information. However, it is difficult for the viewer to determine whether or not the author has a preference, and thus it is difficult to determine whether or not it is reference information for the viewer.

本発明は上記の点に鑑みなされたもので、分野や対象物を限定せず、インターネットのような、あらゆる種類の情報が混在するような状況の中から、その情報に含まれる文章を解析し、体験表現や評価表現の有無を利用して、ある物事に関する体験談や利用した感想、苦情などが書かれている「ユーザの声、つまりクチコミ情報」を見分けて、判定することが可能なクチコミ情報判定方法及び装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and does not limit the fields and objects, and analyzes sentences contained in the information from situations where all kinds of information such as the Internet are mixed. Reviews that can be identified by distinguishing "user's voice, that is, word-of-mouth information" that contains experiences, impressions, complaints, etc. related to certain things by using the presence or absence of experience expressions and evaluation expressions It is an object to provide an information determination method, apparatus, and program.

図1は、本発明の原理構成図である。   FIG. 1 is a principle configuration diagram of the present invention.

本発明(請求項1)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段20と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段21と、
入力されたテキストに、評価表現記憶手段20を参照して、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段501に格納する評価表現検査手段520と、
入力されたテキストに、体験表現記憶手段21を参照して、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段501に格納する体験表現検査手段530と、
データ記憶手段501の情報を読み出して、評価表現検査手段520で評価表現が記述されていると判定され、かつ、体験表現検査手段530で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段540と、を有する。
The present invention (Claim 1) is a word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from an input text, and complaints,
An evaluation expression storage means 20 for storing an evaluation expression that is a phrase that evaluates the quality of things;
Experience expression storage means 21 for storing experience expressions, which are phrases representing the use or experience / experience of things;
The input text is referred to the evaluation expression storage means 20 to determine whether or not an evaluation expression that is a phrase that evaluates the quality of things is described, and the determination result is stored in the data storage means 501. Evaluation expression checking means 520 for performing,
The input text is referred to the experience expression storage means 21 to determine whether or not an experience expression that is a phrase that represents the use or experience / experience of a thing is described, and the determination result is stored in the data storage means 501. Experiential expression inspection means 530 stored in
When the information stored in the data storage unit 501 is read out, the evaluation expression checking unit 520 determines that the evaluation expression is described, and the experience expression checking unit 530 determines that the experience expression is described. And word-of-mouth determination means 540 for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by an evaluation expression and a calculation formula based on the experience expression.

本発明(請求項2)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
評価表現記憶手段を参照して、本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、本文の中に物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、を有する。
The present invention (Claim 2) is a word-of-mouth information determination apparatus that determines word-of-mouth information including experiences and complaints about a certain thing, complaints, and complaints from the input text or the structure of a Web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or , A multi-writer inspection means for inspecting whether the text, the name or the set of symbols appears repeatedly;
An evaluation expression that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a word that evaluates the quality of things is described in the text, and stores the determination result in the data storage means Inspection means;
An experience that refers to experience expression storage means, determines whether the experience expression, which is a phrase that expresses the use or experience / experience of things, is described in the text, and stores the determination result in the data storage means Expression inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth determination means for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項3)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキスト全体のうちのクチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、を有する。
The present invention (Claim 3) is a word-of-mouth information determination apparatus for determining word-of-mouth information including experiences and complaints about a certain thing from the input text, complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
An evaluation that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the input text, and stores the determination result in the data storage means Expression inspection means;
Referring to the experience expression storage means, determine whether the input text contains an experience expression that is a phrase that expresses the use, experience, or experience of things, and stores the determination result in the data storage means An experiential expression inspection means,
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth rate calculating means for calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information in the entire input text, by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項4)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
評価表現記憶手段を参照して、本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
体験表現記憶手段を参照して、本文中に物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
データ記憶手段から判定結果を読み出して、評価表現検査手段で評価表現が記述されていると判定され、かつ、体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストまたはWebページの全体のうちの、クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、を有する。
The present invention (Claim 4) is a word-of-mouth information determination apparatus that determines word-of-mouth information including experiences and complaints about a certain thing in the input text or the structure of the Web page, complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or , A multi-writer inspection means for inspecting whether the text, the name or the set of symbols appears repeatedly;
An evaluation expression that refers to the evaluation expression storage means, determines whether or not an evaluation expression that is a word that evaluates the quality of things is described in the text, and stores the determination result in the data storage means Inspection means;
Experience expression that refers to experience expression storage means, determines whether experience expression that is a phrase that expresses the use or experience / experience of things in the text is described, and stores the determination result in data storage means Inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, the evaluation expression And a word-of-mouth rate calculation means for calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information, of the input text or the entire Web page by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

図2は、本発明の原理を説明するための図である。   FIG. 2 is a diagram for explaining the principle of the present invention.

本発明(請求項5)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップ(ステップ1)と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップ(ステップ2)と、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップ(ステップ3)と、を行う。
The present invention (Claim 5) is a review information determination method for determining review information including experiences, complaints, and complaints related to certain things from the input text.
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step (step 1) stored in the means;
Refers to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, determines whether the experience expression is described in the input text, and the determination result as data An experiential expression inspection step (step 2) to be stored in the storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth determination step (step 3) for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項6)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、を行う。
The present invention (Claim 6) is a word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints related to certain things from the input text or the structure of a Web page.
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or A multi-author inspection step for inspecting whether the text, the name or symbol pair repeatedly appears;
Refers to the evaluation expression storage means for storing the evaluation expression, which is a phrase that evaluates the quality of things, determines whether the evaluation expression is described in the text, and stores the determination result in the data An evaluation expression checking step stored in the means;
Refers to the experience expression storage means for storing the experience expression that is a phrase representing the use or experience / experience of things, determines whether the experience expression is described in the text, and the determination result as a data storage means And the experience expression inspection step to be stored in
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth determination step for determining whether or not the word-of-mouth is a word of mouth by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項7)は、入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストの全体のうちのクチコミ情報が占める比率であるクチコミ率を計算するクチコミ率算出ステップと、を行う。
The present invention (Claim 7) is a review information determination method for determining review information including experiences, complaints, and complaints related to certain things from the input text.
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Refers to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, determines whether the experience expression is described in the input text, and the determination result as data An experiential expression inspection step stored in a storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by word-of-mouth information in the entire input text, using a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項8)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、本文の中に該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
データ記憶手段から判定結果を読み出して、評価表現検査ステップで評価表現が記述されていると判定され、かつ、体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力されたテキストまたはWebページの全体のうちの、クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出ステップと、を行う。
The present invention (Claim 8) is a word-of-mouth information determination method for determining word-of-mouth information including experience stories, impressions used, and complaints related to certain things from the input text or the structure of a Web page.
A set of one or more sentences and a name or symbol including the writer's name or nickname of the body, date information describing the body, in the input text or web page structure, or A multi-author inspection step for inspecting whether the text, the name or symbol pair repeatedly appears;
Refers to an evaluation expression storage means for storing an evaluation expression that is a word that evaluates the quality of things, determines whether or not the evaluation expression is described in the text, and determines the determination result as a data storage means An evaluation expression checking step to be stored in
Refers to the experience expression storage means for storing the experience expression that is a phrase representing the use or experience / experience of things, determines whether the experience expression is described in the text, and the determination result as a data storage means And the experience expression inspection step to be stored in
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the evaluation expression is determined to be described in the experience expression inspection step, the evaluation expression And a word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information, of the input text or the entire Web page by a word-of-mouth determination function represented by a calculation formula based on the experience expression.

本発明(請求項9)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムであって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムである。
The present invention (Claim 9) is a word-of-mouth information determination program for determining word-of-mouth information including input from an input text or an experience story about a certain thing from the structure of a Web page, a complaint,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
9. A process for realizing the word-of-mouth information determination method according to claim 5 on a computer comprising experience expression storage means for storing an experience expression that is a phrase representing use or experience / experience of things. It is a program to let you.

本発明(請求項10)は、入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムを格納した記憶媒体であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムを格納した記憶媒体である。
The present invention (Claim 10) stores a word-of-mouth information determination program for determining word-of-mouth information including experience stories, impressions used, and complaints related to certain things from the input text or the structure of a Web page. A medium,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
9. A process for realizing the word-of-mouth information determination method according to claim 5 on a computer comprising experience expression storage means for storing an experience expression that is a phrase representing use or experience / experience of things. A storage medium storing a program to be executed.

クチコミ情報は、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものである。例えば、「最近、渋谷に新しくできた○○レストランへ行ってみた。○○レストランは、うわさのカルボナーラが非常に美味しかった。」という文章からは、「行ってみた」という体験と「美味しかった」という意見が入っていることから、○○レストランに対するクチコミ情報といえる。このようにクチコミ情報は、対象となる物事とともに、上記に述べたような体験表現(例:行ってみた)やそれを評価している評価表現(例:美味しかった)を含んでいるものといえる。また、クチコミ情報は、あらゆる物事に関して記述されているため、分野や対象物に依存せず判定できることが望ましい。   Word-of-mouth information is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.). A person who has experienced or experienced describes their opinions such as their experiences and their experiences. For example, from the sentence, “I recently went to a new restaurant in Shibuya. The restaurant was very delicious with rumored carbonara.” From the sentence “I tried it” and “It was delicious.” It can be said that it is word-of-mouth information for XX restaurant. Thus, it can be said that the word-of-mouth information includes not only the subject matter but also the experience expression as described above (eg: I tried it) and the evaluation expression (eg: it was delicious) that evaluates it. . In addition, since the word-of-mouth information is described with respect to all things, it is desirable that it can be determined without depending on the field or the object.

本発明によれば、今まで利用されることのなかった体験表現の有無の検査を用いることで、前述の発明が解決しようとする課題の欄で挙げた2種類の評判情報を区別し、クチコミ情報「利用者の体験・経験による意見が書き込まれている情報」かどうかを判断することができる。この体験表現は、クチコミ情報の対象となる物事に依存しない。評価表現と体験表現の両者が記述されているかどうかを確認することで、対象となる物事が何であるかに関わらず、クチコミ情報かどうかを判断することができる。   According to the present invention, it is possible to distinguish two kinds of reputation information mentioned in the column of the problem to be solved by the above-mentioned invention by using the presence / absence of the experience expression that has not been used so far. It is possible to determine whether the information is “information in which opinions based on the user's experience / experience are written”. This expression of experience does not depend on the subject matter of the word of mouth information. By confirming whether both the evaluation expression and the experience expression are described, it is possible to determine whether or not the information is word-of-mouth information regardless of what the object is.

また、上記に加えて、ある対象となる物事について、複数の人のクチコミ情報が集まっているようなWebページもしくは、テキストをクチコミ情報として判定することもできる。通常、クチコミ情報を閲覧する場合、ある個人の1つのクチコミ情報のみを見て満足することは少なく、複数のクチコミ情報を参照し、多面的な情報を得ることが多い。つまり、先に述べた効果によって、閲覧者が一度に複数の人の意見を見ることができ、複数のクチコミ情報ページを参照する手間も省くことができる。この判定方法においては、筆者を特定するような名前やニックネームなどを示す「名前」と1文以上で構成された「本文」の2つの情報、もしくは、これに加えてその情報が公開された「日付情報」の3つの情報を一人分の情報として判断している。日付情報や名前を追加することにより、情報の信頼性が高まり、また情報の新しさを知ることができる。また、これにより、先に述べた一個人の見解の偏りがクチコミ情報の中に生じている問題も回避することができる。   In addition to the above, it is also possible to determine, as word-of-mouth information, a Web page or text in which word-of-mouth information of a plurality of people is gathered for a certain target object. Normally, when reviewing word-of-mouth information, it is rarely satisfied to see only one word-of-mouth information of a certain individual, and a plurality of word-of-mouth information is referred to to obtain multifaceted information. In other words, due to the effects described above, the viewer can see the opinions of a plurality of people at a time, and the trouble of referring to a plurality of word-of-mouth information pages can be saved. In this determination method, there are two pieces of information, ie, “name” indicating a name or nickname for identifying the author and “text” composed of one or more sentences, or in addition to this information “ Three pieces of information “date information” are determined as information for one person. By adding date information and name, the reliability of the information can be improved and the newness of the information can be known. In addition, this can also avoid the above-described problem in which the bias of one person's opinion occurs in the word-of-mouth information.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

以下では、「クチコミ情報」を、ある対象となる物事(例えば、ディジタルビデオカメラ、ホテル、レストラン、テレビドラマ、俳優、英会話教室、観光地、事件、等)に関しての情報であり、その対象となる物事を何らかの形で体験・経験した人が、その体験談や経験した感想などの意見を記述したものと定義し、テキストもしくはWebページなどの入力があったときに、それがクチコミ情報かどうかを判定する装置を「クチコミ判定装置」として説明する。   In the following, “word-of-mouth information” is information about a certain subject (for example, a digital video camera, a hotel, a restaurant, a TV drama, an actor, an English conversation class, a sightseeing spot, a case, etc.) It is defined that a person who has experienced / experienced something in some way describes an opinion such as his / her experiences and impressions, and when there is input such as text or web page, whether or not it is word-of-mouth information The determination device will be described as a “word-of-mouth determination device”.

図3は、本発明の一実施の形態における概要を説明するための図である。   FIG. 3 is a diagram for explaining the outline in one embodiment of the present invention.

クチコミ判定装置にテキストやWebページが入力されると、
1)A「筆者の名前」とB「1つ以上の文で構成される本文」とC「日付」を1つのクチコミセットとし、このA,B,Cからなるセットまたは、A,Bからなるセットが繰り返されているかを判定する。
When text or a web page is input to the review determination device,
1) A “writer's name” and B “text consisting of one or more sentences” and C “date” are one review set, and this A, B, C set or A, B Determine whether the set is repeated.

2)1)でクチコミセットと判定された中から本文と判断された文章のまとまりを抽出する。   2) Extract a group of sentences determined to be the text from the word-of-mouth set determined in 1).

3)2)で抽出された本文(テキスト)に評価表現が記述されているかを検査する。   3) Check whether the evaluation expression is described in the body (text) extracted in 2).

4)本文(テキスト)に体験表現が記述されているかを検査する。   4) Check whether experience expression is described in the text.

5)上記の3)と4)の結果からクチコミ情報かどうかを判定し、判定結果を出力する。   5) From the results of 3) and 4) above, it is determined whether or not it is word-of-mouth information, and the determination result is output.

図4は、本発明の一実施の形態におけるクチコミ情報判定装置の構成を示す。   FIG. 4 shows the structure of the word-of-mouth information determination apparatus in one embodiment of the present invention.

同図に示すクチコミ判定装置は、コンピュータ10と、このコンピュータ10にネットワーク40を介して接続される評価表現記憶部20と体験表現記憶部21から構成される。   The word-of-mouth determination device shown in FIG. 1 includes a computer 10, an evaluation expression storage unit 20 and an experience expression storage unit 21 connected to the computer 10 via a network 40.

コンピュータ10は、RAM,ROM、磁気ディスク等からなるメモリ等で構成されるデータ記憶部501、CPU、ディスプレイによる表示部11、及びマウスやキーボードなどからなる指示入力部12から構成されており、CPUが実行するソフトウェアプログラムによって実現される複数筆者検査処理部500、本文抽出処理部510、評価表現検査処理部520、体験表現検査処理部530、クチコミ情報判定処理部540を有する。   The computer 10 includes a data storage unit 501 including a memory such as a RAM, a ROM, and a magnetic disk, a CPU, a display unit 11 using a display, and an instruction input unit 12 including a mouse and a keyboard. Has a multi-writer inspection processing unit 500, a body text extraction processing unit 510, an evaluation expression inspection processing unit 520, an experience expression inspection processing unit 530, and a word-of-mouth information determination processing unit 540, which are realized by a software program executed by.

データ記憶部501は、複数筆者検査処理部500、本文抽出処理部510、評価表現検査処理部520、体験表現検査処理部530、クチコミ情報判定処理部540によってデータの格納や読み出しが行われる。   In the data storage unit 501, data is stored and read out by the multi-writer inspection processing unit 500, the text extraction processing unit 510, the evaluation expression inspection processing unit 520, the experience expression inspection processing unit 530, and the word-of-mouth information determination processing unit 540.

評価表現記憶部20には、物事に対して、良いイメージや悪いイメージを表すような語句が格納されている。良いイメージの例としては、「良い、美しい、美味しい、面白い、楽しい、心地よい、便利、華やか、豊富、気に入る」などがあげられる。また、悪いイメージの例としては、「悪い、汚い、まずい、面白くない、つまらない、不便、うるさい、くさい、ろこつ、最悪、困難」などが挙げられる。これらは主に形容詞、形容動詞、名詞等が当てはまる。   The evaluation expression storage unit 20 stores words and phrases that express a good image or a bad image with respect to things. An example of a good image is “good, beautiful, delicious, interesting, fun, comfortable, convenient, gorgeous, abundant, likes”. Examples of bad images include “bad, dirty, bad, uninteresting, boring, inconvenient, noisy, annoying, tricky, worst, difficult” and the like. These apply mainly to adjectives, adjective verbs and nouns.

体験表現記憶部21には、物事を体験・経験したことを表すような語句が格納されている。例えば、「行ってみた、試した、実行した、感じた、実感した、チャレンジした」などがあげられる。これらは、主に動詞の過去形「〜た」「〜した」「〜してみた」「〜したことがある」等が当てはまる。体験表現記憶部21では、体験表現に該当する語句{実感した、チャレンジした、等}が格納されていることもあれば、表現形態{してみた、したことがある、等}や形態素解析した後の品詞の組み合わせのルール{動詞語幹+動詞活用語尾+動詞接尾辞+動詞語幹の連用「みる」+動詞接尾辞の終止「ました」等}、またはそれらの混合された情報が格納されている場合もある。体験表現の例を図5に示す。   The experience expression storage unit 21 stores words and phrases that represent experience and experience of things. For example, “I went, tried, executed, felt, realized, challenged”. These apply mainly to the past forms of verbs “~ ta”, “~”, “~”, “has been”, and so on. In the experiential expression storage unit 21, words or phrases corresponding to experiential expressions {actually realized, challenged, etc.} may be stored, or expression forms {already tried, etc.} or morphological analysis may be performed. The later part of speech combination rules {verb stem + verb inflection ending + verb suffix + verb stem continuation “look” + verb suffix ending “is” etc.}, or mixed information is stored There may be. An example of experience expression is shown in FIG.

図6は、本発明の一実施の形態におけるクチコミ情報判定処理の概要動作のフローチャートである。   FIG. 6 is a flowchart of the outline operation of the word-of-mouth information determination process according to the embodiment of the present invention.

ステップ100) 複数筆者検査処理:
複数筆者検査処理部500にテキストまたは、Webページが入力されると、当該テキストもしくはWebページの構造の中に、1つ以上の文で構成された本文と、本文の筆者名やニックネームなどを示す名前もしくは記号、本文を記述した日付情報の3つの情報、または、本文と名前もしくは記号の2つの情報が繰り返し出現するかどうかを検査し、その結果をデータ記憶部501に格納する。
Step 100) Multiple writer inspection process:
When a text or a web page is input to the multi-author inspection processing unit 500, a text composed of one or more sentences and an author name or nickname of the text are shown in the text or web page structure. It checks whether or not three pieces of information of name or symbol and date information describing the body, or two pieces of information of body and name or symbol appear repeatedly, and stores the result in the data storage unit 501.

図7は、本発明の一実施の形態におけるクチコミ情報入力の例を示す。同図(A)は、Webページ(htmlファイル)の例であり、同図(B)は、テキストの例である。入力される文書と本文、文章、文の関係は図8に示すように、筆者名、日付、1つ以上の文で構成された本文が1セットとなる。   FIG. 7 shows an example of word-of-mouth information input in one embodiment of the present invention. FIG. 4A is an example of a Web page (html file), and FIG. 4B is an example of text. As shown in FIG. 8, the relationship between the input document and the text, text, and text is one set of text composed of the author name, date, and one or more texts.

ステップ200) 本文抽出処理:
本文抽出処理部510において、データ記憶部501からステップ100での3つの情報が繰り返し出現する情報を読み出してその中から本文を抽出し、データ記憶部501に格納する。
Step 200) Text extraction processing:
In the text extraction processing unit 510, the information in which the three pieces of information in step 100 repeatedly appear is read from the data storage unit 501, the text is extracted from the information, and stored in the data storage unit 501.

ステップ300) 評価表現検査処理:
評価表現検査処理部520は、データ記憶部501からステップ200において抽出された本文を読み出して、その中に評価表現が記述されているかを評価表現記憶部20を参照することにより検査し、その結果をデータ記憶部501に格納する。
Step 300) Evaluation expression inspection processing:
The evaluation expression inspection processing unit 520 reads out the text extracted in step 200 from the data storage unit 501, checks whether or not the evaluation expression is described therein by referring to the evaluation expression storage unit 20, and the result Is stored in the data storage unit 501.

ステップ400) 体験表現検査処理:
体験表現検査処理部530は、データ記憶部501からステップ200において抽出された本文を読み出して、その中に体験表現が記述されているかを体験表現記憶部21を参照することにより検査し、その結果をデータ記憶部501に格納する。
Step 400) Experience expression inspection processing:
The experience expression inspection processing unit 530 reads out the text extracted in step 200 from the data storage unit 501 and checks whether the experience expression is described therein by referring to the experience expression storage unit 21, and the result Is stored in the data storage unit 501.

ステップ500) クチコミ判定処理:
クチコミ情報判定処理部540は、データ記憶部501からステップ300、ステップ400における検査結果を読み出して、評価表現と体験表現が記述されており、所定のクチコミ判定関数によってクチコミか否かを判定する、または、クチコミ率を判定する。
Step 500) Review determination processing:
The word-of-mouth information determination processing unit 540 reads the test results in step 300 and step 400 from the data storage unit 501 and describes the evaluation expression and the experience expression, and determines whether or not it is a word-of-mouth by a predetermined word-of-mouth determination function. Alternatively, the review rate is determined.

[第1の実施の形態]
本実施の形態では、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。本実施の形態では、クチコミ表現のあり/なしが出力される。
[First Embodiment]
In the present embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body. In this embodiment, presence / absence of word-of-mouth expression is output.

最初に、第1の実施の形態における複数筆者検査処理(ステップ100)について説明する。   First, the multi-writer inspection process (step 100) in the first embodiment will be described.

図9は、本発明の第1の実施の形態におけるクチコミ情報入力html構造の例を示す。   FIG. 9 shows an example of a word-of-mouth information input html structure according to the first embodiment of the present invention.

複数筆者検査処理部500では、図3に示すように、A「筆者の名前」とB「1つ以上の文で構成される本文」とC「日付」を1つのクチコミセットとし、その繰り返しがあるかどうかを判断する。但し、C「日付」は、必ずしも必要ではなく、AとBでクチコミセットを形成することも可能である。ここで、A,B,Cもしくは、A,Bが出現する順序は問わないものとする。以下では、A,B,Cの3つが存在する場合の例を説明する。出現順序は、A→B→C、B→C→A、C→A→B、A→C→B、B→A→C、C→B→Aのいずれでもよい。しかし、繰り返し出現するのは1つの形式のみとする。例えば、A→B→Cの繰り返しであれば、C→B→Aが途中で出現したら、異なる形式が出現したということになり、繰り返しは終了したとみなされる。繰り返しの判定は、種々あるが、ここでは、AまたはCを探すことからスタートする。図7や図8は、A→C→Bの例である。   As shown in FIG. 3, the multiple writer inspection processing unit 500 takes A “writer's name”, B “text composed of one or more sentences”, and C “date” as one review set, and the repetition is repeated. Determine if there is. However, C “date” is not always necessary, and it is possible to form a word-of-mouth set with A and B. Here, the order of appearance of A, B, C or A, B is not limited. Below, the example in case three, A, B, and C exist is demonstrated. The order of appearance may be any of A → B → C, B → C → A, C → A → B, A → C → B, B → A → C, C → B → A. However, only one form appears repeatedly. For example, in the case of repetition of A → B → C, if C → B → A appears in the middle, it means that a different format has appeared, and it is considered that the repetition has ended. There are various determinations of repetition, but here, it starts from searching for A or C. 7 and 8 are examples of A → C → B.

図10は、本発明の第1の実施の形態における複数筆者検査処理のフローチャートであり、名前からスタートする例を示す。   FIG. 10 is a flowchart of the multi-writer inspection process according to the first embodiment of the present invention, and shows an example starting from a name.

ステップ101) 複数筆者検査処理部500は、入力されたhtmlファイル、テキストファイル、または、テキスト等から筆者の名前だと特定できるような文字列を探す。このとき特定できるような文字列は様々であるが、例えば「名前、投稿者、by、ニックネーム」などの文字列とセットで筆者の名前もしくは筆者を特定するような記号が記述されていることがある。   Step 101) The multi-author inspection processing unit 500 searches for a character string that can be identified as the author's name from the input html file, text file, text, or the like. There are various character strings that can be specified at this time. For example, a character string such as “name, contributor, by, nickname” or a character string that identifies the writer is described in a set. is there.

ステップ102) 複数筆者検査処理部500は、ステップ101で特定した名前の前後において、日付があるかどうかを検査する。   Step 102) The multi-author inspection processing unit 500 inspects whether or not there is a date before and after the name specified in Step 101.

日付は、例えば、2004年12月20日を示すときに、「2004.12.20、2004/12/20、04.12.20、2004 12 20、Dec.20,2004」など様々な記述方法がある。また、「日付、投稿日、質問日、」などの文字列と共に日付が記述されている場合や、時間と共に日付が記述されている場合もある。但し、日付は、必ずしも必要ではないため、本ステップを省略することもできる。   For example, when the date indicates December 20, 2004, there are various description methods such as “2004.12.20, 2004/12/20, 04.12.20, 2004 12 20, Dec. 20, 2004”. In addition, a date may be described together with a character string such as “date, posting date, question date”, or a date may be described along with a time. However, since the date is not necessarily required, this step can be omitted.

名前の前後両者において、日付がある場合、図9のように入力がhtmlファイルであった場合は、タグ構造を確認し、名前と同じタグで囲まれている方を採用する方法がある。このとき、図9では、htmlの<table>タグでクチコミセットが区切られている。また、最も名前の情報から近い方(名前を示す文字列から日付を示す文字列までの全文字数が少ない方)を採用する方法などもある。   If there is a date before and after the name, or if the input is an html file as shown in FIG. 9, there is a method of checking the tag structure and adopting the one surrounded by the same tag as the name. At this time, in FIG. 9, the word-of-mouth communication set is delimited by html <table> tags. There is also a method of adopting the one closest to the name information (the one with the smaller total number of characters from the character string indicating the name to the character string indicating the date).

ステップ103) ステップ101で採取した名前とステップ102で採取した日付と一緒に1つ以上の文で構成される本文(=クチコミセット)があるかどうかを検査する。   Step 103) It is checked whether or not there is a body (= review set) composed of one or more sentences together with the name collected in Step 101 and the date collected in Step 102.

図7のようにステップ101で「名前:Keiko」、ステップ102で「投稿日:2004.12.20」という記述が見つかった場合は、これと共に1つ以上の文で構成される本文があるかどうかを検査する。但し、ステップ102を省略した場合は、クチコミセットは、ステップ101で採取した名前と1つ以上の文で構成される本文の2つの情報で形成される。よって、ここでの検査は、前述の2つの情報のセットがあるかどうかを検査することになる。   If a description “name: Keiko” is found in step 101 and “post date: 2004.12.20” is found in step 102 as shown in FIG. 7, whether or not there is a text composed of one or more sentences. inspect. However, if step 102 is omitted, the word-of-mouth set is formed with two pieces of information, that is, the name collected in step 101 and a body text composed of one or more sentences. Therefore, the inspection here is to check whether or not there is the above-described two sets of information.

ステップ104) ステップ103で取得したクチコミセットの順序構造が繰り返し出現するかどうかを検査する。   Step 104) It is checked whether or not the order structure of the review set acquired in Step 103 appears repeatedly.

図7のように「名前: 」と「投稿日:yyyy.mm.dd」という記述と共に1つ以上の文で構成される本文がある場合は、そのクチコミセットの構造が繰り返し2つ以上あるかどうかを検査する。ここで、yyyyは年号(例:2004)、mmは月(例:12)、ddは日(例:20)を表す。但し、ステップ102の処理を省略した場合は、日付を示す「投稿日:yyyy.mm,dd」を除いたクチコミセットの繰り返しが2つ以上存在するかどうかを検査すればよい。   If there is a body consisting of one or more sentences with the description “Name:” and “Posted Date: yyyy.mm.dd” as shown in FIG. 7, is the structure of the review set repeated two or more times? Inspect whether. Here, yyyy represents the year (example: 2004), mm represents the month (example: 12), and dd represents the day (example: 20). However, if the processing in step 102 is omitted, it may be checked whether there are two or more reviews set repetitions excluding “post date: yyyy.mm, dd” indicating the date.

本文とみなせるような1文以上の文章のまとまりが複数点在する場合、例えば、図9のように入力がhtmlファイルであった場合は、タグ構造を確認し、名前や日付と同じタグで区切られている文章のまとまりを本文として採用する方法がある。また、最も名前や日付から近い文章のまとまりを採用する方法、もしくは、最も長い文章のまとまりの候補を本文として採用する方法などがある。   If there are multiple groups of one or more sentences that can be regarded as the body text, for example, if the input is an html file as shown in Fig. 9, check the tag structure and separate it with the same tag as the name and date There is a method of adopting a set of sentences as text. In addition, there is a method of adopting a group of sentences closest to the name or date, or a method of adopting a candidate of a group of sentences having the longest sentence as the text.

ステップ105) ステップ104でクチコミセットが、繰り返し出現する場合、ステップ104で取得したクチコミセットの繰り返し数を算出する。ここで、クチコミセットのデータそれぞれと、クチコミセットの数をデータ記憶部501に格納する。   Step 105) If the review set appears repeatedly in Step 104, the number of repetitions of the review set acquired in Step 104 is calculated. Here, each data of the review set and the number of review sets are stored in the data storage unit 501.

ステップ106) データ記憶部501に格納されているクチコミセットの名前のそれぞれを比較し、それが複数種類存在するかどうかを検査する。図7のような場合、名前に該当するのは「Keiko」「温泉大好き」「秘密」の3つである。このとき、3つとも同一でないため、「名前は複数種類存在する」と判定される。   Step 106) Each name of the word-of-mouth communication set stored in the data storage unit 501 is compared, and it is checked whether or not there are a plurality of types. In the case of FIG. 7, the names correspond to “Keiko”, “I love hot springs”, and “Secret”. At this time, since all three are not the same, it is determined that “a plurality of names exist”.

つまり、入力が複数筆者によって書かれたものかどうかを判定する。当該判定は、クチコミセットが繰り返し出現し、それらの名前が2種類以上存在するときに、複数筆者であると判定される。このステップ106は、省略することもできる。但し、ステップ106を省略した場合は、クチコミセットが繰り返し出現していれば、複数筆者であると判定される。このとき、出力情報(複数筆者であるか否か、複数筆者である場合はそれぞれのクチコミセットとその数)は、データ記憶部501に格納する。   That is, it is determined whether or not the input is written by a plurality of writers. This determination is determined to be a multiple writer when word-of-mouth sets appear repeatedly and there are two or more names. This step 106 can be omitted. However, if step 106 is omitted, if the word-of-mouth set has repeatedly appeared, it is determined that there are multiple authors. At this time, the output information (whether or not it is a plurality of authors, and if it is a plurality of authors, each word-of-mouth communication set and the number thereof) is stored in the data storage unit 501.

上記では、名前からスタートした場合の例を示したが、C「日付」からスタートした場合も上記に述べたステップ101とステップ102の順序が入れ替わる程度である。最初に日付を探し、次に日付の前後から名前を探すというステップを踏むことになる。但し、Cを省略したクチコミセットを利用する場合には、Cからスタートする処理は適用できない。   In the above, an example of starting from a name is shown, but even when starting from C “date”, the order of steps 101 and 102 described above is switched. The first step is to look for the date, and then look for the name around the date. However, when a review set in which C is omitted is used, processing starting from C cannot be applied.

次に、本文抽出部510におけるステップ200の本文抽出処理について説明する。   Next, the text extraction process in step 200 in the text extraction unit 510 will be described.

図11は、本発明の第1の実施の形態における本文抽出処理のフローチャートである。   FIG. 11 is a flowchart of text extraction processing according to the first embodiment of this invention.

ステップ201) 本文抽出部510は、複数筆者検査処理部500で取得されたデータ記憶部501に格納されているクチコミセットの各本文と本文の数S(S>0)を読み出し、HTMLタグ等の記号があるかを判定する。ない場合はステップ203に移行する。   Step 201) The text extracting unit 510 reads each text of the word-of-mouth set and the number of texts S (S> 0) stored in the data storage unit 501 acquired by the multi-author inspection processing unit 500, and extracts HTML tags and the like. Determine if there is a symbol. If not, the process proceeds to step 203.

ステップ202) 各本文について、文章以外であるHTMLタグ等の不要な記号を除去する。   Step 202) For each body, unnecessary symbols such as HTML tags other than sentences are removed.

ステップ203) sに1を代入する。ここでsは本文のカウントである。   Step 203) Substitute 1 for s. Here, s is a text count.

ステップ204) sがSより大きければ処理を終了する。   Step 204) If s is larger than S, the process is terminated.

ステップ205) s番目の本文をデータ記憶部501に格納する。   Step 205) The sth body is stored in the data storage unit 501.

ステップ206) sに1を加算してステップ204に移行する。   Step 206) Add 1 to s and proceed to Step 204.

上記のように、本文抽出部510は、本文と判断された文章のまとまりを抽出し、データ記憶部501に格納しておく。本文の蓄積・出力形式は、上記の例に限定されることなく、選択可能であるが、統一した形式で実行される。   As described above, the text extracting unit 510 extracts a group of sentences determined to be text and stores them in the data storage unit 501. The text storage / output format is not limited to the above example, and can be selected, but is executed in a unified format.

なお、ステップ201においてHTMLタグが入っていない場合には、当該処理は不要である。   If no HTML tag is included in step 201, this processing is not necessary.

次に、評価表現検査処理部520におけるステップ300の評価表現検査処理について説明する。   Next, the evaluation expression inspection process in step 300 in the evaluation expression inspection processing unit 520 will be described.

図12は、本発明の第1の実施の形態における評価表現検査処理のフローチャートである。以下の処理では、予め形態素解析処理を行うとされているものとする。   FIG. 12 is a flowchart of the evaluation expression checking process according to the first embodiment of this invention. In the following processing, it is assumed that morphological analysis processing is performed in advance.

ステップ301) データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。   Step 301) The text of each word-of-mouth set and the number S of text are input from the data storage unit 501.

ステップ302) 評価表現検査処理部520は、sに1を代入する。   Step 302) The evaluation expression inspection processing unit 520 substitutes 1 for s.

ステップ303) s>S(本文の数)であれば、処理を終了する。   Step 303) If s> S (the number of texts), the process ends.

ステップ304) 評価表現検査処理部520は、s番目の本文について形態素解析を行う。形態素解析において、評価表現に該当するような名詞や形容詞、形容動詞、連体詞等の特定の品詞を抽出する。   Step 304) The evaluation expression inspection processing unit 520 performs morphological analysis on the sth body. In morphological analysis, specific parts of speech such as nouns, adjectives, adjective verbs, and conjunctions that correspond to evaluation expressions are extracted.

ステップ305) 形態素解析結果と評価表現記憶部20に格納されている評価表現とを照合し、合致する表現があるか否かを判定する。なお、活用する品詞が検査対象となるときは、記述されている語句を原形に戻した後に検査する方が効率的である。   Step 305) The morphological analysis result and the evaluation expression stored in the evaluation expression storage unit 20 are collated to determine whether there is a matching expression. When the part of speech to be used is to be inspected, it is more efficient to inspect it after returning the written phrase to its original form.

ステップ306) 合致する表現がある場合には、ステップ307に移行し、ない場合には、ステップ308に移行する。   Step 306) If there is a matching expression, the process proceeds to step 307; otherwise, the process proceeds to step 308.

ステップ307) 「s番目の本文に評価表現あり」と判定し、判定結果(評価表現あり)をデータ記憶部501に格納し、ステップ309に移行する。   Step 307) It is determined that “the s-th body has an evaluation expression”, the determination result (with an evaluation expression) is stored in the data storage unit 501, and the process proceeds to Step 309.

ステップ308) 「s番目の本文に評価表現なし」と判定し、判定結果(評価表現なし)をデータ記憶部501に格納し、ステップ309に移行する。   Step 308) It is determined that “the s-th body has no evaluation expression”, the determination result (no evaluation expression) is stored in the data storage unit 501, and the process proceeds to Step 309.

ステップ309) sに1を加算しステップ303に移行する。   Step 309) Add 1 to s and proceed to Step 303.

上記の処理の結果、データ記憶部501に出力されるのは、各本文中の評価表現の有無である。   As a result of the above processing, what is output to the data storage unit 501 is the presence or absence of an evaluation expression in each text.

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ304とステップ305の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 304 and step 305. The evaluation expression stored in the evaluation expression storage unit 20 is collated by character string matching to check whether there is a matching expression.

次に、体験表現検査処理部530におけるステップ400の体験表現検査処理について説明する。   Next, the experience expression inspection process in step 400 in the experience expression inspection processing unit 530 will be described.

図13は、本発明の第1の実施の形態における体験表現検査処理のフローチャートである。以下の処理では、予め形態素解析処理を行うとされているものとする。   FIG. 13 is a flowchart of the experience expression inspection process in the first embodiment of the present invention. In the following processing, it is assumed that morphological analysis processing is performed in advance.

ステップ401) 体験表現検査処理部530に、データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。   Step 401) The experience expression inspection processing unit 530 receives the text of each word-of-mouth set and the number S of texts from the data storage unit 501.

ステップ402) 1をsに代入する。   Step 402) Substitute 1 into s.

ステップ403) s>Sとなった場合には処理を終了する。   Step 403) If s> S, the process is terminated.

ステップ404) s番目の本文に対して形態素解析を行う。形態素解析では、体験表現に該当するような名詞、形容詞、形容動詞等の特定の品詞を抽出することが望ましい。   Step 404) Perform morphological analysis on the sth body. In morphological analysis, it is desirable to extract specific parts of speech such as nouns, adjectives and adjective verbs that correspond to the experiential expression.

ステップ405) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現があるかを調べる。なお、活用する品詞が検査対象となるときは、記述されている語句を原型に戻した後に検査する方が効率的である。また、体験表現は、動詞の過去形であることが多いため、「行ってみた」「試してみました」等の終止形の「た」「しました」が付属する動詞に注目する方法もある。   Step 405) The morphological analysis result and the experience expression stored in the experience expression storage unit 21 are collated to check whether there is a matching expression. When the part of speech to be used is to be inspected, it is more efficient to inspect it after returning the written words to the original form. Also, since the experiential expression is often the past form of the verb, there are also ways to focus on the verbs that come with the final forms of “ta” and “shim”, such as “I went and tried” is there.

ステップ406) 合致する表現がある場合はステップ407に移行し、ない場合にはステップ408に移行する。   Step 406) If there is a matching expression, the process proceeds to step 407; otherwise, the process proceeds to step 408.

ステップ407) 「s番目の本文に体験表現あり」と判定し、その結果(体験表現あり)をデータ記憶部501に格納し、ステップ409に移行する。   Step 407) It is determined that “the s-th body has experience expression”, and the result (with experience expression) is stored in the data storage unit 501, and the process proceeds to Step 409.

ステップ408) 「s番目の本文に体験表現なし」と判定し、その結果(体験表現なし)をデータ記憶部501に格納する。   Step 408) It is determined that “the s-th body has no experience expression”, and the result (no experience expression) is stored in the data storage unit 501.

ステップ409) sに1を加算し、ステップ403に移行する。   Step 409) Add 1 to s, and go to Step 403.

上記の処理でデータ記憶部501に出力されるのは、各本文中の体験表現の有無である。   What is output to the data storage unit 501 in the above processing is the presence or absence of experience expression in each text.

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ404とステップ405の代わりに、s番目の本文と体験表現記憶部21に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 404 and step 405. And the evaluation expression stored in the experience expression storage unit 21 are matched by character string matching to check whether there is a matching expression.

なお、上記の評価表現検査処理(ステップ300)と、体験表現検査処理(ステップ400)の処理に前後関係はないため、同時に実施することも、どちらか先に実行することも可能である。   Note that the evaluation expression test process (step 300) and the experience expression test process (step 400) are not related to each other, and can be performed at the same time or can be executed first.

また、評価表現検査処理部520と体験表現検査処理部530で両者共形態素解析を行う場合は、処理を高速化するために、両者の処理を実行する前に形態素解析を行うことが望ましい。   Further, when both the morphological analysis is performed by the evaluation expression inspection processing unit 520 and the experience expression inspection processing unit 530, it is desirable to perform the morpheme analysis before executing both processes in order to speed up the processing.

上記の図12、図13で示した一連の流れを例を用いて示す。   An example of the series of flows shown in FIGS. 12 and 13 will be described.

図14は、本発明の第1の実施の形態における形態素解析結果の例を示す。同図に示す形態素解析結果の例は、図7のクチコミ情報入力例にある3つのクチコミセットのうち、1つ目のクチコミセットの本文
「私も昨日…とてもよかったです。」
を、前述の「渕武志他、「保守性を考慮した日本語形態素解析システム」、情報処理学会自然言語処理研究会報告、117-09, vol.1997-no.004, pp.59-66」に挙げた形態素解析システムにより、形態素解析した結果を示している。この結果例では、形態素解析により「切り出された語」とその語が分類された「品詞」とその語の「読み」、その語の「原形」がスペース区切りで示されている。例えば、「私」は、「名詞の代名詞」という品詞に分類され、「ワタシ」という読みで、原形が「私」である。
FIG. 14 shows an example of a morphological analysis result in the first embodiment of the present invention. The example of the morphological analysis result shown in the figure is the text of the first review set of the three review sets in the review information input example of FIG. 7 “I was also very good yesterday…”
, "Takeshi Tsuji et al.," Japanese Morphological Analysis System Considering Conservativeness ", Report of the Society for Natural Language Processing, Information Processing Society of Japan, 117-09, vol.1997-no.004, pp.59-66 The results of morphological analysis using the morphological analysis system listed in Fig. 5 are shown. In this result example, “words extracted” by morphological analysis, “parts of speech” in which the words are classified, “reading” of the words, and “original form” of the words are shown separated by spaces. For example, “I” is classified as a part of speech called “pronoun of noun”, and it reads “I” and the original form is “I”.

その後、評価表現検査処理部520において、上記で原形として出力された語と評価表現記憶部20に格納されている評価表現と照合する。図14のような評価表現記憶部20の例がある場合、「良い」が一致する。   Thereafter, the evaluation expression inspection processing unit 520 collates the word output as the original form with the evaluation expression stored in the evaluation expression storage unit 20. If there is an example of the evaluation expression storage unit 20 as shown in FIG. 14, “good” matches.

体験表現検査処理部530においては、体験表現記憶部21に格納されている体験表現と形態素解析結果を照合する。図14のような体験表現記憶部21の例があった場合、動詞の過去形が体験表現記憶部21に格納されているという特徴から、動詞として形態素解析された語に着目する。図14の形態素解析結果例で、動詞に関わるのは、「動詞語幹、動詞活用語尾、動詞接尾辞、動詞語幹の連用、動詞接尾辞の終止」の「行ってみました」である。「行ってみました」は、過去形であり、また、「行ってみた」の丁寧な表現であるので、同一のものと見なされることから、体験表現記憶部21の例に格納されている「行ってみた」と一致する。   In the experience expression inspection processing unit 530, the experience expression stored in the experience expression storage unit 21 is collated with the morphological analysis result. When there is an example of the experience expression storage unit 21 as shown in FIG. 14, attention is paid to a word that has been morphologically analyzed as a verb because the past form of the verb is stored in the experience expression storage unit 21. In the morphological analysis result example of FIG. 14, the verb is related to “verb stem, verb inflection ending, verb suffix, verb stem continuation, verb suffix ending”. “I went” is a past tense, and since it is a polite expression of “I went”, it is considered the same, so it is stored in the example of the experience expression storage unit 21. Matches “I went”.

次に、クチコミ情報判定処理部540におけるステップ500のクチコミ情報判定処理について説明する。   Next, the word-of-mouth information determination processing in step 500 in the word-of-mouth information determination processing unit 540 will be described.

図15は、本発明の第1の実施の形態におけるクチコミ情報判定処理のフローチャートである。   FIG. 15 is a flowchart of word-of-mouth information determination processing according to the first embodiment of this invention.

ステップ501) クチコミ情報判定処理部540は、データ記憶部501から、各本文の数S、各本文に含まれる体験表現のあり/なし、各本文に含まれる評価表現のあり/なしを読み込む。ここでは、図16に示すようなデータが読み込まれたものとする。   Step 501) The word-of-mouth information determination processing unit 540 reads from the data storage unit 501 the number S of each body text, presence / absence of experience expressions included in each body text, and presence / absence of evaluation expressions included in each body text. Here, it is assumed that data as shown in FIG. 16 has been read.

ステップ502) sに1を代入し、kに0を代入する。ここで、sは文書数のカウントであり、kはクチコミ表現と判定された情報セット数である。   Step 502) Substitute 1 for s and 0 for k. Here, s is a count of the number of documents, and k is the number of information sets determined to be word-of-mouth expressions.

ステップ503) s>Sであればステップ507に移行する。   Step 503) If s> S, go to Step 507.

ステップ504) s番目の本文にクチコミ表現があるかを判定し、ない場合にはステップ506に移行する。   Step 504) It is determined whether there is a word of mouth expression in the sth body.

ステップ505) ステップ504においてクチコミ表現がある場合は、kに1を加算する。   Step 505) If there is a word-of-mouth expression in step 504, 1 is added to k.

ステップ506) sに1を加算し、ステップ503に移行する。   Step 506) Add 1 to s, and go to Step 503.

ステップ507) k/S≧X(Xは事前に設定した閾値)である場合はステップ508に移行し、そうでない場合はステップ509に移行する。   Step 507) If k / S ≧ X (X is a preset threshold value), the process proceeds to Step 508, and otherwise, the process proceeds to Step 509.

ステップ508) 入力文書がクチコミ情報であると判定する。   Step 508) It is determined that the input document is word-of-mouth information.

ステップ509) 入力文書がクチコミ情報でないと判定する。   Step 509) It is determined that the input document is not word-of-mouth information.

次に、上記のステップ504の処理について詳細に説明する。   Next, the processing in step 504 will be described in detail.

図17は、本発明の第1の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。   FIG. 17 is a flowchart for determining whether or not there is a word-of-mouth expression according to the first embodiment of this invention.

ステップ5041) データ記憶部501(例えば、図16の例)から読み出した、s番目の本文に評価表現と体験表現の両方があるか判定し、両方ある場合には、ステップ5042に移行し、ない場合にはステップ5043に移行する。   Step 5041) It is determined whether there is both an evaluation expression and an experience expression in the s-th body read from the data storage unit 501 (for example, the example of FIG. 16). In the case, the process proceeds to step 5043.

ステップ5042) s番目の本文には「クチコミ表現があり」と判定する。   Step 5042) It is determined that “there is a word of mouth” in the sth body.

ステップ5043) s番目の本文には「クチコミ表現なし」と判定する。   Step 5043) It is determined that there is no word-of-mouth expression in the sth body.

なお、上記の第1の実施の形態における図10に示す複数筆者検査処理及び、図11に示す本文抽出処理は省略することも可能である。   Note that the multi-writer inspection process shown in FIG. 10 and the text extraction process shown in FIG. 11 in the first embodiment may be omitted.

[第2の実施の形態]
本実施の形態でも、第1の実施の形態と同様に、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。
[Second Embodiment]
Also in the present embodiment, as in the first embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body.

本実施の形態では、複数筆者検査処理については、前述の第1の実施の形態と同様の動作であるため、説明を省略する。なお、複数筆者検査処理を行うか否かは任意であり、省略することも可能である。   In the present embodiment, the multi-writer inspection process is the same operation as that of the first embodiment described above, and thus the description thereof is omitted. It should be noted that whether or not to perform the multi-writer inspection process is arbitrary and can be omitted.

図18は、本発明の第2の実施の形態における本文抽出のフローチャートである。同図において、図11と同一の動作については同一のステップ番号を付し、その説明を省略する。   FIG. 18 is a flowchart of text extraction in the second embodiment of this invention. In the figure, the same operations as those in FIG. 11 are denoted by the same step numbers, and the description thereof is omitted.

ステップ204において、s>Sであるかを判定し、s≦Sであれば、s番目の本文に含まれる文章数N(s)を検出し、N(s)をデータ記憶部501に格納する(N(s)>0)(ステップ221)。以降の処理については図11と同様である。但し、データ記憶部501に出力されるのは、各クチコミセットの本文に加えて、本文それぞれに含まれる文章数N(1),…,N(S)が出力される。   In step 204, it is determined whether s> S. If s ≦ S, the number of sentences N (s) included in the sth body is detected, and N (s) is stored in the data storage unit 501. (N (s)> 0) (step 221). The subsequent processing is the same as in FIG. However, what is output to the data storage unit 501 is the number of sentences N (1),..., N (S) included in each text in addition to the text of each word-of-mouth set.

次に、本実施の形態における評価表現検査処理について説明する。   Next, the evaluation expression inspection process in this embodiment will be described.

図19は、本発明の第2の実施の形態における評価表現検査処理のフローチャートである。   FIG. 19 is a flowchart of the evaluation expression checking process in the second embodiment of the present invention.

ステップ321) データ記憶部501から各クチコミセットの本文と本文の数Sが評価表現検査処理部520に入力される。   Step 321) The text of each word-of-mouth set and the number S of text are input from the data storage unit 501 to the evaluation expression inspection processing unit 520.

ステップ322) 評価表現検査処理部520は、1をsに代入する。   Step 322) The evaluation expression inspection processing unit 520 substitutes 1 for s.

ステップ323) s>Sであれば処理を終了する。   Step 323) If s> S, the process ends.

ステップ324) s番目の本文に対して形態素解析を行う。   Step 324) Perform morphological analysis on the sth body.

ステップ325) 形態素解析結果と評価表現記憶部20に格納されている評価表現を照合し、合致する表現と、合致する表現の数h(s)を調べる。   Step 325) The morpheme analysis result and the evaluation expression stored in the evaluation expression storage unit 20 are collated, and the matching expression and the number h (s) of the matching expressions are examined.

ステップ326) ステップ325において評価表現記憶部20に合致する表現があり、合致する表現の数h(s)>0である場合には、ステップ327に移行し、そうでない場合には、ステップ328に移行する。   Step 326) If there is a matching expression in the evaluation expression storage unit 20 in Step 325 and the number of matching expressions h (s)> 0, the process proceeds to Step 327. Otherwise, the process proceeds to Step 328. Transition.

ステップ327) 「s番目に本文に評価表現あり」と判定し、合致した表現と、合致した表現の数h(s)をデータ記憶部501に格納し、ステップ329に移行する。   Step 327) It is determined that “the s-th body has an evaluation expression”, the matched expression and the number h (s) of the matched expressions are stored in the data storage unit 501, and the process proceeds to Step 329.

なお、合致する表現をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。   Note that storing matching expressions in the data storage unit 501 is not essential, and is necessary when outputting, or when adding a weight to a specific expression.

ステップ328) 「s番目に本文に評価表現なし」と判定し、判定結果(評価表現なし)をデータ記憶部501に格納する。   Step 328) It is determined that “the s-th body has no evaluation expression”, and the determination result (no evaluation expression) is stored in the data storage unit 501.

ステップ329) sに1を加算し、ステップ323に移行する。   Step 329) Add 1 to s and proceed to Step 323.

上記の処理において、データ記憶部501に出力されるのは、各本文中の評価表現の有無、評価表現がある本文中の評価表現、及び、評価表現がある本文中の評価表現の数h(s)である。   In the above processing, the data storage unit 501 outputs the presence / absence of evaluation expressions in each text, the evaluation expressions in the text with evaluation expressions, and the number h of evaluation expressions in the text with evaluation expressions h ( s).

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ324とステップ325の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるかを調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the s-th is used instead of steps 324 and 325. The evaluation expression stored in the evaluation expression storage unit 20 is collated by character string matching to check whether there is a matching expression.

図20は、本発明の第2の実施の形態における体験表現検査処理のフローチャートである。   FIG. 20 is a flowchart of the experience expression inspection process in the second embodiment of the present invention.

ステップ421) 体験表現検査処理部530に、データ記憶部501から各クチコミセットの本文と本文の数Sが入力される。   Step 421) The text of each word-of-mouth set and the number S of text are input from the data storage unit 501 to the experience expression test processing unit 530.

ステップ422) 1をsに代入する。   Step 422) Substitute 1 for s.

ステップ423) s>Sとなった場合には処理を終了する。   Step 423) If s> S, the process is terminated.

ステップ424) s番目の本文に対して形態素解析を行う。形態素解析では、体験表現に該当するような名詞、形容詞、形容動詞等の特定の品詞を抽出することが望ましい。   Step 424) Morphological analysis is performed on the sth body. In morphological analysis, it is desirable to extract specific parts of speech such as nouns, adjectives and adjective verbs that correspond to the experiential expression.

ステップ425) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現及び合致する表現の数を調べる。   Step 425) The morphological analysis result and the experience expression stored in the experience expression storage unit 21 are collated, and the number of matching expressions and the number of matching expressions are checked.

ステップ426) 合致する表現がある場合(t(s)>0)はステップ427に移行し、ない場合にはステップ428に移行する。   Step 426) If there is a matching expression (t (s)> 0), the process proceeds to step 427, and if not, the process proceeds to step 428.

ステップ427) 「s番目の本文に体験表現あり」と判定し、(合致した表現と)合致した表現の数t(s)をデータ記憶部501に格納し、ステップ409に移行する。また、データ記憶部501に格納されるデータとしては、「体験表現あり」の他に、体験表現とその数t(s)を蓄積する。   Step 427) It is determined that “the s-th body has an experience expression”, the number of matched expressions t (s) (with the matched expression) is stored in the data storage unit 501, and the process proceeds to Step 409. Further, as data stored in the data storage unit 501, in addition to “with experience expression”, experience expressions and the number t (s) thereof are accumulated.

なお、合致する表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。   Note that storing the number of matching expressions in the data storage unit 501 is not essential, and is necessary when outputting, or when adding a weight to a specific expression.

ステップ428) 「s番目の本文に体験表現なし」と判定し、データ記憶部501に格納する。   Step 428) It is determined that “the s-th body has no experience expression” and is stored in the data storage unit 501.

ステップ429) sに1を加算し、ステップ423に移行する。   Step 429) Add 1 to s and proceed to Step 423.

当該処理において、データ記憶部501に出力されるのは、図21に示すように、各本文中の体験表現の有無、体験表現がある本文中の体験表現及び、体験表現がある本文中の体験表現の数t(s)である。   In this processing, as shown in FIG. 21, the data storage unit 501 outputs presence / absence of experience expression in each text, experience expression in the text with experience expression, and experience in the text with experience expression. The number of expressions t (s).

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ424とステップ425の代わりに、s番目の本文と体験表現記憶部21に格納されている評価表現について文字列マッチングにより照合し、合致する表現があるか、合致する表現がある場合には、その数t(s)を調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of steps 424 and 425. The evaluation expression stored in the experience expression storage unit 21 is collated by character string matching, and if there is a matching expression or if there is a matching expression, the number t (s) is checked.

また、評価表現検査処理部520と体験表現検査処理部530で両者共、形態素解析を行う場合は、処理を高速化するために、両者の処理を実行する前に形態素解析を行うことが望ましい。   When both the evaluation expression inspection processing unit 520 and the experience expression inspection processing unit 530 perform morphological analysis, it is desirable to perform morphological analysis before executing both processes in order to speed up the processing.

図22は、本発明の第2の実施の形態におけるクチコミ情報判定処理のフローチャートである。   FIG. 22 is a flowchart of the word-of-mouth information determination process in the second embodiment of the present invention.

クチコミ判定処理については、前述の第1の実施の形態における図15の動作のステップ501とステップ504以外の処理については同様である。   The review determination process is the same for the processes other than step 501 and step 504 in the operation of FIG. 15 in the first embodiment.

ステップ501においては、データ記憶部501から
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文に含まれる体験表現とその数:t(1),…,t(S);
・各本文に含まれる評価表現とその数:h(1),…,h(S);
が入力される。
In step 501, from the data storage unit 501, the number of texts: S;
・ The number of sentences included in each text: N (1), ..., N (S);
・ Experience expressions included in each text and the number thereof: t (1), ..., t (S);
-Evaluation expressions included in each text and the number thereof: h (1), ..., h (S);
Is entered.

以下に、本実施の形態における、図22におけるステップ504の処理について説明する。   Hereinafter, the processing in step 504 in FIG. 22 in the present embodiment will be described.

図23は、本発明の第2の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。   FIG. 23 is a flowchart for determining whether or not there is a word-of-mouth expression in the second embodiment of the present invention.

ステップ5051) クチコミ情報判定処理部540は、データ記憶部501から読み出したs番目の本文に評価表現と体験表現の両者があるかを判定し、両方ある場合には、ステップ5053に移行し、ない場合にはステップ5043に移行する。   Step 5051) The word-of-mouth information determination processing unit 540 determines whether there are both an evaluation expression and an experience expression in the sth body read from the data storage unit 501. In the case, the process proceeds to step 5043.

ステップ5052) 各本文に含まれる評価表現の出現数h(s)と体験表現の出現数t(s)とを加算し、その数が各クチコミセットの本文それぞれに含まれる文章の数N(s)で除した数が所定の数Y以上であるかを判定する((h(s)+t(s))/N(s)≧Y)。そうであれば、ステップ5053に移行し、そうでなければステップ5054に移行する。   Step 5052) The number of appearances of evaluation expressions h (s) included in each body and the number of appearances of experience expressions t (s) are added, and the number is the number of sentences N (s) included in each body of each review set. ) Is determined whether or not the number divided by a predetermined number Y is equal to or greater than ((h (s) + t (s)) / N (s) ≧ Y). If so, the process proceeds to step 5053, and if not, the process proceeds to step 5054.

ステップ5053) s番目の本文には「クチコミ表現あり」と判定する。   Step 5053) It is determined that “the word-of-mouth expression is present” in the sth body.

ステップ5054) s番目の本文には「クチコミ表現なし」と判定する。   Step 5054) It is determined that there is no word-of-mouth expression in the sth body.

図24に、本実施の形態における出力例を示す。   FIG. 24 shows an output example in the present embodiment.

また、本実施の形態では、
本文の数S;
s番目の本文に含まれる文章の数N(s);
s番目の本文に含まれる体験表現とその数t(s);
s番目の本文に含まれる評価表現とその数h(s);
としたとき、
クチコミ表現あり/なしを判定する式f(H,T)について、評価表現や体験表現全体に重みを付けて計算することもできる。
In the present embodiment,
Number of text S;
the number N (s) of sentences contained in the sth body;
Experience expression included in the sth body and its number t (s);
Evaluation expressions included in the sth body and their number h (s);
When
The formula f (H, T) for determining whether or not there is a wording expression can also be calculated by weighting the entire evaluation expression and experience expression.

例えば、評価表現の重みをE,体験表現の重みをGとしたとき、
f(H,T)=(E×h(s)+G×t(s))/N(s) 式(1)
となる。
For example, when the weight of evaluation expression is E and the weight of experience expression is G,
f (H, T) = (E × h (s) + G × t (s)) / N (s) Equation (1)
It becomes.

また、表現全体ではなく、ある特定の語句のみ重みをつけて計算することも可能である。   It is also possible to calculate by weighting only a specific word, not the entire expression.

それぞれの体験表現もしくは、評価表現の出現数は、評価表現検査処理部520や体験表現検査処理部530にて検出されているため、次のような式ができる。   Since the number of appearances of each experience expression or evaluation expression is detected by the evaluation expression inspection processing unit 520 and the experience expression inspection processing unit 530, the following expression can be obtained.

評価表現の出現種類もしくは、評価表現記憶部20にある評価表現の総数:AH;
体験表現の出現種類もしくは、体験表現記憶部21にある体験表現の総数:AT
ある特定の評価表現:nH(0<n<AH);
ある特定の体験表現:mT(0<m<AT);
s番目の本文の中に出現するnHの数:nH(s) (0≦nH(s)≦h(s));
s番目の本文の中に出現するmtの数:mT(s) (0≦mT(s)≦t(s));
ある特定の表現nHにかかる重み:ne;
ある特定の表現nTにかかる重み:ng;
としたとき、
f(H,T)=Σ(ne×nH(s))+Σ(ng×mT(s)) 式(2)
各表現に対する重みがそれぞれ1である場合は、
h(s)=ΣnH(s),
t(s)=ΣmT(s)
となる。つまり、s番目の本文に含まれる評価表現と体験表現の数と等しくなる。
Appearance types of evaluation expressions or the total number of evaluation expressions in the evaluation expression storage unit 20: AH;
Appearance types of experience expressions or total number of experience expressions in the experience expression storage unit 21: AT
A specific evaluation expression: nH (0 <n <AH);
A specific experience expression: mT (0 <m <AT);
the number of nH appearing in the sth body: nH (s) (0 ≦ nH (s) ≦ h (s));
number of mts appearing in the sth body: mT (s) (0 ≦ mT (s) ≦ t (s));
The weight on a particular expression nH: ne;
Weight on a particular expression nT: ng;
When
f (H, T) = Σ (ne × nH (s)) + Σ (ng × mT (s)) Equation (2)
If the weight for each representation is 1,
h (s) = ΣnH (s),
t (s) = ΣmT (s)
It becomes. That is, it is equal to the number of evaluation expressions and experience expressions included in the sth body.

また、s番目の本文に含まれる文章の数N(s)のとき、
f(H,T)={Σ(ne×nH(s))+Σ(ng×mT(s))}÷N(s) 式(3)
で表すこともできる。式(1)、(2)、(3)ともf(H,T)≧Y(Yは予め設定した閾値)であれば入力がクチコミ表現であると判定することができる。
Also, when the number of sentences included in the sth body text N (s),
f (H, T) = {Σ (ne × nH (s)) + Σ (ng × mT (s))} ÷ N (s) Equation (3)
It can also be expressed as If the expressions (1), (2), and (3) are f (H, T) ≧ Y (Y is a preset threshold value), it can be determined that the input is a word-of-mouth expression.

[第3の実施の形態]
本実施の形態でも、第1の実施の形態と同様に、入力文書がクチコミ情報か否かを判定し、s番目の本文にクチコミ表現があるか否かの判定を行う例を示す。
[Third Embodiment]
Also in the present embodiment, as in the first embodiment, an example is shown in which it is determined whether or not the input document is word-of-mouth information and whether or not there is a word-of-mouth expression in the sth body.

本実施の形態では、複数筆者検査処理については、前述の第1の実施の形態と同様の動作であるため、説明を省略する。なお、複数筆者検査処理を行うか否かは任意であり、省略することも可能である。   In the present embodiment, the multi-writer inspection process is the same operation as that of the first embodiment described above, and thus the description thereof is omitted. It should be noted that whether or not to perform the multi-writer inspection process is arbitrary and can be omitted.

図25は、本発明の第3の実施の形態における本文抽出のフローチャートである。同図において、図11と同一の動作については同一のステップ番号を付し、その説明を省略する。   FIG. 25 is a flowchart of text extraction in the third embodiment of the present invention. In the figure, the same operations as those in FIG. 11 are denoted by the same step numbers, and the description thereof is omitted.

ステップ201〜ステップ204までの処理は、図11と同様であるため、その説明を省略する。   The processing from step 201 to step 204 is the same as that in FIG.

ステップ211) 本文抽出部510は、s番目の本文に含まれる文章数N(s)を検出し、N(s)をデータ記憶部501に格納する(N(s)>0)。   Step 211) The text extracting unit 510 detects the number N (s) of sentences included in the sth text, and stores N (s) in the data storage unit 501 (N (s)> 0).

ステップ212) zに1を代入する。但し、zは本文中の文章のカウントである。   Step 212) Substitute 1 for z. Where z is the count of sentences in the text.

ステップ213) z>N(s)であるかを判定し、そうである場合にはステップ2114に移行し、そうでない場合には、ステップ215に移行する。   Step 213) It is determined whether z> N (s). If so, the process proceeds to Step 2114. If not, the process proceeds to Step 215.

ステップ214) sに1を加算しステップ204に移行する。   Step 214) Add 1 to s and proceed to Step 204.

ステップ215) s番目の本文のz番目の文章に含まれる文の数n(s)(z)を検出し、n(s)(z)をデータ記憶部501に格納する(n(s)(z)>0)。   Step 215) The number n (s) (z) of sentences included in the zth sentence of the sth body is detected, and n (s) (z) is stored in the data storage unit 501 (n (s) ( z)> 0).

ステップ216) s番目の本文のz番目の文章をデータ記憶部501に格納する。   Step 216) The z-th sentence of the s-th body is stored in the data storage unit 501.

ステップ217) zに1を加算し、ステップ213に移行する。   Step 217) Add 1 to z and go to Step 213.

上記のフローチャートに示す動作により、データ記憶部501に出力される内容は、各クチコミセットの本文それぞれに含まれる文章、各クチコミセットの本文それぞれに含まれる文章の数N(1),…,N(S)、及び、各クチコミセットの本文それぞれに含まれる文章それぞれに含まれる文の数n(1)(1),…,n(S)(N(S))である。   Through the operation shown in the flowchart, the contents output to the data storage unit 501 include the texts included in the texts of each review set, the number of sentences included in the texts of each review set N (1),. (S) and the number n (1) (1),..., N (S) (N (S)) of sentences included in each of the sentences included in the body text of each review set.

次に、本実施の形態における評価表現検査処理について説明する。   Next, the evaluation expression inspection process in this embodiment will be described.

図26は、本発明の第3の実施の形態における評価表現検査処理のフローチャートである。   FIG. 26 is a flowchart of the evaluation expression checking process in the third embodiment of the present invention.

ステップ341) 評価表現検査処理部520には、本文の数S、本文に含まれる文章と文章数N(1),…,N(S)が入力される。   Step 341) The evaluation expression inspection processing unit 520 receives the number S of texts, the texts included in the texts, and the text numbers N (1), ..., N (S).

ステップ342) sに1を代入し、zに0を代入する。ここで、sは本文の数、zは文章の数である。   Step 342) Substitute 1 for s and 0 for z. Here, s is the number of texts and z is the number of sentences.

ステップ343) sがSより大きければ処理を終了する。   Step 343) If s is larger than S, the process is terminated.

ステップ344) zに1を加算する。   Step 344) Add 1 to z.

ステップ345) zがN(s)より大きければステップ351に移行する。   Step 345) If z is larger than N (s), the process proceeds to Step 351.

ステップ346) s番目の本文のz番目の文章に対して形態素解析を行う。   Step 346) Morphological analysis is performed on the zth sentence of the sth body.

ステップ347) 形態素解析結果と評価表現記憶部20に格納されている評価表現を照合し、合致する表現と合致する表現の数h(s)(z)を調べる。   Step 347) The morpheme analysis result and the evaluation expression stored in the evaluation expression storage unit 20 are collated, and the number h (s) (z) of expressions that match the matching expressions is checked.

ステップ348) 合致する表現があるか(h(s)(z)>0)を判定し、ある場合には、ステップ349に移行し、ない場合にはステップ350に移行する。   Step 348) It is determined whether there is a matching expression (h (s) (z)> 0). If there is, the process proceeds to Step 349, and if not, the process proceeds to Step 350.

ステップ349) 合致する表現と表現の数h(s)(z)をデータ記憶部501に格納し、ステップ344に移行する。なお、合致する表現と表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。   Step 349) The matching expression and the number of expressions h (s) (z) are stored in the data storage unit 501, and the process proceeds to Step 344. Note that it is not essential to store the matching expressions and the number of expressions in the data storage unit 501, but it is necessary when outputting, or when adding a weight to a specific expression.

ステップ350) 合致する表現の数=0をデータ記憶部501に格納し、ステップ344に移行する。   Step 350) Store the number of matching expressions = 0 in the data storage unit 501, and proceed to Step 344.

ステップ351) s番目の本文に含まれる文章中に一つでも評価表現が含まれれば、「評価表現あり」とし、含まれなければ「評価表現なし」と判定する。   Step 351) If at least one evaluation expression is included in the sentence included in the sth body, it is determined that there is “evaluation expression”, and if it is not included, it is determined that there is no evaluation expression.

ステップ352) sに1を加算し、zに0を代入し、ステップ343に移行する。   Step 352) Add 1 to s, substitute 0 for z, and go to Step 343.

上記の処理により、データ記憶部501に出力されるのは、各本文中の評価表現の有無、評価表現のある本文中の各文章に含まれる評価表現及び、評価表現がある本文中の各文章に含まれる評価表現の数h(s)(z)である。   As a result of the above processing, the data storage unit 501 outputs the presence / absence of evaluation expressions in each text, the evaluation expressions included in each text in the text with the evaluation expressions, and each text in the text having the evaluation expressions. Is the number h (s) (z) of evaluation expressions included in.

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ346とステップ347の代わりに、s番目の本文と評価表現記憶部20に格納されている評価表現について文字列マッチングにより照合し、合致する表現、及び評価表現がある本文中の各文章に含まれる評価表現の数h(s)(z)があるかを調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 346 and step 347. The number of evaluation expressions h (s) (z) included in each sentence in the body with the matching expression and the evaluation expression. )

図27は、本発明の第3の実施の形態における体験表現検査処理のフローチャートである。   FIG. 27 is a flowchart of the experience expression inspection process in the third embodiment of the present invention.

ステップ441) 体験表現検査処理部530に、本文の数S,本文に含まれる文章と文章数N(1),…,N(S)がデータ記憶部501から入力される。   Step 441) The experience expression inspection processing unit 530 receives from the data storage unit 501 the number S of texts, the texts included in the texts, and the text numbers N (1),..., N (S).

ステップ442) sに1を代入し、zに0を代入する。ここで、sは本文のカウントであり、zは文章数のカウントである。   Step 442) 1 is substituted into s, and 0 is substituted into z. Here, s is a text count, and z is a text count.

ステップ443) s>Sであるかを判定し、そうである場合には処理を終了する。   Step 443) It is determined whether or not s> S. If so, the process ends.

ステップ444) zに1を加算する。   Step 444) Add 1 to z.

ステップ445) z>N(s)であるかを判定し、そうである場合には、ステップ451に移行する。   Step 445) It is determined whether z> N (s). If so, the process proceeds to Step 451.

ステップ446) s番目の本文のz番目の文章に対して形態素解析を行う。   Step 446) Perform morphological analysis on the zth sentence of the sth body.

ステップ447) 形態素解析結果と体験表現記憶部21に格納されている体験表現を照合し、合致する表現と、合致する表現の数t(s)(z)を調べる。   Step 447) The morpheme analysis result and the experience expression stored in the experience expression storage unit 21 are collated, and the matching expression and the number of matching expressions t (s) (z) are checked.

ステップ448) 合致する表現があるか(t(s)(z)>0)を判定し、ある場合には、ステップ449に移行し、ない場合にはステップ450に移行する。   Step 448) It is determined whether there is a matching expression (t (s) (z)> 0). If there is a matching expression, the process proceeds to Step 449, and if not, the process proceeds to Step 450.

ステップ449) 合致する表現と合致する表現の数t(s)(z)をデータ記憶部501に格納し、ステップ444に移行する。なお、合致する表現と合致する表現の数をデータ記憶部501に格納することは必須ではなく、出力をする場合や、ある特定の表現のみ重みを加算する場合等に必要となる。   Step 449) The number t (s) (z) of the matching expressions and the matching expressions are stored in the data storage unit 501, and the process proceeds to Step 444. Note that it is not essential to store the number of matching expressions with the matching expressions in the data storage unit 501. This is necessary when outputting, or when adding a weight to a specific expression.

ステップ450) 合致する表現の数(t(s)(z)=0)をデータ記憶部501に格納し、ステップ444に移行する。   Step 450) The number of matching expressions (t (s) (z) = 0) is stored in the data storage unit 501, and the process proceeds to Step 444.

ステップ451) s番目の本文に含まれる文章中に1つでも体験表現が含まれてていれば、「体験表現あり」、その体験表現、体験表現の数をデータ記憶部501に格納し、含まれなければ「体験表現なし」と判定し、「体験なし」をデータ記憶部501に格納する。   Step 451) If at least one experiential expression is included in the text included in the sth body, “experience expression is present”, the experiential expression and the number of experiential expressions are stored in the data storage unit 501 and included. Otherwise, it is determined that “no experience expression” and “no experience” is stored in the data storage unit 501.

ステップ452) sに1を加算し、zに0を代入する。   Step 452) Add 1 to s and substitute 0 for z.

上記の処理の結果、データ記憶部501には、各本文中の体験表現の有無、体験表現がある本文中の各文章に含まれる体験表現、および、体験表現がある本文中の各文章に含まれる体験表現の数t(s)(z)が格納される。   As a result of the above processing, the data storage unit 501 includes the presence / absence of experience expression in each text, the experience expression included in each sentence in the text with the experience expression, and each sentence in the text with the experience expression. The number of experience expressions t (s) (z) to be stored is stored.

なお、上記では、予め形態素解析処理を実施することが決定されている場合の例を示しているが、もし、形態素解析処理を実施しない場合には、ステップ446とステップ447の代わりに、s番目の本文と体験表現記憶部21に格納されている体験表現について文字列マッチングにより照合し、合致する表現、及び体験表現がある本文中の各文章に含まれる体験表現の数t(s)(z)があるかを調べる。   In the above, an example in which it is determined in advance that the morpheme analysis process is performed is shown. However, if the morpheme analysis process is not performed, the sth is used instead of step 446 and step 447. The number of experience expressions t (s) (z) included in each sentence in the body with the matching expression and the experience expression are matched by character string matching. )

次に、クチコミ情報判定処理を行う。クチコミ判定処理については、前述の第1の実施の形態における図15のステップ501、ステップ504以外の処理について同様である。   Next, word-of-mouth information determination processing is performed. The review determination process is the same for the processes other than step 501 and step 504 of FIG. 15 in the first embodiment described above.

図28は、本発明の第3の実施の形態におけるクチコミ情報判定処理のフローチャートである。ステップ501において、
・本文の数S;
・各本文に含まれる文章の数N(1),…,N(S);
・各本文の各文章に含まれる文の数n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数h(1)(1),…,h(S)(N(S));
が入力される。
FIG. 28 is a flowchart of the word-of-mouth information determination process in the third embodiment of the present invention. In step 501,
-Number of text S;
・ The number of sentences included in each text N (1), ..., N (S);
The number of sentences included in each sentence of each body text n (1) (1),..., N (S) (N (S));
・ Experience expressions and their numbers t (1) (1),..., T (S) (N (S)) included in each sentence of each text;
・ Evaluation expressions included in each sentence of each body and the number h (1) (1),..., H (S) (N (S));
Is entered.

以下に、本実施の形態における、図15におけるステップ504の処理について図29を用いて説明する。   The processing in step 504 in FIG. 15 in the present embodiment will be described below with reference to FIG.

図29は、本発明の第3の実施の形態におけるクチコミ表現有無の判定のフローチャートである。   FIG. 29 is a flowchart of the determination of the presence / absence of word-of-mouth expression in the third embodiment of the present invention.

なお、本実施の形態では、図28のステップ501において、クチコミ情報判定処理部540にデータ記憶部501から上記の内容が入力されるものとする。上記の例として例えば、図30に示すような内容が入力される。   In the present embodiment, it is assumed that the above-described contents are input from the data storage unit 501 to the word-of-mouth information determination processing unit 540 in step 501 of FIG. For example, the contents shown in FIG. 30 are input as the above example.

以下に、ステップ504の処理について説明する。   Hereinafter, the processing of step 504 will be described.

ステップ5061) クチコミ情報判定処理部540は、s番目の本文に評価表現と体験表現の両者があるかを判定し、ある場合にはステップ5062に移行し、ない場合には、ステップ5067に移行する。   Step 5061) The word-of-mouth information determination processing unit 540 determines whether there are both evaluation expression and experience expression in the sth body. If there is, the process proceeds to Step 5062, and if not, the process proceeds to Step 5067. .

ステップ5062) zに1を代入する。   Step 5062) Substitute 1 for z.

ステップ5063) z>N(s)であるかを判定し、そうであればステップ5067に移行し、そうでなければステップ5064に移行する。   Step 5063) It is determined whether z> N (s). If so, the process goes to Step 5067, and if not, the process goes to Step 5064.

ステップ5064) (h(s)(z)+t(s)(z))/n(s)(z)≧Y(但し、Yは予め設定された閾値)であるかを判定し、そうであれば、ステップ5065に移行し、そうでなければステップ5066に移行する。   Step 5064) It is determined whether (h (s) (z) + t (s) (z)) / n (s) (z) ≧ Y (where Y is a preset threshold value). If not, the process proceeds to step 5065. Otherwise, the process proceeds to step 5066.

なお、上記の(h(s)(z)+t(s)(z))/n(s)(z)≧Yの条件の代わりに、h(s)(z)+t(s)(z)≧Yを用いて判定してもよい。   In addition, instead of the above condition (h (s) (z) + t (s) (z)) / n (s) (z) ≧ Y, h (s) (z) + t (s) (z) It may be determined using ≧ Y.

ステップ5065) s番目の本文には「クチコミ表現あり」と判定する。   Step 5065) It is determined that “the word-of-mouth expression is present” in the sth body.

ステップ5067) s番目の本文には「クチコミ表現なし」と判定する。   Step 5067) It is determined that the s-th body has no word-of-mouth expression.

上記の処理により前述の図24のような出力が得られる。   With the above processing, the output as shown in FIG. 24 is obtained.

また、本実施の形態では、
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文の各文章に含まれる文の数:n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数:t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数:h(1)(1),…,h(S)(N(S));
としたとき、
f(H,T)は、評価表現や体験表現全体に重みを付けて計算することもできる。
In the present embodiment,
・ Number of text: S;
・ The number of sentences included in each text: N (1), ..., N (S);
-Number of sentences included in each sentence of each body: n (1) (1), ..., n (S) (N (S));
・ Experience expressions included in each sentence of each body and the number thereof: t (1) (1),..., T (S) (N (S));
-Evaluation expressions included in each sentence of each body and the number thereof: h (1) (1), ..., h (S) (N (S));
When
f (H, T) can also be calculated by weighting the entire evaluation expression and experience expression.

例えば、評価表現の重みをE、体験表現の重みをGとしたとき、
f(H,T)=(E×h(s)(z)+G×t(s)(z))/n(s)(z) 式(4)
また、表現全体ではなく、ある特定の語句にのみ重みを付けて計算することも可能である。それぞれの体験表現もしくは評価表現の出現数は、評価表現検査処理部520や体験表現検査処理部530にて検出されているため、次のような式ができる。
For example, when the weight of evaluation expression is E and the weight of experience expression is G,
f (H, T) = (E × h (s) (z) + G × t (s) (z)) / n (s) (z) Equation (4)
It is also possible to calculate by weighting only a specific phrase, not the entire expression. Since the number of appearances of each experience expression or evaluation expression is detected by the evaluation expression inspection processing unit 520 and the experience expression inspection processing unit 530, the following expression can be obtained.

評価表現の出現種類もしくは、評価表現記憶部20にある評価表現の総数:AH;
体験表現の出現種類もしくは、体験表現記憶部21にある体験表現の総数:AT;
ある特定の評価表現:nH(0<n<AH);
ある特定の体験表現:mT(0<m<AT);
s番目の本文のある文章zの中に出現するnHの数:nH(s)(z)
(0≦nH(s)(z)≦h(s)(z))
s番目の本文にある文章zの中に出現するmTの数:mT(s)(z)
(0≦mT(s)(z)≦t(s)(z))
ある特定の表現nHにかかる重み:ne;
ある特定の表現nTにかかる重み:ng;
としたとき、
f(H,T)=Σ(ne×nH(s)(z))+Σ(ng×mT(s)(z)) 式(5)
各表現に対する重みがそれぞれ1である場合は、
h(s)(z)=ΣnH(s)(z),
t(s)(z)=ΣmT(s)(z)
となる。つまり、s番目の本文のz番目の文章に含まれる評価表現と体験表現の数と等しくなる。
Appearance types of evaluation expressions or the total number of evaluation expressions in the evaluation expression storage unit 20: AH;
Type of appearance of experience expression or total number of experience expressions in experience expression storage unit 21: AT;
A specific evaluation expression: nH (0 <n <AH);
A specific experience expression: mT (0 <m <AT);
The number of nH appearing in the sentence z with the sth body: nH (s) (z)
(0 ≦ nH (s) (z) ≦ h (s) (z))
The number of mTs that appear in the sentence z in the sth body: mT (s) (z)
(0 ≦ mT (s) (z) ≦ t (s) (z))
The weight on a particular expression nH: ne;
Weight on a particular expression nT: ng;
When
f (H, T) = Σ (ne × nH (s) (z)) + Σ (ng × mT (s) (z)) Equation (5)
If the weight for each representation is 1,
h (s) (z) = ΣnH (s) (z),
t (s) (z) = ΣmT (s) (z)
It becomes. That is, it is equal to the number of evaluation expressions and experience expressions included in the zth sentence of the sth body.

また、
f(H,T)={Σ(ne×nH(s)(z))+Σ(ng×mT(s)(z))}
÷n(s)(z) 式(6)
で表すこともできる。式(4)(5)(6)、ともf(H,T)≧Y(Yは予め設定した閾値)であれば、入力がクチコミ表現であると判定することができる。
Also,
f (H, T) = {Σ (ne × nH (s) (z)) + Σ (ng × mT (s) (z))}
÷ n (s) (z) Equation (6)
It can also be expressed as If both formulas (4), (5), and (6) are f (H, T) ≧ Y (Y is a preset threshold value), it can be determined that the input is a word-of-mouth expression.

このf(H,T)は、上記の例に限定されることなく、HとTを用いた計算式で表すことができる。   This f (H, T) is not limited to the above example, and can be expressed by a calculation formula using H and T.

[第4の実施の形態]
本実施の形態は、第1の実施の形態とクチコミ情報判定処理のみが異なる。本実施の形態におけるクチコミ情報判定処理では、入力文書のクチコミ率を求めるものである。他の処理については、第1の実施の形態と同様であるので、以下では、クチコミ情報判定処理のみを説明する。
[Fourth Embodiment]
This embodiment is different from the first embodiment only in word-of-mouth information determination processing. In the word-of-mouth information determination process in the present embodiment, the word-of-mouth rate of the input document is obtained. Since other processes are the same as those in the first embodiment, only the word-of-mouth information determination process will be described below.

図31は、本発明の第4の実施の形態におけるクチコミ情報判定処理のフローチャートである。   FIG. 31 is a flowchart of the word-of-mouth information determination process in the fourth embodiment of the present invention.

ステップ701) クチコミ情報判定処理部540に、データ記憶部501から以下の内容が入力される。
・各本文の数S;
・各本文に含まれる体験表現のあり/なし;
・各本文に含まれる評価表現のあり/なし;
ステップ702) sに1を代入し、kに0を代入する。ここで、sは本文のカウントであり、kはクチコミ表現と判定されたクチコミ情報セット数である。
Step 701) The following information is input from the data storage unit 501 to the review information determination processing unit 540.
・ The number S of each text;
・ With / without experience expression included in each text;
・ With / without evaluation expression included in each text;
Step 702) Substitute 1 for s and 0 for k. Here, s is a text count, and k is the number of word-of-mouth information sets determined to be word-of-mouth information.

ステップ703) s>Sであればステップ707に移行する。   Step 703) If s> S, go to Step 707.

ステップ704) s番目の本文にクチコミ表現があるかを判定し、ない場合には、ステップ706に移行し、ある場合はステップ705に移行する。本ステップの詳細な処理については、前述の図17の処理を行う。   Step 704) It is determined whether there is a word-of-mouth expression in the s-th body. For the detailed processing of this step, the above-described processing of FIG. 17 is performed.

ステップ705) kに1を加算する。   Step 705) Add 1 to k.

ステップ706) sに1を加算し、ステップ703に移行する。   Step 706) Add 1 to s, and go to Step 703.

ステップ707) 入力文書のクチコミ率を、K/S*100(%)により計算し、出力する。但し、上記のk,Kは、クチコミ表現と判定された情報セット数である。   Step 707) The word-of-mouth rate of the input document is calculated by K / S * 100 (%) and output. However, the above k and K are the number of information sets determined as word-of-mouth expressions.

上記のステップ707について説明する。当該ステップ707は、入力文書全体がクチコミ情報かどうか、もしくは、クチコミ率は何%かを判定する。この判定方法は、次のような関数で表すことができる。   The above step 707 will be described. In step 707, it is determined whether the entire input document is word-of-mouth information or the word-of-mouth rate is what percentage. This determination method can be expressed by the following function.

f(K,S)
K:クチコミ表現と判定されたクチコミ情報セット数≧0
S:入力されたクチコミ情報セット数(=本文の数)≧1
例えば、
f(K,S)=K÷Sとし、
f(K,S)は、クチコミ率として次のように表現することができる。
f (K, S)
K: Number of word-of-mouth information sets determined as word-of-mouth expression ≧ 0
S: Number of input review information sets (= number of texts) ≧ 1
For example,
f (K, S) = K ÷ S,
f (K, S) can be expressed as a word-of-mouth rate as follows.

f(K,S)=K÷S×100
本実施の形態では、クチコミ率のみが出力される。
f (K, S) = K ÷ S × 100
In this embodiment, only the word-of-mouth rate is output.

[第5の実施の形態]
本実施の形態は、第2の実施の形態とクチコミ情報判定処理のみが異なる。本実施の形態におけるクチコミ情報判定処理では、入力文書のクチコミ率を求めるものである。他の処理については、第2の実施の形態と同様であるので、以下では、クチコミ情報判定処理のみを説明する。
[Fifth Embodiment]
This embodiment is different from the second embodiment only in the word-of-mouth information determination process. In the word-of-mouth information determination process in the present embodiment, the word-of-mouth rate of the input document is obtained. Since other processes are the same as those in the second embodiment, only the word-of-mouth information determination process will be described below.

図32は、本発明の第5の実施の形態におけるクチコミ情報判定処理のフローチャートである。   FIG. 32 is a flowchart of word-of-mouth information determination processing in the fifth embodiment of the present invention.

ステップ801において、
・本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文に含まれる体験表現とその数:t(1),…,t(S);
・各本文に含まれる評価表現とその数:h(1),…,h(S);
が入力される。
In step 801,
・ Number of text: S;
・ The number of sentences included in each text: N (1), ..., N (S);
・ Experience expressions included in each text and the number thereof: t (1), ..., t (S);
-Evaluation expressions included in each text and the number thereof: h (1), ..., h (S);
Is entered.

クチコミ情報判定処理においては、前述の第4の実施の形態における図31の処理と同様である。但し、ステップ704において、図23のステップ゜5052に示すクチコミ表現あり/なしを判定するための式((h(s)+t(s))/N(s)≧Y)を用いる。   The review information determination process is the same as the process of FIG. 31 in the fourth embodiment described above. However, in step 704, an expression ((h (s) + t (s)) / N (s) ≧ Y) for determining whether or not there is a word-of-mouth expression shown in step ° 5052 in FIG.

上記の処理により、本実施の形態では、図33に示すような結果が出力される。   With the above processing, in the present embodiment, a result as shown in FIG. 33 is output.

また、本実施の形態において、前述の第2の実施の形態と同様にクチコミ判定処理において、重みを付けることも可能である。   In the present embodiment, it is also possible to add a weight in the word-of-mouth determination process as in the second embodiment described above.

[第6の実施の形態]
本実施の形態では、前述の第3の実施の形態とは、クチコミ情報判定処理において入力文書のクチコミ率を求める点のみが異なる。
[Sixth Embodiment]
This embodiment is different from the above-described third embodiment only in that the word-of-mouth rate of the input document is obtained in the word-of-mouth information determination process.

図34は、本発明の第6の実施の形態におけるクチコミ判定処理のフローチャートである。同図に示すフローチャートは、前述の第4の実施の形態における図31のフローチャートのステップ701のみが異なり、他の処理については第4の実施の形態と同様であるため、説明を省略する。   FIG. 34 is a flowchart of the word-of-mouth determination process in the sixth embodiment of the present invention. The flowchart shown in the figure is different from the flowchart of FIG. 31 in the above-described fourth embodiment only, and the other processes are the same as those of the fourth embodiment, and thus description thereof is omitted.

ステップ901) クチコミ情報判定処理部540に、データ記憶部501から以下の内容が入力される。
・各本文の数:S;
・各本文に含まれる文章の数:N(1),…,N(S);
・各本文の各文章に含まれる文の数n(1)(1),…,n(S)(N(S));
・各本文の各文章に含まれる体験表現とその数:t(1)(1),…,t(S)(N(S));
・各本文の各文章に含まれる評価表現とその数:h(1)(1),…,h(S)(N(S));
また、本実施の形態では、ステップ704の処理として、前述の第3の実施の形態と同様に図29の処理を行うものであるので、その説明を省略する。
Step 901) The following information is input from the data storage unit 501 to the review information determination processing unit 540.
・ Number of texts: S;
・ The number of sentences included in each text: N (1), ..., N (S);
The number of sentences included in each sentence of each body text n (1) (1),..., N (S) (N (S));
・ Experience expressions included in each sentence of each body and the number thereof: t (1) (1),..., T (S) (N (S));
-Evaluation expressions included in each sentence of each body and the number thereof: h (1) (1), ..., h (S) (N (S));
Further, in the present embodiment, as the processing in step 704, the processing in FIG. 29 is performed in the same manner as in the third embodiment described above, and thus the description thereof is omitted.

上記の処理の結果、図33に示す結果が出力される。   As a result of the above processing, the result shown in FIG. 33 is output.

また、本実施の形態において、前述の第3の実施の形態と同様にクチコミ判定処理において、重みを付けることも可能である。   In the present embodiment, it is also possible to add a weight in the word-of-mouth determination process as in the third embodiment.

なお、上記の第1〜第6の実施の形態に示す動作をプログラムとして構築し、評価表現記憶部20、体験表現記憶部21、データ記憶部501を有するコンピュータに実行させる、または、ネットワークを介して流通させることが可能である。   The operations shown in the first to sixth embodiments are constructed as a program and executed by a computer having the evaluation expression storage unit 20, the experience expression storage unit 21, and the data storage unit 501, or via a network. Can be distributed.

また、構築されたプログラムをクチコミ情報判定装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールする、または、配布することが可能である。   Also, the constructed program is stored in a hard disk device connected to a computer used as a word-of-mouth information determination device, a portable storage medium such as a flexible disk, a CD-ROM, etc., and installed in a computer or distributed. Is possible.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、ある物事に関するユーザの声や、評判などを判定する技術や、Web検索の分類技術に適用可能である。   The present invention can be applied to a technique for determining a user's voice and reputation regarding a certain thing, and a Web search classification technique.

本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の一実施の形態における概要を説明するための図である。It is a figure for demonstrating the outline | summary in one embodiment of this invention. 本発明の一実施の形態におけるクチコミ情報判定装置の構成図である。It is a block diagram of the review information determination apparatus in one embodiment of this invention. 本発明の一実施の形態における体験表現の例である。It is an example of the experience expression in one embodiment of this invention. 本発明の一実施の形態におけるクチコミ情報判定処理の概要動作のフローチャートである。It is a flowchart of the outline | summary operation | movement of the review information determination process in one embodiment of this invention. 本発明の一実施の形態におけるクチコミ情報入力例である。It is an example of word-of-mouth information input in one embodiment of the present invention. 本発明の一実施の形態における入力文書、本文、文章、文の関係を示す図である。It is a figure which shows the relationship between the input document in one embodiment of this invention, the text, a sentence, and a sentence. 本発明の第1の実施の形態におけるクチコミ情報入力html構造の例である。It is an example of the word-of-mouth information input html structure in the 1st Embodiment of this invention. 本発明の第1の実施の形態における複数筆者検査処理のフローチャート(名前からスタートする例)である。It is a flowchart (example which starts from a name) of the multi-writer test | inspection process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における本文抽出処理のフローチャートである。It is a flowchart of the text extraction process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における評価表現検査処理のフローチャートである。It is a flowchart of the evaluation expression test | inspection process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における体験表現検査処理のフローチャートである。It is a flowchart of the experience expression test | inspection process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における形態素解析結果の例である。It is an example of the morphological analysis result in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるデータ記憶部のデータ例である。It is an example of data of the data storage part in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。It is a flowchart of the determination of the presence or absence of the word-of-mouth expression in the 1st Embodiment of this invention. 本発明の第2の実施の形態における本文抽出処理のフローチャートである。It is a flowchart of the text extraction process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における評価表現検査処理のフローチャートである。It is a flowchart of the evaluation expression inspection process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における体験表現検査処理のフローチャートである。It is a flowchart of the experience expression test | inspection process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。It is a flowchart of the determination of the presence or absence of the word-of-mouth expression in the 2nd Embodiment of this invention. 本発明の第2の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態におけるクチコミ表現の有無の判定のフローチャートである。It is a flowchart of the determination of the presence or absence of the word-of-mouth expression in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における出力例である。It is an output example in the 2nd Embodiment of this invention. 本発明の第3の実施の形態における本文抽出処理のフローチャートである。It is a flowchart of the text extraction process in the 3rd Embodiment of this invention. 本発明の第3の実施の形態における評価表現検査処理のフローチャートである。It is a flowchart of the evaluation expression inspection process in the 3rd Embodiment of this invention. 本発明の第3の実施の形態における体験表現検査処理のフローチャートである。It is a flowchart of the experience expression test | inspection process in the 3rd Embodiment of this invention. 本発明の第3の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 3rd Embodiment of this invention. 本発明の第3の実施の形態におけるクチコミ表現有無の判定のフローチャートである。It is a flowchart of the determination of the word-of-mouth expression presence or absence in the 3rd Embodiment of this invention. 本発明の第3の実施の形態におけるデータ記憶部のデータ例である。It is an example of data of the data storage part in the 3rd Embodiment of this invention. 本発明の第4の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 4th Embodiment of this invention. 本発明の第5の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 5th Embodiment of this invention. 本発明の第5の実施の形態における出力例である。It is an output example in the 5th Embodiment of this invention. 本発明の第6の実施の形態におけるクチコミ情報判定処理のフローチャートである。It is a flowchart of the review information determination process in the 6th Embodiment of this invention.

符号の説明Explanation of symbols

10 コンピュータ
11 表示部
12 指示入力部
20 評価表現記憶手段、評価表現記憶部
21 体験表現記憶手段、体験表現記憶部
40 ネットワーク
501 データ記憶手段、データ記憶部
500 複数筆者検査処理部
510 本文抽出処理部
520 評価表現検査手段、評価表現検査部
530 体験表現検査手段、体験表現検査部
540 クチコミ情報判定手段、クチコミ情報判定部
10 Computer 11 Display Unit 12 Instruction Input Unit 20 Evaluation Expression Storage Unit, Evaluation Expression Storage Unit 21 Experience Expression Storage Unit, Experience Expression Storage Unit 40 Network 501 Data Storage Unit, Data Storage Unit 500 Multi-Writer Examination Processing Unit 510 Text Extraction Processing Unit 520 Evaluation expression inspection means, evaluation expression inspection section 530 Experience expression inspection means, experience expression inspection section 540 Review information determination means, Review information determination section

Claims (10)

入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段の情報を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、
を有することを特徴とするクチコミ情報判定装置。
A word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from the input text,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression, which is a word that evaluates the quality of things, is described in the input text, and the determination result is stored in the data storage means. Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the input text, and the determination result is a data storage means The experiential expression inspection means stored in the
When the information of the data storage means is read out, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth determination means for determining whether or not a word-of-mouth is based on a word-of-mouth determination function represented by an evaluation expression and a calculation formula based on the experience expression;
The word-of-mouth information determination apparatus characterized by having.
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
前記評価表現記憶手段を参照して、前記本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果を前記データ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記本文の中に、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果を前記データ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定手段と、
を有することを特徴とするクチコミ情報判定装置。
A word-of-mouth information determination device that determines word-of-mouth information including experiences and complaints about a certain thing in the text entered or the structure of a web page, and complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection means for inspecting whether the text, the name or the symbol set repeatedly appears;
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the text, and the determination result is stored in the data storage means Evaluation expression inspection means to
With reference to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the text, and the determination result is the data storage means The experiential expression inspection means stored in the
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth determination means for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
The word-of-mouth information determination apparatus characterized by having.
入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記評価表現記憶手段を参照して、入力されたテキストに、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記入力されたテキストに、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストの全体のうち、前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、
を有することを特徴とするクチコミ情報判定装置。
A word-of-mouth information determination device for determining word-of-mouth information including experiences and complaints about a certain thing from the input text,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression, which is a word that evaluates the quality of things, is described in the input text, and the determination result is stored in the data storage means. Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of a thing is described in the input text, and the determination result is a data storage means The experiential expression inspection means stored in the
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means, A word-of-mouth rate calculation means for calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information, of the whole of the input text by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
The word-of-mouth information determination apparatus characterized by having.
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定装置であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査手段と、
前記評価表現記憶手段を参照して、前記本文の中に、物事の良し悪しを評価するような語句である評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査手段と、
前記体験表現記憶手段を参照して、前記本文の中に、物事を利用もしくは体験・経験したことを表すような語句である体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査手段と、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査手段で評価表現が記述されていると判定され、かつ、前記体験表現検査手段で体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストまたは前記Webページの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出手段と、
を有することを特徴とするクチコミ情報判定装置。
A word-of-mouth information determination device that determines word-of-mouth information including experiences and complaints about a certain thing in the text entered or the structure of a web page, and complaints,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
Experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection means for inspecting whether the text, the name or the symbol set repeatedly appears;
Referring to the evaluation expression storage means, it is determined whether or not an evaluation expression that is a phrase that evaluates the quality of things is described in the text, and the determination result is stored in the data storage means Evaluation expression inspection means;
Referring to the experience expression storage means, it is determined whether or not an experience expression that is a phrase representing use or experience / experience of things is described in the text, and the determination result is stored in the data storage means Storing experiential expression inspection means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described by the evaluation expression inspection means, and the experience expression is determined by the experience expression inspection means The word-of-mouth rate calculation that calculates the word-of-mouth rate, which is the ratio occupied by the word-of-mouth information in the input text or the entire Web page, by the word-of-mouth determination function represented by the calculation expression based on the evaluation expression and the experience expression Means,
The word-of-mouth information determination apparatus characterized by having.
入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、
を行うことを特徴とするクチコミ情報判定方法。
In the word-of-mouth information determination method for determining word-of-mouth information including experiences related to certain things, comments used, and complaints from the entered text,
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Referring to the experience expression storage means for storing the experience expression, which is a phrase representing the use or experience / experience of things, it is determined whether the experience expression is described in the input text, and the determination result is obtained. An experiential expression inspection step stored in the data storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth determination step for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、前記本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記本文の中に、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数によりクチコミか否かを判定するクチコミ判定ステップと、
を行うことを特徴とするクチコミ情報判定方法。
In the word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints about certain things from the text entered or the structure of the web page,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection step for inspecting whether the text, the name or the symbol pair appears repeatedly;
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the text, and the determination result is data An evaluation expression checking step to be stored in the storage means;
Referring to experience expression storage means for storing experience expressions, which are phrases representing the use or experience / experience of things, it is determined whether the experience expression is described in the text, and the determination result is data An experiential expression inspection step stored in a storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth determination step for determining whether or not the word-of-mouth is a word-of-mouth by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
入力されたテキストからある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、入力されたテキストに該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記入力されたテキストに、該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を計算するクチコミ率算出ステップと、
を行うことを特徴とするクチコミ情報判定方法。
In the word-of-mouth information determination method for determining word-of-mouth information including experiences related to certain things, comments used, and complaints from the entered text,
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the input text, and the determination result is stored in data An evaluation expression checking step stored in the means;
Referring to the experience expression storage means for storing the experience expression, which is a phrase representing the use or experience / experience of things, it is determined whether the experience expression is described in the input text, and the determination result is obtained. An experiential expression inspection step stored in the data storage means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step A word-of-mouth rate calculation step of calculating a word-of-mouth rate, which is a ratio occupied by the word-of-mouth information in the whole of the input text, by a word-of-mouth determination function represented by a calculation formula based on the evaluation expression and the experience expression;
A word-of-mouth information determination method characterized by:
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定方法において、
前記入力されたテキストの中、もしくはWebページの構造の中に、1つ以上の文で構成された本文と該本文の筆者名やニックネームを含む名前もしくは記号、本文を記述した日付情報の組、もしくは、該本文、該名前または記号の組が繰り返し出現するかどうかを検査する複数筆者検査ステップと、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段を参照して、前記本文の中に、該評価表現が記述されているか否かを判定し、判定結果をデータ記憶手段に格納する評価表現検査ステップと、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段を参照して、前記本文の中に該体験表現が記述されているかを判定し、判定結果をデータ記憶手段に格納する体験表現検査ステップと、
前記データ記憶手段から前記判定結果を読み出して、前記評価表現検査ステップで評価表現が記述されていると判定され、かつ、前記体験表現検査ステップで体験表現が記述されていると判定された場合に、該評価表現と該体験表現による計算式で表されるクチコミ判定関数により、入力された前記テキストまたは前記Webページの全体のうちの前記クチコミ情報が占める比率であるクチコミ率を算出するクチコミ率算出ステップと、
を行うことを特徴とするクチコミ情報判定方法。
In the word-of-mouth information determination method for determining word-of-mouth information including experiences, complaints, and complaints about certain things from the text entered or the structure of the web page,
In the input text or the structure of the web page, a set of one or more sentences and a name or symbol including the writer name or nickname of the body, date information describing the body, Or a multi-writer inspection step for inspecting whether the text, the name or the symbol pair appears repeatedly;
Referring to an evaluation expression storage means for storing an evaluation expression that is a phrase that evaluates the quality of things, it is determined whether or not the evaluation expression is described in the text, and the determination result is data An evaluation expression checking step to be stored in the storage means;
Refers to experience expression storage means for storing experience expressions that are words representing use or experience / experience of things, determines whether the experience expressions are described in the text, and stores the determination results as data An experiential expression inspection step stored in the means;
When the determination result is read from the data storage means, it is determined that the evaluation expression is described in the evaluation expression inspection step, and the experience expression is determined to be described in the experience expression inspection step The word-of-mouth rate calculation that calculates the word-of-mouth rate, which is the ratio occupied by the word-of-mouth information in the input text or the entire Web page, by the word-of-mouth determination function represented by the calculation expression based on the evaluation expression and the experience expression Steps,
A word-of-mouth information determination method characterized by:
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムであって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、
前記請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させることを特徴とするクチコミ情報判定プログラム。
A word-of-mouth information determination program for determining word-of-mouth information including experience stories, impressions used, and complaints from the text entered or the structure of a web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
In a computer equipped with experience expression storage means for storing experience expressions that are words representing use or experience / experience of things,
A word-of-mouth information determination program for executing the word-of-mouth information determination method according to any one of claims 5 to 8.
入力されたテキストの中、もしくはWebページの構造の中からある物事に関する体験談や利用した感想、苦情を含むクチコミ情報を判定するクチコミ情報判定プログラムを格納した記憶媒体であって、
物事の良し悪しを評価するような語句である評価表現を格納する評価表現記憶手段と、
物事を利用もしくは体験・経験したことを表す語句である体験表現を格納する体験表現記憶手段と、を備えたコンピュータに、
前記請求項5乃至8記載のクチコミ情報判定方法を実現するための処理を実行させるプログラムを格納したことを特徴とするクチコミ情報判定プログラムを格納した記憶媒体。
A storage medium storing a word-of-mouth information determination program for determining word-of-mouth information including experiences, complaints, and complaints related to certain things from the input text or the structure of a web page,
An evaluation expression storage means for storing an evaluation expression, which is a phrase that evaluates the quality of things,
In a computer equipped with experience expression storage means for storing experience expressions that are words representing use or experience / experience of things,
9. A storage medium storing a word-of-mouth information determination program, wherein a program for executing a process for realizing the word-of-mouth information determination method according to claim 5 is stored.
JP2005061390A 2005-03-04 2005-03-04 Word-of-mouth information determination method, apparatus, and program Active JP4293145B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005061390A JP4293145B2 (en) 2005-03-04 2005-03-04 Word-of-mouth information determination method, apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005061390A JP4293145B2 (en) 2005-03-04 2005-03-04 Word-of-mouth information determination method, apparatus, and program

Publications (2)

Publication Number Publication Date
JP2006244305A JP2006244305A (en) 2006-09-14
JP4293145B2 true JP4293145B2 (en) 2009-07-08

Family

ID=37050644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005061390A Active JP4293145B2 (en) 2005-03-04 2005-03-04 Word-of-mouth information determination method, apparatus, and program

Country Status (1)

Country Link
JP (1) JP4293145B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5070281B2 (en) * 2007-03-23 2012-11-07 パイオニア株式会社 Information providing system, information management server, information management method, information management program, and storage medium
US20090248484A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Automatic customization and rendering of ads based on detected features in a web page
JP5187187B2 (en) * 2008-12-25 2013-04-24 大日本印刷株式会社 Experience information search system
US9152625B2 (en) * 2011-11-14 2015-10-06 Microsoft Technology Licensing, Llc Microblog summarization
US20130238971A1 (en) 2012-03-07 2013-09-12 Google, Inc. Propagating user feedback on shared posts
JP6486760B2 (en) * 2015-04-30 2019-03-20 Kddi株式会社 Dialog pattern automatic generation apparatus, method and program
JPWO2016199401A1 (en) * 2015-06-11 2018-03-29 日本電気株式会社 Information processing apparatus, information analysis apparatus, information processing method, information analysis method, information processing program, and information analysis program
CN111079026B (en) * 2019-11-28 2023-11-24 北京秒针人工智能科技有限公司 Method, storage medium and device for determining character impression data

Also Published As

Publication number Publication date
JP2006244305A (en) 2006-09-14

Similar Documents

Publication Publication Date Title
Oueslati et al. A review of sentiment analysis research in Arabic language
Kuzman et al. Automatic genre identification: a survey
CN101887414B (en) Server for automatically scoring opinion conveyed by text message containing pictorial-symbols
Hosseini et al. SentiPers: a sentiment analysis corpus for Persian
JP4293145B2 (en) Word-of-mouth information determination method, apparatus, and program
JP4347226B2 (en) Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method
JPWO2009096523A1 (en) Information analysis apparatus, search system, information analysis method, and information analysis program
Itani et al. Corpora for sentiment analysis of Arabic text in social media
JP2010211594A (en) Text analysis device and method, and program
Rahate et al. Feature selection for sentiment analysis by using svm
Serigos Using distributional semantics in loanword research: A concept-based approach to quantifying semantic specificity of Anglicisms in Spanish
Ädel Corpus compilation
Serigos Applying corpus and computational methods to loanword research: new approaches to Anglicisms in Spanish
Park et al. Web content summarization using social bookmarks: a new approach for social summarization
Itani Sentiment analysis and resources for informal Arabic text on social media
Tariku et al. Sentiment Mining and Aspect Based Summarization of Opinionated Afaan Oromoo News Text
Alawami Aspect terms extraction of Arabic dialects for opinion mining using conditional random fields
van der Meer et al. A framework for automatic annotation of web pages using the Google rich snippets vocabulary
Litvak et al. Multilingual Text Analysis: Challenges, Models, and Approaches
JP4539616B2 (en) Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof
JP4726683B2 (en) EXPERIENCE INFORMATION EXTRACTION METHOD AND DEVICE, PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM
KR101265467B1 (en) Method for extracting experience and classifying verb in blog
Lin et al. The secret to popular Chinese web novels: A corpus-driven study
Arora et al. Web‐Based News Straining and Summarization Using Machine Learning Enabled Communication Techniques for Large‐Scale 5G Networks
Nelli Textual Data Analysis with NLTK

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4293145

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350