JP5083627B2 - Minority opinion extractor - Google Patents

Minority opinion extractor Download PDF

Info

Publication number
JP5083627B2
JP5083627B2 JP2008150759A JP2008150759A JP5083627B2 JP 5083627 B2 JP5083627 B2 JP 5083627B2 JP 2008150759 A JP2008150759 A JP 2008150759A JP 2008150759 A JP2008150759 A JP 2008150759A JP 5083627 B2 JP5083627 B2 JP 5083627B2
Authority
JP
Japan
Prior art keywords
target
evaluation
keyword
writer
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008150759A
Other languages
Japanese (ja)
Other versions
JP2009295105A (en
Inventor
竜馬 備瀬
直之 田村
博和 笠原
智洋 二本木
光昭 森本
政樹 高田
修 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2008150759A priority Critical patent/JP5083627B2/en
Publication of JP2009295105A publication Critical patent/JP2009295105A/en
Application granted granted Critical
Publication of JP5083627B2 publication Critical patent/JP5083627B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、利用者から寄せられた意見の中から、マイナー(少数派)ではあるが貴重な意見を抽出するための技術に関する。   The present invention relates to a technique for extracting a minor (minority) but valuable opinion from opinions received from users.

近年、インターネット上では、様々なサービスが提供されている。その1つとして、商品、サービス、その他の事象などに関して、一般の利用者による評価や意見を収集し、公開するWebサイト(以下、評価サイトという)が存在する。このような評価サイトでは、商品名などを入力すると、その商品に関する一般利用者による評価情報、意見情報が表示される。このため、評価サイトを利用すると、商品の販売者寄りの情報ではなく、その商品を実際に利用した利用者の評価、意見を知ることができるという利点がある。   In recent years, various services have been provided on the Internet. As one example, there is a Web site (hereinafter referred to as an evaluation site) that collects and publishes evaluations and opinions by general users regarding products, services, and other events. In such an evaluation site, when a product name or the like is input, evaluation information and opinion information about the product by a general user are displayed. For this reason, the use of the evaluation site has an advantage that it is possible to know the evaluation and opinion of the user who actually uses the product, not the information close to the seller of the product.

従来の評価サイトでは、ある事象等について良い評価、悪い評価がどの程度あるかということを知ることができ、また、個別の意見についても知ることができる。しかし、個別の意見については、寄せられている意見の中から任意に選ばれたものを閲覧することができるだけであり、例えば、ある事象について良い評価が多い場合、どのような点に着目して大勢の人が良いと言っているのか、具体的な意見を知ることは難しいという問題がある。また、逆に少数意見であっても、貴重な意見というものも存在するが、こちらは、少ない意見であるだけに抽出することが難しいという問題がある。アンケートなどの設問に対して少数意見をくみ取るようにする技術も存在するが(特許文献1参照)、適格な少数意見を抽出するのに十分ではない。
特開2005−92616号公報
In a conventional evaluation site, it is possible to know how many good evaluations and bad evaluations exist for a certain event, and it is also possible to know individual opinions. However, with regard to individual opinions, it is only possible to browse the ones selected arbitrarily from the received opinions. For example, if there are many good evaluations about an event, what points should be noted There is a problem that it is difficult to know a specific opinion whether many people say it is good. On the other hand, even if there are minority opinions, there are also valuable opinions, but here there is a problem that it is difficult to extract because there are few opinions. Although there is a technique for collecting a minority opinion for a question such as a questionnaire (see Patent Document 1), it is not sufficient to extract a qualified minority opinion.
JP 2005-92616 A

そこで、本発明は、少数派ではあるが貴重な意見をBlog、ネットの掲示板SNS等から抽出することが可能な少数意見抽出装置を提供することを課題とする。   Therefore, an object of the present invention is to provide a minority opinion extraction apparatus that can extract a valuable opinion, although it is a minority, from a blog, a bulletin board SNS, or the like.

上記課題を解決するため、本発明では、記事データを書き手およびカテゴリと対応付けて記憶するとともに、キーワードをカテゴリと対応付けて記憶した記憶手段と、キーワードを指定するキーワード指定手段と、評価対象と評価表現の組み合わせを指定する評価情報指定手段と、前記指定された評価対象と評価表現の組み合わせに従って、前記記憶手段に記憶された記事データから、評価対象を説明する対象説明語を抽出する対象説明語抽出手段と、前記抽出された対象説明語の出現回数を計数する出現回数計数手段と、前記計数の結果、出現回数の少ない対象説明語を有する文を対象説明文として抽出する対象説明文抽出手段と、前記キーワード指定手段により指定されたキーワードが属するカテゴリを特定し、特定されたカテゴリについて得意な書き手を特定する得意書き手特定手段と、前記抽出された対象説明文のうち、当該対象説明文が含まれる記事の書き手が、前記得意書き手である対象説明文を少数意見として抽出する少数意見抽出手段を有する少数意見抽出装置を提供する。   In order to solve the above problems, in the present invention, the article data is stored in association with the writer and the category, the storage unit stores the keyword in association with the category, the keyword specifying unit for specifying the keyword, the evaluation target, An evaluation information specifying means for specifying a combination of evaluation expressions, and an object description for extracting an object explanatory word for explaining the evaluation object from article data stored in the storage means according to the combination of the specified evaluation object and the evaluation expression Word extraction means, appearance frequency counting means for counting the number of appearances of the extracted target explanation word, and target explanation sentence extraction for extracting a sentence having a target explanation word with a small number of appearances as a target explanation text as a result of the counting And a category to which the keyword specified by the keyword specifying means belongs. A good writer identifying means for identifying a good writer and a small number in which the writer of an article including the target explanatory text among the extracted target explanatory texts extracts the target explanatory text that is the expert writer as a minority opinion A minority opinion extraction apparatus having an opinion extraction means is provided.

本発明によれば、指定されたキーワード、評価対象、評価表現を含み、かつ評価対象を説明する対象説明語を含む対象説明文を抽出し、キーワードに対応するカテゴリが得意な書き手を特定し、得意書き手が書いた記事に含まれる対象説明文を少数意見として抽出するようにしたので、ある事象について寄せられた意見の中から、少数派ではあるが貴重な意見を抽出することが可能となるという効果を奏する。   According to the present invention, a target description including a specified keyword, an evaluation target, and an evaluation expression and including a target explanatory word explaining the evaluation target is extracted, and a writer who is good at a category corresponding to the keyword is specified. Since the target explanation contained in the article written by a good writer is extracted as a minority opinion, it is possible to extract a precious opinion, although it is a minority, from the opinions received about a certain event There is an effect.

(1.装置構成)
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。図1は、本発明に係る少数意見抽出装置の構成図である。図1において、10は記憶手段、21はキーワード指定手段、22は評価情報指定手段、30は対象説明語抽出手段、40は出現回数計数手段、50は得意書き手特定手段、60は対象説明文抽出手段、70は少数意見抽出手段、80は意見提示手段、90は演算処理手段である。
(1. Device configuration)
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described in detail with reference to the drawings. FIG. 1 is a configuration diagram of a minority opinion extraction apparatus according to the present invention. In FIG. 1, 10 is a storage means, 21 is a keyword designation means, 22 is an evaluation information designation means, 30 is a target explanation word extraction means, 40 is an appearance count counting means, 50 is a good writer identification means, and 60 is a subject explanation sentence extraction. , 70 is a minority opinion extraction means, 80 is an opinion presentation means, and 90 is an arithmetic processing means.

記憶手段10は、Blog、ネットの掲示板SNS等から抽出してテキスト形式の記事データを、記事データを特定するための記事ID、記事の書き手を特定するための書き手IDと対応付けて記憶するとともに、記事IDと予め用意しておいた記事に関するカテゴリの対応関係、キーワードとカテゴリの対応関係を記憶したものであり、コンピュータに接続されたハードディスク等の記憶装置により実現される。キーワード指定手段21は、利用者が検索対象とするキーワードを指定するものである。評価情報指定手段22は、評価対象と評価表現の組み合わせを指定するものである。評価表現は、「欲しい」、「かわいい」、「きれい」等の評価を表す語であり、評価対象は、評価表現の対象となる語である。少数意見抽出装置100は、利用者がキーワード指定手段21で入力したキーワードと、評価情報指定手段22で入力した評価対象と評価表現を用いて、テキスト形式の記事データから利用者が求める記事データを抽出する。評価表現が「欲しい」であり、評価対象が「情報」であれば、「情報」を「欲しい」と書き込んであり、利用者が入力したキーワードが含まれる記事データから少数意見で有用な記事データを抽出して、利用者に提示するものである。キーワード指定手段21、評価情報指定手段22は、マウスやキーボード等の指示入力機器と、入力機器I/F、およびOSの機能により実現される。演算処理手段90は、コンピュータのCPUおよびメモリで実現され、専用のプログラムをメモリに読み込んでCPUが実行することにより、対象説明語抽出手段30、出現回数計数手段40、得意書き手特定手段50、対象説明文抽出手段60、少数意見抽出手段70としての機能を実現する。   The storage unit 10 stores the article data in the text format extracted from the blog, the bulletin board SNS, etc. in association with the article ID for specifying the article data and the writer ID for specifying the writer of the article. , Which stores the correspondence between article IDs and categories relating to articles prepared in advance, and the correspondence between keywords and categories, and is realized by a storage device such as a hard disk connected to a computer. The keyword specifying means 21 is used for specifying a keyword to be searched by the user. The evaluation information designating unit 22 designates a combination of an evaluation object and an evaluation expression. The evaluation expression is a word representing evaluation such as “desirable”, “cute”, “beautiful”, and the evaluation object is a word to be evaluated. The minority opinion extraction apparatus 100 uses the keyword input by the user using the keyword specifying means 21 and the evaluation target and evaluation expression input by the evaluation information specifying means 22 to obtain article data requested by the user from text-format article data. Extract. If the evaluation expression is "I want" and the evaluation target is "Information", "Information" is written as "I want" and the article data that contains keywords entered by the user is useful for minority opinions. Is extracted and presented to the user. The keyword specifying means 21 and the evaluation information specifying means 22 are realized by an instruction input device such as a mouse and a keyboard, an input device I / F, and an OS function. The arithmetic processing unit 90 is realized by a CPU and a memory of a computer. When the CPU reads a dedicated program into the memory and executes it, the target explanatory word extraction unit 30, the appearance count counting unit 40, the good writer specifying unit 50, the target Functions as the explanatory note extracting unit 60 and the minority opinion extracting unit 70 are realized.

対象説明語抽出手段30は、キーワード指定手段21により利用者に指定されたキーワードと、評価情報指定手段22により利用者に指定された評価対象と評価表現を有する記事データを記憶手段10内から抽出する。抽出した記事データから指定された評価対象を説明する語である対象説明語を抽出する。評価対象が「情報」であれば、「情報」が示す内容が「俳優」であれば「俳優」を対象説明語として抽出する。出現回数計数手段40は、対象説明語抽出手段30により抽出された各対象説明語が、記憶手段10内の全記事データ内で何回出現したかを計数する。得意書き手特定手段50は、キーワード指定手段21により指定されたキーワードで記憶手段10に記憶されているキーワード−カテゴリ対応テーブルを参照して、そのキーワードのカテゴリを特定し、特定したカテゴリが得意な書き手として、そのカテゴリの記事をよく書いている書き手IDを特定する。対象説明文抽出手段60は、出現回数計数手段40により計数された対象説明語のうち、出現回数が所定の数より少ない対象説明語を含む文を対象説明文として抽出する。少数意見抽出手段70は、対象説明文抽出手段60により抽出された対象説明文のうち、その対象説明文が含まれる記事データの書き手IDを抽出し、得意書き手特定手段50で抽出された書き手IDとマッチするものを少数意見として抽出する。   The target explanatory word extraction unit 30 extracts from the storage unit 10 the article data having the keyword specified by the user by the keyword specifying unit 21 and the evaluation target and evaluation expression specified by the user by the evaluation information specifying unit 22. To do. A target explanatory word that is a word explaining the specified evaluation target is extracted from the extracted article data. If the evaluation target is “information”, if the content indicated by “information” is “actor”, “actor” is extracted as the target explanatory word. The appearance count counting unit 40 counts how many times each target explanatory word extracted by the target explanatory word extraction unit 30 appears in all article data in the storage unit 10. The good writer specifying means 50 refers to the keyword-category correspondence table stored in the storage means 10 with the keyword specified by the keyword specifying means 21, specifies the category of the keyword, and the writer who is good at the specified category. The writer ID that often writes articles in the category is specified. The target explanatory sentence extraction unit 60 extracts, as the target explanatory sentence, a sentence including the target explanatory words whose appearance count is less than a predetermined number among the target explanatory words counted by the appearance count counting unit 40. The minority opinion extracting means 70 extracts the writer ID of the article data including the target explanatory sentence from the target explanatory sentences extracted by the target explanatory sentence extracting means 60, and the writer ID extracted by the specialty writer specifying means 50. Are extracted as a minority opinion.

意見提示手段80は、少数意見抽出手段70により抽出された対象説明文を提示するものであり、液晶ディスプレイ等の表示装置、出力I/F、およびOSの機能で実現される。   The opinion presentation unit 80 presents the target explanatory text extracted by the minority opinion extraction unit 70, and is realized by a display device such as a liquid crystal display, an output I / F, and an OS function.

ここで、記憶手段10に記憶された情報について説明しておく。図2は、記憶手段10に記憶された情報の一例を示す図である。図2(a)は記事情報、図2(b)は記事−カテゴリ対応テーブルである。カテゴリは、記事の書き手が記事に付与しておく場合と、記事データをテキストデータとして収集した後、自動的に記事を分類する場合がある。図2(c)はキーワード−カテゴリ対応テーブルを示している。キーワード−カテゴリ対応テーブルは、人手で予め準備しておく。もしくは、記事データからキーワードとカテゴリを自動的に対応付けることができる。図2(a)に示すように、記事情報としては、記事データに対応付けて、記事データを特定する記事ID、記事の書き手を特定する書き手IDが記憶されている。記憶手段10に記憶されている記事データは、実際には、インターネット上に公開された評価サイトにアクセスしてきた利用者から入力されたものであり、評価サイトを開設しているサーバコンピュータが、利用者から送信されてきた記事データに記事IDを付与するとともに、送信元の利用者のIDを書き手IDとして記憶手段10に登録することになる。また、Web上のブログや掲示板への記述内容を取得して記事データとし、記憶手段10に登録する場合もある。また、企業が利用者から収集したアンケートデータをデジタル化し、記事データとして記憶手段10に登録する場合もある。   Here, the information memorize | stored in the memory | storage means 10 is demonstrated. FIG. 2 is a diagram illustrating an example of information stored in the storage unit 10. 2A is article information, and FIG. 2B is an article-category correspondence table. The category may be assigned to the article by the article writer or may be automatically classified after the article data is collected as text data. FIG. 2C shows a keyword-category correspondence table. The keyword-category correspondence table is prepared manually in advance. Alternatively, keywords and categories can be automatically associated from article data. As shown in FIG. 2A, as article information, an article ID for specifying article data and a writer ID for specifying the writer of the article are stored in association with the article data. The article data stored in the storage means 10 is actually input from a user who has accessed the evaluation site published on the Internet, and is used by the server computer that has established the evaluation site. The article ID is given to the article data transmitted from the user, and the ID of the transmission source user is registered in the storage means 10 as the writer ID. In addition, there are cases where the description content on a blog or bulletin board on the Web is acquired as article data and registered in the storage means 10. In addition, the questionnaire data collected from the user by the company may be digitized and registered in the storage means 10 as article data.

(2.処理動作)
次に、図1に示した少数意見抽出装置の処理動作について説明する。まず、利用者が、Web上で動作する少数意見抽出装置100のキーワード指定手段21からキーワードを指定する。さらに、利用者は、評価情報指定手段22から評価対象および評価表現を指定する。すると、対象説明語抽出手段30は、指定されたキーワード、指定された評価対象、評価表現で記憶手段10の記事データを全文検索し、指定されたキーワード、評価対象、評価表現の3つ全てを有する記事データを抽出する。
(2. Processing operation)
Next, the processing operation of the minority opinion extraction apparatus shown in FIG. 1 will be described. First, the user designates a keyword from the keyword designation means 21 of the minority opinion extraction apparatus 100 operating on the Web. Further, the user designates an evaluation object and an evaluation expression from the evaluation information designating unit 22. Then, the target explanatory word extraction unit 30 performs a full-text search of the article data in the storage unit 10 with the specified keyword, the specified evaluation target, and the evaluation expression, and finds all three of the specified keyword, evaluation target, and evaluation expression. Extract the article data you have.

続いて、対象説明語抽出手段30は、抽出した記事の構文解析を行う。そして、構文解析の結果、利用者が入力した評価対象に係っている語の中で特定の品詞を、評価対象の説明語である対象説明語として特定する処理を行う。対象説明語とすべき品詞は、事前に設定されており、対象説明語抽出手段30は、設定された品詞の語を対象説明語として抽出する。対象説明語とすべき品詞は、適宜設定することができるが、本実施形態では、一般名詞、サ変接続となる名詞、自立した形容詞等を設定している。図2に示した例では、対象説明語として“俳優”、“近況”、“ファッション”、“プライベート”、“撮影経過”が抽出されることになる。   Subsequently, the target explanatory word extraction unit 30 performs syntax analysis of the extracted article. Then, as a result of the syntax analysis, a specific part of speech is identified as a target explanatory word that is an evaluation target explanatory word among words related to the evaluation target input by the user. The part of speech to be the target explanatory word is set in advance, and the target explanatory word extraction means 30 extracts the word of the set part of speech as the target explanatory word. The part of speech that should be the target explanatory word can be set as appropriate, but in the present embodiment, a general noun, a noun that becomes a sub-variant connection, an independent adjective, and the like are set. In the example illustrated in FIG. 2, “actor”, “recent status”, “fashion”, “private”, and “shooting progress” are extracted as target explanatory words.

次に、出現回数計数手段40が、対象説明語抽出手段30により抽出された対象説明語が、記憶手段10内において対象説明語として出現した回数を、各対象説明語ごとに計数する。したがって、対象説明語と同じ単語であっても、対象説明語として出現したものでなければ、計数されない。図2に示した例では、対象説明語“俳優”が2回、対象説明語“近況”が1回、対象説明語“ファッション”が1回、対象説明語“プライベート”が1回、対象説明語“撮影経過”が1回計数されることになる。出現回数の計数については、このように単純に計数する手法の他に、対象説明語の組み合わせでカウントする手法を用いても良い。例えば、図2に示した記事K0002の場合、評価対象“情報”が2回出現し、最初の“情報”の対象説明語は、“俳優”と“ファッション”の2つであり、この2つは、いずれも同一の評価対象“情報”に係っているので、“俳優”と“ファッション”の組み合わせを1回として計数する。   Next, the appearance count counting unit 40 counts the number of times the target explanatory word extracted by the target explanatory word extraction unit 30 appears as the target explanatory word in the storage unit 10 for each target explanatory word. Therefore, even if the word is the same as the target explanatory word, it is not counted unless it appears as the target explanatory word. In the example shown in FIG. 2, the target explanatory word “actor” is twice, the target explanatory word “recent” is once, the target explanatory word “fashion” is once, the target explanatory word “private” is once, and the target description is The word “shooting progress” is counted once. For counting the number of appearances, in addition to the method of simply counting in this way, a method of counting by a combination of target explanatory words may be used. For example, in the case of the article K0002 shown in FIG. 2, the evaluation target “information” appears twice, and the first “information” target explanatory words are “actor” and “fashion”. Since both are related to the same evaluation object “information”, the combination of “actor” and “fashion” is counted as one time.

次に、少数意見抽出手段70が、出現回数計数手段40により計数された出現回数が少ない対象説明語を、回数が少ないものから所定数選定する。出現回数が少ない対象説明語は、出現回数が同回数であることが多く、その対象説明語が含まれる記事データを利用者に表示してみせるには、記事データが多すぎる。そのため、さらに有用な少数意見を抽出するために、記事データを絞り込む処理を行う。具体的には、まず、対象説明文抽出手段60が、出現回数が少ないとして選定された対象説明語を対象説明語として含む文を対象説明文として記事データから抽出する。記事データから文を抽出する際、文の開始位置と終了位置の特定は、公知の構文解析の手法により行われる。   Next, the minority opinion extracting means 70 selects a predetermined number of target explanatory words with a small number of appearances counted by the appearance number counting means 40 from those with a small number of appearances. The target explanatory words with a small number of appearances often have the same number of appearances, and there are too many pieces of article data to display the article data including the target explanatory words to the user. Therefore, in order to extract a more useful minority opinion, a process for narrowing down article data is performed. Specifically, first, the target explanatory sentence extracting means 60 extracts a sentence including the target explanatory word selected as the target explanatory word as the target explanatory word from the article data as the target explanatory sentence. When a sentence is extracted from article data, the start position and end position of the sentence are specified by a known syntax analysis technique.

一方、得意書き手特定手段50は、キーワード指定手段21により指定されたキーワードを用いて、記憶手段10内のキーワード−カテゴリ対応テーブルを参照し、指定されたキーワードが属するカテゴリを特定する。例えば、キーワード指定手段21により「△△Cafe」が指定されたとする。この場合、図2(c)のキーワード−カテゴリ対応テーブルを参照すると、そのカテゴリとして「映画」が特定される。続いて、得意書き手特定手段50は、特定されたカテゴリについて得意な書き手を特定する。具体的には、図2(a)に示した記事情報を参照し、各書き手が一定期間内に書いた記事の記事IDを取得する。続いて、その記事IDで図2(b)に示した記事−カテゴリ対応テーブルを参照し、その記事IDのカテゴリを特定する。   On the other hand, the good writer specifying unit 50 uses the keyword specified by the keyword specifying unit 21 to refer to the keyword-category correspondence table in the storage unit 10 and specifies the category to which the specified keyword belongs. For example, it is assumed that “ΔΔCafe” is specified by the keyword specifying means 21. In this case, referring to the keyword-category correspondence table in FIG. 2C, “movie” is specified as the category. Subsequently, the good writer specifying unit 50 specifies a good writer for the specified category. Specifically, with reference to the article information shown in FIG. 2A, the article ID of an article written by each writer within a certain period is acquired. Subsequently, the article ID category is specified by referring to the article-category correspondence table shown in FIG.

次に、各書き手ごとに、その書き手が書いた記事の件数に対する、目的とするカテゴリに属する記事の件数の比率を算出し、これを得意度とする。例えば、書き手“H0001”が一定期間内に書いた記事が30件あり、このうち、カテゴリ「映画」に属する記事が15件あったとする。この場合、書き手“H0001”の得意度=15/30=0.5と算出される。記事情報に1つ以上の記事が登録されている全ての書き手に対して、同様に得意度を算出し、得意度が最も高い書き手を、そのカテゴリが得意な書き手として特定する。例えば、書き手“H0002”の得意度が0.67、書き手“H0003”の得意度が0.33であったとする。この場合、書き手“H0002”の得意度が最も高いので、書き手“H0002”が得意書き手として特定される。   Next, for each writer, the ratio of the number of articles belonging to the target category to the number of articles written by the writer is calculated, and this is used as the strength. For example, it is assumed that there are 30 articles written by the writer “H0001” within a certain period, and of these, 15 articles belong to the category “movie”. In this case, the goodness of the writer “H0001” is calculated as 15/30 = 0.5. For each writer in which one or more articles are registered in the article information, the proficiency is calculated in the same manner, and the writer with the highest proficiency is identified as the writer who is good at the category. For example, it is assumed that the writer “H0002” is good at 0.67 and the writer “H0003” is good at 0.33. In this case, since the writer “H0002” has the highest strength, the writer “H0002” is identified as the good writer.

得意書き手特定手段50により、指定キーワードについての得意書き手が特定されたら、少数意見抽出手段70は、対象説明文抽出手段60により抽出された対象説明文のうち、得意書き手により書かれたものを少数意見として選出する。   When the good writer specifying unit 50 specifies a good writer for the specified keyword, the minority opinion extracting unit 70 extracts a small number of the target explanations extracted by the target explanatory note extracting unit 60 and written by the good writer. Selected as an opinion.

少数意見抽出手段70により少数意見が抽出されたら、意見提示手段80が、少数意見それぞれについて、対象説明語と評価対象を含むタイトルを作成する。具体的には、対象説明語と評価対象間の文字列を記事データ中から全て抽出することにより作成する。そして、作成されたタイトルを、事前に設定されたレイアウトに配置して画面データを作成し、提示する。   When the minority opinion is extracted by the minority opinion extraction unit 70, the opinion presentation unit 80 creates a title including the target explanatory word and the evaluation target for each minority opinion. Specifically, it is created by extracting all character strings between the target explanatory word and the evaluation target from the article data. Then, the created title is arranged in a preset layout, and screen data is created and presented.

このとき提示された画面の様子を図3に示す。図3において、画面上部には、キーワード指定手段21により指定したキーワード、評価情報指定手段22により指定した評価対象と評価表現が表示されている。そして、画面下部には“少数派のコメント”の一覧が表示されている。少数派のコメントの欄では、少数派のコメントとして抽出された記事のタイトルが一覧表示されている。   The state of the screen presented at this time is shown in FIG. In FIG. 3, the keyword specified by the keyword specifying means 21, the evaluation target specified by the evaluation information specifying means 22 and the evaluation expression are displayed at the top of the screen. At the bottom of the screen, a list of “minority comments” is displayed. In the minority comments column, the titles of articles extracted as minority comments are listed.

本発明に係る少数意見抽出装置は、スタンドアローン型としても利用できるし、ネットワーク型としても利用することができる。例えば、アンケート結果を記事データとして収集し、これを単体のコンピュータで分析して、少数意見を抽出する場合は、スタンドアローン型で実現される。また、一般利用者が自分の端末から閲覧できるようにするためには、キーワード指定手段21、評価情報指定手段22、意見提示手段80の一部をネットワーク通信機能で構成することにより、ネットワーク型で実現される。   The minority opinion extraction apparatus according to the present invention can be used as a stand-alone type or a network type. For example, when questionnaire results are collected as article data and analyzed by a single computer to extract minority opinions, a stand-alone type is realized. Further, in order to allow general users to browse from their own terminals, a part of the keyword specifying means 21, the evaluation information specifying means 22, and the opinion presentation means 80 is configured by a network communication function, so that it is a network type. Realized.

本発明に係る少数意見抽出装置の構成図である。It is a block diagram of the minority opinion extraction apparatus which concerns on this invention. 記憶手段10に記憶された情報の一例を示す図である。4 is a diagram illustrating an example of information stored in a storage unit 10. FIG. 提示手段80により提示された画面の様子を示す図である。It is a figure which shows the mode of the screen shown by the presentation means.

符号の説明Explanation of symbols

10・・・記憶手段
21・・・キーワード指定手段
22・・・評価情報指定手段
30・・・対象説明語抽出手段
40・・・出現回数計数手段
50・・・得意書き手特定手段
60・・・対象説明文抽出手段
70・・・少数意見抽出手段
80・・・意見提示手段
90・・・演算処理手段
100・・・少数意見抽出装置
DESCRIPTION OF SYMBOLS 10 ... Memory | storage means 21 ... Keyword designation | designated means 22 ... Evaluation information designation | designated means 30 ... Target explanatory word extraction means 40 ... Appearance count counting means 50 ... Special note hand identification means 60 ... Object explanation sentence extraction means 70 ... minority opinion extraction means 80 ... opinion presentation means 90 ... arithmetic processing means 100 ... minority opinion extraction device

Claims (2)

記事データを書き手およびカテゴリと対応付けて記憶するとともに、キーワードをカテゴリと対応付けて記憶した記憶手段と、
キーワードを指定するキーワード指定手段と、
評価対象と評価表現の組み合わせを指定する評価情報指定手段と、
前記指定された評価対象と評価表現の組み合わせに従って、前記記憶手段に記憶された記事データから、評価対象を説明する対象説明語を抽出する対象説明語抽出手段と、
前記抽出された対象説明語の出現回数を計数する出現回数計数手段と、
前記計数の結果、出現回数の少ない対象説明語を有する文を対象説明文として抽出する対象説明文抽出手段と、
前記キーワード指定手段により指定されたキーワードが属するカテゴリを特定し、特定されたカテゴリについて得意な書き手を特定する得意書き手特定手段と、
前記抽出された対象説明文のうち、当該対象説明文が含まれる記事の書き手が、前記得意書き手である対象説明文を少数意見として抽出する少数意見抽出手段と、
を有することを特徴とする少数意見抽出装置。
Storing the article data in association with the writer and the category, and storing the keyword in association with the category;
A keyword specifying means for specifying a keyword,
An evaluation information specifying means for specifying a combination of an evaluation object and an evaluation expression;
A target explanatory word extracting means for extracting a target explanatory word for explaining the evaluation target from the article data stored in the storage means according to the combination of the designated evaluation target and the evaluation expression;
Appearance count counting means for counting the number of appearances of the extracted target explanatory words;
As a result of the counting, target explanation sentence extracting means for extracting a sentence having a target explanation word with a small number of appearances as a target explanation sentence;
Identifying a category to which the keyword designated by the keyword designation means belongs, and identifying a writer who is good at the identified category;
Of the extracted target explanatory texts, the writer of the article including the target explanatory text is a minority opinion extracting means for extracting the target explanatory text that is the expert writer as a minority opinion,
A minority opinion extraction device characterized by comprising:
コンピュータを、請求項1に記載の少数意見抽出装置として機能させるためのプログラム。   A program for causing a computer to function as the minority opinion extracting device according to claim 1.
JP2008150759A 2008-06-09 2008-06-09 Minority opinion extractor Expired - Fee Related JP5083627B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008150759A JP5083627B2 (en) 2008-06-09 2008-06-09 Minority opinion extractor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008150759A JP5083627B2 (en) 2008-06-09 2008-06-09 Minority opinion extractor

Publications (2)

Publication Number Publication Date
JP2009295105A JP2009295105A (en) 2009-12-17
JP5083627B2 true JP5083627B2 (en) 2012-11-28

Family

ID=41543204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008150759A Expired - Fee Related JP5083627B2 (en) 2008-06-09 2008-06-09 Minority opinion extractor

Country Status (1)

Country Link
JP (1) JP5083627B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6047903B2 (en) 2012-03-27 2016-12-21 富士通株式会社 Group work support method, group work support program, group work support server, and group work support system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10161876A (en) * 1996-12-04 1998-06-19 Mitsubishi Electric Corp Information propagation processor
JP2001273432A (en) * 2000-01-20 2001-10-05 Ok Web Inc Bulletin board system by means of computer network utilization
JP2006209222A (en) * 2005-01-25 2006-08-10 Yamaha Corp File retrieving device

Also Published As

Publication number Publication date
JP2009295105A (en) 2009-12-17

Similar Documents

Publication Publication Date Title
US8725717B2 (en) System and method for identifying topics for short text communications
US10127225B2 (en) Automatic semantic rating and abstraction of literature
JP5092252B2 (en) Trend analysis server and trend analysis method
Simmons et al. A computer aided content analysis of online reviews
JP5398413B2 (en) Brand recommendation system and brand recommendation program
JP5940955B2 (en) Trend analysis apparatus, method and program
JP2010055159A (en) Information retrieval device, information retrieval method, and program
US20110231448A1 (en) Device and method for generating opinion pairs having sentiment orientation based impact relations
JP2009169541A (en) Web page retrieval server and query recommendation method
JP2007018285A (en) System, method, device, and program for providing information
CN114514546A (en) System, method and user interface for facilitating product development
JP2004021445A (en) Text data analysis system, text data analysis method and computer program
JP5130900B2 (en) Opinion extraction device
KR101850853B1 (en) Method and apparatus of search using big data
JP2010055155A (en) Server device, information processing method, and program
JP2005190284A (en) Information classification device and method
JP6653169B2 (en) Keyword extraction device, content generation system, keyword extraction method, and program
KR20100052795A (en) Community managing method and apparatus for mediating contents and human social identity
JP5083627B2 (en) Minority opinion extractor
JP2020091539A (en) Information processing device, information processing method, and information processing program
JP2005128872A (en) Document retrieving system and document retrieving program
JP5368900B2 (en) Information presenting apparatus, information presenting method, and program
JP7171352B2 (en) Workshop support system and workshop support method
JP6287192B2 (en) Information processing apparatus, information processing method, and program
JP2021176085A (en) Brand dictionary creating apparatus, apparatus for evaluating article and so on, brand dictionary creating method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120822

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees