JP5130900B2 - Opinion extraction device - Google Patents

Opinion extraction device Download PDF

Info

Publication number
JP5130900B2
JP5130900B2 JP2007327831A JP2007327831A JP5130900B2 JP 5130900 B2 JP5130900 B2 JP 5130900B2 JP 2007327831 A JP2007327831 A JP 2007327831A JP 2007327831 A JP2007327831 A JP 2007327831A JP 5130900 B2 JP5130900 B2 JP 5130900B2
Authority
JP
Japan
Prior art keywords
target
opinion
article data
extracting
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007327831A
Other languages
Japanese (ja)
Other versions
JP2009151483A (en
Inventor
竜馬 備瀬
直之 田村
博和 笠原
智洋 二本木
光昭 森本
政樹 高田
修 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2007327831A priority Critical patent/JP5130900B2/en
Publication of JP2009151483A publication Critical patent/JP2009151483A/en
Application granted granted Critical
Publication of JP5130900B2 publication Critical patent/JP5130900B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、利用者から寄せられた意見の中から、メジャーな(多数派の)意見、マイナーな(少数派の)意見を抽出するための技術に関する。   The present invention relates to a technique for extracting a major (majority) opinion and a minor (minority) opinion from opinions received from users.

近年、インターネット上では、様々なサービスが提供されている。その1つとして、商品、サービス、その他の事象などに関して、一般の利用者による評価や意見を収集し、公開するWebサイト(以下、評価サイトという)が存在する。このような評価サイトでは、商品名などを入力すると、その商品に関する一般利用者による評価情報、意見情報が表示される。このため、評価サイトを利用すると、商品の販売者寄りの情報ではなく、その商品を実際に利用した利用者の評価、意見を知ることができるという利点がある。   In recent years, various services have been provided on the Internet. As one example, there is a Web site (hereinafter referred to as an evaluation site) that collects and publishes evaluations and opinions by general users regarding products, services, and other events. In such an evaluation site, when a product name or the like is input, evaluation information and opinion information about the product by a general user are displayed. For this reason, the use of the evaluation site has an advantage that it is possible to know the evaluation and opinion of the user who actually uses the product, not the information close to the seller of the product.

従来の評価サイトでは、ある事象等について良い評価、悪い評価がどの程度あるかということを知ることができり、また、個別の意見についても知ることができる。しかし、個別の意見については、寄せられている意見の中から任意に選ばれたものを閲覧することができるだけであり、例えば、ある事象について良い評価が多い場合、どのような点に着目して大勢の人が良いと言っているのか、具体的な意見を知ることは難しいという問題がある。また、逆に少数意見であっても、貴重な意見というものも存在するが、こちらは、少ない意見であるだけに抽出することが難しいという問題がある。アンケートなどの設問に対して少数意見をくみ取るようにする技術も存在するが(特許文献1参照)、多数意見、少数意見の双方を抽出するものではない。
特開2005−92616号公報
In a conventional evaluation site, it is possible to know how many good evaluations and bad evaluations exist for a certain event or the like, and it is also possible to know individual opinions. However, with regard to individual opinions, it is only possible to browse the ones selected arbitrarily from the received opinions. For example, if there are many good evaluations about an event, what points should be noted There is a problem that it is difficult to know a specific opinion whether many people say it is good. On the other hand, even if there are minority opinions, there are also valuable opinions, but here there is a problem that it is difficult to extract because there are few opinions. Although there is a technique for collecting a minority opinion with respect to a question such as a questionnaire (see Patent Document 1), it does not extract both a majority opinion and a minority opinion.
JP 2005-92616 A

そこで、本発明は、多数派の意見、または少数派ではあるが貴重な意見を抽出することが可能な意見抽出装置を提供することを課題とする。   Therefore, an object of the present invention is to provide an opinion extraction device capable of extracting a majority opinion or a minority but valuable opinion.

上記課題を解決するため、本発明では、記事データを記憶した記事データ記憶手段と、評価対象と評価表現の組み合わせを指定する評価情報指定手段と、前記指定された評価対象と評価表現の組み合わせに従って、前記記事データ記憶手段に記憶された記事データから、評価対象を説明する対象説明語を抽出する対象説明語抽出手段と、前記抽出された対象説明語の出現回数を計数する出現回数計数手段と、前記計数の結果、出現回数の多い対象説明語を有する記事データを多数意見として抽出する多数意見抽出手段と、前記計数の結果、出現回数の少ない対象説明語を有する文を対象説明文として抽出する対象説明文抽出手段と、前記抽出された対象説明文の文字数、または当該対象説明文内の所定の単語数が多い対象説明文を少数意見として抽出する少数意見抽出手段を有する意見抽出装置を提供する。   In order to solve the above problems, according to the present invention, article data storage means storing article data, evaluation information specifying means for specifying a combination of an evaluation object and an evaluation expression, and a combination of the specified evaluation object and evaluation expression , Target explanation word extracting means for extracting a target explanation word for explaining an evaluation target from article data stored in the article data storage means, and appearance count counting means for counting the number of appearances of the extracted target explanation word , A majority opinion extracting means for extracting article data having a target explanatory word with a large number of appearances as a result of the counting, and a sentence having a target explanatory word with a low number of appearances as a target explanatory text as a result of the counting A target explanation sentence extracting means, and the number of characters of the extracted target explanation sentence, or a target explanation sentence having a large number of predetermined words in the target explanation sentence as a minority opinion Providing an opinion extraction device having a minority opinion extracting means for extracting Te.

本発明によれば、ある事象について寄せられた意見の中から、多数派の意見、または少数派ではあるが貴重な意見を抽出することが可能となるという効果を奏する。   According to the present invention, it is possible to extract a majority opinion or a minority but valuable opinion from among opinions received for a certain event.

(1.第1の実施形態)
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。図1は、本発明第1の実施形態に係る意見抽出装置の構成図である。図1において、10は記事データ記憶手段、20は評価情報指定手段、30は対象説明語抽出手段、40は出現回数計数手段、50は多数意見抽出手段、60は対象説明文抽出手段、70は少数意見抽出手段、80は意見提示手段、90は演算処理手段である。
(1. First embodiment)
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described in detail with reference to the drawings. FIG. 1 is a configuration diagram of an opinion extraction apparatus according to the first embodiment of the present invention. In FIG. 1, 10 is an article data storage means, 20 is an evaluation information designation means, 30 is an object explanation word extraction means, 40 is an appearance count counting means, 50 is a multiple opinion extraction means, 60 is an object explanation sentence extraction means, and 70 is Minority opinion extraction means, 80 is opinion presentation means, and 90 is arithmetic processing means.

記事データ記憶手段10は、テキスト形式の記事データと、記事データを特定するための記事IDを対応付けて記憶したものであり、コンピュータに接続されたハードディスク等の記憶装置により実現される。評価情報指定手段20は、評価対象と評価表現の組み合わせを指定するものであり、マウスやキーボード等の指示入力機器と、入力機器I/F、およびOSの機能により実現される。演算処理手段90は、コンピュータのCPUおよびメモリで実現され、専用のプログラムをメモリに読み込んでCPUが実行することにより、対象説明語抽出手段30、出現回数計数手段40、多数意見抽出手段50、対象説明文抽出手段60、少数意見抽出手段70としての機能を実現する。   The article data storage means 10 stores article data in text format and article IDs for specifying article data in association with each other, and is realized by a storage device such as a hard disk connected to a computer. The evaluation information designating unit 20 designates a combination of an evaluation object and an evaluation expression, and is realized by an instruction input device such as a mouse and a keyboard, an input device I / F, and an OS function. The arithmetic processing unit 90 is realized by a CPU and a memory of a computer. When the CPU reads a dedicated program into the memory and executes it, the target explanatory word extraction unit 30, the appearance count counting unit 40, the majority opinion extraction unit 50, the target Functions as the explanatory note extracting unit 60 and the minority opinion extracting unit 70 are realized.

対象説明語抽出手段30は、指定された評価対象と評価表現を有する文を記事データ記憶手段10内で探索し、指定された評価対象を説明する語である対象説明語を抽出する。出現回数計数手段40は、対象説明語抽出手段30により抽出された各対象説明語が、記事データ記憶手段10内の全記事データ内で何回出現したかを計数する。多数意見抽出手段50は、出現回数計数手段40により計数された対象説明語のうち、出現回数が多い所定数の対象説明語を特定し、特定された対象説明語を含む記事データを、記事データ記憶手段10から抽出する。対象説明文抽出手段60は、出現回数計数手段40により計数された対象説明語のうち、出現回数が少ない所定数の対象説明語を含む文を対象説明文として抽出する。少数意見抽出手段70は、対象説明文抽出手段60により抽出された対象説明文において、文字数または所定の単語数が多いものを少数意見として記事データ記憶手段10から抽出する。   The target explanatory word extraction unit 30 searches the article data storage unit 10 for a sentence having the specified evaluation target and evaluation expression, and extracts a target explanatory word that is a word explaining the specified evaluation target. The appearance count counting unit 40 counts how many times each target explanatory word extracted by the target explanatory word extraction unit 30 appears in all article data in the article data storage unit 10. The majority opinion extracting unit 50 identifies a predetermined number of target explanatory words having a large number of appearances among the target explanatory words counted by the appearance number counting unit 40, and converts article data including the specified target explanatory words into article data. Extracted from the storage means 10. The target explanatory sentence extracting unit 60 extracts a sentence including a predetermined number of target explanatory words with a small number of appearances as the target explanatory sentence from the target explanatory words counted by the appearance number counting unit 40. The minority opinion extraction unit 70 extracts, from the article data storage unit 10, as a minority opinion, the target explanatory text extracted by the target explanatory text extraction unit 60 with a large number of characters or a predetermined number of words.

意見提示手段80は、多数意見抽出手段50、少数意見抽出手段70により抽出された記事データを提示するものであり、液晶ディスプレイ等の表示装置、出力I/F、およびOSの機能で実現される。   The opinion presentation unit 80 presents article data extracted by the majority opinion extraction unit 50 and the minority opinion extraction unit 70, and is realized by a display device such as a liquid crystal display, an output I / F, and an OS function. .

ここで、記事データ記憶手段10に記憶された情報について説明しておく。図2は、記事データ記憶手段10に記憶された情報の一例を示す図である。図2に示すように、記事データ記憶手段10には、記事IDに対応付けて各記事IDで特定される記事データの内容が記憶されている。記事データ記憶手段10に記憶されている記事データは、実際には、インターネット上に公開された評価サイトにアクセスしてきた利用者から入力されたものであり、評価サイトを開設しているサーバコンピュータが、利用者から送信されてきた記事データを記事データ記憶手段10に登録することになる。また、Web上のブログや掲示板への記述内容を取得して記事データとし、記事データ記憶手段10に登録する場合もある。また、アンケートデータをデジタル化し、記事データとして記事データ記憶手段10に登録する場合もある。   Here, information stored in the article data storage unit 10 will be described. FIG. 2 is a diagram illustrating an example of information stored in the article data storage unit 10. As shown in FIG. 2, the article data storage means 10 stores the contents of article data specified by each article ID in association with the article ID. The article data stored in the article data storage means 10 is actually input from a user who has accessed the evaluation site published on the Internet, and the server computer that has established the evaluation site The article data transmitted from the user is registered in the article data storage means 10. Also, there are cases where the description content on the blog or bulletin board on the Web is acquired as article data and registered in the article data storage means 10. Further, the questionnaire data may be digitized and registered in the article data storage means 10 as article data.

次に、図1に示した意見抽出装置の処理動作について説明する。まず、利用者が、評価情報指定手段20から評価対象および評価表現を指定する。すると、対象説明語抽出手段30は、指定された評価対象、評価表現で記事データ記憶手段10を全文検索し、指定された評価対象、評価表現の両方を有する記事データを抽出する。例えば、図2に示したような5つの記事がある場合に、評価対象として“情報”、評価表現として“欲しい”が指定されたとする。この場合、“情報”と“欲しい”の両方を有する記事K0001、K0002、K0003が抽出されることになる。   Next, the processing operation of the opinion extraction apparatus shown in FIG. 1 will be described. First, the user designates an evaluation object and an evaluation expression from the evaluation information designating unit 20. Then, the target explanatory word extraction unit 30 searches the article data storage unit 10 in full text with the specified evaluation target and evaluation expression, and extracts article data having both the specified evaluation target and evaluation expression. For example, when there are five articles as shown in FIG. 2, it is assumed that “information” is designated as the evaluation target and “want” is designated as the evaluation expression. In this case, articles K0001, K0002, and K0003 having both “information” and “want” are extracted.

続いて、対象説明語抽出手段30は、抽出した記事の構文解析を行う。そして、構文解析の結果、評価対象に係っている語の中で特定の品詞を、評価対象の説明語である対象説明語として特定する処理を行う。対象説明語とすべき品詞は、事前に設定されており、対象説明語抽出手段30は、設定された品詞の語を対象説明語として抽出する。対象説明語とすべき品詞は、適宜設定することができるが、本実施形態では、一般名詞、サ変接続となる名詞、自立した形容詞等を設定している。図2に示した例では、対象説明語として“選手”、“怪我”、“ファッション”、“プライベート”、“試合速報”が抽出されることになる。   Subsequently, the target explanatory word extraction unit 30 performs syntax analysis of the extracted article. Then, as a result of the syntax analysis, a process is performed in which a specific part of speech is identified as a target explanatory word that is an evaluation target explanatory word among words related to the evaluation target. The part of speech to be the target explanatory word is set in advance, and the target explanatory word extraction means 30 extracts the word of the set part of speech as the target explanatory word. The part of speech that should be the target explanatory word can be set as appropriate, but in the present embodiment, a general noun, a noun that becomes a sub-variant connection, an independent adjective, and the like are set. In the example shown in FIG. 2, “player”, “injury”, “fashion”, “private”, and “game bulletin” are extracted as target explanatory words.

次に、出現回数計数手段40が、対象説明語抽出手段30により抽出された対象説明語が、記事データ記憶手段10内において対象説明語として出現した回数を、各対象説明語ごとに計数する。したがって、対象説明語と同じ単語であっても、対象説明語として出現したものでなければ、計数されない。図2に示した例では、対象説明語“選手”が2回、対象説明語“怪我”が1回、対象説明語“ファッション”が1回、対象説明語“プライベート”が1回、対象説明語“試合速報”が1回計数されることになる。出現回数の計数については、このように単純に計数する手法の他に、対象説明語の組み合わせでカウントする手法を用いても良い。例えば、図2に示した記事K0002の場合、評価対象“情報”が2回出現するが、先の“情報”の対象説明語は、“選手”と“ファッション”の2つであり、この2つは、いずれも同一の評価対象“情報”に係っているので、“選手”と“ファッション”の組み合わせを1回として計数する。   Next, the appearance count counting unit 40 counts the number of times the target explanatory word extracted by the target explanatory word extraction unit 30 appears as the target explanatory word in the article data storage unit 10 for each target explanatory word. Therefore, even if the word is the same as the target explanatory word, it is not counted unless it appears as the target explanatory word. In the example shown in FIG. 2, the target explanation word “player” is twice, the target explanation word “injury” is once, the target explanation word “fashion” is once, the target explanation word “private” is once, the target explanation The word “game bulletin” will be counted once. For counting the number of appearances, in addition to the method of simply counting in this way, a method of counting by a combination of target explanatory words may be used. For example, in the case of the article K0002 shown in FIG. 2, the evaluation target “information” appears twice, but there are two target explanation words for “information” in the above “information” and “fashion”. Since all are related to the same evaluation object “information”, the combination of “player” and “fashion” is counted as one time.

次に、多数意見抽出手段50が、出現回数計数手段40により計数された出現回数が多い対象説明語を、回数が多いものから所定数選定し、選定した対象説明語を有する記事データを多数意見として抽出する。以上のようにして、対象説明語抽出手段30、出現回数計数手段40、多数意見抽出手段50により多数意見である記事データが記事データ記憶手段10から抽出される。   Next, the majority opinion extraction means 50 selects a predetermined number of target explanatory words with a large number of appearances counted by the appearance count counting means 40, and selects a predetermined number from those with a large number of appearances. Extract as As described above, article data that is a majority opinion is extracted from the article data storage means 10 by the target explanatory word extraction means 30, the appearance count counting means 40, and the majority opinion extraction means 50.

意見抽出装置100は、多数意見と並行して少数意見も抽出する。評価対象および評価表現が指定された場合、対象説明語抽出手段30、出現回数計数手段40における処理は、多数意見を抽出する場合と同じであり、ここまでの結果は、多数意見抽出と併用する。そして、少数意見抽出手段70が、出現回数計数手段40により計数された出現回数が少ない対象説明語を、回数が少ないものから所定数選定する。出現回数が少ない対象説明語は、出現回数が同回数であることが多く、そのままでは選定が困難である。このため、さらに、絞り込む処理を行う。具体的には、まず、対象説明文抽出手段60が、出現回数が少ないとして選定された対象説明語を対象説明語として含む文を対象説明文として記事データから抽出する。文の特定は公知の構文解析の手法により行われる。そして、抽出された対象説明文において、文字数または所定の単語数が多い対象説明文を少数意見として抽出する。例えば、文字数が多いものとしては、抽出した対象説明文の長さが長いもの、すなわち対象説明文の文字数が多いものを少数意見として抽出する。また、所定の単語数が多いものとしては、係り受け語が多いものを抽出する手法と、対象説明語が多いものを抽出する手法がある。このようにして、対象説明語抽出手段30、出現回数計数手段40、多数意見抽出手段50、対象説明文抽出手段60、少数意見抽出手段70により少数意見が記事データ記憶手段10から抽出される。   Opinion extraction apparatus 100 extracts minority opinions in parallel with majority opinions. When the evaluation target and the evaluation expression are specified, the processing in the target explanatory word extraction unit 30 and the appearance count counting unit 40 is the same as the case of extracting a majority opinion, and the results up to this point are used together with the majority opinion extraction. . Then, the minority opinion extraction unit 70 selects a predetermined number of target explanatory words with a small number of appearances counted by the appearance number counting unit 40 from those with a small number of appearances. Target explanatory words with a small number of appearances often have the same number of appearances, and are difficult to select as they are. For this reason, further narrowing processing is performed. Specifically, first, the target explanatory sentence extracting means 60 extracts a sentence including the target explanatory word selected as the target explanatory word as the target explanatory word from the article data as the target explanatory sentence. The sentence is specified by a known parsing technique. Then, in the extracted target explanatory text, the target explanatory text having a large number of characters or a predetermined number of words is extracted as a minority opinion. For example, as a thing with a large number of characters, the extracted object explanation sentence having a long length, that is, an object explanation sentence with a large number of characters is extracted as a minority opinion. In addition, there are a method for extracting a large number of dependency words and a method for extracting a large number of target explanatory words as a method having a large number of predetermined words. In this way, minority opinions are extracted from the article data storage means 10 by the target explanatory word extraction means 30, the appearance count counting means 40, the majority opinion extraction means 50, the target explanation sentence extraction means 60, and the minority opinion extraction means 70.

多数意見抽出手段50により多数意見が抽出され、少数意見抽出手段70により少数意見が抽出されたら、意見提示手段80が、多数意見、少数意見それぞれについて、対象説明語と評価対象を含むタイトルを作成する。多数意見のタイトルは、対象説明語と評価対象間の間に適切な助詞を追加することにより作成される。例えば、対象説明語が“選手”、評価対象が“情報”の場合、“選手の情報”というタイトルが作成される。少数意見のタイトルは、対象説明語と評価対象間の文字列を記事データ中から全て抽出することにより作成される。そして、作成されたタイトルを、多数意見、少数意見ごとに、事前に設定されたレイアウトに配置して画面データを作成し、提示する。   When the majority opinion is extracted by the majority opinion extraction means 50 and the minority opinion is extracted by the minority opinion extraction means 70, the opinion presentation means 80 creates a title including the target explanatory word and the evaluation object for each of the majority opinion and the minority opinion. To do. The title of the majority opinion is created by adding an appropriate particle between the target explanatory word and the evaluation target. For example, when the target explanatory word is “player” and the evaluation target is “information”, a title “player information” is created. The title of the minority opinion is created by extracting all character strings between the target explanatory words and the evaluation target from the article data. Then, screen data is created and presented by arranging the created titles in a layout set in advance for each of the majority opinion and the minority opinion.

このとき提示された画面の様子を図3に示す。図3において、最上部には、評価情報指定手段20により指定した評価対象と評価表現が表示されている。そして、画面上部には“多数派のコメント”の一覧、画面中部には“意見の内容”、画面下部には“少数派のコメント”の一覧が表示されている。多数派のコメントの欄では、多数派のコメントとして抽出された記事のタイトルが一覧表示され、各タイトルを選択する指示を行うと、その記事の内容が“意見の内容”として、“意見の内容”の欄に表示される。図3の例では、“選手の情報”が選択された場合を示している。少数派のコメントの欄では、少数派のコメントとして抽出された記事のタイトルが一覧表示されている。   The state of the screen presented at this time is shown in FIG. In FIG. 3, the evaluation target and the evaluation expression designated by the evaluation information designating unit 20 are displayed at the top. A list of “majority comments” is displayed at the top of the screen, a “content of opinion” is displayed at the center of the screen, and a list of “minority comments” is displayed at the bottom of the screen. In the majority comment column, the titles of articles extracted as majority comments are displayed in a list. When an instruction is given to select each title, the content of the article is changed to “content of opinion” and “content of opinion”. "" Is displayed. The example of FIG. 3 shows a case where “player information” is selected. In the minority comments column, the titles of articles extracted as minority comments are listed.

第1の実施形態に係る意見抽出装置は、スタンドアローン型としても利用できるし、ネットワーク型としても利用することができる。例えば、アンケート結果を記事データとして収集し、これを単体のコンピュータで分析して、多数意見、少数意見を抽出する場合は、スタンドアローン型で実現される。また、一般利用者が自分の端末から閲覧できるようにするためには、評価情報指定手段20、意見提示手段80の一部をネットワーク通信機能で構成することにより、ネットワーク型で実現される。   The opinion extraction apparatus according to the first embodiment can be used as a stand-alone type or a network type. For example, when questionnaire results are collected as article data and analyzed by a single computer to extract majority opinions and minority opinions, it is realized as a stand-alone type. Moreover, in order to allow general users to browse from their own terminals, a part of the evaluation information specifying means 20 and the opinion presentation means 80 is configured with a network communication function, thereby realizing a network type.

(2.第2の実施形態)
次に、第2の実施形態について説明する。図4は、本発明第2の実施形態に係る意見抽出装置の構成図である。図4において、11はアクセスログ記憶手段、71は少数意見抽出手段、85はアクセスログ取得手段、91は演算処理手段である。図4中、図1と同一の構成要素については、同一符号を付して説明を省略する。
(2. Second Embodiment)
Next, a second embodiment will be described. FIG. 4 is a configuration diagram of an opinion extraction apparatus according to the second embodiment of the present invention. In FIG. 4, 11 is an access log storage means, 71 is a minority opinion extraction means, 85 is an access log acquisition means, and 91 is an arithmetic processing means. In FIG. 4, the same components as those in FIG.

アクセスログ記憶手段11は、記事データ記憶手段10に記憶された記事データへのアクセスログを記憶したものであり、記事データ記憶手段10と同様、コンピュータに接続されたハードディスク等の記憶装置により実現される。第2の実施形態における意見抽出装置101は、Webサーバとしての機能を有しており、記事データ記憶手段10に記憶された記事データをネットワークを介してアクセスしてきた端末に提示する。そして、端末から記事データの読み込みがあった際に、その利用者の利用者IDを取得して、利用者IDと記事IDを対応付けて読み込みログとしてアクセスログ記憶手段11に記録する。また、提示された記事に関して書き込みが行われた場合は、利用者IDと記事IDを対応付けて書き込みログとしてアクセスログ記憶手段11に記録する。本明細書では、読み込みログと書き込みログを総称してアクセスログと呼ぶ。利用者IDは、例えば、意見抽出装置にログインする際に利用者に毎回入力させたり、Cookieファイルを利用したり、取得したIPアドレスに利用者IDを割り振り、次回以降IPアドレスに対応するものを取得する等公知の手法で取得することができる。   The access log storage unit 11 stores an access log to the article data stored in the article data storage unit 10, and is realized by a storage device such as a hard disk connected to the computer, like the article data storage unit 10. The The opinion extraction apparatus 101 according to the second embodiment has a function as a Web server, and presents article data stored in the article data storage unit 10 to a terminal that has accessed through a network. When the article data is read from the terminal, the user ID of the user is acquired, and the user ID and the article ID are associated with each other and recorded in the access log storage unit 11 as a reading log. When writing is performed for the presented article, the user ID and the article ID are associated with each other and recorded in the access log storage unit 11 as a writing log. In this specification, the read log and the write log are collectively referred to as an access log. For example, the user ID can be input every time when logging in to the opinion extraction device, the cookie file is used, the user ID is assigned to the acquired IP address, and the ID corresponding to the IP address is used from the next time on. It can be obtained by a known method such as obtaining.

アクセスログ記憶手段11に記憶された情報の一例を図5に示す。図5(a)は書き込みログ、図5(b)は読み込みログを示す。図5(a)(b)に示すように、アクセスログ記憶手段11には、利用者IDと対応付けて書き込みまたは読み込みのあった記事IDが記録されている。   An example of information stored in the access log storage unit 11 is shown in FIG. FIG. 5A shows a write log, and FIG. 5B shows a read log. As shown in FIGS. 5A and 5B, the access log storage unit 11 stores article IDs that are written or read in association with user IDs.

アクセスログ取得手段85は、アクセスログ記憶手段11に記憶されたアクセスログを取得して、少数意見抽出手段71に渡す。少数意見抽出手段71は、出現回数計数手段40により計数された対象説明語のうち、出現回数が少ない下位所定数の対象説明語を特定し、特定された対象説明語を含む記事データを選出候補とし、選出候補の中からアクセスログを用いて算出されたスコアが高い記事データを、記事データ記憶手段10から抽出する。   The access log acquisition unit 85 acquires the access log stored in the access log storage unit 11 and passes it to the minority opinion extraction unit 71. The minority opinion extraction means 71 specifies a lower predetermined number of target explanation words with a small number of appearances among the target explanation words counted by the appearance count counting means 40, and selects article data including the specified target explanation words. Then, article data having a high score calculated using the access log is extracted from the article data storage means 10 among the selection candidates.

次に、図4に示した意見抽出装置の処理動作について説明する。多数意見の抽出については、第1の実施形態における処理と全く同じである。少数意見の抽出については、対象説明語抽出手段30、出現回数計数手段40における処理は、多数意見を抽出する場合と同じである。そして、少数意見抽出手段71が、出現回数計数手段40により計数された出現回数が少ない対象説明語を所定数選定する。具体的には、まず、対象説明文抽出手段60が、出現回数が少ないとして選定された対象説明語を、対象説明語として含む記事を対象説明文として抽出する。   Next, the processing operation of the opinion extraction apparatus shown in FIG. 4 will be described. The extraction of the majority opinion is exactly the same as the processing in the first embodiment. Regarding the extraction of minority opinions, the processing in the target explanatory word extraction means 30 and the appearance count counting means 40 is the same as the case of extracting a majority opinion. Then, the minority opinion extracting unit 71 selects a predetermined number of target explanatory words with a small number of appearances counted by the appearance number counting unit 40. Specifically, first, the target explanatory sentence extracting means 60 extracts an article including the target explanatory word selected as the target explanatory word as the target explanatory word as the target explanatory sentence.

さらに、少数意見抽出手段71は、アクセスログ取得手段85を介して、アクセスログ記憶手段11から、対象説明文抽出手段60により抽出された対象説明文についてのアクセスログを取得する。そして、書き込みログ、読み込みログそれぞれを用いて、書き込み、読み込みについての各記事IDのスコアを算出する。スコアの算出は、書き込み、読み込みを多く行っている利用者が書いたり、読んだりした記事IDのスコアを高くすることにより行われる。   Further, the minority opinion extracting unit 71 acquires an access log for the target explanatory text extracted by the target explanatory text extracting unit 60 from the access log storage unit 11 via the access log acquiring unit 85. Then, the score of each article ID for writing and reading is calculated using the writing log and the reading log, respectively. The score is calculated by increasing the score of an article ID written or read by a user who writes and reads a lot.

例えば、図5(a)の書き込みログを用いて各記事IDのスコアを算出する場合を考えてみる。図5(a)の例では、利用者U0001が、記事K0011、K0014、K0015の3つを書き込んでいる。この場合、記事K0011、K0014、K0015にはそれぞれスコア“3”が与えられる。利用者U0002、U0003はそれぞれ記事K0012、K0013の1つだけ書き込んでいる。したがって、記事K0012、K0013にはそれぞれスコア“1”が与えられる。   For example, consider the case where the score of each article ID is calculated using the write log of FIG. In the example of FIG. 5A, the user U0001 has written three articles K0011, K0014, and K0015. In this case, the score “3” is given to each of the articles K0011, K0014, and K0015. Users U0002 and U0003 have written only one of articles K0012 and K0013, respectively. Therefore, each of the articles K0012 and K0013 is given a score “1”.

また、図5(b)の読み込みログを用いて各記事IDのスコアを算出する場合を考えてみる。図5(b)の例では、利用者U0001が、記事K0011、K0012の2つを読み込んでいる。この場合、記事K0011、K0012にはそれぞれスコア“2”が与えられる。利用者U0002は記事K0012の1つだけ読み込んでいる。したがって、記事K0012にはスコア“1”が与えられる。記事K0012については、利用者U0001に着目するとスコア“2”が与えられ、利用者U0002に着目するとスコア“1”が与えられる。この場合、低いほうのスコア“1”が記事K0012に与えられる。また、K0013、K0014、K0015については、読み込みがないのでスコア“0”が与えられる。   Also, consider a case where the score of each article ID is calculated using the read log of FIG. In the example of FIG. 5B, the user U0001 reads two articles K0011 and K0012. In this case, each of the articles K0011 and K0012 is given a score “2”. User U0002 has read only one article K0012. Therefore, the score “1” is given to the article K0012. The article K0012 is given a score “2” when focusing on the user U0001, and a score “1” when focusing on the user U0002. In this case, the lower score “1” is given to the article K0012. Also, K0013, K0014, and K0015 are not read and are given a score of “0”.

さらに、少数意見抽出手段71は、書き込みのスコアと読み込みのスコアを用いて、総合スコアを算出する。本実施形態では、少数意見抽出手段71が、以下の〔数式1〕に従った処理を実行することにより算出する。   Further, the minority opinion extraction unit 71 calculates a total score using the writing score and the reading score. In the present embodiment, the minority opinion extraction unit 71 performs the calculation according to the following [Formula 1].

〔数式1〕
(総合スコア)=α×(書き込みスコア)+β×(読み込みスコア)
[Formula 1]
(Overall score) = α × (Write score) + β × (Reading score)

〔数式1〕において、α、βは係数であり、適宜設定することが可能である。α=β=1とした場合、図5(a)(b)の例では、記事K0011の総合スコアが5で最大となるので、少数意見抽出手段71は、記事K0011を少数意見として決定し、抽出する。   In [Equation 1], α and β are coefficients, and can be set as appropriate. When α = β = 1, in the example of FIGS. 5A and 5B, the overall score of the article K0011 is the largest at 5, so the minority opinion extraction means 71 determines the article K0011 as a minority opinion, Extract.

多数意見抽出手段50により多数意見が抽出され、少数意見抽出手段71により少数意見が抽出されたら、意見提示手段80は、第1の実施形態と同様、多数意見、少数意見それぞれについて、対象説明語とその評価対象間の文字列を標題として記事から抽出する。そして、多数意見、少数意見ごとに標題を、事前に設定されたレイアウトに配置して画面データを作成し、提示する。提示先がインターネットを介した端末である場合は、HTMLデータを作成し、アクセス元である端末に送信することになる。   When the majority opinion is extracted by the majority opinion extraction means 50 and the minority opinion is extracted by the minority opinion extraction means 71, the opinion presentation means 80, for each of the majority opinion and the minority opinion, is the target explanation word as in the first embodiment. And the character string between the evaluation targets is extracted from the article as the title. Then, the title is arranged for each of the majority opinion and the minority opinion in a preset layout, and screen data is created and presented. If the presentation destination is a terminal via the Internet, HTML data is created and transmitted to the terminal that is the access source.

本発明第1の実施形態に係る意見抽出装置の構成図である。It is a lineblock diagram of an opinion extraction device concerning a 1st embodiment of the present invention. 記事データ記憶手段10に記憶された情報の一例を示す図である。4 is a diagram illustrating an example of information stored in an article data storage unit 10. FIG. 提示手段80により提示された画面の様子を示す図である。It is a figure which shows the mode of the screen shown by the presentation means. 本発明第2の実施形態に係る意見抽出装置の構成図である。It is a block diagram of the opinion extraction device which concerns on the 2nd Embodiment of this invention. アクセスログ記憶手段11に記憶された情報の一例を示す図である。It is a figure which shows an example of the information memorize | stored in the access log memory | storage means.

符号の説明Explanation of symbols

10・・・記事データ記憶手段
11・・・アクセスログ記憶手段
20・・・評価情報指定手段
30・・・対象説明語抽出手段
40・・・出現回数計数手段
50・・・多数意見抽出手段
60・・・対象説明文抽出手段
70、71・・・少数意見抽出手段
80・・・意見提示手段
85・・・アクセスログ取得手段
90・・・演算処理手段
100、101・・・意見抽出装置
DESCRIPTION OF SYMBOLS 10 ... Article data storage means 11 ... Access log storage means 20 ... Evaluation information designation means 30 ... Target explanatory word extraction means 40 ... Appearance count counting means 50 ... Multiple opinion extraction means 60 ... Object explanation sentence extraction means 70, 71... Minority opinion extraction means 80... Opinion presentation means 85... Access log acquisition means 90.

Claims (4)

記事データを記憶した記事データ記憶手段と、
評価対象と評価表現の組み合わせを指定する評価情報指定手段と、
前記指定された評価対象と評価表現の組み合わせに従って、前記記事データ記憶手段に記憶された記事データから、評価対象を説明する対象説明語を抽出する対象説明語抽出手段と、
前記抽出された対象説明語の出現回数を計数する出現回数計数手段と、
前記計数の結果、出現回数の多い対象説明語を有する記事データを多数意見として抽出する多数意見抽出手段と、
前記計数の結果、出現回数の少ない対象説明語を有する文を対象説明文として抽出する対象説明文抽出手段と、
前記抽出された対象説明文の文字数、または当該対象説明文内の所定の単語数が多い対象説明文を少数意見として抽出する少数意見抽出手段と、
を有することを特徴とする意見抽出装置。
Article data storage means for storing article data;
An evaluation information specifying means for specifying a combination of an evaluation object and an evaluation expression;
A target explanatory word extracting means for extracting a target explanatory word for explaining the evaluation target from the article data stored in the article data storage means according to the combination of the designated evaluation target and the evaluation expression;
Appearance count counting means for counting the number of appearances of the extracted target explanatory words;
As a result of the counting, a majority opinion extracting means for extracting article data having a target explanatory word with a large number of appearances as a majority opinion;
As a result of the counting, target explanation sentence extracting means for extracting a sentence having a target explanation word with a small number of appearances as a target explanation sentence;
A minority opinion extracting means for extracting the number of characters of the extracted target explanatory text or the target explanatory text having a large number of predetermined words in the target explanatory text as a minority opinion;
An opinion extraction device characterized by comprising:
前記記事データへのアクセスログを記憶したアクセスログ記憶手段と、
前記アクセスログ記憶手段から所定の記事に関するアクセスログを取得するアクセスログ取得手段と、をさらに有し、
前記少数意見抽出手段は、前記抽出された対象説明文を有する記事データの中から前記取得したアクセスログを用い、アクセスの多い利用者がアクセスした記事データに含まれる対象説明文ほど高いスコアを与え、当該スコアの高い所定数の対象説明文を少数意見として抽出するものであることを特徴とする請求項1に記載の意見抽出装置。
Access log storage means for storing an access log to the article data;
Access log acquisition means for acquiring an access log related to a predetermined article from the access log storage means,
The minority opinion extraction means uses the acquired access log from among the article data having the extracted target explanatory text, and gives a higher score to the target explanatory text included in the article data accessed by a user with much access. 2. The opinion extraction apparatus according to claim 1, wherein a predetermined number of target explanatory sentences having a high score are extracted as minority opinions.
前記アクセスログは、読み込みログおよび書き込みログからなり、
前記スコアは、読み込みの多い利用者が読み込んだ記事データに含まれる対象説明文ほど高く、かつ、書き込みの多い利用者が書き込んだ記事データに含まれる対象説明文ほど高く与えられるものであることを特徴とする請求項2に記載の意見抽出装置。
The access log consists of a read log and a write log,
The score is higher for a target explanatory sentence included in article data read by a user who reads a lot, and higher for a target explanatory sentence included in article data written by a user who writes a lot. The opinion extraction device according to claim 2, wherein the opinion extraction device is a feature.
コンピュータを、請求項1から請求項3のいずれかに記載の意見抽出装置として機能させるためのプログラム。   The program for functioning a computer as an opinion extraction apparatus in any one of Claims 1-3.
JP2007327831A 2007-12-19 2007-12-19 Opinion extraction device Expired - Fee Related JP5130900B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007327831A JP5130900B2 (en) 2007-12-19 2007-12-19 Opinion extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007327831A JP5130900B2 (en) 2007-12-19 2007-12-19 Opinion extraction device

Publications (2)

Publication Number Publication Date
JP2009151483A JP2009151483A (en) 2009-07-09
JP5130900B2 true JP5130900B2 (en) 2013-01-30

Family

ID=40920593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007327831A Expired - Fee Related JP5130900B2 (en) 2007-12-19 2007-12-19 Opinion extraction device

Country Status (1)

Country Link
JP (1) JP5130900B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11272740B2 (en) 2012-07-16 2022-03-15 Nicoventures Holdings Limited Electronic vapor provision device
US11350666B2 (en) 2012-07-16 2022-06-07 Nicoventures Tading Limited Electronic vapor provision device
US11723396B2 (en) 2015-03-31 2023-08-15 Nicoventures Trading Limited Cartridge, pouch and method of manufacture of pouch for use with apparatus for heating smokable material

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6047903B2 (en) 2012-03-27 2016-12-21 富士通株式会社 Group work support method, group work support program, group work support server, and group work support system
JP6075149B2 (en) * 2013-03-26 2017-02-08 富士通株式会社 Learning support program, learning support apparatus, and learning support method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342365A (en) * 2001-05-16 2002-11-29 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for introducing recommended information and recording medium having the program recorded thereon
JP4269698B2 (en) * 2003-01-23 2009-05-27 富士通株式会社 Opinion analysis method, opinion analysis apparatus, and opinion analysis program
JP2006053685A (en) * 2004-08-10 2006-02-23 Nippon Telegr & Teleph Corp <Ntt> Reputation information processing device, reputation information processing method and program
JP2006323738A (en) * 2005-05-20 2006-11-30 Fuji Xerox Co Ltd Program for evaluating contribution level of community participant and electronic communication system
JP2007115118A (en) * 2005-10-21 2007-05-10 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for extracting reputation information

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11272740B2 (en) 2012-07-16 2022-03-15 Nicoventures Holdings Limited Electronic vapor provision device
US11350666B2 (en) 2012-07-16 2022-06-07 Nicoventures Tading Limited Electronic vapor provision device
US11723396B2 (en) 2015-03-31 2023-08-15 Nicoventures Trading Limited Cartridge, pouch and method of manufacture of pouch for use with apparatus for heating smokable material

Also Published As

Publication number Publication date
JP2009151483A (en) 2009-07-09

Similar Documents

Publication Publication Date Title
Egri et al. The role of search engine optimization on keeping the user on the site
Iacob et al. Retrieving and analyzing mobile apps feature requests from online reviews
JP5647508B2 (en) System and method for identifying short text communication topics
US20100138428A1 (en) Keyword output apparatus and method
JP2010066870A (en) Information recommendation device and information recommendation method
JP5130900B2 (en) Opinion extraction device
JP5547669B2 (en) Related word extraction device, related word extraction method, related word extraction program
JP2009026083A (en) Content retrieval device
JP2008107904A (en) Text and animation service apparatus, and computer program
JP4744404B2 (en) Evaluation output device, evaluation output method, and program
JP6960253B2 (en) Product evaluation device, product evaluation method, and program
KR101850853B1 (en) Method and apparatus of search using big data
JP2012212191A (en) Information processor and information processing method
JP6960553B2 (en) Brand dictionary creation device, product evaluation device, brand dictionary creation method and program
Woolcott et al. Missing the MARC: Utilization of MARC fields in the search process
JP2017117021A (en) Keyword extraction device, content generation system, keyword extraction method, and program
JP6675868B2 (en) Information processing apparatus, information processing method, and program
JP2010049384A (en) Moving image evaluation method, device, and program
JP5083627B2 (en) Minority opinion extractor
JP2006202118A (en) Attribute evaluation apparatus, method and program
KR101440385B1 (en) Device for managing information using indicator
JP3967230B2 (en) Image information display system
JP2007052693A (en) Webpage information display apparatus, processing method and program
JP6200392B2 (en) Information presenting apparatus and information presenting program
JP2004070376A (en) Document display device and method therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101028

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121022

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5130900

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees