WO2013129311A1 - 不満抽出装置,不満抽出方法および不満抽出プログラム - Google Patents

不満抽出装置,不満抽出方法および不満抽出プログラム Download PDF

Info

Publication number
WO2013129311A1
WO2013129311A1 PCT/JP2013/054761 JP2013054761W WO2013129311A1 WO 2013129311 A1 WO2013129311 A1 WO 2013129311A1 JP 2013054761 W JP2013054761 W JP 2013054761W WO 2013129311 A1 WO2013129311 A1 WO 2013129311A1
Authority
WO
WIPO (PCT)
Prior art keywords
evaluation
sentence
dissatisfied
dissatisfaction
polarity
Prior art date
Application number
PCT/JP2013/054761
Other languages
English (en)
French (fr)
Inventor
善雄 石澤
細見 格
定政 邦彦
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2014502205A priority Critical patent/JP6048691B2/ja
Publication of WO2013129311A1 publication Critical patent/WO2013129311A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Definitions

  • Dissatisfaction extraction device dissatisfaction extraction method, and program, which can extract dissatisfaction useful for improvement of evaluation target products from documents written by users of evaluation target products such as blogs and Internet bulletin boards
  • the present invention relates to a dissatisfaction extraction apparatus, method, and program.
  • the direct request can be extracted by using an expression representing the request such as “I want” as described in Non-Patent Document 1.
  • the product developer can immediately provide feedback to product development.
  • the user of the mobile phone C is not dissatisfied, such as “the mobile phone C is also good, but the mobile phone D is even better”. You may know that it exists. In this case, since the user feels that the mobile phone D is superior to the mobile phone C and can be regarded as a potential dissatisfaction possessed by the user of the mobile phone C, such dissatisfaction also represents an expectation for improvement. As a result, if product feedback can be fed back to the product development, the product developer can develop the product in line with consumer expectations.
  • Dissatisfaction that expresses expectations for improvement is defined as dissatisfaction that states that there is a better comparison target than the function, performance, and design of the evaluation target, and that the evaluation target is inferior to the comparison target. .
  • Such a dissatisfaction is a dissatisfaction useful for improving the evaluation target product.
  • Patent Document 1 extracts dissatisfaction regarding disadvantages and disadvantageous events as dissatisfactions that can be used for other services (for example, Q & A sites) from various dissatisfactions. .
  • Patent Document 1 acquires a document from a document database, extracts a word representing an improvement operation, extracts a target of the improvement operation from a document acquired from a document set database, and represents a word representing the improvement operation Obtain the co-occurrence frequency of the word representing the improvement action target, obtain the co-occurrence frequency of the word representing the improvement action and the word representing the improvement action target, and deny, neutral, and affirm the word of the improvement action target Classify into any of the evaluation polarities, and output words that indicate the object of negative improvement action as dissatisfied.
  • a question posted by the user on the Q & A site is acquired, a question including a word that is dissatisfied is selected from among the questions, a question including a word that is dissatisfied is acquired, and the question is received from the Q & A site. Get the corresponding answer and output it as a recommendation page.
  • the co-occurrence frequency of the word representing the action and the word representing the object of the action and the co-occurrence frequency of the word representing the action and the modality representing the profit are obtained, and the two co-occurrence frequencies are obtained.
  • An operation with a large product is extracted as an improvement operation.
  • the target of the improved action extracted is identified from the document set, the polarity of the target of the improved action is determined from the co-occurrence frequency of the improved action and the target of the improved action, and finally the target of the improved action whose polarity is negative is determined. Extract as “dissatisfied”.
  • Extract words that match dissatisfaction from the text written by the user select a question containing dissatisfaction from the questions posted on the Q & A site, and present the user with an answer associated with the question.
  • the comparative evaluation detection device of Patent Document 2 compares a plurality of objects, and detects a comparative evaluation expression part composed of a character string expressing a comparative evaluation describing differences or superiority recognized in them.
  • the comparative evaluation detection device of Patent Document 2 stores a pattern for extracting a comparative evaluation asserted portion in advance. Next, the text is acquired, divided into character strings of specific units, morphological analysis is performed for each character string, and morphological analysis results are acquired. Then, the morphological analysis result and the extracted pattern are collated. Then, a character string indicating the target, a character string indicating a comparison target when the target is relatively evaluated, a character string indicating an attribute focused on when evaluating the target, and a degree of evaluation regarding the target A combination including either a character string to be indicated or a character string indicating an evaluation related to the target is detected as a comparative evaluation asserted portion.
  • the polarity estimation system in Patent Document 3 estimates the evaluation polarity of reputation information. If this is utilized, it can be estimated which product is evaluated by the magnitude
  • the evaluation polarity can be estimated and the evaluation polarity is unknown, considering the usage and negation of the expression of good image or bad image in the attribute expression.
  • the polarity can be estimated for an evaluation expression. That is, based on the reputation information accumulated so far, the evaluation polarity can be estimated by taking into account the polarity of the polarity of the object, the attribute expression, and the evaluation expression. Then, a statistical average of the evaluation polarities for the object is obtained as an evaluation value of the object, and an object having a large evaluation value is set as an object evaluated by the user.
  • Patent Document 1 extracts dissatisfaction from a sentence describing the effect of a product based on a word representing an improvement operation, and can extract dissatisfaction with respect to the effect aimed at by the company that developed the product.
  • it is difficult to extract dissatisfaction useful for improving the evaluation target products from documents written based on the viewpoints of purchasers and users such as blogs and Internet bulletin boards.
  • a purchaser or user of a mobile phone complains that the same manufacturer makes it, but mobile phone A can play games but mobile phone B cannot play games. Even if it is written on a bulletin board, etc., it is useful for improving the evaluation target product written by the purchaser or user if the explanation such as “Game play is possible” is not written on the mobile phone. It is not possible to extract unsatisfactory complaints.
  • the comparative evaluation and detection device of Patent Document 2 is effective when relatively comparing multiple objects within a certain evaluation axis, such as “The image quality of a liquid crystal television is much better than the image quality of a cathode ray tube.” It was difficult. That is, the comparative evaluation detection device of Patent Document 2 also detects a sentence such as “operability of the mobile phone D is still better than that of the mobile phone C”.
  • the expression “the operability of the mobile phone D is still better than the mobile phone C” includes, in addition, the standard that the user can satisfy both the operability of the mobile phone C and the operability of the mobile phone D. It is assumed that it has not been exceeded. "
  • the polarity estimation system of Patent Document 3 extracts reputation information even when the evaluation object and the comparison object are not compared and evaluated. For example, even if the user thinks that the mobile phone F is superior to the mobile phone E, if it is not necessary to make a comparative evaluation, the purchaser or the user writes an evaluation such as “the mobile phone E is good”. . I don't know which cell phone is better. When such evaluations are mixed, even if reputation information is collected and a statistical average of evaluation expressions is obtained, the result includes a large error.
  • the present invention solves the above problems, and can extract frustrations useful for improving an evaluation target product from documents written by users of the evaluation target product such as blogs and Internet bulletin boards.
  • An object is to provide a dissatisfaction extraction device, method and program.
  • the present invention that solves the above-described problem is a sentence including an evaluation object, an evaluation expression related to the evaluation object, a comparison object different from the evaluation object, and an evaluation expression related to the comparison object from a set of sentences.
  • a dissatisfied sentence candidate extraction unit that extracts two consecutive sentences as dissatisfied sentence candidates, a polarity determination unit that determines the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object, and the evaluation object
  • a dissatisfied sentence extraction unit that determines whether or not the dissatisfied sentence candidate is a dissatisfied sentence based on a difference in the degree of polarity between the evaluation expression and the evaluation expression related to the comparison target, and extracts a dissatisfied sentence. It is an unsatisfactory extraction device.
  • the dissatisfaction extraction device inputs an evaluation object represented by a character string, and the evaluation object, the evaluation expression related to the evaluation object, and the evaluation object are different from the set of sentences.
  • One sentence including the comparison object and the evaluation expression related to the comparison object or two consecutive sentences are extracted as dissatisfied sentence candidates, and the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object is determined.
  • the present invention that solves the above-described problems includes an evaluation object input process for inputting an evaluation object represented by a character string, a sentence set, the evaluation object, an evaluation expression related to the evaluation object, and the evaluation object.
  • Dissatisfied sentence candidate extraction processing for extracting different comparison objects, one sentence including the evaluation expression related to the comparison object or two consecutive sentences as dissatisfied sentence candidates, and the evaluation expression related to the evaluation object and the evaluation related to the comparison object Whether or not the dissatisfied sentence candidate is a dissatisfied sentence based on a polarity determination process for determining the degree of polarity of the expression and a difference in the degree of polarity between the evaluation expression relating to the evaluation object and the evaluation expression relating to the comparison object It is a dissatisfaction extraction program characterized by causing a dissatisfaction extraction device to execute a dissatisfaction extraction process for determining and extracting dissatisfaction sentences.
  • FIG. 1 is a functional block diagram of the dissatisfaction extraction device according to the first embodiment.
  • the dissatisfaction extracting apparatus inputs a sentence set acquisition unit 101 that acquires and stores a set of sentences, an evaluation target input unit 102 that inputs an evaluation target as a product to be improved, and a comparison target corresponding to the evaluation target From the comparison target input unit 103 and the set of sentences, one evaluation sentence or two consecutive sentences including the evaluation expression related to the evaluation object and the evaluation object and the evaluation expression related to the comparison object and the comparison object are extracted as dissatisfied sentence candidates.
  • the sentence set acquisition unit 101 acquires and stores a set of sentences from a blog, an internet bulletin board, a word-of-mouth website, etc. written by the purchaser or user of the target product.
  • the evaluation target input unit 102 inputs a character string input with a keyboard or the like as an evaluation target.
  • “A company-made smartphone” is an evaluation target as an example.
  • the comparison target input unit 103 inputs a character string input with a keyboard or the like as a comparison target.
  • a character string input with a keyboard or the like is used as a comparison target.
  • “B company smartphone” or “C company smartphone” is used as a comparison target.
  • the dissatisfied sentence candidate extraction unit 104 searches the sentence set stored in the sentence set acquisition unit 101 for the evaluation expression related to the evaluation target and the evaluation expression related to the comparison target.
  • the evaluation expression is determined with reference to the evaluation expression dictionary 108.
  • One sentence or two consecutive sentences including the evaluation expression related to the evaluation object and the evaluation object and the evaluation expression related to the comparison object and the comparison object are extracted as dissatisfied sentence candidates.
  • the screen of the C company smartphone is [good].
  • the screen of the smartphone manufactured by Company A [cannot be complained].
  • the screen of the smartphone manufactured by Company A is also good.
  • the screen of the C company smartphone is also good.
  • (G) Although the screen of the C company smartphone is [not good], the screen of the company A smartphone is [too bad].
  • the smartphone manufactured by Company A normally [cannot be charged] on the second day, and the red lamp blinked.
  • I would like to be able to automatically refresh the screen with a company A smartphone.
  • J Although mobile phones are foldable, they cannot be used with smartphones.
  • the dissatisfied sentence candidate extraction unit 104 extracts each sentence (a) to (g) as a dissatisfied sentence candidate.
  • the polarity determination unit 105 determines the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object.
  • the evaluation polarity is a characteristic of whether the evaluation expression is a positive expression or a negative expression.
  • the polarity of the evaluation expression is determined with reference to the polarity dictionary 109.
  • FIG. 2 is a diagram illustrating the structure of the polarity dictionary 109.
  • “[Sa variation] can be” or the like represents a pattern of “use (sa variation)” + “can” such as “can be used”.
  • the polarity is a real number from ⁇ 1 to 1, and the closer to 1, the more positive, and the closer to ⁇ 1, the negative.
  • Polarity 0 indicates neutral evaluation. That is, -1 ⁇ polarity ⁇ 0 indicates negative evaluation, and 0 ⁇ polarity ⁇ 1 indicates positive evaluation.
  • the polarity of the evaluation expression included in the candidates (a) to (g) is determined.
  • the dissatisfaction sentence extraction unit 106 evaluates the value Pt indicating the degree of polarity of the evaluation expression related to the evaluation target and the comparison target A difference (Pc ⁇ Pt) from the value Pc of the degree of polarity of the expression is obtained.
  • the polarity difference (Pc-Pt) is an index that represents the user's expectation for improvement. If this index value increases, the effect of improvement increases.
  • the threshold value is a value that can show a clear superiority or inferiority.
  • the dissatisfied sentence extraction unit 106 determines that each sentence of (a) to (d) in which the polarity difference (Pc ⁇ Pt) is equal to or greater than a predetermined threshold (eg, 0.4) is a dissatisfied sentence.
  • a predetermined threshold eg, 0.4
  • the polarity difference (Pc ⁇ Pt) is a negative number. This means that the evaluation target is superior to the comparison target, and there is no improvement.
  • the polarity difference (Pc ⁇ Pt) is less than the threshold value, there is no superiority or inferiority between the evaluation object and the comparison object, and there is no improvement.
  • the dissatisfaction storage unit 107 stores dissatisfaction sentences (a), (b), (c), and (d).
  • the product developer accesses the dissatisfaction storage unit 107 and refers to the dissatisfaction to provide immediate feedback on product improvement.
  • FIG. 3 is a flowchart showing the treatment content of the dissatisfaction extraction device. The operation of the dissatisfaction extraction device will be described using a flowchart.
  • a set of sentences is acquired from a blog, an internet bulletin board or a word-of-mouth website written by the purchaser or user of the target product and stored (step 1). For example, a set of sentences including the sentences (a) to (j) described above is acquired.
  • a character string input with a keyboard or the like is input as an evaluation target (step 2).
  • “Smartphone manufactured by Company A” is input as an evaluation target.
  • a character string input with a keyboard or the like is input as a comparison target (step 3).
  • “B company smartphone” and “C company smartphone” are input as comparison targets.
  • Step 4 From a set of sentences, an evaluation object, an evaluation expression related to the evaluation object, a comparison object different from the evaluation object, and one sentence or two consecutive sentences containing the evaluation expression related to the comparison object (Step 4).
  • the sentences (a) to (g) are extracted as dissatisfied sentence candidates.
  • step 5 the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object is determined (step 5). Refer to the polarity dictionary 109 for the polarity of the evaluation expression.
  • the evaluation expressions related to the comparison target “B company smartphone” and “C company smartphone” are positive evaluation expressions or neutral evaluation expressions, and indicate the degree of polarity of the evaluation expression related to the evaluation object “A company smartphone”.
  • the difference between the value and the value of the degree of polarity of the evaluation expression related to the comparison target is determined to be a dissatisfied sentence for each of the dissatisfied sentence candidates (a) to (d), and the dissatisfied sentence is determined. Extract (step 6) and store (step 7).
  • the product developer can make improvements that exceed the standards satisfied by the user by adding the functions evaluated in the comparison target to the evaluation target.
  • an electronic money function, an FM transmission function, and a music file playback function may be added to a smartphone manufactured by company A to improve the image quality of the screen.
  • the function has already been realized in the smartphone manufactured by Company B, which is a comparison target, and there is almost no technical problem in adding the function to the evaluation target.
  • the dissatisfaction extraction apparatus of this embodiment can also extract dissatisfaction sentences in which potential dissatisfaction is described.
  • dissatisfaction sentence like each sentence of (d) above, the user does not feel direct dissatisfaction with the smartphone manufactured by company A which is the object of evaluation and exceeds the standard, but B which is the object of comparison.
  • company-made smartphones are superior, and users will be more satisfied if the screen of smartphones made by company A is improved to the same quality as smartphones made by company B.
  • the function has already been realized in the smartphone manufactured by Company B, which is a comparison target, and there is almost no technical problem in adding the function to the evaluation target.
  • the dissatisfied sentence candidate extraction unit 104 searches the evaluation expression related to the evaluation target and the evaluation expression related to the comparison target from the sentence set stored in the sentence set acquisition unit 101.
  • the evaluation expression is determined with reference to the evaluation expression dictionary 108.
  • One sentence or two consecutive sentences including the evaluation expression related to the evaluation object and the evaluation object and the evaluation expression related to the comparison object and the comparison object are extracted as dissatisfied sentence candidates.
  • FIG. 4 is a functional block diagram of a dissatisfaction extraction device according to a modification.
  • the dissatisfied sentence candidate extraction unit 104 detects a reverse tangent expression from the evaluation target and the comparison target from the sentence set stored in the sentence set acquisition unit 101. Whether or not the reverse connection expression is used is determined by referring to the reverse connection expression dictionary 110. One sentence or two consecutive sentences including the evaluation expression related to the evaluation object and the evaluation object, the evaluation expression related to the comparison object and the comparison object, and the reverse connection expression are extracted as dissatisfied sentence candidates.
  • the screen of A company's smartphone [can't be complaining].
  • the screen of the smartphone manufactured by Company A is also good.
  • the screen of the C company smartphone is also nice.
  • the screen of the smartphone manufactured by company C is [not good] ⁇ but >>, and the screen of the smartphone manufactured by company A is [too bad].
  • the smartphone manufactured by Company A normally [cannot be charged] on the second day, and the red lamp blinked.
  • I would like to be able to automatically refresh the screen with a company A smartphone.
  • Mobile phones are foldable, but cannot be used with smartphones.
  • the dissatisfied sentence candidate extraction unit 104 extracts the sentences (a) to (c) and (g) as dissatisfied sentence candidates.
  • Other configurations and operations are the same as in this embodiment.
  • the dissatisfied sentence extraction unit 106 operates only when the evaluation expression related to the comparison target is a positive evaluation expression or a neutral evaluation expression (Pc ⁇ 0). To do. This is because even if the screen of the smartphone manufactured by company A is improved to have the same quality as the screen of the smartphone manufactured by company C, the user feels [not good enough] and is not satisfied. In the present embodiment, such dissatisfaction is not useful, but may be useful in some cases. In that case, the dissatisfied sentence extraction unit 106 operates by canceling the condition of (Pc ⁇ 0).
  • the dissatisfied sentence extracting unit 106 determines that a dissatisfied sentence candidate whose polarity difference (Pc ⁇ Pt) is equal to or greater than a threshold is a dissatisfied sentence.
  • a dissatisfied sentence candidate with a polarity difference (Pc ⁇ Pt)> 0 is a dissatisfied sentence.
  • FIG. 5 is a functional block diagram of the dissatisfaction extraction device according to the second embodiment
  • FIG. 6 is a flowchart showing the treatment content of the dissatisfaction extraction device according to the second embodiment.
  • the comparison target input unit 103 inputs a character string input with a keyboard or the like as a comparison target (step 3), but in the second embodiment, the comparison target specifying unit 111 has an upper-lower relationship.
  • the comparison target corresponding to the evaluation target is specified with reference to the dictionary 112 (step 8).
  • FIG. 7 is a diagram showing the structure of the upper / lower relationship dictionary 112.
  • “smartphone”, “mobile phone”, and “landline phone” as subordinate terms of “telephone”.
  • “smartphone” exists as a broad term for “smart phone made by company A”, “smart phone made by company B”, and “smart phone made by company C”, and “phone” exists as a broad term for “smartphone”. You can also.
  • the upper-level and lower-level relationship extraction tools distributed in the Advanced Language Information Fusion Forum can be used.
  • Smartphone manufactured by Company A “Smartphone manufactured by Company B”, and “Smartphone manufactured by Company C” are similar terms similar to the broader term “smartphone”.
  • the comparison target identification unit 111 identifies the broader word to be evaluated, and identifies the narrower word of this broader word as the comparison target.
  • “smart phone” is specified as a broad term of the evaluation target “smart phone made by company A”, and “smart phone made by company B” and “smart phone made by company C”, which are subordinate terms of “smart phone”, are identified as comparison targets.
  • N represents a co-occurring range
  • the comparison target specifying unit 111 can save time and effort for inputting a comparison target. Furthermore, since the comparison target specifying unit 111 requests that the comparison target appears in the vicinity of the evaluation target, it is possible to extract a dissatisfied sentence candidate with higher accuracy.
  • FIG. 8 is a functional block diagram of a dissatisfaction extraction device according to a modification of the second embodiment.
  • the sentence set acquisition unit 101 in the second embodiment is the sentence set acquisition unit 113, and there is no evaluation target input unit 102.
  • the sentence set acquisition unit 113 acquires and stores a set of sentences from a blog, an Internet bulletin board, a word-of-mouth website, etc., about the evaluation target “Company A” written by the purchaser or user of the target product.
  • the comparison target specifying unit 111 specifies the comparison target corresponding to the evaluation target with reference to the upper-lower relationship dictionary 112. For example, “B company smartphone” or “C company smartphone” is the comparison target.
  • the sentence set acquisition unit 116 estimates that the description of the evaluation target is omitted by acquiring a set of sentences from a blog, an internet bulletin board, a word-of-mouth website, or the like regarding the evaluation target “Company A smartphone”. can do.
  • the sentence set acquisition unit 113 can save time and effort for inputting an evaluation target.
  • the present invention provides an evaluation object, an evaluation expression related to the evaluation object, a comparison object different from the evaluation object, and one sentence or two consecutive sentences including the evaluation expression related to the comparison object from a set of sentences.
  • a dissatisfied sentence candidate extracting unit that extracts a dissatisfied sentence candidate, a polarity determining unit that determines the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object, and the evaluation expression and the comparison object related to the evaluation object
  • a dissatisfied sentence extraction unit for determining whether or not the dissatisfied sentence candidate is a dissatisfied sentence based on a difference in the degree of polarity of the evaluation expression according to It is.
  • the dissatisfaction extraction apparatus configured as described above can extract dissatisfaction sentences in which the evaluation target of evaluation that is superior and the evaluation target of evaluation that is inferior are described in contrast.
  • the dissatisfaction statement implicitly states an absolute evaluation that the user thinks that the comparison target exceeds the standard, but the evaluation target does not exceed the standard. Yes.
  • the product developer can make improvements that exceed the standards satisfied by the user by adding the functions evaluated in the comparison target to the evaluation target.
  • the function has already been realized in the comparison target that is the comparison target, and there is almost no technical problem in adding the function to the evaluation target.
  • the dissatisfaction extraction device of the present invention can also extract dissatisfaction sentences in which potential dissatisfaction is described. That is, the user does not feel direct dissatisfaction with the evaluation object and exceeds the standard, but if the user feels that the comparison object is superior, the user becomes a potential dissatisfaction. If the product developer adds various functions evaluated in the comparison object to the evaluation object, the user is more satisfied. The function has already been realized in the comparison target that is the comparison target, and there is almost no technical problem in adding the function to the evaluation target.
  • the dissatisfaction sentence extraction unit calculates a difference between a value indicating the degree of polarity of the evaluation expression related to the evaluation object and a value of the degree of polarity of the evaluation expression related to the comparison object. If the difference between the polarity values is equal to or greater than a predetermined threshold, it is determined that the dissatisfied sentence candidate is a dissatisfied sentence.
  • the dissatisfied sentence extracting unit further determines that the dissatisfied sentence candidate is a dissatisfied sentence if the evaluation expression related to the comparison target is a positive evaluation expression or a neutral evaluation expression. judge.
  • comparison target does not exceed the standard, the user is not satisfied even if improvements are made to add the functions evaluated in the comparison target to the evaluation target. Such dissatisfaction that is not useful for improving the evaluation target product can be excluded.
  • the dissatisfied sentence candidate extracting unit further extracts a sentence including a reverse tangent expression between the evaluation object and the comparison object as a dissatisfied sentence candidate.
  • the dissatisfaction extraction device further includes a comparison target specifying unit that specifies the broader word to be evaluated and specifies the lower word of the broader word as the comparison target.
  • the dissatisfaction extraction device inputs an evaluation object represented by a character string, and from a set of sentences, the evaluation object, an evaluation expression related to the evaluation object, a comparison object different from the evaluation object, One sentence or two consecutive sentences including the evaluation expression related to the comparison target are extracted as dissatisfied sentence candidates, the degree of polarity of the evaluation expression related to the evaluation target and the evaluation expression related to the comparison target is determined, and the evaluation target
  • a method for extracting dissatisfaction is characterized by determining whether or not the dissatisfied sentence candidate is a dissatisfied sentence based on a difference in the degree of polarity between the evaluation expression relating to the evaluation expression and the evaluation expression relating to the comparison target, and extracting the dissatisfaction sentence It is.
  • the dissatisfaction extraction method of the present invention more preferably, in the step of extracting the dissatisfaction sentence, a value indicating a degree of polarity of the evaluation expression related to the evaluation object and a value of a degree of polarity of the evaluation expression related to the comparison object A difference is obtained, and if the difference between the polarity values is equal to or greater than a predetermined threshold, it is determined that the dissatisfied sentence candidate is a dissatisfied sentence.
  • the dissatisfaction extraction method of the present invention more preferably, in the step of extracting the dissatisfied sentence, if the evaluation expression related to the comparison target is a positive evaluation expression or a neutral evaluation expression, the dissatisfied sentence candidate is a dissatisfied sentence. Judge that there is.
  • a sentence including an inverse expression between the evaluation object and the comparison object is further extracted as a dissatisfied sentence candidate.
  • the broader word to be evaluated is identified, and the narrower word of the broader word is identified as the comparison target.
  • the present invention relates to an evaluation object input process for inputting an evaluation object represented by a character string, a sentence set, the evaluation object, an evaluation expression related to the evaluation object, and a comparison object different from the evaluation object, Dissatisfied sentence candidate extraction process for extracting one sentence or two consecutive sentences including the evaluation expression related to the comparison object as a dissatisfied sentence candidate, and the degree of polarity of the evaluation expression related to the evaluation object and the evaluation expression related to the comparison object And determining whether or not the dissatisfied sentence candidate is a dissatisfied sentence based on a difference in polarity between the polarity determination process for determining and the evaluation expression relating to the evaluation object and the evaluation expression relating to the comparison object, and dissatisfaction sentence
  • a difference between a value indicating the degree of polarity of the evaluation expression related to the evaluation object and a value of the degree of polarity of the evaluation expression related to the comparison object is calculated. If the difference between the polarity values is equal to or greater than a predetermined threshold, it is determined that the dissatisfied sentence candidate is a dissatisfied sentence.
  • the dissatisfied sentence candidate is a dissatisfied sentence. judge.
  • a sentence including an inverse expression between the evaluation object and the comparison object is further extracted as a dissatisfied sentence candidate.
  • the dissatisfaction extracting apparatus further executes a comparison object specifying process for specifying the broader word to be evaluated and specifying the low-order word of the broader word as the comparison object.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出する。不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価表現辞書108を参照して、評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む不満文候補を抽出する。極性判定部105は、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する。不満文抽出部106は、比較対象に係る評価表現が肯定評価表現又は中立評価表現である場合、評価対象に係る評価表現の極性値Ptと比較対象に係る評価表現の極性値Pcとの差(Pc-Pt)が閾値以上となる文を不満文であると判定する。

Description

不満抽出装置,不満抽出方法および不満抽出プログラム
 不満抽出装置,不満抽出方法およびプログラムに係り、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することのできる不満抽出装置,方法およびプログラムに関する。
 近年、製品の購入者や使用者が、ブログやインターネット掲示板などで、購入製品や使用製品に関する事実や意見を大量に発信するようになってきた。このような購入者や使用者が製品に対して持った意見には、「使いやすくて良い」などの肯定的意見から「画面が暗くて見にくい」などの否定的意見(不満)や「画面の解像度を上げて欲しい」などの要望など、様々な意見がある。それらの意見の中には商品の改善に有用な意見も含まれている。
 そのような改善に有用な意見として、「キーを押しやすくして欲しい」といった直接的要望がある。直接的要望に関しては、非特許文献1に記載されているような「欲しい」などの要望を表す表現を手がかりにすることで、直接的要望を抽出することが出来る。
 一方、不満の中にも、「携帯電話Aは使えない」といった愚痴レベルの不満から、「携帯電話Aには機能αがあるのに、携帯電話Bに機能αがないのはおかしい」などの製品の改善に有用な不満まで、様々な不満が含まれている。
 すなわち、「携帯電話Aは使えない」という不満では、製品開発者はどの点を改善すればよいのか分からない。一方、「携帯電話Aには機能αがあるのに、携帯電話Bに機能αがないのはおかしい」という不満から、携帯電話Bの開発者は、携帯電話Bに機能αを追加することを検討できる。機能αは携帯電話Aにおいて実現されており、携帯電話Bに機能αを追加することに技術的な課題はほとんどない。このような不満は、間接的要望でもある。
 この様に、評価対象製品の改善に有用な不満を抽出することができれば、製品開発者は、製品開発に直ちにフィードバックすることができる。
 また、使用者の不満ではないが、「携帯電話Cもいいけど、携帯電話Dは更に素晴らしい」などのように、携帯電話Cのユーザは不満を持っていないが、より優れた携帯電話Dが存在することを知っている場合がある。この場合、ユーザにとって携帯電話Dの方が携帯電話Cより優れていると感じており、携帯電話Cのユーザが持っている潜在的不満とみなせるので、このような不満も改善への期待を表した不満として、商品開発にフィードバックできれば、商品の開発者は、消費者の期待により沿った商品の開発を行うことができる。
 改善への期待を表した不満とは、評価対象の機能や性能やデザインなどに比べてより優れた比較対象が存在し、評価対象が比較対象より劣っている旨が書かれた不満と定義する。このような不満が、評価対象製品の改善に有用な不満である。
 以下、評価対象製品の改善への期待を表した不満と、そうでない不満について例示し、その理由を示す。
○評価対象製品への改善の期待を表した不満の例:
「パソコン用音楽再生ソフトで再生できるのに、ポータブルオーディオに取り込むと再生できない。」(ポータブルオーディオで再生可能になる改善を期待)
「G社製スマートフォンOSでフリック入力できるが、A社製スマートフォンOSではフリック入力できないのが残念。」(A社製スマートフォンOSでもフリック入力できるような改善を期待)
「B社製スマートフォンの液晶画面は綺麗だが、A社製スマートフォンは汚い。」(A社製スマートフォンの画面が、B社製スマートフォンの液晶画面と同等の品質になる改善を期待)
「C社製スマートフォンの画面は綺麗だが、B社製スマートフォンの画面は文句のつけようがない。」(C社製スマートフォンの画面が、B社製スマートフォンの画面と同等の品質になる改善を期待)
○評価対象製品への改善の期待を表した不満でない例とその理由:
「2日目に正常に充電できなくなり、赤いランプが点滅状態になった。」(理由:事実のみで、意見ではない。)
「使い物にならないスイング設定はとても残念。」(理由:どうなれば使い物になるかわからないので、製品開発にフィードバックできない。)
「画面の自動リフレッシュができるようになったらいいのになぁ。」(理由:要望であり、実現可能か技術的課題の検討が必要である。)
「D社製スマートフォンの画面はイマイチだが、E社製スマートフォンの画面は酷過ぎる。」(理由:E社製スマートフォンの画面の改善を期待するが、D社製スマートフォンの画面と同等の品質に改善しても使用者は満足しない。)
 ところで、従来技術として、いくつかの不満抽出装置や関連する装置が提案されている。
 特許文献1の情報処理装置(不満抽出装置)は、様々な不満の中から、他のサービス(例えば、Q&Aサイト)に利用可能な不満として、デメリットや不利益な出来事に関する不満を見分けて抽出する。
 特許文献1の情報処理装置は、文書データベースから文書を取得し、改善動作を表す語を抽出し、文書集合データベースから取得した文書から該改善動作の対象を抽出し、該改善動作を表す語と該改善動作の対象を表す語の共起頻度を求め、改善動作を表す語と改善動作の対象を表す語の共起頻度を取得し、該改善動作の対象の語を否定、中立、肯定のいずれかの評価極性に分類し、否定的な改善動作の対象を現す語を不満として出力する。
 さらに、Q&Aサイトにユーザより投稿された質問を取得し、該質問の中から不満に一致する語を含む質問を選択し、不満に一致する語を含む質問を取得し、Q&Aサイトから該質問に対応する回答を取得して、推薦ページとして出力する。
 具体的には、まず、商品の効果を説明する際に記述される「この商品は、運動不足を解消してくれます」などの説明文から、改善動作を表す語「解消」と否定的動作対象を表す語「運動不足」と利益を表すモダリティを表す語「解消してくれます」の3つを抜き出す。
 次に、文書集合を用いて、動作を表す語と動作の対象を表す語の共起頻度と、動作を表す語と利益を表すモダリティを表す語の共起頻度を求め、2つの共起頻度の積が大きい動作を改善動作として抽出する。
 その後、文書集合から、抽出した改善動作の対象を特定し、改善動作と改善動作の対象の共起頻度から改善動作の対象の極性を判定し、最後に、極性が否定の改善動作の対象を「不満」として抽出する。
 ユーザが記述したテキストから不満と一致する語を抽出し、Q&Aサイトに投稿された質問の中から不満を含む質問を選択し、その質問に紐付く回答をユーザに提示する。
 特許文献2の比較評価検出装置は、複数の対象を比較し、それらに認められる異同や優劣について述べた比較評価を表明する文字列から構成された比較評価表明箇所を検出する。
 特許文献2の比較評価検出装置は、予め、比較評価表明箇所を抽出するパターンを格納しておく。次に、テキストを取得し、特定の単位の文字列に区切り、その文字列毎に形態素解析を行い、形態素解析結果を取得する。そして、前記形態素解析結果と前記抽出パターンを照合する。そして、前記対象を示す文字列、該対象を相対的に評価する際の比較対象を示す文字列、該対象を評価する際に着目している属性を示す文字列、該対象に関する評価の程度を示す文字列、該対象に関する評価を示す文字列、のいずれかを含む組み合わせを比較評価表明箇所として検出する。
 特許文献3の極性推定システムは、評判情報の評価極性を推定するものである。これを利用すれば、評価極性の大きさにより、どちらの製品が評価されているかを推定できる。
 特許文献3の、極性が既知である評判情報に基づいて、属性表現における良いイメージ又は悪いイメージ等の表現の使われ方や否定度合いを加味して、評価極性を推定でき、評価極性が未知である評価表現に対して極性を推定することができる。すなわち、今までに蓄積された評判情報に基づいて、対象物や属性表現、評価表現の極性度の偏りを加味して評価極性を推定することができる。そして、対象に対する評価極性の大きさの統計的平均を、その対象の評価値として求め、評価値の大きい対象をユーザに評価されている対象とする。
特開2010‐204865号公報 特開2008‐209978号公報 国際公開第2008/075524号 金山 博,那須川哲哉、要望の対象の同定、言語処理学会第14回年次大会、Mar. 2008
 上記従来技術には、以下のような課題があった。
 特許文献1の情報処理装置は、商品の効果の説明をする文から改善動作を表す語を基に不満を抽出しており、商品を開発した企業が狙った効果に対する不満を抽出することはできるが、ブログやインターネット掲示板などの購入者や使用者の視点に基づいて書かれた文書から評価対象製品の改善に有用な不満を抽出することは難しかった。
 例えば、ある携帯電話に対して、購入者や使用者が「同じメーカが作っているけど、携帯電話Aではゲームがプレイできるのに、携帯電話Bではゲームがプレイできない」という不満をブログやインターネット掲示板などに書いたとしても、携帯電話に対して「ゲームのプレイが可能です」などの説明が商品の効果として書かれていない場合、購入者や使用者が書いた評価対象製品の改善に有用な不満を抽出することはできない。
 特許文献2の比較評価検出装置は、「液晶テレビの画質はブラウン管の画質よりとても良い。」など、ある評価軸の中で複数の対象間を相対的に比較する場合には有効だが、絶対評価が難しかった。すなわち、特許文献2の比較評価検出装置は、「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」といった文も検出する。「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」の表現には、言外に、「使用者は、携帯電話Cの操作性も携帯電話Dの操作性も満足できる基準を超えていないと考えている。」との前提が含まれている。
 一方、「B社製スマートフォンの液晶画面は綺麗だが、A社製スマートフォンは汚い。」との表現には、「使用者は、B社製スマートフォンの液晶画面については基準を超えていると考えているが、A社製スマートフォンの液晶画面については基準を超えていないと考えている。」との使用者の基準に基づく絶対評価が含まれている。
 しかし、「携帯電話Dの操作性は、携帯電話Cよりはまだ良い。」といった相対評価では、使用者が満足できる基準が判らないため、製品開発者はどの程度改善すればよいのか判断できない。
 特許文献3の極性推定システムは、評価対象と比較対象を比較して評価しない場合でも、評判情報を抽出する。たとえば、使用者が携帯電話Eより携帯電話Fが優れていると思っていたとしても、比較評価する必要がない場合は、購入者や使用者は「携帯電話Eはいい。」といった評価を書く。これではどちらの携帯電話の方が優れているということがわからない。このような評価が混じると、評判情報を収集し評価表現の大きさの統計的平均を求めたとしても、その結果は大きな誤差を含んだものになってしまう。
 本発明は上記課題を解決するものであり、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することのできる不満抽出装置,方法およびプログラムを提供することを目的とする。
 上記課題を解決する本発明は、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部とを備えることを特徴とする不満抽出装置である。
 上記課題を解決する本発明は、不満抽出装置が、文字列で表される評価対象を入力し、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出することを特徴とする不満抽出方法である。
 上記課題を解決する本発明は、文字列で表される評価対象を入力する評価対象入力処理と、文の集合から、前記評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理とを不満抽出装置に実行させることを特徴とする不満抽出プログラムである。
 本発明によれば、ブログやインターネット掲示板のような、評価対象製品の使用者によって書かれた文書の中から、評価対象製品の改善に有用な不満を抽出することができる。製品開発者は、抽出した不満を製品開発に直ちにフィードバックすることができる。
不満抽出装置の機能ブロック図(第1実施形態) 極性辞書の構造 不満抽出装置の処置内容を示すフローチャート 不満抽出装置の機能ブロック図(変形例) 不満抽出装置の処置内容を示すフローチャート(第2実施形態) 不満抽出装置の処置内容を示すフローチャート 上位下位関係辞書の構造 不満抽出装置の機能ブロック図(変形例)
 <第1実施形態>
 ~構成~
 第1実施形態の構成について説明する。図1は、第1実施形態に係る不満抽出装置の機能ブロック図である。不満抽出装置は、文の集合を取得して格納する文集合取得部101と、改善する製品である評価対象を文字列として入力する評価対象入力部102と、評価対象に対応する比較対象を入力する比較対象入力部103と、文の集合から、評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部104と、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部105と、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部106と、抽出された不満文を格納する不満記憶部107を備えている。
 文集合取得部101は、対象製品の購入者や使用者によって書かれた、ブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する。
 評価対象入力部102は、キーボードなどにより入力された文字列を評価対象として入力する。本実施形態では、一例として「A社製スマートフォン」を評価対象とする。
 比較対象入力部103は、キーボードなどにより入力された文字列を比較対象として入力する。本実施形態では、たとえば、「B社製スマートフォン」や「C社製スマートフォン」を比較対象とする。
 不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象に係る評価表現および比較対象に係る評価表現を検索する。評価表現か否かを、評価表現辞書108を参照して、判定する。評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
 たとえば、以下の(a)~(j)の各文を含む文の集合を想定する。評価対象に係る評価表現および比較対象に係る評価表現を〔 〕で示す。
(a)B社製スマートフォンの場合、電子マネー機能を〔使うことができる〕が、A社製スマートフォンでは電子マネー機能を使うことが〔できない〕。
(b)B社製スマートフォンのようにFM送信機能を〔利用できる〕のだが、A社製スマートフォンではFM送信機能を〔利用できない〕。
(c)A社製スマートフォンは〔汚い〕が、B社製スマートフォンは画面が〔綺麗〕。
(d)A社製スマートフォンの画面は〔良い〕。B社製スマートフォンの画面は〔文句のつけようがない〕。
(e)C社製スマートフォンの画面は〔良い〕。A社製スマートフォンの画面は〔文句のつけようがない〕。
(f)A社製スマートフォンの画面も〔いい〕。C社製スマートフォンの画面も〔いい〕な。
(g)C社製スマートフォンの画面は〔イマイチ〕だけど、A社製スマートフォンの画面は〔酷過ぎる〕。
(h)A社製スマートフォンは2日目に正常に〔充電できなく〕なり、赤いランプが点滅状態になった。
(i)A社製スマートフォンで、画面の自動リフレッシュができるようになったらいいのになぁ。
(j)携帯電話は折りたたみ式があるのに、スマートフォンではできない。
 すなわち、不満文候補抽出部104は、(a)~(g)の各文を不満文候補として抽出する。
 なお、(h)(i)においては、比較対象と比較対象に係る評価表現がないため、(j)においては、更に評価対象と評価対象に係る評価表現もないため、候補から除外される。
 極性判定部105は、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する。評価極性とは、評価表現が肯定表現であるか否定表現かの特性である。評価表現の極性を、極性辞書109を参照して、判定する。
 図2は、極性辞書109の構造を示す図である。「[サ変動詞]できる」などは、「利用できる」などの「利用(サ変動詞)」+「できる」のパターンを表している。極性を-1~1の実数とし、1に近いほど肯定的であり、-1に近いほど否定的であるものとする。極性=0は中立評価を示す。すなわち-1≦極性<0は否定評価を示し、0<極性≦1には肯定評価を示す。上記候補(a)~(g)に含まれる評価表現の極性を判定する。
(a)〔使うことができる〕=0.6,〔できない〕=-1.0
(b)〔利用できる〕=0.6,〔利用できない〕=-1.0
(c)〔汚い〕=-0.9,〔綺麗〕=0.9
(d)〔良い〕=0.5,〔文句のつけようがない〕=1.0
(e)〔良い〕=0.5,〔文句のつけようがない〕=1.0
(f)〔いい〕=0.5,〔いい〕=0.5
(g)〔イマイチ〕=-0.3,〔酷過ぎる〕=-1.0
 不満文抽出部106は、比較対象に係る評価表現が肯定評価表現又は中立評価表現である場合(Pc≧0)、評価対象に係る評価表現の極性の程度を示す値Ptと比較対象に係る評価表現の極性の程度の値Pcとの差(Pc-Pt)を求める。
(a)Pc-Pt=0.6-(-1.0)=1.6
(b)Pc-Pt=0.6-(-1.0)=1.6
(c)Pc-Pt=0.9-(-0.9)=1.8
(d)Pc-Pt=1.0-0.5=0.5
(e)Pc-Pt=0.5-1.0=-0.5
(f)Pc-Pt=0.5-0.5=0・0
 なお、(g)においては、比較対象「C社製スマートフォン」に係る評価表現〔イマイチ〕が否定評価(=-0.3<0.0)であるため、除外される。これは、A社製スマートフォンの画面をC社製スマートフォンの画面と同等の品質になる改善したとしても、使用者は〔イマイチ〕と感じ、満足しないためである。
 極性差(Pc-Pt)は、使用者の改善への期待を表す指標である。この指標値が大きくなれば、改善の効果が大きくなる。閾値は、明確な優劣差を示せる値である。
 不満文抽出部106は、極性差(Pc-Pt)が所定の閾値(例えば0.4)以上となる(a)~(d)の各文が不満文であると判定する。
 なお、(e)においては、極性差(Pc-Pt)は負数となっている。これは、評価対象が比較対象より優れていることを意味し、改善点はない。また、(f)においては、極性差(Pc-Pt)は閾値未満となっており、評価対象と比較対象との間に優劣差はなく、改善点はない。
 不満記憶部107は、不満文(a),(b),(c),(d)を格納する。
 製品の開発者は、不満記憶部107にアクセスし、不満を参照することによって、製品改善に直ちにフィードバックする。
 ~動作~
 図3は、不満抽出装置の処置内容を示すフローチャートである。フローチャートを用いて、不満抽出装置の動作を説明する。
 まず、対象製品の購入者や使用者によって書かれた、ブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する(ステップ1)。たとえば、上記の(a)~(j)の各文を含む文の集合を取得する。
 一方、キーボードなどにより入力された文字列を評価対象として入力する(ステップ2)。たとえば、評価対象として「A社製スマートフォン」を入力する。また、キーボードなどにより入力された文字列を比較対象として入力する(ステップ3)。たとえば、比較対象として「B社製スマートフォン」,「C社製スマートフォン」を入力する。
 文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する(ステップ4)。たとえば、(a)~(g)の各文を不満文候補として抽出する。
 次いで、評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する(ステップ5)。評価表現の極性は極性辞書109を参照する。
 そして、比較対象「B社製スマートフォン」,「C社製スマートフォン」に係る評価表現が肯定評価表現又は中立評価表現であり、評価対象「A社製スマートフォン」に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差が所定の閾値以上である、不満文候補(a)~(d)の各文が不満文であると判定し、不満文を抽出し(ステップ6)、格納する(ステップ7)。
 これらの処理は、不満抽出装置のプログラムにより実行される。
 ~効果~
 本実施形態の不満抽出装置により、優れた評価の比較対象と劣った評価の評価対象が対比表現で記載された不満文を抽出できる。たとえば、上記(a)~(c)の各文のような不満文には、「使用者は、比較対象については基準を超えていると考えているが、評価対象については基準を超えていないと考えている」との絶対評価が黙示的に記載されている。
 すなわち、製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者の満足する基準を超える改善をすることができる。たとえば、A社製スマートフォンに電子マネー機能,FM送信機能,音楽ファイル再生機能を付加し、画面の画質を改善すればよい。当該機能は比較対象であるB社製スマートフォンにおいて既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
 また、本実施形態の不満抽出装置は、潜在的な不満が記載されている不満文も抽出できる。たとえば、上記(d)の各文のような不満文では、使用者は、評価対象であるA社製スマートフォンに直接的な不満を感じておらず基準は超えているが、比較対象であるB社製スマートフォンの方が優れていると感じており、A社製スマートフォンの画面をB社製スマートフォンと同等の品質になる改善をすれば、使用者はより満足する。当該機能は比較対象であるB社製スマートフォンにおいて既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
 このように、製品開発者は、使用者の不満を製品改善および新製品開発に直ちにフィードバックすることができる。
 ~変形例~
 本実施形態では、不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象に係る評価表現および比較対象に係る評価表現を検索する。評価表現か否かを、評価表現辞書108を参照して、判定する。評価対象と評価対象に係る評価表現および比較対象と比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
 変形例としてさらに、評価対象と比較対象の間から逆接表現を検出してもよい。図4は、変形例に係る不満抽出装置の機能ブロック図である。
 不満文候補抽出部104は、文集合取得部101に格納された文の集合から、評価対象と比較対象の間から逆接表現を検出する。逆接表現か否かを、逆接表現辞書110を参照して、判定する。評価対象と評価対象に係る評価表現、比較対象と比較対象に係る評価表現、および逆接表現を含む1つの文または連続する2つの文を不満文候補として抽出する。
 上記(a)~(j)の各文において、逆接表現を《 》で示す。
(a)B社製スマートフォンの場合、電子マネー機能を〔使うことができる〕《が》、A社製スマートフォンでは電子マネー機能を使うことが〔できない〕。
(b)B社製スマートフォンのようにFM送信機能を〔利用できる〕の《だが》、A社製スマートフォンではFM送信機能を〔利用できない〕。
(c)A社製スマートフォンは〔汚い〕《が》、B社製スマートフォンは画面が〔綺麗〕。
(d)A社製スマートフォンの画面は〔良い〕。B社製スマートフォンの画面は〔文句のつけようがない〕。
(e)C社製スマートフォンの画面は〔良い〕。A社製スマートフォンの画面は〔文句のつけようがない〕。
(f)A社製スマートフォンの画面も〔いい〕。C社製スマートフォンの画面も〔いい〕な。
(g)C社製スマートフォンの画面は〔イマイチ〕《だけど》、A社製スマートフォンの画面は〔酷過ぎる〕。
(h)A社製スマートフォンは2日目に正常に〔充電できなく〕なり、赤いランプが点滅状態になった。
(i)A社製スマートフォンで、画面の自動リフレッシュができるようになったらいいのになぁ。
(j)携帯電話は折りたたみ式がある《のに》、スマートフォンではできない。
 すなわち、不満文候補抽出部104は、(a)~(c),(g)の各文を不満文候補として抽出する。その他の構成及び動作は本実施形態と同様である。
 これにより、精度よく不満文候補を抽出することができる。その結果、不満文を精度よく抽出できる。
 他の変形例について説明する。
 本実施形態では、上記(g)のような分を除外するため、不満文抽出部106は、比較対象に係る評価表現が肯定評価表現又は中立評価表現である場合(Pc≧0)のみ、作動する。A社製スマートフォンの画面をC社製スマートフォンの画面と同等の品質になる改善したとしても、使用者は〔イマイチ〕と感じ、満足しないためである。本実施形態ではこのような不満は有用でないとしているが、場合によっては有用となることもあり得る。その場合は、不満文抽出部106は、(Pc≧0)の条件を解除して、作動する。
 本実施形態では、明確な優劣差を抽出するため、不満文抽出部106は、極性差(Pc-Pt)が閾値以上の不満文候補について不満文であると判定している。しかし、極性辞書109をより正確にすることにより、精度よく優劣差を抽出できれば、極性差(Pc-Pt)>0の不満文候補について不満文であると判定してもよい。
 <第2実施形態>
 図5は、第2実施形態に係る不満抽出装置の機能ブロック図であり、図6は、第2実施形態に係る不満抽出装置の処置内容を示すフローチャートである。
 第1実施形態においては、比較対象入力部103が、キーボードなどにより入力された文字列を比較対象として入力する(ステップ3)が、第2実施形態においては、比較対象特定部111が上位下位関係辞書112を参照して評価対象に対応する比較対象を特定している(ステップ8)。
 図7は、上位下位関係辞書112の構造を示す図である。「電話」の下位語として「スマートフォン」,「携帯電話」,「固定電話」が存在する。「スマートフォン」の下位語として「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」などが存在する。逆に、「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」の上位語として、「スマートフォン」が存在し、「スマートフォン」の上位語として、「電話」が存在するということもできる。
 上位下位関係を構築するには、高度言語情報融合フォーラムで配布している上位下位関係抽出ツールなどを利用することができる。
 「A社製スマートフォン」,「B社製スマートフォン」,「C社製スマートフォン」は、上位語「スマートフォン」を同じくする同種語である。
 比較対象特定部111は、評価対象の上位語を特定し、この上位語の下位語を比較対象と特定する。たとえば、評価対象「A社製スマートフォン」の上位語として、「スマートフォン」を特定し、「スマートフォン」の下位語である「B社製スマートフォン」,「C社製スマートフォン」を比較対象として特定する。そして、評価対象を表す語からN形態素以内に比較対象を表す語が出現するか否かを確認し、比較対象を抽出する。ここで、Nは共起する範囲を表し、Nは任意の値とする(例えば、N=100と設定)。
 比較対象特定部111により、比較対象を入力する手間を省くことができる。さらに、比較対象特定部111は、比較対象が評価対象の近傍に出現することを要求するため、不満文候補をより精度よく抽出することができる。
 ~変形例~
 図8は、第2実施形態の変形例に係る不満抽出装置の機能ブロック図である。
 変形例において、第2実施形態における文集合取得部101が文集合取得部113となり、評価対象入力部102がない。
 文集合取得部113は、対象製品の購入者や使用者によって書かれた、評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどから、文の集合を取得し、格納する。
 比較対象特定部111は、上位下位関係辞書112を参照して評価対象に対応する比較対象を特定する。たとえば、「B社製スマートフォン」や「C社製スマートフォン」を比較対象とする。
 その他の構成及び動作は第2実施形態と同様である。
 評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどでは、評価対象に関する話題であることが前提であり、評価対象が省略されていることも多い。変形例において、文集合取得部116は、評価対象「A社製スマートフォン」に関するブログやインターネット掲示板や口コミサイトなどから、文の集合を取得することで、評価対象の記載が省略されていると推測することができる。
 また、文集合取得部113により、評価対象を入力する手間を省くことができる。
 <付記>
 上記実施形態の一部または全部は、以下の様に付記のようにも記載されうるが、以下に限定されない。
 本発明は、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部とを備えることを特徴とする不満抽出装置である。
 このように構成された不満抽出装置により、優れているとの評価の比較対象と劣っているとの評価の評価対象が対比表現で記載された不満文を抽出できる。不満文には、「使用者は、比較対象については基準を超えていると考えているが、評価対象については基準を超えていないと考えている」との絶対評価が黙示的に記載されている。
 すなわち、製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者の満足する基準を超える改善をすることができる。当該機能は比較対象である比較対象において既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
 また、本発明の不満抽出装置は、潜在的な不満が記載されている不満文も抽出できる。すなわち、使用者は、評価対象に直接的な不満を感じておらず基準は超えているが、比較対象の方が優れていると感じている場合、潜在的な不満となる。製品開発者は、比較対象で評価された諸機能を評価対象に付加すれば、使用者はより満足する。当該機能は比較対象である比較対象において既に実現しており、評価対象に当該機能を追加することに技術的な課題はほとんどない。
 このように、製品開発者は、使用者の不満を製品改善および新製品開発に直ちにフィードバックすることができる。
 本発明の不満抽出装置において、さらに好ましくは、前記不満文抽出部は、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
 これにより、比較対象と評価対象との間に明確な優劣差がある不満文を、より精度よく抽出できる。
 本発明の不満抽出装置において、さらに好ましくは、前記不満文抽出部は、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
 比較対象が基準を超えていない場合、比較対象で評価された諸機能を評価対象に付加する改善をしても、使用者は満足しない。このような評価対象製品の改善に有用でない不満を除外することができる。
 本発明の不満抽出装置において、さらに好ましくは、前記不満文候補抽出部は、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
 本発明の不満抽出装置において、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定部を更に備える。
 本発明は、不満抽出装置が、文字列で表される評価対象を入力し、文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出することを特徴とする不満抽出方法である。
 本発明の不満抽出方法において、さらに好ましくは、前記不満文を抽出するステップでは、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
 本発明の不満抽出方法において、さらに好ましくは、前記不満文を抽出するステップでは、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
 本発明の不満抽出方法において、さらに好ましくは、前記不満文候補を抽出するステップでは、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
 本発明の不満抽出方法において、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する。
 本発明は、文字列で表される評価対象を入力する評価対象入力処理と、文の集合から、前記評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理とを不満抽出装置に実行させることを特徴とする不満抽出プログラムである。
 本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文抽出処理では、前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する。
 本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文抽出処理では、更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する。
 本発明の不満抽出プログラムにおいて、さらに好ましくは、前記不満文候補抽出処理では、更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する。
 本発明の不満抽出プログラムにおいて、さらに好ましくは、前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定処理を更に不満抽出装置に実行させる。
 この出願は、2012年2月28日に出願された日本出願特願2012-041395を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 101 文集合取得部
 102 評価対象入力部
 103 比較対象入力部
 104 不満文候補抽出部
 105 極性判定部
 106 不満文抽出部
 107 不満記憶部
 108 評価表現辞書
 109 極性辞書
 110 逆接表現辞書(変形例)
 111 比較対象特定部(第2実施形態)
 112 上位下位関係辞書(第2実施形態)
 113 文集合取得部(変形例)
 

Claims (7)

  1.  文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出部と、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定部と、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出部と
     を備えることを特徴とする不満抽出装置。
  2.  請求項1記載の不満抽出装置において、
     前記不満文抽出部は、
     前記評価対象に係る評価表現の極性の程度を示す値と比較対象に係る評価表現の極性の程度の値との差を求め、
     前記極性値の差が所定の閾値以上であれば、前記不満文候補が不満文であると判定する
     ことを特徴とする不満抽出装置。
  3.  請求項1~2記載の不満抽出装置において、
     前記不満文抽出部は、
     更に、前記比較対象に係る評価表現が肯定評価表現又は中立評価表現であれば、前記不満文候補が不満文であると判定する
     ことを特徴とする不満抽出装置。
  4.  請求項1~3記載の不満抽出装置において、
     前記不満文候補抽出部は、
     更に、前記評価対象と前記比較対象の間に逆接表現を含む文を不満文候補として抽出する
     ことを特徴とする不満抽出装置。
  5.  請求項1~4記載の不満抽出装置において、
     前記評価対象の上位語を特定し、該上位語の下位語を前記比較対象と特定する比較対象特定部
     を更に備えることを特徴とする不満抽出装置。
  6.  不満抽出装置が、
     文字列で表される評価対象を入力し、
     文の集合から、評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出し、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定し、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する
     ことを特徴とする不満抽出方法。
  7.  文字列で表される評価対象を入力する評価対象入力処理と、
     文の集合から、前記評価対象と、該評価対象に係る評価表現および、該評価対象とは異なる比較対象と、該比較対象に係る評価表現を含む1つの文または連続する2つの文を不満文候補として抽出する不満文候補抽出処理と、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度を判定する極性判定処理と、
     前記評価対象に係る評価表現および比較対象に係る評価表現の極性の程度の差に基づいて、前記不満文候補が不満文であるか否かを判定し、不満文を抽出する不満文抽出処理と
     を不満抽出装置に実行させることを特徴とする不満抽出プログラム。
PCT/JP2013/054761 2012-02-28 2013-02-25 不満抽出装置,不満抽出方法および不満抽出プログラム WO2013129311A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014502205A JP6048691B2 (ja) 2012-02-28 2013-02-25 不満抽出装置,不満抽出方法および不満抽出プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012041395 2012-02-28
JP2012-041395 2012-02-28

Publications (1)

Publication Number Publication Date
WO2013129311A1 true WO2013129311A1 (ja) 2013-09-06

Family

ID=49082509

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/054761 WO2013129311A1 (ja) 2012-02-28 2013-02-25 不満抽出装置,不満抽出方法および不満抽出プログラム

Country Status (2)

Country Link
JP (1) JP6048691B2 (ja)
WO (1) WO2013129311A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015165359A (ja) * 2014-03-03 2015-09-17 富士ゼロックス株式会社 競合判定プログラム及び情報処理装置
JP2015230594A (ja) * 2014-06-05 2015-12-21 株式会社日立製作所 意見活用支援装置、及び意見活用支援方法
JP2020160159A (ja) * 2019-03-25 2020-10-01 Tis株式会社 採点装置、採点方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209978A (ja) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> 比較評価検出装置,比較評価検出方法,その方法を実装した比較評価検出プログラム及びそのプログラムを記録した記録媒体
JP2010204864A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満解決商品発見方法及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209978A (ja) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> 比較評価検出装置,比較評価検出方法,その方法を実装した比較評価検出プログラム及びそのプログラムを記録した記録媒体
JP2010204864A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満解決商品発見方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAKOTO OKADA ET AL.: "An Method to Extract Comparative Relations from Texts of Reviews", THE INSTITUTE OF ELECTRICAL ENGINEERS OF JAPAN KENKYUKAI SHIRYO (JOHO SYSTEM KENKYUKAI), 19 May 2011 (2011-05-19), pages 83 - 86 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015165359A (ja) * 2014-03-03 2015-09-17 富士ゼロックス株式会社 競合判定プログラム及び情報処理装置
JP2015230594A (ja) * 2014-06-05 2015-12-21 株式会社日立製作所 意見活用支援装置、及び意見活用支援方法
JP2020160159A (ja) * 2019-03-25 2020-10-01 Tis株式会社 採点装置、採点方法およびプログラム
JP7257835B2 (ja) 2019-03-25 2023-04-14 Tis株式会社 採点装置、採点方法およびプログラム

Also Published As

Publication number Publication date
JP6048691B2 (ja) 2016-12-21
JPWO2013129311A1 (ja) 2015-07-30

Similar Documents

Publication Publication Date Title
US10546005B2 (en) Perspective data analysis and management
US9582486B2 (en) Apparatus and method for classifying and analyzing documents including text
TWI643076B (zh) 金融非結構化文本分析系統及其方法
US20190146984A1 (en) Prioritizing survey text responses
CN104933081A (zh) 一种搜索建议提供方法及装置
CN110287405B (zh) 情感分析的方法、装置和存储介质
JP6230725B2 (ja) 因果関係分析装置、及び因果関係分析方法
US20120141968A1 (en) Evaluation Assistant for Online Discussion
Tumitan et al. Tracking Sentiment Evolution on User-Generated Content: A Case Study on the Brazilian Political Scene.
Paperno et al. When the whole is less than the sum of its parts: How composition affects pmi values in distributional semantic vectors
US20200175024A1 (en) Identifying and scoring data values
JP6048691B2 (ja) 不満抽出装置,不満抽出方法および不満抽出プログラム
US10055478B2 (en) Perspective data analysis and management
KR20150054355A (ko) 감정 사전 구축 장치 및 감정 사전 구축 방법
KR101542417B1 (ko) 사용자 선호도 학습 방법 및 장치
CN112307726A (zh) 因果去偏差模型指导的法院观点自动生成方法
Su'a et al. Quickreview: a novel data-driven mobile user interface for reporting problematic app features
CN113515932B (zh) 处理问答信息的方法、装置、设备和存储介质
JP5884977B2 (ja) 不満抽出装置,不満抽出方法および不満抽出プログラム
CN114297380A (zh) 一种数据处理方法、装置、设备及存储介质
CN113392218A (zh) 文本质量评估模型的训练方法和确定文本质量的方法
Goyal et al. Central bank communications and professional forecasts: Evidence from India
JP2019194793A (ja) 情報処理装置およびプログラム
CN112445892B (zh) 确定品牌提及率的方法、装置、电子设备及存储介质
KR102476662B1 (ko) 다수의 사용자의 코멘트를 공유하는 방법 및 디바이스

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13755860

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014502205

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13755860

Country of ref document: EP

Kind code of ref document: A1