CN105589901A - 电子商务口碑分析系统和其方法 - Google Patents
电子商务口碑分析系统和其方法 Download PDFInfo
- Publication number
- CN105589901A CN105589901A CN201410695675.2A CN201410695675A CN105589901A CN 105589901 A CN105589901 A CN 105589901A CN 201410695675 A CN201410695675 A CN 201410695675A CN 105589901 A CN105589901 A CN 105589901A
- Authority
- CN
- China
- Prior art keywords
- perception
- keyword
- group
- vocabulary
- public praise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title abstract description 6
- 238000011156 evaluation Methods 0.000 claims abstract description 30
- 230000008447 perception Effects 0.000 claims description 221
- 238000013519 translation Methods 0.000 claims description 39
- 230000000694 effects Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract 1
- 238000000605 extraction Methods 0.000 abstract 1
- 241001269238 Data Species 0.000 description 4
- 239000004575 stone Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
Abstract
本发明揭露一种电子商务口碑分析系统和其方法。电子商务口碑分析系统包含评论数据撷取模块、关键字撷取模块、观感分析模块和口碑分析模块。评论数据撷取模块根据分析项目在电子商务平台撷取评论数据。关键字撷取模块从评论数据中撷取多个关键字。观感分析模块将每一关键字与观感群组进行比对。当观感群组的特征词汇中具有第一特征词汇与关键字中的第一关键字相符时,观感分析模块判断具有第一特征词汇的观感群组为对应第一关键字的观感群组,并增加对应第一关键字的观感群组的评价数。口碑分析模块选择观点群组中对应分析项目的第一观感群组,并统计第一观感群组的评价数。
Description
技术领域
本发明是关于一种电子商务口碑分析系统和其方法,且特别是有关于一种依据评价数据进行口碑分析的电子商务口碑分析系统和其方法。
背景技术
近年来,由于网络科技的发达,电子商务平台(例如:淘宝网、或是PChome线上购物等等)的崛起提供消费者一种新的消费形态。由于只要透过网络连线,消费者便可从众多电子商务平台中寻找想要的商品,使得购物更加便利。因此,越来越多消费者偏好透过这种消费形态进行购物。
虽然电子商务平台提供一种便利的消费模式,然而,随着电子商务平台的规模越大,要获得关于电子商务平台的整体口碑分析,以及对特定商品或特定活动进行口碑分析也就越不容易。由于卖家或商品的数量太多,许多消费者会对所购买的商品自由发言或进行评价,而这些评价数据并非系统化的产生也无特定的格式,因此很难对这些评价数据进行统计或分析以产生对特定商品或特定活动的口碑分析,导致在电子商务平台的卖家商场亦无法掌握贩卖商品在整个电子商务平台的口碑以及作出对应的措施。
因此,如何提供一种对于电子商务平台的口碑有效的分析,乃为此一业界亟待解决的问题。
发明内容
本发明的一方面在于提供一种电子商务口碑分析系统。电子商务口碑分析系统包含评论数据撷取模块、关键字撷取模块、观感分析模块和口碑分析模块。评论数据撷取模块用以根据分析项目在电子商务平台撷取评论数据。关键字撷取模块用以从评论数据中撷取多个关键字。观感分析模块包含多个观感群组。所述观感群组中的每一个观感群组分别包含多个特征词汇。观感分析模块用以将所述关键字中的每一关键字与观感群组进行比对。当所述观感群组的特征词汇中具有第一特征词汇与关键字中的第一关键字相符时,观感分析模块判断具有第一特征词汇的观感群组为对应第一关键字的观感群组,并增加对应第一关键字的观感群组的评价数。口碑分析模块用以选择所述观点群组中对应分析项目的多个第一观感群组,并统计所述第一观感群组的评价数。
根据本发明的一实施例,当所述观感群组的所述特征词汇中不具有所述第一特征词汇与关键字中的第一关键字相符时,所述观感分析模块将所述第一关键字进行翻译以产生不同于所述第一关键字的语言的对应翻译词汇,并将对应翻译词汇与所述每一观感群组的所述特征词汇进行相似度比对以产生比对结果。当所述观感分析模块根据比对结果判断有所述对应所述第一关键字的观感群组存在时,所述观感分析模块增加对应所述第一关键字的观感群组的评价数。
根据本发明的一实施例,所述观感分析模块透过一位元断词(unigram)和二位元断词(bigram)的方式对所述对应翻译词汇与所述每一观感群组的所述特征词汇进行所述相似度比对。
根据本发明的一实施例,当所述观感分析模块根据所述比对结果判断有所述对应所述第一关键字的观感群组存在时,所述观感分析模块还将所述第一关键字设定为第二特征词汇,并将第二特征词汇加入至所述对应所述第一关键字的观感群组以更新所述对应所述第一关键字的观感群组包含的特征词汇。
根据本发明的一实施例,所述观感分析模块包含特征词库。特征词库用以储存所述每一观感群组中的所述特征词汇。当所述观感分析模块根据所述比对结果判断有所述对应所述第一关键字的观感群组存在时,所述观感分析模块将所述第一关键字储存设定为第二特征词汇,并将第二特征词汇储存至特征词库中。
根据本发明的一实施例,所述关键字撷取模块包含断词单元、词性辨识单元和词句撷取单元。断词单元用以对所述评论数据的内容进行断词演算法以得到多个词句。词性辨识单元用以辨识所述词句的词性。词句撷取单元用以撷取所述词句中具有名词和形容词的词句作为多个候选关键字,并从所述候选关键字中撷取所述关键字。
根据本发明的一实施例,所述词句撷取单元根据所述候选关键字出现的的频率和所述候选关键字与所述分析项目的关联性从所述候选关键字中撷取所述关键字。
根据本发明的一实施例,所述分析项目为该电子商务平台的商品、卖家或活动。
本发明的另一方面在于提供一种电子商务口碑分析方法。所述电子商务口碑分析方法包含:根据分析项目在电子商务平台撷取评论数据;从评论数据中撷取多个关键字;将所述关键字中的每一关键字与多个观感群组进行比对,其中所述观感群组中的每一观感群组分别包含多个特征词汇;当所述观感群组的特征词汇中具有第一特征词汇与关键字中的第一关键字相符时,判断具有第一特征词汇的观感群组为对应第一关键字的观感群组;增加对应第一关键字的观感群组的评价数;选择观感群组中对应分析项目的多个第一观感群组;及统计所述第一观感群组的评价数。
根据本发明的一实施例,所述电子商务口碑分析方法还包含:当所述观感群组的特征词汇中不具有第一特征词汇与关键字中的第一关键字相符时,将所述第一关键字进行翻译以产生不同于所述第一关键字的语言的对应翻译词汇;将对应翻译词汇与所述每一观感群组的所述特征词汇进行相似度比对以产生比对结果;及当根据比对结果判断有所述对应所述第一关键字的观感群组存在时,增加所述对应所述第一关键字的观感群组的评价数。
根据本发明的一实施例,将所述对应翻译词汇与所述每一观感群组的所述特征词汇进行所述相似度比对的步骤包含:透过一位元断词和二位元断词的方式对所述对应翻译词汇与所述每一观感群组的所述特征词汇进行所述相似度比对。
根据本发明的一实施例,当根据所述比对结果判断有所述对应所述第一关键字的观感群组存在时还包含:将所述第一关键字设定为第二特征词汇;及将第二特征词汇加入至所述对应所述第一关键字的观感群组以更新所述对应所述第一关键字的观感群组包含的特征词汇。
根据本发明的一实施例,当根据所述比对结果判断有所述对应所述第一关键字的观感群组存在时还包含:将所述第一关键字设定为第二特征词汇;及将第二特征词汇储存至特征词库中,其中特征词库用以储存每一观感群组中的所述特征词汇。
根据本发明的一实施例,从所述评论数据中撷取所述关键字的步骤包含:对所述评论数据的内容进行断词演算法以得到多个词句;辨识所述词句的词性;撷取所述词句中具有名词和形容词的词句作为多个候选关键字;及从所述候选关键字中撷取所述关键字。
根据本发明的一实施例,从所述候选关键字中撷取所述关键字的步骤包含:根据所述候选关键字出现的的频率和所述候选关键字与所述分析项目的关联性从所述候选关键字中撷取所述关键字。
根据本发明的一实施例,所述分析项目为所述电子商务平台的商品、卖家或活动。
附图说明
为让本发明的上述和其他目的、特征、优点与实施例能更明显易懂,所附附图的说明如下:
图1是根据本发明一实施例绘示的一种电子商务口碑分析系统的方块图;及
图2是根据本发明一实施例绘示的一种电子商务口碑分析方法的流程图。
具体实施方式
下文是举实施例配合所附附图作详细说明,但所提供的实施例并非用以限制本发明所涵盖的范围,而结构操作的描述非用以限制其执行的顺序,任何由元件重新组合的结构,所产生具有均等功效的装置,皆为本发明所涵盖的范围。此外,附图仅以说明为目的,并未依照原尺寸作图。为使便于理解,下述说明中相同元件将以相同的符号标示来说明。
关于本文中所使用的『第一』、『第二』、…等,并非特别指称次序或顺位的意思,亦非用以限定本发明,其仅仅是为了区别以相同技术用语描述的元件或操作而已。
请参照图1,图1是根据本发明一实施例绘示的一种电子商务口碑分析系统100的方块图。电子商务口碑分析系统100包含评论数据撷取模块110、关键字撷取模块120、观感分析模块130和口碑分析模块140。电子商务口碑分析系统100可应用于任何电子商务平台,例如:淘宝网、Yahoo奇摩拍卖或Pchome线上购物等电子消费平台。电子商务口碑分析系统100可根据使用者选定的分析项目对一特定电子商务平台进行评价数据的统计和分析。在一实施例中,分析项目可包含电子商务平台的商品、卖家或活动等等。
具体来说,使用者可透过电子商务口碑分析系统100在一特定电子商务平台(例如:淘宝网)中,对商品(例如:iphone6)、商场卖家或是活动(例如:情人节促销活动)的所有评价数据进行统计和分析,进而了解在所述电子商务平台中的商品、商场卖家或是活动的口碑是如何。举例来说,当使用者想了解淘宝网的某一卖家的整体口碑,可透过电子商务口碑分析系统100搜集所述卖家的所有评价数据,并进行比对、分析和统计,最后使用者可了解所述卖家的整体口碑是怎样,例如:所述卖家卖的商品的性价比(Cost/PerformanceRatio)高、服务态度普通、出货速度慢等口碑。
在本实施例中,评论数据撷取模块110用以根据分析项目在电子商务平台撷取评论数据。在一实施例中,评论数据撷取模块110可透过对电子商务平台进行全文搜寻以撷取对应分析项目的评论数据。关键字撷取模块120用以从评论数据中撷取多个关键字。
观感分析模块130包含观感群组131~133。为了方便说明,在本实施例中,观感群组的数量为3个,然本实施例并不以此为限;换言之,本领域的技术人员可根据实施需求增加或减少观感群组的数量。观感群组131~133中的每一个观感群组分别包含多个特征词汇。在本实施例中,观感群组131包含特征词汇131a~131c,观感群组132包含特征词汇132a~132b,观感群组133包含特征词汇133a~133c,然本实施例并不以此为限。
在一实施例中,观感群组131~133及其中的特征词汇131a~131c、132a~132b和133a~133c,可以由技术人员事先建立并予以储存,或是由电子商务口碑分析系统100依据先前已完成分析的其他案例中的观感群组及其特征词汇而建立/经由训练而得,或是由电子商务口碑分析系统100事先建立多个观感群组及其特征词汇后再提供给使用者来选取,本实施例并不以此为限。
另外,在一实施例中,电子商务口碑分析系统100还可在对观感群组中的特征词汇与从评价数据撷取的关键字进行比对后,将关键字新增为新的特征词汇中;或是将从评价数据撷取的关键字透过语言翻译后再新增为新的特征词汇,关于此部分于后面的实施例再详加说明。
观感分析模块130用以将关键字中的每一个关键字与观感群组131~133进行比对,亦即,与观感群组131~133中的特征词汇131a~131c、132a~132b和133a~133c进行比对。当观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c中具有第一特征词汇与关键字中的第一关键字相符时,观感分析模块判断具有第一特征词汇的观感群组为对应第一关键字的观感群组,并增加对应第一关键字的观感群组的评价数。
在本实施例中,观感群组131~133中的每一个观感群组为为电子商务口碑分析系统100于进行口碑分析时,分别对应到使用者观感的口碑分析结果。也就是说,电子商务口碑分析系统100可先预选多个观感群组,或是由使用者从原本的观感群组中预选多个观感群组,用以作为口碑分析结果。接着,观感分析模块130可将每一个评价数据的关键字(亦即,特征词句)和多个观感群组的特征词汇进行比对。若评价数据的特征词句和某一观感群组的特征词汇相似或有相同涵义时,观感分析模块130即可判断所述评价数据为对应到所述的观感群组,并且增加所述的观感群组的评价数。
举例来说,观感群组132可为对应卖家的物流服务口碑。特征词汇132a可为「出货迅速」的特征词句,特征词汇132b可为「退货速度快」的特征词句。当关键字撷取模块120从评论数据撷取的关键字包含「出货」和「迅速」等词句时,观感分析模块130可判断关键字「出货」和「迅速」与观感群组132中的特征词汇132a相符。接着,观感分析模块130即可判断具有特征词汇132a的观感群组132为对应关键字「出货」和「迅速」的观感群组,并且增加观感群组132的评价数,亦即,增加卖家的物流服务口碑的评价数。
在一实施例中,在电子商务口碑分析系统100或使用者预选的多个观感群组中,可能具有一些观感群组的评价数为零,而这些评价数为零的观感群组最后则不会出现在口碑分析结果中。
口碑分析模块140用以选择观感群组131~133中对应分析项目的多个第一观感群组,并统计第一观感群组的评价数。举例来说,若分析项目为对电子商务平台的某一卖家;换言之,若电子商务口碑分析系统100用以对电子商务平台的某一卖家进行口碑分析,则口碑分析模块140可针对卖家选取所有观感群组中(例如:观感群组131~133)对应卖家的口碑的观感群组(例如:观感群组132、133),并且分别统计观感群组132和133的评价数。需注意的是,为了方便说明,在此例中对应卖家的观感群组的数量为2个,然本领域的技术人员应可了解在实际情况下对应不同的分析项目(例如:商品、卖家或活动),其对应的观感群组的数量(亦即,对应其分析项目的口碑)应为好几个。
如此一来,使用者即可透过电子商务口碑系统100,了解针对某一电子商务平台的某一分析项目的口碑的评价数,并根据评价数来了解所述电子商务平台对于所述分析项目的消费或是贩售等分析结果。
在一实施例中,观感分析模块130还包含翻译单元134和特征词库135。翻译单元134可用以对具有第一语言的词句进行翻译以产生不同于第一语言的第二语言的词句。特征词库135用以储存观感群组131~133中的所有特征词汇131a~131c、132a~132b和133a~133c。
在一实施例中,当观感群组131~133的特征词汇131a~133c中不具有第一特征词汇与关键字中的第一关键字相符时,观感分析模块130可将第一关键字透过翻译单元134进行翻译,以产生不同于第一关键字的语言的对应翻译词汇。接着,观感分析模块130可将第一关键字的对应翻译词汇与观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c进行相似度比对以产生比对结果。
在一实施例中,观感群组131~133包含的特征词汇131a~131c、132a~132b和133a~133c可事先储存对应于多种语言的对应翻译词汇,以供观感分析模块130据以和第一关键字翻译成不同语言的对应翻译词汇进行相似度比对。
在另一实施例中,观感分析模块130可将第一关键字和观感群组131~133包含的特征词汇131a~131c、132a~132b和133a~133c皆透过翻译单元134进行翻译,再将对应第一关键字的对应翻译词汇与翻译后的特征词汇131a~131c、132a~132b和133a~133c进行相似度比对。
接着,观感分析模块130可根据将评价数据中的关键字和观感群组131~133进行比对的比对结果,判断是否有对应的第一关键字的观感群组存在。当观感分析模块130根据比对结果判断有对应第一关键字的观感群组存在时,观感分析模块130增加对应第一关键字的观感群组的评价数。
以上述例子来说,若关键字撷取模块120从评论数据撷取的第一关键字包含「出货」和「很快」等词句时,由于特征词汇132a为「出货迅速」的特征词句,观感分析模块130并无法判断关键字「很快」与「迅速」相符,因此观感分析模块130可先将「很快」透过翻译单元134进行翻译以产生不同于中文的语言(例如:英文)的对应翻译词汇(例如:fast)。在本实施例中,观感群组132包含的特征词汇132a还具有对应「迅速」的英文的词汇(例如:quick);或是观感分析模块130亦可将观感群组132包含的特征词汇「迅速」透过翻译单元134进行翻译以得到对应「迅速」的英文词汇(例如:quick)。接着,观感分析模块130可透过同义词(Synonym)分析对应翻译词汇与观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c进行相似度比对,并借此判断「fast」和「quick」为相同意思的词句。因此,观感分析模块130可判断观感群组132包含的第一特征词汇「迅速」与第一关键字「很快」相符合。
借此,观感分析模块130即可判断具有特征词汇132a的观感群组132为对应关键字「出货」和「迅速」的观感群组,并且增加观感群组132的评价数。
在另一特定实施例中,观感分析模块130还可透过一位元断词(unigram)和二位元断词(bigram)的方式对对应翻译词汇与观感群组131~133的特征词汇131~133进行相似度比对。以「veryfast」和「veryquick」的例子来说,若对应翻译词汇为「veryfast」,透过一位元断词可得到「v」、「e」、「r」、「y」、「f」、「a」、「s」和「t」的断词,透过二位元断词可得到「ve」、「er」、「ar」、「ry」、「yf」、「fa」、「as」和「st」的断词。同理,特征词汇「veryquick」亦透过一位元断词和二位元断词可得到「v」、「e」、「r」、「y」、「q」、「u」、「i」、「c」、「k」、「ve」、「er」……多个断词。观感分析模块130可将对应翻译词汇的每个断词与观感群组的特征词汇的每个断词进行比较,并且将对应翻译词汇中与特征词汇的断词相同的断词的总数除以对应翻译词汇的断词总数可得到一概率(在本例为100%),接着观感分析模块130可判断此概率是否大于一预设概率来决定第一关键字「出货」和「很快」是否与观感群组132中的特征词汇132a「出货迅速」相符。当计算后的概率大于预设概率(例如:75%),则观感分析模块130则判断有对应第一关键字(例如:「出货」和「速度快」)的观感群组132存在,亦即,第一关键字「出货」和「很快」与观感群组132的特征词汇132a相符。
当观感分析模块130根据比对结果(例如:计算后的概率大于预设概率)判断有对应第一关键字的观感群组存在时,观感分析模块130可将第一关键字设定为特征词汇132c,亦即,将第一关键字设定为新的特征词汇,并将特征词汇132c加入至对应第一关键字的观感群组132以更新观感群组132包含的特征词汇,并且将特征词汇132c储存至特征词库135中。
另外,当观感分析模块130根据比对结果判断没有对应第一关键字的观感群组存在时,观感分析模块130则将第一关键字从由关键字撷取模块120撷取的多个关键字中删除。换言之,当没有对应第一关键字的观感群组时,代表此关键字为无意义或是不符合分析项目的特性,因此不需要再对此关键字进行口碑的分析。
在一实施例中,关键字撷取模块120包含断词单元121、词性辨识单元122和词句撷取单元123。断词单元121用以对评论数据的内容进行断词演算法以得到多个词句。词性辨识单元122用以辨识词句的词性。词句撷取单元123用以撷取词句中具有名词和形容词的词句作为多个候选关键字,并从候选关键字中撷取关键字。
在一实施例中,词句撷取单元113根据所述候选关键字出现的的频率和候选关键字与分析项目的关联性从候选关键字中撷取关键字。借此,关键字撷取模块110可淘汰掉与分析项目无关的词句,并将与分析项目相关的特征的词句设为关键字后再进行比对分析,可增加观感分析模块130比对以及口碑分析模块140分析的效率。
请一并参照图1和图2,图2是根据本发明一实施例绘示的一种电子商务口碑分析方法200的流程图。电子商务口碑分析方法200可实作为一计算机程序产品(如应用程序),并储存于一计算机可读取记录媒体中,而使计算机读取此记录媒体后执行电子商务口碑分析方法200。计算机可读取记录媒体可为只读记忆体、快闪记忆体、软盘、硬盘、光盘、随身盘、磁带、可由网络存取的数据库或熟悉此技艺者可轻易思及具有相同功能的计算机可读取记录媒体。
首先,在步骤S202中,透过评论数据撷取模块110根据分析项目在一电子商务平台中撷取评论数据。在一实施例中,评论数据撷取模块110可透过对电子商务平台进行全文搜寻以撷取对应分析项目的评论数据。
接着,在步骤S204中,透过关键字撷取模块120从评论数据撷取多个关键字。在一实施例中,步骤S204可包含:对评论数据的内容进行断词演算法以得到多个词句;辨识词句的词性;撷取词句中具有名词和形容词的词句作为多个候选关键字;及从候选关键字中撷取关键字。进一步来说,使用者可根据候选关键字出现的的频率和候选关键字与分析项目的关联性从候选关键字中撷取所述关键字。
接着,在步骤S206中,透过观感分析模块130将关键字中的每一个关键字与观感群组131~133进行比对。类似地,观感群组131~133及其中的特征词汇131a~131c、132a~132b和133a~133c,可以由技术人员事先建立并予以储存,或是由电子商务口碑分析系统100依据先前已完成分析的其他案例中的观感群组及其特征词汇而建立,或是由电子商务口碑分析系统100事先建立多个观感群组及其特征词汇后再提供给使用者来选取,本实施例并不以此为限。
接着,在步骤S208中,判断观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c中是否具有第一特征词汇与关键字中的第一关键字相符。换句话说,判断评价数据的特征词句和某一观感群组的特征词汇是否相似或具有相同涵义,藉以判断所述评价数据是否为对应到所述的观感群组。
当观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c中具有第一特征词汇与关键字中的第一关键字相符时,进行步骤S210。在步骤S210中,判断具有第一特征词汇的观感群组为对应第一关键字的观感群组。接着,进行步骤S212,在步骤S212中,增加对应第一关键字的观感群组的评价数。
接着,在步骤S214中,判断从评价数据撷取的所有关键字是否皆完成比对。换言之,判断所有关键字是否完成找到其对应的观感群组。当尚有关键字仍未完成比对时,则回到步骤S206,继续对其它关键字进行比对。当所有关键字已完成比对时,则进行步骤S216。
在步骤S216中,选择观感群组131~133中对应分析项目的多个第一观感群组。接着,在步骤S218,统计第一观感群组的评价数。
如此一来,使用者即可透过电子商务口碑方法200,了解针对某一电子商务平台的某一分析项目的口碑的评价数,并根据评价数来了解所述电子商务平台对于所述分析项目的消费或是贩售等分析结果。
在步骤S208中,当观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c中不具有第一特征词汇与关键字中的第一关键字相符时,则进行步骤S220。在步骤S220中,将第一关键字透过翻译单元134进行翻译以产生不同于第一关键字的语言的对应翻译词汇,其具体实施方式可参照上述实施例,在此并不赘述。接着,在步骤S222中,透过观感分析模块130将对应翻译词汇与观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c进行相似度比对以产生比对结果。
在一实施例中,对应翻译词汇与观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c可透过进行相似度比对,其具体实施方式可参照上述实施例,在此并不赘述。
在一实施例中,对应翻译词汇与观感群组131~133的特征词汇131a~131c、132a~132b和133a~133c可透过一位元断词(unigram)和二位元断词(bigram)的方式进行相似度比对,其具体实施方式可参照上述实施例,在此并不赘述。
接着,在步骤S224中,根据比对结果判断是否有对应第一关键字的观感群组存在。当根据比对结果判断有对应第一关键字的观感群组存在时,进行步骤S226。在步骤S226中,将第一关键字设定为第二特征词汇。换言之,将第一关键字设定为新的特征词汇。接着,在步骤S228中,将第二特征词汇加入至对应第一关键字的观感群组以更新对应第一关键字的观感群组包含的特征词汇。
接着,进行步骤S230,将第二特征词汇储存至特征词库135中。接着,回到步骤S212,增加对应第一关键字的观感群组的评价数。需注意的是,步骤S228~S230的任一步骤可根据实际需求增加、删除或是更换其顺序,本实施例并不以此为限。
回到步骤S224,当根据比对结果判断没有对应第一关键字的观感群组存在时,进行步骤S232。在步骤S232中,将第一关键字从关键字撷取模块120节取的多个关键字中删除,并且回到步骤S206。
如上所述的电子商务口碑分析系统100或电子商务口碑分析方法200,其具体实施方式可为软件、硬件与/或固件。举例来说,若以执行速度及精确性为首要考量,则电子商务口碑分析系统100基本上可选用硬件与/或固件为主;若以设计弹性为首要考量,则电子商务口碑分析系统100基本上可选用软件为主;或者,电子商务口碑分析系统100可同时采用软件、硬件及固件协同作业。应了解到,以上所举的这些例子并没有所谓孰优孰劣之分,亦并非用以限制本发明,熟悉此项技艺者当视当时需要,弹性选择该等单元的具体实施方式。
综上所述,透过本发明提供的电子商务口碑分析系统与电子商务口碑分析方法,通过有效地撷取评价数据中的关键字和比对方式,使用者可了解针对某一电子商务平台的某一分析项目的口碑的评价数,并根据评价数来决定是否在所述电子商务平台进行消费或是贩售等行为。
虽然本发明已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视所后附的权利要求书所界定的范围为准。
Claims (16)
1.一种电子商务口碑分析系统,其特征在于,包含:
一评论数据撷取模块,用以根据一分析项目在一电子商务平台撷取一评论数据;
一关键字撷取模块,用以从该评论数据中撷取多个关键字;
一观感分析模块,包含多个观感群组,所述观感群组中的每一观感群组分别包含多个特征词汇,该观感分析模块用以将所述关键字中的每一关键字与所述观感群组进行比对,其中当所述观感群组的所述特征词汇中具有一第一特征词汇与所述关键字中的一第一关键字相符时,该观感分析模块判断具有该第一特征词汇的观感群组为一对应该第一关键字的观感群组,并增加该对应该第一关键字的观感群组的评价数;及
一口碑分析模块,用以选择所述观感群组中对应该分析项目的多个第一观感群组,并统计所述第一观感群组的评价数。
2.根据权利要求1所述的电子商务口碑分析系统,其特征在于,当所述观感群组的所述特征词汇中不具有该第一特征词汇与该第一关键字相符时,该观感分析模块将该第一关键字进行翻译以产生不同于该第一关键字的语言的一对应翻译词汇,并将该对应翻译词汇与该每一观感群组的所述特征词汇进行一相似度比对以产生一比对结果,其中当该观感分析模块根据该比对结果判断有该对应该第一关键字的观感群组存在时,该观感分析模块增加该对应该第一关键字的观感群组的评价数。
3.根据权利要求2所述的电子商务口碑分析系统,其特征在于,该观感分析模块透过一位元断词和二位元断词的方式对该对应翻译词汇与该每一观感群组的所述特征词汇进行该相似度比对。
4.根据权利要求2所述的电子商务口碑分析系统,其特征在于,当该观感分析模块根据该比对结果判断有该对应该第一关键字的观感群组存在时,该观感分析模块还将该第一关键字设定为一第二特征词汇,并将该第二特征词汇加入至该对应该第一关键字的观感群组以更新该对应该第一关键字的观感群组包含的特征词汇。
5.根据权利要求2所述的电子商务口碑分析系统,其特征在于,该观感分析模块包含一特征词库用以储存该每一观感群组中的所述特征词汇,其中当该观感分析模块根据该比对结果判断有该对应该第一关键字的观感群组存在时,该观感分析模块将该第一关键字设定为一第二特征词汇,并将该第二特征词汇储存至该特征词库中。
6.根据权利要求1所述的电子商务口碑分析系统,其特征在于,该关键字撷取模块包含:
一断词单元,用以对该评论数据的内容进行一断词演算法以得到多个词句;
一词性辨识单元,用以辨识所述词句的词性;及
一词句撷取单元,用以撷取所述词句中具有名词和形容词的词句作为多个候选关键字,并从所述候选关键字中撷取所述关键字。
7.根据权利要求6所述的电子商务口碑分析系统,其特征在于,该词句撷取单元根据所述候选关键字出现的的频率和所述候选关键字与该分析项目的关联性从所述候选关键字中撷取所述关键字。
8.根据权利要求1所述的电子商务口碑分析系统,其特征在于,该分析项目为该电子商务平台的一商品、一卖家或一活动。
9.一种电子商务口碑分析方法,其特征在于,包含:
根据一分析项目在一电子商务平台撷取一评论数据;
从该评论数据中撷取多个关键字;
将所述关键字中的每一关键字与多个观感群组进行比对,其中所述观感群组中的每一观感群组分别包含多个特征词汇;
当所述观感群组的所述特征词汇中具有一第一特征词汇与所述关键字中的一第一关键字相符时,判断具有该第一特征词汇的观感群组为一对应该第一关键字的观感群组;
增加该对应该第一关键字的观感群组的评价数;
选择所述观感群组中对应该分析项目的多个第一观感群组;及
统计所述第一对应观感群组的评价数。
10.根据权利要求9所述的电子商务口碑分析方法,其特征在于,还包含:
当所述观感群组的所述特征词汇中不具有该第一特征词汇与该第一关键字相符时,将该第一关键字进行翻译以产生不同于该第一关键字的语言的一对应翻译词汇;
将该对应翻译词汇与该每一观感群组的所述特征词汇进行一相似度比对以产生一比对结果;及
当根据该比对结果判断有该对应该第一关键字的观感群组存在时,增加该对应该第一关键字的观感群组的评价数。
11.根据权利要求10所述的电子商务口碑分析方法,其特征在于,将该对应翻译词汇与该每一观感群组的所述特征词汇进行该相似度比对包含:
透过一位元断词和二位元断词的方式对该对应翻译词汇与该每一观感群组的所述特征词汇进行该相似度比对。
12.根据权利要求10所述的电子商务口碑分析方法,其特征在于,当根据该比对结果判断有该对应该第一关键字的观感群组存在时还包含:
将该第一关键字设定为一第二特征词汇;及
将该第二特征词汇加入至该对应该第一关键字的观感群组以更新该对应该第一关键字的观感群组包含的特征词汇
13.根据权利要求10所述的电子商务口碑分析方法,其特征在于,当根据该比对结果判断有该对应该第一关键字的观感群组存在时还包含:
将该第一关键字设定为一第二特征词汇;及
将该第二特征词汇储存至一特征词库中,其中该特征词库用以储存该每一观感群组中的所述特征词汇。
14.根据权利要求9所述的电子商务口碑分析方法,其特征在于,从该评论数据中撷取所述关键字包含:
对该评论数据的内容进行一断词演算法以得到多个词句;
辨识所述词句的词性;
撷取所述词句中具有名词和形容词的词句作为多个候选关键字;及
从所述候选关键字中撷取所述关键字。
15.根据权利要求14所述的电子商务口碑分析方法,其特征在于,从所述候选关键字中撷取所述关键字包含:
根据所述候选关键字出现的的频率和所述候选关键字与该分析项目的关联性从所述候选关键字中撷取所述关键字。
16.根据权利要求9所述的电子商务口碑分析方法,其特征在于,该分析项目为该电子商务平台的一商品、一卖家或一活动。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103139791A TW201619885A (zh) | 2014-11-17 | 2014-11-17 | 電子商務口碑分析系統、方法和其電腦可讀取記錄媒體 |
TW103139791 | 2014-11-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105589901A true CN105589901A (zh) | 2016-05-18 |
Family
ID=55929483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410695675.2A Pending CN105589901A (zh) | 2014-11-17 | 2014-11-26 | 电子商务口碑分析系统和其方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20160140634A1 (zh) |
KR (1) | KR20160059398A (zh) |
CN (1) | CN105589901A (zh) |
TW (1) | TW201619885A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018205178A1 (zh) * | 2017-05-10 | 2018-11-15 | 曹修源 | 文字探勘衡量系统及方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204156A (zh) * | 2016-07-20 | 2016-12-07 | 天涯社区网络科技股份有限公司 | 一种用于网络论坛的广告投放方法及装置 |
KR102130035B1 (ko) * | 2018-08-07 | 2020-07-06 | 인천대학교 산학협력단 | 사용자 가치 평가 장치 및 방법 |
KR102076657B1 (ko) * | 2019-05-31 | 2020-02-12 | 주식회사 브레인커머스 | 기업의 위기 조짐 모니터링을 위한 기업 위험도 분석 방법 및 이를 위한 장치 |
CN113177164B (zh) * | 2021-05-13 | 2022-12-09 | 深圳市欣易辰信息科技有限公司 | 基于大数据的多平台协同新媒体内容监控管理系统 |
CN113793169A (zh) * | 2021-08-12 | 2021-12-14 | 惠州Tcl云创科技有限公司 | 基于用户评论数据处理方法、装置、设备及存储介质 |
CN117407578B (zh) * | 2023-12-15 | 2024-02-23 | 南京飓风引擎信息技术有限公司 | 一种去中心化的云资源数据检索系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201214169A (en) * | 2010-09-26 | 2012-04-01 | Alibaba Group Holding Ltd | Recognition of target words using designated characteristic values |
US8477134B1 (en) * | 2006-06-30 | 2013-07-02 | Nvidia Corporation | Conservative triage of polygon status using low precision edge evaluation and high precision edge evaluation |
CN103488635A (zh) * | 2012-06-11 | 2014-01-01 | 腾讯科技(深圳)有限公司 | 一种获取产品信息的方法及装置 |
CN103870973A (zh) * | 2012-12-13 | 2014-06-18 | 阿里巴巴集团控股有限公司 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8364467B1 (en) * | 2006-03-31 | 2013-01-29 | Google Inc. | Content-based classification |
TWI489862B (zh) * | 2011-11-09 | 2015-06-21 | Inst Information Industry | Digital TV instant translation system and its method |
-
2014
- 2014-11-17 TW TW103139791A patent/TW201619885A/zh unknown
- 2014-11-26 CN CN201410695675.2A patent/CN105589901A/zh active Pending
- 2014-11-28 US US14/555,702 patent/US20160140634A1/en not_active Abandoned
-
2015
- 2015-03-30 KR KR1020150044504A patent/KR20160059398A/ko not_active Application Discontinuation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8477134B1 (en) * | 2006-06-30 | 2013-07-02 | Nvidia Corporation | Conservative triage of polygon status using low precision edge evaluation and high precision edge evaluation |
TW201214169A (en) * | 2010-09-26 | 2012-04-01 | Alibaba Group Holding Ltd | Recognition of target words using designated characteristic values |
CN103488635A (zh) * | 2012-06-11 | 2014-01-01 | 腾讯科技(深圳)有限公司 | 一种获取产品信息的方法及装置 |
CN103870973A (zh) * | 2012-12-13 | 2014-06-18 | 阿里巴巴集团控股有限公司 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018205178A1 (zh) * | 2017-05-10 | 2018-11-15 | 曹修源 | 文字探勘衡量系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20160140634A1 (en) | 2016-05-19 |
TW201619885A (zh) | 2016-06-01 |
KR20160059398A (ko) | 2016-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717406B (zh) | 文本情绪分析方法、装置及存储介质 | |
US9767144B2 (en) | Search system with query refinement | |
CN105589901A (zh) | 电子商务口碑分析系统和其方法 | |
CN108536852B (zh) | 问答交互方法和装置、计算机设备及计算机可读存储介质 | |
WO2019199719A1 (en) | Dynamically generated machine learning models | |
CA3083723C (en) | Method and apparatus for providing personalized self-help experience | |
WO2020108063A1 (zh) | 特征词的确定方法、装置和服务器 | |
US20140052688A1 (en) | System and Method for Matching Data Using Probabilistic Modeling Techniques | |
CN107526721B (zh) | 一种对电商产品评论词汇的歧义消除方法及装置 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
US20220058504A1 (en) | Autoclassification of products using artificial intelligence | |
CN110399614A (zh) | 用于真产品词识别的系统和方法 | |
CN105975547A (zh) | 基于内容与位置特征的近似web文档检测方法 | |
Ren et al. | Finding deceptive opinion spam by correcting the mislabeled instances | |
CN113204953A (zh) | 基于语义识别的文本匹配方法、设备及设备可读存储介质 | |
CN112307314A (zh) | 搜索引擎精选摘要的生成方法和装置 | |
CN107609921A (zh) | 一种数据处理方法及服务器 | |
CN109213873B (zh) | 一种为待售专利自动匹配潜在买方的专利匹配方法和匹配系统 | |
CN111259223A (zh) | 基于情感分析模型的新闻推荐和文本分类方法 | |
Sharaff et al. | Analyzing sentiments of product reviews based on features | |
CN113590792A (zh) | 用户问题的处理方法、装置和服务器 | |
CN113988057A (zh) | 基于概念抽取的标题生成方法、装置、设备及介质 | |
CN112783410B (zh) | 信息处理方法、介质、装置和计算设备 | |
CN112926297A (zh) | 处理信息的方法、装置、设备和存储介质 | |
CN110851560B (zh) | 信息检索方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160518 |