CN115391656A - 一种用户需求确定方法、装置及设备 - Google Patents
一种用户需求确定方法、装置及设备 Download PDFInfo
- Publication number
- CN115391656A CN115391656A CN202211041023.8A CN202211041023A CN115391656A CN 115391656 A CN115391656 A CN 115391656A CN 202211041023 A CN202211041023 A CN 202211041023A CN 115391656 A CN115391656 A CN 115391656A
- Authority
- CN
- China
- Prior art keywords
- user
- comment
- comments
- similarity
- user comments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种用户需求确定方法、装置及设备,应用于大数据技术领域。所述方法包括:分别获取对应于至少两个候选对象的用户评论;分别计算各个候选对象的用户评论之间的相似度;基于所述相似度从所述候选对象中筛选目标对象;从所述目标对象的用户评论中提取评论关键词;基于所述评论关键词确定用户需求。上述方法从评论中有效提炼用户的需求。此外,根据相似度筛选目标对象,保障了所选取的用户评论对于分析用户需求的有效性,针对目标对象的用户评论提取评论关键词,也提高了分析效率,保证了分析结果符合实际中的用户需求,进而能够针对用户需求更好地为用户推荐相应的内容,提高用户的使用体验。
Description
技术领域
本说明书实施例涉及大数据技术领域,特别涉及一种用户需求确定方法、装置及设备。
背景技术
随着信息技术的发展,用户可以基于智能终端方便地实现通讯、交易、购物、浏览资讯等多项操作,极大地便利了用户的生活。但是,互联网上的数据在不断增加,用户基于互联网所能够获取的数据也越来越多。若展示给用户的数据中包含过多的无用数据,则所展示的数据并不符合用户需求,会浪费用户的时间,进而影响用户的使用体验。
因此,在为用户展示相应数据之前,需要预先确定用户的需求,再根据用户需求推送对应的数据。目前在确定用户需求时,一般是通过问卷调查等形式,向用户直接询问的方式来确定用户需求,但这种方式会额外占用用户的时间,且所获取的调查结果具有一定的延时性,难以准确反映用户的实际需求。因此,目前亟需一种能够准确有效地确定用户需求的方法。
发明内容
本说明书实施例的目的是提供一种用户需求确定方法、装置及设备,以解决如何准确有效地确定用户需求的问题。
为了解决上述技术问题,本说明书实施例提出一种用户需求确定方法,包括:分别获取对应于至少两个候选对象的用户评论;分别计算各个候选对象的用户评论之间的相似度;基于所述相似度从所述候选对象中筛选目标对象;从所述目标对象的用户评论中提取评论关键词;基于所述评论关键词确定用户需求。
本说明书实施例还提出一种用户需求确定装置,包括:用户评论获取模块,用于分别获取对应于至少两个候选对象的用户评论;相似度计算模块,用于分别计算各个候选对象的用户评论之间的相似度;目标对象筛选模块,用于基于所述相似度从所述候选对象中筛选目标对象;评论关键词提取模块,用于从所述目标对象的用户评论中提取评论关键词;用户需求确定模块,用于基于所述评论关键词确定用户需求。
本说明书实施例还提出一种用户需求确定设备,包括存储器和处理器;所述存储器用于存储计算机程序/指令,所述计算机程序/指令在被执行时实现上述用户需求确定方法的步骤。
本说明书实施例还提出一种计算机可读存储介质,其上存储有计算机程序/指令,所述计算机程序/指令在被处理器执行时实现上述用户需求确定方法。
本说明书实施例还提出一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令在被处理器执行时实现上述用户需求确定方法。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中,通过获取用户针对候选对象的评论,并分析用户评论之间的相似度,根据相似度来筛选对应的目标对象,进而从目标对象的用户评论中提取评论关键词,以根据评论关键词有效确定用户需求。上述方法通过分析用户所发出的评论,从评论中有效提炼用户的需求。此外,根据相似度筛选目标对象,保障了所选取的用户评论对于分析用户需求的有效性,针对目标对象的用户评论提取评论关键词,也提高了分析效率,保证了分析结果符合实际中的用户需求,进而能够针对用户需求更好地为用户推荐相应的内容,提高用户的使用体验。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例一种用户需求确定方法的流程图;
图2为本说明书实施例一种用户需求确定方法的流程示意图;
图3为本说明书实施例一种用户需求确定装置的模块图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
为了解决上述技术问题,本说明书实施例提出一种用户需求确定方法。所述用户需求确定方法的执行主体可以是用户需求确定设备。所述用户需求确定设备包括但不限于服务器、工控机、PC机等。如图1所示,所述用户需求确定方法可以包括以下具体实施步骤。
S110:分别获取对应于至少两个候选对象的用户评论。
由于用户评论一般是用户发表针对与候选对象的看法,相应的也受到了用户自身需求的影响,因此可以通过用户评论进行分析,来确定用户的需求。
为了综合分析用户评论,保证用户评论能够正确反映用户需求,需要获取两个及以上的候选对象的用户评论。候选对象是用户评论所针对的对象,在候选对象的数量、类型较多时,能够有效通过候选对象全面准确地确定用户的综合需求。
在一些实施方式中,所述候选对象包括软件或商品。在候选对象为软件的情况下,用户评论可以是在各个软件上所发表的评论,进而能够直接通过用户的评论来确定用户针对对应软件的态度。在候选对象为商品的情况下,用户的评论可以用于反映用户针对不同商品的观点,也能够用于反映出用户的相关需求。
在一些实施方式中,为了保证基于用户评论进行处理所得到的结果的准确性,避免不真实或低质量评论对预测结果所造成的影响,在获取到用户评论之后,可先对用户评论进行过滤。具体的,可以预先设置停用词。停用词可以是违法违规用语,也可以是影响评论的正常性的用词。停用词可以预先由操作人员设定,在获取到用户评论后,可以判断用户评论中是否包含有所述停用词。若包含,则对包含停用词的用户评论进行过滤;若不包含,则利用用户评论执行后续的处理步骤。
由于用户评论是用户直接填写的内容,并未规定统一的用词标准,使得用户评论中可能会包含有一些具有偏见、投诉性质或强烈情绪的用词。这些情感因素过强的词不仅无法正常实现用户需求预测,反而可能会成为高频词汇而影响最终需求预测的结果的准确性。
因此,在一些实施方式中,在获取到用户评论后,可以针对用户评论中的情感用词进行过滤。具体的,可以是先针对用户评论进行分词,具体的分词方式可以根据实际应用的需求进行设置,在此不再赘述。
在分词完毕后,针对分词得到的各个评论分词,确定其中的情感用词。情感用词可以是由操作人员预先设定对应于情感用词的相应标准,通过直接比对情感用词的相应标准,完成对于用户评论中的情感用词的确定,进而对用户评论中的情感用词进行过滤,保证用于分析的用户评论的有效性。
由于在正常语句中,名词、动词和形容词的组合能够更好地反映出用户可见特征,进而更好地确定用户的相应需求。
因此,在一些实施方式中,在一些实施方式中,在获取到用户评论之后,可以先针对用户评论进行分词,具体的分词方式可以根据实际应用的需求进行设置,在此不再赘述。在分词得到评论分词后,针对各个评论分词标注词性,词性包括名词、动词、数词、形容词、名动词、语气词等。具体的,例如可以使用Jieba工具进行词性标注。
在完成词性标注之后,根据词性标注的结果,可以筛选对应于名词、动词、数词、形容词和名动词的词性标注结果的评论分词,作为目标评论分词。由于名词、动词、数词、形容词和名动词能够更直观有效地表现用户的需求,因此针对目标评论分词进行分析能够在提高分析效率的同时,保证分析结果的准确性。
在获取到目标评论分词后,在后续过程中可以利用目标评论分词来分析用户需求。
在一些实施方式中,为了提高针对用户评论进行分析的效率和准确性,在获取到用户评论分词后,还可以针对用户评论中的分词的重要性进行分析,并筛选出重要性较高的分词。
具体的,由于词语的出现频率在一定程度上能够反映词语的重要性,因此,在针对用户评论进行分词以得到评论分词之后,可以基于TF-IDF算法分别计算各个评论分词的权重值。TF-IDF算法用于分析词语的重要性。一般情况下,字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降,TF-IDF算法即通过分析词语的这两项特性来确定词语的重要性。因此,可以通过TF-IDF算法分别计算各个评论分词的权重值。
在针对各个评论分词计算得到权重值后,可以将权重值与权重阈值进行比较,若权重值低于权重阈值,表示该评论分词的重要性不足,可以过滤权重值低于权重阈值的评论分词。权重阈值可以基于实际应用或测试过程进行设置,以使筛选到的评论分词符合需求分析的要求。
需要说明的是,上述针对用户评论的预处理可以全部进行,也可以选取其中的一项或多项进行。相应的,针对各项预处理的执行顺序也可以基于实际应用需求进行设置,对此不做限制。
S120:分别计算各个候选对象的用户评论之间的相似度。
在获取到用户评论后,可以计算各个候选对象的用户评论之间的相似度。在相似性强的情况下,结合这些候选对象的用户评论进行分析时能够更好地保证需求结果的一致性和准确性,而相似性差的候选对象的用户评论可能会对分析结果造成干扰。
具体的,可以利用SVD(Singular Value Decomposition,奇异值分解)算法计算各个候选对象的用户评论之间的相似度。SVD算法能够有效分解自然语言中的相关特征,保证分析结果的速率和准确性。
S130:基于所述相似度从所述候选对象中筛选目标对象。
在计算得到相似度后,可以基于预先设置的相似度阈值,确定候选对象中相似性较高的对象,将这些对象作为目标对象,从而完成目标对象的筛选。对于相似度阈值可以基于实际应用需求进行设置,在此不再赘述。
S140:从所述目标对象的用户评论中提取评论关键词。
在完成对于目标对象的选取后,可以针对目标对象的用户评论提取评论关键词,从而保证所选取的评论关键词对于用户需求分析的有效性,也能够提高分析的效率。
具体的,提取评论关键词可以参照前述方式,针对评论分词的词性、频率等特征进行特征来确定评论关键词。
此外,还可以针对用户评论进行聚类来选取出评论关键词。在一些实施方式中,还可以预先选取至少两种候选聚类算法,例如K-means算法、FCM算法、DBSCAN算法等,利用这些候选聚类算法分别针对样本评论进行建模,并计算得到对应的轮廓值。轮廓值的大小可以用于描述聚类分析的效果。计算得到轮廓值后,可以选取最大轮廓值所对应的候选聚类算法作为目标聚类算法,进而利用目标聚类算法从所述目标对象的用户评论中提取评论关键词。
通过上述方式能够通过实际效果来选取适用于当前情况的具有最优效果的聚类算法,从而保证所提取的评论关键词的准确性。
S150:基于所述评论关键词确定用户需求。
在筛选得到评论关键词后,由于评论关键词能够有效对用户的观点、态度和兴趣进行反应,因此针对评论关键词进行分析可以确定用户需求。
在一些实施方式中,可以通过评论关键词的词频和/或情感值来确定用户需求。
具体的,为了保证识别的准确性,可以在对象迭代更新后,重复收集评论、数据清洗、利用最终实验算法来处理用户评论,并记录预测关键词以及更新关键词,对此关键词的词频以及用户情感之来挖掘用户的潜在需求。
如图2所示,为通过分阶段的方式对整体的需求预测过程进行描述的示意图。其中,在阶段1,主要进行数据预处理,包括通过过滤停用词、情感词和同义词替换,设置POS标记,利用TF-IDF算法等方式来对用户评论进行筛选。在阶段2中通过功能识别,对文本进行聚类,并对聚类结果进行评估,在评估结果符合相应条件后,进入阶段3,基于聚类结果完成需求预测,进而能够针对用户需求推送符合用户需求的数据,提高用户的使用体验。
基于上述用户需求确定方法的实施例的介绍,可以看出,所述方法通过获取用户针对候选对象的评论,并分析用户评论之间的相似度,根据相似度来筛选对应的目标对象,进而从目标对象的用户评论中提取评论关键词,以根据评论关键词有效确定用户需求。上述方法通过分析用户所发出的评论,从评论中有效提炼用户的需求。此外,根据相似度筛选目标对象,保障了所选取的用户评论对于分析用户需求的有效性,针对目标对象的用户评论提取评论关键词,也提高了分析效率,保证了分析结果符合实际中的用户需求,进而能够针对用户需求更好地为用户推荐相应的内容,提高用户的使用体验。
基于图1所对应的用户需求确定方法,介绍本说明书实施例一种用户需求确定装置。所述用户需求确定装置设置于所述用户需求确定设备。如图3所示,所述用户需求确定装置包括以下模块。
用户评论获取模块310,用于分别获取对应于至少两个候选对象的用户评论。
相似度计算模块320,用于分别计算各个候选对象的用户评论之间的相似度。
目标对象筛选模块330,用于基于所述相似度从所述候选对象中筛选目标对象。
评论关键词提取模块340,用于从所述目标对象的用户评论中提取评论关键词。
用户需求确定模块350,用于基于所述评论关键词确定用户需求。
在一些实施方式中,所述装置还包括:用户评论过滤模块,用于对包含停用词的用户评论进行过滤。
在一些实施方式中,所述装置还包括:情感用词过滤模块,用于确定并过滤所述用户评论中的情感用词。
在一些实施方式中,所述装置还包括:分词模块,用于针对所述用户评论进行分词,得到评论分词;词性标注模块,用于对所述评论分词进行词性标注;目标评论分词选取模块,用于根据词性标注的结果,在评论分词中选取对应于名词、动词、数次、形容词和名动词的词性标注结果的评论分词,作为目标评论分词;所述相似度计算模块,包括:相似度计算单元,用于利用目标评论分词计算各个候选对象的用户评论之间的相似度。
在一些实施方式中,所述装置还包括:分词模块,用于针对所述用户评论进行分词,得到评论分词;权重值计算模块,用于基于TF-IDF算法分别计算各个评论分词的权重值;评论分词过滤模块,用于过滤权重值低于权重阈值的评论分词。
在一些实施方式中,所述相似度计算模块,用于利用奇异值分解算法计算各个候选对象的用户评论之间的相似度。
在一些实施方式中,所述装置还包括:轮廓至计算模块,用于利用至少两种候选聚类算法针对样本评论进行建模,分别计算得到对应的轮廓值;目标聚类算法选取模块,用于选取最大轮廓值所对应的候选聚类算法作为目标聚类算法;评论关键词提取模块,用于利用所述目标聚类算法从所述目标对象的用户评论中提取评论关键词。
在一些实施方式中,所述用户需求确定模块,包括:用户需求确定单元,用于通过分析评论关键词的词频和/或情感值来确定用户需求。
基于图1所对应的用户需求确定方法,本说明书实施例提供一种用户需求确定设备。所述用户需求确定设备可以包括存储器和处理器。
在本实施例中,所述存储器可以按任何适当的方式实现。例如,所述存储器可以为只读存储器、机械硬盘、固态硬盘、或U盘等。所述存储器可以用于存储计算机程序/指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以执行所述计算机程序指令实现如图1所对应的用户需求确定方法。
基于图1所对应的用户需求确定方法,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序/指令。所述计算机可读存储介质可以基于设备的内部总线被处理器所读取,进而通过处理器实现所述计算机可读存储介质中的程序指令。
在本实施例中,所述计算机可读存储介质可以按任何适当的方式实现。所述计算机可读存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)、存储卡(MemoryCard)等等。所述计算机存储介质存储有计算机程序指令。在所述计算机程序指令被执行时实现本说明书图1所对应实施例的程序指令或模块。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。具体的,所述处理器在被设置在用户需求确定设备上时可以执行图1对应的实施例中的方法步骤。
基于图1所对应的用户需求确定方法,本说明书实施例还提供一种计算机程序产品,包括计算机程序/指令。所述计算机程序产品可以是通过相应的计算机程序语言所编写的程序,以程序方式存储在相应的存储设备中,并可以通过计算机网络进行传输。所述计算机程序产品可以被处理器所执行。在本说明书实施例中,所述计算机程序产品在被执行时实现如图1所对应实施例的用户需求确定方法的程序指令或模块。
需要说明的是,上述用户需求确定方法、装置及设备可以应用于大数据技术领域,也可以应用至除大数据技术领域外的其他技术领域,对此不做限制。
此外,上述用户需求确定方法、装置及设备在应用过程中对于用户数据的获取、存储、处理、转发等操作均符合国家法律法规的相关规定。
虽然上文描述的过程流程包括以特定顺序出现的多个操作,但是,应当清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。
本申请是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁带存储、磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (13)
1.一种用户需求确定方法,其特征在于,包括:
分别获取对应于至少两个候选对象的用户评论;
分别计算各个候选对象的用户评论之间的相似度;
基于所述相似度从所述候选对象中筛选目标对象;
从所述目标对象的用户评论中提取评论关键词;
基于所述评论关键词确定用户需求。
2.如权利要求1所述的方法,其特征在于,所述候选对象包括软件或商品。
3.如权利要求1所述的方法,其特征在于,所述分别计算各个候选对象的用户评论之间的相似度之前,还包括:
对包含停用词的用户评论进行过滤。
4.如权利要求1所述的方法,其特征在于,所述分别计算各个候选对象的用户评论之间的相似度之前,还包括:
确定并过滤所述用户评论中的情感用词。
5.如权利要求1所述的方法,其特征在于,所述分别计算各个候选对象的用户评论之间的相似度之前,还包括:
针对所述用户评论进行分词,得到评论分词;
对所述评论分词进行词性标注;
根据词性标注的结果,在评论分词中选取对应于名词、动词、数词、形容词和名动词的词性标注结果的评论分词,作为目标评论分词;
相应的,所述分别计算各个候选对象的用户评论之间的相似度,包括:
利用目标评论分词计算各个候选对象的用户评论之间的相似度。
6.如权利要求1所述的方法,其特征在于,所述分别计算各个候选对象的用户评论之间的相似度之前,还包括:
针对所述用户评论进行分词,得到评论分词;
基于TF-IDF算法分别计算各个评论分词的权重值;
过滤权重值低于权重阈值的评论分词。
7.如权利要求1所述的方法,其特征在于,所述分别计算各个候选对象的用户评论之间的相似度,包括:
利用奇异值分解算法计算各个候选对象的用户评论之间的相似度。
8.如权利要求1所述的方法,其特征在于,所述从所述目标对象的用户评论中提取评论关键词之前,还包括:
利用至少两种候选聚类算法针对样本评论进行建模,分别计算得到对应的轮廓值;
选取最大轮廓值所对应的候选聚类算法作为目标聚类算法;
利用所述目标聚类算法从所述目标对象的用户评论中提取评论关键词。
9.如权利要求1所述的方法,其特征在于,所述基于所述评论关键词确定用户需求,包括:
通过分析评论关键词的词频和/或情感值来确定用户需求。
10.一种用户需求确定装置,其特征在于,包括:
用户评论获取模块,用于分别获取对应于至少两个候选对象的用户评论;
相似度计算模块,用于分别计算各个候选对象的用户评论之间的相似度;
目标对象筛选模块,用于基于所述相似度从所述候选对象中筛选目标对象;
评论关键词提取模块,用于从所述目标对象的用户评论中提取评论关键词;
用户需求确定模块,用于基于所述评论关键词确定用户需求。
11.一种用户需求确定设备,包括存储器和处理器;其特征在于,所述存储器用于存储计算机程序/指令,所述计算机程序/指令在被执行时实现如权利要求1-9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,所述计算机程序/指令在被执行时实现如权利要求1-9中任一项所述方法的步骤。
13.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令在被执行时实现如权利要求1-9中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211041023.8A CN115391656A (zh) | 2022-08-29 | 2022-08-29 | 一种用户需求确定方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211041023.8A CN115391656A (zh) | 2022-08-29 | 2022-08-29 | 一种用户需求确定方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115391656A true CN115391656A (zh) | 2022-11-25 |
Family
ID=84121820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211041023.8A Pending CN115391656A (zh) | 2022-08-29 | 2022-08-29 | 一种用户需求确定方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115391656A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117389514A (zh) * | 2023-10-11 | 2024-01-12 | 国网上海能源互联网研究院有限公司 | 一种融合终端微应用开发需求分类方法、装置及系统 |
-
2022
- 2022-08-29 CN CN202211041023.8A patent/CN115391656A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117389514A (zh) * | 2023-10-11 | 2024-01-12 | 国网上海能源互联网研究院有限公司 | 一种融合终端微应用开发需求分类方法、装置及系统 |
CN117389514B (zh) * | 2023-10-11 | 2024-04-02 | 国网上海能源互联网研究院有限公司 | 一种融合终端微应用开发需求分类方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106919619B (zh) | 一种商品聚类方法、装置及电子设备 | |
CN108875059B (zh) | 用于生成文档标签的方法、装置、电子设备和存储介质 | |
US20170154077A1 (en) | Method for comment tag extraction and electronic device | |
CN109325121B (zh) | 用于确定文本的关键词的方法和装置 | |
CN111309910A (zh) | 文本信息挖掘方法及装置 | |
CN106991175B (zh) | 一种客户信息挖掘方法、装置、设备以及存储介质 | |
CN112990973B (zh) | 线上店铺画像构建方法及系统 | |
CN112967144B (zh) | 一种金融信用风险事件抽取方法、可读存储介质及设备 | |
CN111597297A (zh) | 物品召回方法、系统、电子设备及可读存储介质 | |
CN110210038B (zh) | 核心实体确定方法及其系统、服务器和计算机可读介质 | |
EP2862104A1 (en) | Search method and apparatus | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
CN109146625B (zh) | 一种基于内容的多版本App更新评价方法及系统 | |
CN114579104A (zh) | 数据分析场景的生成方法、装置、设备及存储介质 | |
CN110750297A (zh) | 一种基于程序分析和文本分析的Python代码参考信息生成方法 | |
Rani et al. | Study and comparision of vectorization techniques used in text classification | |
US20160132809A1 (en) | Identifying and amalgamating conditional actions in business processes | |
CN112084448A (zh) | 相似信息处理方法以及装置 | |
CN116151233A (zh) | 数据标注、生成方法、模型训练方法、设备和介质 | |
US9396177B1 (en) | Systems and methods for document tracking using elastic graph-based hierarchical analysis | |
CN115391656A (zh) | 一种用户需求确定方法、装置及设备 | |
CN111198934A (zh) | 一种信息处理方法及相关设备 | |
CN110827049A (zh) | 一种数据推送方法及装置 | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 | |
Dasondi et al. | An implementation of graph based text classification technique for social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |