CN111831913A - 一种潜在竞争者信息推荐方法、装置、设备和存储介质 - Google Patents

一种潜在竞争者信息推荐方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111831913A
CN111831913A CN202010694314.1A CN202010694314A CN111831913A CN 111831913 A CN111831913 A CN 111831913A CN 202010694314 A CN202010694314 A CN 202010694314A CN 111831913 A CN111831913 A CN 111831913A
Authority
CN
China
Prior art keywords
data
information
potential competitor
potential
mining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010694314.1A
Other languages
English (en)
Inventor
许婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lotut Innovation Design Co Ltd
Original Assignee
Shenzhen Lotut Innovation Design Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Lotut Innovation Design Co Ltd filed Critical Shenzhen Lotut Innovation Design Co Ltd
Priority to CN202010694314.1A priority Critical patent/CN111831913A/zh
Publication of CN111831913A publication Critical patent/CN111831913A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于计算机技术领域,提供了一种潜在竞争者信息推荐方法、装置、设备及存储介质,该方法在根据用户输入的已知竞争者信息确定至少一条待分析数据后,按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词,并基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据,再根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。通过上述方法,用户只需要输入已知竞争者信息,即可获取到有针对性的潜在竞争者信息,因此节省了大量的搜寻时间,成本较低,且操作十分方便,实用性强。

Description

一种潜在竞争者信息推荐方法、装置、设备和存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种潜在竞争者信息推荐方法、装置、设备和存储介质。
背景技术
因为潜在竞争者突然转变成现实竞争者时往往会给本企业带来极大的冲击,所以在激烈的市场竞争环境下,企业不仅需要关注到现实的竞争者,而且还需要具备识别潜在竞争者的能力,如此才能在激烈的市场竞争中生存下来,并获得更好的发展。
但是,识别潜在竞争者比识别现实竞争者困难得多。如果漫无目的地从浩如烟海的市场信号中搜寻潜在竞争者,不仅需要花费大量的时间,而且还需要专业人员对搜索到的信息进行分析比对,才能进一步确定潜在竞争者,因此成本较高。
发明内容
本发明实施例的目的在于提供一种潜在竞争者信息推荐方法,旨在解决现有技术针对识别潜在竞争者的方式难度大,且需要花费大量的时间和成本的问题。
本发明实施例是这样实现的,一种潜在竞争者信息推荐方法,所述方法包括:
根据用户输入的已知竞争者信息,确定至少一条待分析数据;
按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;
根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
本发明实施例的另一目的在于提供一种潜在竞争者信息推荐装置,包括:
待分析数据确定单元,用于根据用户输入的已知竞争者信息,确定至少一条待分析数据;
关键词提取单元,用于按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
企业数据挖掘单元,用于基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;以及
潜在竞争者信息推荐单元,用于根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述的潜在竞争者信息推荐方法的步骤。
本发明实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述潜在竞争者信息推荐方法的步骤。
本发明实施例提供的一种潜在竞争者信息推荐方法,在根据用户输入的已知竞争者信息确定至少一条待分析数据后,按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词,并基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据,再根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。通过上述方法,用户只需要输入已知竞争者信息,即可获取到有针对性的潜在竞争者信息,无需漫无目的地从浩如烟海的市场信号中搜寻潜在竞争者,也不需要额外聘请专业人员对搜寻到的信息进行分析比对来进一步确定潜在竞争者,因此节省了大量的搜寻时间,成本较低,且操作十分方便,实用性强。
附图说明
图1为本发明第一实施例提供的潜在竞争者信息推荐方法的流程图;
图2为本发明第二实施例提供的潜在竞争者信息推荐方法的流程图;
图3为本发明第三实施例提供的潜在竞争者信息推荐方法的流程图;
图4为本发明第四实施例提供的潜在竞争者信息推荐方法的流程图;
图5为本发明第五实施例提供的潜在竞争者信息推荐方法的流程图;
图6为本发明第六实施例提供的潜在竞争者信息推荐方法的流程图;
图7为本发明第七实施例提供的潜在竞争者信息推荐方法的流程图;
图8为本发明实施例提供的一种潜在竞争者信息推荐装置的结构示意图;
图9为本发明实施例提供的一种关键词提取单元的结构示意图;
图10为本发明实施例提供的另一种潜在竞争者信息推荐装置的结构示意图;
图11为一种执行本发明实施例提供的潜在竞争者信息推荐方法的计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于识别潜在竞争者比识别现实竞争者困难得多,且不仅需要花费大量的时间去从海量的市场信息中搜寻,而且还需要专业人员对搜寻到的市场信息进行分析才能进一步确定有针对性的潜在竞争者,因此时间和人力成本高,不便于用户及时掌握潜在竞争者的信息,以应对激烈的市场竞争。本发明为解决该问题,只需用户输入已知竞争者信息,即可基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与由该已知竞争者信息确定的待分析数据中提取出来的目标关键词具有关联关系的专利数据和/或非专利数据,并通过预设的分析规则对该专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给用户,无需用户漫无目的地从浩如烟海的市场信号中搜寻潜在竞争者,也不需要额外聘请专业人员对搜寻到的信息进行分析比对来进一步确定潜在竞争者,从而大大降低了识别潜在竞争者的时间和人力成本。
作为本发明的一个实施例,如图1所示,提供了一种潜在竞争者信息推荐方法的步骤流程图,具体包括以下步骤:
步骤S102,根据用户输入的已知竞争者信息,确定至少一条待分析数据。
在本发明实施例中,已知竞争者信息包括但不限于商家名称、产品名称等。例如,用户自己是手机生产商,其生产销售曲面屏手机,目前该用户已知的与其有竞争关系的曲面屏手机生产销售商家有华为、三星,那么用户输入的已知竞争者信息可以是“三星”“华为”“曲面屏手机”中的任意一个或者两个或者三个词。即输入的内容可以是“三星”,也可以是“三星”和“曲面屏手机”,还可以是“三星”、“华为”和“曲面屏手机”。
在本发明实施例中,待分析数据通常是指包含用户输入的已知竞争者信息的专利文献数据和/或非专利数据。专利文献数据通常是文本信息,非专利数据可以是文本信息、图像信息或者语音信息。
专利文献数据通常是指收录在各专利数据库中的专利文本。例如,用户输入的已知竞争者信息是“华为”“三星”,那么系统可根据“华为”“三星”,在各个专利检索平台进行搜索并将包含“华为”和/或“三星”的专利文本确定为待分析数据。
非专利数据包括但不限于新闻网页数据、博客文章、论坛上发布的消息、微博发布的数据、微信或QQ等即时通信工具发布的消息、电子商务网站的网页发布的信息等。例如,用户输入的已知竞争者信息是“华为”“三星”,那么系统可根据“华为”“三星”,在全网进行搜索并将包含“华为”和/或“三星”的新闻网页、博客文章、论坛上发布的文本、语音或图像信息等、微博发布的文本、语音或图像信息等、电子商务网站的网页发布文本、语音或图像信息等等确定为待分析数据。
步骤S104,按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词。
在本发明实施例中,所述预设的目标关键词提取规则有多种,且针对不同类型的待分析数据可有不同的提取方式。例如,当待分析数据为文本信息时,预设的目标关键词提取规则可以是将在文本信息中出现的频率、密度达到预设频次、密度阈值的一个或多个词语确定为目标关键词。又例如,当待分析文本为语音信息时,预设的目标关键词提取规则可以是先将语音信息转换成文字信息,再按照上述当待分析数据是文本信息时的目标关键词提取规则确定目标关键词。再例如,当待分析数据为图像信息时,预设的目标关键词提取规则可以是先提取所述图像信息中的像素特征和轮廓特征信息,将所述像素特征和轮廓特征信息与预存的标准物体的像素特征和轮廓特征信息进行匹配,得到匹配结果,并根据所述匹配结果确定所述图像信息中的目标物体,并将所述目标物体的名称确定为目标关键词。
本发明对目标关键词提取规则的方式不做具体的限制,凡是按照可行的目标关键词提取规则提取出每条待分析数据的至少一个目标关键词的方法,都在本发明要求保护的范围之内。
步骤S106,基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据。
在本发明实施例中,大数据可以分为互联网的大数据,政府的大数据,企业的大数据和个人的大数据。
在本发明示例性实施例中,具有关联关系通常是指在专利文献数据或非专利数据中记载有与该目标关键词相似或者主题相关的内容,即认为该专利文献数据或非专利数据与该目标关键词具有关联关系。
在本发明实施例中,与目标关键词相似可以是该目标关键词的近义词等。例如,目标关键词为“水杯”,其近义词有“茶杯”“杯子”“杯具”,可将记载有“茶杯”和/或“杯子”和/或“杯具”的专利文献数据或非专利数据确定为与该目标关键词具有关联关系。
在本发明实施例中,与目标关键词主题相关通常是指与该目标关键词是属于相同或相近技术领域,或者是具有相同或者类似功能的主题。例如,目标关键词为“足球”,与“足球”主题相关的内容可以是“篮球”、“蹴鞠”、“世界杯”、“踢球”、“球”等等。将记载有“篮球”和/或“蹴鞠”和/或“世界杯”和/或“踢球”和/或“球”的专利文献数据或非专利数据确定为与该目标关键词具有关联关系。
步骤S108,根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
在本发明实施例中,预设的分析规则通常是指对与每个所述目标关键词具有关联关系的专利数据和/或非专利数据进行各个组成部分的划分,然后提取出每个组成部分中的商家信息和产品信息,生成商家-产品信息列表(如下表1所示),并将该商家-产品信息列表推荐给用户。
表1
Figure BDA0002590429000000071
作为本发明的一个优选实施例,预设的分析规则还可以是基于用户输入的筛选信息,诸如产品的产地、技术工艺、原材料等,对所述与每个所述目标关键词具有关联关系的专利数据和/或非专利数据进行筛选,将含有用户输入的筛选信息的专利数据和/或非专利数据筛选出来,然后提取出每个组成部分中的商家信息和产品信息,生成商家-产品信息列表,并将该商家-产品信息列表推荐给用户。
在本发明实施例中,在将商家-产品信息列表推荐给用户之前,可先将掺杂在该商家-产品信息列表中的用户输入的已知竞争者的商家名称及其对应的产品信息剔除出去,仅留下用户未知的潜在竞争者的商家名称及其对应的产品信息,减少信息的冗余。
本发明实施例提供的一种潜在竞争者信息推荐方法,在根据用户输入的已知竞争者信息确定至少一条待分析数据后,按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词,并基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据,再根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。通过上述方法,用户只需要输入已知竞争者信息,即可获取到有针对性的潜在竞争者信息,无需漫无目的地从浩如烟海的市场信号中搜寻潜在竞争者,也不需要额外聘请专业人员对搜寻到的信息进行分析比对来进一步确定潜在竞争者,因此节省了大量的搜寻时间,成本较低,且操作十分方便,实用性强。
在本发明的一个实施例中,如图2所示,与图1所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,将步骤S104替换为步骤S202。
步骤S202,对每条所述待分析数据进行分词操作,确定候选关键词,并将所述候选关键词中重复出现频次达到预设频率的词语确定为每条所述待分析数据对应的目标关键词。
从词性来看,词语可分为实词和虚词;实词,有实际意义的词,包括名词、动词、形容词、数词、量词;虚词,没有实在意义的词,包括副词、介词、连词、助词、叹词、拟声词。候选关键词可以是实词。
在本发明的一个示例性实施例中,当待分析数据为专利文本时,可对该专利文本按照上述词性进行分词操作,并将其中的实词确定为候选关键词,并将候选关键词中重复出现频次达到预设频率的词语确定为该专利文本对应的目标关键词。
在本发明实施例中,预设的次数可以是≥2,3,4....,在此不做具体限定。示例性地,可将在候选关键词中重复出现次数达到至少2次的词语确定为目标关键词。例如,当前确定的候选关键词包括:“手机”、“曲面显示屏”、“触控层”和“显示面板”,每个候选关键词的重复出现次数分别为10、23、1、3次。若预设的频次为2次,那么将“手机”、“曲面显示屏”、“显示面板”确定为该篇专利文本对应的目标关键词。
在本发明的另一示例性实施例中,当待分析数据为语音信息时,先将该语音信息转换成文本信息,然后再按照上述文本信息的处理方式提取出其对应的目标关键词。
在本发明的又一示例性实施例中,当待分析数据为图像信息时,可采用现有的计算机提取图像信息的方法提取出该图像信息中的像素特征和轮廓特征信息,再将所述像素特征和轮廓特征信息与预存的标准物体的像素特征和轮廓特征信息进行匹配,得到匹配结果,并根据所述匹配结果确定所述图像信息中的目标物体,并将所述目标物体的名称确定为目标关键词。
在本发明实施例中,标准物体通常是指具有明确名称、形状轮廓、颜色特征的一类物体,包括但不限于水杯、文件夹、苹果、手机、花瓶等。
在本发明实施例中,预先构建标准物体名称-像素特征-轮廓特征的映射表,如下表2所示:
表2
标准物体名称 像素特征 轮廓特征 其他特征
A a c e
B b d f
示例性地,假设从该待分析数据中提取到的像素特征信息为a,轮廓特征为c,那么可以将提取到的像素特征a和轮廓特征c与预置的标准物体名称-像素特征-轮廓特征的映射表中的标准物体的像素特征和轮廓特征信息进行匹配,得到的匹配结果显示该标准物体是A,那么可将A确定为目标关键词。
在本发明的另一个实施例中,如图3所示,与图2所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,在步骤S202之后还包括步骤S302、步骤S304;并将步骤S106替换为步骤S306。
在步骤S302中,对每条所述待分析数据对应的目标关键词进行分类,生成至少一个聚类关键词集合。
在本发明实施例中,为了提高基于web的大数据进行深度分析和挖掘的数据筛选效率和命中率,可以对每天所述待分析数据对应的目标关键词进行分类。结合上述实施例的例子,从待分析数据中抽取出来的目标关键词可能为多个不同词性的词语,此时,可以根据词性将这些目标关键词按照词性进行聚类。例如,从待分析数据中抽取到的目标关键词中有7个名词,5个形容词,3个数词和8个副词,那么可以将名词归为一个聚类关键词集合,形容词归为一个聚类关键词集合,数词归为一个聚类关键词集合,即形成三个聚类关键词集合。
在步骤S304中,根据预设的最终目标关键词筛选规则,从每个聚类关键词集合中筛选出对应的至少一个最终目标关键词。
在本发明实施例中,预设的最终目标关键词筛选规则可以是剔除聚类关键词集合中的某个或几个,例如,剔除虚词聚类关键词集合。
结合上述实施例的例子,将从待分析数据中抽取并聚类得到的副词聚类关键词集合(属于虚词聚类关键词集合)剔除掉,保留其中的名词、形容词和数词聚类关键词集合,并将名词、形容词和数词聚类关键词集合中的元素确定为最终的目标关键词。
在步骤S306中,基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述最终目标关键词具有关联关系的专利数据和/或非专利数据。
在本发明的一个实施例中,如图4所示,与图1所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,将步骤S106替换为步骤S402。
步骤S402,基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出包含所述目标关键词的专利数据和/或非专利数据。
在本发明一个示例性实施例中,假设目标关键词为“曲面屏手机”,那么可基于现有的web的大数据深度分析和挖掘技术,从海量的web数据中挖掘出包含“曲面屏手机”的专利数据和/或非专利数据。
在本发明的另一示例性实施例中,为了更加全面、准确地挖掘出与目标关键词相关的专利数据和/非专利数据,避免遗漏,提高后续分析结果的精准度和实用价值,可以通过在系统中预置目标关键词-近义词对照表,并根据该目标关键词-近义词对照表,确定与该目标关键词对应的近义词,然后再从海量的web数据中挖掘出包含该目标关键词和/或目标关键词的近义词的专利数据和/或非专利数据。
例如,目标关键词为“足球”,与“足球”对应的近义词为“蹴鞠”,那么系统可基于现有的web的大数据深度分析和挖掘技术,从海量的web数据中挖掘出包含“足球”和/或“蹴鞠”的专利数据和/或非专利数据。
在本发明的另一实施例中,如图5所示,与图3所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,将步骤S306替换为步骤S502。
步骤502,基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出包含所述最终目标关键词的专利数据和/或非专利数据。
在本发明实施例中,通过对目标关键词的聚类、筛选,可以将一些冗余的、没有意义的目标关键词过滤掉,从而提高了大数据的挖掘效率和准确率。
作为本发明的示例性实施例,如图6所示,与图1所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,将步骤S108替换为步骤S602。
步骤S602,将每条与每个所述目标关键词具有关联关系的专利数据和/或非专利数据中的潜在竞争者的企业名称及其产品信息抽取出来,生成潜在竞争者信息列表并推荐给用户,所述潜在竞争者信息列表包括至少一个潜在竞争者的企业名称及其对应的产品信息。
在本发明实施例中,产品信息包括产品的名称、功能信息、原材料信息、质量信息、价格信息、产地信息、成长过程信息、技术工艺信息、开发信息以及结构信息。
产品的功能信息是指对产品的基本作用、效用和功能等进行介绍和描述的信息。产品说明书中功能部分的介绍说明就属于产品的功能信息。例如,一款感冒药,其功能信息为治感冒。
产品的原材料信息即系对生产产品所使用的原材料的介绍和说明,例如,一款奶茶,其原材料包括奶精、茶叶、水、糖以及包装奶茶的包材等。
产品的质量信息是对产品自身质量状况的介绍或描述,例如产品的等级、质量认证类别等。
产品的成长信息是对产品在其成长过程中表现出来的特点、所属的成长阶段进行的介绍和说明。通常包括萌芽期、发展期、成熟期和后成熟期。
产品的技术工艺信息是对生产产品所使用的技术和工艺的介绍或说明。例如,抛光工艺、蜡染、磨砂工艺等。
产品的开发信息是对产品的开发情况进行介绍和说明的信息。产品的开发信息包括开发组织、开发计划、开发过程和开发效果等方面的信息。
产品的结构信息是对产品所属的行业结构和企业结构进行的介绍和描述。产品的行业结构就是整个行业的所有产品相比较在市场上的地位排列情况。产品的企业结构是指某企业所经营的所有产品相比较的市场地位排列情况。市场地位高的产品也就是盈利大的产品。在行业中市场地位高的产品,在其企业内一般也是高地位产品。
在本发明的一个示例性实施例中,当提取出来的目标关键词为“钢化玻璃”,而目前从海量的web数据中挖掘出N条与“钢化玻璃”有关联关系的专利数据和M条与“钢化玻璃”有关联关系的论文、新闻网页、微博、淘宝网页信息。那么系统可将这N条专利数据和M条非专利数据中的潜在竞争者的企业名称及其产品信息抽取出来。以专利数据为例,可以从每条专利数据的著录项中的申请人/专利权人、专利标题、分类号、摘要部分的内容抽取出来,然后再通过上述的分词操作的方法将专利标题、摘要部分中重复出现次数超过预设频次的实词抽取出来,再生成潜在竞争者信息列表(如下表3所示)。
表3
Figure BDA0002590429000000131
Figure BDA0002590429000000141
表3中的产品信息中的a、b表示的是从专利数据中抽取出来的实词、分类号所对应的产品所属领域,从专利标题、摘要中抽取出来的实词。
在本发明实施例中,在这N条专利数据和M条非专利数据中,可能属于同一个企业的专利数据/非专利数据不止一条,所以可以先将每条专利数据/非专利数据中的企业名称抽取出来,并生成以该企业名称命名的数据集合,之后再分别对该数据集合中的每条数据进行上述的实词抽取操作,得到该企业与其对应的产品信息。若产品信息中相同或相似的实词有多个,则将相同或相似的实词进行合并,只保留其中的一个,其余均剔除,使得潜在竞争者信息列表的内容更加的简洁,便于用户查看。
作为本发明的另一示例性实施例,如图7所示,与图1所示出的一种潜在竞争者信息推荐方法的步骤流程图的区别在于,在步骤S108之后还包括步骤S702。
步骤S702,实时监控并收集所述潜在竞争者的产品市场推广信息,并将所述潜在竞争者的产品市场推广信息推送给所述用户。
在本发明实施例中,市场推广是指企业为扩大产品市场份额,提高产品销量和知名度,而将有关产品或服务的信息传递给目标消费者,激发和强化其购买动机,并促使这种购买动机转化为实际购买行为而采取的一系列措施。市场推广信息则是指有关产品或服务的信息。
在本发明实施例中,为了及时掌握潜在竞争者的产品的市场布局情况,可通过实时监控并收集潜在竞争者信息列表中的潜在竞争者的产品市场推广信息,并将所述潜在竞争者的产品市场推广信息实时推送给用户。例如,用户K是钢化玻璃的生产制造商,其要进驻的目标市场是华南地区,S系用户K的潜在竞争者,目前潜在竞争者S在华北地区生产销售钢化玻璃,对于在华南地区的市场布局甚少。为了及时掌握潜在竞争者S的市场推广情况,本发明通过实时监控并收集潜在竞争者S的市场推广信息,并将潜在竞争者S的市场推广信息实时推送给用户K,以使用户K能够及时掌握潜在竞争者S的市场推广动向,做好市场应对策略,获得抢占华南地区市场的有利地位。
作为本发明的优选实施例,上述步骤S702还包括:对所潜在竞争者的产品市场推广信息进行市场动态分析,生成市场动态分析报告并推送给所述用户。
在本发明实施例中,为了使用户更好、更加直观地了解潜在竞争者的产品市场动态,本发明在收集到潜在竞争者的市场推广信息之后,将这些市场推广信息进行汇总,并进行市场动态分析,生成潜在竞争者的产品市场动态分析报告。市场动态分析报告具体可以是根据收集到的数据绘制成的EXCEL表格,柱状图、折线图、饼状图、散点图等图表。
如图8所示,本发明实施例还提供了一种潜在竞争者信息推荐装置,为了便于说明,图中仅示出了与本发明实施例相关的部分,所述潜在竞争者信息推荐装置800包括:待分析数据确定单元810、关键词提取单元820、数据挖掘单元830和潜在竞争者信息推荐单元840。
待分析数据确定单元810,用于根据用户输入的已知竞争者信息,确定至少一条待分析数据。
关键词提取单元820,用于按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词。
数据挖掘单元830,用于基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据。
潜在竞争者信息推荐单元840,用于根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
本发明实施例提供的一种潜在竞争者信息推荐装置,待分析数据确定单元810根据用户输入的已知竞争者信息确定至少一条待分析数据,关键词提取单元820按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词,数据挖掘单元830基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据,潜在竞争者信息推荐单元840再根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。通过上述装置,用户只需要输入已知竞争者信息,即可获取到有针对性的潜在竞争者信息,无需漫无目的地从浩如烟海的市场信号中搜寻潜在竞争者,也不需要额外聘请专业人员对搜寻到的信息进行分析比对来进一步确定潜在竞争者,因此节省了大量的搜寻时间,成本较低,且操作十分方便,实用性强。
在本发明的示例性实施例中,所述关键词提取单元820具体用于对每条所述待分析数据进行分词操作,确定候选关键词,并将所述候选关键词中重复出现频次达到预设频率的词语确定为每条所述待分析数据对应的目标关键词。
在本发明的示例性实施例中,如图9所示,所述关键词提取单元820包括目标关键词分类模块821和最终目标关键词确定模块822。
目标关键词分类模块821,用于对每条所述待分析数据对应的目标关键词进行分类,生成至少一个聚类关键词集合。
最终目标关键词确定模块822,用于根据预设的最终目标关键词筛选规则,从每个聚类关键词集合中筛选出对应的至少一个最终目标关键词。
在本发明实施例中,数据挖掘单元830可用于:基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述最终目标关键词具有关联关系的专利数据和/或非专利数据。
在本发明实施例中,数据挖掘单元830还可用于:基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出包含所述目标关键词的专利数据和/或非专利数据。
在本发明实施例中,所述潜在竞争者信息推荐单元840具体用于:将每条与每个所述目标关键词具有关联关系的专利数据和/或非专利数据中的潜在竞争者的企业名称及其产品信息抽取出来,生成潜在竞争者信息列表并推荐给用户,所述潜在竞争者信息列表包括至少一个潜在竞争者的企业名称及其对应的产品信息。
在本发明实施例中,如图10所示,所述潜在竞争者信息推荐装置800还包括产品市场推广信息单元850。
产品市场推广信息单元850,用于实时监控并收集所述潜在竞争者的产品市场推广信息,并将所述潜在竞争者的产品市场推广信息推送给所述用户。
在本发明的优选实施例中,所述产品市场推广信息单元850还用于:对所潜在竞争者的产品市场推广信息进行市场动态分析,生成市场动态分析报告并推送给所述用户。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11示出了一个实施例中计算机设备的内部结构图。如图11所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现潜在竞争者信息推荐方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行潜在竞争者信息推荐方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的潜在竞争者信息推荐装置可以实现为一种计算机程序的形式,计算机程序可在如图11所示的计算机设备上运行。计算机设备的存储器中可存储组成该潜在竞争者信息推荐装置的各个程序模块,比如,图8所示的待分析数据确定单元810、关键词提取单元820、数据挖掘单元830和潜在竞争者信息推荐单元840。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的潜在竞争者信息推荐方法中的步骤。
例如,图11所示的计算机设备可以通过如图8所示的潜在竞争者信息推荐装置中的待分析数据确定单元810执行步骤S102。计算机设备可通过关键词提取单元820执行步骤S104。计算机设备可通过数据挖掘单元830执行步骤S106。计算机设备可通过潜在竞争者信息推荐单元840执行步骤S108。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据用户输入的已知竞争者信息,确定至少一条待分析数据;
按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;
根据预设的分析规则对所述专利数据和和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
根据用户输入的已知竞争者信息,确定至少一条待分析数据;
按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;
根据预设的分析规则对所述专利数据和和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种潜在竞争者信息推荐方法,其特征在于,所述方法包括:
根据用户输入的已知竞争者信息,确定至少一条待分析数据;
按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;
根据预设的分析规则对所述专利数据和和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
2.根据权利要求1所述的潜在竞争者信息推荐方法,其特征在于,所述按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词的步骤,包括:
对每条所述待分析数据进行分词操作,确定候选关键词,并将所述候选关键词中重复出现频次达到预设频率的词语确定为每条所述待分析数据对应的目标关键词。
3.根据权利要求2所述的潜在竞争者信息推荐方法,其特征在于,在所述将所述候选关键词中重复出现频次达到预设频率的词语确定为每条所述待分析数据对应的目标关键词的步骤之后,还包括:
对每条所述待分析数据对应的目标关键词进行分类,生成至少一个聚类关键词集合;
根据预设的最终目标关键词筛选规则,从每个聚类关键词集合中筛选出对应的至少一个最终目标关键词;
所述基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与所述目标关键词具有关联关系的专利数据和/或非专利数据的步骤,具体包括:
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述最终目标关键词具有关联关系的专利数据和/或非专利数据。
4.根据权利要求1或3所述的潜在竞争者信息推荐方法,其特征在于,所述基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与所述目标关键词具有关联关系的专利数据和/或非专利数据的步骤,包括:
基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出包含所述目标关键词的专利数据和/或非专利数据。
5.根据权利要求1所述的潜在竞争者信息推荐方法,其特征在于,所述根据预设的分析规则对所述企业数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户的步骤,包括:
将每条与每个所述目标关键词具有关联关系的专利数据和/或非专利数据中的潜在竞争者的企业名称及其产品信息抽取出来,生成潜在竞争者信息列表并推荐给用户,所述潜在竞争者信息列表包括至少一个潜在竞争者的企业名称及其对应的产品信息。
6.根据权利要求1所述的潜在竞争者信息推荐方法,其特征在于,在所述根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户的步骤之后,还包括:
实时监控并收集所述潜在竞争者的产品市场推广信息,并将所述潜在竞争者的产品市场推广信息推送给所述用户。
7.根据权利要求6所述的潜在竞争者信息推荐方法,其特征在于,所述实时监控并收集所述潜在竞争者的产品市场推广信息,并将所述潜在竞争者的产品市场推广信息推送给所述用户的步骤,包括:
对所潜在竞争者的产品市场推广信息进行市场动态分析,生成市场动态分析报告并推送给所述用户。
8.一种潜在竞争者信息推荐装置,其特征在于,包括:
待分析数据确定单元,用于根据用户输入的已知竞争者信息,确定至少一条待分析数据;
关键词提取单元,用于按照预设的目标关键词提取规则提取出每条所述待分析数据的至少一个目标关键词;
数据挖掘单元,用于基于web的大数据进行深度分析和挖掘,从海量的web数据中挖掘出与每个所述目标关键词具有关联关系的专利数据和/或非专利数据;以及
潜在竞争者信息推荐单元,用于根据预设的分析规则对所述专利数据和/或非专利数据进行分析,确定至少一个潜在竞争者信息并推荐给所述用户。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述潜在竞争者信息推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述潜在竞争者信息推荐方法的步骤。
CN202010694314.1A 2020-07-17 2020-07-17 一种潜在竞争者信息推荐方法、装置、设备和存储介质 Withdrawn CN111831913A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010694314.1A CN111831913A (zh) 2020-07-17 2020-07-17 一种潜在竞争者信息推荐方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010694314.1A CN111831913A (zh) 2020-07-17 2020-07-17 一种潜在竞争者信息推荐方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN111831913A true CN111831913A (zh) 2020-10-27

Family

ID=72923540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010694314.1A Withdrawn CN111831913A (zh) 2020-07-17 2020-07-17 一种潜在竞争者信息推荐方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111831913A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836379A (zh) * 2021-09-26 2021-12-24 北京百炼智能科技有限公司 一种基于客户画像的智能推荐方法和系统
CN115148374A (zh) * 2022-08-15 2022-10-04 重庆康洲大数据(集团)有限公司 一种用于网络药理学的数据挖掘方法及装置
CN115641009A (zh) * 2022-11-14 2023-01-24 安徽大学 基于专利异构信息网络挖掘竞争者的方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836379A (zh) * 2021-09-26 2021-12-24 北京百炼智能科技有限公司 一种基于客户画像的智能推荐方法和系统
CN113836379B (zh) * 2021-09-26 2023-08-25 北京百炼智能科技有限公司 一种基于客户画像的智能推荐方法和系统
CN115148374A (zh) * 2022-08-15 2022-10-04 重庆康洲大数据(集团)有限公司 一种用于网络药理学的数据挖掘方法及装置
CN115641009A (zh) * 2022-11-14 2023-01-24 安徽大学 基于专利异构信息网络挖掘竞争者的方法及装置
CN115641009B (zh) * 2022-11-14 2023-05-05 安徽大学 基于专利异构信息网络挖掘竞争者的方法及装置

Similar Documents

Publication Publication Date Title
Garimella et al. Quantifying controversy on social media
Salloum et al. Mining social media text: extracting knowledge from Facebook
Das et al. Text mining and topic modeling of compendiums of papers from transportation research board annual meetings
CN103914478B (zh) 网页训练方法及系统、网页预测方法及系统
US10685181B2 (en) Linguistic expression of preferences in social media for prediction and recommendation
Chen Personalized recommendation system of e-commerce based on big data analysis
CN111831913A (zh) 一种潜在竞争者信息推荐方法、装置、设备和存储介质
El Alaoui et al. Big data quality metrics for sentiment analysis approaches
CN103870973A (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
Kar et al. Finding opinion strength using fuzzy logic on web reviews
CN102789449B (zh) 对评论文本进行评价的方法和装置
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN110637316A (zh) 用于使用在线资源和神经网络处理以基于出版资料对组织进行分类的智能预期对象识别的系统和方法
CN109101553B (zh) 用于购买方非受益方的行业的采购用户评价方法和系统
Gupta et al. A combined approach of sentimental analysis using machine learning techniques
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN102306178A (zh) 视频推荐方法及装置
Kurniawan et al. Exploring Sentimen Analysis Using Machine Learning: A Case Study on Partai Demokrasi Indonesia Perjuangan (PDIP) in the 2024 General Election
Zhao et al. Tourism e-commerce recommender system based on web data mining
CN112182390A (zh) 一种函件推送方法、装置、计算机设备及存储介质
Turdjai et al. Simulation of marketplace customer satisfaction analysis based on machine learning algorithms
Mantika et al. Sentiment Analysis on Twitter Using Naïve Bayes and Logistic Regression for the 2024 Presidential Election
Saputri et al. Sentiment analysis on shopee e-commerce using the naïve bayes classifier algorithm
Khasby et al. Comparison of K-N earest Neighbor (K-NN) and Naïve Bayes Algorithm for Sentiment Analysis on Google Play Store Textual Reviews
Kim et al. Analyzing and visualizing comprehensive and personalized online product reviews

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201027

WW01 Invention patent application withdrawn after publication