CN111125351A - 商情简报生成方法及装置、电子设备及存储介质 - Google Patents
商情简报生成方法及装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111125351A CN111125351A CN201911310442.5A CN201911310442A CN111125351A CN 111125351 A CN111125351 A CN 111125351A CN 201911310442 A CN201911310442 A CN 201911310442A CN 111125351 A CN111125351 A CN 111125351A
- Authority
- CN
- China
- Prior art keywords
- data
- target entity
- collecting
- business
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种商情简报生成方法及装置、电子设备及存储介质。所述商情简报生成方法,包括:收集目标实体的商情数据;基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
Description
技术领域
本申请涉及数据技术领域,尤其涉及一种商情简报生成方法及装置、电子设备及存储介质。
背景技术
公司利用爬虫或者其他数据采集工具等,自主收集公司内外部商情数据;将采集到的数据结构化和标签化,无法自动生成有针对性的商情竞品简报。数据结构和标签系统维护和构建成本极高,且无法满足多种业务需求;网络获取的数据多且繁杂,需要人工剔除无效不相关数据;无法满足企业的情报数据需求。
发明内容
有鉴于此,本申请实施例期望提供一种商情简报生成方法及装置、存储介质。
本申请实施例第一方面提供一种商情简报生成方法,包括:
收集目标实体的商情数据;
基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
基于上述方案,所述收集目标实体的商情数据,包括以下至少之一:
收集目标实体自身的数据;
收集所述目标实体的上下游供应链的数据;
收集所述目标实体所提供产品和/或服务的竞品数据;
收集所述目标实体的新闻数据;
收集所述目标实体所提供产品和/或服务的宏观政策数据;、收集所述目标实体所提供产品和/或服务的市场数据;
收集所述目标实体的合作伙伴的数据。
基于上述方案,所述收集目标实体自身的数据,包括以下至少之一:
收集所述目标实体的基础数据,其中,所述基础数据包括:所述目标实体所属或涉及的行业数据、、法人数据、团队数据、知识产权数据、所述目标实体提供的产品和/或服务的数据中的一个或多个;
收集所述目标实体的财务数据;
收集所述目标实体的经营活动数据;
收集所述目标实体的销售数据;
收集所述目标实体的公关数据。
基于上述方案,所述收集所述目标实体的上下游供应链的数据,包括:
识别所述目标实体所提供产品的说明,提取到所述产品提供所需的原料或者成分;
利用自然语言处理技术处理所述原料或成分得到进行数据搜索的关键词;
基于所述关键词对新闻数据库进行搜索,得到与所述目标实体所提供产品的原料或者成分的市场供应数据;
收集并整理为所述目标实体提供所述原料或成分的上游供应商的数据。
基于上述方案,所述收集所述目标实体的新闻数据,包括:
收集包含活动数据的新闻数据;
对所述新闻数据中的活动数据分词分析,得到所述活动数据所描述活动事件的关键词和特征;
基于所述关键词和特征,将所述活动事件进行分类,得到分类数据;
基于所述分类数据,选择出与所述目标实体相关的新闻数据。
基于上述方案,所述基于所述分类数据,选择出与所述目标实体相关的新闻数据,包括:
利用所述目标实体的连接从实体库中获取所述目标实体的实体数据;
结合所述分类数据,计算新闻数据中所包含活动数据新闻数据与所述目标实体之间的最小图距离;
确定目标实体与所述活动事件之间的上下文相似度;
根据最小图距离和所述上行文相似度,确定出与所述目标实体相关的新闻数据。
基于上述方案,所述素材获取配置包括:素材来源配置、标签命中规则和/ 或素材过滤规则;
所述简报生成配置包括:
触发规则;
简报显示规则;
文字显示规则。
本申请实施例第二方面提供一种商情简报生成装置,包括:
收集模块,被配置为收集目标实体的商情数据;
素材模块,被配置为基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
生成模块,被配置为基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
本申请实施例第三方面提供一种电子设备,其中,包括:
存储器;
处理器,与所述存储器连接,用于通过执行所述存储器上存储的计算机可执行指令,能够前述任意技术方案提供的商情简报生成方法。
本申请实施例第四方面提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行代码;所述计算机可执行代码被执行后,能够用于实现前述一个或多个技术方案提供的商情简报生成方法。
本申请实施例提供的商情简报生成方法及装置、存储介质,获得原始视频之后,设备采用视频处理技术,识别原始视频中包含的声学特征,基于视频识别技术得到原始视频中包含的视频对象,例如,人物对象、物体对象和/或视频所包含的特殊事件,设备自动根据识别得到的视频对象,标注原始视频得到视频标签。如此,设备就可以在无需人工操作的情况下,对原始视频进行自动标注,而设备的自动标注相对于人工标注,具有效率高及操作简单的特点;与此同时,由于设备标注,减少了标注人员的业务不熟练或者标注疲劳引入的标注错误现象,提升了视频标注的精确度。
附图说明
图1为本申请实施例提供的一种商情简报生成方法的流程示意图;
图2A为本申请实施例提供的一种商情简报收集方法的流程示意图;
图2B为本申请实施例提供的一种商情简报收集方法的流程示意图;
图3为本申请实施例提供的一种商情简报生成装置的结构示意图;
图4为本申请实施例提供的一种商情简报生成方法的流程示意图。
具体实施方式
以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本实施例提供一种商情简报生成方法,包括:
S110:收集目标实体的商情数据;
S120:基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
S130:基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
本申请实施例提供的商情简报方法可以应用于各种电子设备,例如,终端设备中或者服务器中,该服务器可为本地服务器或云端服务等。这些电子设备可以连接到互联网络,从而利用爬虫计算等从网络中收集各种数据,或者,通过人机交互界面接收各种从输入输出(Input Output,IO)设备输入的数据。
在本实施例中,所述目标实体可为企业等法人或者特定组织等等非法人团体。
所述商情数据可包括各种与商业情况相关的各种数据。
在一些实施例中,S110可包括:
按照预设维度收集的商情数据,然后根据各个维度收集的商情数据的数据量、可信度及完整性等,提供所生成商情简报的置信度确定的参考因子。
此时的预设维度可以分为以下几类:
目标实体自身的维度,目标实体的人力组织数据、经营状况数据及知识产权数据中的一个或多个。
目标实体所提供产品和/或服务的供应链维度,例如,目标实体的供应商的数据;目标实体的采购者的数据。供应商的数据包括但不限于:供应商自身的经济实力、经营状况及稳定性的数据。采购者的数据包括但不限于:采购量、对目标实体的采购量在采购者所采购量中的比值,采购量的变化;
目标实体的竞争对手的维度,该维度的数据可包括:是否有竞争对手、如果有竞争对手,则与各个竞争对手所提供的产品和/或服务的相似程度、可替代性程度、各自当前市场占有份额、各自所占市场的份额变化趋势、价格差异数据及消费者心中的知名度排名等数据中的一个或多个。
目标实体所提供产品和/或服务的市场维度,例如,市场需求量和/或市场需求变化趋势;
例如,根据历史事件端内实际收集数据量及当前时间段内收集到的数据量,可以确定出数据量所对应的数据量因子的取值,该数据量因子的取值可为0到 1之间的任意取值。
例如,根据收集到的多条数据之间的是否有冲突和/或数据来源,确定可信度因子的取值。该可信度因子的取值可为0到1之间的任意取值。
例如,是否有收集到官方数据,官方数据一般比其他私人渠道的数据的可信度高一些。若收集到多条有冲突的数据,相比数据一致性好的多条数据的可行度因子的取值低一些。
例如,预定收集目标实体的半年内的销售数据,可以根据未收集到销售数据的时间段在所需收集时间段内的比值,确定所述完整性。
再例如,根据已经收集数据综合分析,确定出有商情数据遗漏,则根据遗漏情况的预估,确定遗漏部分对所需收集数据的占比,得到所述完整性。例如,针对目标企业对外宣称销售量M,但是在商情数据收集时,仅收集的其中销售量N的详细销售数据,则遗漏部分为M-N,此时,可以根据该M-N确定出所述完整性。该完整性的取值可为0到1之间的任意值。
收集到商情数据之后,所述方法可包括:按照预设数据处理策略,解析并整理所述商情数据解析并整理所述商情数据;在生成所述商情简报时,可以是基于解析整理后的商情数据。
对收集到的商情数据进行分析和整理可包括:
将收集的商情数据按照预设维度进行分类;例如,通过数据处理模型,提取商情数据的关键词和/或主旨等,基于提取的关键词和/或主旨进行实现不同维度的数据的分类。再进一步的可以根据关键词和/或主旨,实现同维度下数据的细分粒度的进一步分类。在一些实施例中,将获取的商情数据输入到神经网络等深度学习模型,由深度学习模型通过黑盒子内部的数据处理,实现商量数据的自动分类。
根据有公信力部门提供的数据进行比对,去除伪劣数据,有公信力部门提供的数据可包括:政府公告的数据、税收部门的数据、证监会提供的数据等去除明显伪劣数据,再例如,根据S条商情数据的描述对象是相同的,但是其中有个别的条数描述情况不一样,可以直接排除个别描述不一致的商情数据;也可以根据将这S条商情数据都配置为可疑数据,进一步收集该描述对象的数据,等待结合数据量和足够判断描述对象的高公信力的商情数据,重写标注这些数据的可信度标签。该可信度标签可包括:可信数据、可疑数据、伪劣数据。
S120还可包括:存储完成商情数据分析和整理的数据。例如,在完成分类之后存储时,可以特定的存储顺序进行数据存储,例如,按照数据标签分库存储。例如,数据标签为可信数据的商情数据存储到可信数据库、将数据标签为可疑数据的商情数据存储到可疑数据库。
在需要生成商情简报时,在S120中会基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材。存储到可信库中的数据可作为目标素材的备选素材。
当然在基于可信库中的数据量不足以支持商情简报的生成时,可以考虑到从可疑数据库中选择数据。可疑数据库中的数据可配置有可疑因子,可疑因子越大则表示数据的可信度越低,此时,优先选择可以因子低的可疑数据补充可信数据作为目标素材,以生成商情简报。
当然在选取目标素材时,会根据商情简报的简报目的,选择与当前简报目的相符的数据作为所述目标素材。例如,想要了解A公司近一段时间的经营状况,此时,目标素材可能是与经营状况相关的数据,而与A公司的人员组织架构及知识产权数据等数据不相关。
在本申请实施例的S130中,简报生成模板包含有简报生成配置,电子设备可以根据简报生成配置自动生成包含目标素材的商情简报,或者,包含目标素材的商情简报。
例如,所述简报生成配指示了生成商情简报的相关参数,例如,可包括:所述商情简报的文件格式和/或所包含的内容。例如,针对销售数据的数据表格、针对销售数据的变化趋势图、目标实体与至少3个竞争对手的优势劣势的比较图表。
在一些实施例中,电子设备自动生成的商情简报中可包含所使用目标素材的链接地址,如此,用户在查看该商情简报有疑虑时,可以通过该链接地址直接链接到目标素材的原始数据。
采用本申请实施例提供的这种方法,电子设备会自动根据简报生成模板生成商情简报,如此不用人工去触发商情数据收集、整理及商情简报生成,通过简报生成模板中的数据配置,可以定期或不定期的生成商情简报,减少了很多没有人力和物力请专业公司提供商情简报的公司提供商情简报时,基于本申请实施例提供的方法通过电子设备生成所述商情简报,一方面降低了对于非专业人士而言商情简报生成的难度和成本,另一方面,设备相对于专业人士而言在数据分析处理层面,能够减少人为错误导致的商情简报的偏差现象,提升了商情简报的精确度。
与此同时,所述商情简报生成模板可以为基于作用于简报模板生成界面的用户输入,生成的。例如,在简报生成界面提供各种配置商情简报生成模板的配置选项输入控件或者文字输入控件。在一些实施例中,所述简报生成界面上还可用于接收当前商情简报生成的目的配置等。如此,方便有针对性的满足特定需求的商情简报。
在一些实施例中,所述商情简报可具有多种文件类型,例如,所述商情简报可为:文档格式的文字简报,和/或,可为视频格式的视频简报。
在一些实施例中,所述S110可包括以下至少之一:
收集目标实体自身的数据;
收集所述目标实体的上下游供应链的数据;
收集所述目标实体所提供产品和/或服务的竞品数据;
收集所述目标实体的新闻数据;
收集所述目标实体所提供产品和/或服务的宏观政策数据;、收集所述目标实体所提供产品和/或服务的市场数据;
收集所述目标实体的合作伙伴的数据。
以上仅是各个维度的数据进行举例说明,具体实现时不局限于上述任意维度的数据。
例如,所述收集目标实体自身的数据,包括以下至少之一:
收集所述目标实体的基础数据,其中,所述基础数据包括:所述目标实体所属或涉及的行业数据、、法人数据、团队数据、知识产权数据、所述目标实体提供的产品和/或服务的数据中的一个或多个;
收集所述目标实体的财务数据;
收集所述目标实体的经营活动数据;
收集所述目标实体的销售数据;
收集所述目标实体的公关数据。
在一些实施例中,所述基础数据还可包括:股东数据、与目标实体的关联实体的数据。例如,被目标实体控股的控股实体和/或控制目标实体的控股实体等。所述目标实体所提供产品和/或服务所形成的产业链数据。例如,有的企业单纯做手机、但是有的企业会做手机、同时会做智能穿戴设备(例如,智能手环或手表)或智能家居设备从而形成智能设备产业链。
团队数据可包括:团队人数、团队的年龄分层、受教育状况、团队所在地分布、团队内是否包含所在行业内知名专家。
知识产权数据可包括:商标数据、专利数据、著作权数据及有特点的装换数据等。基础数据可以通过目标实体的公开网站等途径获取。
前述财务数据可包括:财务部可提供的各种数据、收支数据、税务数据、员工的薪资福利发放数据、与供应商和采购者之间的财务往来。财务数据可以通过目标实体的税务缴纳数据中获取。
经营活动数据可包括各种与经营活动相关的数据,例如,新产品的发布会、公司内部的活动数据、招聘数据、裁员数据、上市数据、融资数据和/或股东更换数据。
在一些网络新闻和/或电视新闻等会报道对应的企业,从而形成新闻数据,新闻数据可以反映目标实体的经营状况和合作对象等数据。
在一些实施例中,如图2A所示,所述收集所述目标实体的上下游供应链的数据,包括:
S111A:识别所述目标实体所提供产品的说明,提取到所述产品提供所需的原料或者成分;
S112A:利用自然语言处理技术处理所述原料或成分得到进行数据搜索的关键词;
S113A:基于所述关键词对新闻数据库进行搜索,得到与所述目标实体所提供产品的原料或者成分的市场供应数据;
S114A:收集并整理为所述目标实体提供所述原料或成分的上游供应商的数据。
所述说明可为产品的说明书,通过说明书上记载的内容,可以分析出目标实体所提供产品的原料或成分。
在一些实施例中,所述S110还可包括:根据所述目标实体所提供的产品的销售数据,确定所述目标实体所提供产品的采购者的数据;以所述产品的标识数据搜索新闻数据库,得到所述目标实体所提供产品的市场供应数据。
若目标实体生成的产品不仅仅是直接面向消费者,则会有相应的采购者。通过供应商的数据和采购者的数据的获取,获得目标实体完整的供应链的数据。
在一些实施例中,如图2B所示,所述S110还可包括:
S111B:收集包含活动数据的新闻数据;
S112B:对所述新闻数据中的活动数据分词分析,得到所述活动数据所描述活动事件的关键词和特征;
S113B:基于所述关键词和特征,将所述活动事件进行分类,得到分类数据;
S114B:基于所述分类数据,选择出与所述目标实体相关的新闻数据。
在本申请实施例中可以从各类网站中收集新闻数据,然后利用各种自然语言技术,例如分词处理或者词袋处理等,得到一条新闻数据所描述对象的活动事件的关键词和特征。此处的关键词可包括:活动事件的名称、特征可包括:时间、地点、参与者、活动事件的发生目的和达到的效果等数据。
将得到的关键词和特征对活动事件进行分类得到分类数据,基于该分类数据,可以从海量的新闻数据中选择出于目标对象关联的新闻数据。
进一步地,所述基于所述分类数据,选择出与所述目标实体相关的新闻数据,包括:
利用所述目标实体的连接从实体库中获取所述目标实体的实体数据;
结合所述分类数据,计算新闻数据中所包含活动数据新闻数据与所述目标实体之间的最小图距离;
确定目标实体与所述活动事件之间的上下文相似度;
根据最小图距离和所述上行文相似度,确定出与所述目标实体相关的新闻数据。
实体库中存储有目标实体能够描述目标实体的数据。例如,实体的名称、曾用名、注册工商号、法人信息、高管信息和/或所提供产品的产品信息等。
在一些实施例中,所述实体数据以知识图谱的方式存储。在另一些实施例中,电子设备从实体库中获取到实体数据之后再生成知识图谱。
在另一些实施例中,所述实体数据以实体关系图。在另一些实施例中,电子设备还可以根据获取的实体数据自行生成实体关系图。
将分类信息在所述知识图谱或实体关系图中的相应实体,通过计算图距离,将最小的图距离作为判断对应新闻数据是否为目标实体的新闻数据的依据。
在一些实施例中,通过上下文消除企业。例如“苹果”可以指水果、苹果手机或者苹果公司,此时,需要通过上下文消除不同含义的匹配歧义,确保确定出的新闻数据的准确度。
在另一些实施例中,所述方法还包括:将计算最小图距离小于距离阈值的新闻数据确定为与目标实体相关的新闻数据,但是需要进一步确定该新闻数据与该目标实体的关联紧密程度。
在一些实施例中,所述素材获取配置包括:素材来源配置、标签命中规则和/或素材过滤规则;
所述简报生成配置包括:
触发规则;
简报显示规则;
文字显示规则。
所述素材获取配置,可限定了以下内容至少之一:
素材的来源、标签命中规则、素材过滤规则。素材过滤规则,可用于过滤素材的创建时间范围、所属文件、素材类型、音/视频时长范围及素材构图方式等的至少其中之一。
所述触发规则可包括:
手动触发规则,即在检测到用户输入时,触发商情简报的生成;
定时触发规则,按照预定的时间间隔,在前一次和商情情报生成间隔预定的时间间隔后,设备自动启动再次商情简报生成;
事件规则,即在识别出新闻数据表明目标实体的股价波动大于预设值时自动触发商情简报的生成,或者,检测到目标实体所提供产品和/或服务的市场价格波动达到特定值触发商情简报的生成。再例如,股市信息发现目标实体出现股价涨幅或股价下跌导致停牌时,触发商情简报的生成。当然此处仅是举例,具体的实现方式有很多种,不局限于此。
简报显示规则,例如,商情简报中可以综合企业自身,竞争对手,行业动态等多个维度的信息,可以设置各个维度的展示时间顺序,展示形态(词云,图表等)等。
商情简报的格式可能是:文本格式、也可能是图片格式、还可能是视频格式等。在商情简报中可包括图表、数据,当然也可以包括文字。此处的文字,可为特别标注的文字,可以动态的显示以提示观看者注意。例如,针对每一条资讯使用算法提取的一些关键属性元素的描述文字。
如图3所示,本发明实施例提供一种商情简报生成装置,包括:
收集模块210,被配置为收集目标实体的商情数据;
素材模块220,被配置为基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
生成模块230,被配置为基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
在一些实施例中,所述收集模块210、、素材模块220及生成模块230可为程序模块,所述程序模块被处理器执行后能够实现上述商情简报生成。
所述处理器可为各种类型的处理器,例如,微处理器、中央处理器、数字信号处理器、图像处理器等。
在另一些实施例中,所述收集模块210、、素材模块220及生成模块230可对应于软件和硬件的结合模块,例如,各种类型的可编程阵列;所述可编程阵列可包括:现场可编程阵列或者复杂可编程阵列。
在还有一些实施例,所述收集模块210、、素材模块220及生成模块230可对应于纯硬件模块;所述纯硬件模块可包括专用集成电路等。
在一些实施例中,所述收集模块210,具体用于执行以下至少之一:
收集目标实体自身的数据;
收集所述目标实体的上下游供应链的数据;
收集所述目标实体所提供产品和/或服务的竞品数据;
收集所述目标实体的新闻数据;
收集所述目标实体所提供产品和/或服务的宏观政策数据;、收集所述目标实体所提供产品和/或服务的市场数据;
收集所述目标实体的合作伙伴的数据。
在一些实施例中,所述收集模块210,用于执行以下之一:
收集所述目标实体的基础数据,其中,所述基础数据包括:所述目标实体所属或涉及的行业数据、、法人数据、团队数据、知识产权数据、所述目标实体提供的产品和/或服务的数据中的一个或多个;
收集所述目标实体的财务数据;
收集所述目标实体的经营活动数据;
收集所述目标实体的销售数据;
收集所述目标实体的公关数据。
在一些实施例中,所述收集模块210,具体用于识别所述目标实体所提供产品的说明,提取到所述产品提供所需的原料或者成分;
利用自然语言处理技术处理所述原料或成分得到进行数据搜索的关键词;
基于所述关键词对新闻数据库进行搜索,得到与所述目标实体所提供产品的原料或者成分的市场供应数据;
收集并整理为所述目标实体提供所述原料或成分的上游供应商的数据。
在一些实施例中,所述收集模块210,具体用于收集包含活动数据的新闻数据;
对所述新闻数据中的活动数据分词分析,得到所述活动数据所描述活动事件的关键词和特征;
基于所述关键词和特征,将所述活动事件进行分类,得到分类数据;
基于所述分类数据,选择出与所述目标实体相关的新闻数据。
在一些实施例中,所述收集模块210,具体用于利用所述目标实体的连接从实体库中获取所述目标实体的实体数据;
结合所述分类数据,计算新闻数据中所包含活动数据新闻数据与所述目标实体之间的最小图距离;
确定目标实体与所述活动事件之间的上下文相似度;
根据最小图距离和所述上行文相似度,确定出与所述目标实体相关的新闻数据。
在一些实施例中,所述素材获取配置包括:素材来源配置、标签命中规则和/或素材过滤规则;所述简报生成配置包括:触发规则;简报显示规则;文字显示规则。
本实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行代码;所述计算机可执行代码被执行后,能够用于实现前述一个或多个技术方案提供的商情简报生成方法,例如,图、图2/或图4所的商情简报生成方法。本实施例提供的计算机存储介质可为非瞬间存储介质。
以下结合上述任意实施例提供几个具体示例:
示例1
本示例提供一种商情简报生成方法,用于缩小企业上下游供应链范围,精准锁定相关事件,提高商情准确性和及时性,具体可包括:
采取对公司相关实体产品的产品配料/产品说明等有关数据提取,得出精准上游供应链目标;并通过对上层供应链的使用相似程度推导同类商品竞品及其对应公司
整合公司自主报道及外界报道,精准定位公司产品具体销售下游,合作伙伴或竞争对手
整理和归纳影响供应链上下游的各个参数,例如:国家政策,供应量,竞品公司,行业领军企业数据等
配置简报生成规则,将影响企业产品或者企业形象的相关属性按照一定规则设置,按照触发条件生成有针对性的商情报道。
示例2:
参考图4所示,以各个公司为目标单位进行数据收集并按照各相关维度归纳,以下是多个维度的举例,包括但不限于如下:
企业基础数据:所属行业、主要产品数据、企业法人、核心团队、研发人数、专利数量等;
企业财务数据:营收、利润、融资、负债、财报或破产等;
企业经营活动:产品数据、招聘数据、裁员消息、上市或投融资等;
企业销售下游:通过该公司对自己的PR新闻分析,推导出合作伙伴,下游销售对象,竞品公司等。
以具体产品为粒度获取企业某条产品线上的上游供应材料,并对该供应材料进行一下维度的分析。
对产品使用说明进行识别,提取产品的生产原料或者成分。
将该生产原料或者成分,利用分词,实体识别以及语意理解技术,对新闻库进行搜索,并对按照规定数据结构进行存储。
归纳该生产原料或者成分所在行业中生产占比最高的企业以及该企业的相关数据。
举例说明:
康师傅控股有限公司,拆解出来该公司下的所有产品,主要产品之一康师傅红烧牛肉面,提取主要配料如下:
面饼:特制小麦粉、精炼棕榈油(含维生素E)、淀粉;
肉酱包:精制棕榈油(含维生素E)、牛肉、葱、食用盐;
调味包:食用盐、麦芽糊精、味精、白砂糖、香辛料、食用香料;
蔬菜包:脱水高丽菜、脱水胡萝卜、脱水牛肉、脱水葱、脱水蛋黄、脱水大豆粨、脱水虾仁;
对所有配料以关键词形式进行新闻检索,并按照一定数据结构进行聚类,以牛肉为例:
牛肉涨跌趋势,牛肉单价,牛肉供应相关新闻;
国际牛肉市场,国内牛肉市场;
与牛肉相关的其他肉类数据;
收集并整理主要国内外牛肉供应公司(供应总量占市场K%以上,K可调节简报生成模板)和国内外其他相关肉类供应公司。
聚类所有有关成分该公司或者该行业的宏观经济新闻,例如国家政策,贸易制裁,所在城市政策等。
从某一产品使用的上游生产原料的相似度推算目标竞品产品可能性,从而推导出目标竞品公司。
对具体新闻使用的算法机器具体应用方法可如下:
公司活动事件分类模块对公司活动相关文本进行分词分析,抽取每种活动事件的关键词与特征,构建深度学习网络分类器按公司参与的活动不同作多分类,根据预先分类的文本进入不同的事件提取模版。
事件提取模块利用已经标注事件的文本训练序列标注模型,自动抽取文本中公司参与的事件名,同时文本会经过不同类型的预设模版抽取定义标准的事件要素比如时间、地点等并且对序列标注模型识别出来的结果进行清洗与修正,进一步提高识别的准确率。
实体识别模块利用实体链接与实体库将文本中具体的公司实体、公司相关人物实体等活动参与对象提取出来,将识别出来的人物、公司实体与活动事件计算最小图距离同时考虑实体与事件的上下文相似度进行匹配消歧,最后将不同类型的公司活动事件与活动要素分别输出与持久化存储。
配置简报生成模板,模板包括可包括如下配置:
素材获取配:包括素材的来源、标签命中规则、素材过滤规则(比如素材的创建时间范围、所属文件、素材类型、音/视频时长范围、素材构图方式等)
简报生成配置:
触发规则——手动触发,定时触发,事件触发(新增一条新闻,特定指标波动较大,例如,肉价大幅波动)
显示规则——比如商情简报中可以综合企业自身,竞争对手,行业动态等多个维度的数据,可以设置各个维度的展示时间顺序,展示形态(词云,图表等)
文字显示规则——针对每一条资讯使用算法提取的一些关键属性元素。
企业知识图谱的构建往往需要力度细且维度广,而且不容易有具体产出,无法命中用户想要的关键上下游竞品数据。通过从企业具体上下游数据着手,可以极大的缩小数据整理范围,为企业提供最好的商情资讯。
简报生成模板配置的流程,可包括:从具体产品上游原材料着手分析,对各行业各产品相关数据结构进行归纳及整理;将所有对产品有影响的指标进行综合排序,给出专业商情意见。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种商情简报生成方法,其特征在于,包括:
收集目标实体的商情数据;
基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
2.根据权利要求1所述的方法,其特征在于,所述收集目标实体的商情数据,包括以下至少之一:
收集目标实体自身的数据;
收集所述目标实体的上下游供应链的数据;
收集所述目标实体所提供产品和/或服务的竞品数据;
收集所述目标实体的新闻数据;
收集所述目标实体所提供产品和/或服务的宏观政策数据;、
收集所述目标实体所提供产品和/或服务的市场数据;
收集所述目标实体的合作伙伴的数据。
3.根据权利要求2所述的方法,其特征在于,所述收集目标实体自身的数据,包括以下至少之一:
收集所述目标实体的基础数据,其中,所述基础数据包括:所述目标实体所属或涉及的行业数据、、法人数据、团队数据、知识产权数据、所述目标实体提供的产品和/或服务的数据中的一个或多个;
收集所述目标实体的财务数据;
收集所述目标实体的经营活动数据;
收集所述目标实体的销售数据;
收集所述目标实体的公关数据。
4.根据权利要求2所述的方法,其特征在于,所述收集所述目标实体的上下游供应链的数据,包括:
识别所述目标实体所提供产品的说明,提取到所述产品提供所需的原料或者成分;
利用自然语言处理技术处理所述原料或成分得到进行数据搜索的关键词;
基于所述关键词对新闻数据库进行搜索,得到与所述目标实体所提供产品的原料或者成分的市场供应数据;
收集并整理为所述目标实体提供所述原料或成分的上游供应商的数据。
5.根据权利要求2至4任一项所述的方法,其特征在于,
所述收集所述目标实体的新闻数据,包括:
收集包含活动数据的新闻数据;
对所述新闻数据中的活动数据分词分析,得到所述活动数据所描述活动事件的关键词和特征;
基于所述关键词和特征,将所述活动事件进行分类,得到分类数据;
基于所述分类数据,选择出与所述目标实体相关的新闻数据。
6.根据权利要求5所述的方法,其特征在于,所述基于所述分类数据,选择出与所述目标实体相关的新闻数据,包括:
利用所述目标实体的连接从实体库中获取所述目标实体的实体数据;
结合所述分类数据,计算新闻数据中所包含活动数据新闻数据与所述目标实体之间的最小图距离;
确定目标实体与所述活动事件之间的上下文相似度;
根据最小图距离和所述上行文相似度,确定出与所述目标实体相关的新闻数据。
7.根据权利要求1所述的方法,其特征在于,所述素材获取配置包括:素材来源配置、标签命中规则和/或素材过滤规则;
所述简报生成配置包括:
触发规则;
简报显示规则;
文字显示规则。
8.一种商情简报生成装置,其特征在于,包括:
收集模块,被配置为收集目标实体的商情数据;
素材模块,被配置为基于简报生成模板包含的素材获取配置,从所述商情数据选择生成商情简报所需的目标素材;
生成模块,被配置为基于所述目标素材使用简报生成模板包含的简报生成配置,生成商情简报。
9.一种电子设备,其中,包括:
存储器;
处理器,与所述存储器连接,用于通过执行所述存储器上存储的计算机可执行指令,能够实现权利要求1至7任一项提供的方法。
10.一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现权利要求1至7任一项提供的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310442.5A CN111125351B (zh) | 2019-12-18 | 2019-12-18 | 商情简报生成方法及装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310442.5A CN111125351B (zh) | 2019-12-18 | 2019-12-18 | 商情简报生成方法及装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111125351A true CN111125351A (zh) | 2020-05-08 |
CN111125351B CN111125351B (zh) | 2023-05-26 |
Family
ID=70499658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911310442.5A Active CN111125351B (zh) | 2019-12-18 | 2019-12-18 | 商情简报生成方法及装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111125351B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035653A (zh) * | 2020-11-05 | 2020-12-04 | 北京智源人工智能研究院 | 一种政策关键信息提取方法和装置、存储介质、电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063411A (zh) * | 2013-09-12 | 2014-09-24 | 江苏金鸽网络科技有限公司 | 基于波特五力模型的企业情报收集方法 |
CN106960063A (zh) * | 2017-04-20 | 2017-07-18 | 广州优亚信息技术有限公司 | 一种针对招商引资领域的互联网情报抓取和推荐系统 |
US20180165724A1 (en) * | 2016-12-13 | 2018-06-14 | International Business Machines Corporation | Method and system for contextual business intelligence report generation and display |
CN108846592A (zh) * | 2018-07-11 | 2018-11-20 | 北京神州泰岳软件股份有限公司 | 一种基于大数据的企业评价报告生成方法及装置 |
TW201843639A (zh) * | 2017-05-04 | 2018-12-16 | 賴文復 | 金融商情分析平台 |
-
2019
- 2019-12-18 CN CN201911310442.5A patent/CN111125351B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063411A (zh) * | 2013-09-12 | 2014-09-24 | 江苏金鸽网络科技有限公司 | 基于波特五力模型的企业情报收集方法 |
US20180165724A1 (en) * | 2016-12-13 | 2018-06-14 | International Business Machines Corporation | Method and system for contextual business intelligence report generation and display |
CN106960063A (zh) * | 2017-04-20 | 2017-07-18 | 广州优亚信息技术有限公司 | 一种针对招商引资领域的互联网情报抓取和推荐系统 |
TW201843639A (zh) * | 2017-05-04 | 2018-12-16 | 賴文復 | 金融商情分析平台 |
CN108846592A (zh) * | 2018-07-11 | 2018-11-20 | 北京神州泰岳软件股份有限公司 | 一种基于大数据的企业评价报告生成方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035653A (zh) * | 2020-11-05 | 2020-12-04 | 北京智源人工智能研究院 | 一种政策关键信息提取方法和装置、存储介质、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111125351B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schleifer | Private governance undermined: India and the roundtable on sustainable palm oil | |
CN108734184B (zh) | 一种对敏感图像进行分析的方法及装置 | |
CN107833082B (zh) | 一种商品图片的推荐方法和装置 | |
CN107632984A (zh) | 一种聚类数据表的展现方法、装置和系统 | |
US9213733B2 (en) | Computerized internet search system and method | |
CN109542916A (zh) | 平台商品入驻方法、装置、计算机设备及存储介质 | |
Merler et al. | Snap, Eat, RepEat: A food recognition engine for dietary logging | |
US20150227973A1 (en) | Systems and methods for organizing search results and targeting advertisements | |
KR102458510B1 (ko) | 실시간 보완 가능한 마케팅 시스템 | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别系统及其方法 | |
CN107104875B (zh) | 信息推送的方法和装置 | |
CN117788109A (zh) | 一种基于大语言模型生成商品标签的方法及电子设备 | |
CN114926199A (zh) | 一种互联网营销受众精准分析方法和系统 | |
US10719561B2 (en) | System and method for analyzing popularity of one or more user defined topics among the big data | |
Rojas-Méndez et al. | Market orientation in the Chilean small business context: An empirical study | |
US20040098271A1 (en) | Method and system for tracking the lifecycles of technology items | |
CN105389714B (zh) | 一种从行为数据识别用户特性的方法 | |
Zhang et al. | Measuring similarity between brands using followers' post in social media | |
CN111125351B (zh) | 商情简报生成方法及装置、电子设备及存储介质 | |
KR102000663B1 (ko) | 빅데이터 및 인공지능을 활용한 이벤트 예측 시스템 및 그 방법 | |
CN115563176A (zh) | 一种电子商务数据处理系统及方法 | |
CN115879947A (zh) | 一种基于电子化交易的管理方法及系统 | |
CN111178934B (zh) | 获取目标对象的方法及装置 | |
KR20220118703A (ko) | 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법 | |
CN113254775A (zh) | 一种基于客户浏览行为序列的信用卡产品推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |