CN105718457B - 基于电子票据的信息推送方法及系统 - Google Patents
基于电子票据的信息推送方法及系统 Download PDFInfo
- Publication number
- CN105718457B CN105718457B CN201410720670.0A CN201410720670A CN105718457B CN 105718457 B CN105718457 B CN 105718457B CN 201410720670 A CN201410720670 A CN 201410720670A CN 105718457 B CN105718457 B CN 105718457B
- Authority
- CN
- China
- Prior art keywords
- commodity
- information
- category
- name
- belongs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是有关于一种基于电子票据的信息推送方法及系统,其中的方法包括:从收集到的各电子票据的商品明细字段中提取商品名称;根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别,并存储所述商品名称所属的商品类别以及电子票据中的相关信息;针对信息需求方的信息推送需求,根据所述存储的信息获得所述信息推送需求对应的统计结果信息;将所述统计结果信息推送给所述信息需求方;其中,所述商品本体树的叶节点为商品名称,且叶节点的上游节点为叶节点所属的商品类别。本发明提供的技术方案充分利用了电子票据所包含的信息,可方便快捷准确的为信息需求方提供有参考价值的推送信息。
Description
技术领域
本发明涉及信息推送技术,特别是涉及一种基于电子票据的信息推送方法及系统。
背景技术
随着我国法律制度的逐渐健全以及互联网络的蓬勃发展,电子票据在我国的应用范围会越来越广泛。电子票据是实物票据电子化的产物。电子票据通常包括:电子发票以及电子销售收据等等。
发明人在实现本发明过程中发现,电子票据中包含有一定的信息,如果能对电子票据所包含的信息进行充分利用,则电子票据可以为信息需求方提供有参考价值的信息;目前电子票据所包含的信息并没有得到充分利用。
有鉴于目前并没有对电子票据所包含的信息进行充分利用的现状,本发明人基于从事此类产品设计制造多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期创设一种基于电子票据的信息推送方法及系统,能够解决现有的没有对电子票据所包含的信息进行充分利用这一问题,使其更具有实用性。经过不断的研究设计,并经过反复试作样品及改进后,终于创设出确具实用价值的本发明。
发明内容
本发明的目的之一在于,解决现有的没有对电子票据所包含的信息进行充分利用的问题,而提供一种基于电子票据的信息推送方法及系统,所要解决的技术问题是,充分利用电子票据中所包含的信息,为信息需求方提供有参考价值的推送信息。
本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
依据本发明提出的一种基于电子票据的信息推送方法,包括:从收集到的各电子票据的商品明细字段中提取商品名称;根据预先设定的商品本体树查找所述商品名称所属的商品类别,并存储商品名称所属的商品类别以及所述电子票据中的相关信息;针对信息需求方的信息推送需求,根据所述存储的信息获得所述信息推送需求对应的统计结果信息;将所述统计结果信息推送给所述信息需求方;其中,所述商品本体树的叶节点为商品名称,且叶节点的上游节点为叶节点所属的商品类别。
依据本发明提出的一种基于电子票据的信息推送系统,主要包括:提取商品名称模块,适于从收集到的各电子票据的商品明细字段中提取商品名称;确定商品类别模块,适于根据预先设定的商品本体树查找所述商品名称所属的商品类别,并存储所述商品名称所属的商品类别以及所述电子票据中的相关信息;信息需求分析模块,适于针对信息需求方的信息推送需求,根据存储的信息获得所述信息推送需求对应的统计结果信息;信息推送模块,适于将所述统计结果信息推送给所述信息需求方。
借由上述技术方案,本发明的基于电子票据的信息推送方法及系统至少具有下列优点及有益效果:本发明通过利用商品本体树来确定各电子票据的商品明细字段中的商品名称所属的商品类别,可以方便快捷的积累大量的商品类别以及电子票据中的相关信息(如销售数量和销售时间等),这些通过积累获得的信息基本上都是真实有效的基础数据,这样,在利用这些基础数据为信息需求方提供满足其信息推送需求的推送信息时,则能够为信息需求方提供满足其多种需求的有实际参考价值的推送信息;从而本发明提供的技术方案对电子票据中所包含的信息进行了充分利用,可方便快捷准确的为信息需求方提供有参考价值的推送信息。
综上所述,本发明在技术上有显著的进步,并具有明显的积极技术效果,诚为一新颖、进步、实用的新设计。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。
附图说明
图1是本发明实施例一的基于电子票据的信息推送方法的流程图;
图2是本发明实施例二的基于电子票据的信息推送系统的示意图。
具体实施方式
下面结合附图对本发明实施例的基于电子票据的信息推送方法及系统进行详细说明。
实施例一、基于电子票据的信息推送方法,其流程如图1所示。
图1中,S100、从收集到的各电子票据的商品明细字段中分别提取商品名称。
具体的,本实施例中的电子票据可以为电子发票,也可以为电子销售收据等。一张电子票据的商品明细字段中通常会包括一个商品名称或者多个商品名称,在一张电子票据的商品明细字段中包括多个商品名称的情况下,可以将该电子票据的商品明细字段中的所有的商品名称同时提取出来或者依次提取出来。另外,从商品明细字段中提取出来的商品名称有可能为通用的商品名称,也有可能为不通用的商品名称。
本实施例为了给信息需求方提供的统计结果信息更有参考价值,本步骤中收集到的电子票据的数量应尽可能的多一些,并应该尽可能的从收集到的所有电子票据的商品明细字段中提取所有的商品名称。
S110、根据预先设定的商品本体树查找上述提取的商品名称所属的商品类别,并存储商品名称所属的商品类别以及电子票据中的相关信息。
具体的,本实施例中的商品本体树的叶节点为商品名称(通常为通用的商品名称),且非叶节点为叶节点所属的商品类别,这里的非叶节点即叶节点的上游节点,且叶节点的上游节点可以包括:从叶节点的父节点开始一直到商品本体树的根节点。
本实施例中的商品本体树是利用已知的商品名称以及已知的商品名称所属的商品类别来建立的,建立本实施例中的商品本体树的一个具体例子为:通过网页爬取方式从互联网中获取商品名称和商品名称所属的商品类别,如通过网页爬取方式从国内某大型购物网站提供的页面中获取商品名称和商品名称所属的商品类别;然后,根据爬取获得的所有商品名称和各商品名称所属的商品类别建立商品本体树。
本实施例中的商品本体树通常需要根据实际应用而更新维护,以使商品本体树不断完善。本实施例可以通过维护人员的人工操作来更新维护商品本体树;本实施例也可以在根据S100中获取的商品名称从商品本体树中查找不到该商品名称所属的商品类别、且通过其他方式获知了该商品名称所属的商品类别的情况下,自动据此更新维护商品本体树,如在通过网页爬取方式从互联网中获得了电子票据的商品明细字段中的商品名称所属的商品类别后,自动的在商品本体树中针对该商品名称在相应的商品类别下添加叶节点或者针对该商品名称以及商品类别自动在商品本体树的相应位置处增加非叶节点以及叶节点。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第一个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第二个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则对该商品名称进行分词处理,以获得至少一个关键词,将获得的所有的关键词进行组合,获得新的商品名称,之后,将获得的新的商品名称再次与商品本体树中的叶节点进行匹配,并将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第三个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站提供的网页中搜索从商品明细字段中提取的商品名称所属的商品类别,将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第四个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则对该商品名称进行分词处理,以获得至少一个关键词,将获得的所有的关键词进行组合,从而获得新的商品名称,之后,通过网页爬取方式从互联网中获取该新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索上述新的商品名称所属的商品类别,将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第五个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则对该商品名称进行分词处理,以获得至少一个关键词,将获得的所有的关键词进行组合,从而获得新的商品名称,之后,将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则通过网页爬取方式从互联网中获取该新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索该新的商品名称所属的商品类别,将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第六个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则对该商品名称进行分词处理,以获得至少一个关键词,将获得的所有的关键词进行组合,从而获得新的商品名称,之后,将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索从商品明细字段中提取的商品名称所属的商品类别,将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
本实施例根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第七个具体的例子为:将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则对该商品名称进行分词处理,以获得至少一个关键词,将获得的所有的关键词进行组合,从而获得新的商品名称,之后,将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索从商品明细字段中提取的商品名称所属的商品类别,如果通过网页爬取获得了商品类别,则将获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别;如果通过网页爬取没有获得商品类别,则通过网页爬取方式从互联网中获取上述新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索该新的商品名称所属的商品类别,将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
在通过上述方法不能获得从商品明细字段中提取的商品名称所属的商品类别的情况下,可以输出相应的提示信息,以便于维护人员获知,并采用其他方法设置该商品名称所属的商品类别。
在商品本体树中不存在与电子票据的商品明细字段中的商品名称相对应的叶节点的情况下,本实施例可以针对该商品名称对商品本体树进行更新维护,下面简单例举几种商品本体树更新维护的具体例子。
第一种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据该商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第二种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据由该商品名称中的关键词组合而成的新的商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第三种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据该商品名称在商品本体树中相应的商品类型下增加新的叶节点,同时,根据由该商品名称中的关键词组合而成的新的商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第四种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据通过网页爬取方式获得的该商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据该商品名称为该子节点增加叶节点。
第五种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据通过网页爬取方式获得的商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据该商品名称中的关键词组成的新的商品名称为该子节点增加叶节点。
第六种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,根据通过网页爬取方式获得的商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据从商品明细字段中提取的商品名称为该子节点增加叶节点,同时,根据该商品名称中的关键词组成的新的商品名称为该子节点增加叶节点。
本实施例在获得了商品明细字段中的商品名称所属的商品类别后,可以将从商品明细字段中提取的商品名称、对应的商品类别、商品销售时间以及商品名称对应的商品销售数量等信息采用表或数据库等方式存储,也可以将从商品明细字段中提取的商品名称中的关键词组成的新的商品名称、对应的商品类别、商品销售时间、商品销售单价以及商品名称对应的商品销售数量等信息采用表或者数据库等方式存储。
另外,本实施例还可以将电子票据中的电子票据出具方信息与上述商品名称等信息一并对应存储于表或者数据库中;该电子票据出具方信息如电子票据的纳税人名称字段中的内容(如出具电子票据方的中文名称)和/或出具电子票据方的纳税人税务登记号等,该电子票据出具方信息还可以包括电子票据出具方所属的企业类别等。
S120、针对信息需求方的信息推送需求,根据上述存储的信息获得信息推送需求对应的统计结果信息;
具体的,本实施例中的信息推送需求通常是信息需求方根据实际情况设置的,该信息推送需求可以为某段时间范围内某商品的销售总量,信息推送需求也可以为时间范围内某种企业类别的企业销售某商品的总量,信息推送需求还可以为前N个月(如半年或者一个季度)内某商品每个月的销售数量,信息推送需求还可以为前N个月内某种企业类别的企业每个月销售某商品的数量。本实施例不限制信息推送需求的具体表现形式。另外,本实施例中的信息需求方可以为电子票据出具方。
本实施例的根据存储的信息获得信息推送需求对应的统计结果信息的一个具体的例子为:确定信息需求方所属的企业类别,如先获取信息需求方所涉及的主要商品分别所属的商品类别或者所有商品分别所属的商品类别,然后,根据商品本体树确定上述各商品类别共同所属的商品类别,并将该共同所属的商品类别确定为信息需求方所述的企业类别;再如,先获取信息需求方所涉及的主要商品分别所属的商品类别或者所有商品分别所属的商品类别,然后,根据商品本体树确定上述各商品类别共同所属的商品类别,将该共同所属的商品类别确定为信息需求方所述的企业类别,之后,根据信息需求方的规模(如经营规模或者销售规模等)对信息需求方所属的企业类别进行进一步的细分类;在确定了信息需求方所属的企业类别之后,根据上述记录存储的信息以及信息需求方所属的企业类别进行统计分析,从而获得信息推送需求所对应的统计结果信息。本实施例的统计结果信息可以采用表、折线图、柱状图以及饼状图等多种方式。本实施例不限制确定信息需求方所属的企业类别的具体实现方式、统计分析的具体实现过程以及统计结果信息的表现形式。
S130、将上述获得的统计结果信息推送给信息需求方。
具体的,本实施例可以通过互联网、移动通信网络或者传真等方式将统计结果信息推送给信息需求方,本实施例不限制将统计结果信息推送给信息需求方的具体实现方式。
实施例二、基于电子票据的信息推送系统,该系统如图2所示。
图2中,本实施例的基于电子票据的信息推送系统主要包括:提取商品名称模块200、确定商品类别模块210、信息需求分析模块220以及信息推送模块230;可选的,该系统还可以包括:商品本体树建立模块240以及商品本体树维护模块250。
提取商品名称模块200主要适于从收集到的各电子票据的商品明细字段中提取商品名称。
具体的,一张电子票据的商品明细字段中通常会包括一个商品名称或者多个商品名称,在一张电子票据的商品明细字段中包括多个商品名称的情况下,提取商品名称模块200可以将该电子票据的商品明细字段中的所有的商品名称同时提取出来或者依次提取出来。提取商品名称模块200从商品明细字段中提取出来的商品名称有可能为通用的商品名称,也有可能为不通用的商品名称。
本实施例为了给信息需求方提供的统计结果信息更有参考价值,提取商品名称模块200应尽可能的从收集到的所有电子票据的商品明细字段中提取所有的商品名称。
确定商品类别模块210主要适于根据预先设定的商品本体树查找提取商品名称模块200提取的商品名称所属的商品类别,并存储商品名称所属的商品类别以及电子票据中的相关信息。
具体的,商品本体树的叶节点为商品名称,且非叶节点为叶节点所属的商品类别,这里的非叶节点即叶节点的上游节点,且叶节点的上游节点可以包括:从叶节点的父节点开始一直到商品本体树的根节点。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第一个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第二个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210对该商品名称进行分词处理,以获得至少一个关键词,确定商品类别模块210将获得的所有的关键词进行组合,获得新的商品名称,确定商品类别模块210将获得的新的商品名称再次与商品本体树中的叶节点进行匹配,并将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第三个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站提供的网页中搜索从商品明细字段中提取的商品名称所属的商品类别,确定商品类别模块210将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第四个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210对该商品名称进行分词处理,以获得至少一个关键词,确定商品类别模块210将获得的所有的关键词进行组合,从而获得新的商品名称,之后,确定商品类别模块210通过网页爬取方式从互联网中获取该新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索上述新的商品名称所属的商品类别,确定商品类别模块210将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第五个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210对该商品名称进行分词处理,以获得至少一个关键词,确定商品类别模块210将获得的所有的关键词进行组合,从而获得新的商品名称,之后,将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则确定商品类别模块210通过网页爬取方式从互联网中获取该新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索该新的商品名称所属的商品类别,确定商品类别模块210将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第六个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210对该商品名称进行分词处理,以获得至少一个关键词,确定商品类别模块210将获得的所有的关键词进行组合,从而获得新的商品名称,确定商品类别模块210将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则确定商品类别模块210通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索从商品明细字段中提取的商品名称所属的商品类别,确定商品类别模块210将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
确定商品类别模块210根据预先设定的商品本体树查找从商品明细字段中提取的商品名称所属的商品类别的第七个具体的例子为:确定商品类别模块210将从商品明细字段中提取的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;如果不存在匹配的叶节点,则确定商品类别模块210对该商品名称进行分词处理,以获得至少一个关键词,确定商品类别模块210将获得的所有的关键词进行组合,从而获得新的商品名称,确定商品类别模块210将获得的新的商品名称与商品本体树中的叶节点进行匹配,如果商品本体树中存在匹配的叶节点,则确定商品类别模块210将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别,如果不存在匹配的叶节点,则确定商品类别模块210通过网页爬取方式从互联网中获取从商品明细字段中提取的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索从商品明细字段中提取的商品名称所属的商品类别,如果通过网页爬取获得了商品类别,则确定商品类别模块210将获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别;如果通过网页爬取没有获得商品类别,则确定商品类别模块210通过网页爬取方式从互联网中获取上述新的商品名称所属的商品类别,如通过网页爬取方式从国内的大型购物网站中搜索该新的商品名称所属的商品类别,确定商品类别模块210将通过网页爬取获得的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
在确定商品类别模块210通过上述方法仍不能获得从商品明细字段中提取的商品名称所属的商品类别的情况下,确定商品类别模块210可以输出相应的提示信息,以便于维护人员获知,并采用其他方法设置该商品名称所属的商品类别。
确定商品类别模块210在获得了商品明细字段中的商品名称所属的商品类别后,可将从商品明细字段中提取的商品名称、对应的商品类别、商品销售时间以及商品名称对应的商品销售数量等信息采用表或数据库等方式存储,也可以将从商品明细字段中提取的商品名称中的关键词组成的新的商品名称、对应的商品类别、商品销售时间、商品销售单价以及商品名称对应的商品销售数量等信息采用表或者数据库等方式存储。
另外,确定商品类别模块210还可以将电子票据中的电子票据出具方信息与上述商品名称等信息一并对应存储于表或者数据库中;该电子票据出具方信息如电子票据的纳税人名称字段中的内容(如出具电子票据方的中文名称)和/或出具电子票据方的纳税人税务登记号等,该电子票据出具方信息还可以包括电子票据出具方所属的企业类别等。
信息需求分析模块220主要适于针对信息需求方的信息推送需求,根据存储的信息获得信息推送需求对应的统计结果信息。
具体的,信息需求分析模块220根据存储的信息获得信息推送需求对应的统计结果信息的一个具体的例子为:信息需求分析模块220确定信息需求方所属的企业类别,如信息需求分析模块220先获取信息需求方所涉及的主要商品分别所属的商品类别或者所有商品分别所属的商品类别,然后,信息需求分析模块220根据商品本体树确定上述各商品类别共同所属的商品类别,并将该共同所属的商品类别确定为信息需求方所述的企业类别;再如,信息需求分析模块220先获取信息需求方所涉及的主要商品分别所属的商品类别或者所有商品分别所属的商品类别,然后,信息需求分析模块220根据商品本体树确定上述各商品类别共同所属的商品类别,将该共同所属的商品类别确定为信息需求方所述的企业类别,之后,信息需求分析模块220根据信息需求方的规模(如经营规模或者销售规模等)对信息需求方所属的企业类别进行进一步的细分类;在确定了信息需求方所属的企业类别之后,信息需求分析模块220根据上述记录存储的信息以及信息需求方所属的企业类别进行统计分析,从而获得信息推送需求所对应的统计结果信息。信息需求分析模块220可以采用表、折线图、柱状图以及饼状图等多种方式来体现统计结果信息。本实施例不限制信息需求分析模块220确定信息需求方所属的企业类别的具体实现方式、信息需求分析模块220统计分析的具体实现过程以及统计结果信息的表现形式。
信息推送模块230主要适于将信息需求分析模块220获得的统计结果信息推送给信息需求方。
具体的,信息推送模块230可以通过互联网、移动通信网络或者传真等方式将统计结果信息推送给信息需求方,本实施例不限制信息推送模块230将统计结果信息推送给信息需求方的具体实现方式。
商品本体树建立模块240主要适于通过网页爬取方式获取多个商品名称和商品名称所属的商品类别,并根据爬取的各商品名称和商品名称所属的商品类别建立商品本体树。
具体的,商品本体树建立模块240是利用已知的商品名称以及已知的商品名称所属的商品类别来建立商品本体树的。
商品本体树建立模块240建立本实施例中的商品本体树的一个具体例子为:商品本体树建立模块240通过网页爬取方式从互联网中获取商品名称和商品名称所属的商品类别,如通过网页爬取方式从国内某大型购物网站提供的页面中获取商品名称和商品名称所属的商品类别;然后,商品本体树建立模块240根据爬取获得的所有商品名称和各商品名称所属的商品类别建立商品本体树。
商品本体树维护模块250主要适于根据关键词组成的商品名称以及关键词组成的商品名称所属的商品类别更新商品本体树。
具体的,在商品本体树中不存在与电子票据的商品明细字段中的商品名称相对应的叶节点的情况下,商品本体树维护模块250可以针对该商品名称对商品本体树进行更新维护,下面简单例举几种商品本体树更新维护的具体例子。
第一种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据该商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第二种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据由该商品名称中的关键词组合而成的新的商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第三种更新维护的具体例子为:在商品本体树中存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据该商品名称在商品本体树中相应的商品类型下增加新的叶节点,且商品本体树维护模块250还会根据由该商品名称中的关键词组合而成的新的商品名称在商品本体树中相应的商品类型下增加新的叶节点。
第四种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据通过网页爬取方式获得的该商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据该商品名称为该子节点增加叶节点。
第五种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据通过网页爬取方式获得的商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据该商品名称中的关键词组成的新的商品名称为该子节点增加叶节点。
第六种更新维护的具体例子为:在商品本体树中不存在从商品明细字段中提取的商品名称所属的商品类别的情况下,商品本体树维护模块250根据通过网页爬取方式获得的商品名称所属的商品类别在商品本体树中相应的商品类型下增加新的商品类别子节点,并根据从商品明细字段中提取的商品名称为该子节点增加叶节点,同时,商品本体树维护模块250根据该商品名称中的关键词组成的新的商品名称为该子节点增加叶节点。
以上所述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (7)
1.一种基于电子票据的信息推送方法,其特征在于,包括:
从收集到的各电子票据的商品明细字段中提取商品名称;
根据预先设定的商品本体树查找所述商品名称所属的商品类别,并存储所述商品名称所属的商品类别以及所述电子票据中的相关信息;
针对信息需求方的信息推送需求,根据所述存储的信息获得所述信息推送需求对应的统计结果信息;
将所述统计结果信息推送给所述信息需求方;
其中,所述商品本体树的叶节点为商品名称,且叶节点的上游节点为叶节点所属的商品类别;
其中,通过网页爬取方式获取多个商品名称和商品名称所属的商品类别,并根据爬取的各商品名称和商品名称所属的商品类别建立所述商品本体树;
其中,所述根据预先设定的商品本体树查找所述商品名称所属的商品类别包括:
将从所述商品明细字段中提取的商品名称与所述商品本体树中的叶节点进行匹配;
如果存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为所述商品名称所属的商品类别;
如果不存在匹配的叶节点,则对从商品明细字段中提取的商品名称进行分词处理,将由分词处理所获得的各关键词组成的商品名称与所述商品本体树中的叶节点进行匹配,并将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;
所述根据预先设定的商品本体树查找所述商品名称所属的商品类别还包括:
在商品本体树中不存在与所述关键词组成的商品名称匹配的叶节点的情况下,通过网页爬取方式获取所述关键词组成的商品名称所属的商品类别,并将爬取的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述关键词组成的商品名称以及所述关键词组成的商品名称所属的商品类别更新所述商品本体树。
3.如权利要求1所述的方法,其特征在于,所述电子票据中的相关信息包括:所述商品名称对应的销售时间、所述商品名称对应的销售数量、所述商品名称对应的销售单价以及电子票据出具方信息中的至少一个。
4.如权利要求1至3中任一权利要求所述的方法,其特征在于,所述根据所述存储的信息获得所述信息推送需求对应的统计结果信息包括:
获取信息需求方所涉及的商品类别,根据所述信息需求方所涉及的商品类别确定信息需求方所属的企业类别;
根据所述存储的信息以及信息需求方所属的企业类别获得所述信息推送需求对应的统计结果信息。
5.如权利要求4所述的方法,其特征在于,所述根据所述信息需求方所涉及的商品类别确定信息需求方所属的企业类别还包括:
根据信息需求方的规模对所述信息需求方所属的企业类别进行进一步分类。
6.一种基于电子票据的信息推送系统,其特征在于,包括:
提取商品名称模块,适于从收集到的各电子票据的商品明细字段中提取商品名称;
确定商品类别模块,适于根据预先设定的商品本体树查找所述商品名称所属的商品类别,并存储所述商品名称所属的商品类别以及所述电子票据中的相关信息;
信息需求分析模块,适于针对信息需求方的信息推送需求,根据所述存储的信息获得所述信息推送需求对应的统计结果信息;
信息推送模块,适于将所述统计结果信息推送给所述信息需求方;
所述系统还包括:
商品本体树建立模块,适于通过网页爬取方式获取多个商品名称和商品名称所属的商品类别,并根据爬取的各商品名称和商品名称所属的商品类别建立所述商品本体树;
其中,所述确定商品类别模块具体适于:
将从所述商品明细字段中提取的商品名称与所述商品本体树中的叶节点进行匹配;
如果存在匹配的叶节点,则将匹配的叶节点的所有上游节点作为所述商品名称所属的商品类别;
如果不存在匹配的叶节点,则对从商品明细字段中提取的商品名称进行分词处理,将由分词处理所获得的各关键词组成的商品名称与所述商品本体树中的叶节点进行匹配,并将匹配的叶节点的所有上游节点作为从商品明细字段中提取的商品名称所属的商品类别;
其中,所述确定商品类别模块还具体适于:
在商品本体树中不存在与所述关键词组成的商品名称匹配的叶节点的情况下,通过网页爬取方式获取所述关键词组成的商品名称所属的商品类别,并爬取的商品类别作为从商品明细字段中提取的商品名称所属的商品类别。
7.如权利要求6所述的系统,其特征在于,所述系统包括:
商品本体树维护模块,适于根据所述关键词组成的商品名称以及所述关键词组成的商品名称所属的商品类别更新所述商品本体树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410720670.0A CN105718457B (zh) | 2014-12-01 | 2014-12-01 | 基于电子票据的信息推送方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410720670.0A CN105718457B (zh) | 2014-12-01 | 2014-12-01 | 基于电子票据的信息推送方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105718457A CN105718457A (zh) | 2016-06-29 |
CN105718457B true CN105718457B (zh) | 2021-03-26 |
Family
ID=56146373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410720670.0A Active CN105718457B (zh) | 2014-12-01 | 2014-12-01 | 基于电子票据的信息推送方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105718457B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112673392A (zh) * | 2018-09-12 | 2021-04-16 | 华为技术有限公司 | 用于推荐数字广告和发布者的系统和方法 |
CN109300003B (zh) * | 2018-09-17 | 2023-06-02 | 平安科技(深圳)有限公司 | 企业推荐方法、装置、计算机设备和存储介质 |
CN109800242A (zh) * | 2018-12-26 | 2019-05-24 | 广州联业商用机器人科技股份有限公司 | 一种销售数据的处理方法及系统 |
CN110046978A (zh) * | 2019-03-19 | 2019-07-23 | 上海大学 | 智能报销方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737057A (zh) * | 2011-04-14 | 2012-10-17 | 阿里巴巴集团控股有限公司 | 一种商品类目信息的确定方法及装置 |
CN103310343A (zh) * | 2012-03-15 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 商品信息发布方法和装置 |
CN103345645A (zh) * | 2013-06-27 | 2013-10-09 | 复旦大学 | 面向网购平台的商品图像类别预测方法 |
CN103425732A (zh) * | 2012-05-24 | 2013-12-04 | 云端行动科技股份有限公司 | 电子发票资料处理方法 |
CN103995905A (zh) * | 2014-06-13 | 2014-08-20 | 重庆大学 | 一种电子商务内容多维分类、导航及跳转方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8805720B2 (en) * | 2006-12-20 | 2014-08-12 | Microsoft Corporation | Feedback loop for consumer transactions |
WO2009132664A1 (en) * | 2008-04-29 | 2009-11-05 | Nec Europe, Ltd. | Method and system for providing recommendations to users |
-
2014
- 2014-12-01 CN CN201410720670.0A patent/CN105718457B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737057A (zh) * | 2011-04-14 | 2012-10-17 | 阿里巴巴集团控股有限公司 | 一种商品类目信息的确定方法及装置 |
CN103310343A (zh) * | 2012-03-15 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 商品信息发布方法和装置 |
CN103425732A (zh) * | 2012-05-24 | 2013-12-04 | 云端行动科技股份有限公司 | 电子发票资料处理方法 |
CN103345645A (zh) * | 2013-06-27 | 2013-10-09 | 复旦大学 | 面向网购平台的商品图像类别预测方法 |
CN103995905A (zh) * | 2014-06-13 | 2014-08-20 | 重庆大学 | 一种电子商务内容多维分类、导航及跳转方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105718457A (zh) | 2016-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106156127B (zh) | 选择数据内容向终端推送的方法及装置 | |
WO2019214245A1 (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN105468605B (zh) | 一种实体信息图谱生成方法及装置 | |
CN109359244A (zh) | 一种个性化信息推荐方法和装置 | |
CN103294781B (zh) | 一种用于处理页面数据的方法与设备 | |
CN103631929B (zh) | 一种用于搜索的智能提示的方法、模块和系统 | |
CN103400286B (zh) | 一种基于用户行为进行物品特征标注的推荐系统及方法 | |
US20120102015A1 (en) | Method and System for Performing a Comparison | |
CN103455613B (zh) | 基于MapReduce模型的兴趣感知服务推荐方法 | |
CN103235803B (zh) | 一种从文本中获取物品属性值的方法和装置 | |
CN104252456B (zh) | 一种权重估计方法、装置及系统 | |
SG152180A1 (en) | Website management method and on-line system | |
CN103778555A (zh) | 基于用户标签的用户属性挖掘方法和系统 | |
CN103310003A (zh) | 一种基于点击日志的新广告点击率预测方法及系统 | |
CN105718457B (zh) | 基于电子票据的信息推送方法及系统 | |
CN107657057A (zh) | 一种企业征信信息融合图形化方法 | |
KR101505858B1 (ko) | 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템 | |
CN104156450A (zh) | 一种基于用户网络数据的物品信息推荐方法 | |
CN104598647A (zh) | 一种树图搜索和匹配物品的方法 | |
CN105023178B (zh) | 一种基于本体的电子商务推荐方法 | |
CN106547864A (zh) | 一种基于查询扩展的个性化信息检索方法 | |
CN103324708A (zh) | 一种长文本到短文本的迁移学习方法 | |
CN104615734B (zh) | 一种社区管理服务大数据处理系统及其处理方法 | |
JP6375029B2 (ja) | レポートの重要度を分析するメタデータ基盤のオンライン分析処理システム | |
Giri et al. | Big data-overview and challenges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |