CN112417251A - 一种基于风电竞价的交易信息检索方法及装置 - Google Patents
一种基于风电竞价的交易信息检索方法及装置 Download PDFInfo
- Publication number
- CN112417251A CN112417251A CN202011371811.4A CN202011371811A CN112417251A CN 112417251 A CN112417251 A CN 112417251A CN 202011371811 A CN202011371811 A CN 202011371811A CN 112417251 A CN112417251 A CN 112417251A
- Authority
- CN
- China
- Prior art keywords
- information
- webpage
- data table
- wind power
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000009193 crawling Effects 0.000 claims abstract description 19
- 238000004891 communication Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S50/00—Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
- Y04S50/10—Energy trading, including energy flowing from end-user application to grid
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于风电竞价的交易信息检索方法及装置。包括:获取用户信息需求,根据该信息需求获取对应网页信息;对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;将信息数据表存入数据库中对数据库进行更新。本发明通过对获取到的网页信息进行解析,能够依次得到精准的用户需求数据,同时能够爬取更多相关信息,提高用户信息需求的精度,同时设定属性分类标准与用户信息需求结合,能够生成每个用户的画像模型,为用户电力交易决策提供辅助,提升用户体验。
Description
技术领域
本发明涉及风电竞价技术领域,尤其涉及一种基于风电竞价的交易信息检索方法及装置。
背景技术
在现有的电力市场环境下,开展策略性竞价是市场参与者的重要决策之一,各市场参与者需要向电力交易中心策略报价以达到自身价值最大化的目的。在电力撮合交易中,科学合理的竞价行为可以有效提高市场活力,优化资源的配置。
现有的风电竞价要获取交易对手和客户的信息方式比较单一,而且信息比较难以获取,只能通过线下沟通或者利用电网公开的一些信息来获取交易主体的基本信息,这种信息获取方式不仅效率低下,而且获取的消息还不够全面,不能有效为风电企业竞价提供足够的市场信息,所以,亟需对现有的信息获取方法进行改进。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于风电竞价的交易信息检索方法及装置,旨在解决现有技术无法实现通过爬虫系统根据客户需求全面精确爬取客户需求信息的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于风电竞价的交易信息检索方法,所述基于风电竞价的交易信息检索方法包括以下步骤:
S1,获取用户信息需求,根据该信息需求获取对应网页信息;
S2,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
S3,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
S4,将信息数据表存入数据库中对数据库进行更新。
在以上技术方案的基础上,优选的,步骤S1中,获取用户信息需求,根据该信息需求获取对应网页信息,还包括以下步骤,获取用户信息需求,根据该信息需求搜索对应的网页信息,并向该网页信息对应的服务器发送请求,当收到服务器反馈时,获取该网页信息。
在以上技术方案的基础上,优选的,步骤S2中,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据,还包括以下步骤,通过正则表达式对该网页信息进行解析,获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL 信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果。
在以上技术方案的基础上,优选的,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果,还包括以下步骤,根据网页解析结果建立不同分类集合,根据该分类集合建立网页解析数据表,将该网页解析数据表存入数据库中,通过爬取的网页的解析结果建立新网页解析数据表,根据该新网页解析数据表对网页解析数据表进行更新。
在以上技术方案的基础上,优选的,步骤S3中,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表,还包括以下步骤,设定属性分类标准,所述分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立信息数据表。
在以上技术方案的基础上,优选的,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立新数据表,还包括以下步骤,结合信息数据表以及网页解析数据表对每个用户的需求进行分析,并建立用户画像模型,生成对应的信息检索建议。
在以上技术方案的基础上,优选的,步骤S4中,将信息数据表存入数据库中对数据库进行更新,还包括以下步骤,将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新。
更进一步优选的,所述基于风电竞价的交易信息检索装置包括:
获取模块,用于获取用户信息需求,根据该信息需求获取对应网页信息;
解析爬取模块,用于对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
分类模块,用于设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
更新模块,用于将信息数据表存入数据库中对数据库进行更新。
第二方面,所述基于风电竞价的交易信息检索方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序配置为实现如上文所述的基于风电竞价的交易信息检索方法的步骤。
第三方面,所述基于风电竞价的交易信息检索方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序被处理器执行时实现如上文所述的基于风电竞价的交易信息检索方法的步骤。
本发明的一种基于风电竞价的交易信息检索方法相对于现有技术具有以下有益效果:
(1)通过对网页信息进行解析爬取,能够在现有的网页信息的基础上获取更多的网页信息,提高信息检索的精确度,提升用户获取信息的数量。
(2)通过设定属性分类标准,通过属性分类标准与用户信息需求结合,构建用户画像模型,能够为用户电力交易决策提供帮助,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;
图2为本发明基于风电竞价的交易信息检索方法第一实施例的流程示意图;
图3为本发明基于风电竞价的交易信息检索方法第一实施例的功能模块示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,该设备可以包括:处理器1001,例如中央处理器(Central ProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口 1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory, RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory, NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001 的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对设备的限定,在实际应用中设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于风电竞价的交易信息检索方法程序。
在图1所示的设备中,网络接口1004主要用于建立设备与存储基于风电竞价的交易信息检索方法系统中所需的所有数据的服务器的通信连接;用户接口 1003主要用于与用户进行数据交互;本发明基于风电竞价的交易信息检索方法设备中的处理器1001、存储器1005可以设置在基于风电竞价的交易信息检索方法设备中,所述基于风电竞价的交易信息检索方法设备通过处理器1001调用存储器1005中存储的基于风电竞价的交易信息检索方法程序,并执行本发明实施提供的基于风电竞价的交易信息检索方法。
结合图2,图2为本发明基于风电竞价的交易信息检索方法第一实施例的流程示意图。
本实施例中,所述基于风电竞价的交易信息检索方法包括以下步骤:
S10:获取用户信息需求,根据该信息需求获取对应网页信息。
应当理解的是,本系统实施例首先会获取用户信息需求,这个用户信息需求基本是对手的一些基本信息或者用户所处的技术领域,本实施例中以风电竞价为例,之后系统会搜索风电竞价对应的网页信息,然后向这些网页信息对应的服务器发送下载请求,只有当接收到服务器的反馈之后,系统才会根据反馈来对这些网页信息进行下载,通过这种方式,能够在搜索网页信息之前,对网页信息有一个精确定位,避免了搜索资源的浪费,提高了整个信息检索的效率。
S20:对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据。
应当理解的是,在获取到网页信息之后,系统会对网页信息进行解析,网页信息解析的方式有xpath语句,正则表达式或者css选择器,通过上述方式都可以从网页信息中获取对应的解析结果,本实施例中使用的是正则表达式获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,通过正则表达式能够精确且快速获得对应的网页解析结果,能够提高整个信息检索的速度。
应当理解的是,在获取到URL信息之后,系统会根据URL信息爬取新的网页,然后从新的网页处获取新的网页信息,以此不断对检索的信息进行更新,不断提高信息检索的精确度,网络爬虫,是能够按照程序设计者所指定的要求,有序的自动获取指定网站上的有用信息的程序,本实施例中通过分布式文件系统和分布式并行计算框架的使用,提高爬虫的效率和准确度,使抓取过程更流畅。
应当理解的是,最后系统会根据获取到的网页解析结果生成不同的数据表,即根据网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息这些信息建立不用的数据集合,然后将各个集合统一起来形成一个表格,通过这样的方式,能够方便后续对信息的检索。
S30:设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表。
应当理解的是,为了更好方便用户信息检索,系统会设定属性分类标准,通过属性标准利用数据表生成对应的分类表,以此方便用户直观方便检索信息,分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息。
其中,基础信息包括:所属供电局、电压等级、地址、联系人、所属行业、主要产品以及实际产量等信息;价值信息包括:年度、月度成交量,交易均价,年度同比、环比以及各类交易类型的信息。能够自动甄别高电价用户,对高电价用户进行划分;行为信息包括:行业月度成交的量价信息,以及行业开工率和主要产品价格信息走势;行业信息包括:企业的欠费情况、信用情况以及履约情况评价;财务信息包括:近两年的资产负债率、流动比率、报酬利率以及上市公司财务信息查看网址。
应当理解的是,之后系统会获取用户基本信息,通过对用户基本信息即用户的基础属性和交易属性进行分析,识别出大用户的特性。然后基于上述建立的数据表和分类表,通过对大用户进行分析,逐步完善大用户的特性,构建大用户画像模型,为电力交易决策提供辅助支持。
S40:将信息数据表存入数据库中对数据库进行更新。
应当理解的是,最后系统会将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新,以此完成整个信息检索过程的不断更新,提高信息检索的精确度。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例通过获取用户信息需求,根据该信息需求获取对应网页信息;对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;将信息数据表存入数据库中对数据库进行更新。本实施例通过对获取到的网页信息进行解析,能够依次得到精准的用户需求数据,同时能够爬取更多相关信息,提高用户信息需求的精度,同时设定属性分类标准与用户信息需求结合,能够生成每个用户的画像模型,为用户电力交易决策提供辅助,提升用户体验。
此外,本发明实施例还提出一种基于风电竞价的交易信息检索装置。如图 3所示,该基于风电竞价的交易信息检索装置包括:获取模块10、解析爬取模块20、分类模块30以及更新模块40。
获取模块10,用于获取用户信息需求,根据该信息需求获取对应网页信息;
解析爬取模块20,用于对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
分类模块30,用于设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
更新模块40,用于将信息数据表存入数据库中对数据库进行更新。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于风电竞价的交易信息检索方法,此处不再赘述。
此外,本发明实施例还提出一种介质,所述介质为计算机介质,所述计算机介质上存储有基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序被处理器执行时实现如下操作:
S1,获取用户信息需求,根据该信息需求获取对应网页信息;
S2,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
S3,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
S4,将信息数据表存入数据库中对数据库进行更新。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
获取用户信息需求,根据该信息需求搜索对应的网页信息,并向该网页信息对应的服务器发送请求,当收到服务器反馈时,获取该网页信息。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
通过正则表达式对该网页信息进行解析,获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL 信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
根据网页解析结果建立不同分类集合,根据该分类集合建立网页解析数据表,将该网页解析数据表存入数据库中,通过爬取的网页的解析结果建立新网页解析数据表,根据该新网页解析数据表对网页解析数据表进行更新。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
设定属性分类标准,所述分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立信息数据表。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
结合信息数据表以及网页解析数据表对每个用户的需求进行分析,并建立用户画像模型,生成对应的信息检索建议。
进一步地,所述基于风电竞价的交易信息检索方法程序被处理器执行时还实现如下操作:
将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于风电竞价的交易信息检索方法,其特征在于:包括以下步骤;
S1,获取用户信息需求,根据该信息需求获取对应网页信息;
S2,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
S3,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
S4,将信息数据表存入数据库中对数据库进行更新。
2.如权利要求1所述的基于风电竞价的交易信息检索方法,其特征在于:步骤S1中,获取用户信息需求,根据该信息需求获取对应网页信息,还包括以下步骤,获取用户信息需求,根据该信息需求搜索对应的网页信息,并向该网页信息对应的服务器发送请求,当收到服务器反馈时,获取该网页信息。
3.如权利要求2所述的基于风电竞价的交易信息检索方法,其特征在于:步骤S2中,对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据,还包括以下步骤,通过正则表达式对该网页信息进行解析,获取网页解析结果,所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果。
4.如权利要求3所述的基于风电竞价的交易信息检索方法,其特征在于:所述网页解析结果包括:网页组成元素信息、网页领域属性信息、网页文本信息以及URL信息,根据该URL信息爬取对应的网页,并对爬取到的网页进行解析,获取爬取的网页的解析结果,还包括以下步骤,根据网页解析结果建立不同分类集合,根据该分类集合建立网页解析数据表,将该网页解析数据表存入数据库中,通过爬取的网页的解析结果建立新网页解析数据表,根据该新网页解析数据表对网页解析数据表进行更新。
5.如权利要求4所述的基于风电竞价的交易信息检索方法,其特征在于:步骤S3中,设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表,还包括以下步骤,设定属性分类标准,所述分类标准包括:基础信息、价值信息、行为信息、行业信息以及财务信息,根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立信息数据表。
6.如权利要求5所述的基于风电竞价的交易信息检索方法,其特征在于:根据该分类标准对新网页解析数据表中的数据进行分类,并根据分类后的数据建立新数据表,还包括以下步骤,结合信息数据表以及网页解析数据表对每个用户的需求进行分析,并建立用户画像模型,生成对应的信息检索建议。
7.如权利要求6所述的基于风电竞价的交易信息检索方法,其特征在于:步骤S4中,将信息数据表存入数据库中对数据库进行更新,还包括以下步骤,将信息数据表与用户画像模型进行关联,并存储本地数据库中,若数据库中不存在相同信息数据表与用户画像模型,则直接进行存储;若数据库中存在相同信息数据表与用户画像模型,则对数据库中的信息数据表与用户画像模型进行更新。
8.一种基于风电竞价的交易信息检索装置,其特征在于,所述基于风电竞价的交易信息检索装置包括:
获取模块,用于获取用户信息需求,根据该信息需求获取对应网页信息;
解析爬取模块,用于对该网页信息进行解析,获取网页节点信息,根据该网页节点信息爬取对应的信息数据;
分类模块,用于设定属性分类标准,根据该属性分类标准对信息数据进行分类,并根据分类后的信息数据建立信息数据表;
更新模块,用于将信息数据表存入数据库中对数据库进行更新。
9.一种设备,其特征在于,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序配置为实现如权利要求1至7任一项所述的基于风电竞价的交易信息检索方法的步骤。
10.一种介质,其特征在于,所述介质为计算机介质,所述计算机介质上存储有基于风电竞价的交易信息检索方法程序,所述基于风电竞价的交易信息检索方法程序被处理器执行时实现如权利要求1至7任一项所述的基于风电竞价的交易信息检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371811.4A CN112417251B (zh) | 2020-11-30 | 2020-11-30 | 一种基于风电竞价的交易信息检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371811.4A CN112417251B (zh) | 2020-11-30 | 2020-11-30 | 一种基于风电竞价的交易信息检索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112417251A true CN112417251A (zh) | 2021-02-26 |
CN112417251B CN112417251B (zh) | 2024-10-11 |
Family
ID=74830642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011371811.4A Active CN112417251B (zh) | 2020-11-30 | 2020-11-30 | 一种基于风电竞价的交易信息检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417251B (zh) |
Citations (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080243786A1 (en) * | 2007-03-30 | 2008-10-02 | Tyron Jerrod Stading | System and method of goal-oriented searching |
CN104991917A (zh) * | 2015-06-23 | 2015-10-21 | 上海斐讯数据通信技术有限公司 | 广告个性化推送系统及方法 |
CN105138551A (zh) * | 2015-07-14 | 2015-12-09 | 青岛海信传媒网络技术有限公司 | 一种获取用户兴趣标签的方法及装置 |
CN105827676A (zh) * | 2015-01-04 | 2016-08-03 | 中国移动通信集团上海有限公司 | 一种用户画像信息获取系统、方法及装置 |
CN106339806A (zh) * | 2016-08-24 | 2017-01-18 | 北京创业公社征信服务有限公司 | 一种面向企业信息的行业全息画像构建方法及系统 |
US9646095B1 (en) * | 2012-03-01 | 2017-05-09 | Pathmatics, Inc. | Systems and methods for generating and maintaining internet user profile data |
CN106991175A (zh) * | 2017-04-06 | 2017-07-28 | 百度在线网络技术(北京)有限公司 | 一种客户信息挖掘方法、装置、设备以及存储介质 |
CN107066599A (zh) * | 2017-04-20 | 2017-08-18 | 北京文因互联科技有限公司 | 一种基于知识库推理的相似上市公司企业检索分类方法及系统 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
CN108537586A (zh) * | 2018-03-30 | 2018-09-14 | 杭州米趣网络科技有限公司 | 基于用户画像的数据处理方法及装置 |
CN108959618A (zh) * | 2018-07-18 | 2018-12-07 | 北京欣欣苹果网络科技有限公司 | 互联网信息收集及处理方法和装置 |
CN109299997A (zh) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 产品推荐方法、装置及计算机可读存储介质 |
CN109359998A (zh) * | 2018-08-15 | 2019-02-19 | 中国平安人寿保险股份有限公司 | 客户数据处理方法、装置、计算机装置及存储介质 |
CN109815386A (zh) * | 2018-12-21 | 2019-05-28 | 厦门市美亚柏科信息股份有限公司 | 一种基于用户画像的构建方法、装置及存储介质 |
CN109918508A (zh) * | 2019-03-08 | 2019-06-21 | 成都场量科技有限公司 | 基于网络爬虫采集技术的用户画像生成方法 |
CN110134853A (zh) * | 2019-05-13 | 2019-08-16 | 重庆八戒传媒有限公司 | 数据爬取方法及系统 |
CN110188226A (zh) * | 2019-04-29 | 2019-08-30 | 苏宁易购集团股份有限公司 | 一种基于人脸识别的客户画像生成方法及装置 |
CN110443632A (zh) * | 2019-07-05 | 2019-11-12 | 中国平安人寿保险股份有限公司 | 用户画像的用户管理方法、装置、计算机设备及存储介质 |
CN110674391A (zh) * | 2019-08-15 | 2020-01-10 | 中国平安财产保险股份有限公司 | 基于大数据的产品数据推送方法、系统和计算机设备 |
CN110727860A (zh) * | 2019-09-16 | 2020-01-24 | 武汉安诠加信息技术有限公司 | 基于互联网美容平台的用户画像方法、装置、设备及介质 |
CN110766460A (zh) * | 2019-10-21 | 2020-02-07 | 海南高灯科技有限公司 | 一种用户画像的方法、装置、存储介质及计算机设备 |
CN110781368A (zh) * | 2019-10-22 | 2020-02-11 | 北京赛时科技有限公司 | 一种针对指定专家的信息爬取系统及方法 |
CN110807548A (zh) * | 2019-10-23 | 2020-02-18 | 华能大理风力发电有限公司 | 基于风电竞价用户的数据采集方法、装置、设备及介质 |
US10643246B1 (en) * | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Methods and systems for customization of user profiles |
CA3060822A1 (en) * | 2018-11-09 | 2020-05-09 | 10353744 Canada Ltd. | Label information acquistion method and apparatus, electronic device and computer readable medium |
CN111191122A (zh) * | 2019-12-20 | 2020-05-22 | 重庆邮电大学 | 一种基于用户画像的学习资源推荐系统 |
CN111444236A (zh) * | 2020-03-23 | 2020-07-24 | 华南理工大学 | 一种基于大数据的移动终端用户画像构建方法及系统 |
CN111538931A (zh) * | 2020-03-27 | 2020-08-14 | 中国平安财产保险股份有限公司 | 基于大数据的舆情监控方法、装置、计算机设备及介质 |
CN111859071A (zh) * | 2020-07-21 | 2020-10-30 | 北京北斗天巡科技有限公司 | 一种基于互联网信息的商业信息挖掘系统 |
US20210240729A1 (en) * | 2020-01-31 | 2021-08-05 | Slack Technologies, Inc. | Dynamic Profile Reconciliation In Group-Based Communication Systems |
-
2020
- 2020-11-30 CN CN202011371811.4A patent/CN112417251B/zh active Active
Patent Citations (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080243786A1 (en) * | 2007-03-30 | 2008-10-02 | Tyron Jerrod Stading | System and method of goal-oriented searching |
US9646095B1 (en) * | 2012-03-01 | 2017-05-09 | Pathmatics, Inc. | Systems and methods for generating and maintaining internet user profile data |
CN105827676A (zh) * | 2015-01-04 | 2016-08-03 | 中国移动通信集团上海有限公司 | 一种用户画像信息获取系统、方法及装置 |
CN104991917A (zh) * | 2015-06-23 | 2015-10-21 | 上海斐讯数据通信技术有限公司 | 广告个性化推送系统及方法 |
CN105138551A (zh) * | 2015-07-14 | 2015-12-09 | 青岛海信传媒网络技术有限公司 | 一种获取用户兴趣标签的方法及装置 |
CN106339806A (zh) * | 2016-08-24 | 2017-01-18 | 北京创业公社征信服务有限公司 | 一种面向企业信息的行业全息画像构建方法及系统 |
US10643246B1 (en) * | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Methods and systems for customization of user profiles |
CN106991175A (zh) * | 2017-04-06 | 2017-07-28 | 百度在线网络技术(北京)有限公司 | 一种客户信息挖掘方法、装置、设备以及存储介质 |
CN107066599A (zh) * | 2017-04-20 | 2017-08-18 | 北京文因互联科技有限公司 | 一种基于知识库推理的相似上市公司企业检索分类方法及系统 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
CN108537586A (zh) * | 2018-03-30 | 2018-09-14 | 杭州米趣网络科技有限公司 | 基于用户画像的数据处理方法及装置 |
CN108959618A (zh) * | 2018-07-18 | 2018-12-07 | 北京欣欣苹果网络科技有限公司 | 互联网信息收集及处理方法和装置 |
CN109359998A (zh) * | 2018-08-15 | 2019-02-19 | 中国平安人寿保险股份有限公司 | 客户数据处理方法、装置、计算机装置及存储介质 |
CN109299997A (zh) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 产品推荐方法、装置及计算机可读存储介质 |
CA3060822A1 (en) * | 2018-11-09 | 2020-05-09 | 10353744 Canada Ltd. | Label information acquistion method and apparatus, electronic device and computer readable medium |
CN109815386A (zh) * | 2018-12-21 | 2019-05-28 | 厦门市美亚柏科信息股份有限公司 | 一种基于用户画像的构建方法、装置及存储介质 |
CN109918508A (zh) * | 2019-03-08 | 2019-06-21 | 成都场量科技有限公司 | 基于网络爬虫采集技术的用户画像生成方法 |
CN110188226A (zh) * | 2019-04-29 | 2019-08-30 | 苏宁易购集团股份有限公司 | 一种基于人脸识别的客户画像生成方法及装置 |
CN110134853A (zh) * | 2019-05-13 | 2019-08-16 | 重庆八戒传媒有限公司 | 数据爬取方法及系统 |
CN110443632A (zh) * | 2019-07-05 | 2019-11-12 | 中国平安人寿保险股份有限公司 | 用户画像的用户管理方法、装置、计算机设备及存储介质 |
CN110674391A (zh) * | 2019-08-15 | 2020-01-10 | 中国平安财产保险股份有限公司 | 基于大数据的产品数据推送方法、系统和计算机设备 |
CN110727860A (zh) * | 2019-09-16 | 2020-01-24 | 武汉安诠加信息技术有限公司 | 基于互联网美容平台的用户画像方法、装置、设备及介质 |
CN110766460A (zh) * | 2019-10-21 | 2020-02-07 | 海南高灯科技有限公司 | 一种用户画像的方法、装置、存储介质及计算机设备 |
CN110781368A (zh) * | 2019-10-22 | 2020-02-11 | 北京赛时科技有限公司 | 一种针对指定专家的信息爬取系统及方法 |
CN110807548A (zh) * | 2019-10-23 | 2020-02-18 | 华能大理风力发电有限公司 | 基于风电竞价用户的数据采集方法、装置、设备及介质 |
CN111191122A (zh) * | 2019-12-20 | 2020-05-22 | 重庆邮电大学 | 一种基于用户画像的学习资源推荐系统 |
US20210240729A1 (en) * | 2020-01-31 | 2021-08-05 | Slack Technologies, Inc. | Dynamic Profile Reconciliation In Group-Based Communication Systems |
CN111444236A (zh) * | 2020-03-23 | 2020-07-24 | 华南理工大学 | 一种基于大数据的移动终端用户画像构建方法及系统 |
CN111538931A (zh) * | 2020-03-27 | 2020-08-14 | 中国平安财产保险股份有限公司 | 基于大数据的舆情监控方法、装置、计算机设备及介质 |
CN111859071A (zh) * | 2020-07-21 | 2020-10-30 | 北京北斗天巡科技有限公司 | 一种基于互联网信息的商业信息挖掘系统 |
Non-Patent Citations (5)
Title |
---|
DE NART, DARIO: "Users as crawlers: exploiting metadata embedded in Web pages for user profiling", 《IRIS CATALOGO RICERCA UNIUDINE 4 CONTRIBUTO IN ATTI DI CONVEGNO (PROCEEDING) 4.1 CONTRIBUTO IN ATTI DI CONVEGNO》, 1 January 2014 (2014-01-01), pages 1 - 10 * |
PRATIKAKIS: "twAwler: A lightweight twitter crawler", 《ARXIV E-PRINTS》, 30 April 2018 (2018-04-30), pages 1 - 8 * |
曾子明: "基于用户画像的智慧图书馆个性化移动视觉搜索研究", 《图书与情报 》, no. 4, 30 April 2020 (2020-04-30), pages 84 - 91 * |
王冬羽: "基于移动互联网行为分析的用户画像系统设计", 《中国优秀硕士学论论文全文数据库 信息科技》, 15 March 2018 (2018-03-15), pages 136 - 630 * |
高凯: "《信息检索与智能处理》", 31 January 2014, 国防工业出版社, pages: 172 - 181 * |
Also Published As
Publication number | Publication date |
---|---|
CN112417251B (zh) | 2024-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10242093B2 (en) | Method and system for performing a probabilistic topic analysis of search queries for a customer support system | |
US9330080B2 (en) | Methods and systems to facilitate providing spreadsheet and database data to users via a social network | |
US20170032251A1 (en) | Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system | |
CN108805694B (zh) | 信贷咨询服务方法、装置、设备及计算机可读存储介质 | |
US20140025774A1 (en) | Systems and methods for metadata driven dynamic web services | |
US20070133522A1 (en) | Method and System for Defining, Capturing, and Reporting Performance Data | |
CN104954410A (zh) | 消息推送方法、装置及服务器 | |
US9465881B2 (en) | User displays using N-way paginated merge of information from diverse sources | |
US20200104340A1 (en) | A/b testing using quantile metrics | |
US20220076320A1 (en) | Content recommendation method, device, and storage medium | |
US20160034553A1 (en) | Hybrid aggregation of data sets | |
CN104346371A (zh) | 内存数据库驱动业务整合系统报告 | |
CN111310032B (zh) | 资源推荐方法、装置、计算机设备及可读存储介质 | |
Even et al. | Value-Driven Data Quality Assessment. | |
WO2020221022A1 (zh) | 业务对象推荐方法 | |
US20180307744A1 (en) | Named entity-based category tagging of documents | |
CN110929134A (zh) | 投融资数据管理方法、装置、计算机设备及存储介质 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
CN110209944B (zh) | 一种股票分析师推荐方法、装置、计算机设备和存储介质 | |
US20170039196A1 (en) | Computing system to evaluate sentiment of entities by processing data | |
US20120265588A1 (en) | System and method for recommending new connections in an advertising exchange | |
Podolskij et al. | Comment on: Limit of Random Measures Associated with the Increments of a Brownian Semimartingale: Asymptotic behavior of local times related statistics for fractional Brownian motion | |
CN112991033A (zh) | 一种确定物品价值属性的方法和装置 | |
CN112417251A (zh) | 一种基于风电竞价的交易信息检索方法及装置 | |
CN113076395B (zh) | 语义模型训练、搜索显示方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |