CN111340550A - 一种数据信息提取方法 - Google Patents
一种数据信息提取方法 Download PDFInfo
- Publication number
- CN111340550A CN111340550A CN202010124979.9A CN202010124979A CN111340550A CN 111340550 A CN111340550 A CN 111340550A CN 202010124979 A CN202010124979 A CN 202010124979A CN 111340550 A CN111340550 A CN 111340550A
- Authority
- CN
- China
- Prior art keywords
- data
- keywords
- product
- terminal
- information data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据信息提取方法,包括获取终端数据,基于所述终端数据获取客户端的访问信息数据,根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词,基于所述多个关键词,选取与产品相匹配的产品关键词,获取与所述产品关键词相应的产品信息数据。本发明提供的数据信息提取方法,可逐步对用户的需求进行精确筛选,进而从海量数据中找到真正符合用户所需求的商品信息,使得商户选择合适的渠道商进行发布,从而方便服务商为用户服务。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据信息提取方法。
背景技术
大数据,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。从技术上看,大数据必然无法用单台的计算机进行处理,必须采用分布式架构。对海量数据进行分布式数据挖掘必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。但是,现有的大数据提取信息的方法还不成熟,无法从海量数据中提取用户真正需要的信息,面对海量数据,如何从大量数据中准确提取出有效信息已成为大数据信息提取的研究重点。
发明内容
为了解决上述问题,本发明提供一种数据信息提取方法,以克服在海量数据中提取信息不准确的问题。
在一方面,本发明提供一种数据信息提取方法,包括:
获取终端数据;
基于所述终端数据获取客户端的访问信息数据;
根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词;
基于所述多个关键词,选取与产品相匹配的产品关键词;
获取与所述产品关键词相应的产品信息数据。
根据本发明的一个具体实施例,所述获取终端数据包括:从设备终端的应用模块中获取终端数据,其中所述应用模块包括存储模块和/或录音模块,所述存储模块用于存储用户终端数据,所述录音模块用于存储用户的语音数据。
根据本发明的一个具体实施例,所述设备终端包括移动终端设备和计算机。
根据本发明的一个具体实施例,所述客户端包括APP和/或网页和/或微信小程序。
根据本发明的一个具体实施例,所述终端数据包括文本数据和语音数据。
根据本发明的一个具体实施例,所述访问信息数据包括浏览量和点击率,其中所述基于所述终端数据获取客户端的访问信息数据,包括:
从所述设备终端的存储模块中载入用户终端数据,基于所述用户终端数据获取客户端的浏览量和点击率,其中所述用户终端数据为cookie文本数据。
根据本发明的一个具体实施例,所述根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词,包括:
利用所述访问信息数据中的浏览量和点击率,从所述终端数据中的文本数据和语音数据中提取多个关键词。
根据本发明的一个具体实施例,所述基于所述多个关键词,选取与产品相匹配的产品关键词,包括:
利用人工智能算法从所述多个关键词中选取与产品数据库中的产品信息数据相匹配的产品关键词,并将所述产品关键词上传到云端和/或终端设备和/或后台管理系统进行备份处理。
根据本发明的一个具体实施例,所述获取与所述产品关键词相应的产品信息数据,包括:
将所述产品关键词与数据库中的产品信息数据相匹配,得到用户需求的产品信息数据。
根据本发明的一个具体实施例,所述方法还包括:判断是否在设定时间内得到所述产品信息数据,若未得到,则进行二次关键词提取,重新获取所述产品信息数据。
本发明提供的数据信息提取方法,可逐步对用户的需求进行精确筛选,进而从海量数据中找到真正符合用户所需求的商品信息,使得商户选择合适的渠道商进行发布,从而方便服务商为用户服务。
附图说明
图1是根据本发明一实施例的数据推送方法流程图。
具体实施方式
为了使本领域技术人员更加清楚地理解本发明的概念和思想,以下结合具体实施例详细描述本发明。应理解,本文给出的实施例都只是本发明可能具有的所有实施例的一部分。本领域技术人员在阅读本申请的说明书以后,有能力对下述实施例的部分或整体作出改进、改造、或替换,这些改进、改造、或替换也都包含在本发明要求保护的范围内。
在本文中,术语“第一”、“第二”和其它类似词语并不意在暗示任何顺序、数量和重要性,而是仅仅用于对不同的元件进行区分。在本文中,术语“一”、“一个”和其它类似词语并不意在表示只存在一个所述事物,而是表示有关描述仅仅针对所述事物中的一个,所述事物可能具有一个或多个。在本文中,术语“包含”、“包括”和其它类似词语意在表示逻辑上的相互关系,而不能视作表示空间结构上的关系。例如,“A包括B”意在表示在逻辑上B属于A,而不表示在空间上B位于A的内部。另外,术语“包含”、“包括”和其它类似词语的含义应视为开放性的,而非封闭性的。例如,“A包括B”意在表示B属于A,但是B不一定构成A的全部,A还可能包括C、D、E等其它元素。
在本文中,术语“实施例”、“本实施例”、“一实施例”、“一个实施例”并不表示有关描述仅仅适用于一个特定的实施例,而是表示这些描述还可能适用于另外一个或多个实施例中。本领域技术人员应理解,在本文中,任何针对某一个实施例所做的描述都可以与另外一个或多个实施例中的有关描述进行替代、组合、或者以其它方式结合,所述替代、组合、或者以其它方式结合所产生的新实施例是本领域技术人员能够容易想到的,属于本发明的保护范围。
实施例1
本发明的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施方式的实践了解到。
图1是根据本发明一实施例的数据信息提取方法流程图,如图1所示,所述方法包括以下步骤:
S1:获取终端数据。
S2:基于所述终端数据获取客户端的访问信息数据。
S3:根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词。
S4:基于所述多个关键词,选取与产品相匹配的产品关键词。
S5:获取与所述产品关键词相应的产品信息数据。
S6:判断是否在设定时间内得到所述产品信息数据,若未得到,则执行步骤S7。
S7:进行二次关键词提取,重新获取所述产品信息数据。
具体的,步骤S1获取终端数据,包括从设备终端的应用模块中获取终端数据,所述终端数据包括文本数据和语音数据,所述设备终端可以是移动终端设备或计算机,所述设备终端的应用模块中安装有APP和/或网页和/或微信小程序,优选的在移动终端安装有APP或微信小程序,在计算机中安装有网页,将应用数据安装在包括APP和/或网页和/或微信小程序的应用数据载体,并将该载体存储在设备终端。所述应用模块包括存储模块和/或录音模块,其中存储模块用于存储用户终端数据(cookie-小型文本文件),录音模块用于存储用户的语音数据,存储模块载入终端数据,基于cookie(终端数据)获取终端设备的浏览量、点击率,并基于录音模块获取终端设备使用者的录音。
具体的,步骤S2基于所述终端数据获取客户端的访问信息数据,包括从所述设备终端的存储模块中载入用户终端数据,基于所述用户终端数据获取客户端的浏览量和点击率,其中所述用户终端数据为cookie文本数据。所述访问信息数据包括浏览量和点击率,所述客户端可以是APP、网页和微信小程序。
具体的,步骤S3根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词,包括利用访问信息数据中的浏览量和点击率,从所述终端数据中的文本数据和语音数据中提取多个关键词。优选的,本发明实施例根据客户端的访问信息数据,利用AI(人工智能)技术匹配访问信息数据的浏览量、点击率以及录音内容,进而从所述终端数据中的文本数据和语音数据的内容中提取多个关键词,其中所述客户端的访问信息数据包括浏览量和点击率,所述客户端包括APP和/或网页和/或微信小程序,在APP和/或网页和/或微信小程序中筛选出符合服务商自身产品中的关键词,并提取该关键词上传云端和/或终端设备和/或后台管理系统进行备份处理。
具体的,步骤S4基于所述多个关键词,选取与产品相匹配的产品关键词,包括从所述多个关键词中选取与产品数据库中的产品信息数据相匹配的产品关键词,并将所述产品关键词上传到云端和/或终端设备和/或后台管理系统进行备份处理。优选的,本发明实施例利用AI(人工智能)技术的算法计算,通过从cookie(终端数据)中提取的多个关键词与服务商自身产品数据库中的数据信息相匹配,从而筛选出符合服务商自身产品的关键词,并将其传输到云端备份和/或终端设备和/或后台管理系统中进行备份处理,基于云端备份和/或终端设备和/或后台管理系统备份处理数据,可实现产品关键词的筛选。
具体的,步骤S5获取与所述产品关键词相应的产品信息数据,包括将所述产品关键词与数据库中的产品信息数据相匹配,得到用户需求的产品信息数据。基于步骤S4,通过在一段时间内获取的用户感兴趣的信息,并结合服务商自身产品数据库相匹配,对该段时间内的数据信息进行筛选,匹配后得到符合用户实际需求的产品信息数据。以二十四小时为例,在该二十四小时内,基于这二十四小时获得用户关键词的点击率,并基于该点击率进行数据筛选,得到用户在该段时间内的需求,该时间可自行定义,并匹配该时间点的数据分析。其中所述服务商包括一个或多个合作运营商,优选的,本发明实施例从多个合作运营商中同时获取与所述产品关键词相匹配的产品信息数据。进一步方便服务商为用户服务,本发明实施例还能够结合地区大数据,找到符合该地区所需商品的需求信息。
具体的,如果未筛选出符合服务商自身产品的关键词,则需要进行二次关键词提取,重新获取产品关键词,以保证算法的可靠运行。首先通过步骤S6进行获取信息确定,判断是否在设定时间内得到用户所需的产品关键词,如果得到用户所需产品的关键词,则可推送该产品关键词的对应产品信息,若并未得到,则通过步骤S7进行关键词的二次筛选,重新获取产品关键词,从而确保了数据信息的准确提取。
本发明实施例提供的数据信息提取方法,可逐步对用户的需求进行精确筛选,进而从海量数据中找到真正符合用户所需求的商品信息,使得商户选择合适的渠道商进行发布,从而方便服务商为用户服务。
以上结合具体实施方式(包括实施例和实例)详细描述了本发明的概念、原理和思想。本领域技术人员应理解,本发明的实施方式不止上文给出的这几种形式,本领域技术人员在阅读本申请文件以后,可以对上述实施方式中的步骤、方法、装置、部件做出任何可能的改进、替换和等同形式,这些改进、替换和等同形式应视为落入在本发明的范围内。本发明的保护范围仅以权利要求书为准。
Claims (10)
1.一种数据信息提取方法,其特征在于,包括:
获取终端数据;
基于所述终端数据获取客户端的访问信息数据;
根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词;
基于所述多个关键词,选取与产品相匹配的产品关键词;
获取与所述产品关键词相应的产品信息数据。
2.根据权利要求1所述的方法,其特征在于,所述获取终端数据包括:从设备终端的应用模块中获取终端数据,其中所述应用模块包括存储模块和/或录音模块,所述存储模块用于存储用户终端数据,所述录音模块用于存储用户的语音数据。
3.根据权利要求2所述的方法,其特征在于,所述设备终端包括移动终端设备和计算机。
4.根据权利要求1所述的方法,其特征在于,所述客户端包括APP和/或网页和/或微信小程序。
5.根据权利要求1或2所述的方法,其特征在于,所述终端数据包括文本数据和语音数据。
6.根据权利要求1所述的方法,其特征在于,所述访问信息数据包括浏览量和点击率,其中所述基于所述终端数据获取客户端的访问信息数据,包括:
从所述设备终端的存储模块中载入用户终端数据,基于所述用户终端数据获取客户端的浏览量和点击率,其中所述用户终端数据为cookie文本数据。
7.根据权利要求1所述的方法,其特征在于,所述根据所述访问信息数据和所述终端数据进行关键词提取,获得多个关键词,包括:
利用所述访问信息数据中的浏览量和点击率,从所述终端数据中的文本数据和语音数据中提取多个关键词。
8.根据权利要求1所述的方法,其特征在于,所述基于所述多个关键词,选取与产品相匹配的产品关键词,包括:
利用人工智能算法从所述多个关键词中选取与产品数据库中的产品信息数据相匹配的产品关键词,并将所述产品关键词上传到云端和/或终端设备和/或后台管理系统进行备份处理。
9.根据权利要求1所述的方法,其特征在于,所述获取与所述产品关键词相应的产品信息数据,包括:
将所述产品关键词与数据库中的产品信息数据相匹配,得到用户需求的产品信息数据。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:判断是否在设定时间内得到所述产品信息数据,若未得到,则进行二次关键词提取,重新获取所述产品信息数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010124979.9A CN111340550A (zh) | 2020-02-27 | 2020-02-27 | 一种数据信息提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010124979.9A CN111340550A (zh) | 2020-02-27 | 2020-02-27 | 一种数据信息提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111340550A true CN111340550A (zh) | 2020-06-26 |
Family
ID=71183900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010124979.9A Pending CN111340550A (zh) | 2020-02-27 | 2020-02-27 | 一种数据信息提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340550A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850546A (zh) * | 2014-02-13 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 移动媒介信息的展示方法和系统 |
CN109446412A (zh) * | 2018-09-25 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于网页标签的产品数据推送方法、装置、设备及介质 |
CN109785052A (zh) * | 2018-12-26 | 2019-05-21 | 珠海横琴跨境说网络科技有限公司 | 基于暗数据挖掘的智能购物方法及系统 |
-
2020
- 2020-02-27 CN CN202010124979.9A patent/CN111340550A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850546A (zh) * | 2014-02-13 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 移动媒介信息的展示方法和系统 |
CN109446412A (zh) * | 2018-09-25 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于网页标签的产品数据推送方法、装置、设备及介质 |
CN109785052A (zh) * | 2018-12-26 | 2019-05-21 | 珠海横琴跨境说网络科技有限公司 | 基于暗数据挖掘的智能购物方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10504120B2 (en) | Determining a temporary transaction limit | |
CN108509485B (zh) | 数据的预处理方法、装置、计算机设备和存储介质 | |
CN102236663B (zh) | 一种基于垂直搜索的查询方法、系统和装置 | |
CN111080398B (zh) | 商品推荐方法、装置、计算机设备和存储介质 | |
CN105491599B (zh) | 预测lte网络性能指标的新型回归系统 | |
CN112100219B (zh) | 基于数据库查询处理的报表生成方法、装置、设备和介质 | |
CN112365202B (zh) | 一种多目标对象的评价因子筛选方法及其相关设备 | |
CN111489201A (zh) | 一种客户价值分析的方法、设备、存储介质 | |
CN110334059A (zh) | 用于处理文件的方法和装置 | |
CN110335090A (zh) | 基于商品销量分布预测的补货方法及系统、电子设备 | |
CN115238815A (zh) | 异常交易数据获取方法、装置、设备、介质和程序产品 | |
CN110650170A (zh) | 用于推送信息的方法和装置 | |
CN110020196B (zh) | 一种基于不同数据源的用户分析方法和装置及计算设备 | |
CN109697155B (zh) | It系统性能评估方法、装置、设备及可读存储介质 | |
CN112116159B (zh) | 信息交互方法、装置、计算机可读存储介质及电子设备 | |
CN113435900A (zh) | 交易风险确定方法、装置和服务器 | |
CN113313279A (zh) | 一种单据审核方法和装置 | |
CN111340550A (zh) | 一种数据信息提取方法 | |
CN104839962A (zh) | 一种智能钱包及其信息处理方法和装置 | |
CN111353101A (zh) | 一种数据推送方法 | |
CN115049456A (zh) | 金融产品组合的推荐方法及其装置、电子设备 | |
CN112380321A (zh) | 基于票据知识图谱的主次数据库分配方法及相关设备 | |
CN112085566A (zh) | 基于智能决策的产品推荐方法、装置及计算机设备 | |
CN113689020A (zh) | 业务信息预测方法、装置、计算机设备和存储介质 | |
CN112734352A (zh) | 一种基于数据维度的单据审核方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |