CN110334260A - 数据分析方法、装置、计算机设备及存储介质 - Google Patents
数据分析方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110334260A CN110334260A CN201910477321.3A CN201910477321A CN110334260A CN 110334260 A CN110334260 A CN 110334260A CN 201910477321 A CN201910477321 A CN 201910477321A CN 110334260 A CN110334260 A CN 110334260A
- Authority
- CN
- China
- Prior art keywords
- judging result
- data
- evaluation personnel
- age
- preliminary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000003860 storage Methods 0.000 title claims description 16
- 238000007405 data analysis Methods 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims description 138
- 238000004590 computer program Methods 0.000 claims description 20
- 230000002452 interceptive effect Effects 0.000 claims description 20
- 235000013399 edible fruits Nutrition 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 241000219315 Spinacia Species 0.000 description 3
- 235000009337 Spinacia oleracea Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000012907 honey Nutrition 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 235000013527 bean curd Nutrition 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据分析方法,应用于计算机领域,用于为不同群体的用户提供数据分析服务。本发明提供的方法包括:抓取预定网站的信息作为待参考数据;获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果;所述第一年龄群体对应第一判断结果,所述第二年龄群体对应第二判断结果;将所述待参考数据、所述第一判断结果和所述第二判断结果存储在参考信息库中;获取待判断数据和用户的年龄信息;根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示。这样,能够解决现有的数据分析方法在针对不同群体时判断结果准确性较低的问题。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种数据分析方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,现代社会充斥着各种各样的信息,人们经常淹没在信息的海洋中,从而导致了人们往往需要花费较多的精力判断所接收的信息的真伪。当电脑、智能手机等智能设备的用户使用智能设备中的应用程序或进行网上冲浪时,问题尤为突出。此外,在智能设备的用户群体中,老龄人群由于知识储备落后、缺乏上网经验等原因,其对数据的分析能力往往不高。为此,人们提出了许多利用计算机程序辅助智能设备的用户进行数据分析的方法。但是,由于数据的分析有较强的群体差异性,例如,“多吃豆腐”这条信息相对老年人来说是伪的,但是相对年轻人来说是真的,而且现有的数据分析方法通常缺少针对不同人群的优化,因此,现有的数据分析方法在针对不同群体时存在判断结果准确性较低的问题。
发明内容
本发明实施例提供一种数据分析方法、装置、计算机设备及存储介质,以解决现有的数据分析方法在针对不同群体时判断结果准确性较低的问题。
本发明实施例第一方面提供了一种数据分析方法,其包括:
抓取预定网站的信息作为待参考数据;
获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果;所述第一年龄群体对应第一判断结果,所述第二年龄群体对应第二判断结果;
将所述待参考数据、所述第一判断结果和所述第二判断结果存储在参考信息库中;
获取待判断数据和用户的年龄信息;
根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示。
本发明实施例第二方面提供了一种数据分析装置,其包括:
抓取模块,用于抓取预定网站的信息作为待参考数据;
收集模块,用于获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果;所述第一年龄群体对应第一判断结果,所述第二年龄群体对应第二判断结果;
存储模块,用于将所述待参考数据、所述第一判断结果和所述第二判断结果存储在参考信息库中;
获取模块,用于获取待判断数据和用户的年龄信息;
确定模块,用于根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示。
本发明实施例第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据分析方法的步骤。
本发明实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据分析方法的步骤。
在本发明实施例中,通过收集第一年龄群体和第二年龄群体对待参考数据对应的判断结果,并据此设置第一判断结果和第二判断结果,然后将待参考数据、第一判断结果和第二判断结果存储在参考信息库中,最后根据待判断数据和年龄信息搜索参考信息库以确定待判断数据的判断结果,从而解决现有的数据分析方法在针对不同群体时判断结果准确性较低的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中数据分析方法的应用环境示意图;
图2是本发明实施例一中数据分析方法的流程图;
图3是图2所示的数据分析方法的步骤102的一个具体流程图;
图4是图3所示的步骤202的一个具体流程图;
图5是图4所示的步骤302的一个具体流程图;
图6是本发明实施例二中数据分析装置的模块图;
图7是图6所示的数据分析装置的收集模块20的一个具体模块图;
图8是图7所示的设置单元22的一个具体模块图;
图9是本发明实施例三中计算机设备的一个示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的数据分析方法,可应用在如图1的应用环境中,其中,用户端通过网络与服务器进行通信。其中,用户端可以是但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
为了说明本发明所述的技术方案,下面通过具体实施例来说明。
实施例一:
在本实施例中,如图2所示,提供一种数据分析方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
步骤101:抓取预定网站的信息作为待参考数据。
在上述步骤101中,预定网站可以是预先存储的各类官方网站(如政府和企业官网)、由用户自行录入的网络地址所对应的网站及分享次数满足预设条件的网站中的一种或多种。抓取预定网站信息的频率可以是一天一次或者数天一次。预定网站的信息可以是网站的标题、内容或关键词。
对于预定网站是由用户自行录入的网络地址所对应的网站的情况,可以在终端设备(如电脑、手机)的交互界面提供网址输入框来获取用户想要添加的网站所对应的网站地址。
对于预定网站是分享次数满足预设条件的网站的情况,可以通过请求百度分享的API接口以获得网站的分享次数,此时预设条件可以是:分享次数大于分享次数阈值。例如:分享次数阈值取值为200,如果某一网站的分享次数大于200,则将其作为预定网站。另外,也可以通过请求百度分享的API接口以获得网站的分享次数排行,此时预设条件可以为:分享次数排行在某一分享次数排行区间内。例如:分享次数排行区间取为第一名至第一百名,如果某一网站的分享次数排行在这个区间内,则将其作为预定网站。
步骤102:获取预设的第一年龄群体和第二年龄群体对待参考数据对应的判断结果;第一年龄群体对应第一判断结果,第二年龄群体对应第二判断结果。
具体地,如图3所示,上述步骤102可以通过以下步骤来实现:
步骤201:向评价人员的设备发送收集指令;收集指令用于将待参考数据呈现于评价人员的设备的交互界面,并在交互界面提供相应的第一选择框和/或第二选择框;第一选择框用于收集评价人员基于第一年龄群体对待参考数据所作出的真伪判断选择,第二选择框用于收集评价人员基于第二年龄群体对待参考数据所作出的真伪判断选择。
步骤202:根据评价人员在第一选择框和/或第二选择框所作出的真伪判断选择操作得到第一判断结果和/或第二判断结果;第一判断结果对应第一选择框,第二判断结果对应第二选择框。
此处需要说明的是,第一年龄群体可以是老龄群体,第二年龄群体可以是非老龄群体。根据人类的生命周期,通常年龄超过60岁的人群可以被认为是老龄群体,年龄未超过60岁的人群可以被认为是非老龄群体。此时,在交互界面处的第一选择框和第二选择框上还可以呈现相关的图标或提示信息,以便向评价人员提示第一选择框所收集的是基于老龄群体对待参考数据所作出的真伪判断选择,第二选择框所收集的是基于非老龄群体对待参考数据所作出的真伪判断选择。
第一选择框和第二选择框中可以都具有两个选项,分别为真选项和伪选项。当评价人员基于第一年龄群体考虑,如认为待参考数据为真,则在第一选择框选择真选项;如认为待参考数据为伪,则在第一选择框选择伪选项。当评价人员基于第二年龄群体考虑,如认为待参考数据为真,则在第二选择框选择真选项;如认为待参考数据为伪,则在第二选择框选择伪选项。以第一年龄群体是老龄群体,第二年龄群体是非老龄群体,待参考数据是“多吃豆腐对身体好”为例,如果评价人员基于老龄群体考虑,认为“多吃豆腐对身体好”这一信息是伪的,则在第一选择框里选择伪选项;如果评价人员基于非老龄群体考虑,认为“多吃豆腐对身体好”这一信息是真的,即在第二选择框里选择真选项。
在上述步骤201中,在交互界面提供相应的第一选择框和/或第二选择框可以有以下两种实现方式:
(1)同时向评价人员提供第一选择框和第二选择框,以同时收集评价人员基于第一年龄群体和第二年龄群体对待参考数据的真伪判断选择。
以第一年龄群体是老龄群体,第二年龄群体是非老龄群体为例,此时,在交互界面同时提供第一选择框和第二选择框,评价人员在第一选择框输入基于老龄群体对待参考数据的真伪判断选择,同时还在第二选择框输入基于非老龄群体对待参考数据所作出的真伪判断选择。
(2)根据评价人员的年龄提供第一选择框或第二选择框,以收集评价人员基于其对应的年龄群体对待参考数据的真伪判断选择。具体地,当评价人员的年龄大于年龄阈值时,在交互界面提供第一选择框,当评价人员的年龄未大于年龄阈值时,在交互界面提供第二选择框。这里,评价人员的年龄可以通过启动评价人员的设备的摄像头以拍摄评价人员的图像,然后通过人工智能技术判断评价人员的年龄来获得。
以第一年龄群体是老龄群体,第二年龄群体是非老龄群体为例,此时,年龄阈值可以取值为60岁。当评价人员的年龄大于60岁时,在交互界面提供第一选择框,当评价人员的年龄未大于60岁时,在交互界面提供第二选择框。
此时,由于仅向年龄超过60岁的评价人员提供第一选择框以获取第一判断结果,向年龄未超过60岁的评价人员提供第二选择框以获取第二判断结果,所以能够使作出真伪判断选择的对象是判断结果所针对的人群,从而提高第一判断结果和第二判断结果的准确度。
对于上述步骤202,当评价人员为单个时,如果评价人员在第一选择框中选择真选项,可得到第一判断结果为真;如果评价人员在第一选择框中选择伪选项,可得到第一判断结果为伪。如果评价人员在第二选择框中选择真选项,可得到第二判断结果为真;如果评价人员在第二选择框中选择伪选项,可得到第二判断结果为伪。
当评价人员为多个且按照权限等级分为一级权限评价人员和二级权限评价人员(一级权限评价人员可以是官方人员,二级权限评价人员可以是网友)时,如图4所示,上述步骤202可以通过以下步骤实现:
步骤301:根据多个评价人员在第一选择框和第二选择框所作出的真伪判断选择操作得到每个评价人员对应的第一初步判断结果和第二初步判断结果;第一初步判断结果对应第一选择框,第二初步判断结果对应第二选择框。
步骤302:根据多个评价人员对应的权限等级、第一初步判断结果和第二初步判断结果确定一级权限评价人员的第一中间判断结果和第二中间判断结果、二级权限评价人员的第一中间判断结果和第二中间判断结果。
步骤303:当二级权限评价人员的数量大于人数阈值时,将二级权限评价人员的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果;当二级权限评价人员的数量不大于人数阈值时,将一级权限评价人员的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果。
在上述步骤301中,当评价人员在第一选择框中选择真选项时,得到该评价人员的第一初步判断结果为真,当评价人员在第一选择框中选择伪选项时,得到该评价人员的第一初步判断结果为伪。当评价人员在第二选择框中选择真选项时,得到该评价人员的第二初步判断结果为真,当评价人员在第二选择框中选择伪选项时,得到该评价人员的第二初步判断结果为伪。
例如,评价人员A在第一选择框选择伪选项,在第二选择框中选择真选项,即评价人员A对应的第一初步判断结果和第二初步判断结果分别为伪和真。评价人员B在第一选择框选择真选项,在第二选择框中选择伪选项,即评价人员B对应的第一初步判断结果和第二初步判断结果分别为真和伪。
如图5所示,上述步骤302可以通过以下步骤实现:
步骤401:将一级权限评价人员中第一初步判断结果为真的人数与第一初步判断结果为伪的人数进行比较,将一级权限评价人员中第二初步判断结果为真的人数与第二初步判断结果为伪的人数进行比较,并根据比较结果设置一级权限评价人员的第一中间判断结果和第二中间判断结果。
步骤402:将二级权限评价人员中第一初步判断结果为真的人数与第一初步判断结果为伪的人数进行比较,将二级权限评价人员中第二初步判断值为真的人数与第二初步判断值为伪的人数进行比较,并根据比较结果设置二级权限评价人员的第一中间判断结果和第二中间判断结果。
对于步骤401,在一级权限评价人员中,当第一初步判断结果为真的人数大于第一初步判断结果为伪的人数时,将一级权限评价人员的第一中间判断结果设置为真,当第一初步判断结果为真的人数小于第一初步判断结果为伪的人数时,将一级权限评价人员的第一中间判断结果设置为伪。当第二初步判断值为真的人数大于第二初步判断值为伪的人数时,将一级权限评价人员的第二中间判断结果设置为真,当第二初步判断值为真的人数小于第二初步判断值为伪的人数时,将一级权限评价人员的第二中间判断结果设置为伪。
以一级权限评价人员为官方人员,官方人员中第一初步判断结果为真的人数为100人、第一初步判断结果为伪的人数为50人、第二初步判断值为真的人数为50人和第二初步判断值为伪的人数为100人为例,此时,第一初步判断结果为真的人数大于第一初步判断结果为伪的人数,故将一级权限评价人员的第一中间判断结果设置为真,第二初步判断值为真的人数小于第二初步判断值为伪的人数,故将一级权限评价人员的第二中间判断结果设置为伪。
对于步骤402,在二级权限评价人员中,当第一初步判断结果为真的人数大于第一初步判断结果为伪的人数时,将二级权限评价人员的第一中间判断结果设置为真,当第一初步判断结果为真的人数小于第一初步判断结果为伪的人数时,将二级权限评价人员的第一中间判断结果设置为伪。当第二初步判断值为真的人数大于第二初步判断值为伪的人数时,将二级权限评价人员的第二中间判断结果设置为真,当第二初步判断值为真的人数小于第二初步判断值为伪的人数时,将二级权限评价人员的第二中间判断结果设置为伪。
以二级权限评价人员为网友,网友中第一初步判断结果为真的人数为50人、第一初步判断结果为伪的人数为100人、第二初步判断值为真的人数为100人和第二初步判断值为伪的人数为50人为例,此时,第一初步判断结果为真的人数小于第一初步判断结果为伪的人数,故将二级权限评价人员的第一中间判断结果设置为伪,第二初步判断值为真的人数大于第二初步判断值为伪的人数,故将二级权限评价人员的第二中间判断结果设置为真。
对于上述步骤303,以一级权限评价人员为官方人员,二级权限评价人员为网友,人数阈值取值为100为例。如果作出评价的网友的数量超过100,则以网友的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果,否则,以官方人员的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果。
这样,能够收集多个评价人员对待参考数据作出的真伪判断,并据此得出第一判断结果和第二判断结果,从而避免了因仅仅收集单个评价人员对待参考数据的真伪判断,而导致第一判断结果和第二判断结果有较强的主观因素,进而使所得到的第一判断结果和第二判断结果更加客观准确。
步骤103:将待参考数据、第一判断结果和第二判断结果存储在参考信息库中。
在上述步骤103中,参考信息库可以是一个数据库,此时,待参考数据与第一判断结果和第二判断结果形成映射关系存储于数据库中的一条记录里面。该记录至少包括三列,三列中的每一列分别存储有待参考数据、第一判断结果及第二判断结果。
参考信息库也可以包括两个相互独立的第一数据库和第二数据库。将待参考数据和第一判断结果形成映射关系存储于第一数据库中的一条记录里面,该记录至少包括两列,两列中的每一列分别存储有待参考数据和第一判断结果。将待参考数据和第二判断结果形成映射关系存储于第二数据库中的一条记录里面,该记录至少包括两列,两列中的每一列分别存储有待参考数据和第二判断结果。
这里,待参考数据存储在数据库中的形式可以是将待参考数据对应的字符存储在数据库中。第一判断结果和第二判断结果存储在数据库中的形式可以是将第一判断结果和第二判断结果对应的判断值存储在数据库中。例如,第一判断结果为真时,对应的判断值为1,即将1存储在数据库中,第一判断结果为伪时,对应的判断值为-1,即将-1存储在数据库中。
步骤104:获取待判断数据和用户的年龄信息。
在上述步骤104中,获取待判断数据可以通过如下方式实现:
(1)获取待判断数据可具体为:获取用户的语音输入信息,然后将语音输入信息转化为文本信息,以文本信息作为待判断数据。具体而言,可以通过调用第三方语音识别API实现将语音输入信息转化为文本信息。这里,语音输入信息可以是用户通过设备录制的语音,例如,用户通过移动手机录制的语音。
(2)获取待判断数据可具体为:获取用户的图像信息,然后将图像信息转化为文本信息,以文本信息作为待判断数据。具体地,可以通过对图像信息进行语义分割以获取文本信息。这里,图像信息可以是用户通过设备即时拍摄的图像,也可以是用户上传的图像。例如,用户通过移动终端(例如,手机)拍摄的图像。
(3)获取待判断数据可具体为:获取用户输入的文本信息,以用户输入的文本信息作为待判断数据。这里,用户输入的文本信息可以是用户通过移动终端(例如,手机)输入的文字。
获取用户的年龄信息可以通过启动用户设备(例如,手机)的摄像头拍摄用户的图像,然后通过人工智能技术对所拍摄到的用户的图像进行识别以获得用户的年龄信息。
步骤105:根据待判断数据和年龄信息搜索参考信息库以确定待判断数据对应的判断结果,并输出相应的判断结果提示。上述步骤105可具体为:
搜索参考信息库,并判断是否存在与待判断数据相同的目标待参考数据。这里,目标待参考数据可以是参考信息库中与待判断数据相同的待参考数据。
例如,参考信息库中的待参考数据包括“多吃豆腐对身体好”、“多吃菠菜对身体好”和“蜜糖和豆腐可以一起吃”等,当待判断数据是“多吃豆腐对身体好”时,即该待判断数据对应的目标待参考数据为“多吃豆腐对身体好”这一待参考数据。
当参考信息库中存在目标待参考数据,且年龄信息大于年龄阈值时,根据目标待参考数据所对应的第一判断结果确定待判断数据的判断结果。具体地,当目标待参考数据的第一判断结果为真时,确定待判断数据为真,当目标待参考数据的第一判断结果为伪时,确定待判断数据为伪。
以用户的年龄信息为70岁,年龄阈值为60岁,待判断数据为“多吃豆腐对身体好”,参考信息库中的待参考数据包括“多吃豆腐对身体好”、“多吃菠菜对身体好”和“蜜糖和豆腐可以一起吃”等,且“多吃豆腐对身体好”这一待参考数据对应的第一判断结果为伪,第二判断结果为真为例,此时,参考信息库中存在与待判断数据相同的待参考数据,即目标待参考数据为“多吃豆腐对身体好”,且年龄信息大于年龄阈值,故“多吃豆腐对身体好”这一待判断数据的判断结果以目标待参考数据的第一判断结果为准,此时第一判断结果为伪,所以“多吃豆腐对身体好”这一待判断数据对年龄信息为70岁的用户而言为伪。
当参考信息库中存在目标待参考数据,且年龄信息不大于年龄阈值时,根据目标待参考数据所对应的第二判断结果确定待判断数据的判断结果。具体地,当目标待参考数据的第二判断结果为真时,确定待判断数据为真,当目标待参考数据的第二判断结果为伪时,确定待判断数据为伪。
以用户的年龄信息为20岁,年龄阈值为60岁,待判断数据为“多吃豆腐对身体好”,参考信息库中的待参考数据包括“多吃豆腐对身体好”、“多吃菠菜对身体好”和“蜜糖和豆腐可以一起吃”等,且“多吃豆腐对身体好”这一待参考数据对应的第一判断结果为伪,第二判断结果为真为例,此时,参考信息库中存在与待判断数据相同的待参考数据,即目标待参考数据为“多吃豆腐对身体好”,且年龄信息不大于年龄阈值,故“多吃豆腐对身体好”这一待判断数据的判断结果以目标待参考数据的第二判断结果为准,此时第二判断结果为真,所以“多吃豆腐对身体好”这一待判断数据对年龄信息为20岁的用户而言为真。
当参考信息库中不存在目标待参考数据,确定待判断数据的判断结果为不确定。
此外,在上述步骤105中,输出相应的判断结果提示时,可以通过在终端设备(如电脑、手机)的交互界面展示相应的图形和/或文字来实现。例如,确定待判断数据为真时,在终端设备的交互界面展示文字“正确”,确定待判断数据为伪时,在终端设备的交互界面展示文字“错误”,确定待判断数据为不确定时,在终端设备的交互界面展示文字“未知”。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
本实施例提供一种数据分析装置,该数据分析装置与上述实施例中数据分析方法一一对应。如图6所示,该数据分析装置包括抓取模块10、收集模块20、存储模块30、获取模块40和确定模块50。各功能模块详细说明如下:
抓取模块10,用于抓取预定网站的信息作为待参考数据。
收集模块20,用于获取预设的第一年龄群体和第二年龄群体对待参考数据对应的判断结果;第一年龄群体对应第一判断结果,第二年龄群体对应第二判断结果。
存储模块30,用于将待参考数据、第一判断结果和第二判断结果存储在参考信息库中。
获取模块40,用于获取待判断数据和用户的年龄信息。
确定模块50,用于根据待判断数据和年龄信息搜索参考信息库以确定待判断数据对应的判断结果,并输出相应的判断结果提示。
进一步地,如图7所示,上述收集模块20还可以包括:
选择收集单元21,用于向评价人员的设备发送收集指令;收集指令用于将待参考数据呈现于评价人员的设备的交互界面,并在交互界面提供相应的第一选择框和/或第二选择框;第一选择框用于收集评价人员基于第一年龄群体对待参考数据所作出的真伪判断选择,第二选择框用于收集评价人员基于第二年龄群体对待参考数据所作出的真伪判断选择。
设置单元22,用于根据评价人员在第一选择框和/或第二选择框所作出的真伪判断选择操作设置第一判断结果和/或第二判断结果;第一判断结果对应第一选择框,第二判断结果对应第二选择框。
进一步地,如图8所示,当评价人员为多个且按照权限等级分为一级权限评价人员和二级权限评价人员,上述设置单元22包括:
初步设置子单元221,用于根据多个评价人员在第一选择框和/或第二选择框所作出的真伪判断选择操作得到每个评价人员对应的第一初步判断结果和/或第二初步判断结果;第一初步判断结果对应第一选择框,第二初步判断结果对应第二选择框。
中间设置子单元222,用于根据多个评价人员对应的权限等级、第一初步判断结果和第二初步判断结果确定一级权限评价人员的第一中间判断结果和第二中间判断结果、二级权限评价人员的第一中间判断结果和第二中间判断结果。
最终设置子单元223,用于当二级权限评价人员的数量大于人数阈值时,将二级权限评价人员的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果;当二级权限评价人员的数量不大于人数阈值时,将一级权限评价人员的第一中间判断结果和第二中间判断结果分别作为第一判断结果和第二判断结果。
关于数据分析装置的具体限定可以参见上文中对于数据分析方法的限定,在此不再赘述。上述数据分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例三:
在本实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据分析方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据分析方法。
另外,在另一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中数据分析方法的步骤,例如图2所示的步骤101至步骤105。或者,处理器执行计算机程序时实现上述实施例中数据分析装置的各模块/单元的功能,例如图6所示模块10至模块50的功能。为避免重复,这里不再赘述。
另外,在又一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中数据分析方法的步骤,例如图2所示的步骤101至步骤105。或者,计算机程序被处理器执行时实现上述实施例中数据分析装置的各模块/单元的功能,例如图6所示模块10至模块50的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据分析方法,其特征在于,包括:
抓取预定网站的信息作为待参考数据;
获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果;所述第一年龄群体对应第一判断结果,所述第二年龄群体对应第二判断结果;
将所述待参考数据、所述第一判断结果和所述第二判断结果存储在参考信息库中;
获取待判断数据和用户的年龄信息;
根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示。
2.根据权利要求1所述的数据分析方法,其特征在于,所述获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果包括:
向评价人员的设备发送收集指令;所述收集指令用于将所述待参考数据呈现于所述评价人员的设备的交互界面,并在所述交互界面提供相应的第一选择框和/或第二选择框;所述第一选择框用于收集所述评价人员基于所述第一年龄群体对所述待参考数据所作出的真伪判断选择,所述第二选择框用于收集所述评价人员基于所述第二年龄群体对所述待参考数据所作出的真伪判断选择;
根据所述评价人员在所述第一选择框和/或所述第二选择框所作出的真伪判断选择操作设置所述第一判断结果和/或所述第二判断结果;所述第一判断结果对应所述第一选择框,所述第二判断结果对应所述第二选择框。
3.根据权利要求2所述的数据分析方法,其特征在于,所述评价人员为多个且按照权限等级分为一级权限评价人员和二级权限评价人员,所述根据所述评价人员在所述第一选择框和/或所述第二选择框所作出的真伪判断选择操作设置所述第一判断结果和/或所述第二判断结果包括:
根据多个评价人员在所述第一选择框和/或所述第二选择框所作出的真伪判断选择操作得到每个评价人员对应的第一初步判断结果和/或第二初步判断结果;所述第一初步判断结果对应所述第一选择框,所述第二初步判断结果对应所述第二选择框;
根据所述多个评价人员对应的权限等级、所述第一初步判断结果和所述第二初步判断结果确定所述一级权限评价人员的第一中间判断结果和第二中间判断结果、所述二级权限评价人员的第一中间判断结果和第二中间判断结果;
当所述二级权限评价人员的数量大于人数阈值时,将所述二级权限评价人员的所述第一中间判断结果和所述第二中间判断结果分别作为所述第一判断结果和所述第二判断结果;当所述二级权限评价人员的数量不大于人数阈值时,将所述一级权限评价人员的所述第一中间判断结果和所述第二中间判断结果分别作为所述第一判断结果和所述第二判断结果。
4.根据权利要求3所述的数据分析方法,其特征在于,所述根据所述多个评价人员对应的权限等级、所述第一初步判断结果和所述第二初步判断结果确定所述一级权限评价人员的第一中间判断结果和第二中间判断结果、所述二级权限评价人员的第一中间判断结果和第二中间判断结果包括:
将所述一级权限评价人员中所述第一初步判断结果为真的人数与所述第一初步判断结果为伪的人数进行比较,将所述一级权限评价人员中所述第二初步判断结果为真的人数与所述第二初步判断结果为伪的人数进行比较,并根据比较结果设置所述一级权限评价人员的所述第一中间判断结果和所述第二中间判断结果;
将所述二级权限评价人员中所述第一初步判断结果为真的人数与所述第一初步判断结果为伪的人数进行比较,将所述二级权限评价人员中所述第二初步判断值为真的人数与所述第二初步判断值为伪的人数进行比较,并根据比较结果设置所述二级权限评价人员的所述第一中间判断结果和所述第二中间判断结果。
5.根据权利要求1所述的数据分析方法,其特征在于,所述根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示包括:
搜索所述参考信息库,并判断是否存在与所述待判断数据相同的目标待参考数据;
当所述参考信息库中存在所述目标待参考数据,且所述年龄信息大于年龄阈值时,根据所述目标待参考数据所对应的第一判断结果确定所述待判断数据的判断结果;
当所述参考信息库中存在所述目标待参考数据,且所述年龄信息不大于年龄阈值时,根据所述目标待参考数据所对应的第二判断结果确定所述待判断数据的判断结果;
当所述参考信息库中不存在所述目标待参考数据,确定所述待判断数据的判断结果为不确定。
6.一种数据分析装置,其特征在于,包括:
抓取模块,用于抓取预定网站的信息作为待参考数据;
收集模块,用于获取预设的第一年龄群体和第二年龄群体对所述待参考数据对应的判断结果;所述第一年龄群体对应第一判断结果,所述第二年龄群体对应第二判断结果;
存储模块,用于将所述待参考数据、所述第一判断结果和所述第二判断结果存储在参考信息库中;
获取模块,用于获取待判断数据和用户的年龄信息;
确定模块,用于根据所述待判断数据和所述年龄信息搜索所述参考信息库以确定所述待判断数据对应的判断结果,并输出相应的判断结果提示。
7.根据权利要求6所述的数据分析装置,其特征在于,所述收集模块包括:
选择收集单元,用于向评价人员的设备发送收集指令;所述收集指令用于将所述待参考数据呈现于所述评价人员的设备的交互界面,并在所述交互界面提供相应的第一选择框和/或第二选择框;所述第一选择框用于收集所述评价人员基于所述第一年龄群体对所述待参考数据所作出的真伪判断选择,所述第二选择框用于收集所述评价人员基于所述第二年龄群体对所述待参考数据所作出的真伪判断选择;
设置单元,用于根据所述评价人员在所述第一选择框和/或所述第二选择框所作出的真伪判断选择操作设置所述第一判断结果和/或所述第二判断结果;所述第一判断结果对应所述第一选择框,所述第二判断结果对应所述第二选择框。
8.根据权利要求7所述的数据分析装置,其特征在于,所述评价人员为多个且按照权限等级分为一级权限评价人员和二级权限评价人员,所述设置单元包括:
初步设置子单元,用于根据多个评价人员在所述第一选择框和/或所述第二选择框所作出的真伪判断选择操作得到每个评价人员对应的第一初步判断结果和/或第二初步判断结果;所述第一初步判断结果对应所述第一选择框,所述第二初步判断结果对应所述第二选择框;
中间设置子单元,用于根据所述多个评价人员对应的权限等级、所述第一初步判断结果和所述第二初步判断结果确定所述一级权限评价人员的第一中间判断结果和第二中间判断结果、所述二级权限评价人员的第一中间判断结果和第二中间判断结果;
最终设置子单元,用于当所述二级权限评价人员的数量大于人数阈值时,将所述二级权限评价人员的所述第一中间判断结果和所述第二中间判断结果分别作为所述第一判断结果和所述第二判断结果;当所述二级权限评价人员的数量不大于人数阈值时,将所述一级权限评价人员的所述第一中间判断结果和所述第二中间判断结果分别作为所述第一判断结果和所述第二判断结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述数据分析方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述数据分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477321.3A CN110334260B (zh) | 2019-06-03 | 2019-06-03 | 数据分析方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477321.3A CN110334260B (zh) | 2019-06-03 | 2019-06-03 | 数据分析方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334260A true CN110334260A (zh) | 2019-10-15 |
CN110334260B CN110334260B (zh) | 2024-05-07 |
Family
ID=68140971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910477321.3A Active CN110334260B (zh) | 2019-06-03 | 2019-06-03 | 数据分析方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334260B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004005262A (ja) * | 2002-05-31 | 2004-01-08 | Alliance Group Inc | 医療情報提供サービスシステム、方法及びプログラム |
CN104881591A (zh) * | 2015-06-25 | 2015-09-02 | 贾建平 | 认知障碍数据处理方法以及处理系统 |
CN109273051A (zh) * | 2018-08-30 | 2019-01-25 | 夏茂 | 基于端粒长度的身份信息编码模型 |
CN109358749A (zh) * | 2018-09-30 | 2019-02-19 | 广东原动力信息科技有限责任公司 | 一种体适能分析方法 |
CN109637543A (zh) * | 2018-12-12 | 2019-04-16 | 平安科技(深圳)有限公司 | 语音卡的语音数据处理方法和装置 |
-
2019
- 2019-06-03 CN CN201910477321.3A patent/CN110334260B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004005262A (ja) * | 2002-05-31 | 2004-01-08 | Alliance Group Inc | 医療情報提供サービスシステム、方法及びプログラム |
CN104881591A (zh) * | 2015-06-25 | 2015-09-02 | 贾建平 | 认知障碍数据处理方法以及处理系统 |
CN109273051A (zh) * | 2018-08-30 | 2019-01-25 | 夏茂 | 基于端粒长度的身份信息编码模型 |
CN109358749A (zh) * | 2018-09-30 | 2019-02-19 | 广东原动力信息科技有限责任公司 | 一种体适能分析方法 |
CN109637543A (zh) * | 2018-12-12 | 2019-04-16 | 平安科技(深圳)有限公司 | 语音卡的语音数据处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110334260B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110442790B (zh) | 推荐多媒体数据的方法、装置、服务器和存储介质 | |
CN108986908A (zh) | 问诊数据处理方法、装置、计算机设备和存储介质 | |
CN109614476A (zh) | 客服系统问答方法、装置、计算机设备及存储介质 | |
CN109065139A (zh) | 医疗随访方法、装置、计算机设备和存储介质 | |
CN110377900A (zh) | 网络内容发布的审核方法、装置、计算机设备及存储介质 | |
CN103916436B (zh) | 信息推送方法、装置、终端及服务器 | |
CN108073659A (zh) | 一种婚恋对象推荐方法及装置 | |
CN109408811A (zh) | 一种数据处理方法及服务器 | |
CN109783624A (zh) | 基于知识库的答案生成方法、装置和智能会话系统 | |
CN110263329A (zh) | 软件产品测评处理方法、装置、计算机设备及存储介质 | |
CN106844341A (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN112201359A (zh) | 基于人工智能的重症问诊数据识别方法及装置 | |
JP6970949B2 (ja) | 行動学習装置 | |
Omara et al. | A field-based recommender system for crop disease detection using machine learning | |
CN110134846A (zh) | 文本的专有名词处理方法、装置和计算机设备 | |
CN109471951A (zh) | 基于神经网络的歌词生成方法、装置、设备和存储介质 | |
CN109086386A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN116028613B (zh) | 常识问答方法、系统、计算机设备和存储介质 | |
CN110334260A (zh) | 数据分析方法、装置、计算机设备及存储介质 | |
CN111581929A (zh) | 基于表格的文本生成方法及相关装置 | |
CN113449165A (zh) | 搜索引擎优化方法、装置、设备及存储介质 | |
CN118036756B (zh) | 大模型多轮对话的方法、装置、计算机设备及存储介质 | |
WO2021025094A1 (ja) | 行動学習装置、行動学習方法、行動決定装置、行動決定方法、行動学習システム、プログラム、及び記録媒体 | |
CN112765326B (zh) | 一种问答社区专家推荐方法、系统及应用 | |
CN107509083A (zh) | 直播人数真实性检测方法、存储介质、电子设备及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |