CN116320019B - 数据采集方法、介质以及电子设备 - Google Patents
数据采集方法、介质以及电子设备 Download PDFInfo
- Publication number
- CN116320019B CN116320019B CN202310549135.2A CN202310549135A CN116320019B CN 116320019 B CN116320019 B CN 116320019B CN 202310549135 A CN202310549135 A CN 202310549135A CN 116320019 B CN116320019 B CN 116320019B
- Authority
- CN
- China
- Prior art keywords
- user
- condition
- acquisition
- electronic device
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000015654 memory Effects 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 32
- 230000006399 behavior Effects 0.000 claims description 25
- 238000013480 data collection Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 23
- 239000004576 sand Substances 0.000 claims description 5
- 230000002950 deficient Effects 0.000 claims description 4
- 230000010006 flight Effects 0.000 claims description 4
- 230000033001 locomotion Effects 0.000 claims description 4
- 230000037361 pathway Effects 0.000 claims description 4
- 230000029305 taxis Effects 0.000 claims description 4
- 239000002699 waste material Substances 0.000 abstract description 17
- 238000012545 processing Methods 0.000 abstract description 11
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000007726 management method Methods 0.000 description 58
- 230000008569 process Effects 0.000 description 37
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 238000010295 mobile communication Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004080 punching Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000009529 body temperature measurement Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 208000033748 Device issues Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及数据处理技术领域,具体涉及一种数据采集方法、介质以及电子设备。方法包括:第一电子设备向第二电子设备发送第一采集任务,其中,第一采集任务与第二电子设备的第一设备标识对应,并且第一采集任务包括采集条件,采集条件包括针对第二电子设备的第一使用条件和针对第二电子设备的用户的第一用户条件中的至少一种;第二电子设备接收到第一采集任务后,采集与第一采集任务对应的任务数据,其中,第二电子设备满足采集条件;第二电子设备向第一电子设备发送任务数据。基于此,避免了第二电子设备在不满足采集任务所对应的应用场景下,不会一直进行数据采集,进而避免资源浪费。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据采集方法、介质以及电子设备。
背景技术
目前终端设备,例如手机,一般会给用户提供个性化服务。例如,在用户将要乘坐地铁时,提前弹出用户所需乘坐地铁的卡片;在用户将要打车时,提前弹出用户打车需要使用的乘车软件小窗口;在用户将要去购物时,提前弹出用户将要去的商场的小程序等等。参考图1A,用户B在下班打卡后,离开写字楼A需要去乘坐地铁C,此时用户的手机300会提前弹出用户所需乘坐地铁的卡片,便于用户快速进入地铁站。
这些个性化服务需要在手机等终端设备被用户授权的情况下,采集用户的各种行为数据,并且将采集到的各种行为数据用于训练可以预测用户行为的预测模型,然后基于预测模型对用户行为的预测,进而为用户提供个性化服务。
目前,云端设备在手机等终端设备被用户授权的情况下,通过终端设备的设备标识下发采集任务,终端设备一般会在接收到云端设备下发的采集任务后,进行对应的行为数据的采集。但是在一些情况下,由于应用场景限制等问题,有些终端设备在不符合应用场景的情况下,仍然在进行采集,导致终端设备资源浪费。可以理解,上述终端设备资源可以为功耗资源、存储资源、数据连接资源等。
例如,某些手机根据云端设备下发的与用户乘坐地铁有关的采集任务后,可以采集用户离开家后断开Wi-Fi的时间以及断开Wi-Fi后乘坐地铁情况,可以采集用户下班时间以及下班之后乘坐地铁情况,还可以采集用户骑车/走路/跑步后的乘坐地铁情况等有关数据。但是在一些情况下,用户所在的城市没有地铁,而手机仍持续采集上述数据,导致终端设备资源浪费。
发明内容
为了解决上述问题,本申请提出了一种数据采集方法、介质以及电子设备,避免电子设备在不满足应用场景对应的采集条件时还继续采集的问题,进而避免电子设备的资源浪费,例如功耗资源、存储资源、数据连接资源等浪费。
第一方面,本申请提供了一种数据采集方法,该方法包括:
第一电子设备向第二电子设备发送第一采集任务,其中,第一采集任务与第二电子设备的第一设备标识对应,并且第一采集任务包括采集条件,采集条件包括针对第二电子设备的第一使用条件和针对第二电子设备的用户的第一用户条件中的至少一种;
第二电子设备接收到第一采集任务后,采集与第一采集任务对应的任务数据,其中,第二电子设备满足采集条件;
第二电子设备向第一电子设备发送任务数据。
可以理解的,第一电子设备可以为云端设备,第二电子设备为终端设备。云端设备将和应用场景相关的使用条件或者用户条件作为采集任务的采集条件,使得终端设备在接收到云端设备下发的采集任务后,保证终端设备在满足采集所需任务数据的采集条件时,才进行数据采集。由此,可以避免终端设备在不满足应用场景对应的采集条件时还继续采集,进而避免终端设备的资源浪费,例如功耗资源、存储资源、数据连接资源等浪费。另外,云端设备配置好终端设备的采集条件,并且,该采集条件与各终端设备的具体使用状态以及具体用户情况无关,在下发过程中保证了终端设备用户的隐私。
第二方面,本申请提供了一种数据采集方法,方法包括:
第一电子设备生成第一采集任务,其中,第一采集任务与第二电子设备的第一设备标识对应,并且第一采集任务包括采集条件,采集条件包括针对第二电子设备的第一使用条件和针对第二电子设备的用户的第一用户条件中的至少一种,
并且,采集条件能够被第二电子设备用于判断第二电子设备是否采集与第一采集任务对应的任务数据;
第一电子设备向第二电子设备发送第一采集任务。
可以理解的,第一电子设备可以为云端设备,第二电子设备为终端设备。云端设备配置好终端设备的采集条件,给终端设备提供判断是否需要进行采集任务的选择,有利于终端设备在不满足采集任务对应的应用场景下,不进行数据采集,避免浪费资源。并且,终端设备生成的采集条件与各终端设备的具体情况无关,从而保证了用户的隐私。
在上述第二方面的一种可能实现中,还包括:
第一电子设备基于任务数据,对用户行为预测模型进行训练。
可以理解的,基于采集到所需要的任务数据,从而能够给用户行为预测模型提供更多的样本数据,使得用户行为预测模型能够更好的训练。
在上述第二方面的一种可能实现中,针对第二电子设备的第一使用条件包括设备状态子条件,并且设备状态子条件包括以下至少一种:
电池无缺损、电池电量大于电量阈值、内存可用容量大于内存可用容量阈值、麦克风被打开。
可以理解的,设备状态子条件可以应用在需要终端设备的设备状态有要求的场景,例如,采集用户使用唱歌软件唱歌情况的有关的任务数据,就需要终端设备打开麦克风等。可以理解的,设备状态子条件还可以作为最基本的采集条件之一应用在其他任何场景,例如,电池电量大于电量阈值可以作为所有终端设备进行数据采集的基本条件之一。
在上述第二方面的一种可能实现中,针对第二电子设备的第一使用条件包括系统事件子条件,并且系统事件子条件包括以下至少一种:
系统设置中的第一设置功能被选用、系统通知中的第一通知功能被选用、连接事件中的第一连接功能被选用。
可以理解的,系统事件子条件可以应用在需要对终端设备的系统事件有要求的场景,例如,需要采集系统通知情况的有关的任务数据,就需要系统设置中的某个设置功能打开等。可以理解的,系统事件子条件还可以使用在其他场景,例如,作为采集用户使用某个软件的采集条件之一。
在上述第二方面的一种可能实现中,针对第二电子设备的第一使用条件包括传感器事件子条件,并且传感器事件子条件包括以下至少一种:
第二电子设备的温度计的测量设备温度功能被选用、第二电子设备的温度测量值大于第一设备温度、第二电子设备中的计步器功能被启用、计步器检测到的步数值大于第一步数阈值。
可以理解的,系统事件子条件可以应用在需要对终端设备的传感器有要求的场景。
在上述第二方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括业务事件子条件,并且业务事件子条件包括以下至少一种:
用户乘坐过交通工具,交通工具包括航班、公交车、火车、地铁、出租车中的至少一种;
用户乘坐过的交通工具包括具有第一标识信息的交通工具,第一标识包括第一航班号、第一公交车号、第一火车车次、第一地铁车次中的至少一种;
用户乘坐的交通工具的出发地包括第一出发地;
用户乘坐的交通工具的抵达地包括第一抵达地;
用户乘坐的交通工具的途径站点包括第一站点。
可以理解的,用户乘坐过交通工具的应用场景是很普遍的,对用户乘坐交通工具的场景情况进行各种限定,有利于获取到与用户乘坐交通工具有关的所需数据。
在上述第二方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括位置状态子条件,并且位置状态子条件包括以下至少一种:
用户位于第一地理位置、第二电子设备的网络位置为第一网络位置、第二电子设备的通信小区为第一通信小区。
可以理解的,与用户位置状态有关的应用场景是很普遍的,对与用户位置状态有关的场景情况进行各种限定,便于获取到更多所需的数据。
在上述第二方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括天气状态子条件,并且天气状态子条件包括以下至少一种:
用户所在地的环境温度大于第一环境温度阈值;
用户所在地的湿度大于第一湿度阈值;
用户所在地的空气指数大于第一空气指数阈值;
用户所在地的天气为第一天气状态,第一天气状态包括晴、雨、雪、冰雹、大风、沙尘暴、霾中的至少一种。
可以理解的,与天气状态有关的应用场景是很普遍的,对与天气状态有关的应用场景场景情况进行各种限定,有利于获取到不同的天气状态下的数据,以方面后续使用。
在上述第二方面的一种可能实现中,任务数据包括以下至少一种:用户的乘车记录、用户打卡记录、用户运动记录、用户购物记录、用户使用软件记录。
第三方面,本申请提供了一种数据采集方法,方法包括:
第二电子设备从第一电子设备接收第一采集任务,其中,第一采集任务与第二电子设备的第一设备标识对应,并且第一采集任务包括采集条件,采集条件包括针对第二电子设备的第一使用条件和针对第二电子设备的用户的第一用户条件中的至少一种;
第二电子设备采集与第一采集任务对应的任务数据,其中,第二电子设备满足采集条件;
第二电子设备向第一电子设备发送任务数据。
在上述第三方面的一种可能实现中,针对第二电子设备的第一使用条件包括设备状态子条件,并且设备状态子条件包括以下至少一种:
电池无缺损、电池电量大于电量阈值、内存可用容量大于内存可用容量阈值、麦克风被打开。
在上述第三方面的一种可能实现中,针第二电子设备的第一使用条件包括系统事件子条件,并且系统事件子条件包括以下至少一种:
系统设置中的第一设置功能被选用、系统通知中的第一通知功能被选用、连接事件中的第一连接功能被选用。
在上述第三方面的一种可能实现中,针对第二电子设备的第一使用条件包括传感器事件子条件,并且传感器事件子条件包括以下至少一种:
第二电子设备的温度计的测量设备温度功能被选用、第二电子设备的温度测量值大于第一设备温度、第二电子设备中的计步器功能被启用、计步器检测到的步数值大于第一步数阈值。
在上述第三方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括业务事件子条件,并且业务事件子条件包括以下至少一种:
用户乘坐过交通工具,交通工具包括航班、公交车、火车、地铁、出租车中的至少一种;
用户乘坐过的交通工具包括具有第一标识信息的交通工具,第一标识包括第一航班号、第一公交车号、第一火车车次、第一地铁车次中的至少一种;
用户乘坐的交通工具的出发地包括第一出发地;
用户乘坐的交通工具的抵达地包括第一抵达地;
用户乘坐的交通工具的途径站点包括第一站点。
在上述第三方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括位置状态子条件,并且位置状态子条件包括以下至少一种:
用户位于第一地理位置、第二电子设备的网络位置为第一网络位置、第二电子设备的通信小区为第一通信小区。
在上述第三方面的一种可能实现中,针对第二电子设备的用户的第一用户条件包括天气状态子条件,并且,天气状态子条件包括以下至少一种:
用户所在地的环境温度大于第一环境温度阈值;
用户所在地的湿度大于第一湿度阈值;
用户所在地的空气指数大于第一空气指数阈值;
用户所在地的天气为第一天气状态,第一天气状态包括晴、雨、雪、冰雹、大风、沙尘暴、霾中的至少一种。
在上述第三方面的一种可能实现中,第二电子设备通过以下方式确认第二电子设备的使用状态是否满足第一使用条件:
第二电子设备获取第二电子设备在第一历史时间段内的第一历史使用数据,其中第一历史使用数据包括对应第一使用条件的设备使用数据;
基于第一历史使用数据确认第二电子设备的使用状态是否满足第一使用条件。
可以理解的,第二电子设备存储有对应第一使用条件的设备使用数据,当采集条件中包括使用条件后,能够根据存储的设备使用数据与使用条件匹配,从而根据匹配结果进行任务采集,并且第二电子设备不需要向其他电子设备传输具体的设备使用数据,从而不会泄露用户隐私。
在上述第三方面的一种可能实现中,第二电子设备通过以下方式确认第二电子设备的用户是否满足第一用户条件:
第二电子设备获取第二电子设备在第二历史时间段内的第一历史用户数据,其中第一历史用户数据包括对应第一用户条件的用户情况数据;
基于第一历史用户数据确认第二电子设备的用户是否满足第一用户条件。
可以理解的,第二电子设备存储有对应第一用户条件的历史用户数据,当采集条件中包括用户条件后,能够根据存储的历史用户数据与用户条件匹配,从而根据匹配结果进行任务采集,使得第二电子设备不需要向其他电子设备传输具体的历史用户数据,从而不会泄露用户隐私。
在上述第三方面的一种可能实现中,任务数据包括以下至少一种:用户的乘车记录、用户打卡记录、用户运动记录、用户购物记录、用户使用软件记录。
第四方面,本申请提供了一种电子设备,包括:一个或多个处理器;一个或多个存储器;一个或多个存储器存储有一个或多个程序,当一个或者多个程序被一个或多个处理器执行时,使得电子设备执行上述第一方面以及各种可能的实现提供的数据采集方法、上述第二方面以及各种可能的实现提供的数据采集方法、或者上述第三方面以及各种可能的实现提供的数据采集方法。
第五方面,本申请提供了一种计算机可读存储介质,存储介质上存储有指令,指令在计算机上执行时使计算机执行上述第一方面以及各种可能的实现提供的数据采集方法、上述第二方面以及各种可能的实现提供的数据采集方法、或者上述第三方面以及各种可能的实现提供的数据采集方法。
附图说明
图1A根据本申请一些实施例,示出了一种用户B下班打卡后乘坐地铁的场景示意图;
图1B根据本申请一些实施例,示出了一种云端设备200下发采集任务的场景示意图;
图1C根据本申请一些实施例,示出了一种终端设备100与云端设备200实现数据采集的模块示意图;
图2A根据本申请一些实施例,示出了一种各采集任务与设备标识配置信息以及用户特征配置信息的对应关系示意图;
图2B根据本申请一些实施例,示出了另一种云端设备200下发采集任务的场景示意图;
图3根据本申请一些实施例,示出了一种云端设备200配置采集任务数据,终端设备100采集任务数据的交互示意图;
图4根据本申请的一些实施例,示出了另一种终端设备100与云端设备200实现数据采集的具体模块示意图;
图5根据本申请的一些实施例,示出了一种结合图4所示的云端设备200的功能模块阐述云端设备200配置采集任务的具体过程;
图6根据本申请的一些实施例,示出了一种结合图4所示的终端设备100、以及云端设备200的功能模块,具体阐述终端设备100向云端设备200请求采集任务,并且云端设备200向终端设备100下发采集任务的具体过程示意图;
图7根据本申请的一些实施例,示出了一种结合图4所示的终端设备100、以及云端设备200的功能模块,具体阐述终端设备100采集数据的具体过程示意图;
图8根据本申请的实施例,示出了一种终端设备100的硬件结构示意图。
具体实施方式
本申请的说明性实施例包括但不限于一种数据采集方法、介质以及电子设备。
下面结合附图详细阐述本申请的技术方案。
如前所述,为了给用户提供个性化服务,需要利用用户的行为数据训练可以预测用户行为的预测模型,云端设备在手机等终端设备被用户授权的情况下,通过终端设备的设备标识下发采集任务,从而利用终端设备采集用户行为数据。而由于采集任务所对应的应用场景限制等问题,存在可能无法采集到所需的用户行为数据的问题。
在一些实施例中,任务数据的具体采集过程如下:
云端设备配置有各种采集任务,并且各采集任务都对应有用于完成采集任务的终端设备的设备标识。可以理解的,设备标识可以包括设备型号、系统版本或者软件版本等等。终端设备根据接收到的与自身设备标识对应的采集任务后,进行任务数据采集。例如,云端设备配置有各种采集任务,可以为采集任务A、采集任务B、采集任务C等等。并且,采集任务A与设备型号a对应;采集任务B与设备型号b对应;采集任务C与设备型号c对应等等。
各终端设备在用户授权参与用户数据采集计划的情况下,定期向云端设备发送获取采集任务请求,请求中携带各终端设备的设备型号,此时云端设备会将与设备型号对应的采集任务下发给对应的终端设备。
例如,如图1B所示的云端设备200下发采集任务场景中,云端设备200会向设备型号为a的终端设备100、终端设备101、终端设备102等终端设备下发采集任务A;向设备型号为b的终端设备10、终端设备11、终端设备12发送采集任务B;向设备型号为c的终端设备0、终端设备1、终端设备2发送采集任务C等等。
各终端设备在接收到与采集任务后,进行任务数据的采集。
但是,由于存在各采集任务所对应的应用场景限制,导致终端设备资源浪费,上述终端设备资源可以为功耗资源、存储资源、数据连接资源等。例如,采集乘坐地铁有关任务数据,需要应用在用户所在的城市有地铁的场景,而终端设备在没有地铁的城市还一直不停的采集,导致终端设备资源浪费,终端设备资源可以为功耗资源、存储资源、数据连接资源等。
下面以终端设备100与云端设备200为例,具体阐述终端设备以及云端设备完后数据采集的过程。例如,如图1C示出了终端设备100与云端设备200实现数据采集的模块示意图。
如图1C所示,终端设备100包括终端采集任务管理模块101'、数据采集模块102'。云端设备200包括云端采集任务管理模块210'、数据湖202'、云端采集任务管理模块210'中包括采集任务配置模块211'。
可以理解的,终端采集任务管理模块101'向云端设备200发送获取采集任务的请求,请求中携带终端设备100所对应的设备标识信息。云端设备200中的采集任务配置模块211'接收到采集任务请求后,将请求中的终端设备100的设备标识与各任务所配置的设备标识匹配,将匹配成功的采集任务下发给终端设备100中的终端采集任务管理模块101'。数据采集模块102'进行采集数据任务,然后将采集到的任务数据上传给数据湖202',以用于后续用户行为模型预测。
但是,终端设备100在获取到与自身设备标识(例如,设备型号,系统版本,软件版本等)相对应的采集任务后,由于应用场景限制,导致终端设备资源浪费。例如,用户所在的城市没有地铁,导致终端设备在没有地铁的城市还一直不停的采集,导致终端设备资源浪费,比如说功耗资源、存储资源、数据连接资源等。
因此,为了解决电子设备在一些场景中的资源浪费的问题,本申请提出了一种数据采集方法,该采集方法中,云端设备在采集用户行为数据前,会将采集任务与用于采集任务数据的终端设备的设备标识以及采集条件之间,建立对应关系,其中,采集条件包括进行任务数据采集的终端设备的使用条件以及终端设备的用户的用户条件中的至少一种。其中,使用条件以及用户条件是与采集任务的具体应用场景相关的条件。例如,对于采集任务为与用户乘坐地铁相关的场景,用户条件可以为“用户所在的地理位置为北京,并且用户乘坐过地铁”。又例如,对于采集任务为用户使用唱歌软件有关的任务数据,使用条件可以为“麦克风被打开”。再例如,对于采集任务为与用户航班安检相关的场景,用户条件可以为“用户乘坐过飞机”,使用条件可以为“电池电量大于10%”。
然后,云端设备根据终端设备的设备标识向终端设备发送采集任务时,会同时向终端设备发送用户特征配置信息,其中,用户特征配置信息中包括采集条件。终端设备接收到采集任务后,在确认出终端设备满足采集条件时,例如可以确认出自身设备满足用户特征配置信息中的使用条件或者用户条件,此时才采集任务数据。
例如,对于前述采集任务为用户乘坐地铁有关场景,终端设备确认出用户所在的地理位置为北京,并且用户乘坐过地铁,此时才采集任务数据。又例如,对于前述采集任务为用户使用唱歌软件有关场景,终端设备确认出终端设备的麦克风有打开,此时才采集任务数据。再例如,对于前述采集任务为与用户航班安检相关的场景,终端设备确认出用户乘坐过飞机,并且电池电量大于10%,此时才采集任务数据。
最后,终端设备可以将采集到的任务数据上传到云端设备,使得云端设备采集到用户行为数据,并且利用采集到的用户行为数据训练用户行为预测模型。例如,终端设备100将采集到的用户离开家后断开Wi-Fi的时间以及断开Wi-Fi后乘坐地铁情况(包括乘坐地铁和不乘坐地铁的数据),用户下班的时间以及下班之后乘坐地铁情况(包括乘坐地铁和不乘坐地铁的数据),以及用户骑车/走路/跑步后的乘坐地铁情况(包括乘坐地铁和不乘坐地铁的数据)等有关的采集任务数据上传云端设备。
可以理解的,云端设备在配置采集任务时,将和应用场景相关的使用条件或者用户条件,作为采集任务的采集条件,使得终端设备在接收到云端设备下发的采集任务后,保证终端设备在满足采集所需任务数据的采集条件时,才进行数据采集,避免终端设备在不满足应用场景对应的采集条件时还继续采集的问题。从而避免了终端设备的资源浪费,例如可以避免功耗资源、存储资源、数据连接资源等浪费。
可以理解的,对应于不同应用场景,采集到的任务数据不同。例如,当采集任务与乘坐交通工具有关时,采集到的任务数据可以为用户的乘车记录,具体可以有乘坐地铁、火车、飞机、出租车等情况数据;当采集任务与上班、上学有关时,采集到的任务数据可以为用户打卡记录,具体可以有用户上课打卡、上班打卡等情况数据;当采集任务与用户锻炼情况相关时,采集到的任务数据可以为用户运动记录,具体可以有用户跑步、用户跳操、用户散步等情况数据;当采集任务与用户购物情况相关时,采集到的任务数据可以为用户购物记录,具体可以有用户去商场、去商铺等情况数据;还可以为用户使用软件记录,例如,使用某种软件的频率、时间等数据。
下面结合图2A和图2B所示的图例,阐述终端设备100以及云端设备200进行数据采集的过程。
云端设备200在配置采集任务时,对各采集任务配置有对应的设备标识配置信息以及用户特征配置信息。其中,用户特征配置信息可以为本申请提及的采集条件,包括进行任务数据采集的终端设备的使用条件以及终端设备的用户的用户条件中的至少一种。
图2A示出了一种各采集任务与设备标识配置信息以及用户特征配置信息的对应关系。具体的,采集任务A对应的设备标识配置信息包括设备型号a、对应的用户特征配置信息包括用户条件“地理位置:城市,北京;地铁出行事件:用户乘坐过地铁”,其中“地理位置:城市,北京;地铁出行事件:用户乘坐过地铁”表明采集条件为用户在城市为北京并且乘坐过地铁;采集任务B对应的设备标识配置信息包括设备型号b、对应的用户特征配置信息包括用户条件“航班出行事件:用户乘坐过飞机”、使用条件“电量情况:电池电量大于10%”,其中“航班出行事件:用户乘坐过飞机”、使用条件“电量情况:电池电量大于10%”表明采集条件为用户乘坐过飞机并且终端设备的电池电量大于10%;采集任务C对应的设备标识配置信息设备型号c、对应的用户特征配置信息包括用户条件“地理位置:城市,北京;天气状态:雨”对应,其中“地理位置:城市,北京;天气状态:雨”表明采集条件为用户所在城市北京并且所在城市的天气为雨。
云端设备200向各终端设备下发采集任务。如图2B所示,云端设备200向设备型号为a的终端设备100、终端设备101、终端设备102等终端设备下发采集任务A,并且下发的采集任务A中包括“用户所在城市为北京并且用户乘坐过地铁”的用户条件;云端设备200向设备型号为b的终端设备10、终端设备11、终端设备12发送采集任务B,采集任务B中包括“用户乘坐过飞机”的用户条件以及“电池电量大于10%”的使用条件;云端设备200向设备型号为c的终端设备0、终端设备1、终端设备2发送采集任务C等等,采集任务C中包括“用户所在城市北京、用户所在城市的天气为雨”的用户条件。
终端设备100接收任务数据,并且根据与采集条件的匹配情况进行数据采集。如图2B所示,对于采集任务A,设备型号为a的终端设备100确认出用户所在的城市为北京并且用户乘坐过地铁,才采集与采集任务A相关的数据;而终端设备101、终端设备102由于确认出用户所在的城市不在北京,所以就不进行任务数据的采集,从而避免功耗资源、存储资源或者后续的数据连接资源浪费。同理,对于采集任务B,只有终端设备11对应的用户乘坐过飞机并且电池电量大于10%,才进行数据任务的采集;对于采集任务C,只有终端设备1对应的用户所在城市为北京,并且天气为雨,才进行数据任务的采集。
可以理解的,在一些实施例中,终端设备的使用条件可以包括设备状态子条件、系统事件子条件、传感器事件子条件等等。可以理解的,终端设备的使用条件还可以包括其他子条件,在此不做限制。
其中,设备状态子条件可以包括电池无缺损、电池电量大于电量阈值、内存可用容量大于内存可用容量阈值、麦克风被打开,还可以包括其他与设备状态相关的条件,在此不做限制。
系统事件子条件可以包括系统设置中的所需的设置功能被选用、系统通知中的所需的通知功能被选用、连接事件中的所需的连接功能被选用,还可以包括其他与系统事件相关的条件,在此不做限制。
传感器事件子条件可以包括:终端设备的温度计的测量设备温度功能被选用、终端设备的温度测量值大于所需的设备温度、终端设备的计步器功能被启用、终端设备的计步器检测到的步数值大于步数阈值,还可以包括其他与传感器事件相关的条件,在此不做限制。
可以理解的,在一些实施例中,与终端设备的用户对应的用户条件可以包括业务事件子条件、位置状态子条件、天气状态子条件等等。可以理解的,用户条件还可以包括其他子条件,在此不做限制。
其中,业务事件子条件可以包括用户乘坐过与任务相关的交通工具,其中,交通工具可以包括航班、公交车、火车、地铁、出租车等等。并且,对于各类交通工具,业务事件子条件还可以包括用户乘坐过的具体交通工具包括所需的标识信息,例如,航班号、公交车号、火车车次、地铁车次等等;用户乘坐的具体交通工具的出发地包括了所需的出发地;用户乘坐的交通工具的抵达地包括所需的抵达地;用户乘坐的交通工具的途径站点包括所需的站点;还可以包括其他与业务事件相关的条件,在此不做限制。
位置状态子条件可以包括终端设备的用户位于所需的地理位置,例如,某个国家、某个省、某个城市、某个景点等等;终端设备的网络位置为所需的网络位置,例如,终端设备的网络位置为家庭无线局域网、为商场网络、为学校网络、为写字楼网络;终端设备的通信小区为所需的通信小区,例如,终端设备的通信小区的小区识别码是在小区识别码范围内的;还可以包括其他与位置状态相关的条件,在此不做限制。
天气状态子条件可以包括终端设备的用户所在地的环境温度大于某个环境温度阈值、或者在某个环境温度范围内;终端设备的用户所在地的湿度大于某个湿度阈值、或者在湿度阈值范围内;用户所在地的空气指数大于某个空气指数阈值、或者在某个空气指数范围内;用户所在地的天气状态可以包括晴、雨、雪、冰雹、大风、沙尘暴、霾中的某种或者多种天气;还可以包括其他与位置状态相关的条件,在此不做限制。
可以理解的,在一些实施例中,云端设备在对采集任务进行配置时,还可以配置采集结束策略,以规定终端设备的采集期限。例如,采集结束策略为采集时间为3月1号至3月7号,又例如,采集结束策略为采集任务数据的样本总数量为10000。
终端设备在接收到采集任务后,可以周期性的确认是否满足采集条件,其中,采集条件可以为上述提及的具体的终端设备的使用条件以及与终端设备的用户对应的用户条件。例如,终端设备还可以在采集结束的期限之前周期性的获取一段时间的历史数据,将历史数据与接收到的采集条件比对,在满足采集条件的情况下,再进行数据采集;在不满足采集条件的情况下,不进行数据采集,以适应用户动态变化。其中,历史数据可以包括历史使用数据,以及历史用户数据。历史使用数据包括对应使用条件的设备使用数据,历史用户数据包括对应用户条件的用户情况数据。
可以理解的,云端设备在向终端设备下发的采集任务的采集条件与各终端设备的具体使用状态和具体的用户情况没有关系,不会泄露用户隐私。并且,终端设备存储有与采集条件相对应的历史数据,不需要向其他电子设备传输具体的设备使用数据或者与具体用户情况相关的数据,就可以确认出是否需要数据采集,也保证了终端设备的用户的隐私安全。
例如,在采集时间期限内,终端设备100接收到与采集任务对应的采集条件为用户所在城市为北京并且用户乘坐过地铁,则终端设备100从内部存储的历史数据中获取前2天用户所在的城市以及用户乘坐地铁情况。如果前用户2天内都在北京并且乘坐过一次地铁,则认为满足采集条件,采集任务数据,可以采集用户离开家后断开Wi-Fi的时间以及断开Wi-Fi后乘坐地铁情况(包括乘坐地铁和不乘坐地铁的数据),采集用户下班的时间以及下班之后乘坐地铁情况(包括乘坐地铁和不乘坐地铁的数据)。如果前2天中有一天不在北京或者没有乘坐过地铁,则不进行数据采集,等待下一次判断是否满足采集条件。
可以理解的,当采集任务对应的实际情况发生变化,对于同样的采集任务,可以动态调整具体的采集条件,以适应新的采集业务。例如,对于与用户乘坐地铁有关的采集任务,原先西安没有地铁,所以采集条件中的具体地理位置中没有西安这个城市。随着时间变化,西安有了地铁,此时,对于采集条件中的具体地理位置,可以将城市西安加进去,由原先的“地理位置:北京”变为“地理位置:北京或者西安”。
可以理解的,上述终端设备100所对应的终端设备包括但不限于手机、平板电脑、智慧屏、可穿戴设备(例如,手表、手环、头盔、耳机等)、车载设备、增强现实(AugmentedReality,AR)/虚拟现实(Virtual Reality,VR)设备、笔记本电脑、超级移动个人计算机(Ultra-mobile Personal Computer,UMPC)、上网本、个人数字助理(PersonalDigitalAssistant,PDA)等电子设备中的一种。云端设备200所对应的云端设备可以是单独的服务器,也可以是多个服务器构成的服务器集群。
图3根据本申请的一些实施例,云端设备200与终端设备100执行数据采集方法的具体交互过程示意图。图3示出的采集方法中,云端设备200配置任务数据,终端设备100接收任务数据,并且根据与终端设备100的使用状态或者用户情况有关的历史数据与采集条件的匹配情况进行数据采集,具体过程如下:
S301,云端设备200进行采集任务配置。
在一些实施例中,云端设备200可以根据用户的选择配置采集任务,以生成各采集任务。其中,各采集任务与各采集任务配置信息相对应。例如,各采集任务配置信息可以包括任务描述配置信息、设备标识配置信息、用户特征配置信息、以及采集结束策略配置信息等。
其中,上述任务描述配置信息可以包括配置的任务名称、任务优先级、任务描述等信息。
上述设备标识配置信息可以包括用于进行采集任务的终端设备的设备型号、系统版本、软件包名、软件版本等。
上述用户特征配置信息可以包括用于进行采集任务的终端设备的采集条件,采集条件可以包括进行采集任务的终端设备的使用条件和终端设备的用户的用户条件。可以理解的,可以根据采集任务所对应的应用场景情况,进行使用条件与用户条件的配置,从而得到用户特征配置信息。例如,用户特征配置信息包括上述提及的使用条件与用户条件。其中,具体根据采集任务所对应的应用场景情况,进行使用条件与用户条件的配置,从而得到用户特征配置信息。得到用户特征配置信息的具体过程将在下文图5中进行介绍,在此不做赘述。
上述采集结束策略配置信息包括用于进行采集任务的终端设备的采集结束的期限,例如,采集样本总量、采集时间周期等信息。
例如,对于配置与用户乘坐地铁相关的采集任务,采集任务描述配置信息包括采集用户离开家后断开Wi-Fi的时间以及断开Wi-Fi后乘坐地铁情况的数据,采集用户下班的时间以及下班之后乘坐地铁情况的数据、用户骑车/走路/跑步后的乘坐地铁情况的数据。
上述设备标识配置信息可以包括对应需要进行用户乘坐地铁相关的采集任务的终端设备的设备型号,例如为设备型号a。
上述用户特征配置信息的采集条件可以包括:“地理位置:城市,北京;地铁出行事件:用户乘坐过地铁”。
上述采集结束策略配置信息可以包括终端设备的采集时间期限,例如在3月1日至3月7日进行采集。
S302,终端设备100向云端设备200发送采集任务请求,请求中包括自身设备标识信息。
在一些实施例中,终端设备100向云端设备200发送获取采集任务的请求,请求中包括终端设备100自身设备所对应的设备标识信息。其中,终端设备100自身设备所对应的设备标识包括设备型号、系统版本、软件包名、软件版本等信息。
S303,云端设备200判断设备标识是否匹配。
可以理解的,根据接收的终端设备100的设备标识,云端设备200判断是否能够从各采集任务中匹配到采集任务,即判断采集任务的对应的设备标识是否与终端设备100的设备标识相同。如果匹配到相同的设备标识,则进入S305,云端设备200下发采集任务给终端设备100;否则,进入S304,云端设备200不下发采集任务给终端设备100。
例如,终端设备100的设备标识为设备型号a,从各采集任务中匹配到采集用户乘坐地铁相关的任务的设备标识为设备型号a,则将该采集用户乘坐地铁相关的任务下发给终端设备100。
S304,云端设备200不下发采集任务信息给终端设备100。
可以理解的,若设备标识没有匹配成功,云端设备200不下发采集任务信息给终端设备100,即终端设备100不会接收到采集任务,不进行任务数据采集。
S305,云端设备200将采集任务下发给终端设备100。
可以理解的,云端设备200可以将采集任务以任意可实施的格式发送给终端设备100,其中,采集任务中可以包括各任务配置信息。
在一些实施例中,采集任务可以包括任务描述配置信息和采集结束策略配置信息。
在另一些实现方式中,采集任务配置信息还可以包括任务描述配置信息,采集结束策略配置信息,用户特征配置信息。
可以理解的,在一些实现方式中,终端设备100中内置有具体采集任务描述,并且,各具体采集任务描述都有对应的编号,所以下发的采集任务中的任务描述配置信息可以为具体任务的编号。
例如,云端设备200将采集用户乘坐地铁相关的任务下发给终端设备100。
S306,终端设备100对接收的采集任务解析,得到各采集任务配置信息。
在一些实施例中,得到的采集任务配置信息包括任务描述配置信息,采集结束策略配置信息。
在另一些实施例中,得到的采集任务配置信息可以包括任务描述配置信息,采集结束策略配置信息、用户特征配置信息。
在一些实现方式中,终端设备100接收云端设备200下发的采集任务,将采集任务进行解析,得到对应格式的采集任务配置信息。例如,将接收的.xml格式的采集任务进行解析,得到某种格式的各采集任务配置信息。
例如,终端设备100将接收的与用户乘坐地铁相关的采集任务解析,从而得到与具体某种格式的任务编号,某种格式的用户特征配置信息,某种格式的采集结束策略配置信息。
S307,终端设备100根据采集结束策略配置信息判断是否结束采集。
可以理解的。终端设备100进行采集需要一个采集期限。采集结束策略配置信息中包括了采集期限,例如,采集开始的时间、采集结束的时间;还例如采集的总样本数量等等。所以需要根据采集结束策略配置信息定期判断是否结束采集。若判断出结束采集任务,进入步骤S311;否则,进入步骤S308,进行后续是否进行采集任务数据的判断。
在一些实施例中,终端设备100将采集结束策略配置中的采集期限与当前时间比较,如果当前时间不在采集期限内,就判定不需要继续采集任务数据,进入步骤S311,结束采集任务。如果当前时间在采集期限内,就判定需要继续采集任务数据,进入步骤S308,进行后续过程。
在另一些实施例中,当采集期限为采集总样本数量时,以当前采集的样本数量与所要采集的总样本数量比较,如果当前采集样本数达到采集的总样本数量,就判定不需要继续采集任务数据,进入步骤S311,结束采集任务。如果当前采集样本数没有达到采集的总样本数量,就判定需要继续采集任务数据,进入步骤S308,进行后续过程。
例如,采集结束策略配置信息中采集时间期限是3月1号开始采集,3月7日结束采集。终端设备100在3月2号判断是否结束采集,此时终端设备100判断不满足采集结束的时间,进入S308,进行后续过程。又例如,终端设备100在3月8号判断是否结束采集,此时终端设备100判断满足采集结束的时间,进入S311,结束采集。
S308,终端设备100根据采集任务中是否包括用户特征配置信息判断是否需要进行采集条件匹配。
可以理解的,终端设备100接收云端设备200下发的采集任务中不一定包括用户特征配置信息,即不一定包括采集条件。当采集任务中包括用户特征配置信息,则判定需要进行采集条件匹配,进入S309;否则,则意味着该采集任务对应用场景不需要限制,进入S310,进行数据采集。
在一些实施例中,终端设备100根据对采集任务解析得到的各采集任务配置信息中查看是否包括用户特征配置信息,如果包括用户特征配置信息,进入S309;如果不包括用户特征配置信息,进入S310,进行数据采集。
例如,终端设备100接收的与用户乘坐地铁相关的采集任务中包括用户特征配置信息,即包括了采集条件,进入S309。
S309,终端设备100根据历史数据判断是否与用户特征配置信息中的采集条件匹配。
可以理解的,历史数据可以包括终端设备100的历史使用数据,或者历史用户数据,其中,历史使用数据包括与采集条件中的使用条件对应的设备使用数据,历史用户数据包括与采集条件中的用户条件对应的用户情况数据。例如,历史使用数据与上述采集条件相对应的设备状态、系统事件、传感器事件等相对应,历史用户数据与业务事件、位置状态、天气状态等相对应。当根据历史数据判断出与用户特征配置信息中的采集条件匹配后,说明当前终端设备100符合采集任务中的采集条件,进入S310,进行数据采集;当根据历史数据判断出与用户特征配置信息中的采集条件不匹配,说明当前终端设备100不符合采集任务的采集条件,进入S311,结束当前的采集。
可以理解的,终端设备能够在采集任务所对应的应用场景下进行任务采集,避免终端设备在不满足采集任务所对应的应用场景的情况下,还进行数据采集,浪费资源。
在一些实现方式中,终端设备100将用户特征配置信息进行解析,得到具体的采集条件。然后从存储的历史数据中获取预设历史时间段内的与采集条件相对应的历史数据。如果获取到与采集条件相关的历史数据与解析出的具体的采集条件匹配,则判断出终端设备的设备使用情况或者用户情况与用户特征配置信息中的采集条件匹配,可以进入S310,进行数据采集。如果没有获取到与采集条件相关的数据或者获取的相关数据与解析出的具体的采集条件不匹配,则判断出终端设备的设备使用情况或者用户情况与用户特征配置信息中的采集条件不匹配,可以进入S311,结束当前的采集。
可以理解的,具体的根据历史数据与采集条件的匹配过程可以按照情况在终端设备100上任意设定,在此不做具体限定。
例如,对于与用户乘坐地铁有关的采集任务,终端设备100将用户特征配置信息进行解析,得到具体的采集条件为“地理位置:城市,北京;地铁出行事件:用户乘坐过地铁”。
假设需要判断出2天内的地理位置都为“北京”与采集条件中的具体地理位置符合,以及用户2天内至少乘坐过一次地铁与采集条件中的具体乘坐地铁的业务事件符合,才认为采集条件匹配成功,否则匹配不成功。
此时,终端设备100从存储的历史数据中获取2天内与地理位置以及用户乘坐地铁事件相关的数据,例如,获取到用户2天内的地理位置在北京,并且2天内用户都乘坐过地铁,则判断出匹配成功。
可以理解的,还可以假设需要判断出前1天的地理位置都为“北京”与采集条件中的具体地理位置符合,以及用户2天内都乘坐过地铁与采集条件中的具体乘坐地铁的业务事件符合,才认为采集条件匹配成功,否则匹配不成功,具体其他情况在此不再赘述。
S310,终端设备100采集任务数据。
可以理解的,终端设备100采集与接收的采集任务所对应的任务数据,例如,与任务描述配置信息中的具体的任务描述相对应的数据。例如,对于与用户乘坐地铁相关的采集任务,采集与用户离开家后断开Wi-Fi的时间以及断开Wi-Fi后乘坐地铁情况(包括乘坐地铁以及不乘坐地铁)的任务数据,采集用户下班的时间以及下班之后乘坐地铁情况(包括乘坐地铁以及不乘坐地铁)的数据、用户骑车/走路/跑步后的乘坐地铁情况(包括乘坐地铁以及不乘坐地铁)的任务数据。
可以理解的,在一些实施例中,当终端设备100进行任务数据采集后,得到的任务数据满足所需的上传任务数据量后,把先采集到的数据发送给云端设备200,进入S312。
在另一些实施例中,当终端设备100进行任务数据采集后,会再次进入S307,定期判断是否满足采集结束的期限。
S311,终端设备100结束采集。
在一些实施例中,当终端设备100在判断出达到采集结束的期限,从而结束采集后,终端设备100结束当前的采集任务,此时终端100可以把采集到的任务数据发送给云端设备200,从而进入S312;终端设备100也可以等待其他采集任务的进行,可以直至结合其他采集任务的任务数据的总数量满足所需的上传任务数据量,再将任务数据上传,从而进入S312。
在另一些实施例中,当终端设备100由于采集条件不匹配的原因结束采集后,可以在等待预设时间后,进入S307,在此进行采集期限判断,以及采集条件的匹配过程。
可以理解的,在又一些实施例中,终端设备100还可以在预设时间后,直接进入S309(图中未示出),直接进行采集条件的判断。
可以理解的,由于终端设备100的历史数据随着时间是会变化的,虽然当前采集条件匹配失败,但是,过一段时间后,存在匹配成功的可能性,从而实现动态匹配。
S312,终端设备100向云端设备200发送采集到的任务数据。
S313,云端设备200接收采集的任务数据并存储。
可以理解,上述步骤S301至步骤S313的执行顺序只是一种示意,在另一些实施例中,也可以采用其他执行顺序,还可以拆分或合并部分步骤,在此不做限定。通过上述步骤S301至S313,可以保证终端设备在满足采集所需任务数据的采集条件时,才进行数据采集。由此,可以避免终端设备在不满足应用场景对应的采集条件时还继续采集的情况,进而避免终端设备的资源浪费,例如功耗资源、存储资源、数据连接资源等浪费。另外,云端设备配置好终端设备的采集条件,并且,该采集条件与各终端设备的具体使用状态以及具体用户情况无关,在下发过程中保证了终端设备用户的隐私。
图4根据本申请的一些实施例,示出了另一种终端设备100与云端设备200实现数据采集的具体模块示意图。
如图所示,终端设备100包括,终端采集任务管理模块101、数据采集模块102、特征计算管理模块103、个人行为数据库104;云端设备200包括:云端采集任务管理模块210、元数据管理模块203、数据湖202,其中,云端采集任务管理模块210包括采集任务配置模块211。
下面对云端设备200中的具体模块功能进行介绍:
云端采集任务管理模块210用于对采集任务进行配置和管理。
在一些实施例中,采集任务配置模块211用于实现对采集任务的配置得到各采集任务所对应的采集任务配置信息。例如,在一些实施例中,采集任务配置模块211包括任务描述配置子模块211a、设备标识配置子模块211b、采集结束配置子模块211c、用户特征配置子模块211d。
其中,任务描述配置子模块211a用于配置采集任务所对应的任务描述信息,例如,采集任务的任务名称、任务优先级以及其他具体任务描述等,得到任务描述配置信息。
设备标识配置子模块211b用于配置采集任务所对应的设备标识,例如,用于采集数据的设备所对应的设备型号、系统版本、软件包名、软件版本等,得到设备标识配置信息。
采集结束配置子模块211c用于配置采集任务所对应的采集期限,例如,采集的开始时间、采集的结束时间,采集样本总数量等,得到采集结束策略配置信息。
用户特征配置子模块211d用于配置进行采集任务的终端设备的采集条件,采集条件包括与进行采集任务的终端设备的使用条件和终端设备的用户的用户条件。例如,用户特征配置信息可以根据采集任务所对应的应用场景情况,进行使用条件与用户条件的配置,从而得到用户特征配置信息。
元数据管理模块203用于管理元数据,其中元数据包括与配置所需具体的采集条件对应的终端设备的使用因素,和终端设备的用户有关的用户因素。其中,管理的元数据所对应的具体因素是与终端设备的可以获取的历史数据相对应的因素。
元数据中的使用因素包括,设备状态、系统事件、传感器事件、业务事件等,元数据中的用户因素包括位置状态、天气状态等。其中,设备状态因素具体还可以包括电池状态、电量情况、内存状态、麦克风状态等,其中,内存状态可以包括内存可用容量等。系统事件因素具体还包含系统设置情况、系统通知情况、连接事件等。业务事件的事件因素具体还包含航班事件、公交出行事件、火车出行事件、地铁出行事件、出租车出行事件等,其中,对各种交通工具事件,还可以具体包括是否乘坐过对应交通工具,乘坐时的交通工作的标识、乘坐的交通工具的出发地、乘坐的交通工具的抵达地、乘坐的交通工具的途径站点。传感器事件因素具体还包含温度计情况、计步器情况等,其中,对于温度计情况,还可以具体包括是否具有测量设备功能等,对于计步器,还可以具体包括是否具有计步功能等。位置状态因素具体还包含地理位置(例如全球定位系统(Global Positioning System,GPS)信息)、无线网络(Wi-Fi)位置、通信小区(例如,通信小区识别码(CELLID))等;天气状态因素具体还包含用户所在地的环境温度、用户所在地的湿度、用户所在地的空气指数、用户所在地的天气等。
数据湖202用于存储数据。
下面对于终端设备100中的具体模块功能进行介绍:
终端采集任务管理模块101用于发送采集任务请求;还用于对获取到的采集任务进行任务解析,以及对采集任务进行启动、停止管理。
在一些实施例中,终端采集任务管理模块101包括采集任务配置解析子模块101a、采集任务启停子模块101b。
其中,采集任务配置解析子模块101a用于将采集任务进行任务解析,得到采集任务解析结果。采集任务解析结果中包括各采集任务配置信息,例如,用户特征配置信息、采集结束策略配置信息,任务描述配置信息等等。
采集任务启停子模块101b用于根据采集结束策略配置信息判断数据采集是开始还是结束。
特征计算管理模块103用于对采集任务中的用户特征配置信息解析得到具体的采集条件,并且将终端设备100中与采集条件对应的历史数据与解析到的具体采集条件进行匹配,得到匹配结果。
在一些实例中,特征计算管理模块103包括用户特征配置解析子模块103a和用户特征计算子模块103b。
其中,用户特征配置解析子模块103a用于对用户特征配置信息解析得到具体的采集条件。
用户特征计算子模块103b用于与采集条件对应的历史数据与解析到的具体采集条件进行匹配,得到匹配结果。
个人行为数据库104用于存储与采集条件所对应的历史数据,历史数据包括终端设备100的历史使用数据,以及历史用户数据,其中,历史使用数据包括与采集条件中的使用条件对应的设备使用数据,历史用户数据包括与采集条件中的用户条件对应的用户情况数据。例如,与上述采集条件相对应的设备状态、系统事件、传感器事件等相对应的历史使用数据,与业务事件、位置状态、天气状态等相对应的历史用户数据。
数据采集模块102用于采集数据。
可以理解的,在一些实施例中,云端设备200和终端设备100包括用于采集任务配置、采集条件匹配以及进行数据采集的接口。例如,下表1根据本申请的一些实施例,示出了部分用于采集任务配置、采集条件匹配以及进行数据采集的具体接口。
表1
接口编号 | 接口名称 | 接口描述 |
IF1 | 特征元数据获取接口 | 用于获取配置采集任务所需的元数据 |
IF2 | 终端采集任务请求接口 | 用于进行采集任务请求,其中,采集任务请求中携带终端设备的设备标识 |
IF3 | 云端采集任务下发接口 | 用于对与设备标识匹配的终端设备进行采集任务下发 |
IF4 | 特征计算请求接口 | 用于根据用户特征配置信息中的采集条件,进行采集条件匹配的请求 |
IF5 | 个人行为数据库读取接口 | 用于从个人行为数据库中读取与终端设备的使用状态以及用户条件相关的历史数据 |
1F6 | 特征计算返回接口 | 用于返回特征计算结果(采集条件匹配结果) |
1F7 | 数据采集启动/停止接口 | 用于请求数据采集启动或者停止 |
IF8 | 终端数据上云接口 | 用于将采集到的任务数据上传 |
图5根据本申请的一些实施例,示出了一种云端设备200配置采集任务的具体过程,下面结合上述图4所示的云端设备200的功能模块进行具体介绍。
S501,开始配置采集任务。
在一些实施例中,采集任务配置模块211开始配置采集任务。
在一些实现方式中,任务描述配置子模块211a开始配置采集任务所对应的任务描述信息,得到任务描述配置信息,其中,任务描述配置信息包括采集任务的任务名称、任务优先级以及其他具体任务描述等。
设备标识配置子模块211b开始配置采集任务所对应的设备标识,得到设备标识配置信息,其中,设备标识可以包括用于采集数据的设备所对应的设备型号、系统版本、软件包名、软件版本等。
采集结束配置子模块211c开始配置采集任务所对应的采集期限,得到采集结束配置信息,例如,可以包括采集样本总量、采集时间周期等信息。
用户特征配置子模块211d开始配置进行采集任务的终端设备的采集条件,得到用户特征配置信息,其中,用户特征配置信息中的采集条件包括需要进行采集任务的终端设备的使用条件和终端设备的用户的用户条件。
S502,发送元数据信息查询请求。
在一些实施例中,采集任务配置模块211通过上述表1中的IF1接口获取元数据信息。
在一些实现方式中,用户特征配置子模块211d向元数据管理模块203发送元数据信息查询请求。可以理解的,当云端设备的配置人员在配置所需的采集任务时,有考虑到与进行该采集任务所需的采集条件所对应的终端设备的具体的使用因素或者终端设备的用户有关的具体的用户因素。用户特征配置子模块211d向元数据管理模块203发送元数据信息查询请求,请求查询所管理的元数据中是否存在对应的因素。
例如,对于配置与用户乘坐地铁相关的采集任务,所需要的采集条件为地理位置、以及地铁出行情况。此时,用户特征配置子模块211d向元数据管理模块203发送元数据查询请求,查询元数据中的各因素是否包括地铁位置、以及地铁出行相关的因素。
S503,选择元数据信息。
在一些实施例中,元数据管理模块203根据接收的元数据查询请求选择配置当前采集任务所需的采集条件的元数据信息。
例如,元数据管理模块203根据接收的查询请求将元数据中与地理位置以及地铁出行相关的具体因素选择出来。例如,将元数据中的地理位置以及是否乘坐过地铁的地铁出行事件因素选择出来,并且反馈给采集任务配置模块211。
S504,完成采集任务配置。
在一些实施例中,采集任务配置模块211,根据从元数据管理模块203中接收到的元数据完成采集任务配置。
在一些实现方式中,用户特征配置子模块211d接收元数据管理模块203中接收的与采集条件相符合的元数据后,根据相符合的元数据完成采集条件配置,得到用户特征配置信息。
例如,用户特征配置子模块211d根据接收的元数据,元数据包括地理位置因素、是否乘坐过地铁的地铁出行的地铁出行事件因素进行具体采集条件的配置,具体配置方式不做具体要求。例如,对于用户乘坐地铁的采集任务,可以将地理位置具体指定为“北京”、将地铁出行事件具体指定为“用户乘坐过地铁”,从而完成采集任务的配置,得到用户特征配置信息。
可以理解的,任务描述配置子模块211a完成配置采集任务所对应的任务描述信息得到任务描述配置信息。设备标识配置子模块211b完成配置采集任务所对应的设备标识得到设备标识配置信息。采集结束配置子模块211c完成配置采集任务所对应的采集结束要求得到采集结束策略配置信息。
可以理解,上述步骤S501至步骤S504的执行顺序只是一种示意,在另一些实施例中,也可以采用其他执行顺序,还可以拆分或合并部分步骤,在此不做限定。通过上述步骤S501至S504,云端设备配置与采集任务相关的终端设备的采集条件的具体过程,与各终端设备的具体使用状态以及具体用户情况无关,使得在下发过程中保证了终端设备用户的隐私。
图6根据本申请的一些实施例,示出了一种终端设备100向云端设备200请求采集任务,并且云端设备200向终端设备100下发采集任务的具体过程,下面结合上述图4所示的终端设备100、以及云端设备200的功能模块进行具体介绍。
S601,终端设备100请求获取采集任务。
在一些实施例中,终端设备100向云端设备200发送采集任务请求。其中,采集任务请求中携带终端设备100自身设备所对应的设备标识。
在一些实现方式中,终端采集任务管理模块101向云端采集任务管理模块210发送采集任务请求,其中,采集任务请求中携带终端设备100自身设备所对应的设备标识。
在一些实现方式中,终端设备100通过根据如表1所示的IF2接口向云端设备200发送采集任务请求,请求体中携带终端设备100自身设备所对应的设备标识。
S602,云端设备200根据请求判断设备标识是否匹配。
在一些实施例中,云端设备200判断接收的采集任务请求中的设备标识与各采集任务所对应的设备标识配置信息中的设备标识是否匹配。若匹配成功,进入S603,云端设备200下发采集任务信息;否则,进入S604,云端设备200不下发采集任务信息。
在一些实现方式中,云端采集任务管理模块210接收终端采集任务管理模块101的采集任务请求,将采集任务请求中的携带的终端设备100自身设备所对应的设备标识与各采集任务所对应的设备标识配置信息中的设备标识相比对,如果相同,则匹配成功,进入S603;否则,进入S604。
S603,云端设备200下发采集任务信息。
在一些实施例中,云端设备200向终端设备100下发采集任务信息。
在一些实现方式中,云端采集任务管理模块210向终端采集任务管理模块101发送采集任务信息。
在一些实现方式中,云端设备200通过如上述表1所示的IF3接口向终端设备100下发采集任务信息。
S604,云端设备200不下发采集任务。
在一些实施例中,云端采集任务管理模块210不向终端采集任务管理模块101发送采集任务信息。
可以理解,上述步骤S601至步骤S604的执行顺序只是一种示意,在另一些实施例中,也可以采用其他执行顺序,还可以拆分或合并部分步骤,在此不做限定。
图7根据本申请的一些实施例,示出了一种终端设备100接收到采集任务后,对采集任务进行解析,然后进行采集条件匹配后进行数据采集,并上传给云端设备200的具体过程。可以理解的,在对采集任务解析后,可以定期进行采集条件匹配,然后进行数据采集。下面介绍的具体过程,是以进行一次采集条件匹配为例,进行介绍。可以理解的,下述图7结合上述图4所示的终端设备100、以及云端设备200的功能模块示出的过程是上述图3中的部分情况。下面进行具体介绍:
S701,将接收的采集任务进行解析,得到各采集任务配置信息。
在一些实施例中,终端采集任务管理模块101将接收的采集任务进行解析,得到各采集任务配置信息。
在一些实现方式中,采集任务配置解析子模块101a将接收的采集任务进行解析,例如,将接收到的.xml格式的采集任务信息进行解析,得到各采集任务配置信息。例如,各采集任务配置信息包括任务描述配置信息、设备标识配置信息、用户特征配置信息、以及采集结束策略配置信息等。
S702,根据采集结束策略配置信息判断是否结束采集。
在一些实施例中,终端采集任务管理模块101根据采集结束策略配置信息判断是否结束采集。如果满足,进入S709,结束采集任务。否则,进入S703。
在一些实现方式中,采集任务启停子模块101b根据当前时间判断是否符合采集结束策略配置信息中的采集结束期限。如果满足,进入S709,结束采集任务。否则,进入S703。
在另一些实现方式中,采集任务启停子模块101b根据当前采集的样本总数量判断是否符合采集结束策略配置信息中的采集结束的样本总数量。如果满足,进入S709,结束采集任务。否则,进入S703。
在一些实现方式中,采集任务启停子模块101b根据如上表1中的IF7接口,根据采集结束策略配置信息判断出的是否需要结束采集的结果,请求数据采集启动或者数据采集停止。
S703,判断是否需要进行采集条件匹配。
在一些实施例中,终端采集任务管理模块101根据采集任务中是否包括用户特征配置信息判断是否需要采集条件匹配。如果采集任务配置信息中包括用户特征配置信息,则确定需要进行用户特征匹配,进入S704,否则,进入S707,直接进行数据采集。
在一些实现方式中,当确定需要进行采集条件匹配时,终端采集任务管理模块101可以通过如上述表1所示的IF4接口向特征计算管理模块103进行用户特征计算请求,即采集条件匹配请求。
S704,将用户特征配置信息解析得到具体采集条件。
在一些实施例中,特征计算管理模块103中将用户特征配置信息进行解析得到具体采集条件。
在一些实现方式中,用户特征配置解析子模块103a将用户特征配置信息解析,得到具体采集条件。
S705,获取历史数据,将得到的历史数据与具体的采集条件进行匹配,得到匹配结果。
可以理解的,历史数据与采集条件相对应,历史数据可以包括预设历史时间内终端设备的设备使用状态或者用户情况相关的数据。
在一些实施例中,特征计算管理模块103从个人行为数据库104中读取与具体采集条件相对应的历史数据,根据得到的历史数据与具体采集条件进行匹配,得到匹配结果。
在一些实现方式中,用户特征计算子模块103b根据读取的历史数据与具体采集条件进行匹配,比对得到的历史数据与具体采集条件是否符合,得到匹配结果。用户特征计算子模块103b还将得到的匹配结果发送给终端采集任务管理模块101。
在一些实现方式中,特征计算管理模块103可以通过如上述表1中的IF5接口对个人行为数据库104发送读取与采集条件相对应的历史数据请求。
在一些实现方式中,特征计算管理模块103可以通过如上述表1中的IF6接口将匹配结果返回给终端采集任务管理模块101。
例如,特征计算管理模块103从个人行为数据库104中读取用户近3天的所在地的具体地理位置信息,以及是否乘坐过地铁情况。如果读取到的用户3天所在地的位置为“北京”,与用户特征配置信息中的地理位置要求相同,则认为匹配成功。如果读取到的用户3天所在地的地理位置不为“北京”,例如为“西安”,与用户特征配置信息中的地理位置要求不相同,则匹配不成功。
S706,根据匹配结果判断是否需要采集任务数据。
在一些实施例中,终端采集任务管理模块101根据得到的匹配结果为匹配成功,则确认需要数据采集,进入S707;否则,确认不需要数据采集,进入S709,结束数据采集。
在一些实现方式中,在确认需要数据采集时,终端采集任务管理模块101根据如上表1中的IF7接口,发送启动任务数据采集请求。
在另一些实现方式中,在确认结束数据采集时,终端采集任务管理模块101根据如上表1中的IF7接口,发送停止任务数据采集请求。
S707,进行任务数据采集。
在一些实施例中,数据采集模块102按照任务描述配置信息中的任务描述信息进行任务数据采集。
S708,将采集到的数据上传。
在一些实施例方式中,采集任务管理模块102将采集到的任务数据上传给数据湖202。例如,采集任务管理模块102达到上传任务数据量后,将数据传输到数据湖202。
在一些实现方式中,通过如上述表1所示的IF8接口将采集数据上传到云端设备200。
S709,结束数据采集。
在一些实施例中,终端采集任务管理模块101结束数据采集。
可以理解,上述步骤S701至步骤S709的执行顺序只是一种示意,在另一些实施例中,也可以采用其他执行顺序,还可以拆分或合并部分步骤,在此不做限定。通过上述步骤S701至S709,终端设备在接收到云端设备下发的采集任务后,保证终端设备在满足采集所需任务数据的采集条件时,才进行数据采集,进而避免终端设备的资源浪费,例如功耗资源、存储资源、数据连接资源等浪费。
图8根据本申请的实施例,示出了一种终端设备100的硬件结构示意图。
终端设备100能够与云端200配合执行本申请实施例提供的数据采集方法。在图8中,相似的部件具有同样的附图标记。如图8所示,终端设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(Universal Serial Bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(SubscriberIdentification Module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对终端设备100的具体限定。在本申请另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如,可以包括中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)、数字信号处理器(Digital Signal Processor,DSP)、微处理器(Micro-programmed Control Unit,MCU)、人工智能(ArtificialIntelligence,AI)处理器或可编程逻辑器件(Field ProgrammableGate Array,FPGA)等的处理模块或处理电路。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
存储器可用于存储数据、软件程序以及模块,可以是易失性存储器(VolatileMemory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(Non-Volatile Memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(FlashMemory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,或者也可以是可移动存储介质,例如安全数字(SecureDigital,SD)存储卡。
充电管理模块140可以包括电源、电源管理部件等。电源可以为电池。电源管理部件用于管理电源的充电和电源向其他模块的供电。充电管理模块用于从充电器接收充电输入;电源管理模块用于连接电源,充电管理模块与处理器110。
移动通信模块150可以包括但不限于天线、功率放大器、滤波器、低噪声放大器(Low Noise Amplify,LNA)等。移动通信模块150可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以由天线接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
无线通信模块160可以包括天线,并经由天线实现对电磁波的收发。无线通信模块160可以提供应用在终端设备100上的包括无线局域网(Wireless Local Area Networks,WLAN)(如无线保真(WirelessFidelity,Wi-Fi)网络),蓝牙(Bluetooth,BT),全球导航卫星系统(Global Navigation Satellite System,GNSS),调频(Frequency Modulation,FM),近距离无线通信技术(NearField Communication,NFC),红外技术(Infrared,IR)等无线通信的解决方案。终端设备100可以通过无线通信技术与网络以及其他设备进行通信。
在一些实施例中,终端设备100的移动通信模块150和无线通信模块160也可以位于同一模块中。
摄像头193用于捕获静态图像或视频。景物通过镜头生成的光学图像投射到感光元件。感光元件把光信号转换成电信号,之后将电信号传递给图像信号处理器(ImageSignal Processor,ISP)转换成数字图像信号。终端设备100可以通过ISP,摄像头193,视频编解码器,图形处理器(GraphicProcessing Unit,GPU),显示屏以及应用处理器等实现拍摄功能。
显示屏包括显示面板。显示面板可以采用液晶显示屏 (Liquid CrystalDisplay,LCD),有机发光二极管(Organic Light-emitting Diode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(Active-matrix Organic Light-emittingDiode,AMOLED),柔性发光二极管(Flex Light-emitting Diode,FLED),Mini LED,Micro LED,Micro OLED,量子点发光二极管(QuantumDot Light-emitting Diodes,QLED)等。
音频模块170可以将数字音频信息转换成模拟音频信号输出,或者将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
接口模块包括外部存储器接口、通用串行总线(Universal Serial Bus,USB)接口及用户标识模块(Subscriber Identification Module,SIM)卡接口等。其中外部存储器接口可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口与处理器110通信,实现数据存储功能。通用串行总线接口用于终端设备100和其他手机进行通信。用户标识模块卡接口用于与安装至终端设备100的SIM卡进行通信,例如读取SIM卡中存储的电话号码,或将电话号码写入SIM卡中。
在一些实施例中,终端设备100还包括按键、马达以及指示器等。其中,按键可以包括音量键、开/关机键等。马达用于使终端设备100产生振动效果,例如在用户的终端设备100收到新的IM APP消息时产生振动,以提示用户查看消息。指示器可以包括激光指示器、射频指示器、LED指示器等。
可以理解的是,本发明实施例示意的结构并不构成对终端设备100的具体限定。
本申请公开的机制的各实施例可以被实现在硬件、软件、固件或这些实现方法的组合中。本申请的实施例可实现为在可编程系统上执行的计算机程序或程序代码,该可编程系统包括至少一个处理器、存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备以及至少一个输出设备。
可将程序代码应用于输入指令,以执行本申请描述的各功能并生成输出信息。可以按已知方式将输出信息应用于一个或多个输出设备。为了本申请的目的,处理系统包括具有诸如例如数字信号处理器(DSP)、微控制器、专用集成电路(ASIC)或微处理器之类的处理器的任何系统。
程序代码可以用高级程序化语言或面向对象的编程语言来实现,以便与处理系统通信。在需要时,也可用汇编语言或机器语言来实现程序代码。事实上,本申请中描述的机制不限于任何特定编程语言的范围。在任一情形下,该语言可以是编译语言或解释语言。
在一些情况下,所公开的实施例可以以硬件、固件、软件或其任何组合来实现。所公开的实施例还可以被实现为由一个或多个暂时或非暂时性机器可读(例如,计算机可读)存储介质承载或存储在其上的指令,其可以由一个或多个处理器读取和执行。例如,指令可以通过网络或通过其他计算机可读介质分发。因此,机器可读介质可以包括用于以机器(例如,计算机)可读的形式存储或传输信息的任何机制,包括但不限于,软盘、光盘、光碟、只读存储器(CD-ROMs)、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、磁卡或光卡、闪存、或用于利用因特网以电、光、声或其他形式的传播信号来传输信息(例如,载波、红外信号数字信号等)的有形的机器可读存储器。因此,机器可读介质包括适合于以机器(例如,计算机)可读的形式存储或传输电子指令或信息的任何类型的机器可读介质。
在附图中,可以以特定布置和/或顺序示出一些结构或方法特征。然而,应该理解,可能不需要这样的特定布置和/或排序。而是,在一些实施例中,这些特征可以以不同于说明性附图中所示的方式和/或顺序来布置。另外,在特定图中包括结构或方法特征并不意味着暗示在所有实施例中都需要这样的特征,并且在一些实施例中,可以不包括这些特征或者可以与其他特征组合。
需要说明的是,本申请各设备实施例中提到的各单元/模块都是逻辑单元/模块,在物理上,一个逻辑单元/模块可以是一个物理单元/模块,也可以是一个物理单元/模块的一部分,还可以以多个物理单元/模块的组合实现,这些逻辑单元/模块本身的物理实现方式并不是最重要的,这些逻辑单元/模块所实现的功能的组合才是解决本申请所提出的技术问题的关键。此外,为了突出本申请的创新部分,本申请上述各设备实施例并没有将与解决本申请所提出的技术问题关系不太密切的单元/模块引入,这并不表明上述设备实施例并不存在其它的单元/模块。
需要说明的是,在本专利的示例和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然通过参照本申请的某些优选实施例,已经对本申请进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。
Claims (22)
1.一种数据采集方法,其特征在于,所述方法包括:
第一电子设备向第二电子设备发送第一采集任务,其中,所述第一采集任务与所述第二电子设备的第一设备标识对应,并且所述第一采集任务包括采集条件,所述采集条件包括针对所述第二电子设备的第一使用条件和针对所述第二电子设备的用户的第一用户条件中的至少一种,所述第一使用条件以及所述第一用户条件是与所述第一采集任务的应用场景相关的条件;
所述第二电子设备接收到所述第一采集任务后,采集与所述第一采集任务对应的任务数据,其中,所述第二电子设备的历史使用数据和历史用户数据满足所述采集条件;
所述第二电子设备向所述第一电子设备发送所述任务数据。
2.一种数据采集方法,其特征在于,所述方法包括:
第一电子设备生成第一采集任务,其中,所述第一采集任务与第二电子设备的第一设备标识对应,并且所述第一采集任务包括采集条件,所述采集条件包括针对所述第二电子设备的第一使用条件和针对所述第二电子设备的用户的第一用户条件中的至少一种,所述第一使用条件以及所述第一用户条件是与所述第一采集任务的应用场景相关的条件,
并且,所述采集条件能够被所述第二电子设备用于判断所述第二电子设备是否采集与所述第一采集任务对应的任务数据;所述判断所述第二电子设备是否采集与所述第一采集任务对应的任务数据包括:判断所述第二电子设备的历史使用数据和历史用户数据是否满足所述采集条件;
所述第一电子设备向所述第二电子设备发送所述第一采集任务。
3.根据权利要求2所述的方法,其特征在于,还包括:
所述第一电子设备基于所述任务数据,对用户行为预测模型进行训练。
4.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括设备状态子条件,并且所述设备状态子条件包括以下至少一种:
电池无缺损、电池电量大于电量阈值、内存可用容量大于内存可用容量阈值、麦克风被打开。
5.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括系统事件子条件,并且所述系统事件子条件包括以下至少一种:
系统设置中的第一设置功能被选用、系统通知中的第一通知功能被选用、连接事件中的第一连接功能被选用。
6.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括传感器事件子条件,并且所述传感器事件子条件包括以下至少一种:
所述第二电子设备的温度计的测量设备温度功能被选用、所述第二电子设备的温度测量值大于第一设备温度、所述第二电子设备中的计步器功能被启用、所述计步器检测到的步数值大于第一步数阈值。
7.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括业务事件子条件,并且所述业务事件子条件包括以下至少一种:
用户乘坐过交通工具,所述交通工具包括航班、公交车、火车、地铁、出租车中的至少一种;
用户乘坐过的交通工具包括具有第一标识信息的交通工具,所述第一标识包括第一航班号、第一公交车号、第一火车车次、第一地铁车次中的至少一种;
用户乘坐的交通工具的出发地包括第一出发地;
用户乘坐的交通工具的抵达地包括第一抵达地;
用户乘坐的交通工具的途径站点包括第一站点。
8.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括位置状态子条件,并且所述位置状态子条件包括以下至少一种:
用户位于第一地理位置、所述第二电子设备的网络位置为第一网络位置、所述第二电子设备的通信小区为第一通信小区。
9.根据权利要求2所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括天气状态子条件,并且所述天气状态子条件包括以下至少一种:
用户所在地的环境温度大于第一环境温度阈值;
用户所在地的湿度大于第一湿度阈值;
用户所在地的空气指数大于第一空气指数阈值;
用户所在地的天气为第一天气状态,所述第一天气状态包括晴、雨、雪、冰雹、大风、沙尘暴、霾中的至少一种。
10.根据权利要求2至9中任一项所述的方法,其特征在于,所述任务数据包括以下至少一种:用户的乘车记录、用户打卡记录、用户运动记录、用户购物记录、用户使用软件记录。
11.一种数据采集方法,其特征在于,所述方法包括:
第二电子设备从第一电子设备接收第一采集任务,其中,所述第一采集任务与所述第二电子设备的第一设备标识对应,并且所述第一采集任务包括采集条件,所述采集条件包括针对所述第二电子设备的第一使用条件和针对所述第二电子设备的用户的第一用户条件中的至少一种,所述第一使用条件以及所述第一用户条件是与所述第一采集任务的应用场景相关的条件;
所述第二电子设备采集与所述第一采集任务对应的任务数据,其中,所述第二电子设备的历史使用数据和历史用户数据满足所述采集条件;
所述第二电子设备向所述第一电子设备发送所述任务数据。
12.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括设备状态子条件,并且所述设备状态子条件包括以下至少一种:
电池无缺损、电池电量大于电量阈值、内存可用容量大于内存可用容量阈值、麦克风被打开。
13.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括系统事件子条件,并且所述系统事件子条件包括以下至少一种:
系统设置中的第一设置功能被选用、系统通知中的第一通知功能被选用、连接事件中的第一连接功能被选用。
14.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的第一使用条件包括传感器事件子条件,并且所述传感器事件子条件包括以下至少一种:
所述第二电子设备的温度计的测量设备温度功能被选用、所述第二电子设备的温度测量值大于第一设备温度、所述第二电子设备中的计步器功能被启用、所述计步器检测到的步数值大于第一步数阈值。
15.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括业务事件子条件,并且所述业务事件子条件包括以下至少一种:
用户乘坐过交通工具,所述交通工具包括航班、公交车、火车、地铁、出租车中的至少一种;
用户乘坐过的交通工具包括具有第一标识信息的交通工具,所述第一标识包括第一航班号、第一公交车号、第一火车车次、第一地铁车次中的至少一种;
用户乘坐的交通工具的出发地包括第一出发地;
用户乘坐的交通工具的抵达地包括第一抵达地;
用户乘坐的交通工具的途径站点包括第一站点。
16.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括位置状态子条件,并且所述位置状态子条件包括以下至少一种:
用户位于第一地理位置、所述第二电子设备的网络位置为第一网络位置、所述第二电子设备的通信小区为第一通信小区。
17.根据权利要求11所述的方法,其特征在于,所述针对所述第二电子设备的用户的第一用户条件包括天气状态子条件,并且,所述天气状态子条件包括以下至少一种:
用户所在地的环境温度大于第一环境温度阈值;
用户所在地的湿度大于第一湿度阈值;
用户所在地的空气指数大于第一空气指数阈值;
用户所在地的天气为第一天气状态,所述第一天气状态包括晴、雨、雪、冰雹、大风、沙尘暴、霾中的至少一种。
18.根据权利要求11所述的方法,其特征在于,所述第二电子设备通过以下方式确认所述第二电子设备的使用状态是否满足所述第一使用条件:
所述第二电子设备获取所述第二电子设备在第一历史时间段内的第一历史使用数据,其中所述第一历史使用数据包括对应所述第一使用条件的设备使用数据;
基于所述第一历史使用数据确认所述第二电子设备的使用状态是否满足所述第一使用条件。
19.根据权利要求11所述的方法,其特征在于,所述第二电子设备通过以下方式确认所述第二电子设备的用户是否满足所述第一用户条件:
所述第二电子设备获取所述第二电子设备在第二历史时间段内的第一历史用户数据,其中所述第一历史用户数据包括对应所述第一用户条件的用户情况数据;
基于所述第一历史用户数据确认所述第二电子设备的用户是否满足所述第一用户条件。
20.根据权利要求11至19中任一项所述的方法,其特征在于,所述任务数据包括以下至少一种:用户的乘车记录、用户打卡记录、用户运动记录、用户购物记录、用户使用软件记录。
21.一种电子设备,其特征在于,包括:一个或多个处理器;一个或多个存储器;所述一个或多个存储器存储有一个或多个程序,当所述一个或者多个程序被所述一个或多个处理器执行时,使得所述电子设备执行权利要求1至20中任一项所述的数据采集方法。
22.一种计算机可读存储介质,其特征在于,所述存储介质上存储有指令,所述指令在计算机上执行时使所述计算机执行权利要求1至20中任一项所述的数据采集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310549135.2A CN116320019B (zh) | 2023-05-16 | 2023-05-16 | 数据采集方法、介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310549135.2A CN116320019B (zh) | 2023-05-16 | 2023-05-16 | 数据采集方法、介质以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116320019A CN116320019A (zh) | 2023-06-23 |
CN116320019B true CN116320019B (zh) | 2023-10-27 |
Family
ID=86799917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310549135.2A Active CN116320019B (zh) | 2023-05-16 | 2023-05-16 | 数据采集方法、介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116320019B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593376A (zh) * | 2012-08-17 | 2014-02-19 | 阿里巴巴集团控股有限公司 | 一种采集用户行为数据的方法及装置 |
CN104461268A (zh) * | 2013-09-16 | 2015-03-25 | 联想(北京)有限公司 | 一种切换方法和装置 |
CN105828430A (zh) * | 2015-01-08 | 2016-08-03 | 阿里巴巴集团控股有限公司 | 一种信息采集和处理方法、客户端及服务器 |
CN107800651A (zh) * | 2017-10-31 | 2018-03-13 | 广东欧珀移动通信有限公司 | 应用程序关闭方法、装置、存储介质和电子设备 |
CN108710516A (zh) * | 2018-05-29 | 2018-10-26 | Oppo广东移动通信有限公司 | 预测样本的采集方法、装置、存储介质及智能终端 |
CN109345081A (zh) * | 2018-09-07 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 一种数据采集方法、装置及电子设备 |
CN110647231A (zh) * | 2018-06-07 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置和机器可读介质 |
CN110827108A (zh) * | 2018-08-13 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 信息搜索方法、搜索请求控制方法及系统 |
CN111796979A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 数据采集策略的确定方法、装置、存储介质及电子设备 |
CN112562114A (zh) * | 2020-12-18 | 2021-03-26 | 北京百度网讯科技有限公司 | 数据采集的方法及装置 |
CN113947418A (zh) * | 2020-07-16 | 2022-01-18 | 北京达佳互联信息技术有限公司 | 反馈信息的获取方法、装置、电子设备及存储介质 |
CN114282940A (zh) * | 2021-12-17 | 2022-04-05 | 中国电信股份有限公司 | 用于意图识别的方法及装置、存储介质及电子设备 |
CN114385463A (zh) * | 2021-12-09 | 2022-04-22 | 深信服科技股份有限公司 | 数据采集方法、装置以及电子设备 |
CN115145806A (zh) * | 2021-03-31 | 2022-10-04 | 腾讯云计算(北京)有限责任公司 | 一种数据采集方法、装置、以及计算机可读存储介质 |
CN115220597A (zh) * | 2022-06-10 | 2022-10-21 | Oppo广东移动通信有限公司 | 数据采集方法、装置、终端、服务器及可读存储介质 |
CN116048648A (zh) * | 2022-07-28 | 2023-05-02 | 荣耀终端有限公司 | 应用预加载方法、应用的启动方法及电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10129211B2 (en) * | 2011-09-15 | 2018-11-13 | Stephan HEATH | Methods and/or systems for an online and/or mobile privacy and/or security encryption technologies used in cloud computing with the combination of data mining and/or encryption of user's personal data and/or location data for marketing of internet posted promotions, social messaging or offers using multiple devices, browsers, operating systems, networks, fiber optic communications, multichannel platforms |
US11442136B2 (en) * | 2018-05-30 | 2022-09-13 | Here Global B.V. | Collecting or triggering collecting positioning data for updating and/or generating a positioning map |
-
2023
- 2023-05-16 CN CN202310549135.2A patent/CN116320019B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593376A (zh) * | 2012-08-17 | 2014-02-19 | 阿里巴巴集团控股有限公司 | 一种采集用户行为数据的方法及装置 |
CN104461268A (zh) * | 2013-09-16 | 2015-03-25 | 联想(北京)有限公司 | 一种切换方法和装置 |
CN105828430A (zh) * | 2015-01-08 | 2016-08-03 | 阿里巴巴集团控股有限公司 | 一种信息采集和处理方法、客户端及服务器 |
CN107800651A (zh) * | 2017-10-31 | 2018-03-13 | 广东欧珀移动通信有限公司 | 应用程序关闭方法、装置、存储介质和电子设备 |
CN108710516A (zh) * | 2018-05-29 | 2018-10-26 | Oppo广东移动通信有限公司 | 预测样本的采集方法、装置、存储介质及智能终端 |
CN110647231A (zh) * | 2018-06-07 | 2020-01-03 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置和机器可读介质 |
CN110827108A (zh) * | 2018-08-13 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 信息搜索方法、搜索请求控制方法及系统 |
CN109345081A (zh) * | 2018-09-07 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 一种数据采集方法、装置及电子设备 |
CN111796979A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 数据采集策略的确定方法、装置、存储介质及电子设备 |
CN113947418A (zh) * | 2020-07-16 | 2022-01-18 | 北京达佳互联信息技术有限公司 | 反馈信息的获取方法、装置、电子设备及存储介质 |
CN112562114A (zh) * | 2020-12-18 | 2021-03-26 | 北京百度网讯科技有限公司 | 数据采集的方法及装置 |
CN115145806A (zh) * | 2021-03-31 | 2022-10-04 | 腾讯云计算(北京)有限责任公司 | 一种数据采集方法、装置、以及计算机可读存储介质 |
CN114385463A (zh) * | 2021-12-09 | 2022-04-22 | 深信服科技股份有限公司 | 数据采集方法、装置以及电子设备 |
CN114282940A (zh) * | 2021-12-17 | 2022-04-05 | 中国电信股份有限公司 | 用于意图识别的方法及装置、存储介质及电子设备 |
CN115220597A (zh) * | 2022-06-10 | 2022-10-21 | Oppo广东移动通信有限公司 | 数据采集方法、装置、终端、服务器及可读存储介质 |
CN116048648A (zh) * | 2022-07-28 | 2023-05-02 | 荣耀终端有限公司 | 应用预加载方法、应用的启动方法及电子设备 |
Non-Patent Citations (2)
Title |
---|
"Research on Big Data Analysis Data Acquisition and Data Analysis";Hong Li;《 2021 International Conference on Artificial Intelligence, Big Data and Algorithms (CAIBDA)》;全文 * |
网格资源发现模型的研究;周洋;蒋昌俊;张亚英;;小型微型计算机系统(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116320019A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190205115A1 (en) | Systems and methods for secure and safety software updates in the context of moving things, in particular a network of autonomous vehicles | |
US10269246B2 (en) | Vehicle locator and guide | |
CN101739835B (zh) | 用于在驾驶员与至少一个要被运送的人之间自动且直接建立联系的方法和系统 | |
US11481697B2 (en) | Vehicle dispatch system, server, and information processing method | |
US20210004731A1 (en) | Ticketing method and system | |
CN109357681B (zh) | 与手持无线装置协调的车辆导航服务 | |
CN104786860A (zh) | 用于电动汽车旅程和充电计划的方法和设备 | |
CN105431882A (zh) | 环境感知的分布式出租车汽车调度 | |
CN105489051A (zh) | 公交到站提示方法和移动终端及云端服务器 | |
CN102739763A (zh) | 追踪方法 | |
CN110910190A (zh) | 汽车共享和出租车服务的综合识别和认证 | |
KR101265158B1 (ko) | 버스 정보 시스템 및 그의 정보 처리 방법 | |
CN105205873A (zh) | 停车场管理装置、系统及方法 | |
CN107705576A (zh) | 车辆套牌检测方法、服务器及存储介质 | |
JP2019182096A (ja) | 車内環境設定システム、車内環境設定方法、及び車内環境設定プログラム | |
US20220051029A1 (en) | Message-based image processing method and electronic device implementing same | |
CN113888857A (zh) | 基于车联网的公共交通管理系统、装置及方法 | |
CN106878421B (zh) | 预约共享车辆的方法、订车终端及系统 | |
CN116320019B (zh) | 数据采集方法、介质以及电子设备 | |
KR20180022585A (ko) | 이동체의 위치 정보 공통 관리 시스템 | |
CN112822642B (zh) | 一种基于v2x的车辆派发方法、装置及系统 | |
CN112731495B (zh) | 一种基于北斗或gps导航的三证合一数字智能交通车载终端 | |
CN115601957A (zh) | 运行管理方法、运行管理装置及运行管理系统 | |
JP4784554B2 (ja) | プローブデータ収集システム | |
CN106612498B (zh) | 一种到站信息推送方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |