CN111291013A - 行为数据处理方法及装置、电子设备和存储介质 - Google Patents
行为数据处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111291013A CN111291013A CN202010053651.2A CN202010053651A CN111291013A CN 111291013 A CN111291013 A CN 111291013A CN 202010053651 A CN202010053651 A CN 202010053651A CN 111291013 A CN111291013 A CN 111291013A
- Authority
- CN
- China
- Prior art keywords
- behavior
- user
- time period
- labeling
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开涉及一种行为数据处理方法及装置、电子设备和存储介质,所述方法包括:获取行为数据,所述行为数据包括用户进行标注产生的数据;根据所述行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;在所述用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种行为数据处理方法及装置、电子设备和存储介质。
背景技术
随着人工智能的发展,数据标注变得越来越重要。高质量的标注数据可以提高训练模型的精准度,有助于改进和优化人工智能技术。然而,标注员在长时间工作的情况下难免会产生疲劳,从而导致标注出来的结果质量较差,标注效率较低。
发明内容
本公开提出了一种行为数据处理方法及装置、电子设备和存储介质。
根据本公开的第一方面,提供了一种行为数据处理方法,包括:获取行为数据,所述行为数据包括用户进行标注产生的数据;根据所述行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;在所述用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
在一种可能的实现方式中,所述行为数据包括行为日志;所述根据所述行为数据,确定行为参数,包括:从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;根据所述第一目标行为日志,确定所述行为参数。
这样,通过行为日志记录行为数据,可以提升开发效率,加快出现问题时的解决速度。
在一种可能的实现方式中,所述行为参数包括标注效率和/或标注准确率,所述目标时间段包括第一时间段和第二时间段,所述第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻;
所述用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
这样,通过对标注效率和/或标注准确率,可以确定用户的标注状态是否需要改变以及是否适合继续工作,从而有利于提高标注效率和/或标注准确率。
在一种可能的实现方式中,在所述行为参数包括标注效率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:根据所述第一目标行为日志的数量和所述目标时间段的时长,确定所述用户在所述目标时间段内进行标注的标注效率;
和/或,
根据所述第一目标行为日志中所述第一时间段内产生的日志数量和所述第一时间段的时长,确定所述第一标注效率,并根据所述第一目标行为日志中所述第二时间段内产生的日志数量和所述第二时间段的时长,确定所述第二标注效率。
这样,可以根据目标时间段内用户标注速度的快慢或者用户在第一时间段内和第二时间段内标注速度的变化,对用户进行提醒。
在一种可能的实现方式中,在所述行为参数包括标注准确率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:获取所述第一目标行为日志中每条行为日志指示标注过程的标注数据,所述标注数据包括对待标注数据进行标注后得到的数据;根据所述标注数据与参考标注数据之间的差异参数,确定所述每条行为日志对应的标注准确率;根据所述每条行为日志对应的标注准确率,确定所述用户在所述目标时间段内进行标注的标注准确率;
和/或,
确定所述用户在所述第一时间段内进行标注的所述第一标注准确率以及所述用户在所述第二时间段内进行标注的所述第二标注准确率。
这样,可以根据目标时间段内用户标注是否正确或者用户在第一时间段内和第二时间段内标注正确率的变化,对用户进行提醒。
在一种可能的实现方式中,所述生成介入信息,以提示所述用户,包括:根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;以所确定的方式向所述用户展示所述介入信息的内容。
这样,根据行为参数和参数阈值,可以反映用户的标注状态,从而确定对用户提示的内容和提示的方式,实现有针对性的提醒。
在一种可能的实现方式中,所述参数阈值包括多个阈值区间;所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式,包括:根据所述行为参数与所述多个阈值区间中至少一个阈值区间的归属关系,确定所述用户的标注状态的等级;将与所述标注状态的等级对应的提示内容,确定为所述介入信息的内容,并将与所述标注状态的等级对应的提示方式,确定为提示所述用户的方式。
这样,通过对标注状态划分等级,可以提升提示方式的准确性。
在一种可能的实现方式中,所述行为数据包括行为日志,所述介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;所述方法还包括:从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
这样,在用户出现重复操的情况下,可以提醒目标用户暂停标注工作,有利于提升标注准确率和/或标注效率。
在一种可能的实现方式中,所述行为日志至少包括用户标识、时间戳、操作类型和标注结果;所述操作类型至少包括删除、添加、撤销、翻页和调整中的一项。
在一种可能的实现方式中,所述行为日志还包括操作内容和/或待标注物体,所述操作内容至少包括框、点、属性、字符、字符串中的一项;在所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式之前,所述方法还包括:根据所述行为日志的操作内容和/或待标注物体,确定所述参数阈值。
这样,通过按照难易程度确定参数阈值,可以平衡不同的标注工作,使得行为参数更加准确的反映用户的标注状态。
在一种可能的实现方式中,所述方法还包括:在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;
或者,
在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
这样,通过调整参数阈值,可以提升参数阈值的合理程度,从而提高提醒用户的合理性,通过调整个别用户的工作量和/或工作内容,可以提高用户的标注效率。
在一种可能的实现方式中,所述行为数据包括所述用户进行图像标注产生的数据。
这样,可以提升行为数据种类的丰富程度。
根据本公开的第二方面,提供了一种行为数据处理装置,包括:第一获取模块,用于获取行为数据,所述行为数据包括用户进行标注产生的数据;第一确定模块,用于根据所述第一获取模块获取的行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;生成模块,用于在所述第一确定模块确定的行为参数反映的用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
在一种可能的实现方式中,所述行为数据包括行为日志;所述第一确定模块还用于:从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;根据所述第一目标行为日志,确定所述行为参数。
在一种可能的实现方式中,所述行为参数包括标注效率和/或标注准确率,所述目标时间段包括第一时间段和第二时间段,所述第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻;
所述用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
在一种可能的实现方式中,在所述行为参数包括标注效率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:根据所述第一目标行为日志的数量和所述目标时间段的时长,确定所述用户在所述目标时间段内进行标注的标注效率;
和/或,
根据所述第一目标行为日志中所述第一时间段内产生的日志数量和所述第一时间段的时长,确定所述第一标注效率,并根据所述第一目标行为日志中所述第二时间段内产生的日志数量和所述第二时间段的时长,确定所述第二标注效率。
在一种可能的实现方式中,在所述行为参数包括标注准确率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:获取所述第一目标行为日志中每条行为日志指示标注过程的标注数据,所述标注数据包括对待标注数据进行标注后得到的数据;根据所述标注数据与参考标注数据之间的差异参数,确定所述每条行为日志对应的标注准确率;根据所述每条行为日志对应的标注准确率,确定所述用户在所述目标时间段内进行标注的标注准确率;
和/或,
确定所述用户在所述第一时间段内进行标注的所述第一标注准确率以及所述用户在所述第二时间段内进行标注的所述第二标注准确率。
在一种可能的实现方式中,所述生成模块还用于:
根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;以所确定的方式向所述用户展示所述介入信息的内容。
在一种可能的实现方式中,所述参数阈值包括多个阈值区间;
所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式,包括:根据所述行为参数与所述多个阈值区间中至少一个阈值区间的归属关系,确定所述用户的标注状态的等级;将与所述标注状态的等级对应的提示内容,确定为所述介入信息的内容,并将与所述标注状态的等级对应的提示方式,确定为提示所述用户的方式。
在一种可能的实现方式中,所述行为数据包括行为日志,所述介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;
所述装置还包括:第二获取模块,用于从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;第二确定模块,用于根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
在一种可能的实现方式中,所述行为日志至少包括用户标识、时间戳、操作类型和标注结果;所述操作类型至少包括删除、添加、撤销、翻页和调整中的一项。
在一种可能的实现方式中,所述行为日志还包括操作内容和/或待标注物体,所述操作内容至少包括框、点、属性、字符、字符串中的一项;
所述装置还包括:第三确定模块,用于根据所述行为日志的操作内容和/或待标注物体,确定所述参数阈值。
在一种可能的实现方式中,所述装置还包括:第一调整模块,用于在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;
或者,
第二调整模块,用于在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
在一种可能的实现方式中,所述行为数据包括所述用户进行图像标注产生的数据。
根据本公开的第三方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
在本公开实施例中,可以根据用户进行标注时产生的行为数据,确定反映用户标注状态的行为参数,从而在用户的标注状态满足介入条件的情况下,生成介入信息,以对用户进行提示,从而实现对用户的标注操作的监控,提高标注效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开实施例的行为数据处理方法的流程图;
图2示出根据本公开实施例的监控系统的一个示例性示意图;
图3示出根据本公开实施例的行为数据处理装置的框图;
图4示出根据本公开实施例的一种电子设备800的框图;
图5示出根据本公开实施例的一种电子设备1900的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开实施例的行为数据处理方法的流程图。如图1所示,所述方法包括:
步骤S11,获取行为数据。
其中,所述行为数据包括用户进行标注产生的数据。
步骤S12,根据所述行为数据,确定行为参数。
其中,所述行为参数用于反映所述用户的标注状态。
步骤S13,在所述用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
在一种可能的实现方式中,可通过服务器等具备数据处理能力的设备,执行所述方法。或者,所述方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
在本公开实施例中,可以根据用户进行标注时产生的行为数据,确定反映用户标注状态的行为参数,从而在用户的标注状态满足介入条件的情况下,生成介入信息,以对用户进行提示,从而实现对用户的标注操作的监控,提高标注效率。
在步骤S11中,在标注过程中,标注系统响应于用户的标注操作可以产生相应的数据,这些用户进行标注产生的数据可以作为用户的行为数据。标注系统可以将用户的行为数据记录下来,并上报至服务器,以便于服务器通过凋S12和步骤S13对用户的行为数据进行后续处理。在一个示例中,行为数据可以反映用户在标注过程中产生的行为,包括用户进行图像标注产生的数据,即标注系统响应于用户针对待标注内容的标注操作而产生的数据。在本公开实施例中,以图像标注为例进行说明。
其中,待标注内容指的是待标注图像,标注操作可以包括拉框操作、标点操作、添加属性操作、添加文字内容操作、删除框操作、删除点操作,撤销拉框操作等标注过程中涉及到的操作。本公开实施例对标注操作不做限制。
行为数据的表现形式多种多样,可以采用图表、日志等多种形式中的至少一项进行存储、展示等。在一种可能的实现方式中,行为数据包括行为日志。行为日志可以通过日志系统进行存储、展示等。日志系统是一种比较成熟的系统,日志系统可以帮助开发和运维工程师监控业务系统(例如本公开实施例中的标注系统)的运行情况和分析问题出现时的异常日志,部署日志系统有利于提升开发效率和加快出现问题时的解决速度。
图2示出根据本公开实施例的监控系统的一个示例性示意图。如图2所示,该监控系统可以包括业务终端和日志服务器。当然,监控系统还可以包括同时具备业务终端及日志服务器功能的设备,以由该设备执行本申请提供的技术方案。参照图2,在本公开实施例中,业务终端中部署有标注系统,日志服务器中部署有日志系统。业务终端可以采用对用户(即标注员)在标注系统中的标注操作进行监控,得到用户的行为日志。业务终端可以将行为日志上报至日志服务器,由日志服务器中的日志系统通过步骤S12和步骤S13对用户的行为数据进行后续处理。
用户可以在业务终端的标注系统中通过标注工具执行标注操作。为了实现对用户在标注系统中的标注操作进行监控,可以在需要监控的业务终端上的标注系统中预设埋点。其中,预设埋点就是在关键点植入统计代码,在检测到用户在对标注系统中进行标注操作的情况下,由统计代码对用户的标注操作进行记录,生成相应的行为日志。在一个示例中,可以在标注系统中的标注工具中植入统计代码,由统计代码对用户采用标注工具而执行的每次标注操作进行记录,生成相应的行为日志。
业务终端可以实时或者间隔一定时间(例如十分钟、半小时或者一小时等,可依据业务终端的资源使用情况、处理能力、业务需求等因素中的一项或是多项进行调整)将生成的行为日志上传至日志服务器中,以便于日志服务器通过日志系统对行为日志进行分析,从而实现对用户的标注操作的监控。在一种可能的实现方式中,业务终端可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。业务终端生成及发送行为日志的过程可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
日志服务器可以每隔一段时间(例如每小时或者每十分钟,可依据日志服务器的资源使用情况、处理能力、业务需求等因素中的一项或是多项进行调整)通过日志系统对行为日志进行分析。之后,日志服务器可以将分析结果反馈至业务终端,以对用户进行提示。需要说明的是,对于业务终端与日志服务器所分别实现的功能集成在同一设备的情况而言,该设备可直接基于分析结果为用户提示。
参考图2,在本公开实施例中,日志服务器可以包括一个或是多个具有行为日志分析能力的服务器等设备。在一种可能的实现方式中,本公开实施例的日志服务器可以为kafka集群。用户的标注操作的速度通常很快,同一时刻或是同一时段内,可能有较多的用户在工作,这样在较短的时间内往往会产生大量的行为日志,这就需要日志服务器具有较强的处理高并发和存储的能力,而kafka集群是一种高吞吐量的分布式发布定于消息系统,引用了消息队列的通信模式,能够较好的处理高并发和存储的问题。
考虑到诸如标注员等用户的工作,在实际执行过程中,往往会有相应的管理员进行监管,那么为了更好的执行监管工作,在一种可能的实现方式中,监控系统还可以包括监控终端。其中,监控终端可以表示监管进行标注的用户的管理员所使用的终端。监控终端可以为用户设备、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理、手持设备、计算设备、车载设备、可穿戴设备等。日志服务器可以将分析结果返回至监控终端,以便于管理员全面了解不同的用户的标注状态,便于对不同的用户进行横向比较。
当然,在实际应用过程中,监控终端、业务终端所实现的功能也可以由同一设备实现,具体可以为管理员与标注员分别分配不同的账户以访问标注系统或是日志系统,这样可以供管理员与标注员分别执行自身试图实现的功能。也就意味着,图2展示的系统架构仅为一种示例性的结构,在实际应用过程中,可以对标注系统、日志系统的部署方式进行调整,比如由同一系统来实现标注系统、日志系统所能实现的功能,或是采用分别部署、集成部署等实现方式,同样的,对于监控终端、业务终端、日志服务器的部署方式,也不限于图2所示内容。
在步骤S12中,可以根据步骤S11获取的行为数据,确定行为参数,其中,行为参数可以用于反映用户的标注状态,例如懈怠、认真或者劳累等。在步骤S13中,可以判断用户的标注状态是否满足介入条件,在用户的标注状态满足介入条件的情况下,生成用于提示用户的介入信息。其中,介入条件可以用于确定是否需要对目标用户的标注操作进行介入。在满足介入条件的情况下,表明目标用户工作上可能存在一些问题,可以对目标用户的标注操作进行介入,比如,可以生成介入信息;在不满足介入条件的情况下,表明目标用户工作状态良好,不需要对目标用户的标注操作进行介入,此时可以不生成介入信息。
可以理解的是,确定出的行为参数不同,行为参数反应的用户的标注状态不同,用户的标注状态满足的介入条件也就不同,相应生成的介入信息也就不同,下面首先对行为参数进行说明,然后基于行为参数,对标注状态、介入条件以及介入信息进行说明。
在一种可能的实现方式中,在行为数据包括行为日志的情况下,步骤S12可以包括:从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;根据所述第一目标行为日志,确定所述行为参数。
其中,目标时间段可以表示待分析用户标注操作的时间段,目标时间段可以为任意一个时间段,目标时间段的时长可以根据需要进行设置。举例来说,目标时间段可以为以当前时刻为截止时刻的一周或者一天等,目标时间段还可以为任意一个自定义时间段。本公开实施例对目标时间段不做限制。第一目标行为日志可以表示目标时间段内第一操作类型的用户的行为日志。
在一种可能的实现方式中,行为日志可以至少包括用户标识、时间戳、操作类型和标注结果。其中,用户标识可以用于区分不同用户,比如,可以用于定位执行标注操作的用户(即确定行为日志是基于哪个用户的标注操作所形成的)。举例来说,用户标识可以为用户名、用户编号、工号、邮箱、姓名或者昵称等能够唯一标识用户的数据。时间戳可以用于表示用户执行标注操作的时间。时间戳可以为标注操作的开始时间,也可以为标注操作的结束时间,还可以是标注操作的开始时间和结束时间,对此本公开不做限制。操作类型可以表示标注操作的功能,举例来说,操作类型可以包括删除、添加、撤销和调整中的一者或多者。标注结果可以用于表示标注操作的结果,举例来说,标注结果可以包括框的顶点位置坐标、点的位置坐标、属性类别和文字内容中的一者或多者。
一条目标行为日志可以记录用户进行的一个标注操作。用户在执行标注任务可以进行多个标注操作,因此在步骤S11中,可以获取到用户的多条目标行为日志。第一目标行为日志即为用户的多条行为日志中,时间戳在目标时间段内、操作类型为第一操作类型的行为日志。
之后,服务器可以根据第一目标行为日志确定行为参数。
在一种可能的实现方式中,行为参数可以包括标注效率和/标注准确率。
由于用户的行为日志中可能包括删除、撤销和调整等类型的行为日志,这些行为日志在确定标注效率以及标注准确率的过程中没有用,因此确定标注效率以及标注准确率时使用的是操作类型为“添加”的行为日志。也就是说,在本公开实施例中,第一操作类型可以为“添加”,第一操作类型的标注操作即为用户图像中添加标注的操作。
在行为参数包括标注效率的情况下,标注效率可以包括两种情况:
情况一:标注效率包括用户在目标时间段内进行标注的标注效率。
情况二:标注效率包括用户在第一时间段内进行标注的第一标注效率和用户在第二时间段内进行标注的第二标注效率。其中,目标时间段包括第一时间段和第二时间段,且第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻。也就意味着,第一时间段与第二时间段,可以为目标时间段中存在部分重叠,或是完全不重叠的两个时间段。第一标注效率可以表示用户在第一时间段内进行标注的标注效率,第二标注效率可以表示用户在第二时间段内进行标注的标注效率。
针对情况一:
在所述行为参数包括标注效率的情况下,根据所述第一目标行为日志,确定所述行为参数可以包括:从所述第一目标行为日志的数量和所述目标时间段的时长,确定所述用户在所述目标时间段内进行标注的标注效率。
标注效率可以用于反映标注速度的快慢。在本公开实施例中,可以根据第一目标行为日志的数量和目标时间段的时长,确定用户在目标时间段内进行标注的标注效率。例如,可以将第一目标行为日志的数量和目标时间段的时长之比,确定为用户在目标时间段内进行标注的标注效率。
在标注操作的操作内容不同的情况下,标注效率的确定方式不同。在一种可能的实现方式中,所述操作内容至少包括框、点、属性、字符、字符串中的一项。在一个示例中,操作内容为“框”的情况下,标注效率可以根据单位时间(例如一分钟、十分钟或者一天等)内拉框的数量确定,操作内容为“点”的情况下,标注效率可以根据单位时间标点的数量确定,操作内容为“属性”的情况下,标注效率可以根据单位时间内确定属性的对象的数量(例如确定属性的图片的数量)确定,操作内容“字符”或者“字符串”的情况下,标注效率可以根据单位时间内完成字符或字符串输入的对象的数量(例如完成字符或字符串输入的图片的数量)确定。其中,目标时间段内拉框的数量、标点的数量、确定属性的对象的数量和完成字符或字符串输入的对象的数量可以根据第一目标行为日志的数量确定。
针对情况二:
在所述行为参数包括标注效率的情况下,根据所述第一目标行为日志,确定所述行为参数可以包括:
根据所述第一目标行为日志中所述第一时间段内产生的日志数量和所述第一时间段的时长,确定所述第一标注效率,并根据所述第一目标行为日志中所述第二时间段内产生的日志数量和所述第二时间段的时长,确定所述第二标注效率。
在行为参数包括标注准确率的情况下,标注准确率可以包括两种情况:
情况一:标注准确率包括用户在目标时间段内进行标注的标注准确率。
情况二:标注准确率包括用户在第一时间段内进行标注的第一标注准确率和用户在第二时间段内进行标注的第二标注准确率。其中,第一标注准确率可以表示用户在第一时间段内进行标注的标注准确率,第二标注准确率可以表示用户在第二时间段内进行标注的标注准确率。
针对情况一:
在所述行为参数包括标注准确率的情况下,根据所述第一目标行为日志,确定行为参数包括:获取所述第一目标行为日志中每条行为日志指示标注过程的标注数据,所述标注数据包括对待标注数据进行标注后得到的数据;根据所述标注数据与参考标注数据之间的差异参数,确定所述每条行为日志对应的标注准确率;根据所述每条行为日志对应的标注准确率,确定所述用户在所述目标时间段内进行标注的标注准确率。
标注准确率可以用于反映标注是否正确。在本公开实施例中,可以首先确定每个第一目标行为日志对应的标注准确度,然后根据各第一目标行为日志的标注准确度确定用户在目标时间段内的标注准确率。例如第一目标行为日志中对应标注准确度大于准确度阈值的第一目标行为日志的数量与第一目标行为日志的总数量的比值,确定为用户在目标时间段内的标注准确率。其中,准确度阈值可以根据需要进行设置,可以理解的是,不同操作内容的目标行为日志的准确度的确定方法可以相同或是不同,对应的准确度阈值也可以相同或是不同。举例来说,在操作内容为“框”的情况下,标注准确度可以根据用户标注的框(即标注数据)与参考框(即参考标注数据)的交并比确定;在操作内容为“点”的情况下,标注准确度可以根据用户标注的点(即标注数据)与参考点(即参考标注数据)之间的距离确定;在操作内容为“属性”的情况下,标注准确度可以根据用户标注的属性(即标注数据)与参考属性(即参考标注数据)是否相同来确定;在操作内容为“字符”或“字符串”的情况下,标注准确度可以根据用户添加的字符或字符串(即标注数据)与参考字符或字符串(即参考标注数据)之间的语义相似度确定。
需要说明的是,参考框、参考点、参考属性和参考字符或字符串等参考标注数据是预先设置的。在一种可能的实现方式中,在确定准确率的过程中,可以先根据参考标注数据对第一目标行为日志进行筛选,然后基于筛选后的第一目标行为日志,确定用户在目标时间段内进行标注的标注准确率。
举例来说,在操作内容为“框”的情况下,可以舍去一些不太好标的框,筛选一些易于标注的框(例如面积较大的框)作为参考标注数据。每个第一目标行为日志中的标注数据都可以采用这个参考标注数据进行匹配,筛选出与参考标注数据相匹配的第一目标行为日志,然后根据每个筛选出的第一目标行为日志中的标注数据与相匹配的参考标注数据的差距,确定各筛选出的第一目标行为日志对应的标注准确度,根据各筛选出的第一目标行为日志对应的标注准确度,确定出用户在目标时间段内进行标注的标注准确率。
针对情况二:
在所述行为参数包括标注准确率的情况下,根据所述第一目标行为日志,确定所述行为参数包括:确定所述用户在所述第一时间段内进行标注的所述第一标注准确率以及所述用户在所述第二时间段内进行标注的所述第二标注准确率。
其中,确定第一标注准确率和第二标注准确率的方法可以参照确定用户在目标时间段内进行标注的标注准确率,这里不再赘述。
在行为参数包括标注效率和/或标注准确率的情况下,步骤S13中,用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
在目标时间段内的标注效率小于第一阈值的情况下,表明用户在目标时间段内的工作效率很低,这可能是用户工作散漫导致的,此时可以确定用户的标注状态满足介入条件。相应的,可以将用于提醒提高工作效率的信息(例如“请加快速度”、“现在速度有点慢哦”等)确定为步骤S13的介入信息的内容,以提醒用户调高工作效率。
其中,第一阈值可以根据需要进行设置。考虑到不同操作内容的标注操作的难易程度不同,在本公开实施例中为不同操作内容的标注操作设置的第一阈值可以不同。例如针对标注人群中的人头的标注任务,第一阈值可以设置为100框/分钟;针对为道路上的车辆分类的标注任务,第一阈值可以设置为150框/分钟。
在目标时间段内的标注准确率小于第二阈值的情况下,表明用户的标注质量较差,这可能是由于用户工作不认真或者是过于疲劳导致的,此时可以确定用户的标注状态满足介入条件。相应的,可以将用于提醒提高准确率的信息(例如“请认真标注”、“错误太多了”等)确定为步骤S13的介入信息的内容,以提醒用户提高标注质量。
其中,第二阈值可以根据需要进行设置,第二阈值的设置方式同样可以参照第一阈值。在一个示例中,第三阈值可以设置为90%、95%等。
在目标时间段内的标注效率大于第三阈值的情况下,表明用户的标注速度很快,这可能是由于用户工作不认真导致,此时可以确定用户的标注状态满足介入条件。相应的,可以将用于提醒减缓操作的信息(例如“请慢慢标注”、“标注速度太快了,请注意准确率”)确定为步骤S13的介入信息的内容,以提醒用户降低标注速度。
其中,第三阈值可以根据需要进行设置,第三阈值的设置方式可以参照第一阈值,且第三阈值大于第一阈值。
在第二标注效率小于第一标注效率,且第一标注效率与第二标注效率的差值大于第四阈值的情况下,表明用户的工作速度变慢了,之后,用户的工作速度可能变的更慢。此时,可以确定用户的标注状态满足介入条件。相应的可以将用于提醒用户及时调整或者休息的信息(例如“标注速度变慢了,请加快”)确定为步骤S13的介入信息的内容,以提醒用户。
其中,第四阈值可以根据需要进行设置,这里不再赘述。
在第二标注准确率小于第一标注准确率,且第一标注准确率与第二标注准确率的差值大于第五阈值的情况下,表明用户的标注质量变差了,之后,用户的标注质量可能会变的更差。此时可确定用户的标注状态满足介入条件。相应的,可以将用于提醒户及时调整或者休息的信息(例如“标注质量变差了,请注意”)确定为步骤S13的介入信息的内容,以提醒用户。
其中,第五阈值可以根据需要进行设置,这里不再赘述。
在一种可能的实现方式中,步骤S13中,生成介入信息,以提示所述用户,包括:根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;以所确定的方式向所述用户展示所述介入信息的内容。
其中,行为参数可以包括标注准确率和/或标注效率。其中,标注准确率可以包括用户在目标时间段内进行标注的标注准确率,和/或,用户在第一时间段内进行标注的标注准确率和用户在第二时间段内进行标注的标注准确率;标注效率可以包括用户在目标时间段内进行标注的标注效率,和/或,用户在第一时间段内进行标注的标注效率和用户在第二时间段内进行标注的标注准确率。参数阈值和介入信息的内容,可以参考上述第一阈值至第五阈值及相应内容,这里不再赘述。提示方式可以为弹窗、弹幕或者消息提醒,对此本公开实施例不做限制。
在一种可能的实现方式中,所述参数阈值包括多个阈值区间;所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式,包括:根据所述行为参数与所述多个阈值区间中至少一个阈值区间的归属关系,确定所述用户的标注状态的等级;将与所述标注状态的等级对应的提示内容,确定为所述介入信息的内容,并将与所述标注状态的等级对应的提示方式,确定为提示所述用户的方式。
以第一阈值为例,第一阈值可以包括多个阈值区间,例如,第一阈值可以包括第一子阈值、第二子阈值和第三子阈值,其中,第一子阈值小于第二子阈值,且第二子阈值小于第三子阈值。在目标时间段内的标注效率小于第一子阈值的情况下,表明标注效率极低,可以确定用户的标注状态的等级为一级,此时可以对用户进行强提醒,例如直接禁止用户使用标注工具;在目标时间段内的标注效率小于第二子阈值且大于或等于第一子阈值的情况下,表明标注效率低,可以确定用户的标注状态的等级为二级,此时可以对用户进行普通提醒,例如以弹窗的形式展示介入信息;在目标时间段内的标注效率小于第三子阈值且大于或等于第二子阈值的情况下,表明标注效率略低,可以确定用户的标注状态的等级为三级,此时可以对用户进行轻微提醒,例如以消息提醒的形式展示介入信息。第二阈值、第三阈值、第四阈值和第五阈值均可以参照第一阈值,这里不再赘述。
在一种可能的实现方式中,介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;所述方法还包括:从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
其中,第二操作类型可以为删除和/或撤销。重复操作可以用于反映返工情况。在本公开实施例中,可以根据添加类型的第一目标行为日志和删除(和/或撤销)类型的第二目标行为日志的出现情况,确定用户是否出现重复操作。
在一个示例中,若在第三时间段内,第一目标行为日志的数量与第二目标行为日志的数量的差距小于第六阈值,表明目标用户可能反复执行拉框(或者标点、确定属性和添加文字等)操作,这可能是由于目标用户工作比较懈怠或者这个地方不好标记造成,此时可以确定用户出现重复操作。其中,第六阈值可以根据需要进行设置。
在用户出现重复操的情况下,可以将用于提醒用户休息的告警信息(例如“请休息”)确定为介入信息的内容,以提醒目标用户暂停标注工作。
在一种可能的实现方式中,行为日志还可以包括操作内容和/或待标注物体。其中,操作内容可以表示标注操作的具体动作,举例来说,操作内容可以包括框、点、属性和文字中的一者或多者。待标注物体可以用于表示标注操作所针对的物体,举例来说,在对图片进行标注的情况下,待标注物体可以表示图片中的人脸、人体、车辆或者动物等。
在一种可能的实现方式中,在根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式之前,所述方法还包括:
根据所述行为日志的操作内容和/或待标注物体,确定所述参数阈值。
可以理解的是,不同操作内容和/或待标注物体的标注难易程度不同。例如,标注人群中的人头和标注道路上的车辆相比,前者相对较为困难,后者相对较为简单;标注道路上的车辆和为道路上的车辆分类相比,前者相对较为简单,后者相对较为困难。因此,本公开实施例中,针对操作内容和/或待标注物体分别进行标注操作的分析。在一种可能的实现方式中,可以根据操作内容和/或待标注物体,确定标注类别。举例来说,在标注人群中的人头的情况下,操作内容为“框”,待标注物体为“人头”;在标注道路上的车辆分类的情况下,其操作内容为“属性”,待标注物体为“车辆”;这两种情况属于不同的标注类别,可以为其设置不同的参数阈值。
在一种可能的实现方式中,行为日志还可以包括终端标识和对象标识。
其中,终端标识可以用于识别业务终端。同一个用户可能在不同的业务终端上执行标注操作,不同的用户可以在同一个业务终端上执行标注操作。举例来说,终端标识可以为终端的编号或者IP地址等,对此本公开不做限制。对象标识可以用于确定标注操作所针对的对象。以图片作为标注对象为例,对象标识可以用于识别用户的标注操作所针对的图片,对象标识可以为图片编号或者图片名称等,对此本公开不做限制。
在一种可能的实现方式中,步骤S13中的介入信息可以反馈至图2所示的监控终端和/或业务终端。通过向监控终端反馈介入信息,可以方便管理者了解标注员的工作态度和完成质量,有利于管理者对标注员进行评价。通过向业务终端反馈介入信息,可以提醒标注员认真工作和适时休息,从而提高标注质量和标注效率。需要说明的是,提醒标注员休息或者放慢速度可能会让标注的数量减少一些,但是可以让标注质量提升,有利于后续对数据的利用。
在一种可能的实现方式中,所述方法还包括:在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;或者,在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
在标注状态满足介入条件的用户的数量大于第一数量阈值的情况下,表明较多的用户都存在问题,这可能是参数阈值设置不合理造成的,可以调整参数阈值。例如,可以提高第一阈值和第二阈值,降低第三阈值。这样,可以提高提醒用户的合理性。
在标注状态满足介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,表明个别用户存在问题,这属于个人工作问题,此时可以调整存在问题的用户的工作量和/或工作内容。例如,降低工作量和/或分配较易标注的标注工作。这样,可以提高用户的标注效率。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了行为数据处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种行为数据处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图3示出根据本公开实施例的行为数据处理装置的框图。如图3所示,所述行为数据处理装置30包括:
第一获取模块31,用于获取行为数据,所述行为数据包括用户进行标注产生的数据;
第一确定模块32,用于根据所述第一获取模块31获取的行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;
生成模块33,用于在所述第一确定模块32确定的行为参数反映的用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
在本公开实施例中,可以根据用户进行标注时产生的行为数据,确定反映用户标注状态的行为参数,从而在用户的标注状态满足介入条件的情况下,生成介入信息,以对用户进行提示,从而实现对用户的标注操作的监控,提高标注效率。
在一种可能的实现方式中,所述行为数据包括行为日志;
所述第一确定模块还用于:
从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;
根据所述第一目标行为日志,确定所述行为参数。
在一种可能的实现方式中,所述行为参数包括标注效率和/或标注准确率,所述目标时间段包括第一时间段和第二时间段,所述第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻;
所述用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
在一种可能的实现方式中,在所述行为参数包括标注效率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:
根据所述第一目标行为日志的数量和所述目标时间段的时长,确定所述用户在所述目标时间段内进行标注的标注效率;
和/或,
根据所述第一目标行为日志中所述第一时间段内产生的日志数量和所述第一时间段的时长,确定所述第一标注效率,并根据所述第一目标行为日志中所述第二时间段内产生的日志数量和所述第二时间段的时长,确定所述第二标注效率。
在一种可能的实现方式中,在所述行为参数包括标注准确率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:
获取所述第一目标行为日志中每条行为日志指示标注过程的标注数据,所述标注数据包括对待标注数据进行标注后得到的数据;
根据所述标注数据与参考标注数据之间的差异参数,确定所述每条行为日志对应的标注准确率;
根据所述每条行为日志对应的标注准确率,确定所述用户在所述目标时间段内进行标注的标注准确率;
和/或,
确定所述用户在所述第一时间段内进行标注的所述第一标注准确率以及所述用户在所述第二时间段内进行标注的所述第二标注准确率。
在一种可能的实现方式中,所述生成模块还用于:
根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;
以所确定的方式向所述用户展示所述介入信息的内容。
在一种可能的实现方式中,所述参数阈值包括多个阈值区间;
所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式,包括:
根据所述行为参数与所述多个阈值区间中至少一个阈值区间的归属关系,确定所述用户的标注状态的等级;
将与所述标注状态的等级对应的提示内容,确定为所述介入信息的内容,并将与所述标注状态的等级对应的提示方式,确定为提示所述用户的方式。
在一种可能的实现方式中,所述行为数据包括行为日志,所述介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;
所述装置还包括:
第二获取模块,用于从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;
第二确定模块,用于根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
在一种可能的实现方式中,所述行为日志至少包括用户标识、时间戳、操作类型和标注结果;所述操作类型至少包括删除、添加、撤销、翻页和调整中的一项。
在一种可能的实现方式中,所述行为日志还包括操作内容和/或待标注物体,所述操作内容至少包括框、点、属性、字符、字符串中的一项;
所述装置还包括:
第三确定模块,用于根据所述行为日志的操作内容和/或待标注物体,确定所述参数阈值。
在一种可能的实现方式中,所述装置还包括:
第一调整模块,用于在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;
或者,
第二调整模块,用于在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
在一种可能的实现方式中,所述行为数据包括所述用户进行图像标注产生的数据。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,当计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任一实施例提供的行为数据处理方法的指令。
本公开实施例还提供了另一种计算机程序产品,用于存储计算机可读指令,指令被执行时使得计算机执行上述任一实施例提供的行为数据处理方法的操作。
电子设备可以被提供为终端、服务器或其它形态的设备。
图4示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图4,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random-Access Memory,SRAM),电可擦除可编程只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM),可擦除可编程只读存储器(erasable programmable read-only memory,EPROM),可编程只读存储器(Programmable read-only memory,PROM),只读存储器(Read-Only Memory,ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(Liquid Crystal Display,LCD)和触摸面板(Touch Panel,TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(Microphone,MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)或电荷耦合元件(Charge-coupled Device,CCD)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(Near FieldCommunication,NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RadioFrequency Identification,RFID)技术,红外数据协会(Infrared Data Association,IrDA)技术,超宽带(Ultra Wide Band,UWB)技术,蓝牙(bluetooth,BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(Digital Signal Processing Device,DSPD)、可编程逻辑器件(programmable logic device,PLD)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图5示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图5,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(randomaccess memory,RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(Static Random-Access Memory,SRAM)、便携式压缩盘只读存储器(CompactDisc Read-Only Memory,CD-ROM)、数字多功能盘(Digital Video Disc,DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(Instruction Set Architecture,ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(Local Area Network,LAN)或广域网(WideArea Network,WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(Field ProgrammableGate Array,FPGA)或可编程逻辑阵列(Programmable logic arrays,PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (20)
1.一种行为数据处理方法,其特征在于,所述方法包括:
获取行为数据,所述行为数据包括用户进行标注产生的数据;
根据所述行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;
在所述用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
2.根据权利要求1所述的方法,其特征在于,所述行为数据包括行为日志;
所述根据所述行为数据,确定行为参数,包括:
从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;
根据所述第一目标行为日志,确定所述行为参数。
3.根据权利要求2所述的方法,其特征在于,所述行为参数包括标注效率和/或标注准确率,所述目标时间段包括第一时间段和第二时间段,所述第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻;
所述用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
4.根据权利要求3所述的方法,其特征在于,在所述行为参数包括标注效率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:
根据所述第一目标行为日志的数量和所述目标时间段的时长,确定所述用户在所述目标时间段内进行标注的标注效率;
和/或,
根据所述第一目标行为日志中所述第一时间段内产生的日志数量和所述第一时间段的时长,确定所述第一标注效率,并根据所述第一目标行为日志中所述第二时间段内产生的日志数量和所述第二时间段的时长,确定所述第二标注效率。
5.根据权利要求3或4所述的方法,其特征在于,在所述行为参数包括标注准确率的情况下,所述根据所述第一目标行为日志,确定所述行为参数,包括:
获取所述第一目标行为日志中每条行为日志指示标注过程的标注数据,所述标注数据包括对待标注数据进行标注后得到的数据;
根据所述标注数据与参考标注数据之间的差异参数,确定所述每条行为日志对应的标注准确率;
根据所述每条行为日志对应的标注准确率,确定所述用户在所述目标时间段内进行标注的标注准确率;
和/或,
确定所述用户在所述第一时间段内进行标注的所述第一标注准确率以及所述用户在所述第二时间段内进行标注的所述第二标注准确率。
6.根据权利要求2至5中任意一项所述的方法,其特征在于,所述生成介入信息,以提示所述用户,包括:
根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;
以所确定的方式向所述用户展示所述介入信息的内容。
7.根据权利要求6所述的方法,其特征在于,所述参数阈值包括多个阈值区间;
所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式,包括:
根据所述行为参数与所述多个阈值区间中至少一个阈值区间的归属关系,确定所述用户的标注状态的等级;
将与所述标注状态的等级对应的提示内容,确定为所述介入信息的内容,并将与所述标注状态的等级对应的提示方式,确定为提示所述用户的方式。
8.根据权利要求2至5中任意一项所述的方法,其特征在于,所述行为数据包括行为日志,所述介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;
所述方法还包括:
从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;
根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
9.根据权利要求2至8中任一项所述的方法,其特征在于,所述行为日志至少包括用户标识、时间戳、操作类型和标注结果;所述操作类型至少包括删除、添加、撤销、翻页和调整中的一项。
10.根据权利要求6或7所述的方法,其特征在于,所述行为日志还包括操作内容和/或待标注物体,所述操作内容至少包括框、点、属性、字符、字符串中的一项;
在所述根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式之前,所述方法还包括:
根据所述行为日志的操作内容和/或待标注物体,确定所述参数阈值。
11.根据权利要求6、7、9和10中任一项所述的方法,其特征在于,所述方法还包括:
在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;
或者,
在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
12.根据权利要求1至6中任一项所述的方法,其特征在于,所述行为数据包括所述用户进行图像标注产生的数据。
13.一种行为数据处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取行为数据,所述行为数据包括用户进行标注产生的数据;
第一确定模块,用于根据所述第一获取模块获取的行为数据,确定行为参数,所述行为参数用于反映所述用户的标注状态;
生成模块,用于在所述第一确定模块确定的行为参数反映的用户的标注状态满足介入条件的情况下,生成介入信息,以提示所述用户。
14.根据权利要求13所述的装置,其特征在于,所述行为数据包括行为日志;
所述第一确定模块还用于:
从多条所述行为日志中,获取目标时间段内第一操作类型的第一目标行为日志;
根据所述第一目标行为日志,确定所述行为参数。
15.根据权利要求14所述的装置,其特征在于,所述行为参数包括标注效率和/或标注准确率,所述目标时间段包括第一时间段和第二时间段,所述第一时间段的起始时刻早于所述第二时间段的起始时刻,所述第一时间段的截止时刻不晚于所述第二时间段的截止时刻;
所述用户的标注状态满足介入条件,至少包括如下一项:
所述目标时间段内的标注效率小于第一阈值;
所述目标时间段内的标注准确率小于第二阈值;
所述目标时间段内的标注效率大于第三阈值;
所述第二时间段内的第二标注效率小于所述第一时间段内的第一标注效率,且所述第一标注效率与所述第二标注效率的差值大于第四阈值;
所述第二时间段内的第二标注准确率小于所述第一时间段内的第一标注准确率,且所述第一标注准确率与所述第二标注准确率的差值大于第五阈值。
16.根据权利要求14或15所述的装置,其特征在于,所述生成模块还用于:
根据所述行为参数和参数阈值,确定所述介入信息的内容和提示所述用户的方式;
以所确定的方式向所述用户展示所述介入信息的内容。
17.根据权利要求14或15所述的装置,其特征在于,所述行为数据包括行为日志,所述介入信息包括告警信息,所述用户的标注状态满足介入条件,包括所述用户出现重复操作;
所述装置还包括:
第二获取模块,用于从多条所述行为日志中,获取所述目标时间段内与所述第一操作类型相对的第二操作类型的第二目标行为日志;
第二确定模块,用于根据所述第一目标行为日志以及所述第二目标行为日志,确定所述用户是否出现重复操作。
18.根据权利要求16所述的装置,其特征在于,所述装置还包括:
第一调整模块,用于在标注状态满足所述介入条件的用户的数量大于第一数量阈值的情况下,调整所述参数阈值;
或者,
第二调整模块,用于在标注状态满足所述介入条件的目标用户的数量小于或者等于第二数量阈值的情况下,调整标注状态满足所述介入条件的用户的工作量和/或工作内容。
19.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至12中任意一项所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010053651.2A CN111291013A (zh) | 2020-01-17 | 2020-01-17 | 行为数据处理方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010053651.2A CN111291013A (zh) | 2020-01-17 | 2020-01-17 | 行为数据处理方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111291013A true CN111291013A (zh) | 2020-06-16 |
Family
ID=71021192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010053651.2A Pending CN111291013A (zh) | 2020-01-17 | 2020-01-17 | 行为数据处理方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111291013A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111966674A (zh) * | 2020-08-25 | 2020-11-20 | 北京金山云网络技术有限公司 | 标注数据的合格性判断方法、装置和电子设备 |
CN113240126A (zh) * | 2021-01-13 | 2021-08-10 | 深延科技(北京)有限公司 | 标注管理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104898834A (zh) * | 2015-05-18 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 行为状态的调整方法及装置 |
US20170255651A1 (en) * | 2016-03-07 | 2017-09-07 | Sony Corporation | System and method for information processing |
CN107316156A (zh) * | 2017-06-30 | 2017-11-03 | 北京金山安全软件有限公司 | 一种数据处理方法、装置、服务器及存储介质 |
CN109684947A (zh) * | 2018-12-11 | 2019-04-26 | 广州景骐科技有限公司 | 标注质量监控方法、装置、计算机设备和存储介质 |
CN109784381A (zh) * | 2018-12-27 | 2019-05-21 | 广州华多网络科技有限公司 | 标注信息处理方法、装置及电子设备 |
-
2020
- 2020-01-17 CN CN202010053651.2A patent/CN111291013A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104898834A (zh) * | 2015-05-18 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 行为状态的调整方法及装置 |
US20170255651A1 (en) * | 2016-03-07 | 2017-09-07 | Sony Corporation | System and method for information processing |
CN107316156A (zh) * | 2017-06-30 | 2017-11-03 | 北京金山安全软件有限公司 | 一种数据处理方法、装置、服务器及存储介质 |
CN109684947A (zh) * | 2018-12-11 | 2019-04-26 | 广州景骐科技有限公司 | 标注质量监控方法、装置、计算机设备和存储介质 |
CN109784381A (zh) * | 2018-12-27 | 2019-05-21 | 广州华多网络科技有限公司 | 标注信息处理方法、装置及电子设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111966674A (zh) * | 2020-08-25 | 2020-11-20 | 北京金山云网络技术有限公司 | 标注数据的合格性判断方法、装置和电子设备 |
CN111966674B (zh) * | 2020-08-25 | 2024-03-15 | 北京金山云网络技术有限公司 | 标注数据的合格性判断方法、装置和电子设备 |
CN113240126A (zh) * | 2021-01-13 | 2021-08-10 | 深延科技(北京)有限公司 | 标注管理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10061762B2 (en) | Method and device for identifying information, and computer-readable storage medium | |
US9858259B2 (en) | Automatic capture of information from audio data and computer operating context | |
US20200012701A1 (en) | Method and apparatus for recommending associated user based on interactions with multimedia processes | |
CN111200503B (zh) | 聊天信息的处理方法、装置及电子设备 | |
KR20160048708A (ko) | 통신 메시지 인식 방법, 장치, 프로그램 및 저장매체 | |
CN109842612B (zh) | 基于图库模型的日志安全分析方法、装置及存储介质 | |
CN107659717B (zh) | 状态检测方法、装置和存储介质 | |
CN111554382B (zh) | 医学图像的处理方法及装置、电子设备和存储介质 | |
CN104636164A (zh) | 启动页面生成方法及装置 | |
CN111742311A (zh) | 智能助理方法 | |
CN111291013A (zh) | 行为数据处理方法及装置、电子设备和存储介质 | |
CN111209381B (zh) | 对话场景中时间管理方法及装置 | |
US11797218B2 (en) | Method and device for detecting slow node and computer-readable storage medium | |
CN112256563A (zh) | 安卓应用稳定性测试方法、装置、电子设备及存储介质 | |
CN109189822B (zh) | 数据处理方法及装置 | |
CN114239531A (zh) | 模板推荐方法、装置、电子设备及存储介质 | |
CN105450510A (zh) | 用于社交网络平台的好友管理方法、装置及服务器 | |
CN114490754A (zh) | 文档审核方法、装置和电子设备 | |
CN114118278A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN114124866A (zh) | 会话处理方法、装置、电子设备及存储介质 | |
CN112801474A (zh) | 数据处理方法及装置、电子设备和存储介质 | |
CN113079086A (zh) | 消息发送方法、消息发送装置、电子设备和存储介质 | |
CN111526084A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN110019270B (zh) | 信息更新方法及其装置、终端、服务器、可读存储介质 | |
CN112651352A (zh) | 图像处理方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |