CN110532447A - 一种业务数据处理方法、装置、介质和设备 - Google Patents
一种业务数据处理方法、装置、介质和设备 Download PDFInfo
- Publication number
- CN110532447A CN110532447A CN201910806268.7A CN201910806268A CN110532447A CN 110532447 A CN110532447 A CN 110532447A CN 201910806268 A CN201910806268 A CN 201910806268A CN 110532447 A CN110532447 A CN 110532447A
- Authority
- CN
- China
- Prior art keywords
- operator
- algorithm
- file
- parameter
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提出一种业务数据处理方法、装置、介质和设备,包括:根据数据应用领域创建样本集;根据所述样本集获取算法参数描述文件;根据所述数据应用领域创建训练数据集,训练算法模型;根据所述算法模型构建算子管理器;通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;编辑所述初始化算法文件,生成算子;本发明可有效简化算子的生成过程,提高算子的生成效率。
Description
技术领域
本发明涉及智能算法应用领域,尤其涉及一种业务数据处理方法、装置、介质和设备。
背景技术
在机器学习过程中,会通过统计学算法,对大量历史数据进行处理,生成经验模型,再利用生成的经验模型指导业务。一个模型往往是由若干可复用的算子组成,算子按一定逻辑组织起来执行。渐渐地,演变成了以数据作为AI模型输入的建模方式,比如非常有代表性的阿里可视化建模平台PAI Studio,通过拖拽将算子连接创建模型图。
在平台与算法的对接过程中,算法形成算子的过程往往过于依赖人工,因此迫切需要一种工具平台,帮助建模人员完成算子的初始化,制定一个算子标准,简化算子的生成过程。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种业务数据处理方法、装置、介质和设备,主要解决算子生成依赖人工且效率低的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种业务数据处理方法,包括:
获取业务数据流并将所述业务数据流输入生成的算子中;
通过所述算子对所述业务数据流进行处理;其中,通过算法参数描述文件和算子管理器,生成所述算子。
可选地,根据数据应用领域创建样本集;根据所述样本集获取算法参数描述文件。
可选地,根据数据应用领域创建训练数据集,训练算法模型;根据所述算法模型构建算子管理器。
可选地,通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;编辑所述初始化算法文件,生成算子。
可选地,所述构建算子管理器包括:
根据所述数据应用领域对所述训练数据集中的数据进行分类,获取多个子数据集;
针对每个所述子数据集进行模型训练,获取对应的算法模型;
将所述算法模型整合成模型库,根据所述模型库构建所述算子管理器。
可选地,所述数据应用领域包括人脸识别、投资风险评估、语音识别。
可选地,根据所述样本集的应用领域,获取所述样本集的类别参数;
根据所述类别参数和所述样本集中的样本数据,生成所述算法参数描述文件。
可选地,所述算法参数描述文件至少还包括输入参数和输出参数;
获取所述样本集中数据的数据类型,根据数据类型获取输入参数;
预设输出数据的数据类型,根据所述输出数据的数据类型获取输出参数;
将所述输入参数和所述输出参数输入所述算法参数描述文件。
可选地,所述算子管理器获取多个所述算法参数描述文件;
根据每个所述算法参数描述文件中的所述类别参数创建对应的输入锚点和输出锚点;
通过所述输入锚点和所述输出锚点分别定位对应的所述算法参数描述文件的输入参数和输出参数。
可选地,所述获取初始化算法文件包括:
获取所述算法参数描述文件中的类别参数;
所述算子管理器根据所述类别参数获取对应的算法模型,生成算法文件;
根据所述算法参数描述文件,指定所述算法文件的输入参数和输出参数,对所述算法文件进行初始化,获取初始化算法文件。
可选地,所述生成算子,还包括:
选取经过初始化的算法文件,根据所述算法文件的应用领域,加入算法数据,获取修正算法文件;
将所述修正算法文件反馈给所述算子管理器;
所述算子管理器生成所述算子的可视化外形,建立所述可视化外形与所述修正算法文件的对应关系,生成算子。
可选地,将一个算子的输入锚点与另一算子的输出锚点进行校验,根据校验结果建立算子间的连接关系。
可选地,所述算子管理器包括可视化配置界面;
通过所述可视化配置界面显示所述算法参数描述文件的内容;所述可视化配置界面包括编辑窗口,通过所述编辑窗口修改所述算法参数描述文件。
一种业务数据处理装置,包括:
业务数据获取模块,用于获取业务数据流并将所述业务数据流输入生成的算子中;
业务数据处理模块,用于通过所述算子对所述业务数据流进行处理;其中,通过算法参数描述文件和算子管理器,生成所述算子。
可选地,还包括参数生成模块,用于根据数据应用领域创建样本集;根据所述样本集获取算法参数描述文件。
可选地,还包括管理器创建模块,用于根据数据应用领域创建训练数据集,训练算法模型;根据所述算法模型构建算子管理器。
可选地,还包括算子生成模块,用于通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;编辑所述初始化算法文件,生成算子。
可选地,所述算子生成模块包括外形生成单元和连接单元,通过所述外形生成单元用于生成算子的可视化外形,通过所述连接单元建立所述可视化外形与对应算子的连接关系。
可选地,所述参数生成模块包括:
类别获取单元,根据所述样本集的应用领域,获取所述样本集的类别参数;
文件生成单元,根据所述类别参数和所述样本集中的样本数据,生成所述算法参数描述文件。
可选地,还包括:
存储模块,用于存储所述类别参数;
校验模块,用于根据所述存储模块存储的类别参数校验算子间的连接关系。
可选地,还包括数据传输接口,通过所述数据传输接口导入或导出算法文件。
可选地,还包括可视化操作界面,用于显示所述算子以及算子间的连接关系。
一种设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行所述业务数据处理方法。
一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行所述的业务数据处理方法。
如上所述,本发明一种业务数据处理方法、装置、介质和设备,具有以下有益效果。
通过算子管理器可自动生成算法文件,并对算法文件进行初始化,只需要根据算法参数描述文件对生成的算法文件进行简单调整,便可得到需要的算子,极大提高了算子生成的效率,缩减了人工成本。
附图说明
图1为本发明一实施例中的业务数据处理方法的流程图。
图2为本发明一实施例中的业务数据处理装置的模块图。
图3为本发明一实施例中终端设备的硬件结构示意图。
图4为本发明另一实施例中终端设备的硬件结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
一个算子由四部分组成:可视化形状元素、可视化配置页面、算法参数描述文件、算法文件。
一个可以形成算子的算法应当包括一个或多个数据流参数,也可包括非数据流参数,且该算法必然会以一个或多个数据流作为输出。
算法参数描述文件用于指明输入参数、输出参数以及数据涉及的类别参数。
请参阅图1,本发明提供一种业务数据处理方法,包括步骤S01-S02。
在步骤S01中,获取业务数据流并将所述业务数据流输入生成的算子中;
业务数据流信息可以包括为报表、视频图像以及文本数据等,可将报表数据通过人工输入到平台中,形成输入数据流,也可通过摄像头采集视频数据流信息,作为输入数据流,也可通过激光扫描器扫描文本数据,获取文本数据信息输入数据流。也可将报表数据、视频流数据和/或文本数据按设定顺序整合在一起,形成输入数据流。
在步骤S02中,通过所述算子对所述业务数据流进行处理;其中,通过算法参数描述文件和算子管理器,生成所述算子。
根据业务数据流的数据应用领域创建样本集,数据应用领域可以包括人脸识别、语音识别、投资风险评估等领域。
样本集中数据为待分析数据,通过将样本数据输入到构建的算子模型中,得到想要的分析结果。待分析数据可以为报表、视频图像以及文本数据等,可根据待分析数据的应用领域,对待分析数据进行归类。以风险投资为例,可以以个人历史征信数据作为样本数据,构建基于征信度的样本集。
根据样本集获取算法参数描述文件:
以人脸识别为例,由于涉及人脸识别应用领域,可以以特定字符串或代码作为标识,标注用于识别的数据信息,获取类别参数。如用字符串“0001”标识类别参数为人脸,当涉及自然语言识别时,可用字符串“0002”标识文本数据。将类别参数写入算法参数描述文件中。
获取用于输入算法中的样本数据的数据类型,设置输入数据的参数类型,获取输入参数,如输入数据的数据类型为字符串,则设置输入参数为str,输入参数类型根据编写算法使用的计算机语言不同而有所区别,这里仅以示例形式作为参考。
在一实施例中,输入数据为数据流时,数据流中通常包含多种数据类型,可按照数据流中数据输入算法的先后顺序,将对应数据的数据类型转换为输入参数,输入参数的顺序与数据流中数据的顺序保持一致。
同时根据算法输出数据的数据类型设置输出数据的参数类型,获取输出参数。将输入参数和输出参数写入算法参数描述文件中,将输入参数、输出参数分别与类别参数对应。算法参数描述文件主要包含输入参数、输出参数以及类别参数。
根据所述数据应用领域创建训练数据集,训练算法模型:
训练数据集的创建可利用现有的数据库,如FERET人脸数据库、维基百科文本库等,也可实时采集语音、图像、及文本等数据信息,构建训练数据集。训练数据集中可包含多种数据类别,根据不同的数据类别采用对应的算法训练算法模型。
以卷积神经网络为例,可通过卷积神经网络训练文本识别模型,得到文本识别的模型框架。同样的,涉及图像采样的算法模型,可采用邻近插值法,双线性内插法等本领域常用的采样算法,形成算法模型,
根据所述算法模型构建算子管理器:
根据获取的各类算法模型,整合成模型库,将模型库集成在算子管理器中,算子管理器可根据需要调取模型库中的算法模型。
如当算法参数描述文件中的类别参数为文本识别对应的参数时,算子管理器调取文本识别的模型框架。
通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;
通过算子管理器调取对应的算法模型,根据算法参数描述文件中的参数以及参数类型对模型框架进行调整。如可将算法参数描述文件中的输入参数用于替换模型框架中对应函数的输入参数类型,以便模型框架能适用于算法参数描述文件对应的输入数据,同时将算法参数描述文件中的输出参数用于替换模型框架的输出函数对应的参数,以便的到想要的输出结果。
在一实施例中,算子管理器可以同时获取多个算法参数描述文件,每个算法参数描述文件对应一种算法操作。每个算法参数描述文件中的类别参数用于区分不同的算法操作。算子管理器会根据接收到的算法参数描述文件,为每个算法参数描述文件创建锚点。根据算法参数描述文件中的输入参数和类别参数创建输入锚点,以类别参数的参数类型所为输入锚点的类型,同样地,以算法参数描述文件中的输出参数和类别参数创建输出锚点,以类别参数的参数类型作为输出锚点的类型。锚点主要用于建立两个算子之间的连接关系。
如当前有三份算法参数描述文件,一份算法参数描述文件对应的输入数据为人脸识别数据,其类别参数为字符串“0001”,第二份算法参数描述文件对应的输入数据为摄像头采集的图像数据,需要进行图像预处理,其类别参数为字符串“0005”,第三份算法参数描述文件对应的输入数据为经过图像分割等与处理后的图像数据,需要进行特征提取,其类别参数为字符串“0006”。正常情况下,需要将“0006”对应的算子与“0005”对应的算子建立连接,再将“0005”对应的算子与“0001”对应的算子建立连接。需要将“0001”的输出锚点的类型与“0005”的输入锚点的类型进行校验,以判断这两个算子能否建立连接。同样地,将三份算法参数描述文件对应的锚点进行相互校验,根据预先制定的校验规则,建立算子间的连接关系。以人脸识别为例,图像分割对应的算子可以与特征提取对应的算子连接,特征提取对应的算子可以与人脸识别对应的算子连接。
在另一实施例中,可以将多种类别的数据按输入的先后顺序组成数据流。如一组采集的原始数据包含图像信息、文字信息以及语音信息,则同时包含音频识别、自然语言识别和图像识别三种类别,算法参数描述文件中同时包含三种类别参数,算子管理器根据三种类别参数创建多个对应的输入锚点和输出锚点。不同类型的锚点用于连接不同的算子。
在一实施例中,算子管理器可初始化一个可视化配置界面,可视化配置界面包括显示窗口和编辑窗口,操作人员可直接在可视化配置界面上编辑算法参数描述文件,并通过显示窗口实时显示编辑内容。当需要对参数进行修改时,可直接点击可视化界面对应的功能按钮,调取对应的算法参数描述文件,进行实时修改。
在一实施例中,通过算法参数描述文件指定模型框架的输入和输出参数,对模型框架进行初始化,可以获取初始化算法文件。
编辑所述初始化算法文件,生成算子:
根据获取的初始化算法文件,操作人员可以对初始化算法文件进行调整,检查经过初始化的算法文件是否存在逻辑错误,当需要增加必要的函数以实现需要的功能时,操作人员可将初始化算法文件加载到本地计算机进行实时编辑,并将编辑好的算法文件上传至算子管理器。
在一实施例中,算子管理器也可自主对经过初始化的算法文件进行自检,检查其中的语法以及逻辑错误,以减少操作人员的工作量。
在一实施例中,操作人员可通过网页远程登录的方式访问算子管理器,获取经过初始化的算法文件,进行实时编辑。
算子管理器接收到经过操作人员修正的算法文件,算子管理器根据创建的输入锚点和输出锚点创建算子的可视化外形,将经过修正的算法文件和算法参数描述文件通过可视化外形封装在一起,生成对应的算子。操作人员可直接点击算子对应的可视化外形查看对应的算法文件以及算法参数描述文件。算子的可视化外形根据锚点的类型及数量设置有连接位,操作人员可通过拖拽的方式,将多个算子拖拽到显示窗口,算子间通过锚点校验自动建立连接,并通过显示窗口实时显示算子可视化外形连接位的连接情况。操作人员也可手动调整各算子间的连接情况,以实现想要的功能。
在一实施例中,建立了算子间连接关系后,将得到的算子模型发送给算子执行器,算子执行器获取输入数据,并根据算法参数描述文件中的参数类型,自动对输入数据中的数据进行参数转换。当输入数据为数据流时,算子执行器根据算法参数文件中的参数顺序获取数据流中数据,自动将获取的数据流中对应数据转换为算法参数描述文件中记载的参数类型。如当输入数据流为一串字符串时,而算法参数描述文件记录的参数顺序依次为字符串、数字以及布尔型,则执行器会将获取的数据流中对应长度的字符串分别转换为数字和布尔型。
请参阅图2,本实施例提供一种业务数据处理装置,用于执行前述方法实施例中所述的业务数据处理方法。由于装置实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
在一实施例中,业务数据处理系统包括业务数据获取模块10、业务数据处理模块11、参数生成模块12、管理器创建模块13和算子生成模块14。业务数据获取模块10用于辅助执行前述方法实施例介绍的步骤S01,业务数据处理模块11、参数生成模块12、管理器创建模块13和算子生成模块14用于执行前述方法实施例介绍的步骤S02。
在一实施例中,算子生成模块14包括外形生成单元和连接单元,通过所述外形生成单元生成算子的可视化外形,通过所述连接单元建立所述可视化外形与对应算子的连接关系。外形生成单元根据创建的输入锚点和输出锚点生成算子的可视化外形,将算法文件和算法参数描述文件通过可视化外形封装在一起,生成对应的算子。操作人员可直接点击算子对应的可视化外形查看对应的算法文件以及算法参数描述文件。算子的可视化外形根据锚点的类型及数量设置有连接位,操作人员可通过拖拽的方式,将多个算子拖拽到显示窗口,算子间通过连接单元建立连接,并通过显示窗口实时显示算子可视化外形连接位的连接情况。操作人员也可手动调整各算子间的连接情况,以实现想要的功能。外形生成单元可以为通过C语言、C++编程语言或Java语言编写的图形化组件。连接单元主要用于将生成的可视化外形与算法文件及算法参数描述文件封装在一起。
在一实施例中,参数生成模块12包括数据获取单元、类别获取单元和文件生成单元,数据获取单元,用于获取应用领域的数据信息;类别获取单元,用于根据所述应用领域类别对所述数据信息进行标注,获取类别参数;文件生成单元,用于根据所述类别参数和所述数据信息,生成所述算法参数描述文件。
在一实施例中,装置还包括存储模块和校验模块,存储模块用于存储算反参数描述文件中的类型参数,以便在进行验证时,不必每次重新读取对应的算法参数描述文件中的类别参数,直接读取存储模块中的类别参数进行校验,提高效率。操作人员在拖拽算子时,算子自动类别参数存入存储模块中,便于校验模块读取类别参数完成校验。
在一实施例中,装置上还设置有数据传输接口,操作人员可以通过该数据传输接口导入经过编辑的算法参数描述文件,也可通过数据传输接口导出经过初始化的算法文件进行离线编辑,完成编辑后在通过该数据传输接口上传算法文件。
在一实施例中,装置还包括可视化操作界面,可视化操作界面包括显示窗口和编辑窗口,操作人员可直接在可视化操作界面上编辑算法参数描述文件,并通过显示窗口实时显示编辑内容。当需要对参数进行修改时,可直接点击可视化界面对应的功能按钮,调取对应的算法参数描述文件,进行实时修改。
本申请实施例还提供了一种设备,该设备可以包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行图1所述的方法。在实际应用中,该设备可以作为终端设备,也可以作为服务器,终端设备的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的图1中业务数据处理方法所包含步骤的指令(instructions)。
图3为本申请一实施例提供的终端设备的硬件结构示意图。如图所示,该终端设备可以包括:输入设备1100、第一处理器1101、输出设备1102、第一存储器1103和至少一个通信总线1104。通信总线1104用于实现元件之间的通信连接。第一存储器1103可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,第一存储器1103中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
可选的,上述第一处理器1101例如可以为中央处理器(Central ProcessingUnit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,该处理器1101通过有线或无线连接耦合到上述输入设备1100和输出设备1102。
可选的,上述输入设备1100可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备1102可以包括显示器、音响等输出设备。
在本实施例中,该终端设备的处理器包括用于执行各设备中语音识别装置各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。
图4为本申请的另一个实施例提供的终端设备的硬件结构示意图。图4是对图3在实现过程中的一个具体的实施例。如图所示,本实施例的终端设备可以包括第二处理器1201以及第二存储器1202。
第二处理器1201执行第二存储器1202所存放的计算机程序代码,实现上述实施例中图1所述方法。
第二存储器1202被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息,图片,视频等。第二存储器1202可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可选地,第一处理器1201设置在处理组件1200中。该终端设备还可以包括:通信组件1203,电源组件1204,多媒体组件1205,语音组件1206,输入/输出接口1207和/或传感器组件1208。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。
处理组件1200通常控制终端设备的整体操作。处理组件1200可以包括一个或多个第二处理器1201来执行指令,以完成上述图1所示方法的全部或部分步骤。此外,处理组件1200可以包括一个或多个模块,便于处理组件1200和其他组件之间的交互。例如,处理组件1200可以包括多媒体模块,以方便多媒体组件1205和处理组件1200之间的交互。
电源组件1204为终端设备的各种组件提供电力。电源组件1204可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。
多媒体组件1205包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
语音组件1206被配置为输出和/或输入语音信号。例如,语音组件1206包括一个麦克风(MIC),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部语音信号。所接收的语音信号可以被进一步存储在第二存储器1202或经由通信组件1203发送。在一些实施例中,语音组件1206还包括一个扬声器,用于输出语音信号。
输入/输出接口1207为处理组件1200和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。
传感器组件1208包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器组件1208可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器组件1208可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器组件1208还可以包括摄像头等。
通信组件1203被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个实施例中,该终端设备中可以包括SIM卡插槽,该SIM卡插槽用于插入SIM卡,使得终端设备可以登录GPRS网络,通过互联网与服务器建立通信。
由上可知,在图4实施例中所涉及的通信组件1203、语音组件1206以及输入/输出接口1207、传感器组件1208均可以作为图3实施例中的输入设备的实现方式。
综上所述,本发明一种业务数据处理方法、装置、介质和设备,通过算子管理器自动初始化算法文件,可极大地减少操作人员的工作量,提高算法生成的效率;通过锚点进行算子校验,可自动建立算子间的连接关系,提高算子模型的智能化;提供可视化界面,便于操作人员实时修改和编辑,操作简单,可提高工作效率;可远程通过网页访问,进行算法文件及配置文件的编辑,可实现实时调试;通过拖拽、可视化配置、可视化编辑代码等方式提高算子编写效率。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (24)
1.一种业务数据处理方法,其特征在于,包括:
获取业务数据流并将所述业务数据流输入生成的算子中;
通过所述算子对所述业务数据流进行处理;其中,通过算法参数描述文件和算子管理器,生成所述算子。
2.根据权利要求1所述的业务数据处理方法,其特征在于,根据数据应用领域创建样本集;根据所述样本集获取算法参数描述文件。
3.根据权利要求2所述的业务数据处理方法,其特征在于,根据数据应用领域创建训练数据集,训练算法模型;根据所述算法模型构建算子管理器。
4.根据权利要求3所述的业务数据处理方法,其特征在于,通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;编辑所述初始化算法文件,生成算子。
5.根据权利要求3所述的业务数据处理方法,其特征在于,所述构建算子管理器包括:
根据所述数据应用领域对所述训练数据集中的数据进行分类,获取多个子数据集;
针对每个所述子数据集进行模型训练,获取对应的算法模型;
将所述算法模型整合成模型库,根据所述模型库构建所述算子管理器。
6.根据权利要求3所述的业务数据处理方法,其特征在于,所述数据应用领域包括人脸识别、投资风险评估、语音识别。
7.根据权利要求4所述的业务数据处理方法,其特征在于,
根据所述样本集的应用领域,获取所述样本集的类别参数;
根据所述类别参数和所述样本集中的样本数据,生成所述算法参数描述文件。
8.根据权利要求7所述的业务数据处理方法,其特征在于,所述算法参数描述文件至少还包括输入参数和输出参数;
获取所述样本集中数据的数据类型,根据数据类型获取输入参数;
预设输出数据的数据类型,根据所述输出数据的数据类型获取输出参数;
将所述输入参数和所述输出参数输入所述算法参数描述文件。
9.根据权利要求8所述的业务数据处理方法,其特征在于,
所述算子管理器获取多个所述算法参数描述文件;
根据每个所述算法参数描述文件中的所述类别参数创建对应的输入锚点和输出锚点;
通过所述输入锚点和所述输出锚点分别定位对应的所述算法参数描述文件的输入参数和输出参数。
10.根据权利要求9所述的业务数据处理方法,其特征在于,所述获取初始化算法文件包括:
获取所述算法参数描述文件中的类别参数;
所述算子管理器根据所述类别参数获取对应的算法模型,生成算法文件;
根据所述算法参数描述文件,指定所述算法文件的输入参数和输出参数,对所述算法文件进行初始化,获取初始化算法文件。
11.根据权利要求4所述的业务数据处理方法,其特征在于,所述生成算子,还包括:
选取经过初始化的算法文件,根据所述算法文件的应用领域,加入算法数据,获取修正算法文件;
将所述修正算法文件反馈给所述算子管理器;
所述算子管理器生成所述算子的可视化外形,建立所述可视化外形与所述修正算法文件的对应关系,生成算子。
12.根据权利要求1所述的业务数据处理方法,其特征在于,将一个算子的输入锚点与另一算子的输出锚点进行校验,根据校验结果建立算子间的连接关系。
13.根据权利要求1所述的业务数据处理方法,其特征在于,所述算子管理器包括可视化配置界面;
通过所述可视化配置界面显示所述算法参数描述文件的内容;所述可视化配置界面包括编辑窗口,通过所述编辑窗口修改所述算法参数描述文件。
14.一种业务数据处理装置,其特征在于,包括:
业务数据获取模块,用于获取业务数据流并将所述业务数据流输入生成的算子中;
业务数据处理模块,用于通过所述算子对所述业务数据流进行处理;其中,通过算法参数描述文件和算子管理器,生成所述算子。
15.根据权利要求14所述的业务数据处理装置,其特征在于,还包括参数生成模块,用于根据数据应用领域创建样本集;根据所述样本集获取算法参数描述文件。
16.根据权利要求14所述的业务数据处理装置,其特征在于,还包括管理器创建模块,用于根据数据应用领域创建训练数据集,训练算法模型;根据所述算法模型构建算子管理器。
17.根据权利要求14所述的业务数据处理装置,其特征在于,还包括算子生成模块,用于通过所述算法参数描述文件和所述算子管理器,获取初始化算法文件;编辑所述初始化算法文件,生成算子。
18.根据权利要求17所述的业务数据处理装置,其特征在于,所述算子生成模块包括外形生成单元和连接单元,通过所述外形生成单元用于生成算子的可视化外形,通过所述连接单元建立所述可视化外形与对应算子的连接关系。
19.根据权利要求15所述的业务数据处理装置,其特征在于,所述参数生成模块包括:
类别获取单元,根据所述样本集的应用领域,获取所述样本集的类别参数;
文件生成单元,根据所述类别参数和所述样本集中的样本数据,生成所述算法参数描述文件。
20.根据权利要求14所述的业务数据处理装置,其特征在于,还包括:
存储模块,用于存储所述类别参数;
校验模块,用于根据所述存储模块存储的类别参数校验算子间的连接关系。
21.根据权利要求14所述业务数据处理装置,其特征在于,还包括数据传输接口,通过所述数据传输接口导入或导出算法文件。
22.根据权利要求14所述的业务数据处理装置,其特征在于,还包括可视化操作界面,用于显示所述算子以及算子间的连接关系。
23.一种设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-13中一个或多个所述的方法。
24.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-13中一个或多个所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910806268.7A CN110532447A (zh) | 2019-08-29 | 2019-08-29 | 一种业务数据处理方法、装置、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910806268.7A CN110532447A (zh) | 2019-08-29 | 2019-08-29 | 一种业务数据处理方法、装置、介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110532447A true CN110532447A (zh) | 2019-12-03 |
Family
ID=68664957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910806268.7A Pending CN110532447A (zh) | 2019-08-29 | 2019-08-29 | 一种业务数据处理方法、装置、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532447A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177238A (zh) * | 2019-12-13 | 2020-05-19 | 北京航天云路有限公司 | 一种基于用户自定义的数据集生成方法 |
CN111552470A (zh) * | 2019-12-31 | 2020-08-18 | 远景智能国际私人投资有限公司 | 物联网中的数据分析任务创建方法、装置及存储介质 |
CN112632113A (zh) * | 2020-12-31 | 2021-04-09 | 北京九章云极科技有限公司 | 一种算子管理方法和算子管理系统 |
CN113676353A (zh) * | 2021-08-19 | 2021-11-19 | 杭州华橙软件技术有限公司 | 设备的控制方法、装置、存储介质和电子装置 |
CN117932972A (zh) * | 2024-03-15 | 2024-04-26 | 南京凯奥思数据技术有限公司 | 基于web应用于设备状态算法模型的可视化建模平台及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104020994A (zh) * | 2014-05-30 | 2014-09-03 | 华为技术有限公司 | 基于流系统的流过程定义装置和流过程定义方法 |
CN104331270A (zh) * | 2014-10-24 | 2015-02-04 | 华为技术有限公司 | 一种流数据处理的方法、装置及系统 |
CN104391747A (zh) * | 2014-11-18 | 2015-03-04 | 北京锐安科技有限公司 | 一种并行计算方法及装置 |
CN107463595A (zh) * | 2017-05-12 | 2017-12-12 | 中国科学院信息工程研究所 | 一种基于Spark的数据处理方法及系统 |
CN107943463A (zh) * | 2017-12-15 | 2018-04-20 | 清华大学 | 交互式自动化大数据分析应用开发系统 |
US20180268076A1 (en) * | 2017-03-16 | 2018-09-20 | Raytheon Company | Systems and methods for generating a property graph data model representing a system architecture |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
-
2019
- 2019-08-29 CN CN201910806268.7A patent/CN110532447A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104020994A (zh) * | 2014-05-30 | 2014-09-03 | 华为技术有限公司 | 基于流系统的流过程定义装置和流过程定义方法 |
CN104331270A (zh) * | 2014-10-24 | 2015-02-04 | 华为技术有限公司 | 一种流数据处理的方法、装置及系统 |
CN104391747A (zh) * | 2014-11-18 | 2015-03-04 | 北京锐安科技有限公司 | 一种并行计算方法及装置 |
US20180268076A1 (en) * | 2017-03-16 | 2018-09-20 | Raytheon Company | Systems and methods for generating a property graph data model representing a system architecture |
CN107463595A (zh) * | 2017-05-12 | 2017-12-12 | 中国科学院信息工程研究所 | 一种基于Spark的数据处理方法及系统 |
CN107943463A (zh) * | 2017-12-15 | 2018-04-20 | 清华大学 | 交互式自动化大数据分析应用开发系统 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177238A (zh) * | 2019-12-13 | 2020-05-19 | 北京航天云路有限公司 | 一种基于用户自定义的数据集生成方法 |
CN111177238B (zh) * | 2019-12-13 | 2023-12-08 | 北京航天云路有限公司 | 一种基于用户自定义的数据集生成方法 |
CN111552470A (zh) * | 2019-12-31 | 2020-08-18 | 远景智能国际私人投资有限公司 | 物联网中的数据分析任务创建方法、装置及存储介质 |
CN111552470B (zh) * | 2019-12-31 | 2023-09-12 | 远景智能国际私人投资有限公司 | 物联网中的数据分析任务创建方法、装置及存储介质 |
CN112632113A (zh) * | 2020-12-31 | 2021-04-09 | 北京九章云极科技有限公司 | 一种算子管理方法和算子管理系统 |
CN113676353A (zh) * | 2021-08-19 | 2021-11-19 | 杭州华橙软件技术有限公司 | 设备的控制方法、装置、存储介质和电子装置 |
CN117932972A (zh) * | 2024-03-15 | 2024-04-26 | 南京凯奥思数据技术有限公司 | 基于web应用于设备状态算法模型的可视化建模平台及方法 |
CN117932972B (zh) * | 2024-03-15 | 2024-05-28 | 南京凯奥思数据技术有限公司 | 基于web应用于设备状态算法模型的可视化建模平台及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532447A (zh) | 一种业务数据处理方法、装置、介质和设备 | |
CN109783354A (zh) | 应用系统的功能测试方法、终端设备及介质 | |
CN109284473A (zh) | 在线教学课件的编辑和生成方法以及系统 | |
CN107423054B (zh) | 基于fpga的自定义图形化算法组态装置、系统和方法 | |
CN109240924A (zh) | 一种应用程序的测试方法及设备 | |
CN105159754B (zh) | 基于商业智能云平台的在线仿真方法及装置 | |
CN104777911A (zh) | 一种基于全息技术的智能交互方法 | |
CN103744787A (zh) | 一种手机自动化测试方法 | |
CN110610698B (zh) | 一种语音标注方法及装置 | |
CN109376069A (zh) | 一种测试报告的生成方法及设备 | |
CN103279846A (zh) | 一种基于bim模型的工程验收方法和系统 | |
CN106708510A (zh) | 一种基于图形化组态的工业智能相机软件体系结构及方法 | |
CN108197019A (zh) | 智能卡的测试系统、测试设备、测试方法 | |
CN110490958A (zh) | 动画绘制方法、装置、终端及存储介质 | |
CN109242934A (zh) | 一种动画代码的生成方法及设备 | |
CN105989213A (zh) | 一种通信工程图纸生成方法及图纸设计客户端 | |
WO2021031137A1 (zh) | 人工智能应用开发系统、计算机设备及存储介质 | |
CN110348109A (zh) | 三维仿真培训数据处理的方法及终端设备 | |
CN107179910A (zh) | 一种在线编辑即时生效的逻辑组态方法 | |
CN111047046A (zh) | 一种机器学习模型的可视化生成方法及设备 | |
CN112148276A (zh) | 用于深度学习的可视化编程 | |
CN107283423A (zh) | 智能型测试机器人系统 | |
CN117951723A (zh) | 任务数据的构建方法及装置、计算设备、可读存储介质 | |
CN112906554B (zh) | 基于视觉图像的模型训练优化方法、装置及相关设备 | |
CN104992379A (zh) | 一种电力行业大数据动态文本交换格式管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191203 |