CN113360705A

CN113360705A - 数据管理方法和数据管理装置

Info

Publication number: CN113360705A
Application number: CN202110910365.8A
Authority: CN
Inventors: 胡卫军; 卢奕
Original assignee: Wuhan Huaxin Data System Co ltd
Current assignee: Wuhan Huaxin Data System Co ltd
Priority date: 2021-08-09
Filing date: 2021-08-09
Publication date: 2021-09-07
Anticipated expiration: 2041-08-09
Also published as: CN113360705B

Abstract

本申请提供一种数据管理方法和数据管理装置；该数据管理方法根据初始音频数据中的第一音频数据和作为初始音频数据的上下文信息的第二音频数据确定第一特征数据和第二特征数据，并根据初始音频数据的特征数据以及预设的关联信息确定第一音频数据和第二音频书的关联度，并在关联度大于预设值时，修正第一特征数据和第二特征数据得到初始音频数据的目标特征数据，则可以根据目标特征数据以及初始音频数据对应的场景数据库，确定初始音频数据的语义数据，从而可以在得到初始音频数据的特征数据后，根据第一音频数据和第二音频数据的关联度对初始音频数据的特征数据进行修正，保证输入数据的识别率和准确率。

Description

数据管理方法和数据管理装置

技术领域

本申请涉及计算机领域，尤其是涉及一种数据管理方法和数据管理装置。

背景技术

随着水务行业的发展，为了更好的实现生产状况的呈现和教育展示，水厂会引入导览机器人和多媒体展板进行互动。但现有的导览机器人仅能进行简单的文本搜索、天气查询等功能，无法应对污水处理行业的专有名词、语句，导致无法正常反馈或者互动。

所以，现有水务行业的数据识别方法存在无法应对专业用语所导致的语义识别率较低的技术问题。

发明内容

本申请实施例提供一种数据管理方法和数据管理装置，用以缓解现有水务行业的数据识别方法存在无法应对专业用语所导致的语义识别率较低的技术问题。

本申请实施例提供一种数据管理方法，该数据管理方法包括：

获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据；

根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据；

根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据；

根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度；

在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据；

根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

同时，本申请实施例提供一种数据管理装置，该数据管理装置包括：

获取模块，用于获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据；

第一确定模块，根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据；

第二确定模块，用于根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据；

第三确定模块，用于根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度；

修正模块，用于在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据；

第四确定模块，用于根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

同时，本申请实施例提供一种数据服务器，该数据服务器包括存储器，处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行程序时实现上述数据管理方法中的步骤。

同时，本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有多条指令，指令适于处理器进行加载，以执行上述数据管理方法中的步骤。

有益效果：本申请提供一种数据管理方法和数据管理装置；该数据管理方法先获取待处理的初始音频数据，然后根据第一音频数据以及初始音频数据对应的语义特征数据库，确定第一音频数据的第一特征数据，根据第二音频数据以及语义特征数据库，确定第二音频数据的第二特征数据，然后根据第一特征数据、第二特征数据以及预设的关联信息，确定第一音频数据和第二音频数据的关联度，并在关联度大于预设值时，修正第一特征数据和第二特征数据得到初始音频数据的目标特征数据，根据目标特征数据以及初始音频数据对应的场景数据库，确定初始音频数据对应的语义数据。本申请通过在需要根据待处理的初始音频数据确定对应的语义数据时，根据初始音频数据中的第一音频数据和作为初始音频数据的上下文信息的第二音频数据确定第一特征数据和第二特征数据，并根据初始音频数据的特征数据以及预设的关联信息确定第一音频数据和第二音频书的关联度，并在关联度大于预设值时，修正第一特征数据和第二特征数据得到初始音频数据的目标特征数据，则可以根据目标特征数据以及初始音频数据对应的场景数据库，确定初始音频数据的语义数据，从而可以在得到初始音频数据的特征数据后，根据第一音频数据和第二音频数据的关联度对初始音频数据的特征数据进行修正，保证输入数据的识别率和准确率。

附图说明

下面结合附图，通过对本申请的具体实施方式详细描述，将使本申请的技术方案及其它有益效果显而易见。

图1为本申请实施例提供的水务交互系统的场景示意图。

图2为本申请实施例提供的数据管理方法的流程图。

图3为本申请实施例提供的语义特征数据库的结构示意图。

图4为本申请实施例提供的数据管理装置的结构示意图。

图5为本申请实施例提供的数据服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1为本申请实施例提供的水务交互系统的场景示意图，该系统可以包括设备和服务器通过网络或者网关连接通信，网络可以是广域网或者局域网，又或者是二者的组合，使用无线链路实现数据传输，不再赘述，其中，设备包括语音输入装置11，服务器包括数据服务器12以及通信服务器，图1中未示出通信服务器等，其中：

语音输入装置11包括但不局限于话筒、移动终端、笔记本电脑、个人计算机连接的麦克风，用于采集输入数据。

服务器包括本地服务器和/或远程服务器等。数据服务器12以及通信服务器都可以部署在本地服务器，也可以部分或者全部部署在远程服务器上。

数据服务器12可以获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据；根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据；根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据；根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度；在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据；根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

需要说明的是，图1所示的系统场景示意图仅仅是一个示例，本申请实施例描述的服务器以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。以下分别进行详细说明。需要说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

需要说明的是，在本申请实施例中，初始音频数据包括待处理语音数据，该待处理语音数据可以通过语音输入装置输入。

图2为本申请实施例提供的数据管理方法的流程示意图，请参阅图2，该数据管理方法包括以下步骤：

201：获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据。

在一种实施例中，初始音频数据包括通过语音输入的语音内容，该语音内容中包括查看、查询或者展示水务系统中的设备、设施、视频、文本，对初始音频数据进行处理后能够使水务交互系统进行相应的操作（包括但不限于对设备或者设施的控制、展示，对视频和文本的修改、展示）。

在一种实施例中，作为初始音频数据的上下文信息的第二音频数据包括相邻或者相近的输入数据，例如语音输入的输入数据包括三句语音，则位于中间一句的语音的上下文信息包括上一句语音和下一句语音，而上一句语音的上下文信息包括中间一句的语音和下一句语音。

针对不同身份的人员对水务领域的专业名称的了解程度不同，采用同一识别过程会导致效率较低的技术问题。在一种实施例中，在所述获取初始音频数据的步骤之前，还包括：接收输入的身份信息；根据所述身份信息，确定输入数据的输入类型。针对不同的用户，采用不同的识别方式，例如根据身份信息确定输入类型为专业人员的语音输入、或者是普通人员的语音输入，则可以相应的调用不同的数据库，以及不同的处理方式确定特征数据，例如考虑到专业人员所描述的名词一般为本领域的专有名词，则在输入数据中存在该名词时，确定该名词的含义为本领域的含义，而普通人员在描述该名词时，需要进一步确定该名词是否为本领域的含义，或者可能是其他领域的含义，相应的对该名词进行进一步确定，从而保证语义识别的准确性，且可以提高识别效率。

上述实施例以输入的名词与本领域的名词相同进行了说明，但在本申请实施例中，还可以是语音输入中的名词与本领域的名词相近，则在专业人员输入的名词为与本领域的名词相近时，进一步确定输入的名词，保证语义识别的准确性。

202：根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据。

在一种实施例中，所述语义特征数据库指具有特定含义的名称、名词和字组成的数据库，通过特征数据可以确定输入数据的语义。例如通过水厂导览、运行过程展示等特征数据确定输入数据的语义为水厂的导览、或者水厂中设备的运行过程的展示。

在一种实施例中，所述第一特征数据指表征第一音频数据的特征的数据，可以为数字、字符串，也可以为数字、字符串组成的数组，从而可以通过第一特征数据确定第一音频数据的特征，相应的确定第一音频数据的语义。

针对第一音频数据直接确定第一特征数据效率较低，且对数据的处理要求过高。在一种实施例中，所述根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据的步骤，包括：根据所述第一音频数据，确定所述第一音频数据对应的第一特征信息；在所述初始音频数据对应的语义特征数据库查找所述第一音频数据对应的第一特征信息；在所述语义特征数据库中查找到所述第一音频数据对应的第一特征信息时，确定所述第一音频数据对应的第一特征数据。通过先处理第一音频数据，确定第一音频数据对应的第一特征信息，然后在语义特征数据库中查找第一特征信息，并在查找到第一特征信息时，确定第一特征数据，从而可以降低数据查找过程的难度，提高数据查找的效率。

在一种实施例中，第一特征信息指第一音频数据中的具有特定含义的信息，包括具有特定含义的字、名词、短句。

具体的，在获取到第一音频数据后，通过将第一音频数据分解为多个输入片段（可以为多个字、词或者短句），根据多个输入片段确定第一音频数据的第一特征信息，然后在语义特征数据库中查找与第一特征信息相同或者相近的特征信息，在查找到与第一特征信息相同或者相近的特征信息，确定第一音频数据的第一特征数据。

具体的，在语义特征数据库中查找到与第一特征信息相近的特征信息时，可以通过设置模型进行训练，通过训练后的模型比对第一特征信息和语义特征数据库中与第一特征信息相近的特征信息，确定第一特征信息和语义特征数据库中与第一特征信息相近的特征信息的相似度，进而判断第一特征信息所表示的语义是否与语义特征数据库中的特征信息的语义相同，则可以在语义特征数据库中确定是否存在第一特征信息，在语义特征数据库中存在第一特征信息时，确定第一音频数据的第一特征数据，从而确定第一音频数据的语义。

在一种实施例中，在确定第一特征数据时，需要确定第一音频数据的名称信息、身份信息和系数信息。具体的，所述在所述语义特征数据库中查找到所述第一音频数据对应的第一特征信息时，确定所述第一音频数据对应的第一特征数据的步骤，包括：根据所述第一特征信息，确定所述语义特征数据库中对应所述第一音频数据的名称信息；根据所述第一音频数据的名称信息，在所述语义特征数据库中确定所述第一音频数据的身份信息和所述第一音频数据的系数信息；根据所述第一音频数据的名称信息、所述第一音频数据的身份信息和所述第一音频数据的系数信息，确定所述第一音频数据的第一特征数据。

具体的，第一音频数据的身份信息指第一音频数据的名称信息对应的身份信息，第一音频数据的系数信息指第一音频数据的名称信息对应的关系系数，表征第一音频数据的重要性，例如名称信息为曝气室，相应的身份信息可以通过数字1表示，相应的系数信息可以通过小数0.01表示，通过不同名称信息以及对应的不同身份信息、不同的系数信息确定第一特征数据，从而可以根据第一特征数据确定第一音频数据的语义。

具体的，根据第一特征信息，确定第一音频数据的名称信息，例如输入片段对应的特征信息的名称为曝气室，则可以通过字符串表示名称信息，在确定名称信息后，确定第一音频数据的身份信息和系数信息，例如通过整数表示第一音频数据的身份信息、通过小数确定第一音频数据的系数信息，从而可以根据第一音频数据的名称信息、身份信息和系数信息确定第一音频数据的第一特征数据。

具体的，如图3所示，语义特征数据库3包括第一级数据和第二级数据，第一级数据包括数据一d1（m1，n1，q1）（标号31）和数据二d2（m2，n2，q2）（标号32），数据一d1（m1，n1，q1）（标号31）包括第二级数据d11（m11，n11，q11）（标号311）、d12（m12，n12，q12）（标号312）和d13（m13，n13，q13）（标号313），数据二d2（m2，n2，q2）（标号32）包括第二级数据d21（m21，n21，q21）（标号321）、d22（m22，n22，q22）（标号322）和d23（m23，n23，q23）（标号323）。

其中，d（m，n，q）是指由m（名称信息，以字符串表示），n（身份信息，以整数表示），q（系数信息，以小数表示）组成的二维数组，通过第一音频数据和语义特征数据库，确定第一音频数据中的各二维数组，从而确定第一音频数据的第一特征数据。

针对语义特征数据库中无法查找到第一音频数据对应的第一特征信息时，无法确定第一音频数据的第一特征数据的问题。在一种实施例中，在所述初始音频数据对应的语义特征数据库查找所述第一音频数据对应的第一特征信息的步骤之后，还包括：获取预设特征数据；在所述初始音频数据对应的语义特征数据库未查找所述第一音频数据对应的第一特征信息时，根据所述预设特征数据确定所述第一特征数据。根据预设特征数据确定第一特征数据，则可以在后续确定第一音频数据和第二音频数据的关联度后，对第一特征数据进行修正，从而确定目标特征数据。

具体的，第一音频数据包括多个第一特征信息，在语义特征数据库中查找到部分第一特征信息，并存在部分第一特征信息无法查找到时，通过预设特征数据确定未查找到的第一特征信息对应的特征数据，从而根据在语义特征数据库中查找到的第一特征信息的特征数据和未查找到的第一特征信息确定第一特征数据，以在后续根据第一音频数据和第二音频数据的关联度，对第一特征数据进行修正，保证第一音频数据的语义识别准确。

203：根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据对应的第二特征数据。

在一种实施例中，所述第二特征数据指表征第二音频数据的特征的数据，可以为数字、字符串，也可以为数字、字符串组成的数组，从而可以通过第二特征数据确定第二音频数据的特征，相应的确定第二音频数据的语义。

针对第二音频数据直接确定第二特征数据效率较低，且对数据的处理要求过高。在一种实施例中，所述根据所述第二音频数据，以及所述语义特征数据库，确定所述第二音频数据对应的第二特征数据的步骤，包括：根据所述第二音频数据，确定所述第二音频数据对应的第二特征信息；在所述语义特征数据库查找所述第二音频数据对应的第二特征信息；在所述语义特征数据库中查找到所述第二音频数据对应的第二特征信息时，确定所述第二音频数据对应的第二特征数据。通过先处理第二音频数据，确定第二音频数据对应的第二特征信息，然后在语义特征数据库中查找第二特征信息，并在查找到第二特征信息时，确定第二特征数据，从而可以降低数据查找过程的难度，提高数据查找的效率。

在一种实施例中，在确定第二特征数据时，可以根据需要第二音频数据的名称信息、身份信息和系数信息确定第二特征数据。具体的，所述在所述语义特征数据库中查找到所述第二音频数据对应的第二特征信息时，确定所述第二音频数据对应的第二特征数据的步骤，包括：根据所述第二特征信息，确定所述语义特征数据库中对应所述第二音频数据的名称信息；根据所述第二音频数据的名称信息，在所述语义特征数据库中确定所述第二音频数据的身份信息和所述第二音频数据的系数信息；根据所述第二音频数据的名称信息、所述第二音频数据的身份信息和所述第二音频数据的系数信息，确定所述第二音频数据的第二特征数据。

204：根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度。

在一种实施例中，预设的关联信息指确定第一特征数据和第二特征数据的关联性的数据，例如，预设的关联信息为计算第一特征数据和第二特征数据的关联度的计算公式。

205：在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据。

在一种实施例中，目标特征数据指包括修正后的第一特征数据和第二特征数据的特征数据，根据目标特征数据可以确定初始音频数据的语义。

针对第一音频数据存在无法在语义特征数据库中查找到对应的第一特征信息，导致无法准确识别第一音频数据的语义的问题。在一种实施例中，所述在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据的步骤，包括：在所述关联度大于预设值时，根据所述第二特征数据修正所述第一特征数据；根据修正后的第一特征数据和所述第二特征数据，确定所述初始音频数据的目标特征数据。通过在第一音频数据的第一特征数据无法准确确定第一音频数据的语义时，在第二音频数据的第二特征数据确定时，通过第二音频数据确定第一音频数据的第一特征数据，从而可以确定第一音频数据的语义，从而识别初始音频数据的语义。

具体的，第一特征数据中存在“液位计”这一特征数据，但由于在水务互动系统中多个设备存在液位计，因此无法确定液位计是某个设备的液位计，而在第二特征数据中存在“同时”、“展示”、“搅拌设备”、“搅拌频率”等特征，则可以根据第二特征数据修正第一特征数据，在第一特征数据中加入或者将原有数据修正为“搅拌设备”，从而可以确定第一音频数据的语义包括“搅拌设备的液位计”，从而确定初始音频数据的语义。

上述实施例以第二特征数据修正第一特征数据进行了详细说明，但在本申请实施例，并未限定第一特征数据对应的第一音频数据和第二特征数据对应的第二音频数据的先后顺序，因此可以理解的是，本申请实施例也可以通过第一特征数据修正第二特征数据，且还可以通过第一特征数据和第二特征数据相互修正，从而得到准确的语义。

针对水务互动系统中的展示类型、设施、设备数量较大，而语音输入存在部分数据缺失的问题。在一种实施例中，所述根据所述第一音频数据，以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据的步骤，包括：根据所述第一音频数据，以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第一音频数据的第一阶特征数据；根据所述第一音频数据，以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第一音频数据的第二阶特征数据；所述第一阶语义特征数据库对应的第一阶特征包括所述第二阶语义特征数据库对应的第二阶特征；根据所述第一音频数据，以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第一音频数据的第三阶特征数据；所述第二阶语义特征数据库对应的第二阶特征包括所述第三阶语义特征数据库对应的第三阶特征；根据所述第一音频数据的第一阶特征数据、所述第一音频数据的第二阶特征数据和所述第一音频数据的第三阶特征数据，确定所述第一特征数据。

上述实施例中根据第一音频数据分为不同阶的特征数据，使得在确定第一音频数据的第一特征数据时，即使存在部分阶的数据缺失，仍然能够确定第一特征数据，并根据第二特征数据修正第一特征数据，以确定第一音频数据的语义。

具体的，以水务互动系统为例，第一阶特征包括对水厂的导览及相关的动作，例如第一阶特征包括查询或者查看水厂中的视频、文档，第二阶特征包括水厂的设施名称，例如第二阶特征包括搅拌处理中的搅拌池、深度处理中的氧化池；第三阶特征包括水厂的设备名称，例如第三阶特征包括水厂的搅拌设备。

更具体的，第一阶特征、第二阶特征和第三阶特征均包括第一级数据和第二数据，第一阶特征的第一级数据包括动作的意图类别、第二级数据包括动作的意图类别下的具体动作，例如第一阶特征的第一级数据为查询、第二级数据为查询视频或者查询文字；第二阶特征的第一级数据包括工艺单元名称、第二级数据包括具体设施名称，例如第二阶特征的第一级数据为深度处理，第二级数据为氧化池，第三阶特征的第一级数据包括设备类别，第二级数据包括机械、仪表名称，例如第三阶特征的第一级数据为搅拌设备，第二级数据为搅拌设备的具体名称和型号。

上述实施例中以将特征数据分为多阶数据和多级数据为例进行了说明，通过将特征数据分为多阶数据和多级数据，能够准确的确定各数据的语义，且在部分数据缺失时，通过数据的特殊性和数据的关联性确定缺失的数据，从而可以准确确定输入数据的语义。

上述实施例中通过第一特征数据和第二特征数据相互修正举例如下：第一音频数据的第一阶特征数据确定、第二阶特征数据部分缺失、第三阶特征数据确定，而第二音频数据的第一阶特征数据缺失，第二阶特征数据确定，第三阶特征数据确定，根据第一音频数据中的第二阶特征数据和第二音频数据中的第二阶特征数据确定第二音频数据的第一阶特征数据，根据第一音频数据的第三阶特征数据和第二音频数据的第三阶特征数据确定第一音频数据的第二阶特征数据中缺失的数据，从而确定第一音频数据和第二音频数据的语义。

在一种实施例中，所述根据所述第二音频数据，以及所述语义特征数据库，确定所述第二音频数据的第二特征数据的步骤，包括：根据所述第二音频数据，以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第二音频数据的第一阶特征数据；根据所述第二音频数据，以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第二音频数据的第二阶特征数据；根据所述第一音频数据，以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第二音频数据的第三阶特征数据；根据所述第二音频数据的第一阶特征数据、第二音频数据的第二阶特征数据和所述第二音频数据的第三阶特征数据，确定所述第二特征数据。

针对初始音频数据会存在部分数据缺失的问题，通过确定初始音频数据中第一音频数据和第二音频数据的关联信息，对初始音频数据中缺失的数据进行补充，从而准确识别输入数据的语义。在一种实施例中，所述根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度的步骤，包括：根据所述第一音频数据的第一阶特征数据、所述第二音频数据的第一阶特征数据以及所述预设关联信息，确定第一关联度；根据所述第一音频数据的第二阶特征数据、所述第二音频数据的第二阶特征数据以及所述预设关联信息，确定第二关联度；根据所述第一音频数据的第三阶特征数据、所述第二音频数据的第三阶特征数据以及所述预设关联信息，确定第三关联度；根据所述第一关联度、所述第二关联度和所述第三关联度，确定所述第一音频数据和所述第二音频数据的关联度。

上述实施例中通过不同阶的特征数据的关联度，确定第一音频数据和第二音频数据的关联度，可以准确的判断第一音频数据和第二音频数据的关联度，从而根据第一音频数据和第二音频数据的关联度对第一音频数据和第二音频数据的特征数据进行修正，从而保证第一音频数据和第二音频数据的语义准确，提高语义识别准确率。

具体的，例如初始音频数据的第一阶数据包括第一级数据（m_k，n_k，q_k）和第二级数据（m_kl，n_kl，q_kl），在第一语义特征数据库中查找到初始音频数据的第一级特征信息时，则可以确定初始音频数据的第一阶特征数据的第一级特征数据v_1a=n_k* q_k，在第一语义特征数据库中未查找到初始音频数据的第一级特征信息时，确定初始音频数据的第一阶特征数据的第一级特征数据为v_1a=0，即预设特征数据为0；在第一语义特征数据库中查找到初始音频数据的第二级特征信息时，则可以确定初始音频数据的第二阶特征数据的第二级特征数据v_1b=n_kl* q_kl，在第一语义特征数据库中未查找到初始音频数据的特征信息时，确定初始音频数据的第一阶特征数据的第二级特征数据v_1b=0，相应的，可以确定第一阶特征数据v₁=【v_1av_1b】，相应的确定第二阶特征数据v₂=【v_2av_2b】，第三阶特征数据v₃=【v_3av_3b】，则可以确定初始音频数据的特征数据

（v₁，v₂，v₃均为向量）。

上述实施例说明了初始音频数据的特征数据的具体表达形式，第一音频数据和第二音频数据均适于上述表达形式，以上述表达形式说明第一音频数据和第二音频数据的关联度，具体如下：

第一音频数据的特征数据

，第二音频数据的特征数据

，则第一音频数据和第二音频数据的第一阶特征数据的关联度

，相应的第二阶特征数据的关联度

，第三阶特征数据的关联度

，则第一音频数据和第二音频数据的关联度

，在θ越小时，表示第一音频数据和第二音频数据的关联度越高，通过设定预设值，在第一音频数据和第二音频数据的关联度大于预设值时，对第一音频数据和第二音频数据的特征数据进行修正，例如

，上式中，

，从而准确确定第一音频数据和第二音频数据的语义。

206：根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

在一种实施例中，在确定目标特征数据后，根据目标特征数据，从场景数据库中确定初始音频数据的语义数据，相应的输出语义数据。

其中，场景数据库包括水处理数据库，水处理数据库包括水处理知识库和生产实时数据库，水处理数据库中可以存储包括水处理的相关信息，包括基础的工艺流程，各设施、各设备的信息等，生产实时数据库包括生产实时的数据，包括视频、文档展示生产过程的数据。

本申请实施例提供一种数据管理方法，该数据管理方法通过在需要根据待处理的初始音频数据确定对应的语义数据时，根据初始音频数据中的第一音频数据和作为初始音频数据的上下文信息的第二音频数据确定第一特征数据和第二特征数据，并根据初始音频数据的特征数据以及预设的关联信息确定第一音频数据和第二音频书的关联度，并在关联度大于预设值时，修正第一特征数据和第二特征数据得到初始音频数据的目标特征数据，则可以根据目标特征数据以及初始音频数据对应的场景数据库，确定初始音频数据的语义数据，从而可以在得到初始音频数据的特征数据后，根据第一音频数据和第二音频数据的关联度对初始音频数据的特征数据进行修正，保证输入数据的识别率和准确率。

相应的，图4为本申请实施例提供的数据管理装置的结构示意图，请参阅图4，该数据管理装置包括以下模块：

获取模块401，用于获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据；

第一确定模块402，用于根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据；

第二确定模块403，用于根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据；

第三确定模块404，用于根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度；

修正模块405，用于在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据；

第四确定模块406，用于根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

在一种实施例中，所述第一确定模块402用于根据所述第一音频数据，确定所述第一音频数据对应的第一特征信息；在所述初始音频数据对应的语义特征数据库查找所述第一音频数据对应的第一特征信息；在所述语义特征数据库中查找到所述第一音频数据对应的第一特征信息时，确定所述第一音频数据的第一特征数据。

在一种实施例中，所述第一确定模块402用于根据所述第一特征信息，确定所述语义特征数据库中对应所述第一音频数据的名称信息；根据所述第一音频数据的名称信息，在所述语义特征数据库中确定所述第一音频数据的身份信息和所述第一音频数据的系数信息；根据所述第一音频数据的名称信息、所述第一音频数据的身份信息和所述第一音频数据的系数信息，确定所述第一音频数据的第一特征数据。

在一种实施例中，所述第一确定模块402用于获取预设特征数据；在所述初始音频数据对应的语义特征数据库未查找所述第一音频数据对应的第一特征信息时，根据所述预设特征数据确定所述第一特征数据。

在一种实施例中，所述第二确定模块403用于根据所述第二音频数据，确定所述第二音频数据对应的第二特征信息；在所述语义特征数据库查找所述第二音频数据对应的第二特征信息；在所述语义特征数据库中查找到所述第二音频数据对应的第二特征信息时，确定所述第二音频数据的第二特征数据。

在一种实施例中，所述修正模块405用于在所述关联度大于预设值时，根据所述第二特征数据修正所述第一特征数据；根据修正后的第一特征数据和所述第二特征数据，确定所述初始音频数据的目标特征数据。

在一种实施例中，所述第一确定模块402用于根据所述第一音频数据、以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第一音频数据的第一阶特征数据；根据所述第一音频数据、以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第一音频数据的第二阶特征数据；所述第一阶语义特征数据库对应的第一阶特征包括所述第二阶语义特征数据库对应的第二阶特征；根据所述第一音频数据、以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第一音频数据的第三阶特征数据；所述第二阶语义特征数据库对应的第二阶特征包括所述第三阶语义特征数据库对应的第三阶特征；根据所述第一音频数据的第一阶特征数据、所述第一音频数据的第二阶特征数据和所述第一音频数据的第三阶特征数据，确定所述第一特征数据。

在一种实施例中，所述第二确定模块403用于根据所述第二音频数据、以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第二音频数据的第一阶特征数据；根据所述第二音频数据，以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第二音频数据的第二阶特征数据；根据所述第一音频数据，以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第二音频数据的第三阶特征数据；根据所述第二音频数据的第一阶特征数据、第二音频数据的第二阶特征数据和所述第二音频数据的第三阶特征数据，确定所述第二特征数据。

在一种实施例中，所述第三确定模块404用于根据所述第一音频数据的第一阶特征数据、所述第二音频数据的第一阶特征数据以及所述预设的关联信息，确定第一关联度；根据所述第一音频数据的第二阶特征数据、所述第二音频数据的第二阶特征数据以及所述预设的关联信息，确定第二关联度；根据所述第一音频数据的第三阶特征数据、所述第二音频数据的第三阶特征数据以及所述预设的关联信息，确定第三关联度；根据所述第一关联度、所述第二关联度和所述第三关联度，确定所述第一音频数据和所述第二音频数据的关联度。

相应的，本申请实施例还提供一种数据服务器，如图5所示，该数据服务器可以包括射频（RF，Radio Frequency）电路501、包括有一个或一个以上计算机可读存储介质的存储器502、输入单元503、显示单元504、传感器505、音频电路506、无线保真（WiFi，WirelessFidelity）模块507、包括有一个或者一个以上处理核心的处理器508、以及电源509等部件。本领域技术人员可以理解，图5中示出的数据服务器结构并不构成对数据服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部分，或者不同的部件布置。其中：

RF电路501可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器508处理；另外，将涉及上行的数据发送给基站。存储器502可用于存储软件程序以及模块，处理器508通过运行存储在存储器502的软件程序以及模块，从而执行各种功能应用以及数据处理。输入单元503可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

显示单元504可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。

数据服务器还可包括至少一种传感器505，比如光传感器、运动传感器以及其他传感器。音频电路506包括扬声器，扬声器可提供用户与数据服务器之间的音频接口。

WiFi属于短距离无线传输技术，数据服务器通过WiFi模块507可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块507，但是可以理解的是，其并不属于数据服务器的必须构成，完全可以根据需要在不改变申请的本质的范围内而省略。

处理器508是数据服务器的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器502内的软件程序和/或模块，以及调用存储在存储器502内的数据，执行数据服务器的各种功能和处理数据，从而对手机进行整体监控。

数据服务器还包括给各个部件供电的电源509（比如电池），优选的，电源可以通过电源管理系统与处理器508逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，数据服务器还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，数据服务器中的处理器508会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中，并由处理器508来运行存储在存储器502中的应用程序，从而实现以下功能：

获取待处理的初始音频数据，所述初始音频数据包括第一音频数据以及作为所述初始音频数据的上下文信息的第二音频数据；根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据；根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据；根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度；在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据；根据所述目标特征数据以及所述初始音频数据对应的场景数据库，确定所述初始音频数据对应的语义数据。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文的详细描述，此处不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以实现以下功能：

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种方法中的步骤，因此，可以实现本申请实施例所提供的任一种方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

以上对本申请实施例所提供的一种数据管理方法和数据管理装置、数据服务器和计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的技术方案及其核心思想；本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。

Claims

1.一种数据管理方法，其特征在于，包括：

2.如权利要求1所述的数据管理方法，其特征在于，根据所述第一音频数据、以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据的步骤，包括：

根据所述第一音频数据，确定所述第一音频数据对应的第一特征信息；

在所述初始音频数据对应的语义特征数据库查找所述第一音频数据对应的第一特征信息；

在所述语义特征数据库中查找到所述第一音频数据对应的第一特征信息时，确定所述第一音频数据的第一特征数据。

3.如权利要求2所述的数据管理方法，其特征在于，所述在所述语义特征数据库中查找到所述第一音频数据对应的第一特征信息时，确定所述第一音频数据的第一特征数据的步骤，包括：

根据所述第一特征信息，确定所述语义特征数据库中对应所述第一音频数据的名称信息；

根据所述第一音频数据的名称信息，在所述语义特征数据库中确定所述第一音频数据的身份信息和所述第一音频数据的系数信息；

根据所述第一音频数据的名称信息、所述第一音频数据的身份信息和所述第一音频数据的系数信息，确定所述第一音频数据的第一特征数据。

4.如权利要求2所述的数据管理方法，其特征在于，在所述初始音频数据对应的语义特征数据库查找所述第一音频数据对应的第一特征信息的步骤之后，还包括：

获取预设特征数据；

在所述初始音频数据对应的语义特征数据库未查找所述第一音频数据对应的第一特征信息时，根据所述预设特征数据确定所述第一特征数据。

5.如权利要求4所述的数据管理方法，其特征在于，所述根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据的步骤，包括：

根据所述第二音频数据，确定所述第二音频数据对应的第二特征信息；

在所述语义特征数据库查找所述第二音频数据对应的第二特征信息；

在所述语义特征数据库中查找到所述第二音频数据对应的第二特征信息时，确定所述第二音频数据的第二特征数据。

6.如权利要求5所述的数据管理方法，其特征在于，所述在所述关联度大于预设值时，修正所述第一特征数据和所述第二特征数据以得到所述初始音频数据的目标特征数据的步骤，包括：

在所述关联度大于预设值时，根据所述第二特征数据修正所述第一特征数据；

根据修正后的第一特征数据和所述第二特征数据，确定所述初始音频数据的目标特征数据。

7.如权利要求1所述的数据管理方法，其特征在于，所述根据所述第一音频数据，以及所述初始音频数据对应的语义特征数据库，确定所述第一音频数据的第一特征数据的步骤，包括：

根据所述第一音频数据、以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第一音频数据的第一阶特征数据；

根据所述第一音频数据、以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第一音频数据的第二阶特征数据；所述第一阶语义特征数据库对应的第一阶特征包括所述第二阶语义特征数据库对应的第二阶特征；

根据所述第一音频数据、以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第一音频数据的第三阶特征数据；所述第二阶语义特征数据库对应的第二阶特征包括所述第三阶语义特征数据库对应的第三阶特征；

根据所述第一音频数据的第一阶特征数据、所述第一音频数据的第二阶特征数据和所述第一音频数据的第三阶特征数据，确定所述第一特征数据。

8.如权利要求7所述的数据管理方法，其特征在于，所述根据所述第二音频数据、以及所述语义特征数据库，确定所述第二音频数据的第二特征数据的步骤，包括：

根据所述第二音频数据、以及所述初始音频数据对应的第一阶语义特征数据库，确定所述第二音频数据的第一阶特征数据；

根据所述第二音频数据，以及所述初始音频数据对应的第二阶语义特征数据库，确定所述第二音频数据的第二阶特征数据；

根据所述第一音频数据，以及所述初始音频数据对应的第三阶语义特征数据库，确定所述第二音频数据的第三阶特征数据；

根据所述第二音频数据的第一阶特征数据、第二音频数据的第二阶特征数据和所述第二音频数据的第三阶特征数据，确定所述第二特征数据。

9.如权利要求8所述的数据管理方法，其特征在于，所述根据所述第一特征数据、所述第二特征数据以及预设的关联信息，确定所述第一音频数据和所述第二音频数据的关联度的步骤，包括：

根据所述第一音频数据的第一阶特征数据、所述第二音频数据的第一阶特征数据以及所述预设的关联信息，确定第一关联度；

根据所述第一音频数据的第二阶特征数据、所述第二音频数据的第二阶特征数据以及所述预设的关联信息，确定第二关联度；

根据所述第一音频数据的第三阶特征数据、所述第二音频数据的第三阶特征数据以及所述预设的关联信息，确定第三关联度；

根据所述第一关联度、所述第二关联度和所述第三关联度，确定所述第一音频数据和所述第二音频数据的关联度。

10.一种数据管理装置，其特征在于，包括：