CN112001155A

CN112001155A - 智能语音标注方法和系统

Info

Publication number: CN112001155A
Application number: CN202011048837.5A
Authority: CN
Inventors: 王鑫
Original assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Current assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date: 2020-09-29
Filing date: 2020-09-29
Publication date: 2020-11-27
Anticipated expiration: 2040-09-29
Also published as: CN112001155B

Abstract

本发明提供了智能语音标注方法和系统，其能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

Description

智能语音标注方法和系统

技术领域

本发明涉及智能教育的技术领域，特别涉及智能语音标注方法和系统。

背景技术

学生在阅读资料文本的过程中常常需要对资料文本包含的词语和/或文字进行标注，以此增加相应词语/文字含义解释，从而便于提高学生对资料文本的理解程度和学习效率。而现有的对资料文本进行标注都是通过手动的方式来相应的纸质资料文本或者电子资料文本上逐一地增加相应的标注内容，这种方式需要耗费大量时间对资料文本进行浏览和标注，其不仅效率低下，并且还容易发生误标注或者遗漏标注的情况，从而大大地降低文本标注的有效性和可靠性。可见，现有技术需要通过非手动标注的方式就能够对不同文本数据进行全面的和准确的标注手段。

发明内容

针对现有技术存在的缺陷，本发明提供智能语音标注方法和系统，其通过对用户进行录音，以此获得来自该用户的语音样本信息，并对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合，并对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合，再确定该语音向量集合与所述语义向量集合之间的匹配度，再根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行所述标注操作；可见，该智能语音标注方法和系统能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

本发明提供智能语音标注方法，其特征在于，其包括如下步骤：

步骤S1，对用户进行录音，以此获得来自所述用户的语音样本信息，并对所述语音样本信息进行预处理，从而获得与所述语音样本信息对应的语音向量集合；

步骤S2，对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合，再确定所述语音向量集合与所述语义向量集合之间的匹配度；

步骤S3，根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作；

进一步，在所述步骤S1中，对用户进行录音，以此获得来自所述用户的语音样本信息，并对所述语音样本信息进行预处理，从而获得与所述语音样本信息对应的语音向量集合具体包括：

步骤S101，采用阵列麦克风对所述用户进行多方位录音，以此获得来自所述用户的语音样本信息；

步骤S102，对所述语音样本信息进行卡尔曼滤波降噪处理，以此消除所述语音样本信息中的背景噪声；

步骤S103，根据下面公式(1)，对所述语音样本信息进行傅里叶变换处理，从而获得与所述语音样本信息对应的语音向量集合：

在上述公式(1)中，Type表示与所述语音样本信息对应的语音向量集合，R_t表示所述语音样本信息中第t秒语音数据对应的语音向量值，R_t+1表示所述语音样本信息中第t+1秒语音数据对应的语音向量值，sum(R_t，R_t+1)表示第t秒语音数据对应的语音向量值与第t+1秒语音数据对应的语音向量值之和，T表示所述语音样本信息包含的语音数据的总时长，e表示自然常数，α表示预设语音向量修正系数、且其取值为0.25；f(R_t)表示语音向量集合包含的元素R_t在语音向量集合中对应的值；

进一步，在所述步骤S2中，对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合，再确定所述语音向量集合与所述语义向量集合之间的匹配度具体包括：

步骤S201，对所述待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本包含的每一组文字对应的语义向量值，从而将所有语义向量值组成所述语义向量集合；

步骤S202，根据下面公式(2)，确定所述语音向量集合与所述语义向量集合之间的匹配度：

在上述公式(2)，Sim(R_t，O_m)表示所述语音向量集合中第t秒时对应的语音数据的语音向量值与所述语义向量集合中第m组文字对应的语义向量值之间的匹配度，Type(R_t)表示所述语音向量集合包含的元素R_t对应的f(R_t)的值，O_m表示所述语义向量集合中第m组文字对应的语义向量值，O_m-1表示所述语义向量集合中第m-1组文字对应的语义向量值，sum(O_m，O_m-1)表示语义向量值O_m与语义向量值O_m-1之和，M表示所述语义向量集合包含的语义向量值的总数量、且其取值为[50，1000]；

进一步，在所述步骤S3中，根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作具体包括：

步骤S301，根据所述匹配度和下面公式(3)，确定所述待标注学习文本需要进行标注操作的文字所在的行位置：

在上述公式(3)中，H(R_m)表示所述语音向量集合中第t秒的语音数据对应的语音向量值与所述语义向量集合中第m组文字对应的语义向量值匹配时、所述第m组文字在所述待标注学习文本中对应的行位置，R_t表示所述语音样本信息中第t秒语音数据对应的语音向量值，R_t+5表示所述语音样本信息中第t+5秒语音数据对应的语音向量值，sum(R_t，R_t+5)表示第t秒语音数据对应的语音向量值与第t+5秒语音数据对应的语音向量值之和，sum(R_t，O_m)表示所述语音样本信息中第t秒语音数据对应的语音向量值与所述语义向量集合中第m组文字对应的语义向量值之和，T表示所述语音样本信息包含的语音数据的总时长，μ表示预设匹配修正系数、且其取值为1.5，INT()取值函数运算；

步骤S302，根据所述行位置H(R_m)，对所述待标注学习文本中所述行位置H(R_m)对应的文字进行相应语音数据的标注操作。

本发明还提供智能语音标注系统，其特征在于，其包括语音样本获取模块、语音向量集合生成模块、语义向量集合生成模块、向量集合相似度确定模块和标注操作模块；其中，

所述语音样本获取模块用于对用户进行录音，以此获得来自所述用户的语音样本信息；

所述语音向量集合生成模块用于对所述语音样本信息进行预处理，从而获得与所述语音样本信息对应的语音向量集合；

所述语义向量集合生成模块用于对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合；

所述向量集合相似度确定模块用于确定所述语音向量集合与所述语义向量集合之间的匹配度；

所述标注操作模块用于根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作；

进一步，所述语音样本获取模块对用户进行录音，以此获得来自所述用户的语音样本信息具体包括：

采用阵列麦克风对所述用户进行多方位录音，以此获得来自所述用户的语音样本信息；

以及，

所述语音向量集合生成模块对所述语音样本信息进行预处理，从而获得与所述语音样本信息对应的语音向量集合具体包括：

对所述语音样本信息进行卡尔曼滤波降噪处理，以此消除所述语音样本信息中的背景噪声；

再根据下面公式(1)，对所述语音样本信息进行傅里叶变换处理，从而获得与所述语音样本信息对应的语音向量集合：

进一步，所述语义向量集合生成模块对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合具体包括：

对所述待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本包含的每一组文字对应的语义向量值，从而将所有语义向量值组成所述语义向量集合；

以及，

所述向量集合相似度确定模块确定所述语音向量集合与所述语义向量集合之间的匹配度具体包括：

根据下面公式(2)，确定所述语音向量集合与所述语义向量集合之间的匹配度：

进一步，所述标注操作模块根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作具体包括：

根据所述匹配度和下面公式(3)，确定所述待标注学习文本需要进行标注操作的文字所在的行位置：

再根据所述行位置H(R_m)，对所述待标注学习文本中所述行位置H(R_m)对应的文字进行相应语音数据的标注操作。

相比于现有技术，该智能语音标注方法和系统通过对用户进行录音，以此获得来自该用户的语音样本信息，并对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合，并对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合，再确定该语音向量集合与所述语义向量集合之间的匹配度，再根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行所述标注操作；可见，该智能语音标注方法和系统能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的智能语音标注方法的流程示意图。

图2为本发明提供的智能语音标注系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的智能语音标注方法的流程示意图。该智能语音标注方法包括如下步骤：

步骤S1，对用户进行录音，以此获得来自该用户的语音样本信息，并对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合；

步骤S2，对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合，再确定该语音向量集合与该语义向量集合之间的匹配度；

步骤S3，根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行该标注操作。

上述技术方案的有益效果为：该智能语音标注方法能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

优选地，在该步骤S1中，对用户进行录音，以此获得来自该用户的语音样本信息，并对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合具体包括：

步骤S101，采用阵列麦克风对该用户进行多方位录音，以此获得来自该用户的语音样本信息；

步骤S102，对该语音样本信息进行卡尔曼滤波降噪处理，以此消除该语音样本信息中的背景噪声；

步骤S103，根据下面公式(1)，对该语音样本信息进行傅里叶变换处理，从而获得与该语音样本信息对应的语音向量集合：

在上述公式(1)中，Type表示与该语音样本信息对应的语音向量集合，R_t表示该语音样本信息中第t秒语音数据对应的语音向量值，R_t+1表示该语音样本信息中第t+1秒语音数据对应的语音向量值，sum(R_t，R_t+1)表示第t秒语音数据对应的语音向量值与第t+1秒语音数据对应的语音向量值之和，T表示该语音样本信息包含的语音数据的总时长，e表示自然常数，α表示预设语音向量修正系数、且其取值为0.25；f(R_t)表示语音向量集合包含的元素R_t在语音向量集合中对应的值。

上述技术方案的有益效果为：采用阵列麦克风对用户进行多方位录音以及对录音得到的语音样本信息进行卡尔曼滤波降噪处理，以此消除其中的背景噪声，这样能够提高对该语音样本信息处理的准确性；此外，通过上述公式(1)，对该语音样本信息进行傅里叶变换处理能够有效地从该语音样本信息中提取得到相应的语音向量集合，从而便于后续对该语音向量集合进行可靠的处理。

优选地，在该步骤S2中，对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合，再确定该语音向量集合与该语义向量集合之间的匹配度具体包括：

步骤S201，对该待标注学习文本进行语义识别处理，以此获得与该待标注学习文本包含的每一组文字对应的语义向量值，从而将所有语义向量值组成该语义向量集合；

步骤S202，根据下面公式(2)，确定该语音向量集合与该语义向量集合之间的匹配度：

在上述公式(2)，Sim(R_t，O_m)表示该语音向量集合中第t秒时对应的语音数据的语音向量值与该语义向量集合中第m组文字对应的语义向量值之间的匹配度，Type(R_t)表示该语音向量集合包含的元素R_t对应的f(R_t)的值，O_m表示该语义向量集合中第m组文字对应的语义向量值，O_m-1表示该语义向量集合中第m-1组文字对应的语义向量值，sum(O_m，O_m-1)表示语义向量值O_m与语义向量值O_m-1之和，M表示该语义向量集合包含的语义向量值的总数量、且其取值为[50，1000]。

上述技术方案的有益效果为：对该待标注学习文本包含的每一组文字进行语义识别处理，能够将每一组文字一一对应转换为语义向量值，从而保证得到的语义向量集合能够全面地反映该待标注学习文本的真实语义情况；此外，通过上述公式(2)计算得到该语音向量集合与该语义向量集合之间的匹配度，能够保证对该语音样本信息和该待标注学习文本进行有效的和量化的比对处理。

优选地，在该步骤S3中，根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行该标注操作具体包括：

步骤S301，根据该匹配度和下面公式(3)，确定该待标注学习文本需要进行标注操作的文字所在的行位置：

在上述公式(3)中，H(R_m)表示该语音向量集合中第t秒的语音数据对应的语音向量值与该语义向量集合中第m组文字对应的语义向量值匹配时、该第m组文字在该待标注学习文本中对应的行位置，R_t表示该语音样本信息中第t秒语音数据对应的语音向量值，R_t+5表示该语音样本信息中第t+5秒语音数据对应的语音向量值，sum(R_t，R_t+5)表示第t秒语音数据对应的语音向量值与第t+5秒语音数据对应的语音向量值之和，sum(R_t，O_m)表示该语音样本信息中第t秒语音数据对应的语音向量值与该语义向量集合中第m组文字对应的语义向量值之和，T表示该语音样本信息包含的语音数据的总时长，μ表示预设匹配修正系数、且其取值为1.5，INT()取值函数运算；

步骤S302，根据该行位置H(R_m)，对该待标注学习文本中该行位置H(R_m)对应的文字进行相应语音数据的标注操作。具体地，将所述语音向量集合中第t秒的语音数据标注在该行位置H(R_m)处，作为对该行位置H(R_m)的文字语音解释。

上述技术方案的有益效果为：通过上述公式(3)，计算该待标注学习文本需要进行标注操作的文字所在的行位置，能够便于对该待标注学习文本进行全面的浏览和文字标注，从而提高对该待标注学习文本进行标注操作的全面性和准确性。

参阅图2，为本发明实施例提供的智能语音标注系统的结构示意图。该智能语音标注系统包括语音样本获取模块、语音向量集合生成模块、语义向量集合生成模块、向量集合相似度确定模块和标注操作模块；其中，

该语音样本获取模块用于对用户进行录音，以此获得来自该用户的语音样本信息；

该语音向量集合生成模块用于对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合；

该语义向量集合生成模块用于对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合；

该向量集合相似度确定模块用于确定该语音向量集合与该语义向量集合之间的匹配度；

该标注操作模块用于根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行该标注操作。

上述技术方案的有益效果为：该智能语音标注系统能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

优选地，该语音样本获取模块对用户进行录音，以此获得来自该用户的语音样本信息具体包括：

采用阵列麦克风对该用户进行多方位录音，以此获得来自该用户的语音样本信息；

以及，

该语音向量集合生成模块对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合具体包括：

对该语音样本信息进行卡尔曼滤波降噪处理，以此消除该语音样本信息中的背景噪声；

再根据下面公式(1)，对该语音样本信息进行傅里叶变换处理，从而获得与该语音样本信息对应的语音向量集合：

优选地，该语义向量集合生成模块对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合具体包括：

对该待标注学习文本进行语义识别处理，以此获得与该待标注学习文本包含的每一组文字对应的语义向量值，从而将所有语义向量值组成该语义向量集合；

以及，

该向量集合相似度确定模块确定该语音向量集合与该语义向量集合之间的匹配度具体包括：

根据下面公式(2)，确定该语音向量集合与该语义向量集合之间的匹配度：

优选地，该标注操作模块根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行该标注操作具体包括：

根据该匹配度和下面公式(3)，确定该待标注学习文本需要进行标注操作的文字所在的行位置：

再根据该行位置H(R_m)，对该待标注学习文本中该行位置H(R_m)对应的文字进行相应语音数据的标注操作。

从上述实施例的内容可知，该智能语音标注方法和系统通过对用户进行录音，以此获得来自该用户的语音样本信息，并对该语音样本信息进行预处理，从而获得与该语音样本信息对应的语音向量集合，并对待标注学习文本进行语义识别处理，以此获得与该待标注学习文本对应的语义向量集合，再确定该语音向量集合与所述语义向量集合之间的匹配度，再根据该匹配度，确定该待标注学习文本需要进行标注操作的文字的位置信息，再根据该位置信息，对相应的文字进行所述标注操作；可见，该智能语音标注方法和系统能够以来自用户的语音样本信息作为标注操作的依据，其对该语音样本信息进行处理得到相应的语音向量集合，同时对待标注学习文本进行处理以得到相应的语义向量集合，并根据上述两个向量集合之间的匹配度，确定需要进行标注操作的文字的位置信息，从而便于准确地对相应文字进行标注，这样能够使用户通过语音控制的方式就能够准确地和全面地对待标注学习文本进行细化标注操作，以此提高文本标注的有效性和可靠性。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.智能语音标注方法，其特征在于，其包括如下步骤：

步骤S3，根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作。

2.如权利要求1所述的智能语音标注方法，其特征在于：

在所述步骤S1中，对用户进行录音，以此获得来自所述用户的语音样本信息，并对所述语音样本信息进行预处理，从而获得与所述语音样本信息对应的语音向量集合具体包括：

在上述公式(1)中，Type表示与所述语音样本信息对应的语音向量集合，R_t表示所述语音样本信息中第t秒语音数据对应的语音向量值，R_t+1表示所述语音样本信息中第t+1秒语音数据对应的语音向量值，sum(R_t，R_t+1)表示第t秒语音数据对应的语音向量值与第t+1秒语音数据对应的语音向量值之和，T表示所述语音样本信息包含的语音数据的总时长，e表示自然常数，α表示预设语音向量修正系数、且其取值为0.25；f(R_t)表示语音向量集合包含的元素R_t在语音向量集合中对应的值。

3.如权利要求2所述的智能语音标注方法和，其特征在于：

在所述步骤S2中，对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合，再确定所述语音向量集合与所述语义向量集合之间的匹配度具体包括：

在上述公式(2)，Sim(R_t，O_m)表示所述语音向量集合中第t秒时对应的语音数据的语音向量值与所述语义向量集合中第m组文字对应的语义向量值之间的匹配度，Type(R_t)表示所述语音向量集合包含的元素R_t对应的f(R_t)的值，O_m表示所述语义向量集合中第m组文字对应的语义向量值，O_m-1表示所述语义向量集合中第m-1组文字对应的语义向量值，sum(O_m，O_m-1)表示语义向量值O_m与语义向量值O_m-1之和，M表示所述语义向量集合包含的语义向量值的总数量、且其取值为[50，1000]。

4.如权利要求3所述的智能语音标注方法，其特征在于：

在所述步骤S3中，根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作具体包括：

5.智能语音标注系统，其特征在于，其包括语音样本获取模块、语音向量集合生成模块、语义向量集合生成模块、向量集合相似度确定模块和标注操作模块；其中，

所述标注操作模块用于根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作。

6.如权利要求5所述的智能语音标注系统，其特征在于：

所述语音样本获取模块对用户进行录音，以此获得来自所述用户的语音样本信息具体包括：

以及，

7.如权利要求6所述的智能语音标注系统，其特征在于：

所述语义向量集合生成模块对待标注学习文本进行语义识别处理，以此获得与所述待标注学习文本对应的语义向量集合具体包括：

以及，

8.如权利要求7所述的智能语音标注系统，其特征在于：

所述标注操作模块根据所述匹配度，确定所述待标注学习文本需要进行标注操作的文字的位置信息，再根据所述位置信息，对相应的文字进行所述标注操作具体包括：