CN113792608B

CN113792608B - 一种智能语义分析方法及系统

Info

Publication number: CN113792608B
Application number: CN202110955076.XA
Authority: CN
Inventors: 杨建仁
Original assignee: Guangzhou Clouddcs Co ltd
Current assignee: Guangzhou Clouddcs Co ltd
Priority date: 2021-08-19
Filing date: 2021-08-19
Publication date: 2022-05-10
Anticipated expiration: 2041-08-19
Also published as: CN113792608A

Abstract

本发明提供了一种智能语义分析方法及系统，通过使用语音识别技术将视频中的音频信号转化为文字化表述的字符串数据Line，利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记作为集合Scnset，将字符串Line利用集合Scnset切分成多个字符作为集合Tokset，将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组作为集合Stryset，计算主题词Key在Stryset各元素中的序列距离度，通过计算筛选出Stryset中序列距离度小于平均值的多个字符串数组，将筛选所得的多个字符串数组进行字符串拼接并在创建的文本文件保存，从而达到根据视频的音频识别得到字符文本进而对字符文本进行切分筛选精简出关键部分的效果。

Description

一种智能语义分析方法及系统

技术领域

本发明属于文字识别领域，具体涉及一种智能语义分析方法及系统。

背景技术

视频在现代的信息传播场景中的作用日益显著，短视频应用在知识传播和信息记录的作用越发重要。但是视频对于直接传递文本信息的复杂度要高于字符数据，不利于将视频中的知识结构化地表述并存储下来，因此，对视频中的音频信息进行语音文字识别得到文本信息是高效读取视频中文字信息的重要手段。

在给定相关的搜索关键词的背景下，计算关键词与识别所得文本的距离度，从而有利于将具有较高相关度的字符串拼接起来得到视频信息的有效信息，并将有效信息作为文本进行长期的数据存储。

发明内容

本发明的目的在于提出一种智能语义分析方法及系统，以解决现有技术中所存在的一个或多个技术问题，至少提供一种有益的选择或创造条件。

为了实现上述目的，根据本公开的一方面，提供一种智能语义分析方法，所述方法包括以下步骤：

S100，输入视频，利用语音识别技术得到视频中的音频信号的文本的字符串Line，利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记作为集合Scnset；

S200，在字符串Line中提取出主题词Key；

S300，利用集合Scnset将字符串Line切分成多个字符，将所得多个字符作为集合Tokset；S400，通过中文切词算法将集合Tokset中各元素进行切分得到多个字符串数组，将切分

得到的多个字符串数组作为集合Stryset；

S500，计算主题词Key在Stryset各元素中的序列距离度作为集合Loiset；

S600，通过计算集合Loiset的平均值筛选出Stryset中序列距离度小于Loiset的平均值的多个字符串数组，将筛选所得的多个字符串数组进行字符串拼接并在创建的文本文件保存。

进一步地，在S100中，输入视频，利用语音识别技术得到视频中的音频信号的文本的字符串Line，利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记作为集合Scnset的方法为：输入视频，利用语音识别技术得到视频中的音频的文字化表述的字符串Line，并记录字符串Line中各字符在视频中的采集时间的时间标记作为序列Temp，利用视频目标追踪技术分类视频的不同场景得到多个不同场景的多个时间标记作为集合Scnset。

进一步地，在S200中，在字符串Line中提取出主题词Key的方法为：将字符串Line通过中文切词算法和TF-IDF算法从中提取得到主题词Key。

进一步地，在S300中，将字符串Line利用集合Scnset切分成多个字符，将所得多个字符作为集合Tokset的方法为：把字符串Line根据序列Temp中各字符在视频中的采集时间的时间标记通过集合Scnset中区分多个不同场景的多个时间标记进行切分，将切分得到的多个字符串数组作为集合Stryset。

进一步地，在S400中，将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组，将切分得到的多个字符串数组作为集合Stryset的方法为：将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组，将切分得到的多个字符串数组作为集合Stryset。

进一步地，在S500中，计算主题词Key在Stryset各元素中的序列距离度作为集合Loiset的方法为：计算主题词Key在Stryset各元素中的多个连接序列的具体方法为，记集合Stryset各元素的数量为n，变量i为集合Stryset中元素的序号，i∈[1,n]，字符串数组Stryset(i)表示集合Stryset中序号为i的元素，记变量j表示字符串数组Stryset(i)中字符串的序号，m为字符串数组Stryset(i)中包含的字符串的数量，word(i,j)表示集合Stryset中序号为i的元素Stryset(i)中的序号为j的字符串，记函数Emb()为通过词向量方法将输入的字符串进行向量化得到词向量的函数，通过函数Emb()所得的词向量的维度均相同，记通过函数Emb()所得的词向量的维度为k，变量t表示通过函数Emb()所得的词向量的第t维的序号，t∈[1,k]，则Emb(Key)表示通过词向量方法将Key进行向量化得到的词向量，记vt即表示Emb(Key),Emb(word(i,j))表示通过词向量方法将word(i,j)进行向量化得到的词向量，记emw即表示Emb(word(i,j))，emt[t]表示Emb(Key)的第t维数值，emw[t]表示Emb(word(i,j))的第t维数值，记词向量Emb(Key)与Emb(word(i,j))之间的距离度为ρ(i,j)，计算词向量Emb(Key)与Emb(word(i,j))之间的距离度ρ(i,j)的公式为：

则记函数Lo()为输入两个向量计算两个向量之间的距离度的函数，词向量Emb(Key)与Emb(word(i,j))之间的距离度为ρ(i,j)可通过函数Lo()表示为ρ(i,j)＝Lo(Emb(Key),Emb(word(i,j)))或者ρ(i,j)＝Lo(emt,emw)或者Lo(emt,emw)＝Lo(Emb(Key),Emb(word(i,j)))；

计算Emb(Key)分别与集合Stryset中序号为i的元素Stryset(i)中的各个字符串通过函数Emb()进行向量化得到的各个词向量的距离度的算术平均值记作距离平均度Lois(vt,Stryset(i))，距离平均度函数Lois()表示计算一个词向量与集合Stryset中序号为i的元素Stryset(i)中的各个字符串通过函数Emb()进行向量化得到的各个词向量的序列距离度，Lois(vt,Stryset(i))序列距离度的计算公式为：

进而根据Lois(vt,Stryset(i))的公式分别计算vt与Stryset中各个元素之间的序列距离度，记vt与Stryset中序号为i的元素的序列距离度为Lois_i，将vt与Stryset中n个元素之间的序列距离度作为集合Loiset，Loiset＝{Lois_1,Lois_2,…,Lois_(n-1),Lois_n}。

进一步地，在S600中，通过计算集合Loiset的平均值筛选出Stryset中序列距离度小于Loiset的平均值的多个字符串数组，将筛选所得的多个字符串数组进行字符串拼接并在创建的文本文件保存的方法为：计算得到集合Loiset中各元素的算术平均值记为Lois_avg,筛选出Stryset中序列距离度小于Lois_avg的多个字符串数组作为集合Sline，将集合Sline中的多个字符串数组进行字符串拼接并在创建的文本文件保存。

本公开还提供了一种智能语义分析系统，所述一种智能语义分析系统包括：处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1中的一种智能语义分析方法中的步骤，所述一种智能语义分析系统可以运行于桌上型计算机、笔记本、移动电话、手提电话、平板电脑、掌上电脑及云端数据中心等计算设备中，可运行的系统可包括，但不仅限于，处理器、存储器、服务器集群，所述处理器执行所述计算机程序运行在以下系统的单元中：

识别输入单元，用于将输入视频利用语音识别技术得到视频中的音频信号的文本的字符串Line并利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记作为集合Scnset；

主题词提取单元，用于在字符串Line中提取出主题词Key；

时间标识切分单元，用于利用集合Scnset将字符串Line切分成多个字符并将所得多个字符作为集合Tokset；

切词分组单元，用于通过中文切词算法将集合Tokset中各元素进行切分得到多个字符串数组进而将切分得到的多个字符串数组作为集合Stryset；

序列距离度计算单元，用于计算主题词Key在Stryset各元素中的序列距离度作为集合Loiset；

筛选保存单元，用于通过计算集合Loiset的平均值筛选出Stryset中序列距离度小于Loiset的平均值的多个字符串数组并将筛选所得的多个字符串数组进行字符串拼接并在创建的文本文件保存。

本发明的有益效果为：本发明提供了一种智能语义分析方法及系统，通过使用语音识别技术将视频中的音频信号转化为文字化表述的字符串数据，利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记，计算序列距离度筛选出序列距离度小于平均值的多个字符串数组进行字符串拼接并在创建的文本文件保存，从而达到根据视频的音频识别得到字符文本进而对字符文本进行切分筛选精简出关键部分的效果。

附图说明

通过对结合附图所示出的实施方式进行详细说明，本公开的上述以及其他特征将更加明显，本公开附图中相同的参考标号表示相同或相似的元素，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，在附图中：

图1所示为一种智能语义分析方法的流程图；

图2所示为一种智能语义分析系统的系统结构图。

具体实施方式

以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述，以充分地理解本公开的目的、方案和效果。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

如图1所示为根据本发明的一种智能语义分析方法的流程图，下面结合图1来阐述根据本发明的实施方式的一种智能语义分析方法及系统。

本公开提出一种智能语义分析方法，所述方法具体包括以下步骤：

其中，语音识别技术至少包括模式匹配法、隐马尔可夫模型(HMM)、矢量量化法、ANN/HMM法或FSVQ/HMM法中任意一种。

其中，视频目标追踪技术至少包括质心跟踪算法(Centroid)、多目标跟踪算法(MTT)、相关跟踪算法(Correlation)、边缘跟踪算法(Edge)、相位相关跟踪算法(PhaseCorrelation)，场景锁定算法(SceneLock)和组合(Combined)跟踪算法中任意一种。

S200，在字符串Line中提取出主题词Key；

S300，利用集合Scnset将字符串Line切分成多个字符，将所得多个字符作为集合Tokset；

S400，通过中文切词算法将集合Tokset中各元素进行切分得到多个字符串数组，将切分

得到的多个字符串数组作为集合Stryset；

所述一种智能语义分析系统包括：处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种智能语义分析方法实施例中的步骤，所述一种智能语义分析系统可以运行于桌上型计算机、笔记本、掌上电脑及云端数据中心等计算设备中，可运行的系统可包括，但不仅限于，处理器、存储器、服务器集群。

本公开的实施例提供的一种智能语义分析系统，如图2所示，该实施例的一种智能语义分析系统包括：处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种智能语义分析方法实施例中的步骤，所述处理器执行所述计算机程序运行在以下系统的单元中：

主题词提取单元，用于在字符串Line中提取出主题词Key；

时间标识切分单元，用于将字符串Line利用集合Scnset切分成多个字符并将所得多个字符作为集合Tokset；

切词分组单元，用于将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组进而将切分得到的多个字符串数组作为集合Stryset；

所述一种智能语义分析系统可以运行于桌上型计算机、笔记本、掌上电脑及云端数据中心等计算设备中。所述一种智能语义分析系统包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，所述例子仅仅是一种智能语义分析方法及系统的示例，并不构成对一种智能语义分析方法及系统的限定，可以包括比例子更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述一种智能语义分析系统还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立元器件门电路或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述一种智能语义分析系统的控制中心，利用各种接口和线路连接整个一种智能语义分析系统的各个分区域。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述一种智能语义分析方法及系统的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本发明提供了一种智能语义分析方法及系统，通过用户在客户端输入的关键字符串和将文件通过文字识别得到的字符串数据集合，利用分词算法进行切分，求得关键字符串和字符串数据集合的距离度，进而根据距离度计算选取出连接序列，通过云服务器将连接序列发送到客户端，实现到对大规模纸质文件的高效率信息处理，达到对大规模纸质文件的根据主题相关度的智能推荐排序进行在客户端的显示。

尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述，但其并非旨在局限于任何这些细节或实施例或任何特殊实施例，从而有效地涵盖本公开的预定范围。此外，上文以发明人可预见的实施例对本公开进行描述，其目的是为了提供有用的描述，而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims

1.一种智能语义分析方法，其特征在于，所述方法包括以下步骤：

S200，在字符串Line中提取出主题词Key；

S300，将字符串Line利用集合Scnset切分成多个字符，将所得多个字符作为集合Tokset；

S400，将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组，将切分得到的多个字符串数组作为集合Stryset；

2.根据权利要求1所述的一种智能语义分析方法，其特征在于，在S100中，输入视频，利用语音识别技术得到视频中的音频信号的文本的字符串Line，利用视频目标追踪技术划分视频的不同场景得到区分多个不同场景的多个时间标记作为集合Scnset的方法为：输入视频，利用语音识别技术得到视频中的音频的文字化表述的字符串Line，并记录字符串Line中各字符在视频中的采集时间的时间标记作为序列Temp，利用视频目标追踪技术分类视频的不同场景得到多个不同场景的多个时间标记作为集合Scnset。

3.根据权利要求1所述的一种智能语义分析方法，其特征在于，在S200中，在字符串Line中提取出主题词Key的方法为：将字符串Line通过中文切词算法和TF-IDF算法从中提取得到主题词Key。

4.根据权利要求2所述的一种智能语义分析方法，其特征在于，在S300中，将字符串Line利用集合Scnset切分成多个字符，将所得多个字符作为集合Tokset的方法为：把字符串Line根据序列Temp中各字符在视频中的采集时间的时间标记通过集合Scnset中区分多个不同场景的多个时间标记进行切分，将切分得到的多个字符串数组作为集合Stryset。

5.根据权利要求4所述的一种智能语义分析方法，其特征在于，在S400中，将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组，将切分得到的多个字符串数组作为集合Stryset的方法为：将集合Tokset中各元素通过中文切词算法进行切分得到多个字符串数组，将切分得到的多个字符串数组作为集合Stryset。

6.根据权利要求5所述的一种智能语义分析方法，其特征在于，在S500中，计算主题词Key在Stryset各元素中的序列距离度作为集合Loiset的方法为：计算主题词Key在Stryset各元素中的多个连接序列的具体方法为，记集合Stryset各元素的数量为n，变量i为集合Stryset中元素的序号，i∈[1,n]，字符串数组Stryset(i)表示集合Stryset中序号为i的元素，记变量j表示字符串数组Stryset(i)中字符串的序号，m为字符串数组Stryset(i)中包含的字符串的数量，word(i,j)表示集合Stryset中序号为i的元素Stryset(i)中的序号为j的字符串，记函数Emb()为通过词向量方法将输入的字符串进行向量化得到词向量的函数，通过函数Emb()所得的词向量的维度均相同，记通过函数Emb()所得的词向量的维度为k，变量t表示通过函数Emb()所得的词向量的第t维的序号，t∈[1,k]，则Emb(Key)表示通过词向量方法将Key进行向量化得到的词向量，记vt即表示Emb(Key),Emb(word(i,j))表示通过词向量方法将word(i,j)进行向量化得到的词向量，记emw即表示Emb(word(i,j))，emt[t]表示Emb(Key)的第t维数值，emw[t]表示Emb(word(i,j))的第t维数值，记词向量Emb(Key)与Emb(word(i,j))之间的距离度为ρ(i,j)，计算词向量Emb(Key)与Emb(word(i,j))之间的距离度ρ(i,j)的公式为：

7.根据权利要求6所述的一种智能语义分析方法，其特征在于，在S600中，通过计算集合Loiset的平均值筛选出Stryset中序列距离度小于Loiset的平均值的多个字符串数组，将筛选所得的多个字符串数组进行字符串拼接并在创建的文本文件保存的方法为：计算得到集合Loiset中各元素的算术平均值记为Lois_avg,筛选出Stryset中序列距离度小于Lois_avg的多个字符串数组作为集合Sline，将集合Sline中的多个字符串数组进行字符串拼接并在创建的文本文件保存。

8.一种智能语义分析系统，其特征在于，所述一种智能语义分析系统包括：处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1中的一种智能语义分析方法中的步骤，所述一种智能语义分析系统可以运行于桌上型计算机、笔记本、移动电话、掌上电脑及云端数据中心等计算设备中，可运行的系统可包括处理器、存储器、服务器集群。