CN113077792B - 佛学主题词识别方法、装置、设备及存储介质 - Google Patents
佛学主题词识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113077792B CN113077792B CN202110311416.5A CN202110311416A CN113077792B CN 113077792 B CN113077792 B CN 113077792B CN 202110311416 A CN202110311416 A CN 202110311416A CN 113077792 B CN113077792 B CN 113077792B
- Authority
- CN
- China
- Prior art keywords
- word
- subject
- recognition
- voice
- buddha
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 244000179970 Monarda didyma Species 0.000 claims abstract description 65
- 235000010672 Monarda didyma Nutrition 0.000 claims abstract description 65
- 230000011218 segmentation Effects 0.000 claims abstract description 57
- 238000001914 filtration Methods 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000002372 labelling Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及人工智能领域,公开了一种佛学主题词识别方法、装置、设备及存储介质,该方法包括:通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的主题词更具精准性。此外,本发明还涉及区块链技术,佛学内容和主题词可存储于区块链中。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种佛学主题词识别方法、装置、设备及存储介质。
背景技术
佛经是一种特殊的文体,具备古汉语、文言文及梵文转译的特点,佛学领域的信众在阅读过程中存在难以发现主题词等问题,而在现有自然语言处理相关技术中,没有能够识别佛经体裁文本单元(卷/篇)主题词的实现方案。
在现有技术中,对于主题词的识别主要是基于各种主题词识别模型,从模型识别的角度上解决主题词识别问题,而没有从其他角度考虑主题词的识别问题,也没有将主题词的识别技术引入到佛学领域,佛学领域的信众在进行佛经阅读时对于主题词的识别问题需待解决。
发明内容
本发明的主要目的在于通过语音识别技术与主题词识别模型相结合的方式解决佛学主题词的识别问题。
本发明第一方面提供了一种佛学主题词识别方法,包括:
获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
对所述诵读语音进行语音识别,得到至少一个第二主题词;
基于所述第一主题词和所述第二主题词,创建主题词备选集;
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
可选的,在本发明第一方面的第一种实现方式中,所述根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词包括:
根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;
利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;
基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词。
可选的,在本发明第一方面的第二种实现方式中,所述对所述诵读语音进行语音识别,得到至少一个第二主题词包括:
对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;
根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;
基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词。
可选的,在本发明第一方面的第三种实现方式中,所述基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量包括:
对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;
利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;
将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;
基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量
可选的,在本发明第一方面的第四种实现方式中,所述将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果包括:
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用所述主题词识别模型中预设的语体属性划分工具,对所述主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将所述通用词汇添加到所述过滤词表中;
基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果。
可选的,在本发明第一方面的第五种实现方式中,所述基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果包括:
对非通用词汇进行分词处理,得到分词后的词汇;
基于所述主题词识别模型中预设的图排序模型算法,根据所述分词后的词汇,构建一个字与词的连接矩阵;
基于预设的字与词的权重,对所述字与词的连接矩阵中的字与词进行权值计算,得到一个权值排序;
基于所述权值排序,进行主题词识别,得到识别结果。
可选的,在本发明第一方面的第六种实现方式中,在所述预设一个过滤词表,将所述主题词备选集和所述过滤词表输入至预设的主题词识别模型进行主题词识别处理,生成最终的主题词之前,还包括:
获取通用词汇,并基于所述通用词汇创建过滤词表;
从预设的历史文本中获取相应的文本内容和主题词数据;
将所述过滤词表、所述文本内容和所述主题词数据作为训练语料,对主题词识别工具进行训练,得到主题词识别模型。
本发明第二方面提供了一种佛学主题词识别装置,包括:
获取模块,用于获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
分词识别模块,用于根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
语音识别模块,用于对所述诵读语音进行语音识别,得到至少一个第二主题词;
主题词备选集创建模块,用于基于所述第一主题词和所述第二主题词,创建主题词备选集;
主题词识别模块,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
主题词输出模块,用于若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。。
可选的,在本发明第二方面的第一种实现方式中,所述分词识别模块具体用于:
根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;
利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;
基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词。
可选的,在本发明第二方面的第二种实现方式中,所述语音识别模块包括:
语音波形生成单元,用于对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;
语调特征确定单元,用于根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
语调变化特征量确定单元,用于基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;
主题词生成单元,用于基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词。
可选的,在本发明第二方面的第三种实现方式中,所述语调变化特征量确定单元具体用于:
对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;
利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;
将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;
基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量。
可选的,在本发明第二方面的第四种实现方式中,所述主题词识别模块包括:
语体属性划分单元,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用所述主题词识别模型中预设的语体属性划分工具,对所述主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将所述通用词汇添加到所述过滤词表中;
主题词识别单元,用于基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果。
可选的,在本发明第二方面的第五种实现方式中,所述主题词识别单元具体用于:
对非通用词汇进行分词处理,得到分词后的词汇;
基于所述主题词识别模型中预设的图排序模型算法,根据所述分词后的词汇,构建一个字与词的连接矩阵;
基于预设的字与词的权重,对所述字与词的连接矩阵中的字与词进行权值计算,得到一个权值排序;
基于所述权值排序,进行主题词识别,得到识别结果。
可选的,在本发明第二方面的第六种实现方式中,所述佛学主题词识别装置还包括模型训练模块,所述模型训练模块具体用于:
获取通用词汇,并基于所述通用词汇创建过滤词表;
从预设的历史文本中获取相应的文本内容和主题词数据;
将所述过滤词表、所述文本内容和所述主题词数据作为训练语料,对主题词识别工具进行训练,得到主题词识别模型。
本发明第三方面提供了一种佛学主题词识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛学主题词识别设备执行上述的佛学主题词识别方法的步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的佛学主题词识别方法的步骤。
本发明提供的技术方案中,通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明提供的技术方案从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的主题词更具精准性。
附图说明
图1为本发明实施例中佛学主题词识别方法的第一个实施例示意图;
图2为本发明实施例中佛学主题词识别方法的第二个实施例示意图;
图3为本发明实施例中佛学主题词识别方法的第三个实施例示意图;
图4为本发明实施例中佛学主题词识别方法的第四个实施例示意图;
图5为本发明实施例中佛学主题词识别装置的一个实施例示意图;
图6为本发明实施例中佛学主题词识别装置的另一个实施例示意图;
图7为本发明实施例中佛学主题词识别设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种佛学主题词识别方法、装置、设备及存储介质,通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明实施例从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的佛学主题词更具精准性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中佛学主题词识别方法的第一个实施例包括:
101,获取待识别的佛经内容,并基于选择的人物语音样本将佛经内容转换为诵读语音;
获取到需要进行主题词识别的佛经内容,并选择一个人物语音样本,根据所选择的人物语音样本中所对应的人物对佛经内容进行诵读,从而得到诵读语音。
人物语音样本是从预设的人物语音样本库中选择的,预设的人物语音样本库中包含有至少一个人物语音样本,一个人物语音样本对应一个人物。
102,根据预设的佛学知识图谱,对佛经内容分词识别,得到至少一个第一主题词;
根据预设的佛学知识图谱利用字符串匹配,对佛经内容进行分词处理,得到分词后的文本数据,再利用词频计算工具,对分词后的文本数据中的词语进行词频统计计算,得到一个词频排序,根据词频排序,从排序靠前的各词语中筛选得到至少一个主题词作为第一主题词。
其中,在分词处理的过程中可以采用不同的分词算法进行分词处理,例如基于词典的规则匹配方法,基于统计的机器学习方法等。基于词典的分词算法,本质上就是字符串匹配。将待匹配的字符串基于一定的算法策略,和一个足够大的词典利用字符串匹配,如果匹配命中,则可以分词。基于统计的分词算法,本质上是一个序列标注问题。我们将语句中的字,按照他们在词中的位置进行标注。标注主要有:B(词开始的一个字),E(词最后一个字),M(词中间的字,可能多个),S(一个字表示的词)。然后基于统计分析方法,得到序列标注结果,就可以得到分词结果了。
另外在对佛经内容进行主题词的提取过程中,还可以利用自然语言处理技术中对于主题词提取的相关算法对文本中的主题词进行提取,例如基于统计特征的主题词提取(TF,TF-IDF),基于词图模型的主题词提取(PageRank,TextRank);基于主题模型的主题词提取(LDA)等无监督式的主题词提取算法,利用主题词提取算法对文本中的主题词进行提取属于现有技术,故此不再赘述。
103,对诵读语音进行语音识别,得到至少一个第二主题词;
将获取到的诵读语音进行语音识别,经语音识别后可以得到与诵读语音相对应的语音波形,然后根据语音波形,可以确定诵读语音中各个字符的语调特征,根据诵读语音所对应的人物原有的各个字符的发音特征,从而确定诵读语音中各个字符的语调变化特征量,根据语调变化特征量与佛经原文的对应关系,从而可以得到至少一个主题词作为第二主题词。
其中,语音识别可以通过语音识别技术进行实现,利用声学模型将诵读语音转化成为对应的语音波形,语音波形能够反映各个字符对应的语调特征,利用诵读语音中的语调特征和人物在诵读时原有的发音特征进行比对,从而可以确定诵读语音中各个字符的语调变化量。其中,利用语音识别技术,对语音进行识别属于现有技术,故此不再赘述。
104,基于第一主题词和第二主题词,创建主题词备选集;
将得到的第一主题词和第二主题词进行汇总合并,从而可以创建出一个主题词备选集,由于主题词备选集经由第一主题词和第二主题词合并而来,所以主题词备选集包含有至少两个主题词。
105,将主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过主题词识别模型对主题词备选集进行主题词的识别处理,得到识别结果;
将主题词备选集和预设的过滤词表输入到主题词识别模型中,其中过滤词表里的词语是通用词汇,且过滤词表包含有至少一个通用词汇,主题词识别模型利用过滤词表将主题词备选集划分为非通用词汇和通用词汇,通过了主题词识别模型的为非通用词汇,未通过主题词识别模型的为通用词汇,所以主题词识别模型进行主题词的识别处理所得到的识别结果为非通用词汇。
在主题词识别模型对于主题词的识别过程中,可以将未通过模型的通用词汇合并到过滤词表中用于提高模型的精度,同时模型对主题词的识别的步骤可以多次进行,用以提高主题词的精准度。
106,若识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
利用佛学主题词组合规则对主题词识别模型输出的识别结果进行检验比对,如果识别结果中的词语满足于佛学主题词组合规则,则可以将该词语作为最终的主题词进行输出,如果识别结果中的词语不满足于佛学主题词组合规则,则将该词语作为通用词汇,合并到过滤词表中。
本发明实施例中,通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明实施例从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的佛学主题词更具精准性。
请参阅图2,本发明实施例中佛学主题词识别方法的第二个实施例包括:
201,获取待识别的佛经内容,并基于选择的人物语音样本将佛经内容转换为诵读语音;
获取到需要进行主题词识别的佛经内容,并选择一个人物语音样本,根据所选择的人物语音样本中所对应的人物对佛经内容进行诵读,从而得到诵读语音。
202,根据预设的佛学知识图谱,对佛经内容进行分词识别,得到分词后的文本数据;
根据预设的佛学知识图谱利用字符串匹配,对佛经内容进行分词处理,得到分词后的数据。
在分词处理的过程中可以采用不同的分词算法进行分词处理,例如基于词典的规则匹配方法,基于统计的机器学习方法等。
基于词典的分词算法,本质上就是字符串匹配。将待匹配的字符串基于一定的算法策略,和一个足够大的词典利用字符串匹配,如果匹配命中,则可以分词。根据不同的匹配策略,又分为正向最大匹配法,逆向最大匹配法,双向匹配分词,全切分路径选择等。正向最大匹配法,从左到右对语句进行匹配,匹配的词越长越好;逆向最大匹配法,从右到左对语句进行匹配,同样也是匹配的词越长越好;双向匹配分词,则同时采用正向最大匹配和逆向最大匹配,选择二者分词结果中词数较少者;全切分路径选择,将所有可能的切分结果全部列出来,从中选择最佳的切分路径。
基于统计的分词算法,本质上是一个序列标注问题。我们将语句中的字,按照他们在词中的位置进行标注。标注主要有:B(词开始的一个字),E(词最后一个字),M(词中间的字,可能多个),S(一个字表示的词)。然后基于统计分析方法,得到序列标注结果,就可以得到分词结果了。
203,利用预设的词频计算工具,对分词后的文本数据中的词语进行词频统计计算,得到词频排序;
对分词后的数据中的词语利用词频统计工具进行词频的统计计算,从而得到一个词频排序,在此过程中,利用词频统计工具对词频进行计算主要是利用词频统计算法,统计该词语在数据文本中出现的频率。
字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降,在一份给定的文件里,词频指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件,同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否。
204,基于词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词;
根据词频统计得到的词频排序,选择排序中靠前的词语进行主题词识别,此步骤中的主题词识别主要是对这些词语的词性进行识别,将一些通用词汇进行过滤,得到至少一个第一主题词。
205,对诵读语音进行语音识别,得到至少一个第二主题词;
将获取到的诵读语音进行语音识别,经语音识别后可以得到与诵读语音相对应的语音波形,然后根据语音波形,可以确定诵读语音中各个字符的语调特征,根据诵读语音所对应的人物原有的各个字符的发音特征,从而确定诵读语音中各个字符的语调变化特征量,根据语调变化特征量与佛经原文的对应关系,从而可以得到至少一个主题词作为第二主题词。
206,基于第一主题词和第二主题词,创建主题词备选集;
将得到的第一主题词和第二主题词进行汇总合并,从而可以创建出一个主题词备选集,由于主题词备选集经由第一主题词和第二主题词合并而来,所以主题词备选集包含有至少两个主题词。
207,将主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过主题词识别模型对主题词备选集进行主题词的识别处理,得到识别结果;
将主题词备选集和预设的过滤词表输入到主题词识别模型中,其中过滤词表里的词语是通用词汇,且过滤词表包含有至少一个通用词汇,主题词识别模型利用过滤词表将主题词备选集划分为非通用词汇和通用词汇,通过了主题词识别模型的为非通用词汇,未通过主题词识别模型的为通用词汇,所以主题词识别模型进行主题词的识别处理所得到的识别结果为非通用词汇。
208,若识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
利用佛学主题词组合规则对主题词识别模型输出的识别结果进行检验比对,如果识别结果中的词语满足于佛学主题词组合规则,则可以将该词语作为最终的主题词进行输出,如果识别结果中的词语不满足于佛学主题词组合规则,则将该词语作为通用词汇,合并到过滤词表中。
本发明实施例中,通过对佛经内容进行分词识别,利用词频计算工具计算词频,从而识别出主题词,并与诵读语音中语音识别出的主题词汇集成主题词备选集,再利用主题词识别模型对主题词备选集进行主题词识别,得到最终的主题词;本发明实施例利用主题词识别模型对佛经内容识别出的主题词和诵读语音中语音识别出来的主题词进行主题词筛选,提高了主题词识别的精准度,并且满足了用户所需。
请参阅图3,本发明实施例中佛学主题词识别方法的第三个实施例包括:
301,获取待识别的佛经内容,并基于选择的人物语音样本将佛经内容转换为诵读语音;
获取到需要进行主题词识别的佛经内容,并选择一个人物语音样本,根据所选择的人物语音样本中所对应的人物对佛经内容进行诵读,从而得到诵读语音。
302,根据预设的佛学知识图谱,对佛经内容分词识别,得到至少一个第一主题词;
根据预设的佛学知识图谱利用字符串匹配,对佛经内容进行分词处理,得到分词后的文本数据,再利用词频计算工具,对分词后的文本数据中的词语进行词频统计计算,得到一个词频排序,根据词频排序,从排序靠前的各词语中筛选得到至少一个主题词作为第一主题词。
303,对诵读语音进行语音识别,得到与诵读语音相对应的语音波形;
将获取到的诵读语音利用语音识别技术进行语音识别,利用声学模型将诵读语音转化成为对应的语音波形。
304,根据语音波形,确定诵读语音中各个字符的语调特征,其中各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
从语音波形中利用傅里叶变换确定诵读语音中各个字符所包含的各个音素的频谱特征,进而每一字符所包括音素的频谱特征的综合频谱可以用来表征该字符的语调特征。音素是构成音节的最小单位或最小的语音片段,是从音质的角度划分出来的最小的线性的语音单位。在语音学与音韵学中,音素一词所指的是说话时所发出的声音。例如,对于汉语的音素而言,音节只是最自然的语音单位,而音素是最小的语音单位,音素包括10个元音,22个辅音,总共有32个;一个音节,至少有一个音素,至多有四个音素。如“普通话”,由三个音节组成,可以分析成“p,u,t,o,ng,h,u,a”八个音素。其中,从语音波形中确定佛经内容中各个字符所包含的各个音素的频谱特征可以通过现有技术进行实现,此处不再赘述。
305,基于语调特征,确定诵读语音中各个字符的语调变化特征量;
在确定出诵读语音中各个字符的语调特征后,可以基于预先确定出的该诵读语音对应的人物的发音特征和该语调特征,确定各个字符的语调特征变化量。其中,该发音特征通过所统计出的预定的音素的频谱特征来表征。可以理解的是,诵读语音中的任意一个字符的语调特征变化量的确定方式可以包括:确定该字符所包括的至少一个音素,并确定与该至少一个音素分别相同的预定的音素的频谱特征,进而构成该字符所对应的基于该人物的发音特征所确定出的语调特征,最终将该字符所对应的基于目标人物的发音特征所确定出的语调特征和之前基于原语音波形所确定出的相应字符的语调特征进行比对,确定出该字符的语调特征变化量。
306,基于预设的各字符的语调变化特征量与佛经内容的映射关系,根据各个字符的语调变化特征量,从佛经内容中查找到至少一个第二主题词。
基于预设的各字符的语调变化特征量与佛经内容的映射关系,根据各个字符的语调变化特征量,从佛经内容中找到相对应的各个字符,从而得到至少一个主题词作为第二主题词。
307,基于第一主题词和第二主题词,创建主题词备选集;
将得到的第一主题词和第二主题词进行汇总合并,从而可以创建出一个主题词备选集,由于主题词备选集经由第一主题词和第二主题词合并而来,所以主题词备选集包含有至少两个主题词。
308,将主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过主题词识别模型对主题词备选集进行主题词的识别处理,得到识别结果;
将主题词备选集和预设的过滤词表输入到主题词识别模型中,其中过滤词表里的词语是通用词汇,且过滤词表包含有至少一个通用词汇,主题词识别模型利用过滤词表将主题词备选集划分为非通用词汇和通用词汇,通过了主题词识别模型的为非通用词汇,未通过主题词识别模型的为通用词汇,所以主题词识别模型进行主题词的识别处理所得到的识别结果为非通用词汇。
309,若识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
利用佛学主题词组合规则对主题词识别模型输出的识别结果进行检验比对,如果识别结果中的词语满足于佛学主题词组合规则,则可以将该词语作为最终的主题词进行输出,如果识别结果中的词语不满足于佛学主题词组合规则,则将该词语作为通用词汇,合并到过滤词表中。
本发明实施例中,通过对诵读语音进行语音识别得到的语调变化,确定语音波形,再根据语音波形识别出语调特征和语调变化特征量,从而根据语调变化特征量识别出相关主题词,并与佛经内容中识别出的主题词构成主题词备选集,将主题词备选集输入至主题词识别模型中进行主题词的识别得到最终的主题词;本发明实施例从通过语音识别的维度上,解决了主题词的识别问题,并结合了主题词识别模型,对主题词进行再次识别,提高了主题词识别的精准性。
请参阅图4,本发明实施例中佛学主题词识别方法的第四个实施例包括:
401,获取待识别的佛经内容,并基于选择的人物语音样本将佛经内容转换为诵读语音;
获取到需要进行主题词识别的佛经内容,并选择一个人物语音样本,根据所选择的人物语音样本中所对应的人物对佛经内容进行诵读,从而得到诵读语音。
402,根据预设的佛学知识图谱,对佛经内容分词识别,得到至少一个第一主题词;
根据预设的佛学知识图谱利用字符串匹配,对佛经内容进行分词处理,得到分词后的文本数据,再利用词频计算工具,对分词后的文本数据中的词语进行词频统计计算,得到一个词频排序,根据词频排序,从排序靠前的各词语中筛选得到至少一个主题词作为第一主题词。
403,对诵读语音进行语音识别,得到至少一个第二主题词;
将获取到的诵读语音进行语音识别,经语音识别后可以得到与诵读语音相对应的语音波形,然后根据语音波形,可以确定诵读语音中各个字符的语调特征,根据诵读语音所对应的人物原有的各个字符的发音特征,从而确定诵读语音中各个字符的语调变化特征量,根据语调变化特征量与佛经原文的对应关系,从而可以得到至少一个主题词作为第二主题词。
404,基于第一主题词和第二主题词,创建主题词备选集;
将得到的第一主题词和第二主题词进行汇总合并,从而可以创建出一个主题词备选集,由于主题词备选集经由第一主题词和第二主题词合并而来,所以主题词备选集包含有至少两个主题词。
405,将主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用主题词识别模型中预设的语体属性划分工具,对主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将通用词汇添加到过滤词表中;
将主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,该主题词识别模型可以根据语体属性划分规则,利用模型中预设的语体属性划分工具对主题词备选集进行语体属性划分,从而可以得到非通用词汇和通用词汇,得到的通用词汇可以添加到过滤词表中,供主题词识别模型使用。
406,基于主题词识别模型,对非通用词汇进行主题词识别,得到识别结果;
在得到非通用词汇之后,可以对非通用词汇进行主题词识别,在此过程中的主题词识别主要是针对各个词汇的词性进行识别和筛选,从而得到识别结果。
407,若识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
利用佛学主题词组合规则对主题词识别模型输出的识别结果进行检验比对,如果识别结果中的词语满足于佛学主题词组合规则,则可以将该词语作为最终的主题词进行输出,如果识别结果中的词语不满足于佛学主题词组合规则,则将该词语作为通用词汇,合并到过滤词表中。
本发明实施例中,通过对佛经内容和诵读语音进行主题词识别,得到相关的主题词,并创建主题词备选集,通过主题词识别模型对主题词备选集进行主题词识别,得到过滤词和最终的主题词;本发明实施例将没有通过主题词识别模型的过滤词汇集到预设的过滤词表中,在主题词识别模型使用过滤词表和主题词备选集对主题词进行识别的过程中,提高了模型识别的精度,使得识别出来的主题词更精准。
上面对本发明实施例中佛学主题词识别方法进行了描述,下面对本发明实施例中佛学主题词识别装置进行描述,请参阅图5,本发明实施例中佛学主题词识别装置一个实施例包括:
获取模块501,用于获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
分词识别模块502,用于根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
语音识别模块503,用于对所述诵读语音进行语音识别,得到至少一个第二主题词;
主题词备选集创建模块504,用于基于所述第一主题词和所述第二主题词,创建主题词备选集;
主题词识别模块505,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
主题词输出模块506,用于若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
本发明实施例中,通过上述装置的实施,对佛经内容进行分词识别,对诵读语音进行语音识别得到相关主题词,并构建主题词备选集,经由装置上的主题词识别模型进行主题词识别,得到最终主题词;从语音识别维度和模型识别维度上实现了对于佛学主题词的提取,同时还保证了佛学主题词提取的精准度,满足了用户的需求。
请参阅图6,本发明实施例中佛学主题词识别装置的另一个实施例包括:
获取模块501,用于获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
分词识别模块502,用于根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
语音识别模块503,用于对所述诵读语音进行语音识别,得到至少一个第二主题词;
主题词备选集创建模块504,用于基于所述第一主题词和所述第二主题词,创建主题词备选集;
主题词识别模块505,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
主题词输出模块506,用于若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
在本实施例中,分词识别模块502具体用于:
根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;
利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;
基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词。
在本实施例中,语音识别模块503包括:
语音波形生成单元5031,用于对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;
语调特征确定单元5032,用于根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
语调变化特征量确定单元5033,用于基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;
主题词生成单元5034,用于基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词。
在本实施例中,语调变化特征量确定单元5033具体用于:
对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;
利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;
将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;
基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量。
在本实施例中,主题词识别模块505包括:
语体属性划分单元5051,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用所述主题词识别模型中预设的语体属性划分工具,对所述主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将所述通用词汇添加到所述过滤词表中;
主题词识别单元5052,用于基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果.
在本实施例中,主题词识别单元5052具体用于:
对非通用词汇进行分词处理,得到分词后的词汇;
基于所述主题词识别模型中预设的图排序模型算法,根据所述分词后的词汇,构建一个字与词的连接矩阵;
基于预设的字与词的权重,对所述字与词的连接矩阵中的字与词进行权值计算,得到一个权值排序;
基于所述权值排序,进行主题词识别,得到识别结果。
可选的,模型训练模块507具体用于:
获取通用词汇,并基于所述通用词汇创建过滤词表;
从预设的历史文本中获取相应的文本内容和主题词数据;
将所述过滤词表、所述文本内容和所述主题词数据作为训练语料,对主题词识别工具进行训练,得到主题词识别模型。
本发明实施例中,通过上述装置的实施,能够对佛经内容进行分词识别,和对诵读语音进行识别,得到主题词构建主题词备选集,然后经由装置上的主题词识别模型对主题词备选集进行主题词识别,得到最终的主题词;在本实施例中的佛学主题词识别装置还设置了模型训练模块,对主题词识别模型能进行训练,从而提高了模型精度,保证了识别出来的主题词更具精准性。
上面图5和图6从模块化功能实体的角度对本发明实施例中的佛学主题词识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中佛学主题词识别设备进行详细描述。
图7是本发明实施例提供的一种佛学主题词识别设备的结构示意图,该佛学主题词识别设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对佛学主题词识别设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在佛学主题词识别设备700上执行存储介质730中的一系列指令操作。
佛学主题词识别设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的佛学主题词识别设备结构并不构成对佛学主题词识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述佛学主题词识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种佛学主题词识别方法,其特征在于,所述佛学主题词识别方法包括:
获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
所述根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词包括:
根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;
利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;
基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词;
对所述诵读语音进行语音识别,得到至少一个第二主题词;
所述对所述诵读语音进行语音识别,得到至少一个第二主题词包括:
对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;
根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;
基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词;
基于所述第一主题词和所述第二主题词,创建主题词备选集;
获取通用词汇,并基于所述通用词汇创建过滤词表;
从预设的历史文本中获取相应的文本内容和主题词数据;
将所述过滤词表、所述文本内容和所述主题词数据作为训练语料,对主题词识别工具进行训练,得到主题词识别模型;
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
2.根据权利要求1所述的佛学主题词识别方法,其特征在于,所述基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量包括:
对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;
利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;
将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;
基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量。
3.根据权利要求1或2所述的佛学主题词识别方法,其特征在于,所述将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果包括:
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用所述主题词识别模型中预设的语体属性划分工具,对所述主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将所述通用词汇添加到所述过滤词表中;
基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果。
4.根据权利要求3中所述的佛学主题词识别方法,其特征在于,所述基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果包括:
对非通用词汇进行分词处理,得到分词后的词汇;
基于所述主题词识别模型中预设的图排序模型算法,根据所述分词后的词汇,构建一个字与词的连接矩阵;
基于预设的字与词的权重,对所述字与词的连接矩阵中的字与词进行权值计算,得到一个权值排序;
基于所述权值排序,进行主题词识别,得到识别结果。
5.一种佛学主题词识别装置,执行如权利要求1所述的佛学主题词识别方法,其特征在于,所述佛学主题词识别装置包括:
获取模块,用于获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
分词识别模块,用于根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
语音识别模块,用于对所述诵读语音进行语音识别,得到至少一个第二主题词;
主题词备选集创建模块,用于基于所述第一主题词和所述第二主题词,创建主题词备选集;
主题词识别模块,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
主题词输出模块,用于若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。
6.一种佛学主题词识别设备,其特征在于,所述佛学主题词识别设备包括:
存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛学主题词识别设备执行如权利要求1-4中任一项所述的佛学主题词识别方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-4中任一项所述的佛学主题词识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311416.5A CN113077792B (zh) | 2021-03-24 | 2021-03-24 | 佛学主题词识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311416.5A CN113077792B (zh) | 2021-03-24 | 2021-03-24 | 佛学主题词识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113077792A CN113077792A (zh) | 2021-07-06 |
CN113077792B true CN113077792B (zh) | 2024-03-05 |
Family
ID=76613840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110311416.5A Active CN113077792B (zh) | 2021-03-24 | 2021-03-24 | 佛学主题词识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113077792B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1512402A (zh) * | 2002-12-31 | 2004-07-14 | 程松林 | 一种语音检索方法及采用该方法的音像信息检索系统 |
JP2013029652A (ja) * | 2011-07-28 | 2013-02-07 | Nippon Hoso Kyokai <Nhk> | 音声認識装置および音声認識プログラム |
CN106328147A (zh) * | 2016-08-31 | 2017-01-11 | 中国科学技术大学 | 语音识别方法和装置 |
CN108538286A (zh) * | 2017-03-02 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法以及计算机 |
CN110457711A (zh) * | 2019-08-20 | 2019-11-15 | 电子科技大学 | 一种基于主题词的社交媒体事件主题识别方法 |
CN111831785A (zh) * | 2020-07-16 | 2020-10-27 | 平安科技(深圳)有限公司 | 敏感词检测方法、装置、计算机设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9864741B2 (en) * | 2014-09-23 | 2018-01-09 | Prysm, Inc. | Automated collective term and phrase index |
CN107193973B (zh) * | 2017-05-25 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 语义解析信息的领域识别方法及装置、设备及可读介质 |
-
2021
- 2021-03-24 CN CN202110311416.5A patent/CN113077792B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1512402A (zh) * | 2002-12-31 | 2004-07-14 | 程松林 | 一种语音检索方法及采用该方法的音像信息检索系统 |
JP2013029652A (ja) * | 2011-07-28 | 2013-02-07 | Nippon Hoso Kyokai <Nhk> | 音声認識装置および音声認識プログラム |
CN106328147A (zh) * | 2016-08-31 | 2017-01-11 | 中国科学技术大学 | 语音识别方法和装置 |
CN108538286A (zh) * | 2017-03-02 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法以及计算机 |
CN110457711A (zh) * | 2019-08-20 | 2019-11-15 | 电子科技大学 | 一种基于主题词的社交媒体事件主题识别方法 |
CN111831785A (zh) * | 2020-07-16 | 2020-10-27 | 平安科技(深圳)有限公司 | 敏感词检测方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于中文文本主题提取的分词方法研究;唐培丽, 胡明, 张勇;吉林工程技术师范学院学报;20050225(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113077792A (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ali et al. | Automatic dialect detection in arabic broadcast speech | |
US8504367B2 (en) | Speech retrieval apparatus and speech retrieval method | |
JP5524138B2 (ja) | 同義語辞書生成装置、その方法、及びプログラム | |
Hanani et al. | Spoken Arabic dialect recognition using X-vectors | |
US10867525B1 (en) | Systems and methods for generating recitation items | |
KR20190059185A (ko) | 청각 장애 학생들을 위한 전문 자료 텍스트 분석 기반 음성인식 기술 정확도 향상 방법 및 시스템 | |
Nguyen et al. | A method for Vietnamese Text Normalization to improve the quality of speech synthesis | |
Orasan | A hybrid method for clause splitting in unrestricted English texts | |
CN113077792B (zh) | 佛学主题词识别方法、装置、设备及存储介质 | |
CN116052655A (zh) | 音频处理方法、装置、电子设备和可读存储介质 | |
Ghoshal et al. | Web-derived pronunciations | |
Park et al. | Jejueo datasets for machine translation and speech synthesis | |
CN112071304B (zh) | 一种语意分析方法及装置 | |
Abu-Soud | ILATalk: a new multilingual text-to-speech synthesizer with machine learning | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
Penagarikano et al. | Semisupervised training of a fully bilingual ASR system for Basque and Spanish | |
Naser et al. | Birzeit Arabic dialect identification system for the 2018 VarDial challenge | |
JP4511274B2 (ja) | 音声データ検索装置 | |
KR101869016B1 (ko) | 등장인물 추출 방법 및 장치 | |
Samlowski | The syllable as a processing unit in speech production: evidence from frequency effects on coarticulation | |
Kozhirbayev et al. | Preliminary Tasks of Word Embeddings Comparison of Unaligned Audio and Text Data for the Kazakh Language | |
Olivo et al. | CRFPOST: Part-of-Speech Tagger for Filipino Texts using Conditional Random Fields | |
Phaiboon et al. | Isarn Dharma Alphabets lexicon for natural language processing | |
Li et al. | Analyzing speaker information in self-supervised models to improve unsupervised speech recognition | |
Donaj et al. | Manual sorting of numerals in an inflective language for language modelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |