CN112487804A - 一种基于语义上下文场景的中文小说语音合成系统 - Google Patents
一种基于语义上下文场景的中文小说语音合成系统 Download PDFInfo
- Publication number
- CN112487804A CN112487804A CN202011335771.8A CN202011335771A CN112487804A CN 112487804 A CN112487804 A CN 112487804A CN 202011335771 A CN202011335771 A CN 202011335771A CN 112487804 A CN112487804 A CN 112487804A
- Authority
- CN
- China
- Prior art keywords
- module
- character
- novel
- preset
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 16
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims abstract description 5
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000004075 alteration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L2013/083—Special characters, e.g. punctuation marks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于语义上下文场景的中文小说语音合成系统,包括文本扫描模块、电子稿导入模块、文字识别模块、文字提取模块、文字处理模块、特殊字符检索模块、总控模块与语音生成模块;所述文本扫描模块用于将纸质的小说文稿扫描为电子文稿,所述电子稿导入模块用于导入小说的电子文稿;所述文字识别模块用于对文本扫描模块扫描出的电子文稿和电子稿导入模块导入的电子稿进行文字识别;所述文字提取模块用于将文字识别模块识别出的小说文字内容提取出,发送到文字处理模块;所述文字处理模块对获取到的小说文字内容进行文字处理,所述文字处理的过程包括分词,词性标注。本发明能够更好的进行中文小说语音合成,更加值得推广使用。
Description
技术领域
本发明涉及语音合成领域,具体涉及一种基于语义上下文场景的中文小说语音合成系统。
背景技术
语音小说,顾名思义就是能发出声音的小说,引申为:一种既保留了内含丰富的小说情节、又通过播音员将文字通过语言表达出来形成有声的“读本”,然后配合后期的制作合成变成一部有丰富的感情又有美丽动听背景音乐的有声音的小说,在将文字小说转化为语音小说时需要使用到语音合成系统。
现有的语音合成系统,在将文字小说转化为语音小说时,其准确度不够好,容易导致语音小说出现较大歧义,并且转化语音小说的质量较差,给语音合成系统的使用带来了一定的影响,因此,提出一种基于语义上下文场景的中文小说语音合成系统。
发明内容
本发明所要解决的技术问题在于:如何解决现有的语音合成系统,在将文字小说转化为语音小说时,其准确度不够好,容易导致语音小说出现较大歧义,并且转化语音小说的质量较差,给语音合成系统的使用带来了一定的影响的问题,提供了一种基于语义上下文场景的中文小说语音合成系统。
本发明是通过以下技术方案解决上述技术问题的,本发明包括文本扫描模块、电子稿导入模块、文字识别模块、文字提取模块、文字处理模块、特殊字符检索模块、总控模块与语音生成模块;
所述文本扫描模块用于将纸质的小说文稿扫描为电子文稿,所述电子稿导入模块用于导入小说的电子文稿;
所述文字识别模块用于对文本扫描模块扫描出的电子文稿和电子稿导入模块导入的电子稿进行文字识别;
所述文字提取模块用于将文字识别模块识别出的小说文字内容提取出,发送到文字处理模块;
所述文字处理模块对获取到的小说文字内容进行文字处理,所述文字处理的过程包括分词,词性标注,韵律结构预测与多音字消岐,所述词性标注的内容包括名词、动词与形容词;
所述文字处理模块处理后的文字内容被发送到特征字符检索模块,进行特征内容的检索,检索完成后总控模块即控制语音生成模块将经过特殊字符检索后的小说文稿转化为语音内容;
所述语音内容被发送到评分模块进行人工评分,当评分符合标准时总控模模块即控制语音发送模块将小说语音发送出。
优选的,所述文字识别模块进行文字识别的具体过程如下:
步骤一:电子文稿中的每个字符标记为一个识别区域,将其放大预设倍数;
步骤二:通过ORC文字识别技术对放大后的识别区域进行识别,对同一个区域使用三种不同的预设放大倍数识别;
步骤三:当三种不同预设倍数放大识别后的文字有两次及以上相同时即进行下一识别区域的识别;
步骤四:当同一个区域使用三种不同的预设放大倍数识别的文字均不相同时,即将其标注为未识别字体采用人工识别。
优选的,所述特殊字符检索模块检索特殊字符的具体处理模块入下:
S1:特征内容包括预设语气词库与预设语气符号库;
S2:从小说文字内容检索出预设语气词库与预设语气符号库;
S3:当检索到预设语气词库与预设语气符号库内的内容时,对该内容进行重点标记;
所述预设语气词库与预设语气符号库内的预设语气词与预设语气符号均设置了预设读音。
优选的,所述词性标注的名词、动词与形容词均均预设对应的读音。
优选的,所述评分模块评分的具体过程如下:
步骤一:小说文字转化为语音内容之后将其发送到随机的x个评分人员的智能移动终端,x≥5;
步骤二:随机的x个评分人员每个人对听到的语音小说进行语气和上下文连贯性进行评分,得到x个评分K;
步骤三:通过公式K1+K2+K3……+Kx=K和得到总评分K和;
步骤四:再通过公式K和/x=K均得到平均分值K均;
步骤五:再计算出最大评分值Kmax与最小评分值Kmin之间的差值得到分值差Kk差;
步骤六:当平均分值K均大于预设值,且分值差Kk差小于预设值时即评分符合标准时;
步骤七:当平均分值K均小于预设值,分值差Kk差小于预设值时或平均分值K均大于预设值,分值差Kk差大于预设值时,即评分不符合标准。
优选的,当评分不符合标准时,评分不符合标准发送到总控模块,所述总控模块发出复核指令,复核指令被发送到文字处理模块,对小说文字重新进行文字处理。
本发明相比现有技术具有以下优点:该基于语义上下文场景的中文小说语音合成系统,通过在对小说文稿进行识别时,更加细致的处理,能够有效的避免文字识别出错导致的小说装换为语音内容后语义出现问题的状况发生,让该系统能够进行更加精准的语音识别,同时在语音识别后,设置了随机人员对小说内容进行试听处理,并进行评分,通过评分来判定被转为语音的小说是否合格,并在不合格时对小说进行重新处理来修正语音和上下文连续问题,该种设置能够让该系统合成的语音小说品质更高,让该系统更加值得推广使用。
附图说明
图1是本发明的系统框图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例提供一种技术方案:一种基于语义上下文场景的中文小说语音合成系统,包括文本扫描模块、电子稿导入模块、文字识别模块、文字提取模块、文字处理模块、特殊字符检索模块、总控模块与语音生成模块;
所述文本扫描模块用于将纸质的小说文稿扫描为电子文稿,所述电子稿导入模块用于导入小说的电子文稿;
所述文字识别模块用于对文本扫描模块扫描出的电子文稿和电子稿导入模块导入的电子稿进行文字识别;
所述文字提取模块用于将文字识别模块识别出的小说文字内容提取出,发送到文字处理模块;
所述文字处理模块对获取到的小说文字内容进行文字处理,所述文字处理的过程包括分词,词性标注,韵律结构预测与多音字消岐,所述词性标注的内容包括名词、动词与形容词;
所述文字处理模块处理后的文字内容被发送到特征字符检索模块,进行特征内容的检索,检索完成后总控模块即控制语音生成模块将经过特殊字符检索后的小说文稿转化为语音内容;
所述语音内容被发送到评分模块进行人工评分,当评分符合标准时总控模模块即控制语音发送模块将小说语音发送出。
所述文字识别模块进行文字识别的具体过程如下:
步骤一:电子文稿中的每个字符标记为一个识别区域,将其放大预设倍数;
步骤二:通过ORC文字识别技术对放大后的识别区域进行识别,对同一个区域使用三种不同的预设放大倍数识别;
步骤三:当三种不同预设倍数放大识别后的文字有两次及以上相同时即进行下一识别区域的识别;
步骤四:当同一个区域使用三种不同的预设放大倍数识别的文字均不相同时,即将其标注为未识别字体采用人工识别。
所述特殊字符检索模块检索特殊字符的具体处理模块入下:
S1:特征内容包括预设语气词库与预设语气符号库;
S2:从小说文字内容检索出预设语气词库与预设语气符号库;
S3:当检索到预设语气词库与预设语气符号库内的内容时,对该内容进行重点标记;
所述预设语气词库与预设语气符号库内的预设语气词与预设语气符号均设置了预设读音。
所述词性标注的名词、动词与形容词均均预设对应的读音。
所述评分模块评分的具体过程如下:
步骤一:小说文字转化为语音内容之后将其发送到随机的x个评分人员的智能移动终端,x≥5;
步骤二:随机的x个评分人员每个人对听到的语音小说进行语气和上下文连贯性进行评分,得到x个评分K;
步骤三:通过公式K1+K2+K3……+Kx=K和得到总评分K和;
步骤四:再通过公式K和/x=K均得到平均分值K均;
步骤五:再计算出最大评分值Kmax与最小评分值Kmin之间的差值得到分值差Kk差;
步骤六:当平均分值K均大于预设值,且分值差Kk差小于预设值时即评分符合标准时;
步骤七:当平均分值K均小于预设值,分值差Kk差小于预设值时或平均分值K均大于预设值,分值差Kk差大于预设值时,即评分不符合标准。
当评分不符合标准时,评分不符合标准发送到总控模块,所述总控模块发出复核指令,复核指令被发送到文字处理模块,对小说文字重新进行文字处理。
综上,本发明在使用时,文本扫描模块用于将纸质的小说文稿扫描为电子文稿,电子稿导入模块用于导入小说的电子文稿,文字识别模块用于对文本扫描模块扫描出的电子文稿和电子稿导入模块导入的电子稿进行文字识别,文字提取模块用于将文字识别模块识别出的小说文字内容提取出,发送到文字处理模块,文字处理模块对获取到的小说文字内容进行文字处理,文字处理的过程包括分词,词性标注,韵律结构预测与多音字消岐,词性标注的内容包括名词、动词与形容词,文字处理模块处理后的文字内容被发送到特征字符检索模块,进行特征内容的检索,检索完成后总控模块即控制语音生成模块将经过特殊字符检索后的小说文稿转化为语音内容,语音内容被发送到评分模块进行人工评分,当评分符合标准时总控模模块即控制语音发送模块将小说语音发送出。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种基于语义上下文场景的中文小说语音合成系统,其特征在于,包括文本扫描模块、电子稿导入模块、文字识别模块、文字提取模块、文字处理模块、特殊字符检索模块、总控模块与语音生成模块;
所述文本扫描模块用于将纸质的小说文稿扫描为电子文稿,所述电子稿导入模块用于导入小说的电子文稿;
所述文字识别模块用于对文本扫描模块扫描出的电子文稿和电子稿导入模块导入的电子稿进行文字识别;
所述文字提取模块用于将文字识别模块识别出的小说文字内容提取出,发送到文字处理模块;
所述文字处理模块对获取到的小说文字内容进行文字处理,所述文字处理的过程包括分词,词性标注,韵律结构预测与多音字消岐,所述词性标注的内容包括名词、动词与形容词;
所述文字处理模块处理后的文字内容被发送到特征字符检索模块,进行特征内容的检索,检索完成后总控模块即控制语音生成模块将经过特殊字符检索后的小说文稿转化为语音内容;
所述语音内容被发送到评分模块进行人工评分,当评分符合标准时总控模模块即控制语音发送模块将小说语音发送出。
2.根据权利要求1所述的一种基于语义上下文场景的中文小说语音合成系统,其特征在于:所述文字识别模块进行文字识别的具体过程如下:
步骤一:电子文稿中的每个字符标记为一个识别区域,将其放大预设倍数;
步骤二:通过ORC文字识别技术对放大后的识别区域进行识别,对同一个区域使用三种不同的预设放大倍数识别;
步骤三:当三种不同预设倍数放大识别后的文字有两次及以上相同时即进行下一识别区域的识别;
步骤四:当同一个区域使用三种不同的预设放大倍数识别的文字均不相同时,即将其标注为未识别字体采用人工识别。
3.根据权利要求1所述的一种基于语义上下文场景的中文小说语音合成系统,其特征在于:所述特殊字符检索模块检索特殊字符的具体处理模块入下:
S1:特征内容包括预设语气词库与预设语气符号库;
S2:从小说文字内容检索出预设语气词库与预设语气符号库;
S3:当检索到预设语气词库与预设语气符号库内的内容时,对该内容进行重点标记;
所述预设语气词库与预设语气符号库内的预设语气词与预设语气符号均设置了预设读音。
4.根据权利要求1所述的一种基于语义上下文场景的中文小说语音合成系统,其特征在于:所述词性标注的名词、动词与形容词均均预设对应的读音。
5.根据权利要求1所述的一种基于语义上下文场景的中文小说语音合成系统,其特征在于:所述评分模块评分的具体过程如下:
步骤一:小说文字转化为语音内容之后将其发送到随机的x个评分人员的智能移动终端,x≥5;
步骤二:随机的x个评分人员每个人对听到的语音小说进行语气和上下文连贯性进行评分,得到x个评分K;
步骤三:通过公式K1+K2+K3……+Kx=K和得到总评分K和;
步骤四:再通过公式K和/x=K均得到平均分值K均;
步骤五:再计算出最大评分值Kmax与最小评分值Kmin之间的差值得到分值差Kk差;
步骤六:当平均分值K均大于预设值,且分值差Kk差小于预设值时即评分符合标准时;
步骤七:当平均分值K均小于预设值,分值差Kk差小于预设值时或平均分值K均大于预设值,分值差Kk差大于预设值时,即评分不符合标准。
6.根据权利要求5所述的一种基于语义上下文场景的中文小说语音合成系统,其特征在于:当评分不符合标准时,评分不符合标准发送到总控模块,所述总控模块发出复核指令,复核指令被发送到文字处理模块,对小说文字重新进行文字处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011335771.8A CN112487804B (zh) | 2020-11-25 | 2020-11-25 | 一种基于语义上下文场景的中文小说语音合成系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011335771.8A CN112487804B (zh) | 2020-11-25 | 2020-11-25 | 一种基于语义上下文场景的中文小说语音合成系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112487804A true CN112487804A (zh) | 2021-03-12 |
CN112487804B CN112487804B (zh) | 2024-04-19 |
Family
ID=74934338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011335771.8A Active CN112487804B (zh) | 2020-11-25 | 2020-11-25 | 一种基于语义上下文场景的中文小说语音合成系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487804B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114373445A (zh) * | 2021-12-23 | 2022-04-19 | 北京百度网讯科技有限公司 | 语音生成方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109686361A (zh) * | 2018-12-19 | 2019-04-26 | 深圳前海达闼云端智能科技有限公司 | 一种语音合成的方法、装置、计算设备及计算机存储介质 |
WO2019136911A1 (zh) * | 2018-01-12 | 2019-07-18 | 平安科技(深圳)有限公司 | 更新声纹数据的语音识别方法、终端装置及存储介质 |
CN111164674A (zh) * | 2019-12-31 | 2020-05-15 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、终端及存储介质 |
CN111161703A (zh) * | 2019-12-30 | 2020-05-15 | 深圳前海达闼云端智能科技有限公司 | 带语气的语音合成方法、装置、计算设备及存储介质 |
-
2020
- 2020-11-25 CN CN202011335771.8A patent/CN112487804B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019136911A1 (zh) * | 2018-01-12 | 2019-07-18 | 平安科技(深圳)有限公司 | 更新声纹数据的语音识别方法、终端装置及存储介质 |
CN109686361A (zh) * | 2018-12-19 | 2019-04-26 | 深圳前海达闼云端智能科技有限公司 | 一种语音合成的方法、装置、计算设备及计算机存储介质 |
CN111161703A (zh) * | 2019-12-30 | 2020-05-15 | 深圳前海达闼云端智能科技有限公司 | 带语气的语音合成方法、装置、计算设备及存储介质 |
CN111164674A (zh) * | 2019-12-31 | 2020-05-15 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、终端及存储介质 |
Non-Patent Citations (1)
Title |
---|
高璐;陈琪;李永宏;于洪志;: "藏语语音合成中文本分析的若干问题研究", 西北民族大学学报(自然科学版), no. 02, 15 June 2010 (2010-06-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114373445A (zh) * | 2021-12-23 | 2022-04-19 | 北京百度网讯科技有限公司 | 语音生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112487804B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5761640A (en) | Name and address processor | |
EP0845774B1 (en) | Method and apparatus for automatically generating a speech recognition vocabulary from a white pages listing | |
US7092870B1 (en) | System and method for managing a textual archive using semantic units | |
US6085162A (en) | Translation system and method in which words are translated by a specialized dictionary and then a general dictionary | |
JP4089148B2 (ja) | 通訳サービス方法および通訳サービス装置 | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
US20050283365A1 (en) | Dialogue supporting apparatus | |
WO1988002516A1 (en) | Language translation system | |
JP4930584B2 (ja) | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム | |
JP2005150841A (ja) | 情報処理方法及び情報処理装置 | |
JP2009216986A (ja) | 音声データ検索システム及び音声データの検索方法 | |
CN103885924A (zh) | 一种领域自适应的公开课字幕自动生成系统及方法 | |
CN113627196A (zh) | 一种基于语境和Transformer的多语言对话机器人系统及其对话方法 | |
CN111435595A (zh) | 文本规整方法及装置 | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
CN114996506A (zh) | 语料生成方法、装置、电子设备和计算机可读存储介质 | |
CN112487804A (zh) | 一种基于语义上下文场景的中文小说语音合成系统 | |
CN113505609A (zh) | 一种一键式多语言会议辅助翻译方法及具有该方法的设备 | |
JP3071804B2 (ja) | 音声合成装置 | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
CN1198260C (zh) | 识别多种语言的语音识别系统的方法 | |
CN111652005B (zh) | 汉语与乌尔都语同步互译系统及方法 | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
Hsieh et al. | Improved spoken document retrieval with dynamic key term lexicon and probabilistic latent semantic analysis (PLSA) | |
CN1924996B (zh) | 利用语音辨识以选取声音内容的系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |