CN103680503A - 语义辨识方法 - Google Patents
语义辨识方法 Download PDFInfo
- Publication number
- CN103680503A CN103680503A CN201210342128.7A CN201210342128A CN103680503A CN 103680503 A CN103680503 A CN 103680503A CN 201210342128 A CN201210342128 A CN 201210342128A CN 103680503 A CN103680503 A CN 103680503A
- Authority
- CN
- China
- Prior art keywords
- group
- transliteration character
- transliteration
- character string
- semantic identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012790 confirmation Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 37
- 230000006870 function Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明系提供一种语义辨识方法,包括下列步骤:接收一语音信号;将语音信号辨识为一包含有音译字符组的音译字符序列;将音译字符组的每一个音译字符转换为一拼音字母件组;将拼音字母件组予以依序比对于参考拼音字母件组而得到相似度系数;以及依据相似度系数决定对应的参考音译字符组,藉此改善语音辨识的正确率,使辨识出的语义更接近输入音讯的原意。
Description
技术领域
本发明系关于一种语音辨识方法,特别是关于一种语义辨识方法。
背景技术
早先,使用者与电子产品沟通的方式可以使用键盘、鼠标或触碰屏幕来输入信息,而随着科技的进步,一种较为自然的沟通方式也发展出来,即为语音输入。使用者利用语音输入的方式以及电子产品的语音输出而达到自然对话的效果。而语音输入的过程大体上如下所述,当声音藉由模拟到数字的转换而输入至计算机的内部,并以数值方式储存后,语音辨识程序将已事先储存好的声音样本与输入的测试声音样本进行比对。比对完成后输入一个它认为最「像」的声音样本序列,就可以知道使用者刚刚念进去的声音代表何意,进而能够控制电器设备作各种事情或其它用途。
语音辨识系统的性能受许多因素的影响,包括不同的人说出的话、说话方式、环境噪音及传输信道等等,因此辨识出来的往往会有错误,只有音对,而意不对,譬如,「脏话」和「彰化」、「市民大道」和「四名大盗」。甚至是音也不对,譬如,「姓胡」和「幸福」,所以辨识出来的通常只有音的转译,而不完全是语义的翻译。如此一来,当辨识出来的结果已经有误的情况下,利用文法结构校正的方式来作语义修正的效果是有限的,所以辨识出来的结果上总是会与实际输入的语音有差。
以习知方式要达到高准确率的语音辨识,必须要建立大量的声音样本,譬如男生的声音样本、女性的声音样本、同语言不同腔调的声音样本等等,而且声音的档案比文字的档案大上许多,比对的过程更是繁杂,导致语音辨识须利用高阶计算机比对才有较高的辨识率,也因此难以广泛使用。
发明内容
本发明的主要目的是提供一种语义辨识方法,以改善语音辨识的正确率,使辨识音讯出来的语义更接近输入音讯的原意。
本发明为解决习知技术的问题所采用的技术手段系提供一种语义辨识方法,包括下列步骤:(a)接收一语音信号;(b)将语音信号辨识为一音译字符序列,音译字符序列包含有至少一个由一音译字符所组成的音译字符组;(c)将音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;(d)将音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到音译字符组与参考音译字符组的相似度系数;以及(e)依据分别所得的相似度系数决定音译字符组于数据库中所对应的参考音译字符组。
在本发明的一实施例中,语音信号系为以非拉丁字母为字母的语音信号。
在本发明的一实施例中,拼音字母件组系为拉丁字母所拼音组成。
在本发明的一实施例中,步骤(a)还包括:(a1)将语音信号录音并取样;(a2)将语音信号的取样转换为一语音数字数据;以及(a3)将语音数字数据传送至一辨识装置。
在本发明的一实施例中,在步骤(b)与步骤(c)之间,还包括将音译字符序列的音译字符组分组的步骤(b1)。
在本发明的一实施例中,步骤(b1)中音译字符序列的音译字符组系根据文法结构的分析来分组。
在本发明的一实施例中,步骤(b)还包括给予音译字符序列的音译字符组一对应词性,以及步骤(b1)系依据对应词性而分组音译字符序列的音译字符组。
在本发明的一实施例中,每一个组具有一预设的优先度。
在本发明的一实施例中,步骤(d)系根据每一个组的优先度而从优先度高的组至优先度低的组进行比对。
在本发明的一实施例中,步骤(e)之后还包括一依据音译字符序列所对应的每一个相似度最高的参考音译字符组而决定音译字符序列的对应的功能指令的步骤(f)。
在本发明的一实施例中,步骤(f)之后还包括依据功能指令而输出一执行信息的步骤。
在本发明的一实施例中,执行信息系为一搜寻关键词串,搜寻关键词串系被输出至一搜寻引擎进行搜寻。
在本发明的一实施例中,执行信息系为一控制信号,控制信号系被输出至一执行设备执行作业。
在本发明的一实施例中,当无法决定音译字符序列的特定的功能指令时,步骤(f)之后还包括下列步骤:(g1)输出一再确认要求,再确认要求系对音译字符序列的音译字符组进行再确认的要求;(g2)接受响应于再确认要求的一再确认信号;以及(g3)依据音译字符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能指令。
本发明具有以下有益技术效果:
经由本发明所采用的技术手段,可以提高语音辨识的正确率,并且因为采用的拼音的比对是属于文字的比对,所以是建立文字的数据库来比对,而省去建立庞大的声音样本数据库。以及决定音译字符序列的对应的功能指令,并且依据功能指令而输出一执行信息,藉此,在语音输入的语义若是控制执行设备或是想得到某种信息时,使得语音输入的语义被辨识出来而更准确执行。
此外,本发明将音译字符组进行分组并给予优先度,以及给予对应词性,在比对流程的执行更有效率。
附图说明
图1系显示本发明的第一实施例的语义辨识方法的流程图。
图2系显示应用有本发明的第一实施例的语义辨识方法的电子设备的方块图。
图3系显示应用有本发明的第一实施例的语义辨识方法的电子设备的示意图。
图4系显示本发明的第二实施例的语义辨识方法的流程图。
图5系显示应用有本发明的第二实施例的语义辨识方法的电子设备的方块图。
主要组件符号说明
100电子设备
1撷取装置
11录音单元
12取样单元
13传输单元
2辨识装置
21辨识单元
22转换单元
3数据库
4拼音比对装置
41分组单元
42拼音转换单元
43比对单元
5输出单元
6执行设备
具体实施方式
本发明所采用的具体实施例,将藉由以下的实施例及附呈图式作进一步的说明。
参阅图1及图2所示,图1系显示本发明的第一实施例的语义辨识方法的流程图,图2系显示本发明的第一实施例的语义辨识方法的电子设备的方块图。
如图所示,本发明的第一实施例的语义辨识方法可执行于一电子设备中,用以辨识一输入音讯的语义,进而给予对应的回应。电子设备100在本实施例中包括一撷取装置1、一辨识装置2、一数据库3、一拼音比对装置4、以及一输出单元5。其中撷取装置1包含一录音单元11、一取样单元12及一传输单元13,辨识装置2包含一辨识单元21、一转换单元22,拼音比对装置4包含一分组单元41、一拼音转换单元42及一比对单元43。
首先,输入语音信号(步骤S110)。例如,撷取装置1中的录音单元11接收使用者讲的一段语音信号,并且将语音信号储存起来(步骤S111)。取样单元12将语音信号的背景杂音删除并且取样后转成语音数字数据(步骤S112)。然后传输单元13将所取样的语音数字数据传送至辨识装置2(步骤S113)。撷取装置1可为智能型手机、个人计算机或智能型电视等,辨识装置2可以是远程服务器,而传输单元13借着因特网将取样的语音数字数据传送至辨识装置2。
当取样的语音数字数据传送至辨识装置2后,辨识装置2运用语音识别技术(AutomaticSpeech Recognition,ASR)将取样的语音数字数据与数据库3中的参考语音数字数据进行比对,而得出最匹配的参考语音数字数据,并且根据所得的参考语音数字数据而取得取样的语音数字数据所对应的音译字符序列(步骤S120)。详细而言,在本实施例中,辨识单元21是利用隐藏式马可夫模型(Hidden Markov Model,HMM)及类神经网络(Neural Network,N.N.)的方法将取样的语音数字数据与数据库3中的参考语音数字数据进行比对,而得到最合适的参考语音数字数据。然后转换单元22根据最匹配的参考语音数字数据对应的音译字符而将步骤S110中输入的语音信号转换为所对应的音译字符序列,其中音译字符序列包含有至少一个由一音译字符所组成的音译字符组。音译字符主要是由语音信号的语言所使用的字符,举例来说,汉语的音译字符序列主要是由汉字所组成、日语的音译字符序列主要是由假名与日本汉字所组成,以及韩语的音译字符序列主要是由韩字所组成。
透过辨识装置2运用语音识别技术辨识后而得到的音译字符序列,会具有基本的字义分组,此分组即为音译字符组,而不光只是纯音译。举例来说,输入的语音信号为「花莲的海洋公园」的情况下,其辨识出来的音译字符序列可能由下列的音译字符组所组成,「花莲」、「华丽」、「的」、「海洋」、「公元」、「公园」。如此一来,音译字符序列可能是「花莲的海洋公园」、「华丽的海洋公园」或「华丽的海洋公元」等,而不会是「华怜的海杨供圆」等只有纯音译的情况。其中,音译字符组由至少一个音译字符所组成,譬如音译字符组「花莲」是由两个音译字符「花」及「莲」所组成,而音译字符组「的」是由一个音译字符「的」所组成。
接下来,辨识出来的音译字符序列将传送至拼音比对装置4进行拼音转换与比对。拼音比对装置4在本实施例中是一服务器,与语音辨识装置2和数据库3以因特网连接传输。拼音比对装置4的分组单元41将辨识出来的音译字符序列的音译字符组进行分组(步骤S122),而且每一个组分别给予一个预设的优先度,使得在比对时可以根据优先度的高低而决定比对的顺序。较佳地,在分组之前给予音译字符序列的音译字符组一对应词性(步骤S121),譬如,本实施例中,中文的情况下,音译字符组的词性依照简易中文分词系统(Simple ChineseWords Segmentation,SCWS)来分组,并主要分成三大类,动词类、名词类及其它,而每个类别又包含许多组,例如名词类又再细分为人名组、地名组、机构团体组、名词性语素组及其它专名组。
此外,分组的时候,除了利用词性分组外,还可以配合文法结构的分析,使得分组时的正确率更高。例如在中文的情况下,一个字符或一个字符组往往有两种以上的词性,会使得在步骤S122中依词性而分组时容易分组错误。如此一来,配合文法结构的分析,分组的错误率能降低。在本实施例中,在中文的情况下,文法结构是利用中文句结构树数据库(SinicaTreebank)来分析。当然,本发明不限于此,词性分组也可以使用其它数据库或系统的分组方式,只要能分组即可,而文法结构也可以使用其它数据库或系统来分析,只要能分析文法即可。
接着,藉由拼音转换单元42将音译字符序列的音译字符组的音译字符转换为一拼音字母件组(步骤S130)。详细而言,在本实施例中,在中文的情况下,较佳地是使用英文字母来作拼音的拼音字母,以及使用汉语拼音系统(Hanyu Pinyin)来记写中文字读音。例如,音译字符组「台北」藉由拼音转换单元42而转换成汉语拼音「tai2bei3」(数字代表声调),其中「tai2」即为音译字符「台」的拼音字母件组,「bei3」即为音译字符「北」的拼音字母件组。当然,本发明不限于此,也可以使用拉丁字母或其它表音文字(Phonogram)来作拼音的拼音字母,或是采用通用拼音系统(Tongyong Pinyin)或其它拼音系统,只要能拼出该音译字符之音即可。
在步骤S130之后,比对单元43将音译字符组的每一个拼音字母件组予以依序比对于数据库3中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的相似度系数(步骤S140)。详细而言,藉由比对单元43将音译字符组的每一个拼音字母件组和数据库3中的参考音译字符组的参考拼音字母件组进行比对,并且根据组的优先度而依序从优先度高的组比对至优先度低的组,举例来说,「zhao3(找)」、「xiang3zhi1dao4(想知道)」等搜寻字的组的优先度在设定上高于地名或人名的组,在比对时会先将优先度高的组进行数据库比对,并在高优先度组比对完成后再进行优先度次高的组的数据库比对,然后依序比对至优先度最低的组,藉此使得比对更有效率。当然,本发明不限于此,在比对的过程中,若是已经比对至一个适当的结果而能进行下一个步骤,则不需要将音译字符序列的所有音译字符组去对数据库3中所有的参考音译字符组,只要比对的结果可以进行下个步骤即可,譬如,被归类至助词组的音译字符组「的」、「之」及「着」将不进行比对。
在本实施例中,进行比对的方式是计算两者的编辑距离(Levenshtein distance),然后将得出的编辑距离(L)换算为相似度系数(S),换算的方式为相似度系数S=1/(1+L)。譬如「xing4hu2(姓胡)」和「xing4fu2(幸福)」,「xing4(姓)」和「xing4(幸)」的拼音字母件组完全一样,则相似度系数S为1/(1+0)=1,而「hu2(胡)」和「fu2(福)」的编辑距离L为1,所以「hu2(胡)」和「fu2(福)」的相似度系数S为1/(1+1)=0.5。而若是比较一个音译字符组,如「姓胡」和「幸福」,则是两者的音译字符组的拼音字母件组一起比对「xing4hu2(姓胡)」和「xing4fu2(幸福)」,其编辑距离L为1,则两者的相似度系数S为1/(1+1)=0.5。当然,本发明不限于此,也可以利用其它比对方式,或是相似度系数与编辑距离的关系为S=1/(1+2L),只要能求出两者的相似度的相似度系数S即可。
然而,因为同一个音译字符组有时候会具有多重的词性而可以分配在不同的组进行比对,或是因为语音辨识出来的音译字符组有误,仅音译正确但音译字符错误而分配到错误的组,此情况下比对出来的结果得到的相似度系数S可能会不够好。因此在步骤S140中,可以配合文法结构的分析,将每一个音译字符组比对数据库3中一个以上词性的组,而得到在不同分组的比对下的相似度系数S,最后根据在不同分组情况下,综合各个音译字符组的相似度系数S的平均,从而得到最合适的分组方式,而得到音译字符组的最合适的相似度系数S。举例来说,输入的语音信号为「宜兰的蜜饯」,而辨识出的音译字符序列为「依然的密件」,则其音译字符组的分组分别为「依然」是副词组,「密件」是名词组,在比对时会在副词组中将音译字符组「依然」的拼音字母件组「yi1ran2」与数据库3中的参考音译字符组「依然」的参考拼音字母件组「yi1ran2」比对而得到相似度系数S=1,在名词组中将音译字符组「密件」的拼音字母件组「mi4jian4」与数据库3中的参考音译字符组「密件」的参考拼音字母件组「mi4jian4」比对而得到相似度系数S=1,其相似度系数的平均为1。接着,将音译字符组「依然」的拼音字母件组「yi1ran2」与数据库3中的地名组比对,而得到与数据库3中参考字符组「宜兰」的参考拼音字母件组「yi2lan2」的相似度系数S=1/3,然后将音译字符组「密件」的拼音字母件组「mi4jian4」与数据库3中的名词组比对,而得到与数据库3中参考字符组「蜜饯」的参考拼音字母件组「mi4jian4」的相似度系数S=1,其相似度系数的平均为2/3。虽然第二次用另一种分组去比对时的相似度系数S的平均较低,但配合文法结构的分析,以及综合各种分组比对后的相似度系数S的平均,可以得到最合适的分组比对方式,将「依然」分配为地名组进行比对。
接着,依据所得的相似度系数S决定音译字符组于数据库3中所对应的参考音译字符组(步骤S150),详细而言,在步骤S140中,音译字符组与数据库3中参考音译字符组比对的时候,音译字符序列的各个音译字符组依所对应的词性分的组去比对于数据库3中所对应的组后,得到各个音译字符组与参考音译字符组的相似度系数S,然后决定一个最合适的对应的参考音译字符组,举例来说,「依然」与地名组比对后得出与参考字符组「宜兰」的相似度系数S为1/3,「密件」与名词组比对后得出与参考字符组「蜜饯」的相似度系数S为1,决定音译字符组依然所对应的参考音字字符组为「宜兰」,以及决定音译字符组「密件」所对应的参考音字字符组为「蜜饯」。如此一来,一般语音辨识所辨识的音译字符序列的有误的地方被修正改善了。
再者,依据音译字符序列所对应的每一个参考音译字符组而决定音译字符序列的对应的功能指令(步骤S160)。详细而言,根据参考音译字符组所对应的预设指令而决定音译字符序列的对应的功能指令。举例来说,参考音译字符组为「找」、「找寻」、「想知道」、「搜寻」等被归类为查询的功能指令,而参考音译字符组为「开」、「打开」、「开启」、「启动」等归类被为设备控制的功能指令。
进一步而言,在步骤S160后,是否决定出对应的功能指令(步骤S170),若是决定出对应的功能指令,则输出单元5依据功能指令而输出一执行信息(步骤S180),譬如,当音译字符组所对应的参考音译字符组为「搜寻」时,则对应的功能指令即为一搜寻关键词串,并且透过输出单元5输出至执行设备进行搜寻,并且将搜寻的数据回传给使用者,举例来说,使用者说「我想知道台中火车站的位置」,则输出单元5输出关键词串「台中火车站」至计算机(如google map)进行搜寻,然后将搜寻的结果如台中地图的数据回传给使用者。或是,当音译字符组所对应的参考音译字符组为「打开」时,则对应的功能指令即为一控制信号,并且透过输出单元5输出至执行设备6执行作业,例如将控制信号输出至冷气,然后将冷气开启。如此一来,将接收的语音信号转变成响应所搜寻信息,或是转变成控制一个电子设备等,即为辨识出语音信号的语义。
当无法决定音译字符序列的特定的功能指令时,则输出单元5输出再确认要求,再确认要求是对音译字符序列的音译字符组进行再确认的要求(步骤S171)。接着再接受响应于再确认要求的一再确认信号(步骤S172)。然后依据音译字符序列所对应的每一个参考音译字符组及再确认信号而决定音译字符序列的对应的功能指令(步骤S173)。详细而言,输出单元输出再确认要求可以是透过屏幕显示的方式显示一段文字以向使用者确认功能指令,或是透过扬声器发出一段音讯以向使用者确认功能指令,譬如,屏幕显示「请再次输入语音信号」、或显示「请问所输入的语音信号是脏话还彰化」。当然,本发明不限于此,也可以是振动方式,只要能发出再确认要求即可。
然后使用者根据再确认要求而给予再确认信号,举例来说,智能型手机的屏幕显示「脏话」及「彰化」,让使用者触碰智能型手机的屏幕去决定功能指令是要搜寻「脏话」的信息还是「彰化」的信息。再者,或是显示「请再次输入语音信号」时,使用者重新输入一次语音信号。
接着,若使用者选择「彰化」,则配合之前的参考音译字符组,譬如「我想知道」,则决定出功能指令为查询,而查询的内容为彰化。若是请使用者再次输入语音信号的情况下,则使用者再次输入语音信号后进入步骤S110,并且经过上述的本发明辨识方法的流程,而得到再次输入的语音信号的参考音译字符组,并配合之前输入的语音信号所得到的参考音译字符组,而决定出功能指令,然后再依据得到的功能指令而输出一执行信息。
参阅图3所示,其系显示本发明的第一实施例的语义辨识的方法的电子设备的示意图。在实际应用上,在语义辨识的过程中,其较佳地流程如下。首先,撷取装置1(如智能型手机)接收并撷取语音信号,然后传输至辨识装置(如远程服务器)2辨识为音译字符序列。接着,拼音比对装置4(如远程服务器)将音译字符序列中各个拼音字符组的拼音字符转换成以拼音字母所组成的拼音字母件组,再与数据库3中的数据比对而得到音译字符组与参考音译字符组的相似度系数S。最后根据得到的相似度系数S而决定出音译字符组于数据库3中所对应的参考音译字符组,然后输出单元5根据得到的参考音译字符组所对应的功能指令输出执行信息至执行设备6(如电器设备、网络搜寻引擎),在本实施例中输出的执行信息为打开电视,当然也可是调整音量,或是控制其它电器设备。
参阅图4及图5所示,图4系显示本发明的第一实施例的语义辨识方法的流程图,图5系显示本发明的第一实施例的语义辨识方法的电子设备的方块图。在本实施例中,语音辨识方法的系统100a包含的撷取装置1、辨识装置2、数据库3及拼音比对装置4设置整合在一起,例如智能型手机或笔记型计算机。这类型的装置的效能以及储存空间比服务器差,或是为了减少运算的复杂度以达到省电的效果,所以需要降低比对的复杂性、减少比对的时间以及简化数据库。因此,本实施例的语义辨识方法较第一实施例的步骤S精简,不同之处在步骤S120中将输入的语音信号转换音译字符序列后,接着步骤S130,将音译字符序列的每一个音译字符组的每一个音译字符转换为拼音字母件组。然后,在步骤S140中将音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到音译字符组与参考音译字符组的相似度系数。然后,接着在步骤S150中依据分别所得的相似度系数决定音译字符组于数据库中所对应的参考音译字符组。最后,将音译字符序列中每一个音译字符组所对应的参考音译字符组输出(步骤S190)。举例来说,在个人计算机的使用情况下,当使用者想使用语音输入方式来取代键盘的打字时,因为一般计算机内建的语音辨识的效果有限而导致语音输入常有错别字,所以必须要花费大量的时间去校正。因此,利用本实施例的语义辨识方法,可以提高语音输入的正确率,并且不需要使用庞大的数据库以及复杂的比对方式,可以单独在移动装置上使用而不需与服务器联机。
藉由本发明的语义辨识方法,能够在语音辨识后改善辨识的正确率,以及配合音译字符组所对应的参考音译字符组的功能指令而去执行对应的动作,进一步的达到辨识出语义的效果。
由以上的实施例可知,本发明所提供的语义辨识方法确具产业上的利用价值。然而,以上的叙述仅为本发明的较佳实施例说明,凡精于此项技艺者当可依据上述的说明而作其它种种的改良,然而这些改变仍属于本发明的发明精神及所界定的专利范围中。
Claims (14)
1.一种语义辨识方法,其特征在于,包括下列步骤:
(a)接收一语音信号;
(b)将该语音信号辨识为一音译字符序列,该音译字符序列系包含有至少一个由一音译字符所组成的音译字符组;
(c)将该音译字符序列的每一个音译字符组的每一个音译字符转换为一拼音字母件组;
(d)将该音译字符组的每一个拼音字母件组予以依序比对于一数据库中的参考音译字符组的参考拼音字母件组而得到该音译字符组与该参考音译字符组的相似度系数;以及
(e)依据分别所得的该相似度系数决定该音译字符组于该数据库中所对应的该参考音译字符组。
2.如权利要求1所述的语义辨识方法,其特征在于,该语音信号系为以非拉丁字母为字母的语音信号。
3.如权利要求1所述的语义辨识方法,其特征在于,该拼音字母件组系为拉丁字母所拼音组成。
4.如权利要求1所述的语义辨识方法,其特征在于,步骤(a)还包括:
(a1)将该语音信号录音并取样;
(a2)将该语音信号的取样转换为一语音数字数据;以及
(a3)将该语音数字数据传送至一辨识装置。
5.如权利要求1所述的语义辨识方法,其特征在于,在步骤(b)与步骤(c)之间,还包括一步骤:
(b1)将该音译字符序列的音译字符组分组。
6.如权利要求5所述的语义辨识方法,其特征在于,步骤(b1)中该音译字符序列的音译字符组系根据文法结构的分析来分组。
7.如权利要求5所述的语义辨识方法,其特征在于,步骤(b)还包括给予该音译字符序列的音译字符组一对应词性的步骤,以及步骤(b1)系依据该对应词性而分组该音译字符序列的音译字符组。
8.如权利要求5所述的语义辨识方法,其特征在于,该每一个组具有一预设的优先度。
9.如权利要求8所述的语义辨识方法,其特征在于,步骤(d)系根据该每一个组的优先度而从优先度高的组至优先度低的组进行比对。
10.如权利要求1所述的语义辨识方法,其特征在于,在步骤(e)之后还包括一步骤:
(f)依据该音译字符序列所对应的每一个参考音译字符组而决定该音译字符序列的对应的功能指令。
11.如权利要求10所述的语义辨识方法,其特征在于,在步骤(f)之后还包括依据该功能指令而输出一执行信息的步骤。
12.如权利要求11所述的语义辨识方法,其特征在于,该执行信息系为一搜寻关键词串,该搜寻关键词串系被输出至一搜寻引擎进行搜寻。
13.如权利要求11所述的语义辨识方法,其特征在于,该执行信息系为一控制信号,该控制信号系被输出至一执行设备执行作业。
14.如权利要求10所述的语义辨识方法,其特征在于,当无法决定该音译字符序列的特定的功能指令时,步骤(f)之后还包括下列步骤:
(g1)输出一再确认要求,该再确认要求系对该音译字符序列的音译字符组进行再确认的要求;
(g2)接受响应于该再确认要求的一再确认信号;以及
(g3)依据该音译字符序列所对应的每一个参考音译字符组及该再确认信号而决定该音译字符序列的对应的功能指令。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101131765A TW201409462A (zh) | 2012-08-31 | 2012-08-31 | 語意辨識方法 |
TW101131765 | 2012-08-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103680503A true CN103680503A (zh) | 2014-03-26 |
Family
ID=50317857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210342128.7A Pending CN103680503A (zh) | 2012-08-31 | 2012-09-14 | 语义辨识方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103680503A (zh) |
TW (1) | TW201409462A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206274A (zh) * | 2015-10-30 | 2015-12-30 | 北京奇艺世纪科技有限公司 | 一种语音识别的后处理方法及装置和语音识别系统 |
CN108597537A (zh) * | 2018-04-06 | 2018-09-28 | 东莞市华睿电子科技有限公司 | 一种音频信号相似度检测方法 |
CN107251137B (zh) * | 2015-02-26 | 2020-08-04 | 纳宝株式会社 | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 |
US11861521B2 (en) | 2021-12-21 | 2024-01-02 | PolyAI Limited | System and method for identification and verification |
CN117831573A (zh) * | 2024-03-06 | 2024-04-05 | 青岛理工大学 | 基于多模态的语言障碍人群言语录音分析方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI579830B (zh) * | 2015-12-29 | 2017-04-21 | Chunghwa Telecom Co Ltd | On the Chinese Text Normalization System and Method of Semantic Cooperative Processing |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1127898A (zh) * | 1995-01-26 | 1996-07-31 | 李琳山 | 智慧型国语语音输入方法及国语听写机 |
EP0867858A2 (en) * | 1997-03-28 | 1998-09-30 | Dragon Systems Inc. | Pronunciation generation in speech recognition |
CN1361517A (zh) * | 2000-12-26 | 2002-07-31 | 于泽华 | 汉字拼音法 |
CN1674091A (zh) * | 2005-04-18 | 2005-09-28 | 南京师范大学 | 地理信息的语音识别方法及其在导航系统中的应用 |
CN1703923A (zh) * | 2002-10-18 | 2005-11-30 | 中国科学院声学研究所 | 一种便携式数字移动通讯设备及其语音控制方法和系统 |
CN101145289A (zh) * | 2007-09-13 | 2008-03-19 | 上海交通大学 | 基于代理技术的远程教育环境中语音答疑系统 |
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
-
2012
- 2012-08-31 TW TW101131765A patent/TW201409462A/zh unknown
- 2012-09-14 CN CN201210342128.7A patent/CN103680503A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1127898A (zh) * | 1995-01-26 | 1996-07-31 | 李琳山 | 智慧型国语语音输入方法及国语听写机 |
EP0867858A2 (en) * | 1997-03-28 | 1998-09-30 | Dragon Systems Inc. | Pronunciation generation in speech recognition |
CN1361517A (zh) * | 2000-12-26 | 2002-07-31 | 于泽华 | 汉字拼音法 |
CN1703923A (zh) * | 2002-10-18 | 2005-11-30 | 中国科学院声学研究所 | 一种便携式数字移动通讯设备及其语音控制方法和系统 |
CN1674091A (zh) * | 2005-04-18 | 2005-09-28 | 南京师范大学 | 地理信息的语音识别方法及其在导航系统中的应用 |
CN101145289A (zh) * | 2007-09-13 | 2008-03-19 | 上海交通大学 | 基于代理技术的远程教育环境中语音答疑系统 |
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107251137B (zh) * | 2015-02-26 | 2020-08-04 | 纳宝株式会社 | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 |
CN105206274A (zh) * | 2015-10-30 | 2015-12-30 | 北京奇艺世纪科技有限公司 | 一种语音识别的后处理方法及装置和语音识别系统 |
CN108597537A (zh) * | 2018-04-06 | 2018-09-28 | 东莞市华睿电子科技有限公司 | 一种音频信号相似度检测方法 |
US11861521B2 (en) | 2021-12-21 | 2024-01-02 | PolyAI Limited | System and method for identification and verification |
CN117831573A (zh) * | 2024-03-06 | 2024-04-05 | 青岛理工大学 | 基于多模态的语言障碍人群言语录音分析方法及系统 |
CN117831573B (zh) * | 2024-03-06 | 2024-05-14 | 青岛理工大学 | 基于多模态的语言障碍人群言语录音分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
TW201409462A (zh) | 2014-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102417045B1 (ko) | 명칭을 강인하게 태깅하는 방법 및 시스템 | |
CN111968649B (zh) | 一种字幕纠正方法、字幕显示方法、装置、设备及介质 | |
CN109255113B (zh) | 智能校对系统 | |
CN107038158B (zh) | 对译语料库制作方法、装置、记录介质以及机器翻译系统 | |
CN110770735B (zh) | 具有嵌入式数学表达式的文档的编码转换 | |
CN103678684A (zh) | 一种基于导航信息检索的中文分词方法 | |
CN103680503A (zh) | 语义辨识方法 | |
KR20120006489A (ko) | 입력 방법 편집기 | |
WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
CN101256559A (zh) | 用于处理输入语音的装置和方法 | |
CN104166462A (zh) | 一种文字的输入方法和系统 | |
US20100106481A1 (en) | Integrated system for recognizing comprehensive semantic information and the application thereof | |
CN104850543A (zh) | 语音对话支持装置和语音对话支持方法 | |
CN110782881A (zh) | 一种语音识别及实体识别后的影视实体纠错方法 | |
WO2016008128A1 (en) | Speech recognition using foreign word grammar | |
CN104808806A (zh) | 根据不确定性信息实现汉字输入的方法和装置 | |
CN110991180A (zh) | 一种基于关键词和Word2Vec的命令识别方法 | |
CN105335356B (zh) | 一种面向语义识别的纸质翻译方法及翻译笔装置 | |
CN103164397B (zh) | 汉哈电子辞典及其自动转译汉哈语的方法 | |
CN103164398B (zh) | 利用汉维电子辞典自动转译汉维语的方法 | |
CN103164395B (zh) | 汉柯电子辞典及其自动转译汉柯语的方法 | |
CN103164396B (zh) | 使用汉维哈柯电子辞典自动转译汉维哈柯语的方法 | |
JP5208795B2 (ja) | 通訳装置、方法、及びプログラム | |
CN107251137A (zh) | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140326 |