CN1706173A - 号码簿助理方法和设备 - Google Patents
号码簿助理方法和设备 Download PDFInfo
- Publication number
- CN1706173A CN1706173A CNA2003801015184A CN200380101518A CN1706173A CN 1706173 A CN1706173 A CN 1706173A CN A2003801015184 A CNA2003801015184 A CN A2003801015184A CN 200380101518 A CN200380101518 A CN 200380101518A CN 1706173 A CN1706173 A CN 1706173A
- Authority
- CN
- China
- Prior art keywords
- word
- entry
- directory
- database
- assistant apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 5
- 241001672694 Citrus reticulata Species 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 claims 1
- 101100258233 Caenorhabditis elegans sun-1 gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
被公开的是一种用于大规模自动对话电信系统的号码簿助理方法和设备。所述号码簿助理方法和设备使用自然语言对话系统要求用户描述想要的号码簿登录项,随后使用相关知识数据库来分析和理解这些描述并且翻译它们的意义。最后,所述号码簿助理方法和设备从几个对话、号码簿数据库和相关知识数据库综合全部可用的信息,随后提供用户想要的号码簿登录项信息。
Description
本发明涉及一种号码簿助理方法和设备,并且特别涉及一种在自动对话电信系统中的号码簿助理方法和设备。
给用户提供电话号码的号码簿助理(DA)系统是一种重要的电信业务。例如,凯尔斯(Kelsey)集团估计全世界的电信公司每个月共接收超过5.16亿次DA呼叫,其中目前几乎全部通过话务员处理。使用语音识别来使这种业务自动化是一种巨大的市场机会。
常规的DA系统通过使用一种受限制的对话被实现。传统上,它首先要求用户说出要被联系的人的名字,随后使用一个语音识别器从号码簿数据库确定几个候选者。如果候选者太多,则DA系统进一步要求用户拼写想要的人的名字或者提供额外的信息,例如,想要的人居住的街道的名字。这样,候选者的范围可以被进一步缩小。最后,DA系统要求用户通过回答一个相应的数字或者仅仅通过“是/否”来选择正确的一个候选者。这种DA系统令人满意地为小规模的西文DA系统工作。但是它不能令人满意地为具有例如在一个大城市中被使用的12,000,000个登录项的大规模号码簿助理系统工作,因为上面提及的输入信息不足以区分全部可能的候选者。
相同的系统也不能令人满意地为大规模的中文DA系统工作。由于下列特殊的特征,所述输入信息不足以区分全部可能的候选者。首先,中文是一种单音节语言。中文的每个字精确地包含一个音节。有超过13000个通常被使用的字,但仅有1300个合法音节。平均起来,每个音节大约有10个同音字。第二,一个中文名字通常短于一个西文名字。中文名字通常只有三个音节。而且,有大约200个姓氏被10亿中国人频繁地使用。因此,需要更多的信息来解决在中文DA系统中的多义性。第三,中文是一种表意语言。通常,中国人通过用字和用一些通常被使用的短语描述他们的名字来向别人介绍他们的名字。没有方便并且标准的方式来“拼写”或“组成”中文字。因此,现在的DA系统的性能,特别是中文DA系统的性能不令人满意。
本发明的一个目的是提供一种用于提供想要的号码簿登录项信息的号码簿助理方法和设备。所述号码簿助理方法和设备使用自然语言对话系统来要求用户描述想要的号码簿登录项,并且随后使用相关知识数据库来分析和理解这些描述并且翻译它们的意义。最后,所述号码簿助理方法和设备综合来自几个对话回合、号码簿数据库和相关知识数据库的全部可用的信息,于是提供用户想要的号码簿登录项信息。
本发明的另一个目的是提供一种驻留在计算机可读取的媒体上的计算机程序产品,它具有多个被存储在其上的指令,当被一个处理器执行时,导致所述处理器提供想要的号码簿登录项信息。
根据下面给出的详细说明和附图,将更可以充分地理解本发明,这些附图是用于说明而不是用于限制的,其中:
图1表示一个本发明的号码簿助理设备的框图;
图2表示根据本发明的经常被使用的模板和经常被使用的字来产生名字描述语法规则;以及
图3表示一个本发明的号码簿助理方法的流程图。
参考图1,诸如普通话号码簿助理设备的本发明的号码簿助理设备,包括一个用于存储号码簿登录项信息、语法规则和概念序列的数据库30;一个用于接收描述想要的号码簿登录项的语音信号、识别所述语音信号并且产生被识别的字序列的声音识别单元10;一个语音翻译单元20,用于通过使用被存储在数据库30中的一种预先确定的语法规则和它的相关信息来翻译被识别的字序列以构成概念序列,以及根据被存储在所述数据库中的语义意义和它的相关信息及当前系统状态翻译所述概念序列,从而通过使用用于所述想要的号码簿登录项的最大的后验概率和最大的似然性标准之一产生至少一个候选者,另外,语音翻译单元20还更新所述系统状态;一个用于查找对应于来自数据库30的至少一个候选者的至少一个号码簿登录项信息的查找单元40;以及一个用于输出被确定的至少一个号码簿登录项信息的输出单元60(诸如一个语音输出单元)。
本发明的号码簿助理设备还包括一个用于产生请求更多信息的问题的问题发生器60,其中所述问题是请求用户提供更多信息、基于列表的确认和未决问题确认之一。当潜在的候选者在一个数量限制内或者第一个候选者的概率远远高于其他人时,则所述基于列表的确认被使用。当在名字数据库中最流行的请求用户确认的描述方式,例如你想要李登輝的李(如在Li3 Deng1 Hue1中那样的Li3)时,则所述未决问题确认被使用。
声音识别单元10还包括一个用于识别所述输入语音信号并且产生被识别的字序列的语音识别器11;一个用于根据混淆表13扩展所述被识别的字序列的混淆分析器12,其中混淆表13被预先训练并且包括全部易被混淆的字、与它们相应的正确的字和出现的概率;以及一个用于根据置信度表15过滤出易被混淆的字对的置信度测量单元14。
数据库30包括一个相关知识数据库31和一个号码簿数据库32。相关知识数据库31包括字和它们的使用频率,描述所述字的方式、语法规则、属性和相应的使用频率,通信概念和它们的使用频率,相应的语法规则、语义意义和使用频率,而号码簿数据库32包括多个登录项,其中每个登录项包括名字、电话号码、相关信息和使用频率。
在相关知识数据库31中,利用几种流行的描述方式来存储名字中流行的字,其中所述语法规则和概念序列被用于描述包括登录项名字或登录项名字的至少一个字以及它的相关信息的想要的号码簿登录项,并且所述语法规则通过经常被使用的语法模板和经常被使用的字被产生.所述语法模板通过经常被使用的名词、名人的名字、成语、字符笔划、字母、字以及字符根等等之一被产生。例如,在名字中的字可以被描述如下:
-著名的姓描述,象李登輝的李(如在Li3 Deng1 Hue1中那样的Li3)。
-著名的名字描述,象李登輝的李(如在Li3 Deng1 Hue1中那样的Li3)。
-通常被使用的字、短语和特别的四字中文成语,象趙銭孫李的趙(如在Zhau4 Chien2 Sun1 Li3中那样的Zhau4)。
-通常被使用的书写/笔划描述,象三横一
王(有三条横线和一条竖线的Wang2);或耳東陳(有一个耳和一个东的Chen2)。
图2表示根据本发明的经常被使用的模板和经常被使用的字来产生名字描述语法规则。本发明首先建立一个数据库,它收集所述名字描述语法规则和它们相应的语义标记。
有两种建立数据库的方式。第一种方式是收集尽可能多的名字和它们相应的字符描述。根据这个数据库,我们已经发现了名字描述语法规则和它们的概率统计,诸如LN(姓的描述)84、FN1(名字的第一个字的描述)85和FN2(名字的第二个字的描述)86。
第二种方式是根据一个名字描述的小数据库(例如上面提及的数据库)来发现经常被使用的语法模板。随后,我们使用被发现的语法模板和经常被使用的字来产生必要的语法规则。例如,我们已经发现描述名字的字的最流行的方式是:
-经常被使用的名词(FNoun)81;
-名人的名字(FName)82;
-成语(CI);
-字符笔划(CS);
-经常被使用的外来词(FW);
-字符根(CR)83;
-……
-其它不规则的方式(OW)。
随后,通过结合这些语法模板和经常被使用的字(从字典、互联网、报纸等等收集的),我们能够建立必要的语法规则。
参考图3,诸如普通话号码簿助理方法的本发明的号码簿助理方法被描述如下:
所述方法首先提示一个问题来要求用户以语音方式输入想要的登录项(100);随后,接收一个描述所述想要的号码簿登录项的语音信号(110);识别所述语音信号并且产生被识别的字序列,根据一个混淆表来扩展所述被识别的字序列并且根据一个置信度表来过滤出易被混淆的字对(120);通过使用被存储在一个数据库中的被预先确定的语法规则和它的相关信息来翻译所述被识别的字序列以构成概念序列(130);根据被存储在所述数据库中的语义意义和它的相关信息以及当前系统状态来翻译所述概念序列,从而通过使用用于所述想要的号码簿登录项的最大的后验概率和最大的似然性标准之一产生至少一个候选者并且更新所述系统状态;查找对应于来自所述数据库的至少一个候选者的至少一个号码簿登录项信息,并且如果有不定性,则产生一个请求更多信息的问题(150);输出被定位的至少一个号码簿登录项信息(160);以及确认所述被定位的号码簿登录项信息,并且重复上述步骤直到所述想要的号码簿登录项被定位(170)。
上面提及的方法可以通过计算机程序指令被实现。所述计算机程序指令可以被下载到计算机中或者其它可编程的处理设备中来执行在图3中所示的方法的功能。所述计算机程序指令可以被存储在一种计算机程序产品中或者计算机可读取的媒体中。计算机程序产品或计算机可读取的媒体的例子包括诸如磁带、软盘、硬盘驱动器、RAM、ROM和光盘的可记录型媒体以及诸如数字和模拟通信链路的传输型媒体。
本发明的目的在于理解描述名字中的字的方式、建立相关知识数据库来存储描述名字中的字的方式、以及使用所述数据库作为语法规则来分析输入语音。通过这种新的结构,当仍有不定性时,本发明可以使用自然语言对话系统来要求用户描述名字的字。随后,本发明使用相关知识数据库来分析和理解这些描述并且翻译它们的意义。最后,本发明结合全部可用的信息来缩小可能的候选者的范围并且最终确定正确的号码簿登录项。尽管通过使用中文字作为例子描述了部分本发明,但是本发明也可以被应用于其它语言。例如,著名的姓描述,象李登輝的李(如在Li3 Deng1 Hue1中那样的Li3),可以被改变为“George Bush中的Bush。”
尽管本发明和它的优点已经被详细描述,但是应该理解,在不违背如通过附加权利要求被定义的本发明的精神和范围的情况下,在此可以进行各种变化、代替和变换。
现有技术参考
Nick Wang和Leo Liao提交给菲利普公司知识产权的Chinesename recognition(中文名字识别),发明公开,2000年10月11日。
Andreas Kellner,Bernhard Rueber,Frank Seide和Bach-HiepTran,“PADIS-an Automatic Telephone Switchboard and DifectoryInformation(PADIS-一种自动电话交换机和号码簿信息系统)”,语音通信,23:95-111,1997年10月。
Bernd Souvignier,Andreas Kellner,Bernhard Rueber,HaukeSchramm和Frank Seide,“The Thoughtful Elephant:Strategiesfor Spoken Dialog systems(深思的大象:口语对话系统策略)”,关于语音和音频处理的IEEE期刊,8(1):51-62,2000年1月。
Georg Rose,“PADIS-XXL,Large Scale Directory Assistant(PADIS-XXL,大规模号码簿助理),”PowerPoint幻灯片,人机接口,2000。
Andreas Meylahn,“SpeechFinder for SpeechPerl2000-Developer’s Guide v20.(用于语音Perl 2000-开发者指南v2.0的语音探测器)”,菲利普语音处理-德国,亚琛,2000年9月21日
Yen-Ju Yang(杨燕珠),“Statistics-based spoken dialoguemodeling and its applications(基于统计的口语对话建模和它的应用),”博士论文,国立台湾大学,台湾,1999。
Jan Kneissler和Dietrich Klakow,“Speech Recognition forHuge Vocabularies by Using Optimized Sub-Word Units(使用最优化子字单元用于大量词汇的语音识别)”。
Dietrich Klakow,Georg Rose和Xavier Aubert,“OOV-Detection in Large Vocabulary System Using AutomaticallyDefined Word-Fragments as Fillers(在使用自动被定义的字段作为填充符的大量词汇系统中的OOV-检测)”,Proc.EUROSPEECH,第1卷,1999,第49-53页。
Alex Weibel,Petra Geutner,Laura Mayfield Tomokiyo,TanjiaSchultz和Monika Woszcyna,“在语音和口语语言系统中的多语言性,”IEEE会议论文集,第88卷,第8期,2000年8月,第1297-1313页。
Claims (37)
1.一种用于提供想要的号码簿登录项信息的号码簿助理方法,包括步骤:
(a)接收一个描述所述想要的号码簿登录项的语音信号;
(b)识别所述语音信号并且产生被识别的字序列;
(c)通过使用被存储在数据库中的一种被预先确定的语法规则和它的相关信息来翻译所述被识别的字序列以构成概念序列;
(d)根据被存储在所述数据库中的语义意义和它的相关信息以及它的当前系统状态来翻译所述概念序列,从而产生至少一个所述想要的号码簿登录项的候选者;
(e)查找对应于来自所述数据库的至少一个候选者的至少一个号码簿登录项信息;以及
(f)输出被确定的至少一个号码簿登录项信息。
2.如权利要求1中所述的方法,还包括用户的校正或确认步骤并且重复步骤(a)到(f)直到想要的号码簿登录项信息被确定。
3.如权利要求1中所述的方法,其中,步骤(a)还包括在接收一个语音信号之前的系统提示步骤。
4.如权利要求1中所述的方法,其中,所述被预先确定的语法规则和概念序列被用于描述包括登录项名字或登录项名字的至少一个字及其相关信息的想要的号码簿登录项。
5.如权利要求1中所述的方法,其中,所述被预先确定的语法规则通过经常被使用的语法模板和经常被使用的字被产生。
6.如权利要求5中所述的方法,其中,所述语法模板通过经常被使用的名词、名人的名字、成语、字符笔划、字母、字和字符根之一被产生。
7.如权利要求1中所述的方法,其中,所述数据库包括一个相关知识数据库和一个号码簿数据库。
8.如权利要求1中所述的方法,其中,步骤(b)还包括根据一个混淆表来扩展所述被识别的字序列的步骤。
9.如权利要求8中所述的方法,其中,所述混淆表被预先训练并且包括全部易被混淆的字、与它们相应的正确的字和出现概率。
10.如权利要求1中所述的方法,其中,步骤(b)还包括根据一个置信度表过滤出易被混淆的字对的置信度测量步骤。
11.如权利要求1中所述的方法,其中,步骤(d)还包括更新所述系统状态的步骤。
12.如权利要求1中所述的方法,其中,步骤(e)还包括产生一个请求更多信息的问题的步骤。
13.如权利要求12中所述的方法,其中,所述问题是请求用户提供更多信息、基于列表的确认和未决问题确认之一。
14.如权利要求7中所述的方法,其中,所述相关知识数据库包括字和它的使用频率、描述所述字的方式、语法规则、属性和相应的使用频率。
15.如权利要求7中所述的方法,其中,所述相关知识数据库包括通信概念和它的使用频率,相应的语法规则、语义意义和使用频率。
16.如权利要求7中所述的方法,其中,所述号码簿数据库包括多个登录项,其中每个登录项包括名字、电话号码、相关信息和使用频率。
17.如权利要求1中所述的方法,其中,所述至少一个候选者通过使用最大的后验概率和最大的似然性标准之一被产生。
18.如权利要求1中所述的方法,其中,所述方法是一种普通话号码簿助理方法。
19.一种驻留在计算机可读取的媒体上具有多个被存储在其上的指令的计算机程序产品,当它被一个处理器执行时,导致所述处理器去:
-接收一个描述所述想要的号码簿登录项的语音信号;
-识别所述语音信号并且产生被识别的字序列;
-通过使用一种被存储在数据库中的被预先确定的语法规则和它的相关信息翻译所述被识别的字序列以便构成概念序列;
-根据被存储在所述数据库中的语义意义和它的相关信息以及它的当前系统状态翻译所述概念序列,从而产生所述想要的号码簿登录项的至少一个候选者;
-查找对应于来自所述数据库的至少一个候选者的至少一个号码簿登录项信息;以及
-输出被确定的至少一个号码簿登录项信息。
20.一种用于提供想要的号码簿登录项信息的号码簿助理设备,包括:
-一个用于存储号码簿登录项信息、语法规则和概念序列的数据库;
-一个用于接收描述想要的号码簿登录项的语音信号、识别所述语音信号并且产生被识别的字序列的声音识别单元;
-一个语音翻译单元,用于通过使用一种被存储在数据库中的预先确定的语法规则和它的相关信息来翻译被识别的字序列以构成概念序列,以及根据被存储在所述数据库中的语义意义和它的相关信息及当前系统状态翻译所述概念序列,从而产生所述想要的号码簿登录项的至少一个候选者;
-一个用于查找对应于来自所述数据库的至少一个候选者的至少一个号码簿登录项信息的查找单元;以及
-一个用于输出被确定的至少一个号码簿登录项信息的输出单元。
21.如权利要求20中所述的号码簿助理设备,其中,所述被预先确定的语法规则和概念序列被用于描述包括登录项名字或登录项名字的至少一个字及其相关信息的想要的号码簿登录项。
22.如权利要求20中所述的号码簿助理设备,其中,所述数据库包括一个相关知识数据库和一个号码簿数据库。
23.如权利要求22中所述的号码簿助理设备,其中,所述相关知识数据库包括字和它的使用频率、描述所述字的方式、语法规则、属性和相应的使用频率。
24.如权利要求22中所述的号码簿助理设备,其中所述相关知识数据库包括通信概念和它的使用频率、相应的语法规则、语义意义和使用频率。
25.如权利要求22中所述的号码簿助理设备,其中,所述号码簿数据库包括多个登录项,其中每个登录项包括名字、电话号码、相关信息和使用频率。
26.如权利要求20中所述的号码簿助理设备,其中,所述被预先确定的语法规则通过经常被使用的语法模板和经常被使用的字被产生。
27.如权利要求26中所述的号码簿助理设备,其中,所述语法模板通过经常被使用的名词、名人的名字、成语、字符笔划、字母、字和字符根之一被产生。
28.如权利要求20中所述的号码簿助理设备,其中,所述声音识别单元还包括一个用于识别所述语音信号并且产生被识别的字序列的语音识别单元。
29.如权利要求20中所述的号码簿助理设备,其中,所述声音识别单元还包括一个用于根据一个混淆表来扩展所述被识别的字序列的混淆分析器。
30.如权利要求29中所述的号码簿助理设备,其中,所述混淆表被预先训练并且包括全部易被混淆的字、它们相应正确的字和出现概率。
31.如权利要求20中所述的号码簿助理设备,其中,声音识别单元还包括一个用于根据一个置信度表过滤出易被混淆的字对的置信度测量单元。
32.如权利要求20中所述的号码簿助理设备,其中,所述语音翻译单元不断更新所述系统状态。
33.如权利要求20中所述的号码簿助理设备,还包括一个用于产生一个请求更多信息的问题的问题发生器。
34.如权利要求33中所述的号码簿助理设备,其中所述问题是请求用户提供更多信息、基于列表的确认和未决问题确认之一。
35.如权利要求20中所述的号码簿助理设备,其中,所述至少一个候选者通过使用最大的后验概率和最大的似然性标准之一被产生。
36.如权利要求20中所述的号码簿助理设备,其中,所述输出单元是一种语音输出单元。
37.如权利要求20中所述的号码簿助理设备,其中,所述号码簿助理设备是一种普通话号码簿助理设备。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02102454 | 2002-10-16 | ||
EP02102454.2 | 2002-10-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1706173A true CN1706173A (zh) | 2005-12-07 |
CN100502441C CN100502441C (zh) | 2009-06-17 |
Family
ID=32103995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003801015184A Expired - Lifetime CN100502441C (zh) | 2002-10-16 | 2003-10-08 | 号码簿助理方法和设备 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1554864B1 (zh) |
JP (1) | JP2006503328A (zh) |
KR (1) | KR20050056242A (zh) |
CN (1) | CN100502441C (zh) |
AU (1) | AU2003264790A1 (zh) |
TW (1) | TWI307845B (zh) |
WO (1) | WO2004036887A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107577656A (zh) * | 2017-07-12 | 2018-01-12 | 中国科学院自动化研究所 | 文本隐含语义激活方法及系统 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102404358A (zh) * | 2010-09-10 | 2012-04-04 | 中华电信股份有限公司 | 远程电话簿系统 |
JP6310150B2 (ja) | 2015-03-20 | 2018-04-11 | 株式会社東芝 | 意図理解装置、方法およびプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU5803394A (en) | 1992-12-17 | 1994-07-04 | Bell Atlantic Network Services, Inc. | Mechanized directory assistance |
JPH086940A (ja) * | 1994-06-16 | 1996-01-12 | Hitachi Ltd | 音声入力方式およびそれを用いた情報処理装置 |
MX9702759A (es) | 1994-10-25 | 1997-07-31 | British Telecomm | Servicios operados por voz. |
GB9601925D0 (en) | 1996-01-31 | 1996-04-03 | British Telecomm | Database access |
JP3435471B2 (ja) * | 1996-03-29 | 2003-08-11 | 日本電信電話株式会社 | 情報検索後処理方法と装置及び情報検索システム |
JPH11153998A (ja) * | 1997-11-19 | 1999-06-08 | Canon Inc | 音声応答装置及びその方法、コンピュータ可読メモリ |
JP3035261B2 (ja) * | 1998-03-20 | 2000-04-24 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 日本語構文解析装置 |
JP2002532763A (ja) | 1998-12-17 | 2002-10-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声によって動作される自動問合せシステム |
WO2002029620A1 (fr) * | 2000-10-02 | 2002-04-11 | Fujitsu Limited | Systeme d'extraction de caractere, procede d'extraction de caractere, et support d'enregistrement lisible par ordinateur |
JP2002148181A (ja) * | 2000-11-07 | 2002-05-22 | Hioki Ee Corp | フローインジェクション分析装置 |
US6934683B2 (en) * | 2001-01-31 | 2005-08-23 | Microsoft Corporation | Disambiguation language model |
JP2001357064A (ja) * | 2001-04-09 | 2001-12-26 | Toshiba Corp | 情報共有支援システム |
-
2003
- 2003-10-08 AU AU2003264790A patent/AU2003264790A1/en not_active Abandoned
- 2003-10-08 JP JP2004544575A patent/JP2006503328A/ja active Pending
- 2003-10-08 CN CNB2003801015184A patent/CN100502441C/zh not_active Expired - Lifetime
- 2003-10-08 KR KR1020057006435A patent/KR20050056242A/ko not_active Application Discontinuation
- 2003-10-08 EP EP03808828A patent/EP1554864B1/en not_active Expired - Lifetime
- 2003-10-08 WO PCT/IB2003/004429 patent/WO2004036887A1/en active Application Filing
- 2003-10-13 TW TW092128283A patent/TWI307845B/zh not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107577656A (zh) * | 2017-07-12 | 2018-01-12 | 中国科学院自动化研究所 | 文本隐含语义激活方法及系统 |
CN107577656B (zh) * | 2017-07-12 | 2020-02-14 | 中国科学院自动化研究所 | 文本隐含语义激活方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN100502441C (zh) | 2009-06-17 |
EP1554864B1 (en) | 2012-11-21 |
WO2004036887A1 (en) | 2004-04-29 |
KR20050056242A (ko) | 2005-06-14 |
AU2003264790A1 (en) | 2004-05-04 |
EP1554864A1 (en) | 2005-07-20 |
TWI307845B (en) | 2009-03-21 |
TW200419387A (en) | 2004-10-01 |
JP2006503328A (ja) | 2006-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6067520A (en) | System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
Gaurav et al. | Development of application specific continuous speech recognition system in Hindi | |
EP1623412B1 (en) | Method for statistical language modeling in speech recognition | |
WO2003058602A2 (en) | Grammar and index interface to a large database of changing records | |
CN1187693C (zh) | 以自底向上方式将声调集成到汉语连续语音识别系统中的方法和系统 | |
Schlippe et al. | Grapheme-to-phoneme model generation for Indo-European languages | |
Le et al. | Spoken and Written Language Resources for Vietnamese. | |
Alsharhan et al. | Evaluating the effect of using different transcription schemes in building a speech recognition system for Arabic | |
Ronzhin et al. | Russian voice interface | |
Boulianne | Phoneme transcription of endangered languages: an evaluation of recent ASR architectures in the single speaker scenario | |
CN100502441C (zh) | 号码簿助理方法和设备 | |
Wang et al. | YINHE: a Mandarin Chinese version of the GALAXY system. | |
Safarik et al. | Unified approach to development of ASR systems for East Slavic languages | |
EP2008268A1 (en) | Method and apparatus for building grammars with lexical semantic clustering in a speech recognizer | |
Schillo et al. | Grapheme based speech recognition for large vocabularies. | |
Karpov et al. | Speech Interface for Internet Service “Yellow Pages” | |
Bansal et al. | Development of Text and Speech Corpus for Designing the Multilingual Recognition System | |
Nouza et al. | A study on adapting Czech automatic speech recognition system to Croatian language | |
CN111782779A (zh) | 语音问答方法、系统、移动终端及存储介质 | |
Le et al. | First steps in building a large vocabulary continuous speech recognition system for Vietnamese | |
Jannedy et al. | Name pronunciation in German text-to-speech synthesis | |
Xu et al. | Robust and Fast Lyric Search based on Phonetic Confusion Matrix. | |
Choueiter et al. | New word acquisition using subword modeling. | |
Qaroush et al. | Automatic spoken customer query identification for Arabic language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: NUANCE COMMUNICATION INC. Free format text: FORMER OWNER: KONINKL PHILIPS ELECTRONICS NV Effective date: 20121219 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20121219 Address after: Massachusetts, USA Patentee after: Nuance Communications, Inc. Address before: Holland Ian Deho Finn Patentee before: Koninklijke Philips Electronics N.V. |
|
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20090617 |