CN100514985C - 电话号码检索系统和方法 - Google Patents
电话号码检索系统和方法 Download PDFInfo
- Publication number
- CN100514985C CN100514985C CNB2004101047887A CN200410104788A CN100514985C CN 100514985 C CN100514985 C CN 100514985C CN B2004101047887 A CNB2004101047887 A CN B2004101047887A CN 200410104788 A CN200410104788 A CN 200410104788A CN 100514985 C CN100514985 C CN 100514985C
- Authority
- CN
- China
- Prior art keywords
- telephone number
- word
- voice
- service
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000004044 response Effects 0.000 claims abstract description 49
- 238000003860 storage Methods 0.000 claims abstract description 6
- 238000010295 mobile communication Methods 0.000 claims description 24
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000005055 memory storage Effects 0.000 claims description 4
- 230000008447 perception Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000001994 activation Methods 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/2753—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/68—Details of telephonic subscriber devices with means for recording information, e.g. telephone number during a conversation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Exchange Systems With Centralized Control (AREA)
Abstract
本发明提供了一种控制电话号码检索的方法和系统。一个终端从电话号码服务中请求一个电话号码。包括电话号码是语音响应从电话号码服务中被接收。特征向量序列作为用于已接收的语音响应的参考模式被存储在终端的存储器中。该语音响应具有在多个电话号码之间和在多个电话号码当中指定的字。关键字定点程序搜索指定的字。包括电话号码的设置在指定的字之间和设置在指定的字之中的连接字被抽取并存储在缓存器中。号码识别器分析缓存器的内容。号码识别器输出已识别的电话号码,其用于显示在终端上和/或存储在存储器中,以备将来之用。
Description
技术领域
本发明涉及显示和存储电话号码。尤其是,本发明涉及用于从电话号码服务中显示和存储电话号码的电话号码检索系统。
背景技术
如果用户不知道电话号码,则用户就会请求用于辅助服务的电话号码服务。电话号码服务的操作者接收来自用户,例如商店或者百货公司的电话号码请求。执行电话号码搜索。电话号码服务经由自动响应服务(ARS)提供电话号码给用户。用户写下或者存储例如由ARS的机械声音提供的电话号码。用户例如经由自动链接功能请求电话号码,自动链接功能基于用户的命令拨电话号码。
如果例如由于噪声,用户不能理解ARS的机械声音,则用户需要再次联络电话号码服务。这种不方便导致时间损失,并且可以导致支付一个或多个额外的费用去接入电话号码服务。如果用户不想使用自动链接服务,则用户被要求记录电话号码。忘记或者丢失电话号码的用户必须再次使用电话号码服务,这就导致用户时间和钱财的损失。
图1和2举例说明现有技术电话号码服务的例子,其自动地拨由用户请求的电话号码。在一个现有技术的例子中,常规的神经网络算法接收并学习ARS的机械声音。常规的神经网络算法难以从ARS的机械声音中辨别话务员的语音。常规的电话号码服务使用机械声音识别算法,诸如隐藏的马尔可夫模型(HMM)或者神经电路,其取决于说话者的语音。使用隐藏的马尔可夫模型(HMM)或者神经电路网络预置的ARS机械声音提供低的效率,而且不具有准确地确定电话号码的性能。
孤立字识别算法难以从目标电话号码和/或其它的信息中辨别由ARS说出的字。如果语音类型或者自动响应类型被改变,则常规的语音识别算法不能有效地适合于这些变化,以准确地接收想要的电话号码。
因此,存在对电话号码检索系统的需要,其对现有技术系统提供改进,诸如甚至改进在嘈杂的环境条件之下电话号码的识别,以及提供其它的优点,诸如如果用户希望在以后的时间里打电话,则具有一个存储电话号码的能力。
发明内容
本发明是一种电话号码检索系统。在此处公开的电话号码检索系统从电话号码服务中显示和/或存储电话号码。该系统提供了一种对与常规的电话号码检索系统有关的问题的解决方案,诸如在嘈杂的条件之下识别电话号码,当响应一个响应系统或者语音类型的变化时更新性能,以及在用户希望打电话之前存储电话号码。
按照一个实施例,电话号码检索系统与诸如自动响应服务(ARS)这样的电话号码服务相联系。自动响应服务例如使用参考矢量序列。参考矢量序列从自动响应服务中指定一种格式,其中指定的字或者字句被加在电话号码的数字之前和之后。指定的字是由关键字定点程序识别的。连接指定的字的数字被抽取和处理,以生成一个已识别的电话号码。
在一个实施例中,连接在指定的字之间的语音信号被存储在缓存器中。缓存器的内容驱动号码识别器。号码识别器处理内容,并且输出一个电话号码服务的已识别的电话号码。已识别的电话号码被显示在终端上,和/或存储在诸如缓存器的这样的存储器中。
在另一个实施例中,动态时间偏离(DTW)被用作号码识别器。DTW利用数字序列(诸如,从0到9)生成一个特征向量序列。该特征向量序列定义一个用于确定习惯于生成电话号码的号码位置的矢量参考模式。按照系统的一个供选择的实施例,特征向量序列被预先定义。在该系统的又一个实施例中,特征向量序列是使用Mel频率Cepstral系数(MFCC),线性的预测Cepstral系数(LPCC)或者感性的线性预测(PLP)生成的。在该系统的又一个供选择的实施例中,特征向量适合于电话号码服务的特定的格式。
在另一个实施例中,当ARS在语音类型或者响应类型方面具有变化时,除了DTW之外,隐藏的马尔可夫模型(HMM),矢量量化(VQ),或者神经网络(NN)可以用于识别连接字,一个用于特征向量的适宜的参考模式被重新下载并存储。
根据本发明的第一方面,提供一种用于在移动通信设备中在缓存器中显示和/或存储已识别的电话号码以便将来由用户检索的方法,所述方法包括步骤:接入一个电话号码服务;接收一个来自电话号码服务的语音响应,该语音响应包括电话号码部分;在语音响应内按照关键字定点程序搜索电话号码服务的至少一个指定的字;在缓存器中抽取和存储在指定字之间的电话号码;由号码识别器从缓存器读取内容并识别电话号码;和传送用于由用户查看的已识别的电话号码给显示器和存储位置中的至少一个。
根据本发明的第二方面,提供一种用于移动通信终端的在与特定的字之间的电话号码相关的存储器中存储特定的参考特征向量序列的方法,所述方法包括:搜索一个接入电话服务的终端,该电话号码服务用于话务员语音和ARS的机械声音的至少一个;利用关键字定点程序在话务员的语音和自动响应系统的机械声音的至少一个中搜索第一指定字和第二指定字;在缓存器中存储在已搜索的第一指定字和第二指定字之间的语音响应;对存储在缓存器中的语音响应应用一种字识别算法;从缓存器的内容中识别电话号码,和在显示器上显示已识别的电话号码,并且在终端的电话簿中以参考特征向量序列的形式存储电话号码。
根据本发明的第三方面,提供一种用于管理在移动通信系统中互通的消息的移动通信设备,所述移动通信设备包括:一个RF模块,它包括在移动通信系统中互通消息的发射机和接收机;和用于接入一个电话号码服务的装置;用于接收一个来自电话号码服务的语音响应的装置,该电话号码服务包括电话号码部分;处理器,用于在语音响应内按照关键字定点程序来搜索电话号码服务的至少一个指定的字,并在缓存器中抽取和存储在指定的字之间的电话号码;号码识别器,用于从缓存器读取内容并识别电话号码;和显示器,用于显示已识别的电话号码以便由用户查看以备将来之用。
根据本发明的第四方面,提供一种用于与移动通信系统中的终端进行无线电通信的网络,所述网络包括:在移动通信网络中通信的至少一个发射机和至少一个接收机;用于接入一个电话号码服务的装置;用于接收一个来自电话号码服务的语音响应的装置,该电话号码服务包括一个电话号码部分;处理器,用于在语音响应内按照关键字定点程序来搜索电话号码服务的至少一个指定的字,并在缓存器中抽取和存储在指定的字之间的电话号码;号码识别器,用于从缓存器读取内容并识别电话号码;和显示器,用于显示已识别的电话号码以便由用户查看以备将来之用。
本发明的附加的特点和优点将在随后的描述中阐述,并且该描述在某种程度上是清晰可见的,或者可以通过实践本发明来得到。应当明白,上文的概述和下面的本发明的详细说明是示范性和说明性的,并且作为权利要求意欲对发明提供进一步的说明。
对于那些本领域技术人员来说,从下列与附图有关的实施例的详细说明中,这些和其它的实施例也将变得更加显而易见的,本发明不局限于公开的任何特定的实施例。
附图说明
附图被包括以提供对本发明进一步的理解,并且被结合进而构成本说明书的一部分,其举例说明本发明的实施例,并且与说明书一起可以起解释本发明原理的作用。
在不同的附图中,按照一个或多个实施例由相同的数字提及的本发明的特点,单元和方面,表示相同的,等效的或者类似的特点,单元或者方面。
图1是一个举例说明用于通过神经网络算法来搜索和自动地拨电话号码的现有技术常规的装置的结构图。
图2是一个举例说明现有技术常规的用于通过与说话者相关的孤立字识别算法来识别和自动地拨电话号码的顺序步骤的流程图。
图3是一个举例说明按照发明实施例的用于显示和存储自动响应电话号码的方法的流程图。
图4是一个举例说明按照本发明实施例的用于显示和存储自动响应电话号码的方法的顺序步骤的流程图。
图5是举例说明按照本发明一个实施例的移动通信设备的方框图。
图6是举例说明按照本发明一个实施例的UTRAN的方框图。
具体实施方式
本发明涉及显示和存储来自电话服务的电话号码。尤其是,本发明是用于在移动终端上显示和存储来自语音或者其它的响应系统,诸如自动响应系统(ARS)的自动响应电话号码的电话号码检索系统和方法。自动响应电话号码被显示在终端上,供用户实际上同时使用,和/或存储在终端的电话簿中稍后供用户使用。这个存储特点允许用户有选择地打电话。
电话号码检索系统对与常规的响应系统有关的问题提供一种解决方案,诸如通过提供指定的序列在嘈杂的条件之下识别电话号码。当语音类型或者响应改变时,通过下载一个电话号码服务的向量序列,电话号码检索系统提供更新性能和通用性。电话号码检索系统具有在用户希望打电话以前,用于存储电话号码的存储器存储容量。
虽然电话号码检索系统是相对于一个终端举例说明的,但期待本发明可以在任何的通信设备中应用于显示和存储来自响应系统的电话号码。在下面的详细描述中,公知的功能或者结构不做详细描述,因为不必要的细节将使本发明难以理解。
用户接入一个希望从电话号码服务来得到电话号码的移动终端,该电话号码服务具有诸如自动响应系统(ARS)这样的响应系统。移动终端可以是任何的移动通信设备,诸如蜂窝移动电话,移动电话,PDA等等。在一个供选择的检索系统的实施例中,终端可以是一个基站终端。
在生产终端期间,参考特征向量序列被预先准备和存储在存储器中。指定的字被预先存储在终端的存储器中,其是包括电话号码的自动响应的一部分的字。参考特征向量表示将要传送给用户的电话号码的格式。
用户从终端使用常规的信息数字请求常规的电话服务以获得一个电话号码。电话号码服务从ARS以形式化了的格式提供一个电话号码给用户。该格式可以是诸如:“号码是xxx-xxxx。号码是xxx-xxxx。如果你想要你的呼叫直接连接,则请按号码1。你将为你的请求成功付费100”。X表示例如从0到9的数字。
在一个例子中,由用户请求的使用者是234-5678。ARS经由移动终端扬声器提供一个机械声音给用户,诸如“号码是234-5678。号码是234-5678。如果你想要你的呼叫直接连接,则请按号码1。你将为你的请求成功付费100”。
号码检索系统作为接收的语音响应,诸如机械声音来接收电话号码。接收的语音响应是通过号码检索系统对于指定的关键字搜索的,例如只有要接入的电话号码服务才有的。搜索是通过一个关键字定点程序对于在指定的关键字之间或者在指定的关键字之中的连接字执行的。关键字定点程序从顺序的关键字中抽取有意义的关键字,示出类似电话号码服务的ARS的有关相同的扬声器的相同的语音近似完整的精度。因此,对应于号码的语音数据可以近似完整的精确度从ARS的语音中分离出来。
参考图3,表示大量电话号码的连接字被存储在缓存器中(S10)。号码识别器处理在缓存器中的内容(S20),以识别电话号码。已识别的电话号码被显示在诸如LCD这样的显示器上,或者存储在存储器中(S30)。
如果ARS的响应类型被改变,则更新电话检索系统的内容是为准确地识别电话号码所必需的。例如,如果电话号码服务(诸如ARS)的语音类型或者响应类型被改变,则终端的软件必须升级。更新可以通过经由有线和/或无线因特网接入连接,从因特网下载参考模式、特征向量序列或者参数文件来发生。在一个实施例中,电话号码服务具有一种格式变化,并且服务提供者通知用户如何去下载已改变的内容,并且以商业模式的形式收费。
电话检索系统其它的特点包括接收信号的预先处理。语音预先处理技术抽取接收的语音响应的特征。使用的某些语音预先处理技术的例子包括:Mel频率Cepstral系数(MFCC),线性的预测Cepstral系数(LPCC)或者感性的线性预测(PLP)。
在一个例子中,用户请求电话号码服务,由用户的终端接收的包括“号码是”的语音响应是在关键字定点程序中用于搜索的指定的关键字。号码的参考向量序列确认在指定的关键字之间的连接字,其包含电话号码。与连接字有关的号码被处理并显示在终端上,供用户使用或者在存储器中存储以备将来之用。
参考图4,具有诸如便携式终端或者常规的有线电话这样的终端的用户请求电话号码服务,已接收的语音,即,话务员的语音和ARS的机械声音被搜索(S100)。终端在其存储器中存储由语音预先处理技术定义的参考特征向量序列“号码是0、1、2、3、4、5、6、7、8、9”。
从所接收的语音中通过关键字定点算法作为关键字来搜索“号码是”(S110)。在由关键字定点算法搜索“号码是”之后,从检测的语音作为关键字再次搜索说出的短语“号码是”(S120)。由关键字定点算法搜索的在“号码是”和“号码是”之间的语音信号被存储在缓存器中(S130)。语音信号包括表示电话号码的号码信息。尔后,在这个实施例中,号码信息是通过连接字识别算法,诸如动态时间偏离(DTW)识别的。特征向量序列“0、1、2、3、4、5、6、7、8、9”被用作参考模式(S140)。
在此处公开的电话号码检索系统与现有技术系统不同,该系统提供了监控接收的语音特征的变化。在此处公开的电话号码检索系统按照与向量参考模式相比较的时间轴监控变量,诸如接收的语音的持续时间,在大量电话号码之间的指定字的长度,和号码的位置。
相比之下,如果不监控这些变量和考虑这些变量,则可能导致错误或者号码识别失败。利用基于来自Vintsynk、Chiba和Sakoe的动态编程(DP)的时间轴非线性弹性匹配方法的软件算法,诸如DTW可以有效地处理这些接收的语音持续时间变化。
在号码被识别之后,识别结果被显示在终端的显示屏上,或者存储在终端的电话薄中(S150),使得用户可以在任何时候调用电话号码。
如以前论述的,用于显示和存储自动响应电话号码的方法通过使用关键字定点算法和连接字识别算法,以很少的计算来精确地从ARS的语音中识别和搜索电话号码,并且在终端的显示器上显示电话号码,或者在终端的电话薄中存储电话号码,以便用户可以方便地使用电话号码。
此外,一旦用户请求电话号码服务,他/她不必再次请求电话号码服务或者搜索电话号码摘录。用户可以在任何时候调用存储在终端中的电话号码,这使用户感到非常地舒服。经济上这也是有益的。
虽然参考某些优选实施例已经示出和描述了本发明,但是那些本领域技术人员应理解,可以在形式和细节方面进行各种各样的变化。例如,当连接字是由隐藏的马尔可夫模型(HMM),矢量量化(VQ)或者神经网络(NN)以及DTW识别时,可以适用本发明。此外,如果机械声音或者ARS的响应类型是通过电话号码服务改变的,则其可以通过下载改变的内容来处理。此外,如在下面进行描述的,以上所述的方法适用于任何的移动通信设备和/或基站终端。
参考图5,举例说明了本发明的移动通信设备500的方框图,诸如一个用于执行本发明方法的移动电话。移动通信设备500包括:处理单元510,诸如微处理器或者数字信号处理器,RF模块535,功率管理模块505,天线540,电池555,显示器515,小键盘520,存储单元530,诸如闪存,ROM或者SRAM,扬声器545和麦克风550。
用户例如通过按压小键盘520的按键,或者通过使用麦克风550语音激活来输入命令信息,诸如电话号码。处理单元510接收和处理命令信息,以执行适宜的功能,诸如拨电话号码。操作数据可以从存储单元530中恢复以执行功能。此外,处理单元510可以在显示器515上显示命令和操作信息,以方便用户参考。
处理单元510发出命令信息给RF模块535,以启动通信,例如发射包括话音通信数据的无线电信号。RF模块535包括接收机和发射机,以接收和发射无线电信号。天线540方便无线电信号的发射和接收。一旦接收到无线电信号,RF模块535可以转发和变换信号为基带频率,以便由处理单元510处理。处理的信号将被转换为经由扬声器545输出的听得见的或者可读的信息。
处理单元510适合于执行在上面的图3-4中举例说明的方法。作为一个例子,处理单元510适合于接入一个电话号码服务和从包括电话号码部分的电话号码服务中接收语音响应。处理单元在语音响应内按照关键字定点程序来搜索电话号码服务的至少一个指定的字。在指定的字之间的号码被抽取和存储在缓存器中。号码识别器读取缓存器的内容,并且处理来自缓存器的已识别的电话号码。已识别的电话号码被传送给显示器,诸如移动终端,用于由用户查看,和/或传送给一个存储位置,诸如在移动终端上的电话号簿,以备将来之用。如上在图3和4中所述的其它的特点可以同样结合进处理单元510之内。
处理单元510在存储单元530中存储从其它的用户接收的消息和发送给其它的用户的消息,接收用于由用户输入的消息的条件请求,处理条件请求以对应于条件请求从存储单元中读出数据。处理单元510输出信息数据给显示单元515。存储单元530适合于存储接收的和发送的两个消息的消息数据。
图6举例说明一个按照本发明的优选实施例的UTRAN 600的方框图。UTRAN 600包括一个或多个无线电网络子系统(RNS)625。每个RNS625包括一个无线电网络控制器(RNC)623和多个由RNC管理的节点B(基站)621。RNC623处理无线电资源的分配和管理,并且相对于核心网络起一个的接入点的作用。此外,RNC 623适合于执行本发明的方法。
节点B 621接收由终端的物理层经由上行链路发送的信息,和经由下行链路发送数据给终端。节点B 621起用于终端的UTRAN 600的接入点或者发射机和接收机的作用。对于一个本领域技术人员来说将是显而易见的,可以容易地或者单独或者与外部支持逻辑相结合使用,例如处理单元510(图5的)或者其它的数据或者数字处理设备来实施移动通信设备500。
通过利用本发明,如上在图3-4中所述,移动通信设备的用户可以存储多媒体数据。作为一个例子,控制器623适合于接入一个电话号码服务和从包括电话号码部分的电话号码服务中接收语音响应。控制器单元在语音响应内按照关键字定点程序搜索电话号码服务的至少一个指定的字。在指定的字之间的大量电话号码被抽取和存储在缓存器中。号码识别器读取和处理缓存器的内容,生成已识别的电话号码。已识别的电话号码被传送给显示器以便由用户查看和/或被传送给一个存储位置以备将来之用。
对于一个本领域技术人员来说将是显而易见的,可以容易地或者单独或者与外部支持逻辑相结合使用,例如处理单元510(图5的)或者其它的数据或者数字处理设备来实施本发明的优选实施例。
虽然在移动通信的范围中描述了本发明,但是本发明还可以在任何一种使用移动设备的无线通信系统中使用,诸如PDA和配备有无线通信性能的便携式计算机。此外,对于描述本发明所使用的某些术语不应限制于本发明范围的某些类型的无线通信系统,诸如UMTS。本发明还可适用于其它的使用不同的空中接口和/或物理层的无线通信系统,例如,TDMA,CDMA,FDMA,WCDMA等等。
优选实施例可以作为方法,装置或者使用标准程序和/或施工技术制造的产品来实施,以产生软件,程序包,硬件或者其任意的组合。在此处使用的术语“制造的产品”指的是以硬件逻辑(例如,集成电路片,现场可编程门阵列(FPGA),专用集成电路(ASIC)等等)实现的代码或逻辑,或者计算机可读介质(例如,磁存储介质(例如,硬盘驱动器,软盘,磁带等等),光存储(CD-ROM,光盘等等),易失的和非易失性存储器设备(例如,EEPROM,ROM,PROM,RAM,DRAM,SRAM,程序包,可编程逻辑等等)。
在计算机可读介质中的代码是由处理器访问和执行的。其中优选实施例执行的代码可以进一步经由传输介质或者经网络从文件服务器访问。在此情况下,其中代码被实现的制造的产品可以包括传输介质,诸如网络传输线,无线传输介质,信号经由空间,无线电波,红外信号等等传送。当然,那些本领域技术人员将理解,不脱离本发明的范围可以对这些结构进行很多的修改,而且制造的产品可以包括在本领域已知的任何信息承载媒体中。
在附图中示出的逻辑实施例描述了作为以特定的顺序发生的特定的操作。在供选择的实施例中,某些逻辑操作可以以不同的顺序实施,修改或者除去,并且仍然实现本发明的优选实施例。此外,步骤可以被添加给以上所述的逻辑,并且仍然符合本发明的实施例。
上述的实施例和优点仅仅是示范性的,并且不应理解为限制本发明。当前的教导可以容易地应用于其它类型的装置。本发明的描述意图是说明性的,而不是限制权利要求的范围。对于那些本领域技术人员来说许多的替换,修改和变化将是显而易见的。因此,本发明不局限于在上文中详细描述的那些明确的实施例。
对于权利要求,申请人的意图是权利要求不按照U.S.C.章节11235的第六段落解释,除非使用的术语“装置”后面有功能性陈述。
在那些权利要求中,装置加功能从句意图是当执行列举的功能时覆盖在此处描述的结构,以及不仅仅是结构上的等效,而且是等效的结构。此外,对于权利要求,应当明白,在下面进行描述的任何一个权利要求都可以为了发明的目的而被合并。
Claims (37)
1.一种用于在移动通信设备中在显示器上显示已识别的电话号码和/或在存储器中存储已识别的电话号码以便将来由用户检索的方法,其特征在于,所述方法包括步骤:
接入一个电话号码服务;
接收一个来自电话号码服务的语音响应,该语音响应包括电话号码部分;
在语音响应内按照关键字定点程序搜索电话号码服务的至少一个指定的字;
在缓存器中抽取和存储在指定字之间的电话号码;
由号码识别器从缓存器读取内容并识别电话号码;和
传送用于由用户查看的已识别的电话号码给显示器和存储位置中的至少一个。
2.根据权利要求1的方法,其特征在于,所述电话号码服务是一种自动响应系统。
3.根据权利要求1的方法,其特征在于,所述电话号码服务具有语音类型或者响应类型,该类型如果被改变,则终端将下载参数文件以保持电话服务的高性能。
4.根据权利要求1的方法,其特征在于,所述方法进一步包括步骤:
由服务提供者提供用户信息,即如何去下载已改变的内容,其中所述电话号码服务具有一种格式变化,以及
以商业模式的形式收费。
5.根据权利要求1的方法,其特征在于,所述方法进一步包括步骤:
当电话号码服务的语音类型或者响应类型被改变,且终端的软件需要升级的时候,更新可以通过经由因特网接入连接,从因特网下载参考模式来发生。
6.根据权利要求1的方法,其特征在于,所述方法进一步包括步骤:由用户从话务员的语音和自动响应系统的说话者相关的机械声音中至少一个收听电话号码。
7.根据权利要求1的方法,其特征在于,所述指定的字包含至少一个在电话号码的号码部分之前和之后的特定的字。
8.根据权利要求1的方法,其特征在于,从语音信号中已识别的电话号码是通过字识别算法识别的。
9.根据权利要求8的方法,其特征在于,所述字识别算法是一种DTW算法。
10.根据权利要求9的方法,其特征在于,所述DTW算法使用特征向量序列0至9作为参考模式。
11.根据权利要求8的方法,其特征在于,所述字识别算法是一种HMM算法。
12.根据权利要求8的方法,其特征在于,所述字识别算法是一种VQ算法。
13.根据权利要求8的方法,其特征在于,所述字识别算法是一种NN算法。
14.根据权利要求1的方法,其特征在于,所述方法进一步包括如下步骤:
一旦关键字定点程序结束,就通过语音预先处理技术产生特征向量并将该特征向量定义为序列。
15.根据权利要求14的方法,其特征在于,所述方法进一步包括:在终端的存储器中存储已定义的特征向量。
16.根据权利要求1的方法,其特征在于,语音响应利用包括MFCC的语音预先处理技术,用于抽取语音响应的特征。
17.根据权利要求14的方法,其特征在于,所述语音预先处理技术利用线性的预测Cepstral系数,其用于抽取语音响应的特征。
18.根据权利要求14的方法,其特征在于,所述语音预先处理技术利用感性的线性预测,其用于抽取语音响应的特征。
19.一种用于移动通信终端的在与特定的字之间的电话号码相关的存储器中存储特定的参考特征向量序列的方法,其特征在于,所述方法包括:
搜索一个接入电话服务的终端,该电话号码服务用于话务员语音和ARS的机械声音的至少一个;
利用关键字定点程序在话务员的语音和自动响应系统的机械声音的至少一个中搜索第一指定字和第二指定字;
在缓存器中存储在已搜索的第一指定字和第二指定字之间的语音响应;
对存储在缓存器中的语音响应应用一种字识别算法;
从缓存器的内容中识别电话号码,和
在显示器上显示已识别的电话号码,并且在终端的电话簿中以参考特征向量序列的形式存储电话号码。
20.根据权利要求19的方法,其特征在于,所述方法进一步包括步骤:
在应用关键字定点程序之后按照语音预先处理技术定义特征向量作为一个序列。
21.根据权利要求20的方法,其特征在于,所述语音预先处理技术利用Mel频率Cepstral系数,其用于抽取语音的特征。
22.根据权利要求20的方法,其特征在于,所述语音预先处理技术利用线性的预测Cepstral系数,用于抽取语音特征。
23.根据权利要求20的方法,其特征在于,所述语音预先处理技术利用感性的线性预测,其用于抽取语音特征。
24.根据权利要求20的方法,其特征在于,关键字定点程序使用“号码是”的特征向量序列作为参考模式。
25.根据权利要求20的方法,其特征在于,所述字识别算法是一种动态时间偏离算法。
26.根据权利要求25的方法,其特征在于,所述动态时间偏离算法使用特征向量序列“0、1、2、3、4、5、6、7、8、9”作为参考模式。
27.根据权利要求19的方法,其特征在于,所述字识别算法是一种隐藏的马尔可夫模型算法。
28.根据权利要求19的方法,其特征在于,所述字识别算法是一种矢量量化算法。
29.根据权利要求19的方法,其特征在于,所述字识别算法是一种神经网络算法。
30.一种用于管理在移动通信系统中互通的消息的移动通信设备,其特征在于,所述移动通信设备包括:
一个RF模块,它包括在移动通信系统中互通消息的发射机和接收机;和
用于接入一个电话号码服务的装置;
用于接收一个来自电话号码服务的语音响应的装置,该电话号码服务包括电话号码部分;
处理器,用于在语音响应内按照关键字定点程序来搜索电话号码服务的至少一个指定的字,并在缓存器中抽取和存储在指定的字之间的电话号码;
号码识别器,用于从缓存器读取内容并识别电话号码;和
显示器,用于显示已识别的电话号码以便由用户查看以备将来之用。
31.根据权利要求30的设备,其特征在于,所述电话号码服务是一种自动响应系统。
32.根据权利要求30的设备,其特征在于,所述电话号码服务具有语音类型或者响应类型,该类型如果被改变,则终端将下载参数文件以保持电话服务的高性能。
33.根据权利要求30的设备,其特征在于,所述电话号码服务具有一种格式变化,并且服务提供者通知用户如何去下载已改变的内容,并且以商业模式的形式收费。
34.一种用于与移动通信系统中的终端进行无线电通信的网络,其特征在于,所述网络包括:
在移动通信网络中通信的至少一个发射机和至少一个接收机;
用于接入一个电话号码服务的装置;
用于接收一个来自电话号码服务的语音响应的装置,该电话号码服务包括一个电话号码部分;
处理器,用于在语音响应内按照关键字定点程序来搜索电话号码服务的至少一个指定的字,并在缓存器中抽取和存储在指定的字之间的电话号码;
号码识别器,用于从缓存器读取内容并识别电话号码;
显示器,用于显示已识别的电话号码以便由用户查看以备将来之用;和
RNC,用于管理所述发射机和接收机。
35.根据权利要求34的网络,其特征在于,所述电话号码服务是一种自动响应系统。
36.根据权利要求34的网络,其特征在于,所述电话号码服务具有语音类型或者响应类型,该类型如果被改变,则终端将下载一个向量参考模式以改变电话服务的变量。
37.根据权利要求34的网络,其特征在于,所述电话号码服务具有一种格式变化,并且服务提供者通知用户如何去下载已改变的内容,并且以商业模式的形式收费。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2003-0076089 | 2003-10-29 | ||
KR1020030076089A KR100595610B1 (ko) | 2003-10-29 | 2003-10-29 | 전화번호 안내 방법 및 장치 |
KR1020030076089 | 2003-10-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1620083A CN1620083A (zh) | 2005-05-25 |
CN100514985C true CN100514985C (zh) | 2009-07-15 |
Family
ID=36782389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004101047887A Expired - Fee Related CN100514985C (zh) | 2003-10-29 | 2004-10-29 | 电话号码检索系统和方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7356356B2 (zh) |
EP (1) | EP1528773B1 (zh) |
KR (1) | KR100595610B1 (zh) |
CN (1) | CN100514985C (zh) |
AT (1) | ATE333750T1 (zh) |
DE (1) | DE602004001563T2 (zh) |
ES (1) | ES2268564T3 (zh) |
PT (1) | PT1528773E (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2513018A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | Method for training a proxy server for content delivery based on communication of state information from a mobile device browser |
CA2513019A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method for communicating state information between a server and a mobile device browser with version handling |
CA2513016A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A secure method of synchronizing cache contents of a mobile browser with a proxy server |
CA2513022A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | System and method for communicating state management between a browser user-agent and a mobile data server |
CA2513014A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method of controlling delivery of multi-part content from an origin server to a mobile device browser via a proxy server |
CA2513010A1 (en) * | 2005-07-22 | 2007-01-22 | Research In Motion Limited | A method for detecting state changes between data stored in a first computing device and data retrieved from a second computing device |
KR100705580B1 (ko) * | 2005-08-04 | 2007-04-10 | 삼성전자주식회사 | 브이오아이피 단말 및 그 단말의 정보관리방법 |
US20080208594A1 (en) * | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
US8761815B2 (en) | 2007-03-21 | 2014-06-24 | Motorola Mobility Llc | Method, device and system for accessing mobile device user information |
US8130275B2 (en) * | 2008-06-13 | 2012-03-06 | Nintendo Co., Ltd. | Information-processing apparatus, and storage medium storing a photographing application launch program executed by information-processing apparatus |
CN101651730B (zh) * | 2009-06-30 | 2012-02-29 | 重庆重邮信科通信技术有限公司 | 一种电话簿条目快速读取方法 |
US20110014952A1 (en) * | 2009-07-15 | 2011-01-20 | Sony Ericsson Mobile Communications Ab | Audio recognition during voice sessions to provide enhanced user interface functionality |
US9137342B2 (en) | 2012-08-22 | 2015-09-15 | Mitel Networks Corporation | Automatic contact population |
KR101380430B1 (ko) * | 2012-12-20 | 2014-04-01 | 주식회사 팬택 | 통화 중 편의정보를 제공하는 휴대 단말 및 휴대 단말 상에서 통화 중 편의정보를 제공하는 방법 |
KR20160003504A (ko) | 2014-07-01 | 2016-01-11 | 김윤희 | 사용자의 음성 분석을 이용하는 전화 번호 안내 시스템 및 전화 번호 안내 방법 |
US10223066B2 (en) * | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
KR20190138915A (ko) * | 2018-06-07 | 2019-12-17 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297183A (en) | 1992-04-13 | 1994-03-22 | Vcs Industries, Inc. | Speech recognition system for electronic switches in a cellular telephone or personal communication network |
JPH1084419A (ja) * | 1996-09-06 | 1998-03-31 | Brother Ind Ltd | 電話番号検索システム |
JP3055514B2 (ja) * | 1997-12-05 | 2000-06-26 | 日本電気株式会社 | 電話回線用音声認識装置 |
JPH11252283A (ja) | 1998-03-06 | 1999-09-17 | Canon Inc | 携帯情報端末、携帯情報端末の制御方法および記憶媒体 |
KR100273642B1 (ko) | 1998-06-22 | 2000-12-15 | 윤종용 | 안내 음성 디스플레이 기능을 갖는 전화 단말 장치 및 그 제어방법 |
KR20000003371A (ko) | 1998-06-27 | 2000-01-15 | 윤종용 | 휴대통신단말기에서 전화번호 안내 서비스 시 전화번호 표시장치 및 방법 |
US6570964B1 (en) * | 1999-04-16 | 2003-05-27 | Nuance Communications | Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system |
CN1166155C (zh) | 1999-07-28 | 2004-09-08 | 三菱电机株式会社 | 便携电话机 |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
KR20010008179A (ko) | 2000-11-14 | 2001-02-05 | 이근철 | 음성 인식을 이용한 전화 안내 서비스 표시 방법 및시스템 |
US6868267B1 (en) * | 2000-11-17 | 2005-03-15 | Qualcomm Inc. | Apparatus, method, and article of manufacture used to invoice for services consumed in a communications network |
US6915262B2 (en) * | 2000-11-30 | 2005-07-05 | Telesector Resources Group, Inc. | Methods and apparatus for performing speech recognition and using speech recognition results |
US6731724B2 (en) * | 2001-01-22 | 2004-05-04 | Pumatech, Inc. | Voice-enabled user interface for voicemail systems |
KR20020065229A (ko) | 2001-02-06 | 2002-08-13 | (주)유니와이드 테크놀러지 | 지능형 전화서비스 시스템 |
JP2002300306A (ja) * | 2001-03-30 | 2002-10-11 | Tsubasa System Co Ltd | 電話番号情報配信方法、電話番号情報配信プログラム、電話番号情報配信システム |
JP2003152856A (ja) * | 2001-11-15 | 2003-05-23 | Nec Corp | 通信端末装置、通信方法、およびそのプログラム |
US7174191B2 (en) * | 2002-09-10 | 2007-02-06 | Motorola, Inc. | Processing of telephone numbers in audio streams |
-
2003
- 2003-10-29 KR KR1020030076089A patent/KR100595610B1/ko not_active IP Right Cessation
-
2004
- 2004-10-28 PT PT04025687T patent/PT1528773E/pt unknown
- 2004-10-28 EP EP04025687A patent/EP1528773B1/en not_active Expired - Fee Related
- 2004-10-28 ES ES04025687T patent/ES2268564T3/es active Active
- 2004-10-28 DE DE602004001563T patent/DE602004001563T2/de active Active
- 2004-10-28 AT AT04025687T patent/ATE333750T1/de active
- 2004-10-29 US US10/976,520 patent/US7356356B2/en not_active Expired - Fee Related
- 2004-10-29 CN CNB2004101047887A patent/CN100514985C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1620083A (zh) | 2005-05-25 |
US7356356B2 (en) | 2008-04-08 |
EP1528773B1 (en) | 2006-07-19 |
PT1528773E (pt) | 2006-09-29 |
KR100595610B1 (ko) | 2006-06-30 |
DE602004001563D1 (de) | 2006-08-31 |
ATE333750T1 (de) | 2006-08-15 |
US20050094782A1 (en) | 2005-05-05 |
KR20050040628A (ko) | 2005-05-03 |
EP1528773A1 (en) | 2005-05-04 |
DE602004001563T2 (de) | 2006-11-16 |
ES2268564T3 (es) | 2007-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100514985C (zh) | 电话号码检索系统和方法 | |
US6505161B1 (en) | Speech recognition that adjusts automatically to input devices | |
CN101164102B (zh) | 自动扩展移动通信设备的话音词汇的方法和装置 | |
CN102938803B (zh) | 在移动装置上实现关于运营商业务的至少一个功能的方法 | |
US20070208555A1 (en) | Dynamically adjusting speech grammar weights based on usage | |
US20120072212A1 (en) | System and method for mobile automatic speech recognition | |
US20080233928A1 (en) | Method and apparatus for prompting a cellular telephone user with instructions | |
CN101473636A (zh) | 用于检索信息的方法和系统 | |
US20100298010A1 (en) | Method and apparatus for back-up of customized application information | |
CN101129056A (zh) | 用于在车内从无线电话中获取并处理电话簿信息的免提系统和方法 | |
EP1251492B1 (en) | Arrangement of speaker-independent speech recognition based on a client-server system | |
US20070061147A1 (en) | Distributed speech recognition method | |
JP5283947B2 (ja) | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム | |
WO2001010144A1 (en) | Selecting a communication mode in a mobile communication device | |
CN107197074B (zh) | 通讯录管理方法、装置、存储介质及电子设备 | |
JPH10178490A (ja) | 音声記憶システム | |
WO2004039044A1 (ja) | 通信端末、声紋情報検索サーバ、個人情報表示システム、通信端末における個人情報表示方法、個人情報表示プログラム | |
US20040015353A1 (en) | Voice recognition key input wireless terminal, method, and computer readable recording medium therefor | |
CN114285657B (zh) | 防火墙安全策略变更验证方法及装置 | |
CN113724698B (zh) | 语音识别模型的训练方法、装置、设备及存储介质 | |
CN105141611A (zh) | 远程通话控制装置及方法 | |
JP2005348240A (ja) | 電話装置 | |
KR20020080174A (ko) | 이동통신 단말기의 음성인식 장치 및 방법 | |
KR100506395B1 (ko) | 무선 환경에서의 상담원과 음성인식서버를 이용한 정보제공방법 및 시스템 | |
CN106847280A (zh) | 音频信息处理方法、智能终端及语音控制终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090715 Termination date: 20161029 |