CN1136356A - 用于文本检索的输入系统 - Google Patents

用于文本检索的输入系统 Download PDF

Info

Publication number
CN1136356A
CN1136356A CN94194316A CN94194316A CN1136356A CN 1136356 A CN1136356 A CN 1136356A CN 94194316 A CN94194316 A CN 94194316A CN 94194316 A CN94194316 A CN 94194316A CN 1136356 A CN1136356 A CN 1136356A
Authority
CN
China
Prior art keywords
input
name
word
abbreviation
spokesman
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN94194316A
Other languages
English (en)
Inventor
迈克尔·T·罗西德斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/158,297 external-priority patent/US5454063A/en
Priority claimed from US08/165,676 external-priority patent/US5620182A/en
Application filed by Individual filed Critical Individual
Publication of CN1136356A publication Critical patent/CN1136356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B15/00Arrangements or apparatus for collecting fares, tolls or entrance fees at one or more control points
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C15/00Generating random numbers; Lottery apparatus
    • G07C15/006Generating random numbers; Lottery apparatus electronically

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Finance (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Emergency Alarm Devices (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种使用自动语音识别器(1)的计算机输入系统。该系统用于在数据库中寻找名字。该系统减少发言者为在数据库中寻找唯一的名字所需要输入的字母数。该系统能够使发言者输入这样的输入,它能识别发言者的字母输入相应于名字中的哪个字。该系统建立(3)一组检索参数,其中包括用户的字识别符(5)和字母输入(6)。这个组可被称为缩写,因为它通常表示在用户所寻找的名字中的总的字母数的一小部分。还披露了用于存储用户请求的概率系统。

Description

用于文本检索的输入系统
使用自动语音识别器向计算机输入名字是理想的,但是名字数量远远超过识别器可以识别的字的数量。一个解决办法是拼写这些名字。但识别器仍然会遇到字母带来的麻烦。另一个解决办法是使识别器输出其字母猜试,使发言者证实正确的字母。然而这种方法太慢。因而此处披露了一种使用语音识别器的用于拼写名字较快的系统。
一种有成效的拼写名字的方法是将其缩写。一种实用的缩写方法应该把用户的习惯和有效的数据压缩相结合。这种方法的基础以及用于执行这种方法的系统如下:发言者在心中有他要拼的名字,发言者借助于识别在名字中字的位置来选择名字中的字。然后发言者使用识别器拼出该字。该系统允许发言者通过根据在名字中字的位置来对字进行识别而在任何时间改变到另一字。因为发言者可以自由地选择名字中最不常用的字,所以这一方法减小了为从名字表中指定名字所需的被拼的字母数量。
图1表示用于名字的基本系统的流程图。
图2表示包括附加的有用输入的系统的流程图。
图3表示包括删除功能的系统的流程图。
图4表示和查表系统相结合的系统流程图。
图5-5C表示具有交互查表系统的系统流程图。
图6表示具有不证实输入的识别器的系统的流程图。
图7表示用户请求的概率分类程序的流程图。
此处披露的系统可以使人们利用自动语音识别器来容易且快速地在计算机内拼写名字。该系统产生代表名字的缩写。缩写系统可以和查表系统相结合,查表系统使用缩写在数据库中寻找名字。本发明还披露了一种和交互查表系统的组合,交互查表系统引导发言者使用缩写方法。还包括了某些实施例。这些并不限制本发明的范围,只是说明本发明的操作。
                   部分1某些定义
识别器:一种装置,它能使计算机有一合理的机会把发言者的语音输入转换成发言者所说的符号。交互识别器(IR):是一种识别器,它使发言者确认或排除其猜测。交互声音响应识别器(IVRR):一种IR,它以声音的形式输出其猜测。
字:一串字符。名字,一串字。此处的名字不具有合适的名字的意思。一个名字内具有多个合适的名字。复合名:一串名字。在一个全名中具有一个以上的名字未必意味着全名是复合的。其中具有多名称的名字可以被解释为单名或复合名。系统的设计者必须确定哪个解释是最好的。例如,Sony Walkman MegaBass可以被认为是一个名字或三个名字。
缩写:一种被压缩的文本串,用作一组检索参数。
字母输入:一种用来拼字的输入。“字母输入”将意味着构成字的字母数字符号和标点符号。字输入:一种本身就是完整字的输入。
字识别符输入:一种代表在名字中字的顺序位置的输入。用来规定发言者的字母输入相应于哪个字。按照它含的个数,字识别符在所有字母输入之后到另一个字识别符输入之前指定被输入的所有字母的位置。例如,“第二个字”指定被输入的下一字母是拼写名字中第二个字的字母。最通用的字识别符是:计算个数;由计算数目跟随的“字”;顺序数;以及由“字”跟随着的顺序数。如果系统包括完整的字输入,字识别符也将规定完整字的位置。例如,被一个字跟随着的“第二个字”将使该字被放在缩写中的第二字位置中。
名字识别符输入:一种说明发言者的字母输入相应于什么名字的输入。例如,“第二个名字”说明被输入的下一个名字是在复合名中第二个名字的拼写。与字识别符不同,名字识别符未必说明顺序位置。名字识别符可以是描述性的,例如,“制造者”,“作者”,“街道”等等。
Done:表示发言者对一个名字没有更多的输入的终止输入。
                  部分2:基本缩写系统
基本缩写方法
步1,发言者通过输入相应于发言者首先拼的名字中的字的字识别符开始。
步2,发言者拼相应于刚输入的字识别符的字。如果发言者在拼写一部分之后返回一个字,发言者将从他离开之处继续。
步3,发言者可借助于进入如下的一个输入来停止拼一个字:a,字识别符,在此之后发言者转向步2。b,“Done”,在此之后发言者停止或转向步1。
基本缩写系统
如图1所示,用于执行上述方法的基本系统需要下列元件相组合:计算机,识别并确认输入的交互式识别器(IR)1,以及用来执行下面的步骤从而把确认的输入转换成缩写的程序:
1.该程序在2等待字识别符。在这一输入被输入之后,在3程序开始对一名字建立一组检索参数,一个缩写。程序如在下面紧接的步骤中所述的,存储字识别符输入。在这第一输入被存储之后,
2.如果在5字识别符被输入,则程序在4将其在缩写中存储,以便指定被输入的下一字母的位置。该位置被识别符的数量规定。
3.如果字母在6被输入,则程序在7将其存储在由所输入的最后一个字识别符定义的字段的缩写中。在字中的字母按照其被进入的顺序被存储。
4.如果在8进入“Done”,则程序转向步1。
用于缩写复合名的系统
为了允许缩写复合名,该系统可以包括表示发言者将要拼的名字的名字识别符输入。为了处理复合名而增加的输入和功能基本上不使本系统改变。该方法只包括使发言者表示出他正在拼的是什么名字的步骤。因而在该方法的第一步中发言者识别正被拼的名字,在第二步中,识别正在被拼的字。发言者可以借助于说被字识别符跟随的一个不同的名字识别符来改变名字。名字识别符规定在其之后被输入的字识别符。该系统所需的其它步骤说明如下:
1.程序等待要被输入的名字识别符。在名字识别符被输入之后,程序开始建立缩写。程序在缩写中存储名字识别符作为下一个被输入的字识别符的区分符。然后,
a.如果名字识别符被输入,则程序在缩写中将其存储作为输入的下一个字识别符的区分符。
b.如果字识别符被输入,则程序将其存储在由输入的最后名字识别符定义的字段中的缩写中。
c.如果字母被输入,则程序将其存储在由被输入的最后一个字识别符定义的字段中的缩写中。
d.如果“Done”被输入,则程序转向步1。
         部分3:包括附加的帮助输入的系统
定位字母识别符输入(“字母识别符”):该系统可以包括说明在字中字母的顺序位置的输入。最通用的字母识别符是具有计数个数或序数的字母识别符,例如,“三个字母”或“第三个字母”。字母识别符类似于字识别符并被嵌套在其中。如图2所示,在31的字母识别符在32被存储在由输入的最后字识别符定义的字段中。例如,“第三个字”,“第四个字母”。然后在32在由字母识别符中的数量规定的缩写中存储跟随字母识别符的字母。例如,拼“Rocklands”的人可以说:“第四个字母”“K”,然后就把“K”作为字的第四个字母存储起来。
最后字母:如图2所示,系统可以包括称为“最后字母”的输入,它说明被输入的下一个字母是正被拼的词的最后一个字母。当在35输入“最后字母”时,如果接着输入一个字母,系统程序就记录它,该字母就是在36要被存储的被识别的最后字中的字母。该系统可以包括一个输入,称为“对最后字母的第二个”字母,其作用相同,但指的是字的倒数第二个字母。
跳字母,跳元音和跳辅音:该系统可以包括一个输入,可以称之为“跳字母”,它表示发言者在正拼的字中跳拼一个字母。当发言者输入这一输入时,系统存储一个空白字符在缩写中。该系统还可以包括一些输入,它们可被称之为“跳元音”和“跳辅音”,说明发言者正在跳过元音和辅音。
Word Done:如图2所示,系统可以包括一个输入37,它可被称之为“Word Done”,它表明在字中全部字母都已拼出。系统程序在38存储这一输入,存储在被识别的最后字以下的缩写中。Words Done:系统可以包括输入39,它可被称之为“WordsDone”,说明在名字中所有的字都已在某种程度上被拼出。
数值输入:该系统可以包括数值输入,它表示在字中的字母的个数,在名字中字的个数,以及在名字中字母的个数。数值输入具有两个部分,即数字部分和说明该数字应用于什么的说明部分。程序记录说明部分,然后存储数字作为说明部分确定值。程序必须被设计能够识别说明部分,说明部分如所述的那样,可以改变。下面说明输入数值输入的4种方法。
1)利用显式输入,其说明部分是显式的。在这种情况下,数字部分和说明部分可以结合在一个输入中。例如,“5个字”或“六个字母”。另一种变化是数字部分跟随着首先要输入的说明部分45。例如,被“6”跟随着的“字母数”。程序存储由说明部分规定的数。
2)利用提示,其中系统提示发言者给出一个数值。提示是说明部分。在提示之后,被输入的数由提示指定而被存储。
3)按顺序,其中在某一其它输入已被输入之后发言者可以选择输入的数值。系统可被设计为遵守一种约定,借以在某一输入之后,发言者可以进入识别符、字母或数字。如果是数字,该数字是上述三个数值之一。例如,在字识别符之后,数字可以表示在刚被识别的字中的字母数。例如,“第二个字”,“4”将表示被输入的下一个字母属于第二个字,该字有4个字母。也可能有多个数字,其中每个数字说明关于名字的不同的信息部分。例如,发言者可以通过说“二,三,七”开始。其中“二”可以说明在名字中有两个字。“三”可以说明下一字母拼名字中的第三个字。“七”可以说明在第三个字中有七个字母。
4)利用字识别符代码,其中字识别符说明比在名字中字的位置更多的信息。这种编码方法把虚的、空字引入名字中。这些空字可以在实字前面,或者可以插入它们之间。如果在前面,实字的顺序被保留。如果在其间,实字的次序被保留。按上述例子,发言者可以使用字识别符“第237个字”,这等效于上面的“2-3-7”。系统程序将被设计成能够识别代码,以便存储输入的数字部分。
               部分4:帮助功能
删除功能:该系统可以包括使发言者可以删除以前的一个或多个输入的步骤和功能。如图4所示,可在51、52删除字母,在53,54,55删除字或名字。由任何输入跟随着的“删除”50可以说明该输入要从缩写中删除。
重拼功能:缩写系统可使发言者返回前面在某程度上已拼的字并再次拼该字。如上所述的系统可使发言者从他离开的地方开始,因为字母已被按其输入的顺序按顺序存储在缩写中。可容易使发言者在字的开头开始而不用记住他的位置。该系统可以包括消除输入的再确认功能,例如,在发言者输入以前已输入的字识别符之后,系统程序就计算对于该字已拼出的字母;然后程序检查发言者的下一输入,但不确认也不存储它们,直到它检查到和已拼出的字母那样多的输入为止;然后它按照通常那样确认和存储输入。
提醒功能:发言者返回一个字时,可能需要被提醒他是从哪里离开的。系统可以包括提醒发言者的功能。在发言者输入以前已输入的字识别符之后,系统程序输出在字识别符下存储的缩写中的所有字母。在这输出之后,程序正常地存储字母(按跟随着在字中已存储的最后字母的顺序)。
完整字接受功能:虽然该系统被设计成使发言者可以缩写字和基本的名字,但该方法可以包括全字输入。这可能是非常有用的。这样,缩写“Reggies Bowling Alley”的发言者可以输入“第一个字”“R”,“第二个字”“Bowling”等等。除去作为程序指令(例如,“第一”,“Word Done”等)使用的这些字之外,识别器能够识别完整字的词汇。是程序指令的字可以不被存储在缩写中。为了接收字输入和字母输入,系统程序包括存储完整字的功能。在发言者输入字识别符之后,如果发言者输入一个不是字程序输入的字,则该字被存储在由识别符指定的位置上的缩写中,在该字位置中没有字母被存储。
         部分5:缩写系统和查表系统结合
在前一部分所述的系统的关键作用是产生一个可被用于在数据库中寻找名字的缩写。因此,缩写系统应该和查表系统结合,查表系统包括:a)数据库,b)使用所产生的缩写检索数据库的程序,以及c)输出检索结果的功能。这一种组合的系统执行上述和缩写系统相同的步骤,此外还具有如图4所示的被增加的查表系统的步骤:
在缩写程序在缩写中存储输入之后,检索程序在81使用该缩写检索数据库,以便得到和缩写唯一相符的名字。
如果在82没有找到,在83就输出数据不能找到的信息,
如果在84找到了唯一的相符的缩写,在85就输出与名字相应的数据,
如果没有唯一相符的缩写被找到,缩写程序就等待更多的输入。
如上述的步骤,当达到错误符合时,系统就输出“没有数据”信息。不过,系统可以包括一种“最好匹配”功能,用于输出和缩写最好的匹配,此外,在“无数据”信息之后,可以输入删除输入,从而使发言者不用重新开始而改变缩写。
发言者的误操作
当使用缩写方法查表名字时,发言者通常不知道足够的信息用最少的输入来确定名字。这样,查表系统通常包括减少多余输入的交互式的引导功能。一旦发言者碰到死点,各种功能可以退出死点。这些将在交互、引导功能之前被说明。
退出:对于不完整的缩写的输出功能
如果一个缩写不含有足够的信息来唯一地规定数据库中的一个名字,则该缩写是“不完整的”。查表系统应该包括当发言者已输入不完整的缩写并决定他不能进一步规定名字时输出信息的功能。这种功能可以称为退出,并在系统中各种退出都是可能的。当发言者已输入最终输入并仍未找到名字的唯一匹配缩写时,查表程序可以输出:a)说明具有太多的匹配名字的信息,b)与名字有关的最需要的数据,c)与所有的匹配名字有关的数据,d)匹配名字的遗漏部分,并让发言者选择一个部分。然后可以输出相应的名字和数据(例如数据库可以具有两个除去地址之外相同的表。系统可以输出一个地址或其它地址并使发言者确认或者不确认)。
                部分6:交互引导功能
如上所述,当使用缩写方法在数据库中查表名字时,发言者可以因输入不需要的输入而被陷住(stuck)。在进一步讨论这一问题之前,下面将引入一个小型数据库,它会详细说明这一部分。
Bombay Club                     Internal Medicine Group
Federal Election Commitee       McDonalds,5400 Georgia
Federal Express                 McDonalds,3400 Jeniffer
Fetoosh Restaurant              McDonalds,1200K
International Management Association  Zei Club
International Management Group  Zei Club Vacations
1.由于字的一部分被陷住
发言者可以由拼写以前的输入完全确定的字的一部分被陷住。这发生在当这一部分对数据库中的其它字是公用的时候。例如,假如发言者试图匹配上述的“Internal Medicine Group”。他一旦输入“I”,他便已经把他的检索限制为三个名字。然而如果他继续拼“N-T-E-R-N-A”他将没有进展,直到他拼“L”。换句话说,“I”已经规定了“N-T-E-R-N-A”。
2.由于整个字被陷住
发言者可以由于以前输入完全确定的字的拼写被陷住,这发生在当该字在数据库中对其它名字为公用的时候。例如,假如发言者想匹配名字“Zei Club”,如果他输入“第二个字”,“C”,这一字母便把名字表限制为三个,它们包括“Club”作为第二个字。
3.由于多个字被陷住
发言者可以由以前输入所完全确定的一个以上的字的拼写被陷住。这可以发生在当发言者不知道名字中的所有字时。例如,发言者试图匹配Sony Walkman WFF24,可以规定“Sony”和“Walkman”,但是如果他不知道最后一个字即型号,他因前两个字的拼写是无用的而被陷住。
4.由于复合名中的一个名字(或多个)被陷住
发言者可以由已被完全确定的名字的拼写被陷住,这可以发生在当他不知道复合名中的所有名字时。此时他可以被固定在多个匹配。例如,假如发言者匹配上述的McDonalds,一旦他输入“M”,他就规定了第一个名字。再拼出其余的“McDoralds”是不必要的。所需要的是第二个名字的部分,街道地址。
用于拯救的交互查表系统
查表系统可以包括“预先查找”数据库并当发言者被困住时告诉发言者的功能。这些功能也可以建议将有效地规定所寻找的名字的输入。这些功能可以称为引导。有两种类型的引导:概率型引导和确定型引导。概率型引导产生好的猜试的建议。确定型引导产生确定的建议。系统可以并通常包括两种类型的引导。这些引导的每一个又以两个类型出现:通知发言者他被困住的引导和输出建议的输入的引导。引导输出建议信息,例如“Try the third word”(“试第三个字”),或“What is the third word?”  (“第三个字是什么?”)这种信息应该是短的。这信息的通用形式是一种由短的音调通知的信息,例如,嘟嘟声可以表示发言者被困在字中或名字中。
起动引导的条件
在说明交互引导之前,简要讨论一下关于起动这些功能以便操作并输出建议的条件。在某些情况下,这些功能可以连续地操作,对照数据库检查缩写,然后当某一条件满足时,输出建议。在其它情况下,起动比较简单,不涉及检查数据库的交互引导。当然,这些条件由系统设计者设定,并且可以是不同的。系统可以包括这些条件的组合。例如,当a)某一数量的输入对于某一字或名字已被输入时,b)被匹配的名字数小于某一数时,c)发言者在输入某个量的输入之后所达到的进展小于某个量时,d)发言者输入可以叫做“建议”的指令,表示发言者希望系统提供建议时,e)交互引导发现期待某一输入以便缩小匹配表的量大于某一量时,f)交互引导计算发言者的期望进展并且这一进展低于某一量时,交互引导可以被起动,从而输出建议。
当发言者被困住时通知发言者的确定的引导
为了不使发言者被困在一个名字内,和缩写系统结合的查表系统可以包括这些功能:
a.检查在匹配缩写中的所有复合名表。
b.比较在该表中相应于输入的最后名字识别符的所有的名字。
c.如果所有被比较的名字是相同的,输出信息告诉发言者在相应于该识别符的名字中不会再有进展。
如图5所示,为了不使发言者被困在字中,和缩写相结合的查表系统可以包括下列功能:
a)在90检查与缩写匹配的全部名字的表。
b)在91比较输入的最后字识别符所相应的所有的字。
c)如果在92所有被比较的字是相同的,则在93输出信息告诉发言者在该识别符相应的字中不含有更多的进展。
例如,取小型数据库(toy date-base)为例,如果发言者输入“第一个字”“Z”,查表系统就匹配两个名字:“Zei Club”和“Zei Club Vacations”。交互引导比较在两个名字中的第一个字。它们是相同的,因而引导输出一个信息,告诉拼名字中的第一个字不会有更多的进展。
为使发言者不被困在字部分中,这功能可包括下列步骤:
d.如果所有被比较的字不相同,
在每个被比较的字中找出相同的连续的字母数N;
如果N>M(门限值),则输出信息告诉发言者在字中对于N个字母不会有进展。
被确定的建议的输入
在讨论建议具体输入的确定的引导之前,对关于建议的输入进行某些说明。这些说明适用于确定的和概率的引导(guide)。建议的输入是对于可能的作为建议的输出的引导猜试的一些输入和一系列输入。术语“建议的输入”可能有些含混,因为它可以指单个输入和一系列输入。两者都称为建议的输入的理由是,在自然语言中,一系列输入和单个输入常常说的是同一件事。例如,引导可以输出信息:“输入名字中的字数”。为输入这一信息,发言者可以只需要一个输入。另一个信息可能是:“拼第二个字”。为了输入这一信息,发言者需要至少两个输入的序列。一个建议的输入可以涉及多个字母,因为引导可以试验在一行中拼两个或多个字母的值。这样,当引导比较一个建议的输入和另一个建议的输入的信息值时,单个输入可以和单个输入比较或和系列输入比较。没有一个公式来确定什么样的输入应该被试验。
计算建议输入的值
为了建议输入,确定的和概率的引导必须计算在一组建议的输入中不同输入的信息值。在说明这些公式和其在引导中的应用之前,应当说明,它们不是唯一的可能的公式,或是在所有情况下是最好的公式。它们只说明交互引导为了建议输入所需的公式的类型(注意:引导可以包括按照用户的习惯排列输入,因而,给出两个在信息上等效的输入,引导输出用户更有把握的选择。)
计算输入的信息值
信息理论提供了一些用于测试一种信息(输入)值的基本公式。当这些不同的公式在交互引导中使用时,全部采用相同的思路。该思路就是,输入的值由它从匹配表中去掉了多少名字,把匹配表缩小了多少进行测量。一个称为INFOVALUE(输入,名字)的公式,计算施加于名字的输入值。这是因为输入的值取决于发言者所拼的名字。“对名字施加输入”指的是,函数假定发言者正在拼一个名字。然后,该函数找出相应于在该名字中的那一输入的数值或字母。这字母或数值可被称为结果输入。例如,如果名字是“Zei Club”并且函数施加“第二个字”,“最后一个字母”,那么结果输入是“B”。
INFO-VALUE(输入,名字)
INFO-VALUE(输入,名字)执行下列步骤:
1.从一组和缩写匹配的名字中选择名字。
2.从一组建议的输入中选择输入。
3.对名字施加输入,产生结果输入。
4.在缩写中存储结果输入,从而产生假设的缩写。
5.找出和假设的缩写相匹配的一组名字。
6.从原始的匹配组中减去这些假设的匹配(如果发言者正拼所选的名字,这便产生该输入应该清除和匹配数)。
7.由原匹配组减1除以被消除的匹配数。
〔被消除的匹配数/(原始匹配-1)〕
步7中的比测定对所选名字施加的所选输入的值。例如,在小型数据库中,假如发言者输入“第一个字”,“F-E”,这些输入产生三个匹配:“Federal Election Committee”,“FederalExpress”和“Fetoosh Restaurant”,如果INFO-VALUE对名字加以下一个字母,“Fetoosh Restaurant”,其结果输入是“T”,则消除两个匹配而只剩下一个“Fetoosh Restaurant”。这样,加于“Fetoosh”的下一字母的INFO-VALUE是(2/(3-1))或1.0(“T”已经消除了“假”匹配的100%)。
建议输入的确定的引导
如图5a所示,和缩写系统相结合的查表系统可以包括下列功能:
a.检查和缩写匹配的数据库中的所有的名字组。
b.对于每个名字,在100计算在相应于输入的最后字识别符的字中正被输入的下一字母的值,(换句话说,该功能首先检查所有的名字,找出在当前正被拼的字中下一字母的每种情况下的值。)
c.如果在101 INFO-VALUE(下一字母)对所有名字为1.0,则不输出信息。
d.如果在101不是1.0,
则在103取一组可能的输入
在103计算施加于所有的匹配名字的每个输入的信息值。
如果在104输入的INFO-VALUE是1.0,则在105输出信息通知发言者该输入将唯一地规定该名字。
不唯一地确定名字的建议输入
上述的确定的引导对发言者建议在所有情况下能唯一确定名字的输入。虽然没有输入可以作到这一点。但仍然可以是在所有情况下某一输入将比当前正拼的字的下一字母具有高得多的值。在这种情况下,确定的引导可以检查另一输入的值,并建议具有最高值的一个。
概率引导
概率引导给出一个可能的建议(例如,“你可能被困住了”或“你或许应当拼第二个字”)。输入的信息值可在宽的范围内改变,当施加于某一名字时为高,而施加于其它名字时为低,关于每个名字的结论经常不是可能的。因此,概率引导所作的是对发言者可能正在缩写的所有的名字的输入值求和。根据平均(可以取平均值以便产生输入的期望值),具有最高总数的输入是具有最高值的一个。为了说明关于概率引导,引入第二个小型数据库:
Sony W2FF Sony W2FG Sony W2FH SonyZ9LH
例如,用这一小型数据库,输入施加于前三个名字的输入“第一个字母”,“第二个字”具有1/3的INFO-VALUE(它只消掉一个名字,第四个名字)。虽然当同一输入加于第四个名字时INFO-VALUE是1(它消掉其它三个名字)。那么总数是(1/3+1/3+1/3+1)=2。如果我们取另一个输入,例如第二个字的最后一个字母,我们发现对于头两个名字的总的INFO-VALUE是1.0,对于后两个名字是1/2,总数为3。简单求和具有的问题是,例如本例,其中每个名字具有相等的加权,在最现实的情况下,每个名字不具有相等的加权(此处的加权意味着被缩写的可能性)。所需要的是加权的和。当然,加权如何确定取决于应用。虽然值得注意,在许多情况下,加权应当来自数据库本身的实际用途。因此,引导可以包括测量名字被要求超时(over time)多久的请求功能。
确定发言者是否可能被陷住的概率引导
用来确定发言者是否被困在名字中、字中以及字的一部分中的三个方法是:
1.具有相同部分的名字的百分数在门限值以上
当检查与缩写匹配的复合名时,一种函数可以求出在由输入的最后名字识别符确定的位置中具有相同名字的百分数。
当检查和缩写匹配的单个名字时,一种函数可以求出在由输入的最后字识别符确定的位置中具有相同字的百分数。同样,一种函数可以求出在由输入的最后字识别符确定的字中具有相同字部分的名字的百分数。当百分数大于门限值时,引导可以表明发言者可能被困在相关的名字、字或字部分中。
2.后面N个字母的期望值低于门限值
一种函数可以计算拼出的名字的、字的或字的一部分的后面N个字母的期望值,如果该序列字母的期望值低于一个门限,则引导表示发言者可能被困在相关的部分中(见下面例子)。
3.发言者的输入的期望值低于门限值
一种函数不仅可以计算字母序列的期望值,而且可以计算发言者输入任意给定的输入序列的概率,这一概率可以被放到(factored)期望值函数中产生发言者的输入的期望值。如果这期望值低于一个门限,引导就说明发言者可能被困住。除计算所有这些概率之外,引导可以使用历史数据,在输入输入的给定阶段提供发言者的输入的期望值。这说明这一期望值可以不同方式确定。
可能被困住的许多确定
如上所述的方法,有许多方法用来通过数学计算确定发言者可能被困住。这一点不是在引导中使用的精确确定方法,但是却是在所有情况下使用的合理的概率方法。下面给出一个例子。为了使发言者不被困在字的一部分中,和缩写系统相结合的查表系统可以包括如下功能:
a.检查和至今产生的缩写相匹配的名字组。
b.计算在由最后输入的字识别符确定的所有字中后面N个字母的期望的信息值。
c.如果期望值低于某个门限,则输出信息告诉发言者对后面N个字母他可能进展很小,
被困住的门限确定
以上的用于确定发言者是否被困住的方法包括门限值。如果发言者的期望进展低于门限值,引导就表示发言者可能被困住。门限值可以是常数,或者可以随一个数而改变,这个数取决于一些因素的变化,例如已经输入了多少输入;或者它可以取决于其它输入序列的期望值。检查其它序列的值可能是有用的,因为它常常可以告诉发言者,例如当他只打算试他被同样困住的另一字时,告诉他可能被困在一个字中。因而,引导可以包括用来检查在名字的每个字中“被困住程度”的步骤。如果当全部字被计算时发言者的下一输入的期望值低于门限值,他就“全部被困住”,在这种情况下,除去告诉发言者他被困住之外,还产生为建议特定输入的引导。告诉发言者被困住的引导最好和建议输入的引导相结合。
建议输入的概率引导的微妙(Subtlety)
为了建议输入,概率的引导必须估算交互输入序列组并选择具有最高期望值的一个(虽然可以考虑用户的帮助(friendliness))。在给定情况下应用的最好的概率功能常常是主观的事情。以棒球为例可说明这一点。在棒球中,平均命中率(命中数/击球数)是测量运动员击中能力的核心公式。但是这公式真能给出运动员的命中几率吗?如果击球者面向Nolan Ryan会怎样?如果击球者有一弱的腘旁腱(hamstring)会怎样?如果击球者刚刚和其女友分手会怎样?如果目标(bases)被装载会怎样?所有这些因素都应该包括在概率函数中。但是至少它仍然含有(命中数/打击数)的核心。同样,引导可以包含许多因素。但至少都会有一个核心(core),如果给定的名字正被缩写,该核心测量一个建议的输入将消除的名字数。如图5b所示,建议输入的概率引导需要:
a.在120检查建议输出组。
b.在121计算每个的期望信息值。
c.在122选择具有最高值的建议的输入。
为了解释上述的关于建议输入的概率引导的内容,我们再次使用引入的第一个小型数据库。为简单起见,我们假定每个名字具有同样的被缩写的几率。假定发言者试图缩写“Internal MedicineGroup”,他输入“第一个字”,“I”。这些输入把检索缩小到三个名字。如图5B所示,在123引导计算在所有剩下的第一个字中的下三个字母的期望值,并发现对所有三个名字输入的这些字母(“N-T-E”)的期望值是0。因此,在124引导就把该值和期望值门限进行比较,比如在这一级它被设为5。因为0小于这个值,所以在125引导比较已被输入的数,此处为2,并发现该数在输入的门限,例如5个输入以下。(如果在门限以上,我们假定引导建议一个输入)。这样,在126引导输出信息告诉发言者他被困住。
在127我们输入“Suggest”。然后在120引导取一组建议的输入,在这一假设情况下,它包括其余字的下两个字母。在121引导计算每个序列的期望值,在122求出拼的第二和第三个字产生同样的值。然后通过用户帮助引导检查其排列输入序列的表,并发现拼的第二个字比拼的第三个字有略多的用户帮助。因而,引导输出“拼第二个字”。
现在我们假定发言者不输入“Suggest”,并且用于起动引导的门限是最好的建议输入和当前字的下N个字母的拼写之间的比较。在上述例子中,门限就是期望值常数(5)和输入的输入数。比如发言者尝试第三个字,他输入“第三个字”。如图5C所示,在130引导计算拼出的这一字的下三个字母的期望值,并求出该期望值是2/3。在131,132引导还计算建议输入组的值,现在它包括拼出的第二个字。引导求出拼出的第二个字的值也是2/3。在133,取两个值之差,结果为0,在134不释放门限值,因此,引导不输出信息。在输入一个字母“G”之后,引导发现他再次被困住,这次是在左边,字“Group”中。然后引导检查建议的输入值并发现拼出的第二个字将在两个字母内产生1.0的期望值。这样引导输出一个信息,叫发言者拼第二个字。
           部分7:使用不确认输入的识别器
上述系统使用确认输入的交互式识别器。借助于确认输入,产生然后建立的一个缩写。然而,显然该系统如可以使用不确认输入的识别器。在这种情况下,识别器将具有关于发言者的输入的多个猜试。如图6所示,该系统在140将使用猜试并把可能性排序从而产生基于识别器猜试的多个缩写。该缩写将对照数据库进行匹配,并在141删除不匹配的那些。这种输入的“后处理”在本领域中是熟知的。当在系统中使用非确认识别器时,可以按照正确的几率对多个缩写加权。然后这些加权可被计算输入的期望值的系统的交互猜试所使用。
系统最好包括确认和非确认两种方式。具体地说,具有可被精确识别的高几率的输入,例如数字和字识别符,通常不被确认。用于组合方式的另一种可能性是使用户通过使用确认的输入首先缩小检索范围,然后继续非确认输入。或者系统可以在识别器确定识别精度在某个百分数以下时请求确认。或者系统可以从非确认方式能换为确认方式,以便排除某些假的匹配,这说明确认和非确认方式可共同使用。
               部分8:Juggle字序的功能
当使用缩写方法时,发言者可能知道名字中的字或几个字,但不能保证字或几个字在什么位置。例如,假如发言者想缩写“Herman’s World of Sports”,但发言者只知道“Herman’s”和“Sports”在该名字中。那么发言者就只想缩写这两个字。因而,系统可以包括“Juggle”由发言者输入的字序的功能,从而产生多个缩写。如果发言者不能确信在名字中的字序,他可以输入一种称为“Juggle”的输入,这将产生一种功能,利用发言者的输入对字序的每个可能的组合产生一种缩写。在名字中的字数必须被确定。或者发言者输入字数,或此功能有预置的限制。这一组组合(多个缩写)被用来检索数据库。不和任何名字匹配的组合被消除。输入的每个输入被Juggle功能放在所有剩余的组合中。在输入被放入之后,便执行另一个检索,则可以消除更多的缩写。(系统可以使发言者在因为没有匹配而使缩写被拒绝之后调用Juggle功能)。
当一个或几个字处在固定位置时,Juggle是更有效的。因而Juggle功能可以包括允许发言者固定字的位置的特征。在所有组合中,字应该有其规定的位置。系统程序应当包括称之为“Sure”的输入,表示发言者确信字的位置。
Juggle功能最好和引导发言者的交互查表系统结合。关键引导是通知发言者他被困住的引导。这些引导除它们必须尝试更多的缩写之外,基本上和6部分中所述的那些的工作方式相同。但是,当发言者不知道字序时,程序如何建议输入的输入?一种方法是引导选择一个建议的输入,然后找出发言者已输入的字,该字比发言者已输入的任何其它的字更相应于那个输入。(我们假定建议的输入包括字母)。然后该功能向发言者建议输入那个字中的下一个(或最后一个)字母。这样,建议的输入就被转换而应用于发言者已识别的字。
             用户请求的概率分类程序
开放市场的一个固有的特点是商店必须对一种产品或服务设定一个单价,而他们根据不同客户的支付能力可以容易地设定不同的价格。但是因为人们的想法是不知道的,并因为市场是开放的(对不同的客户设定不同的密秘的价格是不实际的),因而商店通常不能象它们希望的那样区分价格。但是对许多商店,尤其是具有低的可变费用的商店,例如信息行业和某些资金紧张的行业,能够区分价格是十分有利的。当然,这些行业可以尽其最大努力。例如,航空业根据人们买票的时间而具有不同的价格,这些试图可以被改善。
问题是两个方面的。一个是,如何按照用户的支付能力对其进行分类?二个是,怎样阻止支付能力高的用户也取低的价格?下面给出的方法并不打算彻底解答这些问题,而只给出一种较少的局部的解决方法,但不管怎样,这对某些行业会带来重大的冲击。
可以使用随机数发生器(RNG),按照顾客愿意付价格X,称为“全价”或愿意付低价Y,称为“折扣价”对他们进行分类。顾客按接受商品的不确定性被进行分类。假定愿付全价的顾客需要这种商品并且不存在只可能接受该商品的不确定性。执行这一原理的一般方法具有三个条件:1)顾客对获胜的机会签字,2)顾客不预先付费,只有他们在被随机地选中有权购买折价商品时才付费。3)精确地设定顾客获胜的概率。
这种方法的问题在于,顾客将试图输入随机选择处理(RSP),其次数比他们被允许的多,从而增加在商店设定的水平以上获胜的几率。为防止这样,商店的主要警卫要记录顾客识别信息并拒绝重复的尝试。
第二个问题是,全费顾客将试图得到折扣价。防止的方法是使用随时间的不确定性。此处的思路是,使顾客拿不准什么时候可以购买商品。假定付全费的顾客不能容忍不确定的延迟。这样,商店可设立一个不公开的时间周期,在此周期之后,潜在的顾客有随机的机会购买折扣价的商品。人们可以在某日具有买到折价商品的可能性,或者这日期本身可以是随机的。可以使人们获得购买折价商品的权利在概率上接近确定(或者甚至为确定的),但是使这个日期是随机的,从而产生所需要的不确定性。
例:某人对从纽约到洛杉矶的飞行感兴趣,全价是$500。此人只愿付$200。航空公司可能给这一潜在的顾客1/4的机会在未确定的时间购买$200的机票。此人将为此而登记。登记内容应该包括个人识别信息和登记日期。航空公司将等待一段时间然后取(随机地或非随机地)一个日期或几个日期,给此人一个随机的机会购买$200的机票。
航空公司应当使用顾客例如此人把飞机坐满,因而如果从NY到LA的飞行为2/3的满载率,航空公司将检查其“随机顾客”表,并随机地使某些顾客买到折扣价座位。获胜者将得到折扣票,同时航空公司在不丢掉全费顾客的同时得到额外收入。(注意:企业可以使顾客规定他们愿付的折扣价。然后企业可以按他们愿意付的数量分类)。
如图7所示,随机的分类程序至少包括RNG,并且可以包括这样的装置,用于:在200登记顾客识别信息,在201设定时间段,在此时间段顾客可以取胜,在202设定取胜的几率,在203操作RNG确定顾客是否获胜,在204记录顾客进行RSP的次数和时间。对顾客进行分类的随机系统可以包括下列步骤:
1.设定顾客可以在某一价格下购买商品的几率,
2.记录顾客识别信息,
3.记录顾客已进行RSP的次数和时间,
4.操作RNG,选择顾客是否有权以折扣价购买。
这RSP可以两种基本方式发生:
I.a.所述几率被设为X/N,其中X是整数,
  b.所述随机数发生器从1-N中选择一个整数,
  c.如果所选的整数小于或等于X,则在205授与顾客购买折价商品的权利。
II.x.在206把时间段分为N个子单位,
   y.RNG从1-N中选择一个整数。
   z.在207授予顾客在所选的的子单位期间购买折价商品的权利。

Claims (1)

1.一种使用自动语音识别器的输入系统,所述自动语音识别器可以识别并确认作为程序指令使用的字和数,并可以识别并确认字母-数字符号(字母和数字0-9的字符);
所述输入系统用于把检索参数输入一个数据库系统,以便在所述数据库中找到名字;
所述输入系统建立一组检索参数,被称为缩写,所述缩写使用来在所述数据库中确定名字所需的输入减到最小;
所述输入系统包括以下元件的组合:
具有存储器,处理器和输出装置的计算机,和所述语音识别器一道作为输入装置,以及引导所述输入系统的操作的程序;
所述程序能使系统接受来自向所述识别器发言的发言者的语音输入,所述程序能使系统在三组输入当中进行识别:
a.组成字的字母输入,所述字母输入包括字母-数字符号,
b.字识别符输入,它说明在名字中字的顺序位置,每个识别符包括相应于字的不同顺序位置的不同的数,每个数被用来定义一个字段,所述字段识别发言者的字母输入相应于哪个字,
c.终止输入,它表示已没有输入要被存储在缩写中;
所述程序引导所述输入系统执行下述步骤:
-首先,等待要被输入的一个字识别符,然后,在所述识别符输入之后,开始建立一个缩写,并在所述缩写中存储所述字识别符,在此之后,
-如果字识别符被输入,则将其存储在所述缩写中,
-如果字母被输入,则将其存储在由输入的最后字识别符确定的字段的所述缩写中,
-如果终止输入被输入,则在所述缩写中不再存储输入,并返回上述第一步;
所述输入系统和具有检索装置的数据库系统结合,所述检索装置使用所述缩写在所述数据库中查找和所述名字相应的名字和数据;
所述数据库系统根据在所述缩写中存储的输入执行下列步骤:
-为找出与所述缩写唯一匹配的名字,检索所述数据库,
-如果所述缩写没有名字与之匹配,则输出信息告诉没有名字和被缩写的名字匹配,
-如果所述缩写和由多个名字组成的一组名字匹配,则不输出信息,并等待要被存储在所述缩写中的另一输入,
-如果所述缩写和一个名字匹配,则输出和所述名字相应的所述名字和数据。
CN94194316A 1993-11-29 1994-11-29 用于文本检索的输入系统 Pending CN1136356A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/158,297 US5454063A (en) 1993-11-29 1993-11-29 Voice input system for data retrieval
US158297 1993-11-29
US165676 1993-12-13
US08/165,676 US5620182A (en) 1990-08-22 1993-12-13 Expected value payment method and system for reducing the expected per unit costs of paying and/or receiving a given ammount of a commodity

Publications (1)

Publication Number Publication Date
CN1136356A true CN1136356A (zh) 1996-11-20

Family

ID=26854909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94194316A Pending CN1136356A (zh) 1993-11-29 1994-11-29 用于文本检索的输入系统

Country Status (3)

Country Link
CN (1) CN1136356A (zh)
AU (1) AU1210295A (zh)
WO (1) WO1995014974A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329861C (zh) * 1999-10-28 2007-08-01 佳能株式会社 模式匹配方法和装置
CN1835077B (zh) * 2005-03-14 2011-05-11 台达电子工业股份有限公司 中文人名自动语音辨识输入方法及系统
CN111061925A (zh) * 2019-12-16 2020-04-24 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903864A (en) * 1995-08-30 1999-05-11 Dragon Systems Speech recognition
CN105389305B (zh) * 2015-10-30 2019-01-01 北京奇艺世纪科技有限公司 一种文本识别方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3069324D1 (en) * 1980-12-19 1984-10-31 Ibm Interactive data retrieval apparatus
US5309359A (en) * 1990-08-16 1994-05-03 Boris Katz Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval
US5228133A (en) * 1990-10-01 1993-07-13 Carl Oppedahl Method to perform text search in application programs in computer by selecting a character and scanning the text string to/from the selected character offset position
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329861C (zh) * 1999-10-28 2007-08-01 佳能株式会社 模式匹配方法和装置
CN1835077B (zh) * 2005-03-14 2011-05-11 台达电子工业股份有限公司 中文人名自动语音辨识输入方法及系统
CN111061925A (zh) * 2019-12-16 2020-04-24 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Also Published As

Publication number Publication date
WO1995014974A1 (en) 1995-06-01
AU1210295A (en) 1995-06-13

Similar Documents

Publication Publication Date Title
CN1198225C (zh) 关键字提取系统及采用该系统的文本检索系统
US7707283B2 (en) Information processing apparatus, information processing method, program, and recording medium
US6904560B1 (en) Identifying key images in a document in correspondence to document text
CN1489089A (zh) 文件检索系统和问题回答系统
US8335787B2 (en) Topic word generation method and system
US20050198027A1 (en) Document retrieval system recognizing types and values of numeric search conditions
US20060190435A1 (en) Document retrieval using behavioral attributes
US20020059220A1 (en) Intelligent computerized search engine
JPH06131398A (ja) 複数の文書検索方法
JP2005182817A (ja) クエリレコグナイザ
CN1846210A (zh) 利用本体存储并检索数据的方法及装置
US8428933B1 (en) Usage based query response
WO2020253391A1 (zh) 一种基于数据分析的预检信息交互方法及相关设备
US8775160B1 (en) Usage based query response
JP2017102757A (ja) 探索支援方法、探索支援装置、及び、プログラム
Mühlberger et al. User-driven correction of OCR errors: combining crowdsourcing and information retrieval technology
JP2000222427A (ja) 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体
CN1136356A (zh) 用于文本检索的输入系统
JPH10254911A (ja) 検索条件作成方法およびその装置、ならびにこの検索条件作成方法を用いた対象物検索方法およびその方法を用いた検索システム
JPH10301943A (ja) 画像処理装置及びその制御方法
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
JP2005208838A (ja) ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体
US20050071333A1 (en) Method for determining synthetic term senses using reference text
JP2005128961A (ja) データベース検索装置、データベース検索方法およびプログラム
JP5272615B2 (ja) 検索装置、検索システム及び検索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication