CN1274440A - 信息处理装置和方法、及信息提供媒体 - Google Patents
信息处理装置和方法、及信息提供媒体 Download PDFInfo
- Publication number
- CN1274440A CN1274440A CN99801293A CN99801293A CN1274440A CN 1274440 A CN1274440 A CN 1274440A CN 99801293 A CN99801293 A CN 99801293A CN 99801293 A CN99801293 A CN 99801293A CN 1274440 A CN1274440 A CN 1274440A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- information
- input
- user
- conceptual elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/02—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
- G06F15/0225—User interface arrangements, e.g. keyboard, display; Interfaces to other computer systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
接口部30,对由用户输入的语音进行语音识别,并将识别结果输出到概念抽出部31。概念抽出部31,从由接口部30由供给的识别结果抽出概念要素,意图解释部32,根据由概念抽出部31抽出的概念要素解释用户意图。信息管理部33,按照由意图解释部32解释出的用户意图进行信息管理。
Description
技术领域
本发明涉及信息处理装置和方法、及信息提供媒体,尤其是从所输入的信息抽出概念要素、根据所抽出的概念要素解释用户的输入意图并按照解释出的用户意图管理信息从而能够更容易且更迅速地管理信息的信息处理装置和方法、及信息提供媒体。
背景技术
作为管理日程表或住址名簿等个人信息用的PIH(PersonalInformation Hanager),有电子记事簿或PDA(个人数字助理)等。此外,有时也由个人计算机执行和使用由软件构成的PIH。在本说明书中,将这些统称为个人信息管理装置。
在具有这种PIH功能的个人信息管理装置中,一般根据所管理的信息对功能进行分类。例如,当输入住址时,用户起动个人信息管理装置的住址名簿功能,并在其上登录住址。
可是,用户想要登录的信息、例如备忘录等,也有许多是不能明确分类的。在现有的个人信息管理装置中,由于不具备将内容自动分类、整理并进行管理的功能,所以,要由用户自己对备忘录的内容进行分类、整理,然后由个人信息管理装置的相应管理功能进行登录,因而存在着使用户负担过重的问题。
另外,有时还要考虑保持备忘录的原有状态,例如以语音在磁带录音机等录音设备上进行记录,但在这种情况下,如信息量增大,则存在着很难从其中检索到必要信息的问题。
发明的公开
本发明是鉴于如上所述的现有技术的实际状态而开发的,其目的是提供一种能够更容易且更迅速地管理信息的信息处理装置和方法、及信息提供媒体。
在本发明中,从所输入的信息抽出概念要素,根据所抽出的概念要素解释用户的信息输入意图并按照解释出的输入意图对信息执行规定的处理。
即,本发明的信息处理装置,其特征在于,备有:输入装置,用于输入信息;抽出装置,从由输入装置输入的信息抽出概念要素;解释装置,根据由抽出装置抽出的概念要素解释用户的信息输入意图;及执行装置,按照由解释装置解释出的输入意图对信息执行规定的处理。
另外,本发明的信息处理方法,其特征在于,包括:输入步骤,用于输入信息;抽出步骤,从在输入步骤中输入的信息抽出概念要素;解释步骤,根据在抽出步骤中抽出的概念要素解释用户的信息输入意图;及执行步骤,按照在解释步骤中解释出的输入意图对信息执行规定的处理。
进一步,本发明的信息提供媒体,其特征在于,提供用于使信息处理装置执行包括如下步骤的处理的计算机可读程序,即输入信息的输入步骤、从在输入步骤中输入的信息抽出概念要素的抽出步骤、根据在抽出步骤中抽出的概念要素解释用户的信息输入意图的解释步骤、及按照在解释步骤中解释出的输入意图对信息执行规定的处理的执行步骤。
附图的简单说明
图1是表示应用了本发明的信息处理装置的个人信息管理装置的一实施形态的结构例的外观图。
图2是表示上述个人信息管理装置的内部的电气结构例的框图。
图3是表示上述个人信息管理装置的由CPU执行的处理的功能结构例的功能框图。
图4是表示上述个人信息管理装置的信息管理部的详细结构例的框图。
图5是说明上述个人信息管理装置的个人信息存储部的存储形态的图。
图6是说明上述个人信息管理装置的动作的流程图。
图7是表示上述个人信息管理装置的应用画面的显示例的图。
图8是表示上述个人信息管理装置中的信息检索处理的具体例的流程图。
图9是说明上述信息检索处理的图。
图10是表示用户的信息输入步骤的流程图。
图11是详细表示用户的信息输入的流程图。
图12是表示提示信息输入处理结果的画面例的图。
图13是表示执行着概念要素输入的画面例的图。
图14是表示对与用户意图对应的信息进行一览提示的画面例的图。
图15是表示执行着用户输入项目修正的画面例的图。
用于实施发明的最佳形态
以下,参照附图详细说明本发明的实施形态。
图1是表示应用了本发明的信息处理装置的个人信息管理装置的一结构例的外观图。
在该个人信息管理装置100的本体1上,配置着扬声器2、显示部3-1、通话开关4、滚屏键5、决定键6、传声器7等。
扬声器2,用于输出如后文所述的合成后语音、或与录音后的信息对应的语音。
显示部3-1,用于显示应用程序的GUI(图形用户界面)。在该显示部3-1的表面上,配置着当用户用触笔8或手指等接触时输出与所指示的位置对应的信号的所谓的触摸屏(触摸板)3-2。该触摸屏3-2,用玻璃或树脂等透明材料构成,用户可以通过触摸屏3-2观看由显示部3-1显示的图象。此外,用户还可以用触笔8在触摸屏3-2上输入(记述)规定的文字,或者选择或执行在显示部3-1上显示着的规定的对象(图符)。
通话开关4,是当通过传声器7输入语音时操作的按钮,在由用户持续地操作着该通话开关4的期间,由个人信息管理装置接收(输入)语音。
滚屏键5,由向上滚屏键5-1和向下滚屏键5-2构成。当使显示部3-1上显示着的图象向上滚动时操作向上滚屏键5-1,当使图象向下滚动时操作向下滚屏键5-2。
决定键6,当决定规定的项目或处理时操作。
图2是表示上述个人信息管理装置100的内部的电气结构例的框图。该个人信息管理装置100,备有通过内部总线10相互连接的CPU11、ROM12、RAM13、显示控制部14、输入接口15及语音合成部18,在上述输入接口15上,连接着输入检测部16和A/D转换部17。而上述显示部3-1则与显示控制部14连接。此外,上述的触摸屏3-2、通话开关4、滚屏键5、或决定键6,与输入检测部16连接。进一步,将上述扬声器2连接于语音合成部18。
CPU11,根据存储在ROM12或RAM13内的应用程序或各种数据执行各种处理。
显示控制部14,根据由CPU11供给的信息生成用于在显示部3-1上显示的图象数据,并将其显示在显示部3-1上。输入检测部16,检测来自触摸屏3-2、通话开关4、滚屏键5或决定键6的输入,并将相应的操作信号输出到输入接口15。A/D转换部17,将从传声器7输入的语音信号从模拟信号转换成数字信号,并输出到输入接口15。
输入接口15,接收由A/D转换部17供给的语音信号或由输入检测部16供给的操作信号,并将其输出到CPU11。语音合成部18,根据由CPU11供给的为进行语音合成所需的参数或文本数据生成合成语音,并通过扬声器2输出。此外,当对通过传声器7录制到RAM13内的语音进行再生时,也使用语音合成部18。
当从传声器7通过A/D转换部17及输入接口15输入语音信号时,CPU11,参照存储在ROM12或RAM13内的语音学习数据或词典信息,执行语音识别处理。而当从触摸屏3-2通过输入检测部16及输入接口15输入操作信号(文字输入操作信号)时,CPU11,利用存储在ROM12或RAM13内的文字学习数据或文字信息,执行文字识别处理。这里,来自触摸屏3-2的输入,是对显示部3-1上显示的规定对象(图符)的指示操作信号、还是文字输入操作信号,由已起动的应用程序加以区别。
图3是表示由CPU11执行的处理功能的结构例的功能框图。在该例中,接口部30,构成用于在用户与系统之间进行信息传递的接口,对用户输入信息中的语音输入或文字输入分别进行语音识别处理或文字识别处理,生成对应的文本数据,并作为语言信息输出到概念抽出部31。此外,接口部30,还用于检测由用户随着语音或文字而输入的非语言信息。例如,当输入了语音时,接口部30,检测该语音的音调频率的变化信息或语音的大小信息,而当输入了文字时,检测用户输入文字所需要的时间或笔压变化等信息,并输出到概念抽出部31和意图解释部32。进一步,接口部30,还可以向用户提示由概念抽出部31、意图解释部32、或信息管理部33供给的信息。
概念抽出部31,对由接口部30供给的语言信息和非语音信息进行词句的模式搭配、单句的句法分析、或语义分析等自然语言处理,从而抽出概念要素。这里,所谓概念要素,表示与具有特定的归纳后语义的词句概念有关的信息。在与非语言信息对应的概念要素的抽出中,预先定义对应的概念要素的模式,例如,对于「语音的声级在X以上」这样的非语言信息,定义的是附加指示「强调」的语义信息,作为概念要素。从用户输入的1个语言信息抽出的概念要素,不一定是一个,有时也可能抽出多个概念要素。将这时得到的多个概念要素的集合称为概念要素群。由概念抽出部31抽出的概念要素群,输出到意图解释部32。
意图解释部32,根据由概念抽出部31供给的概念要素群,解释用户输入的语言信息表示怎样的意图。意图解释部32,备有预先定义了与概念要素组合对应的用户意图的用户意图规则表,参照该表,选择与由概念抽出部31供给的概念要素组合最适合的用户意图,并输出到信息管理部33。当与由概念抽出部31供给的概念要素组合完全适合的用户意图不存在时,由接口部30向用户提示该情况,或考虑从其中选择可以认为是最为适合的组合。
信息管理部33,按照由意图解释部32供给的用户意图,对个人信息存储部34进行信息的追加(存储)、删除、或检索等处理,同时将个人信息存储部34存储着的应向用户提示的信息输出到接口部30。此外,信息管理部33,还以与由概念抽出部31抽出的概念要素群相对应的方式将由接口部30输入的语音存储在个人信息存储部34内。
个人信息存储部34,是在RAM13上构成的数据库,这里,作为个人信息存储着语音录音数据、语音识别数据(文本数据)、或文字识别数据(文本数据)等。此外,在个人信息存储部34内,还存储与由概念抽出部31检出的概念要素群有关的信息,以便能将概念要素作为关键字进行数据检索。
图4示出信息管理部33的详细结构例。在该例中,信息管理部33,包括对个人信息存储部34进行信息存储或检索的个人信息操作部51、对由个人信息操作部51供给的数据进行压缩或展开的数据压缩展开部52、及对参照信息进行管理的参照信息管理部53。个人信息操作部51,接收由概念抽出部31抽出的概念要素群及由意图解释部32解释出的用户意图,并按照所接收的信息对个人信息存储部34进行数据的存储或检索。此外,个人信息操作部51,在进行信息存储时,将概念要素群及用户意图与个人信息存储部34的信息一起存储,在进行数据检索时,根据后文所述的用户意图索引和概念要素索引对用户需要的数据进行检索。
数据压缩展开部52,由个人信息操作部51控制,例如根据霍夫曼编码等进行数据压缩,同时可以对压缩过的数据进行展开。参照信息管理部53,对与存储在个人信息存储部34内的各个数据有关的各参照信息进行管理。
数据压缩展开部52,按照信息的参照频度评价值(如后文所述),改变信息的压缩率。具体地说,对需频繁参照的信息,设定为更迅速地进行展开和提示而不进行压缩,或采用低的压缩率,对不怎么使用的信息,将压缩率提得较高,以避免个人信息存储部34的浪费使用。
参照信息管理部53,对与用户进行的信息参照有关的信息(参照信息)进行管理,并随着对个人信息操作部51的个人信息存储部34的各种操作,更新参照信息。具体地说,参照信息,是用户以怎样的频度参照各个信息的参照频度。
图5示出个人信息存储部34的存储形态的例。在该例中,以与用户意图索引和概念要素索引相对应的方式存储信息(个人信息)。用户意图索引,是以用户意图为关键字的与个人信息链接的信息。例如,以用户意图「住址登录」为关键字的用户意图索引ID3,链接着与某人的住址(电话号码)有关的信息即信息D2(「A先生的电话号码xxx」)及信息D4(「B先生的电话号码xxx」)。
在从以概念要素为关键字的概念要素索引到个人信息的链接信息中,包含着与各概念要素分别对应的词句位置和作为概念要素得到的值。例如,在从概念要素索引ID5到信息D4的对应词句的链接中,提供指示与概念要素「姓名」对应的D4中的词句「B先生」的位置的信息和作为概念要素值得到的「B」的信息。另外,对于1个概念要素索引,有时信息也可能对应着多个词句(在概念要素索引ID5的情况下,有信息D2的「A先生」和信息D4的「B先生」),有时还如图5的ID4-1、4-2所示,关键字以分层的形式构成。此外,索引信息,由按照在应用程序中处理的形式定义的用户意图和概念要素构成,而且,只要不从外部改变其定义,就是固定的。
以下,参照图6说明个人信息管理装置100的动作。此外,在以下的处理中,对语音输入进行说明,即使当通过触摸屏3-2输入文字时,也进行同样的处理。首先,在步骤S61中,当用户一边操作图1的通话开关4一边开始通过传声器7输入语音时,接口部30,对所输入的语音进行识别,并将作为识别结果的语言信息和随着用户的输入同时带入的非语言信息输出到概念抽出部31。当用户停止操作通话开关4时,使语音的输入停止,并进入步骤S62。
在步骤S62中,概念抽出部31,从由接口部30供给的语言信息和非语言信息抽出概念要素。这时,概念抽出部31,将所供给的语言信息分解为具有特定语义信息的各个词句。例如,当供给的是「从今天5点起开会」这样的单句时,将其分解为词句「从今天5点」和「开会」,同时,作为语义信息而分别对「从今天5点」附加表示「开始时刻」的语义的标志、对「开会」附加表示「事件」的语义的标志。以下,以(语义信息:单词串)的形式表示由概念抽出部31抽出的概念要素。
在本例的情况下,可以从语言信息抽出由以下2个概念要素构成的概念要素群,即
(开始时刻:从今天5点起),(事件:开会)
在对非语言信息的概念抽出中,如上所述,对各非语言信息附加预先定义的概念要素。例如,当语音的声级超过规定的阈值时,概念要素抽出部31,将其看作是在用户的输入中包含着「重要的」语义,并抽出(修饰:重要)这样的概念要素。从语言信息抽出的概念要素群、及从非语言信息抽出的概念要素群,合在一起作为1个概念要素群供给到意图解释部32。
进入步骤S63,并由意图解释部32根据由概念抽出部31供给的概念要素群解释用户意图。在本实施形态中,预先准备有与概念要素群的特定组合对应的称作意图解释规则的一些规则,并根据该意图解释规则进行意图解释。
作为意图解释规则,例如可以举出,「当概念要素群中有「开始时刻」和「事件」的组合时,用户意图与预定的存储有关」、「当概念要素群中有「姓名」、「电话」和「数字串」的组合时,用户意图与电话号码的存储有关」。
例如,在步骤S62中,当得到了由以下3个概念要素
(开始时刻:从今天5点起)
(事件:开会)
(修饰:重要)
构成的概念要素群时,意图解释部32,根据意图解释规则将用户意图解释为「预定的存储」。另外,当用户的输入中包含着「检索」等词句、或包含着「什么?」或「何时?」等询问语义的词句时,意图解释部32,将用户意图解释为「信息的检索」。
可是,虽然也考虑了在用户的输入中存在着在个人信息管理装置中未定义的未知词句的情况,但在这种情况下,当进行步骤S61中的识别处理时,将发生丢失信息或导致完全不同的语义的错误识别。其结果是,在步骤S62中,不能抽出正确的概念要素。
但是,由于意图解释部32根据概念要素群中所包含着的概念要素组合解释用户意图,所以,即使含有错误的概念要素,也可以进行解释而不把该错误的概念要素考虑在内。此外,在备有语音录音功能的个人信息管理装置中,即使在语音识别时进行了错误的识别,也可以通过将所录制的语音再生而确认正确的内容。
在步骤S64中,判断由意图解释部32解释的用户意图是否是信息检索,当判定用户意图不是信息检索(是信息的存储)时,进入步骤S65。而当在步骤S64中判定用户意图是信息检索时,进入步骤S66。
在步骤S65中,信息管理部33,以与由概念抽出部31抽出的概念要素群相对应的方式将由接口部30输入的信息(文本数据或语音录音数据)存储在个人信息存储部34内,然后,进入步骤S67。这里,对于信息,还存储其生成时刻(输入时刻)、修正时刻、最后参照时刻、或参照次数等相关的信息。通过将这些相关信息适当地提示给用户,可以使用户能够掌握所管理的信息状况。
在步骤S66中,信息管理部33,从存储在个人信息存储部34内的信息中检索由用户请求的信息,并将检索结果输出到接口部30。如上所述,存储在个人信息存储部34内的信息,以概念要素的组合为依据进行存储,因此,信息管理部33,检索包含着用户的输入内所含有的概念要素群的(即用户请求的)信息。但也不一定是由与输入中所含概念要素群完全一致的概念要素群构成的信息。如果没有完全一致的信息,则可以将条件放宽后进行检索,从而检索出与用户意图尽可能接近的信息。关于检索处理的具体例,将在后文中用图8进行说明。
进入步骤S67,并由接口部30设定用于对用户的输入进行提示的信息的输出参数。这里,所谓输出参数,当以合成语音输出信息时,表示其音调或大小等参数,当如图1所示以文本形式显示在显示部3-1上时,表示所使用的字形的种类、大小、修饰等参数。在本例的情况下,在步骤S61中,以超过规定阈值的声级输入「从今天5点起开会」的语音,并在步骤S62中抽出概念要素(修饰:重要),所以,接口部30,与之相应地,将所显示的文字设定为采用比常规尺寸大的字形或以黑体字加以强调。而当所输入的语音的语速很快时,接口部30,与之相应地将所显示的文字设定为斜体字。
在步骤S68中,接口部30,利用在步骤S67中设定的输出参数对用户进行提示。例如,当在步骤S65中进行信息的存储时,以所设定的参数将所存储的信息显示在显示部3-1上,同时还显示出以怎样的方式对其进行识别和解释。而当在步骤S65中进行信息的检索时,接口部30,以所设定的参数显示检索结果。此外,作为信息的提示方法,不限于文本数据,对于录音信息,可以将用于对其进行再生的图符与文本数据一起显示,并由用户根据需要指定该图符,从而输出语音。
信息管理部33,计算出可以根据与规定的信息有关的生成(存储)时刻、修正时刻、最后参照时刻、参照次数的信息的任何一个或其组合计算的评价值,接口部30,与之相应地配置显示在显示部3-1上的信息。
由此,使用户可以根据「这是很久以前看到过的某个存储信息」、或「这是最近刚看到的信息」等实际的存储内容进行信息的检索。作为此时的评价值的一例,可以根据下式按照每单位时间的参照次数进行显示的配置。
参照次数/(最后参照时刻-输入时刻)
显示的配置方法,除上述以外还准备有几种配置方法,可以由用户选择或由用户定义。
图7示出应用画面的显示例。在该例中,如上所述,根据参照频度的评价值,将参照频度高的信息显示在画面的上侧,而将参照频度低的显示在画面的下侧,这些显示,反映出输出参数。例如,可以看到,「明天5点开会」的信息71的字形设定得大于其他信息,因此是重要事项。而显示在其下侧的信息72,是指示「明天5点」的具体日期时间的信息。显示在显示部3-1上的画面,可以通过用手指或触笔8操作滚屏条73、或操作滚屏键5而上下滚动。此外,上述信息的配置,可以由用户自由变更,当变更配置时,评价值也随着配置的变更而变更。另外,当用户对显示在显示部3-1上的信息进行了例如使字形大小变更的操作时,应对由该操作导出的概念要素进行新的追加和变更。
以下,参照图8的流程图,说明信息检索处理的具体例。在该例中,假定用户过去曾输入过「A先生」的电话号码,并对该电话号码进行检索。首先,在步骤S81中,用户将语音输入接口部30。例如,用户输入“A先生的电话号码是多少号”这样的语音。所输入的语音,不一定非得是单句,可以是例如「A先生」、「电话号码」、「多少号」等一连串的关键字。进入步骤S82,由接口部30对所输入的语音进行语音识别,并将识别结果输出到概念抽出部31。在步骤S83中,概念抽出部31,从由接口部30供给的识别结果抽出概念要素群,并输出到意图解释部32。在本例的情况下,抽出的是概念要素(姓名:A)及概念要素(电话号码:多少号)。
接着,进入步骤S84,意图解释部32,根据由概念抽出部31抽出的概念要素群,解释用户意图。在本例的情况下,由于在概念要素群中包含着「多少号」这样的明确的检索意图,所以可以判定用户意图是「信息的检索」,检索对象是「电话号码」。在步骤S85中,将由意图解释部32解释出的用户意图供给信息管理部33,信息管理部33,与之相应地,从存储在个人信息存储部34的内容中检索该信息,并将检索结果输出到接口部30。
这里,存储在个人信息存储部34的内容,假定为如图5所示的状态。图9是说明步骤S85中的信息检索处理的图。由于作为用作检索关键字的概念要素已经得到「姓名」和「电话号码」,所以,信息管理部33,对与分别将其作为关键字的概念要素索引ID5及概念要素索引ID6对应的信息进行检索。概念要素索引ID5,在本例的情况下,虽然可能与信息D2的「A先生」和信息D4的「B先生」链接,但因在该链接信息中包含着作为概念要素值的「A」,所以选择信息D2作为与检索项目相适合的信息。按照这种方式,将各概念要素的各自的检索结果综合后最终可以选择出最为适合的信息。在本例的情况下,有(姓名:A)和(电话号码:多少号)两个概念要素,而且,满足这两个条件的信息是信息D2,所以,信息管理部33,将信息D2判定为满足用户的检索意图的信息。
在步骤S86中,用户接口部30,将由信息管理部33供给的检索结果显示在显示部3-1上。
这里,有将所检索的信息以其原有的形式向用户提示的方法或只提示用户请求的词句的方法。假如采用后一种方法,则在本例的情况下,由于用户意图是检索电话号码,所以用户接口部30应提示检索结果信息D2的电话号码的概念要素值。这时,如果完全满足条件的信息不存在,则可以提示满足至少一个条件的多个信息。此外,也可以对与各概念要素是否适合的结果附加得分,并从高分起依次进行提示。在这种情况下,分别对与概念要素值完全适合的信息(在图9的情况下,为信息D2)附加例如2分、对概念要素值不同的信息(在图9的情况下,为信息D4)附加例如1分的分数。由此,可以容许用户的输入差错或对文字的错误识别。
作为对用户提供执行以上的各项处理的计算机程序的提供媒体,除磁盘、CD-ROM、固体存储器等记录媒体外,还可以利用网络、卫星等通信媒体。
可是,在由接口部30执行的语音识别处理、由概念抽出部31进行的概念要素抽出处理、及由意图解释部32进行的意图解释处理中,按照其预先分别备有的词典或处理规则执行处理。因此,当用户进行了不是预定作为用户输入处理的输入时,就有可能使用户陷入与原来请求的处理不一致的结果。此外,即使可以预先进行处理,但在例如接口部30的语音识别处理中,也有可能对出错的单句或词句进行错误的识别。由于上述处理按图6的处理步骤中示出的S61、S62、S63依次进行,所以,当例如在语音识别处理中对用户输入进行了错误的识别时,在随后的概念要素抽出处理及后面的处理中都将以错误的输入进行处理,其结果是,有可能引起不是用户意图的动作。
为避免发生这种情况,只需在接口部30中备有对由语音识别处理及由概念抽出部31、意图解释部32得到的处理结果进行提示并对其进行修正、控制的装置即可。用户可以根据该提示结果确认其处理过程并当发生差错时对其进行修正或将处理停止等。另外,在进行该修正时,可以追加用户个人的词典要素或规则要素。因此,即使是曾被错误地处理过一次的输入,也可以通过由用户追加词典或规则以便将该输入引向正确的处理,从而能够执行随后的预期动作。
另外,作为接口部30的信息输入装置,备有使用户可以选择和输入可使用的概念要素及输入意图的选择装置。因此,当用户想要可靠地输入信息时,或当想要输入与以前曾输入过的某个信息类似的信息时,可以很容易地输入系统。此外,通过对一个用户输入有选择地追加概念要素或输入意图,可以进行进一步修饰过的信息输入或更能反映用户意图的信息输入。
图10示出信息的输入步骤,图11更详细地示出图10中步骤S101的处理流程。以下,参照图10、11和12,以用户想要将「明天必须给C先生打电话」存储在个人信息管理装置100内的情况为例,说明在处理过程中发生差错时的动作。
首先,在图10的步骤S101中,用户执行信息输入操作。在图11的步骤S1101中,通过用户对图1的个人信息管理装置100的操作,进行信息输入操作,例如,用触笔8对显示部3-1所显示的对象进行选择、及对通话开关4或滚屏键5及决定键6的操作。
当用户在步骤S1101中进行一连串的处理后,在步骤1102中进行是否是语音输入的判断。这可以根据是否按压了个人信息管理装置100的通话开关4等明确地进行判断。如果是语音输入,则接着在步骤S1103中进行语音识别处理,并在步骤S110中将识别结果的文本信息存储在由RAM13确保的缓冲区内。然后,在步骤S1105中进行概念抽出处理,并在步骤S1106中将作为该抽出结果的概念要素存储在由RAM13确保的缓冲区内。进一步,在步骤S1107中进行意图解释处理,并在步骤S1108中将作为该解释结果的输入意图存储在由RAM13确保的缓冲区内。
当在步骤S1102中判定不是语音输入时,在步骤S1109中进行是否是概念要素的输入的判断。这可以根据由用户用触笔8对个人信息管理装置100的显示部3-1所显示的指示任意概念要素的对象进行选择等明确的选择输入进行判断。如果是选择概念要素,则接着进入步骤S1106,将所选定的概念要素存储在由RAM13确保的缓冲区内,然后,实施步骤S1107及随后的步骤。
另外,当在步骤S1109中判定不是概念要素的输入时,在步骤S1110中进行是否是意图输入的判断。这可以根据由用户用触笔8对上述显示部3-1所显示的指示任意输入意图的对象进行选择等明确的选择输入进行判断。如果是选择输入意图,则接着进入步骤S1108,将所选定的输入意图存储在由RAM13确保的缓冲区内。当在在步骤S1110中判定不是意图输入时,判断为不是用户输入操作,并结束处理。
这里,首先,在图10的步骤S101中,用户为了明确地表示出重要性,选择语义为在显示部3-1上显示的(修饰:必须)的对象作为概念要素。在图11的步骤S1109中,判断为概念要素的输入,并将其内容存储在缓冲区内。接着在图10的步骤S102中,用显示部3-1将该缓冲区的内容提示给用户。然后,在步骤S103中,由用户判断该输入结果是否正确,如果是错误的,则在步骤S104中进行修正或删除处理。如果输入正确,则在步骤S105中进行是否有进一步的信息输入的判断。该判断可以通过用户用触笔8或键输入明确地进行。
接着,当用户以语音输入方式对本装置输入上述的「明天必须给C先生打电话」时,进行录音并在图11的步骤1003中通过识别处理变换为文本,在步骤S1004中将该结果存储在缓冲区内。这里,错误地识别为「明天不给B先生打电话」,并通过步骤S1005抽出概念要素:(修饰:必须)、(日期时间:明天)、(姓名:B)、(事件:电话)、(动作:取消)。进一步,在步骤S1007中,解释为「预定的删除」。
在图10的步骤S102中,按照RAM13所存储的缓冲区的内容对用户进行如图12所示的信息提示。在图12中,从画面上部起依次提示各处理过程的结果,并由语音输入结果显示部121、概念要素显示部122、用户意图显示部123提示各处理结果。语音输入结果显示部121,由作为语音识别结果的文本部121-1及录音数据再生指示部121-2构成。概念要素显示部122,提示从用户输入抽出的或由用户选择输入并存储在缓冲区内的概念要素群。另外,用户意图显示部123,提示从概念要素群解释出的或由用户选择输入并存储在缓冲区内的用户意图。OK键124及NG键125,使用户可以对该结果进行判断,如果由语音输入结果显示部121、概念要素显示部122、用户意图显示部123显示出的内容正确,则按压OK键124,如果有差错并重新运行,则按压NG键125。
用户可以观察在该图12中提示的处理过程,并对所进行的与自己的意图不同的处理进行确认。在步骤S103中,如用户判断为必须进行修正或删除,则可以在步骤S104中进行修正或删除。修正和删除操作,例如可按如下方式进行,即,在图12所示的画面上,通过触笔操作指定语音输入结果显示部121、概念要素显示部122、用户意图显示部123中的任何一个的显示区域,从而指示应修正的处理结果,并选择或重新输入正确的处理结果。这里,用户可以通过在概念要素抽出处理中将具有姓名属性的概念要素值修正为「C」并将概念要素(动作:取消)删除,修正为符合用户本来的输入意图。此外,在进行上述修正的同时,在已抽出语义的原识别结果的文本中也反映出修正,并以「明天给C打电话」的文本形式保存信息。
当用户的修正操作结束时,在步骤S105中判断是否继续进行输入。这里,假如对以上的输入进行了用户所期望的处理,则用户将输入处理中止,并进入执行处理。
按照这种方式,即可纠正在信息的输入处理过程中产生的差错,同时可以逐次追加在一次输入中不能表现的附加信息,因而能够进行更有表现力的信息输入。
这里,在表1中给出定义了与任意概念要素组合对应的用户意图的用户意图规则表的一例。在该表1中,在箭头的左边,记载着个数任意的概念要素串,在右边,记载着作为对与左边相对应的概念要素群的解释的用户意图。这里,可以用预先确定的特别符号作为概念要素的值,例如,「*」表示只要概念要素的属性一致则可以为任何值,「过去」,表示该值为比当前时刻早的时刻的所有值。
表1:用户意图规则
概念要素 用户意图
(姓名:*)、(电话:*)、(数字串:*) →住址登录
(时刻:*)、(事件:*) →预定
(时刻:*)、(场所:*) →预定
(时刻:过去)、(金额:*) →金额
以下,在图13中示出采用个人信息管理装置100时显示出用户输入信息过程的显示部的显示例。在图13中,在输入项目选择部1301中,提示着指示3种输入形式的项目。用户通过用上述的触笔8对输入项目选择部1301的文本输入按钮1302、概念要素输入按钮1303、用户意图输入按钮1304中的任何一个进行操作,即可进行特定形式的输入。文本输入按钮1302,用于由用户以文本输入形式输入信息,概念要素输入按钮1303,用于输入概念要素,用户意图输入按钮1304,用于输入用户意图。图13示出显示输入概念要素过程的一例,作为以触笔8按压概念要素输入按钮的结果,显示出表示概念要素属性的表1305,进一步,当选择该表1305中的项目「事件」时,显示出显示着列出与「事件」对应的概念要素值的表1306的状态。用户可以通过选择表中的任意值输入其想要输入的概念要素。
另外,图14是表示根据用户意图提示信息的一种形式的一例。在图14的用户意图选择部1401中,显示着表示应在显示部上进行一览显示的用户意图的按钮。用户通过用上述触笔8按压该用户意图选择部1401中的任意按钮,即可仅显示出与该用户意图相关的信息。这里,作为用户意图,给出一个由用户指示了使其提示与「金额」有关的信息的例,并以适当的形式提示「日期」、「项目」、「金额」等与「金额」有关的信息。
图15是显示出信息修正过程的显示部的一例。该例表示出将作为概念要素抽出的(姓名:B)修正为(姓名:C)的过程。当用户用上述触笔8选择想要修正的项目、即图15情况下的(姓名:B)的概念要素1501时,显示列出概念要素属性的表1502。在表1502中,在表1502中选择的将概念要素(姓名:B)的属性「姓名」显示在表1502的最上部。进一步,当用户选择显示在表1502上的概念要素属性时,显示列出该概念要素值的表1503。由于本操作是与修正有关的操作,所以在表1503中将与选定的概念要素(姓名:B)一致的值「B」除去。接着,通过选择表1503中显示的概念要素值「C」,即可将用户想要修正的概念要素(姓名:B)1501变更为(姓名:C)。
在以上的实施形态中,将本发明应用于如图1所示的携带式个人信息管理装置100,但当然也可以应用于其他装置。另外,在概念抽出部31中,从语言信息和非语言信息两者抽出概念要素,以便在信息的管理中更详细地反映用户的输入意图,但也可以从其中一种信息抽出概念要素。
作为对用户提供执行以上各项处理的计算机程序的提供媒体,除磁盘、CD-ROM、固体存储器等记录媒体外,还可以利用网络、卫星等通信媒体。
Claims (14)
1.一种信息处理装置,其特征在于,备有:输入装置,用于输入信息;抽出装置,从由上述输入装置输入的上述信息抽出概念要素;解释装置,根据由上述抽出装置抽出的上述概念要素解释用户的上述信息的输入意图;及执行装置,按照由上述解释装置解释出的上述输入意图对上述信息执行规定的处理。
2.根据权利要求1所述的信息处理装置,其特征在于:上述执行装置,按照上述输入意图执行上述信息的存储、对与上述信息相关的其他信息的检索、或删除。
3.根据权利要求2所述的信息处理装置,其特征在于:上述执行装置,按照对上述信息的参照频度,设定压缩上述信息时的压缩率。
4.根据权利要求1所述的信息处理装置,其特征在于:还备有提示上述执行装置的执行结果的提示装置,上述提示装置,根据上述概念要素设定提示的执行结果的输出参数。
5.根据权利要求4所述的信息处理装置,其特征在于:上述提示装置,当提示多个信息作为上述执行结果时,按照各信息的参照频度,决定其提示的顺序。
6.根据权利要求4所述的信息处理装置,其特征在于:上述输出参数,是与上述执行结果对应的显示字形的形状或大小。
7.根据权利要求4所述的信息处理装置,其特征在于:上述输出参数,是与上述执行结果对应的语音的音调频率或语速。
8.根据权利要求1所述的信息处理装置,其特征在于:上述信息是语音,并且,还备有对由上述输入装置输入的上述语音进行语音识别的识别装置。
9.根据权利要求8所述的信息处理装置,其特征在于:还备有当由上述识别装置识别上述语音时对上述语音进行录音的录音装置,上述执行装置,使由上述抽出装置抽出的上述概念要素与由上述录音装置录制的上述语音相对应。
10.根据权利要求1所述的信息处理装置,其特征在于:上述输入装置,备有用户用来选择和输入由上述概念要素的抽出装置抽出的概念要素的选择装置。
11.根据权利要求1所述的信息处理装置,其特征在于:上述输入装置,备有用户用来选择和输入由上述解释装置解释的输入意图的选择装置。
12.根据权利要求1所述的信息处理装置,其特征在于:上述输入装置,备有存储抽出装置和解释装置的各处理结果的缓冲装置、及将存储在上述缓冲装置内的各处理结果对用户进行提示的提示装置。
13.一种信息处理方法,其特征在于,包括:输入步骤,用于输入信息;抽出步骤,从在上述输入步骤中输入的上述信息抽出概念要素;解释步骤,根据在上述抽出步骤中抽出的上述概念要素解释用户的上述信息输入意图;及执行步骤,按照在上述解释步骤中解释出的上述输入意图对上述信息执行规定的处理。
14.一种信息提供媒体,其特征在于,提供用于使信息处理装置执行包括如下步骤的处理的计算机可读程序,即输入信息的输入步骤、从在上述输入步骤中输入的上述信息抽出概念要素的抽出步骤、根据在上述抽出步骤中抽出的上述概念要素解释用户的上述信息的输入意图的解释步骤、及按照在上述解释步骤中解释出的上述输入意图对上述信息执行规定的处理的执行步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15282498 | 1998-06-02 | ||
JP152824/1998 | 1998-06-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1274440A true CN1274440A (zh) | 2000-11-22 |
Family
ID=15548955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99801293A Pending CN1274440A (zh) | 1998-06-02 | 1999-06-02 | 信息处理装置和方法、及信息提供媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6510412B1 (zh) |
KR (1) | KR100638198B1 (zh) |
CN (1) | CN1274440A (zh) |
WO (1) | WO1999063425A1 (zh) |
Cited By (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101989424A (zh) * | 2009-07-30 | 2011-03-23 | 索尼公司 | 语音处理设备和方法及程序 |
CN101616221B (zh) * | 2008-06-25 | 2012-07-18 | 富士通株式会社 | 引导信息显示装置及引导信息显示方法 |
CN105745679A (zh) * | 2013-07-26 | 2016-07-06 | 格林伊登美国控股有限责任公司 | 用于发现和探索概念的系统和方法 |
US9548050B2 (en) | 2010-01-18 | 2017-01-17 | Apple Inc. | Intelligent automated assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9620104B2 (en) | 2013-06-07 | 2017-04-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9626955B2 (en) | 2008-04-05 | 2017-04-18 | Apple Inc. | Intelligent text-to-speech conversion |
US9633660B2 (en) | 2010-02-25 | 2017-04-25 | Apple Inc. | User profiling for voice input processing |
US9646614B2 (en) | 2000-03-16 | 2017-05-09 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9953088B2 (en) | 2012-05-14 | 2018-04-24 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9966068B2 (en) | 2013-06-08 | 2018-05-08 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10102359B2 (en) | 2011-03-21 | 2018-10-16 | Apple Inc. | Device access using voice authentication |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10185542B2 (en) | 2013-06-09 | 2019-01-22 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10283110B2 (en) | 2009-07-02 | 2019-05-07 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5077787B2 (ja) * | 2000-03-30 | 2012-11-21 | 渡邉 治巳 | ネットワークを介した企業業務毎の文字・画像パターンの移植可能表示・印刷ファイル生成装置 |
AU2001295080A1 (en) * | 2000-09-29 | 2002-04-08 | Professorq, Inc. | Natural-language voice-activated personal assistant |
US6788767B2 (en) * | 2000-12-28 | 2004-09-07 | Gateway, Inc. | Apparatus and method for providing call return service |
JP2002258894A (ja) * | 2001-03-02 | 2002-09-11 | Fujitsu Ltd | 音声データ圧縮・解凍装置及び方法 |
JP2006331302A (ja) * | 2005-05-30 | 2006-12-07 | Kyocera Corp | 関連情報検索装置 |
US20060282265A1 (en) * | 2005-06-10 | 2006-12-14 | Steve Grobman | Methods and apparatus to perform enhanced speech to text processing |
US7996228B2 (en) * | 2005-12-22 | 2011-08-09 | Microsoft Corporation | Voice initiated network operations |
KR101577607B1 (ko) | 2009-05-22 | 2015-12-15 | 삼성전자주식회사 | 상황 및 의도인지 기반의 언어 표현 장치 및 그 방법 |
CN105956137B (zh) * | 2011-11-15 | 2019-10-01 | 阿里巴巴集团控股有限公司 | 一种搜索方法、搜索装置及一种搜索引擎系统 |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
WO2019144542A1 (en) * | 2018-01-26 | 2019-08-01 | Institute Of Software Chinese Academy Of Sciences | Affective interaction systems, devices, and methods based on affective computing user interface |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2791051B2 (ja) * | 1988-10-04 | 1998-08-27 | キヤノン株式会社 | 情報処理システム |
US5282265A (en) * | 1988-10-04 | 1994-01-25 | Canon Kabushiki Kaisha | Knowledge information processing system |
JP2525666B2 (ja) * | 1989-04-03 | 1996-08-21 | 富士写真フイルム株式会社 | 画像ファイリング方法 |
JPH0343867A (ja) * | 1989-07-12 | 1991-02-25 | Hitachi Ltd | 画像検索方法 |
JPH0352058A (ja) * | 1989-07-20 | 1991-03-06 | Fujitsu Ltd | 音声入力の文書処理装置 |
US5477511A (en) * | 1994-07-13 | 1995-12-19 | Englehardt; C. Duane | Portable documentation system |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US6167376A (en) * | 1998-12-21 | 2000-12-26 | Ditzik; Richard Joseph | Computer system with integrated telephony, handwriting and speech recognition functions |
US6249765B1 (en) * | 1998-12-22 | 2001-06-19 | Xerox Corporation | System and method for extracting data from audio messages |
US6266642B1 (en) * | 1999-01-29 | 2001-07-24 | Sony Corporation | Method and portable apparatus for performing spoken language translation |
-
1999
- 1999-06-02 US US09/463,927 patent/US6510412B1/en not_active Expired - Lifetime
- 1999-06-02 CN CN99801293A patent/CN1274440A/zh active Pending
- 1999-06-02 WO PCT/JP1999/002950 patent/WO1999063425A1/ja not_active Application Discontinuation
- 1999-06-02 KR KR1020007001113A patent/KR100638198B1/ko not_active IP Right Cessation
Cited By (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9646614B2 (en) | 2000-03-16 | 2017-05-09 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US9626955B2 (en) | 2008-04-05 | 2017-04-18 | Apple Inc. | Intelligent text-to-speech conversion |
CN101616221B (zh) * | 2008-06-25 | 2012-07-18 | 富士通株式会社 | 引导信息显示装置及引导信息显示方法 |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US10283110B2 (en) | 2009-07-02 | 2019-05-07 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
CN101989424B (zh) * | 2009-07-30 | 2012-07-04 | 索尼公司 | 语音处理设备和方法 |
CN101989424A (zh) * | 2009-07-30 | 2011-03-23 | 索尼公司 | 语音处理设备和方法及程序 |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US9548050B2 (en) | 2010-01-18 | 2017-01-17 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US9633660B2 (en) | 2010-02-25 | 2017-04-25 | Apple Inc. | User profiling for voice input processing |
US10102359B2 (en) | 2011-03-21 | 2018-10-16 | Apple Inc. | Device access using voice authentication |
US9953088B2 (en) | 2012-05-14 | 2018-04-24 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9620104B2 (en) | 2013-06-07 | 2017-04-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9966068B2 (en) | 2013-06-08 | 2018-05-08 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10185542B2 (en) | 2013-06-09 | 2019-01-22 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
CN105745679B (zh) * | 2013-07-26 | 2020-01-14 | 格林伊登美国控股有限责任公司 | 用于发现和探索概念的系统和方法 |
CN105745679A (zh) * | 2013-07-26 | 2016-07-06 | 格林伊登美国控股有限责任公司 | 用于发现和探索概念的系统和方法 |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
Also Published As
Publication number | Publication date |
---|---|
KR100638198B1 (ko) | 2006-10-26 |
WO1999063425A1 (fr) | 1999-12-09 |
US6510412B1 (en) | 2003-01-21 |
KR20010022524A (ko) | 2001-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1274440A (zh) | 信息处理装置和方法、及信息提供媒体 | |
CN1201611C (zh) | 具有预测编辑作用的通信终端 | |
CN1201225C (zh) | 背景声频恢复系统 | |
US7277029B2 (en) | Using language models to expand wildcards | |
US6173253B1 (en) | Sentence processing apparatus and method thereof,utilizing dictionaries to interpolate elliptic characters or symbols | |
US8335787B2 (en) | Topic word generation method and system | |
US20030177008A1 (en) | Voice message processing system and method | |
CN1685303A (zh) | 在电子装置的用户界面中输入单词的方法及装置 | |
CN1732426A (zh) | 用于移动通信终端的预测性文本条目和数据压缩方法 | |
CN1748195A (zh) | 用于小键盘的文本输入机制 | |
CN1271433A (zh) | 简化键盘多义性消除系统 | |
CN1764896A (zh) | 在具有用户接口的电子设备中提供允许语音的输入的方法和设备 | |
CN1441371A (zh) | 字符输入装置 | |
JP2008250385A (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JPWO2006134682A1 (ja) | 固有表現抽出装置、方法、及びプログラム | |
JP5688941B2 (ja) | 声調を用いて中国語を検索する方法及びその方法を実行するシステム | |
CN1095560C (zh) | 修改汉字转换结果的系统 | |
JP2003030207A (ja) | モバイル機用取扱問題解決処理システム及びモバイル機用取扱問題解決処理プログラム並びにデータベース検索プログラム並びに当該プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN110968245A (zh) | 一种透过语音控制office办公软件的操作方法 | |
CN101655846A (zh) | 中文输入法标点关联方法及装置 | |
CN1084500C (zh) | 汉字变换装置 | |
CN1190748C (zh) | 信息处理装置及方法、和电子出版数据提供系统 | |
JP2002156996A (ja) | 音声認識装置、認識結果修正方法及び記録媒体 | |
JP2005044103A (ja) | 文書作成装置、文書作成方法およびプログラム | |
JP2006120021A (ja) | 問題解決支援装置、問題解決支援方法、及び問題解決支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1047719 Country of ref document: HK |