CN101563682A - 语句改述方法、程序以及系统 - Google Patents

语句改述方法、程序以及系统 Download PDF

Info

Publication number
CN101563682A
CN101563682A CNA2007800474909A CN200780047490A CN101563682A CN 101563682 A CN101563682 A CN 101563682A CN A2007800474909 A CNA2007800474909 A CN A2007800474909A CN 200780047490 A CN200780047490 A CN 200780047490A CN 101563682 A CN101563682 A CN 101563682A
Authority
CN
China
Prior art keywords
sentence
file
transformation rule
storage unit
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800474909A
Other languages
English (en)
Inventor
石川开
赤峰享
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN101563682A publication Critical patent/CN101563682A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

对于用户对疑问句的输入,学习疑问句的改述模型,实时生成改述后的表述。当文件集合存储单元(401)的信息被更新时,语句对提取单元(301)从文件集合存储单元(401)提取改述语句对,并将其存储在语句对存储单元(403)中。模型学习单元(302)从语句对存储单元(402)中的改述语句对学习疑问句改述模型,并将其存储在模型存储单元(402)中。语句对提取单元(301)使用模型存储单元(302)所具有的疑问句改述模型从文件集合存储单元(401)再次提取改述语句对并将其存储在语句对存储单元(403)中。当存储的改述语句对与存储在语句对存储单元(403)中的改述语句对相同时,结束疑问句改述模型的学习。候选制定单元(303)从模型存储单元(402)读取疑问句改述模型,生成所输入的疑问句的改述候选。

Description

语句改述方法、程序以及系统
技术领域
(相关申请)本申请要求在先的日本发明专利申请第2006-345757号(2006年12月22日申请)的优先权,所述在先申请的全部记载内容将通过引用被记入本申请文件中。
本发明涉及语句改述方法、转换规则计算方法、语句改述系统、转换规则计算用的程序以及语句改述用的程序,尤其是涉及学习语句的改述规则的语句改述方法、转换规则计算方法、语句改述系统、转换规则计算用的程序以及语句改述用的程序。
背景技术
由计算机将由人输入的文章转换为他国语言的文章的机器翻译已被广泛应用,但在将同一语言之间的转换为对象的情况下,则使用用于改变文章表述的语句的改述方法(参见非专利文献1)。
在非专利文献1中,记载了现有的语句的改述后的表述制定方法的一个例子。非专利文献1中记载的语句的改述后的表述制定方法是事先由人制定依照造句法特征(性质)来进行表述的改述规则的方法。而且对于获得的改述后的表述,最终需人工确认。
此外,语句改述方法还被用于对于转换后的疑问句自动输出答复的疑问应答系统等中(参见专利文献1)。例如,在专利文献1中,记载了通过机器学习从改述文集(corpus)获得语句改述模型的语句的改述后的表述制定方法的一个例子。在专利文献1所记载的语句的改述后的表述制定方法中,将多个对于辞典或新闻等报道中的相同标题的说明句当作具有改述关系的文件对来制定改述文集,并对此进行机器学习。
非专利文献1:藤田  篤、他1名、「A Class-oriented Approach toBuilding a paraphrase Corpus(IWP)」、2005年10月、P.25-32;
专利文献1:日本专利申请早期公开特开2002-014990号公报(第0058~0059段、以及图4)。
发明内容
上述非专利文献1以及专利文献1的全部公开内容通过引用被记入本申请文件中。
但是,当对由很多用户输入的疑问句适用现有的语句的改述后的表述制定方法时,就人工制定改述规则的方法(例如,非专利文献1所记载的语句的改述后的表述制定方法)而言,需要制定大量的规则。这是因为对于多种多样的疑问句的内容和表述必须要实现充分的收罗性。而且,当获得最终的改述后的表述时需要人工进行确认操作,因此大多情况下无法适用于对用户的疑问句输入进行实时处理的系统。
此外,在专利文献1所记载的语句的改述后的表述制定方法中,就已有的辞典的标题或新闻等报道中未收罗的领域而言,难以获取学习数据。而且,如果学习数据当中包含有表述上不具有可改述的关系的语句对,则学习时就会成为干扰(无用信息)。此时,根据学习数据的质量有时无法获得恰当的语句改述模型(改述规则。以下称为改述模型)。即,在如专利文献1所记载的那样从已有的辞典或新闻等报道数据进行机器学习的方法中,被收罗的疑问句限定在与已有的辞典和新闻等报道数据相关的内容,因此大多情况下对于用户多种多样的疑问句难以实现充分的收罗性。语句对是指两个语句的组合(两句一组)。
因此,本发明的目的在于,提供对于用户的疑问句输入实时生成改述表述的语句改述方法、转换规则计算方法、语句改述系统、转换规则计算用的程序以及语句改述用的程序,尤其是提供能够对用户输入的疑问句的改述模型进行学习的语句改述方法、转换规则计算方法、语句改述系统、转换规则计算用的程序以及语句改述用的程序。
根据本发明的第一方面,提供一种语句改述方法,用于针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,其特征在于,包括:第一句子提取步骤,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;转换规则计算步骤,基于在第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;第二句子提取步骤,使用在转换规则计算步骤中算出的转换规则从存储单元中再次提取具有阈值以上的相似度的句子的组合;判定步骤,判定在第一以及第二句子提取步骤中提取的句子的组合是否全部一致;以及文件生成步骤,使用在转换规则计算步骤中算出的转换规则来生成所输入的疑问文件的改述文件,其中,重复执行第一句子提取步骤、转换规则计算步骤以及第二句子提取步骤,直到在第一以及第二句子提取步骤中提取的句子的组合全部一致为止。
在上述语句改述方法中,优选包括对用户显示所生成的改述文件的步骤,并且一并显示生成的改述文件和表示相对于所输入的疑问句的相似度的值。
可以在上述语句改述方法的文件生成步骤中包括:将所输入的疑问文件分解为单词序列的步骤;对在转换规则计算步骤中算出的转换规则与所述单词序列进行比较并选择多个相似度高的单词序列的选择步骤;以及对在选择步骤中选择的单词序列进行重排的重排步骤。
根据本发明的第二方面,提供一种转换规则计算方法,用于针对由用户输入的疑问文件计算用于生成内容相同但表述不同的疑问文件的转换规则,其特征在于,包括:第一句子提取步骤,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;转换规则计算步骤,基于在第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;第二句子提取步骤,使用在转换规则计算步骤中算出的转换规则从存储单元中再次提取具有阈值以上的相似度的句子的组合;和判定步骤,判定在第一以及第二句子提取步骤中提取的句子的组合是否全部一致,其中,重复执行第一句子提取步骤、转换规则计算步骤以及第二句子提取步骤,直到在第一以及第二句子提取步骤中提取的句子的组合全部一致为止。
在上述转换规则计算方法中,将从输入单元输入的疑问文件、针对疑问文件的答复文件、以及表示疑问文件与答复文件的对应关系的信息存储在存储单元中,并且对于集合了内容相同的答复文件的一个组,应用信息来生成与内容相同的答复文件对应的疑问文件的组。
上述转换规则计算方法可以包括更新存储单元中保存的信息的步骤。此时也可以以存储单元的信息被更新了的事件为契机,开始进行第一句子提取步骤的处理。
根据本发明的第三方面,提供一种语句改述系统,用于针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,其特征在于,包括:输入单元,用于输入疑问文件;存储单元,用于存储输入至输入单元的疑问文件以及针对疑问文件的答复文件;句子提取单元,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;转换规则计算单元,基于在句子提取单元中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;以及文件生成单元,使用由转换规则计算单元算出的转换规则来生成由用户输入至输入单元的疑问文件的改述文件。
上述语句改述系统中的存储单元优选包括:第一存储单元,用于存储输入至输入单元的疑问文件与针对疑问文件的答复文件;第二存储单元,用于存储由句子提取单元提取的句子的组合;和第三存储单元,用于存储由转换规则计算单元算出的转换规则。
此外,上述语句改述系统中的转换规则可以至少包括翻译模型、语言模型以及单词序列。
此外,上述语句改述系统可以包括显示由文件生成单元生成的改述文件的显示单元。可以在该显示单元上一并显示由文件生成单元生成的改述文件、以及表示与由用户输入至输入单元的疑问句之间的相似度的值。
此外,上述语句改述系统可以包括依据输入至输入单元的指令来更新存储单元中的信息的信息更新单元。该信息更新单元在更新了存储单元中的信息时向句子提取单元发送用于开始提取句子的组合的信号。
此外,上述语句改述系统可以是根据由用户过去输入的疑问文件与针对各疑问文件的答复文件之间的对应关系来制定与同一答复文件对应的疑问文件集合,并将该疑问文件集合作为语句改述的学习数据来使用的语句改述系统。即便是对应于同一答复文件的疑问文件,也会根据制定每个文件的用户对领域中的知识或问题的理解水平、意图或战略的不同等,不能保证文件彼此间必定存在可相互进行改述的关系,因此该语句改述系统为了从疑问句集合的所有语句对中只筛选出存在可相互进行改述的关系的语句对,而通过改述模型(例如,后述的式(1)等)来提取存在可相互进行改述的关系的语句对。然后,将所述提取的改述语句对(例如,图8所述的语句对)作为学习数据进来进一步进行改述模型的学习。交替地重复执行使用改述模型在上述改述语句对中提取改述语句对的过程和利用所提取的改述语句对学习改述模型的过程这两个过程直到提取语句组(提取的改述语句对)收敛(使用新学习到的改述模型提取的改述语句对与使用之前的改述模型提取的改述语句对达到相同)为止,并获得最终的改述模型。通过这样的逐次处理,能够从对应于同一答复文件的疑问文件集合中高精度地提取存在改述语句的关系的语句对,因此能够将此语句对作为学习数据来学习恰当的改述模型。
通过进行上述那样的学习,上述疑问句改述系统例如能够生成针对用邮件接收的疑问文件的答复文件。即,即便顾客以各种各样的表述进行咨询,对于该表述也能够生成各种各样的改述来对照。从而,只要预先备有疑问文件与答复文件的对,就能够与咨询的表述不同无关地自动分配答复文件。
上述的语句改述方法例如能够用于自动生成应对记录(摘要)。即,当在语句改述系统中积累了答复文件(答复的邮件、或者将操作员用电话答复的语音通过语音识别转换而成的文本)及其对应记录(由操作员将对应内容摘录的记录)时,通过学习从该答复文件改述为应对记录的模型,能够实现应对记录的自动生成。
根据本发明的第四方面,提供一种转换规则计算用的程序,针对由用户输入的疑问文件计算用于生成内容相同但表述不同的疑问文件的转换规则,所述程序用于使计算机执行以下处理:第一句子提取处理,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;转换规则计算处理,基于在第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;第二句子提取处理,使用在转换规则计算处理中算出的转换规则从存储单元中再次提取具有阈值以上的相似度的句子的组合;和判定处理,判定在第一以及第二句子提取处理中提取的句子的组合是否全部一致,其中,使计算机重复执行第一句子提取处理、转换规则计算处理以及第二句子提取处理,直到在第一以及第二句子提取处理中提取的句子的组合全部一致为止。
上述转换规则计算用的程序可以使计算机执行以下处理,即:在存储了从输入单元输入的疑问文件、针对疑问文件的答复文件、以及表示疑问文件与答复文件的对应关系的信息的存储单元中,对于集合了内容相同的答复文件的一个组,应用信息来生成与内容相同的答复文件对应的疑问文件的组。
上述转换规则计算用的程序也可以使计算机执行更新存储单元中保存的信息的处理,以及以存储单元的信息被更新了的事件为契机来开始进行第一句子提取处理的处理。
根据本发明的第五方面,提供一种语句改述用的程序,针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,所述程序使计算机执行以下处理:第一句子提取处理,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;转换规则计算处理,基于在第一句子提取处理中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;第二句子提取处理,使用在转换规则计算处理中算出的转换规则从存储单元中再次提取具有阈值以上的相似度的句子的组合;判定处理,判定在第一以及第二句子提取处理中提取的句子的组合是否全部一致;直到在判定出第一以及第二句子提取处理中提取的句子的组合全部一致为止重复执行第一句子提取处理、转换规则计算处理以及第二句子提取处理的处理;以及文件生成处理,使用在转换规则计算处理中算出的转换规则来生成所输入的疑问文件的改述文件。
上述语句改述用的程序可以使计算机执行一并显示表示相对于所输入的疑问句的相似度的值和生成的改述文件的处理。
上述语句改述用的程序可以使计算机在文件生成处理中执行:将所输入的疑问文件分解为单词序列的处理;对在转换规则计算处理中算出的转换规则与单词序列进行比较并选择多个相似度高的单词序列的选择处理;以及对在选择处理中选择的单词序列进行重排的重排处理。
发明效果
根据本发明,能够从用户过去输入的疑问文件与针对各疑问文件的答复文件之间的对应关系学习疑问句改述模型。这是因为引入了一边逐步去除不处于改述语句的关系的疑问句对、一边同时学习改述模型以逐步提高了改述模型精度的渐进的处理过程的缘故。于是,能够从对应于同一答复文件的疑问文件集合中高精度地提取处于改述语句的关系的语句对。
附图说明
图1是示出根据本发明的语句改述系统的一个例子的系统结构图;
图2是用于说明语句改述系统的动作的流程图;
图3是用于说明语句改述系统的动作的流程图;
图4是示出存储在文件集合存储单元中的疑问文件集合的一个例子的说明图;
图5是示出针对图4所示的每个疑问句文件的答复文件的一个例子的说明图;
图6是示出图4中的每个疑问句文件与图5中的答复文件之间的对应关系的说明图;
图7是示出从图6的对应关系制定的、与同一答复文件对应的疑问文件集合的关系的说明图;
图8是示出由语句对提取单元提取的改述语句对的一个例子的说明图;
图9是示出与图8所示的改述语句对对应的各疑问句的文本(text)的一个例子的说明图;
图10是示出由模型学习单元对改述语句对(Q1_S1、Q1_S2)执行的对准(alignment)结果的说明图;
图11是由模型学习单元对改述语句对(Q1_S1、Q10_S2)执行的对准结果的说明图;
图12是示出由模型学习单元对改述语句对(Q2_S1、Q6_S1)执行的对准结果的说明图;
图13是示出由模型学习单元对改述语句对(Q2_S1、Q9_S2)执行的对准结果的说明图;
图14是示出由模型学习单元对改述语句对(Q2_S1、Q10_S2)执行的对准结果的说明图;
图15是示出由模型学习单元对改述语句对(Q2_S1、Q12_S2)执行的对准结果的说明图;
图16是示出由语句对提取单元提取的改述语句对的一个例子的说明图;
图17是示出与新追加的语句对(Q4_S1、Q8_S1)对应的疑问句的文本的一个例子的说明图;
图18是示出由模型学习单元对改述语句对(Q4_S1、Q8_S1)执行的对准结果的说明图;
图19是示出输入至输入单元的疑问句的一个例子的说明图;
图20是示出由候选生成单元使用改述模型生成的改述候选的一个例子的说明图。
附图符号说明
100输入单元
200输出单元
300数据处理装置
301语句对提取单元
302模型学习单元
303文件登记单元
304候选生成单元
400存储单元
401文件集合存储单元
402模型存储单元
403语句对存储单元
具体实施方式
以下,参考附图对本发明的实施方式进行说明。图1是示出根据本发明的语句改述系统的一个例子的系统结构图。语句改述系统包括:输入单元100、输出单元200、通过程序控制来动作的数据处理装置300、以及存储单元400。本实施方式中的语句改述系统使用存储在存储单元400中的疑问句改述模型实时生成输入至输入单元100的疑问句的改述候选。下面,对输入至输入单元100的文章为疑问句的情况进行说明。
输入单元100例如通过用于输入文章等的键盘或鼠标等来实现。输入单元100具有向数据处理装置300输出与用户的操作相应的输入信号的功能。
输出单元200通过液晶显示装置等来实现。在输出单元200上,例如显示由数据处理装置300生成的疑问句的改述候选。
数据处理装置300包含:语句对提取单元301、模型学习单元302、文件登记单元303。候选生成单元304。数据处理装置300例如通过CPU和图中没有示出的外围电路来实现。数据处理装置300通过程序控制来动作,生成输入至输入单元100的疑问句的改述候选。
语句对提取单元301具有对于存储在后述的存储单元400中的疑问文件的集合中的所有语句对判定每个语句对是否具有改述语句对的关系的功能。具体地说,语句对提取单元301使用存储在模型存储单元402中的疑问句改述模型对存储在文件集合存储单元401中的疑问文件集合中的所有语句对判定是否为改述语句对。本实施方式中的改述语句对是指处于可改述的关系(即内容相同)的句子的组合(两句一组)。例如,在语句对包含多个句子的情况下,也可以存在该语句对中的两个句子被判定为改述语句对的情况。语句对提取单元301将被判定为改述语句对的语句对输出并存储在语句对存储单元403中。
模型学习单元302具有将存储在语句对存储单元403中的改述语句对用作学习数据来学习疑问句改述模型的功能。模型学习单元302将学习的疑问句改述模型存储在模型存储单元402中。本实施方式中的学习是指直到获得与现有的疑问句改述模型不同的新的疑问句改述模型为止的整个处理。
此外,在本实施方式中,疑问句改述模型以最优的形式应用于各处理工序中。例如,语句对提取单元301在提取改述语句对时,将用于判定是否为改述语句对的翻译概率等用作疑问句改述模型。此外,例如模型学习单元302从所提取的改述语句对学习疑问句语言模型等。本实施方式中的疑问句改述模型包含翻译概率、疑问句改述翻译模型、疑问句语言模型、以及单词序列等。
文件登记单元303具有依据从输入单元100输入的指令来更新文件集合存储单元401的信息的功能。具体地说,文件登记单元303将输入至输入单元100的具有同一答复文件的疑问文件集合存储到文件集合存储单元401中。此外,文件登记单元303具有依据输入至输入单元100的指令来删除文件集合存储单元401中的疑问文件集合的功能。后述的改述语句对的提取处理以文件登记单元303向语句对提取单元301输出的信号为契机而开始。
候选生成单元304具有对从输入单元100输入的疑问句生成改述候选并将该改述候选输出给输出单元200的功能。具体地说,候选生成单元304具有应用存储在模型存储单元402中的疑问句改述模型实时生成针对所输入的疑问句的改述候选的功能。并且,候选生成单元304将生成的改述候选输出给输出单元200。
存储单元400包括:文件集合存储单元401、模型存储单元402、语句对存储单元403。存储单元400例如通过RAM等存储介质来实现,保存由数据处理装置300执行的控制程序等各种数据。存储单元400的一部分也可以通过ROM来实现,并且也可以在ROM部分中存储控制程序。
存储单元400具有存储由用户输入的疑问句、针对该疑问句的答复句、疑问句与答复句的对应关系以及疑问句改述模型等的功能。
文件集合存储单元401存储基于从输入单元100输入的疑问文件的集合和对于所述各疑问文件的答复文件来制定的、与同一答复文件对应的疑问句的集合等。
模型存储单元402具有存储疑问句改述模型的功能。具体地说,模型存储单元402存储由模型学习单元302学习到的疑问句语言模型或单词序列等新的疑问句改述模型。模型存储单元402所存储的疑问句改述模型被语句对提取单元301或候选生成单元304读取。
语句对存储单元403具有存储由语句对提取单元301判定为改述语句对的语句对(句子的组合)和每个语句对的文本数据等的功能。语句对存储单元403所存储的改述语句对被语句对提取单元301或模型学习单元302读取。
根据本发明的语句改述系统,如在后面说明的那样,由语句对提取单元301、模型学习单元302、文件登记单元303、文件集合存储单元401、模型学习单元402以及语句对存储单元403实现疑问句改述模型的学习。此外,在本发明的语句改述系统中,由输入单元100、输出单元200、候选生成单元304、模型存储单元402实现使用疑问句改述模型的改述候选的生成。
接着,参考附图对本实施方式中的语句改述系统的动作进行说明。图2是用于说明根据本发明的语句改述系统的动作的流程图。在本实施方式中的语句改述系统中,候选生成单元304从模型存储单元402中读取疑问句改述模型,实时生成被输入的疑问句的改述候选。在本实施方式中,当由用户输入疑问句时,假定疑问句改述模型已存在于模型存储单元402中。下面说明语句改述系统对疑问句改述模型进行学习的方法。
当用户向输入单元100输入了指令时,文件登记单元303更新包含在文件集合存储单元401中的信息(步骤S101)。例如,当与登记指令一起输入了疑问文件集合时,文件登记单元303将输入的疑问文件集合记录在文件集合存储单元401中。此外,例如当选择文件集合存储单元401中的疑问文件并输入删除指令时,文件登记单元303从文件集合存储单元401中删除选中的疑问文件。文件登记单元303以文件集合存储单元401中的信息被更新的事件为契机,向语句对提取单元301发送用于开始进行改述语句对的提取处理的信号(触发)。
语句对提取单元301对于存储在文件集合存储单元401中的疑问文件集合中的所有语句对判定每个语句对是否具有改述语句对的关系。此时,语句对提取单元301使用存储在模型存储单元402中的疑问句改述模型来判定是否为改述语句对。语句对提取单元301将判定为改述语句对的语句对输出并存储在语句对存储单元403中(步骤S102)。
接着,模型学习单元302将存储在语句对存储单元403中的改述语句对用作学习数据来学习疑问句改述模型(步骤S103)。模型学习单元302将学习到的疑问句改述模型存储在模型存储单元402中。疑问句改述模型是指翻译概率、疑问句改述翻译模型、疑问句语言模型、单词序列等。
语句对提取单元301对于存储在文件集合存储单元401中的疑问文件集合中的所有语句对再次判定每个语句对是否具有改述语句对的关系。具体地说,语句对提取单元301使用由模型学习单元302学习到的疑问句改述模型对文件集合存储单元401中的所有语句对判定是否为改述语句对。此时,也可以从同一疑问句文件中提取改述语句对。语句对提取单元301将判断为改述语句对的语句对输出并存储在语句对存储单元403中(步骤S104)。
语句对提取单元301判定所提取的改述语句对是否收敛(步骤S105)。当提取的改述语句对不收敛时,语句对提取单元301以及模型学习单元302重复执行上述的步骤S103和步骤S104中的处理,直到提取的改述语句对收敛为止。步骤S102的处理、第一次循环中的步骤S104的处理分别相当于第一语句提取步骤、第二语句提取步骤。而且,第n次循环的步骤S104的处理、第(n+1)次循环的步骤S104的处理分别相当于第一语句提取步骤、第二语句提取步骤。n为1以上的整数。此外,改述语句对收敛是指由语句对提取单元301使用最新的疑问句改述模型提取的改述语句对与使用之前的疑问句改述模型提取的改述语句对全部达到相同的情况。
当提取的改述语句对收敛时(步骤S105:是),语句改述系统结束疑问句改述模型的生成处理。
接下来,对输入至输入单元100的疑问句的改述候选的生成方法进行说明。图3是用于说明根据本发明的语句改述系统的动作的流程图。
当疑问句被输入至输入单元100时(步骤S201),候选生成单元304从模型存储单元402中读取疑问句改述模型(步骤S202)。候选生成单元304对于从输入单元100输入的疑问句,应用存储在模型存储单元402中的疑问句改述模型实时生成针对所输入的疑问句的改述候选。
候选生成单元304将输入至输入单元100的疑问句分解为单词单位,并与从模型存储单元402中读取的单词序列进行比较(步骤S203)。并且选择多个后述的单词的改述概率大的单词序列(步骤S204)。
接着,候选生成单元304对所选择的单词序列进行重排,求出后述的重排概率(步骤S205)。候选生成单元304选择多个重排概率大的文章,并将该文章作为疑问句改述候选输出给输出单元200(步骤S206)。候选生成单元304所输出的改述候选也可以为一个。
接下来,参考附图对上述的动作进行更加具体的说明。
图4是示出存储在文件集合存储单元401中的疑问文件集合的一个例子的说明图。此外,图5是示出针对图4所示的每个疑问句文件的答复文件的一个例子的说明图。图6是示出图4中的每个疑问句文件与图5中的答复文件之间的对应关系的说明图。
在图6所示的对应关系中示出:例如,对于图4所示的疑问文件Q1,由图5中的答复文件A1进行答复。此外,在图6所示的对应关系中示出:例如,对于图4所示的疑问文件Q4,由将图5中的答复文件A1和A2这两个文件连接起来的文件进行答复。在图6中,当对疑问文件对应有多个答复文件时,表示对应于该疑问文件的答复包含多个答复文件。例如,就对于上述疑问文件Q4的答复文件来说,表示的是答复文件中包含A1和A2这两个答复文件,而并不是表示答复文件中包含A1和A2中的任一个答复文件。
图7是示出从图6的对应关系制定的、与同一答复文件对应的疑问文件集合的关系的说明图。文件集合存储单元401存储图7所示那样的疑问文件集合的关系和图4所示那样的疑问文件(文本数据)。
语句对提取单元301对于存储在文件集合存储单元401中的与同一答复文件对应的疑问文件集合中的所有语句对,使用存储在模型存储单元402中的疑问句改述模型来判定是否为改述语句对。例如,在图7中,语句对提取单元301对于与答复文件A1对应的疑问文件Q1和Q2中所包含的所有语句对,判定每个句子是否处于改述语句对的关系。同样地,语句对提取单元301对于与答复文件A1对应的疑问文件Q1和Q3中所包含的所有句子,判定每个句子是否处于改述语句对的关系。在一个疑问文件中包含多个句子的情况(例如,疑问文件Q1由3个句子构成的情况)下,语句对提取单元301对于同一疑问文件中的每个句子也判定是否为改述语句对。
接着,对由语句对提取单元301进行的判定改述语句对的方法进行说明。这里,当存在具有共同的答复文件A的改述语句对、疑问句1(句子1)和疑问句2(句子2)时,语句对提取单元301例如使用下面的模型Pn =1来估计从疑问句1的单词序列W1...Wk向疑问句2的词序列W”1...W”m翻译的概率。
[数学式1]
P n ( W 1 ′ ′ · · · W m ′ ′ | W 1 · · · W k , A )
= Σ W 1 ′ · · · W l ′ Π i P n ( W j ′ | W i , A ) * P n ( W 1 ′ ′ · · · W m ′ ′ | W 1 ′ · · · W l ′ , A )
≥ P 0 · · · · · · ( 1 )
式(1)中的Pθ表示阈值。并且,与式(1)中的单词序列Wi相关的积“∏iPn(W′j|Wi,A)”相当于疑问句改述翻译模型。
在第一次(n=1)中,单词的改述概率Pn(W′j|Wi,A)以及单词的重排概率Pn(W″1…W″m|W′1…W′l,A)由于尚未学习,因此使用如下述数学式2等那样的专有(Ad Hoc)的初始翻译模型。即,语句对提取单元301在从文件集合存储单元401初次提取改述语句对时,使用通过式(2)和(3)表述的疑问句改述模型。
[数学式2]
P n ( W j ′ | W i , A ) = ( 1 - ϵ ) δ W j ′ , W i α + ϵ ( 1 - δ W j ′ , W i ) · · · ( 2 )
P n ( W 1 ′ ′ · · · W m ′ ′ | W 1 ′ · · · W l ′ , A ) = δ m , l δ { W 1 ′ ′ · · · W m ′ ′ } , l { W 1 ′ · · · W l ′ } · · · ( 3 )
通过使用上述那样的疑问句改述模型进行判定,语句对提取单元301通过步骤S102的处理而获得图8和图9所示那样的改述语句对以及疑问句(句子)。图8是示出由语句对提取单元301提取的改述语句对的一个例子的说明图。此外,图9是示出与图8所示的改述语句对对应的各疑问句的文本的一个例子的说明图。语句对提取单元301将提取的改述语句对以及与该改述语句对对应的各疑问句的文本存储在语句对存储单元403中(步骤S102)。
接下来,模型学习单元302将存储在语句对存储单元403中的改述语句对(图8和图9所示那样的改述语句对以及疑问句)用作学习数据来学习疑问句改述模型Pn=2
此时,模型学习单元302为了求出单词的改述概率Pn(W′j|Wi,A)(即疑问句改述模型),进行与改述语句对的单词相关的对应关系的估计(对准)。具体地说,模型学习单元302使用图8所示的改述语句对的关系,估计图9所示疑问句中的单词的对应关系。
图10是示出由模型学习单元302对于改述语句对(Q1_S1、Q2_S2)执行的估计结果的说明图。同样地,图11是示出对于改述语句对(Q1_S1、Q10_S2)执行的估计结果的说明图,图12是示出对于改述语句对(Q2_S1、Q6_S1)执行的估计结果的说明图,图13是示出对于改述语句对(Q2_S1、Q9_S2)执行的估计结果的说明图,图14是示出对于改述语句对(Q2_S1、Q10_S2)执行的估计结果的说明图,以及图15是示出对于改述语句对(Q2_S1、Q12_S2)执行的估计结果的说明图。图10~图15中的符号“φ”表示不存在对应的单词。
模型学习单元302基于图10~图15所示的改述语句对中相对应的单词间的改述次数,估计单词的改述概率Pn(W′j|Wi,A)。此外,模型学习单元302估计单词的重排概率Pn(W″1…W″m|W′1…W′l,A)。例如,模型学习单元302用改述后的单词序列的出现概率来代替从经单词置换后的单词序列W’1...W’1向改述语句中的单词序列W”1...W”m的重排。
[数学式3]
P n ( W 1 ′ ′ · · · W m ′ ′ | W 1 ′ · · · W l ′ , A )
= δ m , l δ { W 1 ′ ′ · · · W m ′ ′ } , l { W 1 ′ · · · W l ′ } P N - gram ( W 1 ′ ′ · · · W m ′ ′ ) · · · · · · ( 4 )
式(4)中的单词序列的出现概率PN-gram(W″1…W″m)相当于疑问句语言模型。模型学习单元302将式(4)所示那样的疑问句语言模型作为疑问句改述模型进行学习,并将其存储在模型存储单元402中(步骤S103)。
语句对提取单元301使用新学习的疑问句改述模型Pn=2,从文件集合存储单元401中再次提取改述语句对(步骤S104)。并且,语句对提取单元301将判定为改述语句对的语句对记录在语句对存储单元403中。
图16是示出由语句对提取单元301使用疑问句改述模型Pn=2提取的改述语句对的一个例子的说明图。例如,当将图16中的改述语句对和图8中的改述语句对进行比较时,在图16中的改述语句对中,追加有作为新改述语句对的语句对(Q4_S1、Q8_S1)。语句对提取单元301将图16所示的改述语句对记录在语句对存储单元403中。
图17是示出与在图16中新追加的语句对(Q4_S1、Q8_S1)对应的疑问句的文本的一个例子的说明图。此外,图18是示出由模型学习单元302对于改述语句对(Q4_S1、Q8_S1)执行的估计结果的说明图。
由于在语句对存储单元中403中追加了作为新改述语句对的语句对(Q4_S1、Q8_S1),因此语句对提取单元301判定改述语句对不收敛(步骤S105:否)。语句对提取单元301在将使用疑问句改述模型Pn=2所提取的改述语句对记录到语句对存储单元403中时,从语句对存储单元403中读取使用疑问句改述模型Pn=1所提取的改述语句对,并判定改述语句对是否收敛。
模型学习单元302以及语句对提取单元301再次执行步骤S103以及步骤S104中的处理。由此,模型学习单元302获得新的疑问句改述模型Pn=3(步骤S103)。
语句对提取单元301使用疑问句改述模型Pn=3从文件集合存储单元401中再次提取改述语句对(步骤S104)。然后,语句对提取单元301判定改述语句对是否收敛(步骤S105)。当使用疑问句改述模型Pn=3提取的改述语句对与上一次提取的改述语句对(使用疑问句改述模型Pn=2提取的改述语句对)相比没有变化时,语句对提取单元301判定改述语句对收敛(步骤S105:是)。一旦判定改述语句对收敛,语句改述系统就结束疑问句改述模型的生成。
然后,当疑问句被输入至输入单元100时(步骤S201),候选生成单元304从模型存储单元402中读取疑问句改述模型(步骤S202)。候选生成单元304应用存储在模型存储单元402中的疑问句改述模型,对于从输入单元100输入的疑问句,实时生成针对所输入的疑问句的改述候选。
候选生成单元304将输入至输入单元100的疑问句分解为单词单位,并与从模型存储单元402读取的单词序列进行比较(步骤S203)。并且选择多个单词的改述概率大的单词序列(步骤S204)。
候选生成单元304对所选择的单词序列进行重排,求出单词的重排概率(步骤S205)。候选生成单元304选择多个重排概率大的文章,并将该文章作为疑问句改述候选输出给输出单元200(步骤S205)。候选生成单元304所输出的改述候选也可以为一个。
如上所述,候选生成单元304对于从输入单元100输入的疑问句,应用存储在模型存储单元402中的疑问句改述模型来生成改述候选。
图19是示出输入至输入单元100的疑问句的一个例子的说明图。此外,图20是示出由候选生成单元304针对图19所示的疑问句使用疑问句改述模型生成的改述候选的一个例子的说明图。对于图19所示那样的输入疑问句Q_in,候选生成单元304使用疑问句改述模型Pn=3生成图20所示那样的改述候选。候选生成单元304将生成的改述候选与疑问句改述模型的概率值(得分)一并输出给输出单元200(步骤S105)。疑问句改述模型的概率值(得分)用疑问句改述模型(单词的重排概率)的对数来表现。此外,越是得分值大(即,得分绝对值小)的改述候选,对于所输入的疑问句的相似度就越高。
如上所述,在本实施方式的语句改述系统中,从与同一答复文件对应的疑问文件集合中只筛选出具有改述的关系的句子。即,通过使用疑问句改述模型,能够只提取具有改述的关系的语句对。
此外,本发明的语句改述系统直到提取语句组(提取的改述语句对)收敛为止交替地重复执行使用疑问句改述模型提取改述语句对的过程和利用所提取的改述语句对来学习疑问句改述模型的过程这两个过程,并获得了最终的疑问句改述模型。通过这样的逐次处理,能够学习恰当的改述模型,并能够从与同一答复文件对应的疑问文件集合中高精度地提取具有改述语句的关系的语句对。
以上对本发明的优选实施方式进行了说明,但可在本发明的全部公开(包括权利要求书)的框架内进一步基于本发明的基本的技术思想对实施方式以至实施例进行变更和调整。此外,可在本发明权利要求书的框架内对各种公开要件进行多种组合或选择。例如,在上述的实施方式中,对疑问句改述模型已存在于模型存储单元402中的情况进行了说明,但语句改述系统也可以以疑问句被输入至输入单元100的事件为契机,开始进行疑问句改述模型的生成。
产业上的可利用性
本发明能够应用于将输入的文章转换为不同表述方式的文章的语句改述系统。尤其是,本发明由于能够消除疑问句的表述不一致,因此能够应用于邮件应对事例的检索精度的提高上。此外,本发明能够应用于针对用邮件接收的疑问文件的答复文件的自动生成或应对记录(摘要)的自动生成中。

Claims (17)

1.一种语句改述方法,用于针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,其特征在于,包括:
第一句子提取步骤,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;
转换规则计算步骤,基于在所述第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;
第二句子提取步骤,使用在所述转换规则计算步骤中算出的转换规则从所述存储单元中再次提取具有所述阈值以上的相似度的句子的组合;
判定步骤,判定在第一以及第二句子提取步骤中提取的句子的组合是否全部一致;以及
文件生成步骤,使用在所述转换规则计算步骤中算出的转换规则来生成所输入的疑问文件的改述文件,
其中,重复执行第一句子提取步骤、转换规则计算步骤以及第二句子提取步骤,直到在第一以及第二句子提取步骤中提取的句子的组合全部一致为止。
2.如权利要求1所述的语句改述方法,其中,包括对用户显示所生成的改述文件的步骤,
并且一并显示所述生成的改述文件和表示相对于所输入的疑问句的相似度的值。
3.如权利要求1或2所述的语句改述方法,其中,
所述文件生成步骤包括:
将所输入的疑问文件分解为单词序列的步骤;
对在所述转换规则计算步骤中算出的转换规则与所述单词序列进行比较并选择多个相似度高的单词序列的选择步骤;以及
对在所述选择步骤中选择的单词序列进行重排的重排步骤。
4.一种转换规则计算方法,用于针对由用户输入的疑问文件计算用于生成内容相同但表述不同的疑问文件的转换规则,其特征在于,包括:
第一句子提取步骤,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;
转换规则计算步骤,基于在所述第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;
第二句子提取步骤,使用在所述转换规则计算步骤中算出的转换规则从所述存储单元中再次提取具有所述阈值以上的相似度的句子的组合;和
判定步骤,判定在第一以及第二句子提取步骤中提取的句子的组合是否全部一致,
其中,重复执行第一句子提取步骤、转换规则计算步骤以及第二句子提取步骤,直到在第一以及第二句子提取步骤中提取的句子的组合全部一致为止。
5.如权利要求4所述的转换规则计算方法,其中,
将从输入单元输入的疑问文件、针对所述疑问文件的答复文件、以及表示所述疑问文件与所述答复文件的对应关系的信息存储在存储单元中,
对于集合了内容相同的答复文件的一个组,应用所述信息来生成与内容相同的答复文件对应的疑问文件的组。
6.如权利要求4或5所述的转换规则计算方法,其中,
包括更新所述存储单元中保存的信息的步骤,并且以所述存储单元的信息被更新了的事件为契机,开始进行第一句子提取步骤的处理。
7.一种语句改述系统,用于针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,其特征在于,包括:
输入单元,用于输入疑问文件;
存储单元,用于存储输入至所述输入单元的疑问文件以及针对所述疑问文件的答复文件;
句子提取单元,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;
转换规则计算单元,基于在所述句子提取单元中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;以及
文件生成单元,使用由所述转换规则计算单元算出的转换规则来生成由用户输入至所述输入单元的疑问文件的改述文件。
8.如权利要求7所述的语句改述系统,其中,
存储单元包括:
第一存储单元,用于存储输入至输入单元的疑问文件与针对所述疑问文件的答复文件;
第二存储单元,用于存储由所述句子提取单元提取的句子的组合;和
第三存储单元,用于存储由所述转换规则计算单元算出的转换规则。
9.如权利要求7或8所述的语句改述系统,其中,
所述转换规则至少包括翻译模型、语言模型以及单词序列。
10.如权利要求7至9中任一项所述的语句改述系统,其中,
包括显示由所述文件生成单元生成的改述文件的显示单元,
所述显示单元一并显示由所述文件生成单元生成的改述文件、以及表示与由用户输入至输入单元的疑问句之间的相似度的值。
11.如权利要求7至10中任一项所述的语句改述系统,其中,
包括依据输入至输入单元的指令来更新存储单元中的信息的信息更新单元,
所述信息更新单元在更新了所述存储单元中的信息时向所述句子提取单元发送用于开始提取句子的组合的信号。
12.一种转换规则计算用的程序,针对由用户输入的疑问文件来计算用于生成内容相同但表述不同的疑问文件的转换规则,所述程序的特征在于,用于使计算机执行以下处理:
第一句子提取处理,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;
转换规则计算处理,基于在所述第一句子提取步骤中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;
第二句子提取处理,使用在所述转换规则计算处理中算出的转换规则从所述存储单元中再次提取具有所述阈值以上的相似度的句子的组合;和
判定处理,判定在第一以及第二句子提取处理中提取的句子的组合是否全部一致,
其中,使计算机重复执行第一句子提取处理、转换规则计算处理以及第二句子提取处理,直到在第一以及第二句子提取处理中提取的句子的组合全部一致为止。
13.如权利要求12所述的转换规则计算用的程序,其中,
使计算机执行以下处理,即:在存储了从输入单元输入的疑问文件、针对所述疑问文件的答复文件、以及表示所述疑问文件与所述答复文件的对应关系的信息的存储单元中,对于集合了内容相同的答复文件的一个组,应用所述信息来生成与内容相同的答复文件对应的疑问文件的组。
14.如权利要求12或13所述的转换规则计算用的程序,其中,
使计算机执行:
更新所述存储单元中保存的信息的处理,以及
以所述存储单元的信息被更新了的事件为契机来开始进行第一句子提取处理的处理。
15.一种语句改述用的程序,针对由用户输入的疑问文件生成内容相同但表述不同的疑问文件,所述程序的特征在于,使计算机执行以下处理:
第一句子提取处理,从保存在存储单元中的具有同一答复文件的疑问文件中提取具有所设定的阈值以上的相似度的句子的组合;
转换规则计算处理,基于在所述第一句子提取处理中提取的句子的组合来计算用于转换为内容相同但表述不同的句子的转换规则;
第二句子提取处理,使用在所述转换规则计算处理中算出的转换规则从所述存储单元中再次提取具有所述阈值以上的相似度的句子的组合;
判定处理,判定在第一以及第二句子提取处理中提取的句子的组合是否全部一致;
直到在判定出第一以及第二句子提取处理中提取的句子的组合全部一致为止重复执行第一句子提取处理、转换规则计算处理以及第二句子提取处理的处理;以及
文件生成处理,使用在所述转换规则计算处理中算出的转换规则来生成所输入的疑问文件的改述文件。
16.如权利要求15所述的语句改述用的程序,其中,使计算机执行一并显示表示相对于所输入的疑问句的相似度的值和生成的改述文件的处理。
17.如权利要求15或16所述的语句改述用的程序,其中,
使计算机在文件生成处理中执行:
将所输入的疑问文件分解为单词序列的处理;
对在所述转换规则计算处理中算出的转换规则与所述单词序列进行比较并选择多个相似度高的单词序列的选择处理;以及
对在所述选择处理中选择的单词序列进行重排的重排处理。
CNA2007800474909A 2006-12-22 2007-12-21 语句改述方法、程序以及系统 Pending CN101563682A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006345757 2006-12-22
JP345757/2006 2006-12-22

Publications (1)

Publication Number Publication Date
CN101563682A true CN101563682A (zh) 2009-10-21

Family

ID=39562460

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800474909A Pending CN101563682A (zh) 2006-12-22 2007-12-21 语句改述方法、程序以及系统

Country Status (4)

Country Link
US (1) US8447589B2 (zh)
JP (1) JP5126068B2 (zh)
CN (1) CN101563682A (zh)
WO (1) WO2008078670A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526720A (zh) * 2016-06-17 2017-12-29 松下知识产权经营株式会社 意思生成方法、意思生成装置以及程序

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539086B2 (en) * 2002-10-23 2009-05-26 J2 Global Communications, Inc. System and method for the secure, real-time, high accuracy conversion of general-quality speech into text
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20090204399A1 (en) * 2006-05-17 2009-08-13 Nec Corporation Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010073591A1 (ja) * 2008-12-26 2010-07-01 日本電気株式会社 テキスト処理装置、テキスト処理方法、及びコンピュータ読み取り可能な記録媒体
US20100299132A1 (en) * 2009-05-22 2010-11-25 Microsoft Corporation Mining phrase pairs from an unstructured resource
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8484016B2 (en) 2010-05-28 2013-07-09 Microsoft Corporation Locating paraphrases through utilization of a multipartite graph
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9330659B2 (en) * 2013-02-25 2016-05-03 Microsoft Technology Licensing, Llc Facilitating development of a spoken natural language interface
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
AU2014278592B2 (en) 2013-06-09 2017-09-07 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
JP5408380B1 (ja) * 2013-06-17 2014-02-05 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置
US9299339B1 (en) * 2013-06-25 2016-03-29 Google Inc. Parsing rule augmentation based on query sequence and action co-occurrence
IN2013MU02217A (zh) * 2013-07-01 2015-06-12 Tata Consultancy Services Ltd
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US20150088485A1 (en) * 2013-09-24 2015-03-26 Moayad Alhabobi Computerized system for inter-language communication
US9336186B1 (en) * 2013-10-10 2016-05-10 Google Inc. Methods and apparatus related to sentence compression
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10339453B2 (en) * 2013-12-23 2019-07-02 International Business Machines Corporation Automatically generating test/training questions and answers through pattern based analysis and natural language processing techniques on the given corpus for quick domain adaptation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
KR102033435B1 (ko) * 2014-11-19 2019-11-11 한국전자통신연구원 자연어 질의응답 시스템과 방법 및 패러프라이즈 모듈
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US11227113B2 (en) * 2016-01-20 2022-01-18 International Business Machines Corporation Precision batch interaction with a question answering system
JP6671027B2 (ja) * 2016-02-01 2020-03-25 パナソニックIpマネジメント株式会社 換言文生成方法、該装置および該プログラム
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2017167659A (ja) * 2016-03-14 2017-09-21 株式会社東芝 機械翻訳装置、方法、およびプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US9984063B2 (en) 2016-09-15 2018-05-29 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
US9953027B2 (en) * 2016-09-15 2018-04-24 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
CN107861937B (zh) * 2016-09-21 2023-02-03 松下知识产权经营株式会社 对译语料库的更新方法、更新装置以及记录介质
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
KR102589638B1 (ko) * 2016-10-31 2023-10-16 삼성전자주식회사 문장 생성 장치 및 방법
US11182435B2 (en) * 2016-11-25 2021-11-23 Nippon Telegraph And Telephone Corporation Model generation device, text search device, model generation method, text search method, data structure, and program
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN108334533B (zh) * 2017-10-20 2021-12-24 腾讯科技(深圳)有限公司 关键词提取方法和装置、存储介质及电子装置
US10572596B2 (en) 2017-11-14 2020-02-25 International Business Machines Corporation Real-time on-demand auction based content clarification
US20190163756A1 (en) * 2017-11-29 2019-05-30 International Business Machines Corporation Hierarchical question answering system
US10387576B2 (en) * 2017-11-30 2019-08-20 International Business Machines Corporation Document preparation with argumentation support from a deep question answering system
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
JP7149560B2 (ja) * 2018-04-13 2022-10-07 国立研究開発法人情報通信研究機構 リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11036926B2 (en) 2018-05-21 2021-06-15 Samsung Electronics Co., Ltd. Generating annotated natural language phrases
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
JP7087938B2 (ja) * 2018-06-07 2022-06-21 日本電信電話株式会社 質問生成装置、質問生成方法及びプログラム
WO2019235103A1 (ja) * 2018-06-07 2019-12-12 日本電信電話株式会社 質問生成装置、質問生成方法及びプログラム
US11055355B1 (en) * 2018-06-25 2021-07-06 Amazon Technologies, Inc. Query paraphrasing
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11263394B2 (en) * 2019-08-02 2022-03-01 Adobe Inc. Low-resource sentence compression system
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
JP7467057B2 (ja) 2019-09-26 2024-04-15 キヤノンメディカルシステムズ株式会社 診療支援装置及び診療支援プログラム
US11295089B2 (en) 2020-03-01 2022-04-05 International Business Machines Corporation Dynamically enhancing an instrument using multi-stem definitions
CN111401033B (zh) 2020-03-19 2023-07-25 北京百度网讯科技有限公司 事件抽取方法、事件抽取装置和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
CN1447261A (zh) * 2002-03-27 2003-10-08 精工爱普生株式会社 特定要素、字符串向量生成及相似性计算的装置、方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0473864A1 (en) * 1990-09-04 1992-03-11 International Business Machines Corporation Method and apparatus for paraphrasing information contained in logical forms
US6327566B1 (en) * 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
JP2002014990A (ja) 2000-06-28 2002-01-18 Communication Research Laboratory 質問応答システム,質問応答処理方法,変形規則自動獲得処理方法およびそれらのプログラム記録媒体
JP3780341B2 (ja) * 2002-11-21 2006-05-31 独立行政法人情報通信研究機構 言語解析処理システムおよび文変換処理システム
JP2005092271A (ja) 2003-09-12 2005-04-07 Hitachi Ltd 質問応答方法及び質問応答装置
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7584092B2 (en) * 2004-11-15 2009-09-01 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7937396B1 (en) * 2005-03-23 2011-05-03 Google Inc. Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7937265B1 (en) * 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US20080040339A1 (en) * 2006-08-07 2008-02-14 Microsoft Corporation Learning question paraphrases from log data
US20090119090A1 (en) * 2007-11-01 2009-05-07 Microsoft Corporation Principled Approach to Paraphrasing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
CN1447261A (zh) * 2002-03-27 2003-10-08 精工爱普生株式会社 特定要素、字符串向量生成及相似性计算的装置、方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526720A (zh) * 2016-06-17 2017-12-29 松下知识产权经营株式会社 意思生成方法、意思生成装置以及程序

Also Published As

Publication number Publication date
WO2008078670A1 (ja) 2008-07-03
JPWO2008078670A1 (ja) 2010-04-22
JP5126068B2 (ja) 2013-01-23
US8447589B2 (en) 2013-05-21
US20100010803A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
CN101563682A (zh) 语句改述方法、程序以及系统
CN108182972B (zh) 基于分词网络的中文疾病诊断的智能编码方法及系统
CN108595696A (zh) 一种基于云平台的人机交互智能问答方法和系统
CN105787134B (zh) 智能问答方法、装置及系统
CN105912645A (zh) 一种智能问答方法及装置
CN106886567A (zh) 基于语义扩展的微博突发事件检测方法及装置
CN110209790A (zh) 问答匹配方法和装置
CN107229627A (zh) 一种文本处理方法、装置及计算设备
CN113032520A (zh) 信息分析方法及装置、电子设备和计算机可读存储介质
CN110413779B (zh) 一种针对电力行业的词向量训练方法及其系统、介质
CN117725188A (zh) 基于人工智能的问答方法、装置、电子设备及存储介质
CN111178701A (zh) 一种基于特征衍生技术的风险控制方法方法、装置和电子设备
CN105631032A (zh) 基于抽象语义推荐的问答知识库建立方法、装置及系统
CN117332064A (zh) 指令生成及数据库操作方法、电子设备及计算机存储介质
CN116841869A (zh) 基于代码结构化信息及审查知识的Java代码审查评论生成方法及装置
CN116340352A (zh) 数据查询方法、装置、存储介质及电子设备
CN116070642A (zh) 一种基于表情嵌入的文本情感分析方法及相关装置
Abdiansah et al. Inarte: An indonesian dataset for recognition textual entailment
CN113157866A (zh) 一种数据分析方法、装置、计算机设备及存储介质
CN109885827B (zh) 一种基于深度学习的命名实体的识别方法和系统
Puskás et al. A cladistic approach to the evolution of steppe scripts
Cappello et al. Defining a Preprocessing Pipeline for the MULTI-SITA Project and General Medical Italian Natural Language Data
CN116681074B (zh) 数控系统误操作检测方法、装置、设备及存储介质
CN118210818B (zh) Sql语句生成方法、装置、电子设备和存储介质
CN113064887B (zh) 数据管理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20091021