CN110083806A - 用于语言转换的时间转换语法 - Google Patents
用于语言转换的时间转换语法 Download PDFInfo
- Publication number
- CN110083806A CN110083806A CN201910001171.9A CN201910001171A CN110083806A CN 110083806 A CN110083806 A CN 110083806A CN 201910001171 A CN201910001171 A CN 201910001171A CN 110083806 A CN110083806 A CN 110083806A
- Authority
- CN
- China
- Prior art keywords
- time
- expression
- rule
- date
- transformational grammar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
- Stored Programmes (AREA)
Abstract
在语言转换和意图理解方案中,包含时间元素(例如,日历日期、日期范围、年代和持续时间)的表达的自动转换可通过转换技术的实现方式来实现,诸如汇编的规则集和/或已经通过训练集训练过的机器学习识别器。然而,在各实现方式当中共享开发资源可能很难;例如,当更新机器学习识别器时,对于转换技术应用于新上下文而扩展规则集的更新会难以利用。本文呈现的是通过提供时间转换语法来促进时间转换资源的开发的技术,时间转换语法包括:规定时间元素的识别的识别规则;规定将识别的时间元素标准化成标准化时间元素和时间意图的标准化规则;以及将表达的标准化时间元素转换成转换后表达中的日期的转换规则。
Description
本申请是申请日为2015年03月20日、申请号为201580016200.9、发明名称为“用于语言转换的时间转换语法”的中国专利申请的分案申请。
背景技术
在语言转换领域内,可使用许多技术来对与日期相关联的表达的时间元素进行标识、标准化、和/或转换,所述日期诸如日历日期、周日、一天的时间或持续期间。这些技术经常涉及到将转换逻辑应用于表达的设备的配置,诸如包括分别规定了将表达的时间元素转换成转换后表达的一组人工开发的规则的规则集,或者利用训练数据集进行训练以促进将时间元素转换成转换后表达的机器学习识别器。许多这样的技术可被设计和实现用于各种上下文;例如,第一实现方式可以包括提供在具有相对有限的计算资源的移动设备上使用的基本日期转换的比较简单的规则集,并且第二实现方式可以包括鲁棒的机器学习识别器和复杂逻辑,它们一起提供了在计算丰富的服务器上使用的复杂的、极其精确的日期转换。
发明内容
提供该发明内容以便以下文在具体实施方式中进一步描述的简化形式来引入构思的选择。该发明内容不意在标识出所要求保护的主题的关键特征或主要特征,该发明内容也不意在用来限定所要求保护的主题的范围。
以上述方式所描述的用于各种上下文的语言转换资源的开发和调用会遇到一些开发难题。例如,当针对特定上下文人工开发规则集以及利用用于特定上下文的训练数据集训练机器学习识别器时,难以针对其它上下文扩展这些语言转换资源,例如将用于转换成新语言或方言的资源进行本地化。特别地,一些技术可以使用各种规则集和/或机器学习识别器(例如,针对不同设备和/或服务而设计的各种资源)或者这些技术的组合,并且难以在这些各种实现方式的开发中共享时间转换资源。也即,虽然开发了用于第一上下文的第一实现方式(例如,用于移动设备的规则集)以及用于第二上下文的第二实现方式(例如,用于计算上鲁棒的服务的机器学习识别器),可能难以开发由这两个实现方式的逻辑所使用的信息的共享基础。另外,为了将这些资源扩展到新的设备、语言和/或上下文,开发者可能不得不通过加工特定的实现方式来实现这些扩展,例如,通过开发使用与现有规则相同的语言的新规则,和/或通过开发使得能够机器语言识别器按期望的方式扩展的新的训练数据集。然而,这些实现方式特定的开发会将另一的复杂情况引入已经复杂化的自动时间语言评估领域。
本文提供了用于开发基于时间转换语法的时间转换资源的技术,其包括共同提供了用于表达中的时间元素的转换流水线的多个规则集合。时间转换语法包括:至少一个识别规则,其标识表达的时间元素;至少一个标准化规则,其将所述表达的时间元素标准化成标准化时间元素;以及转换规则,其将标准化时间元素转换成日期,该日期可包含在转换后的表达中。
该类型的时间转换语法可以被设计为,例如人类可读的、实现方式无关的规则集,诸如指示包括时间转换语法的各种规则集的可扩展标记语言(XML)文件。各种类型的具体实现方式可以通过各种方式消耗时间转换语法;例如,综合语言转换规则集可以包括时间转换语法,并且机器学习识别器可以用训练集和时间转换语法两者来进行训练,和/或可以连同时间转换语法一起评估表达。由此这些变型例使得基于各种技术的实现方式共享实现方式无关的时间转换语法,从而根据本文提供的技术促进时间转换资源的开发。
为了实现上述目的以及相关的目的,下面的说明书和附图阐述了一些示例性的方面和实现方式。这些指示了可以采用一个或多个方面的各种方式中的仅仅几个。公开的其它方面、优点和新颖特征将根据以下结合附图考虑的具体实施方式中变得显而易见。
附图说明
图1是以使用各种技术来转换包括各种时间元素的表达的一组设备为特征的示范性的方案的图示说明。
图2是以根据本文提供的技术的能用于促进计算机转换表达的时间元素的时间转换语法为特征的示范性的方案的图示说明。
图3是将设备配置为根据本文提供的技术转换包含时间元素的表达的示范性的方法的流程图。
图4是被配置为根据本文提供的技术来转换包含时间元素的表达的示范性的系统的组件框图。
图5是包括被配置为具体实施本文阐述的一个或多个规定的处理器可执行指令的示范性的计算机可读介质的图示说明。
图6是以根据本文提供的技术针对与其相关的基准日期来对表达的时间元素进行转换为特征的示范性的方案的图示说明。
图7是以根据本文提供的技术使用由补充规则补充的时间转换语法和由应用提供的上下文来对包含时间元素的表达进行转换为特征的示范性的方案的图示说明。
图8图示出其中可以实现本文阐述的一个或多个规定的示范性的计算环境。
具体实施方式
现在将参考附图来描述所要求保护的主题,其中在全文中相似的附图标记用来指代相似的元素。在下面的说明中,为了解释的目的,阐述了若干具体的细节以便提供对所要求保护的主题的全面理解。然而,显然,所要求保护的主题可以在没有这些具体细节的情况下实施。在其它实例中,为了促进所要求保护的主题的描述,以框图形式示出了结构和设备。
A.介绍
图1呈现了涉及到通过计算机106来转换的一组表达102的示范性的方案100的图示说明。在该示范性的方案100中,除了提供有关历史登月项目的自然语言陈述,各个表达102中的每一个均包括与表达102的事实相关联的时间元素104;并且虽然表达102中的每一个属于相同事件的日期,但是以自然语言表达时间元素104的多种方式证实了高度的多样性。例如,第一表达102包含以标准化的格式明确地规定了完整的日历日期的时间元素104,而第二表达102包含了仅规定年份的时间元素104。第三表达102和第四表达102包含标识出可以论及日期的口语方式的时间元素104(例如,为“’69”或者为“1960’s”)。第五表达102包含了以相对方式规定的时间元素104(例如,在另一日期之前的一年),并且第六表达102包含了分布在表达102的两个分立部分的时间元素104(例如,“于1969年….于7月”)。第七表达102和第八表达102包含了规定日期集合的时间元素104(“于1969年,1972年以及1972年…”以及“在’69与’72之间”的日期范围)。第九表达102包含了规定范围和频率的再发生的时间元素(“在1969年与1972年之间每年”)。
考虑到每个均与涉及到同一基本事实的同一日期有关的时间元素104的显著的语言差异,可以意识到,配置计算机106正确地识别并解释指定的日期是困难的。为了实现该识别,例如,为了产生包含由各时间元素104所标识的日期的转换后表达112,可以实现各种语言转换技术。第一计算机106可以包括规则集108,该规则集由开发者汇编以转换表达102的时间元素104从而生成转换后表达112,而第二计算机106可以包括已经在训练数据集上训练来识别时间元素104的机器学习识别器110(例如,人工神经网络、遗传算法和/或贝叶斯分类器),并且可以调用机器学习识别器110来标识和转换表达102的时间元素104。其他计算机106可以包括这些技术的组合,任选地与其他技术相结合,从而转换表达102。
B.呈现的技术
在一系列可用的时间转换资源的实现方式中,特定的实现会依精度、转换速度、维护简易性、新上下文的可扩展性(例如,其他语言或方言)和/或计算资源的高效使用而不同。在一些方案中,这些特性可以代表权衡,并且对于适合的转换上下文(例如,基于特定计算机106的资源),适合的实现方式可被选为这些权衡的平衡。例如,对于具有比较受限的计算资源的计算机106,例如,移动电话,可以实现简单规则集108,其仅能够正确地识别最简单的时间元素104(例如,仅图1中的前两个表达102),但是可以以快速并且资源高效的方式来完成这些。相反,对于具有比较丰富的计算资源的计算机106,例如,服务器,可选择使用机器学习识别器110的更鲁棒的实现方式,其能够精确地识别大量的不同的时间元素104(例如,图1的表达102中的多个),并且可以充分利用服务器的计算资源以快速的方式来实现该结果。在这些以及其他方式中,时间语言转换平台可以基于所选的实现方式的类型和详细信息而展现出各种特性。
然而,可以意识到,随着这些实现方式持续发展(例如,随着计算机106的实现的时间转换库的细化,或者随着实现的时间转换库跨具有不同特性的多种计算机106的部署),进一步开发这些资源的简易性和/或在不同实施例之间共享这些扩展的简易性可能是重要的,但是难以实现。作为第一示例,针对新的上下文进行资源的扩展(例如,对于新的国家或语言的本地化)可取决于实现方式的本质。例如,可通过汇编更新的规则集来扩展规则集108,并且可通过开发包含了将新特征特征化的情况的附加训练数据集以及在附加训练数据集上训练机器学习识别器110来扩展机器学习识别器110。实现资源的这种扩展因此需要全面理解资源的本质和根据选定的实现方式来提供扩展的方式。作为第二示例,涉及到在各设备上开发时间转换资源的方案可能需要不同的实现方式(例如,移动设备上的计算上节约的、基于规则的时间转换库,以及服务器上的计算上昂贵的、基于机器学习的时间转换库)。然而,在开发这种资源集合到新上下文的扩展的同时,难以在两个以上的实现方式之间共享扩展。例如,通过汇编更新的规则集来扩展规则集108,并且可通过开发包含了将新特征特征化的情况的附加训练数据集以及在附加训练数据集上训练机器学习识别器100来扩展机器学习识别器110,但是这些开发的努力不是相互兼容的。
图2呈现了以按照可以促进这些开发的各个方面的方式开发时间转换资源的技术(例如,将时间转换资源扩展到新上下文的简易性,以及在单独的实现方式当中共享时间转换资源的能力)为特征的示范性的方案的图示说明。根据这些技术,图2的示范性的方案200提供了时间转换语法202,其包括可以以流水线方式应用于表达102的规则集。时间转换语法202包含了标识表达102的时间元素104的一个或多个识别规则204。例如,在图2的示范性的方案200中的识别规则204涉及到能用于标识表达102内的以口语形式“二十年代(Twenties)”、“三十年代(Thirties)”等标识十年的时间元素104的常规表达。时间转换语法202还包含了一个或多个标准化规则206,其分别将表达102的时间元素104标准化成标准化时间元素。例如,图2的示范性的方案200中的标准化规则206能应用于标识出的时间元素104“二十年代(Twenties)”,其可以被标准化成格式“2X”。时间转换语法202还包含一个或多个转换规则208,其分别将标准化时间元素转换成日期218。例如,图2的转换规则208提供了,由“十年”识别规则204所标识的任何时间元素104在标准化后可以格式化为标准化形式“19”加上由对应的标准化规则206标识的标准化时间元素。
作为示例,在表达102“二十年代(The Twenties)”的情况下,图2的示范性的方案200的时间转换语法202以如下方式应用。首先,应用时间元素识别212,其中识别规则204将短语“二十年代(Twenties)”标识为时间元素104。其次,应用标准化214,其中标准化规则206指示将时间元素“二十年代(Twenties)”转换成标准化时间元素“2X”。第三,应用转换216,其中转换规则208规定短语“二十年代(The Twenties)”被转换为“19”加上标准化时间元素“2X”,得到日期218为“192X”的转换后表达112,表明了在1920年与1929年之间的所有年份。通过这种方式,图2的示范性的方案200中的时间转换语法202能应用以根据本文提供的技术来实现表达102的时间元素104到转换后表达112的日期218的自动转换。
图2的示范性的方案200进一步图示出由时间转换系统210以及机器学习识别器110使用的时间转换语法202,诸如基于时间转换语法202的规则集108,所述时间转换系统210利用各种实现方式和技术,所述机器学习识别器110使用时间转换语法202与使用训练数据集的训练相结合。因为以实现方式独立的方式规定了时间转换语法202,这些不同的实现方式可使用时间转换语法202作为时间转换逻辑的共享基础。因此,时间转换语法202的内容以开发者相对容易理解的方式来规定,因为这不限于特定实现方式的具体情况。另外,不相干的实现方式可以仅通过更新时间转换语法202,来对新的上下文进行更新和/或适应。这些优点以及其他优点可通过提供根据本文呈现的技术由各时间转换系统210使用的时间转换语法202来实现。
C.示范性的实施例
图3呈现了本文所提供的技术的第一示范性实施例,图示为配置计算机106转换表达102的示范性的方法300。示范性的方法300可以被实现为例如存储在存储器组件中的一组指令,存储器组件诸如存储器电路、硬盘驱动器底板、固态存储设备或磁盘或光盘,并且被组织成使得当在计算机106的处理器上执行时,使得计算机106根据本文呈现的技术来操作。示范性的方法300开始于302,并且涉及到在计算机106的处理器上执行304指令。具体地,指令被配置为,在接收到表达102时,将诸如本文提供的时间转换语法202应用于表达102,其中时间转换语法202包括:分别标识表达102的时间元素104的至少一个识别规则306;至少一个标准化规则308,其分别将表达102的时间元素104标准化成标准化时间元素;以及至少一个转换规则310,其分别将表达102的标准化时间元素转换成日期218。通过使得计算机106应用时间转换语法202来将表达102的时间元素104转换成转换后表达112的日期218,示范性的方法300根据本文所提供的技术实现了表达102的转换,并且因此在312结束。
图4呈现了本文所提供的技术的第二示范性的实施例,图示为以被配置为使得计算机402转换表达102的示范性的系统408为特征的示范性的方案400。示范性的系统408可以实现为例如分别包括存储在计算机402的存储器组件中的一组指令的一组组件,计算机402具有处理器404和存储器406,其中相应的组件的指令存储在存储器406中,并且当在处理器404上执行时,使得计算机402实现提供本文所呈现的技术的一部分的组件。示范性的系统408包括时间转换语法202,时间转换语法202存储在存储器406中并且包括:至少一个识别规则204,其分别标识表达102的时间元素104;至少一个标准化规则206,其分别将表达102的时间元素104标准化成标准化时间元素;以及至少一个转换规则208,其分别将标准化时间元素转换成日期218。示范性的系统408还包括表达转换器410,在接收到表达102时,该表达转换器应用时间转换语法202以将表达102的相应的时间元素104转换成转换后表达112的日期218。以这种方式,示范性的系统408使得计算机402能够根据本文提供的技术通过使用时间转换语法202来转换接收到的表达102的时间元素104。
另外的实施例涉及到包含被配置为应用本文提供的技术的处理器可执行指令的计算机可读介质。这些计算机可读介质可以包括例如,计算机可读存储设备,包括有形设备,诸如存储器半导体(例如,使用静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)和/或同步动态随机存取存储器(SDRAM)技术的半导体)、硬盘驱动器的底板、闪速存储器设备、或者磁盘或光盘(诸如CD-R、DVD-R、或软盘),其中编码有一组计算机可读指令,当通过设备的处理器执行时,所述计算机可读指令使得所述设备实现本文提供的技术。这些计算机可读介质还可以包括(作为不同于计算机可读存储设备的一类技术)各种类型的通信媒介,诸如可通过各种物理现象传播的信号(例如,电磁信号、声波信号或光信号),以及在各种有线方案(例如,经由以太网或光纤电缆)中和/或无线方案(例如,无线局域网(WLAN),如WiFi、个域网(PAN),如蓝牙,或者蜂窝或无线电网络)传播的信号,并且其中编码有一组计算机可读指令,当通过设备的处理器执行时,所述计算机可读指令使得设备实现本文提供的技术。
可通过这些方式设计的示范性的计算机可读介质在图5中图示,其中实现方式500包括计算机可读存储设备502(例如,CD-R、DVD-R,或者硬盘驱动器的底板),其中编码有计算机可读数据504。该计算机可读数据504进而包括一组计算机指令506,一组计算机指令506被配置为根据本文阐述的原理来操作。在第一个这样的实施例中,计算机指令506可被配置为使得计算机402转换表达102的一种方法,诸如图3的示范性的方法300。在另一这样的实施例中,计算机指令506可被配置为实现一种被配置为使计算机402转换表达102的系统,诸如图4的示范性的系统408。该计算机可读介质的一些实施例508可以包括被配置为存储以此方式配置的处理器可执行指令的计算机可读存储设备(例如,硬盘驱动器、光盘或闪速存储设备)。本领域普通技术人员可以构想出被配置为根据本文提供的技术操作的许多这样的计算机可读介质。
D.变型例
本文所论述的技术可以在很多方面被设计出变型例,并且一些变型例可以相对于这些以及其他技术的其他变型例提供额外的优点和/或减少缺点。而且,一些变型例可以组合地实现,并且一些组合可以通过协同配合来突显额外的优点和/或减少的缺点。变型例可以并入各个实施例中(例如,
图3的示范性的方法300;以及图4的示范性的系统408)以为这些实施例带来单个的和/或协同的优点。
D1.方案
在这些技术的实施例中可以变化的第一方面涉及到其中可以利用这些技术的方案。
作为该第一方面的第一变型例,本文呈现的技术可以用来实现各种计算机402的配置,各种计算机402诸如工作站、服务器、膝上型计算机、平板式设备、移动电话、游戏控制台、便携式游戏控制台、便携式或非便携式媒体播放器、诸如电视机的媒体显示设备、家用电器、家庭自动化设备的媒体显示设备、以及监督控制与数据获取(SCADA)设备。
作为该第一方面的第二变型例,本文提供的技术可以用于转换多种类型的时间元素104,诸如日历日期、年代、日期集合、日期范围以及持续期间。另外,本文提供的技术可用于转换这些时间元素104,同时执行许多类型的语言之间的转换,许多类型的语言包括:自然语言,诸如口语、书面语和姿态语言;正式语,诸如数学等式以及编程语言;以及非结构化文本内容。在一些情形下,表达的语言可能是未知的,并且可能不得不被识别,或者可使用各种语言,并且不同的转换技术可用于每种语言的表达的相应的部分。这些技术还可以应用于多种类型的转换,包括:表达102在语言上的标准化;表达102从语言的第一方言到该同一语言的第二方言的转换;表达102从语言的第一形态到第二形态的转换,诸如口语英语到书面英语的转换;表达102在两种语言之间的转换;表达102到标准化格式(诸如,ISO 8061日期和时间格式)的转换;表达102和对应的转换后表达112的比较,诸如转换算法的验证;以及语言处理器的训练,诸如表达102的语义解析。这些以及其他方案可适合于本文所提供的技术的应用。
D2.实现方式
可以在本文提供的技术的实施例之间变化的第二方面涉及到在执行表达102的转换的设备中实现这些技术。
作为该第二方面的第一变型例,时间转换语法202的相应的规则可通过多种方式来规定。如图2的示范性的方案200所呈现的,时间转换语法202的相应的规则可以包括例如,以人类可读格式规定的陈述指令,诸如可扩展标记语言(XML)概要。可选地,可以按编程语言(诸如,可解释的脚本或可编译的源代码文档)来规定该规则,或者以机器语言(诸如,部分或全部编译的二进制)来规定规则。如图2的示范性的方案200中进一步图示的,规则可以规定为例如:常规表达(诸如提供用于匹配表达102的时间元素104的常规表达的识别规则204);陈述指令(诸如将表达102的特定的时间元素104与标准化时间元素关联的标准化规则206,例如,“二十年代(twenties)”被标准化为“2X”);和/或编程指令(诸如,提供可执行用于将字符串和标准化函数调用的输出参数连结并且将其赋予时间对象的年份值的编程指令的转换规则208)。
作为该第二方面的第二变型例,本文提供的技术的实施例涉及到将时间转换语法202应用于所提供的表达102,但是该应用可以通过多种方式来实现。作为第一个这样的示例,时间转换语法202可以汇编成规则集108,诸如指示计算机402将时间转换语法202的规则应用于表达102的部分或全部汇编的二进制。例如,汇编的规则集可被提供以标识表达102的时间元素104,并且表达转换器410可以调用汇编的规则集连同表达102以根据时间训练语法202来标识表达104的时间元素102。作为第二个这样的示例,时间转换语法202可用于通知机器学习识别器110。例如,时间转换语法202可连同训练集被提供,从而引导机器学习识别器110的训练来将表达102的时间元素104识别、标准化和/或转换为转换后表达112的日期218。可选地或者另外地,时间转换语法202可被提供作为机器学习识别器110的输入以将特定的表达102的时间元素104转换成日期218;例如,表达转换器410可以调用机器学习识别器110连同时间识别语法202以识别出表达218的时间元素104。这些技术的组合可以被使用;例如,识别规则204可包括一组常规表达,而标准化规则206可以包括汇编的规则集108,并且转换规则208可以包括机器学习识别器110,该机器学习识别器110被训练以将标准化时间元素转换成转换后表达112的日期218,并且连同时间转换语法202被调用以实现特定表达102的时间元素104的转换。这些以及其他的实现方式可被设计成根据本文提供的技术来转换表达102的时间元素104。
D3.识别、标准化和转换
在本文提供的技术的示例之间变化的第三方面涉及到通过时间转换语言202所具体实施的逻辑的内容,时间转换语法202实现了表达102的时间元素104的识别、标准化和转换。
作为该第三方面的第一变型例,时间转换语法202的规则可以通过各种方式来对时间元素104或者在表达102中规定的时间元素104的各个组合进行识别、标准化和/或转换。图1的示范性的方案100提供了时间转换语法202的规则可定向到的这样的一组示例。另外,实施例可以仅识别出表达102的一部分,并且可以将表达的其余部分不做转换,例如,其中其余部分不包含时间元素;其中时间元素不明确并且难以转换成具体的转换后时间元素;或者其中时间元素等同于转换后的时间元素。
作为该第三方面的该第一变型例的第一示例,表达102可以包括第一时间元素和第二时间元素(例如,“moon landing occurred in’69 and in the early 1970’s”),并且时间转换语法202的规则可将第一标准化规则206应用于表达102以将表达102的第一时间元素104标准化成第一标准化时间元素(例如,将“’69”标准化为标识年份1969),以及第二标准化规则206,其不同于第一标准化规则206,并且将表达102的第二时间元素104标准化为第二标准化时间元素(例如,将“20世纪70年代早期”标准化为1970-1975的时间段)。
作为该第三方面的该第一变型例的第二个示例,至少一个选定的标准化时间元素可以与至少两个日期218关联,诸如年份的集合或者从起始日期到结束日期规定的日期范围(例如,范围“1971-1972”或者“星期一-星期三”),并且时间转换语法202的至少一个选定的转换规则208可以将选定的标准化时间元素转换成至少两个日期218(例如,年份1971以及年份1972,或者对应于特定周的星期一、星期二和星期三的工作日的日历日期)。作为另一示例,至少一个选定的标准化时间元素可与日期范围的一部分关联,诸如在一年内每年都出现的一个或多个季节,并且该转换可以得到规定在每年内针对指定季节的典型日期的转换后时间元素。
图6呈现了以该第三方面的该第一变型例的第三示例为特征的示范性的方案600的图示说明,其中表达102的时间元素104是相对于基准日期602来规定的。例如,表达102可以显式地或者隐式地是指先前规定的日期218,并且可以包括相对于该日期218的时间元素104,例如“下个星期二如何?”。时间转换语法202可以包括能够标识由表达102显式地或者隐式地参考或者与表达102显式地或者隐式地关联的基准日期602的规则,以及能够将时间元素104偏差基准日期602(例如,标识出在一周内由基准日期602参考的日历日期的范围,以及根据表达102的时间元素104标识出该周的星期二的日历日期)的规则。
作为该第三方面的第二变型例,具体实施本文提供的技术的计算机402可以具有对包含至少一个事实的知识库的访问权,并且时间转换语法202可以包括使用知识库以利用该知识库的事实将表达102的标准化时间元素转换成日期218的规则。例如,计算机402的用户还可以提供用户简档,诸如对于社交网络的社交简档,并且用户的表达102可以调用与用户简档的事实关联的事实,诸如用户的生日。时间转换语法202可以包括使得能够在该时间表达的标识中使用这些事实的规则(例如,识别规则204提供了常规表达,诸如“___的生日”,以将表达102的该部分标识为时间元素104;标准化规则206提供了该时间元素104的标准化,诸如规定所规定的个体的用户简档内的位置,其中他或她的生日可在该位置找到;和/或转换规则208提供了标准化时间元素104的转换)。还可以使用这些上下文知识,例如,确定基准日期602,相对于该基准日期,规定表达102的时间元素104。例如,诸如“John的生日之后的星期一”的表达102可以由时间转换语法202来评估,首先将“之后的星期一”识别为时间元素104,并且将“John的生日”识别为基准日期;通过访问知识库来确定John生日的日期;以及通过应用标准化规则和/或转换规则来确定在姓名为John的个体的生日之后的星期一的日历日期。根据本文所提供的技术,在表达102的时间元素104的识别、标准化和/或转换中所展现的逻辑中的许多这样的变型例可以包含在时间转换语法202中。
D4.附加的特征
在本文提供的技术的实施例之间可以变化的第四方面涉及到可以包含在一些实施例中的附加特征。
作为该第四方面的第一变型例,一些实施例可以包括语法扩展器,其将由计算机402的应用提供的至少一个规则添加到时间转换语法202中。例如,一个或多个应用402可以提供一个或多个补充识别规则204、标准化规则206和/或转换规则208,其可以针对新的领域扩展时间转换语法202;例如,文化假日数据库可以提供这样的规则以实现对与特定的文化的假日相关联的时间元素104的识别、标准化和转换。
作为该第四方面的第二变型例,一个或多个规则可以包括待应用于表达102和/或特定条件下的标准化时间元素的指令。例如,标准化规则206可以包括与表达102的时间元素104相关联的标准化条件,以及当满足标准化条件时执行的至少一个标准化指令(例如,标准化规则206可以规定,在标识出被规定为“下一个闰年”的时间元素104时,计算机402执行指令,所述指令确定当前年之后的下一个闰年,以及选择日历年份作为该时间元素104的标准化时间元素)。该转换还可以标识表达102的语言的部分,并且可以通过语言部分评估来标识表达102的时间元素104(例如,考虑到作为名词的日期和时间的典型特点,诸如“星期六是假日”,或者形容词,诸如“星期六的约会取消”)。该指令可被规定为例如,在表达102上调用以实现规定标准化的汇编代码。计算机402可以因此被配置为,在确定了表达102的时间元素104满足选定的标准化规则206的标准化条件时,将选定的标准化规则206的标准化指令应用于表达102。
作为该第四方面的第三变型例,除了将时间转换语法202应用于表达102之外,实施例可进一步用通过该应用实现的日期218来表达102的相应的时间元素104;例如,除了确定时间元素102所参考的日期218之外,计算机402可以将所确定的日期218插入转换后的表达112中。在实施例中,该插入是通过根据标准化日期格式(如时间格式)格式化的日期218来实现的。
图7呈现了以本文所描述的技术的组合为特征的示范性的方案700的图示说明。在该示范性的方案700中,应用702提供补充规则704以便添加到时间转换语法202(例如,用于识别、标准化和转换与生日有关的时间元素104的规则),以及用于通知该过程的知识库706,诸如事实708(例如,特定用户的身份)以及与事实708关联的日期710(例如,用户的生日的日历日期)。时间转换语法202可应用以利用补充规则704以及提供事实708和关联的日期710的知识库706来转换表达102的时间元素104以实现包含通过表达102的时间元素104引用的日期218的转换后表达112。通过该方式,时间转换语法202可使用应用702的资源来根据本文提供的技术实现表达102的时间元素104的转换。
E.计算环境
图8以及后面的论述提供了实现本文阐述的一个或多个规定的实施例的适合的计算环境的简要的、大体的描述。图8的操作环境仅是适合的操作环境的一个示例,而不意在暗示对操作环境的使用或功能的范围的任何限定。示例的计算设备包括但不限于个人计算机、服务器计算机、手持式或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、多处理器系统、消费电子设备、微型计算机、主机型计算机、包括任意上述系统或设备的分布式计算环境,等等。
虽然不做要求,但是在一个或多个计算设备执行“计算机可读指令”的总的上下文中描述了实施例。计算机可读指令可以经由计算机可读介质(下文论述)来分配。计算机可读指令可以实现为执行特定的任务或者实现特定的抽象数据类型的程序模块,诸如函数、对象、应用编程接口(API)、数据结构等。典型地,计算机可读指令的功能可以根据需要在各种环境中进行组合或分布。
图8示出了系统800的示例,该系统包括被配置为实现本文提供的一个或多个实施例的设备802。在一个配置中,设备802包括至少一个处理单元806以及存储器808。根据计算设备的确切的配置和类型,存储器808可以是易失性的(诸如例如RAM)、非易失性的(诸如例如ROM、闪速存储器等)或者两者的某组合。该配置通过虚线804图示在图8中。
在其它实施例中,设备802可以包括额外的特征和/或功能。例如,设备802还可以包括额外的存储设备(例如,可移除的和/或非可移除的),包括但不限于磁存储设备、光存储设备和类似物。该额外的存储设备在图8中由存储设备810示出。在一个实施例中,实现本文提供的一个或多个实施例的计算机可读指令可以在存储设备810中。存储设备810还可以存储实现操作系统、应用程序和类似物的其它计算机可读指令。计算机可读指令可以被加载到存储器808中,以便由例如处理单元806来执行。
本文所使用的术语“计算机可读介质”包括计算机可读存储设备。计算机可读存储设备可以是易失性的和非易失性的、可移除的和非可移除的,并且可以包括涉及各种类型的存储计算机可读指令或其它数据的物理设备。存储器808和存储设备810是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪速存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储设备、磁盒、磁带、以及磁盘存储或其它磁存储设备。
设备802还可以包括允许设备802与其它设备通信的通信连接816。通信连接816可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频发射器/接收器、红外端口、USB连接或将设备802与其它计算设备连接的其它接口。通信连接816可包括有线连接或无线连接。通信连接816可以发送和/或接收通信介质。
术语“计算机可读介质”可包括通信介质。通信介质典型地具体实施诸如载波或其它传输机制的“调制数据信号”中的计算机可读指令或其它数据并且包括任何信息输送介质。术语“调制数据信号”可以包括使其一个或多个特性以将信息编码在信号中的方式来设定或改变的信号。
设备802可以包括输入设备814,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外照相机、视频输入设备和/或任何其它输入设备。在设备802中还可以包括输出设备812,诸如一个或多个显示器、扬声器、打印机和/或任何其它输出设备。输入设备814和输出设备812可以经由有线连接、无线连接或其任意组合而连接到设备802。在一个实施例中,来自另一计算设备的输入设备或输出设备可以用作设备802的输入设备814或输出设备812。
设备802的组件可以通过诸如总线的各种互连来连接。这些互连可以包括外围组件互连(PCI)、诸如快速PCI、通用串行总线(USB)、火线(IEEE1394)、光总线结构等。在另一实施例中,设备802的组件可通过网络来互连。例如,存储器808可由位于由网络互连的不同的物理位置中的多个物理存储器单元构成。
本领域技术人员将认识到,用于存储计算机可读指令的存储设备可分布在网络中。例如,能够经由网络818访问计算设备820可以存储实现本文提供的一个或多个实施例的计算机可读指令。设备802可以访问计算设备820并且下载计算机可读指令的部分或全部用于执行。可选地,设备802可以根据需要来下载多条计算机可读指令,或者一些指令可以在设备802处执行,并且一些在计算设备820处执行。
F.术语的使用
虽然用特定于结构特征和/或方法行为的语言描述了主题,应当理解的是在随附的权利要求中限定的主题不一定限于上述的特定特征或行为。相反,上述的特定的特征和行为被公开作为实现一些权利要求的示例的形式。
如该申请中使用的,术语“组件”、“模块”、“系统”、“接口”和/或类似术语通常旨在指代计算机相关实体,或者是硬件、硬件和软件的组合、软件或执行中的软件。例如,组件可以为但不限于在处理器上运行的进程、处理器、对象、可执行程序、执行线程、程序和/或计算机。通过示例的方式,运行于控制器上的应用和控制器都可以是组件。一个或多个组件可以驻存在执行的进程和/或线程内,并且组件可以位于一台计算机上和/或分布于两个或更多个计算机之间。
此外,所要求保护的主题可以实现为利用标准编程和/或工程技术来产生软件、固件、硬件或其任意组合从而控制计算机实现所要求保护的主题的方法、装置或制品。本文所使用的术语“制品”旨在涵盖能够从任意计算机可读设备、载波或介质访问的计算机程序。当然,可以对该配置做出许多修改,而不偏离所要求保护的主题的范围或精神。
本文提供了实施例的各种操作。在一个实施例中,所描述的一个或多个操作可以构成存储在一个或多个计算机可读介质上的计算机可读指令,如果由计算设备执行,则计算机可读指令将使得计算设备执行所描述的操作。描述一些或全部操作的顺序不应解释为暗指这些操作必然是顺序相关的。本领域技术人员在获益于本说明书后将理解到可选的排序。此外,将理解的是,不是全部操作都必然存在于本文提供的每个实施例中。
而且,词语“示范性的”在本文用来意指充当示例、实例、图示。本文中描述为“示范性的”的任何方面或设计不一定解释为相对于其它方面或设计是有益的。相反,词语示范性的使用意在以具体的方式呈现概念。如本文所使用的,术语“或者”意在表示包含性的“或者”,而不是排他性的“或者”。也即,除非另作规定或者从上下文清晰可见,“X采用A或B”意在表示自然包含的置换项中的任一个。也即,如果X采用A;X采用B;或者X采用A和B,则“X采用A或B”在上述任一实例下满足。另外,在本申请以及随附权利要求书中使用的冠词“一(a)”和“一个(an)”通常解释为意指“一个或多个”,除非规定或者从上下文明显是指单数形式。
而且,虽然已经相对于一个或多个实现方式示出和描述了本公开,基于该说明书以及附图的阅读和理解,等同的改动和修改对于本领域其它技术人员而言将是显而易见的。本公开包括全部这样的修改和改动,并且仅受随附权利要求的范围限制。特别地关于上述组件(例如,元件、资源等)所执行的各功能,除非特别指出,否则用于描述这些组件的术语意在对应于执行所描述的组件的规定功能(例如,功能上等同的)的任何组件,即使结构上不等同于公开的结构,所述公开的结构执行在本公开的示范性实现中示出的功能。另外,虽然公开的特定特征已经参考多个实现方式中的仅一个进行了公开,但是该特征可以与对于任何给定的或特定的应用而言所期望或有益的其它实现方式的一个或多个其它特征相组合。此外,在术语“包含”、“具有”、“设有”、“带有”和/或其变体在详细说明或权利要求中使用的范围内,这些术语意在是以类似于术语“包括”的方式是包含性的。
Claims (40)
1.一种使用计算机来转换表达的方法,所述方法包括:
将时间转换语法应用于所述表达,其中,所述应用包括:
使用至少一个识别规则来识别所述表达的时间元素;
使用至少一个标准化规则将所述表达的所述时间元素标准化以生成标准化时间元素;以及
使用至少一个转换规则将所述标准化时间元素转换成日期;以及
其中,所述时间转换语法可操作用于第一转换上下文和第二转换上下文中,其中,所述第一转换上下文不同于所述第二转换上下文。
2.如权利要求1所述的方法,其中,所述表达包括第一时间元素和第二时间元素,所述应用包括:
将第一标准化规则应用于所述表达,所述第一标准化规则将所述表达的所述第一时间元素标准化成第一标准化时间元素;以及
将第二标准化规则应用于所述表达,所述第二标准化规则不同于所述第一标准化规则,并且所述第二标准化规则将所述表达的所述第二时间元素标准化成第二标准化时间元素。
3.如权利要求1所述的方法,其中:
至少一个选定的标准化时间元素是相对于基准日期的;以及
所述时间转换语法的至少一个选定的转换规则将所述选定的标准化时间元素转换成相对于所述基准日期的日期。
4.如权利要求3所述的方法,其中:
所述计算机具有对知识集的访问权,所述知识集包括与基准日期关联的至少一个事实;以及
所述选定的转换规则通过如下来转换所述选定的标准化时间元素:
识别所述知识集中的、与所述选定的基准日期关联的选定事实;以及
将所述选定的标准化时间元素转换成相对于与所述选定事实关联的基准日期的日期。
5.如权利要求1所述的方法,其中:
至少一个选定的标准化时间元素与至少两个日期相关联;以及
所述时间转换语法的至少一个选定的转换规则将所述选定的标准化时间元素转换成至少两个日期。
6.如权利要求5所述的方法,其中:
所述选定的标准化时间元素与从起始日期到结束日期的日期范围相关联;以及
所述时间转换语法的至少一个选定的转换规则将所述选定的标准化时间元素转换成从所述起始日期到所述结束日期的日期范围。
7.一种用于在具有处理器和存储器的计算机上转换表达的系统,所述系统包括:
时间转换语法,其被存储在所述存储器中并且包括:
至少一个识别规则,其分别识别表达的时间元素;
至少一个标准化规则,其分别将所述表达的时间元素标准化成标准化时间元素;以及
至少一个转换规则,其分别将标准化时间元素转换成日期;以及
其中,所述时间转换语法可操作用于第一转换上下文和第二转换上下文中,其中,所述第一转换上下文不同于所述第二转换上下文;以及
表达转换器,其包括存储在所述存储器中的指令,当在所述处理器上执行时,所述指令使得所述计算机在接收到表达时应用所述时间转换语法以将所述表达的相应的时间元素转换成所述选定日期。
8.如权利要求7所述的系统,其中:
所述系统进一步包括:机器学习识别器,利用训练数据集来对其进行训练,所述训练数据集包括至少一个训练表达和由所述至少一个训练表达所表达的至少一个日期;以及
所述表达转换器通过调用所述机器学习识别器连同所述时间转换语法来识别所述表达中的至少时间元素,将所述时间转换语法应用于所述表达。
9.如权利要求8所述的系统,其中:
所述机器学习识别器是利用所述训练数据集来训练的以识别所述表达的所述时间元素;以及
所述表达转换器调用所述机器学习识别器连同所述时间转换语法并且根据所述时间训练语法来识别所述表达中的所述时间元素。
10.如权利要求8所述的系统,其中:
所述系统还包括:
分别与选定语言相关联的至少两个时间转换语法,以及
语言识别器,其识别表达的语言;以及
所述表达转换器通过如下来调用所述机器学习识别器:
调用所述语言识别器来识别所述表达的选定语言;以及
调用所述机器学习识别器连同与所述表达的选定语言相关联的时间转换语法。
11.如权利要求7所述的系统,其中:
所述系统还包括实现所述时间转换语法的汇编的规则集;以及
所述表达转换器通过调用实现所述时间转换语法的所述汇编的规则集以评估所述表达,将所述时间转换语法应用于所述表达。
12.如权利要求11所述的系统,其中:
所述汇编的规则集识别所述表达的所述时间元素;以及
所述表达转换器调用所述汇编的规则集连同所述表达以根据所述时间训练语法识别所述表达的所述时间元素。
13.如权利要求7所述的系统,其中,所述至少一个识别规则还包括识别所述表达的所述时间元素的常规表达。
14.如权利要求7所述的系统,还包括:语法扩展器,所述语法扩展器将由所述计算机的应用提供的至少一个规则添加到所述时间转换语法。
15.一种存储指令的计算机可读存储器设备,所述指令在计算机的处理器上执行时使得所述计算机通过以下来转换表达:
将时间转换语法应用于所述表达,所述时间转换语法包括:
至少一个识别规则,其分别识别表达的时间元素;
至少一个标准化规则,其分别将所述表达的时间元素标准化成标准化时间元素;以及
至少一个转换规则,其分别将标准化时间元素转换成日期;
其中,所述时间转换语法可操作用于第一转换上下文和第二转换上下文中,其中,所述第一转换上下文不同于所述第二转换上下文。
16.如权利要求15所述的计算机可读存储器设备,其中:
所述计算机具有对包含至少一个事实的知识库的访问权;以及
所述指令还使得所述计算机使用所述至少一个转换规则和所述知识库的所述至少一个事实将所述标准化时间元素转换成日期。
17.如权利要求15所述的计算机可读存储器设备,其中:
至少一个选定的标准化规则还包括:
标准化条件,其与所述表达的时间元素相关联;以及
至少一个标准化指令;以及
所述指令还使得所述计算机:在确定所述表达的时间元素满足所述选定的标准化规则的所述标准化条件时,将所述选定的标准化规则的所述至少一个标准化指令应用于所述表达。
18.如权利要求15所述的计算机可读存储器设备,其中:
所述选定的标准化规则的所述至少一个标准化指令还包括汇编代码;以及
将所述选定的标准化规则的所述至少一个标准化指令应用于所述表达还包括:在所述表达上调用所述选定的标准化规则的所述汇编代码。
19.如权利要求15所述的计算机可读存储器设备,其中,所述指令还使得所述计算机用所述日期取代所述表达的所述相应的时间元素。
20.如权利要求19所述的计算机可读存储器设备,其中,取代所述相应的时间元素还包括:用根据标准化日期格式而格式化的所述日期来取代所述表达的所述相应的时间元素。
21.一种系统,包括:
至少一个处理器;以及
存储器,其耦合到所述至少一个处理器,所述存储器用于存储指令,所述指令在由所述至少一个处理器执行时,实行用于转换表达的方法,所述方法包括:
将时间转换语法应用于第一表达,其中,所述时间转换语法可操作用于第一转换上下文和不同的第二转换上下文中;
使用识别规则集来识别所述第一表达的第一时间元素;
使用所述第一时间元素来识别第二时间元素,其中,所述第二时间元素是相对于所述第一时间元素来规定的;
使用标准化规则集对所述第二时间元素进行标准化;以及
使用转换规则集将所述标准化时间元素转换成第一日期。
22.如权利要求21所述的系统,其中,所述时间转换语法包括以流水线方式应用于所述第一表达的一个或多个规则集。
23.如权利要求21所述的系统,其中,所述一个或多个规则集包括以下各项中的至少一个:常规表达集、汇编的规则集和机器学习识别器。
24.如权利要求21所述的系统,其中,所述第一表达包括所述第一时间元素和所述第二时间元素。
25.如权利要求21所述的系统,所述方法还包括:
接收第二表达,所述第二表达包括所述第二时间元素;以及
将所述时间转换语法应用于所述第二表达。
26.如权利要求21所述的系统,其中,使用所述第一时间元素来识别所述第二时间元素包括:
识别隐式地参考的所述第一时间元素;
使用所述标准化规则集对所述第一时间元素进行标准化;以及
使用所述转换规则集将所述标准化的第一时间元素转换成第二日期。
27.如权利要求21所述的系统,其中,所述识别规则集与模式匹配实用程序相关联,所述模式匹配效用可操作用于识别接收的表达中的一个或多个时间元素。
28.如权利要求21所述的系统,其中,所述时间转换语法是独立实现的,从而所述时间转换语法可操作用作时间转换逻辑的共享基础。
29.如权利要求28所述的系统,其中,所述时间转换语法可操作为由包括汇编的规则集的第一计算设备和包括机器学习识别器的第二计算设备使用。
30.如权利要求21所述的系统,其中,所述时间转换语法可操作为在两种或更多种语言之间转换所述时间元素,其中,所述两种或更多种语言选自包括以下各项的组中:口语、书面语、姿态语言、数学等式、编程语言以及非结构化文本。
31.一种使用计算机来转换表达的方法,所述方法包括:
将时间转换语法应用于所述表达,其中,所述时间转换语法可操作用于第一转换上下文和不同的第二转换上下文中;
使用至少一个识别规则来识别所述表达的第一时间元素;
使用所述第一时间元素来识别第二时间元素,其中,所述第二时间元素是相对于所述第一时间元素来规定的;
使用至少一个标准化规则对所述第二时间元素进行标准化;以及
使用至少一个转换规则将所述标准化时间元素转换成日期。
32.如权利要求31所述的方法,其中,所述一个或多个规则集包括以下各项中的至少一个:常规表达集、汇编的规则集和机器学习识别器。
33.如权利要求31所述的方法,其中,所述第二时间元素规定日期范围和日期集合中的至少一个。
34.如权利要求31所述的方法,其中,语法扩展器将由所述计算机的应用提供的至少一个规则添加到所述时间转换语法。
35.如权利要求31所述的方法,其中,所述时间转换语法可操作为由包括汇编的规则集的第一计算设备和包括机器学习识别器的第二计算设备使用。
36.一种系统,包括:
至少一个处理器;以及
存储器,其耦合到所述至少一个处理器,所述存储器用于存储指令,所述指令在由所述至少一个处理器执行时,实行用于使用计算机来转换表达的方法,所述方法包括:
将时间转换语法应用于所述表达,其中,所述时间转换语法可操作用于第一转换上下文和不同的第二转换上下文中;
访问知识库以识别与所述系统的用户相关联的事实集;
确定针对所述事实集的一个或多个规则;
基于所述一个或多个规则,识别所述表达的第一时间元素;
使用至少一个标准化规则对所述第一时间元素进行标准化;以及
使用至少一个转换规则将所述标准化时间元素转换成日期。
37.如权利要求36所述的系统,其中,所述知识库包括与关联于所述用户的一个或多个简档相关联的信息,以及其中,所述表达调用与所述信息相关联的一个或多个事实。
38.如权利要求37所述的系统,其中,所述时间转换语法规定确定在所述事实集中的至少一个事实的一个或多个简档内的位置。
39.如权利要求36所述的系统,所述方法还包括:
识别所述表达的第二时间元素,其中,所述第一时间元素是基准日期,而所述第二时间元素是相对于所述基准日期的日期。
40.如权利要求36所述的系统,所述方法还包括:
接收用于处理一个或多个表达的一个或多个补充规则;以及
将所述一个或多个补充规则添加到所述时间转换语法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910001171.9A CN110083806B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/225,894 US9535904B2 (en) | 2014-03-26 | 2014-03-26 | Temporal translation grammar for language translation |
US14/225,894 | 2014-03-26 | ||
CN201910001171.9A CN110083806B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
CN201580016200.9A CN106164892B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
PCT/US2015/021624 WO2015148281A1 (en) | 2014-03-26 | 2015-03-20 | Temporal translation grammar for language translation |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580016200.9A Division CN106164892B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110083806A true CN110083806A (zh) | 2019-08-02 |
CN110083806B CN110083806B (zh) | 2023-07-04 |
Family
ID=52815308
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580016200.9A Active CN106164892B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
CN201910001171.9A Active CN110083806B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580016200.9A Active CN106164892B (zh) | 2014-03-26 | 2015-03-20 | 用于语言转换的时间转换语法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9535904B2 (zh) |
EP (1) | EP3123353A1 (zh) |
CN (2) | CN106164892B (zh) |
WO (1) | WO2015148281A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019595B1 (en) | 2006-09-11 | 2011-09-13 | WordRake Holdings, LLC | Computer processes for analyzing and improving document readability |
US9535904B2 (en) * | 2014-03-26 | 2017-01-03 | Microsoft Technology Licensing, Llc | Temporal translation grammar for language translation |
US9740689B1 (en) * | 2014-06-03 | 2017-08-22 | Hrl Laboratories, Llc | System and method for Farsi language temporal tagger |
JP6507682B2 (ja) * | 2015-01-30 | 2019-05-08 | 富士通株式会社 | 符号化プログラム、符号化方法および符号化装置 |
CN107229616B (zh) | 2016-03-25 | 2020-10-16 | 阿里巴巴集团控股有限公司 | 语言识别方法、装置及系统 |
CN106844355A (zh) * | 2017-01-16 | 2017-06-13 | 中译语通科技(北京)有限公司 | 一种日期时间自动翻译控制方法 |
US9959272B1 (en) * | 2017-07-21 | 2018-05-01 | Memsource a.s. | Automatic classification and translation of written segments |
WO2019172946A1 (en) * | 2018-03-07 | 2019-09-12 | Google Llc | Facilitating end-to-end communications with automated assistants in multiple languages |
US10956680B1 (en) | 2018-10-01 | 2021-03-23 | Knexus Research Corporation | System and method for temporal expressions processing |
CN109800338A (zh) * | 2018-12-11 | 2019-05-24 | 平安科技(深圳)有限公司 | 口语化时间标准化控制方法、装置、计算机设备及存储介质 |
US10740534B1 (en) | 2019-03-28 | 2020-08-11 | Relativity Oda Llc | Ambiguous date resolution for electronic communication documents |
US11321525B2 (en) | 2019-08-23 | 2022-05-03 | Micro Focus Llc | Generation of markup-language script representing identity management rule from natural language-based rule script defining identity management rule |
CN111104205A (zh) * | 2019-12-24 | 2020-05-05 | 浙江中控技术股份有限公司 | 一种st语言的解释执行方法及系统 |
US11494558B2 (en) | 2020-01-06 | 2022-11-08 | Netiq Corporation | Conversion of script with rule elements to a natural language format |
US20220293098A1 (en) * | 2021-03-15 | 2022-09-15 | Lenovo (Singapore) Pte. Ltd. | Dialect correction and training |
US11900061B2 (en) | 2021-04-14 | 2024-02-13 | Microsoft Technology Licensing, Llc | Intelligent interpretation of temporal expressions |
CN115879479A (zh) * | 2021-09-26 | 2023-03-31 | 北京字节跳动网络技术有限公司 | 一种应用程序的翻译方法及装置 |
CN114676691B (zh) * | 2022-05-27 | 2022-09-09 | 深圳市人马互动科技有限公司 | 一种识别方法、系统、设备以及计算机可读存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0528640A2 (en) * | 1991-08-19 | 1993-02-24 | International Business Machines Corporation | Computer system for generating a user interface |
WO1998044484A1 (en) * | 1997-04-03 | 1998-10-08 | Microsoft Corporation | Text normalization using a context-free grammar |
CN1402154A (zh) * | 2001-08-06 | 2003-03-12 | 株式会社日立制作所 | 时间信息显示系统 |
CN1415096A (zh) * | 1999-11-17 | 2003-04-30 | 联合国 | 语言翻译系统 |
WO2003071393A2 (en) * | 2002-02-15 | 2003-08-28 | Mathsoft Engineering And Education, Inc. | Linguistic support for a regognizer of mathematical expressions |
US20050149858A1 (en) * | 2003-12-29 | 2005-07-07 | Stern Mia K. | System and method for managing documents with expression of dates and/or times |
CN1745593A (zh) * | 2002-12-13 | 2006-03-08 | 捷讯研究有限公司 | 为移动通信设备提供sms消息时间标记格式的一致性的方法和装置 |
EP1808802A1 (en) * | 2005-12-14 | 2007-07-18 | Research In Motion Limited | Method and apparatus for generating a new event directly from a document |
CN101183378A (zh) * | 2006-11-14 | 2008-05-21 | 国际商业机器公司 | 用于在查询时间清洗基于序列的数据的方法和系统 |
US20090055411A1 (en) * | 2007-08-24 | 2009-02-26 | Zhuo Meng | System and method for precisely handling duration values |
US20090326911A1 (en) * | 2008-06-26 | 2009-12-31 | Microsoft Corporation | Machine translation using language order templates |
US20120078611A1 (en) * | 2010-09-27 | 2012-03-29 | Sap Ag | Context-aware conversational user interface |
CN103093334A (zh) * | 2011-11-04 | 2013-05-08 | 周超然 | 活动通知文本识别并自动转换为日历项的方法 |
US20140046717A1 (en) * | 2012-08-08 | 2014-02-13 | Top Scholar Technology, Llc | Organization system and method for calendar applications |
CN103593340A (zh) * | 2013-10-28 | 2014-02-19 | 茵鲁维夫有限公司 | 自然表达信息处理方法、处理及回应方法、设备及系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060248456A1 (en) * | 2005-05-02 | 2006-11-02 | Ibm Corporation | Assigning a publication date for at least one electronic document |
US8819034B2 (en) * | 2005-12-14 | 2014-08-26 | Blackberry Limited | Method and apparatus for generating a new event directly from a document |
WO2007121329A1 (en) * | 2006-04-12 | 2007-10-25 | Google Inc | Method, system ,graphical user interface, and data structure for creating electronic calendar entries from email messages |
US20080154897A1 (en) | 2006-11-20 | 2008-06-26 | Siemens Medical Solution Usa, Inc. | Automated Interpretation and Replacement of Date References in Unstructured Text |
US8131536B2 (en) * | 2007-01-12 | 2012-03-06 | Raytheon Bbn Technologies Corp. | Extraction-empowered machine translation |
US20090235280A1 (en) | 2008-03-12 | 2009-09-17 | Xerox Corporation | Event extraction system for electronic messages |
US9491573B2 (en) * | 2008-11-06 | 2016-11-08 | Texas Instruments Incorporated | Communication device for providing value-added information based upon content and/or context information |
US8379819B2 (en) * | 2008-12-24 | 2013-02-19 | Avaya Inc | Indexing recordings of telephony sessions |
EP2224350A1 (en) | 2009-02-25 | 2010-09-01 | Research In Motion Limited | Intelligent hyperlinking of dates in text |
US20100318398A1 (en) | 2009-06-15 | 2010-12-16 | Xerox Corporation | Natural language interface for collaborative event scheduling |
WO2011148659A1 (ja) | 2010-05-28 | 2011-12-01 | オムロン株式会社 | 特別日の登録のための情報処理方法 |
US8346879B2 (en) | 2010-06-04 | 2013-01-01 | Xerox Corporation | Detecting conflicts in email messages |
US8606564B2 (en) | 2010-11-01 | 2013-12-10 | Yahoo! Inc. | Extracting rich temporal context for business entities and events |
CN103186455B (zh) * | 2011-12-28 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 页面自动化测试脚本生成方法及系统 |
US9760644B2 (en) * | 2013-04-17 | 2017-09-12 | Google Inc. | Embedding event creation link in a document |
US20150193392A1 (en) * | 2013-04-17 | 2015-07-09 | Google Inc. | User Interface for Quickly Checking Agenda and Creating New Events |
US20140372102A1 (en) * | 2013-06-18 | 2014-12-18 | Xerox Corporation | Combining temporal processing and textual entailment to detect temporally anchored events |
US20150149203A1 (en) * | 2013-11-22 | 2015-05-28 | Xerox Corporation | Medical event tracking system |
US9535904B2 (en) * | 2014-03-26 | 2017-01-03 | Microsoft Technology Licensing, Llc | Temporal translation grammar for language translation |
-
2014
- 2014-03-26 US US14/225,894 patent/US9535904B2/en active Active
-
2015
- 2015-03-20 WO PCT/US2015/021624 patent/WO2015148281A1/en active Application Filing
- 2015-03-20 CN CN201580016200.9A patent/CN106164892B/zh active Active
- 2015-03-20 EP EP15715033.5A patent/EP3123353A1/en not_active Ceased
- 2015-03-20 CN CN201910001171.9A patent/CN110083806B/zh active Active
-
2016
- 2016-12-19 US US15/383,095 patent/US10019439B2/en active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0528640A2 (en) * | 1991-08-19 | 1993-02-24 | International Business Machines Corporation | Computer system for generating a user interface |
WO1998044484A1 (en) * | 1997-04-03 | 1998-10-08 | Microsoft Corporation | Text normalization using a context-free grammar |
CN1415096A (zh) * | 1999-11-17 | 2003-04-30 | 联合国 | 语言翻译系统 |
CN1402154A (zh) * | 2001-08-06 | 2003-03-12 | 株式会社日立制作所 | 时间信息显示系统 |
WO2003071393A2 (en) * | 2002-02-15 | 2003-08-28 | Mathsoft Engineering And Education, Inc. | Linguistic support for a regognizer of mathematical expressions |
CN1745593A (zh) * | 2002-12-13 | 2006-03-08 | 捷讯研究有限公司 | 为移动通信设备提供sms消息时间标记格式的一致性的方法和装置 |
US20050149858A1 (en) * | 2003-12-29 | 2005-07-07 | Stern Mia K. | System and method for managing documents with expression of dates and/or times |
EP1808802A1 (en) * | 2005-12-14 | 2007-07-18 | Research In Motion Limited | Method and apparatus for generating a new event directly from a document |
CN101183378A (zh) * | 2006-11-14 | 2008-05-21 | 国际商业机器公司 | 用于在查询时间清洗基于序列的数据的方法和系统 |
US20090055411A1 (en) * | 2007-08-24 | 2009-02-26 | Zhuo Meng | System and method for precisely handling duration values |
US20090326911A1 (en) * | 2008-06-26 | 2009-12-31 | Microsoft Corporation | Machine translation using language order templates |
US20120078611A1 (en) * | 2010-09-27 | 2012-03-29 | Sap Ag | Context-aware conversational user interface |
CN103093334A (zh) * | 2011-11-04 | 2013-05-08 | 周超然 | 活动通知文本识别并自动转换为日历项的方法 |
US20140046717A1 (en) * | 2012-08-08 | 2014-02-13 | Top Scholar Technology, Llc | Organization system and method for calendar applications |
CN103593340A (zh) * | 2013-10-28 | 2014-02-19 | 茵鲁维夫有限公司 | 自然表达信息处理方法、处理及回应方法、设备及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106164892B (zh) | 2019-01-15 |
US10019439B2 (en) | 2018-07-10 |
CN106164892A (zh) | 2016-11-23 |
US9535904B2 (en) | 2017-01-03 |
WO2015148281A1 (en) | 2015-10-01 |
US20170103064A1 (en) | 2017-04-13 |
CN110083806B (zh) | 2023-07-04 |
EP3123353A1 (en) | 2017-02-01 |
US20150278201A1 (en) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106164892B (zh) | 用于语言转换的时间转换语法 | |
US11074521B2 (en) | Career path recommendation engine | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN108959246A (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
WO2018098318A1 (en) | Service for developing dialog-driven applications | |
WO2019083519A1 (en) | NATURAL LANGUAGE PROCESSING USING A N-GRAM MACHINE | |
CN113127624B (zh) | 问答模型的训练方法及装置 | |
Khan et al. | BlindSense: An Accessibility-inclusive Universal User Interface for Blind People. | |
CN112015896B (zh) | 基于人工智能的情感分类方法、以及装置 | |
CN111611355A (zh) | 一种对话回复方法、装置、服务器及存储介质 | |
Alrifai et al. | The user and domain models of the TERENCE adaptive learning system | |
WO2022259005A1 (en) | Automated no-code coding of app-software using a conversational interface and natural language processing | |
WO2023057313A1 (en) | Reactive voice device management | |
CN116643814A (zh) | 模型库构建方法、基于模型库的模型调用方法和相关设备 | |
US20220366331A1 (en) | Persona-driven assistive suite | |
Henrich et al. | Combitagger: A system for developing combined taggers | |
CN114357950A (zh) | 数据改写方法、装置、存储介质及计算机设备 | |
CN116150324A (zh) | 对话模型的训练方法、装置、设备及介质 | |
Ramnani et al. | Intelligent Travel Advisor: A Goal Oriented Virtual agent with Task Modeling, Planning and User Personalization | |
CN117474014B (zh) | 基于大数据分析的知识点拆解方法及系统 | |
Voigtmann et al. | A collaborative context prediction technique | |
CN116778264B (zh) | 基于类增学习的对象分类方法、图像分类方法及相关设备 | |
Taba | Personalized AI Assistant | |
CN114936563B (zh) | 一种事件抽取方法、装置及存储介质 | |
Doroshenko | Creating a virtual assistant using Python |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |