CN105992171A - 一种文本信息的处理方法和装置 - Google Patents

一种文本信息的处理方法和装置 Download PDF

Info

Publication number
CN105992171A
CN105992171A CN201510080218.7A CN201510080218A CN105992171A CN 105992171 A CN105992171 A CN 105992171A CN 201510080218 A CN201510080218 A CN 201510080218A CN 105992171 A CN105992171 A CN 105992171A
Authority
CN
China
Prior art keywords
information
characteristic information
scene characteristic
text message
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510080218.7A
Other languages
English (en)
Inventor
袁志俊
吴凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510080218.7A priority Critical patent/CN105992171A/zh
Priority to TW104129195A priority patent/TWI679862B/zh
Priority to US15/041,003 priority patent/US20160241497A1/en
Publication of CN105992171A publication Critical patent/CN105992171A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/18Commands or executable codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种文本信息的处理方法和装置,该方法包括:获取信息;所述信息中包括文本信息;从所述文本信息中获取一个或多个场景特征信息;根据所述一个或多个场景特征信息构造一个或多个应用入口对象。一方面,减少用户通过人工查找获取所需的场景信息的操作频次,另一方面,减少了调用其他应用、输入信息以获得相应服务的路径,大大提高了操作的简便性,缩小了操作时间,同时,由于操作频次减少了,进而节省了电子设备的系统资源消耗。

Description

一种文本信息的处理方法和装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种文本信息的处理方法和一种文本信息的处理装置。
背景技术
随着移动互联网技术的迅猛发展,人们使用移动设备的频率越来越高,在人们使用移动设备过程中很多时候都需要接收信息,例如短信、即使通讯信息等等,因此,使用移动设备进行信息交互是非常重要的使用场景。
其中,短信是用户接收信息的主要渠道和方式,用户在使用各种服务以及与同事、朋友沟通时,服务商、同事、朋友往往会将活动内容发送短信提醒用户。
但普通文本的短信不便于查找和使用,如果用户还需要其他相关的服务时,需要自行根据短信内容去找相应的应用程序来满足需求。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种文本信息的处理方法和相应的一种文本信息的处理装置。
为了解决上述问题,本申请实施例公开了一种文本信息的处理方法,包括:
获取信息;所述信息中包括文本信息;
从所述文本信息中获取一个或多个场景特征信息;
根据所述一个或多个场景特征信息构造一个或多个应用入口对象。
优选地,所述信息包括短信或者即时通讯信息;所述获取信息的步骤包括:
当接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信;
或者,
当监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
优选地,所述从所述文本信息中获取一个或多个场景特征信息的步骤包括:
在本地从所述文本信息中提取一个或多个场景特征信息。
优选地,所述从所述文本信息中获取一个或多个场景特征信息的步骤还包括:
对所述一个或多个场景特征信息进行信息补充。
优选地,所述在本地从所述文本信息中提取一个或多个场景特征信息的步骤包括:
在本地从所述文本信息中提取符合预设的文本格式的场景特征信息。
优选地,所述在本地从所述文本信息中提取一个或多个场景特征信息的步骤包括:
从所述文本信息中提取,与本地的预置的信息源匹配的场景特征信息。
优选地,所述对所述一个或多个场景特征信息进行信息补充的步骤包括:
将所述一个或多个第一场景特征信息发送至服务器;
接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息。
优选地,所述对所述一个或多个场景特征信息进行信息补充的步骤包括:
以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
优选地,所述从所述文本信息中获取一个或多个场景特征信息的步骤包括:
将所述文本信息发送至服务器;
接收由服务器针对所述文本信息返回的一个或多个场景特征信息。
优选地,所述一个或多个场景特征信息由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
优选地,所述方法还包括:
查找所述一个或多个场景特征信息对应的卡片模板;
将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中,以生成卡片对象。
优选地,所述根据所述一个或多个场景特征信息构造一个或多个应用入口对象的步骤包括:
将所述一个或多个场景特征信息,和/或,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
优选地,所述方法还包括:
当所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
优选地,所述当所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务的步骤包括:
当所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;
当查找成功时,将应用入口对象中的场景特征信息发送至本地的应用;
当查找失败时,将应用入口对象中的场景特征信息发送至网络中的应用。
优选地,所述场景特征信息包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人、视频名称。
优选地,所述在本地从所述文本信息中提取符合预设的文本格式的场景场特征信息的步骤包括:
在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
其中,数字统一为:
统一所述文本信息中的数字形式;
正则表达式匹配为:
从所述文本信息提取符合时间正则表达式中的时间;
所述时间包括日期和/或时间,所述日期包括相对日期和绝对日期;
日期转换为:
当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
优选地,所述在本地从所述文本信息中提取符合预设的文本格式的场景场特征信息的步骤包括:
从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
通过常用地名词库对所述地理标志前的文本信息进行分词;
当分词成功时,将邻接所述地理标志的分词设置为所述地址的前缀;
当分词失败时,以所述地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
本申请实施例还公开了一种文本信息的处理装置,包括:
信息获取模块,用于获取信息;所述信息中包括文本信息;
场景特征信息获取模块,用于从所述文本信息中获取一个或多个场景特征信息;
应用入口对象构造模块,用于根据所述一个或多个场景特征信息构造一个或多个应用入口对象。
优选地,所述信息包括短信或者即时通讯信息;所述信息获取模块包括:
短信查找子模块,用于在接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信;
或者,
即时通讯信息提取模块,用于在监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
优选地,所述场景特征信息获取模块包括:
本地提取子模块,用于在本地从所述文本信息中提取一个或多个场景特征信息。
优选地,所述场景特征信息获取模块还包括:
信息补全子模块,用于对所述一个或多个场景特征信息进行信息补充。
优选地,所述本地提取子模块包括:
第一提取子模块,用于在本地从所述文本信息中提取符合预设的文本格式的场景特征信息。
优选地,所述本地提取子模块包括:
第二提取子模块,用于从所述文本信息中提取,与本地的预置的信息源匹配的场景特征信息。
优选地,所述信息补全子模块包括:
第一发送子模块,用于将所述一个或多个第一场景特征信息发送至服务器;
第一接收子模块,用于接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息。
优选地,所述信息补全子模块包括:
本地补充子模块,用于以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
优选地,所述场景特征信息获取模块包括:
第一发送子模块,用于将所述文本信息发送至服务器;
第二接收子模块,用于接收由服务器针对所述文本信息返回的一个或多个场景特征信息。
优选地,所述一个或多个场景特征信息由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
优选地,所述装置还包括:
卡片模板查找模块,用于查找所述一个或多个场景特征信息对应的卡片模板;
卡片对象生成模块,用于将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中,以生成卡片对象。
优选地,所述应用入口对象构造模块包括:
嵌入子模块,用于将所述一个或多个场景特征信息,或者,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
优选地,所述装置还包括:
应用调用模块,用于在所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
优选地,所述应用调用模块包括:
应用查找子模块,用于在所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;在查找成功时,调用第三发送子模块,在查找失败时,调用第四发送子模块;
第三发送子模块,用于将应用入口对象中的场景特征信息发送至本地的应用;
第四发送子模块,用于将应用入口对象中的场景特征信息发送至网络中的应用。
优选地,所述场景特征信息包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人、视频名称。
优选地,所述第一提取子模块步骤包括:
时间提取子模块,用于在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
其中,数字统一为:
统一所述文本信息中的数字形式;
正则表达式匹配为:
从所述文本信息提取符合时间正则表达式中的时间;
所述时间包括日期和/或时间,所述日期包括相对日期和绝对日期;
日期转换为:
当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
优选地,所述第一提取子模块包括:
地址提取子模块,用于从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
分词子模块,用于通过常用地名词库对所述地理标志前的文本信息进行分词;在分词成功时,调用第一设置子模块,在分词失败时,调用第二设置子模块;
第一设置子模块,将邻接所述地理标志的分词设置为所述地址的前缀;
第二设置子模块,以所述地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
本申请实施例包括以下优点:
本申请实施例基于文本信息获取场景特征信息,对场景特征信息构造应用入口对象,给用户提供应用的快捷方式,一方面,减少用户通过人工查找获取所需的场景信息的操作频次,另一方面,减少了调用其他应用、输入信息以获得相应服务的路径,大大提高了操作的简便性,缩小了操作时间,同时,由于操作频次减少了,进而节省了电子设备的系统资源消耗。
附图说明
图1是本申请的一种文本信息的处理方法实施例的步骤流程图;
图2是本申请的一种场景特征信息和应用入口对象的展示示例图;
图3是本申请的一种文本信息的处理装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种文本信息的处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取信息;
需要说明的是,本申请实施例可以应用于各种电子设备中,包括移动设备和固定设备,该移动设备可以包括手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,该固定设备可以包括个人电脑等等。
这些电子设备可以支持Windows、Android(安卓)、IOS、WindowsPhone等操作系统,通常可以运行各种应用。这些应用可以包括系统应用,例如,拨号应用、通讯录应用、日历应用等等,也可以包括第三方应用,例如,浏览器、打车程序、电子地图等等。
进一步而言,本申请实施例可以为电子设备中的系统应用,也可以为电子设备中的第三方应用,本申请实施例对此不加以限制。
在本申请实施例中,获取的信息可以为电子设备上任意形式的信息,例如,混合图片和文本的信息、混合音频和文本的信息等等。
其中,信息中可以包括文本信息,文本信息可以指电子设备上的含有文本内容的消息载体,可以是短信、即时通讯信息或者电子邮件等等,本申请实施例对此不加以限制。
由于短信、即使通讯信息为用户较为频繁使用的文本信息之一,由于不同操作系统获取短信的方式也不同,为使本领域技术人员更好地理解本申请实施例,以下以Android系统中获取短信、从即时通讯工具获取即使通讯信息作为获取文本信息的示例进行说明。
在本申请的一个实施例中,步骤101可以包括如下子步骤:
子步骤S11,当接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信。
在Android系统中,可以预先设置短信接收权限以及提示短信接收的广播。
当Android系统接收到新的短信时,可以自动发送提示短信接收的广播,若监听到此广播,则可以在Android系统的收件箱提取新收到的短信。
具体而言,可以按照时间降序对短信排序,排序在最前的短信为新收到的短信。
在本申请的另一个实施例中,步骤101可以包括如下子步骤:
子步骤S12,当监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
在具体实现中,通知中心可以接收到各应用的信息,如电子邮件、即时通讯信息等等,若监听到通知中心接收到所需应用的信息,如邮箱客户端、即时通讯工具等等,则可以从通知中心提取所需应用的信息,如电子邮件、即时通讯信息等等。
对于其他文本信息可以具有相应的获取方式。例如,可以由相应的应用直接文本信息的提示信息,接着调用相应的应用所提供的API(ApplicationProgramming Interface,应用程序编程接口)进行提取等等,本申请实施例对此不加以限制。
需要说明的是,本申请实施例对文本信息的来源、格式不作限制。
即文本信息可以来自固定的来源(例如,短信来自某个/些特定号码、即时通讯信息来自某个/些特定账号、电子邮件来自某个/些特定地址等等),也可以来自不固定的来源(例如,短信来自某个/些非特定号码、即时通讯信息来自某个/些非特定账号、电子邮件来自某个/些非特定地址等等)。
若文本信息来源于某些企业/机关单位等,该文本信息可能是服务通知信息,其内容整体的格式是规范的。
例如,铁路部门发出的购票通知短信(文本信息)的示例可以如下:
(1/2)订单号E440674001,李女士您已购06月27日G7509次04车08C号上海虹桥11:00开。可持二代身份【铁路客服】(2/2)证直接检票乘车或换取纸质车票后乘车。【铁路客服】
其格式固定包括:订单号、先生/女士、日期、车次、出发地、出发时间、取票须知。
若文本信息来源于某些个人等,其内容整体的格式一般是不规范的。
例如,某个私人短信的示例可以如下:
明天的机票已经帮你订好,航班号CA1703。
需要说明的是,来源可以指最初的文本信息发送者,可以是服务器,也可以是移动终端等等,并不是指起中转作用的网络节点或服务器。
此外,由于文本信息一般涉及到用户隐私,在某些操作系统或者应用程序可能需要得到用户授权的使用权限才可以获取。
因此,本申请实施例可以预先获得用户授权的使用权限,用户授权主要体现在两个方面:
一、用户授权文本信息源的访问权限(例如,短信中心、即时通讯工具、邮箱客户端等);
本申请实施例可以通过访问文本信息源获取文本信息,用户可能需要授予文本信息源的访问权限。
二、用户接受使用协议;
为保障用户的知情权,本申请实施例可以在使用协议中指出访问文本信息源获取文本信息,用户一般需要接受使用协议。
步骤102,从所述文本信息中获取一个或多个场景特征信息;
其中,场景特征信息可以为文本信息中表征某个/些场景的特征的信息,一般为用户关注的信息,且一般带有一定的延伸性。
文本信息,尤其是短信,在很多情况下会包含至少一个场景,该场景可以泛指情景、活动等。
例如,一条文本信息为“明天的机票已经帮你订好,航班号CA1703。”则该文本信息可以包含乘坐飞机这个场景。
又例如,一条文本信息为“明天上午八点半来西湖区国际大厦开会,请转告Jimmy。”则该文本信息包含了会议这个场景。
又例如,一条文本信息为“明天去看智取威虎山吧?”则该文本信息包含了看电影这个场景。
在本申请实施例中,所述场景特征信息可以至少包括两种类型;
第一种类型,可以为文本格式规则或电子设备本地具有信息源,可以应用于电子设备本地通过文本格式、信息源等方式直接识别的场景特征信息。
在一个示例中,第一种类型的场景特征信息可以包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人;
第二种类型,可以为文本格式不规则,一般由后台(如服务器)预先采集大量的样本信息,进行后台(如服务器)大量的样本信息进行识别的场景特征信息。
在一个示例中,第二种类型的场景特征信息可以包括视频名称。
需要说明的是,上述场景特征信息只是作为示例,本领域技术人员可以根据实际情况设置其他景特征信息,本申请实施例对此不加以限制。
在很多情况下,场景特征信息可能是部分的场景信息,可能存在缺失。
例如,一条文本信息为“明天的机票已经帮你订好,航班号CA1703。”则在乘坐飞机这个场景中,存在“明天”、“CA1703”这两个场景特征信息,缺失了起飞地址、目的地址、起飞时间、到达时间、机长、乘务员等信息。
本申请实施例可以自动对该场景特征信息进行信息补充,即补充场景中所缺失的信息。
需要说明的是,信息补充即对缺失的信息进行补充获得的信息,这些补充的信息一般为用户关注的信息,与场景特征信息具有依赖关系、或者、由场景特征信息可以推导出来的信息,可以较为完整地表达场景,并不一定表明具有与某个场景相关的所有信息。
例如,一条文本信息为“明天的机票已经帮你订好,航班号CA1703。”则在乘坐飞机这个场景中,存在“明天”、“航班号CA1703”这两个场景特征信息,可以补充起飞地址、目的地址、起飞时间、到达时间等信息,而对于其他所缺失的机长、乘务员等信息并不一定需要补充。
在本申请实施例中,可以预先建立场景特征信息与需要补充的信息的关联关系,根据关联关系对场景特征信息进行补充。
场景特征信息与需要补充的信息的关联关系的示例可以如下表所示:
场景特征信息 需要补充的信息
航班号 出发地、目的地、起飞时间、到达时间等
列车车次 列车时刻表等
联系人 联系人的电话号码等
视频名称 影评、主演的介绍等
在本申请的一种优选实施例中,步骤102可以包括如下子步骤:
子步骤S21,在本地从所述文本信息中提取一个或多个场景特征信息;
在本申请实施例中,对于文本格式规则或电子设备本地具有信息源的场景特征信息,可以在电子设备本地通过文本格式、信息源等方式直接识别。
在申请的一种优选实施例中,子步骤S21可以包括如下子步骤:
子步骤S211,在本地从所述文本信息中提取符合预设的文本格式的场景场特征信息。
在本申请实施例中,由于某些场景特征信息(如时间、地址、航班号、列车车次、电话号码等)的文本格式可以是规则的,则可以通过正则表达式从所述文本信息中提取场景场特征信息。
在一个示例中,时间可以包括日期和/或时间点等等,对于日期,一般为“XX-XX-XX”、“XX年XX月XX日”、“XX.XX.XX”等规则格式的绝对日期,也可以为“明天”、“昨天”等规则的文本格式的相对日期,对于时间点,一般为“X点”、“X点半”、“XX:XX”等规则的文本格式,其中,X为数字,包括中文数字、阿拉伯数字等。
则在本示例中,子步骤S211可以包括以下子步骤:
子步骤S2111,在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
具体而言,正则表达式匹配可以为:从所述文本信息提取符合时间正则表达式中的时间;
本示例可以通过时间正则表达式直接提取绝对日期,例如“2014-8-19”、“8月25号”可以直接提取。
在本示例中,时间(如日期)的正则表达式可以为:(([0-9]|(零|一|二|三|四|五|六|七|八|九|十)){4}(-|/|年))?(([0-1]?[0-9]|(零|一|二|三|四|五|六|七|八|九|十){1,2})(-|/|月)((([0-2]?[0-9])|(3[0-1]))(?![0-9])|(零|一|二|三|四|五|六|七|八|九|十){1,3})(日|号)?)
对于“2014年十月8号”这个时间,提取时间的过程可以依据规则([0-9]|(零|一|二|三|四|五|六|七|八|九|十)){4}(-|/|年)提取年份“2014年”,依据规则(([0-1]?[0-9]|(零|一|二|三|四|五|六|七|八|九|十){1,2})(-|/|月)提取月份“十月”,最后依据规则((([0-2]?[0-9])|(3[0-1]))(?![0-9])|(零|一|二|三|四|五|六|七|八|九|十){1,3})(日|号)?)提取日期“8号”。
日期转换可以为:当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
本示例可以通过正则表达式提取相对日期及将该相对日期转换为绝对日期,例如,假设当前为2015年1月1日,则相对日期“明天”可以转换为2015年1月2日。
本示例可以通过正则表达式提取时间点,例如,“8点”、“9:30”。
其中,数字统一可以为:统一所述文本信息中的数字形式;
此外,为了方便正则表达式的使用,可以在提取时间之前,将中文数字、阿拉伯数字等数字的形式进行统一。
由于中文数字编码不连续以及表达方式多样化,则其中一种优选方式可以为将中文数字替换成相对应的阿拉伯数字,如将“五”替换成“5”,将“二十七”替换成“27”。
在另一个示例中,地址一般为包含地理标志,如市、区、县、街道等规则的文本格式。
则在本示例中,子步骤S211可以包括以下子步骤:
子步骤S2112,从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
子步骤S2113,通过常用地名词库对所述第一个地理标志前的文本信息进行分词;当分词成功时,执行子步骤S2114,当分词失败时,执行子步骤S2115;
子步骤S2114,将邻接所述地理标志的分词设置为所述地址的前缀;
子步骤S2115,以所述地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
在具体实现中,可以采用地址正则表达式提取出短信中包含地理标志信息,由于所提取的信息一般缺少第一个地理标志的前缀,则可以通过常用地名词库(用于存储地名的词库,如省、市、区、悬的名称)对地理标志(通常为第一个地理标志)前的信息进行分词,若分词成功(即前缀信息中包含常用地名),则可以将邻接第一个地理标志的分词(如最大分词)作为前缀,若分词失败,则从第一个地理标志往前搜索,搜索到第一个非汉字停止(最多搜索N个字符,超过N个则可以取前N个字符作为前缀)。
在本示例中,地理标志可以指的是带有市、区、县、街道等地理信息的词语,其正则表达式可以为:“省|市|区|县|自治州|自治区|镇|乡|村|街|道|路|苑|大厦|楼|号|层|座|公园|幢”。
例如,对于“明天来杭州市文一路969号一楼开会”,可以依据正则表达式提取“市文一路969号一楼”,因为有“市”、“路”、“号”、“楼”这四个地理标志,但是缺少第一个地理标志“市”的前缀“杭州”,此时,可以采用常用地名词对“市”前的信息“明天来杭州”进行分词,提取出“杭州”这个信息。
此外,最大分词可以指文本在词库中分出的最大长度的词,如文本ABCD,BCD可能是地名,CD也可能是地名,分词结果有两条,BCD的长度比CD要长,是最大分词,可以取BCD作为地名。
在另一个示例中,航班号在国际上一般有统一的编号规则,国内航班由航空公司两字代码加上四个数字组成,国际航班由航空公司两字代码加上三个数字组成,航空公司的两字代码是由大写英文字母或者数字组成。
则在本示例中,可以通过航班号正则表达式从所述文本信息中提取航班号。
例如,提取航班号所用的航班号正则表达式可以为:
((([A-Z][0-9])|([0-9][A-Z])|([A-Z]{2}))\\d{3,4})(?![a-zA-Z0-9]);
对于“CA1703”,“CA”满足规则((([A-Z][0-9])|([0-9][A-Z])|([A-Z]{2})),“1703”满足规则\\d{3,4}。
在另一个示例中,列车车次一般统一的编号规则,国内的列车编号一般是C、D、G、Z、T、K、L开头,加上一到四位数字,或者直接由四位数字组成。
则在本示例中,可以通过取列车车次正则表达式从所述文本信息中提取列车车次。
例如,提取列车车次所用的取列车车次正则表达式可以为:
[A-Z]?\\d{1,5}(?![a-zA-Z0-9]);
对于“T257”,“T”开头且后面跟随3位数字,满足正则表达式。
在另一个示例中,电话号码一般具有较为规则的编号规则,例如,手机号码为11位数字,固定号码为3-4位区号加7-8位直拨号码,后面跟1-4位分机号。
则在本示例中,可以通过电话号码正则表达式从所述文本信息中提取电话号码。
例如,提取列车车次所用的电话号码正则表达式可以为:
(((\\+86)?1[0-9]{10})|((0[0-9]{2,3}-)?[0-9]{7,8}))(?![a-zA-Z0-9])
对于“+8613800008888”,“+86”后且“1”开头,后面跟随10位数字,满足正则表达式。
当然,上述场景场特征信息的提取方式只是作为示例,在实施本申请实施例时,可以根据实际情况设置其他提取方式,本申请实施例对此不加以限制。另外,除了上述提取方式外,本领域技术人员还可以根据实际需要采用其它提取方式,本申请实施例对此也不加以限制。
在申请的另一种优选实施例中,子步骤S21可以包括如下子步骤:
子步骤S212,从所述文本信息中提取,与本地的预置的信息源匹配的场景场特征信息。
在电子设备的使用过程中,用户可以累积各种信息,作为匹配的信息源。
例如,在手机中,用户可以在通讯录中记录联系人信息,如姓名、电话、公司名称等等。
在本申请实施例中,由于某些场景特征信息(如联系人等)在电子设备本地具有信息源,则可以通过信息源匹配,如将联系人信息中的姓名在文本信息中匹配,在匹配成功时,从所述文本信息中提取场景场特征信息。
在本申请的一种优选实施例中,步骤102还可以包括如下子步骤:
子步骤S22,对所述一个或多个场景特征信息进行信息补充。
若电子设备获得场景特征信息,而某些场景特征信息可以存在缺失,不能很好地表达场景,因此,可以对场景信息进行数据的加工。
在本申请的一种优选实施例中,子步骤S22可以包括如下子步骤:子步骤S221,将所述一个或多个第一场景特征信息发送至服务器;
子步骤S222,接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息
应用本申请实施例,可以预先采集不同对象的信息,以类型为单位存储在服务器中,形成一个或多个数据集。
例如,对于飞机,可以从各大航空公司的服务器采集航班号、出发地、目的地、起飞时间、到达时间等信息,以航班号为单元进行存储。
电子设备在识别第一场景特征信息时,可以识别出该第一场景特征信息的类型。
例如,“CA1703”这个第一场景特征信息符合了用于匹配航班号的正则表达式的规则,则可以认为“CA1703”的类型为航班号。
其中,场景特征信息的类型包括第一类型,这类信息的关联信息量较为巨大,且电子设备一般不具有这些关联信息量,例如,航班号、列车车次等,一般由后台的服务器进行补充。
在本申请的另一种优选实施例中,子步骤S22可以包括如下子步骤:
子步骤S223,以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
在本申请实施例中,场景特征信息的类型包括第二类型,这类信息的关联信息量较少,且电子设备一般具有这些关联信息量,例如,联系人等,一般在电子设备进行补充。
在本申请的另一种优选实施例中,步骤102可以包括如下子步骤:
子步骤S31,将所述文本信息发送至服务器;
子步骤S32,接收由服务器针对所述文本信息返回的一个或多个场景特征信息;
其中,所述一个或多个场景特征信息可以由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息可以由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
应用本申请实施例,服务器可以预先采集大量的样本信息(如电影、电视剧的名称、剧情、影评、主演等信息),该样本信息可以指作为场景特征信息的样本的信息。
对于文本格式不规则的某些场景特征信息(如视频名称),可以由服务器通过样本信息等方式直接识别,或者,在场景特征信息存在缺失(如视频名称缺失剧情、影评、主演等信息)等情形下,对场景特征信息进行数据加工。
需要说明的是,本申请实施例可以应用每种方式(如文本格式、信息源、样本信息等)对文本信息进行场景特征信息的提取,以保证提取到的场景特征信息的完整性。
此外,在某些情况下,场景特征信息补充的信息为空,即场景特征信息可以与场景完整信息的内容相同。
假设当前的时间为2015年1月1日,从文本信息中提取场景特征信息的示例可以如下表所示:
步骤103,根据所述一个或多个场景特征信息构造一个或多个应用入口对象;
应用入口对象,可以为应用的触发点,通过该应用入口对象可以触发相应的应用。
在本申请的一种优选实施例中,步骤103可以包括如下子步骤:
子步骤S41,将所述一个或多个场景特征信息,和/或,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
在同一类型中,可能具有多个不同的应用,本申请实施例可以使用统一的应用入口模板对同一类型的应用构造应用入口对象。
其中,应用入口模板可以为应用入口对象中较为固定的数据,主要包括UI(User Interface,用户界面)元素,如图标、文本等,还可以包括用于调用应用的脚本等数据,如JSON(JavaScript Object Notation)脚本等。
在本申请实施例中,可以预先建立类型与应用入口模板之间的对应关系,对于每种类型的场景完整信息,可以提供一种或多种服务。
场景特征信息、应用入口模板与服务的关联关系如下表所示:
在一种情况下,可以将场景特征信息嵌入用户界面元素中,可以标识生成的应用入口对象是针对该场景特征信息提供服务的;
其中,嵌入用户界面元素中的场景完整信息可能是部分,也可能是全部。
例如,对于打车服务、导航服务,则可以嵌入当前的地址、目的地的地址等场景特征信息的部分信息;对于拨打号码的服务,则可以嵌入联系人、电话号码这场景完整信息的全部信息。
在另一种情况下,可以根据场景特征信息查询到应用服务信息,即应用针对该场景特征信息提供的服务的至少部分信息,将嵌入用户界面元素中,可以标直接标识服务的至少部分结果。例如,针对导航服务、打车服务,可以预先以计算从当前地点、目的地等场景完整信息计算路程、时间、打车费用等应用服务信息,嵌入用户界面元素中。
在本申请实施例中,可以将场景特征信息和应用入口对象在应用(如系统应用或第三方应用)中直接显示。
例如,如图2所示,若用户接收到一条短信,为“明天联系于先生一起吃晚饭,地点是西湖印象城”,提取到的场景特征信息包括时间“明天”、联系人“于先生”、地址“西湖印象城”,针对联系人“于先生”,可以构造拨打应用的应用入口对象203,针对地址“西溪印象城”,可以分别构造提供打车服务的应用入口对象201、提供导航服务的应用入口对象202。
对于“于先生”,用户知道“于先生”是他的联系人,但是用户需要的不仅仅是这个信息,用户需要去联系于先生,本示例则直接根据“于先生”,为用户提供了于先生的电话号码(进行信息补充后的场景特征信息),省去了用户去查找联系人的操作。
对于“西溪印象城”,用户也知道“西溪印象城”是个地址,但他更关心的是怎么去西溪印象城,本示例中则会依据用户当前位置,以及目的地位置为用户计算出来路程、时间以及打车费用,并提供导航应用、打车应用等提供导航服务、打车服务的应用的应用入口对象,省去了用户去查找导航应用、打车应用的操作。
同样,如果短信中包含有航班号等信息,用户更关心的一般不是这个航班号,而是怎么去乘坐这个航班,以及目的地的一些信息。
具体而言,如果用户定了一张机票,收到一个航空公司发来的短信,里面包括航班号,短信里面一般包含了航班的起降时间等信息,这时用户考虑的是如何乘车去机场,怎么去值机,北京天气如何,北京有什么好玩的等信息,而本示例可通过航班号获取起飞降落机场,为用户提供导航服务、打车服务的应用的应用入口对象,为用户提供在线值机的应用入口对象,用户只需输入身份证即可在线选座位,告知用户最近目的地天气,方便用户准备衣服等。
在本申请的一种优选实施例中,该方法还可以包括如下步骤:
步骤104,查找所述一个或多个场景特征信息对应的卡片模板;
步骤105,将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中。
本申请实施例可以应用卡片对象(如图2所示的卡片对象200)显示场景特征信息、应用入口对象。
卡片对象可以是一个信息集合的形象表达,并不是一个实质上的卡片,一个卡片是一个场景的相关信息以及应用入口对象的集合,以生成卡片对象。
卡片对象可以将该场景的相关信息以及应用入口对象的集合按照一定的数据模型(或称为数据格式)组织,展现在电子设备的用户界面,从而在电子设备上用卡片来展现活动事件的具体内容和承载相关交互,其实质可以JSON(JavaScript Object Notation,数据交换语言)数据。
在实际应用中,可以预先为不同场景特征信息制作不同的卡片模板,其实质也可以为JSON数据,在该卡片模板中,可以包括特征信息的展示样式,例如,展示位置、字体样式等等,也可以包括应用入口对象的展示位置等等。
将场景特征信息、应用入口对象按照卡片模板的规范,加载到卡片模板中,可以获得卡片对象进行显示。
当然,上述卡片对象只是作为显示方式的示例,在实施本申请实施例时,可以根据实际情况设置其他显示方式,例如,若文本信息为短信,则可以在短信界面加载场景特征信息和应用入口对象,若文本信息为即使通讯信息,则可以在即时通讯工具的会话窗口加载场景特征信息和应用入口对象等等,本申请实施例对此不加以限制。另外,除了上述显示方式外,本领域技术人员还可以根据实际需要采用其它显示方式,本申请实施例对此也不加以限制。
在本申请的一种优选实施例中,该方法还可以包括如下步骤:
步骤106,当所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述服务入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
在具体实现中,用户可以通过触控点击等方式触发该应用入口对象,以获得针对场景完整信息的服务。
在本申请的一种优选实施例中,步骤104可以包括如下子步骤:
子步骤S51,当所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;当查找成功时,执行子步骤S52,当查找失败时,执行子步骤S53;
子步骤S52,将应用入口对象中的场景特征信息发送至本地的应用;
子步骤S53,将应用入口对象中的场景特征信息发送至网络中的应用。
在本申请实施例中,可以优先使用电子设备本地的应用,在电子设备本地没有相关应用时,可以通过浏览器调用网络的应用。
例如,用户触发了如图2所示的应用入口对象202,则需要提供导航服务,可以优先查找电子设备本地是否具有提供导航服务的应用,如电子地图,如果有,则可以从中选择一个应用,将“西溪印象城”发送至该应用,以“西溪印象城”为目的地进行导航。
如果没有,则可以通过本地预置的浏览器,将“西溪印象城”发送至提供导航服务的网络应用,如电子地图平台的服务器,在浏览器中加载地图,以“西溪印象城”为目的地进行导航。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图3,示出了本申请的一种文本信息的处理装置实施例的结构框图,具体可以包括如下模块:
信息获取模块301,用于获取信息;所述信息中包括文本信息;
场景特征信息获取模块302,用于从所述文本信息中获取一个或多个场景特征信息;
应用入口对象构造模块303,用于根据所述一个或多个场景特征信息构造一个或多个应用入口对象。
在本申请实施例的一种优选示例中,所述信息可以包括短信或者即时通讯信息;所述信息获取模块301可以包括如下子模块:
短信查找子模块,用于在接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信;
或者,
即时通讯信息提取模块,用于在监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
在本申请的一种优选实施例中,所述场景特征信息获取模块302可以包括如下子模块:
本地提取子模块,用于在本地从所述文本信息中提取一个或多个场景特征信息。
在本申请的一种优选实施例中,所述场景特征信息获取模块302还可以包括如下子模块:
信息补全子模块,用于对所述一个或多个场景特征信息进行信息补充。
在本申请的一种优选实施例中,所述本地提取子模块可以包括如下子模块:
第一提取子模块,用于在本地从所述文本信息中提取符合预设的文本格式的场景特征信息。
在本申请的一种优选实施例中,所述本地提取子模块可以包括如下子模块:
第二提取子模块,用于从所述文本信息中提取,与本地的预置的信息源匹配的场景特征信息。
在本申请的一种优选实施例中,所述信息补全子模块可以包括如下子模块:
第一发送子模块,用于将所述一个或多个第一场景特征信息发送至服务器;
第一接收子模块,用于接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息。
在本申请的一种优选实施例中,所述信息补全子模块可以包括如下子模块:
本地补充子模块,用于以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
在本申请的一种优选实施例中,所述场景特征信息获取模块302可以包括如下子模块:
第一发送子模块,用于将所述文本信息发送至服务器;
第二接收子模块,用于接收由服务器针对所述文本信息返回的一个或多个场景特征信息。
在具体实现中,所述一个或多个场景特征信息可以由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息可以由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
在本申请的一种优选实施例中,所述应用入口对象构造模块303可以包括如下子模块:
嵌入子模块,用于将所述一个或多个场景特征信息,或者,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
在本申请的一种优选实施例中,该装置还可以包括如下模块:
卡片模板查找模块,用于查找所述一个或多个场景特征信息对应的卡片模板;
卡片对象生成模块,用于将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中,以生成卡片对象。
在本申请的一种优选实施例中,该装置还可以包括如下模块:
应用调用模块,用于在所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
在本申请的一种优选实施例中,所述应用调用模块可以包括如下子模块:
应用查找子模块,用于在所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;在查找成功时,调用第三发送子模块,在查找失败时,调用第四发送子模块;
第三发送子模块,用于将应用入口对象中的场景特征信息发送至本地的应用;
第四发送子模块,用于将应用入口对象中的场景特征信息发送至网络中的应用。
在具体实现中,所述场景特征信息包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人、视频名称。
在本申请实施例的一种优选示例中,所述第一提取子模块可以包括如下子模块:
时间提取子模块,用于在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
其中,数字统一为:
统一所述文本信息中的数字形式;
正则表达式匹配为:
从所述文本信息提取符合时间正则表达式中的时间;
所述时间包括日期和/或时间,所述日期包括相对日期和绝对日期;
日期转换为:
当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
在本申请实施例的一种优选示例中,所述第一提取子模块可以包括如下子模块:
地址提取子模块,用于从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
分词子模块,用于通过常用地名词库对所述地理标志前的文本信息进行分词;在分词成功时,调用第一设置子模块,在分词失败时,调用第二设置子模块;
第一设置子模块,将邻接所述地理标志的分词设置为所述地址的前缀;
第二设置子模块,以所述第一个地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种文本信息的处理方法和一种文本信息的处理装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (34)

1.一种文本信息的处理方法,其特征在于,包括:
获取信息;所述信息中包括文本信息;
从所述文本信息中获取一个或多个场景特征信息;
根据所述一个或多个场景特征信息构造一个或多个应用入口对象。
2.根据权利要求1所述的方法,其特征在于,所述信息包括短信或者即时通讯信息;所述获取信息的步骤包括:
当接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信;
或者,
当监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
3.根据权利要求1所述的方法,其特征在于,所述从所述文本信息中获取一个或多个场景特征信息的步骤包括:
在本地从所述文本信息中提取一个或多个场景特征信息。
4.根据权利要求3所述的方法,其特征在于,所述从所述文本信息中获取一个或多个场景特征信息的步骤还包括:
对所述一个或多个场景特征信息进行信息补充。
5.根据权利要求3所述的方法,其特征在于,所述在本地从所述文本信息中提取一个或多个场景特征信息的步骤包括:
在本地从所述文本信息中提取符合预设的文本格式的场景特征信息。
6.根据权利要求3所述的方法,其特征在于,所述在本地从所述文本信息中提取一个或多个场景特征信息的步骤包括:
从所述文本信息中提取,与本地的预置的信息源匹配的场景特征信息。
7.根据权利要求4所述的方法,其特征在于,所述对所述一个或多个场景特征信息进行信息补充的步骤包括:
将所述一个或多个第一场景特征信息发送至服务器;
接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息。
8.根据权利要求4所述的方法,其特征在于,所述对所述一个或多个场景特征信息进行信息补充的步骤包括:
以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
9.根据权利要求1或2或3或4或5或6或7或8所述的方法,其特征在于,所述从所述文本信息中获取一个或多个场景特征信息的步骤包括:
将所述文本信息发送至服务器;
接收由服务器针对所述文本信息返回的一个或多个场景特征信息。
10.根据权利要求9所述的方法,其特征在于,
所述一个或多个场景特征信息由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
11.根据权利要求1所述的方法,其特征在于,还包括:
查找所述一个或多个场景特征信息对应的卡片模板;
将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中,以生成卡片对象。
12.根据权利要求1或2或3或4或5或6或7或8或10或11所述的方法,其特征在于,所述根据所述一个或多个场景特征信息构造一个或多个应用入口对象的步骤包括:
将所述一个或多个场景特征信息,和/或,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
13.根据权利要求1或2或3或4或5或6或7或8或10或11所述的方法,其特征在于,还包括:
当所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
14.根据权利要求13所述的方法,其特征在于,所述当所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务的步骤包括:
当所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;
当查找成功时,将应用入口对象中的场景特征信息发送至本地的应用;
当查找失败时,将应用入口对象中的场景特征信息发送至网络中的应用。
15.根据权利要求1或2或3或4或5或6或7或8或10或11或14所述的方法,其特征在于,所述场景特征信息包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人、视频名称。
16.根据权利要求15所述的方法,其特征在于,所述在本地从所述文本信息中提取符合预设的文本格式的场景场特征信息的步骤包括:
在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
其中,数字统一为:
统一所述文本信息中的数字形式;
正则表达式匹配为:
从所述文本信息提取符合时间正则表达式中的时间;
所述时间包括日期和/或时间,所述日期包括相对日期和绝对日期;
日期转换为:
当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
17.根据权利要求15所述的方法,其特征在于,所述在本地从所述文本信息中提取符合预设的文本格式的场景场特征信息的步骤包括:
从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
通过常用地名词库对所述地理标志前的文本信息进行分词;
当分词成功时,将邻接所述地理标志的分词设置为所述地址的前缀;
当分词失败时,以所述地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
18.一种文本信息的处理装置,其特征在于,包括:
信息获取模块,用于获取信息;所述信息中包括文本信息;
场景特征信息获取模块,用于从所述文本信息中获取一个或多个场景特征信息;
应用入口对象构造模块,用于根据所述一个或多个场景特征信息构造一个或多个应用入口对象。
19.根据权利要求18所述的装置,其特征在于,所述信息包括短信或者即时通讯信息;所述信息获取模块包括:
短信查找子模块,用于在接收到操作系统发送的广播时,从操作系统中查找所述广播对应的短信;
或者,
即时通讯信息提取模块,用于在监听到通知中心接收到即时通讯工具的即时通讯信息时,从通知中心提取即时通讯工具的即时通讯信息。
20.根据权利要求18所述的装置,其特征在于,所述场景特征信息获取模块包括:
本地提取子模块,用于在本地从所述文本信息中提取一个或多个场景特征信息。
21.根据权利要求20所述的装置,其特征在于,所述场景特征信息获取模块还包括:
信息补全子模块,用于对所述一个或多个场景特征信息进行信息补充。
22.根据权利要求20所述的装置,其特征在于,所述本地提取子模块包括:
第一提取子模块,用于在本地从所述文本信息中提取符合预设的文本格式的场景特征信息。
23.根据权利要求20所述的装置,其特征在于,所述本地提取子模块包括:
第二提取子模块,用于从所述文本信息中提取,与本地的预置的信息源匹配的场景特征信息。
24.根据权利要求21所述的装置,其特征在于,所述信息补全子模块包括:
第一发送子模块,用于将所述一个或多个第一场景特征信息发送至服务器;
第一接收子模块,用于接收由服务器返回的,在一个或多个第一数据集中查找关联的信息进行信息补充获得的一个或多个场景特征信息。
25.根据权利要求21所述的装置,其特征在于,所述信息补全子模块包括:
本地补充子模块,用于以所述一个或多个场景特征信息为关键字在本地查找关联的信息进行信息补充。
26.根据权利要求18或19或20或21或22或23或24或25所述的装置,其特征在于,所述场景特征信息获取模块包括:
第一发送子模块,用于将所述文本信息发送至服务器;
第二接收子模块,用于接收由服务器针对所述文本信息返回的一个或多个场景特征信息。
27.根据权利要求26所述的装置,其特征在于,
所述一个或多个场景特征信息由服务器从所述文本信息中提取获得;
或者,
所述一个或多个场景特征信息由服务器以,从所述文本信息中提取的一个或多个场景特征信息为关键字,在一个或多个第一数据集中查找关联的信息进行信息补充获得。
28.根据权利要求18所述的装置,其特征在于,还包括:
卡片模板查找模块,用于查找所述一个或多个场景特征信息对应的卡片模板;
卡片对象生成模块,用于将所述一个或多个场景特征信息、所述一个或多个应用入口对象加载到所述卡片模板中,以生成卡片对象。
29.根据权利要求18或19或20或21或22或23或24或25或27或28所述的装置,其特征在于,所述应用入口对象构造模块包括:
嵌入子模块,用于将所述一个或多个场景特征信息,或者,由所述一个或多个场景特征信息查询到的一个或多个应用服务信息,嵌入一个或多个用户界面元素中,以生成一个或多个应用入口对象。
30.根据权利要求18或19或20或21或22或23或24或25或27或28所述的装置,其特征在于,还包括:
应用调用模块,用于在所述应用入口对象被触发时,将应用入口对象中的场景特征信息发送至所述应用入口对象对应的应用,以调用所述应用针对所述场景特征信息提供的服务。
31.根据权利要求30所述的装置,其特征在于,所述应用调用模块包括:
应用查找子模块,用于在所述应用入口对象被触发时,在本地查找所述服务入口对象对应的应用;在查找成功时,调用第三发送子模块,在查找失败时,调用第四发送子模块;
第三发送子模块,用于将应用入口对象中的场景特征信息发送至本地的应用;
第四发送子模块,用于将应用入口对象中的场景特征信息发送至网络中的应用。
32.根据权利要求18或19或20或21或22或23或24或25或27或28或31所述的装置,其特征在于,所述场景特征信息包括以下的一种或多种:
时间、地址、航班号、列车车次、电话号码、联系人、视频名称。
33.根据权利要求32所述的装置,其特征在于,所述第一提取子模块步骤包括:
时间提取子模块,用于在本地对所述文本信息,在数字统一、正则表达式匹配和日期转换中至少进行正则表达式匹配,以提取时间;
其中,数字统一为:
统一所述文本信息中的数字形式;
正则表达式匹配为:
从所述文本信息提取符合时间正则表达式中的时间;
所述时间包括日期和/或时间,所述日期包括相对日期和绝对日期;
日期转换为:
当提取的时间包括相对日期时,将所述相对日期转化为绝对日期。
34.根据权利要求32所述的装置,其特征在于,所述第一提取子模块包括:
地址提取子模块,用于从所述文本信息提取符合地址正则表达式的地址;所述地址包括地理标志;
分词子模块,用于通过常用地名词库对所述地理标志前的文本信息进行分词;在分词成功时,调用第一设置子模块,在分词失败时,调用第二设置子模块;
第一设置子模块,将邻接所述地理标志的分词设置为所述地址的前缀;
第二设置子模块,以所述地理标志与往前的第一个非汉字之间的文本信息设置为所述地址的前缀。
CN201510080218.7A 2015-02-13 2015-02-13 一种文本信息的处理方法和装置 Pending CN105992171A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510080218.7A CN105992171A (zh) 2015-02-13 2015-02-13 一种文本信息的处理方法和装置
TW104129195A TWI679862B (zh) 2015-02-13 2015-09-03 文字資訊的處理方法和裝置
US15/041,003 US20160241497A1 (en) 2015-02-13 2016-02-10 Invoking an application to perform a service based on message content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510080218.7A CN105992171A (zh) 2015-02-13 2015-02-13 一种文本信息的处理方法和装置

Publications (1)

Publication Number Publication Date
CN105992171A true CN105992171A (zh) 2016-10-05

Family

ID=56621523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510080218.7A Pending CN105992171A (zh) 2015-02-13 2015-02-13 一种文本信息的处理方法和装置

Country Status (3)

Country Link
US (1) US20160241497A1 (zh)
CN (1) CN105992171A (zh)
TW (1) TWI679862B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107040648A (zh) * 2016-11-30 2017-08-11 阿里巴巴集团控股有限公司 信息展示方法及装置
CN108121714A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 服务提供方法和装置
CN109120501A (zh) * 2017-06-26 2019-01-01 上海博泰悦臻网络技术服务有限公司 基于车载终端通讯程序的自动场景服务方法和系统
CN113497748A (zh) * 2020-04-06 2021-10-12 丰田自动车株式会社 控制装置、非暂时性计算机可读记录介质和信息处理方法
CN113873290A (zh) * 2021-09-14 2021-12-31 联想(北京)有限公司 一种视频处理方法、装置和电子设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016168379A1 (en) * 2015-04-13 2016-10-20 Uber Technologies, Inc. Fare determination system for on-demand transport arrangement service
US10009306B2 (en) 2015-05-15 2018-06-26 Uber Technologies, Inc. Methods to mitigate communication delays between systems in connection with a transport service

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297551A1 (en) * 2012-05-07 2013-11-07 Runway 20, Inc. System and method for providing intelligent location information

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809813B2 (en) * 2002-06-28 2010-10-05 Microsoft Corporation System and method for providing content-oriented services to content providers and content consumers
US8185524B2 (en) * 2006-12-22 2012-05-22 Yahoo! Inc. Method and system for locating events in-context
US8370349B2 (en) * 2007-02-28 2013-02-05 Yahoo! Inc. Instant contact searching and presentation by category
US10204317B2 (en) * 2009-03-09 2019-02-12 Sabre Glbl Inc. Post-booking travel assistance and organization
US9514466B2 (en) * 2009-11-16 2016-12-06 Yahoo! Inc. Collecting and presenting data including links from communications sent to or from a user
CN102375841A (zh) * 2010-08-18 2012-03-14 腾讯科技(深圳)有限公司 一种即时通讯工具及其实现便捷搜索的方法
US10484458B2 (en) * 2013-03-15 2019-11-19 Fujifilm North America Corporation System and method for launching an application program upon association of a mobile computing device with a local area network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297551A1 (en) * 2012-05-07 2013-11-07 Runway 20, Inc. System and method for providing intelligent location information

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121714A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 服务提供方法和装置
CN107040648A (zh) * 2016-11-30 2017-08-11 阿里巴巴集团控股有限公司 信息展示方法及装置
US10827010B2 (en) 2016-11-30 2020-11-03 Alibaba Group Holding Limited Information presentation method and apparatus
CN109120501A (zh) * 2017-06-26 2019-01-01 上海博泰悦臻网络技术服务有限公司 基于车载终端通讯程序的自动场景服务方法和系统
CN113497748A (zh) * 2020-04-06 2021-10-12 丰田自动车株式会社 控制装置、非暂时性计算机可读记录介质和信息处理方法
CN113497748B (zh) * 2020-04-06 2023-03-24 丰田自动车株式会社 控制装置、非暂时性计算机可读记录介质和信息处理方法
CN113873290A (zh) * 2021-09-14 2021-12-31 联想(北京)有限公司 一种视频处理方法、装置和电子设备

Also Published As

Publication number Publication date
TWI679862B (zh) 2019-12-11
TW201630382A (zh) 2016-08-16
US20160241497A1 (en) 2016-08-18

Similar Documents

Publication Publication Date Title
CN105992171A (zh) 一种文本信息的处理方法和装置
US11392896B2 (en) Event extraction systems and methods
US8429099B1 (en) Dynamic gazetteers for entity recognition and fact association
US7890957B2 (en) Remote management of an electronic presence
CN107040648A (zh) 信息展示方法及装置
US20080065974A1 (en) Template-based electronic presence management
CN103473238B (zh) 配送地址定位系统及方法
CN105378727A (zh) 将逆算子用于在在线社交网络上查询
CN111538774B (zh) 数据存储及展示方法、系统、设备及存储介质
US20090157439A1 (en) System and method for travel related commercial interactions
CN105162697A (zh) 一种微博系统及其数据控制方法
CN109947944A (zh) 短信显示方法、装置以及存储介质
US8484380B2 (en) Text-based system for exchanging commands between devices, services and applications
CN108810060B (zh) 业务信息的提供、接收、用户聚合方法、服务器及客户端
WO2010018473A2 (en) Method to send a short message service (sms) campaign to a related object by selecting the base object
CN106453822A (zh) 基于异步加载的地图信息展示方法
US20160260179A1 (en) Apparatus and method for providing account book service
US20140257965A1 (en) System and method for improving marketing services in a social networking environment
Liu et al. The digital divide and COVID-19: impact on the socioeconomic development in Asia and the Pacific
CN103020036A (zh) 一种地名识别的方法、装置及终端设备
CN113220395A (zh) 一种基于地图显示的博物馆互动方法及系统
JP2006065685A (ja) 地域情報提供システム、および地域情報提供プログラム
CN113722580A (zh) 地址信息处理方法、装置、电子设备和计算机可读介质
Zhan et al. Minority tourist information service and sustainable development of tourism under the background of smart city
CN106663112A (zh) 呈现与实体相关联的事件的信息卡

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1229599

Country of ref document: HK

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161005

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1229599

Country of ref document: HK