CN105095176A - 用户设备提取文本信息中的特征信息的方法和用户设备 - Google Patents

用户设备提取文本信息中的特征信息的方法和用户设备 Download PDF

Info

Publication number
CN105095176A
CN105095176A CN201410178293.2A CN201410178293A CN105095176A CN 105095176 A CN105095176 A CN 105095176A CN 201410178293 A CN201410178293 A CN 201410178293A CN 105095176 A CN105095176 A CN 105095176A
Authority
CN
China
Prior art keywords
user
subscriber equipment
text message
information
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410178293.2A
Other languages
English (en)
Inventor
张九龙
齐泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410178293.2A priority Critical patent/CN105095176A/zh
Publication of CN105095176A publication Critical patent/CN105095176A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种用户设备提取文本信息中的特征信息的方法和用户设备。该方法包括:根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源;将第一资源集从用户设备的外存储器加载至用户设备的内存中;基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息。根据本发明实施例的方法,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。

Description

用户设备提取文本信息中的特征信息的方法和用户设备
技术领域
本发明实施例涉及通信领域,并且更具体地,涉及一种用户设备提取文本信息中的特征信息的方法和用户设备。
背景技术
随着自然语言处理技术的进步和智能设备的普及,人们对智能设备的期望越来越高,希望能够对智能设备进行一些更加智能和人性化的操作。例如,在接收到的短信息中含有连续数字或网址时,智能设备可以自动地将连续数字或网址识别出来。相对应地,用户可以对识别出的信息进行特定的操作,将识别出的电话号码加入电话薄、拨打识别出的电话号码、或者用浏览器打开识别出的网页链接等。
然而,在识别短信息包含的其它有用信息时,例如,地址和应用名称等,需要将大量的资源加载到智能设备的内存中。这样,识别过程会占用大量的内存和CPU(CentralProcessingUnit,中央处理器)的计算时间,影响了智能设备的性能,进而降低了用户体验。
发明内容
本发明实施例提供了一种用户设备提取文本信息中的特征信息的方法和用户设备,能够提高用户设备的性能,进而提升用户体验。
第一方面,提供了一种用户设备提取文本信息中的特征信息的方法,包括:根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源;将第一资源集从用户设备的外存储器加载至用户设备的内存中;基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息。
结合第一方面,在第一方面的第一种实现方式中,基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息,包括:基于内存中的第一资源集,提取文本信息中的文字的属性信息作为文本信息的特征信息,文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
结合第一方面及其上述实现方式,在第一方面的第二种实现方式中,在根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集之前,该方法还包括:获取用户的联系人信息或用户当前的位置信息,作为用户信息。
结合第一方面及其上述实现方式,在第一方面的第三种实现方式中,用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
结合第一方面及其上述实现方式,在第一方面的第四种实现方式中,文本信息包括短信中的文本信息、彩信中的文本信息或安装在用户设备上的软件中存储的文本信息。
第二方面,提供了一种用户设备,包括:选择单元,用于根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源;加载单元,用于将第一资源集从用户设备的外存储器加载至用户设备的内存中;提取单元,用于基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息。
结合第二方面,在第二方面的第一种实现方式中,提取单元,具体用于基于内存中的第一资源集,提取文本信息中的文字的属性信息作为文本信息的特征信息,文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
结合第二方面及其上述实现方式,在第二方面的第二种实现方式中,用户设备还包括获取单元,获取单元,用于获取用户的联系人信息或用户当前的位置信息,作为用户信息。
结合第二方面及其上述实现方式,在第二方面的第三种实现方式中,用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
结合第二方面及其上述实现方式,在第二方面的第四种实现方式中,文本信息包括短信中的文本信息、彩信中的文本信息或安装在用户设备上的软件中存储的文本信息。
基于上述技术方案,在本发明实施例中,提取文本信息中的特征信息时,根据用户信息将选择的资源集加载至用户设备的内存中,而不是将整个资源库加载到用户设备的内存中。这样,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的用户设备提取文本信息中的特征信息的方法的示意性流程图。
图2是本发明另一实施例的用户设备提取文本信息中的特征信息的方法的示意性流程图。
图3是本发明一个实施例的用户设备的示意性框图。
图4是本发明另一实施例的用户设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
应理解,在本发明实施例中,用户设备(UserEquipment,简称为“UE”)可称之为终端(Terminal)、移动台(MobileStation,简称为“MS”)、移动终端(MobileTerminal)等,该用户设备可以经无线接入网(RadioAccessNetwork,简称为“RAN”)与一个或多个核心网进行通信,例如,用户设备可以是移动电话(或称为“蜂窝”电话)、具有移动终端的计算机等,例如,用户设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。
图1是本发明一个实施例的用户设备提取文本信息中的特征信息的方法的示意性流程图。图1的方法10可以由用户设备执行。
101,根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源。
例如,资源库可以预先存储在用户设备的外存储器中,或者用户设备可以通过网络从服务器下载并存储在外存储器中。然后,将用户信息作为选择条件,从资源库中选择第一资源集。
又如,根据提取不同特征信息的需要,用户信息包含的具体内容可以是不同的,或者用户信息可以包括提取不同特征信息所需要的所有信息。比如,在提取文本信息中的地址字段作为特征信息时,用户信息中至少要包含与用户相关的位置信息。
102,将第一资源集从用户设备的外存储器加载至用户设备的内存中。
103,基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息。
基于上述技术方案,在本发明实施例中,提取文本信息中的特征信息时,根据用户信息将选择的资源集加载至用户设备的内存中,而不是将整个资源库加载到用户设备的内存中。这样,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。
另外,在提取文本信息中的特征信息时,不依据第一资源集外的其它资源进行特征信息的提取,降低了数据间的冲突,提升了特征信息提取的准确率。
例如,假设文本信息中包含字段“来凤山”时,可以结合用户信息中的用户当前位置、用户住址和用户上下文来确定相应的特征信息。具体地,如果用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”表示的是一个地址信息,词性为名词,具体含义为云南省的“来凤山”,并据此形成对应的特征信息。
或者,如果用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”包含两部分,名词“凤山”和动词“来”。这样,可以从字段“来凤山”中提取到地址信息“凤山”作为特征信息的一部分,具体含义为广西省“凤山”。
应理解,外存储器是相对内存而言的,用户设备中除了内存以外的存储资源都可以称为外存储器。这样,按照用户信息将选择的第一资源集从外存储器加载至内存中,而不是将整个资源库加载至内存中,可以节省大量的内存占用量。由于从文本信息中提取丰富的特征信息需要占用较大的内存,这种情况下,本发明实施例为提取丰富的特征信息提供了一种可实现的方式,为进一步提升用户体验提供了可能。
可选地,作为一个实施例,在步骤103中,基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息时,可以基于内存中的第一资源集,提取文本信息中的文字的属性信息作为文本信息的特征信息,文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
例如,如前文所述的,基于第一资源集可以从字段“来凤山”中提取多种文字的属性信息作为特征信息。在匹配资源为云南省对应的资源时,可以确定字段“来凤山”为名词,表示地址,具体含义为云南省的“来凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。
或者,在匹配资源为广西省对应的资源时,可以确定字段“来凤山”由两部分组成,名词“凤山”和动词“来”,其中“凤山”表示地址,具体含义为广西省“凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。应理解,以上只是文字的属性信息的一些示例,本发明实施例的保护范围并不受限于此。
根据本发明实施例提取了文本信息的特征信息后,可以根据提取的特征信息对文本信息中相应的字段进行标注,以便于用户对其进行特定的操作。例如,将电话号码加入通讯录,用地图软件打开对应的地址,或者启动对应的应用程序等。
可选地,作为另一实施例,在步骤101之前,还可以获取用户的联系人信息或用户当前的位置信息,作为用户信息。
例如,在提取短信息中的特征信息时,如果短信息是由用户设备发送给其他用户的,可以获取短信息的收件人对应的联系人信息作为用户信息。同时,与用户设备本身相关的一些信息,如用户设备当前的位置信息,也可以作为用户信息。
在这种情况下,如前文所述的,可以将资源库中的资源与用户信息进行匹配比较,如果该用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。或者,如果该用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。具体地,相关性比较高可以为资源库中相关性最高的几个资源,或者相关性大于预设值的资源。
应理解,在根据用户信息确定第一资源集时,可以结合用户信息中的多种信息进行确定。综合根据这多种信息确定的相关性结果,最终从资源库中选择一种或多种资源作为第一资源集。因此,前文所描述的例子只是为了便于更好地理解本发明实施例,本发明实施例的保护范围并不受限于此。
又如,在根据用户信息,将匹配资源从用户设备的外存储器加载至用户设备的内存中时,可以先将内存中不需要的资源清除,保留本次可以用到的资源,同时将内存中没有的第一资源集中的资源加载到内存中。这样,可以进一步降低内存占用量,进而进一步提高了用户设备的性能。应理解,这里清除的资源是指在进行本次特征信息提取时用不到的资源,不包括常驻在内存中的资源。这些实施例都应落在本发明实施例的保护范围内。
可选地,作为另一实施例,用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
例如,用户姓名、用户性别、用户住址和用户兴趣等用户信息可以预先获取,并存储在用户设备的外存储器。对于用户当前位置和用户上下文信息等实时性较高的用户信息,用户设备可以实时获取,或者周期性获取并存储在用户设备的外存储器。
可选地,作为另一实施例,文本信息包括短信中的文本信息、彩信中的文本信息或安装在用户设备上的软件中存储的文本信息。
例如,安装在用户设备上的软件可以为微博、微信等通信软件。这种情况下,文本信息可以为长期或短期存储在通信软件中的文本信息。或者,安装在用户设备上的软件可以为记事本、文本编辑软件等软件。
下面将结合具体的例子详细描述本发明实施例。应注意,这些例子只是为了帮助本领域技术人员更好地理解本发明实施例,而非限制本发明实施例的范围。
图2是本发明另一实施例的用户设备提取文本信息中的特征信息的方法的示意性流程图。如图2所示,该实施例是以提取短信息中的特征信息为例进行描述的。
201,获取收件人的联系方式和用户当前的位置信息。
例如,在用户发送短信息时,可以获取收件人的手机号码。这样,可以基于该手机号码,查询该号码的归属地,进而确定收件人所在地。这种情况下,可以将该收件人所在地作为用户信息的一部分。另外,在可以获知收件人GPS(GlobalPositioningSystem,全球定位系统)信息的场景下,也可以将收件人的GPS信息作为用户信息的一部分。
同时,可以通过定位技术获取用户当前的位置信息,并将用户当前的位置信息作为用户信息的一部分。
相似地,作为另一实施例,在对接收到的短信息进行特征信息的提取时时,可以获取发件人的手机号码。然后,基于该手机号码,确定发件人所在地。或者,获知发件人的GPS信息,并据此确定发件人当前的位置。这种情况下,将发件人所在地或者发件人当前的位置信息作为用户信息的一部分。同时,用户当前的位置信息作为用户信息的另一部分。
202,根据收件人的联系方式和用户当前的位置信息选择资源集。
例如,根据步骤201中获取的收件人的位置信息和用户当前的位置信息,从资源库中选择与该位置匹配的资源。
203,清除内存中不需要的资源。
例如,在步骤201确定了匹配资源后,清除内存中该匹配资源以外的其它资源,这样可以降低内存占用率。应理解,这里清除的资源是指在进行本次特征信息提取时用不到的资源,不包括常驻在内存中的资源。这样,可以进一步降低内存占用量,进而进一步提高了用户设备的性能。
204,加载资源集至内存。
例如,根据步骤201中确定的资源集,将不在内存中的匹配资源从外存储器加载至内存中。
205,提取短信息的特征信息。
例如,提取短信中与资源集相关的地址信息作为短信息的特征信息。
206,根据特征信息对短信息进行标注。
例如,基于步骤205中提取的特征信息,对短信息进行标注。
207,显示标注后的短信息。
例如,标注可以高亮地显示在短信息中,用户可以对短信息中的标注进行特定的操作,将电话号码加入通讯录,用地图软件打开对应的地址,或者启动对应的应用程序等。
基于上述技术方案,在本发明实施例中,提取文本信息中的特征信息时,根据用户信息将选择的资源集加载至用户设备的内存中,而不是将整个资源库加载到用户设备的内存中。这样,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。
另外,在提取文本信息中的特征信息时,不依据匹配资源外的其它资源进行特征信息的提取,降低了数据间的冲突,提升了特征信息提取的准确率。
图3是本发明一个实施例的用户设备的示意性框图。图3所示的用户设备30包括选择单元301、加载单元302和提取单元303。
选择单元301,用于根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源。
例如,资源库可以预先存储在用户设备的外存储器中,或者用户设备可以通过网络从服务器下载并存储在外存储器中。然后,将该用户信息作为选择条件,从资源库中选择第一资源集。
又如,根据提取不同特征信息的需要,用户信息包含的具体内容可以是不同的,或者用户信息可以包括提取不同特征信息所需要的所有信息。比如,在提取文本信息中的地址字段作为特征信息时,用户信息中至少要包含与用户相关的位置信息。
加载单元302,用于将第一资源集从用户设备的外存储器加载至用户设备的内存中。
提取单元303,用于基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息。
基于上述技术方案,在本发明实施例中,提取文本信息中的特征信息时,根据用户信息将选择的资源集加载至用户设备的内存中,而不是将整个资源库加载到用户设备的内存中。这样,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。
另外,在提取文本信息中的特征信息时,不依据第一资源集外的其它资源进行特征信息的提取,降低了数据间的冲突,提升了特征信息提取的准确率。
例如,假设文本信息中包含字段“来凤山”时,可以结合用户信息中的用户当前位置、用户住址和用户上下文来确定相应的特征信息。具体地,如果用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”表示的是一个地址信息,词性为名词,具体含义为云南省的“来凤山”,并据此形成对应的特征信息。
或者,如果用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”包含两部分,名词“凤山”和动词“来”。这样,可以从字段“来凤山”中提取到地址信息“凤山”作为特征信息的一部分,具体含义为广西省“凤山”。
应理解,外存储器是相对内存而言的,用户设备中除了内存以外的存储资源都可以称为外存储器。这样,按照用户信息将选择的第一资源集从外存储器加载至内存中,而不是将整个资源库加载至内存中,可以节省大量的内存占用量。由于从文本信息中提取丰富的特征信息需要占用较大的内存,这种情况下,本发明实施例为提取丰富的特征信息提供了一种可实现的方式,为进一步提升用户体验提供了可能。
可选地,作为一个实施例,提取单元303,具体用于基于内存中的第一资源集,提取文本信息中的文字的属性信息作为文本信息的特征信息,文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
例如,如前文所述的,基于第一资源集可以从字段“来凤山”中提取多种文字的属性信息作为特征信息。在匹配资源为云南省对应的资源时,可以确定字段“来凤山”为名词,表示地址,具体含义为云南省的“来凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。
或者,在匹配资源为广西省对应的资源时,可以确定字段“来凤山”由两部分组成,名词“凤山”和动词“来”,其中“凤山”表示地址,具体含义为广西省“凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。应理解,以上只是文字的属性信息的一些示例,本发明实施例的保护范围并不受限于此。
根据本发明实施例提取了文本信息的特征信息后,可以根据提取的特征信息对文本信息中相应的字段进行标注,以便于用户对其进行特定的操作。例如,将电话号码加入通讯录,用地图软件打开对应的地址,或者启动对应的应用程序等。
可选地,作为另一实施例,用户设备30还包括获取单元304,获取单元304,用于获取用户的联系人信息或用户当前的位置信息,作为用户信息。
例如,在提取短信息中的特征信息时,如果短信息是由用户设备发送给其他用户的,可以获取短信息的收件人对应的联系人信息作为用户信息。同时,与用户设备本身相关的一些信息,如用户设备当前的位置信息,也可以作为用户信息。
在这种情况下,如前文所述的,可以将资源库中的资源与用户信息进行匹配比较,如果该用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。或者,如果该用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。具体地,相关性比较高可以为资源库中相关性最高的几个资源,或者相关性大于预设值的资源。
应理解,在根据用户信息确定第一资源集时,可以结合用户信息中的多种信息进行确定。综合根据这多种信息确定的相关性结果,最终从资源库中选择一种或多种资源作为第一资源集。因此,前文所描述的例子只是为了便于更好地理解本发明实施例,本发明实施例的保护范围并不受限于此。
又如,在根据用户信息,将匹配资源从用户设备的外存储器加载至用户设备的内存中时,可以先将内存中不需要的资源清除,保留本次可以用到的资源,同时将内存中没有的第一资源集中的资源加载到内存中。这样,可以进一步降低内存占用量,进而进一步提高了用户设备的性能。应理解,这里清除的资源是指在进行本次特征信息提取时用不到的资源,不包括常驻在内存中的资源。这些实施例都应落在本发明实施例的保护范围内。
可选地,作为另一实施例,用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
例如,用户姓名、用户性别、用户住址和用户兴趣等用户信息可以预先获取,并存储在用户设备的外存储器。对于用户当前位置和用户上下文信息等实时性较高的用户信息,用户设备可以实时获取,或者周期性获取并存储在用户设备的外存储器。
可选地,作为另一实施例,文本信息包括短信中的文本信息、彩信中的文本信息或安装在用户设备上的软件中存储的文本信息。
例如,安装在用户设备上的软件可以为微博、微信等通信软件。这种情况下,文本信息可以为长期或短期存储在通信软件中的文本信息。或者,安装在用户设备上的软件可以为记事本、文本编辑软件等软件。
图4是本发明另一实施例的用户设备的示意性框图。
图4的用户设备40可用于实现上述方法实施例中各步骤及方法。图4的实施例中,用户设备40包括天线410、发射电路420、接收电路430、处理器440和存储器450。处理器440控制用户设备40的操作,并可用于处理信号。存储器450可以包括只读存储器和随机存取存储器,并向处理器440提供指令和数据。发射电路420和接收电路430可以耦合到天线410。用户设备40的各个组件通过总线系统460耦合在一起,其中总线系统460除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都标为总线系统460。
具体地,存储器450可存储执行以下过程的指令:
根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集,资源库中包括至少一个用于从文本信息中提取特征信息的资源;将第一资源集从用户设备的外存储器加载至用户设备的内存中;基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息
基于上述技术方案,在本发明实施例中,提取文本信息中的特征信息时,根据用户信息将选择的资源集加载至用户设备的内存中,而不是将整个资源库加载到用户设备的内存中。这样,可以降低内存占用量,减短CPU的计算时间,进而提高了用户设备的性能,提升了用户体验。
另外,在提取文本信息中的特征信息时,不依据第一资源集以外的其它资源进行特征信息的提取,降低了数据间的冲突,提升了特征信息提取的准确率。
例如,假设文本信息中包含字段“来凤山”时,可以结合用户信息中的用户当前位置、用户住址和用户上下文来确定相应的特征信息。具体地,如果用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”表示的是一个地址信息,词性为名词,具体含义为云南省的“来凤山”,并据此形成对应的特征信息。
或者,如果用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的匹配资源加载至用户设备的内存。经过计算处理后,进一步地可以确定该字段“来凤山”包含两部分,名词“凤山”和动词“来”。这样,可以从字段“来凤山”中提取到地址信息“凤山”作为特征信息的一部分,具体含义为广西省“凤山”。
应理解,外存储器是相对内存而言的,用户设备中除了内存以外的存储资源都可以称为外存储器。这样,按照用户信息将选择的第一资源集从外存储器加载至内存中,而不是将整个资源库加载至内存中,可以节省大量的内存占用量。由于从文本信息中提取丰富的特征信息需要占用较大的内存,这种情况下,本发明实施例为提取丰富的特征信息提供了一种可实现的方式,为进一步提升用户体验提供了可能。
可选地,作为一个实施例,存储器450还可存储执行以下过程的指令:
在基于内存中的第一资源集,提取存储在用户设备中的文本信息中的特征信息时,基于内存中的第一资源集,提取文本信息中的文字的属性信息作为文本信息的特征信息,文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
例如,如前文所述的,基于第一资源集可以从字段“来凤山”中提取多种文字的属性信息作为特征信息。在匹配资源为云南省对应的资源时,可以确定字段“来凤山”为名词,表示地址,具体含义为云南省的“来凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。
或者,在匹配资源为广西省对应的资源时,可以确定字段“来凤山”由两部分组成,名词“凤山”和动词“来”,其中“凤山”表示地址,具体含义为广西省“凤山”,这些信息都可以称作文字的属性信息,并据此形成对应的特征信息。应理解,以上只是文字的属性信息的一些示例,本发明实施例的保护范围并不受限于此。
根据本发明实施例提取了文本信息的特征信息后,可以根据提取的特征信息对文本信息中相应的字段进行标注,以便于用户对其进行特定的操作。例如,将电话号码加入通讯录,用地图软件打开对应的地址,或者启动对应的应用程序等。
可选地,作为一个实施例,存储器450还可存储执行以下过程的指令:
在根据获取的用户信息从存储在用户设备的外存储器的资源库中选择第一资源集之前,获取用户的联系人信息或用户当前的位置信息,作为用户信息。
例如,在提取短信息中的特征信息时,如果短信息是由用户设备发送给其他用户的,可以获取短信息的收件人对应的联系人信息作为用户信息。同时,与用户设备本身相关的一些信息,如用户设备当前的位置信息,也可以作为用户信息。
在这种情况下,如前文所述的,可以将资源库中的资源与用户信息进行匹配比较,如果该用户信息显示该用户与云南省相关性比较高时,可以将与云南省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。或者,如果该用户信息显示该用户与广西省相关性比较高时,可以将与广西省相关的资源确定为第一资源集,然后将第一资源集从外存储器加载至内存中,以便于用户设备对文本信息进行特征信息的提取。具体地,相关性比较高可以为资源库中相关性最高的几个资源,或者相关性大于预设值的资源。
应理解,在根据用户信息确定第一资源集时,可以结合用户信息中的多种信息进行确定。综合根据这多种信息确定的相关性结果,最终从资源库中选择一种或多种资源作为第一资源集。因此,前文所描述的例子只是为了便于更好地理解本发明实施例,本发明实施例的保护范围并不受限于此。
又如,在根据用户信息,将匹配资源从用户设备的外存储器加载至用户设备的内存中时,可以先将内存中不需要的资源清除,保留本次可以用到的资源,同时将内存中没有的第一资源集中的资源加载到内存中。这样,可以进一步降低内存占用量,进而进一步提高了用户设备的性能。应理解,这里清除的资源是指在进行本次特征信息提取时用不到的资源,不包括常驻在内存中的资源。这些实施例都应落在本发明实施例的保护范围内。
可选地,作为一个实施例,存储器450还可存储执行以下过程的指令:
用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
例如,用户姓名、用户性别、用户住址和用户兴趣等用户信息可以预先获取,并存储在用户设备的外存储器。对于用户当前位置和用户上下文信息等实时性较高的用户信息,用户设备可以实时获取,或者周期性获取并存储在用户设备的外存储器。
可选地,作为一个实施例,存储器450还可存储执行以下过程的指令:
文本信息包括短信中的文本信息、彩信中的文本信息或安装在用户设备上的软件中存储的文本信息。
例如,安装在用户设备上的软件可以为微博、微信等通信软件。这种情况下,文本信息可以为长期或短期存储在通信软件中的文本信息。或者,安装在用户设备上的软件可以为记事本、文本编辑软件等软件。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用户设备提取文本信息中的特征信息的方法,其特征在于,包括:
根据获取的用户信息从存储在所述用户设备的外存储器的资源库中选择第一资源集,所述资源库中包括至少一个用于从文本信息中提取特征信息的资源;
将所述第一资源集从所述用户设备的外存储器加载至所述用户设备的内存中;
基于所述内存中的所述第一资源集,提取存储在所述用户设备中的文本信息中的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述内存中的所述第一资源集,提取存储在所述用户设备中的文本信息中的特征信息,包括:
基于所述内存中的所述第一资源集,提取所述文本信息中的文字的属性信息作为所述文本信息的特征信息,所述文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
3.根据权利要求1或2所述的方法,其特征在于,在所述根据获取的用户信息从存储在所述用户设备的外存储器的资源库中选择第一资源集之前,还包括:
获取用户的联系人信息或用户当前的位置信息,作为所述用户信息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述文本信息包括短信中的文本信息、彩信中的文本信息或安装在所述用户设备上的软件中存储的文本信息。
6.一种用户设备,其特征在于,包括:
选择单元,用于根据获取的用户信息从存储在所述用户设备的外存储器的资源库中选择第一资源集,所述资源库中包括至少一个用于从文本信息中提取特征信息的资源;
加载单元,用于将所述第一资源集从所述用户设备的外存储器加载至所述用户设备的内存中;
提取单元,用于基于所述内存中的所述第一资源集,提取存储在所述用户设备中的文本信息中的特征信息。
7.根据权利要求6所述的用户设备,其特征在于,所述提取单元,具体用于基于所述内存中的所述第一资源集,提取所述文本信息中的文字的属性信息作为所述文本信息的特征信息,所述文字的属性信息包括文字的句子结构、文字的词性和文字的词义中的一种或多种。
8.根据权利要求6或7所述的用户设备,其特征在于,所述用户设备还包括获取单元,所述获取单元,用于获取用户的联系人信息或用户当前的位置信息,作为所述用户信息。
9.根据权利要求6至8中任一项所述的用户设备,其特征在于,所述用户信息包括用户姓名、用户性别、用户年龄、用户手机号码、用户住址、用户当前位置、用户上下文信息和用户兴趣信息中的一种或多种。
10.根据权利要求6至9中任一项所述的用户设备,其特征在于,所述文本信息包括短信中的文本信息、彩信中的文本信息或安装在所述用户设备上的软件中存储的文本信息。
CN201410178293.2A 2014-04-29 2014-04-29 用户设备提取文本信息中的特征信息的方法和用户设备 Pending CN105095176A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410178293.2A CN105095176A (zh) 2014-04-29 2014-04-29 用户设备提取文本信息中的特征信息的方法和用户设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410178293.2A CN105095176A (zh) 2014-04-29 2014-04-29 用户设备提取文本信息中的特征信息的方法和用户设备

Publications (1)

Publication Number Publication Date
CN105095176A true CN105095176A (zh) 2015-11-25

Family

ID=54575650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410178293.2A Pending CN105095176A (zh) 2014-04-29 2014-04-29 用户设备提取文本信息中的特征信息的方法和用户设备

Country Status (1)

Country Link
CN (1) CN105095176A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN112669840A (zh) * 2020-12-17 2021-04-16 北京梧桐车联科技有限责任公司 一种语音处理方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388907A (zh) * 2008-10-28 2009-03-18 中国电信股份有限公司 一种互联网用户属性信息的传递方法和网络设备
CN102571957A (zh) * 2012-01-09 2012-07-11 惠州Tcl移动通信有限公司 移动通信终端及其联系人网页地址保存方法
CN102591475A (zh) * 2011-12-29 2012-07-18 北京百度网讯科技有限公司 一种在线编辑器的内容输入方法及系统
US20120296910A1 (en) * 2011-05-16 2012-11-22 Michal Skubacz Method and system for retrieving information
CN102866911A (zh) * 2012-09-12 2013-01-09 北京航空航天大学 Mashup应用建立方法及装置
CN103218458A (zh) * 2013-05-13 2013-07-24 百度在线网络技术(北京)有限公司 推荐方法及推荐服务器
CN103514204A (zh) * 2012-06-27 2014-01-15 华为技术有限公司 信息推荐方法和装置
CN103530083A (zh) * 2013-10-31 2014-01-22 广东粤铁瀚阳科技有限公司 一种基于云计算的海量信息超级显示平台

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388907A (zh) * 2008-10-28 2009-03-18 中国电信股份有限公司 一种互联网用户属性信息的传递方法和网络设备
US20120296910A1 (en) * 2011-05-16 2012-11-22 Michal Skubacz Method and system for retrieving information
CN102591475A (zh) * 2011-12-29 2012-07-18 北京百度网讯科技有限公司 一种在线编辑器的内容输入方法及系统
CN102571957A (zh) * 2012-01-09 2012-07-11 惠州Tcl移动通信有限公司 移动通信终端及其联系人网页地址保存方法
CN103514204A (zh) * 2012-06-27 2014-01-15 华为技术有限公司 信息推荐方法和装置
CN102866911A (zh) * 2012-09-12 2013-01-09 北京航空航天大学 Mashup应用建立方法及装置
CN103218458A (zh) * 2013-05-13 2013-07-24 百度在线网络技术(北京)有限公司 推荐方法及推荐服务器
CN103530083A (zh) * 2013-10-31 2014-01-22 广东粤铁瀚阳科技有限公司 一种基于云计算的海量信息超级显示平台

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN105895103B (zh) * 2015-12-03 2020-01-17 乐融致新电子科技(天津)有限公司 一种语音识别方法及装置
CN112669840A (zh) * 2020-12-17 2021-04-16 北京梧桐车联科技有限责任公司 一种语音处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN104679855A (zh) 一种播放列表创建方法及终端设备
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
CN104471917A (zh) 共享应用信息方法和装置
CN107766474A (zh) 动态展示关系拓展图方法及应用服务器
CN103037091A (zh) 短消息处理方法、装置及终端设备
CN104349320A (zh) 一种共享的方法和电子设备
CN105808583A (zh) 文件类型识别方法及装置
CN104394259A (zh) 来电显示的方法、装置及移动终端
CN104283765A (zh) 一种消息显示方法、装置及终端设备
CN105338659A (zh) 一种设备连接方法及终端
CN103593233A (zh) 推送软件信息的方法和系统
CN105550179A (zh) 一种网页收藏方法和浏览器插件
CN104503956A (zh) 粘贴数据的方法、装置及移动终端
CN105095176A (zh) 用户设备提取文本信息中的特征信息的方法和用户设备
CN105335408A (zh) 一种搜索词白名单的扩展方法及相关系统
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质
CN103067861A (zh) 无线接入设备的地理位置信息获取方法及设备
CN108122123B (zh) 一种扩展潜在用户的方法及装置
CN113383314B (zh) 用户相似度计算方法、装置、服务端及存储介质
CN106686588B (zh) 一种无线保真Wi-Fi连接方法及移动终端
CN105739694A (zh) 一种穿戴式设备交互的方法、终端及穿戴式设备
CN106793016B (zh) 一种无线保真Wi-Fi连接方法及移动终端
CN104536570A (zh) 智能手表的信息处理方法及装置
CN103870460A (zh) 一种靓号检索方法及系统
CN109800229B (zh) 数据访问方法及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151125