CN105117380A - 粘贴处理方法及装置 - Google Patents

粘贴处理方法及装置 Download PDF

Info

Publication number
CN105117380A
CN105117380A CN201510618604.7A CN201510618604A CN105117380A CN 105117380 A CN105117380 A CN 105117380A CN 201510618604 A CN201510618604 A CN 201510618604A CN 105117380 A CN105117380 A CN 105117380A
Authority
CN
China
Prior art keywords
text
type identification
content
application
gluing treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510618604.7A
Other languages
English (en)
Other versions
CN105117380B (zh
Inventor
陈晓昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510618604.7A priority Critical patent/CN105117380B/zh
Publication of CN105117380A publication Critical patent/CN105117380A/zh
Application granted granted Critical
Publication of CN105117380B publication Critical patent/CN105117380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提出一种粘贴处理方法和装置,其中,该方法包括:获取待处理的文本内容;识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。通过本申请提供的粘贴处理方法和装置,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。

Description

粘贴处理方法及装置
技术领域
本申请涉及信息处理技术领域,尤其涉及一种粘贴处理方法及装置。
背景技术
随着移动终端的迅速发展,用户可以随时随地接触各种各样丰富的信息。用户经常根据应用需要选择相关文本进行复制粘贴处理,以避免重新输入,提高处理效率。
实际应用中,用户根据不同的应用场景往往只需要从整段文本中选择部分文本进行复制粘贴处理,比如:接收到朋友发送的包含购物网址的一段购物信息,用户想复制该网址浏览相关网页。
然而,由于便携式终端设备的屏幕较小,且通常是触摸屏操作,因此,用户需要在较小的屏幕上不断地移动光标精准的选择需要的文本片段,或者,以全选模式复制整段文本,粘贴后再选择的删除多余的文本,由此可见,目前的文本粘贴处理大大降低了处理效率。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种粘贴处理方法,该方法实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
本申请的第二个目的在于提出一种粘贴处理装置。
为达上述目的,本申请第一方面实施例提出了一种粘贴处理方法,包括:获取待处理的文本内容;识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
本申请实施例的粘贴处理方法,首先获取待处理的文本内容,然后识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
为达上述目的,本申请第二方面实施例提出了一种粘贴处理装置,包括:第一获取模块,用于获取待处理的文本内容;处理模块,用于识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
本申请实施例的粘贴处理装置,通过第一获取模块获取待处理的文本内容;通过处理模块识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例的粘贴处理方法的流程图;
图2是本申请另一个实施例的粘贴处理方法的流程图;
图3是本申请另一个实施例的粘贴处理方法的流程图;
图4是本申请另一个实施例的粘贴处理方法的流程图;
图5是本申请一个实施例的粘贴处理装置的结构示意图;
图6是本申请另一个实施例的粘贴处理装置的结构示意图;
图7是本申请另一个实施例的粘贴处理装置的结构示意图;
图8是本申请另一个实施例的粘贴处理装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的粘贴处理方法及装置。
图1是本申请一个实施例的粘贴处理方法的流程图。
如图1所示,该粘贴处理方法包括:
步骤101,获取待处理的文本内容。
具体地,首先获取待处理的文本内容,其中,待处理的文本内容的获取方式很多,举例说明如下:
方式一,当用户需要复制的信息为纯文本时,通过用户对所选择内容的复制或者剪切操作,获取待处理的文本内容。其中,所选择内容可以是用户根据终端设备的屏幕大小和操作便捷度,从所有文本内容中选择部分内容,部分内容可能是其中一篇文章中的一段话,或者最后几行等;或者,为了操作更加方便快捷,所选择的文本内容可以是用户通过全选模式复制的所有文本内容。
方式二,当用户需要复制的信息为语音信息或者图片信息时,通过用户对所选择内容的复制或者剪切操作,获取待处理的复制/剪切的语音信息或者图片信息,然后对该语音信息或者图片信息进行转换操作,生成与语音信息或者图片信息匹配的文本内容,从而获取待处理的文本内容。
步骤102,识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
具体地,对待处理的文本内容进行解析,识别该文本内容中文本片段与类型标识的对应关系,其中,类型标识用于表示文本片段的词类含义,需要说明的是,对于多义词的文本片段在不同的文本内容中所表示的含义不相同,此时,类型标识用于表示该文本片段与文本内容匹配的词类含义。举例说明如下:
在文本内容A中,其中的文本片段“捉妖记”对应的类型标识为电影名称;在文本内容B中,其中的文本片段“颐和园”对应的类型标识为景点名称;其中的文本片段“www.google.com”对应的类型标识为网址;在文本内容C中,其中的文本片段“捉妖记”对应的类型标识为电影名称;其中的文本片段“13800138000”对应的类型标识为电话号码。
解析文本内容识别出文本片段与类型标识对应关系的方式有很多,比如正则表达式过滤方式,或者专名识别的方式;可以根据不同的应用场景进行选择,本实施例对此不做限制。举例如下:
若待处理的文本内容以规则表达的内容为主,比如包括很多的网址、电话等,可以采用正则表达式的方式识别文本片段与类型标识对应关系;若待处理的文本内容以文字表达的内容为主,比如包括很多多义词等,可以采用专名识别的方式识别文本片段与类型标识对应关系;若待处理的文本内容中上述两种内容都有,可以采用正则表达式和专名识别的组合方式识别文本片段与类型标识对应关系。
识别出待处理的文本内容中文本片段与类型标识的对应关系之后,可以根据具体的粘贴应用场景,确定与该粘贴应用场景对应的类型标识,从而根据该对应关系获取与该类型标识对应的文本片段,从而进行粘贴处理。举例说明如下:
当用户在豆瓣应用下进行粘贴操作时,获取与豆瓣应用对应的类型标识为电影名称,从而根据该对应关系获取与电影名称对应的文本片段,从而进行粘贴处理;当用户在淘宝应用下进行粘贴操作时,获取与淘宝应用对应的类型标识为商品名称,从而根据该对应关系获取与商品名称对应的文本片段,从而进行粘贴处理;当用户在电话簿应用下进行粘贴操作时,获取与电话簿应用对应的类型标识为电话号码,从而根据该对应关系获取与电话号码对应的文本片段,从而进行粘贴处理;当用户在浏览器应用下进行粘贴操作时,获取与浏览器对应的类型标识为网址,从而根据该对应关系获取与网址对应的文本片段,从而进行粘贴处理。
本申请实施例的粘贴处理方法,首先获取待处理的文本内容,然后识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
针对步骤102,解析文本内容识别出文本片段与类型标识对应关系的方式有很多,比如正则表达式过滤方式,或者专名识别的方式;可以根据不同的应用场景进行选择,本实施例对此不做限制。为了更加清楚的说明识别过程,通过图2和图3所示实施例具体说明如下:
图2是本申请另一个实施例的粘贴处理方法的流程图。
如图2所示,本实施例采用正则表达式识别方式,针对步骤102,具体可以包括以下步骤:
步骤201,应用预设的词表关键词检索所述文本内容;
步骤202,采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。
具体地,正则表达式的方式适用于识别形式规则的字符串,比如电话号码、网址等文本内容。由于电话号码、网址等字符串的起始位都有特殊标识,所以可以将这些标识作为关键词预先建立词表,从而采用预先设置词表关键词检索待处理的文本内容,从文本内容中选择出与该关键词匹配的文本片段。
然后,采用正则表达式过滤与关键词匹配的文本片段,其中,正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。如果预设的正则表达式包括:与“网址”类型标识对应的第一正则表达式,与“电话号码”类型标识对应的第二正则表达式,通过过滤文本片段,如果过滤结果与第一正则表达式匹配,则与该文本片段对应的类型标识为“网址”;如果过滤结果与第二正则表达式匹配,则与该文本片段对应的类型标识为“电话号码”。以此类推,从而生成与文本片段对应的类型标识。
本申请实施例的粘贴处理方法,通过应用预设的词表关键词检索所述文本内容;采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
图3是本申请另一个实施例的粘贴处理方法的流程图。
如图3所示,本实施例采用专名识别方式,针对步骤102,具体可以包括以下步骤:
步骤301,采用预先经过训练的切词模型对所述文本内容进行切词;
具体地,专名识别方式适用于识别不同文章中具有不同含义的多义词,比如“小米”,“小米”在不同的语境下具有不同的类型标识,在科技类文章中的类型标识为“手机”,而在农业类文章中的类型标识为“粮食”,这种就需要采用专名识别方式识别文本片段与类型标识的对应关系。基于专名识别方式,能够动态地根据上下文内容识别出专名的具体含义,获取与应用场景匹配的类型标识。
首先,采用预先经过训练的切词模型对所述文本内容进行切词,其中,切词模型是经过预先训练形成的,具有对文本内容进行有语义的切割处理,生成最小单位的词条,每个词条作为文本片段。
步骤302,根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识。
具体地,采用预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识。其中,专名词典预先根据标注语料训练生成,专名词典的结构如下:
词条一属性1属性1的权重属性2属性2的权重属性3属性3的权重;词条二属性1属性1的权重;词条三属性1属性1的权重属性2属性2的权重,等等;每个专名词条都有若干个属性,每个属性有一个相应的权重(例如范围0-100);每个属性根据其属性级别有一个相应的专业深度值(例如0-1)。
其中,需要解释的是,专名词典的中的属性相当于本实施例中的类型标识;由于有的词条对应唯一的类型标识,有的词条对应多个的类型标识,因此,对于多个类型标识的词条的处理方式可以包括如下步骤:
步骤1:获取与切词结果中每个词条对应的属性信息,所述属性信息包括:至少一个类型标识,与每个类型标识对应的权重;
步骤2:根据与每个类型标识对应的所有权重,以及预设的与所述类型标识对应的专业深度因子生成属性评测表,所述属性评测表包括:与每个类型标识对应的评估数据;
步骤3:根据所述属性评测表确定与多类型标识的词条匹配的类型标识。
为了更加清楚的描述步骤1至步骤3,举例说明如下:
假设待处理的文本内容为“4月1日10点魅族M8换购官网新浪同时启动,新浪微博平台独家2099台MX364G也支持小米、三星指定型号折价500元换购MX364G;预约用户支付一分钱,更可获10元魅族Flyme消费券。”
1、切词结果为:4(0)月(1)1(2)日(3)10(4)点(5)魅族(6)M8(7)换(8)购(9)官网(10)新浪(11)同时(12)启动(13),(14)新浪(15)微博(16)平台(18)独家(19)2099(20)台(21)(22)MX3(23)(25)64G(26)(28)也(29)支持(30)小米(31)、(32)三星(33)指定(34)型号(35)折价(36)500(37)元(38)换(39)购(40)(41)MX3(42)(44)64G(45);(47)预约(48)用户(49)支付(50)一分钱(51),(53)更(54)可(55)获(56)10(57)元(58)魅族(59)(60)Flyme(61)(62)消费(63)券(64)。(65)
2、采用预先建立的专名词典遍历切词结果中的每个词条,获取与切词结果中每个词条对应的属性信息,所述属性信息包括:至少一个类型标识,与每个类型标识对应的权重;
魅族手机100;新浪IT100;微博IT100;
小米手机80农作物20;三星手机60相机20电脑。
3、累加所有词条的各个属性权重得到每个属性的权重和,乘以每个属性的专业深度值,得到每个属性的总得分,根据总得分高低唯一确定每个词条的属性。统计结果如属性评测表,即表1:
表1
属性 权重和 专业深度 总分
手机 100+80+60=240 0.9 240*0.9=216
IT 100+100=200 0.5 200*0.5=100
农作物 20 0.8 20*0.8=16
相机 20 0.7 20*0.7=14
电脑 20 0.7 20*0.7=14
4、根据所述属性评测表确定与多类型标识的词条匹配的类型标识
魅族手机;新浪IT;微博IT;小米手机;三星手机。
本申请实施例的粘贴处理方法,首先采用预先经过训练的切词模型对所述文本内容进行切词;然后根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识,最后根据所述类型标识生成与每个词条对应的类型标识。由此,实现了能够动态地根据上下文内容识别出专名的具体含义,使粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
图4是本申请另一个实施例的粘贴处理方法的流程图。
如图4所示,针对步骤102之后,还可以包括以下步骤:
步骤401,根据粘贴指令,获取与所述粘贴指令对应的应用标识。
接收粘贴指令,然后获取与该粘贴指令对应的应用标识,以识别当前的应用场景,应用标识的内容包括:电影,浏览器、电商等,具体的获取方式很多,根据应用需要进行选择,例如:
从后台获取与当前的应用程序对应的应用标识;或者,检索当前应用界面的关键词,获取与所述关键词对应的应用标识。
步骤402,查询预设的粘贴指令集,获取与所述应用标识对应的类型标识。
步骤403,根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。
具体地,查询预设的、包含类型标识与应用标识对应关系的粘贴指令集,例如粘贴指令集包括:应用标识“电影”与类型标识“电影名称”的对应关系等:从而获取与当前应用标识对应的类型标识,从而根据预先识别出的类型标识与文本片段的对应关系选择与该类型标识对应的文本片段进行粘贴处理。举例说明如下:
当用户在豆瓣应用下进行粘贴操作时,获取与豆瓣应用对应的类型标识为电影名称,从而根据该对应关系获取与电影名称对应的文本片段,从而进行粘贴处理;当用户在淘宝应用下进行粘贴操作时,获取与淘宝应用对应的类型标识为商品名称,从而根据该对应关系获取与商品名称对应的文本片段,从而进行粘贴处理;当用户在电话簿应用下进行粘贴操作时,获取与电话簿应用对应的类型标识为电话号码,从而根据该对应关系获取与电话号码对应的文本片段,从而进行粘贴处理;当用户在浏览器应用下进行粘贴操作时,获取与浏览器对应的类型标识为网址,从而根据该对应关系获取与网址对应的文本片段,从而进行粘贴处理。
粘贴处理包括直接粘贴,以及给用户提供候选的方式,又例如:待处理文本为:“你先上www.google.com或者www.baidu.com上搜一下,不行再打我电话:138000000”在浏览器地址栏选择粘贴操作的话会出现“www.google.com”和“www.baidu.com”的候选粘贴选项;在拨号键盘选择粘贴操作的话会自动粘贴“138000000”。
本申请实施例的粘贴处理方法,首先根据粘贴指令获取与所述粘贴指令对应的应用标识,然后查询预设的粘贴指令集,获取与所述应用标识对应的类型标识,最后根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
为了实现上述实施例,本申请还提出一种粘贴处理装置。
图5是本申请一个实施例的粘贴处理装置的结构示意图。
如图5所示,该粘贴处理装置包括:
第一获取模块11,用于获取待处理的文本内容;
处理模块12,用于识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
其中,第一获取模块12具体用于:
接收复制/剪切的文本内容;或者,
接收复制/剪切的语音信息或者图片信息,将所述语音信息或者图片信息转换成文本内容。
需要说明的是,前述对粘贴处理方法实施例的解释说明也适用于该实施例的粘贴处理装置,此处不再赘述。
本申请实施例的粘贴处理装置,首先获取待处理的文本内容,然后识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
图6是本申请另一个实施例的粘贴处理装置的结构示意图,如图6所示,基于图5所示实施例,所述处理模块12,包括:
检索单元121,用于应用预设的词表关键词检索所述文本内容;
过滤单元122,用于采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。
需要说明的是,前述对粘贴处理方法实施例的解释说明也适用于该实施例的粘贴处理装置,此处不再赘述。
本申请实施例的粘贴处理装置,通过应用预设的词表关键词检索所述文本内容;采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
图7是本申请另一个实施例的粘贴处理装置的结构示意图,如图7所示,基于图5所示实施例,所述处理模块12,包括:
切词单元123,用于采用预先经过训练的切词模型对所述文本内容进行切词;
确定单元124,用于根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识。
所述确定单元124,具体用于:
获取与切词结果中每个词条对应的属性信息,所述属性信息包括:至少一个类型标识,与每个类型标识对应的权重;
根据与每个类型标识对应的所有权重,以及预设的与所述类型标识对应的专业深度因子生成属性评测表,所述属性评测表包括:与每个类型标识对应的评估数据;
根据所述属性评测表确定与多类型标识的词条匹配的类型标识。
需要说明的是,前述对粘贴处理方法实施例的解释说明也适用于该实施例的粘贴处理装置,此处不再赘述。
本申请实施例的粘贴处理装置,首先采用预先经过训练的切词模型对所述文本内容进行切词;然后根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识,最后根据所述类型标识生成与每个词条对应的类型标识。由此,实现了能够动态地根据上下文内容识别出专名的具体含义,使粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
图8是本申请另一个实施例的粘贴处理装置的结构示意图,基于上述实施例,以图5为例,如图8所示,还包括:
第二获取模块13,用于根据粘贴指令,获取与所述粘贴指令对应的应用标识;
其中,第二获取模块13,具体用于:
从后台获取与当前的应用程序对应的应用标识;或者,
检索当前应用界面的关键词,获取与所述关键词对应的应用标识。
查询模块14,用于查询预设的粘贴指令集,获取与所述应用标识对应的类型标识;
选择模块15,用于根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。
需要说明的是,前述对粘贴处理方法实施例的解释说明也适用于该实施例的粘贴处理装置,此处不再赘述。
本申请实施例的粘贴处理装置,首先根据粘贴指令获取与所述粘贴指令对应的应用标识,然后查询预设的粘贴指令集,获取与所述应用标识对应的类型标识,最后根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。由此,实现了粘贴处理与应用场景的自动匹配,提高了处理效率和灵活性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个第一处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种粘贴处理方法,其特征在于,包括以下步骤:
获取待处理的文本内容;
识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
2.如权利要求1所述的粘贴处理方法,其特征在于,所述获取待处理的文本内容,包括:
接收复制/剪切的文本内容;或者,
接收复制/剪切的语音信息或者图片信息,将所述语音信息或者图片信息转换成文本内容。
3.如权利要求1所述的粘贴处理方法,其特征在于,所述识别所述文本内容中文本片段与类型标识的对应关系,包括:
应用预设的词表关键词检索所述文本内容;
采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。
4.如权利要求1所述的粘贴处理方法,其特征在于,所述识别所述文本内容中文本片段与类型标识的对应关系,包括:
采用预先经过训练的切词模型对所述文本内容进行切词;
根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识。
5.如权利要求4所述的粘贴处理方法,其特征在于,所述根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识,包括:
获取与切词结果中每个词条对应的属性信息,所述属性信息包括:至少一个类型标识,与每个类型标识对应的权重;
根据与每个类型标识对应的所有权重,以及预设的与所述类型标识对应的专业深度因子生成属性评测表,所述属性评测表包括:与每个类型标识对应的评估数据;
根据所述属性评测表确定与多类型标识的词条匹配的类型标识。
6.如权利要求1-5任一所述的粘贴处理方法,其特征在于,还包括:
根据粘贴指令,获取与所述粘贴指令对应的应用标识;
查询预设的粘贴指令集,获取与所述应用标识对应的类型标识,
根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。
7.如权利要求1所述的粘贴处理方法,其特征在于,所述获取与所述粘贴指令对应的应用标识,包括:
从后台获取与当前的应用程序对应的应用标识;或者,
检索当前应用界面的关键词,获取与所述关键词对应的应用标识。
8.一种粘贴处理装置,其特征在于,包括:
第一获取模块,用于获取待处理的文本内容;
处理模块,用于识别所述文本内容中文本片段与类型标识的对应关系,以便根据所述对应关系选择与粘贴应用场景匹配的文本片段进行粘贴处理。
9.如权利要求8所述的粘贴处理装置,其特征在于,所述第一获取模块具体用于:
接收复制/剪切的文本内容;或者,
接收复制/剪切的语音信息或者图片信息,将所述语音信息或者图片信息转换成文本内容。
10.如权利要求8所述的粘贴处理装置,其特征在于,所述处理模块,包括:
检索单元,用于应用预设的词表关键词检索所述文本内容;
过滤单元,用于采用正则表达式过滤与所述关键词匹配的文本片段,生成与所述文本片段对应的类型标识。
11.如权利要求8所述的粘贴处理装置,其特征在于,所述处理模块,包括:
切词单元,用于采用预先经过训练的切词模型对所述文本内容进行切词;
确定单元,用于根据预先建立的专名词典遍历切词结果中的每个词条,确定与词条匹配的类型标识。
12.如权利要求11所述的粘贴处理装置,其特征在于,所述确定单元,具体用于:
获取与切词结果中每个词条对应的属性信息,所述属性信息包括:至少一个类型标识,与每个类型标识对应的权重;
根据与每个类型标识对应的所有权重,以及预设的与所述类型标识对应的专业深度因子生成属性评测表,所述属性评测表包括:与每个类型标识对应的评估数据;
根据所述属性评测表确定与多类型标识的词条匹配的类型标识。
13.如权利要求8-12任一所述的粘贴处理装置,其特征在于,还包括:
第二获取模块,用于根据粘贴指令,获取与所述粘贴指令对应的应用标识;
查询模块,用于查询预设的粘贴指令集,获取与所述应用标识对应的类型标识;
选择模块,用于根据所述对应关系选择与所述类型标识对应的文本片段进行粘贴处理。
14.如权利要求13所述的粘贴处理装置,其特征在于,所述第二获取模块,具体用于:
从后台获取与当前的应用程序对应的应用标识;或者,
检索当前应用界面的关键词,获取与所述关键词对应的应用标识。
CN201510618604.7A 2015-09-24 2015-09-24 粘贴处理方法及装置 Active CN105117380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510618604.7A CN105117380B (zh) 2015-09-24 2015-09-24 粘贴处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510618604.7A CN105117380B (zh) 2015-09-24 2015-09-24 粘贴处理方法及装置

Publications (2)

Publication Number Publication Date
CN105117380A true CN105117380A (zh) 2015-12-02
CN105117380B CN105117380B (zh) 2018-09-07

Family

ID=54665374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510618604.7A Active CN105117380B (zh) 2015-09-24 2015-09-24 粘贴处理方法及装置

Country Status (1)

Country Link
CN (1) CN105117380B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653157A (zh) * 2015-12-30 2016-06-08 广州华多网络科技有限公司 一种拷贝文本的处理方法及装置
CN106354570A (zh) * 2016-08-26 2017-01-25 广东欧珀移动通信有限公司 复制粘贴账号信息的方法及装置
CN106648926A (zh) * 2016-08-05 2017-05-10 乐视控股(北京)有限公司 信息输入方法和装置
CN106776082A (zh) * 2017-01-17 2017-05-31 维沃移动通信有限公司 文本的粘贴方法及装置
CN107145398A (zh) * 2017-04-17 2017-09-08 北京小米移动软件有限公司 信息的处理方法、装置及设备
CN109388506A (zh) * 2018-09-30 2019-02-26 联想(北京)有限公司 一种数据处理方法及电子设备
CN110941718A (zh) * 2019-11-27 2020-03-31 广州快决测信息科技有限公司 一种通过文本内容自动识别文本类别的方法和系统
CN111273973A (zh) * 2018-12-05 2020-06-12 阿里巴巴集团控股有限公司 复制粘贴方法、装置及存储介质
US11491396B2 (en) 2018-09-30 2022-11-08 Lenovo (Beijing) Co., Ltd. Information processing method and electronic device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050262521A1 (en) * 2004-05-20 2005-11-24 International Business Machines Corporation User specified transfer of data between applications
CN103246638A (zh) * 2013-05-13 2013-08-14 北京小米科技有限责任公司 一种信息粘贴方法和装置
CN104035986A (zh) * 2014-05-30 2014-09-10 北京金山网络科技有限公司 一种打开网址的方法及装置、搜索关键词的方法及装置
CN104899269A (zh) * 2015-05-26 2015-09-09 北京金山安全软件有限公司 一种访问网址链接的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050262521A1 (en) * 2004-05-20 2005-11-24 International Business Machines Corporation User specified transfer of data between applications
CN103246638A (zh) * 2013-05-13 2013-08-14 北京小米科技有限责任公司 一种信息粘贴方法和装置
CN104035986A (zh) * 2014-05-30 2014-09-10 北京金山网络科技有限公司 一种打开网址的方法及装置、搜索关键词的方法及装置
CN104899269A (zh) * 2015-05-26 2015-09-09 北京金山安全软件有限公司 一种访问网址链接的方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653157A (zh) * 2015-12-30 2016-06-08 广州华多网络科技有限公司 一种拷贝文本的处理方法及装置
CN106648926A (zh) * 2016-08-05 2017-05-10 乐视控股(北京)有限公司 信息输入方法和装置
CN106354570A (zh) * 2016-08-26 2017-01-25 广东欧珀移动通信有限公司 复制粘贴账号信息的方法及装置
CN106776082A (zh) * 2017-01-17 2017-05-31 维沃移动通信有限公司 文本的粘贴方法及装置
CN107145398A (zh) * 2017-04-17 2017-09-08 北京小米移动软件有限公司 信息的处理方法、装置及设备
CN109388506A (zh) * 2018-09-30 2019-02-26 联想(北京)有限公司 一种数据处理方法及电子设备
CN109388506B (zh) * 2018-09-30 2022-07-26 联想(北京)有限公司 一种数据处理方法及电子设备
US11491396B2 (en) 2018-09-30 2022-11-08 Lenovo (Beijing) Co., Ltd. Information processing method and electronic device
CN111273973A (zh) * 2018-12-05 2020-06-12 阿里巴巴集团控股有限公司 复制粘贴方法、装置及存储介质
CN111273973B (zh) * 2018-12-05 2024-04-02 阿里巴巴集团控股有限公司 复制粘贴方法、装置及存储介质
CN110941718A (zh) * 2019-11-27 2020-03-31 广州快决测信息科技有限公司 一种通过文本内容自动识别文本类别的方法和系统

Also Published As

Publication number Publication date
CN105117380B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN105117380A (zh) 粘贴处理方法及装置
US8429099B1 (en) Dynamic gazetteers for entity recognition and fact association
CN104156454B (zh) 搜索词的纠错方法和装置
US11281737B2 (en) Unbiasing search results
US20150161521A1 (en) Method for extracting salient dialog usage from live data
US20180196784A1 (en) Dynamic content generation
WO2012083540A1 (en) Method and apparatus for providing token-based classification of device information
CN111831911A (zh) 查询信息的处理方法、装置、存储介质和电子装置
US10242033B2 (en) Extrapolative search techniques
AU2018250372B2 (en) Method to construct content based on a content repository
CN107885888A (zh) 信息处理方法及装置、终端设备以及计算机可读存储介质
CN107958039A (zh) 一种检索词纠错方法、装置及服务器
CN101631398A (zh) 一种移动终端电子书管理系统和方法
CN105701083A (zh) 文本表示方法和装置
CN107609192A (zh) 一种搜索引擎的补充搜索方法和装置
CN112102840B (zh) 语义识别方法、装置、终端及存储介质
CN114365118A (zh) 具有基本查询元素检测和图形路径生成的人工智能聊天机器人中基于知识图的查询
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN103886039B (zh) 应用检索的优化方法和装置
US20170270195A1 (en) Providing token-based classification of device information
JP7054731B2 (ja) 対話システム
US20160078036A1 (en) Building a Domain Knowledge and Term Identity Using Crowd Sourcing
JP6680472B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN110967030A (zh) 一种用于车载导航的信息处理方法及其装置
CN105447055A (zh) 搜索应用的方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant