CN103714168B - 在具有触摸屏的电子智能设备中获取词条的方法及装置 - Google Patents

在具有触摸屏的电子智能设备中获取词条的方法及装置 Download PDF

Info

Publication number
CN103714168B
CN103714168B CN201310752329.9A CN201310752329A CN103714168B CN 103714168 B CN103714168 B CN 103714168B CN 201310752329 A CN201310752329 A CN 201310752329A CN 103714168 B CN103714168 B CN 103714168B
Authority
CN
China
Prior art keywords
text message
word
entry
scheduled operation
neologisms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310752329.9A
Other languages
English (en)
Other versions
CN103714168A (zh
Inventor
陈晓昕
吴先超
肖日新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu International Technology Shenzhen Co Ltd
Original Assignee
Baidu International Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu International Technology Shenzhen Co Ltd filed Critical Baidu International Technology Shenzhen Co Ltd
Priority to CN201310752329.9A priority Critical patent/CN103714168B/zh
Publication of CN103714168A publication Critical patent/CN103714168A/zh
Application granted granted Critical
Publication of CN103714168B publication Critical patent/CN103714168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

提供了一种在具有触摸屏的电子智能设备中获取词条的方法及装置,所述方法包括:接收在具有文本信息的用户界面上进行的预定操作;获取通过所述预定操作选中的文本信息;对获取到的文本信息进行切词;确定该切词结果中的新词和/或热词。采用本发明所述方法及装置不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率。

Description

在具有触摸屏的电子智能设备中获取词条的方法及装置
技术领域
本发明涉及一种在具有触摸屏的电子智能设备中获取词条的方法及装置,尤其涉及一种在具有触摸屏的电子智能设备中根据用户在具有文本信息的用户界面上进行的预定操作获取新词、热词的技术。
背景技术
目前,简、繁、日、韩等输入法系统基本上都是采用字典(即词库)以及字典中包含的词频信息向用户展现各类候选词的排序,因此输入法首选词准确率的高低直接决定了这类输入法输入的准确率的高低。现有技术为提高首选词的准确率,主要采用以下技术手段来实现,例如,在输入法中加载各类专业细胞字典,通过服务器更新输入法字典,进而扩充字典中的包含的各类词条,可以说,这些方法虽然可以在一定程度上提高输入法首选词的准确率,但是随着互联网日新月异的发展,对于一些在互联网中实时出现的新词、热词来说,这些方法对网络中出现的新词、热词的技术处理上显得相对滞后。
随着各种智能上网设备的飞速发展,通过微博、微信、博客等各种通信客户端工具进行网络交流成为人们日常生活中必不可少的通信交流手段,因此一些新词在互联网不断涌现,例如,赶脚、有木有、肿么了、给力等,而一些特定词条的热度会随着某个重大事件的突然出现而在某个时间段内不断出现,例如,台风海燕等,因此,这些新词和热词是随着时间的推移而实时变化的,但是,采用上述方法难以将这些新词、热词及时整理和扩充到字典中,从而难以进一步提高输入法首选的准确率,这影响了人们对信息输入的体验。
发明内容
本发明的目的在于提供一种在具有触摸屏的电子智能设备中获取词条的方法及装置,不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率。
根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的方法,包括:接收在具有文本信息的用户界面上进行的预定操作;获取通过所述预定操作选中的文本信息;对获取到的文本信息进行切词;确定该切词结果中的新词和/或热词。
优选地,所述预定操作为沿文字方向的滑动操作。
优选地,获取通过所述预定操作选中的文本信息的步骤包括:获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
优选地,获取通过所述预定操作选中的文本信息的步骤包括:将闭合形状包围的文本信息确定为选中的文本信息。
优选地,确定该切词结果中的新词的步骤包括:获取该切词结果中的任一词条;将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
优选地,确定该切词结果中的热词的步骤包括:根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。
根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的装置,包括:接口单元,用于接收在具有文本信息的用户界面上进行的预定操作;获取单元,用于获取通过所述预定操作选中的文本信息;切词单元,用于对获取到的文本信息进行切词;确定单元,用于确定该切词结果中的新词和/或热词。
优选地,所述预定操作为沿文字方向的滑动操作。
优选地,所述获取单元获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
优选地,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。
优选地,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
优选地,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。
有益效果
与现有技术相比,本发明具有以下优点:本发明不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率,从而进一步增强了用户体验。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的方法的流程图;
图2是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的装置的结构框图;
图3是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图;
图4是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图;
图5是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过绘制的闭合曲线获取词条的屏幕截图。
具体实施方式
以下,将参照附图来详细说明本发明的实施例。
图1示出了本发明一种在具有触摸屏的电子智能设备中获取词条的方法的优选实施例的流程图。图2示出的一种在具有触摸屏的电子智能设备中获取词条的装置可用于实现图1中所述的方法。
参照图1,在110中,所述装置接收在具有文本信息的用户界面上进行的预定操作。
在120中,所述装置获取通过所述预定操作选中的文本信息。
该用户界面可以是用户在智能设备中正在浏览的网页的界面,也可以是电子邮件或其他文本编辑应用(如:pdf、txt等),对此本发明不做限制,只要是能够向所述用户展示文本信息的用户界面即可。
根据本发明的一个示例性实施例,所述预定操作为沿文字方向的滑动操作。
该文字方向可以是横向,也可以是竖向,还可以是与水平方向呈预设角度的斜向,对此本发明不作限制,只要所述预定操作沿文字方向的滑动即可。需要说明的是,沿文字方向的滑动操作可以是用户在触摸屏上绘制的单划线,也可以是双划线,还可以是波浪线,对此本发明也不作限制,只要沿文字方向的滑动操作能够指示选中的文本信息即可。另外,还需要进一步说明的是,沿文字方向的滑动操作可以是在智能设备显示的任意一段文本信息的下方,也可以穿越智能设备显示的任意一段文本信息,对此本发明也不作限制。
图3示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图。图中所示的3A为所述装置在具有触摸屏的电子智能设备中绘制的单划线;图中所示的3B为所述装置在具有触摸屏的电子智能设备中绘制的双划线;图中所示的3C为所述装置在具有触摸屏的电子智能设备中绘制的波浪线。
具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
更为具体地,所述装置将起点和终点之间的文本信息确定为选中的文本信息的具体步骤为:所述装置获取智能设备用户界面的显示字体的字高;根据获取到的字高及起点和终点的纵坐标,确定划动操作在智能设备用户界面中对应的行;根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息。
以下结合具体实施例对上述实施过程进行详细说明,如果沿文字方向的滑动操作为单划线,则所述装置通过如下过程获取通过所述预定操作选中的文本信息:
1、所述装置可通过系统提供的操作API(Application Programming Interface,应用程序编程接口)获得下划线起点和终点的屏幕坐标:(X1,Y1)和(X2,Y2)。
2、所述装置可通过系统提供的API获得智能设备用户界面中各行字体的字高H,根据起点和终点的屏幕坐标确定下划线所在的行。
3、所述装置获取该行的文本数据流,通过对该行包含的文本信息(字或者符号)进行循环计算,计算下划线在起点和终点之间的文本信息。
需要说明的是,所述装置还可在上述实施方法进行适当变形,采用各种现有技术获得通过绘制下划线、双划线以及波浪线等各种沿文字方向滑动选中的文本信息。
图4示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图。图中所示的4A为所述装置在具有文本信息的用户界面上选中的部分文本信息。
具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置从所述设备的剪切板中获取用户在具有文本信息的用户界面上选中的文本信息;将所述获取到的文本信息确定为选中的文本信息。
此外,所述装置还可以采用各种现有技术将沿文字方向滑动选中的文本信息确定为选中的文本信息。
根据本发明的一个示例性实施例,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
其中,所述闭合形状可以是完全闭合的曲线,也可以是半闭合的曲线,只要该闭合形状能够包围住智能设备在用户界面中显示的部分或全部文本信息即可。
图5示出了本发明在具有触摸屏的电子智能设备中通过绘制的闭合形状获取词条的屏幕截图。图中所示的5A为所述装置在具有触摸屏的电子智能设备中绘制的完全闭合曲线;图中所示的5B为所述装置在具有触摸屏的电子智能设备中绘制的半闭合曲线。
具体地,根据本发明所述预定操作为在具有文本信息的用户界面上绘制的闭合形状的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置将闭合形状包围的文本信息确定为选中的文本信息。
具体实施时,所述装置可以获取该闭合形状在具有文本信息的用户界面上包围的局部屏幕截图;对获取到的局部屏幕截图进行文本识别;将识别的文本信息确定为选中的文本信息。
此外,所述装置还可以采用各种现有技术获取该闭合形状选中的文本信息,例如,所述装置还可以根据该闭合形状的位置及大小确定该闭合形状选中的文本信息。
在120中,所述装置对获取到的文本信息进行切词。
具体实施时,所述装置可采用各种现有技术对获取到的文本信息进行切词,例如,基于字符串匹配的分词方法、基于理解的分词方法以及基于统计的分词方法,对此本发明不再赘述。
在130中,所述装置确定该切词结果中的新词/热词。
具体地,根据本发明的一个示例性实施例,所述装置确定切词的结果中的新词的具体步骤为:所述装置获取该切词结果中的任一词条;如果该词条没有出现在预置的输入法字典中,则将该词条确定为新词。
具体实施时,所述装置可将该词条与预置的输入法字典中的各个词条进行比对,以确定该词条是否为新词。
需要指出的是,预置的输入法字典可以在云端,也可以在本地设备中。
具体实施时,根据本发明预置的输入法字典在云端的示例性实施例,所述装置将120中的切词得到的多个词条上传到云端,通过云端将所述装置上传的词条与所述云端预置的输入法字典中的各个词条进行比较,如果上传的词条没有出现在云端的输入法字典中,则将上传的词条标记为新词,然后将所述新词反馈给所述装置对应的客户端,以便其更新该客户端所在设备中预置的输入法字典,也可以将该新词反馈给多个客户端,以便多个客户端所在设备中预置的输入法字典得到更新。
具体实施时,根据本发明预置的输入法字典在本地的示例性实施例,所述装置将120中的切词得到多个词条与本地设备预置的输入法字典中的词条进行比较,如果上传的词条没有出现在本地设备预置的输入法字典,则将上传的词条标记为新词,并添加至本地设备预置的输入法字典。
具体地,根据本发明的一个示例性实施例,所述装置确定切词结果中的热词的具体步骤为:所述装置获取该切词结果中的任一词条;根据从预置的输入法字典获取该词条在最近预设时间段内出现的词频信息,确定该词条的热度;将热度不小于预设热度阈值的词条确定为热词。
更为具体地,根据本发明的一个示例性实施例,所述装置可采用加权打分法确定该词条的热度。具体的计算公式如下:
词条热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频)
其中,单个词条的得分=最近一天的词频/单个词条的总词频。
以下结合具体的实施例对上述实施过程进行详细说明,假设有四个词A、B、C、D在2013-11-10和2013-11-11这两天内出现的次数的如下如下表所示:
词条 2013-11-10 2013-11-11 两天的和 2013-11-12
A 35 100 135 0.74
B 140 150 290 0.52
C 1 4 5 0.8
D 150 700 850 0.82
平均值 320 0.72
从表格中显示的数据可以看出,所述装置根据2013-11-10和2013-11-11这两天的历史数据分别计算出这四个词在2013-11-12出现的概率分别为0.74、0.52、0.8、0.82,此时,可假设已经有320个人预先给每个词都打了0.72分,A词还有额外的135个人打分,每个人都给了0.74分,按照前面所述的计算公式,这四个词的最终得分(即热度)分别为:
A:(0.72*320+0.74*135)/(320+135)=0.725
B:(0.72*320+0.52*290)/(320+290)=0.625
C:(0.72*320+0.8*5)/(320+5)=0.721
D:(0.72*320+0.82*850)/(320+850)=0.793
按照热度大小排序如下:
D>A>C>B
可以看出,词条D出现的频率最高,因此排名也最靠前,如果该词条的热度不小于预设热度阈值,所述装置可将其从云端下发给各个客户端的输入法字典进行使用。
具体实施时,根据本发明预置的字典在云端的示例性实施例,所述装置将120中的切词得到的多个词条上传到云端,通过云端计算上传词条的热度,并将热度值高的词条作为热词下发给所述装置所在的客户端的输入法字典,也可以下发给多个客户端的输入法字典,以共享该资源,本地设备上的输入法根据下发词条的热度,更新所述设备中预置的输入法字典,并在用户输入信息时,将热确定的热词作为首选推荐给用户,从而进一步提高了用户在信息输入时的准确率。
具体实施时,根据本发明预置的字典在本地的示例性实施例,所述装置直接计算切词结果中各词条的热度,并将不小于预设热度阈值的词条确定为热词。所述设备上的输入法根据计算的热度,更新所述设备中预置的字典,并在用户输入信息时,将确定的热词作为首选推荐给用户。
此外,所述装置也可以直接将切词结果中各词条的热度更新至输入法字典,输入法根据字典中各词条的热度对候选词进行排序,热度值高的词条将作为首选出现在输入法候选框中,从而进一步提高首选的准确率。
除了上述实施方法外,本发明还可以采用各种现有技术计算词条的热度,对此本发明不作限制,还可以再本发明实施例基础上进行适当的变形以实现本发明。
图2示出了本发明一种在具有触摸屏的电子智能设备中获取词条的装置的优选实施例结构框图。
参照图2,所述装置至少包括接口单元201、获取单元202、切词单元203以及确定单元204。
其中,接口单元201,用于接收在具有文本信息的用户界面上进行的预定操作。
获取单元202,用于获取通过所述预定操作选中的文本信息。
切词单元203,用于对获取到的文本信息进行切词。
确定单元204,用于确定该切词结果中的新词和/或热词。
根据本发明的一个示例性实施例,所述预定操作为沿文字方向的滑动操作。
该文字方向可以是横向,也可以是竖向,还可以是与水平方向呈预设角度的斜向,对此本发明不作限制,只要所述预定操作沿文字方向的滑动即可。需要说明的是,沿文字方向的滑动操作可以是用户在智能设备中绘制的单划线,也可以是双划线,还可以是波浪线,对此本发明也不作限制,只要沿文字方向的滑动操作能够指示选中的文本信息即可。另外,还需要进一步说明的是,沿文字方向的滑动操作可以是在智能设备显示的任意一段文本信息的下方,也可以穿越智能设备显示的任意一段文本信息,对此本发明也不作限制。
具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例,所述获取单元202获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
根据本发明的一个示例性实施例,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
其中,所述闭合形状可以是完全闭合的曲线,也可以是半闭合的曲线,只要该闭合形状能够包围住智能设备在用户界面中显示的部分或全部文本信息即可。
具体地,根据本发明所述预定操作为在具有文本信息的用户界面上绘制的闭合形状的示例性实施例,所述获取单元202将闭合形状包围的文本信息确定为选中的文本信息。
具体地,根据本发明的一个示例性实施例,所述确定单元204将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
具体地,根据本发明的一个示例性实施例,所述确定单元204根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。
由此可见,与现有技术相比本发明不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法字典中,同时还进一步提高了输入法首选的准确率,从而进一步增强了用户体验。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或一组步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问并且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
尽管已参照优选实施例表示和描述了本发明,但本领域技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行各种修改和变换。

Claims (8)

1.一种在具有触摸屏的电子智能设备中获取词条的方法,包括:
接收在具有文本信息的用户界面上进行的预定操作,所述预定操作为沿文字方向的滑动操作;
获取通过所述预定操作选中的文本信息;
对获取到的文本信息进行切词;
确定该切词结果中的新词和/或热词,以利用确定的新词/热词更新输入法字典,
其中,获取通过所述预定操作选中的文本信息的步骤包括:
获取滑动操作的起点和终点;
将起点和终点之间的文本信息确定为选中的文本信息,
其中,将起点和终点之间的文本信息确定为选中的文本信息的步骤包括:
获取所述用户界面的显示字体的字高;
根据获取到的字高及起点和终点的纵坐标,确定滑动操作在所述用户界面中对应的行;
根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息,
其中,确定该切词结果中的热词的步骤包括:
根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;
将热度不小于预设热度阈值的词条确定为热词,
其中,利用如下公式来计算词条的热度:
词条的热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频),
其中,单个词条的得分=最近一天的词频/单个词条的总词频。
2.如权利要求1所述的方法,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
3.如权利要求2所述的方法,其特征在于,获取通过所述预定操作选中的文本信息的步骤包括:
将闭合形状包围的文本信息确定为选中的文本信息。
4.如权利要求1~3任一项所述的方法,其特征在于,确定该切词结果中的新词的步骤包括:
将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
5.一种在具有触摸屏的电子智能设备中获取词条的装置,包括:
接口单元,用于接收在具有文本信息的用户界面上进行的预定操作,所述预定操作为沿文字方向的滑动操作;
获取单元,用于获取通过所述预定操作选中的文本信息;
切词单元,用于对获取到的文本信息进行切词;
确定单元,用于确定该切词结果中的新词和/或热词,以利用确定的新词/热词更新输入法字典,
其中,所述获取单元获取滑动操作的起点和终点,将起点和终点之间的文本信息确定为选中的文本信息,
其中,所述获取单元获取所述用户界面的显示字体的字高,根据获取到的字高及起点和终点的纵坐标,确定滑动操作在所述用户界面中对应的行,根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息,
其中,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词,
其中,所述确定单元利用如下公式来计算词条的热度:
词条的热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频),
其中,单个词条的得分=最近一天的词频/单个词条的总词频。
6.如权利要求5所述的装置,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
7.如权利要求6所述的装置,其特征在于,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。
8.如权利要求5~7任一项所述的装置,其特征在于,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
CN201310752329.9A 2013-12-31 2013-12-31 在具有触摸屏的电子智能设备中获取词条的方法及装置 Active CN103714168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310752329.9A CN103714168B (zh) 2013-12-31 2013-12-31 在具有触摸屏的电子智能设备中获取词条的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310752329.9A CN103714168B (zh) 2013-12-31 2013-12-31 在具有触摸屏的电子智能设备中获取词条的方法及装置

Publications (2)

Publication Number Publication Date
CN103714168A CN103714168A (zh) 2014-04-09
CN103714168B true CN103714168B (zh) 2017-05-31

Family

ID=50407143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310752329.9A Active CN103714168B (zh) 2013-12-31 2013-12-31 在具有触摸屏的电子智能设备中获取词条的方法及装置

Country Status (1)

Country Link
CN (1) CN103714168B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335416B (zh) * 2014-08-05 2018-11-02 佳能株式会社 内容提取方法、内容提取装置和用于内容提取的系统
CN105302902A (zh) * 2015-10-27 2016-02-03 无锡天脉聚源传媒科技有限公司 一种数据搜索方法及装置
CN105718161A (zh) * 2016-01-15 2016-06-29 努比亚技术有限公司 一种终端截屏的方法及装置
CN106557237B (zh) * 2016-10-12 2020-01-31 深圳市金立通信设备有限公司 一种选择复制文本信息的方法及终端
CN106933379A (zh) * 2017-02-13 2017-07-07 北京奇虎科技有限公司 一种词库的生成方法和装置
CN107491184B (zh) * 2017-09-01 2020-12-22 任文 一种输入法装载和显示汉字字典的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923401A (zh) * 2010-09-21 2010-12-22 广东欧珀移动通信有限公司 一种电子设备输入方法
CN102609208A (zh) * 2012-02-13 2012-07-25 广州市动景计算机科技有限公司 在触屏设备上进行屏幕取词的方法、系统及触屏设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120268388A1 (en) * 2011-04-21 2012-10-25 Mahmoud Razzaghi Touch screen text selection
US20120290291A1 (en) * 2011-05-13 2012-11-15 Gabriel Lee Gilbert Shelley Input processing for character matching and predicted word matching
CN103186675A (zh) * 2013-04-03 2013-07-03 南京安讯科技有限责任公司 一种基于网络热词识别的网页自动分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923401A (zh) * 2010-09-21 2010-12-22 广东欧珀移动通信有限公司 一种电子设备输入方法
CN102609208A (zh) * 2012-02-13 2012-07-25 广州市动景计算机科技有限公司 在触屏设备上进行屏幕取词的方法、系统及触屏设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Word入门动画教程39:充实输入法词库";石斌;《天极网:http://soft.yesky.com/office/54/2218054.shtml》;20051201;全文 *

Also Published As

Publication number Publication date
CN103714168A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103714168B (zh) 在具有触摸屏的电子智能设备中获取词条的方法及装置
CN108460082B (zh) 一种推荐方法及装置,电子设备
CN106909901B (zh) 从图像中检测物体的方法及装置
CN111696112A (zh) 图像自动裁剪方法、系统、电子设备及存储介质
CN104866985B (zh) 快递单号识别方法、装置及系统
CN112148987A (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN103577386A (zh) 一种基于用户输入场景动态加载语言模型的方法及装置
US20230114293A1 (en) Method for training a font generation model, method for establishing a font library, and device
US20220270384A1 (en) Method for training adversarial network model, method for building character library, electronic device, and storage medium
US8918404B1 (en) Displaying content in a user interface in a social network system
US20220237935A1 (en) Method for training a font generation model, method for establishing a font library, and device
TWI525456B (zh) Choose font, font determination, recommendation, generation method and device
CN111984792A (zh) 网站分类方法、装置、计算机设备及存储介质
US11816908B2 (en) Method of generating font database, and method of training neural network model
US20220245510A1 (en) Multi-dimensional model shape transfer
CN110796089A (zh) 用于训练换脸模型的方法和设备
CN113763249A (zh) 文本图像超分辨率重建方法及其相关设备
CN106897282A (zh) 一种用户群的分类方法和设备
CN113553428B (zh) 文档分类方法、装置及电子设备
JP6838167B2 (ja) ウェブページメイン画像認識方法及び装置
CN102402553A (zh) 一种用于对推广账户的运营质量进行分析的方法与设备
CN108830460B (zh) 一种基于分步动态填充缓解推荐系统数据稀疏性的方法
CN112100491A (zh) 基于用户数据的信息推荐方法、装置、设备及存储介质
TW201520791A (zh) 網頁的處理方法及裝置
US20200150855A1 (en) Information processing apparatus and non-transitory computer readable medium storing program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant