CN112765445A - 生僻字识别方法及装置 - Google Patents

生僻字识别方法及装置 Download PDF

Info

Publication number
CN112765445A
CN112765445A CN202110109618.1A CN202110109618A CN112765445A CN 112765445 A CN112765445 A CN 112765445A CN 202110109618 A CN202110109618 A CN 202110109618A CN 112765445 A CN112765445 A CN 112765445A
Authority
CN
China
Prior art keywords
word
uncommon
uncommon word
level
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110109618.1A
Other languages
English (en)
Inventor
张华博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202110109618.1A priority Critical patent/CN112765445A/zh
Publication of CN112765445A publication Critical patent/CN112765445A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种生僻字识别方法及装置,属于移动通信领域。所述方法包括:在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。本申请实施例解决了现有技术中,使用电子设备查询生僻字,操作繁琐的问题。

Description

生僻字识别方法及装置
技术领域
本申请属于移动通信领域,具体涉及一种生僻字识别方法及装置。
背景技术
随着移动通信技术的迅速发展,各种移动电子设备以及非移动电子设备已成为人们生活中各方面不可或缺的工具。电子设备的各种应用程序(Application,APP)的功能也逐渐完善,不再只是单纯地起到通信作用,较多的是为用户提供各种智能化服务,给用户工作、生活带来了极大的便利。
在电子设备使用过程中,经常会遇到一些生僻字,例如古籍中的文字、浏览新闻时的地名、人名等;对于生僻字的识别,通常需要用户手动进行识别处理,例如用户通过复制生僻字去查询,或者截取包括生僻字的屏幕截图去查询;然而,手动查询的方式一方面操作繁琐,另一方面还可能需要离开当前屏幕显示界面,去浏览器或其他APP内去查询生僻字,给用户带来不便。
发明内容
本申请实施例的目的是提供一种生僻字识别方法及装置,能够解决现有技术中,使用电子设备查询生僻字,操作繁琐的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种生僻字识别方法,所述方法包括:
在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
第二方面,本申请实施例还提供了一种生僻字识别装置,所述生僻字识别装置包括:
确定模块,用于在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
显示模块,用于在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
第三方面,本申请实施例还提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的程序或指令,所述处理器执行所述程序或指令时实现如上所述的生僻字识别方法中的步骤。
第四方面,本申请实施例还提供了一种可读存储介质,该可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述的生僻字识别方法中的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如上所述的方法。
在本申请实施例中,在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息,帮助用户快速生僻字的文字信息,无需用户手动搜索查询,提升用户操作的便捷程度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1表示本申请实施例提供的生僻字识别方法的流程图;
图2表示本申请实施例提供的第一示例的示意图之一;
图3表示本申请实施例提供的第一示例的示意图之二;
图4表示本申请实施例提供的第二示例的流程图;
图5表示本申请实施例提供的第二示例的示意图;
图6表示本申请的实施例提供的生僻字识别装置的框图;
图7表示本申请的实施例提供的电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的生僻字识别方法进行详细地说明。
参见图1,本申请一实施例提供了一种生僻字识别方法,所述方法可应用于电子设备,所述电子设备包括各种手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备,以及各种形式的移动台(Mobile Station,MS),终端设备(Terminal Device)等等。
所述方法包括:
步骤101,在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数。
其中,生僻字可以是汉字或者其他文字,例如英文等其他语言文字;显示界面可以是电子设备的显示桌面、应用界面或其他界面等;在电子设备的显示界面显示生僻字时,电子设备确定生僻字的生僻字级别,生僻字级别用于表示生僻字的生僻程度;生僻字级别根据第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;第一预设参数例如生僻字的常见程度;第一搜索次数为生僻字在第一字库中被搜索的次数;第一字库例如网络字库或云端字库。第二搜索次数为生僻字被电子设备的用户在第二字库中的搜索次数;第二字库为电子设备的本地字库。
比如,在每个第一预设周期,第一字库记载每个文字在其中的第一搜索次数;在每个第二预设周期,电子设备记录每个文字在第二字库的第二搜索次数。
可选地,确定生僻字级别包括的参数之后,对所有参数进行计算,进而确定生僻字级别,例如采用加权求和的方式确定。
步骤102,在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项;预设阈值用于确定是否对生僻字进行生僻字处理,生僻字处理即显示生僻字的文字信息;在所述生僻字级别大于预设阈值的情况下,对生僻字进行生僻字处理,显示文字信息;文字信息包括读音、释义以及起源中的至少一项;读音即通过汉语拼音、英文音标或其他形式显示生僻字的读音;释义即生僻字的含义;起源即生僻字的来源。
可选地,可从网络中或第二字库中搜索生僻字的文字信息。
所述预设阈值为与所述电子设备的用户的识别等级对应的;识别等级用于表示用户对生僻字了解的程度;比如,生僻字级别越高,对应的生僻字范围越小;生僻字级别越低,表明用户了解的生僻字数量越少,则对应的生僻字范围越大;
这样,在电子设备判断生僻字的生僻字级别大于预设阈值时,可以自动显示生僻字的文字信息,无需用户手动搜索查询。
作为第一示例,参见图2,在电子设备的显示界面显示生僻字“X”时,如S1线框所示,电子设备确定生僻字“X”的生僻字级别。参见图3,生僻字“X”的文字信息如线框S2所示。
本申请实施例中,在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息,帮助用户快速生僻字的文字信息,无需用户手动搜索查询,提升用户操作的便捷程度;本申请实施例解决了现有技术中,使用电子设备查询生僻字,操作繁琐的问题。
在一个可选实施例中,所述预设阈值为与所述电子设备的用户对生僻字的识别等级对应的;所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
所述识别等级为预先设定的,比如电子设备预先设定生僻字级别,由用户选择或电子设备默认设定一级别。
或所述识别等级为根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
其中,用户画像又称用户角色,其作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,可基于用户画像为用户提供有针对性的服务。用户使用电子设备的过程中,根据用户的使用习惯、特征生成用户画像;可选地,用户画像中包括可多个预设标签,确定每个预设标签对应的权重系数,权重系数用于表示对生僻字的了解程度;每个预设标签作为画像的一部分,得到多个预设标签的权重系数之后,变得到该用户的用户画像。
所述第二字库中的文字搜索次数即用户在电子设备的第二字库中搜索文字的次数;可选地,第二字库中可以包括字典,搜索次数包括用户在字典中搜索的次数;第二字库还包括用户在其他APP中搜索文字的次数,例如浏览器等。
若仅确定用户画像或所述文字搜索次数中的一项,则根据预设的对应关系,确定该项参数对应的所述预设阈值;若确定用户画像以及所述文字搜索次数中,首先对二者加权求和,然后根据预设的对应关系确定对应的所述预设阈值。这样,所述预设阈值可以由用户预先设定或自由调整,满足用户使用需求;还可根据用户画像以及使用习惯(使用习惯即文字搜索次数)自动生成。这样,电子设备在确定用户的识别等级之后,根据用户的识别等级对应的预设阈值判断每个生僻字是否需要显示文字信息,实现根据用户对生僻字的了解程度或了解需求,有针对性地展示文字信息,使得生僻字的判别标准符合用户本身的特征;比如对于大众较为生僻的生僻字,可能电子设备的用户可能认识,则不需要展示该生僻字的文字信息,避免浪费用户查看文字信息的查看时间;而对于大众较为熟知的文字,可能对于电子设备的用户来说为较为生僻的文字,此时则及时展示文字信息,便于用户了解该文字。
在一个可选实施例中,所述确定所述生僻字的生僻字级别,包括:
在所述生僻字级别为根据至少两项所述参数确定的情况下,确定每个所述参数对应的权重;
对所述参数加权求和,得到生僻字级别。
综合多个参数,加权求和得到生僻字级别,从而从多个维度判断生僻字级别。
在一个可选实施例中,所述第二字库中包括所述用户搜索超过第一预设次数的文字。其中,为了确保第二字库中的文字具有一定的生僻程度,以及扩大第二字库中的文字范围,将在电子设备搜索超过第一预设次数的文字假如第二字库;第一预设数目可以是任一正整数。
在一个可选实施例中,所述显示所述生僻字的文字信息,包括:
显示所述生僻字的读音;可选地,可优先显示读音;
接收作用于所述生僻字的读音第一输入时,显示所述生僻字的释义以及起源中的至少一项。第一输入例如触控输入,在显示读音之后,又接收到第一输入时,则进一步显示所述生僻字的释义以及起源中的至少一项。
在一个可选实施例中,所述方法还包括:
在所述生僻字级别小于或等于所述预设阈值的情况下,在接收到作用于所述生僻字的第二输入时,显示所述生僻字的文字信息。此处,所述生僻字可以是生僻字级别低于所述预设阈值的文字,即被电子设备判断为被所述电子设备的用户所认识的文字;若用户需要了解该生僻字的文字信息,可以向该生僻字触发第二输入,进而电子设备获取并显示该生僻字的文字信息。
作为第二示例,参见图4,图4示出了应用本申请实施例提供的生僻字识别方法的应用过程,主要包括以下步骤:
步骤401,启动生僻字识别功能。
当用户在使用手机的过程中遇到生僻字时,可以上滑电子设备底部打开生僻字识别功能,生僻字识别功能按键图标如图5中S3所示。
步骤402,电子设备根据屏幕展示内容变动,自动截取当前页面,形成图片。
步骤403,对图片进行光学字符识别(Optical Character Recognition,OCR)以及版面分析,获得当前页面的所有文字以及每个字的位置,OCR的识别区域为整个屏幕区域。
OCR是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;OCR即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
步骤404,针对OCR识别到的每个文字,确定其生僻字级别。
具体确定过程如下:以文字为汉字为例,数据源包括:新华字典中的生僻字;网络中的生僻字字库,根据网络中常见的、用户会经常搜索的生僻字建立字库;电子设备用户手动触发过n次以上识别的汉字(n可以由运营人员选择大小);部分第三方词库。
对数据源整合并建立字典,并对每个生僻字的生僻程度分级,生僻字由易到难分为多个等级,分级级别会参考生僻字的常见程度、网络搜索次数和用户手动触发的次数等参数。
步骤405,若生僻字级别大于预设阈值,显示文字的读音。
在显示读音之后,又接收到第一输入时,则进一步显示所述生僻字的释义以及起源中的至少一项。
本申请实施例中,在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息,帮助用户快速生僻字的文字信息,无需用户手动搜索查询,提升用户操作的便捷程度。
以上介绍了本申请实施例提供的生僻字识别方法,下面将结合附图介绍本申请实施例提供的生僻字识别装置。
需要说明的是,本申请实施例提供的生僻字识别方法,执行主体可以为生僻字识别装置,或者该生僻字识别装置中的用于执行生僻字识别方法的控制模块。本申请实施例中以生僻字识别装置执行生僻字识别方法为例,说明本申请实施例提供的生僻字识别方法。
参见图6,本申请实施例还提供了一种生僻字识别装置600,包括:
确定模块601,用于在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
其中,生僻字可以是汉字或者其他文字,例如英文等其他语言文字;显示界面可以是电子设备的显示桌面、应用界面或其他界面等;在电子设备的显示界面显示生僻字时,电子设备确定生僻字的生僻字级别,生僻字级别用于表示生僻字的生僻程度;生僻字级别根据第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;第一预设参数例如生僻字的常见程度;第一搜索次数为生僻字在第一字库中被搜索的次数;第一字库例如网络字库或云端字库。第二搜索次数为生僻字被电子设备的用户在第二字库中的搜索次数;第二字库为电子设备的本地字库。
比如,在每个第一预设周期,第一字库记载每个文字在其中的第一搜索次数;在每个第二预设周期,电子设备记录每个文字在第二字库的第二搜索次数。
可选地,确定生僻字级别包括的参数之后,对所有参数进行计算,进而确定生僻字级别,例如采用加权求和的方式确定。
显示模块602,用于在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
预设阈值用于确定是否对生僻字进行生僻字处理,生僻字处理即显示生僻字的文字信息;在所述生僻字级别大于预设阈值的情况下,对生僻字进行生僻字处理,显示文字信息;文字信息包括读音、释义以及起源中的至少一项;读音即通过汉语拼音、英文音标或其他形式显示生僻字的读音;释义即生僻字的含义;起源即生僻字的来源。
可选地,可从网络中或第二字库中搜索生僻字的文字信息。
所述预设阈值为与所述电子设备的用户的识别等级对应的;识别等级用于表示用户对生僻字了解的程度;比如,生僻字级别越高,对应的生僻字范围越小;生僻字级别越低,表明用户了解的生僻字数量越少,则对应的生僻字范围越大;
这样,在电子设备判断生僻字的生僻字级别大于预设阈值时,可以自动显示生僻字的文字信息,无需用户手动搜索查询。
作为第一示例,参见图2,在电子设备的显示界面显示生僻字“X”时,如S1线框所示,电子设备确定生僻字“X”的生僻字级别。参见图3,生僻字“X”的文字信息如线框S2所示。
可选地,本申请实施例中,所述确定模块601包括:
确定子模块,用于在所述生僻字级别为根据至少两项所述参数确定的情况下,确定每个所述参数对应的权重;
处理子模块,用于对所述参数加权求和,得到生僻字级别。
可选地,本申请实施例中,所述第二字库中包括所述用户搜索超过第一预设次数的文字。
可选地,本申请实施例中,所述预设阈值为与所述电子设备的用户对生僻字的识别等级对应的;所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
所述识别等级为预先设定的,比如电子设备预先设定生僻字级别,由用户选择或电子设备默认设定一级别。
或所述识别等级为根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
其中,用户画像又称用户角色,其作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,可基于用户画像为用户提供有针对性的服务。用户使用电子设备的过程中,根据用户的使用习惯、特征生成用户画像;可选地,用户画像中包括可多个预设标签,确定每个预设标签对应的权重系数,权重系数用于表示对生僻字的了解程度;每个预设标签作为画像的一部分,得到多个预设标签的权重系数之后,变得到该用户的用户画像。
所述第二字库中的文字搜索次数即用户在电子设备的第二字库中搜索文字的次数;可选地,第二字库中可以包括字典,搜索次数包括用户在字典中搜索的次数;第二字库还包括用户在其他APP中搜索文字的次数,例如浏览器等。
若仅确定用户画像或所述文字搜索次数中的一项,则根据预设的对应关系,确定该项参数对应的所述预设阈值;若确定用户画像以及所述文字搜索次数中,首先对二者加权求和,然后根据预设的对应关系确定对应的所述预设阈值。这样,所述预设阈值可以由用户预先设定或自由调整,满足用户使用需求;还可根据用户画像以及使用习惯(使用习惯即文字搜索次数)自动生成。
可选地,本申请实施例中,所述显示模块602包括:
第一显示子模块,用于显示所述生僻字的读音;
第二显示子模块,用于接收作用于所述生僻字的读音第一输入时,显示所述生僻字的释义以及起源中的至少一项。
可选地,本申请实施例中,所述装置600还包括:
接收模块,用于在所述生僻字级别小于或等于所述预设阈值的情况下,在接收到作用于所述生僻字的第二输入时,显示所述生僻字的文字信息。
本申请实施例中,确定模块601在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;在所述生僻字级别大于预设阈值的情况下,显示模块602显示所述生僻字的文字信息,帮助用户快速生僻字的文字信息,无需用户手动搜索查询,提升用户操作的便捷程度。
本申请实施例中的生僻字识别装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(Ultra-Mobile Personal Computer,UMPC)、上网本或者个人数字助理(PersonalDigital Assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(Personal Computer,PC)、电视机(Television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的生僻字识别装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的生僻字识别装置能够实现图1至图5的方法实施例中生僻字识别装置实现的各个过程,为避免重复,这里不再赘述。
可选的,本申请实施例还提供一种电子设备,包括处理器710,存储器709,存储在存储器709上并可在所述处理器710上运行的程序或指令,该程序或指令被处理器710执行时实现上述生僻字识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图7为实现本申请各个实施例的一种电子设备700的硬件结构示意图;
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。
本领域技术人员可以理解,电子设备700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器710,用于在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
显示单元706,用于在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
可选地,所述预设阈值为与所述电子设备的用户的识别等级对应的;
所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
可选地,处理器710,用于在所述生僻字级别为根据至少两项所述参数确定的情况下,确定每个所述参数对应的权重;
对所述参数加权求和,得到生僻字级别。
可选地,所述第二字库中包括所述用户搜索超过第一预设次数的文字。
可选地,所述预设阈值为与所述电子设备的用户对生僻字的识别等级对应的;所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
可选地,显示单元706,用于显示所述生僻字的读音;
接收作用于所述生僻字的读音第一输入时,显示所述生僻字的释义以及起源中的至少一项。
可选地,处理器710,用于在所述生僻字级别小于或等于所述预设阈值的情况下,在接收到作用于所述生僻字的第二输入时,显示所述生僻字的文字信息。
本申请实施例中,在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息,帮助用户快速生僻字的文字信息,无需用户手动搜索查询,提升用户操作的便捷程度。
应理解的是,本申请实施例中,输入单元704可以包括图形处理器(GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器709可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述生僻字识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述生僻字识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (12)

1.一种生僻字识别方法,其特征在于,所述方法包括:
在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
2.根据权利要求1所述的生僻字识别方法,其特征在于,所述识别所述第一文本中的生僻字以及对应的生僻字级别,包括:
在所述生僻字级别为根据至少两项所述参数确定的情况下,确定每个所述参数对应的权重;
对所述参数加权求和,得到生僻字级别。
3.根据权利要求1所述的生僻字识别方法,其特征在于,所述预设阈值为与所述电子设备的用户对生僻字的识别等级对应的;所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
4.根据权利要求1所述的生僻字识别方法,其特征在于,在所述文字信息包括读音的情况下,所述显示所述生僻字的文字信息,包括:
显示所述生僻字的读音;
接收作用于所述生僻字的读音第一输入时,显示所述生僻字的释义以及起源中的至少一项。
5.根据权利要求1所述的生僻字识别方法,其特征在于,所述方法还包括:
在所述生僻字级别小于或等于所述预设阈值的情况下,在接收到作用于所述生僻字的第二输入时,显示所述生僻字的文字信息。
6.一种生僻字识别装置,其特征在于,所述装置包括:
确定模块,用于在显示界面显示第一文本的情况下,识别所述第一文本中的生僻字以及对应的生僻字级别;
其中,所述生僻字级别为根据所述生僻字的第一预设参数、第一搜索次数和第二搜索次数中的至少一项参数确定的;所述第一搜索次数包括所述生僻字在第一字库中的被搜索次数,所述第二搜索次数包括所述生僻字在电子设备的第二字库中的被搜索次数;
显示模块,用于在所述生僻字级别大于预设阈值的情况下,显示所述生僻字的文字信息;其中,所述文字信息包括读音、释义以及起源中的至少一项。
7.根据权利要求6所述的生僻字识别装置,其特征在于,所述确定模块包括:
确定子模块,用于在所述生僻字级别为根据至少两项所述参数确定的情况下,确定每个所述参数对应的权重;
处理子模块,用于对所述参数加权求和,得到生僻字级别。
8.根据权利要求6所述的生僻字识别装置,其特征在于,所述预设阈值为与所述电子设备的用户对生僻字的识别等级对应的;所述识别等级为预先设定的,或根据所述电子设备的用户画像以及所述第二字库中的文字搜索次数中的至少一项确定的。
9.根据权利要求6所述的生僻字识别装置,其特征在于,所述显示模块包括:
第一显示子模块,用于显示所述生僻字的读音;
第二显示子模块,用于接收作用于所述生僻字的读音第一输入时,显示所述生僻字的释义以及起源中的至少一项。
10.根据权利要求6所述的生僻字识别装置,其特征在于,所述装置还包括:
接收模块,用于在所述生僻字级别小于或等于所述预设阈值的情况下,在接收到作用于所述生僻字的第二输入时,显示所述生僻字的文字信息。
11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至5中任一项所述的生僻字识别方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至5中任一项所述的生僻字识别方法的步骤。
CN202110109618.1A 2021-01-26 2021-01-26 生僻字识别方法及装置 Pending CN112765445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110109618.1A CN112765445A (zh) 2021-01-26 2021-01-26 生僻字识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110109618.1A CN112765445A (zh) 2021-01-26 2021-01-26 生僻字识别方法及装置

Publications (1)

Publication Number Publication Date
CN112765445A true CN112765445A (zh) 2021-05-07

Family

ID=75706059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110109618.1A Pending CN112765445A (zh) 2021-01-26 2021-01-26 生僻字识别方法及装置

Country Status (1)

Country Link
CN (1) CN112765445A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171653A (zh) * 2022-05-25 2022-10-11 深圳市世强元件网络有限公司 一种生僻字发音提醒方法、装置及计算机设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1196519A (zh) * 1998-02-27 1998-10-21 英业达股份有限公司 智能化单字提示方法
CN102855480A (zh) * 2012-08-07 2013-01-02 北京百度网讯科技有限公司 一种图像文字识别方法和装置
CN103186581A (zh) * 2011-12-30 2013-07-03 牟颖 一种通过手机快速对书本生僻字发音进行获取的方法
CN103209245A (zh) * 2012-01-13 2013-07-17 陈九 一种手机上查询汉字偏僻字的方法
CN103425257A (zh) * 2012-05-24 2013-12-04 北京搜狗科技发展有限公司 一种生僻字符信息的提示方法和装置
CN108762857A (zh) * 2018-04-11 2018-11-06 珠海市魅族科技有限公司 一种信息处理方法和装置、终端、可读存储介质
US20180364905A1 (en) * 2017-06-15 2018-12-20 Boris Mikhailovich Putko Method, system and keyboard for input of characters
CN110555441A (zh) * 2019-09-10 2019-12-10 杭州橙鹰数据技术有限公司 一种文字识别方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1196519A (zh) * 1998-02-27 1998-10-21 英业达股份有限公司 智能化单字提示方法
CN103186581A (zh) * 2011-12-30 2013-07-03 牟颖 一种通过手机快速对书本生僻字发音进行获取的方法
CN103209245A (zh) * 2012-01-13 2013-07-17 陈九 一种手机上查询汉字偏僻字的方法
CN103425257A (zh) * 2012-05-24 2013-12-04 北京搜狗科技发展有限公司 一种生僻字符信息的提示方法和装置
CN102855480A (zh) * 2012-08-07 2013-01-02 北京百度网讯科技有限公司 一种图像文字识别方法和装置
US20180364905A1 (en) * 2017-06-15 2018-12-20 Boris Mikhailovich Putko Method, system and keyboard for input of characters
CN108762857A (zh) * 2018-04-11 2018-11-06 珠海市魅族科技有限公司 一种信息处理方法和装置、终端、可读存储介质
CN110555441A (zh) * 2019-09-10 2019-12-10 杭州橙鹰数据技术有限公司 一种文字识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171653A (zh) * 2022-05-25 2022-10-11 深圳市世强元件网络有限公司 一种生僻字发音提醒方法、装置及计算机设备

Similar Documents

Publication Publication Date Title
CN108319489B (zh) 应用页面的启动方法、装置、存储介质及电子设备
CN111381751A (zh) 一种文本处理方法及装置
US20120163664A1 (en) Method and system for inputting contact information
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
CN109933805B (zh) 文本解析方法、系统及计算机可读存储介质
CN105893613B (zh) 一种图像标识信息搜索方法及装置
CN104077273A (zh) 一种对网页内容抽取的方法及装置
CN112099704A (zh) 信息显示方法、装置、电子设备和可读存储介质
CN112416142A (zh) 输入文字的方法、装置和电子设备
CN111967367B (zh) 图像内容提取方法、装置及电子设备
CN105975554B (zh) 基于移动终端的大数据搜索方法及装置
US9501220B2 (en) Device and method for extracting data on a touch screen
CN104281560B (zh) 一种记忆文本信息的显示方法、装置及终端
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
CN112765445A (zh) 生僻字识别方法及装置
CN111610917B (zh) 显示方法、显示装置和电子设备
CN113239302A (zh) 页面显示方法、装置及电子设备
CN112307273B (zh) 信息查询方法、装置及电子设备
CN103116408A (zh) 智能输入方法和设备
CN111353422B (zh) 信息提取方法、装置及电子设备
CN112764551A (zh) 词汇显示方法、装置和电子设备
CN114416664A (zh) 信息显示方法、信息显示装置、电子设备和可读存储介质
CN112328097A (zh) 输入控制方法及装置
CN112286613A (zh) 界面显示方法及界面显示装置
CN112698734A (zh) 候选词显示方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination