CN112163400A - 信息处理方法及装置 - Google Patents
信息处理方法及装置 Download PDFInfo
- Publication number
- CN112163400A CN112163400A CN202010603141.8A CN202010603141A CN112163400A CN 112163400 A CN112163400 A CN 112163400A CN 202010603141 A CN202010603141 A CN 202010603141A CN 112163400 A CN112163400 A CN 112163400A
- Authority
- CN
- China
- Prior art keywords
- word
- target
- standard
- character
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 230000004044 response Effects 0.000 claims abstract description 6
- 238000005516 engineering process Methods 0.000 claims description 24
- 238000005259 measurement Methods 0.000 claims description 19
- 230000001788 irregular Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000013473 artificial intelligence Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Character Discrimination (AREA)
Abstract
本申请公开了一种信息处理方法及装置,属于通信技术领域。该方法主要包括接收用户手写第一字的第一输入;响应于第一输入,确定与第一字对应的笔迹信息;根据笔迹信息,生成与第一字具有相同字体风格的目标字,第一字与目标字为不同字;在目标字满足预设条件的情况下,确定目标字为不规范字。能够解决由字体生成技术生成的字不满足质量要求的问题。
Description
技术领域
本申请属于通信技术领域,具体涉及一种信息处理方法及装置。
背景技术
随着电子设备以及移动互联网的发展,用户可以根据自己的手写字定制具有个人风格的字库。
目前,字体生成技术通过用户手写的数十个字,生成包含数万字的整套手写字库。但是,当前字体生成技术仅能在统计上保证生成字的结果符合正确的分布,当生成包含数万字的整套字库时,如图1所示,难免出现诸如笔画缺失、笔画多余、笔画断裂、笔画扭曲等异常现象,即生成了错字或者别字。这样,会使字体生成技术生成的字不满足质量要求,以使用户无法使用字体生成技术定制具有个人风格的字库。
发明内容
本申请实施例的目的是提供一种信息处理方法及装置,能够解决由字体生成技术生成的字不满足质量要求的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种信息处理方法,该方法包括:
接收用户手写第一字的第一输入;
响应于第一输入,确定与第一字对应的笔迹信息;
根据笔迹信息,生成与第一字具有相同字体风格的目标字,第一字与目标字为不同字;
在目标字满足预设条件的情况下,确定目标字为不规范字。
第二方面,本申请实施例提供了一种信息处理装置,该装置包括:
接收模块,用于用户手写第一字的第一输入;
第一确定模块,用于确定与第一字对应的笔迹信息;
生成模块,用于根据笔迹信息,生成与第一字具有相同字体风格的目标字,第一字与目标字为不同字;
第二确定模块,用于在目标字满足预设条件的情况下,确定目标字为不规范字。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面涉及的方法步骤。
第四方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面涉及的方法步骤。
第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面涉及的方法步骤。
在本申请实施例中,通过用户手写的第一字,确定与第一字对应的笔迹信息,并根据该笔迹信息,生成与第一字具有相同字体风格且与第一字不同的目标字,然后,在检测到目标字满足预设条件时,确定目标字为不规范字。这样,本申请实施例中根据用户手写的第一字的笔迹信息可生成与第一字具有相同字体风格、且与第一字不同的目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字。可对由第一字生成的整套字如多个目标字中每一个字进行质量检测,以找出整套字中全部的错字或者别字,保证目标字满足质量要求。
附图说明
图1是一种不规范字的示意图;
图2为本申请实施例提供的一种信息处理方法的应用场景示意图;
图3为本申请实施例提供的一种信息处理方法的流程图;
图4为本申请实施例提供的一种基于三种预设条件的信息处理方法的流程示意图;
图5为本申请实施例提供的一种信息处理装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图;
图7为本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的信息处理方法进行详细地说明。
其中,本方案提出一种信息处理方法的架构,在接收到用户手写的多个如 20个第一字的情况下,提取20个第一字中每个第一字涉及的笔迹信息即用户书写文字符号形成的、能反映本人特有的书写动作习惯的一种特殊痕迹,这里,可以简单理解为,获取用户手写的具有用户自己风格的20个第一字,根据20 个第一字中每个第一字的笔迹信息,参照图2,如字1“我”中的撇“丿”、字 2“案”中的横折“乛”、字3“小”中的竖勾“亅”等。接着,根据这些笔迹信息以及通过人工智能字体生成技术,生成新的字即目标字,该目标字与第一字是具有相同字体风格的不同的字,如根据用户手写的第一字“我”、“案”和“小”的笔迹信息,生成目标字“你”。然后,检测“你”字是否满足预设条件,若满足预设条件,则确定该目标字为不规范字。
其中,不规范字主要指下述中的至少一种:繁体字、异体字、二简字、错字、别字、旧字形字、生造字。
但是,基于《国家通用语言文字法》第十七条对允许繁体字、异体字保留或使用的“特殊”情形作出了特殊规定:(一)文物古迹;(二)姓氏中的异体字;(三)书法、篆刻等艺术作品;(四)题词和招牌中的手书字;(五)出版、教学、研究中需要使用的;(六)特殊情况。由此,包括上述特殊的情况的字,且经过整理简化并以《简化字总表》与《通用规范汉字表》的形式,正式公布的简化字与传承字为规范字。
基于此,本申请实施例提供了一种信息处理方法,以鉴别基于用户手写的字,通过字体生成技术重新生成的目标字是否出现不规范字,便于后期将不规范字更换为规范字,能够提高由字体生成技术生成字的质量。另外,本申请实施例中的信息处理方法,无需用户手写全部汉字,仅根据用户手写的部分字即可生成与第一字具有相同字体风格、且不同字的整套字如目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字,这样,无需增加用户手写全部字的负担,减少用户操作,在保证目标字满足质量要求的同时,提高用户体验。
根据上述应用场景,下面结合图3对本申请实施例提供的信息处理方法进行详细说明。
图3为本申请实施例提供的一种信息处理方法的流程图。
如图3所示,该信息处理方法具体可以包括如下步骤:
首先,步骤310,接收用户手写第一字的第一输入。
其次,步骤320,响应于所述第一输入,确定与所述第一字对应的笔迹信息。
接着,步骤330,根据所述笔迹信息,生成与所述第一字具有相同字体风格的目标字,所述第一字与所述目标字为不同字。
然后,步骤340,在目标字满足预设条件的情况下,确定目标字为不规范字。
由此,本申请实施例中根据用户手写的第一字的笔迹信息即可生成与第一字具有相同字体风格、且与第一字不同的目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字。可对由第一字生成的整套字如多个目标字中每一个字进行质量检测,以找出整套字中全部的错字或者别字,保证目标字满足质量要求。
下面对上述步骤进行详细说明,具体如下所示:
首先,涉及步骤330,在一种可能的实施例中,该步骤具体可以包括:
根据笔迹信息,通过人工智能字体生成技术生成与第一字具有相同字体风格的目标字。
举例说明,获取用户手写的具有用户自己风格的20个第一字,根据20个第一字中每个第一字的笔迹信息如字1“我”中的横折“乛”、字2“案”中的撇“丿”、字3“小”中的竖钩“亅”等。接着,根据这些笔迹信息(或者,根据笔迹信息并结合人工智能字体生成技术),生成新的字即目标字“你”,该目标字与第一字是具有相同字体风格的不同的字。
这样,无需用户手写全部汉字,仅根据用户手写的部分字即可生成与第一字具有相同字体风格、且不同字的目标字即可,减少用户手写全部字的负担,提高了用户体验。
需要说明的是,本申请实施例中不对待鉴别的字即目标字做范围的限定,也就是说,在目标字为一个时,可以对该目标字进行鉴别,在目标字包括多个时,可以对多个目标字中的每个字进行鉴别,也可以对多个目标字中的部分字进行鉴别。当然,在一些场景下,也可以对用户手写的第一字进行鉴别。
然后,涉及步骤340,在步骤340之前,该方法还可以包括检测目标字是否满足预设条件;其中,预设条件包括下述中的至少一种:
目标字在不规范字集合中、目标字的结构特征为不规范字的结构特征、目标字和目标规范字之间的目标距离度量满足预设距离度量,目标规范字是目标字的规范字,目标规范字和目标字为相同字。
基于此,在目标字满足预设条件的情况下,确定目标字为不规范字;反之,在目标字未满足预设条件的情况下,确定目标字为规范字。
下面根据上述涉及到的不同的预设条件,详细说明在不同的预设条件下如何确定目标字为不规范字。
(1)在预设条件为目标字在不规范字集合中的情况下。
获取多个第二字,第二字由人工智能字体生成技术根据多个用户手写的字的笔迹信息生成;
从多个第二字中选取不规范的至少一个第三字,并根据至少一个第三字生成不规范字集合;
在检测到目标字在不规范字集合中的情况下,确定目标字为不规范字。
举例说明,基于大数据和人工智能技术,预先收集人工智能字体生成技术生成的数百套甚至更多套的手写字,统计错字和别字出现的频率,选取出错频率满足预设阈值的一些字如笔画稠密的复杂字,由于当前的人工智能字体生成技术在生成这些复杂字时,如图1所示,容易产生笔画断裂、扭曲、缺失、多余等现象,所以,可以将这些笔画稠密的复杂字确定为不规范字如错字和别字。接着,根据这些确定的错字和别字,生成不规范字集合。然后,将目标字与不规范字集合中的字进行匹配,若确定该目标字在不规范字集合中,那么确定目标字为不规范字。
(2)预设条件为目标字的结构特征为不规范字的结构特征时。
由于每个规范字都有自己的笔画结构和布局,若对每一个字制定正确字规则,需要制定上万种规则,比较繁琐。由此,本申请实施例中根据不规范字如错字和别字的结构特征,构建不规范字的结构特征,以减少需要人工制定规则的数量。
基于此,根据预设不规范字(如(1)中方式确定的错字和别字)进行数学形态学分析,确定不规范字的结构特征;然后,对目标字进行数学形态学分析,得到目标字的结构特征;检测目标字的结构特征是否与不规范字的结构特征相同或者相似程度满足预设相似阈值,在目标字的结构特征与不规范字的结构特征相同或者相似程度满足预设相似阈值时,确定目标字的结构特征为不规范字的结构特征,由此,确定目标字为不规范字。
举例说明,对人工智能字体生成技术生成的目标字进行数学形态学分析,其中,可以是提取目标字中的连通成分,得到目标字的结构特征,然后,根据目标字的结构特征如笔画结构或者笔画数,是否与不规范字的结构特征相同或者相似程度满足预设相似阈值,以进行不规范字的鉴别。在目标字的结构特征与不规范字的结构特征相同或者相似程度满足预设相似阈值时,确定目标字的结构特征为不规范字的结构特征。
(3)预设条件为目标字和目标规范字之间的目标距离度量满足预设距离度量时。
这里,可以根据与目标字对应的目标规范字以及目标深度网络模型,确定目标字是否为规范字,具体步骤如下所示:
首先,确定目标深度网络模型,具体可以包括:
获取第四字,第四字由人工智能字体生成技术根据多个用户手写的字生成,第四字包括多个不规范字和多个规范字;
根据多个不规范字和多个规范字,生成样本集;
根据样本集对深度网络模型进行训练,直至满足预设训练停止条件,得到目标深度网络模型。
然后,获取与目标字对应的目标规范字;将目标字与目标规范字输入到目标深度网络模型中,得到目标字对应的第一深度特征以及目标规范字对应的第二深度特征;根据第一深度特征和第二深度特征,确定目标字和目标规范字之间的目标距离度量;在目标距离度量满足预设距离度量的情况下,确定目标字为不规范字。
这里,需要提示的是,确定目标深度网络模型和获取与目标字对应的目标规范字的先后顺序在此不再限定,上面只是以先确定目标深度网络模型,后获取规范字为例进行说明,当然,也可以先获取目标规范字,再确定目标深度网络模型,还可以两者同时进行。
举例说明,由于不同标准字体的风格如笔画粗细、笔画弯曲度、笔锋、字体颜色等各不相同。如同一个字对应的宋体和楷体具有不同字体风格,与草书的差别更为明显,再考虑到每个人的手写体风格自成一类,所以,通过人工智能字体生成技术根据多个用户手写的字生成的数万种字体,将每一种字体中的字都分为不规范字和规范字,即正确字和错字(或者别字)。然后,基于这些不规范字和多个规范字,结合深度网络模型如Siamese网络模型进行训练,以得到目标深度网络模型,由此,充分训练的目标深度网络模型可以避免字体风格对字的干扰,准确刻画每个字的本质特征。
接着,在获取到目标字时,可以根据电子设备中操作系统或者一些第三方字体应用程序提供的标准字体如宋体字、楷体字、黑字体等中确定目标字对应的规范字。其中,可以从关于宋体字的ttf文件读取与目标字对应的目标规范字。一般来说,与目标字对应的目标规范字通常只有一个。当然,在一些情况下,该目标字有可能与字A和字B都很相似,此时,可以根据字A与目标字的相似度,以及字B与目标字的相似度,确定与目标字对应的目标规范字。如,可以选择两个相似度中较高的相似度对应的字,为目标规范字。
然后,将目标字与目标规范字输入到目标深度网络模型中,得到目标字对应的第一深度特征以及目标规范字对应的第二深度特征。根据目标字对应的第一深度特征以及目标规范字对应的第二深度特征,计算目标字和目标规范字之间的目标距离度量,若目标距离度量大于预设距离度量的情况下,则确定目标字为不规范字;反之,为规范字即为合格字。
这里,预设距离度量可以是人工标定,也可以是根据海量不规范字和规范字经过深度学习确定。
由此,目标深度网络模型具体可以用于确定目标字和目标规范字之间的目标距离度量,以区分两个字是否属于同一个字,从而确定目标字是否为不规范字。
另外,本申请实施例中是通过对Siamese网络模型进行训练,当然,也可以采用其他结构的网络模型进行训练,以避免字体风格对字的干扰,应与上述 Siamese网络模型相关原理相同,在此不再赘述。
需要说明的是,上述涉及的不同的预设条件,可以单独使用,也可以两两结合、或者三种同时使用。如图4所示,若(1)、(2)和(3)一起使用时,3 个预设条件的先后顺序在此并不限定,但这里以(1)、(2)和(3)的顺序为例进行说明,基于统计先验的评价准则,将目标字先经过(1)的预设条件进行鉴别,在(1)确定目标字为不规范字时,流程结束;反之,在(1)确定目标字为规范字时,基于客观规则的评价准则,再将该目标字经过(2)的预设条件进行鉴别。同理,在(2)确定目标字为不规范字时,流程结束;反之,在(2)确定目标字为规范字时,基于深度特征的评价准则,在将该目标字经过(3)的预设条件进行鉴别,直至得到确定目标字是不规范字还是规范字的结果。这里,若在经过(1)和(2)的情况下,已经确定目标字是不规范字,为了节省计算时间,可以无需经过(3)的鉴别。但是,为了保证确定目标字是否为不规范字的准确性,可以将目标字经过(1)、(2)和(3)的预设条件进行鉴别。这样,本申请实施例能够实现便利、准确且全面的不规范字的鉴别。本申请实施例中先后融合了统计先验、客观规则与深度特征进行错别字检测,在无需用户额外手写任何字、不增加用户负担的条件下,即可对人工智能字体生成技术生成的整套字中每一个目标字进行质量评价,能够找出整套字中的不规范字以便于替换为正确的字,保证良好的用户体验,在保证目标字满足质量要求的同时,提高用户体验。
至此,本申请实施例中可能的鉴别方式已经完成,可以对人工智能字体生成技术生成的每一个字进行鉴别,确定该字是否为不规范字。
另外,在一种可能的实施例中,在确定目标字为不规范字之后,该方法还可以包括:根据目标规范字更新目标字。
综上,通过鉴别字体生成技术重新生成的目标字是否出现不规范字,便于后期将不规范字更换为规范字,能够提高由字体生成技术生成字的质量。另外,本申请实施例中的信息处理方法,无需用户手写全部汉字,仅根据用户手写的部分字即可生成与第一字具有相同字体风格、且不同字的整套字如目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字,这样,无需增加用户手写全部字的负担,减少用户操作,在保证目标字满足质量要求的同时,提高用户体验。
需要说明的是,本申请实施例提供的信息处理方法,执行主体可以为信息处理装置,或者该信息处理装置中的用于执行信息处理方法的控制模块。本申请实施例中以信息处理装置执行信息处理的方法为例,结合图3说明本申请实施例提供的信息处理装置。
图5为本申请实施例提供的一种信息处理装置的结构示意图。
如图5所示,该信息处理装置500具体可以包括:
接收模块501,用于用户手写第一字的第一输入;
第一确定模块502,用于确定与所述第一字对应的笔迹信息;
生成模块503,用于根据所述笔迹信息,生成与所述第一字具有相同字体风格的目标字,所述第一字与所述目标字为不同字;
第二确定模块504,用于在所述目标字满足预设条件的情况下,确定所述目标字为不规范字。
在本申请实施例中,通过用户手写的第一字,确定与第一字对应的笔迹信息,并根据该笔迹信息,生成与第一字具有相同字体风格且与第一字不同的目标字,然后,在检测到目标字满足预设条件时,确定目标字为不规范字。这样,本申请实施例中根据用户手写的第一字的笔迹信息可生成与第一字具有相同字体风格、且与第一字不同的目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字。可对由第一字生成的整套字如多个目标字中每一个字进行质量检测,以找出整套字中全部的错字或者别字,保证目标字满足质量要求。
下面对该信息处理装置500进行详细说明,具体如下所示:
在一种可能的实施例中,第二确定模块504具体用于,在预设条件包括目标字在不规范字集合中的情况下,获取多个第二字,第二字为利用人工智能字体生成技术根据多个用户手写的字的笔迹信息生成;
从多个第二字中选取不规范的至少一个第三字,并根据至少一个第三字生成不规范字集合;
在目标字在不规范字集合中的情况下,确定目标字为不规范字。
在另一个可能的实施例中,第二确定模块504具体用于,在预设条件包括目标字的结构特征为不规范字的结构特征的情况下,对目标字进行数学形态学分析,得到目标字的结构特征;
在目标字的结构特征为不规范字的结构特征时,确定目标字为不规范字,不规范字的结构特征由对预设不规范字进行数学形态学分析确定。
在又一个可能的实施例中,第二确定模块504具体用于,在预设条件包括目标字和目标规范字之间的目标距离度量满足预设距离度量,目标规范字是目标字的规范字,目标规范字和目标字为相同字的情况下,获取目标字的目标规范字;
将目标字与目标规范字输入到目标深度网络模型中,得到目标字对应的第一深度特征以及目标规范字对应的第二深度特征;
根据第一深度特征和第二深度特征,确定目标字和目标规范字之间的目标距离度量;
在目标距离度量满足预设距离度量的情况下,确定目标字为不规范字。
另外,在再一个可能的实施例中,上述涉及的信息处理装置500还包括:
更新模块505,用于根据目标规范字更新目标字。
本申请实施例中的信息处理装置可以是装置,也可以是电子设备中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA) 等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的信息处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的信息处理装置能够实现图2至图4的方法实施例实现的各个过程,为避免重复,这里不再赘述。
综上,在本申请实施例中,通过鉴别字体生成技术重新生成的目标字是否出现不规范字,便于后期将不规范字更换为规范字,能够提高由字体生成技术生成字的质量。另外,本申请实施例中的信息处理方法,无需用户手写全部汉字,仅根据用户手写的部分字即可生成与第一字具有相同字体风格、且不同字的整套字如目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字,这样,无需增加用户手写全部字的负担,减少用户操作,在保证目标字满足质量要求的同时,提高用户体验。
可选的,如图6所示,本申请实施例还提供一种电子设备600,包括处理器601,存储器602,存储在存储器602上并可在处理器601上运行的程序或指令,该程序或指令被处理器601执行时实现上述信息处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
图7为本申请实施例提供的一种电子设备的硬件结构示意图。
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、以及处理器710等部件。
本领域技术人员可以理解,电子设备700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,用户输入单元707,用于接收用户手写第一字的第一输入。
处理器710,用于响应于第一输入,确定与第一字对应的笔迹信息;根据笔迹信息,生成与第一字具有相同字体风格的目标字,第一字与目标字为不同字;在目标字满足预设条件的情况下,确定目标字为不规范字。
由此,本申请实施例中无需用户手写全部汉字,仅根据用户手写的部分字即可生成与第一字具有相同字体风格、且不同字的目标字,然后根据预设条件即可对目标字进行质量检测,找出其中不规范字如错字或者别字。在不增加用户手写全部字负担的同时,可对由第一字生成的整套字如多个目标字中每一个字进行质量检测,以找出整套字中全部的错字或者别字,保证目标字满足质量要求。
应理解的是,本申请实施例中,输入单元704可以包括图形处理器 (GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707 包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备 7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器709可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述信息处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。其中,可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
另外,本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述音频处理法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
接收用户手写第一字的第一输入;
响应于所述第一输入,确定与所述第一字对应的笔迹信息;
根据所述笔迹信息,生成与所述第一字具有相同字体风格的目标字,所述第一字与所述目标字为不同字;
在所述目标字满足预设条件的情况下,确定所述目标字为不规范字。
2.根据权利要求1所述的方法,其特征在于,所述预设条件包括所述目标字在不规范字集合中;所述在所述目标字满足预设条件的情况下,确定所述目标字为不规范字,包括:
获取多个第二字,所述第二字为利用人工智能字体生成技术根据多个用户手写的字的笔迹信息生成;
从所述多个第二字中选取不规范的至少一个第三字,并根据所述至少一个第三字生成不规范字集合;
在所述目标字在所述不规范字集合中的情况下,确定所述目标字为不规范字。
3.根据权利要求1所述的方法,其特征在于,所述预设条件包括所述目标字的结构特征为不规范字的结构特征;所述在所述目标字满足预设条件的情况下,确定所述目标字为不规范字,包括:
对所述目标字进行数学形态学分析,得到所述目标字的结构特征;
在所述目标字的结构特征为不规范字的结构特征时,确定所述目标字为不规范字,所述不规范字的结构特征由对预设不规范字进行数学形态学分析确定。
4.根据权利要求1所述的方法,其特征在于,所述预设条件包括所述目标字和目标规范字之间的目标距离度量满足预设距离度量,所述目标规范字是所述目标字的规范字,所述目标规范字和所述目标字为相同字;所述在所述目标字满足预设条件的情况下,确定所述目标字为不规范字,包括:
获取所述目标字的目标规范字;
将所述目标字与所述目标规范字输入到目标深度网络模型中,得到所述目标字对应的第一深度特征以及所述目标规范字对应的第二深度特征;
根据所述第一深度特征和所述第二深度特征,确定所述目标字和所述目标规范字之间的目标距离度量;
在所述目标距离度量满足所述预设距离度量的情况下,确定所述目标字为不规范字。
5.根据权利要求4所述的方法,其特征在于,在所述确定所述目标字为不规范字之后,所述方法还包括:
根据所述目标规范字更新所述目标字。
6.一种信息处理装置,其特征在于,包括:
接收模块,用于接收用户手写第一字的第一输入;
第一确定模块,用于响应于所述第一输入,确定与所述第一字对应的笔迹信息;
生成模块,用于根据所述笔迹信息,生成与所述第一字具有相同字体风格的目标字,所述第一字与所述目标字为不同字;
第二确定模块,用于在所述目标字满足预设条件的情况下,确定所述目标字为不规范字。
7.根据权利要求6所述的装置,其特征在于,所述第二确定模块具体用于,在所述预设条件包括所述目标字在不规范字集合中的情况下,获取多个第二字,所述第二字为利用人工智能字体生成技术根据多个用户手写的字的笔迹信息生成;
从所述多个第二字中选取不规范的至少一个第三字,并根据所述至少一个第三字生成不规范字集合;
在所述目标字在所述不规范字集合中的情况下,确定所述目标字为不规范字。
8.根据权利要求6所述的装置,其特征在于,所述第二确定模块具体用于,在所述预设条件包括所述目标字的结构特征为不规范字的结构特征的情况下,对所述目标字进行数学形态学分析,得到所述目标字的结构特征;
在所述目标字的结构特征为不规范字的结构特征时,确定所述目标字为不规范字,所述不规范字的结构特征由对预设不规范字进行数学形态学分析确定。
9.根据权利要求6所述的装置,其特征在于,所述第二确定模块具体用于,在所述预设条件包括所述目标字和目标规范字之间的目标距离度量满足预设距离度量,所述目标规范字是所述目标字的规范字,所述目标规范字和所述目标字为相同字的情况下,获取所述目标字的目标规范字;
将所述目标字与所述目标规范字输入到目标深度网络模型中,得到所述目标字对应的第一深度特征以及所述目标规范字对应的第二深度特征;
根据所述第一深度特征和所述第二深度特征,确定所述目标字和所述目标规范字之间的目标距离度量;
在所述目标距离度量满足所述预设距离度量的情况下,确定所述目标字为不规范字。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
更新模块,用于根据所述目标规范字更新所述目标字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010603141.8A CN112163400B (zh) | 2020-06-29 | 2020-06-29 | 信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010603141.8A CN112163400B (zh) | 2020-06-29 | 2020-06-29 | 信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163400A true CN112163400A (zh) | 2021-01-01 |
CN112163400B CN112163400B (zh) | 2024-07-05 |
Family
ID=73860470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010603141.8A Active CN112163400B (zh) | 2020-06-29 | 2020-06-29 | 信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163400B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023134402A1 (zh) * | 2022-01-14 | 2023-07-20 | 中国科学院深圳先进技术研究院 | 一种基于孪生卷积神经网络的书法字识别方法 |
CN117291923A (zh) * | 2023-11-27 | 2023-12-26 | 成都宏讯微电子科技有限公司 | 一种芯片封装质量评价方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646023A (zh) * | 2012-04-11 | 2012-08-22 | 广东欧珀移动通信有限公司 | 一种用户原始笔迹字体的生成方法 |
CN103390358A (zh) * | 2013-07-03 | 2013-11-13 | 广东小天才科技有限公司 | 对电子设备的字符书写操作进行规范性判断的方法及装置 |
CN107247692A (zh) * | 2017-05-26 | 2017-10-13 | 北京小米移动软件有限公司 | 信息处理方法及设备 |
CN109635883A (zh) * | 2018-11-19 | 2019-04-16 | 北京大学 | 基于深度堆叠网络的结构信息指导的中文字库生成方法 |
WO2019232854A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
-
2020
- 2020-06-29 CN CN202010603141.8A patent/CN112163400B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646023A (zh) * | 2012-04-11 | 2012-08-22 | 广东欧珀移动通信有限公司 | 一种用户原始笔迹字体的生成方法 |
CN103390358A (zh) * | 2013-07-03 | 2013-11-13 | 广东小天才科技有限公司 | 对电子设备的字符书写操作进行规范性判断的方法及装置 |
CN107247692A (zh) * | 2017-05-26 | 2017-10-13 | 北京小米移动软件有限公司 | 信息处理方法及设备 |
WO2019232854A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
CN109635883A (zh) * | 2018-11-19 | 2019-04-16 | 北京大学 | 基于深度堆叠网络的结构信息指导的中文字库生成方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023134402A1 (zh) * | 2022-01-14 | 2023-07-20 | 中国科学院深圳先进技术研究院 | 一种基于孪生卷积神经网络的书法字识别方法 |
CN117291923A (zh) * | 2023-11-27 | 2023-12-26 | 成都宏讯微电子科技有限公司 | 一种芯片封装质量评价方法及系统 |
CN117291923B (zh) * | 2023-11-27 | 2024-02-09 | 成都宏讯微电子科技有限公司 | 一种芯片封装质量评价方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112163400B (zh) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416198B (zh) | 人机识别模型的建立装置、方法及计算机可读存储介质 | |
CN106650780B (zh) | 数据处理方法及装置、分类器训练方法及系统 | |
KR101825154B1 (ko) | 중첩 쓰기 핸드라이팅 입력방법 | |
CN106940788B (zh) | 智能评分方法及装置、计算机设备及计算机可读介质 | |
CN102855082B (zh) | 用于重叠文本用户输入的字符识别 | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
CN109284372B (zh) | 用户操作行为分析方法、电子装置及计算机可读存储介质 | |
CN109189519B (zh) | 一种通用的用户桌面行为模拟系统及方法 | |
CN111507330B (zh) | 习题识别方法、装置、电子设备及存储介质 | |
CN102750552B (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN111832396B (zh) | 文档布局的解析方法、装置、电子设备和存储介质 | |
CN112541332B (zh) | 表单信息抽取方法、装置、电子设备及存储介质 | |
CN111984589A (zh) | 文档处理方法、文档处理装置和电子设备 | |
CN114730241B (zh) | 触摸式用户界面输入中的手势笔画识别 | |
CN112163400B (zh) | 信息处理方法及装置 | |
CN104794485A (zh) | 一种识别书写字的方法及装置 | |
CN114549993A (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN111881683A (zh) | 关系三元组的生成方法、装置、存储介质和电子设备 | |
CN115205883A (zh) | 基于ocr和nlp的资料审核方法、装置、设备、存储介质 | |
CN113076939B (zh) | 语境化字符识别系统 | |
CN112749639B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN104077268A (zh) | 整形装置 | |
CN111414728A (zh) | 数值数据展示方法、装置、计算机设备和存储介质 | |
CN104850819B (zh) | 信息处理方法及电子设备 | |
CN114021480A (zh) | 模型优化方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |