CN113553524B - 一种网页的文字排版方法、装置、设备和存储介质 - Google Patents

一种网页的文字排版方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113553524B
CN113553524B CN202110744838.1A CN202110744838A CN113553524B CN 113553524 B CN113553524 B CN 113553524B CN 202110744838 A CN202110744838 A CN 202110744838A CN 113553524 B CN113553524 B CN 113553524B
Authority
CN
China
Prior art keywords
text
typesetting
picture
content
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110744838.1A
Other languages
English (en)
Other versions
CN113553524A (zh
Inventor
徐治钦
周桂麟
冯嘉妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hard Link Network Technology Co ltd
Original Assignee
Shanghai Hard Link Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hard Link Network Technology Co ltd filed Critical Shanghai Hard Link Network Technology Co ltd
Priority to CN202110744838.1A priority Critical patent/CN113553524B/zh
Publication of CN113553524A publication Critical patent/CN113553524A/zh
Application granted granted Critical
Publication of CN113553524B publication Critical patent/CN113553524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开一种网页的文字排版方法,包括:响应于对网页的语言类型的切换操作,获取网页的语言类型转换后的文字内容、页面图片及页面图片的位置信息;通过对页面图片进行识别以确定与其对应的转换后的文字内容;根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;将所述转换后的文字内容排版在所述网页对应的所述排版区域。本发明还公开了一种网页的文字排版装置、设备和存储介质,其能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上。

Description

一种网页的文字排版方法、装置、设备和存储介质
技术领域
本发明涉及计算机技术领域,具体的说,涉及的是一种网页的文字排版方法、装置、设备和存储介质。
背景技术
现有技术中,网页包含很多图片内容和文本内容,网页中文本内容用于与文本内容对应的图片内容进行解释说明。目前,当对网页上的文本内容中的文字的语言类型进行切换时,仅会对文本内容中的文字的语言类型进行切换,并直接将经语言类型转换后的文字直接排版在原有的排版区域内,但是会存在以下问题:经语言类型转换后的文字内容可能会与网页中对应的网页图片的图片内容具有内容关联,若继续将经语言类型转换后的文字内容排版在原有的排版区域内,而原有的排版区域与对应的网页图片相距较远,那么会导致可能出现语言类型转换后的文字的排版位置与对应的网页图片的排版位置不匹配,从而出现网页上的文字排版不合理的问题。所以,在网页的语言切换过程中,亟需解决上述技术缺陷。
发明内容
本发明实施例的目的是提供一种网页的文字排版方法、装置、设备及存储介质,其能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上。
为实现上述目的,本发明实施例提供了一种网页的文字排版方法,包括:
响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
作为上述方案的改进,
所述方法还包括:
将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
获取与所述转换前的文字内容对应的文字排版顺序;
根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述将所述转换后的文字内容排版在所述网页对应的所述排版区域中,具体包括:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
作为上述方案的改进,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述方法还包括:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
作为上述方案的改进,所述文字排版样式还包括字体、字号、字距、对齐方式和行距;
则,所述方法还包括:
根据所述排版区域的大小和所述转换后的文字内容的字数,确定转换后的文字内容的字体、字号、字距、对齐方式和行距。
作为上述方案的改进,所述根据所述文字排版策略,将所述转换后的文字内容排版在所述排版区域中,具体包括:
根据所述转换后的文字内容的文字排版顺序和预设的折行算法,将所述转换后的文字内容排版在所述排版区域。
为实现上述目的,本发明实施例还提供了一种网页的文字排版装置,包括:
网页信息获取模块,用于响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
图片内容识别模块,用于对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
分析模块,用于根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
排版区域确定模块,用于根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
文字排版模块,用于将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
作为上述方案的改进,所述装置还包括:
文字映射模块,用于将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
排版方式获取模块,用于获取与所述转换前的文字内容对应的文字排版顺序;
排版策略确定模块,用于根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述文字排版模块,具体用于:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
作为上述方案的改进,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述排版策略确定模块,还用于:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
为实现上述目的,本发明实施例还提供了一种网页的文字排版设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例所述的网页的文字排版方法。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任一实施例所述的网页的文字排版方法。
与现有技术相比,本发明实施例公开的一种网页的文字排版方法、装置、设备和存储介质,通过对所述页面图片的图片内容进行识别,来得到所述图片内容的识别结果,从而根据所述页面图片的图片内容的识别结果,来确定与所述页面图片的图片内容对应的转换后的文字内容;通过根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,来对应确定所述转换后的文字内容在所述网页中的排版区域,以将所述转换后的文字内容排版在所述网页对应的所述排版区域中。由此可见,本发明实施例能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上,与页面图片的图片内容相匹配。
附图说明
图1是本发明一实施例提供的一种网页的文字排版方法的流程图;
图2是本发明一实施例提供的语言类型转换前的网页中页面图片及文字内容的显示示意图;
图3是本发明一实施例提供的语言类型转换后且重新排版的网页中页面图片及文字内容的显示示意图;
图4是本发明一实施例提供的一种网页的文字排版装置的结构框图;
图5是本发明一实施例提供的另一种网页的文字排版装置的结构框图;
图6是本发明一实施例提供的一种网页的文字排版设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明一实施例提供的一种网页的文字排版方法的流程图,参见图2,本发明一实施例提供的语言类型转换前的网页图片中图片对象及文字内容的显示示意图;参见图2,本发明一实施例提供的语言类型转换前的网页中页面图片及文字内容的显示示意图。
所述网页的文字排版方法可以通过用户端执行,所述用户端可以为电脑、手机、平板等用户终端设备;其中,所述用户端上可以装载有各种应用程序,包括浏览器,并用于呈现网页界面。作为举例,所述用户端可以包括显示屏和处理器,该显示屏用于呈现网页界面,该网页界面用于呈现页面图片和文字内容,以及与用户进行交互;该处理器用于获取网页、生成网页界面以及控制网页界面在显示屏上的显示;
所述网页的文字排版方法也可以由服务器执行,所述服务器可以IA架构服务器、RISC架构服务器等不同类型的服务器;其中,所述服务器端具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性,可以为用户端提供网页的响应服务请求、承担服务、保障服务。
具体地,所述方法包括步骤S11~S14:
S11、响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
S12、对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
S13、根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
S14、根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
S15、将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
在步骤S11中,作为举例地,可以在网页的页面中设置语言类型切换标签,当用户点击语言类型切换标签时,通过弹窗的方式展示多种语言类型标签以供用户选择,用户选择语言类型标签可通过鼠标点击,也可通过键盘输入,可通过触摸屏输入,在此不作限定,则对网页的语言类型的切换操作可以是接收到的用户对语言类型标签的选择指令;或者,可以对客户端所在的地区进行定位,选择该地区的通用语言进行语言类型的切换,在此不作限定;可以通过获取语言类型转换前的文字内容,根据需要切换到的语言类型,采用翻译软件(如google翻译、有道翻译等翻译软件)将语言类型转换前的文字内容进行翻译,得到转换后的文字内容,也可以通过在本地或者云端存储多种语言类型的文字内容,预先建立各个语言类型的文字内容之间的映射关系,在需要时从预先存储的多种网页语言的文字内容中,选出需要切换到的语言类型对应的文字内容,在此不作限定。
在步骤S14中,排版区域一般设置在对应的页面图片的位置的附近,且考虑了页面图片周围预设距离内的各网页页面元素的位置,避免排版区域与页面图片所在位置的附近的页面元素出现重叠的现象。
具体地,在步骤S14中,可通过以下方式确定排版区域:
根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,确定空白区域,以所述空白区域作为候选排版区域;
根据预设的排版区域选用规则,从所述空白区域中确定所述转换后的文字内容在所述网页中的排版区域。
具体地,所述排版区域选用规则可以是选出区域尺寸最大的空白区域作为排版区域;也可以是预先设置下限字号、下限字距和下限行距,再根据转换后的文字内容所占的字符数,确定转换后的文字内容按照下限字号、下限字距和下限行距进行排版所需的排版区域的最小尺寸,根据计算得到的排版区域的最小尺寸,从尺寸大于排版区域的最小尺寸的空白区域中随机选出排版区域;排版区域选用规则可根据实际应用进行确定,在此不作限定。
示例性的,如图2所示,网页中的页面图片和文字内容不能很好地匹配,当接收到键盘输入的指令时(响应于对网页的语言类型的切换操作),提取网页中的文字内容(“您好,欢迎光临”),并提取所述网页中的页面图片(带有欢迎手势的人物位置所在的页面图片)及所述页面图片在所述网页中的位置信息(带有欢迎手势的人物位置);根据当前需要切换到的语言类型(英文),采用翻译软件将所述文字内容(“您好,欢迎光临”)进行语言类型转换,得到转换后的文字内容(“Hello,welcome”);对页面图片(带有欢迎手势的人物位置所在的页面图片)的图片内容(带有欢迎手势的人物)进行识别,得到图片内容(带有欢迎手势的人物)的识别结果,根据识别结果来确定页面图片对应的转换后的文字内容(带有欢迎手势的人物的识别结果与英文的“Welcome”的对应关系,根据识别得到的带有欢迎手势的人物的识别结果,确定“带有欢迎手势的人物位置所在的页面图片”对应的一整句的文字内容为“Hello,welcome”);参阅图3,根据带有欢迎手势的人物位置所在的页面图片及其位置信息,对应确定“Hello,welcome”在所述网页中的排版区域;将“Hello,welcome”排版在对应的位置上。
在本实施例中,通过响应于对网页的语言类型的切换操作,来获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;通过对所述页面图片的图片内容进行识别,来得到所述图片内容的识别结果,从而根据所述页面图片的图片内容的识别结果,来确定与所述页面图片的图片内容对应的转换后的文字内容;通过根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,来对应确定所述转换后的文字内容在所述网页中的排版区域,以将所述转换后的文字内容排版在所述网页对应的所述排版区域中。由此可见,本发明实施例能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上,与页面图片的图片内容相匹配。
在一种实施方式中,在步骤S12中,对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果的过程可以是:
将页面图片输入到预先训练好的图像分类识别模型中,得到所述页面图片的图片内容的识别结果。
示例性的,将页面图片(带有欢迎手势的人物)输入到预先训练好的图像分类识别模型(比如CNN图像识别分类模型)中,得到页面图片的图片内容的识别结果,对应的识别结果为“抬手”。
在一种实施方式中,在步骤S13中,可通过以下方式来实现根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容:
基于预设的图片内容的识别结果与文字样本集的对应关系,获取与所述图片内容的识别结果对应的文字样本集;所述文字样本集包括至少一个与所述图片内容识别结果预先对应的文字样本;
计算转换后的文字内容与文字样本集信息中各文字样本的文本的匹配度,并将所有的匹配度的值相加后求平均值,得到平均匹配度;
若所述平均匹配度大于预设的匹配度阈值,将所述转换后的文字内容对应于与所述文字样本集对应的页面图片。
示例性的,转换后的文字内容为中文的“您好,欢迎光临”四个字,含有“欢迎手势的人物”的页面图片的识别结果为“抬手”,其中,预设有“抬手的文字样本集”与图片识别结果为“抬手”的对应关系,则可以基于该对应关系,获取与图片识别结果为“抬手”对应的“抬手的文字样本集”。其中,“抬手的文字样本集”包含有“您好,欢迎光临”、“您好,请进”这些文字样本,预设的匹配度阈值为50%。则转换后的中文的“您好,欢迎光临”与“抬手的文字样本集”中的文字样本的匹配过程为:计算转换后的文字内容(“您好,欢迎光临”)和文字样本集信息(“您好,欢迎光临”、“您好,请进”)中两个文字样本的文本的匹配度,得到转换后的文字内容(“您好,欢迎光临”)与文字样本(“您好,欢迎光临”)的匹配度为100%,得到转换后的文字内容(“您好,欢迎光临”)与文字样本(“您好,请进”)的匹配度为33%,所以平均匹配度的值为(100%+33%)/2=66.5,则,由此可知,计算得出的匹配度大于预设的匹配度阈值(50%),则将转换后的文字内容(“您好,欢迎光临”)对应与抬手文字样本集对应的页面图片(带有欢迎手势的人物)。
在一种实施方式下,基于步骤S11~S15,进一步地,所述方法还包括步骤S16~S18:
S16、将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
S17、获取与所述转换前的文字内容对应的文字排版顺序;
S18、根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,步骤S15中的所述将所述转换后的文字内容排版在所述网页对应的所述排版区域中,具体包括:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
示例性的,假设转换前的文字内容为“您好,欢迎光临”,转换后的文字内容为“Hello,welcome”;将“您好,欢迎光临”和“Hello,welcome”进行文字映射,得到“您好”与“Hello”、“,”与“,”,以及“欢迎光临”与“welcome”的文字映射结果;获取转换前的文字内容(“您好,欢迎光临”)的文字排版顺序;根据文字映射结果(“您好”与“Hello”、“,”与“,”,以及“欢迎光临”与“welcome”的文字映射结果),以及转换前的文字内容(“您好,欢迎光临”)的文字排版顺序,确定转换后的文字内容的文字排版策略(“Hello,welcome”的文字排版顺序);根据转换后的文字内容的文字排版策略(“Hello,welcome”的文字排版顺序),将转换后的文字内容(“Hello,welcome”)排版在所述网页对应的所述排版区域中。
在一种实施方式中,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述方法还包括步骤S19:
S19、根据所述页面图片确定所述文字动态效果和所述文字颜色。
示例性的,预先设置主色调图片与文字动态效果及文字颜色的映射关系;对页面图片的颜色进行分析,得出页面图片的主色调,根据页面图片的主色调,基于预设的图片主色调与文字动态效果及文字颜色的映射关系,对应确定与页面图片对应的文字内容的文字动态效果及文字颜色。
在一种实施方式中,所述文字排版样式还包括字体、字号、字距、对齐方式和行距;
则,所述方法还包括步骤S20:
根据所述排版区域的大小和所述转换后的文字内容的字数,确定转换后的文字内容的字体、字号、字距、对齐方式和行距。
示例性的,假设存在尺寸为150*150的排版区域,一个英文字母占用一个字节,一个空格占用两个字符,转换后的文字内容为“Hello,welcome”,占用15个字符,根据“Hello,welcome”占用的15个字符和对应的排版区域的150*150的尺寸确定其文字排版样式(字体、字号、字距、对齐方式和行距),以使转换后的文字内容能够合理地展示在对应的排版区域内。
需要说明的是,使转换后的文字内容能够合理地展示在对应的排版区域内,需要根据转换后的文字内容所占用的字符以及对应的排版区域的大小进行文字排版样式的选择,包括文字的字体、字号、字距、对齐方式和行距,字体、字号、字距、对齐方式和行距关系到转换后的文字内容能否清楚地展示以及合理地排版在排版区域内。
在一种实施方式中,步骤S15中的根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中具体包括:
根据所述转换后的文字内容的文字排版顺序和预设的折行算法,将所述转换后的文字内容排版在所述排版区域中。
示例性的,利用折行算法,按照转换后的文字内容的排版顺序,将所述转换后的文字内容排版在所述排版区域中(比如贪心算法,尝试在排版区域内的当前行中放下尽可能多的单词,当前行不能再容纳更多单词时,就放到下一行)。
综上所述,与现有技术相比,本发明实施例公开的网页的文字排版方法,能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上,与页面图片的图片内容相匹配。
参见图4,是本发明一实施例提供的一种网页的文字排版装置的结构框图。网页的文字排版装置10,包括:
网页信息获取模块11,用于用于响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
图片内容识别模块12,用于对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
分析模块13,用于根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
排版区域确定模块14,用于根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
文字排版模块15,用于将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
作为举例地,可以在网页的页面中设置语言类型切换标签,当用户点击语言类型切换标签时,通过弹窗的方式展示多种语言类型标签以供用户选择,用户选择语言类型标签可通过鼠标点击,也可通过键盘输入,可通过触摸屏输入,在此不作限定,则对网页的语言类型的切换操作可以是接收到的用户对语言类型标签的选择指令;或者,可以对客户端所在的地区进行定位,选择该地区的通用语言进行语言类型的切换,在此不作限定;可以通过获取语言类型转换前的文字内容,根据需要切换到的语言类型,采用翻译软件(如google翻译、有道翻译等翻译软件)将语言类型转换前的文字内容进行翻译,得到转换后的文字内容,也可以通过在本地或者云端存储多种语言类型的文字内容,预先建立各个语言类型的文字内容之间的映射关系,在需要时从预先存储的多种网页语言的文字内容中,选出需要切换到的语言类型对应的文字内容,在此不作限定。
一般地,排版区域设置在对应的图片对象的位置的附近,且考虑了页面图片周围预设距离内的各网页页面元素的位置,避免排版区域与页面图片所在位置的附近的页面元素出现重叠的现象。
具体地,可通过以下方式确定排版区域:
根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,确定空白区域,以所述空白区域作为候选排版区域;
根据预设的排版区域选用规则,从所述空白区域中确定所述转换后的文字内容在所述网页中的排版区域。
具体地,所述排版区域选用规则可以是选出区域尺寸最大的空白区域作为排版区域;也可以是预先设置下限字号、下限字距和下限行距,再根据转换后的文字内容所占的字符数,确定转换后的文字内容按照下限字号、下限字距和下限行距进行排版所需的排版区域的最小尺寸,根据计算得到的排版区域的最小尺寸,从尺寸大于排版区域的最小尺寸的空白区域中随机选出排版区域;排版区域选用规则可根据实际应用进行确定,在此不作限定。
示例性的,如图2所示,网页中的页面图片和文字内容不能很好地匹配,当接收到键盘输入的指令时(响应于对网页的语言类型的切换操作),提取网页中的文字内容(“您好,欢迎光临”),并提取所述网页中的页面图片(带有欢迎手势的人物位置所在的页面图片)及所述页面图片在所述网页中的位置信息(带有欢迎手势的人物位置);根据当前需要切换到的语言类型(英文),采用翻译软件将所述文字内容(“您好,欢迎光临”)进行语言类型转换,得到转换后的文字内容(“Hello,welcome”);对页面图片(带有欢迎手势的人物位置所在的页面图片)的图片内容(带有欢迎手势的人物)进行识别,得到图片内容(带有欢迎手势的人物)的识别结果,根据识别结果来确定页面图片对应的转换后的文字内容(带有欢迎手势的人物的识别结果与英文的“Welcome”的对应关系,根据识别得到的带有欢迎手势的人物的识别结果,确定“带有欢迎手势的人物位置所在的页面图片”对应的一整句的文字内容为“Hello,welcome”);参阅图3,根据带有欢迎手势的人物位置所在的页面图片及其位置信息,对应确定“Hello,welcome”在所述网页中的排版区域;将“Hello,welcome”排版在对应的位置上。
在本实施例中,网页的文字排版装置10通过响应于对网页的语言类型的切换操作,来获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;通过对所述页面图片的图片内容进行识别,来得到所述图片内容的识别结果,从而根据所述页面图片的图片内容的识别结果,来确定与所述页面图片的图片内容对应的转换后的文字内容;通过根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,来对应确定所述转换后的文字内容在所述网页中的排版区域,以将所述转换后的文字内容排版在所述网页对应的所述排版区域中。由此可见,本发明实施例能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上,与页面图片的图片内容相匹配。
在一种实施方式下,进一步地,图片内容识别模块12,用于对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果的过程可以是:
将页面图片输入到预先训练好的图像分类识别模型中,得到所述页面图片的图片内容的识别结果。
示例性的,将页面图片(带有欢迎手势的人物位置所在的页面图片)输入到预先训练好的图像分类识别模型(比如现有的CNN图像识别分类模型)中,得到页面图片的图片内容(带有欢迎手势的人物)的识别结果,对应的识别结果为“抬手”。
在一种实施方式中,在步骤S13中,可通过以下方式来实现根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容:
基于预设的图片内容的识别结果与文字样本集的对应关系,获取与所述图片内容的识别结果对应的文字样本集;所述文字样本集包括至少一个与所述图片内容识别结果预先对应的文字样本;
计算转换后的文字内容与文字样本集信息中各文字样本的文本的匹配度,并将所有的匹配度的值相加后求平均值,得到平均匹配度;
若所述平均匹配度大于预设的匹配度阈值,将所述转换后的文字内容对应于与所述文字样本集对应的页面图片。
示例性的,转换后的文字内容为中文的“您好,欢迎光临”四个字,含有“欢迎手势的人物”的页面图片的识别结果为“抬手”,其中,预设有“抬手的文字样本集”与图片识别结果为“抬手”的对应关系,则可以基于该对应关系,获取与图片识别结果为“抬手”对应的“抬手的文字样本集”。其中,“抬手的文字样本集”包含有“您好,欢迎光临”、“您好,请进”这些文字样本,预设的匹配度阈值为50%。则转换后的中文的“您好,欢迎光临”与“抬手的文字样本集”中的文字样本的匹配过程为:计算转换后的文字内容(“您好,欢迎光临”)和文字样本集信息(“您好,欢迎光临”、“您好,请进”)中两个文字样本的文本的匹配度,得到转换后的文字内容(“您好,欢迎光临”)与文字样本(“您好,欢迎光临”)的匹配度为100%,得到转换后的文字内容(“您好,欢迎光临”)与文字样本(“您好,请进”)的匹配度为33%,所以平均匹配度的值为(100%+33%)/2=66.5,则,由此可知,计算得出的匹配度大于预设的匹配度阈值(50%),则将转换后的文字内容(“您好,欢迎光临”)对应与抬手文字样本集对应的页面图片(含有欢迎手势的人物)。
在一种实施方式下,参见图5,所述装置还包括:
文字映射模块16、将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
排版方式获取模块17、获取与所述转换前的文字内容对应的文字排版顺序;
排版策略确定模块18、根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述文字排版模块15,具体用于:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
示例性的,假设转换前的文字内容为“您好,欢迎光临”,转换后的文字内容为“Hello,welcome”;将“您好,欢迎光临”和“Hello,welcome”进行文字映射,得到“您好”与“Hello”、“,”与“,”,以及“欢迎光临”与“welcome”的文字映射结果;获取转换前的文字内容(“您好,欢迎光临”)的文字排版顺序;根据文字映射结果(“您好”与“Hello”、“,”与“,”,以及“欢迎光临”与“welcome”的文字映射结果),以及转换前的文字内容(“您好,欢迎光临”)的文字排版顺序,确定转换后的文字内容的文字排版策略(“Hello,welcome”的文字排版顺序);根据转换后的文字内容的文字排版策略(“Hello,welcome”的文字排版顺序),将转换后的文字内容(“Hello,welcome”)排版在所述网页对应的所述排版区域中。
在一种实施方式中,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述排版策略确定模块18,还用于:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
示例性的,预先设置主色调图片与文字动态效果及文字颜色的映射关系;对页面图片的颜色进行分析,得出页面图片的主色调,根据页面图片的主色调,基于预设的图片主色调与文字动态效果及文字颜色的映射关系,对应确定与页面图片对应的文字内容的文字动态效果及文字颜色。
在一种实施方式中,所述文字排版样式还包括字体、字号、字距、对齐方式和行距;
则,所述排版策略确定模块18,还用于:
根据所述排版区域的大小和所述转换后的文字内容的字数,确定转换后的文字内容的字体、字号、字距、对齐方式和行距。
示例性的,假设存在尺寸为150*150的排版区域,一个英文字母占用一个字节,一个空格占用两个字符,转换后的文字内容为“Hello,welcome”,占用15个字符,根据“Hello,welcome”占用的15个字符和对应的排版区域的150*150的尺寸确定其文字排版样式(字体、字号、字距、对齐方式和行距),以使转换后的文字内容能够合理地展示在对应的排版区域内。
需要说明的是,使转换后的文字内容能够合理地展示在对应的排版区域内,需要根据转换后的文字内容所占用的字符以及对应的排版区域的大小进行文字排版样式的选择,包括文字的字体、字号、字距、对齐方式和行距,字体、字号、字距、对齐方式和行距关系到转换后的文字内容能否清楚地展示以及合理地排版在排版区域内。
在一种实施方式中,所述文字排版模块15,具体用于:
根据所述转换后的文字内容的文字排版顺序和预设的折行算法,将所述转换后的文字内容排版在所述排版区域中。
示例性的,利用折行算法,按照转换后的文字内容的文字排版顺序,将所述转换后的文字内容排版在所述排版区域中(比如贪心算法,尝试在排版区域内的当前行中放下尽可能多的单词,当前行不能再容纳更多单词时,就放到下一行)。
综上所述,与现有技术相比,本发明实施例公开的网页的文字排版装置10,能够,能够通过确认页面图片的图片内容、页面图片的位置信息和页面图片附近的网页元素的位置,来对文字内容重排版,使得网页中的文字内容的语言类型得以转换并排版在合理的位置上,与页面图片的图片内容相匹配。
值得说明的是,具体的所述网页的文字排版装置10的工作过程可参考上述实施例中所述网页的文字排版方法的工作过程,在此不再赘述。
参见图6,是本发明实施例提供的一种网页的文字排版设备20,包括处理器21、存储器22以及存储在所述存储器22中且被配置为由所述处理器21执行的计算机程序,所述处理器21执行所述计算机程序时实现如上述网页的文字排版方法实施例中的步骤,例如图1中所述的步骤S11~S15;或者,所述处理器21执行所述计算机程序时实现上述各装置实施例中各模块的功能,例如网页信息获取模块11。
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器22中,并由所述处理器21执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述网页的文字排版设备20中的执行过程。例如,所述计算机程序可以被分割成网页信息获取模块11、图片内容识别模块12、分析模块13、排版区域确定模块14和文字排版模块15,各模块具体功能如下:
网页信息获取模块11,用于用于响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
图片内容识别模块12,用于对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
分析模块13,用于根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
排版区域确定模块14,用于根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
文字排版模块15,用于将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
各个模块具体的工作过程可参考上述实施例所述的网页的文字排版装置10的工作过程,在此不再赘述。
所述网页的文字排版设备20可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述网页的文字排版设备20可包括,但不仅限于,处理器21、存储器22。本领域技术人员可以理解,所述示意图仅仅是网页的文字排版设备的示例,并不构成对网页的文字排版设备20的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述网页的文字排版设备20还可以包括输入输出设备、网络接入设备、总线等。
所述处理器21可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器21是所述网页的文字排版设备20的控制中心,利用各种接口和线路连接整个网页的文字排版设备20的各个部分。
所述存储器22可用于存储所述计算机程序和/或模块,所述处理器31通过运行或执行存储在所述存储器22内的计算机程序和/或模块,以及调用存储在存储器22内的数据,实现所述网页的文字排版设备20的各种功能。所述存储器22可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述网页的文字排版设备20集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种网页的文字排版方法,其特征在于,包括:
响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
将所述转换后的文字内容排版在所述网页对应的所述排版区域中;
所述对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果,具体包括:将页面图片输入到预先训练好的图像分类识别模型中,得到所述页面图片的图片内容的识别结果;
所述根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容,具体包括:
基于预设的图片内容的识别结果与文字样本集的对应关系,获取与所述图片内容的识别结果对应的文字样本集;所述文字样本集包括至少一个与所述图片内容识别结果预先对应的文字样本;
计算转换后的文字内容与文字样本集信息中各文字样本的文本的匹配度,并将所有的匹配度的值相加后求平均值,得到平均匹配度;
若所述平均匹配度大于预设的匹配度阈值,将所述转换后的文字内容对应于与所述文字样本集对应的页面图片。
2.如权利要求1所述的网页的文字排版方法,其特征在于,所述方法还包括:
将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
获取与所述转换前的文字内容对应的文字排版顺序;
根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述将所述转换后的文字内容排版在所述网页对应的所述排版区域中,具体包括:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
3.如权利要求2所述的网页的文字排版方法,其特征在于,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述方法还包括:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
4.如权利要求3所述的网页的文字排版方法,其特征在于,所述文字排版样式还包括字体、字号、字距、对齐方式和行距;
则,所述方法还包括:
根据所述排版区域的大小和所述转换后的文字内容的字数,确定转换后的文字内容的字体、字号、字距、对齐方式和行距。
5.如权利要求2所述的网页的文字排版方法,其特征在于,所述根据所述文字排版策略,将所述转换后的文字内容排版在所述排版区域中,具体包括:
根据所述转换后的文字内容的文字排版顺序和预设的折行算法,将所述转换后的文字内容排版在所述排版区域中。
6.一种网页的文字排版装置,其特征在于,包括:
网页信息获取模块,用于响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
图片内容识别模块,用于对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
分析模块,用于根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
排版区域确定模块,用于根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
文字排版模块,用于将所述转换后的文字内容排版在所述网页对应的所述排版区域中;
所述图片内容识别模块,具体用于:将页面图片输入到预先训练好的图像分类识别模型中,得到所述页面图片的图片内容的识别结果;
所述分析模块,具体用于:
基于预设的图片内容的识别结果与文字样本集的对应关系,获取与所述图片内容的识别结果对应的文字样本集;所述文字样本集包括至少一个与所述图片内容识别结果预先对应的文字样本;
计算转换后的文字内容与文字样本集信息中各文字样本的文本的匹配度,并将所有的匹配度的值相加后求平均值,得到平均匹配度;
若所述平均匹配度大于预设的匹配度阈值,将所述转换后的文字内容对应于与所述文字样本集对应的页面图片。
7.如权利要求6所述的网页的文字排版装置,其特征在于,所述装置还包括:
文字映射模块,用于将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
排版方式获取模块,用于获取与所述转换前的文字内容对应的文字排版顺序;
排版策略确定模块,用于根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述文字排版模块,具体用于:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
8.如权利要求7所述的网页的文字排版装置,其特征在于,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述排版策略确定模块,还用于:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
9.一种网页的文字排版设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的网页的文字排版方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的网页的文字排版方法。
CN202110744838.1A 2021-06-30 2021-06-30 一种网页的文字排版方法、装置、设备和存储介质 Active CN113553524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110744838.1A CN113553524B (zh) 2021-06-30 2021-06-30 一种网页的文字排版方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110744838.1A CN113553524B (zh) 2021-06-30 2021-06-30 一种网页的文字排版方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN113553524A CN113553524A (zh) 2021-10-26
CN113553524B true CN113553524B (zh) 2022-10-18

Family

ID=78102562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110744838.1A Active CN113553524B (zh) 2021-06-30 2021-06-30 一种网页的文字排版方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113553524B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
WO2021017260A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 多语言文本识别方法、装置、计算机设备及存储介质
CN112328348A (zh) * 2020-11-05 2021-02-05 深圳壹账通智能科技有限公司 应用程序多语言支持方法、装置、计算机设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100530242C (zh) * 2007-09-14 2009-08-19 北大方正集团有限公司 一种图文的自动排版方法
CN105045776B (zh) * 2015-09-07 2017-10-24 武汉大学 一种页面自动排版方法
CN106598956B (zh) * 2016-11-30 2019-09-06 上海工程技术大学 一种语言转换服务器系统
CN107066618B (zh) * 2017-05-09 2020-06-05 灯塔财经信息有限公司 一种网页页面转换后显示方法和装置
CN107256234B (zh) * 2017-05-18 2018-12-07 腾讯科技(深圳)有限公司 一种网页文本调整方法及其设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
WO2021017260A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 多语言文本识别方法、装置、计算机设备及存储介质
CN112328348A (zh) * 2020-11-05 2021-02-05 深圳壹账通智能科技有限公司 应用程序多语言支持方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113553524A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN106484266B (zh) 一种文本处理方法及装置
CN109712218B (zh) 电子书笔记处理方法、手写阅读设备和存储介质
CN110705503B (zh) 生成目录结构化信息的方法和装置
CN107977155B (zh) 一种手写识别方法、装置、设备和存储介质
US9910841B2 (en) Annotation data generation and overlay for enhancing readability on electronic book image stream service
CN111507330A (zh) 习题识别方法、装置、电子设备及存储介质
US20090055778A1 (en) System and method for onscreen text recognition for mobile devices
US11341353B2 (en) Preserving styles and ink effects in ink-to-text
CN103559512B (zh) 一种文字识别输出方法及系统
CN109933751A (zh) 图文绘制方法、装置、计算机可读存储介质和计算机设备
JP2024064941A (ja) 表示方法、装置、ペン型電子辞書、電子機器及び記憶媒体
US9031831B1 (en) Method and system for looking up words on a display screen by OCR comprising a set of base forms of recognized inflected words
CN113553524B (zh) 一种网页的文字排版方法、装置、设备和存储介质
CN109445900B (zh) 用于图片显示的翻译方法和装置
CN113536169B (zh) 一种网页的文字排版方法、装置、设备和存储介质
CN114548040A (zh) 笔记处理方法、电子设备及存储介质
CN113553802B (zh) 网页的隐藏图片中文字的排版方法、装置、设备和存储介质
CN111046096B (zh) 用于生成图文结构化信息的方法和装置
CN114399782A (zh) 文本图像处理方法、装置、设备、存储介质及程序产品
CN113033147A (zh) 文本处理方法、装置、设备和介质
CN113378526A (zh) Pdf段落处理方法、装置、存储介质及设备
US20150095314A1 (en) Document search apparatus and method
JP4466241B2 (ja) 文書処理手法及び文書処理装置
CN113553801A (zh) 网页的动效文字的排版、装置、设备和存储介质
US20220198127A1 (en) Enhancement aware text transition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant