CN116797693A - 一种自动生成其他语言名片的方法及装置 - Google Patents
一种自动生成其他语言名片的方法及装置 Download PDFInfo
- Publication number
- CN116797693A CN116797693A CN202310781395.2A CN202310781395A CN116797693A CN 116797693 A CN116797693 A CN 116797693A CN 202310781395 A CN202310781395 A CN 202310781395A CN 116797693 A CN116797693 A CN 116797693A
- Authority
- CN
- China
- Prior art keywords
- text
- translated
- business card
- image
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000013519 translation Methods 0.000 claims abstract description 35
- 238000009877 rendering Methods 0.000 claims abstract description 7
- 230000014616 translation Effects 0.000 claims description 33
- 239000003086 colorant Substances 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 2
- 238000012015 optical character recognition Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种自动生成其他语言名片的方法。在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、文字形态信息、位置信息。将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。本发明能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。
Description
技术领域
本发明涉及一种文字属性判断、OCR(Optical Character Recognition,光学字符识别)、文字翻译、图像处理和融合技术。
背景技术
在商务活动中,名片是商务人士交换信息的重要媒介。随着涉外商务活动的增加,将一种语言的名片方便地转换为其他语言的名片成为不少企业和个人的需求。
发明内容
本发明所要解决的技术问题是:如何根据某种语言的名片图像快速生成保持名片版式风格不变的另一种语言的名片图像。
为解决上述技术问题,本发明提出了一种自动生成其他语言名片的方法,包括如下步骤。步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行。步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
优选地,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。
优选地,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。
优选地,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
进一步地,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体;(2)以图像学方式比较源语言的原始字体中的特定字符与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体;(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
优选地,所述步骤S5中,翻译后的文字条目的文字颜色、文字大小也保持不变。
优选地,所述步骤S5中,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
本发明还提出了一种自动生成其他语言名片的装置,包括分类单元、记录单元、翻译单元、图像擦除单元、图像回帖单元。所述分类单元用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。所述记录单元用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。所述翻译单元用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。所述图像擦除单元用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述图像回帖单元用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
本发明取得的技术效果是:能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。
附图说明
图1是本发明提出的自动生成其他语言名片的方法的流程示意图。
图2是原始名片图像的一个示例的示意图。
图3是对图2所示的原始名片图像执行步骤S4后得到的名片背景图像的示意图。
图4是对图2所示的原始名片图像执行步骤S5后得到的无粘贴痕迹的英文名片图像的示意图。
图5是本发明提出的自动生成其他语言名片的装置的结构示意图。
图中附图标记说明:1为分类单元、2为记录单元、3为翻译单元、4为图像擦除单元、5为图像回帖单元。
实施方式
请参阅图1,本发明提出的自动生成其他语言名片的方法包括如下步骤。
步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。所述无需翻译的组件包括企业LOGO(其中可能包含企业名称或简称)、照片、头像(其中可能包含个人姓名、职位等)、图标(例如电话图像中包含TEL,传真图标中包含FAX)、条形码、二维码等。这一步可以预先建立一个名片组件数据库,保存企业LOGO等可能包含文字的组件,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。对于需要翻译的文字条目,采用OCR技术获取文字内容。
步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小等在内的文字形态信息、该文字条目在名片上的位置信息。
步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。
优选地,翻译时,可以根据需要翻译的文字条目的文字内容确定条目类型(例如,姓名、职位、单位等),再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
优选地,确定翻译后的文字条目的目标字体可采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体。(2)以图像学方式比较源语言的原始字体中的特定字符(例如数字)与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体。(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。
所述步骤S3、步骤S4的顺序没有严格限制,可以任意在前,或者同时进行。
步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。优选地,翻译后的文字条目的文字颜色、文字大小、位置保持不变。优选地,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
请参阅图2,这是原始名片图像的一个示例,源语言是中文。请参阅图3,这是对图2所示的原始名片图像执行步骤S4后得到的名片背景图像。请参阅图4,这是对图2所示的原始名片图像执行步骤S5后得到的无粘贴痕迹的英文名片图像。
请参阅图5,本发明提出的自动生成其他语言名片的装置包括分类单元1、记录单元2、翻译单元3、图像擦除单元4、图像回帖单元5。图5所示装置对应于图1所示方法。
所述分类单元1用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种。对于需要翻译的文字条目,所述分类单元1还采用OCR技术获取文字内容。
所述记录单元2用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。
所述翻译单元3用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。
所述图像擦除单元4用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。
所述图像回帖单元5用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
当用户希望基于自己已有的某种语言的名片去生成其他语言的同版式、同风格的名片时,如期望基于中文名片生成英文名片。本发明能自动判断原始名片图像中哪些位置的文字条目需要翻译,在OCR识别该条目的文字并翻译的同时,提取该条目的字体、字色、大小等形态属性,及该条目在原始名片图像中的位置。根据上述信息,本发明将翻译后的条目文字按其在原始名片中的位置及文字形态属性回帖到背景图像中,并通过图像融合技术消除贴图的不自然,生成期望语言的名片,省去制作另一种语言名片的多个环节,实现降本增效。
以上仅为本发明的优选实施例,并不用于限定本发明。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种自动生成其他语言名片的方法,其特征是,包括如下步骤;
步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容;
步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息;
步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体;
步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像;
所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行;
步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
2.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。
3.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。
4.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
5.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体;(2)以图像学方式比较源语言的原始字体中的特定字符与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体;(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
6.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S5中,翻译后的文字条目的文字颜色、文字大小也保持不变。
7.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S5中,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
8.一种自动生成其他语言名片的装置,其特征是,包括分类单元、记录单元、翻译单元、图像擦除单元、图像回帖单元;
所述分类单元用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容;
所述记录单元用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息;
所述翻译单元用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体;
所述图像擦除单元用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像;
所述图像回帖单元用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310781395.2A CN116797693A (zh) | 2023-06-28 | 2023-06-28 | 一种自动生成其他语言名片的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310781395.2A CN116797693A (zh) | 2023-06-28 | 2023-06-28 | 一种自动生成其他语言名片的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116797693A true CN116797693A (zh) | 2023-09-22 |
Family
ID=88041378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310781395.2A Pending CN116797693A (zh) | 2023-06-28 | 2023-06-28 | 一种自动生成其他语言名片的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116797693A (zh) |
-
2023
- 2023-06-28 CN CN202310781395.2A patent/CN116797693A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5903904A (en) | Iconic paper for alphabetic, japanese and graphic documents | |
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US8732570B2 (en) | Non-symbolic data system for the automated completion of forms | |
US8156427B2 (en) | User interface for mixed media reality | |
US6351559B1 (en) | User-enclosed region extraction from scanned document images | |
US20140064618A1 (en) | Document information extraction using geometric models | |
US8965125B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
US20060217959A1 (en) | Translation processing method, document processing device and storage medium storing program | |
JPH08305731A (ja) | 文書格納等の方法及び文書サーバ | |
JPH0798765A (ja) | 方向検出方法および画像解析装置 | |
JPH08147446A (ja) | 電子ファイリング装置 | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN116797693A (zh) | 一种自动生成其他语言名片的方法及装置 | |
JP2021047792A (ja) | 情報処理装置及びプログラム | |
US8295602B2 (en) | Image processing apparatus and image processing method | |
US20210182477A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
JP3841318B2 (ja) | アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー | |
JPH06348758A (ja) | 文書情報検索装置及び方法 | |
US7995869B2 (en) | Information processing apparatus, information processing method, and information storing medium | |
Berclaz et al. | Image-based mobile service: automatic text extraction and translation | |
JPH0384681A (ja) | 名刺情報の入力処理方法 | |
JPS59148983A (ja) | 漢字認識辞書選択方式 | |
US20210303790A1 (en) | Information processing apparatus | |
TWI664604B (zh) | 電腦手寫中文字集創建及應用系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |