CN116797693A - 一种自动生成其他语言名片的方法及装置 - Google Patents

一种自动生成其他语言名片的方法及装置 Download PDF

Info

Publication number
CN116797693A
CN116797693A CN202310781395.2A CN202310781395A CN116797693A CN 116797693 A CN116797693 A CN 116797693A CN 202310781395 A CN202310781395 A CN 202310781395A CN 116797693 A CN116797693 A CN 116797693A
Authority
CN
China
Prior art keywords
text
translated
business card
image
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310781395.2A
Other languages
English (en)
Inventor
郭丰俊
龙腾
丁凯
刘鹏伟
余鹏程
张振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Linguan Data Technology Co ltd
Shanghai Shengteng Data Technology Co ltd
Shanghai Yingwuchu Data Technology Co ltd
Shanghai Hehe Information Technology Development Co Ltd
Original Assignee
Shanghai Linguan Data Technology Co ltd
Shanghai Shengteng Data Technology Co ltd
Shanghai Yingwuchu Data Technology Co ltd
Shanghai Hehe Information Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Linguan Data Technology Co ltd, Shanghai Shengteng Data Technology Co ltd, Shanghai Yingwuchu Data Technology Co ltd, Shanghai Hehe Information Technology Development Co Ltd filed Critical Shanghai Linguan Data Technology Co ltd
Priority to CN202310781395.2A priority Critical patent/CN116797693A/zh
Publication of CN116797693A publication Critical patent/CN116797693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种自动生成其他语言名片的方法。在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、文字形态信息、位置信息。将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。本发明能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。

Description

一种自动生成其他语言名片的方法及装置
技术领域
本发明涉及一种文字属性判断、OCR(Optical Character Recognition,光学字符识别)、文字翻译、图像处理和融合技术。
背景技术
在商务活动中,名片是商务人士交换信息的重要媒介。随着涉外商务活动的增加,将一种语言的名片方便地转换为其他语言的名片成为不少企业和个人的需求。
发明内容
本发明所要解决的技术问题是:如何根据某种语言的名片图像快速生成保持名片版式风格不变的另一种语言的名片图像。
为解决上述技术问题,本发明提出了一种自动生成其他语言名片的方法,包括如下步骤。步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行。步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
优选地,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。
优选地,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。
优选地,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
进一步地,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体;(2)以图像学方式比较源语言的原始字体中的特定字符与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体;(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
优选地,所述步骤S5中,翻译后的文字条目的文字颜色、文字大小也保持不变。
优选地,所述步骤S5中,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
本发明还提出了一种自动生成其他语言名片的装置,包括分类单元、记录单元、翻译单元、图像擦除单元、图像回帖单元。所述分类单元用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。所述记录单元用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。所述翻译单元用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。所述图像擦除单元用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述图像回帖单元用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
本发明取得的技术效果是:能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。
附图说明
图1是本发明提出的自动生成其他语言名片的方法的流程示意图。
图2是原始名片图像的一个示例的示意图。
图3是对图2所示的原始名片图像执行步骤S4后得到的名片背景图像的示意图。
图4是对图2所示的原始名片图像执行步骤S5后得到的无粘贴痕迹的英文名片图像的示意图。
图5是本发明提出的自动生成其他语言名片的装置的结构示意图。
图中附图标记说明:1为分类单元、2为记录单元、3为翻译单元、4为图像擦除单元、5为图像回帖单元。
实施方式
请参阅图1,本发明提出的自动生成其他语言名片的方法包括如下步骤。
步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。所述无需翻译的组件包括企业LOGO(其中可能包含企业名称或简称)、照片、头像(其中可能包含个人姓名、职位等)、图标(例如电话图像中包含TEL,传真图标中包含FAX)、条形码、二维码等。这一步可以预先建立一个名片组件数据库,保存企业LOGO等可能包含文字的组件,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。对于需要翻译的文字条目,采用OCR技术获取文字内容。
步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小等在内的文字形态信息、该文字条目在名片上的位置信息。
步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。
优选地,翻译时,可以根据需要翻译的文字条目的文字内容确定条目类型(例如,姓名、职位、单位等),再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
优选地,确定翻译后的文字条目的目标字体可采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体。(2)以图像学方式比较源语言的原始字体中的特定字符(例如数字)与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体。(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。
所述步骤S3、步骤S4的顺序没有严格限制,可以任意在前,或者同时进行。
步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。优选地,翻译后的文字条目的文字颜色、文字大小、位置保持不变。优选地,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
请参阅图2,这是原始名片图像的一个示例,源语言是中文。请参阅图3,这是对图2所示的原始名片图像执行步骤S4后得到的名片背景图像。请参阅图4,这是对图2所示的原始名片图像执行步骤S5后得到的无粘贴痕迹的英文名片图像。
请参阅图5,本发明提出的自动生成其他语言名片的装置包括分类单元1、记录单元2、翻译单元3、图像擦除单元4、图像回帖单元5。图5所示装置对应于图1所示方法。
所述分类单元1用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种。对于需要翻译的文字条目,所述分类单元1还采用OCR技术获取文字内容。
所述记录单元2用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。
所述翻译单元3用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。
所述图像擦除单元4用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。
所述图像回帖单元5用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
当用户希望基于自己已有的某种语言的名片去生成其他语言的同版式、同风格的名片时,如期望基于中文名片生成英文名片。本发明能自动判断原始名片图像中哪些位置的文字条目需要翻译,在OCR识别该条目的文字并翻译的同时,提取该条目的字体、字色、大小等形态属性,及该条目在原始名片图像中的位置。根据上述信息,本发明将翻译后的条目文字按其在原始名片中的位置及文字形态属性回帖到背景图像中,并通过图像融合技术消除贴图的不自然,生成期望语言的名片,省去制作另一种语言名片的多个环节,实现降本增效。
以上仅为本发明的优选实施例,并不用于限定本发明。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种自动生成其他语言名片的方法,其特征是,包括如下步骤;
步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容;
步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息;
步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体;
步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像;
所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行;
步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
2.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。
3.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。
4.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
5.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体;(2)以图像学方式比较源语言的原始字体中的特定字符与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体;(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
6.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S5中,翻译后的文字条目的文字颜色、文字大小也保持不变。
7.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S5中,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
8.一种自动生成其他语言名片的装置,其特征是,包括分类单元、记录单元、翻译单元、图像擦除单元、图像回帖单元;
所述分类单元用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容;
所述记录单元用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息;
所述翻译单元用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体;
所述图像擦除单元用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像;
所述图像回帖单元用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
CN202310781395.2A 2023-06-28 2023-06-28 一种自动生成其他语言名片的方法及装置 Pending CN116797693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310781395.2A CN116797693A (zh) 2023-06-28 2023-06-28 一种自动生成其他语言名片的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310781395.2A CN116797693A (zh) 2023-06-28 2023-06-28 一种自动生成其他语言名片的方法及装置

Publications (1)

Publication Number Publication Date
CN116797693A true CN116797693A (zh) 2023-09-22

Family

ID=88041378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310781395.2A Pending CN116797693A (zh) 2023-06-28 2023-06-28 一种自动生成其他语言名片的方法及装置

Country Status (1)

Country Link
CN (1) CN116797693A (zh)

Similar Documents

Publication Publication Date Title
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US8156427B2 (en) User interface for mixed media reality
US6351559B1 (en) User-enclosed region extraction from scanned document images
US20140064618A1 (en) Document information extraction using geometric models
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
US20060217959A1 (en) Translation processing method, document processing device and storage medium storing program
JPH08305731A (ja) 文書格納等の方法及び文書サーバ
JPH0798765A (ja) 方向検出方法および画像解析装置
JPH08147446A (ja) 電子ファイリング装置
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN116797693A (zh) 一种自动生成其他语言名片的方法及装置
JP2021047792A (ja) 情報処理装置及びプログラム
US8295602B2 (en) Image processing apparatus and image processing method
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH06348758A (ja) 文書情報検索装置及び方法
US7995869B2 (en) Information processing apparatus, information processing method, and information storing medium
Berclaz et al. Image-based mobile service: automatic text extraction and translation
JPH0384681A (ja) 名刺情報の入力処理方法
JPS59148983A (ja) 漢字認識辞書選択方式
US20210303790A1 (en) Information processing apparatus
TWI664604B (zh) 電腦手寫中文字集創建及應用系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination