JP5826966B2 - 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム - Google Patents

画像処理装置、画像処理方法、情報記憶媒体、及びプログラム Download PDF

Info

Publication number
JP5826966B2
JP5826966B2 JP2015504788A JP2015504788A JP5826966B2 JP 5826966 B2 JP5826966 B2 JP 5826966B2 JP 2015504788 A JP2015504788 A JP 2015504788A JP 2015504788 A JP2015504788 A JP 2015504788A JP 5826966 B2 JP5826966 B2 JP 5826966B2
Authority
JP
Japan
Prior art keywords
image
text
covering
display mode
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015504788A
Other languages
English (en)
Other versions
JPWO2014155744A1 (ja
Inventor
宗 益子
宗 益子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5826966B2 publication Critical patent/JP5826966B2/ja
Publication of JPWO2014155744A1 publication Critical patent/JPWO2014155744A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/10Mixing of images, i.e. displayed pixel being the result of an operation, e.g. adding, on the corresponding input pixels
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/12Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/12Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels
    • G09G2340/125Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels wherein one of the images is motion video
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/14Display of multiple viewports
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory
    • G09G5/395Arrangements specially adapted for transferring the contents of the bit-mapped memory to the screen

Description

本発明は、画像処理装置、画像処理方法、情報記憶媒体、及びプログラムに関し、特にはテキストと一体化した画像の処理に関する。
画像処理の分野では、テキストと一体化した原画像における当該テキストを変更したい場合がある。
例えば、仮想商店街サイトでは、バーゲンなどで用いられる「最終日」等のテキストと、注意を喚起するための図形等の背景画像と、を含む画像が用いられることがある。こうした画像からテキストを読み取り、他の言語に翻訳した上で、翻訳前のテキストに代えて翻訳後のテキストを表示させることができれば便利である。
特許文献1には、単一色の用紙に黒で文字が印字された文書をスキャンして得たビットマップ画像から文字を認識した後、その文字を描画していた画素を用紙と同じ属性の画素で埋め戻し、その後、認識した文字を翻訳して別の新たな文字を取得し、画素の埋め戻された箇所に書き込む技術が開示されている。
特開2006−251902号公報
しかしながら、特許文献1に開示された技術では、翻訳前の文字を描画していた画素を用紙と同じ属性の画素で埋め戻していることから、翻訳後の文字の視認性は高いものの、埋め戻しのための処理の負担が大きいという問題がある。なお、背景が単一色でない場合に埋め戻しを行うとすれば、埋め戻しのための処理の負担がさらに大きくなるおそれがある。
本発明が解決しようとする課題は、テキストと一体化した原画像における当該テキストを変更するに当たり、処理負担の軽減を図りつつも、変更後のテキストの視認性を確保する、という点である。
上記課題を解決するため、本発明の画像処理装置は、第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いに関する所定の条件を満たすように決定する決定手段と、前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段と、を備える。
また、本発明の画像処理方法は、第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いに関する所定の条件を満たすように決定し、前記決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する。
また、本発明のプログラムは、第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いに関する所定の条件を満たすように決定する決定手段、及び、前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、としてコンピュータを機能させる。
また、本発明の情報記憶媒体は、第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いに関する所定の条件を満たすように決定する決定手段、及び、前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、としてコンピュータを機能させるプログラムを記録したコンピュータ読み取り可能な情報記憶媒体である。
また、本発明の一態様では、前記表示態様は、前記被覆される度合いを変動させる要因となる表示書体を含み、前記決定手段は、前記表示書体の候補である候補書体の中から何れかを選択し、該選択された候補書体で表示される前記第2のテキストが前記所定の条件を満たすように前記表示態様を決定する。
また、本発明の一態様では、前記決定手段は、前記候補書体の中から、前記第2のテキストの非透明部分の量が小さい方から順に選択する。
また、本発明の一態様では、前記候補書体は、基準となる基準表示書体の他に、該基準表示書体よりも文字のサイズが大きい拡大表示書体と、該基準表示書体よりも文字の線幅が太い太字表示書体と、文字の外縁の外側に装飾が施された装飾表示書体と、の少なくとも何れかを含む。
また、本発明の一態様では、前記原画像において前記第1のテキストを構成する構成部分が前記第2のテキストの非透明部分により被覆される割合を表す被覆率を算出する算出手段をさらに備え、前記決定手段は、前記算出手段により算出される被覆率が所定の閾値以上又は超過である場合に前記所定の条件を満たすと判定する。
また、本発明の一態様では、前記算出手段は、前記第1のテキストに対する前記第2のテキストの相対位置の候補を表す候補位置ごとに前記被覆率を順次算出し、前記決定手段は、前記算出手段により前記候補位置ごとに順次算出される前記被覆率が前記所定の閾値以上又は超過である場合に、当該候補位置について前記所定の条件を満たすと判定する。
また、本発明の一態様では、前記出力手段は、前記原画像の前記位置特定データにより特定される位置上に前記被覆画像を合成するため、画像を合成する合成手段に前記被覆画像と前記位置特定データとを出力する。
また、本発明の一態様では、前記出力手段は、前記原画像の前記位置特定データにより特定される位置の手前に前記被覆画像を重畳表示させるため、画像表示機能を有する表示装置に前記被覆画像と前記位置特定データとを出力する。
本発明によると、原画像における第1のテキストが被覆画像における第2のテキストによって十分に被覆されるように、被覆画像における第2のテキストの表示態様が決定される。従って、第1のテキストと一体化した原画像上に第2のテキストと一体化した被覆画像を重畳させることで、原画像における第1のテキストを構成する画素を埋め戻すための処理の負担を軽減しながら、被覆画像における第2のテキストの十分な視認性を確保することができる。
本発明の実施形態に係る画像処理装置のハードウェア構成の一例を示す図である。 画像の一例を示す図である。 画像処理装置で実現される機能の一例を示す機能ブロック図である。 画像処理装置で実行される処理の一例を示すフローチャートである。 文字認識処理により特定される文字領域の一例を示す図である。 翻訳前文字列の構成画素データの一例を示す図である。 翻訳後文字列の文字画像データの一例を示す図である。 構成画素データと文字画像データの比較の一例を示す図である。 基準書体の文字画像の合成例を示す図である。 拡大書体の文字画像の合成例を示す図である。 太字書体の文字画像の合成例を示す図である。 装飾書体の文字画像の合成例を示す図である。
以下、本発明の実施形態の例について図面に基づき詳細に説明する。
図1は、本発明の実施形態に係る画像処理装置10のハードウェア構成の一例を示す図である。画像処理装置10は、例えばサーバコンピュータ、デスクトップ型コンピュータ、ラップトップ型コンピュータ、又はタブレット型コンピュータ等によって実現される。
図1に示されるように、画像処理装置10は、制御部11、記憶部12、光ディスクドライブ部13、通信インタフェース部14、操作部15、表示部16、及び音声出力部17を含んでいる。
制御部11は、例えば1又は複数のマイクロプロセッサを含み、記憶部12に記憶されたオペレーティングシステム又はプログラムに従って情報処理を実行する。記憶部12は、例えばRAM、ハードディスク、又はソリッドステートドライブを含んでいる。光ディスクドライブ部13は、光ディスク(情報記憶媒体)に記憶されたプログラムやデータを読み取る。
プログラムやデータは、光ディスクを介して記憶部12に供給される。すなわち、プログラムやデータは、光ディスクドライブ部13によって光ディスクから読み出され、記憶部12に記憶される。なお、光ディスク以外の情報記憶媒体(例えばメモリカード)に記憶されたプログラム又はデータを読み取るための構成要素が画像処理装置10に含まれていてもよい。そして、光ディスク以外の情報記憶媒体を介してプログラムやデータが記憶部12に供給されるようにしてもよい。
通信インタフェース部14は、画像処理装置10を通信ネットワークに接続するためのインタフェースである。画像処理装置10は、通信ネットワークを介して他の装置とデータを授受できるようになっている。なお、プログラム及びデータは、通信ネットワークを介して記憶部12に供給されるようにしてもよい。
操作部15は、ユーザが操作を行うためのものである。例えば、キーボード、マウス、タッチパッド、タッチパネル、又はスティック(レバー)等が操作部15に相当する。表示部16は、例えば液晶表示ディスプレイ又は有機ELディスプレイ等である。音声出力部17は、例えばスピーカ又はヘッドホン端子等である。
画像処理装置10は、データベース20にアクセスできるようになっている。データベース20は、画像処理装置10以外の装置(例えばサーバ)において実現されていてもよいし、画像処理装置10において実現されていてもよい。
データベース20には画像が記憶されている。例えば、図示しないWebサーバによって提供される仮想商店街サイトにおいて利用される画像が、データベース20に記憶されている。すなわち、仮想商店街に出店している店舗の担当者によって用意された画像がデータベース20に記憶されている。
図2は、データベース20に記憶される画像の一例を示す図である。図2に示される画像30は、文字列32が背景画像34上に書き込まれた、文字列32と背景画像34が一体化した画像である。文字列32は、例えばバーゲンなどで用いられる「最終日」を表している。また、背景画像34は、例えば注意を喚起するための図形を含んでおり、2種類以上の色を含んでいる。また、背景画像34は、実写された画像など、幾何学的な図形に比して複雑な要素を含んでいてもよい。なお、こうした画像30では、一般的に、文字列32が背景画像34とは異なる目立つ色で書かれていることが多い。また、文字列32は単色で書かれることが多く、横方向、縦方向、又は斜め方向に整列している場合が多い。
以下、図2に示されるような画像30から文字列32を読み取り、他の言語に翻訳した上で、翻訳後の文字列と背景画像34とを含む新たな画像を生成する技術について説明する。
図3は、画像処理装置10で実現される機能のうち、本発明に関連する機能を示す機能ブロック図である。図3に示されるように、画像処理装置10は、原画像取得部41、文字認識部42、文字列変換部43、文字画像取得部44、表示態様決定部45、及び画像合成部46を含んでいる。また、文字認識部42は、構成画素特定部42a、及び文字情報取得部42bを含んでいる。また、表示態様決定部45は、被覆率算出部45a、位置決定部45b、及び書体決定部45cを含んでいる。図3に示される機能ブロックは、画像処理装置10の制御部11によって実現される。
原画像取得部41は、データベース20から画像30を取得し、文字認識部42及び画像合成部46に出力する。
文字認識部42は、画像30に含まれる文字列32を認識する。画像30に含まれる変換前の文字列32は、第1のテキストの一例である。文字認識部42が実行する文字認識処理としては、例えばOCR(Optical Character Recognition)とも呼ばれる公知の文字認識処理が適用される。具体的には、文字認識部42は、図5に示されるように文字列32の各文字に対応する文字領域36を特定し、文字領域36内のパターンを予め登録されたパターンと照合することで、文字列32の各文字を認識する。
文字認識部42に含まれる構成画素特定部42aは、画像30に含まれる文字列32を構成する構成画素を特定し、構成画素の位置を表す構成画素マップを表示態様決定部45に出力する。文字列32を構成する構成画素は、例えば、図5に示される文字領域36内を2値化することで特定される。構成画素のパターンは、文字認識処理に利用される。
文字認識部42に含まれる文字情報取得部42bは、文字認識処理の結果、文字列32を表す文字情報を取得し、文字列変換部43に出力する。文字情報は、例えば文字列32に含まれる各文字の文字コードを含んでいる。
なお、本実施形態では、文字認識処理により文字列32を表す文字情報を取得しているが、この態様に限られず、例えば、文字列32を表す文字情報が画像30に読み取り可能に埋め込まれていて、それを取得する態様であってもよい。
文字列変換部43は、文字列32を表す文字情報が入力されると、文字列32を他の文字列に変換し、変換後の文字列を表す文字情報を文字画像取得部44に出力する。文字列変換部43によって変換された変換後の文字列は、第2のテキストの一例である。本実施形態では、文字列32は他の言語に翻訳される。例えば、日本語の「最終日」という文字列32は、英語の「FINAL DAY」という文字列に翻訳される。
この態様に限られず、文字列32は同一言語の異なる種類の文字に変換されてもよい。例えば「最終日」という文字列32は、平仮名の「さいしゅうび」という文字列に変換されてもよいし、片仮名の「サイシュウビ」という文字列に変換されてもよい。なお、文字列に含まれる文字の数は、複数に限られず1つであってもよい。
また、例えば文字列32が日付や金額などの内容を表す場合、文字列32は、その内容に対応する新たな内容を表す文字列に更新されてもよい。例えば、制御部11は、文字列32が日付又は金額であることを認識すると、現在の日付又は金額などの情報を取得して、文字列32を当該日付又は金額を表す文字列に更新する。
文字画像取得部44は、変換後の文字列を表す文字情報が入力されると、不図示のフォントデータベースから変換後の文字列を表す文字画像を取得し、表示態様決定部45及び画像合成部46に出力する。アウトラインフォントの場合、変換後の文字列を表す文字画像はラスタライズされた上で出力される。ビットマップフォントの場合、変換後の文字列を表す文字画像はそのまま出力される。
表示態様決定部45は、決定手段及び出力手段の一例であり、変換後の文字列を表す文字画像の表示態様を、予め定められた複数の表示態様の中から、画像30に含まれる文字列32を構成する構成画素を被覆する度合いに基づいて決定する。本実施形態において、文字画像の表示態様とは、例えば文字画像の位置や書体などである。ここで、複数の表示態様は、非透明画素の量又は割合が相違する表示態様である。また、表示態様決定部45は、変換後の文字列を表す文字画像を画像30に重畳させる重畳位置を表す位置特定データを、文字画像と関連付けて、画像合成部46に出力する。
表示態様決定部45に含まれる被覆率算出部45aは、算出手段の一例であり、変換後の文字列を表す文字画像の非透明画素が、画像30に含まれる文字列32を構成する構成画素を被覆する被覆率を算出する。
表示態様決定部45に含まれる位置決定部45bは、被覆率算出部45aにより算出される被覆率に基づいて、変換後の文字列を表す文字画像の位置を決定する。
表示態様決定部45に含まれる書体決定部45cは、被覆率算出部45aにより算出される被覆率に基づいて、変換後の文字列を表す文字画像の書体を決定する。
なお、表示態様決定部45、被覆率算出部45a、位置決定部45b、及び書体決定部45cの機能の詳細については後述する(後述の図4のフローチャートを参照)。
画像合成部46は、合成手段の一例であり、変換後の文字列を表す文字画像を、表示態様決定部45により決定された表示態様で、画像30の文字列32上に合成する。具体的には、変換後の文字列を表す文字画像は、位置決定部45bにより決定された位置に、書体決定部45cにより決定された書体で、画像30上に合成される。
なお、図3に示される機能ブロックは、複数の装置に分散させてもよい。例えば、文字認識部42、文字列変換部43、及び文字画像取得部44による処理を前処理とし、表示態様決定部45による処理を本処理とし、画像合成部46による処理を後処理とするとき、これらの処理が別々の装置で実行されてもよい。また、これらの処理が時間的に離れていてもよく、この場合、前処理や本処理で生成されるデータがデータベースに一時的に保持されてもよい。また、クライアントサーバシステムにおいて、サーバからの指令に応じてクライアントが一部の処理を実行してもよい。
図4は、表示態様決定部45、被覆率算出部45a、位置決定部45b、及び書体決定部45cを実現するために、画像処理装置10で実行される処理の一例を示すフローチャートである。制御部11が図4に示す処理をプログラムに従って実行することによって、制御部11が表示態様決定部45、被覆率算出部45a、位置決定部45b、及び書体決定部45cとして機能するようになる。以下、図4を参照しながら、表示態様決定部45、被覆率算出部45a、位置決定部45b、及び書体決定部45cの詳細について説明する。
S1において、制御部11は、翻訳前文字列の構成画素マップ50を取得する。図6は、翻訳前文字列の構成画素マップ50の一例を示す図である。同図では、比較を容易にするため、「あ」の文字に係る構成画素マップ50を示している。構成画素マップ50は、翻訳前文字列の各文字を構成する構成画素52と、文字を構成しない背景の画素である非構成画素54と、を含んでいる。
S2において、制御部11は、翻訳後文字列の文字画像60を取得する。図7は、翻訳後文字列の文字画像60の一例を示す図である。同図では、比較を容易にするため、「A」の文字に係る文字画像60を示している。文字画像60は、翻訳後文字列の各文字を構成する非透明画素61と、文字を構成しない透明画素63と、を含んでいる。
なお、翻訳後文字列の文字画像60の初期の大きさは、画像30内に特定される文字領域36(図5を参照)の大きさ又は一連の複数の文字領域36を連結した領域の大きさに応じて決定される。また、翻訳後文字列の文字画像60の初期の書体としては、予め定められた基準書体が用いられる。
ここで、翻訳後文字列の文字画像60は、被覆画像の一例である。被覆画像は、例えば、原画像30と同じ大きさの透明画像に文字画像60を合成した画像であってもよい。
S3において、制御部11は、構成画素マップ50と文字画像60とを比較する。図8は、構成画素マップ50と文字画像60の比較の一例を示す図である。図中の×印の画素は、構成画素マップデータ50の構成画素52のうち、文字画像60の非透明画素61に被覆されないものを示している。
S4において、制御部11は、文字画像60の非透明画素61が構成画素マップ50の構成画素52を被覆する被覆率を算出する(被覆率算出部45aとしての機能)。具体的には、構成画素マップ50の構成画素52の全数に対する、文字画像60の非透明画素61により被覆される構成画素52の数の割合が、被覆率として算出される。
当該S3及びS4の処理は、文字画像60を合成する候補位置ごとに繰り返される(S5及びS51)。これにより、候補位置ごとの被覆率が算出される。具体的には、制御部11は、構成画素マップ50と重複する範囲内で文字画像60を1画素分ずつ移動させ、その都度、構成画素マップ50と文字画像60を比較し、被覆率を算出する。
S6において、制御部11は、候補位置ごとの被覆率に基づいて、文字画像60を合成する合成位置を決定する(位置決定部45bとしての機能)。具体的には、最も被覆率の高い候補位置が、合成位置として決定される。合成位置は、重畳位置の一例である。
S7において、制御部11は、文字画像60の合成位置における被覆率(すなわち、候補位置ごとの被覆率の最高値)が予め定められたしきい値を超えるか否かを判定する。被覆率がしきい値を超えない場合(S7:NO)、制御部11は、文字画像60の書体を変更した上で(S71)、上記S3〜S7の処理を繰り返す。
当該S71において、文字画像60の書体は、より非透明画素61の量又は割合が多い書体に変更される。具体的には、非透明画素61の量又は割合が相違する複数の書体が用意されており、被覆率がしきい値を超えるまで、非透明画素61の量又は割合の低いものから順番に書体が変更される。
本実施形態では、例えば、図9に示される基準書体、図10に示される拡大書体、図11に示される太字書体、及び図12に示される装飾書体が、この順番で適用される。
図9〜図12では、説明のため、各書体の文字画像60を画像30の文字列32上に実際に合成した例を図示している。なお、これらの図では、画像30の文字列32の明度を下げている。これらの図に示されるように、画像30の「最終日」という文字列32上には、「FINAL DAY」の文字列を表す文字画像60が合成されている。画像30の文字列32のうち、文字画像60の非透明画素61に被覆される部分は合成後の画像において視認不能であるのに対し、文字画像60の非透明画素61に被覆されない部分(すなわち、文字画像60の透明画素63と重複する部分)は合成後の画像において視認可能となる。これらの図に示されるように、適用の順番が後の書体ほど、画像30の文字列32の視認可能な部分の量を減少させる。
図9に示される基準書体は、本実施形態において1番目に適用される書体である。基準書体では、文字画像60の各文字のサイズは、画像30に含まれる文字列32の各文字と同程度とされる。
図10に示される拡大書体は、本実施形態において2番目に適用される書体である。拡大書体では、文字画像60の各文字の書体デザインが基準書体と同じまま、各文字のサイズが基準書体よりも大きくなっている。このため、拡大書体では、非透明画素61の量が基準書体よりも多くなっている。なお、拡大書体では、非透明画素61の割合は基準書体と同じであるが、画像30の文字領域36(図5を参照)で比較した場合には、非透明画素61の割合は基準書体よりも多くなる。
図11に示される太字書体は、本実施形態において3番目に適用される書体である。太字書体では、文字画像60の各文字のサイズは基準書体と同程度であるが、文字画像60の各文字の線幅が基準書体よりも太く、このため、非透明画素61の量及び割合が基準書体よりも多くなっている。また、本実施形態では、太字書体における非透明画素61の量及び割合は拡大書体よりも多くなっている。太字書体を適用する際には、文字画像60の各文字の書体デザインを同じにしたまま、各文字の線幅を太くしてもよいし、文字画像60の各文字の書体デザインをより線幅の太い書体デザインに変えてもよい。
図12に示される装飾書体は、本実施形態において4番目に適用される書体である。装飾書体では、文字画像60の各文字のサイズ及び線幅は基準書体と同程度であるが、文字画像60の各文字の外縁の外側に装飾が施されており、このため、非透明画素61の量及び割合が基準書体よりも多くなっている。本実施形態では、装飾書体における非透明画素61の量及び割合は拡大書体及び太字書体よりも多くなっている。各文字の外縁の外側に施される装飾としては、例えば、各文字の外縁から特定方向に延びる影や、各文字の外縁の全体から広がる光彩などがある。また、文字と装飾の境界を明確にするために、各文字の外縁を文字の内部又は装飾と異なる色にしてもよい。こうした文字にデザイン的効果を与える装飾は、フォントエフェクトとも呼ばれる。
上記図9〜図12では、画像30の文字列32上に合成される文字画像60の書体について説明したが、書体のバリエーションはこれらの例に限られない。例えば、拡大書体、太字書体、及び装飾書体の2又は3つを組み合わせた書体が適用されてもよい。非透明画素61の位置、量又は割合などが相違する種々の書体を適用することが可能である。
なお、本実施形態では、文字画像60の複数の書体は、非透明画素61の量又は割合の低いものから順番に適用されるが、これは一般に非透明画素の量又は割合の低い方が文字画像自体の可読性が高いためである。また、文字画像60の複数の書体を非透明画素61の量又は割合の低いものから順番に適用した方が、原画像30の文字列32に対する視覚的印象の変化が少ないためでもある。
図4の説明に戻り、S8において、制御部11は、被覆率がしきい値を超えた場合に(S7:YES)、その時点での書体を文字画像60に適用する書体として決定する(書体決定部45cとしての機能)。すなわち、制御部11は、最初に被覆率がしきい値を超えるn番目(nは自然数)の書体を、文字画像60に適用する書体として決定する。
以上により、画像30の文字列32上に合成される、翻訳後文字列を表す文字画像60の表示態様(本実施形態では位置及び書体)が被覆率に基づいて決定される。
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、種々の変形実施が当業者にとって可能であるのはもちろんである。
上記実施形態では、被覆率算出部45aが算出する被覆率に基づいて翻訳後文字列を表す文字画像60の表示態様を決定していたが、この態様に限られず、被覆率算出部45aを省略してもよい。例えば、構成画素マップ50に含まれる構成画素52の量又は割合に基づいて、翻訳後文字列を表す文字画像60の書体を決定してもよい。具体的には、構成画素52の量又は割合が多いほど、合成後に構成画素52が視認される蓋然性が高いことから、構成画素52の量又は割合に応じて文字画像60の1〜4番目の書体(図9〜図12)を段階的に切り替えることで、合成後に構成画素52が視認されることを抑制することが可能である。
また、上記実施形態では、画像処理装置10において原画像30上に文字画像60が合成されたが、この態様に限られず、表示装置の画面において原画像30上に文字画像60が重畳されるように表示されてもよい。例えば、クライアントサーバシステムにおいて、サーバが、原画像30上に文字画像60を重畳させる重畳位置を表す位置特定データを、文字画像60と共に、表示装置を備えるクライアントに送信してもよい(出力手段としての機能の一例)。クライアントは、文字画像60及び位置特定データを受信すると、表示装置の画面において原画像30上に文字画像60を重畳表示する。こうした重畳表示は、例えばAjax(Asynchronous JavaScript + XML(JavaScriptは登録商標))を利用した非同期通信により実現することができる。
なお、サーバからクライアントに文字画像60を送信する態様に限られず、原画像30と同じ大きさの透明画像に文字画像60を合成した被覆画像が送信されてもよい。すなわち、サーバは、原画像30と同じ大きさの透明画像の重畳位置に文字画像60を合成し、これにより得られる被覆画像をクライアントに送信する。クライアントは、表示装置の画面において原画像30上に被覆画像を重畳表示する。この場合、被覆画像の表示位置及び大きさが原画像30と同じであるので、被覆画像の表示位置を表す位置特定データの生成が容易である。
10 画像処理装置、11 制御部、12 記憶部、13 光ディスクドライブ部、14 通信インタフェース部、15 操作部、16 表示部、17 音声出力部、20 データベース、30 画像(原画像の一例)、32 文字列(第1のテキストの一例)、34 背景画像、36 文字領域、41 原画像取得部、42 文字認識部、42a 構成画素特定部、42b 文字情報取得部、43 文字列変換部、44 文字画像取得部、45 表示態様決定部(決定手段及び出力手段の一例)、45a 被覆率算出部(算出手段の一例)、45b 位置決定部、45c 書体決定部、46 画像合成部(合成手段の一例)、50 構成画素マップ、52 構成画素、54 非構成画素、60 文字画像、61 非透明画素、63 透明画素。

Claims (14)

  1. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される被覆率がしきい値を超えない場合に前記被覆率が前記しきい値を超えるまで変更する決定手段と、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段と、
    を備える画像処理装置。
  2. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いが所定以上となるように決定する決定手段と、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段と、
    を備え、
    前記表示態様は、前記被覆される度合いを変動させる要因となる表示書体を含み、
    前記決定手段は、前記表示書体の候補である候補書体の中から何れかを選択し、該選択された候補書体で表示される前記第2のテキストが、前記被覆される度合いが所定以上となるように前記表示態様を決定する、
    画像処理装置。
  3. 前記決定手段は、前記候補書体の中から、前記第2のテキストの非透明部分の量が小さい方から順に選択する、
    請求項2に記載の画像処理装置。
  4. 前記候補書体は、基準となる基準表示書体の他に、該基準表示書体よりも文字のサイズが大きい拡大表示書体と、該基準表示書体よりも文字の線幅が太い太字表示書体と、文字の外縁の外側に装飾が施された装飾表示書体と、の少なくとも何れかを含む、
    請求項2または3に記載の画像処理装置。
  5. 前記原画像において前記第1のテキストを構成する構成部分が前記第2のテキストの非透明部分により被覆される割合を表す被覆率を算出する算出手段をさらに備え、
    前記決定手段は、前記算出手段により算出される被覆率が所定の閾値以上又は超過となるように前記第2のテキストの表示態様を決定する、
    請求項1ないし4の何れかに記載の画像処理装置。
  6. 前記算出手段は、前記第1のテキストに対する前記第2のテキストの相対位置の候補を表す候補位置ごとに前記被覆率を順次算出し、
    前記決定手段は、前記算出手段により前記候補位置ごとに順次算出される前記被覆率が前記所定の閾値以上又は超過であるか否か判定する、
    請求項5に記載の画像処理装置。
  7. 前記出力手段は、前記原画像の前記位置特定データにより特定される位置上に前記被覆画像を合成するため、画像を合成する合成手段に前記被覆画像と前記位置特定データとを出力する、
    請求項1ないし6の何れかに記載の画像処理装置。
  8. 前記出力手段は、前記原画像の前記位置特定データにより特定される位置の手前に前記被覆画像を重畳表示させるため、画像表示機能を有する表示装置に前記被覆画像と前記位置特定データとを出力する、
    請求項1ないし6の何れかに記載の画像処理装置。
  9. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される被覆率がしきい値を超えない場合に前記被覆率が前記しきい値を超えるまで変更し、
    前記変更された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する、
    画像処理方法。
  10. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される被覆率がしきい値を超えない場合に前記被覆率が前記しきい値を超えるまで変更する決定手段、及び、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、
    としてコンピュータを機能させるプログラム。
  11. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される被覆率がしきい値を超えない場合に前記被覆率が前記しきい値を超えるまで変更する決定手段、及び、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、
    としてコンピュータを機能させるプログラムを記録したコンピュータ読み取り可能な情報記憶媒体。
  12. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いが所定以上となるように決定し、
    前記決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力し、
    前記表示態様は、前記被覆される度合いを変動させる要因となる表示書体を含み、
    前記決定では、前記表示書体の候補である候補書体の中から何れかを選択し、該選択された候補書体で表示される前記第2のテキストが、前記被覆される度合いが所定以上となるように前記表示態様を決定する、
    画像処理方法。
  13. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いが所定以上となるように決定する決定手段、及び、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、
    としてコンピュータを機能させ、
    前記表示態様は、前記被覆される度合いを変動させる要因となる表示書体を含み、
    前記決定手段は、前記表示書体の候補である候補書体の中から何れかを選択し、該選択された候補書体で表示される前記第2のテキストが、前記被覆される度合いが所定以上となるように前記表示態様を決定する、
    プログラム。
  14. 第1のテキストと一体化した原画像に重畳されるべき被覆画像における第2のテキストの表示態様を、前記原画像における前記第1のテキストが前記被覆画像における前記第2のテキストにより被覆される度合いが所定以上となるように決定する決定手段、及び、
    前記決定手段により決定された表示態様で表示される前記第2のテキストと一体化した前記被覆画像を前記原画像に重畳させる重畳位置を表す位置特定データを、前記被覆画像に関連付けて出力する出力手段、
    としてコンピュータを機能させ、
    前記表示態様は、前記被覆される度合いを変動させる要因となる表示書体を含み、
    前記決定手段は、前記表示書体の候補である候補書体の中から何れかを選択し、該選択された候補書体で表示される前記第2のテキストが、前記被覆される度合いが所定以上となるように前記表示態様を決定する、
    プログラムを記録したコンピュータ読み取り可能な情報記憶媒体。
JP2015504788A 2013-03-29 2013-03-29 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム Active JP5826966B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/059767 WO2014155744A1 (ja) 2013-03-29 2013-03-29 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム

Publications (2)

Publication Number Publication Date
JP5826966B2 true JP5826966B2 (ja) 2015-12-02
JPWO2014155744A1 JPWO2014155744A1 (ja) 2017-02-16

Family

ID=51622788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015504788A Active JP5826966B2 (ja) 2013-03-29 2013-03-29 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム

Country Status (3)

Country Link
US (1) US9905030B2 (ja)
JP (1) JP5826966B2 (ja)
WO (1) WO2014155744A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI684976B (zh) * 2018-11-30 2020-02-11 大陸商北京集創北方科技股份有限公司 可增進圖像緩存架構處理效率的裝置、處理方法及顯示裝置
AU2021202282B2 (en) 2020-04-21 2022-04-07 Canva Pty Ltd Systems and methods for applying effects to design elements
JP2023082471A (ja) * 2021-12-02 2023-06-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、動画像ファイルのデータ構造、情報処理システム、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009053838A (ja) * 2007-08-24 2009-03-12 Fuji Xerox Co Ltd 翻訳装置及びプログラム
JP2011175569A (ja) * 2010-02-25 2011-09-08 Sharp Corp 文書画像生成装置、文書画像生成方法及びコンピュータプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5857707A (en) * 1996-05-02 1999-01-12 Devlin; Stephen M. Jukebox display strip and method of making same
JPH11110480A (ja) * 1997-07-25 1999-04-23 Kuraritec Corp テキストの表示方法およびその装置
US20050086702A1 (en) * 2003-10-17 2005-04-21 Cormack Christopher J. Translation of text encoded in video signals
JP2006251902A (ja) 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP4817821B2 (ja) * 2005-12-01 2011-11-16 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US8144990B2 (en) * 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
KR20080114496A (ko) * 2007-06-26 2008-12-31 삼성전자주식회사 레이저 콘텐츠를 이용하여 장면을 구성하는 방법 및 장치
JP4711093B2 (ja) * 2008-08-28 2011-06-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
US20110097693A1 (en) * 2009-10-28 2011-04-28 Richard Henry Dana Crawford Aligning chunk translations for language learners
US8995698B2 (en) * 2012-07-27 2015-03-31 Starkey Laboratories, Inc. Visual speech mapping
US9037450B2 (en) * 2012-12-14 2015-05-19 Microsoft Technology Licensing, Llc Text overlay techniques in realtime translation
US9098888B1 (en) * 2013-12-12 2015-08-04 A9.Com, Inc. Collaborative text detection and recognition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009053838A (ja) * 2007-08-24 2009-03-12 Fuji Xerox Co Ltd 翻訳装置及びプログラム
JP2011175569A (ja) * 2010-02-25 2011-09-08 Sharp Corp 文書画像生成装置、文書画像生成方法及びコンピュータプログラム

Also Published As

Publication number Publication date
US20150379750A1 (en) 2015-12-31
JPWO2014155744A1 (ja) 2017-02-16
WO2014155744A1 (ja) 2014-10-02
US9905030B2 (en) 2018-02-27

Similar Documents

Publication Publication Date Title
AU2009209293B2 (en) Representing flat designs to be printed on curves of a 3-dimensional product
CA2937702C (en) Emphasizing a portion of the visible content elements of a markup language document
JP6233859B2 (ja) Web漫画の多国語サポートシステム
US20190361907A1 (en) Method for providing e-book service and computer program therefor
JP2011175569A (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
JP5512903B1 (ja) 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム
JP5826966B2 (ja) 画像処理装置、画像処理方法、情報記憶媒体、及びプログラム
US9881395B2 (en) Rendering multi-part glyphs
US9619126B2 (en) Computer-readable non-transitory storage medium with image processing program stored thereon, element layout changed material generating device, image processing device, and image processing system
CN112927314B (zh) 一种图像数据处理方法、装置以及计算机设备
US10818050B2 (en) Vector graphic font character generation techniques
JP6337680B2 (ja) 画像処理システム、画像処理装置、プログラム及び画像処理方法
JP2013003906A (ja) 電子文書装飾装置及び電子文書装飾プログラム
KR101064051B1 (ko) 간단한 광고 제작 방법 및 시스템
JP2010232737A (ja) 画像処理装置、画像形成装置およびプログラム
JP2005235205A (ja) 形状チャネルを用いないクリップ・トゥ・セルフ(clip−to−self)機能を有する合成
JP5672168B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2018019212A (ja) 情報処理装置及び描画処理方法、コンピュータプログラム
JP2012173785A (ja) 翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラム
JP2014023006A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
KR102185851B1 (ko) 전자책 제작방법 및 그를 위한 컴퓨터 프로그램
JP6700953B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4551906B2 (ja) 画像処理装置
KR100586602B1 (ko) 라스터 맵 오버레이 방법
WO2008041270A1 (en) Image synthesizing device and image synthesizing method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151014

R150 Certificate of patent or registration of utility model

Ref document number: 5826966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250