JP2018120338A - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP2018120338A
JP2018120338A JP2017010307A JP2017010307A JP2018120338A JP 2018120338 A JP2018120338 A JP 2018120338A JP 2017010307 A JP2017010307 A JP 2017010307A JP 2017010307 A JP2017010307 A JP 2017010307A JP 2018120338 A JP2018120338 A JP 2018120338A
Authority
JP
Japan
Prior art keywords
typeface
column
character
document
taste
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017010307A
Other languages
English (en)
Inventor
倩如 邱
Qianru QIU
倩如 邱
裕平 島田
Yuhei Shimada
裕平 島田
大村 賢悟
Kengo Omura
賢悟 大村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017010307A priority Critical patent/JP2018120338A/ja
Priority to US15/692,500 priority patent/US20180210865A1/en
Priority to CN201711082740.4A priority patent/CN108345577A/zh
Publication of JP2018120338A publication Critical patent/JP2018120338A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文字の書体を選択する場合に、文字の形状の特徴から抽出した印象を用いて書体を選択するようにした情報処理装置を提供する。【解決手段】情報処理装置の選択手段は、文字の形状の特徴と印象を対応させて記憶している記憶手段から抽出した文字の形状の特徴に対応する印象と最も類似する印象を有する書体を少なくとも1つ以上選択する。【選択図】図1

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、複数の言語をカバーする国際的なフォントを作成することを課題とし、複数の既存フォントをまとめて、単一のフォント・ファミリ、又は「仮想フォント」にグループ化するために、マークアップ言語ドキュメントを使用し、フォントを選択し、このマークアップ言語ドキュメントは、フォント・ファミリ内の個々のフォントのいずれが使用されるべきかについての条件に関するルールを含み、これによって、例えば、フォント開発者が、効率的なやり方で、いくつかの既存フォントを使用して、国際的なフォントを作り出せることが開示されている。
特許文献2には、ドキュメント中の書体データを判定してプリンタ搭載書体の中から最適な書体を特定して印刷処理することを課題とし、ドキュメントファイル中で使用されている書体データが取得されている搭載書体データ中に存在しないとプリンタドライバにより判定された場合に、書体置き換えデータサーバ装置よりプリンタで書体置き換え可能な書体置換情報を取得し、該書体置換情報と搭載書体データとに基づいて置き換えできるかどうかを判定して、プリンタで書体置き換え可能ないずれかの書体又は一意の書体を選択してドキュメントを印刷処理することが開示されている。
特許文献3には、多数のフォントの中から所望のフォントを迅速に見つけることを目的とし、部分イメージ検索領域に表示される複数の文字の一部の形状の中から所望の形状を選択し、検索領域をユーザーがクリックすることにより選択した形状を持つフォントが検索され、検索結果は検索結果領域に一覧表示され、フォント名を覚えていなくとも所望のフォントを見つけられることが開示されている。
特許文献4には、デザイン制作において、デザイン制作の目標となるイメージと実際のデザインのイメージとを容易に把握・修正できなかったことを課題とし、デザイン制作の際に目標となるイメージに関する文字情報を目標イメージとして決定する目標イメージ決定工程と、実際に制作されたデザインを取り込んで、そのデザインのイメージに関する文字情報をデザインイメージとして求めるデザインイメージ評価工程と、イメージに関する文字情報を表示画面の領域に割り当てたイメージマップ画面と、イメージマップ画面の領域のうち目標イメージ情報に対応する領域に目標イメージ情報と、デザインイメージ情報に対応する領域にデザインイメージと、を重ね合わせて表示するイメージ提示工程とを含むデザイン制作支援方法によって上記課題を解決できることが開示されている。
特開2004−157502号公報 特開2001−344085号公報 特開2000−222397号公報 特開2004−102734号公報
文字の形状によって、その文字から受ける印象が異なる。しかし、複数の既存フォントをまとめて、単一のフォント・ファミリを生成する構成では、その文字の印象が類似する書体を選択することができない。
そこで、本発明は、文字の書体を選択する場合に、文字の形状の特徴から抽出した印象を用いて書体を選択するようにした情報処理装置を提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字の形状の特徴と印象を対応させて記憶している記憶手段から抽出した文字の形状の特徴に対応する印象と最も類似する印象を有する書体を少なくとも1つ以上選択する選択手段を有する情報処理装置である。
請求項2の発明は、前記印象は複数の項目によって構成されており、前記特徴に対応する前記各項目における値を抽出する抽出手段をさらに有し、前記選択手段は、前記抽出手段によって抽出された値と前記書体の前記各項目における値との距離にしたがって、書体を選択する、請求項1に記載の情報処理装置である。
請求項3の発明は、前記抽出手段は、前記特徴に対応する前記各項目における値を、特徴と印象の各項目における値とを対応させた表から抽出する、請求項2に記載の情報処理装置である。
請求項4の発明は、操作者の操作にしたがって、前記抽出手段によって抽出された値を調整する調整手段をさらに有し、前記選択手段は、前記調整手段によって調整された値と前記書体の前記各項目における値との距離にしたがって、書体を選択する、請求項2に記載の情報処理装置である。
請求項5の発明は、前記選択手段は、第1の文書から前記文字を抽出し、前記選択手段によって選択された書体の文字を用いて第2の文書を生成する生成手段をさらに有する請求項1に記載の情報処理装置である。
請求項6の発明は、前記第1の文書の前記文字を翻訳する翻訳手段をさらに有し、前記生成手段は、前記選択手段によって選択された書体による翻訳後の文字によって、第2の文書を生成する、請求項5に記載の情報処理装置である。
請求項7の発明は、前記第1の文書には、複数の書体による文字が含まれており、前記選択手段は、前記第1の文書内の前記書体毎に、前記第2の文書に用いる書体を選択する、請求項5に記載の情報処理装置である。
請求項8の発明は、画像内の文字を対象として、該文字の形状の特徴を抽出する第2の抽出手段をさらに有し、前記選択手段は、前記第2の抽出手段によって抽出された特徴を用いて選択を行う、請求項1から7のいずれか一項に記載の情報処理装置である。
請求項9の発明は、電子文書内の文字を対象として、該文字の形状の特徴を抽出する第3の抽出手段をさらに有し、前記選択手段は、前記第3の抽出手段によって抽出された特徴を用いて選択を行う、請求項1から7のいずれか一項に記載の情報処理装置である。
請求項10の発明は、コンピュータを、文字の形状の特徴と印象を対応させて記憶している記憶手段から抽出した文字の形状の特徴に対応する印象と最も類似する印象を有する書体を少なくとも1つ以上選択する選択手段として機能させるための情報処理プログラムである。
請求項1の情報処理装置によれば、文字の書体を選択する場合に、文字の形状の特徴から抽出した印象を用いて書体を選択することができる。
請求項2の情報処理装置によれば、複数の項目によって構成されている印象を反映させて書体を選択することができる。
請求項3の情報処理装置によれば、特徴と印象の各項目における値とを対応させた表を用いて、特徴に対応する各項目における値を抽出することができる。
請求項4の情報処理装置によれば、書体を選択するのに、操作者が調整操作を行うことができる。
請求項5の情報処理装置によれば、選択された書体の文字による文書を生成することができる。
請求項6の情報処理装置によれば、選択された書体の文字による翻訳文書を生成することができる。
請求項7の情報処理装置によれば、文書内に複数の書体による文字が含まれている場合に、第1の文書に含まれている書体毎に第2の文書に用いる書体を選択することができる。
請求項8の情報処理装置によれば、画像内の文字の形状の特徴を反映させた書体の選択をすることができる。
請求項9の情報処理装置によれば、電子文書内の文字の形状の特徴を反映させた書体の選択をすることができる。
請求項10の情報処理プログラムによれば、文字の書体を選択する場合に、文字の形状の特徴から抽出した印象を用いて書体を選択することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 書体感性テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態が用いるテイストプロフィールの例を示す説明図である。 本実施の形態が用いるテイストプロフィールの例を示す説明図である。 本実施の形態による具体的処理例(1)を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 感性得点テーブルのデータ構造例を示す説明図である。 書体感性テーブルのデータ構造例を示す説明図である。 印象距離テーブルのデータ構造例を示す説明図である。 本実施の形態による具体的処理例(2)を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 感性得点テーブルのデータ構造例を示す説明図である。 感性得点テーブルのデータ構造例を示す説明図である。 書体感性テーブルのデータ構造例を示す説明図である。 印象距離テーブルのデータ構造例を示す説明図である。 本実施の形態による具体的処理例(3)を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 感性得点テーブルのデータ構造例を示す説明図である。 書体感性テーブルのデータ構造例を示す説明図である。 印象距離テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 感性得点テーブルのデータ構造例を示す説明図である。 書体感性テーブルのデータ構造例を示す説明図である。 印象距離テーブルのデータ構造例を示す説明図である。 本実施の形態による具体的処理例(4)を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 書体形状特徴感性テーブルのデータ構造例を示す説明図である。 本実施の形態による具体的処理例(5)を示す説明図である。 分析結果テーブルのデータ構造例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置100は、第1の文書から第2の文書を生成するものであって、図1の例に示すように、受付モジュール105、文字形状分析モジュール110、書体形状特徴感性DB115、テイスト判定モジュール120、書体感性DB125、テイストプロフィール比較モジュール130、結果表示モジュール135を有している。
既に作成されている文書である第1の文書と同じ印象(デザインテイスト、テイストともいわれる)を受けるように、第2の文書を作成する場合がある。例えば、第1の文書が第1の言語(例えば、英語等)で作成された文書であり、第2の文書が第1の文書を他の言語(例えば、日本語等)に翻訳した文書である場合、第2の文書は第1の文書の続きである場合等がある。これらの例に限定されることなく、2つの文書の印象を同じ印象を受けるようにしたい場合であればよい。特に、文書として販促物(チラシ、ビラ、パンフレット、ポスター、カタログ、リーフレット、ブックレット、ダイレクトメール(DM)、カレンダー、カード、名刺、WEBページ、レポート、プレゼンスライド等)等がある。
その場合、文書の構成要素である文字による印象を考慮する必要がある。文字から受ける印象も文書全体の印象に寄与するからである。文字の印象を考慮した書体の選択は困難である。例えば、電子文書が残されておらず、印刷後の紙の第1の文書で用いられている書体が不明となっている場合、第2の文書を作成する環境では第1の文書で用いられている書体を用いることができない場合、前述の翻訳のように、そもそも文字体系が異なるために第1の文書で用いられている書体と対応する書体を用いることができない場合等が該当する。
なお、印象は、後述するように、書体形状特徴感性DB115に記憶されている書体形状特徴感性テーブル400によって定義されている。例えば、プリティ、カジュアル、ダイナミック、エレガント、クラシック、ダンディ、シック、クリア等がある。また、同じ印象か否かについては、後述するように、テイストプロフィール比較モジュール130によって、テイスト判定モジュール120によって抽出された値と書体の各項目における値との距離を用いて判断する。
情報処理装置100は、元のフォントと選択したフォントの関連性を評価する。そして、文書内の書体を置き換えるときに、元書体のデザインテイストと類似している書体を選択する。
文字の印象は、複数の項目によって構成されている。「項目」は、印象を構成するものである。例えば、プリティ、カジュアル、ダイナミック、エレガント、クラシック、ダンディ、シック、クリア等がある。印象は、これらの複数の項目の値(強度を示す値)によって構成されている。
受付モジュール105は、文字形状分析モジュール110と接続されている。受付モジュール105は、ユーザー190の操作によって、第1の文書を受け付ける。ここでの第1の文書は、既に作成されている文書であって、画像であってもよいし、電子文書であってもよい。第1の文書が画像の場合は、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。第1の文書が電子文書の場合は、少なくともテキストデータを含み、数値データ、図形データ、画像データ、動画データ、音声データ等の組み合わせであってもよく、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。例えば、ユーザー190の操作にしたがって、文書作成プログラムによって作成された文書、Webページ等を含む。受け付ける第1の文書は、1枚であってもよいし、複数枚であってもよい。また、文書の内容として、前述の販促物、ビジネスに用いられる文書等であってもよい。
さらに、受付モジュール105は、ユーザー190の操作によって、第2の文書を受け付けるようにしてもよい。情報処理装置100は、その第2の文書内の文字を、第1の文書内の文字の印象と同じような印象となるように変更する。なお、第2の文書が第1の文書の翻訳である場合は、翻訳先の言語を受け付けるようにしてもよい。
文字形状分析モジュール110は、受付モジュール105、テイスト判定モジュール120と接続されている。文字形状分析モジュール110は、受付モジュール105が受け付けた第1の文書内の文字の形状を分析する。ここで分析とは、第1の文書内の文字の形状の特徴を抽出することである。ここで「文字の形状の特徴」とは、文字の外形上の特徴をいい、例えば、セリフ(文字の起筆部や終筆部を飾る線のこと、つまり、文字の起筆や終筆その他の部分に施された小さく突出した部分のこと)の有無、小文字の有無、シャープアペクス(文字の最上部又は最下部で画が接合するときの三角形)の有無、文字の起筆と終筆の形状が対称であるか否か(対称型であるか否か、又は、非対称型であるか否か)等がある。なお、アペクスとは、文字の頂点にあたる部分のことである。
第1の文書が画像である場合は、文字形状分析モジュール110は、その画像内の文字を対象として、その文字の形状の特徴を抽出する。例えば、既存の技術を用いて、画像内から文字を抽出する。そして、その文字の形状の特徴を抽出する。例えば、文字のエッジ検出を行い、そのエッジをベクトル変換して、形状の特徴を抽出してもよい。また、文字認識を行った後、予め定められた形状の特徴を有する書体の文字画像を複数生成し、第1の文書内の文字と同じ文字サイズに調整した後に、パターンマッチング等の技術を用いて、第1の文書内の文字と生成した文字画像との差異を算出して、差異が少ない書体の文字画像の特徴を、第1の文書内の文字の特徴とする等がある。なお、小文字であるか否かについては、文字認識を用いればよい。そして、文字認識の結果、第1の文書で用いられている言語を特定するようにしてもよい。
第1の文書が電子文書である場合は、文字形状分析モジュール110は、その電子文書内の文字を対象として、その文字の形状の特徴を抽出する。例えば、その第1の文書内の文字のプロパティ(属性)から書体を抽出することである。書体が特定できれば、その特徴から書体感性テーブル500を用いて、各項目における値を抽出することができるからである。なお、書体と形状の特徴を対応させたテーブルを予め用意し、特定した書体から形状の特徴をそのテーブルから抽出し、この後、第1の文書が画像である場合と同様の処理ができるようにしてもよい。そして、第1の文書内のテキストから、第1の文書で用いられている言語を特定するようにしてもよい。
書体形状特徴感性DB115は、テイスト判定モジュール120と接続されている。書体形状特徴感性DB115は、デザインテイストと特定な書体の形状の特徴の関係の強さを感性評価実験によって分析した結果を格納したデータベースである。具体的には、文字の形状の特徴に対応する印象を記憶している。この印象は、各項目における値によって構成されている。例えば、書体形状特徴感性テーブル400を記憶している。図4は、書体形状特徴感性テーブル400のデータ構造例を示す説明図である。書体形状特徴感性テーブル400は、特徴ID欄405、特徴欄410、プリティ欄415、カジュアル欄420、ダイナミック欄425、エレガント欄430、クラシック欄435、ダンディ欄440、シック欄445、クリア欄450を有している。特徴ID欄405は、本実施の形態において、特徴を一意に識別するための情報(特徴ID:IDentification)を記憶している。特徴欄410は、文字の形状に関する特徴を記憶している。例えば、「セリフあり」、「小文字なし」等がある。プリティ欄415は、その特徴に対応するプリティの値を記憶している。カジュアル欄420は、その特徴に対応するカジュアルの値を記憶している。ダイナミック欄425は、その特徴に対応するダイナミックの値を記憶している。エレガント欄430は、その特徴に対応するエレガントの値を記憶している。クラシック欄435は、その特徴に対応するクラシックの値を記憶している。ダンディ欄440は、その特徴に対応するダンディの値を記憶している。シック欄445は、その特徴に対応するシックの値を記憶している。クリア欄450は、その特徴に対応するクリアの値を記憶している。例えば、書体形状特徴感性テーブル400の1行目は、「セリフあり」の文字に対して、ダイナミック、ダンディ等の印象は高いが、逆にエレガント、クリア等の印象は低いことを示している。
テイスト判定モジュール120は、文字形状分析モジュール110、書体形状特徴感性DB115、テイストプロフィール比較モジュール130と接続されている。テイスト判定モジュール120は、文字形状分析モジュール110によって抽出された文字の形状の特徴に対応する各項目における値を抽出する。ここで「項目における値」とは、前述したプリティ等の項目の強度を示す値である。
また、テイスト判定モジュール120は、特徴に対応する各項目における値を、特徴と印象の各項目における値とを対応させた表から抽出するようにしてもよい。具体的には、「特徴と印象の各項目における値とを対応させた表」として、書体形状特徴感性DB115に記憶されている書体形状特徴感性テーブル400を用いる。例えば、文字の形状の特徴が「セリフあり」である場合は、書体形状特徴感性テーブル400のプリティ欄415〜クリア欄450内の値が、「項目における値」に該当する。つまり、テイスト判定モジュール120は、文字の形状の特徴に対応しているテイスト得点を計算し、テイストプロフィールを作成する。テイストプロフィールを図示したものについては、図7、図8の例を用いて後述する。
書体感性DB125は、テイストプロフィール比較モジュール130と接続されている。書体感性DB125は、デザインテイストと書体の関係の強さを感性評価実験によって評価した結果を格納したデータベースである。具体的には、書体に対応させて、その書体の文字から受ける印象の各項目の値を記憶している。例えば、書体感性テーブル500を記憶している。図5は、書体感性テーブル500のデータ構造例を示す説明図である。書体感性テーブル500は、和文書体ID欄505、書体名欄510、プリティ欄515、カジュアル欄520、ダイナミック欄525、エレガント欄530、クラシック欄535、ダンディ欄540、シック欄545、クリア欄550を有している。和文書体ID欄505は、本実施の形態において、書体を一意に識別するための情報(書体ID)を記憶している。書体名欄510は、その書体の名称を記憶している。プリティ欄515は、その書体に対応するプリティの値を記憶している。カジュアル欄520は、その書体に対応するカジュアルの値を記憶している。ダイナミック欄525は、その書体に対応するダイナミックの値を記憶している。エレガント欄530は、その書体に対応するエレガントの値を記憶している。クラシック欄535は、その書体に対応するクラシックの値を記憶している。ダンディ欄540は、その書体に対応するダンディの値を記憶している。シック欄545は、その書体に対応するシックの値を記憶している。クリア欄550は、その書体に対応するクリアの値を記憶している。
また、書体感性テーブル500として、見出し用、本文用等のように、文書の構成要素毎に用意しておいてもよい。同じ書体であっても、見出しに用いられるか、本文に用いられるか等によって、印象が異なる場合があるからである。
テイストプロフィール比較モジュール130は、テイスト判定モジュール120、書体感性DB125、結果表示モジュール135と接続されている。テイストプロフィール比較モジュール130は、文字の形状の特徴から抽出した印象と最も類似する印象を有する書体を少なくとも1つ以上選択する。ここで類似には、一致することを含む。例えば、テイストプロフィール比較モジュール130は、テイスト判定モジュール120が判定したテイストプロフィールと第2の文書で用いる書体のテイストプロフィールを比較し、印象差が小さい書体を抽出する。具体的には、テイストプロフィール比較モジュール130は、テイスト判定モジュール120によって抽出された値と書体の各項目における値との距離にしたがって、書体を選択する。ここで「文字の形状の特徴」は、文字形状分析モジュール110によって抽出された特徴である。したがって、テイストプロフィール比較モジュール130は、文字形状分析モジュール110によって抽出された特徴を用いて選択を行う。
また、テイストプロフィール比較モジュール130は、第1の文書から文字を抽出してもよい。この文字は、結果表示モジュール135によって翻訳対象として利用される。詳細な処理については、具体的処理例(3)を用いて詳述する。
また、第1の文書には、複数の書体による文字が含まれている場合、テイストプロフィール比較モジュール130は、第1の文書内の書体毎に、第2の文書に用いる書体を選択するようにしてもよい。詳細な処理については、具体的処理例(4)を用いて詳述する。
結果表示モジュール135は、テイストプロフィール比較モジュール130と接続されている。結果表示モジュール135は、テイストプロフィール比較モジュール130による処理結果(書体の選択結果)をユーザー190に提示する。
また、結果表示モジュール135は、テイストプロフィール比較モジュール130によって選択された書体の文字を用いて第2の文書を生成するようにしてもよい。例えば、結果表示モジュール135は、第1の文書内の文字(文章)を翻訳し、テイストプロフィール比較モジュール130によって選択された書体による翻訳後の文字によって、第2の文書を生成する。具体的には、翻訳用の書体(テイストプロフィール比較モジュール130によって選択された書体)を利用して、第1の文書内の文字内容を替えることを行う。そして、第2の文書を出力する。ここで文書を出力するとは、例えば、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で文書を送信すること、文書データベース等の記憶装置へ文書を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。
図2は、本実施の形態の構成例(変更例)についての概念的なモジュール構成図である。
情報処理装置200は、受付モジュール105、文字形状分析モジュール110、書体形状特徴感性DB115、テイスト判定モジュール120、書体感性DB125、テイストプロフィール比較モジュール130、結果表示モジュール135、テイスト調整モジュール240を有している。図1の例に示した情報処理装置100にテイスト調整モジュール240を付加したものである。図1の例に示した情報処理装置100と同種の部位には同一符号を付し重複した説明を省略する。
テイスト判定モジュール120は、文字形状分析モジュール110、書体形状特徴感性DB115、テイストプロフィール比較モジュール130、テイスト調整モジュール240と接続されている。
テイスト調整モジュール240は、テイスト判定モジュール120と接続されている。テイスト調整モジュール240は、ユーザー190の操作にしたがって、テイスト判定モジュール120によって抽出された値を調整する。例えば、テイスト調整モジュール240は、テイスト判定モジュール120が判定したテイストプロフィールの上に、ユーザー190がテイストの強さを調整するようにしてもよい。具体的には、図7、図8の例で示されるテイストプロフィール上の項目の値を上下させる調整を行う。
テイストプロフィール比較モジュール130は、テイスト調整モジュール240によって調整された値と書体の各項目における値との距離にしたがって、書体を選択する。詳細な処理については、具体的処理例(2)を用いて後述する。
図3は、本実施の形態を利用したシステム構成例を示す説明図である。
図3(a)に示す例は、スタンドアロンとして構成した場合の例である。
画像処理装置300は、情報処理装置100(情報処理装置200)を有している。画像処理装置300は、複写機、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等であって、例えば、第1の文書を画像処理装置300のスキャナによって読み込み、情報処理装置100の処理結果である第2の文書を画像処理装置300のプリンタによって印刷する。
図3(b)に示す例は、通信回線390を介して、複数の装置によって構成されるようにしたものである。情報処理装置100(情報処理装置200)、ユーザー端末310、画像処理装置320、フォント管理装置330は、通信回線390を介してそれぞれ接続されている。通信回線390は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100(情報処理装置200)による機能は、クラウドサービスとして実現してもよい。フォント管理装置330は、フォントを管理する装置であり、例えば、書体形状特徴感性DB115、書体感性DB125を有し、フォントデータ等を記憶している。そして、ユーザー端末310、画像処理装置320の要求によって、フォントデータを提供してもよい。
例えば、第1の文書が画像である場合、第1の文書を画像処理装置320のスキャナによって読み込み、情報処理装置100に送信し、処理結果である第2の文書を画像処理装置320のプリンタによって印刷する、又は、ユーザー端末310で受け取る。また、第1の文書が電子文書である場合、第1の文書をユーザー端末310から情報処理装置100に送信し、処理結果である第2の文書をユーザー端末310で受け取る、又は、画像処理装置320のプリンタによって印刷する。また、ユーザー端末310、画像処理装置320で、第2の文書を出力するにあたり、フォントデータが不足している場合は、フォント管理装置330からダウンロードしてもよい。
図6は、本実施の形態(情報処理装置100)による処理例を示すフローチャートである。
ステップS602では、受付モジュール105は、ユーザーが作成した販促物(第1の文書)の画像を入力する。
ステップS604では、文字形状分析モジュール110は、文字内容に対応した言語(第1の文書内の文字の言語)を認識する。
ステップS606では、文字形状分析モジュール110は、文字の形状特徴を認識する。
ステップS608では、テイスト判定モジュール120は、形状特徴に対応したテイストスコアを抽出する。具体的には、書体形状特徴感性テーブル400を用いて、形状特徴から各テイストの値を抽出する。
ステップS610では、テイスト判定モジュール120は、形状特徴に対応した各テイストの得点を算出する。具体的には、複数の形状特徴での各テイストの値を、テイスト毎に加算する。
ステップS612では、テイスト判定モジュール120は、形状特徴に対応したテイストプロフィールを生成する。例えば、図7は、テイストプロフィールを図示したものであり、「プリティ」、「カジュアル」等のテイスト1〜5の5軸で示したものである。もちろんのことながら、書体形状特徴感性テーブル400で示したように8軸のテイストでテイストプロフィールを生成してもよい。なお、図7内の実線は元言語(ステップS604で認識された言語)の書体、点線は指定した言語(ステップS614で指定された言語)の書体を示している。したがって、ステップS612の時点では実線のテイストプロフィールだけが生成されている。
ステップS614では、受付モジュール105は、ユーザーが指定した言語を受け付ける。つまり、第2の文書の言語を受け付ける。ステップS604で認識された言語と異なる場合は、翻訳が行われる。
ステップS616では、テイストプロフィール比較モジュール130は、指定した言語の書体に対応したテイストプロフィールと判定したテイストプロフィールの差を計算する。図7の例で示したように、実線と点線の差(距離)を計算する。もちろんのことながら、比較対象とする書体は複数となる。例えば、図8は、比較対象とする書体が2つである場合のテイストプロフィールを図示したものである。図8内の実線は元言語(ステップS604で認識された言語)の書体、点線は指定した言語(ステップS614で指定された言語)の書体A、一点鎖線は指定した言語(ステップS614で指定された言語)の書体Bを示している。
ステップS616での計算は、例えば、式(1)を用いる。
ここで、Distは、2つの書体間のテイストの距離を示している。mは、テイストの種類の数を示している。TasteScoreは、書体のテイストスコアを示している。TasteScore0,iは、元言語における書体のテイストスコアを示している。TasteScore1〜n,iは、指定した言語における書体のテイストスコアを示している。添え字1〜nは、各テイスト(項目)を示している。
ステップS618では、テイストプロフィール比較モジュール130は、判定したテイストプロフィールと類似しているテイストを持つ書体を選択する。もちろんのことながら、最も類似している書体1つを選択してもよいし、その書体を含めて複数の書体を選択し、最終的な選択はユーザーが行うようにしてもよい。複数の書体を選択することは、例えば、差が予め定められた閾値未満である書体を選択してもよいし、差を昇順に並べて予め定められた順位までの書体を選択してもよい。
ステップS620では、結果表示モジュール135は、デザイン結果である第2の文書を合成・表示する。
次に、具体的処理例(1)〜(4)を用いて、第1の文書が画像である場合の処理について説明し、具体的処理例(5)を用いて、第1の文書が電子文書である場合の処理について説明する。
<具体的処理例(1)>
英語版の販促物(紙文書、チラシ)を書体感性DB125に記憶されている欧文書体を使って電子文書として再作成する場合の例である。つまり、第1の文書が欧文文字であり、第2の文書も欧文文書である場合である。
図9は、本実施の形態による具体的処理例(1)を示す説明図である。情報処理装置100は、対象画像910を対象画像として入力し、再作成した結果として処理結果画像990を出力する例を示している。具体的には、英語版のチラシをスキャンして情報処理装置100に入力し、テイストが一致している英語版のチラシを再作成する。
文字形状分析モジュール110は、文字と文字書体特徴の認識エンジンとしての機能を有しており、対象画像910の文字内容(使用言語)は英語と認識する。そして、文字形状分析モジュール110は、対象画像910の文字形状を抽出する。その後、テイスト判定モジュール120は、その形状を欧文書体の書体形状特徴感性DB115から探索してテイスト得点を取得し、文字のテイストプロフィールを算出する。テイストプロフィール比較モジュール130は、書体選択エンジンとしての機能を有しており、テイスト判定モジュール120によって算出された文字のテイストプロフィールと類似しているテイストを持つ欧文書体をピックアップ(抽出)する。
文字形状分析モジュール110による文字認識の処理結果として、分析結果テーブル1000を生成する。図10は、分析結果テーブル1000のデータ構造例を示す説明図である。分析結果テーブル1000は、内容ID欄1005、元内容欄1010、再作成内容欄1015、内容属性欄1020を有している。内容ID欄1005は、本実施の形態において、内容を一意に識別するための情報(内容ID)を記憶している。元内容欄1010は、元内容を記憶している。つまり、文字認識結果を記憶している。再作成内容欄1015は、再作成内容を記憶している。この例では、元内容欄1010の内容と同じである。なお、ユーザー190の指示にしたがって、再作成内容欄1015の内容が定まる。この場合は、対象画像910をそのまま再生する旨の指示が行われている。内容属性欄1020は、文書の構成要素の種別を示す内容属性を記憶している。文字形状分析モジュール110は、既存の技術を用いて、文書の構成要素を認識する。例えば、文字のサイズを予め定められた閾値と比較することによって、見出し、本文等に分類する。この構成要素にしたがって、対象とする書体(書体感性DB125内の書体)を限定してもよい。例えば、見出しについては、全ての書体を対象とするようにしてもよいし、本文については、明朝体とゴシック体の書体だけを対象とするようにしてもよい。
図11は、本実施の形態による処理例を示す説明図である。文字形状分析モジュール110による文字の形状分析処理の例を示すものである。
文字形状分析モジュール110は、対象画像910から見出し領域1120を抽出する(図11(a)、(b)の例参照)。そして、各文字について、形状の特徴を抽出する。例えば、図11(c)の例に示すように、文字「P」から「セリフなし」、文字「t」から「シャープアペクスなし」、文字「c」から「対称型」の特徴を抽出する。
そして、テイスト判定モジュール120は、文字形状分析モジュール110が抽出した形状の特徴に関するテイスト得点を書体形状特徴感性DB115から抽出する。例えば、抽出結果として書体形状特徴感性テーブル1200を生成する。図12は、書体形状特徴感性テーブル1200のデータ構造例を示す説明図である。書体形状特徴感性テーブル1200は、特徴ID欄1205、特徴欄1210、プリティ欄1215、カジュアル欄1220、ダイナミック欄1225、エレガント欄1230、クラシック欄1235、ダンディ欄1240、シック欄1245、クリア欄1250を有している。特徴ID欄1205は、本実施の形態において、特徴を一意に識別するための情報(特徴ID:IDentification)を記憶している。特徴欄1210は、特徴を記憶している。プリティ欄1215は、プリティの値を記憶している。カジュアル欄1220は、カジュアルの値を記憶している。ダイナミック欄1225は、ダイナミックの値を記憶している。エレガント欄1230は、エレガントの値を記憶している。クラシック欄1235は、クラシックの値を記憶している。ダンディ欄1240は、ダンディの値を記憶している。シック欄1245は、シックの値を記憶している。クリア欄1250は、クリアの値を記憶している。図12の例では、3つの特徴((1)セリフなし、(2)「t」シャープアペクスなし、(3)「c」対称型)のそれぞれに対して、8つの項目における値(感性スコア)が抽出されている。
テイスト判定モジュール120は、書体形状特徴感性テーブル1200から感性得点テーブル1300を生成する。図13は、感性得点テーブル1300のデータ構造例を示す説明図である。感性得点テーブル1300は、統合ID欄1305、プリティ欄1310、カジュアル欄1315、ダイナミック欄1320、エレガント欄1325、クラシック欄1330、ダンディ欄1335、シック欄1340、クリア欄1345を有している。統合ID欄1305は、本実施の形態において、各項目の値の統合を一意に識別するための情報(統合ID)を記憶している。プリティ欄1310は、統合したプリティの値を記憶している。カジュアル欄1315は、統合したカジュアルの値を記憶している。ダイナミック欄1320は、統合したダイナミックの値を記憶している。エレガント欄1325は、統合したエレガントの値を記憶している。クラシック欄1330は、統合したクラシックの値を記憶している。ダンディ欄1335は、統合したダンディの値を記憶している。シック欄1340は、統合したシックの値を記憶している。クリア欄1345は、統合したクリアの値を記憶している。
具体的には、抽出した特徴の感性スコアにより、対象画像910の文字内容の感性得点を計算する。式(2)を用いて、プリティ(1つ目の項目)の感性得点を計算する。いわゆる平均値である。
なお、ScoreOfCharacterprettyは、プリティの感性得点を示しており、プリティ欄1310内の値である。ScoreOfCharacteri,prettyは、各特徴におけるプリティの感性得点を示しており、プリティ欄1215内の値である。CountOfCharactersは、抽出した特徴の数を示しており、特徴ID欄1205の個数(3)である。図12の例では、「(0.0385+0.0954−0.0634)/3」の計算を行い、図13の例に示す「0.0235」を得る。もちろんのことながら、他の項目(カジュアル等)についても同等の式を用いればよい。
次に、テイストプロフィール比較モジュール130は、書体感性DB125から欧文書体で見出しに使用できる書体を抽出する。例えば、抽出結果として書体感性テーブル1400を生成する。図14は、書体感性テーブル1400のデータ構造例を示す説明図である。書体感性テーブル1400は、欧文書体ID欄1405、書体名欄1410、プリティ欄1415、カジュアル欄1420、ダイナミック欄1425、エレガント欄1430、クラシック欄1435、ダンディ欄1440、シック欄1445、クリア欄1450を有している。欧文書体ID欄1405は、本実施の形態において、欧文書体を一意に識別するための情報(欧文書体ID)を記憶している。書体名欄1410は、書体名を記憶している。プリティ欄1415は、その書体におけるプリティの値を記憶している。カジュアル欄1420は、その書体におけるカジュアルの値を記憶している。ダイナミック欄1425は、その書体におけるダイナミックの値を記憶している。エレガント欄1430は、その書体におけるエレガントの値を記憶している。クラシック欄1435は、その書体におけるクラシックの値を記憶している。ダンディ欄1440は、その書体におけるダンディの値を記憶している。シック欄1445は、その書体におけるシックの値を記憶している。クリア欄1450は、その書体におけるクリアの値を記憶している。
ここでは、欧文書体に関するテイスト得点(感性スコア)として、見出しに関する6つの書体を書体感性DB125から抽出した結果である。
そして、テイストプロフィール比較モジュール130は、感性得点テーブル1300、書体感性テーブル1400から印象距離テーブル1500を生成する。図15は、印象距離テーブル1500のデータ構造例を示す説明図である。印象距離テーブル1500は、欧文書体ID欄1505、書体名欄1510、印象距離欄1515を有している。欧文書体ID欄1505は、欧文書体IDを記憶している。書体名欄1510は、書体名を記憶している。印象距離欄1515は、印象距離を記憶している。
具体的には、各書体の感性スコアにより、統合した感性得点との印象距離を計算し、例えば、距離が一番小さい書体(又は、距離が一番小さい書体を含む複数の書体)を選択する。この例では、書体「Arial」が選択される。結果表示モジュール135は、この書体「Arial」の文字(分析結果テーブル1000の再作成内容欄1015)を用いて、処理結果画像990を作成し、提示する。もちろんのことながら、前述したように複数選択してもよい。複数の書体を選択した場合は、各々の書体を用いて複数の処理結果画像990を作成し、ユーザー190に選択可能に提示してもよい。
具体的には、式(3)を用いて、各書体の印象距離を計算する。
なお、Distは、書体nの印象距離を示しており、印象距離欄1515内の値である。TasteScoren,iは、書体nにおける各テイストの感性スコアであり、例えば、プリティの場合は、プリティ欄1415内の値である。TasteScore0,iは、感性得点テーブル1300における各テイストの感性得点である。
<具体的処理例(2)>
英語版の販促物(紙文書、チラシ)の持つテイストを、ユーザー190の操作にしたがって調整し、書体感性DB125に記憶されている欧文書体を使って電子文書として再作成する場合の例である。つまり、第1の文書が欧文文字であり、第2の文書も欧文文書である場合であって、操作者の操作にしたがって、テイスト判定モジュール120によって抽出された値を調整するものである。なお、具体的処理例(1)と同等の処理、例えば、式(2)、式(3)を用いること等については説明を省略した。
図16は、本実施の形態による具体的処理例(2)を示す説明図である。情報処理装置200は、対象画像1610を対象画像として入力し、ユーザー190によってテイストを調整1620が行われ、その調整後に再作成した結果として処理結果画像1690を出力する例を示している。具体的には、英語版のチラシをスキャンして情報処理装置200に入力し、テイストを調整し、そのテイストが一致している英語版のチラシを再作成する。
テイストを調整1620として、例えば、「エレガント」、「クラシック」のテイストを強くするという調整指示があったものとして説明する。なお、テイスト調整モジュール240による処理以外は、具体的処理例(1)と同等である。
文字形状分析モジュール110は、文字と文字書体特徴の認識エンジンとしての機能を有しており、対象画像1610の文字内容(使用言語)は英語と認識する。そして、文字形状分析モジュール110は、対象画像1610の文字形状を抽出する。その後、テイスト判定モジュール120は、その形状を欧文書体の書体形状特徴感性DB115から探索してテイスト得点を取得し、文字のテイストプロフィールを算出する。テイスト調整モジュール240は、ユーザー190のテイストを調整1620にしたがって、テイストを調整する。テイストプロフィール比較モジュール130は、書体選択エンジンとしての機能を有しており、テイスト調整モジュール240によって調整された文字のテイストプロフィールと類似しているテイストを持つ欧文書体をピックアップ(抽出)する。
文字形状分析モジュール110による文字認識の処理結果として、分析結果テーブル1700を生成する。図17は、分析結果テーブル1700のデータ構造例を示す説明図である。分析結果テーブル1700は、内容ID欄1705、元内容欄1710、再作成内容欄1715、内容属性欄1720を有している。具体的処理例(1)における図10の例に示す分析結果テーブル1000のデータ構造と同等である。
図18は、本実施の形態による処理例を示す説明図である。文字形状分析モジュール110による文字の形状分析処理の例を示すものである。具体的処理例(1)における図11の例と同等である。
そして、テイスト判定モジュール120は、文字形状分析モジュール110が抽出した形状の特徴に関するテイスト得点を書体形状特徴感性DB115から抽出する。例えば、抽出結果として書体形状特徴感性テーブル1900を生成する。図19は、書体形状特徴感性テーブル1900のデータ構造例を示す説明図である。書体形状特徴感性テーブル1900は、特徴ID欄1905、特徴欄1910、プリティ欄1915、カジュアル欄1920、ダイナミック欄1925、エレガント欄1930、クラシック欄1935、ダンディ欄1940、シック欄1945、クリア欄1950を有している。具体的処理例(1)における図12の例のデータ構造と同等である。
テイスト判定モジュール120は、書体形状特徴感性テーブル1900から感性得点テーブル2000を生成する。図20は、感性得点テーブル2000のデータ構造例を示す説明図である。感性得点テーブル2000は、統合ID欄2005、プリティ欄2010、カジュアル欄2015、ダイナミック欄2020、エレガント欄2025、クラシック欄2030、ダンディ欄2035、シック欄2040、クリア欄2045を有している。具体的処理例(1)における図13の例のデータ構造と同等である。
次に、テイスト調整モジュール240は、ユーザー190のテイストを調整1620による指示にしたがって、感性得点テーブル2000内のエレガントの値を「+0.3271」、クラシックの値を「+0.4085」として、感性得点テーブル2100を生成する。図21は、感性得点テーブル2100のデータ構造例を示す説明図である。感性得点テーブル2100は、調整ID欄2105、プリティ欄2110、カジュアル欄2115、ダイナミック欄2120、エレガント欄2125、クラシック欄2130、ダンディ欄2135、シック欄2140、クリア欄2145を有している。図20の例に示した感性得点テーブル2000と同等のデータ構造である。ただし、エレガント欄2125の値が「−0.1271」から「0.2000」に変更され、クラシック欄2130の値が「−0.2085」から「0.2000」に変更されている。
例えば、ユーザー190のテイストを調整1620の指示として、図7、図8の例に示したようなテイストプロフィールが提示され、エレガントとクラシックの軸の値を強調する操作が行われる。
次に、テイストプロフィール比較モジュール130は、書体感性DB125から欧文書体で見出しに使用できる書体を抽出する。例えば、抽出結果として書体感性テーブル2200を生成する。図22は、書体感性テーブル2200のデータ構造例を示す説明図である。書体感性テーブル2200は、欧文書体ID欄2205、書体名欄2210、プリティ欄2215、カジュアル欄2220、ダイナミック欄2225、エレガント欄2230、クラシック欄2235、ダンディ欄2240、シック欄2245、クリア欄2250を有している。具体的処理例(1)における図14の例のデータ構造と同等である。
そして、テイストプロフィール比較モジュール130は、感性得点テーブル2100、書体感性テーブル2200から印象距離テーブル2300を生成する。図23は、印象距離テーブル2300のデータ構造例を示す説明図である。印象距離テーブル2300は、欧文書体ID欄2305、書体名欄2310、印象距離欄2315を有している。具体的処理例(1)における図15の例のデータ構造と同等である。
具体的には、各書体の感性スコアにより、統合した感性得点との印象距離を計算し、例えば、距離が一番小さい書体(又は、距離が一番小さい書体を含む複数の書体)を選択する。この例では、書体「Garamond」が選択される。結果表示モジュール135は、この書体「Garamond」の文字(分析結果テーブル1700の再作成内容欄1715)を用いて、処理結果画像1690を作成し、提示する。もちろんのことながら、前述したように複数選択してもよい。複数の書体を選択した場合は、各々の書体を用いて複数の処理結果画像1690を作成し、ユーザー190に選択可能に提示してもよい。
<具体的処理例(3)>
英語版の販促物(紙文書、チラシ)を日本語に翻訳し、書体感性DB125に記憶されている和文書体を使って電子文書として再作成する場合の例である。つまり、第1の文書が欧文文字であり、第2の文書は和文文書である場合である。ただし、本文と見出しがあり、それぞれのテイストが同じになるように別々に処理している。
図24は、本実施の形態による具体的処理例(3)を示す説明図である。情報処理装置100は、対象画像2410を対象画像として入力し、翻訳後に再作成した結果として処理結果画像2490を出力する例を示している。具体的には、英語版のチラシをスキャンして情報処理装置100に入力し、テイストが一致している日本語版のチラシを再作成する。
文字形状分析モジュール110は、文字と文字書体特徴の認識エンジン、翻訳エンジンとしての機能を有しており、対象画像2410の文字内容(使用言語)は英語と認識し、文字認識を行い、英語から日本語への翻訳を行う。そして、文字形状分析モジュール110は、対象画像2410の文字形状を抽出する。その後、テイスト判定モジュール120は、その形状を欧文書体の書体形状特徴感性DB115から探索してテイスト得点を取得し、文字のテイストプロフィールを算出する。テイストプロフィール比較モジュール130は、書体選択エンジンとしての機能を有しており、テイスト判定モジュール120によって算出された文字のテイストプロフィールと類似しているテイストを持つ和文書体をピックアップ(抽出)する。
文字形状分析モジュール110による文字認識、翻訳の処理結果として、分析結果テーブル2500を生成する。図25は、分析結果テーブル2500のデータ構造例を示す説明図である。分析結果テーブル2500は、内容ID欄2505、元内容欄2510、再作成内容欄2515、内容属性欄2520を有している。具体的処理例(1)における図10の例に示す分析結果テーブル1000のデータ構造と同等である。ただし、再作成内容欄2515内は、元内容欄2510に対応する日本語となっている。また、図25は、見出しと本文に分類されている例を示している。見出しと本文で適用する書体(書体感性DB125内の書体)が異なる。この例では、見出しについて、全ての書体を対象とし、本文に対しては、明朝体とゴシック体の書体だけを対象とする。
以下、本文部分と見出し部分との処理を分けて行う。
まず、見出し部分について、以下の処理を行う。もちろんのことながら、いずれを先に行ってもよいし、並列的に処理を行うようにしてもよい。
図26は、本実施の形態による処理例を示す説明図である。文字形状分析モジュール110による文字の形状分析処理の例を示すものである。
文字形状分析モジュール110は、対象画像2410から見出し領域2620を抽出する(図26(a)、(b)の例参照)。そして、各文字について、形状の特徴を抽出する。例えば、図26(c)の例に示すように、文字「NEKOMURA TORAO」から「小文字なし」、文字「N」から「セリフあり」、文字「MN」から「「M」シャープアペクス」の特徴を抽出する。
そして、テイスト判定モジュール120は、文字形状分析モジュール110が抽出した形状の特徴に関するテイスト得点を書体形状特徴感性DB115から抽出する。例えば、抽出結果として書体形状特徴感性テーブル2700を生成する。図27は、書体形状特徴感性テーブル2700のデータ構造例を示す説明図である。書体形状特徴感性テーブル2700は、特徴ID欄2705、特徴欄2710、プリティ欄2715、カジュアル欄2720、ダイナミック欄2725、エレガント欄2730、クラシック欄2735、ダンディ欄2740、シック欄2745、クリア欄2750を有している。具体的処理例(1)における図12の例のデータ構造と同等である。
テイスト判定モジュール120は、書体形状特徴感性テーブル2700から感性得点テーブル2800を生成する。図28は、感性得点テーブル2800のデータ構造例を示す説明図である。感性得点テーブル2800は、統合ID欄2805、プリティ欄2810、カジュアル欄2815、ダイナミック欄2820、エレガント欄2825、クラシック欄2830、ダンディ欄2835、シック欄2840、クリア欄2845を有している。具体的処理例(1)における図13の例のデータ構造と同等である。
次に、テイストプロフィール比較モジュール130は、書体感性DB125から和文書体で見出しに使用できる書体を抽出する。例えば、抽出結果として書体感性テーブル2900を生成する。図29は、書体感性テーブル2900のデータ構造例を示す説明図である。書体感性テーブル2900は、和文書体ID欄2905、書体名欄2910、プリティ欄2915、カジュアル欄2920、ダイナミック欄2925、エレガント欄2930、クラシック欄2935、ダンディ欄2940、シック欄2945、クリア欄2950を有している。具体的処理例(1)における図14の例のデータ構造と同等である。見出しとして、5つの和文書体がある例である。
そして、テイストプロフィール比較モジュール130は、感性得点テーブル2800、書体感性テーブル2900から印象距離テーブル3000を生成する。図30は、印象距離テーブル3000のデータ構造例を示す説明図である。印象距離テーブル3000は、和文書体ID欄3005、書体名欄3010、印象距離欄3015を有している。具体的処理例(1)における図15の例のデータ構造と同等である。
具体的には、各書体の感性スコアにより、統合した感性得点との印象距離を計算し、例えば、距離が一番小さい書体(又は、距離が一番小さい書体を含む複数の書体)を選択する。この例では、書体「小塚明朝」が選択される。結果表示モジュール135は、見出しについて、この書体「小塚明朝」の文字(分析結果テーブル2500の再作成内容欄2515の見出し部分)を用いて、処理結果画像2490を作成する。もちろんのことながら、前述したように複数選択してもよい。複数の書体を選択した場合は、各々の書体を用いて複数の処理結果画像2490の見出し部分を作成してもよい。
次に、本文部分について、見出し部分に対する処理と同等の処理を行う。
図31は、本実施の形態による処理例を示す説明図である。文字形状分析モジュール110による文字の形状分析処理の例を示すものである。
文字形状分析モジュール110は、対象画像2410から本文領域3120、本文領域3130を抽出する(図31(a)、(b)の例参照)。そして、各文字について、形状の特徴を抽出する。例えば、図31(c)の例に示すように、文字「P」から「セリフあり」、文字「t」から「「t」シャープアペクス」、文字「c」から「「c」非対称型」の特徴を抽出する。
そして、テイスト判定モジュール120は、文字形状分析モジュール110が抽出した形状の特徴に関するテイスト得点を書体形状特徴感性DB115から抽出する。例えば、抽出結果として書体形状特徴感性テーブル3200を生成する。図32は、書体形状特徴感性テーブル3200のデータ構造例を示す説明図である。書体形状特徴感性テーブル3200は、特徴ID欄3205、特徴欄3210、プリティ欄3215、カジュアル欄3220、ダイナミック欄3225、エレガント欄3230、クラシック欄3235、ダンディ欄3240、シック欄3245、クリア欄3250を有している。具体的処理例(1)における図12の例のデータ構造と同等である。
テイスト判定モジュール120は、書体形状特徴感性テーブル3200から感性得点テーブル3300を生成する。図33は、感性得点テーブル3300のデータ構造例を示す説明図である。感性得点テーブル3300は、統合ID欄3305、プリティ欄3310、カジュアル欄3315、ダイナミック欄3320、エレガント欄3325、クラシック欄3330、ダンディ欄3335、シック欄3340、クリア欄3345を有している。具体的処理例(1)における図13の例のデータ構造と同等である。
次に、テイストプロフィール比較モジュール130は、書体感性DB125から和文書体で本文に使用できる書体を抽出する。例えば、抽出結果として書体感性テーブル3400を生成する。図34は、書体感性テーブル3400のデータ構造例を示す説明図である。書体感性テーブル3400は、和文書体ID欄3405、書体名欄3410、プリティ欄3415、カジュアル欄3420、ダイナミック欄3425、エレガント欄3430、クラシック欄3435、ダンディ欄3440、シック欄3445、クリア欄3450を有している。具体的処理例(1)における図14の例のデータ構造と同等である。本文として、4つの和文書体(いずれも明朝体、ゴシック体の種類である)がある例である。
そして、テイストプロフィール比較モジュール130は、感性得点テーブル3300、書体感性テーブル3400から印象距離テーブル3500を生成する。図35は、印象距離テーブル3500のデータ構造例を示す説明図である。印象距離テーブル3500は、和文書体ID欄3505、書体名欄3510、印象距離欄3515を有している。具体的処理例(1)における図15の例のデータ構造と同等である。
具体的には、各書体の感性スコアにより、統合した感性得点との印象距離を計算し、例えば、距離が一番小さい書体(又は、距離が一番小さい書体を含む複数の書体)を選択する。この例では、書体「秀英明朝」が選択される。結果表示モジュール135は、本文について、この書体「秀英明朝」の文字(分析結果テーブル2500の再作成内容欄2515の本文部分)を用いて、処理結果画像2490を作成する。もちろんのことながら、前述したように複数選択してもよい。複数の書体を選択した場合は、各々の書体を用いて複数の処理結果画像2490の本文部分を作成してもよい。
先の見出し部分の処理結果とこの本文部分の処理結果とを組み合わせることによって、処理結果画像2490を生成する。複数の書体を選択した場合は、各々の書体を用いて複数の処理結果画像2490を作成し、ユーザー190に選択可能に提示してもよい。
<具体的処理例(4)>
英語版の販促物(紙文書、チラシ)の一文の中に複数の書体があり、この販促物を日本語に翻訳し、書体感性DB125に記憶されている和文書体を使って電子文書として再作成する場合の例である。つまり、第1の文書が欧文文字であり、第2の文書は和文文書である場合である。
図36は、本実施の形態による具体的処理例(4)を示す説明図である。情報処理装置100は、対象画像3610を対象画像として入力し、翻訳後に再作成した結果として処理結果画像3690を出力する例を示している。具体的には、英語版のチラシをスキャンして情報処理装置100に入力し、テイストが一致している日本語版のチラシを再作成する。
文字形状分析モジュール110は、文字と文字書体特徴の認識エンジン、翻訳エンジンとしての機能を有しており、対象画像3610の文字内容(使用言語)は英語と認識し、文字認識を行い、英語から日本語への翻訳を行う。そして、文字形状分析モジュール110は、対象画像3610の文字形状を抽出する。その後、テイスト判定モジュール120は、その形状を欧文書体の書体形状特徴感性DB115から探索してテイスト得点を取得し、文字のテイストプロフィールを算出する。テイストプロフィール比較モジュール130は、書体選択エンジンとしての機能を有しており、テイスト判定モジュール120によって算出された文字のテイストプロフィールと類似しているテイストを持つ和文書体をピックアップ(抽出)する。
文字形状分析モジュール110による文字認識、翻訳の処理結果として、分析結果テーブル3700を生成する。図37は、分析結果テーブル3700のデータ構造例を示す説明図である。分析結果テーブル3700は、内容ID欄3705、元内容欄3710、再作成内容欄3715、内容属性欄3720を有している。具体的処理例(1)における図10の例に示す分析結果テーブル1000のデータ構造と同等である。ただし、再作成内容欄3715内は、元内容欄3710に対応する日本語となっている。
図38は、本実施の形態による処理例を示す説明図である。文字形状分析モジュール110による文字の形状分析処理の例を示すものである。
文字形状分析モジュール110は、対象画像3610から見出し領域3820、見出し領域3830を抽出する(図38(a)、(b)の例参照)。そして、各文字について、書体毎に形状の特徴を抽出する。例えば、図38(c1)、(c2)の例に示すように、文字「k」から「セリフなし」、文字「y」から「「y」ケルンあり」、文字「h」から「セリフあり」、文字「a」から「「a」ダブルストーリー型」の特徴を抽出する。ここで、「セリフなし」と「セリフあり」が混在しており、矛盾したものである。矛盾するものは別のグループに分けることを行う。なお、ケルンとは、「f」、「j」、「r」、「y」等の文字にある丸い部分をいう。
具体的には、文字形状分析モジュール110は、違う特徴毎に分析結果テーブル3700を分けて、分析結果テーブル3900を生成する。図39は、分析結果テーブル3900のデータ構造例を示す説明図である。分析結果テーブル3900は、内容ID欄3905、元内容欄3910、再作成内容欄3915、内容属性欄3920を有している。図17の例に示した分析結果テーブル1700のデータ構造と同等である。ただし、全ては見出しであるが、特徴(書体)毎に分けている。具体的には、書体Aの「Do you like」、書体Bの「Brahms」、書体Cの「?」の3つに分けている。
そして、テイスト判定モジュール120は、文字形状分析モジュール110が抽出した形状の特徴に関するテイスト得点を書体形状特徴感性DB115から抽出する。例えば、抽出結果として書体形状特徴感性テーブル4000、書体形状特徴感性テーブル4100を生成する。書体形状特徴感性テーブル4000は、書体Aの「Do you like」に対応するものであり、書体形状特徴感性テーブル4100は、書体Bの「Brahms」に対応するものである。なお、「?」については、翻訳後も「?」であることから、書体の変更を行う必要がないことから書体形状特徴感性テーブル4000の説明を省略した。
図40は、書体形状特徴感性テーブル4000のデータ構造例を示す説明図である。書体形状特徴感性テーブル4000は、特徴ID欄4005、特徴欄4010、プリティ欄4015、カジュアル欄4020、ダイナミック欄4025、エレガント欄4030、クラシック欄4035、ダンディ欄4040、シック欄4045、クリア欄4050を有している。具体的処理例(1)における図12の例のデータ構造と同等である。書体形状特徴感性テーブル4000は、欧文の書体Aに対応した特徴に関するテイスト得点(感性スコア)を示しており、8つのテイストがある。
図41は、書体形状特徴感性テーブル4100のデータ構造例を示す説明図である。書体形状特徴感性テーブル4100は、特徴ID欄4105、特徴欄4110、プリティ欄4115、カジュアル欄4120、ダイナミック欄4125、エレガント欄4130、クラシック欄4135、ダンディ欄4140、シック欄4145、クリア欄4150を有している。具体的処理例(1)における図12の例のデータ構造と同等である。書体形状特徴感性テーブル4100は、欧文の書体Bに対応した特徴に関するテイスト得点(感性スコア)を示しており、8つのテイストがある。
この後の処理は、前述した具体的処理例(3)の場合で、見出しの処理方法と同等である。つまり、形状特徴に対応したテイストプロフィールを、それぞれ統合する。指定した言語(日本語)の書体に対応したテイストプロフィールと統合したテイストプロフィールの差を計算し、類似しているテイストを持つ書体をそれぞれ選択し、処理結果画像3690を作成する。
<具体的処理例(5)>
ユーザーインタフェース(UI)メニューを日本語版から英語版に翻訳し、書体感性DB125に記憶されている欧文書体を使ってUIメニューとして再作成する場合の例である。つまり、第1の文書が和文文字であり、第2の文書は欧文文書である場合である。
図42は、本実施の形態による具体的処理例(5)を示す説明図である。情報処理装置100は、日本語メニュー画面4210内のデータを対象文書として入力し、翻訳後に再作成した結果として英語メニュー画面4220を出力する例を示している。
携帯端末4200は、日本語メニュー画面4210、英語メニュー画面4220を表示し得る。日本語メニュー画面4210には、ユーザー名欄4212、パスワード欄4214、「ログインする」ボタン4216、「アカウントをつくる」ボタン4218が表示されている。そして、英語メニュー画面4220には、UseName欄4222、Password欄4224、「Login」ボタン4226、「Sign up」ボタン4228が表示されている。UseName欄4222はユーザー名欄4212に対応しており、Password欄4224はパスワード欄4214に対応しており、「Login」ボタン4226は「ログインする」ボタン4216に対応しており、「Sign up」ボタン4228は「アカウントをつくる」ボタン4218に対応している。つまり、英語版のUIメニューとテイストが一致している日本語版のUIメニューを生成する。
文字形状分析モジュール110は、文字書体特徴の認識エンジン、翻訳エンジンとしての機能を有しており、日本語メニュー画面4210の文字内容(使用言語)は日本語と認識する。そして、文字形状分析モジュール110は、日本語メニュー画面4210の文字形状として書体を属性(プロパティ)から抽出する。その後、テイスト判定モジュール120は、その書体を和文書体の書体形状特徴感性DB115から探索してテイスト得点を取得し、文字のテイストプロフィールを算出する。テイストプロフィール比較モジュール130は、書体選択エンジンとしての機能を有しており、テイスト判定モジュール120によって算出された文字のテイストプロフィールと類似しているテイストを持つ欧文書体をピックアップ(抽出)する。
文字形状分析モジュール110による翻訳の処理結果として、分析結果テーブル4300を生成する。図43は、分析結果テーブル4300のデータ構造例を示す説明図である。分析結果テーブル4300は、内容ID欄4305、元内容欄4310、再作成内容欄4315、内容属性欄4320を有している。具体的処理例(1)における図10の例に示す分析結果テーブル1000のデータ構造と同等である。
この後の処理は、前述した具体的処理例と同等である。
図44を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図44に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部4417と、プリンタ等のデータ出力部4418を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)4401は、前述の実施の形態において説明した各種のモジュール、すなわち、受付モジュール105、文字形状分析モジュール110、テイスト判定モジュール120、テイストプロフィール比較モジュール130、結果表示モジュール135、テイスト調整モジュール240等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)4402は、CPU4401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)4403は、CPU4401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス4404により相互に接続されている。
ホストバス4404は、ブリッジ4405を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス4406に接続されている。
キーボード4408、マウス等のポインティングデバイス4409は、操作者により操作されるデバイスである。ディスプレイ4410は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス4409とディスプレイ4410の両方の機能を備えているタッチスクリーン等であってもよい。
HDD(Hard Disk Drive)4411は、ハードディスク(フラッシュ・メモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU4401によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、書体形状特徴感性DB115、書体感性DB125等としての機能を実現させる。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
ドライブ4412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体4413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース4407、外部バス4406、ブリッジ4405、及びホストバス4404を介して接続されているRAM4403に供給する。なお、リムーバブル記録媒体4413も、データ記録領域として利用可能である。
接続ポート4414は、外部接続機器4415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート4414は、インタフェース4407、及び外部バス4406、ブリッジ4405、ホストバス4404等を介してCPU4401等に接続されている。通信部4416は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部4417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部4418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図44に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図44に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図44に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機等に組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
105…受付モジュール
110…文字形状分析モジュール
115…書体形状特徴感性DB
120…テイスト判定モジュール
125…書体感性DB
130…テイストプロフィール比較モジュール
135…結果表示モジュール
190…ユーザー
200…情報処理装置
240…テイスト調整モジュール
300…画像処理装置
310…ユーザー端末
320…画像処理装置
330…フォント管理装置
390…通信回線

Claims (10)

  1. 文字の形状の特徴と印象を対応させて記憶している記憶手段から抽出した文字の形状の特徴に対応する印象と最も類似する印象を有する書体を少なくとも1つ以上選択する選択手段
    を有する情報処理装置。
  2. 前記印象は複数の項目によって構成されており、
    前記特徴に対応する前記各項目における値を抽出する抽出手段
    をさらに有し、
    前記選択手段は、前記抽出手段によって抽出された値と前記書体の前記各項目における値との距離にしたがって、書体を選択する、
    請求項1に記載の情報処理装置。
  3. 前記抽出手段は、前記特徴に対応する前記各項目における値を、特徴と印象の各項目における値とを対応させた表から抽出する、
    請求項2に記載の情報処理装置。
  4. 操作者の操作にしたがって、前記抽出手段によって抽出された値を調整する調整手段
    をさらに有し、
    前記選択手段は、前記調整手段によって調整された値と前記書体の前記各項目における値との距離にしたがって、書体を選択する、
    請求項2に記載の情報処理装置。
  5. 前記選択手段は、第1の文書から前記文字を抽出し、
    前記選択手段によって選択された書体の文字を用いて第2の文書を生成する生成手段
    をさらに有する請求項1に記載の情報処理装置。
  6. 前記第1の文書の前記文字を翻訳する翻訳手段
    をさらに有し、
    前記生成手段は、前記選択手段によって選択された書体による翻訳後の文字によって、第2の文書を生成する、
    請求項5に記載の情報処理装置。
  7. 前記第1の文書には、複数の書体による文字が含まれており、
    前記選択手段は、前記第1の文書内の前記書体毎に、前記第2の文書に用いる書体を選択する、
    請求項5に記載の情報処理装置。
  8. 画像内の文字を対象として、該文字の形状の特徴を抽出する第2の抽出手段
    をさらに有し、
    前記選択手段は、前記第2の抽出手段によって抽出された特徴を用いて選択を行う、
    請求項1から7のいずれか一項に記載の情報処理装置。
  9. 電子文書内の文字を対象として、該文字の形状の特徴を抽出する第3の抽出手段
    をさらに有し、
    前記選択手段は、前記第3の抽出手段によって抽出された特徴を用いて選択を行う、
    請求項1から7のいずれか一項に記載の情報処理装置。
  10. コンピュータを、
    文字の形状の特徴と印象を対応させて記憶している記憶手段から抽出した文字の形状の特徴に対応する印象と最も類似する印象を有する書体を少なくとも1つ以上選択する選択手段
    として機能させるための情報処理プログラム。
JP2017010307A 2017-01-24 2017-01-24 情報処理装置及び情報処理プログラム Pending JP2018120338A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017010307A JP2018120338A (ja) 2017-01-24 2017-01-24 情報処理装置及び情報処理プログラム
US15/692,500 US20180210865A1 (en) 2017-01-24 2017-08-31 Information processing apparatus
CN201711082740.4A CN108345577A (zh) 2017-01-24 2017-11-07 信息处理设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017010307A JP2018120338A (ja) 2017-01-24 2017-01-24 情報処理装置及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2018120338A true JP2018120338A (ja) 2018-08-02

Family

ID=62906482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017010307A Pending JP2018120338A (ja) 2017-01-24 2017-01-24 情報処理装置及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20180210865A1 (ja)
JP (1) JP2018120338A (ja)
CN (1) CN108345577A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020184661A (ja) * 2019-05-01 2020-11-12 菊一 西 Ud書体化複写機。

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09193489A (ja) * 1996-01-19 1997-07-29 Fuji Xerox Co Ltd フォント管理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060245005A1 (en) * 2005-04-29 2006-11-02 Hall John M System for language translation of documents, and methods
JP4818091B2 (ja) * 2006-12-13 2011-11-16 キヤノン株式会社 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09193489A (ja) * 1996-01-19 1997-07-29 Fuji Xerox Co Ltd フォント管理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020184661A (ja) * 2019-05-01 2020-11-12 菊一 西 Ud書体化複写機。

Also Published As

Publication number Publication date
CN108345577A (zh) 2018-07-31
US20180210865A1 (en) 2018-07-26

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
US7519221B1 (en) Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
Clausner et al. ICDAR2019 competition on recognition of early Indian printed documents–REID2019
JP2016001403A (ja) テンプレート管理装置及びプログラム
EP3910550A1 (en) Image processing apparatus and image processing method each for obtaining a region of object and pixels of the object using neural network
US20090063127A1 (en) Apparatus, method, and computer program product for creating data for learning word translation
JP2018120338A (ja) 情報処理装置及び情報処理プログラム
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
CN108875570B (zh) 信息处理装置、存储介质和信息处理方法
JP2012190314A (ja) 画像処理装置およびプログラム
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
US20210006747A1 (en) Image processing apparatus, image processing method and medium
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
JP2011060268A (ja) 画像処理装置及び画像処理プログラム
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20210019554A1 (en) Information processing device and information processing method
JP6379768B2 (ja) 情報処理装置及び情報処理プログラム
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP5284342B2 (ja) 文字認識システムおよび文字認識プログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201211

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210518