JP2010026986A - Image forming apparatus - Google Patents

Image forming apparatus Download PDF

Info

Publication number
JP2010026986A
JP2010026986A JP2008190997A JP2008190997A JP2010026986A JP 2010026986 A JP2010026986 A JP 2010026986A JP 2008190997 A JP2008190997 A JP 2008190997A JP 2008190997 A JP2008190997 A JP 2008190997A JP 2010026986 A JP2010026986 A JP 2010026986A
Authority
JP
Japan
Prior art keywords
character
path
likelihood
path group
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008190997A
Other languages
Japanese (ja)
Inventor
Hidefumi Sasaki
英史 佐々木
Takamichi Aso
隆道 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008190997A priority Critical patent/JP2010026986A/en
Publication of JP2010026986A publication Critical patent/JP2010026986A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that optimum processing for character display is not performed because an applicable part is not drawn as a character by performing outline conversion of a text drawing instruction into a path drawing instruction in the conventional manner. <P>SOLUTION: By extracting a character path group from the path drawing instruction and calculating the character likeness (character likelihood) of the character path group, a character attribute is restored. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、パス描画命令を含む文書データを処理する画像形成装置、画像形成方法に関するものである。   The present invention relates to an image forming apparatus and an image forming method for processing document data including a path drawing command.

電子データを用いた入稿処理が広く利用されている。これはデータ作成者が自分で画像や文字の配置を自分のコンピュータ上で決定し、それをネットワークなどを介してデータ印刷者に送信する。データ印刷者はこれを元に印刷を行うものである。   Submission processing using electronic data is widely used. In this case, the data creator decides the arrangement of images and characters on his own computer and transmits it to the data printer via a network or the like. The data printer prints based on this.

しかしこの場合、データの作成者と印刷者の間で環境に違いが生じると、望まれない印刷結果が生じる場合がある。その代表的な例がフォントの有無である。印刷者が有していないフォントが電子データに含まれる場合には、そのフォントに類似した別の代替フォントを使用しなければならなくなる。しかし、これにより作成者が意図したものと違う印刷結果となる場合がある。   However, in this case, if there is a difference in environment between the data creator and the printer, an undesired printing result may occur. A typical example is the presence or absence of a font. If the electronic data includes a font that the printer does not have, another alternative font similar to that font must be used. However, this may result in a print result different from what the creator intended.

これを回避する1つの手段として、印刷者が有していないフォントに関しては、これをパスを描画する画像描画命令に置き換えるアウトライン処理がある。元の電子データでは、文字を描画する位置やサイズなどの描画属性情報と描画するべき文字を識別し実際に描画するテキスト描画命令によって、文字描画を行っていた。アウトライン処理とは、この描画属性情報と描画命令を利用し、テキスト描画命令をパス点設定命令とパス塗潰し命令に変換することである。   One means for avoiding this is outline processing for replacing a font that the printer does not have with an image drawing command for drawing a path. In the original electronic data, character drawing is performed by drawing attribute information such as a character drawing position and size and a text drawing command for identifying the character to be drawn and actually drawing. Outline processing is to convert a text drawing command into a pass point setting command and a pass painting command using the drawing attribute information and the drawing command.

これにより印刷者が有さないフォントを使用する印刷データであっても、パス描画命令として処理することで作成者の意図した結果に近い結果が得られる。   As a result, even if the print data uses a font that the printer does not have, a result close to the result intended by the creator can be obtained by processing as a path drawing command.

又、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものがある(特許文献1)。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。
特開平10−294863号公報
In addition, there is an apparatus that extracts an edge of a text part when performing outline processing and performs image processing for emphasizing the edge part (Patent Document 1). Starting with this, conventionally, a trapping process or the like has generally been added when making an outline.
Japanese Patent Laid-Open No. 10-294863

しかし、従来はテキスト描画命令をパス描画命令に変換することで、該当個所が文字として描画されず、文字表示の為の最適な処理がなされないという問題があった。この最適な処理には、ヒンティング情報に基づいた線幅調整、あるいは文字用のディザパターンの使用等が含まれる。   However, conventionally, there has been a problem that by converting a text drawing command to a path drawing command, the corresponding portion is not drawn as a character, and optimal processing for character display is not performed. This optimal processing includes line width adjustment based on hinting information, use of a dither pattern for characters, and the like.

特許文献1は、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものである。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。しかしながら、アウトライン化する際に補正処理が適用されていない文書データが入稿される場合もある。また補正処理がそのデバイスに対して適切ではない可能性もある。そのためアウトライン化されたデータに対して補正を行う手段を検討する必要がある。   Japanese Patent Application Laid-Open No. 2004-133830 extracts an edge of a text portion when creating an outline and performs image processing for emphasizing the edge portion. Starting with this, conventionally, a trapping process or the like has generally been added when making an outline. However, there are cases where document data to which correction processing has not been applied is submitted when making an outline. Also, the correction process may not be appropriate for the device. Therefore, it is necessary to consider means for correcting the data that has been outlined.

課題を解決するために、本発明に基づく画像形成装置及び画像形成方法ならびに画像形成方法を実行するプログラムは、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する。
In order to solve the problems, an image forming apparatus, an image forming method, and a program for executing the image forming method according to the present invention include:
Means for performing a grouping process based on the characteristics of the path drawing command and generating a path group;
Means for determining the likelihood that the path is a character based on the characteristics of the path group;
Means for executing the same drawing process as the character drawing for the path group having a high likelihood.

パス群の特徴に基づき該文字尤度を求める手段として、周辺のパス群が直線状に位置している場合に尤度が高いものと認識する手段を有していても良い。   As a means for obtaining the character likelihood based on the characteristics of the path group, there may be a means for recognizing that the likelihood is high when the surrounding path group is located in a straight line.

パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1あるいは外部のデータベース等により記録保持されている文字として識別するに適切な縦横比に基づいて尤度を決定する手段を有していても良い。   As a means for obtaining the character likelihood based on the characteristics of the path group, the aspect ratio of the boundary group of the path group is approximately 1, or the likelihood based on the aspect ratio appropriate for identifying the character as recorded and held by an external database or the like. There may be means for determining the degree.

パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有していても良い。   As a means for obtaining the character likelihood based on the characteristics of the path group, there is a means for obtaining the boundary box frequency of the path group and recognizing that the high-frequency boundary box path group has a high likelihood. good.

パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有していても良い。   As means for obtaining the character likelihood based on the characteristics of the path group, there is means for recognizing that the likelihood is high when the color in which the path group is drawn is the same as that of the adjacent path group. Also good.

パス群の特徴に基づき該文字尤度を求める手段として、尤度が一定以下のものに関してはパス描画命令を実行し、さらにそのパス描画命令に対して文字認識処理を行い、尤度を決定する手段を有していても良い。   As a means for obtaining the character likelihood based on the characteristics of the path group, a path drawing command is executed for those having a certain likelihood or less, and character recognition processing is further performed on the path drawing command to determine the likelihood. You may have a means.

以上に示した文字尤度を求める手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有しても良い。   You may have a means for calculating | requiring likelihood combining at least 2 or more of the means for calculating | requiring the character likelihood shown above.

請求項1の発明によれば、画像形成処理を行っている際に、処理を行っているパス描画命令が、アウトライン化された文字描画命令に由来するか否かを判定することが可能となる。アウトライン化された文字描画命令であれば、文字描画と同じ描画設定を行う事で最適な処理を用いることができる。   According to the first aspect of the present invention, it is possible to determine whether or not the path drawing command being processed is derived from the outlined character drawing command when performing the image forming process. . In the case of an outline character drawing command, an optimum process can be used by performing the same drawing setting as the character drawing.

請求項2の発明によれば、特に横書き・縦書きで記載された文章データを含むデータに対する文字識別度をより高くすることが出来る。   According to the invention of claim 2, it is possible to further increase the degree of character discrimination for data including text data written in horizontal writing / vertical writing.

請求項3の発明によれば、文字毎の縦横幅が一定に近い漢字やハングル、アルファベットのように文字毎の縦横比が異なる文字グリフに対する文字識別度をより高くすることができる。   According to the invention of claim 3, it is possible to further increase the character recognition degree for character glyphs having different aspect ratios for each character, such as kanji, hangul, and alphabet, whose vertical and horizontal widths for each character are almost constant.

請求項4の発明によれば、同じ大きさの文字が繰り返し使用されるようなデータに対する文字識別度をより高くすることが出来る。   According to the invention of claim 4, it is possible to further increase the degree of character identification for data in which characters of the same size are repeatedly used.

請求項5の発明によれば、文字が描画される色が統一的であるようなデータに対する文字識別度をより高くすることが出来る。   According to the invention of claim 5, it is possible to further increase the degree of character identification for data in which the color in which characters are drawn is uniform.

請求項6の発明によれば、文字であるか否かの判定が難しい場合には、その文字を実際に描画し、文字認識処理によって文字か否かを判定することで、全データを処理するよりも短い時間で文字識別処理を実行できる。   According to the invention of claim 6, when it is difficult to determine whether or not it is a character, the character is actually drawn and all data is processed by determining whether or not it is a character by character recognition processing. Character identification processing can be executed in a shorter time.

請求項7の発明によれば、以上の発明を組み合わせて、統合的な判断に基づいた文字識別処理を実施することが出来る。   According to the invention of claim 7, character identification processing based on integrated judgment can be performed by combining the above inventions.

次に、本発明の詳細を実施例の記述に従って説明する。   Next, details of the present invention will be described in accordance with the description of the embodiments.

<コンピュータ構成>
図1は、本発明の実施の形態例に係るシステムのコンピュータの構成図の例を示している。101はCPU、すなわち中央処理装置であり、装置全体の制御及び演算処理等を行う。103はROMすなわち読み出し専用メモリであり、システム起動プログラム、基本I/Oプログラム、及び文字コードをビットパターンに変換するための文字パターンデータ(フォントデータ)等を記憶している。
<Computer configuration>
FIG. 1 shows an example of a configuration diagram of a computer of a system according to an embodiment of the present invention. Reference numeral 101 denotes a CPU, that is, a central processing unit, which controls the entire apparatus, performs arithmetic processing, and the like. Reference numeral 103 denotes a ROM, that is, a read-only memory, which stores a system activation program, a basic I / O program, character pattern data (font data) for converting a character code into a bit pattern, and the like.

102はRAMすなわちランダムアクセスメモリであり、CPU101の演算に使用するデータや演算結果、表示のために文字コードから変換された文字パターンデータ列や図形データ、イメージデータ等を一時記憶する。   Reference numeral 102 denotes a RAM, that is, a random access memory, which temporarily stores data used for calculation by the CPU 101, calculation results, character pattern data strings converted from character codes, graphic data, image data, and the like for display.

106はKBDC、すなわちキーボード制御部であり、107はKB、すなわちキーボードよりキー入力データ(文字コードや制御コード)を受け取り、CPU101へ伝達する。104はDSPC、すなわちディスプレイ制御部であり、RAM102に格納された文字パターンデータ列を読み出し、DSP105に転送する。105はDSP、すなわちディスプレイ装置であり、DSPC104より文字パターンデータ列、図形データ、イメージデータを受け取り、表示画面に表示する。   Reference numeral 106 denotes KBDC, that is, a keyboard control unit. Reference numeral 107 denotes KB, that is, key input data (character code or control code) is received from the keyboard and transmitted to the CPU 101. Reference numeral 104 denotes a DSPC, that is, a display control unit, which reads a character pattern data string stored in the RAM 102 and transfers it to the DSP 105. Reference numeral 105 denotes a DSP, that is, a display device, which receives a character pattern data string, graphic data, and image data from the DSPC 104 and displays them on a display screen.

108はDSKC、すなわちディスク制御部であり、外部記憶装置109に対するアクセス制御を行う。109はハードディスク装置である。HDには、文字パターンデータ(フォントデータ)やフォントデータを読み出してビットマップデータに変換する文字展開処理プログラム、図形データを処理する図形展開処理プログラム、イメージデータを処理するイメージデータ処理プログラム等を記憶している。   Reference numeral 108 denotes DSKC, that is, a disk control unit, which controls access to the external storage device 109. Reference numeral 109 denotes a hard disk device. HD stores character pattern data (font data) and character development processing programs that read font data and convert them to bitmap data, graphic development processing programs that process graphic data, image data processing programs that process image data, etc. is doing.

110はNIC、すなわちネットワークインタフェイスカードであり、ネットワーク201と接続し他の機器と情報交換を行う。201はネットワークであり、多数のコンピュータがネットワークインタフェイスを利用して接続するイントラネットのようなコンピュータネットワークを意味する。   Reference numeral 110 denotes a NIC, that is, a network interface card, which is connected to the network 201 and exchanges information with other devices. Reference numeral 201 denotes a network, which means a computer network such as an intranet in which a large number of computers are connected using a network interface.

<プリンタ構成例>
図2は、本実施例における複合機の主要部構成を示すブロック図である。
<Printer configuration example>
FIG. 2 is a block diagram illustrating a configuration of main parts of the multifunction machine according to the present embodiment.

コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続し、スキャナ2070で読み取られた画像データをプリンタ2095により印刷出力するコピー機能を実現するための制御を行う。また、同時にコントローラユニット2000はLAN3000や公衆回線3001(WAN)に接続することによって、画像情報やデバイス情報の入出力を行うための制御も行う。   The controller unit 2000 connects a scanner 2070 as an image input device and a printer 2095 as an image output device, and performs control for realizing a copy function for printing out image data read by the scanner 2070 by the printer 2095. At the same time, the controller unit 2000 performs control for inputting / outputting image information and device information by connecting to the LAN 3000 and the public line 3001 (WAN).

コントローラユニット2000は、具体的には、CPU2001を有し、CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上る。このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域としてはRAM2002が用いられる。RAM2002は、作業領域とともに、画像データを一時記憶するための画像メモリ領域を提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。   Specifically, the controller unit 2000 includes a CPU 2001, and the CPU 2001 starts up an operation system (OS) by a boot program stored in the ROM 2003. Various processes are executed by executing application programs stored in an HDD (Hard Disk Drive) 2004 on this OS. A RAM 2002 is used as a work area of the CPU 2001. The RAM 2002 provides an image memory area for temporarily storing image data together with a work area. The HDD 2004 stores image data together with the application program.

CPU2001には、システムバス2007を介して、ROM2003およびRAM2002が接続されている。また、CPU2001にはその他に操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050およびイメージバスI/F(イメージインタフェース)2005も接続されている。   A ROM 2003 and a RAM 2002 are connected to the CPU 2001 via a system bus 2007. In addition, an operation unit I / F (operation unit interface) 2006, a network I / F (network interface) 2010, a modem 2050, and an image bus I / F (image interface) 2005 are also connected to the CPU 2001.

操作部I/F2006は、タッチパネルを有する操作部2012とのインターフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。   The operation unit I / F 2006 is an interface with the operation unit 2012 having a touch panel, and outputs image data to be displayed on the operation unit 2012 to the operation unit 2012. In addition, the operation unit I / F 2006 transmits information input by the user in the operation unit 2012 to the CPU 2001.

次に、ネットワークI/F2010は、LAN3000に接続され、LAN3000を介してLAN3000上の各装置との間で情報の入出力を行う。モデム2050は、公衆回線3001に接続され、公衆回線3001を介して情報の入出力を行う。   Next, the network I / F 2010 is connected to the LAN 3000 and inputs / outputs information to / from each device on the LAN 3000 via the LAN 3000. The modem 2050 is connected to the public line 3001 and inputs / outputs information via the public line 3001.

イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバスまたはIEEE1394から構成される。画像バス2008上には、RIP2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035および画像圧縮部2040が設けられている。RIP2060は、ラスタイメージプロセッサであり、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070およびプリンタ2095が接続され、デバイスI/F2020は、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換などを行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、2値画像データをJBIG、MMR、MHなどのデータに圧縮するとともに、その伸張処理を行う。   An image bus I / F 2005 is a bus bridge for connecting a system bus 2007 and an image bus 2008 that transfers image data at high speed and converting the data structure. The image bus 2008 is configured from a PCI bus or IEEE1394. On the image bus 2008, a RIP 2060, a device I / F 2020, a scanner image processing unit 2080, a printer image processing unit 2090, an image rotation unit 2030, a thumbnail creation unit 2035, and an image compression unit 2040 are provided. The RIP 2060 is a raster image processor and is a processor that develops a PDL code into a bitmap image. A scanner 2070 and a printer 2095 are connected to the device I / F 2020, and the device I / F 2020 performs synchronous / asynchronous conversion of image data. A scanner image processing unit 2080 corrects, processes, and edits input image data. A printer image processing unit 2090 performs printer correction, resolution conversion, and the like on print output image data. The image rotation unit 2030 rotates image data. The image compression unit 2040 compresses multi-valued image data into JPEG data and binary image data into data such as JBIG, MMR, and MH, and performs the decompression process.

図3は図2の複写機のリーダ部2070およびプリンタ部2095のハードウェア構成を模式的に示す図である。   FIG. 3 is a diagram schematically showing a hardware configuration of the reader unit 2070 and the printer unit 2095 of the copier of FIG.

リーダ部2070とプリンタ部2095とは、図3に示すように、一体的に構成されている。リーダ部2070は、原稿給紙ユニット9250を搭載し、原稿給紙ユニット9250は、原稿を先頭から順に1枚ずつプラテンガラス9211上へ給送。各原稿の読取動作が終了する毎にその原稿をプラテンガラス9211から排出トレイ(図示せず)に排出する。リーダ部2070は、原稿がプラテンガラス9211上に給送されると、ランプ9212を点灯し、移動ユニット9213の移動を開始する。この移動ユニット9213の移動によりプラテンガラス9211上の原稿に対する読取走査が行われる。この読取走査中、原稿からの反射光は、各ミラー9214,9215,9216およびレンズ9217を経てCCDイメージセンサ(以下、CCDという)9218に導かれ、原稿上の画像がCCD9218の撮像面上に結像される。CCD9218は、撮像面に結像された画像を電気信号に変換し、この電気信号は所定の処理施された後に制御装置9110に入力される。   The reader unit 2070 and the printer unit 2095 are integrally configured as shown in FIG. The reader unit 2070 includes a document feeding unit 9250. The document feeding unit 9250 feeds documents one by one from the top onto the platen glass 9211. Each time the reading operation of each original is completed, the original is discharged from the platen glass 9211 to a discharge tray (not shown). When the document is fed onto the platen glass 9211, the reader unit 2070 turns on the lamp 9212 and starts moving the moving unit 9213. By the movement of the moving unit 9213, the scanning on the original on the platen glass 9211 is performed. During this scanning, the reflected light from the original is guided to a CCD image sensor (hereinafter referred to as CCD) 9218 through each mirror 9214, 9215, 9216 and lens 9217, and the image on the original is connected to the imaging surface of the CCD 9218. Imaged. The CCD 9218 converts an image formed on the imaging surface into an electric signal, and the electric signal is input to the control device 9110 after being subjected to predetermined processing.

プリンタ部2095は、レーザドライバ9321を有し、レーザドライバ9321は、制御装置9110から入力された画像データに基づきレーザ発光部9322を駆動する。これにより、レーザ発光部9322からは画像データに応じたレーザ光が発光され、このレーザ光は走査されながら感光ドラム9323上に照射される。感光ドラム9323上には、照射されたレーザ光により静電潜像が形成され、この静電潜像は現像器9324から供給されたトナーによりトナー像として可視像化される。レーザ光の照射タイミングに同期して、各カセット9311,9312から記録紙が搬送路を介して感光ドラム9323と転写部9325との間に給紙され、感光ドラム9323上のトナー像は転写部9325により給紙された記録紙上に転写される。   The printer unit 2095 has a laser driver 9321, and the laser driver 9321 drives the laser light emitting unit 9322 based on the image data input from the control device 9110. Accordingly, laser light corresponding to the image data is emitted from the laser light emitting unit 9322, and this laser light is irradiated onto the photosensitive drum 9323 while being scanned. An electrostatic latent image is formed on the photosensitive drum 9323 by the irradiated laser light, and the electrostatic latent image is visualized as a toner image by the toner supplied from the developing device 9324. In synchronization with the irradiation timing of the laser light, the recording paper is fed from the cassettes 9131 and 9132 between the photosensitive drum 9323 and the transfer unit 9325 through the conveyance path, and the toner image on the photosensitive drum 9323 is transferred to the transfer unit 9325. Is transferred onto the recording paper fed.

トナー像が転写された記録紙は搬送ベルトを介して定着ローラ対(加熱ローラと加圧ローラ)9326に送られ、定着ローラ対9326は、記録紙を熱圧し、記録紙上のトナー像を記録紙上に定着させる。この定着ローラ対9326を通過した記録紙は、排紙ローラ対9327により排紙ユニット9330に排紙される。排紙ユニット9330は、ソート、ステイプルなどの後処理を施すことが可能なシート処理装置からなる。また、両面記録モードが設定されている場合には、記録紙を排紙ローラ対9327まで搬送した後に、排紙ローラ対9327の回転方向を逆転させ、フラッパ9328によって再給紙搬送路9329へ導く。再給紙搬送路9329に導かれた記録紙は、上述したタイミングで感光ドラム9323と転写部9325との間に再給紙され、この記録紙の裏面にトナー像が転写される。   The recording paper onto which the toner image has been transferred is sent to a fixing roller pair (heating roller and pressure roller) 9326 via a conveyor belt, and the fixing roller pair 9326 heats the recording paper to transfer the toner image on the recording paper onto the recording paper. To settle. The recording paper that has passed through the fixing roller pair 9326 is discharged to a paper discharge unit 9330 by a paper discharge roller pair 9327. The paper discharge unit 9330 includes a sheet processing apparatus capable of performing post-processing such as sorting and stapling. When the duplex recording mode is set, after the recording sheet is conveyed to the discharge roller pair 9327, the rotation direction of the discharge roller pair 9327 is reversed and guided to the refeed conveyance path 9329 by the flapper 9328. . The recording paper guided to the refeed conveyance path 9329 is fed again between the photosensitive drum 9323 and the transfer unit 9325 at the timing described above, and the toner image is transferred to the back surface of the recording paper.

実施例1は本発明を適用した好適な例を記載する。   Example 1 describes a preferred example to which the present invention is applied.

PDL処理の基本的な流れは、処理開始111、データ受信112、文書構成把握113、処理ページ選択114、印刷命令実行115、処理継続判断116、処理終了117の各工程から構成される。   The basic flow of the PDL process is composed of the following steps: process start 111, data reception 112, document structure grasp 113, process page selection 114, print command execution 115, process continuation determination 116, and process end 117.

<データ受信112>
印刷に用いる文書データを外部あるいは内部から受け取るための工程である。
<Data reception 112>
This is a process for receiving document data used for printing from outside or inside.

文書データは、ネットワークI/F2010を会してLAN3000から、ネットワーク上に位置する別のコンピュータよりプリンタに入稿されるものとする。本発明において、入稿される文書データのデータフォーマットは本質とは異なるため、限定はしないが、例えばPDF((登録商標)Portable Document Format)等に対して適用することが出来る。   It is assumed that the document data is submitted to the printer from another computer located on the network from the LAN 3000 by meeting the network I / F 2010. In the present invention, since the data format of the submitted document data is different from the essence, it is not limited, but can be applied to, for example, PDF ((registered trademark) Portable Document Format).

プリンタに入稿されたデータを印刷するタイミングには、データを受け取った場合に即時に対応する場合、一時的に保持しユーザーの支持に基づいて開始をする場合などがある。本発明ではどちらに対しても適用することが出来る。   The timing of printing the data submitted to the printer may include immediate response when data is received, or temporary retention and start based on user support. The present invention can be applied to both.

例えば、プリンタに入稿されたデータは、ネットワークI/F2010から入力され、これを外部記憶装置109に保持される。これに対してユーザーが操作部2012等から印刷指示を行う事で印刷を行うものとする。   For example, data input to the printer is input from the network I / F 2010 and stored in the external storage device 109. On the other hand, it is assumed that printing is performed when the user issues a print instruction from the operation unit 2012 or the like.

あるいはここで、文書データを処理するべき処理設定を受信しても良い。   Alternatively, a processing setting for processing document data may be received.

<文書構成把握113>
受信した文書データには、文書データの構成が記載されている場合がある。これを解析することにより、処理するべきページ枚数を把握したりするための工程である。
<Document structure grasp 113>
The received document data may describe the structure of the document data. By analyzing this, it is a process for grasping the number of pages to be processed.

<処理ページ選択114>
処理を行うべきページを示すデータを選択するための工程である。文書構成把握113に基づいて処理を行うべきページのデータを特定し、次に示す印刷命令実行を行うための工程である。
<Process page selection 114>
This is a process for selecting data indicating a page to be processed. This is a process for specifying page data to be processed based on the document structure grasp 113 and executing the print command shown below.

<印刷命令実行115>
処理ページ選択114で選択されたページに対して、画像データを形成する工程である。詳細については後述する。
<Print command execution 115>
This is a step of forming image data for the page selected in the processing page selection 114. Details will be described later.

<処理継続判断116>
文書構成把握115で処理したページのほかに、処理するべきページが存在するかを判断するための工程である。もし処理するべきページがあれば、処理ページ選択114に戻り、新たな処理ページの選択処理を行う。
<Processing continuation determination 116>
This is a process for determining whether there is a page to be processed in addition to the page processed in the document structure grasp 115. If there is a page to be processed, the process returns to the process page selection 114 and a process for selecting a new process page is performed.

処理するべきページがない場合は、処理を終了する(処理終了117)。   If there is no page to be processed, the process ends (process end 117).

ここで、印刷命令実行115について、図12を用いて更に詳細に説明を行う。印刷命令実行115は、印刷処理命令実行開始121、処理命令選択122、処理命令分岐123、描画処理124〜126、パス群DB登録127、処理継続判断128、終了処理129から構成される。   Here, the print command execution 115 will be described in more detail with reference to FIG. The print command execution 115 includes a print processing command execution start 121, a processing command selection 122, a processing command branch 123, drawing processing 124 to 126, a path group DB registration 127, a processing continuation determination 128, and an end processing 129.

<描画命令選択122>
印刷データにはどの描画命令の処理順序と処理方法が記述されたコンテンツデータが含まれている。この工程は、処理順序に従い、以降の工程で処理するべき描画命令を選択するための工程である。
<Drawing command selection 122>
The print data includes content data describing the processing order and processing method of which drawing command. This step is a step for selecting a drawing command to be processed in the subsequent steps in accordance with the processing order.

<描画命令分岐123>
描画命令選択122に基づいて、次に処理するべき工程を分岐するための工程である。ここでは、描画命令を、画像描画命令、テキスト描画命令、パス描画命令に分類している。
<Drawing instruction branch 123>
This is a process for branching the process to be processed next based on the drawing command selection 122. Here, the drawing commands are classified into an image drawing command, a text drawing command, and a path drawing command.

<改良パス描画命令124A,124B>
これらは共通して、本発明での核となるアウトライン化されたテキストを好適に処理するための工程である。詳細は後述する。
<Improved path drawing commands 124A and 124B>
These are processes for processing the outlined text that is the core of the present invention in common. Details will be described later.

<画像描画命令125>
本工程は画像描画命令を実行するための工程である。画像描画命令とは、イメージと呼ばれる画像データを描画する命令である。文書データに格納する際に、イメージをDCT圧縮やMR・MH圧縮等を用いて圧縮し、サイズを縮小している場合もある。この場合は、画像を描画する際に展開を行う。
<Image drawing command 125>
This step is a step for executing an image drawing command. The image drawing command is a command for drawing image data called an image. When storing in document data, the image may be compressed using DCT compression, MR / MH compression, or the like to reduce the size. In this case, expansion is performed when the image is drawn.

<テキスト描画命令126>
本工程はテキスト描画命令を実行するための工程である。テキスト描画命令とは、文字を描画するための命令であり、使用するべきフォントの種別と、表示するべきサイズ、表示するべき文字列を指定する。
<Text drawing command 126>
This step is a step for executing a text drawing command. The text drawing command is a command for drawing characters, and specifies the type of font to be used, the size to be displayed, and the character string to be displayed.

<パス群DB登録処理127>
描画命令分岐123において、パス描画命令が使用されていた場合は本工程によってパス群DBに登録が成される。
<Path group DB registration process 127>
In the drawing command branch 123, when a path drawing command is used, registration in the path group DB is performed by this process.

パス描画命令とは、パス点設定命令とパス塗潰し命令から構成される。パス点設定命令とは線の描画・塗りつぶしなどで処理を行う領域を指定するための処理である。一方、パス塗潰し命令とは、パス点設定命令によって指定されたパスに対して様々な描画命令を行う処理である。単純な1色での塗りつぶしだけではなく、グラデーションの指定、パターンの指定などができても良い。   The path drawing command includes a path point setting command and a path painting command. The pass point setting command is a process for designating an area to be processed in line drawing / painting. On the other hand, the path painting command is a process of performing various drawing commands for the path specified by the pass point setting command. In addition to simple one-color painting, it may be possible to specify gradation, pattern, and the like.

ここで、パス群DBにはパス点設定命令ならびにパス塗潰し命令が保持される。   Here, the path group DB holds a path point setting instruction and a path filling instruction.

<処理継続判断128>
描画命令選択122で選択され、以上の工程で処理されてきた描画命令の他に処理するべき描画命令が存在するかを判断するための工程である。ここで描画するべき描画命令が残っている場合には、描画命令選択122に戻る。
<Processing continuation judgment 128>
This is a step for determining whether there is a drawing command to be processed in addition to the drawing command selected in the drawing command selection 122 and processed in the above steps. If there are still drawing commands to be drawn, the process returns to the drawing command selection 122.

描画するべき描画命令がない場合には、処理を終了する(処理終了129)
次に、改良パス描画命令124A,124Bでの更に詳細について、図13を用いて説明を行う。改良パス描画命令は、改良パス描画命令開始131、パス群DB確認132、文字候補パス群抽出133、文字尤度算出134、文字尤度確認136、描画属性設定137,138、パス描画139、処理継続判断140、終了141から構成される。
If there is no drawing command to be drawn, the process ends (process end 129).
Next, further details of the improved path drawing instructions 124A and 124B will be described with reference to FIG. The improved path drawing command includes an improved path drawing command start 131, a path group DB check 132, a character candidate path group extraction 133, a character likelihood calculation 134, a character likelihood check 136, a drawing attribute setting 137 and 138, a path drawing 139, and a process continuation determination. 140 and end 141.

<パス群DB確認処理132>
今後処理するべきパス群がパス群DBに登録されているか否かを判定する工程である。パス群DBにデータが存在しない場合、処理を終了する(処理終了141)。
<Path group DB confirmation processing 132>
This is a step of determining whether or not a path group to be processed in the future is registered in the path group DB. If there is no data in the path group DB, the process ends (process end 141).

パス群DBにデータが存在する場合、文字候補パス群抽出133を実行する。   If data exists in the path group DB, character candidate path group extraction 133 is executed.

<文字候補パス群抽出処理133>
パス群DBに含まれるパスデータは文字単位ではない。本工程は、それらのパス群を文字単位にグルーピングするための工程である。
<Character candidate path group extraction processing 133>
The path data included in the path group DB is not in character units. This step is a step for grouping these path groups in units of characters.

まず、アウトライン化処理の例を図4に示す。元のテキスト描画命令401には、使用するフォント名称、描画する位置、描画するテキストの文字コードなどが含まれる。これを元にパス点設定命令402、404、パス塗潰し命令403、405に変換する。この例の場合では文字グリフが大きく二つに分けられている(402と404)。   First, an example of outline processing is shown in FIG. The original text drawing command 401 includes a font name to be used, a drawing position, a character code of the text to be drawn, and the like. Based on this, pass point setting commands 402 and 404 and pass painting commands 403 and 405 are converted. In this example, the character glyph is roughly divided into two (402 and 404).

この402〜405で現れるパス描画命令を用いて、該パス描画命令がテキスト描画を行っていたものであるかを判定するのが本発明の趣旨である。   The gist of the present invention is to determine whether the path drawing command is a text drawing command using the path drawing commands 402 to 405.

ここで対象となるパス描画命令を図5に示す。この時点ではパス設定命令とパス塗潰し命令で構成される描画命令群であるため、テキストとして処理することができない。   FIG. 5 shows the target path drawing command. At this point, since it is a drawing command group composed of a path setting command and a path painting command, it cannot be processed as text.

次にこのパス描画命令群のバウンダリボックスを求める。この結果を図6に示す。1つの文字が複数のパス描画命令とパス塗潰し命令の組合せによって描画される場合もある。この場合、(1)あるパス点設定命令のバウンダリボックス内に別のパス点設定命令のバウンダリボックスと重なりを有する場合には、それらを1つのパス群として認識する。(2)隣接するパス点設定命令と組み合わせた新しいバウンダリボックスが、縦横比が1に近い場合にはそれらを1つのパス群として認識する。   Next, a boundary box of this path drawing command group is obtained. The result is shown in FIG. There is a case where one character is drawn by a combination of a plurality of path drawing commands and path filling commands. In this case, (1) when there is an overlap with a boundary box of another pass point setting instruction in a boundary box of a certain pass point setting instruction, these are recognized as one path group. (2) If the new boundary box combined with the adjacent path point setting command has an aspect ratio close to 1, they are recognized as one path group.

図6の「ン」と「社」という字に注目したものが図7である。「ン」の場合、バウンダリボックス701に対して、バウンダリボックス702が重なりを有しているので、これらを1つの文字候補のパス群として認識する。一方、「社」の場合、703と704は隣接しており、これらを組み合わせたバウンダリボックス705の縦横比は1に近い。この場合も1つの文字候補のパス群として認識する。   FIG. 7 focuses on the characters “N” and “Company” in FIG. In the case of “n”, since the boundary box 702 overlaps the boundary box 701, these are recognized as one character candidate path group. On the other hand, in the case of “Company”, 703 and 704 are adjacent to each other, and the aspect ratio of the boundary box 705 combining these is close to 1. Also in this case, it is recognized as a path group of one character candidate.

以上の作業を繰り返すことで、図8のように全てのパス点設定命令から、文字候補のパス群を抽出することが出来る。   By repeating the above operations, it is possible to extract character candidate path groups from all path point setting commands as shown in FIG.

<文字尤度算出134>
本工程は、文字候補パス群抽出工程133によって決定された文字単位のパス群に対して文字らしさを示す文字尤度を算出する工程である。
<Character likelihood calculation 134>
This step is a step of calculating the character likelihood indicating the character likeness for the character-by-character path group determined by the character candidate path group extracting step 133.

以降では、文字候補パス群の並びに注目した評価方法について、図9を用いて説明する。   Hereinafter, the focused evaluation method of the character candidate path group will be described with reference to FIG.

≪文字尤度の算出(文字の直線性)≫
日本語で使用される漢字・カタカナ・ひらがなを、文章を表示するために用いる場合にはそのグリフの中心座標があまりずれないという特徴がある。これに基づき、文字尤度算出を行うのが請求項2に記載した発明である。
≪Calculation of character likelihood (character linearity) ≫
When kanji, katakana and hiragana used in Japanese are used to display text, the center coordinates of the glyphs are not so shifted. Based on this, the character likelihood calculation is performed in the invention described in claim 2.

一連の文字候補パス群に対して、それぞれの中心座標を求める(901)。更にこれらの中心座標が別の文字候補パス群のものと一致するかを求める。この場合、ある程度の許容誤差を設けることが望ましい。一致した場合にこれらの中心座標の平均を新たな中心座標とする。これを繰り返すことで文字候補パスのうち直線状に位置するパス群を抽出することが出来、更にこれらの文字尤度を高めることで文字識別を高めることが出来る。   The respective center coordinates are obtained for a series of character candidate paths (901). Further, it is determined whether these center coordinates match those of another character candidate path group. In this case, it is desirable to provide a certain tolerance. If they match, the average of these center coordinates is set as a new center coordinate. By repeating this, it is possible to extract a path group located in a straight line from the character candidate paths, and it is possible to further increase the character likelihood by increasing the character likelihood.

しかしながらこの方法では、「ゃゅょ」のような拗音、「っ」のような促音、あるいは「ぁぃぅぇぉ」のような他の字よりも一回り小さな字体に対する識別が困難に成ってしまうという問題もある。こうした場合には、中心座標ではなく横書きの場合は下端の座標、あるいは縦書きの場合は右端の座標を元に算出する方法を用いても良い(902)。   However, with this method, it is difficult to discriminate against stuttering sounds such as “Yayo”, prompting sounds such as “tsu”, or characters that are slightly smaller than other characters such as “Ai ぅ e ぅ”. There is also a problem of end. In such a case, instead of the center coordinates, a method of calculating based on the coordinates of the lower end in the case of horizontal writing or the coordinates of the right end in the case of vertical writing may be used (902).

これを繰り返し、それぞれの文字候補パス群が文字である尤度を算出する事が出来る。   By repeating this, the likelihood that each character candidate path group is a character can be calculated.

<処理パス群選択135>
これ移行は実際に描画する処理となる。本工程は、パス群DBより描画するべきパスならびにパス群を選択する工程である。
<Processing path group selection 135>
This shift is the actual drawing process. This step is a step of selecting a path to be drawn and a path group from the path group DB.

<文字尤度確認処理136>
本工程は、パスならびにパス群が有する文字尤度を元にどの描画属性を設定するかを判定するための工程である。
<Character likelihood check processing 136>
This step is a step for determining which drawing attribute is set based on the character likelihood of the path and the path group.

単純な方法としては、ある閾値を設け、閾値未満であればパスとしての描画属性設定137を行い、閾値以上であれば文字としての描画属性設定138を行う。   As a simple method, a certain threshold value is provided, and if it is less than the threshold value, drawing attribute setting 137 as a path is performed, and if it is equal to or larger than the threshold value, drawing attribute setting 138 as a character is performed.

<パス描画属性設定137>
<テキスト描画属性設定138>
パスあるいはテキストとして描画を行う設定を、次に描画するパスオブジェクトに設定する。例えば使用するディザパターンやトナー載り量制限などの設定がある。
<Path drawing attribute setting 137>
<Text drawing attribute setting 138>
The setting for drawing as a path or text is set in the path object to be drawn next. For example, there are settings such as a dither pattern to be used and a toner application amount limit.

<パス描画処理139>
本工程は、描画属性設定137,138で設定された描画属性を利用し、処理パス群選択工程で選択されたパスに対して、描画処理を行う工程である。
<Path drawing process 139>
This step is a step of performing a drawing process on the path selected in the processing path group selection step using the drawing attributes set in the drawing attribute settings 137 and 138.

<処理継続判断140>
処理パス群選択135で選択され、以上の工程で処理されてきたパス・パス群の他に処理するべきパス・パス群が存在するかを判断するための工程である。ここで処理するべきパス群が残っている場合には、処理パス群選択135に戻る。
<Processing continuation judgment 140>
This is a process for determining whether there is a path / path group to be processed in addition to the path / path group selected by the processing path group selection 135 and processed in the above process. If there remains a path group to be processed, the process returns to the process path group selection 135.

処理するべきパス群がない場合には、パス群DB初期化141を行う。   If there is no path group to be processed, path group DB initialization 141 is performed.

<パス群DB初期化141>
本工程は、パス群DBに含まれる情報を初期化する。この際、使用していたパラメータなどを初期化しない方法をとっても良い。処理を終了する(処理終了141)
<Path group DB initialization 141>
In this step, information included in the path group DB is initialized. At this time, a method of not initializing the parameters used may be used. End processing (End processing 141)

実施例2としては、文字尤度算出136で使用することの出来る、別の文字尤度算出方法について述べる。なお、それ以外の構成については、実施例1と同等であるためここでは省略する。   As Example 2, another character likelihood calculation method that can be used in the character likelihood calculation 136 will be described. Other configurations are the same as those in the first embodiment, and are omitted here.

≪文字尤度の算出(バウンダリボックスの縦横比)≫
日本語の文章で使用される漢字・カタカナ・ひらがなは、一部を除いては、その縦横比がほぼ1:1に近いという特性がある。また英語やひらがな・カタカナの場合繰り返し同じ文字が使用されるためにその縦横比の頻度を元に見つけやすいという特性がある。これらの特性に着目したのが、請求項3の発明である。
≪Character likelihood calculation (boundary box aspect ratio) ≫
Kanji, Katakana, and Hiragana used in Japanese sentences have a characteristic that the aspect ratio is close to 1: 1 except for a part. Also, in English, hiragana and katakana, the same characters are used repeatedly, so that it is easy to find based on the aspect ratio frequency. The invention of claim 3 pays attention to these characteristics.

漢字の場合「一」「二」等の一部の字を抜かせば、多くは正方形即ち縦横比1:1前後に近い形に収まる形状をしている。よって縦横比の頻度に基づいて漢字であるか否かを想定することが可能である。   In the case of Chinese characters, if some characters such as “1”, “2”, etc. are removed, many of them have a shape that fits in a square, that is, a shape close to about 1: 1 aspect ratio. Therefore, it is possible to assume whether the character is a Chinese character based on the frequency of the aspect ratio.

更にアルファベットの場合には、大文字・小文字など限られた文字の組み合わせて文章を構成するために、漢字などと比べて同じグリフの再利用性が高い。よって文字候補パス群のバウンダリ縦横比に対する頻度を導けば、そこから文字と思しき候補の選出が可能となる。   Furthermore, in the case of the alphabet, the same glyph is more reusable than kanji and the like because a sentence is formed by combining limited characters such as uppercase and lowercase letters. Therefore, if the frequency with respect to the boundary aspect ratio of the character candidate path group is derived, it is possible to select a candidate that seems to be a character therefrom.

特にこの発明は、文章主体の文書データに対して好適な効果を齎す。   In particular, the present invention has a preferable effect on document data mainly composed of text.

この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここから縦横比を求める。1001〜1008までの文字のうち、「ノ」を示す1003以外は全て高さ10、幅10で比率が1.0であるならば、これらのパス群は全て文字尤度の高いパス群として扱う。   This example will be described with reference to FIG. The height and width are calculated for each character candidate path group. From this, the aspect ratio is obtained. Of the characters from 1001 to 1008, except for 1003 indicating “no”, if all have a height of 10, a width of 10 and a ratio of 1.0, all of these path groups are treated as a path group having a high character likelihood.

≪文字尤度の算出(バウンダリボックスのサイズ頻度解析)≫
一般的な新聞や週刊誌などを見ても明らかなように、出版物の文書の文字サイズは統一されている場合が多い。これに着目したのが請求項4の発明である。
≪Character likelihood calculation (boundary box size frequency analysis) ≫
As is clear from general newspapers and weekly magazines, the text size of publication documents is often uniform. This is the invention of claim 4.

文字のバウンダリボックスサイズに対して頻度を求め、ある一定以上繰り返し出現するバウンダリボックスに対しては文字尤度を高く見積もることが可能である。   It is possible to obtain the frequency with respect to the boundary box size of the character, and to estimate the character likelihood high for the boundary box that repeatedly appears more than a certain amount.

特にこの発明は、文書フォーマットがある程度決まっている文書データに対して好適な効果を齎す。   In particular, the present invention has a favorable effect on document data whose document format is determined to some extent.

この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここで、それぞれの高さないし幅の頻度を求めると、高さは全て10px、幅は1つを除外して全て10となる。よってこの場合には、高さ10px、あるいは幅10pxのデータに関しては文字尤度の高いデータとして扱う。   This example will be described with reference to FIG. The height and width are calculated for each character candidate path group. Here, when the frequency of each height or width is obtained, the height is 10 px, and the width is 10 except for one. Therefore, in this case, data having a height of 10 px or a width of 10 px is handled as data having a high character likelihood.

先ほどの1003のデータの場合には、高さは他のデータと同じであるが、幅が異なるため他のデータに比べて文字尤度を低く扱うようにする。   In the case of the data of 1003, the height is the same as the other data, but since the width is different, the character likelihood is handled lower than the other data.

≪文字尤度の算出(パス塗潰し命令の色情報)≫
文書に含まれる文字の色は、判読性の都合上、統一されている場合が多い。よってアウトライン化した結果得られたパス塗潰し命令の色情報に着目し、同じ色での塗りつぶしが実施されていた場合には、それらが元は同じ単語や文章に属していた可能性があるといえる。
≪Calculation of character likelihood (color information of path painting command) ≫
In many cases, the color of characters included in a document is unified for the sake of legibility. Therefore, paying attention to the color information of the path paint command obtained as a result of the outline, if the same color is applied, it may be that they originally belonged to the same word or sentence I can say that.

ここで同色と述べたが、例えば赤や青、緑などの色を文書中で目立たせるために用いる場合もあるので、これらを考慮して文字尤度を算出することも有効な手段の1つである。   Although the same color is described here, for example, colors such as red, blue, and green may be used to stand out in the document. Therefore, it is also an effective means to calculate the character likelihood in consideration of these colors. It is.

特にこの発明は、オフィス文書のような文章主体の文書データに対して好適な効果を齎す。   In particular, the present invention has a favorable effect on document-oriented document data such as office documents.

≪文字尤度の算出(文字認識処理を含む)≫
対象となるパス群が文字という可能性が高くはないが、しかし文字ではないと決定付けることも困難であるような文字尤度であった場合においては、実際にその文字を描画し、文字認識処理を試みても良い。
≪Calculation of character likelihood (including character recognition processing) ≫
If the target path group is not likely to be a character, but has a character likelihood that it is difficult to determine that it is not a character, the character is actually drawn and recognized. Processing may be attempted.

またこの結果を元に、このパス群が文字であるという前提を利用して該パスに関連する別のパス群の文字尤度を高く見積もっても良い。   Based on this result, the character likelihood of another path group related to the path may be estimated to be high using the premise that the path group is a character.

この場合、他の全ての描画命令を実行し、最終的な画像を作成してから文字認識処理を行うよりも計算量が小さくなるというメリットがある。対象とするべき文字候補パスのみを描画するため、処理時間も短くなり、また背景画像に伴うノイズが入らないために文字であるかどうかの識別性能の向上も見込める。   In this case, there is a merit that the amount of calculation is smaller than when the character recognition process is performed after executing all other drawing commands and creating a final image. Since only the character candidate path to be processed is drawn, the processing time is shortened, and noise associated with the background image does not enter, so that it is possible to improve the identification performance as to whether or not the character is a character.

≪文字尤度の算出(組合せ)≫
以上に示した算出方法は、組み合わせることで、より望ましい文字尤度の算出を試みる方法である。単純平均に基づくほか、加重平均を行ったりしても良い。
≪Calculation of character likelihood (combination) ≫
The calculation methods shown above are methods that attempt to calculate a more desirable character likelihood by combining them. In addition to simple averaging, weighted averaging may be performed.

本発明の画像形成方法を用いた画像形成処理を行うためのコンピュータ構成である1 is a computer configuration for performing image forming processing using the image forming method of the present invention. 本発明を用いることのできる複合機のシステム構成であるIt is a system configuration of a multifunction machine that can use the present invention. 本発明を用いることのできる複合機のハードウェア構成である1 is a hardware configuration of a multifunction machine that can use the present invention. テキストのアウトライン化の一例である。It is an example of text outlining. 実施例1で説明に用いるアウトライン化されたテキストである。It is the text made into the outline used for description in Example 1. FIG. 図5に対してバウンダリボックスを抽出した結果である。It is the result of extracting the boundary box with respect to FIG. 図6に対するグルーピングの一例である。It is an example of grouping with respect to FIG. 図6に対してパスのグルーピングを行った結果である。It is the result of having performed path grouping with respect to FIG. 図6に対し、中心線あるいは下線に基づく文字尤度算出の例である。FIG. 6 is an example of character likelihood calculation based on the center line or the underline. 図6に対し、バウンダリボックスのサイズに基づいての文字尤度算出の例である。FIG. 6 is an example of character likelihood calculation based on the size of the boundary box. 本発明の実施例における、PDLインタプリタのフローチャートである。4 is a flowchart of a PDL interpreter in an embodiment of the present invention. 本発明の実施例における、描画命令処理のフローチャートである。It is a flowchart of the drawing command process in the Example of this invention. 本発明の実施例における、改良パス描画命令のフローチャートである。It is a flowchart of the improvement path | pass drawing command in the Example of this invention.

符号の説明Explanation of symbols

401 アウトライン化する前のテキスト描画命令
402-405 アウトライン化によって求められるパス描画命令(パス点設定命令・パス塗潰し命令)
901 パス群の中心線に基づく文字尤度算出の例
902 パス群の下端線に基づく文字尤度算出の例
401 Text drawing command before outlining
402-405 Path drawing command (path point setting command / path filling command) required by outline conversion
901 Example of character likelihood calculation based on the center line of the path group
902 Example of character likelihood calculation based on bottom line of path group

Claims (7)

パス描画命令を含む文書データファイルを処理する画像形成装置において、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する画像形成装置。
In an image forming apparatus that processes a document data file including a path drawing command,
Means for performing a grouping process based on the characteristics of the path drawing command and generating a path group;
Means for determining the likelihood that the path is a character based on the characteristics of the path group;
An image forming apparatus comprising: means for executing the same drawing process as that of character drawing for a path group having a high likelihood.
パス群の特徴に基づき該文字尤度を求める手段として、パス群が直線状に位置している場合に尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
The image according to claim 1, further comprising means for recognizing that the likelihood is high when the path group is located in a straight line as the means for obtaining the character likelihood based on the characteristics of the path group. Forming equipment.
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1である、あるいはいずれかの方法によって既知である文字縦横比基準に近い場合には尤度が高いものと認識する手段を有することを特徴とする請求項1に記載の画像形成装置。   As a means for obtaining the character likelihood based on the characteristics of the path group, the likelihood is determined when the aspect ratio of the boundary group of the path group is approximately 1, or is close to a character aspect ratio standard known by any method. 2. The image forming apparatus according to claim 1, further comprising means for recognizing a high one. パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦、横のいずれかすくなくとも1つの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
As a means for obtaining the character likelihood based on the characteristics of the path group, at least one frequency in the vertical or horizontal direction of the boundary box of the path group is obtained, and the path group of the boundary box having a high frequency has a high likelihood. The image forming apparatus according to claim 1, further comprising a recognizing unit.
パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有することを特徴とする請求項1に記載の画像形成装置。   The means for obtaining the character likelihood based on the characteristics of the path group includes means for recognizing that the likelihood is high when the color in which the path group is drawn is the same as that of the adjacent path group. The image forming apparatus according to claim 1. パス群の特徴に基づき該文字尤度を求める手段として、尤度がある閾値範囲に含まれるものに関してはパス描画命令を実行して画像を作成し、かつその画像に対して文字認識処理を行い、尤度を決定する手段を有する
ことを特徴とする請求項1に記載の画像形成装置
As a means for obtaining the character likelihood based on the characteristics of the path group, an image is created by executing a path drawing command for those included in a certain threshold range, and character recognition processing is performed on the image. The image forming apparatus according to claim 1, further comprising means for determining likelihood.
請求項2〜請求項6のいずれかに記載の尤度決定手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有する
ことを特徴とする画像形成装置。
An image forming apparatus comprising: means for obtaining a likelihood by combining at least two or more of the likelihood determining means according to any one of claims 2 to 6.
JP2008190997A 2008-07-24 2008-07-24 Image forming apparatus Pending JP2010026986A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008190997A JP2010026986A (en) 2008-07-24 2008-07-24 Image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008190997A JP2010026986A (en) 2008-07-24 2008-07-24 Image forming apparatus

Publications (1)

Publication Number Publication Date
JP2010026986A true JP2010026986A (en) 2010-02-04

Family

ID=41732726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008190997A Pending JP2010026986A (en) 2008-07-24 2008-07-24 Image forming apparatus

Country Status (1)

Country Link
JP (1) JP2010026986A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9216687B2 (en) 2012-11-16 2015-12-22 Gogoro Inc. Apparatus, method and article for vehicle turn signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9216687B2 (en) 2012-11-16 2015-12-22 Gogoro Inc. Apparatus, method and article for vehicle turn signals

Similar Documents

Publication Publication Date Title
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
CN102404478B (en) Image forming apparatus and system, information processing apparatus, and image forming method
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
JP4343968B2 (en) Image forming apparatus and method
JP2007174270A (en) Image processing apparatus, image processing method, storage medium, and program
JP4732315B2 (en) Image processing apparatus and method
US8520006B2 (en) Image processing apparatus and method, and program
JP2006350551A (en) Document conversion device, document conversion method, document conversion system, document processor and information processor
JP7387339B2 (en) Image processing system, image processing method, and program
JP2010003087A (en) Image processor and image processing method
US8179558B2 (en) Image processing apparatus, image processing method, program and storage medium constructed to generate print data including a bitmap image and attribute data of each pixel of the bitmap image
JP4632443B2 (en) Image processing apparatus, image processing method, and program
JP5594269B2 (en) File name creation device, image forming device, and file name creation program
JP5066977B2 (en) Image processing apparatus, image forming apparatus, and program
JP4673200B2 (en) Print processing system and print processing method
JP4232679B2 (en) Image forming apparatus and program
JP4905275B2 (en) Image processing apparatus, image processing method, and image processing program
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
JP2006196976A (en) Copying system with automatic clean copy function using ocr
JP2020204905A (en) Character recognition device, document file generation method, document file generation program
JP2010026986A (en) Image forming apparatus
JP2010287178A (en) Image processing device, image reading apparatus, multifunction machine, image processing method, program and recording medium
JP2008148263A (en) Image forming apparatus, and its control method
US20090097699A1 (en) Information processing apparatus and method, computer program and computer-readable recording medium
JP4587492B2 (en) Image forming apparatus and method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630