JP5030985B2 - Character string processing apparatus and image forming apparatus - Google Patents
Character string processing apparatus and image forming apparatus Download PDFInfo
- Publication number
- JP5030985B2 JP5030985B2 JP2009061613A JP2009061613A JP5030985B2 JP 5030985 B2 JP5030985 B2 JP 5030985B2 JP 2009061613 A JP2009061613 A JP 2009061613A JP 2009061613 A JP2009061613 A JP 2009061613A JP 5030985 B2 JP5030985 B2 JP 5030985B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- encoding method
- encoded
- character
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、文字列処理装置および画像形成装置に係り、特に一の符号化方式(文字コード・セット)で符号化された文字列を他の符号化方式に変換する文字列処理装置および画像形成装置に関する。 The present invention relates to a character string processing equipment Contact and image forming apparatus, a character string processing equipment for converting the encoded character string, especially in one of the encoding (character code set) to other encodings you and relates to an image forming apparatus.
符号化方式は、文字や記号など(以下、単に文字という)をコンピュータ上で扱うため、文字に割り当てられている文字コードに変換するものである。この符号化方式は、言語やコンピュータシステムにより異なるのが普通である。例えばインターネットでは、世界の主要言語に対応するためUnicodeを利用したUTF−8,UTF−16などが標準的な符号化方式として利用されている。また、文字列処理装置および画像形成装置などでは、シフトJISやLatin1等が符号化方式として利用されている。 The encoding method converts characters and symbols (hereinafter simply referred to as characters) into character codes assigned to the characters in order to handle them on a computer. This encoding method usually differs depending on the language and the computer system. For example, on the Internet, UTF-8, UTF-16, etc. using Unicode are used as standard encoding methods in order to support major languages in the world. In character string processing apparatuses and image forming apparatuses, Shift JIS, Latin 1 and the like are used as encoding methods.
複数の符号化方式を利用可能な文字列処理装置は、必要に応じて一の符号化方式で符号化された文字列を他の符号化方式に変換する。なお、画像形成装置はフォントROMの容量を節約するため、ユーザインターフェースに必要十分な少数の符号化方式を販売先の言語に応じて用意している。 A character string processing apparatus that can use a plurality of encoding methods converts a character string encoded by one encoding method to another encoding method as necessary. In order to save the capacity of the font ROM, the image forming apparatus prepares a small number of encoding methods necessary and sufficient for the user interface according to the language of the sales destination.
従来、インターネットなどのネットワークに接続した文字列処理装置および画像形成装置は、ネットワーク側から例えばUnicodeで表現された文字列を含む要求(例えば、文書名の変更要求など)を受信すると、その文字列を内部処理で利用する符号化方式に変換していた。特許文献1には、一の符号化方式で符号化された文字列を他の符号化方式に変換する内容が記載されている。
Conventionally, when a character string processing apparatus and an image forming apparatus connected to a network such as the Internet receive a request (for example, a request for changing a document name) including a character string expressed in Unicode, for example, from the network side, the character string Was converted to an encoding method used in internal processing.
通常、文字列処理装置および画像形成装置は複数の符号化方式が利用可能であるため、利用する符号化方式を選択する必要があった。しかしながら、符号化方式で表現可能な文字の集合は符号化方式ごとに異なっており、変換前の符号化方式で表現可能な文字が変換後の符号化方式で表現可能な文字であるとは限らない。したがって、変換前の符号化方式と変換後の符号化方式との組み合わせによっては、全ての文字列を完全に変換できない場合があるという問題があった。 Usually, since a plurality of encoding methods can be used for the character string processing device and the image forming apparatus, it is necessary to select the encoding method to be used. However, the set of characters that can be expressed by the encoding method differs for each encoding method, and characters that can be expressed by the encoding method before conversion are not necessarily characters that can be expressed by the encoding method after conversion. Absent. Therefore, depending on the combination of the encoding method before conversion and the encoding method after conversion, there is a problem that all character strings may not be completely converted.
例えばUnicodeで表現可能な文字の集合は、文字列処理装置および画像形成装置が内部処理で利用するシフトJISやLatin1等の符号化方式で表現可能な文字の集合に全て包含されているとは限らない。したがって、Unicodeで表現可能な文字であっても、内部処理で利用する符号化方式で変換可能であるとは限らないという問願があった。 For example, a set of characters that can be expressed in Unicode is not always included in a set of characters that can be expressed by an encoding method such as Shift JIS or Latin 1 that is used by the character string processing apparatus and the image forming apparatus for internal processing. Absent. Therefore, there has been a request that even characters that can be expressed in Unicode cannot always be converted by an encoding method used in internal processing.
以上のように、従来の文字列処理装置および画像形成装置は、一の符号化方式で符号化された文字列をどの符号化方式に変換するかで、変換できない文字の数が異なるため、符号化方式の選択が重要であった。また、従来の文字列処理装置および画像形成装置は、変換後の文字列を照合するとき等に、変換できなかった文字の扱いが重要であった。さらに、いくつかの符号化方式では、同一の文字に異なる文字コードを割り当てており、このような例外的な文字の扱いも重要であった。 As described above, the conventional character string processing device and the image forming apparatus have different numbers of characters that cannot be converted depending on which encoding method the character string encoded by one encoding method is converted. The selection of the conversion method was important. Further, in the conventional character string processing device and image forming apparatus, it is important to handle characters that could not be converted when collating the converted character strings. Furthermore, in some encoding methods, different character codes are assigned to the same character, and handling of such exceptional characters is also important.
本発明は、上記の点に鑑みなされたもので、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、変換後の符号化方式で表現された文字列を適切に扱うことが可能な文字列処理装置および画像形成装置を提供することを目的とする。 The present invention has been made in view of the above points. When a character string encoded by one encoding method is converted to another encoding method, the character string expressed by the converted encoding method the and to provide a character string processing equipment Contact and image forming apparatus capable of properly dealing.
そこで、上記課題を解決するため、本発明は、一の符号化方式で符号化された文字列を用いて、内部処理で利用する内部符号化方式で符号化された文字列を照合する文字列処理装置において、前記内部符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段と、前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列を格納している格納手段とを有し、前記文字列照合手段は、前記内部符号化方式で符号化された文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記格納手段に格納している前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列と、前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列とが一致とみなせなければ、前記前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列を前記格納手段に格納することを有することを特徴とする。 Therefore, in order to solve the above-mentioned problem, the present invention uses a character string encoded by one encoding method, and a character string that collates a character string encoded by an internal encoding method used in internal processing. In the processing device, the character string encoded by the internal encoding method is converted to the one encoding method, and the converted character string is collated using the character string encoded by the one encoding method. Sometimes, the character string matching means that handles the substitute code included in the converted character string as a character having the role of representing all characters, and the one encoding before being encoded by the internal encoding method Storage means for storing a character string encoded by the method, wherein the character string collating means encodes the character string encoded by the internal encoding method by the one encoding method. Stored in the storage means when collating using a character string The character string encoded by the one encoding method before being encoded by the inner encoding method and the one encoding converted from the character string encoded by the inner encoding method If the character string encoded by the method cannot be regarded as a match, the storage means stores the character string encoded by the one encoding method converted from the character string encoded by the inner encoding method. It is characterized by having storing in .
本発明では、一の符号化方式で符号化された文字列を他の符号化方式の文字列に変換するときに、代用符号の数情報および位置情報の少なくとも一方に基づいて符号化方式を決定する。また、本発明では他の符号化方式に変換した文字列に含まれる代用符号を、全ての文字を表す役割ともった文字(ワイルドカード)として扱う。 In the present invention, when a character string encoded by one encoding method is converted to a character string of another encoding method, the encoding method is determined based on at least one of the number information and the position information of the substitute code. To do. In the present invention, a substitute code included in a character string converted into another encoding method is treated as a character (wild card) having a role of representing all characters.
上述の如く、本発明によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、変換後の符号化方式で表現された文字列を適切に扱うことが可能な文字列処理装置および画像形成装置を提供することができる。 As described above, according to the present invention, when a character string encoded by one encoding method is converted to another encoding method, the character string expressed by the converted encoding method is appropriately handled. it is possible to provide a character string processing equipment Contact and image forming apparatus capable.
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。 Next, the best mode for carrying out the present invention will be described based on the following embodiments with reference to the drawings.
まず、本発明の理解を容易とするために、本発明の原理について図1〜7を参照しつつ説明する。図1〜6は、符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。また、図7は文字に割り当てられている文字コードを符号化方式ごとに表したルックアップテーブルである。 First, in order to facilitate understanding of the present invention, the principle of the present invention will be described with reference to FIGS. 1 to 6 are diagrams showing that a set of characters that can be expressed by the encoding method is different for each encoding method. FIG. 7 is a look-up table showing character codes assigned to characters for each encoding method.
図1〜図6では、Ωが全ての文字の集合を表し、Aが符号化方式aで符号化可能な文字の集合を表し、Bが符号化方式bで符号化可能な文字の集合を表し、Cが符号化方式bで符号化可能な文字の集合を表している。 1 to 6, Ω represents a set of all characters, A represents a set of characters that can be encoded by the encoding method a, and B represents a set of characters that can be encoded by the encoding method b. , C represents a set of characters that can be encoded by the encoding method b.
図1は、符号化方式b又はcで符号化可能な文字の集合B∪Cが、符号化方式aで符号化可能な文字の集合Aに包含されていることを表している。例えば符号化方式aがUTF−8,符号化方式bがShift_JIS,符号化方式cがLatin1であるのときに、図1のような関係を有する。なお、符号化方式がUTF−8,Shift_JIS,Latin1のときのルックアップテーブルは図7のように表される。 FIG. 1 shows that the character set B∪C that can be encoded by the encoding method b or c is included in the character set A that can be encoded by the encoding method a. For example, when the encoding method a is UTF-8, the encoding method b is Shift_JIS, and the encoding method c is Latin1, the relationship shown in FIG. Note that the look-up table when the encoding method is UTF-8, Shift_JIS, and Latin1 is expressed as shown in FIG.
図2は、符号化方式a,b及びcで符号化可能な文字の集合A∩B∩Cが、斜線で表されている。例えば図7のルックアップテーブルでは、文字「1」が図2の斜線部分に含まれる。図2の斜線部分に含まれる文字は、一の符号化方式から他の符号化方式に変換できる。 In FIG. 2, a set of characters A∩B∩C that can be encoded by the encoding methods a, b, and c is represented by hatching. For example, in the lookup table of FIG. 7, the character “1” is included in the hatched portion of FIG. Characters included in the hatched portion in FIG. 2 can be converted from one encoding method to another encoding method.
図3は、符号化方式a,bで符号化可能かつ符号化方式cで符号化できない文字の集合A∩B−Cが、斜線で表されている。例えば図7のルックアップテーブルでは、文字「円」が図3の斜線部分に含まれる。図3の斜線部分に含まれる文字は、一の符号化方式から符号化方式cに変換できない。 In FIG. 3, a set of characters A−B-C that can be encoded by the encoding methods a and b but cannot be encoded by the encoding method c is indicated by hatching. For example, in the lookup table of FIG. 7, the character “circle” is included in the hatched portion of FIG. Characters included in the hatched portion in FIG. 3 cannot be converted from one encoding method to encoding method c.
本発明では、図3の斜線部分に含まれている文字を符号化方式cに変換する場合、その文字を代用符号に置き換える。代用符号には、文字が割り当てられていない文字コードを用いる。 In the present invention, when a character included in the hatched portion in FIG. 3 is converted to the encoding scheme c, the character is replaced with a substitute code. As the substitute code, a character code to which no character is assigned is used.
例えば代用符号は、文字を1バイトで表現可能な符号化方式を2バイトに拡張した文字コードを用いることが考えられる。また、代用符号は文字が割り当てられていない隙間の文字コードを用いることが考えられる。さらに、文字列処理装置や画像形成装置などで用いない例えば「字削除」の制御文字を用いることも考えられる。 For example, as a substitute code, it is conceivable to use a character code obtained by extending an encoding method capable of expressing a character by 1 byte to 2 bytes. Further, it is conceivable to use a character code in a gap where no character is assigned as the substitute code. Furthermore, it is also conceivable to use, for example, a “character deletion” control character that is not used in a character string processing apparatus or an image forming apparatus.
図4は、符号化方式a,cで符号化可能かつ符号化方式bで符号化できない文字の集合A∩C−Bが、斜線で表されている。例えば図7のルックアップテーブルでは、文字 In FIG. 4, a set A−C-B of characters that can be encoded by the encoding methods a and c but cannot be encoded by the encoding method b is represented by hatching. For example, in the lookup table of FIG.
[外1]
が図4の斜線部分に含まれる。図4の斜線部分に含まれる文字は、一の符号化方式から符号化方式bに変換できない。本発明では、図4の斜線部分に含まれている文字を符号化方式bに変換する場合、その文字を代用符号に置き換える。
[Outside 1]
Is included in the hatched portion of FIG. Characters included in the shaded area in FIG. 4 cannot be converted from one encoding method to encoding method b. In the present invention, when a character included in the shaded portion in FIG. 4 is converted into the encoding method b, the character is replaced with a substitute code.
図5は、符号化方式aで符号化可能かつ符号化方式b,cで符号化できない文字の集合A−(B∪C)が、斜線で表されている。例えば図7のルックアップテーブルでは、文字 In FIG. 5, a set A- (B∪C) of characters that can be encoded by the encoding method a and cannot be encoded by the encoding methods b and c is represented by hatching. For example, in the lookup table of FIG.
[外2]
が図5の斜線部分に含まれる。図5の斜線部分に含まれる文字は、一の符号化方式から符号化方式b,cに変換できない。本発明では、図5の斜線部分に含まれている文字を符号化方式b,cに変換する場合、その文字を代用符号に置き換える。
[Outside 2]
Is included in the hatched portion of FIG. Characters included in the hatched portion in FIG. 5 cannot be converted from one encoding method to encoding methods b and c. In the present invention, when a character included in the shaded portion in FIG. 5 is converted into the encoding methods b and c, the character is replaced with a substitute code.
図6は、符号化方式a,b,cで符号化できない文字の集合 FIG. 6 shows a set of characters that cannot be encoded by the encoding methods a, b, and c.
[外3]
が、斜線で表されている。図6の斜線部分に含まれる文字は、一の符号化方式から符号化方式a,b,cに変換できない。もっとも、符号化方式aに変換できない文字が文字コードで表現されているなら、最初から代用符号になっているものと考えられる。したがって、本発明では図6の斜線部分に含まれている文字を符号化方式b,cに変換する場合、符号化方式aの代用符号を符号化方式b,cの代用符号に置き換える。代用符号に置き換えられた文字は、例えばオペレーションパネルなどの操作画面に不明文字として「□」で表示される。
[Outside 3]
Is represented by diagonal lines. Characters included in the hatched portion in FIG. 6 cannot be converted from one encoding method to encoding methods a, b, and c. However, if a character that cannot be converted into the encoding method a is expressed by a character code, it can be considered that the character is a substitute code from the beginning. Therefore, in the present invention, when the character included in the hatched portion in FIG. 6 is converted into the encoding methods b and c, the substitute code of the encoding method a is replaced with the substitute code of the encoding methods b and c. The character replaced with the substitute code is displayed as “□” as an unknown character on an operation screen such as an operation panel.
本発明の文字列処理装置は、複数の符号化方式が利用可能であるとき、代用符号に置き換えた文字の数,代用符号に置き換えた文字の位置および符号化方式の優先度により、後述するように符号化方式を選択する。 When a plurality of encoding methods are available, the character string processing apparatus of the present invention will be described later depending on the number of characters replaced with substitute codes, the positions of characters replaced with substitute codes, and the priority of the encoding method. Select the encoding method.
以下、本発明の文字列処理方法を利用する文字列処理装置の一例として画像形成装置の処理を中心に説明するが、一の符号化方式で符号化された文字列を他の符号化方式に変換する如何なる装置であってもよい。 Hereinafter, the processing of the image forming apparatus will be mainly described as an example of a character string processing apparatus using the character string processing method of the present invention. However, a character string encoded by one encoding method is changed to another encoding method. Any device that converts can be used.
なお、本実施例で説明する画像形成装置は、プリンタ,コピー,ファクシミリおよびスキャナなどの各装置の機能を1つの筐体内に収納しているため、融合機とも呼ばれる。 Note that the image forming apparatus described in this embodiment is also called a multi-function machine because the functions of each apparatus such as a printer, a copy machine, a facsimile machine, and a scanner are housed in one housing.
この融合機は、1つの筐体内に表示部,印刷部および撮像部などを設けると共に、プリンタ,コピー,ファクシミリおよびスキャナにそれぞれ対応する4種類のソフトウェアを設け、そのソフトウェアを切り替えることより、プリンタ,コピー,ファクシミリおよびスキャナとして動作させるものである。 This multi-function apparatus is provided with a display unit, a printing unit, an imaging unit, and the like in one casing, and four types of software corresponding to a printer, a copy, a facsimile, and a scanner, respectively. Operates as a copy, facsimile and scanner.
図8は、本発明による融合機の一実施例の構成図である。融合機1は、ソフトウェア群2と,融合機起動部3と,ハードウェア資源4とを含むように構成される。
FIG. 8 is a block diagram of an embodiment of the compound machine according to the present invention. The
融合機起動部3は融合機1の電源投入時に最初に実行され、アプリケーション層5およびプラットフォーム6を起動する。例えば融合機起動部3は、アプリケーション層5およびプラットフォーム6のプログラムをハードディスク装置(以下、HDDという)などから読み出し、読み出した各プログラムをメモリ領域に転送して起動する。
The compound
ハードウェア資源4は、白黒レーザプリンタ(B&W LP)11と,カラーレーザプリンタ(Color LP)12と,スキャナやファクシミリなどのその他のハードウェアリソース13とを含む。
The
また、ソフトウェア群2は、UNIX(登録商標)などのオペレーティングシステム(以下、OSという)上に起動されているアプリケーション層5とプラットフォーム6とを含む。アプリケーション層5は、プリンタ,コピー,ファックスおよびスキャナなどの画像形成にかかるユーザサービスにそれぞれ固有の処理を行うプログラムを含む。
The
アプリケーション層5は、プリンタアプリ21と,コピーアプリ22と,ファックスアプリ23と,スキャナアプリ24と,WEBサービスインターフェース(以下、WEBサービスI/Fという)26とを含む。
The application layer 5 includes a
プラットフォーム6は、アプリケーション層5からの処理要求を解釈してハードウェア資源4の獲得要求を発生するコントロールサービス層9と、1つ以上のハードウェア資源4の管理を行ってコントロールサービス層9からの獲得要求を調停するシステムリソースマネージャ(以下、SRMという)39と、SRM39からの獲得要求に応じてハードウェア資源4の管理を行うハンドラ層10とを含む。
The
コントロールサービス層9は、ネットワークコントロールサービス(以下、NCSという)31,デリバリーコントロールサービス(以下、DCSという)32,オペレーションパネルコントロールサービス(以下、OCSという)33,ファックスコントロールサービス(以下、FCSという)34,エンジンコントロールサービス(以下、ECSという)35,メモリコントロールサービス(以下、MCSという)36,ユーザ情報コントロールサービス(以下、UCSという)37,システムコントロールサービス(以下、SCSという)38など、一つ以上のサービスモジュールを含むように構成されている。
The
なお、プラットフォーム6は予め定義されている関数により、アプリケーション層5からの処理要求を受信するアプリケーションプログラムインターフェース(以下、APIという)51を含むように構成されている。OSは、アプリケーション層5およびプラットフォーム6の各ソフトウェアをプロセスとして並列実行する。
The
NCS31のプロセスは、ネットワーク側から各プロトコルによって受信したデータを各アプリケーションに振り分けたり、各アプリケーションからのデータをネットワーク側に送信する際の仲介を行う。
The process of the
例えばNCS31のプロセスは、ネットワークを介して接続されるクライアントとのデータ通信を例えばhttpd(HyperText Transfer Protocol Daemon)により、HTTP(HyperText Transfer Protocol)で制御する。
For example, the process of the
DCS32のプロセスは、蓄積文書の配送などの制御を行う。OCS33のプロセスは、オペレーションパネルの制御を行う。FCS34のプロセスは、アプリケーション層5からPSTN,ISDN網を利用したファックス送受信,バックアップ用のメモリで管理されている各種ファックスデータの登録/引用,ファックス読み取り,ファックス受信印刷などを行うためのAPIを提供する。
The process of the
ECS35のプロセスは、白黒レーザプリンタ11,カラーレーザプリンタ12,ハードウェアリソース13などのエンジン部の制御を行う。MCS36のプロセスは、メモリの取得および解放,HDDの利用,画像データの圧縮および伸張などのメモリ制御を行う。UCS37のプロセスは、ユーザ情報の管理を行うものである。
The process of the
SCS38のプロセスは、アプリケーション管理,操作部制御,システム画面表示,LED表示,ハードウェア資源管理,割り込みアプリケーション制御などの処理を行う。
The process of the
SRM39のプロセスは、SCS38と共にシステムの制御およびハードウェア資源4の管理を行うものである。例えばSRM39のプロセスは、白黒レーザプリンタ11やカラーレーザプリンタ12などのハードウェア資源4を利用する上位層からの獲得要求に従って調停を行い、実行制御する。
The
具体的に、SRM39のプロセスは獲得要求されたハードウェア資源4が利用可能であるか(他の獲得要求により利用されていないかどうか)を判定し、利用可能であれば獲得要求されたハードウェア資源4が利用可能である旨を上位層に通知する。また、SRM39のプロセスは上位層からの獲得要求に対してハードウェア資源4を利用するためのスケジューリングを行い、要求内容(例えば、プリンタエンジンによる紙搬送と作像動作,メモリ確保,ファイル生成など)を直接実施している。
Specifically, the process of the
また、ハンドラ層10は後述するファックスコントロールユニット(以下、FCUという)の管理を行うファックスコントロールユニットハンドラ(以下、FCUHという)40と、プロセスに対するメモリの割り振り及びプロセスに割り振ったメモリの管理を行うイメージメモリハンドラ(以下、IMHという)41とを含む。
The
SRM39,FCUH40およびIMH41は、予め定義されている関数によりハードウェア資源4に対する処理要求を送信するエンジンI/F52を利用してハードウェア資源4に対する処理要求を行う。
The
図8のような構成により、融合機1は各アプリケーションで共通的に必要な処理をプラットフォーム6で一元的に処理することができる。
With the configuration as shown in FIG. 8, the
次に、融合機1のハードウェア構成について説明する。図9は、本発明による融合機の一実施例のハードウェア構成図である。融合機1は、コントローラ60と,オペレーションパネル70と,FCU80と,USBデバイス90と,IEEE1394デバイス100と,エンジン部110とを含む。
Next, a hardware configuration of the
また、コントローラ60は、CPU61と,システムメモリ62と,ノースブリッジ(以下、NBという)63と,サウスブリッジ(以下、SBという)64と,ASIC66と,ローカルメモリ67と,HDD68,ネットワークI/Fコントローラ69とを含む。
The
オペレーションパネル70は、コントローラ60のASIC66に接続されている。また、FCU80,USBデバイス90,IEEE1394デバイス100およびエンジン部110は、コントローラ60のASIC66にPCIバスで接続されている。
The
コントローラ60は、ASIC66にローカルメモリ67,HDD68,ネットワークI/Fコントローラ69などが接続されると共に、CPU61とASIC66とがCPUチップセットのNB63を介して接続されている。NB63を介してCPU61とASIC66とを接続すれば、CPU61のI/Fが公開されていない場合に対応できる。
In the
なお、ASIC66とNB63とは、PCIバスを介して接続されているのでなく、AGP(Accelerated Graphics Port )65を介して接続されている。このように、図8のアプリケーション層5やプラットフォーム6を形成する一つ以上のプロセスを実行制御するため、ASIC66とNB63とを低速のPCIバスでなくAGP65を介して接続し、パフォーマンスの低下を防いでいる。
The
CPU61は、融合機1の全体制御を行うものである。CPU61は、NCS31,DCS32,OCS33,FCS34,ECS35,MCS36,UCS37,SCS38,SRM39,FCUH40およびIMH41をOS上にそれぞれプロセスとして起動して実行させると共に、アプリケーション層111を形成するプリンタアプリ21,コピーアプリ22,ファックスアプリ23,スキャナアプリ24,ネットファイルアプリ25,WEBサービスI/F26を起動して実行させる。
The
NB63は、CPU61,システムメモリ62,SB64およびASIC66を接続するためのブリッジである。システムメモリ62は、融合機1の描画用メモリ等として用いるメモリである。SB64は、図示していないROM,PCIバス,周辺デバイス等とNB63とを接続するためのブリッジである。
The
ローカルメモリ67はコピー用画像バッファ,符号バッファとして用いるメモリである。ASIC66は、画像処理用のハードウェア要素を有する画像処理用途向けのICである。HDD68は、画像データの蓄積,文書データの蓄積,プログラムの蓄積,フォントデータの蓄積,フォームの蓄積などを行うためのストレージである。また、オペレーションパネル70は、ユーザからの入力操作を受け付けると共に、ユーザに向けた表示を行う操作部である。
The
以下、ネットワークを介して接続されたクライアントから文字列を含む要求(文書名や作者名の変更,照合)を受信したときの融合機1の処理について説明していく。
Hereinafter, processing of the
図10は、本発明による第1実施例の文字列処理方法について説明するための融合機の構成図である。なお、図10の構成図は説明に必要のない構成を省略している。 FIG. 10 is a block diagram of the compound machine for explaining the character string processing method according to the first embodiment of the present invention. In the configuration diagram of FIG. 10, configurations that are not necessary for description are omitted.
図10では、融合機1にインターネット,LANなどのネットワーク210を介してクライアント200が接続されている。クライアント200と融合機1とは、XML(eXtensible Markup Language)形式でデータ交換を行う。なお、クライアント200と融合機1とは、例えばデータ・アクセス・プロトコルとしてSOAP(Simple Object Access Protocol)と呼ばれる通信プロトコル規格を利用する。
In FIG. 10, a
ステップS1では、クライアント200が、XML形式で記述した図11のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。図11は、文書名の変更要求を行うSOAPメッセージの一例の構成図である。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
In step S1, the
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、文書名の変更要求に応じたsetTitleのオブジェクト230に処理を依頼する。
When receiving the HTTP message, the Web service I /
まず、setTitleのオブジェクト230は、内部処理で利用する符号化方式以外の文字列(変更後の文書名)を受信すると、その文字列を内部処理で利用する符号化方式に変換する必要がある。ここでは、UTF−8で符号化された文字列をShift_JISまたはLatin1で符号化された文字列に変換する例を説明する。
First, when the
WebサービスI/F26から処理を依頼されると、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば図12のようなフローチャートで表す処理を実行する。
When processing is requested from the Web service I /
図12は、符号化方式決定処理の一例のフローチャートである。図13はUTF−8,Shift_JISおよびLatin1の文字コードの割り当てを表した一例のルックアップテーブルである。 FIG. 12 is a flowchart of an example of an encoding method determination process. FIG. 13 is an example of a look-up table showing allocation of character codes of UTF-8, Shift_JIS, and Latin1.
ステップS11では、オブジェクト230は融合機1で利用可能な符号化方式のリストを例えばHDD68などから取得し、最初の符号化方式として例えばShift_JISを選択する。なお、符号化方式のリストはランダムに並んだものであってもよいし、優先度順に並んだものであってもよい。
In step S11, the
ステップS11に続いてステップS12に進み、オブジェクト230は符号化方式を変更する文字列
Proceeding to step S12 following step S11, the
[外4]
をステップS11で選択したShift_JISで符号化する。図13のルックアップテーブルを参照すると、符号化方式Shift_JISでは文字
[Outside 4]
Is encoded by Shift_JIS selected in step S11. Referring to the look-up table in FIG. 13, in the encoding method Shift_JIS, characters
[外5]
が変換できない。ステップS12に続いてステップS13に進み、オブジェクト230はステップS12で符号化した結果、符号化方式を変更する文字列がステップS11で選択したShift_JISで所定基準以上の符号化が可能であるか否かを判定する。例えば所定基準としては、完全な符号化であってもよいし、選択した符号化方式で変換できない文字の数が所定数以下であってもよい。ここでは、所定基準が完全な符号化である例を説明する。
[Outside 5]
Cannot be converted. Progressing to step S13 following step S12, the
この場合、Shift_JISで完全に符号化が可能ではないので(S13においてNO)、オブジェクト230はステップS14に進む。なお、ステップS11で選択した符号化方式で完全に符号化が可能であれば(S13においてYES)、オブジェクト230はステップS11で選択した符号化方式に決定して処理を終了する。
In this case, since it is not possible to completely encode with Shift_JIS (NO in S13), the
ステップS14では、オブジェクト230が、ステップS12で符号化した結果から、代用文字に置き換える文字の数および文字の位置を例えばシステムメモリ62に記憶する。この場合、オブジェクト230は代用文字に置き換える文字の数「1」および文字の位置「最初から2番目」を記憶する。
In step S14, the
ステップS14に続いてステップS15に進み、オブジェクト230は符号化方式のリストから選択されていない符号化方式があるか否かを判定する。この場合、Latin1が選択されていないので(S15においてYES)、オブジェクト230はステップS16に進む。
Proceeding to step S15 following step S14, the
ステップS15に続いてステップS16に進み、オブジェクト230は符号化方式のリストからShift_JISの次のLatin1を選択してステップS12に戻る。ステップS12では、オブジェクト230が符号化方式を変更する文字列
Progressing to step S16 following step S15, the
[外6]
をステップS16で選択したLatin1で符号化する。図13のルックアップテーブルから、符号化方式Latin1では文字「作」が変換できないことが分かる。ステップS12に続いてステップS13に進み、オブジェクト230はステップS12で符号化した結果、符号化方式を変更する文字列がステップS16で選択したLatin1で完全に符号化可能であるか否かを判定する。
[Outside 6]
Is encoded with Latin1 selected in step S16. From the lookup table of FIG. 13, it can be seen that the character “saku” cannot be converted by the encoding method Latin1. Progressing to step S13 following step S12, the
この場合、Latin1で完全に符号化が可能ではないので(S13においてNO)、オブジェクト230はステップS14に進む。ステップS14では、オブジェクト230が、ステップS12で符号化した結果から、代用文字に置き換える文字の数および文字の位置を例えばシステムメモリ62に記憶する。この場合、オブジェクト230は代用文字に置き換える文字の数「1」および文字の位置「最初から5番目」を記憶する。
In this case, since encoding is not possible in Latin 1 (NO in S13), the
ステップS14に続いてステップS15に進み、オブジェクト230は符号化方式のリストから選択されていない符号化方式があるか否かを判定する。この場合、全ての符号化方式が選択されているので(S15においてNO)、オブジェクト230はステップS18に進む。
Proceeding to step S15 following step S14, the
ステップS18では、オブジェクト230が、ステップS14で記憶した代用文字に置き換える文字の数,文字の位置などを用いて、所定条件に基づき最適な符号化方式を決定して処理を終了する。
In step S18, the
例えばステップS18では、代用文字に置き換える文字の数が一番少ない符号化方式を最適な符号化方式として決定できる。また、代用文字に置き換える文字が連続して出現する回数が一番少ない符号化方式を最適な符号化方式として決定することもできる。また、代用文字に置き換える文字の最初の出現位置が一番後ろの符号化方式を最適な符号化方式として決定することもできる。 For example, in step S18, an encoding method with the least number of characters to be replaced with substitute characters can be determined as the optimal encoding method. It is also possible to determine the coding method with the smallest number of consecutive occurrences of characters to be replaced with substitute characters as the optimum coding method. It is also possible to determine the coding method with the last appearance position of the character to be replaced with the substitute character as the optimum coding method.
また、代用文字に置き換える文字の平均の出現位置が一番後ろの符号化方式を最適な符号化方式として決定することもできる。また、符号化方式のリスト中で先に現れる符号化方式を最適な符号化方式として決定することもできる。 It is also possible to determine the coding method with the last appearance position of the average character to be replaced with the substitute character as the optimum coding method. In addition, the encoding method that appears first in the list of encoding methods can be determined as the optimal encoding method.
さらに、上記のような符号化方式の決定を2つ以上組み合わせるか、ポイント制にすることにより、最適な符号化方式を決定することもできる。例えば代用文字に置き換える文字の数が一番少なく、且つ代用文字に置き換える文字の最初の出現位置が一番後ろの符号化方式を最適な符号化方式として決定する場合、 Furthermore, an optimal encoding method can be determined by combining two or more determinations of the encoding method as described above or using a point system. For example, when the number of characters to be replaced with a substitute character is the smallest and the first appearance position of the character to be replaced with a substitute character is determined as the most suitable encoding method,
[外7]
を符号化する符号化方式としてLatin1が選択される。なお、代用文字に置き換える文字の数が一番少ない符号化方式を最適な符号化方式として決定すると共に、代用文字に置き換える文字の数が同じ場合に符号化方式のリスト中で先に現れる符号化方式を最適な符号化方式として決定することもできる。
[Outside 7]
Latin1 is selected as an encoding method for encoding. The coding method with the least number of characters to be replaced with substitute characters is determined as the optimal coding method, and the coding that appears first in the list of coding methods when the number of characters to be replaced with substitute characters is the same. It is also possible to determine the system as an optimal encoding system.
図12のフローチャートにより最適な符号化方式を選択したあと、オブジェクト230は選択した符号化方式で文字列
After selecting the optimum encoding method according to the flowchart of FIG. 12, the
[外8]
を符号化する。オブジェクト230は、符号化できない文字を代用文字に置き換える。例えば
[Outside 8]
Is encoded.
[外9]
をLatin1で符号化した場合、最初から5番目の「作」が代用文字に置き換えられる。そして、オブジェクト230はステップS2に進み、符号化した文字列を用いてMCS36に文書名の変更要求を行う。MCS36は例えば図14のような形式の書誌情報データをHDD68等に格納しており、オブジェクト230からの文書名の変更要求に応じて書誌情報データを更新する。
[Outside 9]
Is encoded with
そして、ステップS2に続いてステップS3に進み、MCS36は文書名の変更応答をオブジェクト230に送信する。オブジェクト230は文書名の変更応答を受信すると、WebサービスI/F26に処理の終了を通知する。
In step S3 following step S2, the
ステップS4では、WebサービスI/F26が、文書名の変更応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
In step S <b> 4, the Web service I /
以上、本発明による第1実施例の文字列処理方法によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、適切な符号化方式を選択することができる。 As described above, according to the character string processing method of the first embodiment of the present invention, an appropriate encoding method is selected when a character string encoded by one encoding method is converted into another encoding method. be able to.
なお、図10ではsetTitleのオブジェクト230をWebサービスI/F26に設けた例について説明したが、MCS36に設けてもよい。MCS36にオブジェクト230を設けた場合、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、文書名の変更要求をMCS36に対して行う。そして、MCS36は文書名の変更要求に応じたsetTitleのオブジェクト230に処理を依頼する。
In addition, although the example which provided the
WebサービスI/F26から処理を依頼されると、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば図12のようなフローチャートで表す処理により最適な符号化方式を選択する。オブジェクト230は選択した符号化方式で文字列を符号化すると共に、符号化できない文字を代用文字に置き換える。そして、オブジェクト230はステップS2に進み、符号化した文字列を用いてMCS36に文書名の変更要求を行う。その他の処理は、setTitleのオブジェクト230をWebサービスI/F26に設けた例と同様である。
When processing is requested from the Web service I /
setTitleのオブジェクト230をWebサービスI/F26に設けた場合のメリットは、第1実施例の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webサービス対応のためのオプションという構成にできることである。また、setTitleのオブジェクト230をMCS36に設けた場合のメリットは、他のI/F(例えばプリンタI/Fなど)でも利用できることである。
The merit when the
第1実施例のように、変換できない文字を代用符号に置き換えた場合、変換後の文字列を照合するとき等、代用符号に置き換えた全ての文字が同じ文字としてみなされるという問題もあった。また、符号化方式が等しくないと文字の一致とみなさない場合、同じ文字が異なる文字とみなされるという問題があった。 When characters that cannot be converted are replaced with substitute codes as in the first embodiment, there is also a problem that all characters replaced with substitute codes are regarded as the same character when collating the converted character strings. In addition, when the encoding methods are not equal, there is a problem that the same character is regarded as a different character when it is not regarded as a character match.
そこで、第2実施例の融合機1は照合を行う文字列の符号化方式を等しい符号化方式に変換させ、置き換えられた代用符号をワイルドカード扱いとすることにより、上記の問題を解決している。
Therefore, the
図15は、文字列の照合について説明するための図である。例えばUTF−8で符号化された FIG. 15 is a diagram for explaining collation of character strings. For example, encoded with UTF-8
[外10]
をShift_JISまたはLatin1で符号化し、再びUTF−8に符号化した文字列は、
[Outside 10]
Is a character string encoded with Shift_JIS or Latin1 and encoded again with UTF-8.
[外11]
に一致していない。そこで、代用符号で表される不明文字をワイルドカード扱いとすることで、
[Outside 11]
Does not match. Therefore, by treating the unknown character represented by the substitute code as a wild card,
[外12]
に完全一致する文字列を照合できる。また、
[Outside 12]
Can be matched with the exact string. Also,
[外13]
に前方一致する文字列も照合できる。また、Windows(登録商標)やMAC(登録商標)などのOSの違いにより、UTF−8では同一の文字に異なる文字コードを例えば図16のように割り当てている。このような例外的な文字を予め図16のようなテーブルに設定しておくことで、本発明の文字列処理方法では異なる文字コードを割り当てられた文字であっても同一の文字としてみなすことができる。なお、図16のテーブルはデータの保持形式の一例であって、例えばXMLなどであってもよい。
[Outside 13]
You can also collate a character string that matches the prefix. Also, due to differences in OS such as Windows (registered trademark) and MAC (registered trademark), UTF-8 assigns different character codes to the same character as shown in FIG. By setting such exceptional characters in the table as shown in FIG. 16 in advance, the character string processing method of the present invention can regard even characters assigned different character codes as the same character. it can. The table in FIG. 16 is an example of a data holding format, and may be XML, for example.
図16は、例外的な文字を設定したテーブルの一例の構成図である。図16のテーブルを利用することで、本発明の文字列処理方法は例外的な文字を含む文字列であっても正確な照合が可能である。なお、本発明の文字列処理方法では大文字および小文字,平仮名および片仮名の関係を例外的な文字と同様、テーブルに設定しておくことで、異なる文字であっても同一の文字としてみなすこともできる。 FIG. 16 is a configuration diagram of an example of a table in which exceptional characters are set. By using the table of FIG. 16, the character string processing method of the present invention can accurately collate even a character string including exceptional characters. In the character string processing method according to the present invention, the relationship between uppercase and lowercase letters, hiragana and katakana is set in a table in the same manner as exceptional characters, so that even different characters can be regarded as the same character. .
図17は、本発明による第2実施例の文字列処理方法について説明するための融合機の構成図である。なお、図17の構成図は説明に必要のない構成を省略している。また、図17の融合機1は図10の融合機1と一部を除いて同様な構成であるため適宜説明を省略する。
FIG. 17 is a block diagram of a compound machine for explaining a character string processing method according to the second embodiment of the present invention. In the configuration diagram of FIG. 17, configurations that are not necessary for description are omitted. 17 has the same configuration as that of the
図17の融合機1は、WebサービスI/F26に文書名の照合要求に応じたSearchのオブジェクト240を備え、また、WebサービスI/F26が利用するキャッシュ250を備えるように構成される。
The
図18は、文字列の照合処理について説明するための一例のフローチャートである。クライアント200から上記の文字列の符号化方式の変換を経て文書名の変更または文書の作成に伴う文書名の設定を指示するか、操作者がオペレーションパネル70を操作して文書名の変更または文書の作成を指示すると、融合機1のOCS33はステップS21に進み、文書名の変更要求または文書の作成要求をMCS36に送信する。
FIG. 18 is a flowchart illustrating an example of character string matching processing. The
ステップS21に続いてステップS22に進み、MCS36は文書名の変更要求または文書の作成要求を受信し、その文書名の変更要求または文書の作成要求に応じて図14のような書誌情報データを変更する。そして、MCS36はファイル変化通知をWebサービスI/F26に送信する。
In step S22 following step S21, the
ファイル変化通知を受信すると、WebサービスI/F26は文書名の照合要求に応じたsearchのオブジェクト240に処理を依頼する。図19は、符号化処理の一例のフローチャートである。
When the file change notification is received, the Web service I /
ステップS31では、受信したファイル変化通知に含まれている文書名が内部処理で利用するShift_JISまたはLatin1等の符号化方式で符号化されているため、UTF−8に変換される。ステップS31に続いてステップS32に進み、オブジェクト240は受信したファイル変化通知に含まれている文書IDをキー情報としてキャッシュ250から該当する文書名を検索して照合する。
In step S31, since the document name included in the received file change notification is encoded by an encoding method such as Shift_JIS or Latin1 used in internal processing, it is converted to UTF-8. Progressing to step S32 following step S31, the
ステップS32に続いてステップS33に進み、オブジェクト240はステップS32での照合結果から、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせるか否かを判定する。
Proceeding to step S33 following step S32, the
UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせると判定すると(S33においてYES)、オブジェクト240は図19の符号化処理を終了する。
If it is determined that the document name converted to UTF-8 matches the document name retrieved from the cache 250 (YES in S33), the
例えばUTF−8に変換された文書名が For example, the document name converted to UTF-8 is
[外14]
であり、キャッシュ250から検索された文書名が
[Outside 14]
The document name retrieved from the
[外15]
である場合、前述したように代用符号で表される不明文字をワイルドカード扱いとすることで、UTF−8に変換された文書名とキャッシュ250から検索された文書名とを一致とみなせる。クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250にまず格納する方式をとれば、クライアント200からの文書名の設定の際に、このような場合が発生する。
[Outside 15]
If the unknown character represented by the substitute code is treated as a wild card as described above, the document name converted to UTF-8 and the document name retrieved from the
一方、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせないと判定すると(S33においてNO)、オブジェクト240はUTF−8に変換された文書名を新しい文書名としてキャッシュ250に格納して図19の符号化処理を終了する。
On the other hand, if it is determined that the document name converted to UTF-8 and the document name retrieved from the
例えばUTF−8に変換された文書名が For example, the document name converted to UTF-8 is
[外16]
であり、キャッシュ250から検索された文書名が
[Outside 16]
The document name retrieved from the
[外17]
である場合、UTF−8に変換された文書名とキャッシュ250から検索された文書名とを一致とみなせない。そこで、オブジェクト240は
UTF−8に変換された文書名
[Outside 17]
, The document name converted to UTF-8 and the document name retrieved from the
[外18]
を新しい文書名としてキャッシュ250に格納する。クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250に格納しない方式をとれば、キャッシュ250から検索された文書名が
[Outside 18]
Is stored in the
[外19]
ではなく
[Outside 19]
not
[外20]
であったりするが、不明文字をワイルドカード扱いとしても
[Outside 20]
Although unknown characters are treated as wild cards
[外21]
とは一致しないので、同様の結果となる。
[Outside 21]
Does not match, so the same result is obtained.
このように、図17の融合機1では文書名の変更があったときに、文書名を内部処理で利用するShift_JISまたはLatin1等からUTF−8に変換している。
As described above, in the
ステップS23では、クライアント200が、XML形式で記述した図20のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。図20は、文書名の検索要求を行うSOAPメッセージの一例の構成図である。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
In step S23, the
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、searchのオブジェクト240に処理を依頼する。
When receiving the HTTP message, the Web service I /
searchのオブジェクト240は、UTF−8で符号化された文字列(検索を行う文書名)を受信すると、その文字列をキー情報としてキャッシュ250から該当する文書名を検索して照合する。オブジェクト240は文字列の照合処理が終了すると、WebサービスI/F26に処理の終了を通知する。
When the
ステップS24では、WebサービスI/F26が、文書名の検索応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
In step S <b> 24, the Web service I /
以上、本発明による第2実施例の文字列処理方法によれば、変換後の文字列を照合するときに、符号化方式の違いによる変換後の文字列の差異を吸収することができる。また、キャッシュ250を利用することにより、変換後の文字列を照合するときに、いちいちMCS36に問い合わせる必要がない。更に、クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250にまず格納する方式を取っておけば、クライアント200からの文書名の検索の際には不明文字を含まない変換前の文字列同士の照合となるので、不明文字をワイルドカード扱いとするよりも検索の精度が高いものとなる。
As described above, according to the character string processing method of the second embodiment of the present invention, when the converted character strings are collated, the difference in the converted character strings due to the difference in the encoding method can be absorbed. Further, by using the
なお、図17ではsearchのオブジェクト240をWebサービスI/F26に設けた例について説明したが、MCS36に設けてもよい。図21は、文字列の照合処理について説明するための一例のフローチャートである。
Note that although an example in which the
クライアント200から上記の文字列の符号化方式の変換を経て文書名の変更または文書の作成に伴う文書名の設定を指示するか、操作者がオペレーションパネル70を操作して文書名の変更または文書の作成を指示すると、融合機1のOCS33はステップS21に進み、文書名の変更要求または文書の作成要求をMCS36に送信する。
The
ステップS21に続いてステップS22に進み、MCS36は文書名の変更要求または文書の作成要求を受信し、その文書名の変更要求または文書の作成要求に応じて図14のような書誌情報データを変更する。そして、MCS36は文書名の照合要求に応じたsearchのオブジェクト240に処理を依頼する。
In step S22 following step S21, the
オブジェクト240は図19のような符号化処理を行い、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせないと判定したときに、UTF−8に変換された文書名を新しい文書名としてキャッシュ250に格納する。
The
このように、図17の融合機1では文書名の変更があったときに、文書名を内部処理で利用するShift_JISまたはLatin1等からUTF−8に変換している。
As described above, in the
ステップS42では、クライアント200が、XML形式で記述した図20のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
In step S42, the
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、ステップS43で文書名の検索要求をMCS36に送信する。MCS36は文書名の検索要求を受信すると、searchのオブジェクト240に処理を依頼する。
When the HTTP message is received, the Web service I /
searchのオブジェクト240は、UTF−8で符号化された文字列(検索を行う文書名)を受信すると、その文字列をキー情報としてキャッシュ250から該当する文書名を検索して照合する。オブジェクト240は文字列の照合処理が終了すると、MCS36に処理の終了を通知する。
When the
ステップS44では、MCS36が、文書名の検索結果をWebサービスI/F26に送信する。ステップS45では、WebサービスI/F26が、文書名の検索応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
In step S44, the
以上、本発明による第2実施例の文字列処理方法によれば、変換後の文字列を照合するときに、符号化方式の違いによる変換後の文字列の差異を吸収することができる。 As described above, according to the character string processing method of the second embodiment of the present invention, when the converted character strings are collated, the difference in the converted character strings due to the difference in the encoding method can be absorbed.
Searchのオブジェクト240をWebサービスI/F26に設けた場合のメリットは、第2実施例の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webサービス対応のためのオプションという構成にできることである。また、Searchのオブジェクト240をMCS36に設けた場合のメリットは、他のI/F(例えばプリンタI/Fなど)でも利用できることである。
The advantage of providing the
前述した第1実施例の融合機1ではキャッシュ250を有していないが、図17の融合機1と同様に、WebサービスI/F26またはMCS36が利用するキャッシュ250を備えるようにしてもよい。
Although the
第1実施例の融合機1でキャッシュ250を備えることにより、変換前の文字列をキャッシュ250に格納しておくことができる。このように、変換前の文字列をキャッシュ250に格納しておくことにより、変換前の文字列を文字列の照合処理に利用することができ、文字列の照合処理の精度を上げることができる。
By providing the
上記の実施例1では、符号化方式の優先順位が固定されている例を説明したが、様々な条件に応じて符号化方式の優先順位が変化するようにしてもよい。そこで、実施例3では様々な条件に応じて符号化方式の優先順位が変化する例を説明する。 In the first embodiment, the example in which the priority order of the encoding scheme is fixed has been described. However, the priority order of the encoding scheme may be changed according to various conditions. Therefore, in the third embodiment, an example in which the priority order of the encoding scheme changes according to various conditions will be described.
図22は、本発明による第3実施例の文字列処理方法について説明するための融合機の構成図である。図23は、本発明による第3実施例の文字列処理方法について説明するためのシーケンス図である。なお、図22及び図23では説明に必要のない構成を省略している。また、図22の構成図は図10の構成図と一部を除いて同様であるため、適宜説明を省略する。 FIG. 22 is a block diagram of a compound machine for explaining a character string processing method according to a third embodiment of the present invention. FIG. 23 is a sequence diagram for explaining the character string processing method according to the third embodiment of the present invention. In FIG. 22 and FIG. 23, configurations that are not necessary for description are omitted. The configuration diagram of FIG. 22 is the same as the configuration diagram of FIG.
ステップS51では、クライアント200のブラウザ201が、URLを指定してhttpリクエストを行う。例えばステップS51で指定されるURLは、「http://111.222.33.44/ja/documentbox/」等である。このURLには、ブラウザ201の表示言語が日本語である例であり、URL中の「ja」で表示言語が日本語に指定されている。ブラウザ201から送信されたHTTPリクエストは、融合機1のNCS31に含まれるhttpd220に供給される。
In step S51, the
ステップS52に進み、httpd220は供給されたhttpリクエストをWebアプリ27に供給する。httpリクエストを受信すると、Webアプリ27はhttpリクエストで指定されているURLからブラウザ201の表示言語を特定し、その表示言語に応じた画面データを生成する。
In step S52, the
ステップS53に進み、Webアプリ27は生成した画面データをhttpd220に供給する。ステップS54に進み、httpd220は供給された画面データをクライアント200のブラウザ201に送信する。
In step S53, the
画面データを受信すると、ブラウザ201はステップS55に進み、画面データに応じた画面を表示する。そして、ユーザはブラウザ201に表示された画面に文字列を入力する。ステップS56に進み、クライアント200のブラウザ201はステップS55で画面に入力された文字列を含むhttpリクエストを行う。ブラウザ201から送信されたhttpリクエストは、融合機1のhttpd220に供給される。
When the screen data is received, the
ステップS57に進み、httpd220は供給されたhttpリクエストをWebアプリ27に供給する。httpリクエストを受信すると、Webアプリ27はステップS58に進み、httpリクエストに含まれる文字列を取得してsetTitleのオブジェクト230に処理を依頼する。
In step S57, the
まず、setTitleのオブジェクト230は、内部処理で利用する符号化方式以外の文字列を受信した場合、その文字列を内部処理で利用する符号化方式に変換する必要がある。そこで、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば前述した図12のようなフローチャートで表す処理を実行する。
First, when the
なお、実施例3の場合、図12のステップS11の処理が実施例1の場合と異なる。オブジェクト230は、符号化方式の優先順位を次のように決定し、その優先順位に従って符号化方式を選択する。優先順位の決定は、次のように行う。まず、ブラウザ201の表示言語に対応する符号化方式は、上位の優先順位とする。オペレーションパネル70の表示言語に対応する符号化方式は、中位の優先順位とする。そして、それ以外の符号化方式は、下位の優先順位とする。この場合の優先順位は、ブラウザ201の表示言語に対応する符号化方式、オペレーションパネル70の表示言語に対応する符号化方式、それ以外の符号化方式となる。
In the case of the third embodiment, the process in step S11 in FIG. 12 is different from that in the first embodiment. The
ステップS11以外の処理は、実施例1の場合と同様であるため説明を省略する。図12のフローチャートにより最適な符号化方式を選択したあと、オブジェクト230は選択した符号化方式で文字列を符号化する。なお、オブジェクト230は、符号化できない文字を代用文字に置き換える。
Since the processes other than step S11 are the same as those in the first embodiment, description thereof is omitted. After selecting the optimum encoding method according to the flowchart of FIG. 12, the
そして、ステップS59に進み、Webアプリ27はステップS57のhttpリクエストに対応する画面データを作成し、その画面データをhttpd220に供給する。ステップS54に進み、httpd220は供給された画面データをクライアント200のブラウザ201に送信する。
In step S59, the
以上、本発明による第3実施例の文字列処理方法によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、様々な条件に応じて符号化方式の優先順位を変化させることができるので、適切な符号化方式を選択することができる。 As described above, according to the character string processing method of the third embodiment of the present invention, when a character string encoded by one encoding method is converted into another encoding method, encoding is performed according to various conditions. Since the priority order of the methods can be changed, an appropriate encoding method can be selected.
なお、図22ではsetTitleのオブジェクト230をWebアプリ27に設けた例について説明したが、MCS36に設けてもよい。setTitleのオブジェクト230をWebアプリ27に設けた場合のメリットは、実施例3の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webアプリ27のオプションという構成にできることである。また、setTitleのオブジェクト230をMCS36に設けた場合のメリットは、他のアプリ(例えばプリンタアプリなど)でも利用できることである。
In addition, although the example which provided the
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。 The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.
1 融合機
2 ソフトウェア群
3 融合機起動部
4 ハードウェア資源
5 アプリケーション層
6 プラットフォーム
9 コントロールサービス層
10 ハンドラ層
11 白黒レーザプリンタ(B&W LP)
12 カラーレーザプリンタ(Color LP)
13 ハードウェアリソース
21 プリンタアプリ
22 コピーアプリ
23 ファックスアプリ
24 スキャナアプリ
25 ネットファイルアプリ
26 WebサービスI/F
27 Webアプリ
31 ネットワークコントロールサービス(NCS)
32 デリバリーコントロールサービス(DCS)
33 オペレーションパネルコントロールサービス(OCS)
34 ファックスコントロールサービス(FCS)
35 エンジンコントロールサービス(ECS)
36 メモリコントロールサービス(MCS)
37 ユーザインフォメーションコントロールサービス(UCS)
38 システムコントロールサービス(SCS)
39 システムリソースマネージャ(SRM)
40 ファックスコントロールユニットハンドラ(FCUH)
41 イメージメモリハンドラ(IMH)
51 アプリケーションプログラムインターフェース(API)
52 エンジンI/F
60 コントローラ
61 CPU
62 システムメモリ
63 ノースブリッジ(NB)
64 サウスブリッジ(SB)
65 AGP(Accelerated Graphics Port)
66 ASIC
67 ローカルメモリ
68 ハードディスク装置(HDD)
69 ネットワークI/Fコントローラ
70 オペレーションパネル
80 ファックスコントロールユニット(FCU)
90 USBデバイス
100 IEEE1394デバイス
110 エンジン部
200 クライアント
201 ブラウザ
210 ネットワーク
220 httpd(HyperText Transfer Protocol Daemon)
230 setTitleのオブジェクト
240 Searchのオブジェクト
DESCRIPTION OF
12 Color laser printer (Color LP)
13
27
32 Delivery Control Service (DCS)
33 Operation Panel Control Service (OCS)
34 Fax Control Service (FCS)
35 Engine Control Service (ECS)
36 Memory Control Service (MCS)
37 User Information Control Service (UCS)
38 System Control Service (SCS)
39 System Resource Manager (SRM)
40 Fax Control Unit Handler (FCUH)
41 Image memory handler (IMH)
51 Application Program Interface (API)
52 Engine I / F
60
62
64 South Bridge (SB)
65 AGP (Accelerated Graphics Port)
66 ASIC
67
69 Network I /
90
230
Claims (6)
前記内部符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段と、
前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列を格納している格納手段と
を有し、
前記文字列照合手段は、前記内部符号化方式で符号化された文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記格納手段に格納している前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列と、前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列とが一致とみなせなければ、前記前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列を前記格納手段に格納すること
を有することを特徴とする文字列処理装置。 In a character string processing device that collates a character string encoded by an internal encoding method used in internal processing, using a character string encoded by one encoding method,
When the character string encoded by the internal encoding method is converted to the one encoding method, and the converted character string is collated using the character string encoded by the one encoding method, A character string matching means that handles the substitute code included in the converted character string as a character having a role of representing all characters ,
Storage means for storing a character string encoded by the one encoding method before being encoded by the inner encoding method;
Have
The character string collating means stores the character string encoded by the internal encoding method using the character string encoded by the one encoding method and stores it in the storage means. The character string encoded by the one encoding method before being encoded by the inner encoding method and the character string encoded by the one encoding method converted from the character string encoded by the inner encoding method If the encoded character string cannot be regarded as a match, the character string encoded by the one encoding method converted from the character string encoded by the inner encoding method is stored in the storage means. character string processing apparatus characterized by having a <br/> that.
前記内部符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段と、
前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列を格納している格納手段と
を有し、
前記文字列照合手段は、前記内部符号化方式で符号化された文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記格納手段に格納している前記内部符号化方式で符号化される前の前記一の符号化方式で符号化された文字列と、前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列とが一致とみなせなければ、前記前記内部符号化方式で符号化された文字列から変換された前記一の符号化方式で符号化された文字列を前記格納手段に格納すること
を有することを特徴とする画像形成装置。 An image forming apparatus having a character string collating function for collating a character string encoded by an internal encoding method used in internal processing using a character string encoded by one encoding method,
When the character string encoded by the internal encoding method is converted to the one encoding method, and the converted character string is collated using the character string encoded by the one encoding method, A character string matching means that handles the substitute code included in the converted character string as a character having a role of representing all characters ,
Storage means for storing a character string encoded by the one encoding method before being encoded by the inner encoding method;
Have
The character string collating means stores the character string encoded by the internal encoding method using the character string encoded by the one encoding method and stores it in the storage means. The character string encoded by the one encoding method before being encoded by the inner encoding method and the character string encoded by the one encoding method converted from the character string encoded by the inner encoding method If the encoded character string cannot be regarded as a match, the character string encoded by the one encoding method converted from the character string encoded by the inner encoding method is stored in the storage means. an image forming apparatus wherein a <br/> that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009061613A JP5030985B2 (en) | 2003-01-24 | 2009-03-13 | Character string processing apparatus and image forming apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003016427 | 2003-01-24 | ||
JP2003016427 | 2003-01-24 | ||
JP2009061613A JP5030985B2 (en) | 2003-01-24 | 2009-03-13 | Character string processing apparatus and image forming apparatus |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004004123A Division JP4308676B2 (en) | 2003-01-24 | 2004-01-09 | Character string processing apparatus, character string processing method, and image forming apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009146439A JP2009146439A (en) | 2009-07-02 |
JP5030985B2 true JP5030985B2 (en) | 2012-09-19 |
Family
ID=38906503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009061613A Expired - Fee Related JP5030985B2 (en) | 2003-01-24 | 2009-03-13 | Character string processing apparatus and image forming apparatus |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5030985B2 (en) |
CN (1) | CN101079023B (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169480B (en) * | 2011-03-31 | 2012-08-29 | 西北工业大学 | Method for coding multi-level character string sequence |
JP6491438B2 (en) * | 2014-08-29 | 2019-03-27 | 株式会社日立社会情報サービス | Migration support device |
CN105988977A (en) * | 2015-02-16 | 2016-10-05 | 珠海金山办公软件有限公司 | Character code identification result display method and apparatus |
CN107918542B (en) * | 2017-11-23 | 2022-02-08 | 北京恒华伟业科技股份有限公司 | Character string generation method and device |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05128169A (en) * | 1991-10-31 | 1993-05-25 | Toshiba Corp | Image retrieval device |
US5309358A (en) * | 1992-02-18 | 1994-05-03 | International Business Machines Corporation | Method for interchange code conversion of multi-byte character string characters |
JP2758826B2 (en) * | 1994-03-02 | 1998-05-28 | 株式会社リコー | Document search device |
JPH11328160A (en) * | 1998-05-13 | 1999-11-30 | Toshiba Corp | Device and method for character code conversion processing and storage medium where character code conversion processing program is recorded |
JP2001195287A (en) * | 2000-01-17 | 2001-07-19 | Mitsubishi Electric Corp | Method for sharing data base |
JP2002245033A (en) * | 2001-02-15 | 2002-08-30 | Toshiba Corp | Portable electronic equipment and character string display method therefor |
DE10112587A1 (en) * | 2001-03-15 | 2002-09-26 | Siemens Ag | Computer-assisted determination of similarity between character strings by describing similarly in terms of conversion cost values |
JP2002358299A (en) * | 2001-06-01 | 2002-12-13 | Brother Ind Ltd | Apparatus and program for document processing |
-
2004
- 2004-01-24 CN CN2006101640551A patent/CN101079023B/en not_active Expired - Fee Related
-
2009
- 2009-03-13 JP JP2009061613A patent/JP5030985B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009146439A (en) | 2009-07-02 |
CN101079023A (en) | 2007-11-28 |
CN101079023B (en) | 2012-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4308676B2 (en) | Character string processing apparatus, character string processing method, and image forming apparatus | |
US9405495B2 (en) | Image forming apparatus and scanned data process method | |
US8656277B2 (en) | Image processing apparatus, and method for controlling the same | |
JP4756930B2 (en) | Document management system, document management method, image forming apparatus, and information processing apparatus | |
JP4405793B2 (en) | Document management system, control method therefor, and recording medium | |
US20090284779A1 (en) | Image processing system, image processing method, image processing apparatus and control method thereof | |
JP2009020822A (en) | File transmission device, method, program and file version control system | |
US8730495B2 (en) | Image processing system | |
US20070083508A1 (en) | Document search apparatus and method | |
JP5030985B2 (en) | Character string processing apparatus and image forming apparatus | |
US20030133151A1 (en) | Print system | |
JP4435582B2 (en) | Image processing apparatus, data search method, and data search program | |
JP4435578B2 (en) | Image processing apparatus, data search method, and data search program | |
JP4440576B2 (en) | Image forming apparatus, usage authentication information issuing method, and usage authentication information issuing system | |
JP2012243286A (en) | Information processing device, document data update method and computer program | |
JP2005094358A (en) | Image processor, user information acquisition method, and user information providing method | |
JP4162554B2 (en) | Image forming apparatus, usage authentication information issuing method, and usage authentication information issuing system | |
JP2004303205A (en) | Image forming apparatus with stored document information editable by external device, and document service providing method | |
JP4181945B2 (en) | Image forming apparatus, stored document processing method, and stored document processing system | |
JP2008310774A (en) | Information processor, its control method, and computer program | |
JP3742395B2 (en) | Image forming apparatus, thumbnail printing method, thumbnail output method, thumbnail printing system, and thumbnail output system | |
JP2008048427A (en) | Image processing apparatus, and user information acquisition method | |
JP4457635B2 (en) | Image recording apparatus and control method thereof | |
JP2002218150A (en) | Print system | |
JP2011055183A (en) | Image forming apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120529 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5030985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |