JP2004246870A - 文字列処理装置,文字列処理方法および画像形成装置 - Google Patents

文字列処理装置,文字列処理方法および画像形成装置 Download PDF

Info

Publication number
JP2004246870A
JP2004246870A JP2004004123A JP2004004123A JP2004246870A JP 2004246870 A JP2004246870 A JP 2004246870A JP 2004004123 A JP2004004123 A JP 2004004123A JP 2004004123 A JP2004004123 A JP 2004004123A JP 2004246870 A JP2004246870 A JP 2004246870A
Authority
JP
Japan
Prior art keywords
character string
encoding method
encoding
character
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004004123A
Other languages
English (en)
Other versions
JP4308676B2 (ja
Inventor
Toru Matsuda
透 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004004123A priority Critical patent/JP4308676B2/ja
Priority to US10/758,219 priority patent/US7199730B2/en
Priority to EP04250391A priority patent/EP1441291B1/en
Priority to CNB2004100052873A priority patent/CN100399705C/zh
Priority to CN2006101640551A priority patent/CN101079023B/zh
Publication of JP2004246870A publication Critical patent/JP2004246870A/ja
Priority to US11/675,894 priority patent/US7477167B2/en
Application granted granted Critical
Publication of JP4308676B2 publication Critical patent/JP4308676B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、適切な符号化方式を選択することができ、変換後の符号化方式で表現された文字列を適切に扱うことが可能な文字列処理装置,文字列処理方法および画像形成装置を提供することを目的とする。
【解決手段】 一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理装置1において、複数の符号化方式を選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を複数の符号化方式ごとに取得して、数情報および位置情報の少なくとも一方に基づき他の符号化方式を決定する符号化方式決定手段230を有することにより上記課題を解決する。
【選択図】 図10

Description

本発明は、文字列処理装置,文字列処理方法および画像形成装置に係り、特に一の符号化方式(文字コード・セット)で符号化された文字列を他の符号化方式に変換する文字列処理装置,文字列処理方法および画像形成装置に関する。
符号化方式は、文字や記号など(以下、単に文字という)をコンピュータ上で扱うため、文字に割り当てられている文字コードに変換するものである。この符号化方式は、言語やコンピュータシステムにより異なるのが普通である。例えばインターネットでは、世界の主要言語に対応するためUnicodeを利用したUTF−8,UTF−16などが標準的な符号化方式として利用されている。また、文字列処理装置および画像形成装置などでは、シフトJISやLatin1等が符号化方式として利用されている。
複数の符号化方式を利用可能な文字列処理装置は、必要に応じて一の符号化方式で符号化された文字列を他の符号化方式に変換する。なお、画像形成装置はフォントROMの容量を節約するため、ユーザインターフェースに必要十分な少数の符号化方式を販売先の言語に応じて用意している。
従来、インターネットなどのネットワークに接続した文字列処理装置および画像形成装置は、ネットワーク側から例えばUnicodeで表現された文字列を含む要求(例えば、文書名の変更要求など)を受信すると、その文字列を内部処理で利用する符号化方式に変換していた。特許文献1には、一の符号化方式で符号化された文字列を他の符号化方式に変換する内容が記載されている。
特表平11−512543号
通常、文字列処理装置および画像形成装置は複数の符号化方式が利用可能であるため、利用する符号化方式を選択する必要があった。しかしながら、符号化方式で表現可能な文字の集合は符号化方式ごとに異なっており、変換前の符号化方式で表現可能な文字が変換後の符号化方式で表現可能な文字であるとは限らない。したがって、変換前の符号化方式と変換後の符号化方式との組み合わせによっては、全ての文字列を完全に変換できない場合があるという問題があった。
例えばUnicodeで表現可能な文字の集合は、文字列処理装置および画像形成装置が内部処理で利用するシフトJISやLatin1等の符号化方式で表現可能な文字の集合に全て包含されているとは限らない。したがって、Unicodeで表現可能な文字であっても、内部処理で利用する符号化方式で変換可能であるとは限らないという問願があった。
以上のように、従来の文字列処理装置および画像形成装置は、一の符号化方式で符号化された文字列をどの符号化方式に変換するかで、変換できない文字の数が異なるため、符号化方式の選択が重要であった。また、従来の文字列処理装置および画像形成装置は、変換後の文字列を照合するとき等に、変換できなかった文字の扱いが重要であった。さらに、いくつかの符号化方式では、同一の文字に異なる文字コードを割り当てており、このような例外的な文字の扱いも重要であった。
本発明は、上記の点に鑑みなされたもので、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、適切な符号化方式を選択することができ、変換後の符号化方式で表現された文字列を適切に扱うことが可能な文字列処理装置,文字列処理方法および画像形成装置を提供することを目的とする。
そこで、上記課題を解決するため、本発明は、一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理装置において、前記複数の符号化方式を選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得して、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する符号化方式決定手段を有することを特徴とする。
また、本発明は、一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列処理装置において、前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段を有することを特徴とする。
また、本発明は、一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理方法において、前記複数の符号化方式を選択する段階と、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得する段階と、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する段階とを有することを特徴とする。
また、本発明は、一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列処理方法において、前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換する段階と、前記変換した文字列に含まれる代用符号を全ての文字を表す役割をもった文字として扱って、前記変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合する段階とを有することを特徴とする。
また、本発明は、一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理機能を有した画像形成装置であって、前記複数の符号化方式を選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得して、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する符号化方式決定手段を有することを特徴とする。
また、本発明は、一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列照合機能を有した画像形成装置であって、前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段を有することを特徴とする。
本発明では、一の符号化方式で符号化された文字列を他の符号化方式の文字列に変換するときに、代用符号の数情報および位置情報の少なくとも一方に基づいて符号化方式を決定する。また、本発明では他の符号化方式に変換した文字列に含まれる代用符号を、全ての文字を表す役割ともった文字(ワイルドカード)として扱う。
上述の如く、本発明によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、適切な符号化方式を選択することができ、変換後の符号化方式で表現された文字列を適切に扱うことが可能な文字列処理装置,文字列処理方法および画像形成装置を提供することができる。
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。
まず、本発明の理解を容易とするために、本発明の原理について図1〜7を参照しつつ説明する。図1〜6は、符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。また、図7は文字に割り当てられている文字コードを符号化方式ごとに表したルックアップテーブルである。
図1〜図6では、Ωが全ての文字の集合を表し、Aが符号化方式aで符号化可能な文字の集合を表し、Bが符号化方式bで符号化可能な文字の集合を表し、Cが符号化方式bで符号化可能な文字の集合を表している。
図1は、符号化方式b又はcで符号化可能な文字の集合B∪Cが、符号化方式aで符号化可能な文字の集合Aに包含されていることを表している。例えば符号化方式aがUTF−8,符号化方式bがShift_JIS,符号化方式cがLatin1であるのときに、図1のような関係を有する。なお、符号化方式がUTF−8,Shift_JIS,Latin1のときのルックアップテーブルは図7のように表される。
図2は、符号化方式a,b及びcで符号化可能な文字の集合A∩B∩Cが、斜線で表されている。例えば図7のルックアップテーブルでは、文字「1」が図2の斜線部分に含まれる。図2の斜線部分に含まれる文字は、一の符号化方式から他の符号化方式に変換できる。
図3は、符号化方式a,bで符号化可能かつ符号化方式cで符号化できない文字の集合A∩B−Cが、斜線で表されている。例えば図7のルックアップテーブルでは、文字「円」が図3の斜線部分に含まれる。図3の斜線部分に含まれる文字は、一の符号化方式から符号化方式cに変換できない。
本発明では、図3の斜線部分に含まれている文字を符号化方式cに変換する場合、その文字を代用符号に置き換える。代用符号には、文字が割り当てられていない文字コードを用いる。
例えば代用符号は、文字を1バイトで表現可能な符号化方式を2バイトに拡張した文字コードを用いることが考えられる。また、代用符号は文字が割り当てられていない隙間の文字コードを用いることが考えられる。さらに、文字列処理装置や画像形成装置などで用いない例えば「字削除」の制御文字を用いることも考えられる。
図4は、符号化方式a,cで符号化可能かつ符号化方式bで符号化できない文字の集合A∩C−Bが、斜線で表されている。例えば図7のルックアップテーブルでは、文字
[外1]
Figure 2004246870
が図4の斜線部分に含まれる。図4の斜線部分に含まれる文字は、一の符号化方式から符号化方式bに変換できない。本発明では、図4の斜線部分に含まれている文字を符号化方式bに変換する場合、その文字を代用符号に置き換える。
図5は、符号化方式aで符号化可能かつ符号化方式b,cで符号化できない文字の集合A−(B∪C)が、斜線で表されている。例えば図7のルックアップテーブルでは、文字
[外2]
Figure 2004246870
が図5の斜線部分に含まれる。図5の斜線部分に含まれる文字は、一の符号化方式から符号化方式b,cに変換できない。本発明では、図5の斜線部分に含まれている文字を符号化方式b,cに変換する場合、その文字を代用符号に置き換える。
図6は、符号化方式a,b,cで符号化できない文字の集合
[外3]
Figure 2004246870
が、斜線で表されている。図6の斜線部分に含まれる文字は、一の符号化方式から符号化方式a,b,cに変換できない。もっとも、符号化方式aに変換できない文字が文字コードで表現されているなら、最初から代用符号になっているものと考えられる。したがって、本発明では図6の斜線部分に含まれている文字を符号化方式b,cに変換する場合、符号化方式aの代用符号を符号化方式b,cの代用符号に置き換える。代用符号に置き換えられた文字は、例えばオペレーションパネルなどの操作画面に不明文字として「□」で表示される。
本発明の文字列処理装置は、複数の符号化方式が利用可能であるとき、代用符号に置き換えた文字の数,代用符号に置き換えた文字の位置および符号化方式の優先度により、後述するように符号化方式を選択する。
以下、本発明の文字列処理方法を利用する文字列処理装置の一例として画像形成装置の処理を中心に説明するが、一の符号化方式で符号化された文字列を他の符号化方式に変換する如何なる装置であってもよい。
なお、本実施例で説明する画像形成装置は、プリンタ,コピー,ファクシミリおよびスキャナなどの各装置の機能を1つの筐体内に収納しているため、融合機とも呼ばれる。
この融合機は、1つの筐体内に表示部,印刷部および撮像部などを設けると共に、プリンタ,コピー,ファクシミリおよびスキャナにそれぞれ対応する4種類のソフトウェアを設け、そのソフトウェアを切り替えることより、プリンタ,コピー,ファクシミリおよびスキャナとして動作させるものである。
図8は、本発明による融合機の一実施例の構成図である。融合機1は、ソフトウェア群2と,融合機起動部3と,ハードウェア資源4とを含むように構成される。
融合機起動部3は融合機1の電源投入時に最初に実行され、アプリケーション層5およびプラットフォーム6を起動する。例えば融合機起動部3は、アプリケーション層5およびプラットフォーム6のプログラムをハードディスク装置(以下、HDDという)などから読み出し、読み出した各プログラムをメモリ領域に転送して起動する。
ハードウェア資源4は、白黒レーザプリンタ(B&W LP)11と,カラーレーザプリンタ(Color LP)12と,スキャナやファクシミリなどのその他のハードウェアリソース13とを含む。
また、ソフトウェア群2は、UNIX(登録商標)などのオペレーティングシステム(以下、OSという)上に起動されているアプリケーション層5とプラットフォーム6とを含む。アプリケーション層5は、プリンタ,コピー,ファックスおよびスキャナなどの画像形成にかかるユーザサービスにそれぞれ固有の処理を行うプログラムを含む。
アプリケーション層5は、プリンタアプリ21と,コピーアプリ22と,ファックスアプリ23と,スキャナアプリ24と,WEBサービスインターフェース(以下、WEBサービスI/Fという)26とを含む。
プラットフォーム6は、アプリケーション層5からの処理要求を解釈してハードウェア資源4の獲得要求を発生するコントロールサービス層9と、1つ以上のハードウェア資源4の管理を行ってコントロールサービス層9からの獲得要求を調停するシステムリソースマネージャ(以下、SRMという)39と、SRM39からの獲得要求に応じてハードウェア資源4の管理を行うハンドラ層10とを含む。
コントロールサービス層9は、ネットワークコントロールサービス(以下、NCSという)31,デリバリーコントロールサービス(以下、DCSという)32,オペレーションパネルコントロールサービス(以下、OCSという)33,ファックスコントロールサービス(以下、FCSという)34,エンジンコントロールサービス(以下、ECSという)35,メモリコントロールサービス(以下、MCSという)36,ユーザ情報コントロールサービス(以下、UCSという)37,システムコントロールサービス(以下、SCSという)38など、一つ以上のサービスモジュールを含むように構成されている。
なお、プラットフォーム6は予め定義されている関数により、アプリケーション層5からの処理要求を受信するアプリケーションプログラムインターフェース(以下、APIという)51を含むように構成されている。OSは、アプリケーション層5およびプラットフォーム6の各ソフトウェアをプロセスとして並列実行する。
NCS31のプロセスは、ネットワーク側から各プロトコルによって受信したデータを各アプリケーションに振り分けたり、各アプリケーションからのデータをネットワーク側に送信する際の仲介を行う。
例えばNCS31のプロセスは、ネットワークを介して接続されるクライアントとのデータ通信を例えばhttpd(HyperText Transfer Protocol Daemon)により、HTTP(HyperText Transfer Protocol)で制御する。
DCS32のプロセスは、蓄積文書の配送などの制御を行う。OCS33のプロセスは、オペレーションパネルの制御を行う。FCS34のプロセスは、アプリケーション層5からPSTN,ISDN網を利用したファックス送受信,バックアップ用のメモリで管理されている各種ファックスデータの登録/引用,ファックス読み取り,ファックス受信印刷などを行うためのAPIを提供する。
ECS35のプロセスは、白黒レーザプリンタ11,カラーレーザプリンタ12,ハードウェアリソース13などのエンジン部の制御を行う。MCS36のプロセスは、メモリの取得および解放,HDDの利用,画像データの圧縮および伸張などのメモリ制御を行う。UCS37のプロセスは、ユーザ情報の管理を行うものである。
SCS38のプロセスは、アプリケーション管理,操作部制御,システム画面表示,LED表示,ハードウェア資源管理,割り込みアプリケーション制御などの処理を行う。
SRM39のプロセスは、SCS38と共にシステムの制御およびハードウェア資源4の管理を行うものである。例えばSRM39のプロセスは、白黒レーザプリンタ11やカラーレーザプリンタ12などのハードウェア資源4を利用する上位層からの獲得要求に従って調停を行い、実行制御する。
具体的に、SRM39のプロセスは獲得要求されたハードウェア資源4が利用可能であるか(他の獲得要求により利用されていないかどうか)を判定し、利用可能であれば獲得要求されたハードウェア資源4が利用可能である旨を上位層に通知する。また、SRM39のプロセスは上位層からの獲得要求に対してハードウェア資源4を利用するためのスケジューリングを行い、要求内容(例えば、プリンタエンジンによる紙搬送と作像動作,メモリ確保,ファイル生成など)を直接実施している。
また、ハンドラ層10は後述するファックスコントロールユニット(以下、FCUという)の管理を行うファックスコントロールユニットハンドラ(以下、FCUHという)40と、プロセスに対するメモリの割り振り及びプロセスに割り振ったメモリの管理を行うイメージメモリハンドラ(以下、IMHという)41とを含む。
SRM39,FCUH40およびIMH41は、予め定義されている関数によりハードウェア資源4に対する処理要求を送信するエンジンI/F52を利用してハードウェア資源4に対する処理要求を行う。
図8のような構成により、融合機1は各アプリケーションで共通的に必要な処理をプラットフォーム6で一元的に処理することができる。
次に、融合機1のハードウェア構成について説明する。図9は、本発明による融合機の一実施例のハードウェア構成図である。融合機1は、コントローラ60と,オペレーションパネル70と,FCU80と,USBデバイス90と,IEEE1394デバイス100と,エンジン部110とを含む。
また、コントローラ60は、CPU61と,システムメモリ62と,ノースブリッジ(以下、NBという)63と,サウスブリッジ(以下、SBという)64と,ASIC66と,ローカルメモリ67と,HDD68,ネットワークI/Fコントローラ69とを含む。
オペレーションパネル70は、コントローラ60のASIC66に接続されている。また、FCU80,USBデバイス90,IEEE1394デバイス100およびエンジン部110は、コントローラ60のASIC66にPCIバスで接続されている。
コントローラ60は、ASIC66にローカルメモリ67,HDD68,ネットワークI/Fコントローラ69などが接続されると共に、CPU61とASIC66とがCPUチップセットのNB63を介して接続されている。NB63を介してCPU61とASIC66とを接続すれば、CPU61のI/Fが公開されていない場合に対応できる。
なお、ASIC66とNB63とは、PCIバスを介して接続されているのでなく、AGP(Accelerated Graphics Port )65を介して接続されている。このように、図8のアプリケーション層5やプラットフォーム6を形成する一つ以上のプロセスを実行制御するため、ASIC66とNB63とを低速のPCIバスでなくAGP65を介して接続し、パフォーマンスの低下を防いでいる。
CPU61は、融合機1の全体制御を行うものである。CPU61は、NCS31,DCS32,OCS33,FCS34,ECS35,MCS36,UCS37,SCS38,SRM39,FCUH40およびIMH41をOS上にそれぞれプロセスとして起動して実行させると共に、アプリケーション層111を形成するプリンタアプリ21,コピーアプリ22,ファックスアプリ23,スキャナアプリ24,ネットファイルアプリ25,WEBサービスI/F26を起動して実行させる。
NB63は、CPU61,システムメモリ62,SB64およびASIC66を接続するためのブリッジである。システムメモリ62は、融合機1の描画用メモリ等として用いるメモリである。SB64は、図示していないROM,PCIバス,周辺デバイス等とNB63とを接続するためのブリッジである。
ローカルメモリ67はコピー用画像バッファ,符号バッファとして用いるメモリである。ASIC66は、画像処理用のハードウェア要素を有する画像処理用途向けのICである。HDD68は、画像データの蓄積,文書データの蓄積,プログラムの蓄積,フォントデータの蓄積,フォームの蓄積などを行うためのストレージである。また、オペレーションパネル70は、ユーザからの入力操作を受け付けると共に、ユーザに向けた表示を行う操作部である。
以下、ネットワークを介して接続されたクライアントから文字列を含む要求(文書名や作者名の変更,照合)を受信したときの融合機1の処理について説明していく。
図10は、本発明による第1実施例の文字列処理方法について説明するための融合機の構成図である。なお、図10の構成図は説明に必要のない構成を省略している。
図10では、融合機1にインターネット,LANなどのネットワーク210を介してクライアント200が接続されている。クライアント200と融合機1とは、XML(eXtensible Markup Language)形式でデータ交換を行う。なお、クライアント200と融合機1とは、例えばデータ・アクセス・プロトコルとしてSOAP(Simple Object Access Protocol)と呼ばれる通信プロトコル規格を利用する。
ステップS1では、クライアント200が、XML形式で記述した図11のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。図11は、文書名の変更要求を行うSOAPメッセージの一例の構成図である。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、文書名の変更要求に応じたsetTitleのオブジェクト230に処理を依頼する。
まず、setTitleのオブジェクト230は、内部処理で利用する符号化方式以外の文字列(変更後の文書名)を受信すると、その文字列を内部処理で利用する符号化方式に変換する必要がある。ここでは、UTF−8で符号化された文字列をShift_JISまたはLatin1で符号化された文字列に変換する例を説明する。
WebサービスI/F26から処理を依頼されると、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば図12のようなフローチャートで表す処理を実行する。
図12は、符号化方式決定処理の一例のフローチャートである。図13はUTF−8,Shift_JISおよびLatin1の文字コードの割り当てを表した一例のルックアップテーブルである。
ステップS11では、オブジェクト230は融合機1で利用可能な符号化方式のリストを例えばHDD68などから取得し、最初の符号化方式として例えばShift_JISを選択する。なお、符号化方式のリストはランダムに並んだものであってもよいし、優先度順に並んだものであってもよい。
ステップS11に続いてステップS12に進み、オブジェクト230は符号化方式を変更する文字列
[外4]
Figure 2004246870
をステップS11で選択したShift_JISで符号化する。図13のルックアップテーブルを参照すると、符号化方式Shift_JISでは文字
[外5]
Figure 2004246870
が変換できない。ステップS12に続いてステップS13に進み、オブジェクト230はステップS12で符号化した結果、符号化方式を変更する文字列がステップS11で選択したShift_JISで所定基準以上の符号化が可能であるか否かを判定する。例えば所定基準としては、完全な符号化であってもよいし、選択した符号化方式で変換できない文字の数が所定数以下であってもよい。ここでは、所定基準が完全な符号化である例を説明する。
この場合、Shift_JISで完全に符号化が可能ではないので(S13においてNO)、オブジェクト230はステップS14に進む。なお、ステップS11で選択した符号化方式で完全に符号化が可能であれば(S13においてYES)、オブジェクト230はステップS11で選択した符号化方式に決定して処理を終了する。
ステップS14では、オブジェクト230が、ステップS12で符号化した結果から、代用文字に置き換える文字の数および文字の位置を例えばシステムメモリ62に記憶する。この場合、オブジェクト230は代用文字に置き換える文字の数「1」および文字の位置「最初から2番目」を記憶する。
ステップS14に続いてステップS15に進み、オブジェクト230は符号化方式のリストから選択されていない符号化方式があるか否かを判定する。この場合、Latin1が選択されていないので(S15においてYES)、オブジェクト230はステップS16に進む。
ステップS15に続いてステップS16に進み、オブジェクト230は符号化方式のリストからShift_JISの次のLatin1を選択してステップS12に戻る。ステップS12では、オブジェクト230が符号化方式を変更する文字列
[外6]
Figure 2004246870
をステップS16で選択したLatin1で符号化する。図13のルックアップテーブルから、符号化方式Latin1では文字「作」が変換できないことが分かる。ステップS12に続いてステップS13に進み、オブジェクト230はステップS12で符号化した結果、符号化方式を変更する文字列がステップS16で選択したLatin1で完全に符号化可能であるか否かを判定する。
この場合、Latin1で完全に符号化が可能ではないので(S13においてNO)、オブジェクト230はステップS14に進む。ステップS14では、オブジェクト230が、ステップS12で符号化した結果から、代用文字に置き換える文字の数および文字の位置を例えばシステムメモリ62に記憶する。この場合、オブジェクト230は代用文字に置き換える文字の数「1」および文字の位置「最初から5番目」を記憶する。
ステップS14に続いてステップS15に進み、オブジェクト230は符号化方式のリストから選択されていない符号化方式があるか否かを判定する。この場合、全ての符号化方式が選択されているので(S15においてNO)、オブジェクト230はステップS18に進む。
ステップS18では、オブジェクト230が、ステップS14で記憶した代用文字に置き換える文字の数,文字の位置などを用いて、所定条件に基づき最適な符号化方式を決定して処理を終了する。
例えばステップS18では、代用文字に置き換える文字の数が一番少ない符号化方式を最適な符号化方式として決定できる。また、代用文字に置き換える文字が連続して出現する回数が一番少ない符号化方式を最適な符号化方式として決定することもできる。また、代用文字に置き換える文字の最初の出現位置が一番後ろの符号化方式を最適な符号化方式として決定することもできる。
また、代用文字に置き換える文字の平均の出現位置が一番後ろの符号化方式を最適な符号化方式として決定することもできる。また、符号化方式のリスト中で先に現れる符号化方式を最適な符号化方式として決定することもできる。
さらに、上記のような符号化方式の決定を2つ以上組み合わせるか、ポイント制にすることにより、最適な符号化方式を決定することもできる。例えば代用文字に置き換える文字の数が一番少なく、且つ代用文字に置き換える文字の最初の出現位置が一番後ろの符号化方式を最適な符号化方式として決定する場合、
[外7]
Figure 2004246870
を符号化する符号化方式としてLatin1が選択される。なお、代用文字に置き換える文字の数が一番少ない符号化方式を最適な符号化方式として決定すると共に、代用文字に置き換える文字の数が同じ場合に符号化方式のリスト中で先に現れる符号化方式を最適な符号化方式として決定することもできる。
図12のフローチャートにより最適な符号化方式を選択したあと、オブジェクト230は選択した符号化方式で文字列
[外8]
Figure 2004246870
を符号化する。オブジェクト230は、符号化できない文字を代用文字に置き換える。例えば
[外9]
Figure 2004246870
をLatin1で符号化した場合、最初から5番目の「作」が代用文字に置き換えられる。そして、オブジェクト230はステップS2に進み、符号化した文字列を用いてMCS36に文書名の変更要求を行う。MCS36は例えば図14のような形式の書誌情報データをHDD68等に格納しており、オブジェクト230からの文書名の変更要求に応じて書誌情報データを更新する。
そして、ステップS2に続いてステップS3に進み、MCS36は文書名の変更応答をオブジェクト230に送信する。オブジェクト230は文書名の変更応答を受信すると、WebサービスI/F26に処理の終了を通知する。
ステップS4では、WebサービスI/F26が、文書名の変更応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
以上、本発明による第1実施例の文字列処理方法によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、適切な符号化方式を選択することができる。
なお、図10ではsetTitleのオブジェクト230をWebサービスI/F26に設けた例について説明したが、MCS36に設けてもよい。MCS36にオブジェクト230を設けた場合、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、文書名の変更要求をMCS36に対して行う。そして、MCS36は文書名の変更要求に応じたsetTitleのオブジェクト230に処理を依頼する。
WebサービスI/F26から処理を依頼されると、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば図12のようなフローチャートで表す処理により最適な符号化方式を選択する。オブジェクト230は選択した符号化方式で文字列を符号化すると共に、符号化できない文字を代用文字に置き換える。そして、オブジェクト230はステップS2に進み、符号化した文字列を用いてMCS36に文書名の変更要求を行う。その他の処理は、setTitleのオブジェクト230をWebサービスI/F26に設けた例と同様である。
setTitleのオブジェクト230をWebサービスI/F26に設けた場合のメリットは、第1実施例の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webサービス対応のためのオプションという構成にできることである。また、setTitleのオブジェクト230をMCS36に設けた場合のメリットは、他のI/F(例えばプリンタI/Fなど)でも利用できることである。
第1実施例のように、変換できない文字を代用符号に置き換えた場合、変換後の文字列を照合するとき等、代用符号に置き換えた全ての文字が同じ文字としてみなされるという問題もあった。また、符号化方式が等しくないと文字の一致とみなさない場合、同じ文字が異なる文字とみなされるという問題があった。
そこで、第2実施例の融合機1は照合を行う文字列の符号化方式を等しい符号化方式に変換させ、置き換えられた代用符号をワイルドカード扱いとすることにより、上記の問題を解決している。
図15は、文字列の照合について説明するための図である。例えばUTF−8で符号化された
[外10]
Figure 2004246870
をShift_JISまたはLatin1で符号化し、再びUTF−8に符号化した文字列は、
[外11]
Figure 2004246870
に一致していない。そこで、代用符号で表される不明文字をワイルドカード扱いとすることで、
[外12]
Figure 2004246870
に完全一致する文字列を照合できる。また、
[外13]
Figure 2004246870
に前方一致する文字列も照合できる。また、Windows(登録商標)やMAC(登録商標)などのOSの違いにより、UTF−8では同一の文字に異なる文字コードを例えば図16のように割り当てている。このような例外的な文字を予め図16のようなテーブルに設定しておくことで、本発明の文字列処理方法では異なる文字コードを割り当てられた文字であっても同一の文字としてみなすことができる。なお、図16のテーブルはデータの保持形式の一例であって、例えばXMLなどであってもよい。
図16は、例外的な文字を設定したテーブルの一例の構成図である。図16のテーブルを利用することで、本発明の文字列処理方法は例外的な文字を含む文字列であっても正確な照合が可能である。なお、本発明の文字列処理方法では大文字および小文字,平仮名および片仮名の関係を例外的な文字と同様、テーブルに設定しておくことで、異なる文字であっても同一の文字としてみなすこともできる。
図17は、本発明による第2実施例の文字列処理方法について説明するための融合機の構成図である。なお、図17の構成図は説明に必要のない構成を省略している。また、図17の融合機1は図10の融合機1と一部を除いて同様な構成であるため適宜説明を省略する。
図17の融合機1は、WebサービスI/F26に文書名の照合要求に応じたSearchのオブジェクト240を備え、また、WebサービスI/F26が利用するキャッシュ250を備えるように構成される。
図18は、文字列の照合処理について説明するための一例のフローチャートである。クライアント200から上記の文字列の符号化方式の変換を経て文書名の変更または文書の作成に伴う文書名の設定を指示するか、操作者がオペレーションパネル70を操作して文書名の変更または文書の作成を指示すると、融合機1のOCS33はステップS21に進み、文書名の変更要求または文書の作成要求をMCS36に送信する。
ステップS21に続いてステップS22に進み、MCS36は文書名の変更要求または文書の作成要求を受信し、その文書名の変更要求または文書の作成要求に応じて図14のような書誌情報データを変更する。そして、MCS36はファイル変化通知をWebサービスI/F26に送信する。
ファイル変化通知を受信すると、WebサービスI/F26は文書名の照合要求に応じたsearchのオブジェクト240に処理を依頼する。図19は、符号化処理の一例のフローチャートである。
ステップS31では、受信したファイル変化通知に含まれている文書名が内部処理で利用するShift_JISまたはLatin1等の符号化方式で符号化されているため、UTF−8に変換される。ステップS31に続いてステップS32に進み、オブジェクト240は受信したファイル変化通知に含まれている文書IDをキー情報としてキャッシュ250から該当する文書名を検索して照合する。
ステップS32に続いてステップS33に進み、オブジェクト240はステップS32での照合結果から、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせるか否かを判定する。
UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせると判定すると(S33においてYES)、オブジェクト240は図19の符号化処理を終了する。
例えばUTF−8に変換された文書名が
[外14]
Figure 2004246870
であり、キャッシュ250から検索された文書名が
[外15]
Figure 2004246870
である場合、前述したように代用符号で表される不明文字をワイルドカード扱いとすることで、UTF−8に変換された文書名とキャッシュ250から検索された文書名とを一致とみなせる。クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250にまず格納する方式をとれば、クライアント200からの文書名の設定の際に、このような場合が発生する。
一方、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせないと判定すると(S33においてNO)、オブジェクト240はUTF−8に変換された文書名を新しい文書名としてキャッシュ250に格納して図19の符号化処理を終了する。
例えばUTF−8に変換された文書名が
[外16]
Figure 2004246870
であり、キャッシュ250から検索された文書名が
[外17]
Figure 2004246870
である場合、UTF−8に変換された文書名とキャッシュ250から検索された文書名とを一致とみなせない。そこで、オブジェクト240は
UTF−8に変換された文書名
[外18]
Figure 2004246870
を新しい文書名としてキャッシュ250に格納する。クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250に格納しない方式をとれば、キャッシュ250から検索された文書名が
[外19]
Figure 2004246870
ではなく
[外20]
Figure 2004246870
であったりするが、不明文字をワイルドカード扱いとしても
[外21]
Figure 2004246870
とは一致しないので、同様の結果となる。
このように、図17の融合機1では文書名の変更があったときに、文書名を内部処理で利用するShift_JISまたはLatin1等からUTF−8に変換している。
ステップS23では、クライアント200が、XML形式で記述した図20のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。図20は、文書名の検索要求を行うSOAPメッセージの一例の構成図である。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、searchのオブジェクト240に処理を依頼する。
searchのオブジェクト240は、UTF−8で符号化された文字列(検索を行う文書名)を受信すると、その文字列をキー情報としてキャッシュ250から該当する文書名を検索して照合する。オブジェクト240は文字列の照合処理が終了すると、WebサービスI/F26に処理の終了を通知する。
ステップS24では、WebサービスI/F26が、文書名の検索応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
以上、本発明による第2実施例の文字列処理方法によれば、変換後の文字列を照合するときに、符号化方式の違いによる変換後の文字列の差異を吸収することができる。また、キャッシュ250を利用することにより、変換後の文字列を照合するときに、いちいちMCS36に問い合わせる必要がない。更に、クライアント200からの文書名の設定の際には内部処理で利用する符号化方式に変換する前の文字列をキャッシュ250にまず格納する方式を取っておけば、クライアント200からの文書名の検索の際には不明文字を含まない変換前の文字列同士の照合となるので、不明文字をワイルドカード扱いとするよりも検索の精度が高いものとなる。
なお、図17ではsearchのオブジェクト240をWebサービスI/F26に設けた例について説明したが、MCS36に設けてもよい。図21は、文字列の照合処理について説明するための一例のフローチャートである。
クライアント200から上記の文字列の符号化方式の変換を経て文書名の変更または文書の作成に伴う文書名の設定を指示するか、操作者がオペレーションパネル70を操作して文書名の変更または文書の作成を指示すると、融合機1のOCS33はステップS21に進み、文書名の変更要求または文書の作成要求をMCS36に送信する。
ステップS21に続いてステップS22に進み、MCS36は文書名の変更要求または文書の作成要求を受信し、その文書名の変更要求または文書の作成要求に応じて図14のような書誌情報データを変更する。そして、MCS36は文書名の照合要求に応じたsearchのオブジェクト240に処理を依頼する。
オブジェクト240は図19のような符号化処理を行い、UTF−8に変換された文書名とキャッシュ250から検索された文書名とが一致とみなせないと判定したときに、UTF−8に変換された文書名を新しい文書名としてキャッシュ250に格納する。
このように、図17の融合機1では文書名の変更があったときに、文書名を内部処理で利用するShift_JISまたはLatin1等からUTF−8に変換している。
ステップS42では、クライアント200が、XML形式で記述した図20のようなSOAPメッセージを作成し、そのSOAPメッセージをHTTPメッセージに格納させて融合機1に送信する。クライアント200から送信されたHTTPメッセージは、NCS31のhttpd220を介してWebサービスI/F26に供給される。
HTTPメッセージを受信すると、WebサービスI/F26はディスパッチャによりSOAPメッセージを解釈したあと、ステップS43で文書名の検索要求をMCS36に送信する。MCS36は文書名の検索要求を受信すると、searchのオブジェクト240に処理を依頼する。
searchのオブジェクト240は、UTF−8で符号化された文字列(検索を行う文書名)を受信すると、その文字列をキー情報としてキャッシュ250から該当する文書名を検索して照合する。オブジェクト240は文字列の照合処理が終了すると、MCS36に処理の終了を通知する。
ステップS44では、MCS36が、文書名の検索結果をWebサービスI/F26に送信する。ステップS45では、WebサービスI/F26が、文書名の検索応答を行うSOAPメッセージをXML形式で記述し、そのSOAPメッセージをHTTPメッセージに格納させてクライアント200に送信する。
以上、本発明による第2実施例の文字列処理方法によれば、変換後の文字列を照合するときに、符号化方式の違いによる変換後の文字列の差異を吸収することができる。
Searchのオブジェクト240をWebサービスI/F26に設けた場合のメリットは、第2実施例の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webサービス対応のためのオプションという構成にできることである。また、Searchのオブジェクト240をMCS36に設けた場合のメリットは、他のI/F(例えばプリンタI/Fなど)でも利用できることである。
前述した第1実施例の融合機1ではキャッシュ250を有していないが、図17の融合機1と同様に、WebサービスI/F26またはMCS36が利用するキャッシュ250を備えるようにしてもよい。
第1実施例の融合機1でキャッシュ250を備えることにより、変換前の文字列をキャッシュ250に格納しておくことができる。このように、変換前の文字列をキャッシュ250に格納しておくことにより、変換前の文字列を文字列の照合処理に利用することができ、文字列の照合処理の精度を上げることができる。
上記の実施例1では、符号化方式の優先順位が固定されている例を説明したが、様々な条件に応じて符号化方式の優先順位が変化するようにしてもよい。そこで、実施例3では様々な条件に応じて符号化方式の優先順位が変化する例を説明する。
図22は、本発明による第3実施例の文字列処理方法について説明するための融合機の構成図である。図23は、本発明による第3実施例の文字列処理方法について説明するためのシーケンス図である。なお、図22及び図23では説明に必要のない構成を省略している。また、図22の構成図は図10の構成図と一部を除いて同様であるため、適宜説明を省略する。
ステップS51では、クライアント200のブラウザ201が、URLを指定してhttpリクエストを行う。例えばステップS51で指定されるURLは、「http://111.222.33.44/ja/documentbox/」等である。このURLには、ブラウザ201の表示言語が日本語である例であり、URL中の「ja」で表示言語が日本語に指定されている。ブラウザ201から送信されたHTTPリクエストは、融合機1のNCS31に含まれるhttpd220に供給される。
ステップS52に進み、httpd220は供給されたhttpリクエストをWebアプリ27に供給する。httpリクエストを受信すると、Webアプリ27はhttpリクエストで指定されているURLからブラウザ201の表示言語を特定し、その表示言語に応じた画面データを生成する。
ステップS53に進み、Webアプリ27は生成した画面データをhttpd220に供給する。ステップS54に進み、httpd220は供給された画面データをクライアント200のブラウザ201に送信する。
画面データを受信すると、ブラウザ201はステップS55に進み、画面データに応じた画面を表示する。そして、ユーザはブラウザ201に表示された画面に文字列を入力する。ステップS56に進み、クライアント200のブラウザ201はステップS55で画面に入力された文字列を含むhttpリクエストを行う。ブラウザ201から送信されたhttpリクエストは、融合機1のhttpd220に供給される。
ステップS57に進み、httpd220は供給されたhttpリクエストをWebアプリ27に供給する。httpリクエストを受信すると、Webアプリ27はステップS58に進み、httpリクエストに含まれる文字列を取得してsetTitleのオブジェクト230に処理を依頼する。
まず、setTitleのオブジェクト230は、内部処理で利用する符号化方式以外の文字列を受信した場合、その文字列を内部処理で利用する符号化方式に変換する必要がある。そこで、オブジェクト230は文字列の符号化方式を変換する必要があるかを判定し、必要があれば前述した図12のようなフローチャートで表す処理を実行する。
なお、実施例3の場合、図12のステップS11の処理が実施例1の場合と異なる。オブジェクト230は、符号化方式の優先順位を次のように決定し、その優先順位に従って符号化方式を選択する。優先順位の決定は、次のように行う。まず、ブラウザ201の表示言語に対応する符号化方式は、上位の優先順位とする。オペレーションパネル70の表示言語に対応する符号化方式は、中位の優先順位とする。そして、それ以外の符号化方式は、下位の優先順位とする。この場合の優先順位は、ブラウザ201の表示言語に対応する符号化方式、オペレーションパネル70の表示言語に対応する符号化方式、それ以外の符号化方式となる。
ステップS11以外の処理は、実施例1の場合と同様であるため説明を省略する。図12のフローチャートにより最適な符号化方式を選択したあと、オブジェクト230は選択した符号化方式で文字列を符号化する。なお、オブジェクト230は、符号化できない文字を代用文字に置き換える。
そして、ステップS59に進み、Webアプリ27はステップS57のhttpリクエストに対応する画面データを作成し、その画面データをhttpd220に供給する。ステップS54に進み、httpd220は供給された画面データをクライアント200のブラウザ201に送信する。
以上、本発明による第3実施例の文字列処理方法によれば、一の符号化方式で符号化された文字列を他の符号化方式に変換するときに、様々な条件に応じて符号化方式の優先順位を変化させることができるので、適切な符号化方式を選択することができる。
なお、図22ではsetTitleのオブジェクト230をWebアプリ27に設けた例について説明したが、MCS36に設けてもよい。setTitleのオブジェクト230をWebアプリ27に設けた場合のメリットは、実施例3の文字列処理方法が、ネットワーク210に接続しない融合機に不要な機能であるため、Webアプリ27のオプションという構成にできることである。また、setTitleのオブジェクト230をMCS36に設けた場合のメリットは、他のアプリ(例えばプリンタアプリなど)でも利用できることである。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求のの範囲から逸脱することなく、種々の変形や変更が可能である。
例えば、請求項1記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数情報に基づき前記代用符号の数が最も少ない符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
また、請求項1記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数情報に基づき前記代用符号が連続して出現する回数が最も少ない符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
また、請求項1記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の位置情報に基づき前記代用符号の出現位置が最も後ろの符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
また、請求項1記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の位置情報に基づき前記代用符号の平均出現位置が最も後ろの符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
また、上記に記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数情報および位置情報に基づき、前記代用符号の数,前記代用符号が連続して出現する回数,前記代用符号の出現位置,前記代用符号の平均出現位置の組み合わせから、前記他の符号化方式を決定することを特徴としてもよい。
また、上記に記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数,前記代用符号が連続して出現する回数,前記代用符号の出現位置,前記代用符号の平均出現位置を数値化して、前記数値により前記他の符号化方式を決定することを特徴としてもよい。
また、上記に記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数情報および位置情報に基づき、前記代用符号の数,前記代用符号が連続して出現する回数,前記代用符号の出現位置,前記代用符号の平均出現位置の何れかが同じであるときに、前記複数の符号化方式のリスト中で先に現れる符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
また、上記に記載の文字列処理装置の前記符号化方式決定手段は、前記代用符号の数情報および位置情報に基づき、前記代用符号の数,前記代用符号が連続して出現する回数,前記代用符号の出現位置,前記代用符号の平均出現位置の何れかが同じであるときに、前記複数の符号化方式の優先度に応じて前記他の符号化方式を決定することを特徴としてもよい。
また、上記に記載の文字列処理装置の前記符号化方式決定手段は、前記選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したとき、前記代用符号が出現しなければ、前記選択している符号化方式を前記他の符号化方式として決定することを特徴としてもよい。
符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 符号化方式で表現可能な文字の集合が符号化方式ごとに異なっていることを表す図である。 文字に割り当てられている文字コードを符号化方式ごとに表したルックアップテーブルである。 本発明による融合機の一実施例の構成図である。 本発明による融合機の一実施例のハードウェア構成図である。 本発明による第1実施例の文字列処理方法について説明するための融合機の構成図である。 文書名の変更要求を行うSOAPメッセージの一例の構成図である。 符号化方式決定処理の一例のフローチャートである。 UTF−8,Shift_JISおよびLatin1の文字コードの割り当てを表した一例のルックアップテーブルである。 書誌情報データの形式を表した図である。 文字列の照合について説明するための図である。 例外的な文字を設定したテーブルの一例の構成図である。 本発明による第2実施例の文字列処理方法について説明するための融合機の構成図である。 文字列の照合処理について説明するための一例のフローチャートである。 符号化処理の一例のフローチャートである。 文書名の検索要求を行うSOAPメッセージの一例の構成図である。 文字列の照合処理について説明するための一例のフローチャートである。 本発明による第3実施例の文字列処理方法について説明するための融合機の構成図である。 本発明による第3実施例の文字列処理方法について説明するためのシーケンス図である。
符号の説明
1 融合機
2 ソフトウェア群
3 融合機起動部
4 ハードウェア資源
5 アプリケーション層
6 プラットフォーム
9 コントロールサービス層
10 ハンドラ層
11 白黒レーザプリンタ(B&W LP)
12 カラーレーザプリンタ(Color LP)
13 ハードウェアリソース
21 プリンタアプリ
22 コピーアプリ
23 ファックスアプリ
24 スキャナアプリ
25 ネットファイルアプリ
26 WebサービスI/F
27 Webアプリ
31 ネットワークコントロールサービス(NCS)
32 デリバリーコントロールサービス(DCS)
33 オペレーションパネルコントロールサービス(OCS)
34 ファックスコントロールサービス(FCS)
35 エンジンコントロールサービス(ECS)
36 メモリコントロールサービス(MCS)
37 ユーザインフォメーションコントロールサービス(UCS)
38 システムコントロールサービス(SCS)
39 システムリソースマネージャ(SRM)
40 ファックスコントロールユニットハンドラ(FCUH)
41 イメージメモリハンドラ(IMH)
51 アプリケーションプログラムインターフェース(API)
52 エンジンI/F
60 コントローラ
61 CPU
62 システムメモリ
63 ノースブリッジ(NB)
64 サウスブリッジ(SB)
65 AGP(Accelerated Graphics Port)
66 ASIC
67 ローカルメモリ
68 ハードディスク装置(HDD)
69 ネットワークI/Fコントローラ
70 オペレーションパネル
80 ファックスコントロールユニット(FCU)
90 USBデバイス
100 IEEE1394デバイス
110 エンジン部
200 クライアント
201 ブラウザ
210 ネットワーク
220 httpd(HyperText Transfer Protocol Daemon)
230 setTitleのオブジェクト
240 Searchのオブジェクト

Claims (18)

  1. 一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理装置において、
    前記複数の符号化方式を選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得して、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する符号化方式決定手段
    を有することを特徴とする文字列処理装置。
  2. 前記符号化方式決定手段は、前記複数の符号化方式を順番に選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方が所定基準を満たさないときに、前記複数の符号化方式から次の符号化方式を選択することを特徴とする請求項1記載の文字列処理装置。
  3. 前記符号化方式決定手段は、前記複数の符号化方式を優先度の順番に選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方が所定基準を満たさないときに、前記複数の符号化方式から次の符号化方式を選択することを特徴とする請求項1記載の文字列処理装置。
  4. 前記複数の符号化方式の優先度は、オペレーションパネルの表示言語として設定されている言語に応じて変化することを特徴とする請求項3記載の文字列処理装置。
  5. 前記複数の符号化方式の優先度は、文字列の変換を指示したクライアントの表示言語として設定されている言語に応じて変化することを特徴とする請求項3記載の文字列処理装置。
  6. 前記符号化方式決定手段は、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定できないときに、前記複数の符号化方式の優先度に基づき前記他の符号化方式を決定することを特徴とする請求項1記載の文字列処理装置。
  7. 前記符号化方式決定手段は、前記選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方が所定基準を満たすときに、前記選択した符号化方式を前記他の符号化方式として決定することを特徴とする請求項1記載の文字列処理装置。
  8. 前記代用符号は、前記一の符号化方式で符号化された文字列のうち、前記選択した符号化方式を用いて変換できない文字を置き換えた文字コードであることを特徴とする請求項1乃至7何れか一項記載の文字列処理装置。
  9. 一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列処理装置において、
    前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段
    を有することを特徴とする文字列処理装置。
  10. 前記他の符号化方式で符号化される前の文字列を格納している格納手段を更に有し、前記他の符号化方式で符号化された文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記格納手段に格納している前記他の符号化方式で符号化される前の文字列を用いることを特徴とする請求項9記載の文字列処理装置。
  11. 前記一の符号化方式で符号化された文字のうち、同一の文字に異なる文字コードを割り当てている例を設定したテーブルを更に有することを特徴とする請求項9又は10記載の文字列処理装置。
  12. 前記代用符号は、前記他の符号化方式で符号化された文字列のうち、前記一の符号化方式に変換できない文字を置き換えた文字コードであることを特徴とする請求項9乃至11何れか一項記載の文字列処理装置。
  13. 一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理方法において、
    前記複数の符号化方式を選択する段階と、
    選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得する段階と、
    前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する段階と
    を有することを特徴とする文字列処理方法。
  14. 一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列処理方法において、
    前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換する段階と、
    前記変換した文字列に含まれる代用符号を全ての文字を表す役割をもった文字として扱って、前記変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合する段階と
    を有することを特徴とする文字列処理方法。
  15. 前記代用符号は、前記一の符号化方式または他の符号化方式に変換できない文字を置き換えた文字コードであることを特徴とする請求項13又は14記載の文字列処理方法。
  16. 一の符号化方式で符号化された文字列を、複数の符号化方式から選択された他の符号化方式に変換する文字列処理機能を有した画像形成装置であって、
    前記複数の符号化方式を選択し、選択した符号化方式を用いて前記一の符号化方式で符号化された文字列を変換したときの代用符号の数情報および位置情報の少なくとも一方を前記複数の符号化方式ごとに取得して、前記数情報および位置情報の少なくとも一方に基づき前記他の符号化方式を決定する符号化方式決定手段
    を有することを特徴とする画像形成装置。
  17. 一の符号化方式で符号化された文字列を用いて、他の符号化方式で符号化された文字列を照合する文字列照合機能を有した画像形成装置であって、
    前記他の符号化方式で符号化された文字列を前記一の符号化方式に変換し、変換した文字列を前記一の符号化方式で符号化された文字列を用いて照合するときに、前記変換した文字列に含まれる代用符号を、全ての文字を表す役割をもった文字として扱う文字列照合手段
    を有することを特徴とする画像形成装置。
  18. 前記代用符号は、前記一の符号化方式または他の符号化方式に変換できない文字を置き換えた文字コードであることを特徴とする請求項16又は17記載の画像形成装置。
JP2004004123A 2003-01-24 2004-01-09 文字列処理装置,文字列処理方法および画像形成装置 Expired - Fee Related JP4308676B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004004123A JP4308676B2 (ja) 2003-01-24 2004-01-09 文字列処理装置,文字列処理方法および画像形成装置
US10/758,219 US7199730B2 (en) 2003-01-24 2004-01-16 Character string processing apparatus, character string processing method, and image-forming apparatus
EP04250391A EP1441291B1 (en) 2003-01-24 2004-01-23 Character string encoding conversion
CNB2004100052873A CN100399705C (zh) 2003-01-24 2004-01-24 字符串处理装置、字符串处理方法和成像装置
CN2006101640551A CN101079023B (zh) 2003-01-24 2004-01-24 字符串处理装置、字符串处理方法和成像装置
US11/675,894 US7477167B2 (en) 2003-01-24 2007-02-16 Character string processing apparatus, character string processing method, and image-forming apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003016427 2003-01-24
JP2004004123A JP4308676B2 (ja) 2003-01-24 2004-01-09 文字列処理装置,文字列処理方法および画像形成装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009061613A Division JP5030985B2 (ja) 2003-01-24 2009-03-13 文字列処理装置および画像形成装置

Publications (2)

Publication Number Publication Date
JP2004246870A true JP2004246870A (ja) 2004-09-02
JP4308676B2 JP4308676B2 (ja) 2009-08-05

Family

ID=32599347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004004123A Expired - Fee Related JP4308676B2 (ja) 2003-01-24 2004-01-09 文字列処理装置,文字列処理方法および画像形成装置

Country Status (4)

Country Link
US (2) US7199730B2 (ja)
EP (1) EP1441291B1 (ja)
JP (1) JP4308676B2 (ja)
CN (1) CN100399705C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066449A (ja) * 2005-08-31 2007-03-15 Yamaha Corp コンテンツ記憶装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6631247B1 (en) 1999-09-29 2003-10-07 Ricoh Co., Ltd. Method and system for remote diagnostic, control and information collection based on various communication modes for sending messages to a resource manager
EP1577791B1 (en) * 2004-03-16 2011-11-02 Microdasys Inc. XML content monitoring
JP4072691B2 (ja) * 2004-07-15 2008-04-09 ソニー株式会社 文字情報変換装置および文字情報変換方法
JP4902981B2 (ja) * 2004-10-05 2012-03-21 株式会社リコー サービス提供システム及びサービス提供方法
JP4843287B2 (ja) * 2004-10-25 2011-12-21 株式会社リコー 情報管理システム、情報処理装置及び情報管理方法
US7400271B2 (en) * 2005-06-21 2008-07-15 International Characters, Inc. Method and apparatus for processing character streams
JP4651681B2 (ja) * 2006-01-10 2011-03-16 富士通株式会社 端末装置およびコンピュータプログラム
JP5239367B2 (ja) * 2007-03-19 2013-07-17 富士通株式会社 情報提供システム、情報提供プログラムおよび情報提供方法
US8296461B2 (en) * 2007-08-07 2012-10-23 Object Innovation Inc. Data transformation and exchange
JP2010277440A (ja) * 2009-05-29 2010-12-09 Internatl Business Mach Corp <Ibm> プログラム実行時における文字列の処理を最適化する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム
JP5446852B2 (ja) * 2009-12-25 2014-03-19 コニカミノルタ株式会社 印刷処理装置、印刷処理プログラム、および印刷処理方法
US9058062B2 (en) * 2010-04-26 2015-06-16 Nintendo Co., Ltd. System and method for accessing content
JP5736912B2 (ja) * 2011-04-01 2015-06-17 セイコーエプソン株式会社 記録制御装置、記録システム、記録制御装置の制御方法、及び、プログラム
JP6489810B2 (ja) * 2014-11-28 2019-03-27 キヤノン株式会社 画像形成装置及び画像形成装置の制御方法
JP6397343B2 (ja) * 2015-01-28 2018-09-26 株式会社日立社会情報サービス 情報処理装置、および、情報処理方法
CN106844288B (zh) 2015-12-07 2022-03-22 创新先进技术有限公司 一种随机字符串生成方法及装置
JP6737117B2 (ja) * 2016-10-07 2020-08-05 富士通株式会社 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置
CN116011433A (zh) * 2021-10-22 2023-04-25 伊姆西Ip控股有限责任公司 应用测试的方法、设备和计算机程序产品
CN114416925B (zh) * 2022-01-20 2024-07-02 广州市百果园网络科技有限公司 敏感词识别方法、装置、设备、存储介质及程序产品

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4860214A (en) 1987-01-22 1989-08-22 Ricoh Company, Ltd. Inference system
US6631247B1 (en) 1999-09-29 2003-10-07 Ricoh Co., Ltd. Method and system for remote diagnostic, control and information collection based on various communication modes for sending messages to a resource manager
CA1280215C (en) * 1987-09-28 1991-02-12 Eddy Lee Multilingual ordered data retrieval system
JP3083329B2 (ja) * 1991-02-08 2000-09-04 富士通株式会社 データ圧縮復元方式
US5150430A (en) * 1991-03-15 1992-09-22 The Board Of Trustees Of The Leland Stanford Junior University Lossless data compression circuit and method
US5338976A (en) 1991-06-20 1994-08-16 Ricoh Company, Ltd. Interactive language conversion system
US5309358A (en) * 1992-02-18 1994-05-03 International Business Machines Corporation Method for interchange code conversion of multi-byte character string characters
DE69605433T2 (de) 1995-09-13 2000-07-20 Apple Computer, Inc. Unicode-wandler
WO1997010556A1 (en) 1995-09-13 1997-03-20 Apple Computer, Inc. Unicode converter
JP3499671B2 (ja) * 1996-02-09 2004-02-23 富士通株式会社 データ圧縮装置及びデータ復元装置
US6204782B1 (en) * 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
US7039688B2 (en) 1998-11-12 2006-05-02 Ricoh Co., Ltd. Method and apparatus for automatic network configuration
JP2001084275A (ja) 1999-04-28 2001-03-30 Ricoh Co Ltd データ転送装置
DE10112587A1 (de) * 2001-03-15 2002-09-26 Siemens Ag Verfahren und Vorrichtung zum rechnergestützten Ermitteln der Ähnlichkeit einer elektronischen ersten Zeichenkette mit einer elektronischen zweiten Zeichenkette, Computerlesbares Speichermedium und Computerprogramm-Element
JP2002358299A (ja) * 2001-06-01 2002-12-13 Brother Ind Ltd 文書処理装置及び文書処理プログラム
US20040030986A1 (en) 2002-02-26 2004-02-12 Toru Matsuda Method of controlling user information and information processing apparatus
US7511842B2 (en) 2002-03-19 2009-03-31 Ricoh Company, Ltd. Image forming apparatus
US20030225894A1 (en) 2002-03-25 2003-12-04 Tatsuo Ito Image forming apparatus including web service functions
US6701320B1 (en) * 2002-04-24 2004-03-02 Bmc Software, Inc. System and method for determining a character encoding scheme
US20040070782A1 (en) 2002-06-05 2004-04-15 Sachiko Mihira Image forming apparatus, stored document printing method and stored document printing system
US20040080771A1 (en) 2002-08-15 2004-04-29 Sachiko Mihira Image forming apparatus that can operate without wasteful use of resources thereof and unnecessary authentication
US7218252B2 (en) * 2004-02-25 2007-05-15 Computer Associates Think, Inc. System and method for character conversion between character sets
JP4902981B2 (ja) 2004-10-05 2012-03-21 株式会社リコー サービス提供システム及びサービス提供方法
JP4843287B2 (ja) 2004-10-25 2011-12-21 株式会社リコー 情報管理システム、情報処理装置及び情報管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066449A (ja) * 2005-08-31 2007-03-15 Yamaha Corp コンテンツ記憶装置
JP4670553B2 (ja) * 2005-08-31 2011-04-13 ヤマハ株式会社 コンテンツ記憶装置

Also Published As

Publication number Publication date
US7477167B2 (en) 2009-01-13
US20040187061A1 (en) 2004-09-23
CN100399705C (zh) 2008-07-02
CN1520040A (zh) 2004-08-11
US20070139233A1 (en) 2007-06-21
EP1441291B1 (en) 2012-03-21
US7199730B2 (en) 2007-04-03
EP1441291A3 (en) 2009-02-11
JP4308676B2 (ja) 2009-08-05
EP1441291A2 (en) 2004-07-28

Similar Documents

Publication Publication Date Title
US7477167B2 (en) Character string processing apparatus, character string processing method, and image-forming apparatus
JP4405793B2 (ja) 文書管理システム及びその制御方法並びに記録媒体
US8127177B2 (en) Apparatus and method for executing workflow
US8112520B2 (en) Method of assigning service and information processing apparatus for implementing the method
JP2007004453A (ja) ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置
JP2010219792A (ja) サーバと、前記サーバを含む情報処理システムとその制御方法
JP2021163178A (ja) 情報処理装置
US8730495B2 (en) Image processing system
JP2014237305A (ja) 画像形成装置及び情報処理装置と印刷システム、及びその制御方法とプログラム
JP5030985B2 (ja) 文字列処理装置および画像形成装置
US8953589B2 (en) Method to set setting information in device and device to set setting information
JP2015069565A (ja) 中継装置、画像処理装置、中継装置のプログラムおよび画像処理装置のプログラム
JP2003196056A (ja) プリントシステム及び方法
JP4435582B2 (ja) 画像処理装置、データ検索方法およびデータ検索プログラム
JP5195194B2 (ja) 画像処理装置及び画像処理システム
JP4440576B2 (ja) 画像形成装置,利用認証情報発行方法および利用認証情報発行システム
JP2023072812A (ja) 情報処理装置、情報処理装置の制御方法、そのプログラム及び画像処理システム
JP2005196337A (ja) 情報処理装置、データ検索方法およびデータ検索プログラム
JP4162554B2 (ja) 画像形成装置,利用認証情報発行方法および利用認証情報発行システム
JP2003345713A (ja) 画像形成装置,蓄積文書出力方法および蓄積文書出力システム
JP2004005475A (ja) 画像形成装置および蓄積文書のサムネイル取得方法
JP2004303205A (ja) 外部装置によって蓄積文書情報を編集可能とする画像形成装置、文書サービス提供方法
JP2008310774A (ja) 情報処理装置及びその制御方法、コンピュータプログラム
JP3742395B2 (ja) 画像形成装置,サムネイル印刷方法,サムネイル出力方法,サムネイル印刷システムおよびサムネイル出力システム
JP4910623B2 (ja) ネットワークシステムにおける画像処理方法および画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090414

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140515

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees