JP3367198B2

JP3367198B2 - 文字属性を用いたテキスト処理装置

Info

Publication number: JP3367198B2
Application number: JP05262294A
Authority: JP
Inventors: 和也千葉; 一樹安松
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1994-02-28
Filing date: 1994-02-28
Publication date: 2003-01-14
Anticipated expiration: 2018-01-14
Also published as: JPH07239849A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字属性を用いたテキ
スト処理装置に関し、特に、テキスト中のいくつかの文
字列に文字属性が設定されている文書中のテキストに対
して文字属性を用いて処理を行うテキスト処理装置に関
するものである。

【０００２】

【従来の技術】従来、文書処理装置においては、キーボ
ード装置から入力された一連の文字列の一まとまりをテ
キストとして処理し、所望の文書を作成して、印刷など
の出力処理を行い、最終的な文書を得る。この場合、文
書としての形式を整えるため、書式等の設定を行い、ま
た、テキストの文字列に対しては、その文字列の各々の
文字に対し、その大きさ（ポイント），書体（明朝体，
ゴシック体），表示位置（上つき，下つき）などの表示
形式を様々に変化させ、様々な表示形態の文書が作成可
能なように、各々の文字列の文字に対しては、文字属性
が付加される。

【０００３】なお、このような文字属性は、文字の表示
様式を示すために、テキスト中の文字列の文字に付加す
る属性であり、例えば、文字形式に関する属性として
「ボールド体」、「イタリック体」、「上つき（肩文
字）」、「下つき（足文字）」、「下線」、「ストライ
クアウト（中線；削除を示す線）」などの文字表示の形
式を修飾する付属データである。ここでは、文字属性
は、更に、フォントの種類、文字の大きさも含めて文字
属性と称するものとする。

【０００４】１つ種類の文書処理システムにおいて作成
された電子文書は、異なった種類の文書処理システムで
更に処理される場合が多いが、その場合、それぞれの文
書処理システムは、各々の文書処理システムで固有のテ
キストの表現形式（フォーマット）を用いていることが
一般的である。このため、テキストの表現形式が異なる
場合には、当該電子文書に対する処理が、異なる文書処
理システムで行えないことになる。

【０００５】したがって、他の文書処理システムで処理
された電子文書を、自己の文書処理システムで扱う場
合、自己の文書処理システムで処理可能なテキストの表
現形式に変換する処理を行い、その後に、自己の文書処
理システムにおける処理が行なわれる。

【０００６】これらの様々なテキストの表現形式（フォ
ーマット）の種類を、ここではテキストタイプあるいは
単にタイプと呼ぶことにする。このようなテキストのタ
イプの種類の例としては、Ａｋａｎｅファイルフォーマ
ット（富士ゼロックス社），ＲｉｃｈＴｅｘｔＦｏ
ｒｍａｔ（マイクロソフト社）などがある。

【０００７】一般に、テキストのタイプが異なれば、設
定可能な文字属性は異なるので、異なるタイプの間のテ
キストの変換を行う場合、入力側のテキストのタイプに
おいて設定できた文字属性が、出力側のタイプにおいて
設定できないという場合が生じてしまうという問題があ
る。

【０００８】これに対しては、異なるタイプの間のテキ
ストの変換を行う場合に、出力側のタイプにおいて設定
できない文字属性に対しては、出力側のタイプにおいて
設定できる別の文字属性に代替するように、予じめ入力
側の文字属性と出力側の文字属性との対応関係を定めて
おく方法（例えば「Ｉｎｔｅｒｌｅａｆ社」のＩｎｔｅ
ｒｌｅａｆＦｉｌｅＣｏｎｖｅｒｓｉｏｎのような
方法）がある。

【０００９】この方法においては、予め定められた入力
側と出力側の２つのテキストタイプの間ごとに、出力側
のタイプにおいて設定できない個々の文字属性につい
て、代替する文字属性を指定する記述（代替文字属性指
定記述）を作成しておく。そして、その記述に基づき、
文字属性のそれぞれについての代替を行うようにしてい
る。このような代替文字属性指定記述の一例を、図１８
に示している。図１８に示した代替文字属性指定記述
は、第１行目の記述により、文字属性「ＨＰＦｉｘｅ
ｄ−ｓｐａｃｅｄｖｅｃｔｏｒｆｏｎｔ」を文字属
性「Ｔｉｍｅｓ」に代替することを指定しており、第２
行目では、文字属性「ＨＰＶａｒｉａｂｌｅ−ｓｐａ
ｃｅｄａｒｃｆｏｎｔ」を文字属性「Ｔｉｍｅｓ」
に代替することを指定している。また、第３行目では、
文字属性「ＨＰＦｉｘｅｄ−ｓｐａｃｅｄａｒｃ
ｆｏｎｔ」を文字属性「Ｔｉｍｅｓ」に代替することを
指定している。

【００１０】

【発明が解決しようとする課題】ところで、上述したよ
うな変換方法によれば、入力側のテキストタイプの文字
属性と出力側のテキストタイプの文字属性との組の各々
の組ごとに、１対１の対応で代替文字属性指定記述を作
成する必要があり、相互変換を行いたいテキストタイプ
の文字属性の種類が多い場合にも、多くの数の全ての種
類の各々の文字属性に対して、完全に代替文字属性指定
記述を作成する必要がある。このため、その代替文字属
性指定記述の作成作業が煩雑であると共に、例えば、代
替文字属性指定記述が作成されていない文字属性が存在
すると、その文字属性に対しては、テキスト変換におい
て、文字属性の代替ができず、処理が進められないとい
う問題があった。

【００１１】本発明は、上述のような問題を解決するた
めになされたものであり、したがって、本発明の目的
は、相互変換を行いたいテキストタイプの種類が多い場
合においても、多くの種類の代替する文字属性の指定記
述を完全に作成する必要の無いテキスト処理装置を提供
することにある。

【００１２】本発明の他の目的は、ワードプロセッサ、
あるいは文書処理機能を持つワークステーション等で処
理される電子文書のテキストを対象とし、異なるテキス
トタイプの間のテキスト変換の際に、出力側のタイプに
おいて設定できない文字属性に対しては、出力側のタイ
プにおいて設定できる類似の別の文字属性を判別して代
替し、どのように異なるテキストタイプの間においても
テキストの変換を可能とするテキスト処理装置を提供す
ることにある。

【００１３】また、本発明の別の目的は、ワードプロセ
ッサ、あるいは文書処理機能を持つワークステーション
等で処理される電子文書のテキストを対象とし、テキス
トの文字列中に文字属性が設定されている場合に、正確
に検索キーとしての文字属性を指定しなくても、類似の
別の文字属性を判別し、どのように異なるテキストタイ
プの間においても、文字属性を検索キーに用いた検索処
理が行えるテキスト処理装置を提供することにある。

【００１４】

【課題を解決するための手段】上記のような目的を達成
するため、本発明においては、テキスト中のいくつかの
文字列に文字属性が設定されているテキストを処理する
テキスト処理装置において、文字属性情報を階層的に分
類した記述からなる文字属性分類表を格納する文字属性
情報格納手段（１４）と、処理不可能な文字属性に対し
て、文字属性分類表を用いて処理可能な文字属性を判別
し、文字属性の異なるタイプのテキストに対する処理を
行うテキスト処理手段（１２）とを備えることを特徴と
する。

【００１５】このテキスト処理装置において、文字属性
情報格納手段（１４）が格納する文字属性分類表（１
５）は、文字属性情報を分類した文字属性の上位の分類
名を含んでおり、分類名の指定により下位の文字属性情
報の全体の指定とすることを特徴とする。

【００１６】また、テキスト処理装置において、テキス
ト処理手段は、テキスト中のいくつかの文字列に文字属
性が設定されているテキストをタイプの異なるテキスト
に変換するテキスト変換処理を行い、入力テキスト中の
ある文字列に設定された第１の文字属性が出力タイプに
おいて設定できない場合に、文字属性分類表を参照し
て、出力タイプにおいて設定できる第２の文字属性を選
択し、第１の文字属性を第２の文字属性に代替すること
を特徴とする。

【００１７】ここでのテキスト処理装置において、テキ
スト処理手段は、テキスト中のいくつかの文字列に文字
属性が設定されているテキストを検索対象として、文字
列中のいくつかの文字または文字の並びの文字属性の指
定により、文字属性分類表を用いて文字属性を代替する
判別を行い、テキスト中の文字列に対する検索を行うこ
とを特徴とする。

【００１８】また、テキスト処理装置において、テキス
ト処理手段は、テキスト中のいくつかの文字列に文字属
性が設定されているテキストを検索対象として、文字列
中のいくつかの文字または文字の並びの文字属性の分類
名の指定により、文字属性分類表を用いて文字属性を代
替する判別を行い、テキスト中の文字列に対する検索を
行うことを特徴とする。

【００１９】

【作用】本発明のテキスト処理装置において、テキスト
中のいくつかの文字列に文字属性が設定されている文書
中のテキストを処理する場合に、文字属性を用いるテキ
ストの処理を行うため、ここでの文字属性情報格納手段
（１４）は、文字属性情報を階層的に分類した記述から
なる文字属性分類表を格納しており、テキスト処理手段
（１２）が、処理不可能な文字属性に対して、文字属性
分類表を用いて処理可能な文字属性を判別し、異なるタ
イプのテキストに対する処理を行う。これにより、どの
ようにタイプの異なるテキストに対しても、テキスト処
理が可能となる。

【００２０】また、文字属性情報格納手段（１４）が格
納する文字属性分類表（１５）は、文字属性情報を階層
的に分類した記述と共に、文字属性情報を分類した文字
属性の上位の分類名を含んでおり、この分類名の指定に
よって、そのその分類名から下位の文字属性情報の全体
を指定することができる。このため、特定の文字属性を
指定する場合、その文字属性が不明確な場合において
は、文字属性情報の分類上の上位の分類名を指定するこ
とにより、当該不明確な文字属性の指定とすることがで
きる。

【００２１】また、ここでのテキスト処理装置におい
て、タイプが異なるテキストの間のテキスト変換を行う
場合、テキスト処理手段は、テキスト中のいくつかの文
字列に文字属性が設定されているテキストを、異なるタ
イプのテキストに変換するテキスト変換処理を行い、入
力テキスト中のある文字列に設定された第１の文字属性
が出力タイプにおいて設定できない場合、文字属性情報
格納手段が格納する文字属性分類表を参照し、出力タイ
プにおいて設定できる第２の文字属性を判別して選択
し、第１の文字属性を第２の文字属性に代替する。これ
により、どのような異なるテキストタイプの間において
も、その相互変換が可能となる。

【００２２】また、ここでのテキスト処理装置におい
て、文字属性を用いたテキスト検索を行う場合、テキス
ト処理手段は、テキスト中のいくつかの文字列に文字属
性が設定されているテキストを検索対象として、文字列
中のいくつかの文字または文字の並びの文字属性の指定
により、文字属性分類表を用いて、文字属性を代替する
判別を行い、テキスト中の文字列に対する検索を行う。
これにより、検索キーとしての文字属性を正確に指定し
なくても、その類似の文字属性を含めた文字属性の検索
が可能になる。また、タイプの異なるテキストに渡って
も、テキスト検索が可能となる。

【００２３】更に、ここでのテキスト処理装置におい
て、文字属性を用いたテキスト検索を行う場合、文字属
性の分類名の指定を行うことができる。つまり、テキス
ト処理手段は、テキスト中のいくつかの文字列に文字属
性が設定されているテキストを検索対象として、文字列
中のいくつかの文字またはその並びの文字属性の分類名
の指定により、文字属性分類表を用いて文字属性を代替
する判別を行い、テキスト中の文字列に対する検索処理
を行う。これにより、検索キーとしての文字属性を正確
に指定しなくても、文字属性の分類名を指定するだけ
で、その類似の文字属性を含めた文字属性の検索が可能
になる。また、タイプの異なるテキストに渡っても、テ
キスト検索が可能となる。

【００２４】

【実施例】以下、本発明の一実施例を図面を参照して具
体的に説明する。図１は、本発明の一実施例にかかるテ
キスト処理装置の全体の構成を示すブロック図である。
図１において、１１は入力テキスト、１２はテキスト処
理部、１３は文字属性代替処理部、１４は文字属性情報
格納部、１５は文字属性分類表、１６は出力テキストで
ある。

【００２５】本実施例のテキスト処理装置では、文字属
性を用いるテキストの処理を行うため、文字属性情報格
納部１４には、文字属性情報を階層的に分類した記述か
らなる文字属性分類表１５が格納される。テキスト処理
部１２は、テキスト中のいくつかの文字列に文字属性が
設定されているテキストを処理する。すなわち、入力さ
れた入力テキスト１１に対して、文字属性をも含めた編
集処理，検索処理，変換処理などのテキスト処理を行
う。

【００２６】その場合、テキストの文字列に設定されて
いる文字属性により、当該文字列に対する文字修飾の処
理や、文字属性による検索処理を行うが、その際、ここ
での文書処理システムにおいて処理不可能な文字属性に
対しては、文字属性情報格納部１４に格納されている文
字属性分類表１５を参照し、その記述内容にしたがっ
て、当該文書処理システムで処理可能な文字属性を判別
し、例えば、その文字属性への代替を行って、処理を継
続して行う。そして、出力テキスト１６を出力する。こ
れにより、どのようにタイプの異なるテキストに対して
も、処理を停止することなく、テキストに対する処理を
行う。すなわち、この場合、どのように異なるタイプの
テキストが、入力テキスト１１として与えられても、テ
キスト処理が可能となる。

【００２７】図２は、文字属性情報格納部に格納される
文字属性分類表の一例を示す図である。文字属性分類表
２０は、個々の文字属性２４の情報を階層的に分類した
記述（データ構造）から構成されている。つまり、文字
属性２４の各々の情報を階層的に分類して、各々の上位
となる組に各々の分類名２１，２２，２３の情報を付与
したものとなっている。ここに示している文字属性分類
表２０では、イタリック体，ボールド体，一重下線，二
重下線，赤色，青色，黄色，ストライクアウト（一重
線），ストライクアウト（二重線），肩文字，足文字の
それぞれの文字属性２４の情報が第４階層となって分類
されており、その上位の第３階層の分類名２３として、
斜体文字系，太文字系の２つの分類名が設けられてい
る。つまり、イタリック体に対しては斜体文字系，ボー
ルド体に対しては太文字系の２つの分類名が設けられて
いる。更に、上位の第２階層の分類名２２としては、書
体，下線，文字色，ストライクアウトの４つの分類名が
設けられている。そして、最上位の第１階層の分類名２
１には、強調，削除，肩文字，足文字の４つの分類名が
設けられている。

【００２８】このように、文字属性分類表２０において
は、これらの各階層の個々の分類名２１，２２，２３と
共に、個々の文字属性２４の情報が、階層構造をなすデ
ータ構造で分類されており、上位階層の分類名２１，２
２，２３を１つを指定することにより、その下位に属す
る文字属性の情報の全てが指定できるデータ構造となっ
ている。

【００２９】文字属性分類表２０においては、各々の文
字属性の論理的意味を考慮して、文字属性が、その役割
に基づいて分類されている。すなわち、まず、第１階層
の分類（分類名２１）で、強調，削除などの文字属性の
大ざっぱな役割に基づいて分類しており、次に、第２階
層の分類（分類名２２）で細分化し、更に、第３階層の
分類（分類名２３）へと、分類を更に細分化して、物理
的な共通の特徴を有する文字属性の情報をグループ化し
て分類している。

【００３０】図３は、テキスト処理部が、テキスト処理
の一部で行う文字属性代替処理の処理フローを示すフロ
ーチャートである。この文字属性代替処理は、例えば、
テキスト処理の中で、タイプが異なるテキストの処理を
行う場合に起動されるが、処理不可能が文字属性が検出
されたときに、起動されるようにしておいても良い。こ
のようにして、タイプが異なるテキストの処理を行う場
合に、文字属性代替処理を起動して、文字属性を判別し
て代替する処理を行う。ここでの文字属性代替処理で
は、入力テキストの各々の文字属性から、出力テキスト
のタイプで使用できる文字属性を判別し、その文字属性
に代替する。この場合、その出力テキストタイプで設定
可能な文字属性の集合が予じめ設定されており、その文
字属性の集合の中の文字属性に代替する処理が行われ
る。

【００３１】図３を参照して、文字属性代替処理を説明
する。処理が開始されると、まず、ステップ３０におい
て、ワーク領域Ａに、出力テキストタイプで設定できる
文字属性の集合を保持する。次に、ステップ３１におい
て、入力テキストを順に読み込む。続いて、ステップ３
２において、読み込んだ入力テキストの中に文字属性が
設定されている文字列が見つかるか否かを判定する。こ
の判定ステップで、文字属性の設定されている文字列が
見つからないと、文字属性の代替は行わないので、処理
は終了とする。また、この判定ステップで文字属性の設
定されている文字列が見つかると、次のステップ３３に
進み、その見つかった入力テキストの文字列の文字属性
をワーク変数ｘに代入する。

【００３２】次に、ステップ３４において、ワーク変数
ｘの文字属性がワーク領域Ａの文字属性の集合に含まれ
ているか否かを判定する。ワーク変数ｘの文字属性がワ
ーク領域Ａの文字属性の集合の中に含まれている場合に
は、入力テキストの文字属性は出力テキストにおいても
設定可能なものであり、その文字属性の代替は、特に行
わないので、次の文字属性に対する処理を行うため、ス
テップ３１に戻る。

【００３３】また、ステップ３４の判定処理において、
ワーク変数ｘの文字属性がワーク領域Ａの文字属性の集
合の中に含まれていないことが判定されると、この場合
において、入力テキストの文字属性を、出力テキストの
タイプで設定されている文字属性の中から、類似の文字
属性に代替する処理を行う。そのため、次のステップ３
５からの処理により、文字属性分類表に従って当該文字
属性を出力テキストタイプの中の文字属性に代替する処
理を行う。

【００３４】ステップ３５においては、ワーク変数ｘに
代入された文字属性に対し、その文字属性が分類されて
いる分類名の中で、ワーク領域Ａに含まれる文字属性を
上から順番に捜す処理を行う。つまり、文字属性分類表
を参照し、代替すベき文字属性が分類されている同じ分
類名の中で、ワーク領域Ａの文字属性の集合に含まれる
文字属性を上から順番に捜す処理を行う。そして、次
に、ステップ３６において、該当する文字属性が捜し出
された否かを判定する。当該する文字属性が捜し出され
たことが判定できると、ステップ３７に進み、入力テキ
ストの文字列に設定された文字属性を、捜し出された文
字属性に代替する処理を行う。そして、続いて、次の文
字属性の処理を行うため、ステップ３１に戻る。

【００３５】また、ステップ３６の判定処理において、
該当の文字属性が捜し出されないことが判定されると、
更に、上位の分類名の中で、同じ分類名で分類されてい
る文字属性への代替を行うため、次に、ステップ３８に
進み、当該分類名が第１階層の分類名であるか否かを判
定する。当該分類名が第１階層の分類名でないと判定で
きると、文字属性分類表の中に当該分類名より更に上位
の分類名があり、その上位の分類名と同じ分類名で分類
されている文字属性に代替できるので、次のステップ３
９に進み、更に１つ上位の階層の分類名において、同じ
分類名で分類されている文字属性の中で、ワーク領域Ａ
に含まれる文字属性を上から順番に捜す処理を行う。そ
して、次にステップ３６に戻り、同じく、該当する文字
属性が捜し出された否かを判定する。当該する文字属性
が捜し出されたことが判定できると、ステップ３７に進
み、入力テキストの文字列に設定された文字属性を、捜
し出された文字属性に代替する処理を行う。そして、続
いて、次の文字属性の処理を行うため、ステップ３１に
戻る。

【００３６】また、ステップ３８の判定処理において、
当該分類名が第１階層の分類名である場合には、当該分
類名が文字属性分類表の中の最上位の分類名であり、他
に代替できる文字属性が存在しないことなので、この場
合には、ステップ４０に進み、当該入力テキストの文字
列に設定された文字属性を取り消す処理を行う。そし
て、続いて、次の文字属性の処理を行うため、ステップ
３１に戻る。

【００３７】このような一連の処理を行い、入力テキス
トの文字属性を出力テキストタイプで設定できる複数の
文字属性の中で、文字属性分類表に従って、できるだけ
類似した関係（階層構造で同じ分類名）で分類されてい
る文字属性への代替を行う。これにより、どのように異
なるタイプのテキストに対しても、文字属性を代替する
判別を行い、その判別に従い文字属性の代替を行い、そ
の代替された文字属性によってテキストの処理が可能と
なる。

【００３８】次に、このような文字属性代替処理を伴う
テキスト処理を用いて、タイプの異なるテキストの間の
テキスト変換処理を行う場合について説明する。図４
は、テキスト変換処理の処理の流れを示すブロック図で
あり、図５は、テキスト変換処理により変換されるタイ
プの異なるテキストの変換前および変換後のテキストの
一例を説明する図である。

【００３９】図４および図５を参照して、テキスト変換
処理を説明する。まず、全体の流れの概略から説明する
と、入力テキスト４１が、文字属性代替処理部４２に順
次に読み込まれて、文字属性代替処理部４２が、入力テ
キスト４１の文字列から文字属性の設定を見つけると、
その文字属性を、文字属性分類表４３に基づいて、代替
の必要があれば（例えば対応する文字属性が存在しない
場合など）、これを判別して、他の文字属性への代替を
行い、中間テキスト４４を出力する。出力された中間テ
キスト４４は、文字コード変換処理部４５に供給され、
更に、文字コード変換処理部４５が、必要であれば（例
えばＪＩＳコード，ＥＣＵコードなど文字コードの体系
が異なる場合など）、文字コードの変換を行い、出力テ
キスト４６を出力する。

【００４０】図５には、テキスト中の特定の文字列の領
域に文字属性が設定されている状態が具体的に例示され
ている。図５において、５１は入力テキスト、５２は第
１の文字属性が設定された文字列、５３は第２の文字属
性が設定された文字列、５４は第１の文字属性、５５は
第２の文字属性、５６は入力テキストタイプにおいて設
定可能な文字属性の集合、５７は変換された出力テキス
ト、５８は出力テキストタイプにおいて設定可能な文字
属性の集合、５９は第３の文字属性をそれぞれ示してい
る。

【００４１】ここでのテキスト変換処理では、入力テキ
スト５１が与えられ、更に、出力タイプが指定されるこ
とにより、テキスト変換処理に伴う文字属性代替処理で
は、文字列に設定された文字属性を、入力タイプにおい
て設定可能な文字属性の集合５６の中の文字属性から、
出力タイプにおいて設定可能な文字属性の集合５８の中
の文字属性への代替が行なわれる。この処理は、文字属
性代替処理部４２が文字属性分類表４３を参照して行
う。

【００４２】具体的に説明する。文字属性代替処理部４
２は、まず、出力テキストタイプにおいて設定可能な文
字属性の集合５８を読み込み保持する。図５に示すテキ
ストの例では、文字属性の集合｛イタリック体，ボール
ド体，ストライクアウト（一重線）｝が読み込まれ保持
される（ステップ３０）。次に、入力テキスト５１を順
次に読み込み（ステップ３１）、文字属性が設定された
文字列５２を見つけると、その文字属性が出力テキスト
タイプにおいて設定できるか否かを調べる（ステップ３
２〜ステップ３４）。この例では、文字列５２に設定さ
れた第１の文字属性５４の「ストライクアウト（一重
線）」は、出力テキストタイプにおいて設定できるの
で、代替はせず、そのままの第１の文字属性５４の「ス
トライクアウト（一重線）」にしておく。

【００４３】更に、入力テキスト５１を、読み進んでい
くと、第２の文字属性が設定された文字列５３を見つけ
る。同じく、その文字属性が出力テキストタイプにおい
て設定できるか否かを調べる（ステップ３２〜ステップ
３４）。この例では、第２の文字属性５５の「二重下
線」は、出力テキストタイプにおいて設定できない。こ
の場合、文字属性代替処理部４２では、出力テキストタ
イプにおいて設定できる文字属性の集合５８の中で、文
字属性分類表において最も近いところに分類されている
文字属性、つまり、なるべく下位の分類において同じ分
類に属する文字属性を選び出して、その文字属性に代替
する（ステップ３５〜ステップ３７）。

【００４４】この例の場合、文字属性分類表４３とし
て、図２に示した文字属性分類表２０を用いるものとす
ると、文字属性の「二重下線」の最も近いところに分類
されている文字属性としては、当該文字属性の「二重下
線」が分類されている第２階層の分類名「下線」の分類
と同じ、第２階層の分類名「下線」の下に分類されてい
る文字属性「一重下線」が候補として得られる。しか
し、この文字属性「一重下線」は、出力テキストタイプ
において設定できる文字属性の集合５８に含まれておら
ず、次に、近いところに分類されている文字属性を見つ
けることになる。

【００４５】このため、次に、分類の範囲を更に１位だ
け上位として、当該文字属性の「二重下線」が分類され
ている第１階層の分類名「強調」の分類と同じ、第１階
層の分類名「強調」の下に分類されている文字属性
｛「イタリック体」，「ボールド体」，「一重下線」，
「二重下線」，「赤色」，「青色」，「黄色」｝が候補
として得られる。このため、これを上から順に捜して、
出力テキストタイプにおいて設定できる文字属性を捜す
（ステップ３８〜ステップ３９）。

【００４６】この結果、当該文字属性の「二重下線」が
分類されている同じ第１階層の分類名「強調」の下に分
類されている文字属性「イタリック体」が見つかり、こ
の文字属性は出力テキストタイプにおいて設定できるの
で、入力テキストの第２の文字属性５５の「二重下線」
は、出力テキスト５７の文字列５３の文字属性では、第
３の文字属性５９の「イタリック体」に代替されること
になる（ステップ３６〜ステップ３７）。

【００４７】なお、ここでは、同じ第１階層の分類の下
に、設定できるような文字属性がない場合には、代替は
行わず、出力テキストにおいて、当該領域には文字属性
が設定されないようにしている（ステップ４０）。これ
は、入力テキストの文字属性が、出力テキストにおい
て、論理的な役割の大きく異なる文字属性に代替される
ことを防ぐためである。

【００４８】全ての入力テキストを読み込み、文字属性
の代替処理を終了すると、文字属性が出力タイプにおい
て設定できる適切なものに変更された中間テキスト４４
が得られる。次に、中間テキスト４４に対して、文字コ
ード変換処理部４５により文字コードを変換する処理が
行われる。ここでの文字コードとは、各文字を符号化し
た表現形態のデータであり、ＪＩＳコード，ＡＳＣＩＩ
コード，ＥＵＣコードなどを指している。入力のテキス
トタイプが定める文字コードと出力のテキストタイプが
定める文字コードが異なる場合、文字コード変換処理部
４５は、文字コードの変換を行い、出力のテキストタイ
プが定める文字コードによって表現された、最終的な出
力テキスト４６を出力する。

【００４９】なお、ここでの説明では、入力テキスト４
１は、文字属性代替処理部４２によって、文字列の文字
属性の代替を行った後に、文字コード変換処理部４５に
よって、各々の文字の文字コードの変換を行うようにし
ているが、この２つの処理の順番は逆に行うような構成
であっても良い。

【００５０】また、このテキスト変換処理においては、
相互変換を行いたいテキストタイプの種類が多い場合に
も、文字属性分類表は１つだけ用意すれば十分である。
この意味は、１つの文字属性分類表により、その文字属
性の代替の関係が一意に定まるからである。文字属性の
代替の関係を変更する場合には、その対応の文字属性分
類表を作成する必要がある。このためには、予め事前に
複数の文字属性分類表が用意されていても良い。

【００５１】また、扱いたいテキストタイプを追加する
場合、追加するテキストタイプにおいて設定可能な文字
属性が全て追加前の文字属性分類表に含まれていれば、
何ら作業も不要である。そのまま当該文字属性分類表が
利用できる。また、もし、追加するテキストタイプにお
いて、設定可能な文字属性であって、追加前の文字属性
分類表に含まれていないものがあっても、その文字属性
を、文字属性分類表に追加するだけで良い。

【００５２】例えば、図２で説明した文字属性分類表２
０に、「ゴシック体」の文字属性を追加する場合、第１
階層の分類（分類名２１）を見ると、「ゴシック体」の
文字属性の役割から考慮して、分類名「強調」の分類の
下にあるのが適当であり、第２階層の分類（分類名２
２）では、分類名「書体」の下にあるのが適当であり、
更に、第３階層の分類（分類名２３）では分類名「太文
字系」の下にあるのが適当である。このため、結局、分
類名「太文字系」の下に分類されている文字属性「ボー
ルド体」と同じ分類に分類される文字属性として、「ゴ
シック体」の文字属性を追加することになる。これによ
り、その後に行われるテキスト変換処理においては、出
力テキストタイプにおいて文字属性「ゴシック体」が使
用できず、文字属性「ボールド体」が設定可能な場合、
文字属性「ゴシック体」は、文字属性「ボールド体」に
代替されるようになる。

【００５３】次に、文字属性代替処理を伴うテキスト処
理の更に別の処理の一例として、テキスト中の文字列に
文字属性が設定されている場合のテキスト検索処理につ
いて説明する。ここでのテキスト検索（文字列検索また
はパターンマッチングということもある）の処理とは、
検索対象テキストと呼ばれる文字列と、検索キー（キー
ワードまたはパターンということもある）と呼ばれる文
字列とを与え、検索キーが検索対象テキストの中に出現
するかどうかを判定し、更には、その出現位置の位置情
報を求める処理である。

【００５４】図６は、本発明の他の実施例にかかるテキ
スト検索装置の要部の構成を示すブロック図である。図
６において、６０はテキスト検索装置、６１は検索対象
テキスト、６２は検索キー、６３は検索結果、６４は文
字列照合処理部、６５は文字属性分類表、６６は文字比
較処理部、６７は検索対象テキストの文字、６８は検索
キーの文字、６９は判定結果、７０は文字属性代替処理
部である。

【００５５】テキスト検索装置６０は、検索対象テキス
ト６１および検索キー６２を入力として、検索結果６３
を出力する。この検索結果６３の出力形態としては、い
ろいろな態様が利用できる。例えば、検索キーが検索対
象テキストの中に出現するかどうかを示す態様や、検索
キーの検索対象テキストの中での出現位置を示す態様な
どがあるが、ここでは、検索結果６３として、検索キー
が検索対象テキストの中に出現するかどうかを示す態様
のテキスト検索処理を一例として説明する。

【００５６】テキスト検索装置６０は、文字列照合処理
部６４と文字比較処理部６６とから構成される。文字列
照合処理部６４は、検索対象テキスト６１および検索キ
ー６２の文字列を入力として、検索結果６３を出力す
る。文字列照合を高速に行う方法としては、例えば、Ah
o-Corasick法（Aho, A. V. and Corasick, M. J. : Eff
icient string matching: An aid to bibliographic se
arch, Comm. ACM, Vol.18, No. 6, pp. 333-340 ，197
5. ）などが知られており、この手法を文字列照合処理
部６４に用いることができる。文字列照合処理部６４
は、テキスト検索を行う方法であれば、例えば、Aho-Co
rasick法など、どのような方法を用いてもよく、本発明
の要部にかかる部分ではなく、公知であるので説明は省
略する。

【００５７】ここでの文字列照合の処理において、Aho-
Corasick法などのテキスト検索を行う方法と異なる部分
は、文字属性が設定された文字の文字比較処理の部分だ
けである。従って、以下では、文字属性が設定された文
字の比較処理を中心に説明する。このような文字の比較
処理は、文字比較処理部６６が行う。

【００５８】文字比較処理部６６は、検索対象テキスト
６１の中から、その検索対象の文字６７として、その文
字コード６７ａとその文字に設定された文字属性の集合
６７ｂが与えられ、更に、検索キーの文字６８として、
その文字コード６８ａとその文字に設定された文字属性
（分類名を含む）の集合６８ｂが与えられることによっ
て、文字属性をも含めた文字比較処理が行われる。ここ
での文字比較処理においては、文字属性代替処理部７０
が動作して、図２において説明した文字属性分類表２０
と同様に、ここでの文字属性を分類し記述した文字属性
分類表６５を参照して、その文字属性可能性の代替を判
別することにより、検索キーとして指定された文字（文
字属性）の条件に適合する文字を判定し、判定結果６９
を出力する。判定結果６９は一致または不一致のいづれ
かが出力される。

【００５９】文字属性分類表６５においては、前述した
文字属性分類表と同様に、第１階層となる分類名「強
調」および「削除」などの、文字属性の大ざっぱな役割
や、文字属性の見た目の類似度によって分類されている
態様が好ましい。これは、検索処理において、検索キー
に指定される文字属性は、その分類名による指定が可能
となるためである。このような分類名の指定によって、
検索キーの文字に対して複数の文字属性の指定が可能に
なり、検索処理を能率よく行える。

【００６０】また、このような検索処理のための特性
（文字属性の一致判定の関係）を定める文字属性分類表
６５の内容は可変である。これは、文字列の検索を行う
場合のその特徴に応じて、利用者が自由に文字属性分類
表を作成して使用できるようにするためである。

【００６１】また、そのような文字属性分類表によっ
て、複数のテキストタイプの相違を考慮する必要がなく
なり、異なるタイプの検索対象テキストに対しても、一
連の操作でテキスト検索処理が可能になる。

【００６２】次に、文字比較処理部６６の文字比較の別
の処理の例について説明する。ここでの文字比較では、
文字属性の一致判定のみを行えば良いので、文字属性分
類表を参照することによって、特に、前述のような文字
属性の代替は行なわず、例えば、次のようなステップ
〜ステップの処理手順で進められる。ステップ：検索対象テキスト中の文字６７（文字コー
ド６７ａとそこに設定された文字属性の集合６７ｂ）お
よび検索キーの文字６８（文字コード６８ａとそこに設
定された文字属性および分類名の集合６８ｂ）を入力す
る。ステップ：検索対象の文字コード６７ａと検索キーの
文字コード６８ａとが異なれば、不一致を出力して終了
する。ステップ：検索対象の文字コード６７ａと検索キーの
文字コード６８ａとが一致する場合、検索対象の文字属
性の集合６７ｂの中のある文字属性について、一致する
文字属性が、検索キーの側の文字属性および分類名の集
合６８ｂで指定される文字属性の中になく、かつ、その
文字属性が属する分類の分類名が（１つも）ないなら
ば、不一致を出力して終了する。ステップ：また、検索キーの側の文字属性および分類
名の集合６８ｂで指定される文字属性の中にある文字属
性について、一致する文字属性が、検索対象の文字属性
の集合６７ｂの中にないならば、不一致を出力して終了
する。ステップ：更に、検索キーの側の文字属性および分類
名の集合６８ｂの中のある分類名について、分類名の指
す分類に属する文字属性が、検索対象の文字属性の集合
６７ｂの中に（１つも）ないならば、不一致を出力して
終了する。ステップ：そうでなければ、一致を出力して終了す
る。

【００６３】次に、このような文字（文字属性）の検索
処理を、具体的な文字列の文字比較の中で説明する。図
７は、テキスト検索処理を行う検索対象テキストの一例
を説明する図であり、図８は、テキスト検索処理を行う
検索キーの一例を説明する図である。

【００６４】図７において、７５は検索対象テキストで
ある。検索対象テキスト７５は、いくつかの文字列に文
字属性が設定されている。“No return”の文字列７１
には、文字属性「ボールド体」が設定されており、“pr
isoner”の文字列７２には、文字属性「イタリック体」
および「ストライクアウト（一重線）」が設定されてい
る。“This”の文字列７３には、文字属性「イタリック
体」が設定されている。また、検索対象テキストのタイ
プとして、このテキストに設定可能な文字属性の集合７
４が与えられている。

【００６５】図８において、検索キー８０には“is”の
文字列８１が指定され、更に、このの文字列８１に指定
されている文字属性８２は、分類名「強調」の指定によ
る文字属性の設定となっている。このような分類名「強
調」の指定による文字属性の内容は、具体的には、前述
したように、文字属性分類表６５の記述によって与えら
れることになる。

【００６６】検索対象テキスト（７５：図７）と、検索
キー（８０：図８）との指定によって、テキスト検索処
理を開始した場合の処理結果について説明する。検索対
象テキスト７５の文字列の中には、検索キーとなっいる
“is”の文字列が何回か出現している。このうち、例え
ば、“prisoner”の文字列７２中に出現する“is”の文
字列は、その文字属性として「イタリック体」および
「ストライクアウト（一重線）」の２つの文字属性が設
定されている。

【００６７】ここで文字属性分類表（２０：図２）を参
照することにより、この文字列の文字属性「イタリック
体」は分類名「強調」の分類に属すると判定でき、この
点では、一致と判定される。しかし、同時に、この文字
列には文字属性「ストライクアウト（一重線）」が設定
されている。この文字属性の「ストライクアウト（一重
線）」は、検索キーで指定する文字属性として分類名
「強調」の分類に属すると判定できないので、この文字
属性の判定によって、判定結果として、不一致が出力さ
れる。

【００６８】また、“This”の文字列７３の中に出現す
る“is”の文字列は、文字属性として「イタリック体」
が設定されている。文字属性の「イタリック体」は、文
字属性分類表（２０：図２）を参照すると、分類名「強
調」の分類に属すると判定されるので、判定結果として
一致が出力される。したがって、この検索対象テキスト
７０に対して、検索キー８０による検索処理を行うと、
その処理において、一致と判定されるのは、“This”の
文字列７３の中に出現する“is”の文字列だけである。
したがって、最終的な判定結果としては、一致と判定さ
れる文字列が存在したので、検索結果として「成功（検
索キーが検索対象テキストの中に出現している）」を出
力する。

【００６９】このように、ここでの他の実施例にかかる
テキスト検索装置においては、文字列中のいくつかの文
字または文字の並びに、文字属性または文字属性の分類
名が設定されているような文字列を検索キーに用いるこ
とができる。ここでの文字属性の分類名とは、文字属性
分類表６５において、各々の文字属性が階層的に分類さ
れた分類名であるので、１つの分類名の指定により、そ
の下位に分類されている複数の文字属性を指定すること
ができる。文字比較において、分類名と文字属性とを比
較することになった場合、該当の文字属性がその分類名
の指示する下位の分類に属すれば、一致と判定する。

【００７０】図９〜図１２は、文字属性をも含めて文字
の比較を行う文字比較処理の一連の処理フローを示すフ
ローチャートである。図９は、文字比較処理の全体の処
理フローを示し、図１０は、第１の判定手続Ｐ１の処理
フローを示している。また、図１１に、第２の判定手続
Ｐ２の処理フローを示し、図１２に、第３の判定手続Ｐ
３の処理フローを示している。これらの判定手続Ｐ１〜
Ｐ３は、それぞれの処理の中で呼び出され、それぞれの
判定処理を行って、その結果を戻り値として呼び出され
た処理ルーチンに返す。

【００７１】図９〜図１２を参照して、テキスト検索処
理の一連の処理フローを説明する。まず、図９を参照す
る。ステップ９０において、検索対象テキストからの文
字，文字属性の集合をワークメモリのそれぞれ変数ｘ，
領域Ａに代入する。次に、ステップ９１において、検索
キーからの文字，文字属性の集合をワークメモリのそれ
ぞれ変数ｙ，領域Ｘに代入する。次に、ステップ９２に
おいて、文字（文字コード）の比較を行うため、代入し
た変数ｘと変数ｙとの文字が一致するか否かを判定す
る。一致しなければ、直ちに文字比較の判定結果では
「不一致」と判定できるので、ステップ１０１に進み、
「不一致」を出力して処理を終了とする。

【００７２】ステップ９２の判定において、変数ｘと変
数ｙとの文字が一致した場合、次に当該文字に設定され
ている文字属性の比較処理を行うため、次のステップ９
３に進み、領域Ａに代入されている文字属性ａについ
て、それぞれに第１の判定手続Ｐ１（ａ，Ｘ）を呼び出
す。そして、後述する第１の判定手続Ｐ１（ａ，Ｘ）か
らの判定結果が戻り値として返ってくると、次のステッ
プ９４において、戻り値は全てtrueであるか否かを判定
する。戻り値は全てtrueでなければ、文字属性は一致し
ないので、この場合、文字比較の判定は、判定結果が
「不一致」と判定される。次に、ステップ１０１に進
み、「不一致」を出力して処理を終了とする。

【００７３】ステップ９４の判定において、戻り値は全
てtrueである場合、ステップ９５およびステップ９７の
判定を行う。このため、まず、ステップ９５に進み、ワ
ークメモリの領域Ｘの中に文字属性があるか否かを判定
する。領域Ｘの中に文字属性があると判定される場合、
ステップ９６に進み、領域Ｘの中の全ての文字属性ｂは
領域Ａに含まれているか否かを判定する。この結果、含
まれていると判定できると、ステップ９７に進み、ま
た、含まれていないと判定されると、文字属性の集合比
較で一致しないので、文字比較の判定は、判定結果が
「不一致」と判定される。このため、ステップ１０１に
進み、「不一致」を出力して処理を終了とする。

【００７４】また、ステップ９５の判定により、領域Ｘ
の中に文字属性があると判定されなかった場合には、分
類名による比較を行うため、ステップ９７に進み、領域
Ｘの中に分類名があるか否かを判定する。また、ステッ
プ９６の判定において、領域Ｘの中の全ての文字属性ｂ
は領域Ａに含まれていると判定される場合、領域Ｘの中
に更に判定手続を行っていない分類名があるか否かを確
認するため、同じく、ステップ９７に進み、領域Ｘの中
に分類名があるか否かを判定する。この判定において、
領域Ｘの中に分類名がないと判定されると、文字属性だ
けの比較において一致と判定される。次に、ステップ１
００に進み、判定結果として「一致」を出力して、処理
を終了とする。

【００７５】ステップ９７において、領域Ｘの中に分類
名があると判定される場合は、分類名による文字属性の
比較を行うために、ステップ９８に進み、領域Ｘに代入
されている全ての分類名ｌについて、それぞれに第３の
判定手続Ｐ３（Ａ，ｌ）を呼び出す。そして、後述する
第３の判定手続Ｐ３（Ａ，ｌ）からの判定結果が戻り値
として返ってくると、次のステップ９９において、戻り
値は全てtrueであるか否かを判定する。戻り値は全てtr
ueでなければ、文字属性は一致しないので、この場合の
文字比較の判定は、判定結果が「不一致」と判定され
る。このため、ステップ１０１に進み、「不一致」を出
力して処理を終了とする。

【００７６】ステップ９９の判定において、戻り値は全
てtrueである場合、分類名の比較において、文字属性の
一致の判定が得られたことなので、ステップ１００に進
み、判定結果「一致」を出力して、処理を終了とする。
このようにして、検索対象と検索キーとの文字属性の比
較を、文字属性およびその分類名の集合の比較により行
い、その判定結果を得て、「一致」または「不一致」を
出力する。

【００７７】次に、図１０を参照して、第１の判定手続
Ｐ１（ａ，Ｘ）の処理について説明する。前述したステ
ップ９３の処理により、第１の判定手続Ｐ１（ａ，Ｘ）
が呼び出されると、この判定手続の処理においては、引
数として与えられた文字属性ａと領域Ｘの集合に対し
て、まず、ステップ１０２において、集合Ｘの中に文字
属性ａがあるか否かを判定する。集合Ｘの中に文字属性
ａがある判定されると、ステップ１０７に進み、trueを
出力してリターンする。

【００７８】また、ステップ１０２の判定において、集
合Ｘの中に文字属性ａがあると判定できないと、続いて
ステップ１０３において、集合Ｘの中に分類名があるか
否か判定する。分類名がない場合、分類名による集合の
比較は行う必要がないので、ステップ１０７に進み、tr
ueを出力してリターンする。また、ステップ１０３の判
定で、分類名があると判定できると、分類名による文字
属性の比較を行うために、ステップ１０４に進み、領域
Ｘに代入されている全ての分類名ｌについて、それぞれ
に第２の判定手続Ｐ２（ａ，ｌ）を呼び出す。そして、
後述する第２の判定手続Ｐ２（ａ，ｌ）からの判定結果
が戻り値として返ってくると、次のステップ１０５にお
いて、戻り値は全てfalseであるか否かを判定する。こ
の判定で、戻り値が全てfalseであれば、ステップ１０
６においてfalseを出力してリターンする。また、ステ
ップ１０５の判定において、戻り値は全てfalseと判定
できなければ、ステップ１０７に進み、trueを出力して
リターンする。この判定手続きにより、文字属性ａに対
する一致比較の結果が得られる。

【００７９】次に、図１１を参照して、第２の判定手続
Ｐ２（ａ，ｌ）の処理について説明する。前述したステ
ップ１０４の処理により、第２の判定手続Ｐ２（ａ，
１）が呼び出されると、この判定手続の処理では、引数
として与えられた文字属性ａと分類名ｌに対して、ステ
ップ１０８において、文字属性分類表を参照して、分類
名ｌの分類に含まれる文字属性の集合Ｌを得る。そし
て、次のステップ１０９において、文字属性ａは集合Ｌ
に属するか否かを判定する。文字属性ａは集合Ｌに属す
ると判定できない場合には、ステップ１１０に進み、fa
lseを出力してリターンする。また、文字属性ａが集合
Ｌに属する場合は、ステップ１１１に進み、trueを出力
してリターンする。この判定手続きにより、文字属性ａ
に対する分類名の一致比較の結果が得られる。

【００８０】また、図１２を参照して、第３の判定手続
Ｐ３（Ａ，ｌ）の処理について説明する。この処理は、
前述したステップ９８の処理により呼び出される。第３
の判定手続Ｐ３（Ａ，１）が呼び出されると、この判定
手続の処理では、引数として与えられた集合Ａと分類名
ｌに対して、ステップ１１３において、文字属性分類表
を参照して、分類名ｌの分類に含まれる文字属性の集合
Ｌを得る。そして、次のステップ１１４において、集合
Ｌに属するある文字属性ａ′は集合Ａに属するか否かを
判定する。すベての文字属性ａ′は集合Ａに属すると判
定できない場合には、ステップ１１５に進み、falseを
出力してリターンする。また、ある文字属性ａ′が集合
Ａに属する場合は、ステップ１１６に進み、trueを出力
してリターンする。つまり、ある文字属性ａ′が１つで
も集合Ａに属すれば、trueを出力する。この判定手続き
により、分類名に対する文字属性の一致比較の結果が得
られる。

【００８１】このようにして、テキスト検索処理におけ
る文字比較処理では、検索対象テキストの文字と検索キ
ーの文字に対して、文字（文字コード）の比較と共に、
当該文字に設定された文字属性について、その文字属性
または文字属性の分類名の指定によって、文字属性まで
含めた文字の相互間の比較処理が行われる。ここで指定
される分類名は、前述した文字属性分類表における分類
名であり、文字属性の論理的意味や役割によって個々の
文字属性が分類された集合を指示するものとなってい
る。

【００８２】したがって、検索キー中の文字列のいくつ
かの文字またはその並びの文字属性の指定は、文字属性
だけでなく、文字属性分類表における文字属性の分類名
によって、検索条件とする複数の文字属性を設定でき
る。このため、文字属性分類表の分類体系における文字
属性の論理的意味や役割による分類名により、論理的に
体系化された検索すべき文字属性の複数を指定して、文
字検索を行うこともできる。このため、文字属性につい
て包括的な指定を行うこともできる。例えば、分類名
「下線」を指定することで、一重下線または二重下線の
両方を指定することができる。

【００８３】次に、このようなテキスト検索処理を行う
場合に、検索キーとなる文字の文字属性の指定を、文字
属性分類表における分類名で指定する場合の操作例を説
明する。検索キーの文字属性の分類名の指定は、例え
ば、図１３に示すように、検索文字の文字属性の入力用
のウィンドウ１３１を開き、その入力フィールド１３２
に、指定の分類名をキーボード操作により、タイプ入力
することにより行う。例えば、図１３に示すウィンドウ
の入力例では、分類名の「強調」をタイプ入力してい
る。これにより、分類名「強調」の分類に属する全ての
文字属性が指定されたことと同じになる。また、更に下
位の分類名や、個別の文字属性をそれぞれに指定する場
合は、カンマで区切って、複数の分類名，文字属性を指
定する。

【００８４】このようなタイプ入力によって、文字属性
または分類名を指定する場合、誤った分類名や文字属性
をタイプする場合があるので、検索キーの文字列と文字
属性および分類名の指定入力を効率よく行えない危惧が
ある。そこで、例えば、図１４に示すように、ここで用
いる文字属性分類表と同様なレイアウトを有するメニュ
ー画面により、その文字属性および分類を指定するよう
にも変形できる。つまり、図１４に示す検索キーの文字
属性設定ウィンドウ１４０では、メニュー画面により文
字属性の「イタリック体」が選択され、また、分類名の
「ストライクアウト」が選択されて、その指定がなされ
ている。このような文字属性分類表と同様なレイアウト
のメニュー画面のユーザインタフェースを用いることに
より、文字属性および分類名を選択する操作が簡易にな
り、効率よく文字属性の指定操作が行える。

【００８５】したがって、この場合、検索対象テキスト
および検索キーに対して、そこで設定可能な文字属性の
集合やその種類について細かい知識がなくとも、正確に
文字属性および分類名の指定ができ、容易に検索条件の
指定ができる。更に、文字属性を階層的に分類している
文字属性分類表のレイアウト形式のメニューの表示によ
り、ユーザは文字属性分類表に対する情報をも得ること
ができる。

【００８６】また、更に、このような文字属性設定ウィ
ンドウ１４０と同様な文字属性分類の設定ウィンドウを
用いて、個々のユーザが文字属性分類表を随時に必要に
応じて定義して使用できるようにも構成できる。テキス
ト検索処理では、前述したように、文字属性分類表の分
類体系に従って、この文字属性の一致比較が行なわれる
ので、定義が変更された文字属性分類表を用いることに
より、文字属性の一致比較の判定基準を、ユーザの意図
に沿うように変更することが可能になる。

【００８７】また、文字属性を分類しておく文字属性分
類表を、テキスト検索処理における検索キーの指定が容
易に行えるような体系とすることにより、文字属性を含
むテキストの検索処理を、更に、効率よく行うことがで
きる。図１５は、テキスト処理装置において用いられる
文字属性分類表の別の一例を示す図である。図１５に示
す文字属性分類表１５１は、文字属性の論理的分類の大
部分を含むように構成された他の分類表の一例を示して
いる。文字属性分類表１５１においては、分類名が第１
階層から第４階層まで設けられ、論理的に体系付けられ
た分類体系となっている。例えば、文字属性分類表１５
１では、第１階層の分類名が「強調」の分類であり、第
２階層の分類名が「書体」の分類であり、更に、第３階
層の分類名が「フォント（字体）」の分類である１つの
分類に属するように設定されている文字属性「modern/
ゴシック」は、英語文の場合はmodern体の文字属性と
し、日本語文の場合はゴシックの文字属性とする文字属
性である。このような分類表における各々の分類名の情
報は任意に設定でき、また、変更もできる。更に、また
分類体系も任意に変更できる。

【００８８】図１６は、テキスト処理装置において用い
られる文字属性分類表の更に別の一例を示す図である。
図１６に示す文字属性分類表１５２においては、分類名
「削除」の分類を、第２階層の分類名「付加」の分類に
属する更に下位の第３階層の分類として設ける構造とし
ている。したがって、この文字属性分類表１５２を、図
４により説明したようなテキスト変換処理で用いると、
変換先のテキストのタイプにおいて、分類名「削除」に
属している文字属性「ストライクアウト（抹消線）」が
設定可能でない場合、同じ第３階層の分類の中で上から
順に該当する対応の分類が捜されて、その分類に属する
文字属性に代替される。したがって、その場合には、分
類名「下線」の分類に属する文字属性の中に１つに代替
される。具体的には、更に、下位の分類名「一重下線」
の分類に属する文字属性「（一重下線の）連続」に代替
される。

【００８９】また、この文字属性分類表１５２において
は、「肩文字」と「足文字」との文字属性は、これらが
分類される分類先（分類名）が変更されている。つま
り、第２階層の分類名が「書体」の分類であり、第３階
層の分類名が「大きさ（サイズ）書体」の分類であり、
第４階層の分類名が「小」である分類に変更されてい
る。このように、「肩文字」と「足文字」との文字属性
の分類が変更された結果、この文字属性分類表１５２を
テキスト変換処理で用いると、変換先テキストのタイプ
において、「肩文字」または「足文字」の文字属性が設
定可能でない場合、これらの文字属性が「（文字サイズ
の）小」に代替される。つまり、フォントを小さくする
ことで、その文字属性が代替されるようになる。

【００９０】また、同じく、この文字属性分類表１５２
によれば、文字属性「フィクスドピッチ」が、文字属性
「modern/ゴシック」および文字属性「白ヌキ」と同じ
分類に属するように分類されている。このため、変換前
テキストのタイプにおいて分類名「逐語引用」で指定さ
れる文字属性「フィクスドピッチ」が、変換先テキスト
のタイプにおいて設定可能でない場合、文字属性「mode
rn/ゴシック」に代替される代替指示となる。したがっ
て、変換後テキストタイプにおいて、「フィクスドピッ
チ」のフォントがない場合には、「modern/ゴシック」
のフォントに置き換わる。このように、文字属性分類表
１５２は、フォント変換指示の記述としても用いられ
る。

【００９１】次に、本実施例のテキスト処理装置で用い
るテキストを表現するデータ構造の他の一例について説
明する。ここでの処理対象とするテキストは、図５，図
７および図８にその一例を示したように、テキスト中の
任意の文字列（５２，５３など）に対して、その文字列
の文字属性（５４，５５，５９など）を設定している形
式を有するデータ構造となっている。このようなデータ
構造では、文字列の文字コードと、そこに設定されてい
る文字属性のコードとをそれぞれ別に扱い、メモリ上で
は、文字列データおよび文字属性データを個別に管理す
ることになる。このための処理が複雑となり、メモリ領
域も多く必要とするが、例えば、次に説明するようなデ
ータ構造のテキストを用いることにより、文字列と、そ
れに設定されている文字属性とを一元的に扱うことがで
きる。このようなデータ構造のテキストにおいても、本
実施例による文字属性の処理を含むテキスト処理は同様
に実施できる。

【００９２】図１７は、テキストの文字列の間に文字属
性を示すタグを埋め込んだ形式のデータ構造の一例を説
明する図である。具体例により説明すると、このデータ
構造では、テキスト１７０の文字列の中に、文字属性を
示すタグ１７１，１７２，１７３，１７４が埋め込ま
れ、そのタグによりそれ以降の文字列に対し、タグが示
す文字属性に設定されたものとする形式のデータ構造で
ある。このデータ構造では、テキスト１７０の文字列を
順次にサーチし、最初に見つかるタグ（＜ストライクア
ウト（一重線）＞）１７１により、それ以降の文字列
は、当該タグ１７１の示す文字属性「ストライクアウト
（一重線）」が設定された状態とされる。また、次に見
つかるタグ（＜default＞）１７２により、それ以降の
文字列は、同じく当該タグ１７２の示すデフォルトの文
字属性が設定された状態となる。つまり、文字属性が何
も設定されていない状態の文字列に戻る。したがって、
ここでのデータ構造では、これにより、“want”の文字
列に文字属性「ストライクアウト（一重線）」が設定さ
れた状態となっている。

【００９３】また、同様にして、次のタグ（＜二重下
線）＞）１７３により、それ以降の文字列は、タグ１７
３の示す文字属性「二重下線」が設定された状態とさ
れ、続いて次のタグ（＜default＞）１７４により、そ
れ以降の文字列は文字属性が何も設定されていない状態
の文字列に戻る。このため、同じく、“kunaicho”の文
字列には文字属性「二重下線」が設定された状態となっ
ている。

【００９４】図１７に示す他のデータ構造による文字属
性が設定された文字列からなるテキストの例は、図５に
示したテキストの例に対応して示されている。つまり、
図１７の変換前のテキスト１７０は、図５の変換前のテ
キスト５０に対応しており、図１７の変換後のテキスト
１７６は、図５の変換後のテキスト５７に対応してい
る。この場合、図４に示すようなテキスト変換処理が行
なわれ時、文字属性を代替する判別の処理が行なわれ、
文字属性「二重下線」を示すタグ１７３が、文字属性
「イタリック体」を示すタグ１７７に変更されることに
なる。なお、ここでの１７５は変換前のテキスト１７０
の設定可能な文字属性の集合を示し、１７９は変換後の
テキスト１７６の設定可能な文字属性の集合を示してい
る。

【００９５】また、テキスト変換処理により、変換前の
テキスト１７０（第１の変換後のテキスト１７６）が、
更に別のタイプのテキストに変換される場合、その変換
後のテキスト１８０のタイプにおいて、設定可能な文字
属性の集合１８１の中に文字属性「ストライクアウト
（一重線）」が含まれていない場合、文字属性「ストラ
イクアウト（一重線）」は取り消されることなる。した
がって、変換後のテキスト１８０においては、文字属性
「ストライクアウト（一重線）」の設定のためのタグ１
７１およびタグ１７２が削除される。この結果、第１の
変換後のテキスト１７６（変換前のテキスト１７０）の
“want”の文字列１７８は、タグ１７１およびタグ１７
２によって挾まれた状態から解消され、文字属性「スト
ライクアウト（一重線）」の設定が取消された状態とな
る。

【００９６】

【発明の効果】以上に説明したように、本発明のテキス
ト処理装置によれば、テキスト中のいくつかの文字列に
文字属性が設定されている文書中のテキストを処理する
場合、処理不可能な文字属性に対して、文字属性分類表
を用いて処理可能な文字属性の判別を行い、タイプの異
なるテキストに対する処理を行う。これにより、どのよ
うに異なるタイプのテキストに対しても、テキスト処理
が可能となる。文字属性分類表は、文字属性情報を階層
的に分類した記述と共に文字属性情報を分類した文字属
性の上位の分類名を含んでおり、このような分類名の指
定により、その下位の文字属性情報の全体を指定するこ
とができる。このため、特定の文字属性を指定する場
合、その文字属性が不明確な場合には、文字属性情報の
分類上の上位の分類名を指定することにより、不明確な
文字属性の指定とすることができる。

【図面の簡単な説明】

【図１】図１は本発明の一実施例にかかるテキスト処
理装置の全体の構成を示すブロック図、

【図２】図２は文字属性情報格納部に格納される文字
属性分類表の一例を示す図、

【図３】図３はテキスト処理部がテキスト処理の一部
で行う文字属性代替処理の処理フローを示すフローチャ
ート、

【図４】図４はテキスト変換処理の処理の流れを示す
ブロック図、

【図５】図５はテキスト変換処理により変換されるタ
イプの異なるテキストの変換前および変換後のテキスト
の一例を説明する図、

【図６】図６は、本発明の他の実施例にかかるテキス
ト検索装置の要部の構成を示すブロック図

【図７】図７はテキスト検索処理を行う検索対象テキ
ストの一例を説明する図、

【図８】図８はテキスト検索処理を行う検索キーの文
字列の一例を説明する図、

【図９】図９は文字比較処理の全体の処理フローを示
すフローチャート、

【図１０】図１０は第１の判定手続Ｐ１（ａ，Ｘ）の
処理フローを示すフローチャート、

【図１１】図１１は第２の判定手続Ｐ２（ａ，ｌ）の
処理フローを示すフローチャート、

【図１２】図１２は第３の判定手続Ｐ３（Ａ，ｌ）の
処理フローを示すフローチャート、

【図１３】図１３は検索キーの文字の文字属性および
分類名の設定ウィンドウの一例を示す図、

【図１４】図１４は検索キーの文字の文字属性および
分類名の設定ウィンドウの他の一例を示す図、

【図１５】図１５はテキスト処理装置において用いら
れる文字属性分類表の別の一例を示す図、

【図１６】図１６はテキスト処理装置において用いら
れる文字属性分類表の更に別の一例を示す図、

【図１７】図１７は文字属性を有するテキストの別の
データ構造を説明する図、

【図１８】図１８は従来の代替文字属性指定記述の一
例を示す図である。

【符号の説明】

１１…入力テキスト、１２…テキスト処理部、１３…文
字属性代替処理部、１４…文字属性情報格納部、１５…
文字属性分類表、１６出力テキスト、２０…文字属性分
類表、２１…第１階層の分類名、２２…第２階層の分類
名、２３…第３階層の分類名、２４…文字属性、４１…
入力テキスト、４２…文字属性代替処理部、４３…文字
属性分類表、４４…中間テキスト、４５…文字コード変
換処理部、４６…出力テキスト、５１…入力テキスト、
５２，５３…文字列、５４…第１の文字属性、５５…第
２の文字属性、５６…文字属性の集合、５７…出力テキ
スト、５８…文字属性の集合、５９…第３の文字属性、
６０…テキスト検索装置、６１…検索対象テキスト、６
２…検索キー、６３…検索結果、６４…文字列照合処理
部、６５…文字属性分類表、６６…文字比較処理部、６
７…検索対象テキストの文字、６８…検索キーの文字、
６９…判定結果、７０…文字属性代替処理部、７１，７
２，７３…文字列、７４…文字属性の集合、７５…検索
対象テキスト、８０…検索キー、８１…文字列、８２…
分類名「強調」、１３０…文字属性入力用ウィンドウ、
１３２…入力フィールド、１４０…文字属性設定ウィン
ドウ、１５１，１５２…文字属性分類表、１７０…変換
前テキスト、１７１，１７２，１７３，１７４，１７７
…タグ、１７５…設定可能な文字属性の集合、１７６…
第１の変換後のテキスト、１７８…文字列、１７９…設
定可能な文字属性の集合、１８１…設定可能な文字属性
の集合、１８０…変換後のテキスト。

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/21 - 17/26 G06F 17/30

Claims

(57)【特許請求の範囲】

【請求項１】テキスト中のいくつかの文字列に文字属性
が設定されているテキストを処理するテキスト処理装置
において、文字属性情報を階層的に分類した記述からなる文字属性
分類表を格納する文字属性情報格納手段と、処理不可能な文字属性に対して、文字属性分類表の記述
を参照して当該処理不可能な文字属性の分類名より上位
の分類名で分類されている文字属性を判別し、判別した
文字属性に代替してタイプの異なるテキストに対する処
理を行うテキスト処理手段とを備えることを特徴とする
テキスト処理装置。
【請求項２】請求項１に記載のテキスト処理装置におい
て、文字属性情報格納手段が格納する文字属性分類表
は、文字属性情報を分類した文字属性の上位の分類名を
含んでおり、分類名の指定により下位の文字属性情報の
全体の指定とすることを特徴とするテキスト処理装置。
【請求項３】請求項１に記載のテキスト処理装置におい
て、テキスト処理手段は、テキスト中のいくつかの文字列に
文字属性が設定されているテキストをタイプの異なるテ
キストに変換するテキスト変換処理を行い、入力テキスト中のある文字列に設定された第１の文字属
性が出力タイプにおいて設定できない場合に、文字属性
分類表の記述を参照して当該第１の文字属性の分類名よ
り上位の分類名で分類されている文字属性を判別し、判
別した文字属性から出力タイプにおいて設定できる第２
の文字属性を選択し、第１の文字属性を第２の文字属性
に代替することを特徴とするテキスト処理装置。
【請求項４】請求項１に記載のテキスト処理装置にお
いて、テキスト処理手段は、テキスト中のいくつかの文字列に
文字属性が設定されているテキストを検索対象として、文字列中のいくつかの文字または文字の並びの文字属性
の指定により、文字属性分類表を用いて文字属性情報の
分類の階層関係から文字属性を代替する判別を行い、テ
キスト中の文字列に対する検索を行うことを特徴とする
テキスト処理装置。
【請求項５】請求項２に記載のテキスト処理装置におい
て、テキスト処理手段は、テキスト中のいくつかの文字列に
文字属性が設定されているテキストを検索対象として、文字列中のいくつかの文字または文字の並びの文字属性
の分類名の指定により、文字属性分類表を用いて文字属
性情報の分類の階層関係から文字属性を代替する判別を
行い、テキスト中の文字列に対する検索を行うことを特
徴とするテキスト処理装置。
【請求項６】テキスト中のいくつかの文字列に文字属性
が設定されているテキストを処理するテキスト処理方法
であって、文字属性情報を階層的に分類した記述からなる文字属性
分類表を格納し、処理不可能な文字属性に対して、文字属性分類表の記述
を参照して当該処理不可能な文字属性の分類名より上位
の分類名で分類されている文字属性を判別し、判別した
文字属性に代替してタイプの異なるテキストに対する処
理を行うことを特徴とするテキスト処理方法。
【請求項７】文字属性が利用可能な第１のテキストタイ
プのテキストを第２のテキストタイプのテキストに変換
するテキスト変換装置であって、文字属性情報を階層的に分類した文字属性分類表を格納
する文字属性情報格納手段と、第１のテキストタイプのテキスト中の文字列に設定され
た第１の文字属性が第２のテキストタイプで利用可能な
文字属性でない場合、前記文字属性分類表で第１の文字
属性と同じ分類の上位の分類に属する第２のテキストタ
イプで利用可能な文字属性を選択して、文字属性を代替
する文字属性代替手段とを備えることを特徴とするテキ
スト処理装置。
【請求項８】文字属性が利用可能な第１のテキストタイ
プのテキストを第２のテキストタイプのテキストに変換
するテキスト変換装置が実行するテキスト変換方法であ
って、文字属性情報を階層的に分類し、第１のテキストタイプのテキスト中の文字列に設定され
た第１の文字属性が第２のテキストタイプで利用可能な
文字属性でない場合、前記文字属性の階層的な分類を参
照して、第１の文字属性と同じ分類の上位の分類に属す
る第２のテキストタイプで利用可能な文字属性を選択し
て、文字属性を代替することを特徴とするテキスト変換
方法。