JP2022177381A

JP2022177381A - 文書処理プログラム

Info

Publication number: JP2022177381A
Application number: JP2021083586A
Authority: JP
Inventors: 豊椿; Yutaka Tsubaki
Original assignee: Tsubaki IP Service Co Ltd
Current assignee: Tsubaki IP Service Co Ltd
Priority date: 2021-05-18
Filing date: 2021-05-18
Publication date: 2022-12-01

Abstract

【課題】特許明細書などの文書の作成の補助となる文書処理装置などを提供する。【解決手段】文字列の入力と表示が可能な文書処理プログラムは、表示された文字列の少なくとも一部を選択することが可能な選択ステップと、選択ステップにより選択された文字列中の第１の部分を読みとして、選択ステップにより選択された文字列中の第２の部分、または選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる。【選択図】図５

Description

この発明は、文書処理プログラムに関する。

下記特許文献１には、特許出願に添付される特許請求の範囲等に記載された請求項間の関連を表すクレーム全体構造を、その階層構造の容易な把握が可能なように出力、表示する方法が開示されている。

特開2012-27743号公報

この発明は、特許明細書などの文書の作成の補助を行う文書処理プログラムを提供することを目的としている。

この発明のある局面に従うと、文字列の入力と表示が可能な文書処理プログラムでは、表示された文字列の少なくとも一部を選択することが可能な選択ステップと、前記選択ステップにより選択された文字列中の第１の部分を読みとして、前記選択ステップにより選択された文字列中の第２の部分、または前記選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる。

好ましくは前記登録ステップは、前記選択された文字列に含まれる参照符号を、インプットメソッドエディタの辞書に登録する読みとして決定し、前記登録ステップは、前記選択された文字列に含まれる単語又は前記選択された文字列、及び前記選択された文字列の一部に含まれる参照符号を、インプットメソッドエディタの辞書に対応付けて登録する。

好ましくは、前記選択ステップで選択された文字列の中に第１の部分及び第２の部分が複数含まれるとき、前記登録ステップは、それぞれを前記辞書に登録する。

好ましくは文書処理プログラムは、前記インプットメソッドエディタの辞書に登録された内容を、データベースに登録する登録ステップをさらに備え、前記データベースの登録が削除されると、対応する前記インプットメソッドエディタの辞書登録も削除する削除ステップをさらに備える。

好ましくは文書処理プログラムは、前記登録された読みとそれに対応する文字列を、リストとして表示する表示手段をさらに備える。

この発明によると、上記課題の少なくとも１つを解決することができる。

本発明の第１の実施の形態における文書処理システムの構成を示すブロック図である。本発明の第１の実施の形態における文書処理システムの構成を示す機能ブロック図である。データベース２０７に格納されるデータ構造の具体例を示す図である。データベース２０７に格納されるデータ構造の具体例を示す図である。本発明の第１の実施の形態における文書処理システムに含まれるコンピュータプログラムのＩＭＥ登録・ＤＢ登録処理を示すフローチャートである。図５に続くフローチャートである。本発明の第１の実施の形態における文書処理システムに含まれる特許明細書エディタの画面構成を示す図である。

［第１の実施の形態］

図１は、本発明の第１の実施の形態における文書処理システムの構成を示すブロック図である。

図を参照して、文書処理システムは、ユーザ（システム利用者）が操作を行うコンピュータ１００と、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）３００と、インターネット４００と、他社コンピュータ資源２００と、自社コンピュータ資源５００とから構成される。

ユーザが操作を行うコンピュータ１００は、ＣＰＵ１０１と、通信部１０３と、Ｉ／Ｏ１０５と、ＲＯＭ１０７と、ＲＡＭ１０９と、記憶装置１１１と、音声入力／出力部１１３と、ディスプレイ１１５と、グラフィックユニット１１７と、キーボード１１９と、マウス１２１とを含んで構成されている。

コンピュータ１００は、ＬＡＮ３００に接続され、ＬＡＮ３００はインターネット４００に接続される。ＬＡＮ３００には自社コンピュータ資源５００が接続されており、インターネット４００には他社コンピュータ資源２００が接続されている。

ここでコンピュータ資源とは、サーバ、パーソナルコンピュータ、記憶装置（コンピュータ内のストレージ、ＮＡＳ（ＮｅｔｗｏｒｋＡｔｔａｃｈｅｄＳｔｏｒａｇｅ）など）、および情報通信経路（ネットワーク、ロードバランサ、スイッチ、ルータなど）、並びに、それらを構成するＣＰＵ、メモリ、記憶装置（ハードディスク、光学的または磁気的記憶装置、ＳＳＤほか半導体デバイス）、ＲＯＭ、マザーボード、キーボード、マウス、マイクなどの入力装置、ディスプレイ、およびスピーカなどの出力装置、並びに記憶装置から読み出され、一般にはメモリ上で動作するコンピュータプログラム、データなどのソフトウェアの全てまたは一部を示している。

自社コンピュータ資源５００とは、上記ユーザ（または上記ユーザが所属する組織）が所有しているコンピュータ資源である。組織は、ユーザ１名からなる組織であっても良いし、複数の人員から構成される組織であってもよい。

自社コンピュータ資源５００やコンピュータ１００は、インターネット４００に直接接続されておらず、インターネット４００には、ＬＡＮ３００のルータ（図示せず）を介して接続される。また、ルータ、自社コンピュータ資源５００、コンピュータ１００にファイヤウォール機能を設けることにより、インターネット４００側から自社コンピュータ資源５００やコンピュータ１００にアクセスすることが禁じられている。これにより、自社コンピュータ資源５００やコンピュータ１００がインターネット４００を介して外部から操作されることはなく、また、自社コンピュータ資源５００やコンピュータ１００に記憶されたデータに外部からアクセスすることが禁止されている。

他社コンピュータ資源２００とは、上記ユーザ（または上記ユーザが所属する組織）が所有するものではないコンピュータ資源である。上記ユーザは、コンピュータ１００からアクセスすることで他社コンピュータ資源２００の計算能力やストレージを一時的に借り受けることができる。その利用形態は、有償であると無償であるとを問わない。

文書データは、ワードプロセッサーが処理するファイル、ＨＴＭＬやプレーンなテキストファイルに保存され、自社コンピュータ資源５００やコンピュータ１００に記録される。文書データが画像である場合には、自社コンピュータ資源５００やコンピュータ１００に記録されたＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ／Ｒｅａｄｅｒ）のソフトウェアによりそれがＨＴＭＬ文書やテキスト文書に変換され、処理の対象とされる。

自社コンピュータ資源５００およびコンピュータ１００と、他社コンピュータ資源２００との間の通信プロトコルは、ＨＴＴＰＳ（ＨｙｐｅｒｔｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌＳｅｃｕｒｅ）等により行われる。すなわち、ＳＳＬ（Secure Sockets Layer）／ＴＬＳ（Transport Layer Security）プロトコルによって提供されるセキュアな暗号化（秘密鍵、公開鍵を使ったデータ暗号化手法）の上でＨＴＴＰ通信が行われるので、自社コンピュータ資源５００およびコンピュータ１００と他社コンピュータ資源２００との間の通信内容を秘匿化することができ、その通信内容が第三者に漏洩することは防止される。通信内容の第三者への漏洩を防ぐことができるのであれば、ＨＴＴＰＳ以外の暗号化通信を行っても良い。

図２は、本発明の第１の実施の形態における文書処理システムの構成を示す機能ブロック図である。

図１の記憶装置１１１には、ＣＰＵ１０１によって順に実行されることで、コンピュータ１００を文書処理装置として動作させるコンピュータ読取り可能な実行形式のプログラムが複数記録されている。プログラムは、記憶装置１１１からから読み出され、ＲＡＭ１０９上に展開される。プログラムがＲＡＭ１０９上でＣＰＵ１０１によって実行される。

プログラムの実行により、図２に示されるように、コンピュータ１００は、制御部２０１、通信部１０３、検索・置換部２０３、文書編集・単語登録部２０５、データベース２０７、メモリー２０９、記憶装置１１１、表示／出力部２１１、および入力部２１３としての機能を発揮する。

制御部２０１は、装置全体の各種制御を行う機能ブロックである。通信部１０３は、社内・社外のコンピュータ資源と通信を行うための機能ブロックである。検索・置換部２０３は、文書について、特定の要素（単語、文節など）の検索を行ったり、検索された要素を対応する文字列や暗号に置換する機能ブロックである。文書編集・単語登録部２０５は、文書を編集したり、単語変換のための辞書を登録する機能ブロックである。

データベース２０７は、主に単語辞書を登録するデータベースである。データベース２０７としてはデータベースサーバのソフトウェアを採用しても良いし、ＣＳＶファイルなどの単なるテキストファイルや、表計算ソフト（ＥＸＣＥＬなど）のテーブルを記録し、それを検索し、対応するデータを読み出すことでデータベースとしてもよい。

メモリ２０９は、データを一時的に記録するワーキングエリアである。記憶装置１１１は、不揮発性の記憶装置であり、文書データ、データベースに記録されるデータ、メモリ２０９のデータなどを記憶する。表示／出力部２１１は、ディスプレイ、スピーカなどのユーザインタフェースである。入力部２１３は、マウス、キーボード、マイクなどのユーザインタフェースである。

図３は、データベース２０７に格納されるデータ構造の具体例を示す図である。

ここではデータベース２０７は列名（カラム名、フィールド名）として、ＩＤ（レコード番号であり、データの通し番号）、符号（読み）、単語、変換後単語、属性、対応などを有するテーブルからなっている。図３では、符号に対応付けられている単語がデータベース２０７に登録されている例が示されている。

符号とは、特許明細書などの文書において、単語の直後に記載される文字列であって、その単語と、その単語が指す図面中の要素とを対応付けるための数字、アルファベットなどの文字列である。例えば図面中に描かれた電気自動車（図面中の要素の一例）に引き出し線が付され、「１０１」と番号が振られており、その電気自動車を明細書中で「電気自動車１０１」などと説明する場合、「１０１」が符号である。またこの場合の「電気自動車」は符号「１０１」に対応する単語である。

単語のカラムには、その符号に対応する単語（例えば明細書中に「電気自動車１０１」の文字列が表れるのであれば、そのうちの「電気自動車」）が登録される。一般には単語のカラムには名詞が登録されるが、動詞、副詞、形容詞などを登録しても良い。また名詞には、複数の名詞からなる複合名詞（電気＋自動車である「電気自動車」など）も含まれる。

ＩＤのカラムは、１レコードの通し番号を記録する。

変換後単語のカラムには、そのレコードにおける単語＋符号の文字列が記録される。例えば、図３のＩＤ＝０のレコードでは、符号が「１０１」、単語が「電気自動車」であるため、変換後単語のカラムには、「電気自動車１０１」が登録される。

属性のカラムには、例えばその「単語」が特許明細書中の実施の形態に登場する単語であれば「０」、請求の範囲に登場する単語であれば「１」などの属性が記録される。

対応のカラムには、そのレコードの単語に関連する他の単語のＩＤと、対応関係が記録される（複数の対応付けを行ってもよい）。例えば単語「信号入力部」に対して、他の単語である「信号入力手段」が対応する場合、それら単語が関連することと、その対応関係（例えば、請求項に出てくる単語と、それに対応する実施の形態に出てくる単語の関係であることを示すコード）が記録される。

この実施の形態において符号は、ＩＭＥ（Input Method Editor、インプット・メソッド・エディタ）のユーザ辞書に、その「符号」に対応する「変換後単語」の読みとしても登録される。

ＩＭＥは、パーソナルコンピュータ（ＰＣ）やタブレット端末、スマートフォン端末などの情報機器において、ハードウェアキーボード（物理キーボード）または画面上に表示されるソフトウェアキーボード（仮想キーボード）の上にある限られたキーの組み合わせで、漢字、ハングル、かな文字などキーボード上には無い文字を入力するためのソフトウェアである。ＩＭＥは、ハードウェアキーボードまたはソフトウェアキーボードから入力された文字列を、その文字列に対応する文字列に変換する処理を行う。ＩＭＥは、入力方式エディターやかな漢字変換ソフトとも呼ばれることもある。

ＩＭＥは辞書ファイルを用いて文字列の変換を行う。辞書ファイルには誰もが使用する基本辞書、オプションで追加される追加辞書、およびユーザごとに作成されるユーザ辞書がある。基本辞書には、例えば「せかい」に対応させた「世界」など、誰もが利用する単語が登録されている。追加辞書は、ユーザの利用環境に応じて追加される辞書であり、例えば専門用語を集めた辞書である。ユーザ辞書は、各ユーザごとに、単語と読みを登録、編集、削除できる辞書であり、ユーザ個別の辞書として機能する。

ＩＭＥの基本機能は、ひらがななどの文字列が入力された後に、変換キーが押されるなどすると、その文字列を、その文字列に対応して辞書登録されている文字列に変換するものである。１の文字列に対して複数の辞書登録がある場合、変換キーが押されるなどするごとに、次の候補の文字列が表示される。確定キーが押されるなどすると、表示されている文字列が入力確定文字列となる。その確定文字列は、次回の変換時に優先的に変換候補に表示される。また、ユーザ辞書による変換を他の辞書（基本辞書など）よりも優先的に行ったりする。よく使われる候補を早く表示させるためである。

ＩＭＥは、現在の入力途中の文字列（未確定文字列）に応じて辞書からピックアップした入力候補や変換候補を表示することができる（予測変換機能）。またＩＭＥは、ユーザ入力履歴をもとに学習して辞書や入力／変換候補の精度を強化していくことができる。

上述のように図３の「符号」は、ＩＭＥのユーザ辞書に、その符号に対応する「変換後単語」の読みとしても登録されるため、ユーザは例えば「１０１」をキーボードなどから入力し、変換キーを押すことで「電気自動車１０１」のＩＭＥによる変換結果を得ることができる。また、ＩＭＥの予測変換機能を用いると、「１０１」と入力する前に、または入力することで、「電気自動車１０１」のＩＭＥによる変換結果を得ることができる。これにより、ユーザによる入力の省力化を図ることができる。また、符号と単語との整合性の誤り（誤入力、タイプミス）を防ぐことができる。すなわち、ユーザは迅速に誤りなく単語＋符号からなる文字列の入力が可能となる。

なお、ＩＭＥに「符号」をそれに対応する「単語」の読みとして登録することもできる。この場合、ユーザは例えば「１０１」をキーボードなどから入力し、変換キーを押すことで「電気自動車」のＩＭＥによる変換結果を得ることができる。この場合も省力化や入力ミス軽減を図ることができる。

データベース２０７に複数のレコードがあれば、それら全ての符号および変換後単語のペアが辞書登録される。

図４は、データベース２０７に格納されるデータ構造の具体例を示す図である。

図４で示されているデータベース２０７の構成は、図３と同じである。図４では、符号に対応付けられていない単語がデータベース２０７に登録されている例が示されている。例えば特許明細書であれば、発明の実施の形態や要約書には符号に対応付けられている単語が出現し、特許請求の範囲には符号に対応付けられていない単語が出現することが多い。前者の単語を図３、後者の単語を図４のようにデータベースに登録し、対応カラムのデータによって対応付けるものである。

図４では図３とは違い、符号（読み）のカラムには、その単語のひらがな読みが記載される。例えばＩＤ＝２５０のレコードの単語は「検出手段」であるため、その符号（読み）のカラムには「けんしゅつしゅだん」の文字列が記録される。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。

また、図４においては、変換後単語としては符号のない単語のみが登録される（単語カラムと変換後単語カラムの両者は同じとなる）。

図４においても、データベース２０７に登録される符号（読み）とそれに対応付けられる変換後単語が、ＩＭＥに単語とその読みとして辞書登録される。

これによって、図４の登録がある状態においては、ユーザは単語の読みの「けんしゅつしゅだん」をキーボードから入力し、変換キーを押すことなどによってＩＭＥでそれを変換することで、「検出手段」の変換結果を得ることができる。また、予測変換機能を用いると、「けんしゅつしゅだん」を入力する途中で「検出手段」の変換結果を得ることができる。これにより、迅速に誤りなく単語の文字列の入力が可能となる。

なおＩＭＥはワープロソフト（マイクロソフト社のＷＯＲＤ、オープンソース方式で公開されているＯｐｅｎＯｆｆｉｃｅなど）に付属するものを用いてもよいし、ＯＳに付属するものを用いてもよいし、独自にインストールするものを用いてもよい。本発明は、ワープロソフトのマクロ（ＶＢＡ：ＶｉｓｕａｌＢａｓｉｃＦｏｒＡｐｐｌｉｃａｔｉｏｎｓなど）を用いて図５，６などのフローチャートのプログラムを実行することで実現されてもよい。本発明は、独自のエディタソフトで図５，６などのフローチャートのプログラムを実行することで実現されてもよい。データベースは、専用のデータベース（MySQL，SQLiteなど）でもＣＳＶファイルであってもよいし、マイクロソフト社のＥＸＣＥＬなどの表計算ソフトを用いてデータベースが形成され、ワープロソフトのＶＢＡを用いてデータベースへのアクセスが行われるものであってもよい。なお使用されるワープロソフト、テキストエディタ、プログラム言語の種類は、発明の実施において制限されるものではない。

処理の対象となる文書ファイルは、プレーンテキスト形式で記載されたテキストファイルであってもよいし、ワープロソフトの文書ファイルであってもよいし、ＨＴＭＬファイルであってもよい。また、画像に含まれる文字がＯＣＲによりテキスト化されたファイルであってもよい。画像ファイルを入力し、ＯＣＲ機能により文字部分をテキストデータに変換したファイルを作成しても良い。他、文章を記述することができるのであれば、ファイルのフォーマットは特定のものに限定されない。文書は、他のコンピュータからファイル転送プロトコルや電子メールソフトウェアを用いて受信しても良いし、ＵＳＢメモリなどのストレージから入力されても良い。また、キーボード１１９やマイクによって入力されても良い。文書は、インターネットからダウンロードすることとしてもよい。

以下のフローチャートで示される処理は、記憶装置１１１に記録されたコンピュータプログラムがＲＡＭ１０９上に読み出され、それをＣＰＵ１０１が順次実行することで実行される。プログラムは、コンパイルされた機械語の実行形式で保存されてもよいし、ソースコードをインタプリタが逐次実行する形式としてもよいし、中間言語で記載された形式としても良い。

図５は、本発明の第１の実施の形態における文書処理システムに含まれるコンピュータプログラムのＩＭＥ登録・ＤＢ登録処理を示すフローチャートであり、図６は、図５に続くフローチャートである。

ステップＳ１０１で、コンピュータ１００にインストールされているワープロソフトまたはテキストエディタソフトが起動されている場合を想定する。ソフトで文書または単語などのテキストが表示されている場合において、ユーザは登録を行いたい部分を選択する。選択は、マウス左クリックによって選択の始点から終点までをドラッグする方法や、カーソル位置を始点に合わせ、Ｓｈｉｆｔ＋矢印キーによってカーソルを移動させる方法などで行われる。形態素解析によってコンピュータ１００が単語の区切りを自動判断し、選択範囲を自動で決定、または範囲選択の補助をさせることとしてもよい。

ステップＳ１０１でテキストの選択後に登録処理のトリガが発生したのであれば、ステップＳ１０３に移行する。登録処理のトリガは、例えば特定のショートカットキーの押下、メニュー中の特定項目の選択、マウスの右クリック、特定の音声入力などのコマンド入力によって発生するものとする。また、単語登録を行いたい部分の選択が行われたら（または選択後所定時間が経過したら）自動的にトリガを発生させてもよい。

ステップＳ１０３においては、選択された範囲内に「単語」と「符号」からなる組（ペア）が含まれるかを判定する。ＹＥＳであればステップＳ１０５へ、ＮＯであればＳ２０５（図６）へ進む。ＹＥＳは、単語と符号のペアが選択範囲に含まれるので、それを図３の形式でデータベース２０７に登録するための処理である。ＮＯは、単語のみが選択範囲に含まれるので、それを図４の形式でデータベース２０７に登録するための処理である。

ステップＳ１０５においては、選択された範囲内に「単語」と「符号」からなる組（ペア）が複数組含まれるかを判定する。例えば文書中の１つの「単語」＋それに対応する１つの「符号」のペアのみが選択され、それを登録するのか、あるいは特許明細書であれば「［符号の説明］」の項目に記載されるような、１つの「単語」＋それに対応する１つの「符号」のペアが複数記載されている部分が選択され、それらペアの全てを登録するのかが判定される。

ステップＳ１０７において、選択範囲内の文字列を図３の「変換後単語」のカラムに、選択範囲内の単語部分の文字列を図３の「単語」のカラムに、選択範囲内の符号部分の文字列を図３の「符号（読み）」のカラムに、新たなレコードとして登録するため、これらのセットを取得する。新たなレコードには通し番号であるＩＤが付与される。また「属性」カラム用に、「符号の付いた単語である実施例中の単語である」などの属性が付与される。対応する他のレコードがある場合には、それをユーザから入力し、または自動判別し、「対応」のカラムに記録することとしてもよい。

ステップＳ１０７での登録処理は、例えば特許明細書であれば「［符号の説明］」の項目に記載されるような、１つの「単語」＋それに対応する１つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが１レコードとして、複数レコードが図３のデータベース２０７に登録される。

なお、選択範囲内に符号部分が含まれるか否かは、例えば選択範囲内の文字列の形態素解析や正規表現による検索で、その末尾に数字やアルファベットが含まれているか否かによって判断することができる。また、数字やアルファベットが連続する部分を判定することで、選択範囲内の符号部分の文字列を得ることができるし、それ以外の部分を選択範囲内の単語部分の文字列として得ることができる。

ステップＳ１０９において、ＩＭＥのユーザ辞書登録を行う。より詳しくは、「読み」を選択範囲内の符号部分の文字列、「単語」を選択範囲内の文字列、「品詞」を「短縮読み」などとして辞書の１つのレコードが登録される。「品詞」は「短縮読み」に限らず、「名詞」、「固有名詞」などでもよい。

例えば特許明細書であれば「［符号の説明］」の項目に記載されるような、１つの「単語」＋それに対応する１つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが１レコードとして、複数レコードがＩＭＥに登録される。

ステップＳ１１１において、データベース２０７への登録が確定する。

次に図６のステップＳ２０５以降の説明を行う。図６の処理は、選択範囲内に符号が含まれず、選択範囲内に単語のみが存在する場合に、図４に示されるようにデータベース２０７への単語登録を行い、ＩＭＥにも登録を行う処理である。

ステップＳ２０５において、選択範囲内に単語が複数含まれるかを判定する。これは例えば、それぞれが改行コード、カンマ、スペース、タブ記号で区切られた複数の単語が選択範囲内に存在するかを判定する処理である。

ステップＳ２０７において、選択範囲内の１つの単語と、そのひらがな読みを取得する。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。単語が複数あれば、全ての単語のひらがな読みが得られる。

ステップＳ２０９において、「読み」をひらがな読み、「単語」を選択範囲内の単語、「品詞」を「短縮読み」または「名詞」として、ＩＭＥに辞書登録する。

単語が複数記載されている部分が選択されていた場合には、各単語についてステップＳ２０９の処理が行われ、複数レコードがＩＭＥに登録される。

ステップＳ２１１において、データベース２０７への登録が確定する。

図７は、本発明の第１の実施の形態における文書処理システムに含まれる特許明細書エディタの画面構成を示す図である。

この画面は、特許明細書エディタのウィンドウを示している。ウィンドウの最上部にはタイトルバーが位置し、その下にメニューバーが位置している。メニューには、「ファイル」、「編集」、「機能」、「検索／置換」、「管理」、「分析」が含まれる。

メニューバーの下に、検索／置換バーが位置している。検索／置換バーは、検索するテキストを入力する第1のテキストボックスと、第1のテキストボックスに入力されたテキストを文書中から検索するトリガを発生させる「検索」ボタンと、選択された部分が置換されるテキストを入力する第２のテキストボックスと、第1のテキストボックスに入力されたテキストの文書中からの検索結果を、第２のテキストボックスに入力されたテキストに置換し、次の検索を行うトリガを発生させる「置換＋次」ボタンと、文章中から第1のテキストボックスに入力されたテキストを全て検索し、全てを第２のテキストボックスに入力されたテキストに置換する「全置換」ボタンとが含まれる。

検索／置換バーの下の画面は、左上、左下、右上、右下に４分割されている。左上は、特許明細書の最初から特許請求の範囲の前までを表示するテキストボックスである。左下は、特許明細書の特許請求の範囲から最後までを表示するテキストボックスである。右上は、特許明細書の実施の形態に記載された符号付きの単語について、その符号と、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下は、特許明細書の特許請求の範囲に記載された符号なしの単語について、その読みと、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下のリストコントロールの下に、選択状態とされたリストコントロールの要素を削除するための削除ボタンと、選択状態をキャンセルするためのキャンセルボタンと、リストコントロール中の２以上の要素が選択されている状態で、それら要素を対応付けて記録するための「登録」ボタンが表示される。

コンテンツがテキストボックスやリストコントロールの表示範囲に入りきれない場合、そのテキストボックスやリストコントロールの右側にスクロールバーが表示される。ユーザは、スクロールバーを操作することにより、コンテンツのうち表示される範囲を変更することができる。

ユーザはマウスやTabキーの押下によって、各テキストボックス、各リストコントロールを選択状態とすることができる。ユーザは各テキストボックスにおいては、テキストの入力、編集（コピー、ペーストなど）、削除などを行うことができる。また、選択範囲の登録を行うことができる。ユーザは各リストコントロールにおいては、所望の要素を選択状態とすることができる。複数の要素を同時に選択状態とすることも可能である。

右上のリストコントロールにおいては、図３のデータベースの登録内容が、符号の昇順に並べられて表示される。右下のリストコントロールにおいては、図４のデータベースの登録内容が、符号（読み）の昇順に並べられて表示される。データベースが更新されるごとに、両リストコントロールの内容がリアルタイムで更新される。

ユーザは例えば「水受けかご２」の文字列を入力したいときには、図７の右上のリストコントロールを見て、「２」が対応する符号であることを理解することができる。ユーザはテキストコントロールにカーソルがある状態で、「２」をタイプし、変換キーを押すことで（予測変換機能によれば変換キーを押すことなく）、「水受けかご２」のテキストを入力することができる。

また、ユーザは例えば「バランスリング取付部」の文字列を入力したいときには、「ばらんすりんぐとりつけぶ」をタイプし、変換キーを押すことで（予測変換機能によれば変換キーを押すことなく入力途中で）、「バランスリング取付部」のテキストを入力することができる。

なおデータベースの登録が削除されると、対応するインプットメソッドエディタの辞書登録も削除することが望ましい。使わない単語登録を削除し、ＩＭＥでの誤変換を防ぐためである。

また、文書ごとにデータベースを対応付けて管理し、ある文書を編集するときには対応するデータベースが読み出され、それに記録された符号（読み）と単語（または単語＋符号）がＩＭＥ辞書に登録されるようにしてもよい。文書ごとに、固有のデータベースと固有のＩＭＥの辞書を使うものである。また、文書の編集を終了するときには、対応するデータベースが読み出され、それに記録された符号（読み）と単語（または単語＋符号）がＩＭＥ辞書から削除されるようにしてもよい。

また、ユーザの入力によって、または自動的に、データベースに記録された符号（読み）と単語（または単語＋符号）をＩＭＥに登録させることとしてもよい。データベースの内容とＩＭＥに登録されるユーザ辞書とを同期させることとしてもよい。

ＩＭＥへの辞書登録は、ＩＭＥのデータベースに直接データを登録することとしてもよいし、デスクトップの自動化ソフトを利用することにより、ＩＭＥを起動させた後に自動的にダイアログ画面に必要な情報を入力し、「登録」ボタンが押されるようにプログラムを設計してもよい。ＩＭＥの起動は、ＩＭＥのexeファイル（実行ファイル）を実行することによって行ってもよいし、デスクトップの自動化ソフトでキーやマウスの自動操作を行うことでＩＭＥを起動させてもよい。

ユーザの入力によって、または自動的に、コンピュータによってデータベースから符号と対応する単語のペアを複数取得させ、それを符号の並び順（数字の昇順など）に一覧としてまとめた符号表を出力する機能を設けてもよい。特許明細書であれば、「符号の説明」を自動起草するものである。また、単語の文書中での出現回数をカウントし、出現回数が所定値以上の単語のみを符号表として出力してもよい。

［その他］

上述の複数の実施の形態、およびそれに含まれる要素（一部の構成、一部の処理）を組み合わせたり、入替えたりすることで新たな別の実施の形態とすることもできる。

なお、上記実施の形態において、文書処理は外部サーバを用いて行ってもよいし、スタンドアローンのＰＣ内やＬＡＮ内のＰＣ内で行ってもよい。

上述の実施の形態における処理は、ソフトウェアにより行っても、ハードウェア回路を用いて行ってもよい。また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをＣＤ－ＲＯＭ、フレキシブルディスク、ハードディスク、ＲＯＭ、ＲＡＭ、メモリカードなどの記録媒体に記録してユーザーに提供することにしてもよい。プログラムは、ＣＰＵなどのコンピューターにより実行される。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。

上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

１００コンピュータ
１０１ＣＰＵ
１０３通信部
１０９ＲＡＭ
１１１記憶装置
２００他社コンピュータ資源
２０３検索・置換部
２０５文書編集・単語登録部
２０７データベース
２０９メモリ
２１１表示／出力部
２１３入力部
４００インターネット
５００自社コンピュータ資源

Claims

文字列の入力と表示が可能な文書処理プログラムであって、
表示された文字列の少なくとも一部を選択することが可能な選択ステップと、
前記選択ステップにより選択された文字列中の第１の部分を読みとして、前記選択ステップにより選択された文字列中の第２の部分、または前記選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる、文書処理プログラム。
前記登録ステップは、前記選択された文字列に含まれる参照符号を、インプットメソッドエディタの辞書に登録する読みとして決定し、
前記登録ステップは、前記選択された文字列に含まれる単語又は前記選択された文字列、及び前記選択された文字列の一部に含まれる参照符号を、インプットメソッドエディタの辞書に対応付けて登録する、請求項１に記載の文書処理プログラム。
前記選択ステップで選択された文字列の中に第１の部分及び第２の部分が複数含まれるとき、前記登録ステップは、それぞれを前記辞書に登録する、請求項１又は２に記載の文書処理プログラム。
前記インプットメソッドエディタの辞書に登録された内容を、データベースに登録する登録ステップと、
前記データベースの登録が削除されると、対応する前記インプットメソッドエディタの辞書登録も削除する削除ステップをさらに備えた、請求項１から３のいずれか１項に記載の文書処理プログラム。
前記登録された読みとそれに対応する文字列を、リストとして表示する表示手段をさらに備えた、請求項１から４のいずれか１項に記載の文書処理プログラム。