[第1の実施の形態]
図1は、本発明の第1の実施の形態における文書処理システムの構成を示すブロック図である。
図を参照して、文書処理システムは、ユーザ(システム利用者)が操作を行うコンピュータ100と、LAN(Local Area Network)300と、インターネット400と、他社コンピュータ資源200と、自社コンピュータ資源500とから構成される。
ユーザが操作を行うコンピュータ100は、CPU101と、通信部103と、I/O105と、ROM107と、RAM109と、記憶装置111と、音声入力/出力部113と、ディスプレイ115と、グラフィックユニット117と、キーボード119と、マウス121とを含んで構成されている。
コンピュータ100は、LAN300に接続され、LAN300はインターネット400に接続される。LAN300には自社コンピュータ資源500が接続されており、インターネット400には他社コンピュータ資源200が接続されている。
ここでコンピュータ資源とは、サーバ、パーソナルコンピュータ、記憶装置(コンピュータ内のストレージ、NAS(Network Attached Storage)など)、および情報通信経路(ネットワーク、ロードバランサ、スイッチ、ルータなど)、並びに、それらを構成するCPU、メモリ、記憶装置(ハードディスク、光学的または磁気的記憶装置、SSDほか半導体デバイス)、ROM、マザーボード、キーボード、マウス、マイクなどの入力装置、ディスプレイ、およびスピーカなどの出力装置、並びに記憶装置から読み出され、一般にはメモリ上で動作するコンピュータプログラム、データなどのソフトウェアの全てまたは一部を示している。
自社コンピュータ資源500とは、上記ユーザ(または上記ユーザが所属する組織)が所有しているコンピュータ資源である。組織は、ユーザ1名からなる組織であっても良いし、複数の人員から構成される組織であってもよい。
自社コンピュータ資源500やコンピュータ100は、インターネット400に直接接続されておらず、インターネット400には、LAN300のルータまたはプロキシサーバ(図示せず)を介して接続される。また、ルータ、自社コンピュータ資源500、コンピュータ100にファイヤウォール機能を設けることにより、インターネット400側から自社コンピュータ資源500やコンピュータ100にアクセスすることが禁じられている。これにより、自社コンピュータ資源500やコンピュータ100がインターネット400を介して外部から操作されることはなく、また、自社コンピュータ資源500やコンピュータ100に記憶されたデータに外部からアクセスすることが禁止されている。
他社コンピュータ資源200とは、上記ユーザ(または上記ユーザが所属する組織)が所有するものではないコンピュータ資源である。上記ユーザは、コンピュータ100からアクセスすることで他社コンピュータ資源200の計算能力やストレージを一時的に借り受けることができる。その利用形態は、有償であると無償であるとを問わない。
秘密性の高い文章である処理対象の文書データは、HTMLやプレーンなテキストで記述され、自社コンピュータ資源500やコンピュータ100に記録される。文書処理の対象のデータが画像である場合には、自社コンピュータ資源500やコンピュータ100に記録されたOCR(Optical Character Recognition/Reader)のソフトウェアによりそれがHTML文書やテキスト文書に変換され、処理の対象とされる。
自社コンピュータ資源500およびコンピュータ100と、他社コンピュータ資源200との間の通信プロトコルは、HTTPS(Hypertext Transfer Protocol Secure)等により行われる。すなわち、SSL(Secure Sockets Layer)/TLS(Transport Layer Security)プロトコルによって提供されるセキュアな暗号化(秘密鍵、公開鍵を使ったデータ暗号化手法)の上でHTTP通信が行われるので、自社コンピュータ資源500およびコンピュータ100と他社コンピュータ資源200との間の通信内容を秘匿化することができ、その通信内容が第三者に漏洩することは防止される。通信内容の第三者への漏洩を防ぐことができるのであれば、HTTPS以外の暗号化通信を行っても良い。
図2は、本発明の第1の実施の形態における文書処理システムの構成を示す機能ブロック図である。
図1の記憶装置111には、CPU101によって順に実行されることで、コンピュータ100を文書処理装置として動作させるコンピュータ読取り可能なプログラムが複数記録されている。プログラムは、記憶装置111からから読み出され、RAM109上に展開される。プログラムがRAM109上でCPU101によって実行される。
プログラムの実行により、図2に示されるように、コンピュータ100は、制御部201、通信部103、検索・置換部203、文書編集・単語登録部205、データベース207、メモリー209、記憶装置111、表示/出力部211、および入力部213としての機能を発揮する。
制御部201は、文書処理装置全体の各種制御を行う機能ブロックである。通信部103は、社内・社外のコンピュータ資源と通信を行うための機能ブロックである。検索・置換部203は、文書処理の対象となる文書および処理後の文書の少なくとも一方について、特定の要素(単語、文節など)の検索を行ったり、検索された要素を対応する文字列や暗号に置換する機能ブロックである。文書編集・単語登録部205は、文書処理の対象となる文書および処理後の文書の少なくとも一方を編集したり、単語変換のための辞書を登録する機能ブロックである。
メモリ209は、データを一時的に記録するワーキングエリアである。記憶装置111は、不揮発性の記憶装置であり、文書処理前のデータ、文書処理後のデータ、データベースに記録されるデータ、コンピュータプログラム、そのデータ、メモリ209のデータなどを記憶する。表示/出力部211は、ディスプレイ、スピーカなどのユーザインタフェースである。入力部213は、マウス、キーボード、マイクなどのユーザインタフェースである。
コンピュータ100には、OS(オペレーティングシステム)がインストールされている。OSの機能によりキーボードやマウスなど入力デバイスからの制御信号に基づいた制御や、外部との通信や、ディスプレイなどへの表示制御、複数のアプリケーション(プログラム)を起動したときのCPUの時分割処理、メモリや固定記憶装置へのデータの入出力、これらの管理など、コンピュータ100を動作させるための各種制御が行われる。また、コンピュータ100を動作させるためのプログラムが機械語(実行形式のファイル)でない場合には、それを実行するためのインタープリターのプログラムがコンピュータ100にはインストールされる。
コンピュータ100には、ワードプロセッサーのソフトウェアがインストールされている。これは、例えばマイクロソフト社のWORDや、オープンソース方式で開発・供給されているOpenOfficeなどのソフトウェアである。ワードプロセッサーは、文書を処理、編集するためのソフトウェアであり、テキストエディタも含む概念である。
さらにコンピュータ100には、ブラウザのソフトウェアがインストールされている。これは、例えばマイクロソフト社のエッジ、インターネットエクスプローラー、mozilla.orgのFirefox、GOOGLE社のChromeなどのソフトウェアである。ブラウザのソフトウェアは、OSと協働して、HTML文書をレンダリングして画面表示を行ったり、JavaScript(登録商標)などのプログラムを実行したり、外部コンピュータとの通信(データ送信や処理のリクエスト、そのレスポンスの受信)などを行うソフトウェアである。ブラウザは独自開発のものであってもよいし、既存のプログラムの要素(コンポーネントやライブラリ)を利用(インポート)して動作するものであってもよい。
他社コンピュータ資源200や自社コンピュータ資源500のハードウェア構成、ソフトウェア構成も、コンピュータ100のそれとほぼ同じである。但し、他社コンピュータ資源200や自社コンピュータ資源500には、サーバソフトウェアやデータベースソフトウェアが記録されており、コンピュータ100からのアクセスに従い、レスポンスとして要求されたデータを返信する。
本発明を実施するためにコンピュータ100が通信するサーバは、他社コンピュータ資源200であってもよいし、自社コンピュータ資源500であってもよい。また、サーバソフトをコンピュータ100内にインストールし、コンピュータ100からそのコンピュータ100内のサーバにアクセスしてもよい。
サーバを用いず、HTML文書とスクリプト言語で本発明を実施するためのプログラムを記述し、それをコンピュータ100に保存してもよい。この場合、コンピュータ100に保存されたHTML文書ファイルをコンピュータ100のブラウザで開くと、図3の画面がコンピュータ100に表示され、サーバを用いずに本発明の実施が可能である。
このように本発明は、外部との通信を行う環境であっても、行わない環境(スタンドアローン環境)であっても実施することができる。
図3は、本発明の実施の形態の1つにおける文書処理システムに含まれるコンピュータ100のブラウザ画面を説明する図である。
コンピュータ100においてブラウザソフトウェアを立ち上げると、(さらに必要に応じて、他社コンピュータ資源200や自社コンピュータ資源500のIPアドレス、ポート番号、ドメインなどをユーザがブラウザに入力したり、メニューから選択したりすると)、ディスプレイ115に図3のようなブラウザ画面が表示される。
これは、コンピュータ100からのリクエストに応じて、他社コンピュータ資源200や自社コンピュータ資源500がレスポンスとして図3の画面を表示するためのHTML文書などをコンピュータ100に送信し、コンピュータ100がそれをブラウザ画面にレンダリングすることにより表示されるものである。
ブラウザ画面は、ディスプレイ115上の1つのウィンドウ内に表示される。ウィンドウの表示処理、制御は、OSにより行われる。コンピュータ100において、ブラウザと共にワードプロセッサーのソフトウェアも同時に起動して、ディスプレイ115上の別ウィンドウに表示させることも可能である。この場合、ブラウザ画面のウィンドウとワードプロセッサー画面のウィンドウとがディスプレイ115に同時に表示させることが可能である。また、一方のウィンドウまたは両方のウィンドウを最小化(画面上のタスクバーなどにのみ表示された状態)とすることも可能である。一方のウィンドウまたは両方のウィンドウを最大化(デスクトップ上に、最大化された画面のみが表示された状態)とすることも可能である。両ウィンドウを並列して1画面に表示し、双方を操作することも可能である。この場合、ユーザは一方のウィンドウに表示されたデータを一部又は全部選択し、それをコピーし、他方のウィンドウ内に貼り付ける操作(所謂コピーアンドペースト操作)を直感的に行うことができる。
すなわち、キーボード119やマウス121を用いて、ユーザはワードプロセッサー画面またはブラウザ画面に表示されたテキスト(HTML文書であってもよい)の一部または全部を選択状態(他の部分とは色を変えたり目印をつけるなどして、他の部分と区別できるようにした状態)とし、それをコピーすること(コンピュータ100の一時的にデータを保存できる共有のメモリ領域であるクリップボードに、選択状態となっているテキストのデータをコピーすること)ができる。
コピーされたクリップボードのデータは、ワードプロセッサー画面またはブラウザ画面の、ユーザにより指定された位置に貼り付けることが可能である。すなわちユーザは、クリップボードに一時保存されているデータを、ブラウザのユーザにより指定された入力フォームの位置や、ワードプロセッサー画面のユーザにより指定された位置にコピーすることが可能である。クリップボードとは、コピー・アンド・ペーストにてデータを移動(複製)する際のデータの一時保管所であるともいえる。
画面上に表示されたデータの選択、コピー、貼り付けなどの操作を容易にするために、コンピュータ100のOSの機能としてショートカットキーが準備されており、Windowsであれば、Ctrlキー+Aの押下により全文選択(全て選択)、Ctrlキー+Cの押下により、選択範囲のデータのクリップボードへのコピー、Ctrlキー+Vの押下により、クリップボードに保存されたデータのカーソル位置(指定位置)へのコピー(貼り付け)が可能である(なお、macOSであれば、Ctrlキーの代わりにCmdキーが用いられる)。Centosなど、Linux(登録商標)OSでも同様である。
ショートカットキーでの文書・テキスト操作は、OS間でほぼ共通であり、コピー・アンド・ペーストは、ユーザにとって直感的な操作が可能な機能であるといえる。
ユーザが特許明細書などの文書データから符号表を作成しようとするとき、その文書データは、ワープロソフトで開かれている文書のデータや、ブラウザソフトで表示されている文書のデータである。ユーザは、それらデータに対し、全てまたは一部を選択する(その操作を行うためには、ユーザはショートカットキーを用いてもよいし、メニューを表示してからそのメニュー中の「全て選択」をユーザが選択してもよい)。次にユーザは、選択されたデータのクリップボードへのコピー(または切り取りでもよい)操作を行う(その操作を行うためには、ユーザはショートカットキーを用いてもよいし、メニューを表示してからそのメニュー中の「コピー」(または「切り取り」)をユーザが選択してもよい)。
次に、ユーザは図3に示されるブラウザ画面の第1のフォーム(テキスト入力欄)601にカーソルを移動させる(これは、第1のフォーム601をユーザがマウスでクリックすることにより行われてもよいし、Tabキー押下などのフォーカス移動操作で行われてもよい)。この操作により、第1のフォーム601にフォーカスが移動する。
この状態で、ユーザはクリップボードのデータの貼り付けを行う(その操作を行うためには、ユーザはショートカットキーを用いてもよいし、メニューを表示してからそのメニュー中の「貼り付け(ペースト)」を選択してもよい)。
第1のフォーム601においては、ユーザはデータの貼り付けを行うことだけでなく、キーボード操作やマウス操作などにより、文章を入力したり、文章の一部または全部を削除したり、修正、編集を行うことが可能である。第1のフォーム601に入力された文書の処理結果は第2のフォーム603に表示される。ユーザは、その結果を見て第1のフォーム601に入力されて表示されたままになっている文書を修正したり、追加・削除したりすることができる。
ユーザが第1のフォーム601に文書を入力した後、「作成」ボタン609をマウスポインタでクリック(押下)すると、第1のフォーム601に入力された文書のデータが自社コンピュータ資源500または他社コンピュータ資源200に送信される。自社コンピュータ資源500または他社コンピュータ資源200では、第1のフォーム601に入力された文書のデータを処理し、そのうちの参照符号と、その参照符号が示す部材や要素の名称(単語)とを対応付けて抽出する。参照符号と名称とからなるセットは、通常は複数抽出される。重複するセットは削除され、参照符号の小さいもの順、アルファベットの順、名称のあいうえお順などの予め決められたルールでソートされ、符号表のデータが作成される。
作成された符号表のデータは、自社コンピュータ資源500または他社コンピュータ資源200からコンピュータ100にレスポンスとして返される。コンピュータ100は、レスポンスにより得た符号表のデータを、第2のフォーム603に表示する。
第1のフォーム601と同様、第2のフォーム603においても、ユーザはデータを見るだけではなく、キーボード操作やマウス操作などにより、符号表の一部を入力したり、一部または全部を削除したり、修正、編集を行うことが可能である。また、クリップボードからデータの貼り付けを行うこともできる。表示されている符号表データの一部又は全部を選択することや、クリップボードへのそのデータのコピーも可能である。
また前述のように、ユーザは、第2のフォーム603に表示された処理結果を見て、第1のフォーム601に入力されて表示されたままになっている文書を修正したり、追加したりすることができる。
すなわち、「作成」ボタン609のクリック(押下)によりデータの送信が行われても、第1のフォーム601に入力された内容は、消去されず、そのままの状態で保持される。
ユーザは、ダウンロードボタン605をクリックすることにより、CSV形式、またはEXCEL形式で表にまとめられた符号表を、コンピュータ100にダウンロードすることも可能である。例えばCSV形式であれば、1つの参照符号とそれに対応する名称がカンマまたはタブ記号で区切られて1行に記録され、それが複数行記録されるデータとされる。カンマまたはタブ記号の区切りはなくてもよい。
ユーザは第2のフォーム603が(マウスによるクリックなどで)フォーカスされた状態で、(ショートカットキーまたはメニュー選択で)第2のフォーム603の表示内容全てを選択し、(ショートカットキーまたはメニュー選択で)それをクリップボードにコピーし、(ショートカットキーまたはメニュー選択で)それをクリップボードからワープロソフトのウィンドウ内に貼り付けることで、符号表をワープロソフトの文書に貼り付けることが可能である。また、ブラウザ画面に表示されたコピーボタン607を押下すると、第2のフォーム603に記入されている内容が全てクリップボードにコピーされる。そのコピー内容である符号表をワープロソフトの文書に貼り付けることも可能である。
このように、ブラウザとショートカットキーを用いることで、ユーザは直感的な操作でワープロソフトの文書をサーバで処理させることが可能となり、また、処理結果をユーザは直感的な操作でワープロソフトに張り付けたり、活用することが可能となる。
図4は、本発明の実施の形態の1つにおける文書処理システムに含まれるコンピュータプログラムによる情報処理を示すフローチャートである。
このフローチャートで示される処理は、記憶装置111に記録されたコンピュータプログラムがRAM109上に読み出され、それをCPU101が順次実行することで実行される。プログラムは、コンパイルされた機械語の実行形式で保存されてもよいし、ソースコードをインタプリタが逐次実行する形式としてもよいし、中間言語で記載された形式としても良い。
また、図4の処理は、必要に応じて一部をコンピュータ100の通信相手である自社コンピュータ資源500または他社コンピュータ資源200が実行する(ステップS109での処理など)。これらの処理は、自社コンピュータ資源500または他社コンピュータ資源200の記憶装置に記録されたコンピュータプログラムがRAM上に読み出され、それをCPUが順次実行することで実行される。プログラムは、コンパイルされた機械語の実行形式で保存されてもよいし、ソースコードをインタプリタが逐次実行する形式としてもよいし、中間言語で記載された形式としても良い。
図4を参照して、ステップS101においてユーザはワープロソフトまたはブラウザソフトによって処理対象の文章(特に、特許や実用新案登録の明細書など、参照符号を含む書類)が記録された文書ファイルを開く(文書ファイルを補助記憶装置からRAMへ展開する)。処理対象の文章は、自分が作成したものであってもよいし、他人が作成したものであってもよい。処理対象の文章は、社内やコンピュータ100に保存してあるものであってもよいし、インターネットからダウンロードするものであってもよい。
文書ファイルは、プレーンテキスト形式で記載されたテキストファイルであってもよいし、ワープロソフトの文書ファイルであってもよいし、HTMLファイルであってもよい。また、画像に含まれる文字がOCRによりテキスト化されたファイルであってもよい。画像ファイルを入力し、ステップS101でOCR機能により文字部分をテキストデータに変換したファイルを作成しても良い。他、文章を記述することができるのであれば、ファイルのフォーマットは特定のものに限定されない。文書は、他のコンピュータからファイル転送プロトコルや電子メールソフトウェアを用いて受信しても良いし、USBメモリなどのストレージから入力されても良い。また、キーボード119やマイクによって入力されても良い。文書は、インターネットからダウンロードすることとしてもよい。文書は、ブラウザに表示されたものであってもよい。
ステップS103において、ユーザはブラウザソフトを起動し(既に起動している場合はそのインスタンスに対して)、URLを入力、または登録から読み出すことで、自社コンピュータ資源500または他社コンピュータ資源200のサーバソフトウェアにアクセスする。
サーバはレスポンスとして、図3のブラウザ画面を表示させるためのHTMLファイル、CSSファイル、スクリプトファイルその他のデータをコンピュータ100に送信する。
コンピュータ100は、受信したファイルなどのデータを処理することにより、図3の画面を表示する。
ステップS105においてユーザは、ショートカットキー操作またはメニュー操作によって、処理対象の文書の全文または一部を選択し、ショートカットキー操作またはメニュー操作によって、クリップボードにそれをコピーする。そして、ショートカットキー操作またはメニュー操作によって、図3のブラウザ画面の第1のフォーム601に、クリップボードに一時保存された明細書のデータを貼り付ける(コピーする)。データは、文書ファイルをアップロードすることでサーバに送信されてもよい(この場合、サーバは送信されたファイルを解析して、符号表を作成し、コンピュータ100にレスポンスとして返す)。
また、コピー・アンド・ペーストではなく、ユーザが第1のフォーム601にキー入力で直接明細書の文書を入力してもよい。
ステップS107において、作成キー609が押下されると、HTTPSのSSL通信により、送信元のIPアドレスなどの情報とともに、第1のフォーム601に入力されたデータが自社コンピュータ資源500または他社コンピュータ資源200に送信される(符号表作成処理がスタートする)。
ステップS109において、自社コンピュータ資源500または他社コンピュータ資源200は、プログラムに従い、送信されてきた明細書などの文書データを処理し、符号表を作成する。作成においては、文書データが文頭(または末尾)からスキャンされ、各文字が、参照符号部分、それに対応する名称部分、参照符号でも名称でもない部分にラベリングされる。ラベリング処理は文字単位で行われてもよいし、形態素解析によってわかち書きされた語の単位(言語で意味を持つ最小単位である形態素単位)で行われてもよい。
各単位をラベリングするためのルールには、形態素解析の結果(単位の品詞、活用形など)を利用してもよいし、正規表現による判断(例えば数字は参照符号部分とするなどの判断)を行ってもよい。OKワードとして登録された単語は名称とする、NGワードとして登録された単語は名称としない、などのルールを定めてもよい。同様に、参照符号と判断する文字列、参照符号と判断しない文字列を登録してそのルールに従って処理を行ってもよい。分類のアルゴリズムを構築してもよい。
また、過去の多数の公開された特許出願のデータ(特に、符号の説明の欄に記載された参照符号と名称のデータ)を用い、機械学習により、文章のある一部分が参照符号である確率、名称である確率、それ以外である確率を計算させ、それに基づいてラベリングを行なってもよい。上述のラベリング手法を複数組み合わせてアルゴリズムとして用いてもよい。
例えば仮に、電気自動車について記載された特許明細書から符号表を作成するものとし、文書ファイルに、
「[0023]
電気自動車100は、エンジン101と表示部102を備え、エンジン101は、信号入力手段103と表示部102に接続される。信号入力手段103の入力Iがハイである場合、表示部102は警告Wを表示する。」の文章が記載されていたものとする。なお、[0023]は、文書中の段落番号である。この文章がサーバで処理されると、
100 電気自動車
101 エンジン
102 表示部
103 信号入力手段
I 入力
W 警告
の符号表が作成され、それがコンピュータ100にレスポンスとして送られる。
ステップS111で、コンピュータ100はレスポンスとしての符号表のデータを受信する。ステップS113で第2のフォーム603に符号表のデータが表示される。
なお、ステップS107からS111までの処理期間においては、ユーザに処理中であることを知らせるために、「処理中」の文字を画面に表示する、またはスピナーなどのアニメーションを画面に表示することが望ましい。
ステップS113での符号表のデータの表示は、ブラウザ画面に表示された第2のフォーム603内の要素をJavaScript(登録商標)、jQueryなどの言語で書き換えることで行ってもよい。ブラウザによるページ遷移を行わずにコンテンツの切り替えを行うシングルページアプリケーションとしてもよい。第1のフォーム、第2のフォームに文字列オブジェクトをセットして、ブラウザ画面を再度表示(遷移)させてもよい。
ステップS115において、ユーザは第1および第2のフォームに表示された内容を編集したり、コピーしたり、ダウンロードしたりすることが可能である。
ステップS117において、再度、作成キー609が押下されたのであれば、ステップS107の送信処理以降の処理が再度行われ、更新された第1のフォームの内容で符号表の作成が行われる。
[その他]
明細書中の参照符号に対応付けられる名称は、単語である。ここでの単語は、複合語や合成語も含む概念である。また、単語に形容詞が含まれてもよい。単語は名詞であることが多いが、動詞など他の品詞の単語が参照符号と対応付けられてもよい。
上述の複数の実施の形態、およびそれに含まれる要素(一部の構成、一部の処理)を組み合わせたり、入替えたりすることで新たな別の実施の形態とすることもできる。
符号表の作成には、形態素解析や係り受け解析等、自然言語の電子計算機による処理(自然言語処理:NLP(natural language processing))を利用することが望ましい。また、公開特許公報などの情報から名称データベースや参照符号データベースを作成して、文章中の名称や参照符号の抽出を行ってもよい。機械学習やニューラルネットワークによって、多数の公開特許公報中の情報(特に、符号の説明の欄に記載された情報)を処理し、学習済データを作成してもよい。このデータを用いて、明細書の各単語について、名称らしさ、参照符号らしさを算出することで、参照符号部分と名称部分とそれ以外の部分とを判別することとしてもよい。
図3では、第1のフォーム601に処理すべきデータを入力・表示し、第2のフォーム603に処理結果を表示することとした。これらフォームとしては、例えばHTMLのformタグ、textareaタグで示される複数行のテキスト表示・入力エリアを使ってもよい。作成ボタン609はsubmitタイプのボタンとし、第1のフォーム601の内容をPOSTメソッドにより送信するものであってもよい。
また、図3では、第1のフォーム601に処理すべきデータを入力・表示し、第2のフォーム603に処理結果を表示することとしたが、処理結果を第1のフォーム601の末尾(または最初)に追加して表示することとしてもよい。このようにすると、第2のフォーム603を省略することができる。データ送信後は、処理すべきデータの表示は消去してもよい。また、処理すべきデータが消去された第1のフォーム601に、新たに処理結果を表示してもよい。
また、上述の実施の形態では、自社コンピュータ資源500または他社コンピュータ資源200のサーバにアクセスすることで処理を行うこととしたが、サーバのソフトウェアをコンピュータ100内で動かし、スタンドアローン構成で処理を行ってもよい。また、サーバによらず、処理ルーチンをJavaScript(登録商標)などのコンピュータ言語で記述することで、例えばコンピュータ100内に存在する符号表作成用のHTMLファイルをコンピュータ100のブラウザで開くことで、スタンドアローン構成での処理を行うことができる。処理ルーチンを他の言語で記述し、独自のアプリケーションとして本発明の処理をコンピュータで実行してもよい。
公開前の明細書など、秘密保持の必要のあるデータが送信されることを想定して、サーバとコンピュータ100との間の通信は、SSLによる暗号化通信であることが望ましい。また、サーバでは処理後に送信されてきたデータを保存せず、メモリから消去することが望ましい。さらに、サーバのバックエンドの処理(ロードバランサとサーバとの通信など)にも、SSLによる暗号化通信を行うことが望ましい。
インターネットを用いず、社内サーバで符号表作成処理を行ってもよい。
上述の実施の形態では、作成ボタンの押下により、符号表作成処理をスタートさせることとしたが、第1のフォームに文書がペースト(貼り付け)されたこと、第1のフォームに文書が入力されたこと、第1のフォームの内容に変更があったことなどをトリガとして、符号表作成処理(サーバへの送信処理)をスタートさせてもよい。
符号表は、(参照符号+スペース+その名称+改行)+(次の参照符号+スペース+その名称+改行)・・・の繰り返しで構成されてもよいし、スペースの代わりにコロンなどの文字列、タブ記号などが用いられてもよい。また、名称+スペース+その参照符号の順に配列してもよい。スペースは省略してもよい。また、改行せず、スペース、タブ、記号などで各セットの区切りを示してもよい。すなわち、改行により各セットの区切りを示してもよいし、他の方法で各セットの区切りを示してもよい。
ブラウザソフトをコンピュータ100で立ち上げたとき、図3の画面が表示されるようにしてもよい。また、ブラウザのソフトウェアコンポーネント(ソフトウェア部品)を利用して図3の画面を表示するソフトウェアを提供することとしてもよい。
実施の形態では、第2のフォームに処理結果を表示することとしたが、処理結果を表示する場所はフォームでなくてもよい。処理結果のテキストをHTML文書に含め、直接表示してもよい。処理結果のテキストをHTMLの構成部分に挿入して表示してもよい。
図3の画面が表示されたとき、フォーカスが第1のフォーム601にあってもよい。例えば図3の画面が表示されたとき、カーソルが第1のフォーム601内に位置するようにしてもよい。ユーザは、すぐに明細書など文書を第1のフォーム601に貼り付けることができるようになる。
処理結果を第2のフォーム603に表示するときには、フォーカスが第2のフォーム603にあってもよい。例えば処理結果が表示されたとき、カーソルが第2のフォーム603内に位置してもよい。またこのとき、第2のフォーム603内の内容が自動で全て選択されていてもよい。ユーザはコピー操作をするだけで、第2のフォーム603内の内容を全てクリップボードに貼り付けることができる。
符号表は、名称とその参照符号の順でなるセットを複数出力するフォーマットとしてもよい。また、このような符号表をデータとしてCSV、エクセルなどのファイルフォーマットでダウンロード可能としてもよい。そのような符号表データを、ユーザはワードプロセッサーの予測変換データなどとしてワードプロセッサーに登録することで、ワードプロセッサーの学習データとすることができる。例えば、名称の少なくとも一部がワードプロセッサーで入力されると、名称の全ての部分とその参照符号とに変換することを可能とするものである。
また、ワードプロセッサーに読みとして参照符号を登録し、参照符号が入力されると、それを対応する名称に変換することとしてもよい。また、参照符号が入力されると、それを対応する名称+その参照符号のセットに変換することとしてもよい。明細書を作成するときの労力を軽減することができる。
処理結果を第2のフォーム603に表示するときには、処理結果(第2のフォームの表示内容)がクリップボードに自動的にコピーされてもよい。また、処理結果を自動でクリップボードにコピーすることとし、第2のフォーム603および/または処理結果を表示しない事としてもよい。
ブラウザで図3の画面が表示されたとき、自動的にクリップボードの内容が第1のフォーム601に貼り付けられてもよい。
本発明は、日本語のみならず、英語、中国語、韓国語などの外国語文書に対応することも可能である。
[実施の形態の効果]
以上の実施の形態により、ユーザが直感的な操作で明細書など文書から符号表を作成でき、それを活用できるという効果がある。また、ユーザはプログラムやマクロをコンピュータ100にインストールする必要がないため、セキュリティの問題が生じず、保守のコストを減らすことができる。
すなわち、デスクトップ環境でワープロソフトにマクロを導入したり、コンピュータに独自のプログラムをインストールすることは、セキュリティ上問題となることがあるが、本実施の形態では、それがない。
特にマクロはコンピュータウィルス扱いされるケースが多い。文書ファイルにマクロが添付されたまま配布されるケースも多々あり、それが何らかの問題を引き起こすことが少なくない。独自のプログラムも、利用者が少ないなどの理由で、OSやセキュリティソフトによってその実行が停止させられたり、アンインストールの対象となったりすることがある。本実施の形態では、そのような問題がない。
マクロや独自のプログラムは、コンピュータで動作する他のプログラムと競合し、コンピュータの動作不具合の原因となることもあるが、本実施の形態では、通常用いられるブラウザを利用するため、そのような問題が生じない。
マクロやプログラムのコンピュータへのインストールを禁止している会社においても、本実施の形態の処理を行うことが可能である。
また、マクロや独自のプログラムは、導入や管理(バージョンアップなど)が面倒であるが、本実施の形態ではそのような問題がない。
さらに、マクロや独自プログラムは、ユーザインターフェースが独自のものであるため、直感的な操作が難しいという問題もがあるが、本実施の形態では、通常用いられるブラウザを利用するため、そのような問題が生じない。本実施の形態では、通常使うものと同じショートカットキーの操作やコピー・アンド・ペーストの操作で文書作成ができるため、ユーザにとっての利便性が高い。ユーザは、新たなソフトウェアやマクロの利用方法を学習することも不要である。
上述の実施の形態における処理は、ソフトウェアにより行っても、ハードウェア回路を用いて行ってもよい。また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD−ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザーに提供することにしてもよい。プログラムは、CPUなどのコンピューターにより実行される。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。