JP2022177381A - 文書処理プログラム - Google Patents
文書処理プログラム Download PDFInfo
- Publication number
- JP2022177381A JP2022177381A JP2021083586A JP2021083586A JP2022177381A JP 2022177381 A JP2022177381 A JP 2022177381A JP 2021083586 A JP2021083586 A JP 2021083586A JP 2021083586 A JP2021083586 A JP 2021083586A JP 2022177381 A JP2022177381 A JP 2022177381A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- word
- dictionary
- database
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 19
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000008520 organization Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【課題】特許明細書などの文書の作成の補助となる文書処理装置などを提供する。【解決手段】文字列の入力と表示が可能な文書処理プログラムは、表示された文字列の少なくとも一部を選択することが可能な選択ステップと、選択ステップにより選択された文字列中の第1の部分を読みとして、選択ステップにより選択された文字列中の第2の部分、または選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる。【選択図】図5
Description
この発明は、文書処理プログラムに関する。
下記特許文献1には、特許出願に添付される特許請求の範囲等に記載された請求項間の関連を表すクレーム全体構造を、その階層構造の容易な把握が可能なように出力、表示する方法が開示されている。
この発明は、特許明細書などの文書の作成の補助を行う文書処理プログラムを提供することを目的としている。
この発明のある局面に従うと、文字列の入力と表示が可能な文書処理プログラムでは、表示された文字列の少なくとも一部を選択することが可能な選択ステップと、前記選択ステップにより選択された文字列中の第1の部分を読みとして、前記選択ステップにより選択された文字列中の第2の部分、または前記選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる。
好ましくは前記登録ステップは、前記選択された文字列に含まれる参照符号を、インプットメソッドエディタの辞書に登録する読みとして決定し、前記登録ステップは、前記選択された文字列に含まれる単語又は前記選択された文字列、及び前記選択された文字列の一部に含まれる参照符号を、インプットメソッドエディタの辞書に対応付けて登録する。
好ましくは、前記選択ステップで選択された文字列の中に第1の部分及び第2の部分が複数含まれるとき、前記登録ステップは、それぞれを前記辞書に登録する。
好ましくは文書処理プログラムは、前記インプットメソッドエディタの辞書に登録された内容を、データベースに登録する登録ステップをさらに備え、前記データベースの登録が削除されると、対応する前記インプットメソッドエディタの辞書登録も削除する削除ステップをさらに備える。
好ましくは文書処理プログラムは、前記登録された読みとそれに対応する文字列を、リストとして表示する表示手段をさらに備える。
この発明によると、上記課題の少なくとも1つを解決することができる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態における文書処理システムの構成を示すブロック図である。
図を参照して、文書処理システムは、ユーザ(システム利用者)が操作を行うコンピュータ100と、LAN(Local Area Network)300と、インターネット400と、他社コンピュータ資源200と、自社コンピュータ資源500とから構成される。
ユーザが操作を行うコンピュータ100は、CPU101と、通信部103と、I/O105と、ROM107と、RAM109と、記憶装置111と、音声入力/出力部113と、ディスプレイ115と、グラフィックユニット117と、キーボード119と、マウス121とを含んで構成されている。
コンピュータ100は、LAN300に接続され、LAN300はインターネット400に接続される。LAN300には自社コンピュータ資源500が接続されており、インターネット400には他社コンピュータ資源200が接続されている。
ここでコンピュータ資源とは、サーバ、パーソナルコンピュータ、記憶装置(コンピュータ内のストレージ、NAS(Network Attached Storage)など)、および情報通信経路(ネットワーク、ロードバランサ、スイッチ、ルータなど)、並びに、それらを構成するCPU、メモリ、記憶装置(ハードディスク、光学的または磁気的記憶装置、SSDほか半導体デバイス)、ROM、マザーボード、キーボード、マウス、マイクなどの入力装置、ディスプレイ、およびスピーカなどの出力装置、並びに記憶装置から読み出され、一般にはメモリ上で動作するコンピュータプログラム、データなどのソフトウェアの全てまたは一部を示している。
自社コンピュータ資源500とは、上記ユーザ(または上記ユーザが所属する組織)が所有しているコンピュータ資源である。組織は、ユーザ1名からなる組織であっても良いし、複数の人員から構成される組織であってもよい。
自社コンピュータ資源500やコンピュータ100は、インターネット400に直接接続されておらず、インターネット400には、LAN300のルータ(図示せず)を介して接続される。また、ルータ、自社コンピュータ資源500、コンピュータ100にファイヤウォール機能を設けることにより、インターネット400側から自社コンピュータ資源500やコンピュータ100にアクセスすることが禁じられている。これにより、自社コンピュータ資源500やコンピュータ100がインターネット400を介して外部から操作されることはなく、また、自社コンピュータ資源500やコンピュータ100に記憶されたデータに外部からアクセスすることが禁止されている。
他社コンピュータ資源200とは、上記ユーザ(または上記ユーザが所属する組織)が所有するものではないコンピュータ資源である。上記ユーザは、コンピュータ100からアクセスすることで他社コンピュータ資源200の計算能力やストレージを一時的に借り受けることができる。その利用形態は、有償であると無償であるとを問わない。
文書データは、ワードプロセッサーが処理するファイル、HTMLやプレーンなテキストファイルに保存され、自社コンピュータ資源500やコンピュータ100に記録される。文書データが画像である場合には、自社コンピュータ資源500やコンピュータ100に記録されたOCR(Optical Character Recognition/Reader)のソフトウェアによりそれがHTML文書やテキスト文書に変換され、処理の対象とされる。
自社コンピュータ資源500およびコンピュータ100と、他社コンピュータ資源200との間の通信プロトコルは、HTTPS(Hypertext Transfer Protocol Secure)等により行われる。すなわち、SSL(Secure Sockets Layer)/TLS(Transport Layer Security)プロトコルによって提供されるセキュアな暗号化(秘密鍵、公開鍵を使ったデータ暗号化手法)の上でHTTP通信が行われるので、自社コンピュータ資源500およびコンピュータ100と他社コンピュータ資源200との間の通信内容を秘匿化することができ、その通信内容が第三者に漏洩することは防止される。通信内容の第三者への漏洩を防ぐことができるのであれば、HTTPS以外の暗号化通信を行っても良い。
図2は、本発明の第1の実施の形態における文書処理システムの構成を示す機能ブロック図である。
図1の記憶装置111には、CPU101によって順に実行されることで、コンピュータ100を文書処理装置として動作させるコンピュータ読取り可能な実行形式のプログラムが複数記録されている。プログラムは、記憶装置111からから読み出され、RAM109上に展開される。プログラムがRAM109上でCPU101によって実行される。
プログラムの実行により、図2に示されるように、コンピュータ100は、制御部201、通信部103、検索・置換部203、文書編集・単語登録部205、データベース207、メモリー209、記憶装置111、表示/出力部211、および入力部213としての機能を発揮する。
制御部201は、装置全体の各種制御を行う機能ブロックである。通信部103は、社内・社外のコンピュータ資源と通信を行うための機能ブロックである。検索・置換部203は、文書について、特定の要素(単語、文節など)の検索を行ったり、検索された要素を対応する文字列や暗号に置換する機能ブロックである。文書編集・単語登録部205は、文書を編集したり、単語変換のための辞書を登録する機能ブロックである。
データベース207は、主に単語辞書を登録するデータベースである。データベース207としてはデータベースサーバのソフトウェアを採用しても良いし、CSVファイルなどの単なるテキストファイルや、表計算ソフト(EXCELなど)のテーブルを記録し、それを検索し、対応するデータを読み出すことでデータベースとしてもよい。
メモリ209は、データを一時的に記録するワーキングエリアである。記憶装置111は、不揮発性の記憶装置であり、文書データ、データベースに記録されるデータ、メモリ209のデータなどを記憶する。表示/出力部211は、ディスプレイ、スピーカなどのユーザインタフェースである。入力部213は、マウス、キーボード、マイクなどのユーザインタフェースである。
図3は、データベース207に格納されるデータ構造の具体例を示す図である。
ここではデータベース207は列名(カラム名、フィールド名)として、ID(レコード番号であり、データの通し番号)、符号(読み)、単語、変換後単語、属性、対応などを有するテーブルからなっている。図3では、符号に対応付けられている単語がデータベース207に登録されている例が示されている。
符号とは、特許明細書などの文書において、単語の直後に記載される文字列であって、その単語と、その単語が指す図面中の要素とを対応付けるための数字、アルファベットなどの文字列である。例えば図面中に描かれた電気自動車(図面中の要素の一例)に引き出し線が付され、「101」と番号が振られており、その電気自動車を明細書中で「電気自動車101」などと説明する場合、「101」が符号である。またこの場合の「電気自動車」は符号「101」に対応する単語である。
単語のカラムには、その符号に対応する単語(例えば明細書中に「電気自動車101」の文字列が表れるのであれば、そのうちの「電気自動車」)が登録される。一般には単語のカラムには名詞が登録されるが、動詞、副詞、形容詞などを登録しても良い。また名詞には、複数の名詞からなる複合名詞(電気+自動車である「電気自動車」など)も含まれる。
IDのカラムは、1レコードの通し番号を記録する。
変換後単語のカラムには、そのレコードにおける単語+符号の文字列が記録される。例えば、図3のID=0のレコードでは、符号が「101」、単語が「電気自動車」であるため、変換後単語のカラムには、「電気自動車101」が登録される。
属性のカラムには、例えばその「単語」が特許明細書中の実施の形態に登場する単語であれば「0」、請求の範囲に登場する単語であれば「1」などの属性が記録される。
対応のカラムには、そのレコードの単語に関連する他の単語のIDと、対応関係が記録される(複数の対応付けを行ってもよい)。例えば単語「信号入力部」に対して、他の単語である「信号入力手段」が対応する場合、それら単語が関連することと、その対応関係(例えば、請求項に出てくる単語と、それに対応する実施の形態に出てくる単語の関係であることを示すコード)が記録される。
この実施の形態において符号は、IME(Input Method Editor、インプット・メソッド・エディタ)のユーザ辞書に、その「符号」に対応する「変換後単語」の読みとしても登録される。
IMEは、パーソナルコンピュータ(PC)やタブレット端末、スマートフォン端末などの情報機器において、ハードウェアキーボード(物理キーボード)または画面上に表示されるソフトウェアキーボード(仮想キーボード)の上にある限られたキーの組み合わせで、漢字、ハングル、かな文字などキーボード上には無い文字を入力するためのソフトウェアである。IMEは、ハードウェアキーボードまたはソフトウェアキーボードから入力された文字列を、その文字列に対応する文字列に変換する処理を行う。IMEは、入力方式エディターやかな漢字変換ソフトとも呼ばれることもある。
IMEは辞書ファイルを用いて文字列の変換を行う。辞書ファイルには誰もが使用する基本辞書、オプションで追加される追加辞書、およびユーザごとに作成されるユーザ辞書がある。基本辞書には、例えば「せかい」に対応させた「世界」など、誰もが利用する単語が登録されている。追加辞書は、ユーザの利用環境に応じて追加される辞書であり、例えば専門用語を集めた辞書である。ユーザ辞書は、各ユーザごとに、単語と読みを登録、編集、削除できる辞書であり、ユーザ個別の辞書として機能する。
IMEの基本機能は、ひらがななどの文字列が入力された後に、変換キーが押されるなどすると、その文字列を、その文字列に対応して辞書登録されている文字列に変換するものである。1の文字列に対して複数の辞書登録がある場合、変換キーが押されるなどするごとに、次の候補の文字列が表示される。確定キーが押されるなどすると、表示されている文字列が入力確定文字列となる。その確定文字列は、次回の変換時に優先的に変換候補に表示される。また、ユーザ辞書による変換を他の辞書(基本辞書など)よりも優先的に行ったりする。よく使われる候補を早く表示させるためである。
IMEは、現在の入力途中の文字列(未確定文字列)に応じて辞書からピックアップした入力候補や変換候補を表示することができる(予測変換機能)。またIMEは、ユーザ入力履歴をもとに学習して辞書や入力/変換候補の精度を強化していくことができる。
上述のように図3の「符号」は、IMEのユーザ辞書に、その符号に対応する「変換後単語」の読みとしても登録されるため、ユーザは例えば「101」をキーボードなどから入力し、変換キーを押すことで「電気自動車101」のIMEによる変換結果を得ることができる。また、IMEの予測変換機能を用いると、「101」と入力する前に、または入力することで、「電気自動車101」のIMEによる変換結果を得ることができる。これにより、ユーザによる入力の省力化を図ることができる。また、符号と単語との整合性の誤り(誤入力、タイプミス)を防ぐことができる。すなわち、ユーザは迅速に誤りなく単語+符号からなる文字列の入力が可能となる。
なお、IMEに「符号」をそれに対応する「単語」の読みとして登録することもできる。この場合、ユーザは例えば「101」をキーボードなどから入力し、変換キーを押すことで「電気自動車」のIMEによる変換結果を得ることができる。この場合も省力化や入力ミス軽減を図ることができる。
データベース207に複数のレコードがあれば、それら全ての符号および変換後単語のペアが辞書登録される。
図4は、データベース207に格納されるデータ構造の具体例を示す図である。
図4で示されているデータベース207の構成は、図3と同じである。図4では、符号に対応付けられていない単語がデータベース207に登録されている例が示されている。例えば特許明細書であれば、発明の実施の形態や要約書には符号に対応付けられている単語が出現し、特許請求の範囲には符号に対応付けられていない単語が出現することが多い。前者の単語を図3、後者の単語を図4のようにデータベースに登録し、対応カラムのデータによって対応付けるものである。
図4では図3とは違い、符号(読み)のカラムには、その単語のひらがな読みが記載される。例えばID=250のレコードの単語は「検出手段」であるため、その符号(読み)のカラムには「けんしゅつしゅだん」の文字列が記録される。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。
また、図4においては、変換後単語としては符号のない単語のみが登録される(単語カラムと変換後単語カラムの両者は同じとなる)。
図4においても、データベース207に登録される符号(読み)とそれに対応付けられる変換後単語が、IMEに単語とその読みとして辞書登録される。
これによって、図4の登録がある状態においては、ユーザは単語の読みの「けんしゅつしゅだん」をキーボードから入力し、変換キーを押すことなどによってIMEでそれを変換することで、「検出手段」の変換結果を得ることができる。また、予測変換機能を用いると、「けんしゅつしゅだん」を入力する途中で「検出手段」の変換結果を得ることができる。これにより、迅速に誤りなく単語の文字列の入力が可能となる。
なおIMEはワープロソフト(マイクロソフト社のWORD、オープンソース方式で公開されているOpenOfficeなど)に付属するものを用いてもよいし、OSに付属するものを用いてもよいし、独自にインストールするものを用いてもよい。本発明は、ワープロソフトのマクロ(VBA:Visual Basic For Applicationsなど)を用いて図5,6などのフローチャートのプログラムを実行することで実現されてもよい。本発明は、独自のエディタソフトで図5,6などのフローチャートのプログラムを実行することで実現されてもよい。データベースは、専用のデータベース(MySQL,SQLiteなど)でもCSVファイルであってもよいし、マイクロソフト社のEXCELなどの表計算ソフトを用いてデータベースが形成され、ワープロソフトのVBAを用いてデータベースへのアクセスが行われるものであってもよい。なお使用されるワープロソフト、テキストエディタ、プログラム言語の種類は、発明の実施において制限されるものではない。
処理の対象となる文書ファイルは、プレーンテキスト形式で記載されたテキストファイルであってもよいし、ワープロソフトの文書ファイルであってもよいし、HTMLファイルであってもよい。また、画像に含まれる文字がOCRによりテキスト化されたファイルであってもよい。画像ファイルを入力し、OCR機能により文字部分をテキストデータに変換したファイルを作成しても良い。他、文章を記述することができるのであれば、ファイルのフォーマットは特定のものに限定されない。文書は、他のコンピュータからファイル転送プロトコルや電子メールソフトウェアを用いて受信しても良いし、USBメモリなどのストレージから入力されても良い。また、キーボード119やマイクによって入力されても良い。文書は、インターネットからダウンロードすることとしてもよい。
以下のフローチャートで示される処理は、記憶装置111に記録されたコンピュータプログラムがRAM109上に読み出され、それをCPU101が順次実行することで実行される。プログラムは、コンパイルされた機械語の実行形式で保存されてもよいし、ソースコードをインタプリタが逐次実行する形式としてもよいし、中間言語で記載された形式としても良い。
図5は、本発明の第1の実施の形態における文書処理システムに含まれるコンピュータプログラムのIME登録・DB登録処理を示すフローチャートであり、図6は、図5に続くフローチャートである。
ステップS101で、コンピュータ100にインストールされているワープロソフトまたはテキストエディタソフトが起動されている場合を想定する。ソフトで文書または単語などのテキストが表示されている場合において、ユーザは登録を行いたい部分を選択する。選択は、マウス左クリックによって選択の始点から終点までをドラッグする方法や、カーソル位置を始点に合わせ、Shift+矢印キーによってカーソルを移動させる方法などで行われる。形態素解析によってコンピュータ100が単語の区切りを自動判断し、選択範囲を自動で決定、または範囲選択の補助をさせることとしてもよい。
ステップS101でテキストの選択後に登録処理のトリガが発生したのであれば、ステップS103に移行する。登録処理のトリガは、例えば特定のショートカットキーの押下、メニュー中の特定項目の選択、マウスの右クリック、特定の音声入力などのコマンド入力によって発生するものとする。また、単語登録を行いたい部分の選択が行われたら(または選択後所定時間が経過したら)自動的にトリガを発生させてもよい。
ステップS103においては、選択された範囲内に「単語」と「符号」からなる組(ペア)が含まれるかを判定する。YESであればステップS105へ、NOであればS205(図6)へ進む。YESは、単語と符号のペアが選択範囲に含まれるので、それを図3の形式でデータベース207に登録するための処理である。NOは、単語のみが選択範囲に含まれるので、それを図4の形式でデータベース207に登録するための処理である。
ステップS105においては、選択された範囲内に「単語」と「符号」からなる組(ペア)が複数組含まれるかを判定する。例えば文書中の1つの「単語」+それに対応する1つの「符号」のペアのみが選択され、それを登録するのか、あるいは特許明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択され、それらペアの全てを登録するのかが判定される。
ステップS107において、選択範囲内の文字列を図3の「変換後単語」のカラムに、選択範囲内の単語部分の文字列を図3の「単語」のカラムに、選択範囲内の符号部分の文字列を図3の「符号(読み)」のカラムに、新たなレコードとして登録するため、これらのセットを取得する。新たなレコードには通し番号であるIDが付与される。また「属性」カラム用に、「符号の付いた単語である実施例中の単語である」などの属性が付与される。対応する他のレコードがある場合には、それをユーザから入力し、または自動判別し、「対応」のカラムに記録することとしてもよい。
ステップS107での登録処理は、例えば特許明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが1レコードとして、複数レコードが図3のデータベース207に登録される。
なお、選択範囲内に符号部分が含まれるか否かは、例えば選択範囲内の文字列の形態素解析や正規表現による検索で、その末尾に数字やアルファベットが含まれているか否かによって判断することができる。また、数字やアルファベットが連続する部分を判定することで、選択範囲内の符号部分の文字列を得ることができるし、それ以外の部分を選択範囲内の単語部分の文字列として得ることができる。
ステップS109において、IMEのユーザ辞書登録を行う。より詳しくは、「読み」を選択範囲内の符号部分の文字列、「単語」を選択範囲内の文字列、「品詞」を「短縮読み」などとして辞書の1つのレコードが登録される。「品詞」は「短縮読み」に限らず、「名詞」、「固有名詞」などでもよい。
例えば特許明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが1レコードとして、複数レコードがIMEに登録される。
ステップS111において、データベース207への登録が確定する。
次に図6のステップS205以降の説明を行う。図6の処理は、選択範囲内に符号が含まれず、選択範囲内に単語のみが存在する場合に、図4に示されるようにデータベース207への単語登録を行い、IMEにも登録を行う処理である。
ステップS205において、選択範囲内に単語が複数含まれるかを判定する。これは例えば、それぞれが改行コード、カンマ、スペース、タブ記号で区切られた複数の単語が選択範囲内に存在するかを判定する処理である。
ステップS207において、選択範囲内の1つの単語と、そのひらがな読みを取得する。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。単語が複数あれば、全ての単語のひらがな読みが得られる。
ステップS209において、「読み」をひらがな読み、「単語」を選択範囲内の単語、「品詞」を「短縮読み」または「名詞」として、IMEに辞書登録する。
単語が複数記載されている部分が選択されていた場合には、各単語についてステップS209の処理が行われ、複数レコードがIMEに登録される。
ステップS211において、データベース207への登録が確定する。
図7は、本発明の第1の実施の形態における文書処理システムに含まれる特許明細書エディタの画面構成を示す図である。
この画面は、特許明細書エディタのウィンドウを示している。ウィンドウの最上部にはタイトルバーが位置し、その下にメニューバーが位置している。メニューには、「ファイル」、「編集」、「機能」、「検索/置換」、「管理」、「分析」が含まれる。
メニューバーの下に、検索/置換バーが位置している。検索/置換バーは、検索するテキストを入力する第1のテキストボックスと、第1のテキストボックスに入力されたテキストを文書中から検索するトリガを発生させる「検索」ボタンと、選択された部分が置換されるテキストを入力する第2のテキストボックスと、第1のテキストボックスに入力されたテキストの文書中からの検索結果を、第2のテキストボックスに入力されたテキストに置換し、次の検索を行うトリガを発生させる「置換+次」ボタンと、文章中から第1のテキストボックスに入力されたテキストを全て検索し、全てを第2のテキストボックスに入力されたテキストに置換する「全置換」ボタンとが含まれる。
検索/置換バーの下の画面は、左上、左下、右上、右下に4分割されている。左上は、特許明細書の最初から特許請求の範囲の前までを表示するテキストボックスである。左下は、特許明細書の特許請求の範囲から最後までを表示するテキストボックスである。右上は、特許明細書の実施の形態に記載された符号付きの単語について、その符号と、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下は、特許明細書の特許請求の範囲に記載された符号なしの単語について、その読みと、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下のリストコントロールの下に、選択状態とされたリストコントロールの要素を削除するための削除ボタンと、選択状態をキャンセルするためのキャンセルボタンと、リストコントロール中の2以上の要素が選択されている状態で、それら要素を対応付けて記録するための「登録」ボタンが表示される。
コンテンツがテキストボックスやリストコントロールの表示範囲に入りきれない場合、そのテキストボックスやリストコントロールの右側にスクロールバーが表示される。ユーザは、スクロールバーを操作することにより、コンテンツのうち表示される範囲を変更することができる。
ユーザはマウスやTabキーの押下によって、各テキストボックス、各リストコントロールを選択状態とすることができる。ユーザは各テキストボックスにおいては、テキストの入力、編集(コピー、ペーストなど)、削除などを行うことができる。また、選択範囲の登録を行うことができる。ユーザは各リストコントロールにおいては、所望の要素を選択状態とすることができる。複数の要素を同時に選択状態とすることも可能である。
右上のリストコントロールにおいては、図3のデータベースの登録内容が、符号の昇順に並べられて表示される。右下のリストコントロールにおいては、図4のデータベースの登録内容が、符号(読み)の昇順に並べられて表示される。データベースが更新されるごとに、両リストコントロールの内容がリアルタイムで更新される。
ユーザは例えば「水受けかご2」の文字列を入力したいときには、図7の右上のリストコントロールを見て、「2」が対応する符号であることを理解することができる。ユーザはテキストコントロールにカーソルがある状態で、「2」をタイプし、変換キーを押すことで(予測変換機能によれば変換キーを押すことなく)、「水受けかご2」のテキストを入力することができる。
また、ユーザは例えば「バランスリング取付部」の文字列を入力したいときには、「ばらんすりんぐとりつけぶ」をタイプし、変換キーを押すことで(予測変換機能によれば変換キーを押すことなく入力途中で)、「バランスリング取付部」のテキストを入力することができる。
なおデータベースの登録が削除されると、対応するインプットメソッドエディタの辞書登録も削除することが望ましい。使わない単語登録を削除し、IMEでの誤変換を防ぐためである。
また、文書ごとにデータベースを対応付けて管理し、ある文書を編集するときには対応するデータベースが読み出され、それに記録された符号(読み)と単語(または単語+符号)がIME辞書に登録されるようにしてもよい。文書ごとに、固有のデータベースと固有のIMEの辞書を使うものである。また、文書の編集を終了するときには、対応するデータベースが読み出され、それに記録された符号(読み)と単語(または単語+符号)がIME辞書から削除されるようにしてもよい。
また、ユーザの入力によって、または自動的に、データベースに記録された符号(読み)と単語(または単語+符号)をIMEに登録させることとしてもよい。データベースの内容とIMEに登録されるユーザ辞書とを同期させることとしてもよい。
IMEへの辞書登録は、IMEのデータベースに直接データを登録することとしてもよいし、デスクトップの自動化ソフトを利用することにより、IMEを起動させた後に自動的にダイアログ画面に必要な情報を入力し、「登録」ボタンが押されるようにプログラムを設計してもよい。IMEの起動は、IMEのexeファイル(実行ファイル)を実行することによって行ってもよいし、デスクトップの自動化ソフトでキーやマウスの自動操作を行うことでIMEを起動させてもよい。
ユーザの入力によって、または自動的に、コンピュータによってデータベースから符号と対応する単語のペアを複数取得させ、それを符号の並び順(数字の昇順など)に一覧としてまとめた符号表を出力する機能を設けてもよい。特許明細書であれば、「符号の説明」を自動起草するものである。また、単語の文書中での出現回数をカウントし、出現回数が所定値以上の単語のみを符号表として出力してもよい。
[その他]
上述の複数の実施の形態、およびそれに含まれる要素(一部の構成、一部の処理)を組み合わせたり、入替えたりすることで新たな別の実施の形態とすることもできる。
なお、上記実施の形態において、文書処理は外部サーバを用いて行ってもよいし、スタンドアローンのPC内やLAN内のPC内で行ってもよい。
上述の実施の形態における処理は、ソフトウェアにより行っても、ハードウェア回路を用いて行ってもよい。また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD-ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザーに提供することにしてもよい。プログラムは、CPUなどのコンピューターにより実行される。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
100 コンピュータ
101 CPU
103 通信部
109 RAM
111 記憶装置
200 他社コンピュータ資源
203 検索・置換部
205 文書編集・単語登録部
207 データベース
209 メモリ
211 表示/出力部
213 入力部
400 インターネット
500 自社コンピュータ資源
101 CPU
103 通信部
109 RAM
111 記憶装置
200 他社コンピュータ資源
203 検索・置換部
205 文書編集・単語登録部
207 データベース
209 メモリ
211 表示/出力部
213 入力部
400 インターネット
500 自社コンピュータ資源
Claims (5)
- 文字列の入力と表示が可能な文書処理プログラムであって、
表示された文字列の少なくとも一部を選択することが可能な選択ステップと、
前記選択ステップにより選択された文字列中の第1の部分を読みとして、前記選択ステップにより選択された文字列中の第2の部分、または前記選択ステップにより選択された文字列を、インプットメソッドエディタの辞書に登録する登録ステップとをコンピュータに実行させる、文書処理プログラム。 - 前記登録ステップは、前記選択された文字列に含まれる参照符号を、インプットメソッドエディタの辞書に登録する読みとして決定し、
前記登録ステップは、前記選択された文字列に含まれる単語又は前記選択された文字列、及び前記選択された文字列の一部に含まれる参照符号を、インプットメソッドエディタの辞書に対応付けて登録する、請求項1に記載の文書処理プログラム。 - 前記選択ステップで選択された文字列の中に第1の部分及び第2の部分が複数含まれるとき、前記登録ステップは、それぞれを前記辞書に登録する、請求項1又は2に記載の文書処理プログラム。
- 前記インプットメソッドエディタの辞書に登録された内容を、データベースに登録する登録ステップと、
前記データベースの登録が削除されると、対応する前記インプットメソッドエディタの辞書登録も削除する削除ステップをさらに備えた、請求項1から3のいずれか1項に記載の文書処理プログラム。 - 前記登録された読みとそれに対応する文字列を、リストとして表示する表示手段をさらに備えた、請求項1から4のいずれか1項に記載の文書処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021083586A JP2022177381A (ja) | 2021-05-18 | 2021-05-18 | 文書処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021083586A JP2022177381A (ja) | 2021-05-18 | 2021-05-18 | 文書処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022177381A true JP2022177381A (ja) | 2022-12-01 |
Family
ID=84237786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021083586A Pending JP2022177381A (ja) | 2021-05-18 | 2021-05-18 | 文書処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022177381A (ja) |
-
2021
- 2021-05-18 JP JP2021083586A patent/JP2022177381A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5921527B2 (ja) | インプットメソッドエディタのための拡張フレームワーク | |
US8600916B2 (en) | Office system content prediction based on regular expression pattern analysis | |
US10345922B2 (en) | Office system prediction configuration sharing | |
JP7289556B2 (ja) | 特許文書作成装置、方法、コンピュータプログラム、コンピュータで読み取り可能な記録媒体、サーバー、およびシステム | |
JP5513898B2 (ja) | 共有された言語モデル | |
JP2010520531A (ja) | 統合ピンイン及び画入力 | |
KR20210013991A (ko) | 번역예 검색 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
JP2022177381A (ja) | 文書処理プログラム | |
WO2021107006A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2019057137A (ja) | 情報処理装置及び情報処理プログラム | |
JP7247593B2 (ja) | 生成装置、ソフトウェアロボットシステム、生成方法及び生成プログラム | |
JP2023056585A (ja) | 文書処理プログラム | |
WO2019225560A1 (ja) | 検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム | |
Sorensen et al. | EEVEE: An Easy Annotation Tool for Natural Language Processing | |
JP2012230460A (ja) | 機械翻訳システム、方法及びプログラム | |
JP2020095369A (ja) | 文書処理装置、文書処理装置の制御プログラム、および文書処理装置を用いた文書処理方法 | |
JP2007004636A (ja) | 言語入力システム、その処理方法、記録媒体及びプログラム | |
JP5968186B2 (ja) | プログラム作成支援装置及びプログラム | |
KR20240055290A (ko) | 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
KR20240055302A (ko) | 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
KR20240055309A (ko) | 논문 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
KR20210013990A (ko) | 특허 명세서 번역을 위한 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
KR20210013989A (ko) | 구성요소 번역 관리 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
KR20210013992A (ko) | 자동완성 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 | |
CN117389538A (zh) | 页面组件内容开发方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240520 |