JP2006172231A - Document proofreading method and document proofreading apparatus - Google Patents

Document proofreading method and document proofreading apparatus Download PDF

Info

Publication number
JP2006172231A
JP2006172231A JP2004365141A JP2004365141A JP2006172231A JP 2006172231 A JP2006172231 A JP 2006172231A JP 2004365141 A JP2004365141 A JP 2004365141A JP 2004365141 A JP2004365141 A JP 2004365141A JP 2006172231 A JP2006172231 A JP 2006172231A
Authority
JP
Japan
Prior art keywords
proofreading
function unit
expression
proofreader
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004365141A
Other languages
Japanese (ja)
Inventor
Yoshikazu Miura
良和 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004365141A priority Critical patent/JP2006172231A/en
Publication of JP2006172231A publication Critical patent/JP2006172231A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To develop a proofreading system which can rapidly and accurately search a dictionary for proofreading for a correction object character string registered by a proofreader beforehand, and can display the character string and extend the dictionary. <P>SOLUTION: With a character string detected from proofreading object text by a proofreading object character string detection part 2 set as a search key, a display part displays a character string which the proofreader has recognized as the one to be corrected and has registered in the dictionary 3 for proofreading beforehand, and if a correction history search part 4 has searched for the presence/absence of registration thereof to find the absence of registration, displays as such. If correction is needed, an alternative candidate therefor is retrieved and is also displayed. If the proofreader inputs a character string for the alternative candidate or correction, an alternative candidate decision part 5 decides the character string as the alternative candidate. A sentence update part 6 substitutes the alternative candidate for proofreading object expression. A correction history registration part 12 associates the proofreading object expression with the alternative candidate and registers them in the dictionary 3 for proofreading. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は文書校正方法及び校正装置(以下、「本発明の校正システム」と略称することがある)に関し、詳しくは文書の解析装置及び解析の結果発見された誤り(修正必要表現及び随意に修正好適表現)を表示し、その誤りを校正者の指示に従って修正し、修正結果を更に表示すると共に記憶し、出力できる装置並びに前記の解析等を行なう校正方法に関する。   The present invention relates to a document proofreading method and a proofreading apparatus (hereinafter, may be abbreviated as “the proofing system of the present invention”). The present invention relates to an apparatus capable of displaying (preferred expression), correcting the error in accordance with the instructions of the proofreader, further displaying, storing and outputting the correction result, and a calibration method for performing the above analysis and the like.

日本語文章中の送り仮名の誤り、送り仮名の不統一及び禁止用語等の校正対象表現を修正対象とする機能を備えたワードプロセッサー(略称「ワープロ」)は1988年頃から市販されている。これらの校正対象表現を校正する機能を備えたワープロソフトの中には校正対象表現の検出だけを行なうもの、検出された校正対象表現を置換する(置換する)為の代替候補を単に提示するに過ぎないもの、更に提示された複数種の代替候補の中から何れかを代替表現として選択し、原文中の校正対象表現を当該代替表現で置換するもの等が存在した。
コンピューターに搭載(インストール)されて文章の校正に用いられるシステムとしては、例えば特許文献1〜8等に提案されている。その代表例としては、特許文献1に開示されているものを挙げることができる。
A word processor (abbreviated as “word processor”) having a function of correcting a proofreading target expression such as an error in a Japanese sentence, an inconsistency in a Japanese syllabary, and a forbidden term has been commercially available since about 1988. Some word processing software that has a function for proofreading these proofreading expressions only provides detection of proofreading expressions, and simply presents alternative candidates to replace (replace) the detected proofreading expressions. However, there are those that select any one of a plurality of alternative candidates presented as an alternative expression and replace the proofreading target expression in the original text with the alternative expression.
For example, Patent Documents 1 to 8 propose a system that is installed (installed) in a computer and used for proofreading sentences. As a typical example, one disclosed in Patent Document 1 can be cited.

特開平05−120275号公報Japanese Patent Laid-Open No. 05-120275 特開平05−135095号公報JP 05-135095 A 特開平05−298301号公報JP 05-298301 A 特開平05−298302号公報JP 05-298302 A 特開平05−324647号公報JP 05-324647 A 特開平06−203069号公報Japanese Patent Laid-Open No. 06-203609 特開平07−141362号公報Japanese Patent Application Laid-Open No. 07-141362 特開平09−114831号公報Japanese Patent Laid-Open No. 09-114831

上記の各公開特許公報(文書)に開示された文書作成支援装置、推敲支援装置、校正装置又はそれらの実行方法は何れも概念的には、入力装置、制御装置、表示装置及び記憶装置その他から編成された結合体である。
しかし、上掲の各発明においては、システムの概念がフローチャートの形態で表示されているに過ぎず、それを補足する為の実施例も内容的には別段に詳しくはない。即ち、これらの実施例においては、校正されるべき例文が呈示されてはいるが、その中の誤字、脱字等の単純誤記、句又は短文の変更、挿入又は削除等の複雑誤記とでも言うべきものがいかなる手順で是正されるのかは依然として抽象的開示に留まっている。
また、文書提出責任部署又は機関、例えば特許事務所や法律事務所等は文書の提出期限が極めて切迫した時点でその原稿又はその前段階である文案等が提出依頼者から寄せられる場合に往々にして出会う。この場合においても、提出責任機関は万全の文書を作成する義務を負うから、可能な限り効率的に校正を進める必要がある。その為には通常のワープロソフトに搭載されている辞書がいかに有能であろうとも、蔵出し状態(Default)では対応でき兼ねる表現を記憶した辞書が必要である。この種の辞書が備えるべき能力については後述する。
The document creation support device, the push support device, the proofreading device, or the execution method thereof disclosed in each of the above-mentioned published patent publications (documents) are conceptually from an input device, a control device, a display device, a storage device, and others. It is an organized combination.
However, in each of the above-described inventions, the concept of the system is merely displayed in the form of a flowchart, and an embodiment for supplementing it is not detailed in detail. That is, in these examples, although the example sentence to be proofread is presented, it should be said that it is a simple typographical error such as a typographical error or omission, or a complex typographical error such as a phrase or short sentence change, insertion or deletion, etc. It is still an abstract disclosure of how things are rectified.
Also, departments or organizations responsible for document submission, such as patent offices and law firms, often submit manuscripts or previous drafts from the requester when the deadline for submission of documents is extremely imminent. Meet. Even in this case, the submitting agency is obliged to prepare a complete document, so it is necessary to proceed with the calibration as efficiently as possible. To that end, no matter how competent the dictionary installed in normal word processing software is, a dictionary that stores expressions that can also be handled in the stored state (Default) is required. The ability that this type of dictionary should have will be described later.

本発明者は、上記事情に鑑み、文書の早急な校正方法及び装置に関し鋭意検討し、本発明の完成に至った。
すなわち、本発明の第1は、文書校正システムであって、校正者が予め登録して置いた1以上の文字列であって校正者が修正の要有りと認識している文字列を校正対象文章の全体又は指定部分から検出し、検出された文字列を表示し、校正者がこの文字列を確認後に必要に応じて修正する様に指示することを特徴とする文章校正方法に関する。
本発明の第2は、表示された文字列を校正者が修正を指示した際に、表示された代替候補から校正者が代替表現を選択して前記の表示された文字列を修正させることを特徴とする本発明の第1の文章校正方法に関する。
本発明の第3は、表示された文字列に対して校正者が修正を指示した際に代替候補が表示されない場合に、校正者が代替表現を入力して前記の表示された文字列を修正させることを特徴とする本発明の第1又は2の文章校正方法に関する。
本発明の第4は、表示された文字列が所定の修正条件に適合する場合に、当該文字列を自動的に代替表現で置換して前記の表示された文字列を修正させることを特徴とする本発明の第1又は2の文章校正方法に関する。
本発明の第5は、入力機能部と、校正対象表現検出機能部であって校正対象文章中の校正対象表現を検出する機能部と、修正履歴登録辞書であって校正対象表現と文章校正の際に当該校正対象表現と置換された代替表現との両者を対応づけて登録している辞書と、修正履歴検索機能部であって上記修正履歴登録辞書に基いて上記校正対象表現検出機能部で検出された校正対象表現を検索キーとして、代替表現を検索する機能部及び表示機能部とから基本的に編成されていることを特徴とする文章校正装置に関する。
本発明の第6は、文章校正装置が更に、代替候補決定機能部であって修正履歴登録辞書に校正対象表現に対応づけて登録されている代替表現から代替候補を決定する機能部を備えていることを特徴とする本発明の第5の文章校正装置に関する。
本発明の第7は、文章校正装置が更に、修正履歴登録辞書に代替表現が登録されていない場合に校正者によって入力された代替表現を代替候補として校正対象文字列を修正させることを特徴とする本発明の第5の文章校正装置に関する。
本発明の第8は、文章校正装置が更に、置換機能部であって校正対象表現と上記代替候補決定機能部で決定された代替候補とを自動的に置換して修正する機能部を備えていることを特徴とする本発明の第5の文章校正装置に関する。
本発明の第9は、文章校正装置が更に、修正履歴登録機能部であって置換された校正対象表現と代替候補とを対応づけて上記修正履歴登録辞書に追加登録する機能部を備えていることを特徴とする本発明の第5〜8の何れかの文章校正装置に関する。
本発明の第10は、上記修正履歴登録機能部で登録するか否かを校正者の指示に従って選択する選択機能部を備えていることを特徴とする本発明の第5〜9の何れかの文章校正装置に関する。
本発明の第11は、前記修正履歴登録機能部で登録するか否かを校正者の指示に応じて選択する選択機能部を更に備えていることを特徴とする本発明の第5〜10の何れかの文章校正装置に関する。
本発明の第12は、モード切替え機能部であって上記置換機能部が校正者によって指示された場合に自動的に行なわれるモード切替え機能部を備えていることを特徴とする本発明の第5〜11の何れかの文章校正装置に関する。
本発明の第13は、モード切替機能部が上記置換機能部が校正者によって指示された場合に自動的に起動される様にモードを切替える機能部を備えていることを特徴とする本発明の第12の文章校正装置に関する。
In view of the above circumstances, the present inventor diligently studied a method and apparatus for urgent document proofreading, and completed the present invention.
In other words, the first aspect of the present invention is a document proofreading system, in which one or more character strings registered in advance by a proofreader and recognized by the proofreader as requiring correction are subject to proofreading. The present invention relates to a sentence proofreading method characterized in that it is detected from the whole sentence or a specified part of a sentence, a detected character string is displayed, and a proofreader instructs the character string to be corrected if necessary after confirmation.
According to a second aspect of the present invention, when the proofreader instructs correction of the displayed character string, the proofreader selects an alternative expression from the displayed alternative candidates and causes the displayed character string to be corrected. The present invention relates to the first sentence proofreading method of the present invention.
According to a third aspect of the present invention, when an alternative candidate is not displayed when the proofreader instructs correction of the displayed character string, the proofreader inputs an alternative expression and corrects the displayed character string. The present invention relates to a first or second sentence proofreading method of the present invention.
According to a fourth aspect of the present invention, when the displayed character string meets a predetermined correction condition, the character string is automatically replaced with an alternative expression to correct the displayed character string. The present invention relates to the first or second sentence proofreading method of the present invention.
The fifth aspect of the present invention is an input function unit, a proofreading target expression detecting function unit that detects a proofreading target expression in a proofreading target sentence, and a correction history registration dictionary that includes a proofreading target expression and sentence proofreading. A dictionary in which both the proofreading target expression and the replaced alternative expression are registered in association with each other, and a correction history search function unit based on the correction history registration dictionary. The present invention relates to a sentence proofreading apparatus that is basically composed of a function part for searching for an alternative expression and a display function part using a detected proofreading expression as a search key.
According to a sixth aspect of the present invention, the sentence proofreading apparatus further includes an alternative candidate determination function unit that determines an alternative candidate from an alternative expression registered in the correction history registration dictionary in association with the proofreading expression. The present invention relates to a fifth sentence proofreading apparatus according to the present invention.
According to a seventh aspect of the present invention, the sentence proofreading apparatus further causes the proofreading target character string to be corrected using the alternative expression input by the proofreader as an alternative candidate when the alternative expression is not registered in the correction history registration dictionary. The present invention relates to a fifth sentence proofreading apparatus of the present invention.
According to an eighth aspect of the present invention, the text proofreading apparatus further includes a function unit that automatically replaces and corrects the proofreading target expression and the alternative candidate determined by the alternative candidate determining function unit. The present invention relates to a fifth sentence proofreading apparatus according to the present invention.
According to a ninth aspect of the present invention, the sentence proofreading apparatus further includes a correction history registration function unit that associates the replaced proofreading expression with the alternative candidates and additionally registers them in the correction history registration dictionary. The present invention relates to a sentence proofreading apparatus according to any one of the fifth to eighth aspects of the present invention.
According to a tenth aspect of the present invention, there is provided a selection function unit for selecting whether or not to register with the correction history registration function unit according to an instruction from a proofreader. The present invention relates to a sentence proofing apparatus.
The eleventh aspect of the present invention further includes a selection function section for selecting whether or not to register with the correction history registration function section in accordance with an instruction from the proofreader. It relates to any proofreading device.
A twelfth aspect of the present invention is a mode switching function section, comprising a mode switching function section that is automatically performed when the replacement function section is instructed by a proofreader. To a text proofreading apparatus according to any one of.
According to a thirteenth aspect of the present invention, the mode switching function section includes a function section for switching modes so that the mode is automatically activated when the replacement function section is instructed by a proofreader. It relates to a twelfth sentence proofreading apparatus.

本発明により簡単な操作によって、短時間に文章の校正を行なうことができる。また同一文書内及び複数の文書間において、用語の統一を図ることができる。
以下、本発明を詳しく説明する。
According to the present invention, it is possible to proofread a sentence in a short time by a simple operation. Moreover, it is possible to unify terms within the same document and between a plurality of documents.
The present invention will be described in detail below.

本発明は、上記の従来技術の開示では今以て明確とは言い難い点を改良したものであって、特に文書校正に用いられる辞書(校正用辞書)の改良に関する。
詳しくは本発明は通常のワープロソフトに搭載されている辞書では対応でき兼ねる校正対象表現にこそ対応できる校正用辞書(修正履歴登録辞書)及びその辞書を搭載した文書校正システム並びにそのシステムを用いた文書校正方法に関する。
The present invention is an improvement of the above-described prior art disclosure, which is not yet clear, and particularly relates to an improvement of a dictionary (proofreading dictionary) used for document proofreading.
Specifically, the present invention uses a proofreading dictionary (correction history registration dictionary) that can handle proofreading expressions that cannot be handled by a dictionary installed in normal word processing software, a document proofreading system equipped with the dictionary, and the system. The present invention relates to a document proofreading method.

以下に図面を参照しながら、文章校正装置及び文書校正方法について説明する。
図3は従来の文章校正装置(特開平05−120275の図3)の構成をブロック及びそれらを結合する線で表わすブロックダイヤグラム又はフローチャートである。図3において21は文章記憶部で、入力部26から入力された日本語文章を記憶する機能部である。図3において22は校正対象表現検出機能部で、不図示の日本語解析用辞書に基いて日本語文章を解析し、送り仮名の誤り、使用禁止語等を校正対象として検出する機能部である。23は代替表現辞書メモリーで、校正対象表現とそれに対する適切な表現としての代替候補とを対応させて記憶している機能部である。24は代替表現表示制御部で、上記代替表現辞書メモリー23から校正対象表現と対応して記憶されている代替候補を検索して表示部27に表示させる機能部である。25は修正訂正制御部で、表示部27に表示された代替候補の中から置換に用いられる代替候補を校正者(オペレーター)に選択させると共に、原文中の校正対象表現を選択された代替候補によって置換する機能部である。前記の通り26は入力部で、校正者による日本語文章の入力又は指示等を受付ける機能部である。27は前記の通り表示部で、上記文章校正表現の内容、検出された校正対象表現、代替候補等を表示する機能部である。
上記の様な文章校正装置について、以下にその動作を説明する。先ず、校正者が文章更新部に記憶されている日本語文章から、校正対象表現として使用禁止語を検出する指示を入力部25から発すると、校正対象表現検出部22は日本語文章を解析し、その中から不適切な用語を検出する。例えば、「盲人」が使用禁止語として検出され、代替表現表示制御部24によって「盲人」に対する代替表現「視覚障害者」が検出されたとすると、表示部27はこれらの校正対象表現及び代替候補を表示する。
次に校正者が代替候補の中から代替表現として「視覚障害者」を選択して、置換の指示を入力したとする。それに対応して入力部25は校正者からの代替候補選択指示及び文書中の校正対象表現に対応する代替候補の選択及び選択された候補による校正対象表現の置換を指示する必要が残っていた。それに起因して、極めて長文を校正する場合には、操作作業数も多くなる結果、往々にして作業に長時間を要するという事態に直面するという問題点を生じていた。
A text proofing apparatus and a document proofing method will be described below with reference to the drawings.
FIG. 3 is a block diagram or flowchart showing the configuration of a conventional text proofreading apparatus (FIG. 3 of Japanese Patent Laid-Open No. 05-120275) with blocks and lines connecting them. In FIG. 3, reference numeral 21 denotes a sentence storage unit, which is a functional unit that stores Japanese sentences input from the input unit 26. In FIG. 3, reference numeral 22 denotes a proofreading object expression detection function unit that analyzes Japanese sentences based on a Japanese analysis dictionary (not shown) and detects errors in sending kana, prohibited words, etc. as proofreading objects. . Reference numeral 23 denotes an alternative expression dictionary memory, which is a functional unit that stores proofreading target expressions and alternative candidates as appropriate expressions corresponding thereto. Reference numeral 24 denotes an alternative expression display control unit, which is a function unit that searches the alternative expression dictionary memory 23 for alternative candidates stored in correspondence with the proofreading expression and displays them on the display unit 27. Reference numeral 25 denotes a correction / correction control unit, which allows the proofreader (operator) to select an alternative candidate used for replacement from among the alternative candidates displayed on the display unit 27, and the proofreading target expression in the original text by the selected alternative candidate. It is a functional part to be replaced. As described above, reference numeral 26 denotes an input unit, which is a functional unit that accepts input or instructions of Japanese text by a proofreader. Reference numeral 27 denotes a display unit as described above, which is a functional unit that displays the content of the sentence proofreading expression, the detected proofreading target expression, alternative candidates, and the like.
The operation of the sentence proofing apparatus as described above will be described below. First, when the proofreader issues an instruction from the input unit 25 to detect prohibited words as proofreading expressions from the Japanese sentences stored in the sentence update unit, the proofreading expression detection unit 22 analyzes the Japanese sentences. , Detect inappropriate terms from them. For example, if “blind person” is detected as a prohibited word, and the alternative expression display control unit 24 detects an alternative expression “visually impaired” for “blind person”, the display unit 27 displays the proofreading expression and alternative candidates. indicate.
Next, it is assumed that the proofreader selects “visually impaired” from the alternative candidates as an alternative expression and inputs a replacement instruction. Correspondingly, there remains a need for the input unit 25 to instruct the alternative candidate selection instruction from the proofreader, the selection of the alternative candidate corresponding to the proofreading expression in the document, and the replacement of the proofreading expression by the selected candidate. As a result, in the case of proofreading extremely long sentences, the number of operations is increased, and as a result, there is a problem that a situation where a long time is required for the work is often encountered.

本発明において最も重要な役割を演ずる「校正用辞書」は従来の何れの電子コード化辞書とも異なって、校正者自身が修正すべきと認識した字句(文字列)を校正者が予め当該辞書に登録(格納)して作成されるものであって、世上の何処にも販売又は譲渡されていなかったものと言うことができる。ここで留意すべきは本発明の校正用辞書はそれに登録されている文字列が常識的に妥当な内容を表わすか否かには全く関係無く、登録されている文字列と同一の文字列が校正対象文章中に存在すれば、それを的確に検出することを使命とするということである。ここで「本発明の校正用辞書に登録されている文字列が常識的に妥当な内容を表わすか否かには全く関係無い」とは、実施例2に例示された”修正すべき文字列”を見れば直ちに納得され得るであろう。
尤も、本発明の校正辞書が「世上の何処にも販売又は譲渡されていなかったもの」という意味は最初の校正用辞書が「世上の何処にも販売又は譲渡されていなかった」ということであって、この種の辞書が既に多数個世に現れてからの事情を言うものではない。即ち、最初の本発明の校正用辞書が或る程度の「修正すべき文字列」を格納した後には、それを複写して格納した校正用辞書が世上別の箇所にも出現し得ることは勿論である。
The `` proofreading dictionary '' that plays the most important role in the present invention is different from any conventional electronic coding dictionary, and the proofreader himself / herself puts the lexical phrase (character string) recognized by the proofreader himself into the dictionary. It can be said that it was created by registration (storage) and was not sold or transferred anywhere in the world. It should be noted here that the proofreading dictionary of the present invention has the same character string as the registered character string regardless of whether or not the character string registered in it represents common sense. If it exists in the text to be proofread, the mission is to detect it accurately. Here, “it has nothing to do with whether or not the character string registered in the proofreading dictionary according to the present invention expresses reasonable content” is “character string to be corrected” exemplified in the second embodiment. If you look at it, you will be immediately convinced.
However, the meaning that the proofreading dictionary of the present invention was “not sold or assigned anywhere in the world” means that the first proofreading dictionary was “not sold or assigned anywhere in the world”. This is not to say the circumstances after many dictionaries of this kind have already appeared in the world. That is, after the first proofreading dictionary of the present invention stores a certain amount of “character string to be corrected”, the proofreading dictionary that is copied and stored can appear in different places in the world. Of course.

本発明は従来提供されている種々の文書校正装置及びその方法に伴う問題点を解決しようとするものである。詳しくは、本発明は従来のワープロソフトに搭載された漢字仮名変換辞書又は文書校正ソフトでは今以て対処困難な「改善必要点」として、提出用文書中に内在する種々の不備即ち、フォントの不統一、誤字、脱字は勿論、用字用語の不統一、使用禁止語、接続関係又は用言の語尾変化に見られる不整合、字送り又は行送りの不適切、あるいは文体(1行の字数及び1頁の行数、上下左右の余白等)の不統一等を指摘する機能を果たす。
この提出直前文書の校正は往々にして極めて限られた時間内に完遂することが要求される。従って、この作業においては、当該文書に内在する各種改訂必要事項を迅速に洩れ無く検索できると共に、必要に応じてその改訂代替候補を提示し、その代替候補から選ばれた代替表現を校正者の指示(入力)に応じて置換する。もしも、提示された代替候補中に適切な代替表現が見当らない場合には、あるいは代替候補を提示しない場合には、校正者から入力された代替表現を校正者の指示に応じて置換する。
上記の各先行発明においては、校正用辞書の構成が今以て具体的に開示されていないことから、当該辞書がいかなる程度に詳細にしかも具体的に文書校正能力を発揮するかが外見的には看取困難であった。またこれらの校正用辞書は、本発明の構成辞書のように校正者が修正の要ありと認識して登録するものとは異なり、正しい用語が登録されており、正しい用語に適用しないものを検出するという方法で校正がなされていた。
本発明の文書校正方法及び文書校正装置を構成する最重要機能部である校正用辞書は実際に出会う種々の校正対象表現(校正必要又は校正好適記載)を可能な限り洩れ無く検出してそれを表示し、更に代替候補が有ればそれを表示し、代替候補が無いか又は代替候補の中に代替好適表現が無ければ校正者の入力に応じて、現記載に代えて現記載を代替表現で置換する機能部である。その為には、本発明の文書校正用辞書は「実際に出会う種々の校正対象表現(校正必要又は校正好適記載)を可能な限り洩れ無く格納(登録)している」ことが好ましい。そこで、本発明の文書校正方法及び文書校正装置は実際の文章校正時に出会う校正対象表現をその都度でも多数回を一括してでも、校正用辞書に記憶させられる様に形成されている。これらの校正対象表現の蓄積が増すにつれ、文書の校正精度が高まり、過去の校正実績を、将来の校正に生かすことが出来る。
The present invention is intended to solve the problems associated with various document proofing apparatuses and methods provided so far. Specifically, the present invention describes various deficiencies inherent in a document to be submitted, that is, fonts, as “necessity for improvement” that is difficult to deal with with a kanji conversion dictionary or document proofreading software installed in a conventional word processing software. Inconsistencies, typographical errors, omissions, as well as inconsistent use of terminology, prohibited words, inconsistencies found in connection relations or changes in the end of the idiom, improper character or line feed, or style (number of characters per line And the function of pointing out inconsistencies in the number of lines on one page, top / bottom / left / right margins, etc.).
This proofreading of documents immediately before submission is often required to be completed within a very limited time. Therefore, in this work, various revision requirements contained in the document can be searched quickly and without omission, the revision alternative candidates are presented as necessary, and alternative expressions selected from the alternative candidates are displayed by the proofreader. Replace according to instructions (input). If an appropriate alternative expression is not found in the presented alternative candidates, or if no alternative candidate is presented, the alternative expression input from the proofreader is replaced according to the proofreader's instruction.
In each of the above prior inventions, since the configuration of the proofreading dictionary has not been specifically disclosed, it is apparent from the details how the dictionary can demonstrate the document proofreading ability. It was difficult to see. Also, these proofreading dictionaries are different from those registered by the proofreader that need to be corrected like the configuration dictionary of the present invention, so that correct terms are registered and those that do not apply to correct terms are detected. The calibration was done by the method of doing.
The proofreading dictionary, which is the most important function part constituting the document proofreading method and document proofreading apparatus of the present invention, detects various proofreading expressions (necessary proofreading or proofreading preferable description) that are actually encountered as much as possible and detects them. If there is an alternative candidate, it is displayed. If there is no alternative candidate or there is no alternative preferred expression in the alternative candidate, the current expression is replaced with the current expression instead of the current description according to the input of the proofreader. It is a functional part to be replaced with. For that purpose, it is preferable that the document proofreading dictionary of the present invention “stores (registers) various proofreading expressions (necessary proofreading or proofreading suitable description) that are actually encountered” as much as possible. ” Therefore, the document proofreading method and the document proofreading device of the present invention are formed so that the proofreading target expressions encountered at the time of actual text proofreading can be stored in the proofreading dictionary each time or many times at once. As the accumulation of these proofreading object expressions increases, the proofreading accuracy of the document increases, and the past proofreading results can be used for future proofreading.

本発明は特に、文書校正の要(かなめ)とも言える校正用辞書(別名「修正履歴登録辞書」)の改良に関する。校正用辞書の改良方法としては種々のものが有り得ると思われるが、本発明ではその1例として、既存のワープロソフトの例として、ジャストシステム株式会社の商品名「一太郎」に搭載されているマクロプログラムシステム(略称「マクロ」)を利用する方法を提案する。このマクロを利用するには、検索キーに特定の被検索文字列群を登録して置く方式を挙げることができる。本発明の改良校正用辞書作成の為の具体的手法として、被検索文字列と任意被検索文字との組合せの形が採用でき、「一太郎V12」では「\?」及びプログラム中の改行には、「一太郎V12」のマクロでは被検索文字列に改行(エンター)マークとして「一太郎」では「\n」を用いる。本発明の校正用辞書について強調すべきは校正用辞書がそのメモリーに通常の正規単語(語句又は字句)を収めているだけでなく、寧ろ不正規語句又は誤記字句を多数収めていることである。即ち、本発明の校正用辞書が威力を発揮するのはこの「不正規語句又は誤記字句を多数収めている」ことが大いに与っている。換言すれば、システム(校正用辞書)が発見できるのはそれと同一または近似(任意被検索文字を含む場合)の表現が辞書中に予め収められているからであって、校正対象文章中に存在する不正規表現を当然に検出できる訳ではない。例えば、「無用媒」は「無溶媒」の誤りであるが、システムはこの「無用媒」を当然には検出できない。システムが「無用媒」を校正用辞書中に収めていないからである。同様に、「1般」は「一般」の誤りである。また、「1見の価値」は「一見の価値」の誤りである。これらの誤表現(誤記文字列)はその発見毎に本発明の校正用辞書に登録して置くことが後日の役に立つ。   In particular, the present invention relates to an improvement of a proofreading dictionary (also known as a “correction history registration dictionary”) that can be said to be the key to proofreading documents. There may be various methods for improving the proofreading dictionary, but in the present invention, as an example of this, as an example of an existing word processing software, a macro program installed in the product name “Ichitaro” of Justsystem Corporation. We propose a method that uses a system (abbreviated as “macro”). In order to use this macro, a method of registering a specific character string group to be searched for in a search key can be mentioned. As a specific method for creating the improved proofreading dictionary of the present invention, a combination of a searched character string and an arbitrary searched character can be adopted. In “Ichitaro V12”, “\?” And a line break in a program are used. In the macro of “Ichitaro V12”, “\ n” is used in “Ichitaro” as a line feed (enter) mark in the searched character string. What should be emphasized about the proofreading dictionary of the present invention is that the proofreading dictionary not only contains normal regular words (words or phrases) in its memory, but rather contains many irregular words or typographical words. . In other words, the fact that the proofreading dictionary of the present invention exerts its power is that it “contains many irregular words or typographical phrases”. In other words, the system (the proofreading dictionary) can be found because the same or approximate expression (if any search target character is included) is pre-stored in the dictionary and exists in the proofreading text. Of course, it is not possible to detect irregular expressions. For example, “useless medium” is an error of “no solvent”, but the system cannot naturally detect this “useless medium”. This is because the system does not store “useless media” in the calibration dictionary. Similarly, “1 general” is an error of “general”. “Looking value” is an error of “Looking value”. It is useful at a later date to register these erroneous expressions (erroneous character strings) in the proofreading dictionary of the present invention every time they are found.

この種の誤りは作成者に国語的知識が欠如していることにも起因する。更に、明細書中に「5Oz(オンス)」が「50z」と誤って記載されていた例があった。これはローマ字の「O(オウ)」をタイピストが「0(ゼロ)」と誤読したことに起因する誤記であった。とはいえ、全てのタイピストに外国の度量衡単位の略称までも読めることを期待することには無理がある。何れにせよ、これらの書類はその記載が誤っているままで提出されるべきではない。この種の誤りが1個に限らず、或る程度の個数在る場合には、それらを提出期限前の極めて限られた時間内に洩れ無く是正又は解消することは手作業によっては困難である。その為には本発明の文書校正システムをコンピューターに搭載して、高速で洩れ無く校正作業を遂行する外は無い。
従って、本発明はその校正用辞書中に上記例の様な「修正対象字句、場合によっては誤記字句」を可能な限り多数箇収めていることにこそ、その有用性が存すると言える。本発明の校正用辞書は通常の辞書とは異なって、校正者が予め修正すべきと認識する字句(文字列)を予め登録して置く様に位置付けられている。上の例では「0Z」又は「0z」を一度登録しておくだけで、将来の文書校正の際に、この文字列を発見できる。換言すれば、本発明の校正用辞書は通常の辞書には予め登録(格納)され難い字句(文字列)を校正者が発見の都度、修正対象との関係で重要性判定に掛け、重要と判定されたものを重点的(主体的)に登録して置くものである。従って、格納字句(格納文字列)はそれ自体では何を意味するのかが看取できにくい性格のものである場合が殆どである。
This kind of error is also due to the lack of national knowledge in the creator. Furthermore, there was an example in which “5Oz (ounce)” was erroneously described as “50z” in the specification. This was a typographical error due to the typist misreading the Roman letter “O” as “0”. However, it is impossible to expect all typists to be able to read even abbreviations of foreign units of measure. In any case, these documents should not be submitted in the wrong way. If there is a certain number of this type of error, not just one, it is difficult to correct or eliminate them without omission within a very limited time before the deadline for submission. . To that end, the document proofing system of the present invention is mounted on a computer, and the proofreading operation is performed at high speed without omission.
Therefore, it can be said that the present invention has its usefulness because the proofreading dictionary includes as many “words to be corrected, possibly erroneously written phrases” as in the above example as much as possible. Unlike a normal dictionary, the proofreading dictionary of the present invention is positioned so that a lexical word (character string) that a proofreader recognizes to be corrected in advance is registered in advance. In the above example, “0Z” or “0z” is registered once, and this character string can be found in future document proofreading. In other words, each time the proofreader finds a lexical phrase (character string) that is difficult to be registered (stored) in advance in an ordinary dictionary, the proofreading dictionary of the present invention is subjected to importance determination in relation to the correction target and is important. The determined items are registered with priority (subjective). Therefore, in most cases, the stored phrases (stored character strings) are of a character that makes it difficult to understand what they mean by themselves.

ここで「予め登録して置く」とは、直前に登録して置く場合をも包含する。即ち、同一文書中であれば、文書中で初出の字句(文字列)が確実に登録されることによって後出の同義字句を修正(用語統一を含め)する役割を果たすことができる。この種の校正用辞書が先行資料中には見当らないことから、本発明の校正用辞書は前述の特色だけでも十分な特異性を備えていると言うことができる。尤も、本発明の校正用辞書が最初に或る程度の格納字句数に達した段階で別の校正用辞書へその内容を転写することは当然に可能であるから、この2番目以降の辞書では校正に有用な字句(文字列)が或る程度の個数で予め格納されている場合も実現可能になる。
本発明の校正用辞書は使用前に予め「文字列」を登録できるばかりでなく、使用の過程においても新しい「文字列」を追加登録できる様に編成されている。しかし、上述のようにこの「文字列」には通常的な意味又は妥当性等が備っていることを全く要しない。即ち、本発明の校正ソフトに搭載されている「校正用辞書」の役割はワープロソフト等に搭載(格納)されている通常の「辞書」ソフトとは全く異なって、「正しい字句(文字列)」を格納していることに意義があるのではない。却って、本発明の校正ソフトに搭載されている校正用辞書は「校正者が修正を要すると認識している文字列(字句)」即ち、多くの場合には、それ自身では読手が意味を読取り兼ねる文字列を主対象として格納することにその存在意義(使命)を備えている。
Here, “pre-registered and placed” includes a case of registering and placing immediately before. That is, in the same document, it is possible to play a role of correcting (including term unification) later synonymous words and phrases by reliably registering the first words and phrases (character strings) in the document. Since this type of proofreading dictionary is not found in the preceding documents, it can be said that the proofreading dictionary of the present invention has sufficient specificity even with the above-mentioned feature alone. However, since the proofreading dictionary of the present invention first reaches a certain number of stored phrases, it is naturally possible to transfer the contents to another proofreading dictionary. It is also possible to realize a case where a certain number of lexical phrases (character strings) useful for proofreading are stored in advance.
The proofreading dictionary of the present invention is organized so that not only “character strings” can be registered in advance but also new “character strings” can be registered in the course of use. However, as described above, this “character string” does not need to have a normal meaning or validity. That is, the role of the `` proofreading dictionary '' installed in the proofreading software of the present invention is completely different from the normal `` dictionary '' software installed (stored) in word processing software etc., `` correct lexical (character string) Is not meaningful. On the other hand, the proofreading dictionary installed in the proofreading software of the present invention is a `` character string (lexical phrase) recognized by the proofreader as requiring correction '', i.e., in many cases, the reader itself makes sense. Storing a character string that doubles as a main object has its significance (mission).

上記の「校正者が読取り兼ねる」文字列としては、文案作成者又は校正者の個性(癖)に起因して繰返される意外な誤字句が発生し得る。この種の「読取り兼ねる文字列」は校正者が異なればそれぞれに異なり得るので、相互間に必然的な共通性は無い。尤も、或る範囲では共通性が見られる場合があっても、それは偶然の結果に過ぎない。
本発明の文書校正方法及びその装置は複数の校正者が同時に用いる場合には、本発明のシステムを共通のサーバーコンピューター(略称「サーバー」)に搭載して、それにそれぞれのクライアントコンピューター(略称「クライアント」)が接続され、各校正者がそのクライアントからサーバーへ独立にアクセスできる様に編成することもできる。このクライアント−サーバー方式は多くの文書作成機関例えば特許事務所等では極めて実用的である。この文書校正システムでは、校正用辞書へ各校正者が自由にアクセスできて、各自が発見した「修正すべき文字列」を校正用辞書へ自由に書込める様に編成されていることが有用である。尤も、この校正用辞書の登録文字列の是正、整理及び整頓は各校正者には任せずに単一人の統一責任者が行なう体制であることが極めて重要である。なお、統一責任者は作成機関全体で必ずしも単一人であることを要しない。文書作成機関が複数の部門を擁している場合には、各部門にそれぞれの統一責任者を置くことが有益である。なお、本明細書中には図示されていないが、通常は付設されている機能部として例えば、入力機能部を挙げることができる。この「入力機能部」と称されるものは文書校正を行なう為には極めて有用な機能部であって、校正されるべき文書をシステムへ導入する為に電子コード化する役割を果たす機能部である。従って上記の「入力機能部」とは、例えば、キーボード、マウス、スキャナー(OCRソフトと併用必要)、磁気フロッピーディスクドライブ(FDD)、MOドライブ(MOD)、DVDドライブ、磁気テープ読取機、磁気信号読取機又は他のコンピューター等であり得る。
As the above-mentioned character string “reading by the proofreader”, an unexpected typographical word that repeats due to the personality (癖) of the drafter or proofreader may occur. Since this type of “character string that doubles as reading” can be different for different proofreaders, there is no inevitable commonality between them. However, even if there is a commonality in a certain range, it is only a coincidence.
When a document proofreading method and apparatus of the present invention are used simultaneously by a plurality of proofreaders, the system of the present invention is mounted on a common server computer (abbreviated as “server”) and each client computer (abbreviated as “client”). )) And can be organized so that each proofreader has independent access to the server from its clients. This client-server system is very practical in many document creation institutions such as patent offices. In this document proofreading system, it is useful that each proofreader can freely access the proofreading dictionary and that the “character string to be corrected” discovered by each writer can be freely written in the proofreading dictionary. is there. However, it is extremely important that a single person in charge of unification is responsible for correcting, organizing, and organizing the registered character strings in this proofreading dictionary without leaving it to each proofreader. Note that the person in charge of unification does not necessarily need to be a single person for the entire agency. When the document creation organization has multiple departments, it is beneficial to have a uniform manager in each department. Although not shown in the present specification, an input function unit can be given as an example of a function unit that is normally attached. The so-called “input function unit” is a function unit that is extremely useful for proofreading a document, and is a function unit that plays a role in electronically encoding a document to be proofread into the system. is there. Therefore, the “input function unit” includes, for example, a keyboard, a mouse, a scanner (necessary to use with OCR software), a magnetic floppy disk drive (FDD), an MO drive (MOD), a DVD drive, a magnetic tape reader, and a magnetic signal. It may be a reader or other computer.

本発明の第5の文章校正装置は上記修正履歴登録辞書に基いて上記校正対象表現検出機能部は校正対象文章中の校正対象表現を検出する装置である。この検出には、検出操作をキーボードのキーに登録してキー操作により開始し、くり返し検索で検索を進めていくほか、校正文書中の校正対象表現に校正頁が進むにつれ自動的に文字に色を付して表示させたり、白黒反転させて表示させ、校正することも可能である。修正履歴検出機能部は校正対象表現と置換された代替表現とが対応づけて登録されている機能部である。
修正履歴検索機能部は必要に応じて設けることができ、上記修正履歴登録辞書に基いて、上記校正対象表現検出機能部で検出された校正対象表現を検索キーとし、代替表現を検索する。代替候補決定機能部は校正対象表現が修正履歴登録辞書に登録されている場合には対応づけられた代替表現を代替候補とする一方、登録されていない場合には校正者によって入力された代替表現を代替候補とする。
置換機能部は校正対象表現と上記代替候補決定機能部で決定された代替候補とを自動的に置換する。修正履歴登録機能部は置換を行なった校正対象表現とを対応づけて上記修正履歴登録辞書に追加登録する機能部である。本発明の第7の文章校正装置においては、校正者の入力した指示に従って、選択機能部が本発明の第5の文章校正装置の修正履歴登録機能部で登録するか否かを選択する。
本発明の第12の文章校正装置においては、校正者による指示があった場合に本発明の第5の文章校正装置の置換機能部がモード切替機能部を自動的に起動させる様にモード切替を行なう。
本発明の文章校正対象表現検出機能部においては、修正履歴検出機能部が通常の正規語に加えて不正規語をも登録状態で収録していることも可能である。
A fifth sentence proofreading apparatus according to the present invention is an apparatus in which the proofreading expression detection function unit detects a proofreading expression in a proofreading sentence based on the correction history registration dictionary. In this detection, the detection operation is registered to the keyboard key and started by key operation. The search is repeated and the search automatically proceeds as the proofreading page advances to the proofreading expression in the proofreading document. It is also possible to calibrate by displaying with a mark or by inverting the black and white. The correction history detection function unit is a function unit in which the proofreading target expression and the replaced alternative expression are registered in association with each other.
The correction history search function unit can be provided as necessary, and based on the correction history registration dictionary, the proofreading target expression detected by the proofreading target expression detection function unit is used as a search key to search for alternative expressions. If the proofreading target expression is registered in the correction history registration dictionary, the alternative candidate determination function unit sets the associated alternative expression as a replacement candidate, while if not registered, the alternative expression input by the proofreader Is an alternative candidate.
The replacement function unit automatically replaces the proofreading target expression with the replacement candidate determined by the replacement candidate determination function unit. The correction history registration function unit is a function unit for additionally registering in the correction history registration dictionary in association with the proofreading target expression that has been replaced. In the seventh sentence proofreading apparatus of the present invention, according to the instruction input by the proofreader, the selection function unit selects whether or not to register with the correction history registration function part of the fifth sentence proofreading apparatus of the present invention.
In the twelfth sentence proofreading apparatus of the present invention, the mode switching is performed so that the replacement function part of the fifth sentence proofreading apparatus of the present invention automatically activates the mode switching function part when instructed by the proofreader. Do.
In the sentence proofreading object expression detection function unit of the present invention, the correction history detection function unit can also record irregular words in a registered state in addition to normal regular words.

(実施例1)
以下に、本発明を数個の実施例の形で文章校正装置について図面を参照しながら説明する。図1は本発明の文章校正装置の1例を示すブロック図であり、これに限定されない。図1において、
1は文章記憶機能部であって、不図示の入力機能部から入力された日本語文章を保持する機能部(記憶装置)である。この文章記憶機能部1は光磁気ディスク(MO)又はフロッピー磁気ディスク(FD)、CD±R(W)又はDVD±R(W)等の日本語文章を記憶できるものであれば、いかなる構成のものでも差支え無い。また、日本語文章はキーボード等から入力されたもの、音声認識又は文字認識の結果入力されたものであってもよく、ネットワーク又はFD等によって他の装置から転送されたものでもよい。前記の入力機能部は、例えばキーボード、イメージスキャナー(文字入力をコード化するにはOCR必要)、カードリーダーその他のコードリーダーの場合も有り得る。
2は校正対象表現検出機能部(文章誤り検出装置)であって、別名「文章解析機能部」とも称され得る機能を果たす機能部である。この検出機能部は不図示の日本語解析用辞書に基づいて上記の文章記憶機能部1に記憶されている日本語文章の中から校正者が予め登録して置いた1以上の文字列であって校正者が修正の意図を有している文字列が校正用辞書に記憶されている文字列等の校正対象表現を検索する機能部である。ここで「校正者が予め登録して置いた」という表現は校正者自身が記憶(登録)させる操作を一貫して行なった場合と共に、校正者がシステムを自動モードへ切替えて、記憶操作の各段階を自動的に行なわせ、記憶終了を認識した際に記憶操作を停止させた場合をも包含する。
(2.1.)上記の「校正者が予め登録して置いた」文字列(表現)とは、主として「不自然な字句間の繋がり(係り合い)、送り仮名の誤り並びに送り仮名等の不統一、接頭語又は接尾語等の用語の不統一」の意味である。また文書内容の対象になっている分野でよく間違える言葉、例えば「公報」を「広報」としている場合、蒸留分野で「還流」を「環流」としている場合などである。特に、この種の「不自然な字句間の繋がり(繋がり=係り合い)」に相当するものは一般にその字面だけを見たのでは意味を看取でき兼ねる字句(文字列)である。例えば、「・・・は極めた良好な〜」(「た」を「て」とすべき)、「・・・なって。」(「て」を「た」とすべき)、「考る」(「考える」とすべき)、、「塗幕」(「塗膜」とすべき)等数えきれない程に多数の記載例を挙げることができる。これらに加えて、半角であるべき文字列(記号を含む)が全角で入力されている場合及びその逆の場合をも挙げることができる。これらと同様に、漢字で入力すべき字句が平仮名又は片仮名で入力されている場合及び平仮名であるべき字句が漢字又は片仮名で入力されている場合も本発明における「修正すべき対象表現」に加えられる。例えば、「ことなる」(ひらがなでなく、漢字で「異なる」とするべき)が挙げられる。
(2.2.)なお、本発明の「校正者が予め登録して置いた校正対象表現を検出する」機能部は通常の文書作成ソフト(ワープロソフト等)が備えている次掲の機能の何れをも備えていない。即ち、校正対象表現を予め辞書に登録されていた正しい語句と対比して誤っている表現を検出する機能、禁止用語(主として種々の差別表現、差別用語等)等の校正対象表現を検出する機能及び「行端禁制」の様な機能の何れをも備えていない。
(2.3.)上掲の特定文字列の中でも本発明の検出機能によってしか検出されないものが「校正者によって予備登録された字句間の不自然な繋がり」、「校正者によって予備登録された字句間の不自然な流れ」である。本発明の文書校正システムは実際に文章校正の際に遭遇する「不自然な字句間の繋がり」をその都度登録できる様に編成されていることが「使い込まれる程に諸種の誤字句」を洩れ無く検出できる能力を取得する結果に繋がる。
3は修正履歴登録辞書であって、別名「解析結果記憶機能部」とも称され得る機能部である。この記憶機能部は前出の「文章記憶機能部」と共通性を備えたもので足り、例えば文章校正の際に校正対象表現と、当該校正対象表現を置換した代替表現と、を対応づけて書換え可能なメモリーに記憶するものである。この辞書は後出する「修正履歴登録機能部」と基本的には同一機能を果たす。校正対象表現と置換された代替表現とを対応づける方式としては、例えば上掲の1で検出された校正されるべき表現自体及びその出現位置を記憶すると共に、それを校正用辞書に記憶された代替候補表現と対比させた形で表示するものである。記憶媒体としては、HD、CD(例えば、CD±R及びCD±RW)又はDVD(DVD±R及びDVD±RW並びにDVDRAMの何れでも可)、光磁気ディスク(MO)又はフロッピー磁気ディスク(FD)、磁気テープ等の日本語文章を記憶できるものであれば、いかなる構成のものでも差支え無い。
4は修正履歴検索機能部であって、校正対象表現文字列を検索キーとして、それと対応づけた形で上記修正履歴登録辞書3に記憶(登録又は格納)されている代替候補中から代替表現を検索する機能部である。この機能が作動する為の前提は対応づけが既に1回以上行なわれていることである。しかし、本発明の検索部は上記の記憶済み代替表現に該当しない表現は検出しない様に編成され得る。この種の表現とは、主として上述の「不自然な字句間の繋がり」に該当する場合である。即ち、この種の「修正すべき対象表現」はデフォルト(蔵出し)の校正用辞書には登録(格納)され難いから、この種の表現に遭遇した際にはそれが校正用辞書へ記憶される為に入力されることが原則的に必要である。この入力は自動的又は校正者の指示に従って行なわれ得る。
5は代替候補決定機能部であって、上記の校正対象検出部2で検出された校正対象が上記の修正履歴登録辞書3に記憶されている場合には対応づけられた代替表現を代替候補とする一方、検出された校正対象表現が上記の修正履歴登録辞書3に記憶されていない場合には後述する代替表現入力機能部10から入力される代替表現を代替候補とする機能部である。この代替候補決定機能部には、上記の機能に加えて次の機能が加わっていることが有用である。即ち、代替候補決定機能部が入力文(校正対象文章)を文字列単位に解析する過程で入力文を構成する文字列中に、新出文字列が存在する場合には、上記の「修正履歴登録辞書」の内容を参照して当該文字列単位が新出文字列であることを表示機能部に表示させると共に、解析結果記憶機能部にその結果を記憶させることを言う。ここで「新出文字列」と称するのはそれが校正用辞書にも修正履歴登録辞書にも記憶(登録)されていない文字列であることを言う。当該文字列が新出文字列である場合には、表示機能部にそれを表示させる処理を行なう。この表示が終わった後に、解析位置を新出文字列の末尾位置へ移して解析を再開する。
6は文章更新機能部であって、校正対象表現を代替候補で置換し、上記の文章記憶機能部1に記憶されている文章を新たな入力に従って更新する機能部である。この決定は自動的又は校正者の指示に従って行なわれ得る。
7はモード指定部であって、文章の更新を行なう場合に、文章更新指示機能部8からの校正者による指示に応じて上記の文章更新機能部6を起動し、校正対象表現と代替候補とを置換する対話モード又は代替表現が検索され次第、上記の文章更新機能部6を起動して自動的に置換を行なう自動モードに設定するかを校正者に選択させるものである。
8は文章更新指示機能部であって、文章の更新を校正者に指示させる機能部である。
9は制御機能部であって、上記のモード指定部7で設定されたモードに応じて上記文章更新機能部6及び上記の文章更新機能部8を起動させる機能部である。
10は代替表現入力機能部であって、校正者によって入力された校正対象表現に対応する代替表現を受付ける機能部である。
11は登録指示機能部であって、校正対象表現(文字列)とその代替候補(文字列)とを上記の修正履歴登録辞書3に登録するか否かを校正者に選択させる機能部である。校正者が手動修正を行なうか、自動修正を行なわせるかを選択して、その指示を登録指示機能部へ伝えると、手動修正が指示された場合には、校正者からの指示を待つ表示を表示機能部に示し、自動修正が指示された場合には、校正者の手を経ずにシステムによって自動的に修正が行なわれる。
12は修正履歴登録機能部(辞書)であって、上記の修正履歴登録辞書3に校正を行なった校正対象表現と代替候補とを対応づけて登録する機能部である。実際には、これらの機能部以外にも校正者が日本語文章を入力する為の文章入力機能部(不図示)に加えて、日本語文章及び検出された校正対象表現等を表示する為の表示機能部等の種々の構成要素を必要とするが、本発明の主眼ではないので、説明を省略する。
以上のように構成された文章校正装置について予め入力された文章に対し、校正対象表現としての送り仮名の誤りを校正する場合を例として、以下に説明する。なお、送り仮名の不統一及び禁止用語等のその他の校正対象表現も同様の動作によって校正できる。
(1)文章校正の際に、校正者によってモード指定部7を介して文章の校正を対話的に行なうか又は自動的に行なうかが設定される。
ここでは、校正者が自動的に校正を行なおうとの意向で当該モードが設定されている。
(2)予め入力された文章を校正する為に校正者によって送り仮名の誤りを検出する指示が行なわれる。
(3)校正対象表現検出機能部2は文章記憶機能部1に記憶されている日本語文章の中から送り仮名の誤りを検出する。検出の結果、「行こなう」という校正対象表現が検出されたと仮定する。
(4)代替候補決定機能部5は送り仮名の誤りを修正する為の代替候補を決定する為に先ず、修正履歴検索機能部4を起動する。
(5)修正履歴検索機能部4は校正対象表現「行こなう」を検索キーとして修正履歴登録辞書3を検索し、以前に「行こなう」という表現を別の表現に修正したという履歴があるか否かを調べる。ここでは、以前に該当する修正を行なっていない場合として、該当するものが検索できなかったという情報を出力する。
(6)代替候補決定機能部5は上記の修正履歴検索機能部4からの情報に応じて、代替表現の入力を受付ける為に代替表現入力機能部10を起動する。
(7)代替表現入力機能部10は校正者に校正対象表現に対する代替表現を入力する様に促し、この入力された代替表現を出力する。例えば、代替表現として「行う」が入力されたとすると、当該修正履歴を登録すべきか否かに校正者から指示を受ける為に登録指示機能部11が起動される。
(8)登録指示機能部11は当該修正履歴を修正履歴登録辞書3に保存すべきか否かを校正者に問い合せると共に、校正者からの指示を受付けてそれを出力する。この際に、校正者は、例えば当該修正が一過性のものであると判断すれば、「登録しない」と決定し、一過性でなく以後も何回も検出されて同一の修正を行なう可能性が有ろうと判断すれば、「登録する」と決定すればよい。「登録する」という指示が校正者から与えられると、登録指示機能部11はその指示を受付けて修正履歴登録機能部12に出力する。
なお、上記で校正者が「一過性」であるか否かを判断する一助として、同様の「誤り」が同一の画面に複数個存在する筈であることをシステムが検知した場合には、それらを全て同時に表示する様にシステムが編成されていることが好ましい。この複数同時表示によって、校正者は少なくとも当該文書内ではこの「誤り」が今後も出現すると予想できることになる。それに加えて、修正されるべき文字列が活用する単語である場合には、各語の語尾変化がその位置に応じて必ずしも同一ではない場合があることから、それらを前後関係に最適に調整する為にも、各「誤り」が同一画面に表示されることは有用である。
(9)修正履歴登録機能部12は登録指示機能部11からの出力に従って校正対象表現文字列「行こなう」とその修正の為の代替候補の文字列「行う」とを対応づけて、修正履歴登録辞書3に登録する。その際に、登録すべきものと同一のものが既に修正履歴登録辞書3に登録されている場合には、登録は行なわれない。
(10)校正者は文章中の校正対象表現の修正を実施する為に文章更新指示機能部8を用いてその旨を指示する。
(11)文章更新機能部6は当該校正対象表現「行こなう」を代替表現入力機能部10によって入力された代替候補「行う」に書換えて、文章記憶機能部1の内容を更新する。
上記の(4)〜(11)までの各処理によって、当該校正対象表現「行こなう」に対する修正操作が完了する。更に、後続する文章に対して送り仮名の誤りの検出及び修正作業が引続き行なわれる。そして、上記のように修正履歴登録辞書3に校正対象表現「行こなう」と代替表現「行う」とが登録されている状態で、再度同一の校正対象表現「行こなう」が検出された場合には、次の様な動作が行なわれる。
(12)代替候補決定機能部5は校正対象表現「行こなう」を修正する為の代替候補を決定する為には先ず、修正履歴検索機能部4を起動する。
(13)修正履歴検索機能部4は「行こなう」を検索キーとして修正履歴登録辞書3を検索する。ここでは、以前に「行こなう」という校正対象表現に対して「行う」を用いて修正履歴登録機能部において修正履歴として登録されているので、「行う」が検索され、その情報が出力される。
そこで、上記のモード指定部7によって自動モードに設定されている場合には、以下の各項に示されている機能又は作業が実行される。
(14)代替候補決定機能部5は修正履歴検索機能部4の出力から過去の修正と同様の修正を行なうべく文章更新機能部6を起動する。
(15)文章更新機能部6は当該校正対象表現を代替候補に書換えて文章記憶機能部1の内容を更新する。その際に更新が自動で行なわれた場合には、校正者からの指示を全く要しない。
(16)文書更新指示機能部からの校正者の指示によって文書更新機能部6が起動され、校正対象表現を逐次確認しながら代替候補によって置換して行く。
上記のように自動的に校正を行なうことができる寄与で、過去に既に行なわれた修正と全く同一の修正を行なう場合には、校正者が代替候補を入力する操作、文章の更新を指示する操作を省くことができ、操作の簡素化が図れると同時に修正時間の短縮が実現できる。
また、同一の校正対象表現に対しては同一の修正を施すことが可能になり、修正作業段階で新たな誤り(表記の不統一、同一概念の別単語による表現等)を犯してしまう事態を排除できる。また、登録指示機能部11を設けることによって校正者が必要と判断した守勢履歴だけを選択的に記憶することができる寄与で、前後の文脈を含めて判断して初めて修正候補を特定できる様な場合には、不本意な修正を自動的に行なってしまうことが回避できる。
それに加えて、本発明はモード指定部7を設けることによって、自動的に校正対象表現を修正する方式に加えて、従来行なわれていた校正者が逐次確認しながら校正対象表現を修正して行く手動方式の双方を採用可能である。なお、本実施例においては、代替候補を表わす情報として代替候補の文字列を用いる例が示されているが、校正対象辞書の索引情報又は文字列を修正する為の一連の命令等のその他の情報をも用いる様にすることもできる。
また、校正対象表現を表わす情報として校正対象表現の事例を用いる例が示されているが、校正対象辞書の索引情報又は文章記憶部21内での位置及び長さの情報等の「その他の情報」を用いる様にすることもできる。
Example 1
In the following, the present invention will be described in the form of several embodiments of a text proofing apparatus with reference to the drawings. FIG. 1 is a block diagram showing an example of a sentence proofreading apparatus of the present invention, and the present invention is not limited to this. In FIG.
Reference numeral 1 denotes a sentence storage function unit, which is a function unit (storage device) that holds Japanese sentences input from an input function unit (not shown). This text storage function unit 1 can have any configuration as long as it can store Japanese text such as magneto-optical disk (MO) or floppy magnetic disk (FD), CD ± R (W) or DVD ± R (W). Even things can be used. The Japanese text may be input from a keyboard or the like, input as a result of speech recognition or character recognition, or transferred from another device via a network or FD. The input function unit may be, for example, a keyboard, an image scanner (requires OCR to encode character input), a card reader, and other code readers.
Reference numeral 2 denotes a proofreading target expression detection function unit (sentence error detection device), which is a function unit that performs a function that can also be referred to as an alias “sentence analysis function unit”. This detection function unit is one or more character strings registered in advance by a proofreader from Japanese sentences stored in the sentence storage function unit 1 based on a Japanese analysis dictionary (not shown). This is a function unit that searches for a proofreading expression such as a character string in which a character string that the proofreader intends to correct is stored in a proofreading dictionary. Here, the expression “pre-registered by the proofreader” means that the proofreader himself consistently performed the operation to memorize (register), and the proofreader switched the system to the automatic mode, The case where the step is automatically performed and the storage operation is stopped when the end of the storage is recognized is also included.
(2.1.) The above-mentioned character string (expression) registered in advance by the proofreader is mainly “unnatural lexical connection (interaction), error in sending kana and inconsistency in sending kana etc. , "Unfixed terms such as prefix or suffix". Also, there are words that are often mistaken in the field that is the subject of the document content, for example, “publication” is “public information”, and “reflux” is “circulation” in the distillation field. In particular, what corresponds to this kind of “unnatural connection between lexical phrases (connection = engagement)” is a lexical phrase (character string) that can generally be understood only by looking at the face. For example, "... is extremely good ~"("Ta" should be "te"), "... become."("Te" should be "ta"), "Think ("Think"), "Coating"("Coating"), and so on. In addition to these, a case where a character string (including symbols) that should be half-width characters is input in full-width characters and vice versa can also be cited. In the same manner as above, when a lexical character to be input in kanji is input in hiragana or katakana, and when a lexical character to be in hiragana is input in kanji or katakana, it is added to the “target expression to be corrected” in the present invention. It is done. For example, “to be different” (should be “different” in kanji, not hiragana).
(2.2.) It should be noted that the “detect proofreading expression previously registered by proofreader” function part of the present invention has any of the following functions provided in normal document creation software (such as word processing software). It does not have. In other words, a function for detecting a proofreading target expression such as a prohibited term (mainly various discriminatory expressions, a discriminatory term, etc.) In addition, it does not have any function such as “line end prohibition”.
(2.3.) Among the above-mentioned specific character strings, those that can only be detected by the detection function of the present invention are “unnatural connection between lexical characters preliminarily registered by a proofreader” and “between lexical characters preliminarily registered by a proofreader. Is an unnatural flow. The document proofreading system of the present invention is organized so that it can be registered each time the "unnatural connection between lexical phrases" encountered during proofreading of sentences. It leads to the result of acquiring the ability to detect without.
Reference numeral 3 denotes a correction history registration dictionary, which is a function unit that can also be called an alias “analysis result storage function unit”. This memory function unit is sufficient to have the commonality with the above-mentioned `` text memory function unit '', for example, by associating the proofreading target expression with the alternative expression replacing the proofreading target expression at the time of proofreading the sentence. It is stored in a rewritable memory. This dictionary basically performs the same function as the “correction history registration function” described later. As a method of associating the proofreading target expression with the replaced alternative expression, for example, the expression itself to be proofread detected in the above 1 and the appearance position thereof are stored and stored in the proofreading dictionary. It is displayed in contrast with the alternative candidate expression. Storage media include HD, CD (for example, CD ± R and CD ± RW) or DVD (any of DVD ± R and DVD ± RW and DVDRAM), magneto-optical disk (MO), or floppy magnetic disk (FD) Any structure that can memorize Japanese sentences such as magnetic tape can be used.
Reference numeral 4 denotes a correction history search function unit, which uses a proofreading expression character string as a search key, and selects an alternative expression from among alternative candidates stored (registered or stored) in the correction history registration dictionary 3 in a form associated with the search key. It is a functional part to search. The premise for this function to work is that the association has already been done more than once. However, the search unit of the present invention can be organized so as not to detect expressions that do not correspond to the stored alternative expressions. This type of expression mainly corresponds to the above-described “unnatural connection between words”. That is, this kind of “target expression to be corrected” is difficult to register (store) in the default (stored) proofreading dictionary, so when this kind of expression is encountered, it is stored in the proofreading dictionary. In principle, it is necessary to input for this purpose. This input can be done automatically or according to the instructions of the proofreader.
Reference numeral 5 denotes an alternative candidate determination function unit. When the calibration target detected by the calibration target detection unit 2 is stored in the correction history registration dictionary 3, the associated alternative expression is set as the alternative candidate. On the other hand, when the detected proofreading target expression is not stored in the correction history registration dictionary 3, the function unit uses an alternative expression input from the alternative expression input function unit 10 described later as an alternative candidate. In addition to the above functions, it is useful that this alternative candidate determination function unit has the following functions. That is, if a new character string exists in the character string constituting the input sentence in the process in which the alternative candidate determination function unit analyzes the input sentence (proofreading sentence) in character string units, Refers to the contents of the “registration dictionary” to display on the display function unit that the character string unit is a new character string and to store the result in the analysis result storage function unit. Here, the term “new character string” means that the character string is not stored (registered) in the proofreading dictionary or the correction history registration dictionary. If the character string is a new character string, the display function unit displays it. After this display is finished, the analysis position is moved to the end position of the new character string and the analysis is resumed.
A text update function unit 6 replaces the proofreading expression with an alternative candidate, and updates the text stored in the text storage function unit 1 according to a new input. This determination can be made automatically or according to the instructions of the proofreader.
Reference numeral 7 denotes a mode designating unit which activates the text update function unit 6 in response to an instruction from the text update instruction function unit 8 when the text is updated. As soon as an interactive mode or an alternative expression for replacement is found, the sentence update function unit 6 is activated and the proofreader selects whether to set the automatic mode for automatic replacement.
Reference numeral 8 denotes a text update instruction function unit, which is a function unit that instructs the proofreader to update the text.
A control function unit 9 is a function unit that activates the text update function unit 6 and the text update function unit 8 according to the mode set by the mode designating unit 7.
An alternative expression input function unit 10 is a function unit that receives an alternative expression corresponding to a proofreading target expression input by a proofreader.
A registration instruction function unit 11 is a function unit that allows the proofreader to select whether or not to register the proofreading target expression (character string) and its alternative candidate (character string) in the correction history registration dictionary 3. . When the proofreader selects manual correction or automatic correction and sends the instruction to the registration instruction function unit, when manual correction is instructed, a display waiting for the instruction from the proofreader is displayed. When the automatic correction is instructed as shown in the display function unit, the correction is automatically performed by the system without the manual of the proofreader.
Reference numeral 12 denotes a correction history registration function unit (dictionary), which is a function unit for registering the proofreading target expression calibrated and the alternative candidate in association with each other in the correction history registration dictionary 3. Actually, in addition to these function units, in addition to the text input function unit (not shown) for the proofreader to input Japanese text, it also displays Japanese text and detected proofreading expression etc. Although various components such as a display function unit are required, they are not the main point of the present invention, and thus the description thereof is omitted.
The following description will be given by taking as an example a case where an error in a sending kana as a proofreading expression is calibrated with respect to a sentence input in advance for the sentence proofreading apparatus configured as described above. It should be noted that other proofreading expressions such as inconsistencies in sending kana and prohibited terms can be proofread by a similar operation.
(1) At the time of sentence proofreading, it is set by the proofreader whether to proofread the sentence interactively or automatically through the mode designating unit 7.
Here, this mode is set with the intention that the proofreader automatically proofreads.
(2) In order to proofread a sentence that has been input in advance, the proofreader gives an instruction to detect an error in the kana.
(3) The proofreading target expression detection function unit 2 detects an error in the sending kana from the Japanese sentences stored in the sentence storage function unit 1. As a result of the detection, it is assumed that the expression to be calibrated “Let's go” is detected.
(4) The substitution candidate determination function unit 5 first activates the correction history search function unit 4 in order to determine a substitution candidate for correcting an error in the sending kana.
(5) The correction history search function unit 4 searches the correction history registration dictionary 3 using the proofreading expression “Yoko Konau” as a search key, and has a history that the expression “Yoko Konau” has been previously corrected to another expression. Check if there is any. Here, information indicating that the corresponding item could not be searched is output as a case where the corresponding correction has not been performed before.
(6) The alternative candidate determination function unit 5 activates the alternative expression input function unit 10 to accept the input of the alternative expression in accordance with the information from the correction history search function unit 4 described above.
(7) The alternative expression input function unit 10 prompts the proofreader to input an alternative expression for the expression to be proofread, and outputs the input alternative expression. For example, if “perform” is input as an alternative expression, the registration instruction function unit 11 is activated to receive an instruction from the proofreader as to whether or not the correction history should be registered.
(8) The registration instruction function unit 11 inquires of the proofreader whether or not the correction history should be stored in the correction history registration dictionary 3, and receives an instruction from the proofreader and outputs it. At this time, if the proofreader determines that the correction is temporary, for example, the proofreader decides not to register, and the correction is not repeated but is detected several times thereafter and the same correction is performed. If it is determined that there is a possibility, “registration” may be determined. When an instruction “register” is given from the proofreader, the registration instruction function unit 11 accepts the instruction and outputs it to the correction history registration function unit 12.
As an aid to determining whether the proofreader is “temporary” above, if the system detects that there should be multiple similar “errors” on the same screen, The system is preferably organized so that they are all displayed simultaneously. This multiple display allows the proofreader to predict that this “error” will appear in the document at least in the future. In addition, if the character string to be corrected is a word to be used, the ending change of each word may not always be the same depending on its position, so they are optimally adjusted to the context For this reason, it is useful that each “error” is displayed on the same screen.
(9) The correction history registration function unit 12 makes a correction by associating the proofreading target expression character string “Yokona” with the alternative candidate character string “Done” for the correction in accordance with the output from the registration instruction function unit 11. Register in the history registration dictionary 3. At this time, if the same thing to be registered is already registered in the correction history registration dictionary 3, registration is not performed.
(10) The proofreader uses the sentence update instruction function unit 8 to instruct that to correct the expression to be proofread in the sentence.
(11) The text update function unit 6 updates the content of the text storage function unit 1 by rewriting the proofreading target expression “Gone” to the alternative candidate “perform” input by the alternative expression input function unit 10.
By each of the above processes (4) to (11), the correction operation for the proofreading target expression “Konako” is completed. Further, the detection and correction work of the sending kana error is continued for the succeeding sentence. Then, as described above, the same proofreading expression “Yokona” is detected again in a state where the proofreading expression “Yokokono” and the alternative expression “Perform” are registered in the correction history registration dictionary 3. In such a case, the following operation is performed.
(12) The alternative candidate determination function unit 5 first activates the correction history search function unit 4 in order to determine an alternative candidate for correcting the proofreading target expression “Konaru”.
(13) The correction history search function unit 4 searches the correction history registration dictionary 3 by using “Let's go” as a search key. Here, since the correction history registration function unit previously registered “correction history” using “do” for the expression to be calibrated “going”, “do” is searched and the information is output. The
Therefore, when the automatic mode is set by the mode designating unit 7 described above, the functions or operations shown in the following items are executed.
(14) The alternative candidate determination function unit 5 activates the text update function unit 6 to perform the same correction as the past correction from the output of the correction history search function unit 4.
(15) The text update function unit 6 updates the content of the text storage function unit 1 by rewriting the proofreading target expression to an alternative candidate. If the update is performed automatically at that time, no instruction from the proofreader is required.
(16) The document update function unit 6 is activated by an instruction from the proofreader from the document update instruction function unit, and is replaced with alternative candidates while sequentially checking the proofreading target expression.
In the case of a contribution that can be automatically proofread as described above, and when making a correction that is exactly the same as a correction that has already been made in the past, the proofreader inputs an alternative candidate and instructs the update of the text. The operation can be omitted, the operation can be simplified and the correction time can be shortened.
In addition, it is possible to apply the same correction to the same proofreading expression, and in the correction work stage, a new error (inconsistent notation, expression with another word of the same concept, etc.) will be committed. Can be eliminated. Further, by providing the registration instruction function unit 11, it is possible to selectively store only the defense history judged to be necessary by the proofreader, and it is possible to specify a correction candidate only after judging including the context before and after. In this case, it is possible to avoid making an unintentional correction automatically.
In addition to this, in the present invention, by providing the mode designating unit 7, in addition to the method of automatically correcting the proofreading object expression, the proofreader expression that has been performed in the past is corrected while sequentially checking. Both manual methods can be adopted. In this embodiment, an example in which a character string of an alternative candidate is used as information representing an alternative candidate is shown, but other information such as a series of instructions for correcting index information in the proofreading target dictionary or the character string is shown. Information can also be used.
In addition, although an example using the example of the proofreading target expression as information representing the proofreading target expression is shown, “other information such as index information of the proofreading target dictionary or position and length information in the text storage unit 21 is shown. Can also be used.

(実施例2)
校正対象文章中に仮に「・・・途戸居る・・・」があっても、実施例1において用いられたと同一の文書校正システムによっては、この誤記は自動修正され得ない。即ち、この誤記をいかに修正すべきかはシステムからは提案され得ない。これは人間であるワープロソフトを用いる校正者の頭脳に蓄えられた言語知識による外は無いからである。なお、この誤記は正規表現では「用いる」となっているべきであったにも拘わらず、ワープロ校正者の指使いに生じた誤動作に起因したものと推測される。
この種の誤記載を予想することは殆ど不可能であるから、この様な誤字句を予め校正用辞書に登録しておくことはできない。この様な誤記載に出会った時点でこの誤りが再度出現するか否かを予想して、再出現の可能性が高いと予想できる場合には、この誤字句(誤表現)を校正用辞書に登録して置けば、それが次に出現した際には文書校正システムが自動的に検出して表示する。また、モード指定部7を自動モードに設定して置けば、文書校正システムが前掲の(14)〜(16)の段階を自動的に実行して、当該誤りを自動的に修正することもできる。
本発明では、改良校正用辞書作成の為の具体的手法例として、被検索文字列と任意被検索文字との組合せの形が採用でき、ワープロソフト「一太郎」では「\?」及びプログラム中の改行には、「一太郎」マクロでは被検索文字列に改行(エンター)マークとして「一太郎」では「\n」を用いる。実務上はこのSearchStringで定義された検索文字列をAlt+ローマ字例えば「V」の形で登録した。登録可能数はCPUの能力に応じて約50個であることから、この個数を超える検索文字列を登録する場合には、Altと組合せるローマ字を別の字例えば、「C」へ変更して登録を続けることになる。
実施例2では、Alt+Vを登録キーとしてシステムに登録し、この「V」に検索文字列として例えば、SearchString(.検索文字列="ことなる\|意外は\|で表れる\|加た\|塗幕\|などがの\|であるで\|られることができ\|しくは。\|ほうほう\|なしえた\|広報\|環流",.検索方向=1,.あいまい検索=0)を登録した。「\|」は「又は」検索に相当する。
このSearchStringを用いて実際の文章を校正すると、上掲の各校正者によって予備登録された字句(各校正者によって予備登録された文字列)が文章中に存在すれば必ず検出される。その結果、検出された当該文字列を校正システムが自動的に又は校正者の指示によって確実に修正することができた。
(Example 2)
Even if there is “... dealed ...” in the text to be proofread, this error cannot be corrected automatically by the same document proofreading system used in the first embodiment. That is, the system cannot suggest how to correct this error. This is because there is nothing outside the language knowledge stored in the brains of proofreaders who use human word processing software. Although this error was supposed to be “used” in the regular expression, it is presumed that the error was caused by a malfunction that occurred in the finger usage of the word processor proofreader.
Since it is almost impossible to predict this type of error, it is not possible to register such a typo in the proofreading dictionary in advance. Predicting whether or not this error will reappear at the time of encountering such a mistake, and if it can be predicted that there is a high probability of reappearance, this typographical phrase (misrepresentation) will be stored in the proofreading dictionary. Once registered, the document proofing system will automatically detect and display the next occurrence. If the mode specifying unit 7 is set to the automatic mode, the document proofreading system can automatically execute the steps (14) to (16) described above to automatically correct the error. .
In the present invention, as a specific method example for creating an improved proofreading dictionary, a combination of a searched character string and an arbitrary searched character can be adopted. In the word processor software "Ichitaro", "\?" For a line break, the “Ichitaro” macro uses “\ n” as a line feed (enter) mark in the searched character string for “Ichitaro”. In practice, the search string defined in this SearchString is registered in the form of Alt + Roman letter, for example "V". The number of characters that can be registered is approximately 50 according to the CPU's ability. Therefore, when registering search character strings exceeding this number, change the Roman character combined with Alt to another character, for example, “C”. Registration will continue.
In the second embodiment, Alt + V is registered in the system as a registration key, and for example, SearchString (.search string = "different \ | is unexpectedly expressed as \ | \ | Painting \ | etc. can be \ | can be \ | or can be \\ or \\ information \ | public information \ | recycle ",. Search direction = 1 ,. fuzzy search = 0) was registered. “\ |” Corresponds to “or” search.
When an actual sentence is proofread using this SearchString, a lexical phrase (a character string pre-registered by each proofreader) preliminarily registered by each proofreader listed above is always detected. As a result, the detected character string can be surely corrected by the proofreading system automatically or according to instructions from the proofreader.

以上のように本発明は下掲の諸効果を奏し得る:
(1)校正対象表現と文章校正の際に当該校正対象表現と置換された代替表現とが対応づけて登録されている修正履歴登録辞書に基いて代替表現を検索する修正履歴検索機能部及び校正対象表現と代替候補とを自動的に置換する置換機能部を備えることによって、文章の校正を自動的に行なうこともできる外に、過去に既に行なわれた修正と全く同一の修正が行なわれる場合には、校正者が代替候補を選択する操作及び文章の更新を指示する操作等を共に省くことができる。この寄与で、簡単な操作によって文章の校正を行なうことができることに加えて、同時に修正時間も短縮するという効果をも奏することができる。
(2)付言すれば、この修正操作は同一文書中に狭義の同義語(通常は相互に字面が異なるに過ぎない複数箇の同義語)が複数回出現する場合にそれらを字面の上でも統一する目的に有用である。例えば、「申立て」と「申立」、「手続き」と「手続」等は書類の提出前に所定の字面に統一を要する。これらの点は単に不統一であるというばかりでなく、法律、条例又は規則等に規定された用語であることが要求されていることにも起因する。その他にも、文中に「但し」と「ただし」とが共存することは特段の意味が無い限り避けるべきである。尤も、「ときは」と「時は」とは法律文書中では統一すべきでない。両者には法的に異なる意味が与えられているからである。一般に法律書例えば、法規集、判決書、仮処分命令書、執行命令書等においては、平仮名書きと漢字書きとは相互に異なる意義を与えられている場合が多いことから、両者を同一視(統一)することは避けるべきである。これとは別種の問題として、旧法における字使いと新法における字使いとを統一することは避けることが賢明である。戦前に制定された法律では漢字制限を受けずに用字用語が選択されているから、戦後の当用漢字による制限下において制定された新法では異なる用字用語へ変更されている場合がある。特に、旧法の条文を引用した文中で、旧法の用字用語を新法のものへ合わせることは思わぬ誤りを来す場合があることに留意すべきである。
As described above, the present invention can achieve the following effects:
(1) Correction history search function unit and proofreading that searches for an alternative expression based on a correction history registration dictionary in which the proofreading expression and the alternative expression replaced with the proofreading expression are registered at the time of proofreading By providing a replacement function unit that automatically replaces the target expression with the alternative candidate, the sentence can be automatically proofread, and when the same correction as previously made is performed The proofreader can omit both the operation of selecting an alternative candidate and the operation of instructing the update of the text. With this contribution, in addition to being able to proofread a sentence with a simple operation, it is also possible to produce an effect of shortening the correction time at the same time.
(2) In other words, this correction operation unifies narrower synonyms (usually multiple synonyms that are only different from each other) in the same document even if they appear multiple times. Useful for purposes. For example, “appeal” and “complaint”, “procedure” and “procedure”, etc., need to be unified to a predetermined character before the documents are submitted. These points are not only due to inconsistencies, but also because they are required to be terms defined in laws, regulations or regulations. In addition, it should be avoided that “but” and “but” coexist in the sentence unless there is a special meaning. However, “time” and “time” should not be unified in legal documents. This is because they have different legal meanings. In general, law books, judgment documents, provisional disposition orders, execution orders, etc., are often given different meanings from hiragana writing and kanji writing. You should avoid doing it. As another type of problem, it is wise to avoid unifying the use of letters in the old law and the new law. In the law enacted before the war, script terms were selected without being restricted by kanji, so the new law enacted under the restriction by the kanji after the war may have changed to different script terms. In particular, it should be noted that, in a sentence quoting the provisions of the old law, it may lead to an unexpected error to match the old law script terms to those of the new law.

本発明の実施例における文章校正装置のブロック図。The block diagram of the text proofreading apparatus in the Example of this invention. 同実施例における修正履歴登録辞書の内容の1例を示す模式図。The schematic diagram which shows one example of the content of the correction log | history registration dictionary in the Example. 従来の文章校正装置のブロック図。The block diagram of the conventional text proofreading apparatus.

符号の説明Explanation of symbols

1 文章記憶機能部
2 校正対象表現検出機能部
3 修正履歴登録辞書
4 修正履歴検索機能部
5 代替候補決定機能部
6 文章更新機能部
7 モード指定部
8 文章更新指示機能部
9 制御機能部
10 代替表現入力機能部
11 登録指示機能部
12 修正履歴登録機能部
21 文章記憶部
22 校正対象表現検出部
23 代替表現辞書メモリー
24 代替表現表示制御部
25 修訂正制御部
26 入力部
27 表示部
DESCRIPTION OF SYMBOLS 1 Text memory function part 2 Calibration object expression detection function part 3 Correction history registration dictionary 4 Correction history search function part 5 Alternative candidate determination function part 6 Text update function part 7 Mode designation part 8 Text update instruction function part 9 Control function part 10 Alternative Expression input function unit 11 Registration instruction function unit 12 Correction history registration function unit 21 Text storage unit 22 Calibration target expression detection unit 23 Alternative expression dictionary memory 24 Alternative expression display control unit 25 Correction correction control unit 26 Input unit 27 Display unit

Claims (13)

文書校正システムであって、校正者が予め登録して置いた1以上の文字列であって校正者が修正の要有りと認識している文字列を校正対象文章の全体又は指定部分から検出し、検出された文字列を表示し、校正者がこの文字列を確認後に必要に応じて修正する様に指示することを特徴とする文章校正方法。   A document proofreading system that detects one or more character strings registered in advance by a proofreader and recognized by the proofreader as requiring correction from the entire proofreading sentence or a designated part. A sentence proofreading method characterized by displaying a detected character string and instructing a proofreader to correct the character string as necessary after confirmation. 表示された文字列を校正者が修正を指示した際に、表示された代替候補から校正者が代替表現を選択して前記の表示された文字列を修正させることを特徴とする請求項1に記載の文章校正方法。   The proofreader selects a substitute expression from the displayed alternative candidates and corrects the displayed character string when the proofreader instructs correction of the displayed character string. The written proofreading method. 表示された文字列に対して校正者が修正を指示した際に代替候補が表示されない場合に、校正者が代替表現を入力して前記の表示された文字列を修正させることを特徴とする請求項1又は2に記載の文章校正方法。   The proofreader inputs an alternative expression and corrects the displayed character string when an alternative candidate is not displayed when the proofreader instructs correction of the displayed character string. Item 3. The sentence proofreading method according to item 1 or 2. 表示された文字列が所定の修正条件に適合する場合に、当該文字列を自動的に代替表現で置換して前記の表示された文字列を修正させることを特徴とする請求項1又は2に記載の文章校正方法。   3. The displayed character string is corrected by automatically replacing the character string with an alternative expression when the displayed character string meets a predetermined correction condition. The written proofreading method. 入力機能部と、校正対象表現検出機能部であって校正対象文章中の校正対象表現を検出する機能部と、
修正履歴登録辞書であって校正対象表現と文章校正の際に当該校正対象表現と置換された代替表現との両者を対応づけて登録している辞書と、
修正履歴検索機能部であって上記修正履歴登録辞書に基いて上記校正対象表現検出機能部で検出された校正対象表現を検索キーとして、代替表現を検索する機能部及び表示機能部とから基本的に編成されていることを特徴とする文章校正装置。
An input function unit, a proofreading target expression detection function unit that detects a proofreading target expression in the proofreading text, and
A correction history registration dictionary in which both the proofreading target expression and the proofreading target expression and the alternative expression replaced at the time of sentence proofreading are registered in association with each other;
A correction history search function unit, which is basically composed of a function unit and a display function unit for searching for an alternative expression using the correction target expression detected by the correction target expression detection function unit based on the correction history registration dictionary as a search key. Sentence proofreading device characterized by being organized into.
文章校正装置が更に、代替候補決定機能部であって修正履歴登録辞書に校正対象表現に対応づけて登録されている代替表現から代替候補を決定する機能部を備えていることを特徴とする請求項5に記載の文章校正装置。   The sentence proofreading apparatus further includes a function unit for determining an alternative candidate from an alternative expression registered in the correction history registration dictionary in association with the proofreading expression in the correction history registration dictionary. Item 6. The sentence proofreading apparatus according to Item 5. 文章校正装置が更に、修正履歴登録辞書に代替表現が登録されていない場合に校正者によって入力された代替表現を代替候補として校正対象文字列を修正させることを特徴とする請求項5に記載の文章校正装置。   The sentence proofreading apparatus further causes the proofreading target character string to be corrected using the alternative expression input by the proofreader as an alternative candidate when the alternative expression is not registered in the correction history registration dictionary. Sentence proofing device. 文章校正装置が更に、置換機能部であって校正対象表現と上記代替候補決定機能部で決定された代替候補とを自動的に置換して修正する機能部を備えていることを特徴とする請求項5に記載の文章校正装置。   The sentence proofreading apparatus further includes a function unit that automatically replaces and corrects the proofreading target expression and the alternative candidate determined by the alternative candidate determination function unit as a replacement function unit. Item 6. The sentence proofreading apparatus according to Item 5. 文章校正装置が更に、修正履歴登録機能部であって置換された校正対象表現と代替候補とを対応づけて上記修正履歴登録辞書に追加登録する機能部を備えていることを特徴とする請求項5〜8の何れかに記載の文章校正装置。   The sentence proofreading apparatus is further provided with a function unit that is a correction history registration function unit and associates the replaced proofreading target expression with an alternative candidate and additionally registers it in the correction history registration dictionary. The sentence proofreading apparatus in any one of 5-8. 上記修正履歴登録機能部で登録するか否かを校正者の指示に従って選択する選択機能部を備えていることを特徴とする請求項5〜9の何れかに記載の文章校正装置。   The sentence proofreading apparatus according to any one of claims 5 to 9, further comprising a selection function unit that selects whether or not to register with the correction history registration function unit in accordance with an instruction from a proofreader. 前記修正履歴登録機能部で登録するか否かを校正者の指示に応じて選択する選択機能部を更に備えていることを特徴とする請求項5〜10の何れかに記載の文章校正装置。   The sentence proofreading apparatus according to claim 5, further comprising a selection function unit that selects whether or not to register with the correction history registration function unit in accordance with an instruction from a proofreader. モード切替え機能部であって上記置換機能部が校正者によって指示された場合に自動的に行なわれるモード切替え機能部を備えていることを特徴とする請求項5〜11の何れかに記載の文章校正装置。   12. The sentence according to claim 5, further comprising a mode switching function part which is automatically performed when the replacement function part is instructed by a proofreader. Calibration device. モード切替機能部が上記置換機能部が校正者によって指示された場合に自動的に起動される様にモードを切替える機能部を備えていることを特徴とする請求項12に記載の文章校正装置。   13. The sentence proofreading apparatus according to claim 12, wherein the mode switching function section includes a function section for switching the mode so that the mode switching function section is automatically activated when the replacement function section is instructed by a proofreader.
JP2004365141A 2004-12-16 2004-12-16 Document proofreading method and document proofreading apparatus Pending JP2006172231A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004365141A JP2006172231A (en) 2004-12-16 2004-12-16 Document proofreading method and document proofreading apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004365141A JP2006172231A (en) 2004-12-16 2004-12-16 Document proofreading method and document proofreading apparatus

Publications (1)

Publication Number Publication Date
JP2006172231A true JP2006172231A (en) 2006-06-29

Family

ID=36672903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004365141A Pending JP2006172231A (en) 2004-12-16 2004-12-16 Document proofreading method and document proofreading apparatus

Country Status (1)

Country Link
JP (1) JP2006172231A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067250A (en) * 2008-09-09 2010-03-25 Inst For Information Industry Error-detecting apparatus and method for chinese article, and recording medium
JP2011517793A (en) * 2008-02-06 2011-06-16 ディズニー エンタープライゼス インコーポレイテッド Method and system for managing speech in a virtual community
JP2014081950A (en) * 2010-09-27 2014-05-08 Inst For Information Industry Data processing system applying optical identification devices, method thereof, operation method thereof, and computer-readable recording medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916597A (en) * 1995-06-30 1997-01-17 Toshiba Corp Sentence elaboration device and method therefor
JPH09212504A (en) * 1996-02-06 1997-08-15 N T T Data Tsushin Kk Document proofreading device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916597A (en) * 1995-06-30 1997-01-17 Toshiba Corp Sentence elaboration device and method therefor
JPH09212504A (en) * 1996-02-06 1997-08-15 N T T Data Tsushin Kk Document proofreading device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011517793A (en) * 2008-02-06 2011-06-16 ディズニー エンタープライゼス インコーポレイテッド Method and system for managing speech in a virtual community
US8140528B2 (en) 2008-02-06 2012-03-20 Disney Enterprises, Inc. Method and system for managing discourse in a virtual community
JP2010067250A (en) * 2008-09-09 2010-03-25 Inst For Information Industry Error-detecting apparatus and method for chinese article, and recording medium
JP2014081950A (en) * 2010-09-27 2014-05-08 Inst For Information Industry Data processing system applying optical identification devices, method thereof, operation method thereof, and computer-readable recording medium

Similar Documents

Publication Publication Date Title
US6047299A (en) Document composition supporting method and system, and electronic dictionary for terminology
JPH0844719A (en) Dictionary access system
JPH07325828A (en) Grammar checking system
US20020198859A1 (en) Method and system for providing web links
JP2004536369A (en) A learning method and a learning device using a computer for learning by changing and correcting a text with a user
JP2006172231A (en) Document proofreading method and document proofreading apparatus
Arai et al. Grammatical-error-aware incorrect example retrieval system for learners of Japanese as a second language
JP4189040B2 (en) Sentence proofreading apparatus and proofreading method
JPH09153034A (en) Document preparing device and method therefor
KR0165591B1 (en) Hangul english automatic translation method
JP2010055561A (en) Electronic dictionary, retrieval method in electronic dictionary and program
JP2870375B2 (en) Sentence correction device
Kassmi et al. Spelling Error Detection and Correction for Arabic Using NooJ
JPH07121538A (en) Spelling checking device
JP3077820B2 (en) Inappropriate sentence detection device
JP4111941B2 (en) Apparatus, method and program for converting lexical data to data
JPH06149791A (en) Chinese character document input device
JPH02144761A (en) Sentence producing device
JP2008192165A (en) Text proofreading device and text proofreading method
JPH04158477A (en) Machine translation device
BADREDDINE et al. A Reading of Microsoft Word 2016 Translation into Arabic
Bemhard Machine Translation-success or failure
JPH11175518A (en) Character string inputting device and method therefor and program recording medium for storing character string input program
JPH07160720A (en) Method and device for supporting and making efficient translation of information readable by machine
JPS63184864A (en) Documentation device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071207

A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20071207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102