JPH01189761A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH01189761A
JPH01189761A JP63012658A JP1265888A JPH01189761A JP H01189761 A JPH01189761 A JP H01189761A JP 63012658 A JP63012658 A JP 63012658A JP 1265888 A JP1265888 A JP 1265888A JP H01189761 A JPH01189761 A JP H01189761A
Authority
JP
Japan
Prior art keywords
word
character string
spelling
candidate
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63012658A
Other languages
English (en)
Inventor
Hiroyuki Ueda
博之 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63012658A priority Critical patent/JPH01189761A/ja
Publication of JPH01189761A publication Critical patent/JPH01189761A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、入力される文字情報に応じて文書を作成す
る文書処理装置に係り、特に入力された文書情報の綴り
誤りを検出して、正規の綴りに自動修正する文書処理装
置に関するものである。
〔従来の技術〕
近年、半導体デバイスの進歩に伴い大量情報を1チツプ
の半導体メモリに記憶させることが可能となってきた。
このため、文書処理装置で必要とされる辞書情報を参照
しながら、入力された誤綴り文字列を検出して、正規の
文字列に自動修正する、すなわちスペリングベリファイ
機能が搭載された81種も製品化されている。
この種のスペリングベリファイに適用される自然言語に
かかる技術としては、例えば米国ホートンミツリン社製
がサポートするスペリングベリファイア、スペリングコ
レクタ、電子同意語辞書等がある。
ただし、この種のスペリングベリファイやスペリングコ
レクタは、個々独立に作用するように構   ′成され
、通常の電子タイプライタにおいては、オプションパッ
ケージとして利用できるに留まっている。
このように従来の自然言語技術におけるスペリングベリ
ファイやスペリングコレクタは、ユーザの要求がある場
合に、外部機器として装着して使用する形態となってい
る。
これは、文書処理装置に設けられる記憶素子の容Iに起
因するところが多く、スペリングへリファイやスペリン
グコレクタ起動のための大量の辞書情報を1チツプに記
憶させることができないといフたハードウェア上の制約
から発生している。
また、上記のようなスペリングベリファイ処理やスペリ
ングコレクタ処理というものは、本来個々に発生するも
のではなく、文書作成中には相互に関連を持ちながら処
理されるべきものである。
しかしながら、現状においては個々独立して処理を実行
するため、モードの切換え等の多くの煩雑なキーオペレ
ーションを実行しないと、所望とする正規の文字列を出
力できないといった事態が発生し、却って、上記機能の
ために文書作成効率が著しく低下してしまう。
さらに、現在の文書処理装置においては、実行可能なも
のは、誤入力文字列を上記スペリングベリファイにより
検出し、検出された誤入力文字列をスペリングコレクタ
により正規の文字列に修正するといった比較的に単純な
文字列処理を実行しているに過ぎない。
しかしながら、通常の文書作成において作成される言萌
により多少の差はあるにせよ、通常1つの言語に対して
、交換可能な同意文字列が複数存在する。そして、本来
は作成文書のリズムによって学術的な論文調の場合と、
全話調の場合とでは抽象度の異なる単語文字列をユーザ
が適宜変えて入力している。
ところか、従来の装置においては、上記のようにスペリ
ングベリファイにより検出し、検出された誤入力文字列
をスペリングコレクタにより正規の文字列に修正すると
いった比較的に単純な文字列処理なので、この種の要求
には即応できない。
このような同意文字列を検索して複数の候補を出力する
ためには、上記以上の膨大な単語情報とこれらの単語情
報との関係を相互にリンクする一定の情報テーブルが必
要となる。
以上のように、従来の文書処理装置における言語処理は
、ユーザが文書を作成する際に、入力された文字列に対
して言語上の取り決め、約束に違反する入力文字列を正
常な文字列に復元するといった、最小限度の補正をサポ
ートするに留まっている。
(発明が解決しようとする課題) しかしながら、従来の機種においては、このような複合
的な文書作成要求には対応できず、装置本来に固定記憶
された文字列を正規化するといった処理しかできず、本
来自由に入力し、入力中に最適な文字列候補を選択しな
がら、最良な文書を作成するといった基本的な処理がで
きず、ユーザの言語情報に依存した文書しか作成できな
いといった問題点があった。
この発明は、上記の問題点を解決するためになされたも
ので、入力された所定言語の文字列に対する同意文字列
検索処理と、スペリングベリファイおよびスペリングコ
レクト処理とを相互に従属させながら実行して、必要に
応じて入力された文字列に対する複数の同意文字列候補
から所望の文字列を選択出力できる文書処理装置を得る
ことを目的とする。
〔課題を解決するための手段〕
この発明に係る文書処理装置は、文字列情報の綴り状態
の真偽を判定する綴り状態判定手段と、この綴り状態判
定手段による綴り状態の真偽結果に基づいて所定言語の
正規の文字列に合致する単語候補を発生させる第1の単
語発生手段と、この第1の単語発生手段による単語候補
発生処理に並行してこの単語候補に同意となる同意単語
候補を発生させる第2の単語発生手段と、これらの第1
または第2の単語発生手段による単語候補発生処理また
は同意単語候補発生処理を択一的に選択する単語発生選
択手段とを設けたものである。
〔作用〕
この発明においては、文字列入力手段から所定言語の文
字列情報が入力されるか、または外部記憶手段から所定
言語の文字列情報が読み出されると、綴り状態判定手段
が文字列情報の綴り状態の真偽を判定し、単語発生選択
手段により選択される第1の単語発生手段がこの判定に
基づいて所定言語の正規の文字列に合致する単語候補を
発生させるか、あるいは単語発生選択手段により選択さ
れる第2の単語発生手段が第1の単語発生手段による単
語候補発生処理に並行してこの単語候補に同意となる同
意単語候補を発生させる。
〔実施例〕
第1図はこの一実施例を示す文書処理装置の構成を説明
するブロック図であり、KEYは文字列入力手段および
単語発生選択手段4を兼ねるキーボードで、所定言語に
対応する文字列を構成するキーコードを文書処理を司る
処理部PRC(詳細は後述する)に出力する。この処理
部PRCには、綴り状態判定手段1.第1の単語発生手
段2および第2の単語発生手段3等を有しており、綴り
状態判定手段1はキーボードKEYより入力された所定
の言語に対応する文字列情報の綴り状態の真偽を判定し
、この綴り状態判定手段1による綴り状態の真偽結果に
基づいて第1の単語発生手段2が所定言語の正規の文字
列に合致する単語候補を発生させ、デイスプレィDSP
またはプリンタPRTに送出して正規の文字列を表示ま
たは印字させる。
第2の単語発生手段3は、第1の単語発生手段2が発生
した所定言語の正規の文字列に合致する単語候補に同意
となる同意単語および/または同意熟語(慣用句を含む
)を単語発生選択手段4からの指示に従って択一的に発
生させ、デイスプレィDSPまたはプリンタPRTに送
出して正規の文字列を表示または印字させる。
一般にスペリングに関する情報は入力された文書を表示
する部分とは別の部分、例えばサービスデイスプレィエ
リアに表示される。
この際、それらは同一デバイスで構成しても良い。
第2図は、第1図に示した処理部PRCの詳細を説明す
る回路ブロック図であり、第1図と同一のものには同じ
符合を付しである。
この図において、WPはワードプロセッサ等の文書処理
装置で、キーボードKEYからの文字コードまたは外部
記憶装置MEM (例えばフロッピーディスク装置)か
ら入力または読み出される文字コードをパーサPSRに
出力する。パーサPSRは、入力または読み出される文
字コードを単語単位(スペースコードに囲まれた文字列
の集合を単語と判定する)に切り出し、切り出した単語
文字列をそのままスペリングベリファイ部Sv(第1図
の綴り状態判定手段1に対応する)にデータバスDBを
介して出力する。なお、スペリングベリファイ部S■に
は、例えば所定の言語において使用頻度の高い、例えば
約3万の正規綴り文字列を記憶する辞書を有し、パーサ
PSRにより切り出し出力された単語文字列の真偽性を
、バイナリサーチあるいはハツシュ法に準じて検索判定
し、登録された単語と逐一比較されて、登録された文字
列である場合には正しい綴り文字列と判定し、その文字
列をスペリングコレクト部SCおよびこの発明の第2の
単語発生手段3に相当する同意語処理部TDに出力する
。例えばキーボードKEYより単語(spelllin
g)が誤って入力された場合には、スペリングコレクト
部SCが正規の単語候補(spel 1 ing)を、
例えば音声学的手法、単語中の文字削除、単語中の文字
置き換え、単語中の文字交換によって実行する。
同意語処理部TDは、正しい綴り文字列から構成される
単語の同意単語候補を、図示しない同意語辞書から読み
出し、同意単語候補表示モードスイッチとなるスイッチ
SWの設定状態に基づいてその候補をバスSYN、マル
チプレクサMPXを介してデイスプレィDSPのサービ
スデイスプレィエリアに出力して表示させる。
例えば単語(stop)に対して、同意単語候補rqu
it」および慣用句候補となる熟語rgive  up
」等を出力する。
このため、同意語処理部TDには上記単語辞書に対応す
る同意語を記憶する同意語テーブルを有し、この同意語
テーブル介して同意単語候補を検索して、デイスプレィ
DSPのサービスデイスプレィエリアに表示する。
次に第3図を参照しながらこの発明による文書編集処理
について説明する。
第3図はこの発明による文書編集処理手順の一例を説明
するフローチャートである。なお、(1)〜(16)は
各ステップを示す。
まず、キーボードKEYより単語か入力されるのを待機
しく1)、所定言語に対応する任意の単語がキーボード
KEYより入力されると、文書処理装置wpは外部記憶
装置MEMを管理しながらデイスプレィDSPのサービ
スデイスプレィエリアに入力文字列を順次表示して行<
(2)。
次いで、キーボードKEY上のブランクキー(空白コー
ドに対応)が押下されるのを待機しく3)、ブランクキ
ーが押下されたら、これを単語の区切りと判定してそれ
までに入力された文字列からなる入力単語をパーサPS
RがデータバスDB上に送出する(4)。
そして、データバスDB上に送出された入力された文字
列からなる入力単語をスペリングベリファイ部S■、ス
ペリングコレクト部Sc、同意語処理部TDに伝達する
(5)。
続いて、パーサPSRより起動信号STを発信すると(
6)、スペリングベリファイ部S■が起動される(7)
。次いで、スペリングベリファイ部SVに構築されてい
る単語辞書に登録された単語と一致するかどうかを判定
するために、単語検索処理を実行し、文字列は正綴り単
語を構成するかどうかを判断しく8)、NOならば、す
なわち誤綴り文字列であると判定した場合には、誤綴り
検出信号NCをスペリングコレクト部SCおよびインバ
ータINVに発信する(9)。
これにより、スペリングコレクト部SCは起動がかかり
(10)、データバスDBを介して誤綴り文字列を受領
し、スペリングコレクト処理(スペリングコレクション
)を実行しく11)、正綴り単語を送出するとともに、
正綴り単語をバスCANを介してサービスデイスプレィ
エリアに表示しく12)、リターンする。
一方、ステップ(8)の判断でYESの場合は、スイッ
チSWが「H」レベルか、すなわち同意単語候補表示モ
ードが設定中であるかどうかを判定しく第2図に示す実
施例においては、アンドゲートANDによるマニュアル
設定の場合を示す)(13)、NOならばリターンする
一方、ステップ(13)の判断で、YESの場合は、同
意語処理部TDによる同意単語候補の検索終了を待機し
く14)、検出された複数の同意単語候補群をバスSY
Nに送出しく15)、同意単語候補群をデイスプレィD
SPに表示しく16)、メインルーチンにリターンする
これにより、例えばキーボードKEYより、文字列rs
topp、1が入力されると、第3図のフローチャート
により、ステップ(8)の判定がN。
となり、誤綴り検出信号NCを出力して、スペリングコ
レクト部SCにより、正綴り単語候補「5top」が検
索されて、デイスプレィDSPのす一ビスデイスプレィ
エリアに出力される。
一方、外部記憶装置MEMから文書処理装置WPに対し
て文書データが読み出される場合には、既に上記のよう
な編集処理がなされているので、スイッチSWをオフ状
態として、同意語処理部TDによる同意単語候補の検索
処理を強制停止させる。これは、−度確定した文書を構
成する単語全てについて同意単語候補の検索処理を実行
すると、単語数に応じて非常に煩雑な処理が必要となる
からである。このため、必要に応じてスイッチSWをオ
ン/オフさせることにより、所望とする単語に対しての
み、新規に同意単語候補処理またはスペリングコレクト
処理を実行させることも可能となる。
なお、上記実施例においては、主に論理回路により同意
語処理部TDによる同意単語候補の検索処理を実現する
場合について説明したが、マイクロコンピュータ等によ
り、ソフト処理で、すなわちスイッチSWの状態をフラ
グ情報として、図示しないRAM等に書き換え可能に保
持させて、同意語処理部TD、スペリングコレクト部S
Cの処理実行をPROM等に記憶される制御プログラム
により制御することも可能である。
また、上記実施例においては、スイッチSWのオン/オ
フ状態に従属して同意単語候補検索出力処理を制限する
場合について説明したが、スペリングコレクト部SCの
誤綴り検出信号NCに応じて同意単語候補検索出力処理
を制限するように構成しても良い。
さらに、上記実施例においては、スイッチSWのオン/
オフ状態に従属して同意単語候補検索出力処理を制限す
る場合について説明したが、スイッチSWのオン/オフ
状態に従属して、用法の誤り易い単語の用法に関する注
意情報を単語列で示すようにしても良い。
〔発明の効果〕
以上説明したように、この発明は文字列情報の綴り状態
の真偽を判定する綴り状態判定手段と、この綴り状態判
定手段による綴り状態の真偽結果に基づいて所定言語の
正規の文字列に合致する単語候補を発生させる第1の単
語発生手段と、この第1の単語発生手段による単語候補
発生処理に並行してこの単語候補に同意となる同意単語
候補を発生させる第2の単語発生手段と、これらの第1
または第2の単語発生手段による単語候補発生処理また
は同意単語候補発生処理を択一的に選択する単語発生選
択手段とを設けたのて、文書作成時において、入力文字
列から構成される単語の真偽性に従属して、言い替え可
能な同意文字列を必要に応じて出力することができ、前
後関係から使用すべき最良の単語候補を選択できる。従
って、所望とする正確な綴りの単語による、文書を効率
よく作成出力できる優れた効果を奏する。
【図面の簡単な説明】
第1図はこの一実施例を示す文書処理装置の構成を説明
するブロック図、第2図は、第1図に示した処理部の詳
細を説明する回路ブロック図、第3図はこの発明による
文書編集処理手順の一例を説明するフローチャートであ
る。 図中、1は綴り状態判定手段、2は第1の単語発生手段
、3は第2の単語発生手段、4は単語発生選択手段、K
EYはキーボード、DSPはディ3図

Claims (1)

    【特許請求の範囲】
  1. 文字列入力手段から入力される所定言語の文字列情報ま
    たは外部記憶手段から読み出される所定言語の文字列情
    報を処理可能な文書処理装置において、前記文字列情報
    の綴り状態の真偽を判定する綴り状態判定手段と、この
    綴り状態判定手段による綴り状態の真偽結果に基づいて
    前記所定言語の正規の文字列に合致する単語候補を発生
    させる第1の単語発生手段と、この第1の単語発生手段
    による単語候補発生処理に並行してこの単語候補に同意
    となる同意単語候補を発生させる第2の単語発生手段と
    、これらの第1または第2の単語発生手段による単語候
    補発生処理または同意単語候補発生処理を択一的に選択
    する単語発生選択手段とを具備したことを特徴とする文
    書処理装置。
JP63012658A 1988-01-25 1988-01-25 文書処理装置 Pending JPH01189761A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63012658A JPH01189761A (ja) 1988-01-25 1988-01-25 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63012658A JPH01189761A (ja) 1988-01-25 1988-01-25 文書処理装置

Publications (1)

Publication Number Publication Date
JPH01189761A true JPH01189761A (ja) 1989-07-28

Family

ID=11811458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63012658A Pending JPH01189761A (ja) 1988-01-25 1988-01-25 文書処理装置

Country Status (1)

Country Link
JP (1) JPH01189761A (ja)

Similar Documents

Publication Publication Date Title
JPH067397Y2 (ja) 文書入力装置
JPH0411906B2 (ja)
US4953088A (en) Sentence translator with processing stage indicator
JP4947861B2 (ja) 自然言語処理装置およびその制御方法ならびにプログラム
JPH01189761A (ja) 文書処理装置
US5898825A (en) Failed command translation technique
JP2788274B2 (ja) 文書処理装置および文書処理装置の文書処理方法
EP0720105A2 (en) System and method to review the processing of data according to user entered corrections
JP2570681B2 (ja) ワード・プロセッサ
JPH07146868A (ja) 自然言語処理装置
JP2737160B2 (ja) 文章処理装置
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JPH10116188A (ja) 命令文の作成支援方法及び装置
JP3137329B2 (ja) 文書編集装置
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JPH05314167A (ja) 文表現解析方法
JPH0589140A (ja) 文書作成装置
JPH04155571A (ja) 文書処理装置
JPH09114825A (ja) 形態素解析方法およびその装置
JPH0887507A (ja) 機械翻訳装置
JPH06290219A (ja) 文字検索機能付き文書処理装置
JPH0546370A (ja) プログラム生成装置
JPH0215364A (ja) 文書処理装置
JPS62249273A (ja) 文書処理装置
JPS62249274A (ja) 文書処理装置