JPH0687239B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0687239B2
JPH0687239B2 JP63189127A JP18912788A JPH0687239B2 JP H0687239 B2 JPH0687239 B2 JP H0687239B2 JP 63189127 A JP63189127 A JP 63189127A JP 18912788 A JP18912788 A JP 18912788A JP H0687239 B2 JPH0687239 B2 JP H0687239B2
Authority
JP
Japan
Prior art keywords
dictionary
sentence
information
inflectional
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63189127A
Other languages
English (en)
Other versions
JPH0239265A (ja
Inventor
広市 吉田
浩子 村井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63189127A priority Critical patent/JPH0687239B2/ja
Publication of JPH0239265A publication Critical patent/JPH0239265A/ja
Publication of JPH0687239B2 publication Critical patent/JPH0687239B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、かな漢字変換や文章の校正を行う文字処理
装置に関する。
(ロ)従来の技術 従来この種の文字処理装置例えば日本語ワードプロセッ
サにおいて、かな漢字変換する際に辞書に登録されてい
ない単語が入力されていると、変換処理部は、検索でき
なかった単語を、その単語の長さより短い長さの単語の
組み合わせに置き換えて変換処理していた。また、文章
の校正処理においては検索できなかった単語が現れた時
点で解析を中断し、次ぎに解析を再開できる文字までス
キップする方法が取られている。
(ハ)発明が解決しようとする課題 しかし上記の日本語ワードプロセッサの場合、検索でき
なかった単語以降の文節の切り出し位置が狂ってしま
い、変換が正常に行われないという問題があった。また
校正処理においては、辞書に登録されていない単語が現
れる度に解析ができなくなるという問題があった。
この発明は以上の事情を考慮してなされたもので、辞書
に登録されていない単語についても活用形を含み変換ま
たは解析することのできる文字処理装置を提供する。
(ニ)課題を解決するための手段 第1図はこの発明の文字処理装置の構成を明示するブロ
ック図であり、1は文字情報および各種指示を入力する
入力手段、2は各種情報を表示する表示手段、3は文字
情報に対応する単語を品詞情報を付して記憶している辞
書手段、4は各種単語の活用形を品詞情報を付して記憶
している活用形辞書手段、5は入力した文字情報を記憶
する文字情報記憶手段、6は入力手段1からの指示を受
け文字情報記憶手段5から1つの文を取り出す取出手
段、7は取り出した1つの文を文節単位で切り出す文節
切出手段、8は辞書手段3を検索することにより、切り
出した文節に該当する単語を順次品詞情報とともに読み
出す変換手段、9は該当する単語が検索されない際に活
用形辞書手段4を検索し、該当する活用形の1つを、品
詞情報とともに読み出す仮変換手段、10は読み出された
品詞情報の関係を調べることにより、仮変換した文節を
含む1つの文が適性な構文であるかどうか調べ、適性な
構文の場合は取出手段6に対して次ぎの1文を取り出す
よう指示し、適性な構文でない場合は仮変換した文節
を、活用形辞書手段4に記憶されている他の活用形に変
換し直すよう仮変換手段9に指示する構文解析手段であ
る。
(ホ)作用 この発明によれば、入力手段から文字情報を入力し、変
換または校正指示を行うと、文字情報記憶手段から1つ
の文が取り出され、1つの文はさらに文節毎に切り出さ
れ、変換手段は辞書手段を検索することにより、切り出
された文節の先頭から順次該当する単語を読み出し、品
詞情報とともに出力する。辞書手段に該当する単語がな
い場合、仮変換手段は活用形辞書手段を検索し、該当す
る活用形の1つを読み出し品詞情報とともに出力する。
出力された品詞情報は構文解析手段に順次記憶され、構
文解析手段は記憶された品詞列が適性な構文であるかど
うか判断する。適性構文の場合、取出手段に対して次ぎ
の1文を取り出すよう指示し、適性構文でない場合、仮
変換した活用形を、他の活用形に変換し直すよう仮変換
手段に指示する。
(ヘ)実施例 以下図に示す実施例に基づいてこの発明を詳述する。な
お、これによってこの発明は限定されるものではない。
第2図はこの発明の一実施例である日本語ワードプロセ
ッサの構成を示すブロック図である。同図において20は
入力手段としてのキーボードであり、かな漢字の読みで
ある文字列を入力するための入力キー、各種指示を入力
するための指示キーなどを備えている。21は表示手段と
してのCRTであり、キーボード20から入力された文字列
や変換した漢字などを表示する。なお表示装置はCRTに
限らず、LCDまたはこの種の表示装置で構成することが
できる。22は辞書手段としての基本辞書(かな漢字辞
書)であり、ROMから構成されている。23は同じく辞書
手段としてのユーザー辞書であり、RAMから構成されて
いる。24は活用形辞書手段としての文法パターン辞書で
ありROMから構成され、各種単語の活用形を記憶してい
る。第3図に文法パターン辞書24の一部を示す。なお文
法パターン辞書24は日本語活用表を基にして作成されて
いるが、検索処理が円滑に行えるよう若干の修正が加え
られている例えば単語“して”は、活用表に示される語
尾“し”と接続助詞“て”によって構成されるが、この
実施例における文法パターン辞書24では“して”を1つ
のサ変の動詞として記憶している。
25は文字情報記憶手段としての文章バッファであり、キ
ーボード20から入力された文字列を記憶する。26は文章
バッファ25から取り出される1つの文を記憶する1文バ
ッファである。27は文節切出手段としての文節分割部で
あり、1文バッファ26に記憶されている文を先頭から文
節単位で切り出す。
28は解析バッファであり、基本辞書22およびユーザー辞
書23から読み出された品詞情報を順次記憶する。
29は解析ポインタであり、変換される文節の各アドレス
を収納する。30は構文辞書であり、解析バッファ28に記
憶されている品詞列が正しい構文を形成しているかどう
か判定する際に参照される。
31はCPUであり、例えば16ビットのマイクロプロセッサ
から構成され、図示しないプログラムに従って上記各ブ
ロック間の制御を行う。
つぎにこの実施例の動作を第4図および第5図に従って
説明する。
まず、全体の処理の流れを第4図で説明する。文章バッ
ファ25から1文を取り出し(ステップ40)、1文バッフ
ァ26にセットする。そしてこの1文を文節に分解し、構
文の解析を行う(ステップ41)。解析を行い、解析時に
仮定した単語があった場合に(ステップ42)その仮定し
た単語の表記と品詞とをユーザー辞書に登録し(ステッ
プ43)、この処理を文章末尾まで行う(ステップ44)。
次に解析の詳細を第5図に従って説明する。まず解析バ
ッファ28は、解析ポインタ29を初期化する(ステップ4
5)。次いで1文バッファ26に記憶されている文のの先
頭から、文字列と一致する単語を、ユーザー辞書23から
検索する(ステップ46)。一致する単語がなければ(ス
テップ47)続いて基本辞書22から検索する(ステップ4
8)。基本辞書22においても一致する単語がなければ
(ステップ49)さらに文法パターン辞書24に登録されて
いる品詞情報の中に一致するパターンがあるか検索する
(ステップ50)。ここで一致するパターンがあれば(ス
テップ51)仮定情報を付して解析バッファ28に品詞をセ
ットする(ステップ52)。なお、品詞のセットは、一致
する単語がユーザー辞書23、基本辞書22に存在する場合
も同様、解析バッファ28にセットされる。そして1文に
おける解析できた所まで解析ポインタ29を進める。解析
が1文の最後まで行われると(ステップ53)、解析バッ
ファ28に収納された品詞について構文解析を行う(ステ
ップ54)。この構文解析は、構文辞書30を参照すること
によって行われる。構文解析を行った結果、文として適
性であれば(ステップ55)、仮定した単語の変換は適性
であったと判断して処理を終了する。
文として適性でなければ、そして解析バッファ28に仮定
情報があれば(ステップ56)、仮定した品詞以降の解析
をリセットし、解析ポインタ29もその単語の先頭まで戻
し(ステップ57)、仮定した単語から処理をやり直す
(ステップ50)。仮定がなければ1つ前の単語の品詞以
降の解析をリセットし、解析ポインタ29もその単語の先
頭まで戻して(ステップ58)ユーザー辞書23の検索から
やり直す(ステップ46)。
第6図に実際の処理における1つの文例を示す。同図は
1文バッファ26と解析バッファ28の内容を対比して示し
ており、解析バッファ28に記憶される各品詞には、1ビ
ットの仮定情報と複数ビットからなる文字長さ情報がそ
れぞれセットされる。仮定情報は、仮に変換したことを
示す符号であり、“0"のときは基本辞書22かまたはユー
ザー辞書23に該当する単語が存在していたことを示し、
“1"のときは文法パターン辞書24を検索することにより
仮の変換を行ったことを示す。
また第3図の文法パターン辞書24において、Kは漢字、
hはひらがな、kはカタカナを示しており、例えば“KK
する”とは、“整流する”などと一致するとみなす。し
たがって第6図において単語“交流”、“直流”などは
基本辞書22に登録されているが単語“整流”は登録され
ていないとすると、従来の処理方法では単語“整流し
て”は解析、構文解析ができなかったが、この実施例に
よると単語“整流して”を単語“整流する”というサ変
動詞の連用形と仮定して構文解析することができる。
(ト)発明の効果 この発明によれば、かな漢字変換または校正処理の際
に、辞書に登録されていない単語が現れると、その単語
の活用形を調べることにより一旦仮の単語に置き換えて
仮変換または仮解析し、次いで仮定した単語の構文が適
性かどうか判断することにより、仮変換した単語を確定
することができるので、かな漢字変換においては正確な
漢字変換を行うことができ、校正処理においては連続し
て文章の解析を行うことができる。
【図面の簡単な説明】
第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図は実
施例の文法パターン辞書の内容を示す説明図、第4図お
よび第5図は実施例の動作を説明するフローチャート、
第6図は実施例の解析バッファの内容を説明する模式図
である。 1……入力手段、2……表示手段、 3……辞書手段、4……活用形辞書手段、 5……文字情報記憶手段、 6……取出手段、7……文節切出手段、 8……変換手段、9……仮変換手段、 10……構文解析手段。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字情報および各種指示を入力する入力手
    段と、各種情報を表示する表示手段と、文字情報に対応
    する単語を品詞情報を付して記憶している辞書手段と、
    各種単語の活用形を品詞情報を付して記憶している活用
    形辞書手段と、入力した文字情報を記憶する文字情報記
    憶手段と、入力手段からの指示を受け文字情報記憶手段
    から1つの文を取り出す取出手段と、取り出した1つの
    文を文節単位で切り出す文節切出手段と、辞書手段を検
    索することにより、切り出した文節に該当する単語を順
    次品詞情報とともに読み出す変換手段と、該当する単語
    が検索されない際に活用形辞書手段を検索し、該当する
    活用形の1つを、品詞情報とともに読み出す仮変換手段
    と、読み出された品詞情報の関係を調べることにより、
    仮変換した文節を含む1つの文が適性な構文であるかど
    うか調べ、適性な構文の場合は取出手段に対して次ぎの
    1文を取り出すよう指示し、適性な構文でない場合は仮
    変換した文節を、活用形辞書手段に記憶されている他の
    活用形に変換し直すよう仮変換手段に指示する構文解析
    手段とを備えてなる文字処理装置。
JP63189127A 1988-07-28 1988-07-28 文字処理装置 Expired - Lifetime JPH0687239B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63189127A JPH0687239B2 (ja) 1988-07-28 1988-07-28 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63189127A JPH0687239B2 (ja) 1988-07-28 1988-07-28 文字処理装置

Publications (2)

Publication Number Publication Date
JPH0239265A JPH0239265A (ja) 1990-02-08
JPH0687239B2 true JPH0687239B2 (ja) 1994-11-02

Family

ID=16235847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63189127A Expired - Lifetime JPH0687239B2 (ja) 1988-07-28 1988-07-28 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0687239B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181901A (ja) * 1991-12-27 1993-07-23 Sharp Corp 機械翻訳装置
DE69828181T2 (de) 1997-09-12 2005-12-08 Nippon Zeon Co., Ltd. Ballonkatheter

Also Published As

Publication number Publication date
JPH0239265A (ja) 1990-02-08

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US5587902A (en) Translating system for processing text with markup signs
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
US5579224A (en) Dictionary creation supporting system
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JPH0687239B2 (ja) 文字処理装置
JPS6180362A (ja) 翻訳装置
JP2621999B2 (ja) 文書処理装置
KR20010004090A (ko) 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기
JP2000207395A (ja) 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPS62163174A (ja) 機械翻訳装置
JPS62267872A (ja) 言語解析装置
JP2719453B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPS6172361A (ja) かな漢字変換装置
JP2995717B2 (ja) 形態素解析方法およびその装置
JPH05225232A (ja) テキスト自動前編集装置
JPH0531186B2 (ja)
JPH0816910B2 (ja) 言語解析装置
JPH061468B2 (ja) 日本語文章校正装置
JPS63106867A (ja) 言語解析装置
JPH11282837A (ja) 日本語形態素解析装置、日本語形態素解析方法および記録媒体
JPH05165805A (ja) かな漢字変換装置