JPH041849A - 日本語文章処理装置 - Google Patents

日本語文章処理装置

Info

Publication number
JPH041849A
JPH041849A JP2104029A JP10402990A JPH041849A JP H041849 A JPH041849 A JP H041849A JP 2104029 A JP2104029 A JP 2104029A JP 10402990 A JP10402990 A JP 10402990A JP H041849 A JPH041849 A JP H041849A
Authority
JP
Japan
Prior art keywords
word
kana
kanji
conversion
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2104029A
Other languages
English (en)
Inventor
Hiroshi Yamada
洋志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2104029A priority Critical patent/JPH041849A/ja
Publication of JPH041849A publication Critical patent/JPH041849A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は日本語文章処理装置に関し、特にかな漢字変換
を用いて文章の入力を行う日本語文章処理装置に関する
(従来の技術) 日本語の文章においては、送り仮名の付は方や漢字、ひ
らがな、カタカナの使い方に対する自由度が大きい0日
本語ワードプロセッサなどの辞書部には、1つの単語に
対してその送り仮名や字種の違うさまざまな表記が登録
されている。
例えば、「組み合わせ」には「組み合せ」、「組合せ」
、「組合わせ」、「くみあわせ」などの別表記があり、
「りんご」は「林檎」ミ「リンゴ」とも書かれる。
1つの単語に対するさまざまの表現がすべて登録されて
いる辞書を用いてかな漢字変換を行う場合には、変換処
理に要する記憶領域が多くなり、処理に時間がかかる。
また、表記の揺れを含んだ文章が作成され易く、作成さ
れた文章は利用者の好みの文章に合致し難い。
処理時間を短くするために、表記に一定の規則による制
限を加えて単語の数を減らす表記制限方法が用いられて
いる。例えば、株式会社ジャストシステムの日本語入力
フロントプロセッサATOK7では、動詞の送り仮名の
付は方に、送る(長く付ける)、省く(短く付ける)、
本則(標準的な付は方をする)という3種類を用意し、
利用者がどれかを選択する方式が用いられている(「−
太部Ver、4マニュアル活用繻、221ページ参照)
(発明が解決しようとする課題) しかし、上述した表記制限方法を用いている日本語文章
処理方式では、すべての動詞に対して一律に制限を加え
ているから、該日本語文章処理方式で作成された文章の
表現は制限され、利用者の好みに合致する文章を得るこ
とが困難である。
本発明の目的は、かな漢字変換処理に要する時間を短か
くすることができ、表現を制限することなく文章を作成
することができる日本語文章処理装置を提供することに
ある。
(課題を解決するための手段) 本発明は、文章の読み情報を入力する入力部と、漢字を
含む複数の単語に対し、その読み、該単語が属するグル
ープを識別するグループ番号および該単語をかな漢字変
換に使用するかいなかを示すフラグを登録している単語
辞書と、前記入力部に入力された読み情報が与えられ、
前記単語辞書に登録されている単語を用いて前記読み情
報のかな漢字変換を行うかな漢字変換手段と、該かな漢
字変換手段のかな漢字変換結果を出力する出力部とを備
える日本語文章処理装置において、前記かな漢字変換手
段は、前記単語辞書の前記フラグを参照しながら前記読
み情報に含まれている読みおよびかな漢字変換に使用す
ることを示すフラグを有する単語を前記単語辞書から検
索する単語検索部と、該単語検索部で検索された単語を
用いて前記読み情報をかな漢字混じり文に変換する変換
部と、前記グループ番号が同じある単語グループ毎に前
記フラグを変更するフラグ更新部とを有する。
(作用) 本発明によれば、幾つかの表現方法があって通常の状況
ではそのうちの一種類のみを用いるような単語群を一つ
のグループにまとめることにより、利用者がなんらかの
手段でそのうちの一つを指定することによって同じグル
ープの他の単語は次回から単語辞書検索の対象にされな
いから、変換処理のための記憶領域を減らすことができ
、それに伴))変換速度を増大することができる。
(実施例) 次に、本発明の実施例について図面を参照しながら説明
する。
第1図は本発明の日本語文章処理装置の一実施例を示す
ブロック図である。同図において、1は文字を入力する
入力部、2は途中経過や操作者に対する指示などを出力
する出力部、3は入力された文章を漢字かな混じり文に
変換する変換部、4は変換に用いる単語が登録されてい
る単語辞書、5は単語を単語辞書4から検索する単語検
索部、6は単語辞書4のフラグ情報を更新するフラグ更
新部、7は全体の動作の制御を行う変換制御部、8は変
換部3、単語検索部5、フラグ更新部6および変換制御
部7から構成されるかな漢字変換手段である。
入力部1はキーボードなどからなり、出力部2はデイス
プレィなどからなる。
第2図(a)、(b)は本実施例における単語辞書4の
構成例を示す概念図である。同図B、C。
Dは単語の表記、読み、品詞を示す、同図において、A
は単語検索の対象とするかどうかを示すデータ(以下、
「使用フラグ」という。)であり、使用フラグが1であ
る単語は検索対象であることを示し、使用フラグが0で
ある単語は検索対象でないことを示す、また同図のEは
単語が属するグループを示す番号(以下、「グループ番
号」という。)あり、同じグループ番号を有する単語は
同じグループに属することを示し、番号がない単語はど
のグループにも属さないことを示す。
第3図は本実施例の動作を示す流れ図である。
以下、第3図に従って本実施例の動作を説明する。
a、入力部1からかな文字列を入力する(ステップ31
)。
b、入力した文字列を変換部3に渡し、変換部3は前記
文字列を漢字かな混じり文に変換する(ステップ32)
C0変換結果を出力部2で出力する(ステップ33)。
d、入力部1から、現在の出力結果の結果に対する修正
がないことを示す入力(例えば確定キーの押下)があっ
た場合は動作を終了する(ステップ34)。
e、結果の修正指示が入力された場合は、指示に従って
同音語選択などの修正を行う(ステップ35)。
f、修正された変換結果をフラグ更新部6に渡し、フラ
グ更新部6は修正された単語の使用フラグを更新する(
ステップ36)。
単語検索部5は変換部3からかな文字列を与えられると
、それを部分文字列に分割し、単語辞書4から各部分文
字列を読みとする単語を検索して返す。しかし、単語辞
書4の使用フラグが0である単語は検索されない。
変換部3は単語検索部5から単語を受は取り、単語を組
み会わせて変換結果を作る。このような装!は、例えば
、「文節数最小法を用いたべた書き日本語文の形態素解
析」 (吉村他、情報処理学会論分誌Vol、24.N
0I)に記載されている方法で容易に実現することがで
きる。
第4図はフラグ更新部6の動作を示す流れ図である。以
下、第4図に従ってフラグ更新部6の動作を説明する。
フラグ更新部6は利用者によって選択された単語ごとに
以下の操作を行う、第4図および以下の説明で、nは変
換結果の単語数を表し、W、は2番目の単語を表す。
a、p=1とする(ステップ41)。
b、p>nならば終了(ステップ42)。
c、W、が利用者によって選ばれた単語でなければg、
へ(ステップ43)。
d、W、のグループ番号を調べ、番号が付いていないな
らg、へ(ステップ44)。
e、単語辞書4の中の単語で、W、と同じグループ番号
を持つ単語の使用フラグを0にする(ステップ45)。
f、W、の使用フラグを1にする(ステップ46)。
g、Pを1増やし、b、に戻る(ステップ47)。
本実施例の動作を「くみあわせ」という−単語からなる
文を例にして説明する。また、説明に用いる単語辞書4
の内容は第2図(a)に示すようになっているものとす
る(簡単のため他の単語はないものとする)。
「くみあわせ」という文が入力部1から入力されると、
変換部3は「くみあわせ」を単語検索部5に送る。第2
図(a)に示す単語辞書4では、「くみあわせ」という
読みを持つ5つの単語の使用フラグが1になっているの
で、単語検索部5は単語辞書4から「組み合わせ」、「
組み合せ」。
「組合せ」、「組合わせ」、「くみあわせ」の5単語を
検索する。
変換結果の出力後、利用者による同音語選択でこの内の
「組合せ」が選択されたとする。
フラグ更新部6は、単語辞書4中で「組合せ」と同じグ
ループ番号10を持つ単語を探し、それらの使用フラグ
を0にする。また、「組合せ」の使用フラグを1にする
。その結果、単語辞書4の内容は第2図(b)の様に変
化する0次回に「くみあわせ」という読みを持つ単語を
検索する際には「組合せ」だけが検索されるから、単語
を記憶するための容量や文章処理の時間が節約される。
以上の説明では、同じグループ番号を持つ単語の例とし
て表記の揺れによる同音語を取り上げた。
しかし、ある単語が使われるときは他の単語が使われ難
いという関係があれば、表記の揺れ以外の単語群に対し
て本発明を適用することができる。
また、グループ内の単語を選択する方法には、利用者に
よる明示的な選択の他に、単語の使用頻度を利用するこ
ともできる。
〈発明の効果) 以上説明したように、本発明によれば、前記単語辞書に
登録されている単語をグループ化してグループ内の一部
の単語だけを使用するから、記憶容量を増加させず、ま
た処理速度を落すことなく多種多様な表現を提供するこ
とができる。
語辞書、5・・−単語検索部、6・・・フラグ更新部、
7・・・変換制御部、8・・・かな漢字変換手段。

Claims (1)

    【特許請求の範囲】
  1. 文章の読み情報を入力する入力部と、漢字を含む複数の
    単語に対し、その読み、該単語が属するグループを識別
    するグループ番号および該単語をかな漢字変換に使用す
    るかいなかを示すフラグを登録している単語辞書と、前
    記入力部に入力された読み情報が与えられ、前記単語辞
    書に登録されている単語を用いて前記読み情報のかな漢
    字変換を行うかな漢字変換手段と、該かな漢字変換手段
    のかな漢字変換結果を出力する出力部とを備える日本語
    文章処理装置において、前記かな漢字変換手段は、前記
    単語辞書の前記フラグを参照しながら前記読み情報に含
    まれている読みおよびかな漢字変換に使用することを示
    すフラグを有する単語を前記単語辞書から検索する単語
    検索部と、該単語検索部で検索された単語を用いて前記
    読み情報をかな漢字混じり文に変換する変換部と、前記
    グループ番号が同じである単語グループ毎に前記フラグ
    を変更するフラグ更新部とを有する日本語文章処理装置
JP2104029A 1990-04-19 1990-04-19 日本語文章処理装置 Pending JPH041849A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2104029A JPH041849A (ja) 1990-04-19 1990-04-19 日本語文章処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2104029A JPH041849A (ja) 1990-04-19 1990-04-19 日本語文章処理装置

Publications (1)

Publication Number Publication Date
JPH041849A true JPH041849A (ja) 1992-01-07

Family

ID=14369823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2104029A Pending JPH041849A (ja) 1990-04-19 1990-04-19 日本語文章処理装置

Country Status (1)

Country Link
JP (1) JPH041849A (ja)

Similar Documents

Publication Publication Date Title
JP2828692B2 (ja) 情報検索装置
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH041849A (ja) 日本語文章処理装置
JPS60195664A (ja) 仮名漢字変換方式
JPS6126172A (ja) カナ漢字変換方式
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH0439763A (ja) 文章編集装置
JP2802369B2 (ja) かな漢字変換装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH04270450A (ja) 文書作成装置
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JPS6175467A (ja) 仮名漢字変換方式
JPH0468466A (ja) かな漢字変換装置
JPH0610804B2 (ja) かな漢字変換装置
JPS60112174A (ja) 仮名漢字変換装置における略称語変換方式
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH10154141A (ja) かな漢字変換装置
JPH01243171A (ja) データ処理装置
JPS62168263A (ja) 仮名漢字相互変換装置
JPH02184961A (ja) 辞書検索方法
JPH03225462A (ja) ローマ字漢字変換装置
JPH09153043A (ja) 仮名漢字変換方式
JPH07249035A (ja) 仮名漢字変換装置及び方法
JP2004157688A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JPH05120325A (ja) 電子化辞書