JPH08241315A - 文書処理装置の単語登録機構 - Google Patents

文書処理装置の単語登録機構

Info

Publication number
JPH08241315A
JPH08241315A JP7046890A JP4689095A JPH08241315A JP H08241315 A JPH08241315 A JP H08241315A JP 7046890 A JP7046890 A JP 7046890A JP 4689095 A JP4689095 A JP 4689095A JP H08241315 A JPH08241315 A JP H08241315A
Authority
JP
Japan
Prior art keywords
word
attribute
attribute information
ending
inflection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7046890A
Other languages
English (en)
Inventor
新一 ▲高▼池
Shinichi Takaike
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7046890A priority Critical patent/JPH08241315A/ja
Publication of JPH08241315A publication Critical patent/JPH08241315A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】文書処理装置の単語登録機構に関し、単語の
「属性」 の指定を簡単に行えるようにし、特別な文法そ
の他の知識をもたなくてもよいようにする。 【構成】 文書処理装置の単語辞書を拡充するための単
語登録機構において、単語の読みと、文字表記と、属性
情報、活用語尾、同類語の文字表記のいずれかとを入力
する手段と、それらのいずれが入力されたかを判断する
手段と、単語の活用語尾と属性情報と代表単語の文字表
記とを対応させた語尾・属性・代表語対応テーブルと、
前記の対応テーブルによって、活用語尾が入力されたと
き属性と代表語の文字表記とを得る手段と、属性情報が
入力されたとき活用語尾と代表語の文字表記とを得る手
段と、同類語の文字表記が入力されたとき、その属性情
報を単語辞書より得て前記の対応テーブルによって活用
語尾を得る手段と、単語の属性情報、活用語尾、同類語
の文字表記の入力された又は変換により得た内容を表示
する手段とを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書処理装置の単語登
録機構に関する。通常、文書処理装置では標準的に用意
されている単語辞書にはない単語(例えば、方言、造
語、特定の分野で使う専門語)は利用者が登録すること
により、標準の辞書と同様に使用することができる。こ
の単語登録に際して、文法規則その他の特別な知識をも
たなくても容易に操作できることが望ましい。
【0002】
【従来の技術】日本語文書処理のかな漢字変換の単語辞
書を拡張するための単語登録機構は、通常、追加する単
語に関する「読み」 と「文字表記」 と「属性情報」 とい
う三つの情報をオペレータが入力することを要求する。
このうちの「文字表記」 は、通常のかな漢字変換処理に
より、単語単位の「読み」に対する文字表記の候補を単
語辞書から取り出してディスプレイ等に表示し、オペレ
ータが選択指示を行うことにより入力し、「属性情報」
は、ディスプレイ画面に品詞リストを表示し、オペレー
タが選択指示を行うことにより入力するのが通常であ
る。
【0003】「属性情報」 は、変換技術が単純な時代は
品詞程度であった。しかし、最近のAI技術を利用した
複文節同時変換や文章一括変換等のかな漢字変換の処理
技術の高度化にともなって、指定または選定すべき属性
情報の種類が増加する傾向にある。一般人の場合、文法
知識をもたないことが少なくない。例えば、形容詞と形
容動詞、形容動詞と動詞の区別が明確にできるとは限ら
ない。その上、通常の文法知識とは異なる、変換技術の
都合による何十種類もの属性情報を指定または選択する
となると、適切な処理をするのはかなり困難になる。
【0004】
【発明が解決しようとする課題】従って、辞書に単語の
属性が適切に指定されていないため、文章中に新登録語
が入っていると、文書処理装置に高度な変換処理機能が
備えられているにも係わらず変換がうまくいかないとい
う問題がある。
【0005】本発明は、単語の登録をするときに、単語
の「属性」 の指定を簡単に行えるようにし、特別な文法
その他の知識をもたなくてもよいようにした単語登録機
構を実現することを目的としている。
【0006】
【課題を解決するための手段】単語の読みと、文字表記
と、属性情報とを対応させた単語辞書を有する文書処理
装置の、前記単語辞書を拡充するための単語登録機構に
おいて、 請求項1の発明:語尾入力方式 新規に登録する単語の読みと、文字表記と、活用語尾と
を入力する手段と、単語の活用語尾と属性情報とを対応
させた語尾・属性対応テーブルと、語尾・属性対応テー
ブルによって、入力された活用語尾を属性情報に変換す
る手段と、単語の読みと、文字表記と、語尾から変換し
て得た属性情報とを組にして単語辞書に付加する手段と
を有する。
【0007】ただし、いわゆる活用語尾をもたない品詞
の単語の場合には、付属語(助詞等)で代用したり空白
としたりするものとする。このようなものも含めて「活
用語尾」と記す。
【0008】請求項2の発明:同類語入力方式 新規に登録する単語の読みと、文字表記と、その語の同
類語の文字表記とを入力する手段と、同類語の属性情報
を単語辞書より得る手段と、単語の読みと、文字表記
と、単語辞書から得られた同類語の属性情報とを組にし
て単語辞書に付加する手段とを有する。
【0009】請求項3の発明:例示方式 単語の読みと、文字表記と、属性情報、活用語尾、同類
語の文字表記のいずれかとを入力する手段と、単語の属
性情報、活用語尾、同類語の文字表記のいずれが入力さ
れたかを判断する手段と、単語の活用語尾と属性情報と
代表単語の文字表記とを対応させた語尾・属性・代表語
対応テーブルと、活用語尾が入力されたとき、語尾・属
性・代表語対応テーブルによって、属性と代表語の文字
表記とを得る手段と、属性情報が入力されたとき、語尾
・属性・代表語対応テーブルによって、活用語尾と代表
語の文字表記とを得る手段と、同類語の文字表記が入力
されたとき、その属性情報を単語辞書より得て、さら
に、語尾・属性・代表語対応テーブルによって、属性情
報から活用語尾を得る手段と、単語の属性情報、活用語
尾、同類語の文字表記の入力された又は変換により得た
内容を表示する手段と、単語の読みと、文字表現と、入
力された又は変換により得た属性情報とを組にして単語
辞書に付加する手段とを有する。
【0010】
【作用】
請求項1の発明:語尾入力方式 オペレータは登録したい単語の属性情報を入力(リスト
から選択指定)する代わりに、活用語尾を入力する。こ
の活用語尾から、活用語尾・属性対応テーブルによっ
て、属性情報を得る。これにより、単語の読みと、文字
表記と、属性情報とが揃うので単語辞書に付加すること
により、単語の登録が完了する。
【0011】請求項2の発明:同類語入力方式 オペレータは登録したい単語の属性情報を入力(リスト
から選択指定)する代わりに、同じ属性情報をもつはず
の同類語を入力する。この同類語の属性情報を単語辞書
より得る。なお、同類語の文字表記を確定するとき属性
情報を保存しておくようにすれば、より速く処理でき
る。これにより、単語の読みと、文字表記と、属性情報
とが揃うので単語辞書に付加することにより、単語の登
録が完了する。
【0012】請求項3の発明:例示方式 オペレータは、属性情報、活用語尾、同類語の文字表記
のいずれかを入力する。属性情報は、表示されたリスト
から選択することでもよい。
【0013】このいずれが入力されたかを判断して、語
尾・属性・代表語対応テーブルや単語辞書を検索して他
の2つの情報を得て表示する。従ってオペレータは入力
が正しいかどうかの判断がつきやすくなる。
【0014】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は、本発明の実施例の構成図である。本構成
図は、文書処理装置(パーソナルコンピュータなどのハ
ードウェア装置とワードプロセサプログラムとで構成さ
れる装置を含む)のうちの「単語登録機構」 を中心に表
現したものである。また、請求項3の発明に対応してい
るが、請求項1、2の発明が含まれている。
【0015】単語辞書の形式の例を図2に示す。各単語
に、読み、文字表記、属性(品詞を含む)が対応されて
いる。新規に単語を登録するにはこれらの情報をすべて
入力しなければならない。
【0016】登録しようとする単語の読み、文字表記、
属性指定(または、活用語尾、同類語)を入力するには
ディスプレイ・キーボード1により行う。なお、文字表
記は、通常の文書作成を行っているときに、登録するこ
との指示と、アンダーラインによる指定により文字表記
部分を指示することで行う。この指示があると、図4に
示すような単語登録画面に切り替わる。この表示・入力
の制御は、入力・表示制御部3が行う。
【0017】入力・表示制御部3はディスプレイ画面に
入力データのフィールドを示し、入力データを、必要な
とき単語辞書2により読み・文字表記の変換を行い、一
時保持部9に保持する。
【0018】入力判定部4は、活用語尾/属性/同類語
のいずれが入力されたかを判定し、それぞれ属性抽出部
6/代表語抽出部5/同類語属性抽出部7を起動する。
語尾・属性・代表語対応テーブル8の例を図3に示す。
【0019】属性抽出部6は、語尾・属性・代表語対応
テーブル8を索引して、活用語尾に対応する属性情報と
代表語とを得て、一時保持部9に渡す。代表語抽出部5
は、語尾・属性・代表語対応テーブル8を索引して、属
性情報に対応する活用語尾と代表語とを得て、一時保持
部9に渡す。
【0020】同類語属性抽出部7は単語辞書2を索引し
て得た同類語の属性情報、または同類語の入力時に文字
表現を得るときに保存しておいた属性情報により、語尾
・属性・代表語対応テーブル8を索引して、活用語尾を
得て、同類語の属性情報と活用語尾とを一時保持部9に
渡す。
【0021】確定の指示により、登録処理部10が、一時
保持部にある単語の読み、文字表記、属性情報を単語辞
書2に付加する。この間、ディスプレイ1には途中の情
報が表示される。
【0022】本実施例における単語登録の具体例を以下
に示す。 語尾入力方式 これは、登録する単語に続く活用語尾を入力するもので
ある。活用語尾から属性情報(代表的なものは品詞)を
判定する。この方式は、形容詞、形容動詞、動詞など、
顕著に他と異なる活用語尾をもっている場合に適してい
る。活用語尾がない場合、例えば名詞の場合は、代わり
に助詞の「は」「が」を使用し、副詞等では句点「、」
や空白を使用する。
【0023】例1)語幹「うざった」 に、活用語尾
「い」 が入力されたことで、単語登録機構は、「うざっ
たい」 が「形容詞」 であると判定する。 例2)語幹「ナロー」 に、活用語尾「な」 が入力された
ことで、単語登録機構は、「ナローな」が「形容動詞」
であると判定する。
【0024】例3)語幹「バグ」 に、活用語尾「る」が
入力されたことで、単語登録機構は、「バグる」が「バ
グらない、バグります、バグる」と活用する「ら行5段
活用の動詞」であると判定する。
【0025】例4)単語の活用語尾として「す」 が入力
されたのなら、単語登録機構は、品詞を「さ行5段活用
の動詞」 と判定する。「する」なら、「さ変動詞」と判
定する。
【0026】同類語入力方式 これは、同じ属性をもつ既存の単語(同類語)を指定す
るものである。同類語の属性情報を抽出するには次のよ
うにして行う。同類語を入力するフィールドに文字を入
力する際にも、かな漢字変換機能が動作する。その際、
同類語の読みに対する文字表記と共に属性情報を取り出
し保存しておく。かな漢字変換確定と同時に、その属性
情報を採用する。この方式は、類似語、反対語を想像し
やすい単語の場合に適している。
【0027】例5)単語「ナロー」 の同類語が「ワイ
ド」 であると入力されたことで、単語登録機構は、「ワ
イド」 という語の品詞である〔形容動詞〕を、「ナロ
ー」 の品詞として採用する。また、その他の属性も「ワ
イド」 と同じとして処理する。ただし「ワイド」 は辞書
にすでにあることがわかっているものとする。
【0028】例6)「ライブ」 という単語はあったが、
「ライヴ」 という単語はなかった。そこで、「ライヴ」
を「ライブ」 が同類語であると指定して登録する。 例7)新しい姓を入力し、同類語として「田中」 を入力
する。〔名詞〕であって〔姓〕であることを簡単に指定
できる。
【0029】例示方式 属性情報(主として品詞)選択により、活用語尾と同類
語(代表語)を自動設定して表示する。
【0030】品詞を品詞リストから選択することは従来
から行われていることであるが、選択に伴って、活用語
尾と同類語の入力フィールドに、「例」 を自動的に設定
表示する。これにより、その選択が妥当であるかどうか
を「例」を見ることにより再確認することができる。品
詞の名称だけから選択する従来の方法と比較して、品詞
・属性指定が容易になり、また、正しい品詞・属性を選
びやすくなる。
【0031】また、活用語尾が入力されたとき、属性情
報の選定表示と代表語が表示され、同類語が入力された
とき、属性情報の選定表示と活用語尾が表示される。こ
のように構成したことにより、オペレータは、従来の
「リストからの選択」の他に「語尾の入力」 、「同類語
の入力」 の計三つの方法から、好みの手段を選択して用
いることができる。
【0032】図4は、本実施例のディスプレイ画面(マ
ン・マシン・インタフェース)の例である。以下に画面
の説明をする。 「単語」:単語の文字表現を入力するためのフィール
ドである。
【0033】文書作成画面において単語を指定してから
登録画面に切り換えた場合は、すでにこのフィールドに
は記入されている。 「読み」:単語の読みを入力するためのフィールドで
ある。 「品詞・属性」:カーソルを動かして従来通りの方法
でリストから選択する。 「活用語尾」:「単語」で入力した語の「活用語尾」
を入力するためのフィールドである。ここに入力がある
と、「品詞・属性」 の項目は自動的に入力された活用語
尾に該当するものに変更される。 「同類語」:「単語」と同一の属性をもつはずの既存
の単語を入力するためのフィールドである。ここに入力
があると、「品詞・属性」 の項目は自動的に入力された
当該単語の属性に変更される。 ☆表示した品詞・属性リストの中から選ぶ。ここでカー
ソルにより選択すると、活用語尾と同類語のフィールド
に、例が表示される。 ☆活用語尾のフィールドに入力する。同類語のフィール
ドに例(代表語)が表示され、品詞・属性フィールドで
は相当する項目に矢印が移る。 ☆同類語のフィールドに入力する。活用語尾のフィール
ドに例が表示され、品詞・属性フィールドでは相当する
項目に矢印が移る。
【0034】実際の単語登録の流れを以下に示す。 形容動詞の例:図4(1) オペレータは、文書作成中に「羊頭狗肉」 という単語
が辞書にないことを発見した。漢字を一文字ずつ変換し
て入力した後、今後のために登録することにした。 オペレータは単語登録を指示(単語登録処理プログラ
ムが起動される)。前述の画面がディスプレイ装置に表
示される。 単語のフィールドに「羊頭狗肉」 がすでに入っている
ので、オペレータは、読みのフィールドに「ようとうく
にく」 を入力する。 オペレータは、品詞・属性の指定のために、以下の方
法のどれでも使用することができる。
【0035】⇒「品詞」 のリストの中から、「形容動
詞」 を探して選択する。リストからの選択が煩わしくな
い場合にはこの方法も利用できる。単語登録処理プログ
ラムは、選択した品詞の代表的な単語の例(代表語)と
活用語尾の例とを自動的に設定、表示するので、オペレ
ータは正しい品詞を選択するのに役立てることができ
る。
【0036】⇒「羊頭狗肉」 には「な」 がつながること
を認識し、活用語尾のフィールドに「な」 と入力する。
単語登録処理プログラムは、品詞・属性リストの「形容
動詞」 を自動的に選択状態として表示し、同類語のフィ
ールドに代表語「危険」を表示する。形容動詞には、厳
密には「が」 もつながるタイプ(「安全」 など) と、つな
がらないタイプ(「素敵」 など) とがある。活用語尾とし
て「な」 を入力された際、詳細属性のフィールドに、代
表語「危険」と同じものを強制的に採用して表示する。
ブリンク表示等でそれを示し、詳細属性を指定させる
か、同類語を入力させることにより決定する。
【0037】⇒「羊頭狗肉」 が、「危険」 と同じ属性を
もつと判断し、同類語のフィールドに、かな漢字変換機
能を利用して「危険」 と入力する。単語登録処理プログ
ラムは、品詞・属性リストに対して「形容動詞」 を自動
的に選択状態とし、活用語尾のフィールドに「な」を表
示する。 「登録] 指示を行うことにより、単語は登録される。
【0038】名詞の例:図4(2) 単語「岡蒸気」の例である。形容動詞の例と同様である
ので詳細は略す。なお、活用語尾のフィールドと、同類
語のフィールドを一本化してもよい。それぞれの区分は
自動的に判断することが可能である。
【0039】
【発明の効果】以上説明したように、本発明によれば、
単語登録を行う場合に、従来のように品詞等の属性を直
接入力したり、数多くの候補の中から選択する方法と比
較して、品詞・属性指定を容易に正しく行うことができ
る。そして、登録語の品詞・属性の誤りが減ることによ
り、変換ヒット率も向上する。
【0040】請求項3の発明では、オペレータが属性情
報、活用語尾、同類語の文字表記のいずれかを入力する
と、他の2つの情報を表示する。従ってオペレータは入
力が正しいかどうかの判断がつきやすくなる。
【図面の簡単な説明】
【図1】 実施例の構成図
【図2】 単語辞書の形式の例
【図3】 語尾・属性・代表語対応テーブルの例
【図4】 単語登録画面の例
【符号の説明】
1 ディスプレイ・キーボード 2 単語辞書 3 入力・表示制御部 4 入力判定部 5 代表語抽出部 6 属性抽出部 7 同類語属性抽出部 8 語尾・属性・代表語対応テーブル 9 一時保持部 10 登録処理部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 単語の読みと、文字表記と、属性情報と
    を対応させた単語辞書を有する文書処理装置の、前記単
    語辞書を拡充するための単語登録機構であって、 新規に登録する単語の読みと、文字表記と、活用語尾と
    を入力する手段と、 単語の活用語尾と属性情報とを対応させた語尾・属性対
    応テーブルと、 語尾・属性対応テーブルによって、入力された活用語尾
    を属性情報に変換する手段と、 単語の読みと、文字表記と、活用語尾から変換して得た
    属性情報とを組にして単語辞書に付加する手段とを有す
    ることを特徴とする単語登録機構。
  2. 【請求項2】 単語の読みと、文字表記と、属性情報と
    を対応させた単語辞書を有する文書処理装置の、前記単
    語辞書を拡充するための単語登録機構であって、 新規に登録する単語の読みと、文字表記と、その語の同
    類語の文字表記とを入力する手段と、 同類語の属性情報を単語辞書より得る手段と、 単語の読みと、文字表記と、単語辞書から得られた同類
    語の属性情報とを組にして単語辞書に付加する手段とを
    有することを特徴とする単語登録機構。
  3. 【請求項3】 単語の読みと、文字表記と、属性情報と
    を対応させた単語辞書を有する文書処理装置の、前記単
    語辞書を拡充するための単語登録機構であって、 単語の読みと、文字表記と、属性情報、活用語尾、同類
    語の文字表記のいずれかとを入力する手段と、 単語の属性情報、活用語尾、同類語の文字表記のいずれ
    が入力されたかを判断する手段と、 単語の活用語尾と属性情報と代表単語の文字表記とを対
    応させた語尾・属性・代表語対応テーブルと、 活用語尾が入力されたとき、語尾・属性・代表語対応テ
    ーブルによって、属性と代表語の文字表記とを得る手段
    と、 属性情報が入力されたとき、語尾・属性・代表語対応テ
    ーブルによって、活用語尾と代表語の文字表記とを得る
    手段と、 同類語の文字表記が入力されたとき、その属性情報を単
    語辞書より得て、さらに、語尾・属性・代表語対応テー
    ブルによって、属性情報から活用語尾を得る手段と、 単語の属性情報、活用語尾、同類語の文字表記の、入力
    された又は変換により得た内容を表示する手段と、 単語の読みと、文字表現と、入力された又は変換により
    得た属性情報とを組にして単語辞書に付加する手段とを
    有することを特徴とする単語登録機構。
JP7046890A 1995-03-07 1995-03-07 文書処理装置の単語登録機構 Withdrawn JPH08241315A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7046890A JPH08241315A (ja) 1995-03-07 1995-03-07 文書処理装置の単語登録機構

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7046890A JPH08241315A (ja) 1995-03-07 1995-03-07 文書処理装置の単語登録機構

Publications (1)

Publication Number Publication Date
JPH08241315A true JPH08241315A (ja) 1996-09-17

Family

ID=12759967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7046890A Withdrawn JPH08241315A (ja) 1995-03-07 1995-03-07 文書処理装置の単語登録機構

Country Status (1)

Country Link
JP (1) JPH08241315A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125399A (ja) * 2011-12-14 2013-06-24 Omron Corp 文字入力用のプログラムおよび情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125399A (ja) * 2011-12-14 2013-06-24 Omron Corp 文字入力用のプログラムおよび情報処理装置

Similar Documents

Publication Publication Date Title
JP3277123B2 (ja) 中国語テキストを処理するためのシステムおよび方法
EP0370774B1 (en) Machine translation system
EP1482414A1 (en) TRANSLATING METHOD, TRANSLATED SENTENCE OUTPUTTING METHOD, RECORDING MEDIUM, PROGRAM, AND COMPUTER DEVICE
JPS6231467A (ja) 文章作成装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2621999B2 (ja) 文書処理装置
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH08241315A (ja) 文書処理装置の単語登録機構
JP3622841B2 (ja) かな漢字変換装置およびかな漢字変換方法
JPH0561902A (ja) 機械翻訳システム
JPH1097538A (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH0683807A (ja) 文書作成装置
JPH08106461A (ja) 文書処理方法及び装置
JPH0612453A (ja) 未知語抽出登録装置
JPH11203281A (ja) 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体
JPS5998236A (ja) 日本文入力装置
JP2000242643A (ja) 英文作成支援装置及び方法並びに記憶媒体
JPH0232460A (ja) 文書処理装置
JPS63136264A (ja) 機械翻訳装置
JPH09146937A (ja) 文字列変換装置および文字列変換方法
JPH04280369A (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020507