JP3036005B2 - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JP3036005B2
JP3036005B2 JP2181750A JP18175090A JP3036005B2 JP 3036005 B2 JP3036005 B2 JP 3036005B2 JP 2181750 A JP2181750 A JP 2181750A JP 18175090 A JP18175090 A JP 18175090A JP 3036005 B2 JP3036005 B2 JP 3036005B2
Authority
JP
Japan
Prior art keywords
word
unit
kana
conversion
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2181750A
Other languages
English (en)
Other versions
JPH0468466A (ja
Inventor
洋志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2181750A priority Critical patent/JP3036005B2/ja
Publication of JPH0468466A publication Critical patent/JPH0468466A/ja
Application granted granted Critical
Publication of JP3036005B2 publication Critical patent/JP3036005B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、かな漢字またはローマ字で入力された文章
を漢字かな混じり文章に変換する、かな漢字変換装置に
関する。
〔従来の技術〕
かな漢字変換用の辞書には、同一の読みに対して、同
音異義語のほかに、同一単語の異表記が登録されている
場合がある。異表記の例としては、「行う」と「行な
う」のような送り仮名の違う単語や、「努める」と「つ
とめる」の様な字種が違う単語などがある。
従来のかな漢字変換装置では、単語辞書に登録されて
いる単語すべてを処理の対象としていた。
第2図は従来技術を用いたかな漢字変換装置の一例の
ブロック図である。このかな漢字変換装置は、文字を入
力する入力部1と、変換結果を出力する出力部2と、入
力された文章を漢字かな混じり文に変換する変換部3
と、変換に用いる単語を登録してある単語辞書24と、単
語辞書24から読みをキーとして単語を検索する辞書検索
部25と、装置全体の動作を制御する制御部28とを有して
いる。入力部1はキーボードで、出力部2はCRT装置や
プリンタで、変換部3,辞書検索部25,制御部28はCPUとメ
モリ装置によって、単語辞書24はハードディスクなどの
ファイル装置やメモリ装置によって実現されている。
第1表は、単語辞書24の構成例として、「読み」,
「表記」,「品詞」を示している。「読み」は単語の読
み、「表記」は単語の表記、「品詞」は単語の品詞であ
る。
変換部3は辞書検索部25から単語を受け取り、単語を
組み合わせて変換結果を作る。このような装置は、例え
ば、「文節数最小法を用いたべた書き日本語文の形態素
解析」(吉村他、情報処理学会論文誌Vol.24,No.1)に
記載されている方法で容易に実現できる。
第3図はこの従来のかな漢字変換装置の動作を示す流
れ図である。以下第3図に従ってこの従来例の動作を説
明する。
a.入力部1からかな文字列を入力する(ステップ31)。
b.入力終了後、制御部28は入力された文字列を変換部3
に渡し、変換を指示する。
c.変換部3は、入力文字列をいくつかの部分列に分け、
各部分列を読みとする単語を単語辞書24から検索するよ
う辞書検索部25に指示する。
d.辞書検索部25は指定された読みを持つ単語を単語辞書
24から検索する(ステップ32)。
e.検索結果を変換部3にわたす。
f.変換部3は検索された単語を組み合わせてかな漢字変
換結果を作成する(ステップ33)。
g.変換終了後、制御部28は変換結果を出力部2で出力す
る(ステップ34)。
〔発明が解決しようとする課題〕
上述した従来のかな漢字変換装置の出力の一部が、一
般的には正しい変換結果であっても、特定の用途に対し
ては不都合である場合がある。
いま、単語辞書24の内容が第1表に示すようになって
いるとする(格助詞や動詞の活用語尾については、以下
の説明に関係しないので記述を省略する)。すると、
「そうちのかいりょうにつとめる」という文を変換した
結果は、 「装置の改良に勤める」 「装置の改良に努める」 「装置の改良につとめる」 のいずれかになる。
前記の3種類の結果のうち「装置の改良に勤める」
は、変換の誤りである。「装置の改良に努める」と「装
置の改良につとめる」という結果は、どちらも間違いで
はなく、どちらを選ぶかは文章を入力する人間の選択に
任せられる。
しかし、変換結果を他の言語処理装置への入力に使う
場合は、「つとめる」では都合の悪い場合がある。例え
ば、機械翻訳装置への入力に使う場合は、「つとめる」
を「努める」と解釈するか「勤める」と解釈するかによ
って、翻訳結果が異なってくる。したがって、機械翻訳
装置の使用者が区別を指示する、装置に判別のための機
構を組み込むなどの対策が必要になる。
また、装置の開発者などが装置に組み込んである変換
アルゴリズム、特に、同音語決定アルゴリズムの検証を
行う場合には、「装置の改良につとめる」という結果が
出力されたときにも、「つとめる」が「努める」の異表
記として選択されたのか、「勤める」の異表記として選
択されたのかを判別する必要がある。そのためには、表
記だけではなく、別な情報(例えば、漢字表記するとど
うなるかの情報)も出力する必要があり、出力されるデ
ータの量が増え、評価作業をする人間の負担も増大す
る。
本発明の目的は、意味の違う複数の語に共通の異表記
である単語を変換の際に用いないようにすることによっ
て、単語の区別を明確にできるかな漢字変換装置を提供
することにある。
〔課題を解決するための手段〕
本発明のかな漢字変換装置は、文章を入力する入力部
と、前記入力部から入力された文章のかな漢字変換を行
う変換部と、単語の読み,表記,品詞を含む単語辞書
と、前記単語辞書中から単語の読みをキーとして単語を
検索する辞書検索部と、かな漢字変換結果を出力する出
力部とを備え、前記単語辞書は、入力時に付与される、
前記単語辞書内の単語が意味の違う複数の語の異表記に
なっているかどうかを示す情報をさらに含み、前記入力
部中に組み込まれ、前記情報が付された単語を使用せず
にかな漢字変換を行うことを指示する制限指示部と、前
記辞書検索部が検索した単語を変換に使用するか否かを
判定し、前記制限指示部からの指示があった場合は、検
索した単語から前記情報が付された単語を削除する単語
制限部とを備えることを特徴とする。
〔作用〕
前述した、従来のかな漢字変換装置の解決すべき課題
は、ある単語が意味の違う複数の単語に共通の異表記と
なっていることが原因である。そこで、本発明のかな漢
字変換装置は、意味の違う複数の単語の異表記となる単
語を用いずに変換を行う機能を有している。すなわち、
複数の単語の異表記であるかどうかを区別するための情
報を格単語に付記し、その情報に基づいて変換に使用す
る単語を選別する。それによって、変換結果の正誤に関
する曖昧性を減らすことができる。
〔実施例〕
次に、本発明の実施例について図面を参照して説明す
る。
第1図は本発明の一実施例を示すブロック図である。
このかな漢字変換装置は、文字を入力する入力部1と、
変換結果を出力する出力部2と、入力された文章を漢字
かな混じり文に変換する変換部3と、変換に用いる単語
を登録してある単語辞書4と、単語辞書4から読みをキ
ーとして単語を検索する辞書検索部5と、単語辞書4か
ら検索された単語を変換に使用するかどうかを判定する
単語制限部6と、使用する単語を制限してかな漢字変換
を行うことを指示する制限指示部7と、装置全体の動作
を制御する制御部8とを備えている。
辞書検索部5,単語制限部6,制御部8はCPUとメモリ装
置によって、単語辞書4はハードディスクなどのファイ
ル装置やメモリ装置によって実現できる。制限指示部7
は、指示キーとして入力部1中に組み込むことで実現で
きる。なお、第1図と第2図とにおいて同じ番号が付い
ているブロックは、同じ構成要素なので説明を省略す
る。
第2表は、単語辞書4の構成例を示す。この例では、
「読み」,「表記」,「品詞」,「制限」を示してい
る。
「読み」は単語の読み、「表記」は単語の表記、「品
詞」は単語の品詞、「制限」はこの単語が意味の違う複
数の単語の異表記になっているかどうかを示す情報(以
下の説明では制限フラグと呼ぶ)で、“1"のときは異表
記、“0"のときは異表記ではないことを示す。例えば、
「つとめ」は、「勤め」と「努め」に共通の異表記なの
で制限フラグは1である。一方、「ふるま」は「振る
舞」と「振るま」に共通の異表記であるが、「振る舞」
と「振るま」には意味上の違いがないので制限フラグは
0にする。
第4図は本実施例の動作を示す流れ図である。以下、
第4図に従って本実施例の動作を説明する。
a.入力部1からかな文字列を入力する(ステップ41)。
制限指示部7から単語の使用制限が指示された場合、制
御部8は内部のメモリに指示があったことを記憶してお
く。
b.入力終了後、制御部8は入力された文字列を変換部3
に渡し、変換を指示する。
c.変換部3は、入力文字列をいくつかの部分列に分け、
各部分列を読みとする単語を単語辞書4から検索するよ
う辞書検索部5に指示する。
d.辞書検索部5は、指定された読みを持つ単語を単語辞
書4から検索する(ステップ42)。
e.以前に制限指示部7によって単語の使用制限が指示さ
れていた場合、単語制限部6は、検索された単語のうち
制限フラグが“1"のものを検索結果から削除する(ステ
ップ43)。
f.検索結果を変換部3に渡す。
g.変換部3は、検索された単語を組み合わせてかな漢字
変換結果を作成する(ステップ44)。
h.変換終了後、制御部8は変換結果を出力部2で出力す
る(ステップ45)。
これによって、「そうちのかいりょうにつとめる」と
いう文を変換した結果は、 「装置の改良に勤める」 「装置の改良に努める」 のいずれかになる。
〔発明の効果〕
以上説明したように、本発明は、意味の違う複数の語
に共通の異表記である単語を変換の際に用いないように
することによって、単語の区別が明確になる。その結
果、変換結果を機械翻訳の入力データなどに利用しやす
くなる、装置の開発者などが装置に組み込んだ変換アル
ゴリズムの評価を行うことが容易になる、などの効果が
ある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、 第2図は従来のかな漢字変換装置の一例を示すブロック
図、 第3図は第2図のかな漢字変換装置の動作を表す流れ
図、 第4図は第1図の実施例の動作を表す流れ図である。 1……入力部 2……出力部 3……変換部 4……単語辞書 5……辞書検索部 6……単語制限部 7……制限指示部 8……制御部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文章を入力する入力部と、前記入力部から
    入力された文章のかな漢字変換を行う変換部と、単語の
    読み,表記,品詞を含む単語辞書と、前記単語辞書中か
    ら単語の読みをキーとして単語を検索する辞書検索部
    と、かな漢字変換結果を出力する出力部とを備えるかな
    漢字変換装置において、 前記単語辞書は、入力時に付与される、前記単語辞書内
    の単語が意味の違う複数の語の異表記になっているかど
    うかを示す情報をさらに含み、 前記入力部中に組み込まれ、前記情報が付された単語を
    使用せずにかな漢字変換を行うことを指示する制限指示
    部と、 前記辞書検索部が検索した単語を変換に使用するか否か
    を判定し、前記制限指示部からの指示があった場合は、
    検索した単語から前記情報が付された単語を削除する単
    語制限部と を備えることを特徴とするかな漢字変換装置。
JP2181750A 1990-07-09 1990-07-09 かな漢字変換装置 Expired - Lifetime JP3036005B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2181750A JP3036005B2 (ja) 1990-07-09 1990-07-09 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2181750A JP3036005B2 (ja) 1990-07-09 1990-07-09 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0468466A JPH0468466A (ja) 1992-03-04
JP3036005B2 true JP3036005B2 (ja) 2000-04-24

Family

ID=16106232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2181750A Expired - Lifetime JP3036005B2 (ja) 1990-07-09 1990-07-09 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JP3036005B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633647A (en) * 1994-01-11 1997-05-27 Tines; John L. Base support for movable antenna

Also Published As

Publication number Publication date
JPH0468466A (ja) 1992-03-04

Similar Documents

Publication Publication Date Title
JPH0433069B2 (ja)
JP3038079B2 (ja) 自動翻訳装置
JP3036005B2 (ja) かな漢字変換装置
JPH0130173B2 (ja)
JP2621999B2 (ja) 文書処理装置
JPH01126767A (ja) 辞書参照装置
JP2802369B2 (ja) かな漢字変換装置
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JPH0683809A (ja) 文書処理装置
JPH07302263A (ja) ローマ字入力制御機能付きキーボード
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JP2000057131A (ja) 文字列変換装置およびそのプログラム記録媒体
JPH043243A (ja) かな漢字変換装置
JPH1185751A (ja) 翻訳装置及び翻訳装置制御プログラムを記憶した媒体
JPH01128157A (ja) 日本語文書作成装置
JPS61265673A (ja) 翻訳方式
JPH05108615A (ja) 非優先学習日本語入力システム
JPS62163170A (ja) 機械翻訳システム
JPS62168263A (ja) 仮名漢字相互変換装置
JPH07146858A (ja) 情報処理システム
JPS63136264A (ja) 機械翻訳装置
JPH08235171A (ja) 仮名漢字変換装置
JPH0341551A (ja) 文字入力装置
JPH0240767A (ja) 文章処理装置
JPH0452868A (ja) 機械翻訳装置