JPS61234461A - 文字列訂正方式 - Google Patents

文字列訂正方式

Info

Publication number
JPS61234461A
JPS61234461A JP60075754A JP7575485A JPS61234461A JP S61234461 A JPS61234461 A JP S61234461A JP 60075754 A JP60075754 A JP 60075754A JP 7575485 A JP7575485 A JP 7575485A JP S61234461 A JPS61234461 A JP S61234461A
Authority
JP
Japan
Prior art keywords
character string
kanji
candidate
character
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60075754A
Other languages
English (en)
Inventor
Yutaka Ooyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60075754A priority Critical patent/JPS61234461A/ja
Publication of JPS61234461A publication Critical patent/JPS61234461A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は日本語入力方式に関するものであり、さらに詳
細には入力された漢字かな文字列をもとに正しい漢字か
な文字列を得るための文字列訂正方式に関するものであ
る。
(従来技術とその問題点) 近年のワードプロセッサをはじめとした日本語入力機器
の普及につれ、日本語入力の経験の少ない未熟練者や、
漢字の用法にあまり熟知していない一般利用者が、これ
らの機器を使用する機会が多くなってきた。
日本語入力手段の中で、盤面上の漢字をタッチペンで拾
いながら漢字かな文字列を入力するベンタッチ入力法を
はじめ、各漢字に対応したコードを入力するフード入力
法、実際に手で漢字を書くことで入力するオンライン手
書き文字8M法などは、利用者が所望の漢字を直接入力
できる有効なものであるが、入力単位が文字であること
から、入力した漢字文字列が日本語として正しいもので
あることは利用者自身が保証しなければならない。
このため、例えば「指摘する」という文字列を利用者が
誤って「指摘する」と入力してしまっても、この書き方
が誤りであることを知ることはできなかった。
(発明の・目的) 本発明の目的は、利用者が入力したい漢字かな文字列の
綴りゃ用法を誤った場合に、これに変えて確からしい漢
字かな文字列候補を出力するための文字列訂正方式を提
供することにある。
(発明の構成) 本発明によれば、入力された漢字かな文字列内のかな文
字および、各々の漢字をもとに漢字辞書を検索すること
で得られる別漢字候補を組み合わせて、1個または複数
個の候補文字列を作成するための候補文字列作成手段と
、該候補文字列を形態素解析して日本語として不正なも
のを排除するための形態素解析手段と、該形態素解析手
段の出力する前記候補文字列の中から必要とする文字列
を決定して出力する文字列出力手段を伽えたことを特徴
とする文字列訂正方式を得ることができる。
(実施例) 以下に本発明の実施例について、図面を参照しながら詳
細に′説明する。
第1図は本発明の一実施例である。1は全体の制御を管
理する、制御部であり、2は漢字かな文字列を入力する
ための入力手段であり、3は各漢字に対して、似た形状
を有する1個または複数個の漢字が別漢字候補として収
められている漢字辞書であり、4は漢字辞書3を検索す
ることで得られる各別漢字候補と入力文字列中のかな文
字を組み合わせて、1個または複数個の漢字かな混じり
候補文字列を作成するための候補文字列作成手段であり
、5は少なくとも単語の表記と品詞情報が収められた単
語辞書であり、6は単語辞書5の検索と文法検定を繰り
返しながら候補文字列を形態素解析する形態素解析手段
であり、7は形態素解析の結果得られた日本語として正
しい候補文字列中から所望の文字列を決定して出力する
文字列出力手段である。なお、第1図の実施例に用いて
、入力された漢字かな文字列から正しい漢字かな文字列
を得るまでの流れの概略を第2図に示す。
ここで、前述の「指滴する」を訂正する手順を例にとっ
て説明する。但し、説明の便宜のため、形態素解析段6
は文節分かち書きされた漢字かな文字列を入力するよう
に構成されているものとすけしめに、漢字かな文字列「
指滴する」は、例えば文字単位による直接入力や既に入
力された漢字かな文字列からの文節抽出などにより、入
力手段2から入力される(第2囚の101)。
文字単位の入力は、前述のベンタッチ入力などのほか、
漢字の読みを与えた上で表示された漢字群の中から選択
する表示選択や、既に入力されているテキストデータの
利用、外部からの文字列入力などによって行うことがで
きる。また文節の抽出は、例えば、情報処理学会計算言
語学研究会資料15−2″′日本語の文節の認定”(1
978)に記述されている手法などによる自動処理や、
利用者の範四指定指示などで行うことができる。また、
抽出された文節列が日本語として正しいか否かを、予め
辞書引き0文法検定などでチェックし、文節とならない
もののみを処理対象とすることも可能である。
入力手段2から入力された文字列「指滴する」は、制御
部lの制御により候補文字列作成手段4に送られる。候
補文字列作成手段4は、得られた文字列「指滴する」を
構成する漢字E指」と「f」をもとに漢字辞s3を検索
して各漢字に形状が似た別漢字候補を抽出しく102)
、これらと残りのかな文字「すjと「る」を組み合わせ
て(103)、可能な候補文字列を作成する。第3図は
、漢字辞書の実現例であり、漢字「指」の候補として「
脂」「鮨」が、また「滴」の候補として「嫡」 「摘」
「鏡」「敵」 「適」が収められていることを示す。
漢字辞83として第3図の辞書を使用したいとすると為
候補文字列作成手段4は、これらの文字から、候補文字
列「指摘する」、「指摘する」 「指滴する」 「脂摘
する」のように、(指およびその候補3種類)×(滴お
よびその候補6種類)の合計18種類の候モ11文字列
を作成する。なお、第3図は各々の漢字ごとに形状の似
た漢字を対応させて漢字辞書を実現しているが、例えば
第4図のように形状の特徴ごとに漢字をグループ化した
辞書を使用するなど、漢字辞書3の実現形態は多様であ
る。
形態素解析手段6は、制御部1の制御により単語辞書5
の検索と文法検定を繰り返しながら候補文字列の正当性
を調べ、日本語として不適当な文字列を排除する(10
4)o形態素解析の方法については、同様の処理がカナ
漢字変換入力方式を用いた日本語ワードプロセッサにお
いて実現されているので省略する。ここで、前述の18
11類の候補文字列に関連する単語として、単語辞書5
内にす変名詞の「指摘」のみが登録されているものとす
ると、結果として「指摘する」のみが正しい漢字かな文
字列として得られ、文字列出力手段7へ渡される。
文字列出力手段7は、得られた漢字かな文字列の中から
、例えばすべて表示した上で利用者に選択させるなどの
方法で決定し、これを出力する。
(ios)本説明内の例では、得られた文字列[指摘す
る」が一つだけであることから、利用者の選択を受けず
に「指摘する」を得ることができる。
これら一連の手順により、「指摘する」を1指摘する」
に訂正することができる。
(発明の効果) 本発明を用い・ることにより、利用者が漢字かな文字列
の綴りゃ用法の誤りを犯した際にも、自動的に正しい文
字列候補を抽出、提示することにより、利用者の文字入
力、誤字訂正の作業を軽減することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を説明するためのブロック図
であり、第2図は入力された漢字かな文字列から正しい
文字列を得るまでの流れの概略を示した流れ図であり、
第3図および第4図は漢字辞書の一部分を示した概念図
である。 図において、l・・・制御部、2・・・入力手段、3、
・・漢字辞誓、4・・・候補文字列作成手段15・・・
単a辞猫、6・・・形態素解析手段、7・・・文字列出
力手段◇ 第 7 口

Claims (1)

  1. 【特許請求の範囲】 1、入力された漢字かな文字列内のかな文字および、各
    々の漢字をもとに漢字辞書を検索することで得られる別
    漢字候補を組み合わせて、1個または複数個の候補文字
    列を作成するための候補文字列作成手段と、該候補文字
    列を形態素解析して日本語として不正なものを排除する
    ための形態素解析手段と、該形態素解析手段の出力する
    前記候補文字列の中から必要とする文字列を決定して出
    力する文字列出力手段を備えたことを特徴とする文字列
    訂正方式。 2、前記漢字辞書内に収められた別漢字候補は、各漢字
    に対して、似た形状を有する1個または複数個の漢字で
    あることを特徴とした特許請求の範囲第1項記載の文字
    列訂正方式。
JP60075754A 1985-04-10 1985-04-10 文字列訂正方式 Pending JPS61234461A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60075754A JPS61234461A (ja) 1985-04-10 1985-04-10 文字列訂正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60075754A JPS61234461A (ja) 1985-04-10 1985-04-10 文字列訂正方式

Publications (1)

Publication Number Publication Date
JPS61234461A true JPS61234461A (ja) 1986-10-18

Family

ID=13585349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60075754A Pending JPS61234461A (ja) 1985-04-10 1985-04-10 文字列訂正方式

Country Status (1)

Country Link
JP (1) JPS61234461A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0836144A2 (en) * 1996-06-25 1998-04-15 Microsoft Corporation Method and system for identifying and resolving commonly confused words in a natural language parser
WO2001029696A1 (en) * 1999-10-19 2001-04-26 Microsoft Corporation Method and apparatus for identifying erroneous characters in text

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0836144A2 (en) * 1996-06-25 1998-04-15 Microsoft Corporation Method and system for identifying and resolving commonly confused words in a natural language parser
US6360197B1 (en) 1996-06-25 2002-03-19 Microsoft Corporation Method and apparatus for identifying erroneous characters in text
EP0836144A3 (en) * 1996-06-25 2004-11-10 Microsoft Corporation Method and system for identifying and resolving commonly confused words in a natural language parser
WO2001029696A1 (en) * 1999-10-19 2001-04-26 Microsoft Corporation Method and apparatus for identifying erroneous characters in text

Similar Documents

Publication Publication Date Title
US20020052900A1 (en) Computer assisted text input system
JPH02289100A (ja) 漢字符号化及び復号化装置
KR19990078364A (ko) 문서처리장치 및 그의 방법
KR20010088892A (ko) 한자입력장치 및 방법
JPS61234461A (ja) 文字列訂正方式
JPS62290967A (ja) 表記のゆれ統一方式
JPH0682366B2 (ja) 文字列訂正方式
JP4247849B2 (ja) 氏名入力装置
JPS61234459A (ja) 単語訂正方式
JPS62209667A (ja) 文章作成装置
JP2006338124A (ja) 漢字検索方法,そのシステム,そのサーバ
JP3710157B2 (ja) 漢字語句処理方法及び装置
JPH07191986A (ja) 文章入力装置
JPS60164864A (ja) デ−タ処理装置
KR880000990B1 (ko) 한글의 모아쓰기 자동처리방법
JPH01259448A (ja) 漢字入力方式
JPS61234462A (ja) 文字列訂正方式
JPH0582621B2 (ja)
JPH0512257A (ja) 文書作成装置
JP2002351868A (ja) 電子辞書
JPH0612453A (ja) 未知語抽出登録装置
JP5338482B2 (ja) 漢文例文検索装置およびプログラム
JPH028956A (ja) 文書処理装置
JPS6175954A (ja) 漢字デ−タ入力方式
JPH09106400A (ja) ワードプロセッサ