JPH039502B2 - - Google Patents

Info

Publication number
JPH039502B2
JPH039502B2 JP56149737A JP14973781A JPH039502B2 JP H039502 B2 JPH039502 B2 JP H039502B2 JP 56149737 A JP56149737 A JP 56149737A JP 14973781 A JP14973781 A JP 14973781A JP H039502 B2 JPH039502 B2 JP H039502B2
Authority
JP
Japan
Prior art keywords
word
output
kana
contents
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56149737A
Other languages
English (en)
Other versions
JPS5851381A (ja
Inventor
Yoshitoshi Yamauchi
Hirokawa Hayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP56149737A priority Critical patent/JPS5851381A/ja
Publication of JPS5851381A publication Critical patent/JPS5851381A/ja
Publication of JPH039502B2 publication Critical patent/JPH039502B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
本発明は邦文ワードプロセツサ等に用いられる
カナ漢字変換処理装置に関し、特に同音異字語が
ある場合に、最近の使用順序を考慮して順位付け
をして出力するようにしたカナ漢字変換処理装置
に関する。 カナ漢字変換処理(以下、単に「変換処理」と
もいう。)装置としては、従来、例えば、特開昭
55−44606号公報に開示されたものが知られてい
た。この装置は、単語辞書内の各単語にカウンタ
を設けて、ユーザーの使用ごとに前記カウンタを
加算していき、同音語がある場合には前記カウン
タ内容の大きい順に出力するようにした装置であ
る。しかしながら、ユーザーが変つた場合はもち
ろん、同じユーザーでも使用傾向(取扱う文書の
内容)に変化があることがあり、前述の装置はこ
のような変化に追随し難いという問題があつた。
すなわち、前述の如き使用傾向の変化があつた場
合に、前述の装置が新しい使用傾向合う−新しい
使用傾向において使用頻度の高い単語が出力され
る−よるになるのは、その単語を数十回あるいは
百回以上も使つた後のことになるという問題があ
つた。 本発明は上記事情に鑑みてなされたもので、そ
の目的とするところは、従来のカナ漢字変換処理
装置の上述の如き問題を解消し、使用傾向が変つ
た場合にはその使用傾向における使用順序を考慮
して同音異字語の出力順位を決定するようにした
カナ漢字変換処理装置を提供することにある。 本発明の上記目的は、日本語文章をカナ文とし
て入力する手段と、該入力手段により入力された
文字列を一時記憶する手段と、単語辞書記憶手段
および該単語辞書記憶手段を検索して前記一時記
憶手段の内容を漢字混じり文に変換する手段を有
するカナ漢字変換処理装置において、前記単語辞
書は同音異字単語の出力順位情報を含むととも
に、前記単語辞書から抽出された単語を記憶する
単語バツフアメモリと、該単語バツフアメモリの
内容を前記出力順位情報に従つて出力する手段
と、該出力手段により出力された同音異字語の中
からオペレータにより選択された単語の前記出力
順位情報と、その直前に選択・出力された単語の
前記出力順位情報とを入替える手段および該入替
えられた出力順位情報を前記単語辞書の所定の場
所に書込む手段を有することを特徴とするカナ漢
字変換処理装置によつて達成される。 以下、本発明の実施例を図面に基づいて詳細に
説明する。 第1図は本発明の一実施例を示すカナ漢字変換
処理装置のブロツク図である。本実施例装置は、
入力文を構成する日本語を自立語、接頭辞、接尾
辞および付属語に分類し、前記入力文を1個の自
立語を中心とする分かち書き単位に分解して仮名
文字で入力し、該入力された文字例を一時記憶手
段に記憶しておき、該記憶内容を、前記自立語、
接頭辞、接尾辞および付属語の各々を記憶してい
る辞書の内容と照合するようにしたカナ漢字変換
処理装置に本発明を適用した例を示すものであ
る。 なお、本実施例の説明において、分かち書き単
位(「文節」ともいう。)とは次のものを言う。 〔接頭辞〕(自立語)〔接尾辞〕〔付属語〕※ こ
こで、自立語は必らず1個存在するものとし、
〔 〕で囲んだものは無くても良く、付属語(※
印)は複数個連なつても良い。 第1図において、11は入力用鍵盤装置であ
り、その文字配置の一例を第2図に示した。左右
の手の守備範囲、個々の指の守備範囲を図のよう
に定める。また、ホームジヨンをC列に置くが、
これらは別の態様を取つても差支えない。 12は入列された文字列を一時記憶するカナレ
ジスタ、13は制御回路、14は出力編集器、1
5は表示装置、そして16はプリンタである。1
7〜23は辞書類を示しており、17は接続行列
表、18Aは一般自立語辞書、18Bは固有名詞
辞書、18Cは数詞辞書、19Aは、一般接頭辞
表、19Bは固有名詞接頭辞表、19Cは前置助
数詞表、20Aは一般接尾辞表、20Bは固有名
詞接尾辞表、20Cは後置助数詞表、21は自立
語分類表、22は付属語表、そして23はひら仮
名・カタ仮名対応表である。これらの辞書類の詳
細については後述する。 24は出力文レジスタ、25,27,29はそ
れぞれ自立語、接頭辞および接尾辞の出力バツフ
アメモリ、また、26,28,30は順位制御器
である。 本実施例装置においては、自立語辞書を一般自
立語辞書18A、固有名詞辞書18Bおよび数詞
辞書18Cの3部に分割し、接頭辞表、接尾辞表
もこれに対応して、一般接頭辞表19A、固有名
詞接頭辞表19Bおよび前置助数詞表19C;一
般接尾辞表20A、固有名詞接尾辞表20Bおよ
び後置助数詞表20Cの3部にそれぞれ分割して
いる。これらの細分された辞書、表は、連動する
切換スイツチS1,S2,S3により、対応する辞書、
表が照合に使用される如く選択可能に構成されて
いる。これらは、文節をカテゴリー分類し、該カ
テゴリー情報とともに入力することにより、分析
の正解率(正変換率)を向上させるためのもので
ある。 以下、辞書、表の具体的内容について例を挙げ
て説明しておく。なお、辞書あるいは表の内容項
目は次の通りである。 Γ読み仮名:入力文字列を照合する部分 Γ表 記:特定の単語に確定した場合出力す
る文字 Γ品詞、活用:各自立語の品詞、活用を通番で
記録してある Γ出力順位:ある時点における同音異字単語の
使用頻度順位、使用ごとに上位と
入替えられる (1) 一般自立語辞書18A 第3図にその内容の一部を示した如く、一般用
語の中で、名詞、サ変名詞(サ変動詞「する」の
付き得る名詞)、動詞、形容詞、形容動詞、連体
詞、副詞、感動詞等に属するものを記憶してい
る。これらのうち、用言は語幹のみであるが、1
段活用動詞は活用部の不変化部までを含み、サ変
動詞「する」とカ変動詞「来る」は活用形の全部
を含んでいる。 (2) 固有名詞辞書18B 第4図にその内容の一部を示した如く、自立語
の中で、人名、地名、法人名等の固有名詞を記憶
している。 (3) 数詞辞書18C 第5図にその内容の一部を示した如く、自立語
の中で、数を表わす名詞を数詞として記憶してい
る。 (4) 一般接頭辞表19A 第6図にその内容の一部を示した如く、一般自
立語の名詞等につく接頭辞を記憶している。 (5) 固有名詞接頭辞表19B 第7図にその内容の一部を示した如く、固有名
詞につく接頭辞を記憶している。 (6) 前置助数詞表19C 第8図にその内容の一部を示した如く、数詞の
前に置かれる助数詞を記憶している。 (7) 一般接尾辞表20A 第9図にその内容の一部を示した如く、一般自
立語の名詞等につく接尾辞を記憶している。 (8) 固有名詞接尾辞表20B 第10図にその内容の一部を示した如く、固有
名詞につく接尾辞を記憶している。 (9) 後置助数詞表20C 第11図にその内容の一部を示した如く、数詞
の後に置かれる助数詞を記憶している。 (10) 自立語分類表(含活用語尾表)21 自立語分類表(第12図にその内容の一部を示
した。)は、自立語中、用言以外のものは品詞レ
ベル(名詞、副詞、連体詞および感動詞)で、用
言は活用語尾レベルで分類したものを記憶してい
る。活用語尾表は第13〜16図に示す如く、用
言の活用語尾を記憶している。なお、第13図は
5段活用動詞、第14図は1段活用動詞、第15
図は形容詞、そして第16図は形容動詞の活用語
尾表である。 (11) 付属語表22 大分類表22Aと小分類表22Bとで構成され
ており、大分類表22Aは第17図にその内容の
一部を示す如く、形式名詞、補助動詞(形式動
詞)、助動詞、助詞および用言性接尾辞(「泊りこ
む」等の連語の後部をいう。)の各語の単位で分
類したもので、小分類表22Bとは番号で対応さ
せてある。小分類表22Bは第18図にその内容
の一部を示した如く、形式名詞の各語、補助動
詞、助動詞の各語の活用形、助詞の各語および前
記用言性接尾辞の各語の活用形の単位で分類した
ものである。 (12) 接続行列表17 自立語と付属語との文法的接続関係を、先行す
る語を行に、後続する語を列に配して表わした表
で、i行j列の要素Cijを次のように定めるもの
である。 (イ) Cij=1の場合 第i行の語が第j列の語に接続可能 (ロ) Cij=0の場合 第i行の語が第j列の語に接続不可能 第19図に内容の一部を示した。なお、第19
図の列番号は4列ごとにまとめて16進数で示して
ある。また、前記付属語の大分類表22Aの通番
は、上記列番号に対応している。 第20図に接続行列表17を用いて、付属語を
選択するステツプをモデル的に示した。詳細は後
述の具体例の説明の項において述べる。また、接
続行列表17には終了可能性の項目を設けてあ
り、これが“1”である場合には、前記分節とし
ての終了可能性があることを示している。 上述の如く構成された本実施例の動作につい
て、以下説明する。 (1) 入力動作 入力は鍵盤装置11によつて行う。 本鍵盤装置は下記の如き特殊機能キーを有す
る。 (イ) スペース・バーはある種のキーの役目を持
たせてあるので、実際のスペースを意味する
入力を行う場合にはスペース・バーを続けて
2回打鍵するものとする。 (ロ) 〇印の特殊キー(○般、○固、○数)は、それ

れ前記入力する文節のカテゴリー(一般文
節、個有名詞文節および数詞文節)を入力す
るためのキーである。スペース・バー(以
下、「○ス」と表わす。)と前記特殊キーとを組
合せて打鍵することにより、文節区切り出力
情報とする。一般文節の直後には、○スを打鍵
してから○般を打鍵し、固有名詞文節の直後に
は、○スを打鍵してから○固を打鍵し、数詞文節
の直後には、○スを打鍵してから○数を打鍵する
ことになる。 (例) 打鍵順序 変換後出力 わたくしは○ス○般 →私は が○つこうへ○ス○般 →学校へ やまもとさまと○ス○固 →山本様と おおたくの○ス○固 →大田区の だいごかいの○ス○数 →第5回の だいさんかんでは○ス○数 →第3巻では (ハ) □印の特殊キー(□平、□片)は、それぞれ入
力する文節をひら仮名、カタ仮名のまま出力
させるためのキーである。スペース・バーと
の組合せで、強制文字出力情報とする。 ひら仮名で出力させる文節の直後には、○ス
を打鍵してから□平を打鍵し、カタ仮名で出力
させる文節の直後には、○スを打鍵してから□片
を打鍵することになる。 (例) 打鍵順序 変換後出力 さびしい○ス□平 →さびしい さびしい○ス□片 →サビシイ すくーる・ばす○ス□片 →スクール・バス (2) 変換処理動作 ここでは、「拝啓、貴社※ ますます……(中略)
……申し上げます。さて、今般、貴社※※ と弊社
との……(中略)……貴社※※※ には…(以下
略)」の如き、いわゆるビジネスレターを作成す
る場合を例に挙げる。 オペレータが鍵盤装置11から、「はいけい」
と1文字ずつ入力すると、この信号はカナレジス
タ12に一時記憶される。これは一般文節である
ので、オペレータは次いで○ス○般を打鍵入力する
と、この信号は制御回路13に送られる。制御回
路13は、切換スイツチS1,S2,S3のa端子(一
般文節に対応する端子)を選択し、前記カナレジ
スタ12の内容を、最長一致法により、一般自立
語辞書18Aの内容と照合・サーチしていく。す
ると、「はいけい」に対して「背景、出力順位1」
と「拝啓、出力順位2」の2つが検索され、自立
語バツフア25に転送される。一方、制御回路1
3は自立語分類表21の名詞の項目から接続行列
表17の行をみて、終了可能性の列が“1”とな
つているのを確認し、カナレジスタの内容全部と
辞書内容とが一致していることから付属語のない
ことを知り、この文節の分析が完了する。 そして、まず、出力順位1の「背景」の文字が
出力編集器14に送られ、同音語がある旨を付し
て表示装置15に表示される。この場合は「背
景」は必要でないので、オペレータが更新キー
(○ス)を押すことにより、出力順位2の「拝啓」
が出力編集器14に送られ表示装置15に「拝
景」の文字が表示される。オペレータがこれを確
認して確定キーを押すと、制御回路13は出力文
レジスタ24に「拝啓」の文字コードを転送する
と同時に、順位制御器26に働きかけて自立語バ
ツフア25の出力順位情報の2と1とを入替え
る。この内容は一般自立語辞書18Aに転送さ
れ、辞書内容を自立語バツフア25の内容に書替
える。 次に、オペレータが「きし○や」と1文字ずつ入
力すると、この信号はカナレジスタ12に一時記
憶される。次いで、オペレータが○ス○般と打鍵入力
すると前記カナレジスタ12の内容と一般自立語
辞書18Aの内容との照合が開始される。 「きし○や」に対しては同音異字語が多数あり、
この時点での各語の出力順位とともに、自立語バ
ツフア25に第21図Aの如き内容が転送され
る。この場合は、まず、出力順位1の「記者」が
同音語のある旨とともに表示される。オペレータ
が更新キーを押すと、出力順位2の「汽車」が表
示される。オペレータが再度更新キーを押すと、
出力順位3の「貴社」が表示されるので、ここで
確定キーを押す。 確定情報により、制御回路13は出力文レジス
タ24に「貴社」の文字コードを転送すると同時
に、順位制御器26に働きかけて自立語バツフア
25の出力順位情報の3と2を入替える。その結
果、自立語バツフア25の内容は第21図Bの如
く変更される。この内容は一般自立語辞書18A
に転送され、辞書内容を自立語バツフア25の内
容に書替える。 以下、同様に入力していき、再度「きし○や」の
文字が入力される場合(前記「貴社※※ と……」
に該当するとき)には、最初「記者」が表示され
るが、オペレータが更新キーを押すと、次に「貴
社」が表示されることになる。オペレータが確定
キーを押すと、前と同様の手順により自立語バツ
フア25の内容は第21図cに示す如く変更さ
れ、この内容で一般自立語辞書18Aの内容も書
替えられる。 再々度「きし○や」の文字が入力される場合(前
記「貴社※※※ には……」に該当するとき)に
は、最初に「貴社」が表示されるようになり、こ
の場合には「貴社」の使用3回目から、更新の必
要がなくなる。 なお、上記実施例の説明では、一般自立語の場
合のみを説明したが、他のカテゴリーあるいは接
頭辞、接尾辞等についても同様である。 ここで、本実施例装置に用いている入力文節の
カテゴリー分類について、その利用例を示してお
く。 まず、「私は大田区のミツシヨン・スクールへ
通つています。」という文章を作成する例を示す。 オペレータが「わたくしは」に続けて○ス○般を打
鍵入力すると、この信号は制御回路13に送られ
る。制御回路13は、切換スイツチS1,S2,S3
a端子を選択し、最長一致法により、一般自立語
辞書18Aの内容をサーチしていく。「わたくし
は」は該当するものがなく、「わたくし」に至つ
て該当する名詞があることを知る。 次に制御回路13は、自立語分類表21の名詞
の項目から接続行列表17の行をみていき、ビツ
トが“1”の列をチエツクする。ビツトが“1”
の列があつたら、該列の付属語大分類表22Aを
介して同小分類表22Bの語をサーチし、「は」
があるか否かをチエツクする。もし、上記列に
「は」がなければ、次の列から再度ビツト“1”
の列を探していく。名詞の行には係助詞「は」の
列で“1”となつているので、「わたくし」と
「は」が接続することがわかる。更に付属語小分
類表22Bの係助詞「は」の項目から接続行列表
17の行をみて、終了可能性が“1”となつてい
るのを確認し、前記カナレジスタ12の内容の最
終文字との一致から、正常に分析が行われたこと
を知る(第20図参照)。 次に、制御回路13は前記自立語辞書18Aの
表記を読み「私」のコードを、続いて付属語表2
2の表記を読み「は」のコードを、出力編集器1
4に送る。出力編集器14はこれをこの場合はそ
のまま、表示装置15に送つて表示させる。オペ
レータはこの表示により、正常に変換処理が行わ
れたことを確認する。 オペレータは、次いで「おおたくの」に続けて
これが固有名詞文節であるので、○ス○固を打鍵入力
すると、この信号は制御回路13に送られる。制
御回路13は切換スイツチS1,S2,S3のb端子
(固有名詞文節に対応する端子)を選択し、最長
一致法により、固有名詞辞書18Bの内容をサー
チしていく。固有名詞辞書18Bには「おおた」
があり、固有名詞(名詞扱い)であることがわか
る。 次に制御回路13は、自立語分類表21の名詞
の項目から接続行列表17の行をみていき、ビツ
トが“1”の列をチエツクする。ところが、付属
語表22には、「く」または「くの」の文字列は
無いので、接続行列表17の名詞の行の最後まで
いつても、接続可能とならない。そこで、制御回
路13は、自立語として「おおた」はそのまま維
持し、後続の「くの」の文字列で、接尾辞表との
マツチングを行う。 前述の如く、切換スイツチS2のb端子が選択さ
れているので、固有名詞接尾辞表20Bをサーチ
することになり「く」が取出される。次いで、固
有名詞接尾辞を自立語の名詞扱いとして、自立語
分類表から接続行列表17をチエツクしていく。
格助詞の「の」は名詞と接続可となつているの
で、付属語表22から接続行列表17をみると終
了可能となつていることから、正常に分析された
ことを知る。 次に制御回路13は固有名詞辞書18Bの表記
を読み、これを出力編集器14へ送る。ここでは
「おおた」の読み仮名に対し表記が「大田」と
「太田」の2つあるので、まず出力順位1の「大
田」を出力編集器14に送る。続いて接尾辞の表
を読み、「区」のコードを出力編集器14に送り、
最後に付属語の「の」のコードを送る。 出力編集器14は同音語がある旨を付して表示
装置15にこれを表示する。この場合は「大田区
の」が正しいので、次の入力文字の打鍵に移つて
良いが、もし「太田区の」が必要な場合には、こ
の時点で更新キーを押せば、前述の如く入替えが
行われる。 オペレータは、次いで「み○つし○よん・すくー
る」と1文字ずつ入力すると、この信号はカナレ
ジスタ12に一時蓄積される。この文節はカタ仮
名文字に変換したいので、次に○ス□片と入力すると
この信号は制御回路13に送られる。制御回路1
3はカナレジスタ12の内容を1文字ずつ取出し
て、ひら仮名・カタ仮名対応表23を参照して、
ひら仮名をカタ仮名に変換していく。ひら仮名・
カタ仮名対応表に無い文字または記号(この場合
は中間の点「・」がこれに該当する。)は無交換
のままその位置に置く。全文字の変換が終了した
ら、□片コードとともに出力編集器14に送る。出
力編集器14は制御回路13から送られたコード
のうち、□片コードははずし、その他の文字列はそ
のままで表示装置15に送り表示させる。「ミ○ツ
シ○ヨン・スクール」が表示され、オペレータはそ
れを確認し次の入力に移る。 次の文字は格助詞の「へ」であるが、自立語を
含まない文字列(この場合1文字だが)は変換で
きないので□平を使う。すなわち、オペレータが
「へ」を入力すると、この信号はカナレジスタ1
2に一時蓄積される。次に○ス□平を打鍵するとこの
信号は制御回路13に送られる。制御回路13で
は、カナレジスタの内容を□平コードとともにその
まま出力編集器14へ送り、出力編集器14では
□平コードをはずしその他の文字列はそのまま表示
装置15に送り表示させる。「へ」が表示され、
オペレータはそれを確認し次の入力に移る。 オペレータは次いで「かよ○つています」と1文
字ずつ入力するとこの信号はカナレジスタ12に
一時蓄積される。これは一般文節なので、次に○ス
○般と入力すると、この信号は制御回路13に送ら
れる。制御回路13はまず、切換スイツチS1
S2,S3のa端子を選択し、カナレジスタ12の内
容を、最長一致法により一般自立語辞書18Aの
内容と照合・サーチしていくと「かよ」で一致す
るのでそれを取出す。これはア・ワ行5段活用動
詞ということで、次の文字列「○つています」と5
段活用表のア・ワ行の文字とを照合すると、○つと
一致するので促音便形であることを知る。 次に制御回路13は自立語分類表21の動詞5
段活用促音便形の項目から、接続行列表17の行
をみていき、ビツトが“1”の列をチエツクして
いく。結局「ています」の文字列のうち「て」が
接続助詞であることがわかる。制御回路13は、
付属語表22の接続助詞「て」の項目から接続行
列表17の行をみていき、補助動詞「いる」に到
達したとき、付属語表22でその未然形「い」を
取出し、接続行列表17の行をみていく。この場
合「いる」は1段活用であるので、1段活用動詞
の未然形と同じ行をみる。しかし、この行では後
続の「ます」とは続かないことがわかる。 そこで再度付属語表22にもどり、未然形の次
の連用形の「い」を取出して接続行列表17の行
をみていく。この場合も1段活用動詞の連用形と
同じ行をみる。これは丁寧助動詞「ます」の列で
接続可となり、付属語小分類表の丁寧助動詞「ま
す」の終止形を取出し、この項目から接続行列表
17の行をみていき、終了可能性の欄が“1”と
なつていることを確認し、正常に分析が行われた
ことを知る。 以後の動作は前述の「私は」の文節の処理と同
様で出力編集器14に送られた後、表示装置で
「通○つています」が表示される。 なお、この例では補助動詞「い」の部分をひら
仮名として出力するため1文節として入力した
が、「い」の部分を漢字変換したい場合には、次
の如く2文節として入力すれば良い。 かよ○つて○ス○般います○ス○般 この入力による変換結果は一般自立語辞書18
A中に、読み仮名が「い」、表記が「居」、品詞、
活用が「動詞、1段」の語が収容されているため
「通つて」「居ます」となる。 次に、更に他の分析例として、「第五回中馬込
大運動会」という文章を作成する場合を示す。 オペレータは「だいごかい」○ス○数と入力する。
この信号により制御回路13は切換スイツチS1
S2,S3のc端子を選択し分析を開始する。前記
「だいごかい」の文字列で最長一致法により自立
語辞書(数詞辞書18c)をサーチしても一致す
るものがない。 制御回路13は、自立語が見つからない場合
は、次に接頭辞表(c端子が選択されているので
この場合前置助数詞表19C)をサーチする手順
としてあるので、前置助数詞表19Cから「だ
い」を取出す。次に、後続文字列「ごかい」から
最長一致法により自立語を取出すと、「ご」が数
詞辞書18Cの中にあることがわかる。これは自
立語分類表では名詞扱いとして接続行列表17の
行をみていく。 後続の文字列「かい」の分析では、名詞と副助
詞「か」との接続は可能となつているが、副助詞
「か」と後続の「い」との接続可能性が無いこと
がわかる。そこで接尾辞表(後置助数詞表20
C)との照合を行うと、「かい」を取出すことが
できる。これは自立語分類表では名詞扱いとなつ
ているので、その項目から接続行列表17をみる
と終了可能性が“1”となつているので、正常な
分析が行われたことがわかる。 そこで、制御回路13は、前置助数詞表19C
から「第」を、数詞辞書18Cから「五」を、ま
た後置助数詞表20Cから「回」と「階」を出力
順位とともに出力編集器14に送る。出力編集器
14は「第五回」の文字列を表示装置15に送る
と同時に、同音語があるという信号を送る。この
場合は「第五回」で正しいから、次の入力に移
る。 オペレータは「なかまごめ」○ス○固と入力する
と、制御回路13は切換スイツチS1,S2,S3のb
端子を選択する。そして、最初に最長一致法によ
り固有名詞辞書18Bを引いても一致するものが
ないので、接頭辞処理に移り、固有名詞辞表19
Bから「なか」を取出す。次に、再度最長一致法
により固有名詞辞書18Bを引いて「まごめ」を
取出す。これにより、出力「中馬込」を得る。 次にオペレータは「だいうんどうかい」○ス○般と
入力する。制御回路13は、切換スイツチS1
S2,S3のa端子を選択し、分析を開始する。 最初の最長一致法による自立語の抽出は不成功
となり、接頭辞処理で「だい」を、再度の最長一
致法による自立語の抽出で「うんどう」を取出
す。更に、付属語との接続関係の分析では「か
い」が接続しないことがわかり、接尾辞処理で
「かい」を取出す。制御回路13はこれらの語
(または辞)の表記を出力編集器14に送るが、
接尾辞の「かい」の読みに対し「界」と「会」が
あるので、出力順位情報とともに両者を送る。 出力編集器14は「大運動界」の文字列を表示
装置15に送るとともに同音語のある旨を表示す
る。オペレータが○スを打鍵入力することにより、
「界」が「会」に変化する。これで、必要な「第
五回中馬込大運動会」の文章を入力し得たことに
なる。 上記実施例においては、入力文節を該文節中の
自立語に注目して、これを一般文節、固有名詞文
節および数詞文節の3つのカテゴリーに分類し、
このカテゴリー情報を変換処理に先立つて与える
ようにしたが、この分類はオペレータが行うので
分類ミスあるいは打鍵ミスもあり得る。そこで、
あるカテゴリーを指示した場合に、そのカテゴリ
ーにおいて分析が不成功に終つたときには、自動
的に他のカテゴリーをもみるようにしておくと良
い。その場合のカテゴリーの指示順序としては下
記のようにすると良い。 ○数→○般→○固 ○固→○般→○数 ○般→○固→○数 また、カテゴリー分類に、「専門用語」を加え
ることも、分析の成功率を高めるのに効果があ
る。この場合にも、ミス対策として次のような順
序で他のカテゴリーをもみるようにすると良い。 ○専→○般→○固→○数 ○数→○般→○専→○固 ○固→○般→○専→○数 ○般→○専→○固→○数 なお、カテゴリー分類の内容は上に挙げたもの
に限るものではないことは言うまでもない。 以上述べた如く、本発明によれば、日本語文章
をカナ文として入力する手段と、該入力手段によ
り入力された文字列を一時記憶する手段と、単語
辞書記憶手段および該単語辞書記憶手段を検索し
て前記一時記憶手段の内容を漢字混じり文に変換
する手段を有するカナ漢字変換処理装置におい
て、前記単語辞書は同音異字単語の出力順位情報
を含むとともに、前記単語辞書から抽出された単
語を記憶する単語バツフアメモリと、該単語バツ
フアメモリの内容を前記出力順位情報に従つて出
力する手段と、該出力手段により出力された同音
異字語の中からオペレータにより選択された単語
の前記出力順位情報と、その直前に選択・出力さ
れた単語の前記出力順位情報とを入替える手段お
よび該入替えられた出力順位情報を前記単語辞書
の所定の場所に書込む手段を有する如く構成した
ので、使用傾向が変化した場合にも、その使用傾
向における使用順序を考慮して同音異字語の出力
順位を決定することが可能になり、これにより、
使用頻度を基に学習する場合の如く学習速度が遅
くはなく、また、最新の使用単語を基に学習する
場合の如く過敏でない、適度な学習速度を有する
カナ漢字変換処理装置を実現できるという顕著な
効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すカナ漢字変換
処理装置のブロツク図、第2図は鍵盤装置の文字
配置の一例を示す図、第3図〜第20図は辞書類
の内容を示す図、第21図A〜Cは自立語バツフ
アの内容の変化を示す図である。 11:鍵盤装置、12:カナレジスタ、13:
制御回路、14:出力編集器、15:表示装置、
16:プリンタ、17:接続行列表、18A:一
般自立語辞書、18B:固有名詞辞書、18C:
数詞辞書、19A:一般接頭辞表、19B:固有
名詞接頭辞表、19C:前置助数詞表、20A:
一般接尾辞表、20B:固有名詞接尾辞表、27
C:後置助数詞表、21:自立語分類表、22:
付属語表、22A:付属語大分類表、22B:付
属語小分類表、23:ひら仮名・カタ仮名対応
表。

Claims (1)

    【特許請求の範囲】
  1. 1 日本語文章をカナ文として入力する手段と、
    該入力手段により入力された文字列を一時記憶す
    る手段と、単語辞書記憶手段および該単語辞書記
    憶手段を検索して前記一時記憶手段の内容を漢字
    混じり文に変換する手段を有するカナ漢字変換処
    理装置において、前記単語辞書は同音異字単語の
    出力順位情報を含むとともに、前記単語辞書から
    抽出された単語を記憶する単語バツフアメモリ
    と、該単語バツフアメモリの内容を前記出力順位
    情報に従つて出力する手段と、該出力手段により
    出力された同音異字語の中からオペレータにより
    選択された単語の前記出力順位情報と、その直前
    に選択・出力された単語の前記出力順位情報とを
    入替える手段および該入替えられたた出力順位情
    報を前記単語辞書の所定の場所に書込む手段を有
    することを特徴とするカナ漢字変換処理装置。
JP56149737A 1981-09-22 1981-09-22 カナ漢字変換処理装置 Granted JPS5851381A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56149737A JPS5851381A (ja) 1981-09-22 1981-09-22 カナ漢字変換処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56149737A JPS5851381A (ja) 1981-09-22 1981-09-22 カナ漢字変換処理装置

Publications (2)

Publication Number Publication Date
JPS5851381A JPS5851381A (ja) 1983-03-26
JPH039502B2 true JPH039502B2 (ja) 1991-02-08

Family

ID=15481699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56149737A Granted JPS5851381A (ja) 1981-09-22 1981-09-22 カナ漢字変換処理装置

Country Status (1)

Country Link
JP (1) JPS5851381A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59208635A (ja) * 1983-05-13 1984-11-27 Ricoh Co Ltd 文書作成装置
JPS6057424A (ja) * 1983-09-08 1985-04-03 Ricoh Co Ltd カナ漢字変換処理装置
JPH0664572B2 (ja) * 1984-01-11 1994-08-22 株式会社東芝 辞書作成装置
JPH09114816A (ja) * 1995-10-20 1997-05-02 Nec Software Kansai Ltd 固有名詞自動ルビ振り機能付き日本語ワードプロセッサ

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS537132A (en) * 1976-07-09 1978-01-23 Toshiba Corp Chinese character input unit
JPS55140930A (en) * 1979-04-19 1980-11-04 Yokogawa Hokushin Electric Corp Method and device for chinese character display
JPS55153033A (en) * 1979-05-08 1980-11-28 Fujitsu Ltd Input device for writing in mixed japanese letter and chinese character providing sequential display of homonym

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS537132A (en) * 1976-07-09 1978-01-23 Toshiba Corp Chinese character input unit
JPS55140930A (en) * 1979-04-19 1980-11-04 Yokogawa Hokushin Electric Corp Method and device for chinese character display
JPS55153033A (en) * 1979-05-08 1980-11-28 Fujitsu Ltd Input device for writing in mixed japanese letter and chinese character providing sequential display of homonym

Also Published As

Publication number Publication date
JPS5851381A (ja) 1983-03-26

Similar Documents

Publication Publication Date Title
US5576953A (en) Electronic translating device
US20030023426A1 (en) Japanese language entry mechanism for small keypads
JPH0122948B2 (ja)
JPH039502B2 (ja)
KR960038586A (ko) 컴플렉스 언어 전사용 데이타 처리시스템 및 문자생성 데이타 처리방법
JPH0578058B2 (ja)
JPS5899828A (ja) カナ漢字変換処理装置
JPS59103136A (ja) カナ漢字変換処理装置
JPS59186030A (ja) カナ漢字変換処理装置
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPS6154561A (ja) 日本語処理装置
JPS6282457A (ja) 日本語ワ−ドプロセツサ−の外来語入力方法及びその装置
JPS58101326A (ja) カナ漢字変換処理装置
JPS6057425A (ja) カナ漢字変換処理装置
JPS6246029B2 (ja)
JPS5832418B2 (ja) 漢字まじり文入力装置
JPS5971529A (ja) カナ漢字変換処理装置
JPH077420B2 (ja) 電子辞書
JPS5851380A (ja) カナ漢字変換処理方式
JPS58101325A (ja) カナ漢字変換処理装置
JP2802369B2 (ja) かな漢字変換装置
JPS6246030B2 (ja)
JPH0352102B2 (ja)
JPS59186031A (ja) カナ漢字変換処理装置
JPS55129862A (en) Electronic dictionary