JP2866437B2 - 用例辞書登録方法及び装置 - Google Patents

用例辞書登録方法及び装置

Info

Publication number
JP2866437B2
JP2866437B2 JP2100678A JP10067890A JP2866437B2 JP 2866437 B2 JP2866437 B2 JP 2866437B2 JP 2100678 A JP2100678 A JP 2100678A JP 10067890 A JP10067890 A JP 10067890A JP 2866437 B2 JP2866437 B2 JP 2866437B2
Authority
JP
Japan
Prior art keywords
word
dictionary
registered
input
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2100678A
Other languages
English (en)
Other versions
JPH03296856A (ja
Inventor
佳三 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP2100678A priority Critical patent/JP2866437B2/ja
Publication of JPH03296856A publication Critical patent/JPH03296856A/ja
Application granted granted Critical
Publication of JP2866437B2 publication Critical patent/JP2866437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、入力されたかな文字列を漢字かな交じり
文に変換するかな漢字変換機能を備えた文書処理装置に
用いられる用例辞書登録方法及び装置に関する。
(ロ)従来の技術 従来、この種の文書処理装置においては、かな漢字変
換用の辞書として、読み出し専用の自立語辞書と書き込
み可能なユーザー辞書とが設けられており、自立語辞書
の単語には、変換効率をあげる為、登録単語の共起関係
を考慮して複合用例辞書が用いられている。すなわち、
複合用例辞書に、例えば「泣く」、「鳴く」という同音
異義語が登録してある場合であれば、各々の名詞に対し
てその内のどちらの動詞を用いるのかという単語の共起
関係を前もって以下のように登録しておき、かな漢字変
換時にその共起関係を参照するようにしている。
(子供、彼女、生徒、先生)……泣く (犬、鳥、家畜)……鳴く (ハ)発明が解決しようとする課題 しかしながら、上記のような共起関係は、辞書容量の
関係で全てが登録されているわけではなく、辞書容量と
登録単語の使用頻度が考慮されて登録されており、ユー
ザーにとって全てが満足できるわけではない。
また、後でユーザーが「柴犬」という単語をユーザー
辞書に登録した場合、(柴犬)…(鳴く)という共起関
係が辞書に登録されていないので、「しばいぬがなく」
と入力して変換した場合、「柴犬が泣く」という変換結
果がでる可能性がある。
さらに、このようにユーザー辞書に新規に単語を登録
することによって、分かち位置が変わってしまう場合が
ある。例えば今まで「こうくうじこ」という文字列は
「航空事故」と変換していたが、「うじこ」=「氏子」
を新たにユーザー辞書に登録することによって「こうく
うじこ」が「校区氏子」と変換される可能性が生ずる。
このように、変換頻度の高い単語の共起関係が登録さ
れていなかったり、ユーザー辞書に新しく単語を登録し
た場合、その単語についての共起関係が登録されていな
いために、かな漢字変換の変換効率が低下する場合があ
る。
この発明はこのような事情を考慮してなされたもの
で、自立語辞書やユーザー辞書に記憶され単語について
の共起関係を任意に登録できるようにして、かな漢字変
換の変換効率を向上させた用例辞書登録方法及び装置を
提供するものである。
(ニ)課題を解決するための手段 第1図はこの発明の構成を示すブロック図である。
図に示すように、この発明は、多数の単語をその読み
情報と共に記憶した変換辞書部101と、単語と単語の有
効な組合わせ形態を助詞を含めた形で登録する登録手段
102と、登録手段102によって登録される単語と単語との
有効な組合わせを記憶する用例テーブル103と、かな文
字列を入力する入力手段104と、入力されたかな文字列
を記憶する記憶手段105と、記憶手段105に記憶されたか
な文字列を文節単位に分割し変換辞書部101に基づいて
漢字を含む単語に変換する変換手段106と、変換手段106
にて変換された単語どうしが助詞を含めた形で有効な組
合わせとなるよう用例テーブル103を参照して複数文節
の一括変換を行う一括変換手段107と、記憶手段105に記
憶された文章を表示する表示手段108を備えてなる文書
処理装置である。
この発明における入力手段104、記憶手段105、変換手
段106、一括変換手段107及び表示手段108としては、当
該分野で公知のものが使用できる。たとえば入力手段10
4としては、かな文字列を入力できるものであればよ
く、キーボード装置、タブレット装置、OCR装置などが
用いられる。
記憶手段105は、大容量のRAM、フロッピーディスクや
ハードディスクなどの磁気記憶媒体とその駆動装置など
で構成すればよい。
変換手段106及び一括変換手段107は、主要な構成要素
としてマイクロプロセッサ、プログラムメモリ等を有し
ている。
表示手段108はCRT、LCDなどの表示装置で構成すれば
よい。
この発明における変換辞書部101は、単語の読み情
報、表記、品詞等に関する情報、また、用例テーブル10
3は、単語の共起関係の情報を、それぞれ多数記憶でき
るものであればよく、大容量のROM、フロッピーディス
クやハードディスクなどの磁気記憶媒体とその駆動装置
などで構成される。
登録手段102は、共起関係のテーブル(用例テーブ
ル)やユーザー辞書に用例を登録する際に、単語やその
付属する情報(読み、表記、品詞など)を指定して登録
できるものであればよく、キーボードにおけるファンク
ションキーやマウスなどのポインティングデバイスと、
それからの信号を受けて起動するプログラムを有するマ
イクロプロセッサとで構成すればよい。
(ホ)作用 本願の第1の発明によれば、先行単語と後続単語と助
詞の入力を要求し、入力された先行単語/後続単語/助
詞を各項目毎に用例辞書に登録する際、助詞に対する入
力がない場合は、先行単語と後続単語を複合語として用
例辞書に登録するので、先行単語と後続単語と助詞の全
ての登録を要求する入力画面のみを用意しておけばよ
く、記憶すべき入力画面情報を少なくすることができ
る。また、助詞の入力がない場合には、共起関係にある
2つの単語を複合語として登録するので、単語の入力後
であっても助詞登録の必要性について検討できる。
また、本願の第2の発明によれば、先行単語と後続単
語の入力を要求し、入力された先行単語と後続単語を仮
名漢字変換辞書の単語番号によって用例辞書に登録する
ので、用例辞書の容量を圧縮することができる。
(ヘ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述す
る。なお、これによってこの発明が限定されるものでは
ない。
第1図はこの発明を日本語ワードプロセッサに適用し
た一実施例の構成を示すブロック図である。
この図において、1はかなキーやファンクションキー
等を備えたキーボードであり、かな文字列を制御部2に
入力する。
制御部2は、マイクロコンピュータから構成され、RO
Mからなるプログラムメモリ3に書き込まれている制御
プログラムに従い、各種のデータ処理を行う。
4は多数の単語をその読み情報と共に記憶したかな漢
字変換辞書である。かな漢字変換辞書4は、ROMからな
る自立語辞書5とフロッピーディスク装置からなるユー
ザー辞書6から構成されている。自立語辞書5はメーカ
ーによって選択された一般的な単語(自立語)が記憶さ
れた読み出し専用の辞書であり、ユーザー辞書6はユー
ザーによって新たに単語が登録される辞書である。7は
フロッピーディスク装置からなる用例テーブルであり、
用例テーブル7には、自立語辞書5やユーザー辞書6に
登録されている単語と単語についての有効な組合わせ、
つまり単語の共起関係が用例として登録される。
9はRAMからなるバッファメモリであり、文字バッフ
ァ10、学習バッファ11、同音語バッファ12から構成され
ている。文字バッファ10はキーボード1から入力された
文字を蓄えておくバッファ、学習バッファ11は単語の学
習処理を行うバッファ、同音語バッファ12はかな漢字変
換時に同音語の候補を蓄えておくバッファである。
13はCRTディスプレイ装置からなる表示装置である。
第3図〜第5図は単語の共起関係の登録例を示す説明
図である。以下、登録例〜として説明する。
登録例(第3図参照) 仮名文字列「こうくうじこ」を(航空)+(事故)と
して登録する場合は、文字列「こうくうじこ」を入力
し、 登録語1で先行文節「航空」 助詞 無し 登録語2で後続文節「事故」を入力する。
登録例(第4図参照) 仮名文字列「けっこんしきをあげる」を(結婚式)+
(を)+(挙げる)として登録する場合は、文字列「け
っこんしきをあげる」を入力し、 登録語1で先行文節「結婚式」 助詞 「を」 登録語2で後続文節「挙げる」を入力する。
登録例(第5図参照) 仮名文字列「しばいぬがなく」を(柴犬)+(が)+
(鳴く)として登録する場合は、文字列「しばいぬがな
く」を入力し、 登録語1で先行文節「柴犬」 助詞 [が」 登録語2で後続文節「鳴く」を入力する。
第6図は用例テーブル7に登録された単語の共起関係
の一例を示す説明図である。このような用例テーブル7
への制御部2の登録手順を、前述の第3図〜第5図に示
した各登録例について説明する。
登録例の場合には、「航空」と「事故」とのどちら
も自立語辞書5に登録してある単語であれば、その単語
の実行番号(辞書の登録番号)は容易に決定できるの
で、用例テーブル7に記憶された、第6図のような共起
関係のテーブルにデータを実行番号で登録する。
登録例の場合には、「結婚式を」を「結婚(自立
語)」+「式(接尾語)」+「を(付属語)」に分解
し、「挙げる」とともに該当領域に上記と同様に登録す
る。
登録例の場合には、自立語辞書5に「柴犬」という
単語が登録されておらずユーザー辞書6に登録されてい
る場合、上記のように「柴犬」という単語の実行番号を
特定できない。
したがって、ユーザー辞書6に登録されている単語の
共起関係を用例として登録する場合は、第7図に示すよ
うに、現在使用中の自立語辞書5の登録単語総数(辞書
実行番号)とは違う(例、自立語単語総数+1)実行番
号をユーザー辞書6のスタート実行番号に設定し、ユー
ザー辞書6の何番目に登録してあるのかを算出し、両者
を加算した値を実行番号とする。
この場合、ユーザー辞書6はフロッピーディスクのよ
うな外部記憶装置に格納されることが多いので、第6図
に示した用例テーブル7においてユーザー辞書6に登録
してある単語を指定している場合は、ユーザー辞書6の
方にも共起関係を登録する。ユーザー辞書6に登録する
共起関係テーブルは、第8図に示すようなフォーマット
で登録する。このように自立語辞書5が、ユーザー辞書
6に用例を登録した時の辞書と異なる場合があるので、
自立語実行番号以外に、読み、表記、品詞を登録してお
き、用例参照時にこれらをチェックする。
用例テーブル7及びユーザー辞書6への共起関係の登
録においては、先行文節と後続文節との間の助詞のみが
異なる場合には、その助詞のみを登録する。
次に、制御部2の処理動作の内容を第9図に示すフロ
ーチャートに従い説明する。
以下、「しばいぬがなく」が入力された場合を例にし
て説明する。
まず、「しばいぬがなく」の仮名列を文字バッファ10
に取り込み(ステップ201)、入力仮名列に対して先行
文節の抽出を行う(ステップ202)。ここでは、ユーザ
ー辞書6より「しばいぬが」、「しばいぬ」を、自立語
辞書5より「しばい」、「しば」を、それぞれ先行文節
として抽出する。
そして、抽出した先行文節に続く仮名文字列で始まる
後続文節の抽出を行う(ステップ203)。
先行、後続文節の抽出が終了すると、次に、先行、後
続の二文節での処理を行い、先行文節及び後続文節を決
定する(ステップ204)。ここでは、ユーザー辞書6の
共起関係テーブルに「しばいぬが/なく」の仮名文字列
があるため、「が」の後で分かちする。
「こうくうじこ」の仮名列の場合であれば、「こう
く」+「うじこ」、「こうくう」+「じこ」と2種類の
分かち位置が考えられるが、これは用例テーブル7の共
起関係テーブルの追加登録エリアに「こうくう/じこ」
の仮名文字列があるので、「じ」の前で分かちする。
そして、文が終了したかどうか判断して(ステップ20
5)、終了していなければステップ203へ、終了していれ
はステップ206の同音語選択を行う。
文節に分けた候補は、各文節毎にその結果を同音語バ
ッファ12に蓄える。同音語バッファ12は各文節毎に個別
のバッファが設定されている。入力仮名列を文節分かち
した後、同音語選択処理として、各文節毎に分けた同音
語候補の絞り込みを行う(ステップ206)。ここでは、
ユーザー辞書6の共起関係テーブルより「柴犬が」+
「鳴く」を選択し、順次、このような処理を文章の終わ
りまで続ける(ステップ207)。
このようにして、用例テーブル7及びユーザー辞書6
に単語どうしの共起関係を登録することにより、かな漢
字変換時の変換効率を向上させることができる。
(ト)発明の効果 この発明によれば、先行単語と後続単語と助詞の入力
の要求に際しては、先行単語と後続単語と助詞の全ての
登録を要求する入力画面のみを用意し、助詞の入力がな
い場合には、共起関係にある2つの単語を複合語として
登録するようにしたので、単語の入力後であっても助詞
登録の必要性について検討できる上に、記憶すべき入力
画面情報を少なくすることができる。
また、仮名漢字変換辞書の単語番号を用例辞書に記憶
するようにしたので、用例辞書の容量を圧縮することが
できる。
【図面の簡単な説明】
第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図〜第
5図は単語の共起関係の登録例を示す説明図、第6図は
用例テーブルに登録された単語の共起関係の一例を示す
説明図、第7図は自立語辞書とユーザー辞書との関係を
示す説明図、第8図はユーザー辞書への共起関係の登録
例を示す説明図、第9図は実施例の動作を示すフローチ
ャートである。 1……キーボード、2……制御部、 3……プログラムメモリ、 4……かな漢字変換辞書、5……自立語辞書、 6……ユーザー辞書、7……用例テーブル、 9……バッファメモリ、 10……文字バッファ、11……学習バッファ、 12……同音語バッファ、13……表示装置。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】多数の単語をその読み情報と共に記憶した
    仮名漢字変換辞書から出力される少なくとも2つの単語
    の共起関係を用例辞書に登録するにあたり、 先行する単語及び後続する単語の入力エリアと両単語を
    結合する助詞の入力エリアを個別に表示して入力を要求
    し、該要求に対して入力された先行単語/後続単語/助
    詞を各項目毎に前記用例辞書に登録する際、前記助詞の
    入力エリアに対する入力がない場合は先行単語と後続単
    語を複合語として前記用例辞書に登録するよう構成した
    ことを特徴とする用例辞書登録方法。
  2. 【請求項2】先行単語と後続単語を複合語として前記用
    例辞書に登録する際に、それらの先行単語と後続単語を
    仮名漢字変換辞書の単語番号によって用例辞書に登録す
    ることを特徴とする請求項1記載の用例辞書登録方法。
  3. 【請求項3】多数の単語をその読み情報と共に記憶した
    仮名漢字変換辞書手段と、該仮名漢字変換辞書手段から
    出力される少なくとも2つの単語の共起関係を登録可能
    な用例辞書手段と、先行単語及び後続単語の入力エリア
    と両単語を結合する助詞の入力エリアを個別に表示する
    表示手段と、前記入力項目に先行単語及び後続単語を前
    記仮名漢字辞書手段を参照して入力すると共に助詞に相
    当する仮名を選択的に入力する用例入力手段と、前記用
    例入力手段から入力された先行単語/後続単語/助詞を
    項目毎に前記用例辞書に登録する際、前記助詞の入力エ
    リアに対する入力がない場合は先行単語と後続単語を複
    合語として前記用例辞書に登録する用例登録手段とを備
    えてなる用例辞書登録装置。
  4. 【請求項4】前記用例辞書手段は、前記用例入力手段か
    ら入力された先行単語/後続単語/助詞を項目毎に前記
    用例辞書に登録する際、助詞に対する入力がない場合は
    先行単語と後続単語を複合語として前記用例辞書に登録
    すると共に、先行単語と後続単語を前記仮名漢字変換辞
    書手段の単語番号によって前記用例辞書に登録すること
    を特徴とする請求項3記載の用例辞書登録装置。
JP2100678A 1990-04-16 1990-04-16 用例辞書登録方法及び装置 Expired - Lifetime JP2866437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2100678A JP2866437B2 (ja) 1990-04-16 1990-04-16 用例辞書登録方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2100678A JP2866437B2 (ja) 1990-04-16 1990-04-16 用例辞書登録方法及び装置

Publications (2)

Publication Number Publication Date
JPH03296856A JPH03296856A (ja) 1991-12-27
JP2866437B2 true JP2866437B2 (ja) 1999-03-08

Family

ID=14280415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2100678A Expired - Lifetime JP2866437B2 (ja) 1990-04-16 1990-04-16 用例辞書登録方法及び装置

Country Status (1)

Country Link
JP (1) JP2866437B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002334319A (ja) * 2001-05-10 2002-11-22 Olympus Optical Co Ltd 画像ファイリングシステム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01229369A (ja) * 1988-03-09 1989-09-13 Canon Inc 文字処理装置

Also Published As

Publication number Publication date
JPH03296856A (ja) 1991-12-27

Similar Documents

Publication Publication Date Title
JP2016186805A5 (ja)
JP2016186805A (ja) 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法
JP2866437B2 (ja) 用例辞書登録方法及び装置
JPH0412866B2 (ja)
JPH0612548B2 (ja) 文書処理装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH01307865A (ja) 文字列検索方式
JPH0452500B2 (ja)
JPS628259A (ja) かな漢字変換方式
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム
JPH0410052A (ja) 外国語電子辞書検索方法及び装置
JPH0421901B2 (ja)
JP2580060B2 (ja) かな漢字変換方法及び装置
JPS62202259A (ja) 文書作成装置
JPH11338859A (ja) 氏名入力装置及びプログラム記録媒体
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH0424759A (ja) 文書処理装置
JPS62156768A (ja) メモ機能を有するワ−ド・プロセツサ
JPH04323770A (ja) 機械翻訳装置
JPH0363754A (ja) 文章処理装置
JPH0385669A (ja) 送りがな解析機能付き検索置換装置
JPH04251374A (ja) 文書作成システム
JPH02176965A (ja) かな漢字変換装置
JPH01300378A (ja) 翻訳処理装置
JPH0727526B2 (ja) かな漢字変換装置