JP3058885B2 - 言語処理装置 - Google Patents

言語処理装置

Info

Publication number
JP3058885B2
JP3058885B2 JP1123165A JP12316589A JP3058885B2 JP 3058885 B2 JP3058885 B2 JP 3058885B2 JP 1123165 A JP1123165 A JP 1123165A JP 12316589 A JP12316589 A JP 12316589A JP 3058885 B2 JP3058885 B2 JP 3058885B2
Authority
JP
Japan
Prior art keywords
reading
word
unknown word
unknown
additional information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1123165A
Other languages
English (en)
Other versions
JPH02301857A (ja
Inventor
直久 高山
美由紀 田畑
治雄 水上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1123165A priority Critical patent/JP3058885B2/ja
Publication of JPH02301857A publication Critical patent/JPH02301857A/ja
Application granted granted Critical
Publication of JP3058885B2 publication Critical patent/JP3058885B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は例えばワ−ドプロセッサのように自然言語
を処理する言語処理装置に関し、特に単語辞書に未登録
の単語、即ち未知語を登録する機能を有する言語処理装
置に関するものである。
〔従来の技術〕
従来の未知語登録は、未知語の表記、読み、品詞情報
等の付加情報を全て登録者が入力するという方式がとら
れていた。
この種の未知語登録方式を採用した従来の言語処理装
置として、第5図に示す構成のものがある。この第5図
は例えば、「GMW/Wnn Users' Guide」(京都大学、立石
電気(株)、(株)アステック)の「Wnn使用の手引」
(p1〜8主にp6))に示された装置に基づくものであ
る。従来の言語処理装置について第5図のブロック図を
参照しながら説明する。第5図において、1は標準単語
の表記、読み及び付加情報を格納した単語辞書、2はこ
の単語辞書1に格納されていない所望の単語を未知語と
し、その未知語の表記を発生させて指定する未知語指定
手段、9は未知語の読みを入力する読み入力手段、7は
未知語の付加情報を指定する付加情報指定手段、8は未
知語の表記、読み及び付加情報を単語辞書1に登録する
単語登録手段である。
次に、この従来の言語処理装置における未知語登録処
理の動作について、第6図に示すフロ−チャ−トを参照
しながら説明する。
例えば、「特講」なる単語は標準単語でなく、単語辞
書1に登録されていない未知語とする。いま、「特講」
なる未知語を単語辞書1に登録しようとすると、まずス
テップS31において、未知語指定手段2により、「特
講」なる表記を公知のかな漢字変換等の日本語入力方式
によって発生させ、未知語として指定する。次のステッ
プS32では、読み入力手段9により、「特講」に対する
読み「とっこう」を入力する。次のステップS33では、
付加情報指定手段7により、単語の品詞(「特講」なら
名詞)を付加情報として指定する。次のステップS34で
は、単語登録手段8により、未知語の表記「特講」、読
み「とっこう」、付加情報「名詞」を単語辞書1に登録
する。
〔発明が解決しようとする課題〕
従来の言語処理装置は以上のように構成されているの
で、単語辞書1に予め格納されていない未知語を単語辞
書1に登録する場合、使用者がその未知語の読みを新た
に入力する必要があり、未知語の表記、読み及び付加情
報の登録の操作が複雑化し、言語処理速度の向上を図る
ことが難しいという問題点があった。
この発明は上記のような問題点を解決するためになさ
れたもので、使用者が未知語の読みを新たに入力する必
要をなくし、未知語の表記、読み及び付加情報の登録の
操作を簡単化し、言語処理速度の向上を図れる言語処理
装置を提供することを目的とする。
〔課題を解決するための手段〕
この発明に係る言語処理装置は、未知語を構成する各
文字の読みが格納された読みテーブル3と、未知語指定
手段2によって指定された未知語の各文字の読みを読み
テーブルから検索し未知語の各文字に対応する読みを組
み合わせた読みを生成することにより未知語に対する複
数の読み候補を発生させる読み発生手段4と、この読み
発生手段4で得られた読み候補から未知語に対する読み
を決定し単語辞書1に登録するための読み決定手段5と
を備えたことを特徴とするものである。
〔作用〕 読みテーブル3は、未知語を構成する各文字の読みを
格納する。読み発生手段4は、未知語指定手段2によっ
て指定された未知語の各文字の読みを読みテーブル3か
ら検索し、未知語の各文字に対応する読みを組み合わせ
た読みを生成することにより、未知語に対する複数の読
み候補を発生させる。読み決定手段5は読み発生手段4
で得られた読み候補から未知語に対する読みを決定す
る。このようにして決定された読みは単語辞書1に登録
される。
〔発明の実施例〕
第1図はこの発明の一実施例に係る言語処理装置の要
部構成を示すブロック図である。第1図において、第5
図に示す構成要素に対応するものには同一の符号を付
し、その説明を省略する。第1図において、3は文字の
読みが格納された読みテ−ブル、4は未知語指定手段2
で指定された未知語を構成する各文字の読みを読みテ−
ブル3から検索し未知語の各文字に対応させることによ
り未知語に対する複数の読み候補を発生させる読み発生
手段、5は読み発生手段4で得られた未知語の読み候補
の中から読みを決定する読み決定手段、6は読み決定手
段5より決定された読みが所望の読みでない場合に読み
を修正する読み修正手段である。
第3図は第1図中の読みテ−ブル3の内容の一例を示
し、図中の10は「講」の読み、11,12は「特」の読みを
示す。また、第4図は第1図中の読み発生手段によって
得られた読み候補の一例を示す。
次に、上記実施例における未知語登録処理の動作につ
いて、その処理を表す第2図のフロ−チャ−トを参照し
ながら説明する。
例えば、「特講」なる単語は標準単語でなくて、単語
辞書1には登録されていないものとする。いま、「特
講」なる未知語を単語辞書1に登録しようとすると、ま
ずステップS41において、従来例の場合と同様に未知語
指定手段2によって、「特講」なる表記を発生させ、未
知語として指定する。次のステップS42では、読み発生
手段4により、読みテ−ブル3を検索して、未知語「特
講」を構成する文字である「特」の読み「とく」(第3
図の11)、「とっ」(第3図の12)及び「講」の読み
「こう」(第3図の10)を得る。そして、未知語「特
講」の単語としての複数の読み候補である「とくこう」
(第4図の13)及び「とっこう」(第4図の14)を発生
させる。次のステップS43では、読み決定手段5によ
り、未知語「特講」に対する読み候補である「とくこ
う」13及び「とっこう」14の中から所望の読みである
「とっこう」14を選択して決定する。ステップS44にお
いて、もし、読み修正する必要があるなら、ステップS4
5において、読み修正手段6により読みを修正する。次
のステップS46では、従来例の場合と同様に付加情報指
定手段7により、単語の品詞(「特講」なら名詞)を付
加情報として指定する。次のステップS47では、単語登
録手段8により、単語辞書1に未知語「特講」の読み
「とっこう」、表記「特講」及び付加情報「名詞」を登
録する。
なお、上記実施例の説明は、未知語が漢字の場合につ
いてなされたが、これに限らず他の文字、例えば平仮
名、片仮名等も未知語の中に含めてもよく、この場合も
上記実施例と同様の効果を奏するものである。
〔発明の効果〕
以上のように本発明によれば、未知語を構成する各文
字の読みが格納された読みテーブルと、未知語指定手段
によって指定された未知語の各文字の読みを読みテーブ
ルから検索し未知語の各文字に対応する読みを組み合わ
せた読みを生成することにより未知語に対する複数の読
み候補を発生させる読み発生手段と、未知語に対する読
み候補の中から読みを決定する読み決定手段とを設けて
構成したので、未知語を指定した後、指定さた未知語に
対して読みが自動的に生成され、これにより使用者が未
知語の読みを新たに入力する必要がなくなり、したがっ
て未知語の表記、読み及び付加情報の登録の操作が簡単
化になり、言語処理速度が向上する。また、辞書に登録
されていない単語であっても、読みを推定してユーザに
提示することができるという効果が得られる。また、電
子メールなど通信により入手した文書からの未知語登録
や,読み情報を含まない他機種ワープロ文書からのカッ
ト&ペーストによる未知語登録のようの場合にも、読み
テーブルを参照することにより、読み候補を発生し、入
力の手間を省くことができる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る言語処理装置の要部
構成を示すブロック図、第2図はこの実施例における未
知語登録処理の動作を示すフロ−チャ−ト、第3図は第
1図中の読みテーブルの内容の一例図、第4図は第1図
中の読み発生手段によって得られた読み候補の一例図、
第5図は従来の言語処理装置の要部構成を示すブロック
図、第6図はこの従来例における未知語登録処理の動作
を示すフロ−チャ−トである。 1……単語辞書、2……未知語指定手段、3……読みテ
ーブル、4……読み発生手段、5……読み決定手段、7
……付加情報指定手段、8……単語登録手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 水上 治雄 神奈川県鎌倉市大船5丁目1番1号 三 菱電機株式会社情報電子研究所内 (56)参考文献 特開 昭63−189933(JP,A) 実開 昭64−10849(JP,U)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】標準単語の表記、読み及び付加情報が格納
    された単語辞書と、この単語辞書に格納されていない所
    望の単語を未知語として指定する未知語指定手段と、上
    記未知語に対する付加情報を指定する付加情報指定手段
    と、上記未知語の表記、読み及び付加情報を上記単語辞
    書に登録する単語登録手段とを備えた言語処理装置にお
    いて、 未知語を構成する各文字の読みが格納された読みテーブ
    ルと、上記未知語指定手段によって指定された未知語の
    各文字の読みを上記読みテーブルから検索し未知語の各
    文字に対応する読みを組み合わせた読みを生成すること
    により未知語に対する複数の読み候補を発生させる読み
    発生手段と、この読み発生手段で得られた読み候補から
    未知語に対する読みを決定し上記単語辞書に登録するた
    めの読み決定手段とを設けたことを特徴とする言語処理
    装置。
JP1123165A 1989-05-17 1989-05-17 言語処理装置 Expired - Fee Related JP3058885B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1123165A JP3058885B2 (ja) 1989-05-17 1989-05-17 言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1123165A JP3058885B2 (ja) 1989-05-17 1989-05-17 言語処理装置

Publications (2)

Publication Number Publication Date
JPH02301857A JPH02301857A (ja) 1990-12-13
JP3058885B2 true JP3058885B2 (ja) 2000-07-04

Family

ID=14853794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1123165A Expired - Fee Related JP3058885B2 (ja) 1989-05-17 1989-05-17 言語処理装置

Country Status (1)

Country Link
JP (1) JP3058885B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6410849U (ja) * 1987-07-06 1989-01-20

Also Published As

Publication number Publication date
JPH02301857A (ja) 1990-12-13

Similar Documents

Publication Publication Date Title
JP2848593B2 (ja) 翻訳処理方法
JP3058885B2 (ja) 言語処理装置
KR100576549B1 (ko) 한글 주소 문자열의 고속 입력 장치 및 그 방법
JP3244286B2 (ja) 翻訳処理装置
JPH0512247A (ja) 文書作成装置
JPH02255944A (ja) かな漢字変換装置
JP3337524B2 (ja) かな漢字変換装置
JP3036005B2 (ja) かな漢字変換装置
JP3305343B2 (ja) 辞書編集装置
JP3213991B2 (ja) ワードプロセッサ
JPH09185629A (ja) 機械翻訳方法
JPH06309358A (ja) 自然言語処理装置
JP2000010974A (ja) 機械翻訳装置および機械翻訳方法ならびに記録媒体
JP2723908B2 (ja) 文書作成装置
JPH0589094A (ja) かな漢字変換装置
JPH041849A (ja) 日本語文章処理装置
JPH0619964A (ja) 機械翻訳装置
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JPH04312161A (ja) ワードプロセッサ
JPH0520300A (ja) 文書処理装置
JPH0736884A (ja) 文字認識入力装置
JPH09101955A (ja) 文書作成装置
JPH0385668A (ja) 自動長音付加方法
JPH05108615A (ja) 非優先学習日本語入力システム
JPH10187730A (ja) 形態素解析用平仮名辞書作成方法および装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees