JPH0488553A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0488553A
JPH0488553A JP2202395A JP20239590A JPH0488553A JP H0488553 A JPH0488553 A JP H0488553A JP 2202395 A JP2202395 A JP 2202395A JP 20239590 A JP20239590 A JP 20239590A JP H0488553 A JPH0488553 A JP H0488553A
Authority
JP
Japan
Prior art keywords
document
kana
word
context information
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2202395A
Other languages
English (en)
Inventor
Koichiro Akiyama
浩一郎 秋山
Kenji Ono
顕司 小野
Kazuhiro Kimura
和広 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2202395A priority Critical patent/JPH0488553A/ja
Publication of JPH0488553A publication Critical patent/JPH0488553A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) この発明は、かな表現の文字列を漢字かな混じり文に変
換するかな漢字変換装置に関する。
(従来の技術) かな漢字変換方式として従来一般に、漢字ことにその読
みを入力して変換する単漢字変換方式、文節ごとにかな
文字列を入力して変換する文節変換方式、さらに漢字や
文節にかかわらすかな文字列を入力して変換するべた入
力変換方式がある。
そして近年の日本語ワードプロセッサにおいては、これ
らの方式のうち最後のべた入力変換方式が主流になって
きている。このべた入力変換方式は、入力時に文節切り
を考慮する必要がないばかりか、変換の際に複数の文節
のかな文字列を考慮することができるので、同音語選択
の必要がある場合でも文節変換方式よりも候補を絞った
可能性の高い候補から出力することができるという利点
がある。
例えば、「皇帝に謁見する」を変換したい場合、文節変
換方式ではます、「こうでいに」を変換してから「えっ
けんする」を変換することになる。
そして、「こうでいに」の変換の際に最初の候補として
出力されるものは単語の事前頻度、つまりその単語がそ
れまでに使われた回数の最も多いもの、または最も最近
に使われたものか出力される。
この場合には、それまでに入力した文にもよるか、たい
ていの場合、「肯定に」峠「工程に」→「校訂に」→「
行程に」→「高低に」→「校庭に」−「公定に」−「皇
帝に」−「航程に」−「高弟に」=「公邸に」の順序で
出力される。さらに「えっけんする」を変換する際には
、たいていの場合、「越権する」=「謁見する」の順序
で出力される。したがって、所望の文字列「皇帝に謁見
する」を得るのに8回の次候補選択操作をしなければな
らない。
そこで、この問題を解決するために近年、共起関係を用
いる変換方式により選択回数を減らすようになってきて
いる。二〇共起関係を用いる変換方式は、「こうでいに
えっけんする」という文字列を変換するとき、共起関係
として「皇帝」+「謁見する」があればそれを優先的に
出力する方式であり、1文節しか変換対象としない文節
変換方式では行うことのできない的確な変換を行うこと
かできる。また、「皇帝に貴族が謁見するjのように真
ん中に1〜2文節が挾まれた場合でもこれは有効である
したがって、この共起関係を用いる変換方式は、文節変
換方式では8回の選択が必要であったところをただ1回
の選択もしないで正解候補を得るこ、とができるので、
入力者の負担を軽減してきた。
しかし、このような従来の共起関係を用いるかな漢字変
換方式では、次のような問題点があった。
つまり、共起する単語の組み合わせを数多く求める必要
があり、そのうえ、実際分野によって用法が違う共起関
係もあるので、すべての共起関係を求めることは不可能
である。また、すべての共起関係を求めるのは無理とし
ても、実生活に用いられる大半の共起関係を求めておけ
ば実用上便利なものとなるが、そのような共起する単語
の組み合わせたけでも膨大な数に上るために、求めた共
起関係辞書をメモリ格納することができない。このよう
な状況のために、実生活に使われる共起関係のうちのほ
んの数%だけをメモリに格納して利用することで満足し
なければならないのが現状であった。
一方、計算機の可読な文書に対してその中の語句をより
詳しく読者に理解させるために、その語句とそれと関係
のある他の文書、例えば辞書、事典、参考文献などの一
部または全部との間にリンクを張ることにより計算機的
に関係を持たせるハイパーテキストという技術がある。
(参考文献ASCII  Vol、113 221〜2
36ページ)。このハイパーテキスト技術によれば、今
まで見にくかった文書間の相互関係が読者にとって分か
りやすいものとなる。
そこで、このハイパーテキスト技術を利用すれば、1つ
の専門分野の文書に関連する専門用語を数多く見出だす
ことができ、同時にその特定の専門分野における数多く
の共起関係も容易に見出たすことができる。したがって
、この/%イパーテキスト技術を利用することによりユ
ーザーの属する専門分野での用語や共起関係を求めたい
という欲求が有る。
(発明が解決しようとする課題) このように、従来のワードプロセッサで用いられている
共起関係を用いたかな漢字変換はユーザーの負担を軽減
するものであるか、そのデータの収集と格納に困難を極
めていた。
この発明は、このような従来の問題点に鑑みてなされた
もので、ワードプロセッサで用いられている共起関係を
用いたかな漢字変換において、共起関係をあらかじめ格
納しておくのではなく、既存の漢字かな混じり文書から
共起関係および単語頻度情報を自動的に抽出し、それら
を現在入力中のかな漢字変換に反映させることにより操
作性の良いかな漢字変換装置を提供することを目的とす
る。
[発明の構成] (課題を解決するための手段) この発明のかな漢字変換装置は、既存のかな漢字混じり
文の保存文書を指定するための文書指定手段と、 この文書指定手段により指定された文書の文脈解析を行
う文脈解析結果と、 この文脈解析手段による文脈解析結果を登録する文脈解
析結果登録手段と、 かな文字列を入力するための入力手段と、この入力手段
により入力されたかな文字列に対し、前記文脈解析結果
登録手段により登録されている文脈解析結果を参照しな
がら漢字かな混じり文に変換するかな漢字変換手段とを
備えたものである。
さらに、文脈解析手段は前記文書に対し共起関係の抽出
及び単語頻度の算出を行なうものである。
(作用) この発明のかな漢字変換装置では、まずかな文字列の入
力に先立って、文書指定手段により既存のかな漢字混じ
り文の保存文書を指定し、指定された保存文書に対して
文脈解析手段により文脈解析を行い、専門用語の出現頻
度や共起関係なとを求めてその結果を文脈解析結果登録
手段に登録する。
そして入力手段による実際のかな文字列の入力の際には
、かな漢字変換手段が前記文脈解析結果登録手段に登録
されている辞書や共起関係を参照しながらかな文字列を
漢字かな混しり文に変換し、これを順次記憶手段に記憶
していくことにより、日本語漢字かな混じり文書を作成
していくことかできる。
(実施例) 以下、この発明の実施例を図に基づいて詳説する。
第1図はこの発明の一実施例を示すブロック図であり、
文書指定部11と、文書読み出し部12と、文脈情報抽
出部13と、文脈情報格納部14と、ひらがな入力部1
5と、かな漢字変換部16と、文脈情報制御部17と、
文書表示編集部]8とを備えている。
文書指定部11は、既存の漢字かな混じり文書を指定す
る部分であり、文書読み出し部12は、文書指定部11
て指定された文書を外部記憶装置から内部記憶装置に読
み出す部分である。なお、すでに指定された文書が内部
記憶装置にある場合にはこの文書読み出し部12による
読み出し操作は行われない。
文脈情報抽出部13は、前記文書から文脈情報を抽出す
る部分であり、文脈情報格納部14は、抽出された文脈
情報を記憶装置上に格納する部分である。
ひらがな入力部15は、ひらがな文字列の入力を行い、
入力されたひらがな文字列を順次かな漢字変換部16に
送る部分であり、かな漢字変換部16は、ひらがな入力
部15から順次送られてくるひらがな文字列をかな漢字
変換する部分である。
文脈情報制御部17は、文脈情報格納部14で記憶装置
に格納した文脈情報を利用してかな漢字変換部16でか
な漢字変換を行うために前記文脈情報を制御する部分で
ある。
文書表示編集部18は、ひらがな入力部15やかな漢字
変換部16から送られたデータを表示すると共に、誤変
換や誤入力があった場合にそれらを再変換したり再入力
したりすることにより修正する部分であり、ここで再変
換の場合にはかな漢字変換部16ヘデータを送り、再入
力の場合にはひらがな入力部15にデータを送る。
第2図は文脈情報抽出部13の詳細なブロック図てあり
、1文読み込み部131と、形態素解析部132と、共
起関係抽出部133と、単語頻度算出部134とから構
成されている。
1文読み込み部131は、文書を1文ずつ演算メモリ中
に読み込み、形態素解析部132に送り込む部分である
。形態素解析部132は、送られてくる1文の形態素解
析を行い、各単語を品詞列および活用型列に展開する部
分である。そして、この形態素解析部132の形態素解
析結果は、共起関係抽出部13Bおよび単語頻度算出部
]34に送られ、ここで共起関係の抽出、単語頻度の算
出を行うようになっている。
次に、上記の構成のかな漢字変換装置の動作について説
明する。
文書作成に先立って共起関係登録、単語頻度算出を行う
ために、既存の文書を指定してその文書から共起関係を
抽出し、また開度算出処理を行う。
第3図は文書指定部11により指定される既存文書の一
例であり、21はハイパーテキスト形式で保存されてい
る指定された文書を示している。
この文書21の中で、「データベース」という単語はそ
の内容が一般人には分かりにくいので、矢印aで示すよ
うに専門用語辞書中の文書22の該当部分を参照してい
る。また文書21中の「電子化辞書」という単語も一般
人には分かりにくい言葉であるために、矢印すで示すよ
うに専門用語辞書中の文書23の該当部分を参照してい
る。さらに、指定文書21の下部にある参考文献の「過
去の翻訳結果を利用・・・・・・」は、矢印Cで示すよ
うにその実態のある文書24全体を参照している。
また別文書25の「翻訳支援システムコは、矢印dで示
すように指定文書21の全体を参照している。さらに文
書24の語句「形態素解析」は矢印eで示すように他の
文書の一部または全部を参照していることを示している
そこで、文書指定部11て文書21が指定されたときに
は、文書読み出し部12が指定文書21と、この文書2
1で参照されている文書22の該当部分と、文書23の
該当部分と、文書24の全体と、さらに文書24の語句
「形態素解析」が参照している他の文書の該当部分を内
部記憶装置上に読み出す。
こうして読み出された文書群に対して、文脈情報抽出部
13により文脈情報を抽出する。ここでは以下、文脈情
報のうち共起関係情報と単語開度情報を抽出する例を示
すことにする。
ます共起関係情報の抽出から説明すると、共起関係はあ
る語と他の語との関係であるので、隣接する語句間のデ
ータを抽出する必要があるが、ここでは、「名詞十名詞
」、「名詞+助詞+自立語」という品詞列を持つような
共起関係の抽出について詳細に論じる。
第2図において、指定文書21は、1文読み込み部13
1で1文ずつ演算メモリ上に読み込まれ、形態素解析部
132で形態素解析処理が行われ、読みがな列、品詞列
および活用型列に展開される。
共起関係抽出部133では、これらの列から「名詞十名
詞」、「名詞+助詞+自立語」のペアをそれに当たる単
語と共に抽出し、文脈情報格納部14に送る。
この例では、指定文書21における第1文である「類似
文検索機能を備えた翻訳支援システム」を読み込み、形
態素解析部132で形態素解析処理を行い、単語の列 「類似文+検索十機能十を十備えた十翻訳+支援+シス
テム」 と、これに対応した読みがな列 [るいじぶん+けんさく+きのう十を+そなえた+はん
や<+シえん+しすてむ」、 さらに、品詞および活用型の列 「名詞十名詞十名詞+助詞+動詞(終止形)十名詞十名
詞十名詞」 を共起関係抽出部133に送る。
共起関係抽出部133では、これを受けて「名詞十名詞
」ペア、および「名詞+助詞+自立語」ペアを抽出する
。そのためにまず、品詞および活用型の列を列の頭から
検索していく。
この検索によりまず当たるのが、「類似文士検索」の「
名詞十名詞」ペアである。そこで、これらを文脈情報格
納部14に送る。このとき同時に、「類似文士検索子機
能」を見る。しかしながら、これに対応する品詞および
活用型列は「名詞十名詞十名詞」であるので、長さ3の
検索品詞列「名詞+助詞十自立語」とはマツチしない。
そこで次に、「検索子機能」を見にいく。これに対応す
る品詞列は「名詞十名詞」であるので、前述のように文
脈情報格納部14へこれらを送る。
以下同様にして、「機能+を十鏝えた」、「翻訳+支援
」、「支援+システム」を文脈情報格納部14へ送る。
次に、単語の頻度情報の抽出について説明する。
形態素解析部132で得られた読みがな列と品詞及び活
用型列は単語頻度算出部134に送られ、単語ごとに頻
度を算出する。そしてすべての文書が処理された段階で
、単語ごとの開度を文脈情報格納部14に送るのである
が、ここでは、「翻訳」という単語を例にとって説明す
ると、指定文書21の第1文「類似文検索機能を備えた
翻訳支援システム」を演算メモリに読み込んで頻度を算
出すると、そこには1回「翻訳」という単語が出ている
ので、「翻訳」の頻度バッファを1とする。
続く第2文「1.はじめに」には、該当する単語がない
ので前記「翻訳」の頻度バッファは1のままである。
続く第3文「翻訳する際、以前の翻訳結果を参照すると
ユーザ特有の表現や・・・」には「翻訳」という単語が
2つあるので、それらを見出だした時点で「翻訳」の頻
度バッファに1ずつ加算して行き、この第3文が終わっ
た段階で開度バッファは3となる。
このようにして文書21の中のすべての単語について頻
度バッファを設けて同様の処理を行い、最後にすべての
単語の頻度バッファの内容を文脈情報格納部14に送る
そして、文脈情報格納部14に送られたこれらの文脈情
報は、共起関係については第4図に示すようなフォーマ
ットで格納される。ここでは、読みは単語の読みかなで
あり、見出しは単語そのものであり、品詞情報はその単
語の品詞および活用型の情報である。同様に、単語頻度
情報も第5図、のようなフォーマットで格納される。
このようにして、新たに文書を作成するに先立って既存
文書を指定して、ユーザが自分の専門分野やこれから作
成しようとする文書の分野と共通する分野における共起
関係抽出や単語頻度算出を行なってあらかじめ登録して
おき、続いて、新たな文書の作成に入ることになる。
次に、ユーザがかな文字列を入力して新たに文書を作成
していく処理について説明する。
ユーザがひらがな入力部15からひらがな文字列を入力
すると、かな漢字変換部16ては、ひらがな入力部15
から順次送られてくるひらがな文字列を受けて内部辞書
を参照して4文節最長一致法などの変換方式を用いてか
な漢字変換を行う。
このとき、多くの候補が出現するが、文脈情報制御部1
7は文脈情報格納部14により格納した共起関係が候補
の中にあれば、その候補の優先度を上げ、第1候補に出
力しやすいようにする。例えば、「るいじぶんけんさく
ほう」というひらがな文字列を入力した時、通常ならば
「類似文献作法」となるところを、「類似文献作法」と
いう共起関係がすでに登録されているので、この実施例
では「類似文献作法」という候補が第1候補に出力され
ることになる。
単語頻度に関しても同様であり、候補中の辞書による単
語頻度に加えるか、またはその頻度そのものを単語頻度
として用いるか、あるいは文書から抽出した単語頻度に
何らかの重みをつけて辞書の単語頻度に加えるかするこ
とにより、同音異義語が存在した場合、単語頻度の高い
ものから順に候補として出力する。
最後に文書表示編集部18では、ひらがな入力部15か
らのひらがな文字列データおよびかな漢字変換部16か
らの漢字かな混じり文字列データの表示と、文字列の修
正や候補選択などの編集を行う。
このようにして、ユーザは何らかの文書を作成する場合
に、その文書の作成に先立って、作成しようとする文書
の専門分野と関連する既存の文書を指定してその既存の
文書から自動的に共起関係や単語頻度情報を抽出して登
録しておき、文書作成時のかな漢字変換時に参照するこ
とにより第1候補として正解率の高い単語を選択してく
ることができるようになるのである。
なお、上記の第1実施例では、文書指定部11が既存文
書の全体を指定するようにしていたが、これに限定され
ることはなく、既存文書の一部を指定するようにしても
良い。この既存文書の一部を指定する実施例を第6図に
示しているが、第1図に示す文書指定部11で指定する
のが文書31の目次であり、この目次の中の「第2章 
統語論」という文字列は矢印fで示すようにそれか実際
に書かれている内容部分32を参照している。そして、
この内容部分32の中の「構造的制約」という語句は、
矢印gて示すようにその注釈部分33を参照していると
する。
ここで、「自然言語処理」という分野の中の「統語論」
という分野に関する文書を作成することを目的とする場
合、指定文書31の目次の示す自然言語処理全般につい
て論じである第1章や意味論について論じている第3章
などをも参照すると、自然言語処理全般についての言い
回しや単語、また意味論固有の言い回しや単語などが統
語論の文書に反映されることになり、統語論に関する文
書にふされしい用語を用いたかな漢字変換の効率がかえ
って悪化する恐れがある。そこで、上述のように統語論
に関連する文書のみを参照して共起関係および単語頻度
算出を行うようにすることにより、いつそう専門的な用
語のかな漢字変換効率を上げることができるようにして
いるのである。
第7図はこの発明のさらに別の実施例であり、第1図に
示した第1実施例における文書指定部11を文書構造抽
出部111と参照リンク指定部112とで構成した実施
例である。
文書構造抽出部111では文書指定部11で指定した文
書の参照、被参照の関係から文書構造を抽出する。そし
て参照リンク指定部112ては、文書構造抽出部111
で抽出された文書構造の参照、被参照のリンクのうちど
れを参照するかを指定する。
次に、この第3実施例の動作について説明する。
第8図は文書構造抽出部111で抽出され、参照リンク
指定部112て表示された文書構造の例を示しており、
前記第3図の文書についての文書構造を抽出して示した
ものである。
この第8図において、各リンクh−pに付けられた名前
はそのリンクが張られている理由を示している。例えば
、「類似文検索機能を備えた翻訳支援システム」から「
データベース」に張られたリンクには、「類似文検索機
能を備えた翻訳支援システム」という文章中の「データ
ベース」という単語が専門用語であるの、で、専門用語
辞書中の「データベース」の項を参照するために張られ
ていることを示し、このリンクkには「辞書」という名
前が付けられている。同様に、「類似文検索機能を備え
た翻訳支援システム」から「過去の翻訳結果を利用した
翻訳支援システム」に張られたリンクiは、参考文献と
してのリンクであるので、「参考文献」というリンク名
が付けられている。
第8図の画面表示において、下部には参照リンクの指定
を行う部分が設けられており、「リンク名」のところに
参照文書の文書構造の中から参照したいリンク名を入力
し、「段数」のところに指定したリンクに関して、その
リンクを指定文書から何段下に下がったところまで参照
するか、またに何段上に上がったところまで参照するか
を入力するようにしている。第8図の入力状態では、「
辞書」というリンク名のリンクを指定文書「類似文検索
機能を備えた翻訳支援システム」から2段下まで参照す
る指定を行なっていることを示している。したがって、
この場合には、「データベース」、「電子化辞書」、「
形態素解析」の辞書項目まで参照するが、「機械翻訳の
将来」や「過去の翻訳結果を利用した翻訳支援システム
」という文書は参照しない。
指定した文書から出るすべてのリンクをたどって参照し
ていく場合にはリンクの段数が増えるごとに参照文書が
対象分野からずれてきて、かな漢字変換に悪影響を及ぼ
すようになるが、このようにリンク名と段数を指定して
文書から文脈情報を抽出するようにするならば、そのよ
うな影響の出ない範囲て文脈情報を抽出することができ
ることになる。また無制限に文書の指定を行うと文脈情
報の抽出に時間がかかり過ぎて操作性が低下するが、た
どっていくリンクの段数を制限することによりそれを防
ぐことができる。
このようにして参照リンクが指定されたならば、このデ
ータを第1図に示す文書読み出し部12に送り、文書読
み出し部12では指定された文書およびリンク先の文書
を読み込み、以下、第1実施例と同様にして文脈情報抽
出部13において既存文書における共起関係や単語頻度
などの文脈情報を求め、これを文脈情報格納部14に格
納することになる。
さらにこの発明の他の実施例として、第1図に示した文
脈情報抽出部13を第9図に示すような構成とすること
ができる。つまり、1文読み込み部131と、形態素解
析部132と、共起関係抽出部133と、単語開度算出
部134と、さらにユーザ辞書登録部135とにより文
脈情報抽出部13を構成するのである。
この実施例において、1文読み込み部131〜単語頻度
算出部134は第2図に示した構成と同様であるか、ユ
ーザ辞書登録部135は、第8図に示したように辞書や
事典類を参照していることを明示するリンク名が付加さ
れている場合に(第3実施例におけるリンク名「辞書」
がそれに当たる)、そのリンク先の辞書から読みがなと
見出しく漢字列)および品詞情報を読み取ってユーザ辞
書に自動的に登録する部分である。
次に、この実施例の動作について説明する。第8図にお
いて、ユーザ辞書登録の対象となるのは「辞書」という
名前のリンクが張られている「データベース」、[電子
化辞書J、「形態素解析」である。そして、「データベ
ース」は専門用語ではあるが、−船釣によく使われてい
るので内部辞書にすでに登録されている。しかし、「電
子化辞書」や「形態素解析」は専門性か高い用語なので
内部辞書には登録されていない場合かはとんとである。
そこで、このような用語に対して共起関係だけを登録し
たのでは、語と語の関係としてたけ一でしか捕÷えられ
ないので、最低でも2単語の連:。
接として登録されることになる。しかしながら、これら
を第10図に示すようなフォーマットでユーザ辞書登録
すれば、それぞれが1単語としても捕えられ、単独で現
れる場合にもかな漢字変換できることになり、内部処理
上有効である。
第11図はこの発明の第5の実施例を示しており、第1
図に示した第1実施例の構成に対してさらに、文書管理
部19を付加した構成となっている。
この実施例で新たに追加された文書管理部19は既存文
書のリンクを管理する部分であり、例えば既存の文書間
のリンク付けを行なったり、すてに付けられているリン
クを取り除いたり、さらにはリンク名の付加及び変更を
行なったりする部分である。
次に、この実施例の動作を詳しく説明する。第12図に
おいて、41〜45は第1実施例の第3図における文書
21〜25と同様であり、さらにリンク処理に関連する
メニュー47が設けられ、ここに「付加」、「変更」、
「削除」などの項目が表示される。ここで「付加」は既
存文書中のリンクの付加、「変更」はリンク元、リンク
先またはリンク名の変更であり、「削除」はリンクの削
除を示すものである。
そして、第12図は「付加」を選択した時の表示状態で
あり、メニュー47において「付加」の部分をマウスク
リックなどの入力手段で選択した時、文書管理部19は
「リンク元をマウスで指定してください。」というメツ
セージを出し、ユーザに対してリンク元の指定を促す。
第12図は「翻訳支援」を指定している。
こうしてユーザがリンク元の指定を行なったならば、文
書管理部19はそれをリンク元バッファに保存し、「読
み出す文書名」というメツセージと文書名入力ウィンド
ウ48を表示し、ユーザに対して読み出す文書名の入力
を促す。ここでは、「情報処理用語集」を読み出してい
る。
こうして読み出す文書名の入力を受けて、文書管理部1
9は指定された文書名の文書を読み出し、ウィンドウ4
6を開いて前記文書を表示する。ウィンドウ46は読み
出す文書名で指定された文書を表示するウィンドウであ
る。
ここで文書管理部19は、「リンク先をマウスで指定し
てください。」というメツセージを出し、リンク先の指
定をユーザ促す。第12図では、ウィンドウ46におけ
る「翻訳支援」の辞書項目全部を指定している。
そこでユーザがリンク先を指定したら、文書管理部19
は前記リンク先をリンク先バッファに保存して、「リン
ク名を指定してください。」というメツセージとリンク
名入力ウィンドウ49とを表示し、ユーザの入力を促す
。この第12図では、リンク名として「辞書」を入力し
ている。
このウィンドウ49にリンク名が入力されると、文書管
理部19は前記リンク名をリンク名バッファに保存する
これら一連の操作の後、文書管理部19はリンク元バッ
ファ、リンク先バッファおよびリンク名バッファを参照
して新たなリンクmを張ることになる。
なお、メニュー47における「変更」、「削除」につい
ても同様である。
文書指定部11では、こうして文書管理部19で既存の
文書間のリンク付けを行なったり、すでに付けられてい
るリンクを取り除いたり、さらにはリンク名の付加及び
変更を行なったりした文書データを基にして第1実施例
と同様に文書指定を行ない、以下、同様の処理の流れに
従って共起関係や単語頻度算出などの文脈情報抽出処理
を行なう。
[発明の効果コ 以上のようにこの発明によれば、かな漢字変換により文
書を作成する際に、これから入力しようとする分野の文
脈情報を入力する前に、既存の文書から同じ分野の文書
について文脈解析し、共起関係の抽出や単語頻度の算出
を行なってその文脈解析結果を登録しておき、かな漢字
変換時に参照できるようにしているために、入力するひ
らがな文字列のかな漢字変換において共通する分野の文
脈情報を参照することができ、効率良くかな漢字変換で
きて、文書作成の効率を向上させることができる。
【図面の簡単な説明】
第1図はこの発明の一実施例のブロック図、第2図は上
記実施例における文脈情報抽出部の詳しい構成を示すブ
ロック図、第3図は上記実施例の画面構成例を示す説明
図、第4図は上記実施例で文脈情報格納部が格納する共
起関係のフォーマットを示す説明図、第5図は上記実施
例で文脈情報格納部が格納する単語頻度情報のフォーマ
ットを示す説明図、第6図はこの発明の第2実施例によ
る画面構成例を示す説明図、第7図はこの発明の第3実
施例の文書指定部の詳しい構成を示すブロック図、第8
図は第3実施例の画面構成例を示す説明図、第9図はこ
の発明の第4実施例の文脈情報抽出部の詳しい構成を示
すブロック図、第10図は第4実施例で抽出したユーザ
辞書のフォーマットを示す説明図、第11図はこの発明
の第5実施例のブロック図、第12図は第5実施例の文
書管理部による画面表示例を示す説明図である。 11・・・文書指定部   12・・・文書読み出し部
13・・・文脈情報抽出部 14・・・文脈情報格納部
15・・・ひらがな入力部 16・・・かな漢字変換部
17・・・文脈情報制御部 18・・・文書表示編集部
19・・・文書管理部  131・・・1文読み込み部
132・・・形態素解析部 133・・・共起関係抽出
部134・・・単語頻度産出部 135・・・ユーザ辞書登録部 第 1 図

Claims (2)

    【特許請求の範囲】
  1. (1)既存のかな漢字混じり文の保存文書を指定するた
    めの文書指定手段と、 この文書指定手段により指定された文書の文脈解析を行
    う文脈解析手段と、 この文脈解析手段による文脈解析結果を登録する文脈解
    析結果登録手段と、 かな文字列を入力するための入力手段と、 この入力手段により入力されたかな文字に対し、前記文
    脈解析結果登録手段により登録されている文脈解析結果
    を参照しながら漢字かな混じり文に変換するかな漢字変
    換手段とを備えて成るかな漢字変換装置。
  2. (2)文脈解析手段は前記文書の共起関係の抽出及び単
    語頻度の算出を行なうものである請求項1記載のかな漢
    字変換装置。
JP2202395A 1990-08-01 1990-08-01 かな漢字変換装置 Pending JPH0488553A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2202395A JPH0488553A (ja) 1990-08-01 1990-08-01 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2202395A JPH0488553A (ja) 1990-08-01 1990-08-01 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH0488553A true JPH0488553A (ja) 1992-03-23

Family

ID=16456787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2202395A Pending JPH0488553A (ja) 1990-08-01 1990-08-01 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0488553A (ja)

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
EP0201324B1 (en) Language forming system
JPH05120324A (ja) 言語処理方式
JPH10105555A (ja) 対訳例文検索装置
JPH0488553A (ja) かな漢字変換装置
JP2621999B2 (ja) 文書処理装置
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP2958044B2 (ja) かな漢字変換方法及び装置
JPH0561902A (ja) 機械翻訳システム
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JP2682048B2 (ja) 文章処理装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JPH0612453A (ja) 未知語抽出登録装置
JPH0350668A (ja) 文字処理装置
JP2819765B2 (ja) 外国語電子辞書検索方式
JP5454871B2 (ja) 辞書評価支援装置およびプログラム
Patton Review of Am Faclair Beag online Gaelic-English Dictionary
JPS6389976A (ja) 言語解析装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPS63115264A (ja) 文書処理装置
JPH03129562A (ja) インデックス作成支援装置
JPH05151199A (ja) 文書作成装置
JP2001167093A (ja) 外国語電子辞書の生成、検索のための方法および装置
JPH04130577A (ja) 自然言語処理装置