JPH0683809A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0683809A
JPH0683809A JP4231941A JP23194192A JPH0683809A JP H0683809 A JPH0683809 A JP H0683809A JP 4231941 A JP4231941 A JP 4231941A JP 23194192 A JP23194192 A JP 23194192A JP H0683809 A JPH0683809 A JP H0683809A
Authority
JP
Japan
Prior art keywords
word
word pair
character string
related information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4231941A
Other languages
English (en)
Inventor
Shinji Kawamoto
真司 川本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP4231941A priority Critical patent/JPH0683809A/ja
Publication of JPH0683809A publication Critical patent/JPH0683809A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】単語間の関連情報を同音異義語の候補選択の際
に利用する機能を具えた文書処理装置において、かな漢
字変換の際に、ユーザによる関連情報の登録作業の負担
を軽減する。 【構成】かな漢字変換によって確定された文字列は形態
素解析装置13に送られ、形態素解析される。形態素解
析装置13は解析結果の文字列から係り受け関係にある
単語対を抽出し、係り受け情報制御装置16を通じて係
り受け情報記憶部17に格納する。係り受け情報制御装
置16は格納した単語対の使用頻度が所定の閾値を越え
たかどうかをチェックしており、その単語対の使用頻度
が閾値を越えた場合は、その単語対を係り受け情報記憶
部17から取り出し、関連情報辞書制御装置19を通じ
て関連情報辞書18に登録する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、単語間の関連情報を
同音異義語の候補選択の際に利用する機能を具えた日本
語文章処理装置に関する。
【0002】
【従来の技術】日本語文章処理装置においては、かな又
はローマ字で入力した読みに対して漢字変換を指示する
と、その読みに対する漢字が単語辞書で検索され、かな
漢字混じり文に変換される。この際、同音異義語を含む
多くの解析結果の候補が検出されたときは、なんらかの
手段によって最優先の候補を選出する必要がある。その
一つとして、特開平1−229367号公報には、ある
単語とそれに関連する語を対にして格納した関連情報辞
書の情報を利用し、同一文章内の他の語と関連のある語
を同音異義語の候補の中から優先的に出力するようにし
た文字処理装置が提案されている。
【0003】
【発明が解決しようとする課題】しかしながら、関連情
報辞書にあらかじめ登録されている関連情報だけでは、
ユーザの入力する種々の文章に対応することは困難であ
った。また、必要とする関連情報をユーザ自身が登録す
ることもできるが、文章内の単語どうしが関連している
か否かを判断するには、ある程度の知識と熟練を必要と
するため、専門的な知識を持たないユーザには、大きな
負担となっていた。
【0004】この発明は、かな漢字変換の際に、ユーザ
による関連情報の登録作業の負担を軽減するようにした
文書処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、この発明に係わる文書処理装置は、単語ごとの情報
を保持する単語辞書と、単語間の関連情報を保持する関
連情報辞書と、文字列の形態素解析を行う形態素解析手
段とを有し、文字列の変換候補を表示して操作者の候補
の選択指示によって変換文字列を確定する文書処理装置
において、前記形態素解析手段により解析された文字列
から、係り受け関係にある単語対を抽出する単語対抽出
手段と、前記確定された文字列の係り受け関係にある単
語対を一時的に保持する単語対保持手段と、前記抽出さ
れた係り受け関係にある単語対のうち、使用頻度の高い
単語対を選択する選択手段と、前記選択された単語対を
前記関連情報辞書手段に登録する単語対登録手段とを具
えたことを特徴とする。
【0006】
【作用】かな漢字変換後、確定された文字列は形態素解
析手段に送られ、形態素解析される。単語対抽出手段は
解析結果を参照し、文字列から係り受け関係にある単語
対を抽出する。抽出された単語対は一時的に単語対保持
手段に格納される。選択手段は単語対保持手段に格納さ
れた単語対の使用頻度が所定の閾値を越えたかどうかを
チェックしており、その単語対の使用頻度が閾値を越え
た場合は、その単語対を単語対保持手段から取り出し、
単語対登録手段を通じて関連情報辞書手段に登録する。
【0007】
【実施例】以下、この発明に係わる文書処理装置を日本
語文章処理装置に適用した場合の一実施例を図面を参照
しながら説明する。
【0008】図1は、この実施例における日本語文章処
理装置の全体的な構成を示すブロック図である。図1に
おいて、11はひらがな、英文字などの文字キーと、か
な漢字変換キーなどの機能キーを具えた入力装置、12
は入力装置から入力された文字列の読みに対応する漢字
を単語辞書で検索し、かな漢字変換するかな漢字変換処
理部、13はかな漢字変換処理部で確定された文字列の
形態素解析を行うとともに、解析結果から係り受け関係
にある単語対を抽出する形態素解析装置、14は単語ご
との情報を格納した単語辞書、15は単語辞書の情報を
検索する単語辞書検索装置、16は形態素解析装置から
出力された係り受け関係にある単語対を係り受け情報記
憶部に格納するとともに、前記係り受け関係にある単語
対のうち、使用頻度の高い単語対を選択する係り受け情
報制御装置、17は確定された文字列の係り受け関係に
ある単語対を一時的に保持する係り受け情報記憶部、1
8は単語間の関連情報を格納した関連情報辞書、19は
関連情報辞書の制御を行う関連情報辞書制御装置であ
る。
【0009】係り受け情報制御装置16では、係り受け
情報記憶部17に格納した単語対の使用頻度を格納した
回数によってチェックしている。すなわち、係り受け情
報記憶部17に格納するたびに使用頻度のカウンタをイ
ンクリメントし、格納した回数が所定の閾値を越えた場
合は、使用頻度の高い単語対として選択する。
【0010】次に、上記日本語文章処理装置のかな漢字
変換後の動作手順を示す図2のフローチャートを参照し
ながら、実際の関連情報入力処理について説明する。
【0011】まず、形態素解析装置13はかな漢字変換
処理部12で確定された文字列を受け取り(ステップ1
01)、形態素解析を行う(ステップ102)。続い
て、解析結果を参照し、係り受け関係にある単語対があ
るかどうかを調べる(ステップ103)。ここで、係り
受け関係にある単語対がないときは、次の確定文字列を
解析する。また、係り受け関係にある単語対があるとき
は、係り受け関係にある単語対を確定文字列から所定の
条件に基づいて抽出し(ステップ104)、抽出した単
語対を係り受け情報制御装置16を通じて係り受け情報
記憶部17に格納する(ステップ105)。係り受け情
報制御装置16は、格納した単語対の使用頻度が閾値を
越えたかどうかをチェックし(ステップ106)、閾値
を越えていないならば、その単語対の使用頻度のカウン
タをインクリメントする(ステップ107)。また、閾
値を越えたならば、その単語対の情報を関連情報辞書制
御装置19に送り、関連情報辞書18に登録する。
【0012】次に、上述した関連情報入力処理の具体例
を説明する。
【0013】ここでは、図3に示すように「わたしはだ
いどころでえびのてんぷらをあげていた」というかな文
字列をかな漢字変換し、「私は台所で海老の天ぷらを揚
げていた」というかな漢字混じり文字列を得て確定した
場合を例に説明する。まず、このかな漢字混じり文を形
態素解析装置13で形態素解析し、図4に示すような係
り受け関係の情報を取り出す。そして、これらの係り受
け関係にある単語対の中から、関連情報辞書に必要な単
語対を抽出する。例えば、関連情報辞書18に用言と体
言の関連語対の情報が保持されている場合は、図5に示
すように係り受け関係にある単語対のうち、用言と体言
の単語対のみを抜き出し、それらの単語対を係り受け情
報記憶部17に登録する。図6は係り受け情報記憶部1
7のデータ構造を表したもので、図5に示した単語対を
反映する前の状態を表している。ここで、図6に示すよ
うな係り受け情報記憶部に[私]−[揚げる]、[台
所]−[揚げる]、[天ぷら]−[揚げる]の3つの単
語対を登録する場合を考える。なお、使用頻度の閾値は
2とする。
【0014】単語対[私]−[揚げる]は未登録の単語
対なので、新しいエントリとして使用頻度1で登録され
る。単語対[台所]−[揚げる]は係り受け情報記憶部
17にすでに登録されているので、使用頻度を2にイン
クリメントする。単語対[天ぷら]−[揚げる]も同様
にすでに登録されているので、使用頻度を3にインクリ
メントする。図7はこれらの単語対を反映した後の係り
受け情報記憶部17のデータ構造を表したものである。
ここで、単語対[天ぷら]−[揚げる]の使用頻度は閾
値である2を越えたため、係り受け情報制御装置16は
この単語対を関連情報辞書制御装置18に送る。関連情
報辞書制御装置18は、[天ぷら]−[揚げる]を関連
語対として関連情報辞書19に登録する。
【0015】これによれば、係り受け関係にある単語対
の中で使用頻度の高い単語対が自動的に関連語対として
関連情報辞書に登録されるので、ユーザは単語どうしの
関連の有無などをを意識することなしに、必要とする関
連情報の登録を行うことができる。
【0016】
【発明の効果】以上説明したように、この発明に係わる
文書処理装置においては、かな漢字変換の際、確定した
文字列中で係り受け関係にある単語対を抽出し、その中
で使用頻度の高い単語対を関連語対として関連情報辞書
に登録するようにしたため、ユーザによる関連情報の登
録作業の負担を軽減することができる。したがって、関
連情報を登録するだけの知識や熟練を持たないユーザで
も、特に単語どうしの関連性などを意識することなし
に、入力文章に対応した関連情報を活かして、それ以降
のかな漢字変換を効率良く行うことができる。
【図面の簡単な説明】
【図1】日本語文章処理装置の全体的な構成を示すブロ
ック図。
【図2】日本語文章処理装置のかな漢字変換後の動作手
順を示すフローチャート。
【図3】かな漢字変換前のかな文字列と確定したかな漢
字混じり文字列の具体例を示す図。
【図4】確定文字列の係り受け関係を示す概念図。
【図5】係り受け関係にある単語対のうち、用言と体言
の単語対を抽出した状態を表した図。
【図6】確定文字列の解析結果を反映する前の係り受け
情報記憶部のデータ構造を示す図。
【図7】確定文字列の解析結果を反映した後の係り受け
情報記憶部のデータ構造を示す図。
【符号の説明】
11…入力装置、12…かな漢字変換処理部、13…形
態素解析装置、14…単語辞書、15…単語辞書検索装
置、16…係り受け情報制御装置、17…係り受け情報
記憶部、18…関連情報辞書、19…関連情報辞書制御
装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】単語ごとの情報を保持する単語辞書手段
    と、単語間の関連情報を保持する関連情報辞書手段と、
    文字列の形態素解析を行う形態素解析手段とを有し、文
    字列の変換候補を表示して操作者の候補の選択指示によ
    って変換文字列を確定する文書処理装置において、 前記形態素解析手段により解析された文字列から係り受
    け関係にある単語対を抽出する単語対抽出手段と、 前記抽出された係り受け関係にある単語対を保持する単
    語対保持手段と、 前記抽出された係り受け関係にある単語対のうち、使用
    頻度の高い単語対を選択する選択手段と、 前記選択された単語対を前記関連情報辞書手段に登録す
    る単語対登録手段と、 を具えたことを特徴する文書処理装置。
JP4231941A 1992-08-31 1992-08-31 文書処理装置 Pending JPH0683809A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4231941A JPH0683809A (ja) 1992-08-31 1992-08-31 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4231941A JPH0683809A (ja) 1992-08-31 1992-08-31 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0683809A true JPH0683809A (ja) 1994-03-25

Family

ID=16931466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4231941A Pending JPH0683809A (ja) 1992-08-31 1992-08-31 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0683809A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266947A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2015045833A (ja) * 2013-07-31 2015-03-12 日本電信電話株式会社 発話文生成装置とその方法とプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266947A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2015045833A (ja) * 2013-07-31 2015-03-12 日本電信電話株式会社 発話文生成装置とその方法とプログラム
JP2018195331A (ja) * 2013-07-31 2018-12-06 日本電信電話株式会社 発話文生成装置とその方法とプログラム

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH03185561A (ja) 欧文単語入力方法
JP2806452B2 (ja) かな漢字変換装置および方法、並びに記録媒体
JPH0683809A (ja) 文書処理装置
JP3622841B2 (ja) かな漢字変換装置およびかな漢字変換方法
JP3036005B2 (ja) かな漢字変換装置
JPS6325766A (ja) 日本語入力装置
JPH08263471A (ja) 情報処理装置
JP2833650B2 (ja) 文書処理装置
JPH02255944A (ja) かな漢字変換装置
JPH01126767A (ja) 辞書参照装置
KR100248388B1 (ko) 언어분석에 기반한 전자사전 서비스 방법 및 그 시스템
JPS63136264A (ja) 機械翻訳装置
JPH0561855A (ja) 日本語処理装置
JPH11259472A (ja) 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体
JPH03176758A (ja) かな漢字変換装置
JPH06290219A (ja) 文字検索機能付き文書処理装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH05233686A (ja) 日本語処理装置
JPH02250148A (ja) 文字処理装置
JPH1185751A (ja) 翻訳装置及び翻訳装置制御プログラムを記憶した媒体
JPH0973460A (ja) 文書検索装置
JPH02250145A (ja) 文字処理装置
JPH08153098A (ja) 文書作成装置及び方法
JPH04296970A (ja) 文章検査装置