JP2000181909A - 辞書学習方法及び文書作成装置 - Google Patents

辞書学習方法及び文書作成装置

Info

Publication number
JP2000181909A
JP2000181909A JP10362087A JP36208798A JP2000181909A JP 2000181909 A JP2000181909 A JP 2000181909A JP 10362087 A JP10362087 A JP 10362087A JP 36208798 A JP36208798 A JP 36208798A JP 2000181909 A JP2000181909 A JP 2000181909A
Authority
JP
Japan
Prior art keywords
word
dictionary
document
conversion
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10362087A
Other languages
English (en)
Inventor
Satoru Nakajima
覚 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10362087A priority Critical patent/JP2000181909A/ja
Publication of JP2000181909A publication Critical patent/JP2000181909A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】元となった文書に合った辞書学習をしておくこ
とで、文書作成時の日本語変換を効率化する方法及び装
置の提供。 【解決手段】入力された文書内の漢字単語又は複合語に
ついて、日本語変換用辞書が用いられる前に、該単語又
は複合語が辞書に漢字情報として登録されているか否か
検索し、辞書内に前記単語又は複合語が登録されている
場合には、前記単語又は複合語がすでに使用された状態
となるように変換の優先順位を設定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書作成編集装置
に関し、特に、かな漢字変換機能のための単語辞書の学
習技術に関する。
【0002】
【従来の技術】従来のワードプロセッサ、もしくはワー
プロソフトをインストールしたパソコンの日本語変換シ
ステムには、かな入力もしくはローマ字入力された文字
列をかな漢字変換する際に、一度使用した単語につい
て、単語辞書において、同音語(同じ読み仮名)の漢字
候補に関する変換優先度を更新するという学習機能を具
備している。この辞書学習機能により、頻繁に使用する
単語の変換についてはそのヒット率が向上し、入力作業
が向上する。
【0003】
【発明が解決しようとする課題】ところで、同じ読みが
なでもビジネス用途で使用する場合と、例えば趣味等で
使用するの場合では、必要とされる変換形態は、必ずし
も一致しない。
【0004】例えばビジネス用途で使用したパソコンの
ワープソフトで、ビジネスとはジャンルの異なるその他
の文書を作成する場合、単語辞書には、ビジネス文書に
関連した優先順位がすでに設定されており、必要な単語
候補を探し出すのに時間を要することになる。
【0005】そして、利用者が、ワープロソフトを用い
て、文書を作成する場合、全く新規に一から作成すると
いうことはむしろ希であり、すでに作成済みの文書を例
えば雛型としてこれを修正、補充して作成したり、引用
したりすることが多い。
【0006】なお、特開平3−257575号公報に
は、ひらがなから漢字への変換時に同音語の優先順位を
付け、文書入力終了時に文書データに付随させて記憶
し、次回以降の文書校正時にひらがなから漢字へのヒッ
ト率を向上させるようにした日本語ワードプロセッサが
提案されている。しかしながら、上記公報に記載のワー
ドプロセッサの場合、文書入力終了時に優先データ格納
メモリの内容を文書データに付随させて磁気記録媒体に
記憶するというものであり、専用のファイル形式が必要
とされ、汎用のワープロソフトへの適用性に乏しい。
【0007】したがって、本発明は、上記問題点の認識
と知見に基づき創案されたものであって、元となった文
書に合った辞書学習を行うことで、文書作成時の日本語
変換を効率化する方法及び装置を提供することにある。
【0008】
【課題を解決するための手段】前記目的を達成する本発
明は、日本語ワープロソフト等で入力された文書内の単
語について、日本語変換辞書を使用する前に、辞書に学
習させることで、文書の作成・編集作業を効率化するも
のである。
【0009】本発明は、入力された文書内の漢字単語又
は複合語について、日本語変換用辞書が用いられる前
に、前記単語又は複合語が前記辞書に漢字情報として登
録されているか否か検索し、前記辞書内に前記単語又は
複合語が登録されている場合にが、前記単語又は複合語
がすでに使用された状態となるように変換の優先順位を
設定する、ことを特徴とする。
【0010】
【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明は、その好ましい実施の形態におい
て、入力した文書ファイルについて、前記文書ファイル
内の単語を抽出する手段と、前記抽出された単語につい
て前記単語が日本語変換用の単語辞書に存在するか検索
する手段と、前記単語が前記単語辞書に存在する場合
に、前記単語を前記単語辞書に学習させ、前記単語につ
いて、単語辞書が用いられる前に、前記単語辞書内を検
索し、前記単語辞書内の前記単語に関する優先順位を上
げる手段と、を備える。
【0011】本発明の実施の形態について、図1に示す
文書例を参照して説明する。入力文書A(ファイル)に
は、「日本語変換処理における効率的な入力方法の考
察。」及び「1.1 はじめに 御社の在庫管理・・
・」等の文章が記載されている。ワープロソフトに読み
込まれた入力文書A内の単語「考察」(単語1)は、そ
の文書の利用目的等属性から判断して、「考察」と同じ
読みがなを持つ単語、すなわち同音語である「高察」
(単語2)や「絞殺」(単語3)に比べて、再び利用さ
れる可能性が高い。
【0012】そこで、同文書が開かれたタイミングで、
文書内の単語を探し、日本語辞書内に、同一単語が存在
した場合には、当該単語を一度使用したものとして学習
させる。
【0013】また、入力文書A内には二つ以上の単語が
結合してできた複合語として例えば「在庫管理」が存在
する。この複合語は、日本語辞書内に存在する「在庫」
(単語4)と「管理」(単語5)の単語を組み合わせて
構成されている。
【0014】このような文書内の複合語についても、単
語の場合と同様に、日本語辞書内に学習させる。
【0015】このようにして、入力文書を読み込み際に
該文書に合った辞書学習を予め行い効率のよい文書作成
を可能にする。
【0016】本発明の実施の形態において、(a)入力
した文書ファイルについて、前記文書ファイル内の単語
を抽出する処理(図3のA2)と、(b)前記抽出され
た単語について前記単語が日本語変換用の単語辞書に存
在するか検索する処理(図3のA3)と、(c)前記単
語が前記単語辞書に存在する場合に、前記単語を前記単
語辞書に学習させ、前記単語のについて、単語辞書が用
いられる前に、前記単語辞書内を検索し、前記単語辞書
内の前記単語に関する優先順位を上げる処理(図3のA
4)と、の上記(a)〜(c)の処理は、ワードプロセ
ッサもしくはワープロソフトを実装したコンピュータ上
でプログラムを実行させることで実現される。この場
合、該プログラムを記録した記録媒体から読み出しコン
ピュータの主記憶に該プログラムを読み込み、実行する
ことで、上記各処理の機能が実現される。
【0017】
【実施例】本発明の実施例について図面を参照して以下
に説明する。図2は、本発明の一実施例をなす文書作成
装置の構成を示すブロック図である。図2を参照する
と、本実施例は、キーボード等の入力装置1と、ハード
ディスクやフロッピィディスク等の補助記憶装置2と、
プログラム制御により動作するデータ処理装置3と、情
報を記憶する記憶装置4と、ディスプレイ装置や印字装
置等の出力装置5を含む。
【0018】補助記憶装置2は、編集される文書ファイ
ル21を備えており、記憶装置4は辞書記憶部41を備
えている。
【0019】辞書記憶部41は、見出し語(単語又は複
合語)として、該単語の読みがなと変換後の漢字の情
報、及び読みがなにおける変換の順位を定義する優先順
位を予め記憶している。この優先順位は、単語の使用履
歴に応じて日本語変換の際の変換の順位が可変させるた
めのものである。
【0020】データ処理装置3は、文書の入力指示手段
31と、文書内の単語学習手段32を備える。
【0021】文書の入力指示手段31では入力装置1か
ら与えられた文書ファイル名を元に補助記憶装置2より
該当する文書ファイル21を読み出す。
【0022】文書内の単語学習手段32は入力された文
書ファイル21内に記憶されている単語を抽出し、辞書
記憶部41を検索して、同一の漢字情報を持つかを検索
し、存在する場合には、当該単語を一度日本語変換して
使用したことがあるものとして、辞書記憶部41の日本
語変換の優先度を更新させる。
【0023】図3は、本発明の一実施例の動作について
説明するためのフローチャートである。図2及び図3を
参照して、本実施例の動作について詳細に説明する。
【0024】まず、文書の入力指示手段31により入力
装置1から指定された文書ファイル21を補助記憶装置
2から入力する(図3のステップA1)。ここで入力さ
れた文書ファイルの内容は次の文書内の単語学習手段3
2に供給される。
【0025】入力された文書ファイルを走査し、先頭か
ら順に単語(例えば漢字)を抽出する(ステップA
2)。
【0026】ステップA2で抽出された単語(漢字)に
ついて、読み仮名、変換後の漢字情報、優先順位情報を
有する辞書記憶部41の中の変換後の漢字情報のフィー
ルドを検索し、同一の漢字情報が登録されているか否か
を判定する(ステップA3)。
【0027】辞書記憶部41が、同一の漢字情報を持つ
場合には、その単語が一度変換された履歴があるものと
して、辞書記憶部41の変換候補の日本語変換優先度を
更新する(ステップ4)。
【0028】以上ステップA2からA4までのステップ
を文書ファイル21内の単語全てにおいて繰り返す(ス
テップA5)。
【0029】次に、具体例を用いて説明する。
【0030】図1に示すように、入力された文書Aにお
いて抽出された単語「考察(こうさつ)」(単語1)に
ついては、同じ読みがなを持つ単語として「高察」(単
語2)、「絞殺」(単語3)が辞書記憶部41内に存在
していたとする。
【0031】日本語変換時の優先順位が、それぞれ、
「考察(こうさつ)」(単語1)は、「2」、「高察」
(単語2)は「1」、「絞殺」(単語3)は「3」であ
った場合、本発明の機能を具備しない、通常の日本語変
換では第1候補として、「高察」が出力装置5に表示さ
れる。
【0032】一方、本実施例では、文書内の単語学習手
段32において、「考察」(単語1)が辞書記憶部41
に存在するか検索する(ステップA3)。この場合、存
在しているため、同単語の変換優先順位を、「考察」→
「1」、「高察」→「2」、「絞殺」→「3」と更新す
る(ステップA4)。
【0033】これにより、「こうさつ」に対する日本語
変換では、第一候補が「考察」(単語1)となる。すな
わち、図1に示す日本語辞書の状態となる。
【0034】また複数の単語を連接した複合語について
も、これが辞書に既に登録済みの場合には、辞書内の変
換優先順位を上げる。あるいは、複合語を構成する各単
語について辞書内の優先順位を上げるようにしてもよ
い。
【0035】
【発明の効果】以上説明したように、本発明によれば、
下記記載の効果を奏する。
【0036】本発明の第1の効果は、同一形式の文書作
成を効率化する、ということである。
【0037】その理由は、本発明においては、元となる
文書のワープロソフト等への読み込み時、文書内で使わ
れている定形的な使い回しを予め辞書に学習しておくた
め、作業開始時点から、日本語変換を効率よく行われる
ためである。
【0038】本発明の第2の効果は、同一のパソコンを
複数人で使用している場合において、日本語変換に際し
て、各人の日本語変換の好みを反映できる、ということ
である。
【0039】その理由は、一般に、文書作成に際して、
全く新規に作成するということは希であり、通常、過去
に自分で作成した文書を利用することが圧倒的に多いと
いうのが実状であり、このため、各人が、それぞれ、比
較的よく使う単語を予め辞書に学習し、日本語変換が各
人に合ったものとなるためである。
【0040】また、本発明によれば、上記特開平3−2
57575号等と相違して、文書ファイルに優先データ
を付随させて記憶する必要はなく、標準の文書ファイル
に対してそのまま適用できる。
【図面の簡単な説明】
【図1】本発明の一実施例を説明するための文章、及び
変換優先順位を説明するための図である。
【図2】本発明の一実施例の構成を示す図である。
【図3】本発明の一実施例の処理手順を示す流れ図であ
る。
【符号の説明】
1 入力装置 2 補助記憶装置 21 文書ファイル 3 データ処理装置 31 文書の入力指示手段 32 文書内の単語学習手段 4 記憶装置 41 辞書記憶部 5 出力装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】入力された文書中の単語について、単語辞
    書が用いられる前に、前記単語を前記単語辞書に学習さ
    せ、前記単語辞書内であたかも前記単語が使用された状
    態となるような値に、前記単語の変換の優先順位を設定
    する、ことを特徴とする、日本語変換の辞書学習方法。
  2. 【請求項2】入力された文書中の漢字単語又は複合語に
    ついて、日本語変換用辞書が用いられる前に、前記単語
    又は複合語が前記辞書に漢字情報として登録されている
    か否か検索し、前記辞書内に前記単語又は複合語が登録
    されている場合には、前記単語又は複合語がすでに変換
    がなされた状態となるように変換の優先順位を設定す
    る、ことを特徴とする、日本語変換の辞書学習方法。
  3. 【請求項3】入力された文書内の単語について、単語辞
    書が用いられる前に、前記単語辞書内を検索し、前記単
    語辞書内に前記単語が存在する場合、前記単語辞書内の
    前記単語に関する変換の優先順位を、前記単語がすでに
    使用された状態に設定する手段を備えたことを特徴とす
    る文書作成装置。
  4. 【請求項4】入力された文書について、日本語変換用の
    辞書が用いられる前に、前記文書中の漢字単語又は複合
    語を抽出し、前記単語又は複合語が前記辞書内に漢字情
    報として登録されているか否か検索する手段と、 前記辞書内に前記単語又は複合語が登録されている場合
    には、前記辞書が用いられる前でありながら、前記単語
    又は複合語がすでに変換がなされた状態となるように前
    記単語又は複合語の変換の優先順位を上げる手段と、 を備えたことを特徴とする文書作成装置。
  5. 【請求項5】入力した文書ファイルについて、前記文書
    ファイル内の単語を抽出する手段と、 前記抽出された単語について前記単語が日本語変換用の
    単語辞書に存在するか検索する手段と、 前記単語が前記単語辞書に存在する場合に、前記単語を
    前記単語辞書に学習させ、前記単語について、単語辞書
    が用いられる前に、前記単語辞書内の前記単語に関する
    優先順位を上げる手段と、 を備えたことを特徴とする文書作成装置。
  6. 【請求項6】(a)入力した文書ファイルについて、前
    記文書ファイル内の単語を抽出する処理と、 (b)前記抽出された単語について前記単語が日本語変
    換用の単語辞書に存在するか検索する処理と、 (c)前記単語が前記単語辞書に存在する場合、前記単
    語を前記単語辞書に学習させ、前記単語について、単語
    辞書が用いられる前に、前記単語辞書内の前記単語に関
    する優先順位を上げる処理と、 の上記(a)〜(c)の処理を、ワードプロセッサもし
    くはワープロソフトを実装したコンピュータ上で実行さ
    せるためのプログラムを記録した記録媒体。
JP10362087A 1998-12-21 1998-12-21 辞書学習方法及び文書作成装置 Pending JP2000181909A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10362087A JP2000181909A (ja) 1998-12-21 1998-12-21 辞書学習方法及び文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10362087A JP2000181909A (ja) 1998-12-21 1998-12-21 辞書学習方法及び文書作成装置

Publications (1)

Publication Number Publication Date
JP2000181909A true JP2000181909A (ja) 2000-06-30

Family

ID=18475865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10362087A Pending JP2000181909A (ja) 1998-12-21 1998-12-21 辞書学習方法及び文書作成装置

Country Status (1)

Country Link
JP (1) JP2000181909A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094786A (ja) * 2005-09-29 2007-04-12 Sanyo Electric Co Ltd 携帯端末機

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094786A (ja) * 2005-09-29 2007-04-12 Sanyo Electric Co Ltd 携帯端末機

Similar Documents

Publication Publication Date Title
US6782384B2 (en) Method of and system for splitting and/or merging content to facilitate content processing
JP2004348591A (ja) 文書検索方法及び装置
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP5430312B2 (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2004318510A (ja) 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法
JP2006065477A (ja) 文字認識装置
JP5342760B2 (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP2000181909A (ja) 辞書学習方法及び文書作成装置
JPH0877196A (ja) 文書情報抽出装置
JPS61248160A (ja) 文書情報登録方式
JP2000339310A (ja) 文書分類方法、文書分類装置、およびプログラムを記録する記録媒体
JP4187802B2 (ja) 文書作成装置
JP2000285112A (ja) 予測入力装置及び予測入力方法並びに記録媒体
JPH07325826A (ja) 日本語処理システム
JP3832613B2 (ja) 自動要約装置および自動要約プログラムを記録した記録媒体
JP3952009B2 (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP2000330984A (ja) 文書処理装置及び方法
JP2000029882A (ja) 要約文作成装置
JP3884807B2 (ja) 文書処理方法及びその装置
JP3048793B2 (ja) 文字変換装置
JPH0969104A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS6389976A (ja) 言語解析装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010925