JPH0683812A - 文書入力装置のかな漢字変換装置 - Google Patents
文書入力装置のかな漢字変換装置Info
- Publication number
- JPH0683812A JPH0683812A JP4231671A JP23167192A JPH0683812A JP H0683812 A JPH0683812 A JP H0683812A JP 4231671 A JP4231671 A JP 4231671A JP 23167192 A JP23167192 A JP 23167192A JP H0683812 A JPH0683812 A JP H0683812A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- field
- unit
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
従来に比して軽減すること。 【構成】 文書入力装置のかな漢字変換装各分野の単語
を各単語毎の読み情報と使用頻度情報と共に分野別に格
納した分野別単語辞書を記憶する辞書記憶部1を用い、
辞書記憶部1が記憶している分野別単語辞書の各単語の
使用頻度情報と重み付け部7により分野別単語辞書毎に
設定された重み付け値との演算値により単語出力優先順
位を決定し、この単語出力優先順に、入力された読み情
報に対応する単語の出力を行う。
Description
サの如き文書入力装置に於いて使用されるかな漢字変換
装置に関し、特に単語辞書を使用してかな漢字変換を行
うかな漢字変換装置に関するものである。
装置に於いては、かな文入力されたなか文字列を漢字混
じりの文字列に変換するかな漢字変換装置が組み込まれ
ている。
置は、一般に、単語を各単語毎に読み情報と使用頻度情
報と共に格納した単語辞書を使用し、キーボードより入
力されたかな文(読み情報)に対応する同音異議の単語
単語を、使用頻度情報よって決定される出力優先順位が
高いものより順に単語辞書より読み出し、これを表示装
置等へ出力し、また使用を選択決定された単語の単語辞
書に於ける使用頻度情報を更新する学習を行うようにな
っている。
長く使用されるほど、学習効果が生じ、よく使用される
単語ほど最初に表示され、単語選択の手間が省かれるよ
うになる。
な漢字変換装置に於いては、単語辞書の単語数が多いほ
ど、単語によるかな漢字変換が行われ、一文字ずつかな
漢字変換する手間が省かれる反面、単語辞書より同音異
議語として出力される単語の個数が増加し、単語選択に
手間がかかるようになると云うトレードオフの関係が生
じる。
経済法律用語、工学用語、医学用語、生物用語、固有名
詞等、分野別に分類することが可能であり、作成する文
書の種類によっては、或る特定の分野の単語を多く使用
し、他の分野の単語はあまり使用しないことがある。
には、「昼」、「蛭」等があり、「昼」は一般用語であ
って一般文にて多く使用されるが、「蛭」は生物用語で
あって、「蛭」は生物関連の論文等に使用されても一般
文ではあまり使用されることはなく、また「そうさ」と
云う読みの同音異議語には、「走査」、「捜査」等があ
り、「走査」は工学用語として工学関係の文書にて使用
されが、「捜査」は政治経済法律関係文にて使用されて
も工学関係の文書にて使用されることはない。
於いては、単語の使用頻度の学習だけで、よく使用され
る単語ほど最初に表示されるだけであるため、作成する
文書の分野が変わると、これまでの学習効果により、必
ずしも適切な単語が第一候補として出力されることがな
く、とんでもない単語が最初に表示されることがあり、
単語選択に手間がより一層かかるようになる。
る上述の如き問題点に着目してなされたものであり、作
成する文書の分野が変わっても、各分野の文書入力に於
いて適切な単語が第一候補として出力される確率を向上
し、単語選択の手間を従来に比して軽減でき、また既存
文書の訂正等に際しても適切な単語が第一候補として出
力される確率を向上し、単語選択の手間を従来に比して
軽減できる文書入力装置のかな漢字変換装置を提供する
ことを目的としている。
明によれば、各分野の単語を各単語毎の読み情報と使用
頻度情報と共に分野別に格納した分野別単語辞書を記憶
する辞書記憶部と、前記辞書記憶部が記憶している分野
別単語辞書の各々に重み付け値を個別に変更可能に設定
する重み付け部と、前記辞書記憶部が記憶している分野
別単語辞書の各単語の使用頻度情報と前記重み付け部に
より分野別単語辞書毎に設定された重み付け値との演算
値により単語出力優先順位を決定する単語出力優先順位
決定部と、入力された読み情報に対応する単語を前記辞
書記憶部が記憶している分野別単語辞書より前記単語出
力優先順位決定部が決定した単語出力優先順位が高いも
の順に出力する単語出力部と、前記単語出力部が出力し
た単語より使用を選択決定された単語の前記分野別単語
辞書に於ける使用頻度情報を更新する使用頻度情報更新
部とを有していることを特徴とする文書入力装置のかな
漢字変換装置によって達成される。
語が第一候補として出力される確率を向上させると云う
目的を達成するために本発明によるかな漢字変換装置
は、上述のかな漢字変換装置の構成要件に加えて、編集
中の既入力の文書が使用している単語を抽出する使用単
語抽出部と、前記使用単語抽出部が抽出した単語の個数
を、対応する単語を格納している分野別単語辞書毎に計
数する分野別単語使用数計数部と、前記分野別単語使用
数計数部が計数した分野別単語使用数に応じて前記重み
付け部が設定する重み付け値を分野別単語辞書毎に決定
する既存文書対応重み付け値決定部とを有していること
を特徴としている。
ている分野別単語辞書の各単語の使用頻度情報と重み付
け部により分野別単語辞書毎に設定された重み付け値と
の演算値により単語出力優先順位が決定され、この単語
出力優先順に、入力された読み情報に対応する単語の出
力が行われる。
ついて詳細に説明する。
む文書入力装置の一実施例を示している。図1に於い
て、符号1は辞書記憶部を示しており、辞書記憶部1
は、基本辞書3と、政治経済、工学、医学、生物の如き
分野別単語辞書5を各々個別の辞書ファイルとして記憶
している。基本辞書3は一般用語を読み情報と使用頻度
情報と共に格納しており、分野別単語辞書5は各々の分
野の専門用語を読み情報と使用頻度情報と共に格納して
いる。
いる各辞書に重み付け値を個別に変更可能に設定するも
のであり、図2に例示されている如く、入力文書の分野
に応じて予め各辞書毎に重み付け値を決定した分野別規
定値テーブルを有しており、キーホード9よりの指令に
より、ユーザ選択、或いは読み込み文書に於ける単語の
分野別分布状態より決定される分野別の規定値を分野別
規定値テーブルより読み出すことによって各辞書の重み
付け値を設定、或いはユーザによる各辞書毎の任意入力
値より各辞書の重み付け値を設定する。尚、この実施例
に於いては、重み付け値は、最大値を5、最小値を0と
されている。
に於ける分野別単語辞書の分類は一例であり、例えば、
工学辞書は、機械辞書、電気辞書、コンピュータ辞書、
化学辞書、建築土木辞書の如く、細分類化されていても
よい。
部1が記憶している各辞書に於ける各単語の使用頻度情
報と重み付け部7により各辞書毎に設定された重み付け
値との演算値、例えば使用頻度数と重み付け値との乗算
により単語出力優先順位を決定する。尚、この場合は、
新規辞書に於いて各単語の使用頻度数は0以外の初期値
に設定される。
された読み情報と一致する同音異議の単語を辞書記憶部
1より読み出し、これを単語出力優先順位決定部7が決
定した単語出力優先順位が高いもの順に文書編集部1
5、表示装置17へ出力する。
単語出力優先順位が第一位の単語を文書編集部15、表
示装置17へ出力し、キーボード11より次候補指令を
与えらることにより次に単語出力優先順位が高い単語を
文書編集部15、表示装置17へ出力し、キーボード1
1より確定指令を与えられることにより、出力単語を確
定し、その単語の情報を使用頻度情報更新部19へ出力
する。
1より入力する単語情報により、使用を選択決定された
単語の使用頻度を一つ増加すべく、辞書記憶部1に記憶
された辞書に於ける対応単語の使用頻度情報を更新す
る。
書データ記憶部21が接続されており、文書データ記憶
部21は、文書編集部15にて編集された文書のデータ
の記憶保存と、記憶保存している文書データの文書編集
部15へのデータ出力を行う。
接続されており、使用単語抽出部23は、現在編集中の
既入力の文書、即ち文書編集部15に展開された文書が
使用している単語を抽出する。
抽出部23が抽出した単語の個数を、対応する単語を格
納している分野別単語辞書毎に計数し、読み込み文書に
於ける単語の分野別分布状態を検出する。
対応重み付け値決定部としての既存文書分野決定部27
が接続されている。既存文書分野決定部27は、分野別
単語使用数計数部25が計数した分野別単語使用数に応
じて既存文書の分野を決定し、この決定分野情報を重み
付け部7へ出力する。
換装置に於ける重み付け処理ルーチンの一例を示してい
る。この重み付け処理ルーチンに於いては、先ず文書編
集部15が文書データ記憶部21より取り込んだ読み込
み文書の分野より重み付けを行うか否かを判別する(ス
テップ10)。
否かはキーボード9にてユーザにより選択決定され、新
規文書の作成等であることにより、読み込み文書の分野
より重み付けを行わない場合は、図2に示されている如
き分野別規定値テーブルによる分野別規定値を使用する
か否かのを判別する(ステップ20)。
ボード9にてユーザにより選択決定され、分野別規定値
を使用する場合は、ユーザにより入力文書の分野が選択
設定され(ステップ30)、重み付け部7は分野別規定
値テーブルを参照して選択設定された分野の分野別規定
値に従って重み付け値を決定する(ステップ40)。
合は、基本辞書の重み付け値が4、固有名詞辞書の重み
付け値が1、政治経済辞書の重み付け値が最低値の0、
工学辞書の重み付け値が最大値の5、医学、生物の各辞
書の重み付け値が各々最低値の0に設定される。重み付
け値が最低値0の場合は、かな漢字変換に於いてその辞
書が参照されない。即ち不必要辞書の切り離しが行われ
る。
による辞書毎の任意の数値入力により決定された値に従
って重み付け部7が各辞書の重み付け値を設定する(ス
テップ50)。
1より取り込んだ読み込み文書の分野より重み付けを行
う場合は、使用単語抽出部23が文書編集部15に展開
された読み込み文書が使用している単語を抽出し(ステ
ップ60)、この抽出した単語の個数を分野別単語使用
数計数部25が、対応する単語を格納している分野別単
語辞書毎に計数し、読み込み文書に於ける単語の分野別
分布状態を検出する(ステップ70)。これに基づいて
既存文書分野決定部27が読み込み文書の分野を決定し
(ステップ80)、重み付け部は図2に示されている如
き分野別規定値テーブルを参照して決定分野の分野別規
定値に従って重み付け値を決定する(ステップ40)。
換装置に於けるかな漢字変換処理ルーチンの一例を示し
ている。このかな漢字変換処理ルーチンに於いては、キ
ーボード9よりかな入力によって読み情報が入力される
ことにより、単語出力部13は、辞書記憶部1の各辞書
より入力読み情報と一致する単語と、その単語の使用頻
度情報を読み出す(ステップ100)。
出した各単語について、単語の使用頻度情報(使用頻度
数)と単語が所属している辞書の重み付け値との演算、
例えば乗算を行い、単語出力優先順位を決定する(ステ
ップ110)。これにより使用頻度数だけでなく、所属
している辞書の重み付け値が大きい単語ほど優先順位が
上がることになる。
従って単語出力部13は、先ず最初に単語出力優先順位
が第一位の単語を文書編集部15、表示装置17へ出力
し、キーボード11より次候補指令を与えらることによ
り単語出力優先順位が次に高い単語を文書編集部15、
表示装置17へ出力し、キーボード11より確定指令を
与えられることにより、出力単語を確定する(ステップ
120〜140)。
語が優先して文書編集部15、表示装置17へ出力さ
れ、また重み付け値が0の辞書に所属する同音異議の単
語は、単語出力優先順位が0となり、次候補として出力
されることがなくなり、単語選択の手間が従来に比して
軽減される。
情報を使用頻度情報更新部19へ出力し、使用頻度情報
更新部19が対応単語の使用頻度情報を更新する。
に於いても変更することができ、これによって文書の途
中にて内容が変わる場合も対処でき、また各辞書の重み
付け値を互いに日として値とすると、従来通りの単語の
次候補表示が行われるようになる。また図2に示されて
いる如き分野別規定値テーブルに於ける各辞書の重み付
け値は、デフォルト値を与えられ、ユーザにより任意に
変更されてもよい。
によるかな漢字変換装置によれば、辞書記憶部が記憶し
ている分野別単語辞書の各単語の使用頻度情報と重み付
け部により分野別単語辞書毎に設定された重み付け値と
の演算値により単語出力優先順位が決定され、この単語
出力優先順に、入力された読み情報に対応する単語の出
力が行われるから、作成する文書の分野が変わっても、
各分野の文書入力に於いて適切な単語が第一候補として
出力される確率が向上し、また不必要分野の分野別単語
辞書を不使用状態に切り離し、作成中の文書の分野に於
いて使用することがない同音異議の単語が次候補として
取り上げられることを回避することができ、これらのこ
とにより単語選択の手間が従来に比して軽減されるよう
になり、能率のよい日本語文書の入力が行われ得るよう
になる。
書中の単語の分野別分布状態より、かな漢字変換に於け
る最適な辞書環境が自動的に整えられ、この場合も能率
のよい日本語文書の入力が行われ得るようになる。
装置の一実施例を示すブロック線図。
野別規定値テーブルの一例を示す説明図。
け処理ルーチンの一例を示すフローチャート。
字変換処理ルーチンの一例を示すフローチャート。
Claims (2)
- 【請求項1】 各分野の単語を各単語毎の読み情報と使
用頻度情報と共に分野別に格納した分野別単語辞書を記
憶する辞書記憶部と、 前記辞書記憶部が記憶している分野別単語辞書の各々に
重み付け値を個別に変更可能に設定する重み付け部と、 前記辞書記憶部が記憶している分野別単語辞書の各単語
の使用頻度情報と前記重み付け部により分野別単語辞書
毎に設定された重み付け値との演算値により単語出力優
先順位を決定する単語出力優先順位決定部と、 入力された読み情報に対応する単語を前記辞書記憶部が
記憶している分野別単語辞書より前記単語出力優先順位
決定部が決定した単語出力優先順位が高いもの順に出力
する単語出力部と、 前記単語出力部が出力した単語より使用を選択決定され
た単語の前記分野別単語辞書に於ける使用頻度情報を更
新する使用頻度情報更新部と、 を有していることを特徴とする文書入力装置のかな漢字
変換装置。 - 【請求項2】 各分野の単語を各単語毎の読み情報と使
用頻度情報と共に分野別に格納した分野別単語辞書を記
憶する辞書記憶部と、 前記辞書記憶部が記憶している分野別単語辞書の各々に
重み付け値を個別に変更可能に設定する重み付け部と、 前記辞書記憶部が記憶している分野別単語辞書の各単語
の使用頻度情報と前記重み付け部により分野別単語辞書
毎に設定された重み付け値との演算値により単語出力優
先順位を決定する単語出力優先順位決定部と、 入力された読み情報に対応する単語を前記記憶部が記憶
している分野別単語辞書より前記単語出力優先順位決定
部が決定した単語出力優先順位が高いもの順に出力する
単語出力部と、 前記単語出力部が出力した単語より使用を選択決定され
た単語の前記分野別単語辞書に於ける使用頻度情報を更
新する使用頻度情報更新部と、 編集中の既入力の文書が使用している単語を抽出する使
用単語抽出部と、 前記使用単語抽出部が抽出した単語の個数を、対応する
単語を格納している分野別単語辞書毎に計数する分野別
単語使用数計数部と、 前記分野別単語使用数計数部が計数した分野別単語使用
数に応じて前記重み付け部が設定する重み付け値を分野
別単語辞書毎に決定する既存文書対応重み付け値決定部
と、 を有していることを特徴とする文書入力装置のかな漢字
変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23167192A JP3470975B2 (ja) | 1992-08-31 | 1992-08-31 | 文書入力装置のかな漢字変換方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23167192A JP3470975B2 (ja) | 1992-08-31 | 1992-08-31 | 文書入力装置のかな漢字変換方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0683812A true JPH0683812A (ja) | 1994-03-25 |
JP3470975B2 JP3470975B2 (ja) | 2003-11-25 |
Family
ID=16927163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23167192A Expired - Lifetime JP3470975B2 (ja) | 1992-08-31 | 1992-08-31 | 文書入力装置のかな漢字変換方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3470975B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
JP2011204174A (ja) * | 2010-03-26 | 2011-10-13 | Ntt Docomo Inc | 情報入力装置及び変換候補表示制御方法 |
JP2013065222A (ja) * | 2011-09-19 | 2013-04-11 | Nec Corp | 選択候補学習装置、訳語学習装置、選択候補学習方法、及びコンピュータ・プログラム |
JP2014056492A (ja) * | 2012-09-13 | 2014-03-27 | Nec Corp | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム |
JP2015028708A (ja) * | 2013-07-30 | 2015-02-12 | セイコーインスツル株式会社 | 電子辞書 |
JP2019008772A (ja) * | 2017-06-28 | 2019-01-17 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 文字を入力する方法及び装置 |
-
1992
- 1992-08-31 JP JP23167192A patent/JP3470975B2/ja not_active Expired - Lifetime
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
JP2011204174A (ja) * | 2010-03-26 | 2011-10-13 | Ntt Docomo Inc | 情報入力装置及び変換候補表示制御方法 |
JP2013065222A (ja) * | 2011-09-19 | 2013-04-11 | Nec Corp | 選択候補学習装置、訳語学習装置、選択候補学習方法、及びコンピュータ・プログラム |
JP2014056492A (ja) * | 2012-09-13 | 2014-03-27 | Nec Corp | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム |
JP2015028708A (ja) * | 2013-07-30 | 2015-02-12 | セイコーインスツル株式会社 | 電子辞書 |
JP2019008772A (ja) * | 2017-06-28 | 2019-01-17 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 文字を入力する方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3470975B2 (ja) | 2003-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050228639A1 (en) | Electronic dictionary with example sentences | |
KR20010088892A (ko) | 한자입력장치 및 방법 | |
JP3470975B2 (ja) | 文書入力装置のかな漢字変換方法および装置 | |
JP2009265736A (ja) | 電子機器、その制御方法およびコンピュータプログラム | |
JP3664383B2 (ja) | 日本語入力システム、日本語入力方法、および、記録媒体 | |
JP2004240859A (ja) | 言い換えシステム | |
JP2007257188A (ja) | 辞書検索装置およびその制御プログラム | |
US20030009490A1 (en) | Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system | |
JPH10269210A (ja) | 文字入力装置 | |
JP3744136B2 (ja) | 訳語選択装置と記憶媒体 | |
JPH0474259A (ja) | 文書要約装置 | |
JPH02144763A (ja) | 仮名漢字変換装置 | |
JPS63278174A (ja) | 翻訳装置 | |
JP4057166B2 (ja) | 文字列検索装置および方法ならびに文字列検索プログラムを記録したコンピュータで読取可能な記録媒体 | |
JPH09128395A (ja) | 文書作成装置及び文書作成方法 | |
JPH0350668A (ja) | 文字処理装置 | |
JP2837010B2 (ja) | 仮名漢字変換処理装置 | |
JPH08297659A (ja) | 文字列変換処理方式 | |
JP2802369B2 (ja) | かな漢字変換装置 | |
JP2013174958A (ja) | テキスト読み上げ装置およびテキスト読み上げ方法 | |
JP2012027729A (ja) | 検索装置、検索方法及びプログラム | |
JPH0776966B2 (ja) | 仮名漢字変換装置 | |
JPH0421901B2 (ja) | ||
JP2007079652A (ja) | 用語抽出装置、およびプログラム | |
JP2000285115A (ja) | 文書作成装置、文書作成方法及び文書作成プログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20010912 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100912 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100912 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |