JPH08153090A - かな漢字変換システム及びその辞書作成方法 - Google Patents

かな漢字変換システム及びその辞書作成方法

Info

Publication number
JPH08153090A
JPH08153090A JP6294087A JP29408794A JPH08153090A JP H08153090 A JPH08153090 A JP H08153090A JP 6294087 A JP6294087 A JP 6294087A JP 29408794 A JP29408794 A JP 29408794A JP H08153090 A JPH08153090 A JP H08153090A
Authority
JP
Japan
Prior art keywords
kana
kanji conversion
dictionary
dll
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6294087A
Other languages
English (en)
Inventor
Masami Tada
政美 多田
Masahito Yuge
誠仁 弓削
Shichiro Miyashita
七郎 宮下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP6294087A priority Critical patent/JPH08153090A/ja
Priority to US08/563,815 priority patent/US5745881A/en
Publication of JPH08153090A publication Critical patent/JPH08153090A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Stored Programmes (AREA)

Abstract

(57)【要約】 【目的】 かな漢字変換辞書のサイズが大きい場合で
も、十分な変換機能及び速度を提供すること。 【構成】 本発明によれば、かな漢字変換辞書が、検索
機能を含むプログラムとして一体に作成される。特に、
ダイナミック・リンク・ライブラリ・ルーチン(DL
L)をサポートするオペレーティング・システムのもと
では、かな漢字変換辞書プログラムは、DLLとしてコ
ンパイルされ、その辞書検索機能は、他のプログラムに
よって使用可能にエクスポートされる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、かな漢字変換システ
ムに関するものである。
【0002】
【従来の技術】パーソナル・コンピュータ上で走る連文
節変換システムが実現された当初は、かな漢字変換用辞
書は、1枚のフロッピ・ディスクに収まるサイズである
720KB以内、または1.44MB以内のデータ・フ
ァイルとして提供されていた。
【0003】それは、当時は、ハードディスクを使用す
ることが一般的ではなく、フロッピ・ディスク・ベース
でかな漢字変換システムを使用することを許容しなくて
はならなかったからである。しかし、最近になって、ハ
ードディスクが普及してくると、かな漢字変換システム
は、ハードディスクに導入されるのが一般的になり、そ
れに伴って、かな漢字変換用辞書のサイズの大きさの制
限は実質的になくなった。
【0004】このような従来のシステムの構成及び動作
の概要を説明すると次のとおりである。
【0005】かな漢字変換システムの設計においては、
先ず、辞書フォーマットが設計される。これは、サイズ
を最適化したバイナリ・ファイル形式(圧縮フォーマッ
トと呼ぶ)であるのが一般的である。というのは、単に
テキスト・ファイル形式で辞書の内容を並べると、辞書
のファイル・サイズが大きくなって、辞書へのアクセス
速度も低下するからである。
【0006】次に、そのような圧縮フォーマットをアク
セスするためのプログラム・ロジックが設計される。
【0007】そうして、辞書のテキスト・データベース
からバイナリ・データ辞書を作成するための辞書作成ツ
ールが設計される。そして、これによって、圧縮フォー
マットのバイナリ・データ辞書が作成される。
【0008】このようにして作成されたかな漢字システ
ムの動作は次のとおりである。先ず、かな漢字システム
がロードされた時点で、かな漢字システムは、辞書用の
バッファを数キロバイト主記憶に確保する。
【0009】そして、かな漢字システムは、ユーザーが
漢字キーを押すタイミングで辞書ファイルをオープン
し、辞書ファイルのインデックス部分を主記憶に読み込
む。
【0010】もし複数の辞書が存在するなら、その各々
について、辞書ファイルをオープンし、辞書ファイルの
インデックス部分を主記憶に読み込む、という処理を繰
り返す。
【0011】次に、かな漢字システムは、ユーザーが入
力した「読み」文字列(例えば、「じどうしゃれー
す」)に対して変換要求があった場合に、その「読み」
の部分文字列をインデックス上で検索する。因みに、
「じどうしゃれーす」の部分文字列とは、「じ」「ど」
「う」「しゃ」「れー」「す」「じど」「うしゃ」「し
ゃれー」「れーす」「じどう」「どうしゃ」「うしゃれ
ー」「しゃれーす」「じどうしゃ」「どうしゃれー」
「うしゃれーす」「じどうしゃれー」「どうしゃれー」
「うしゃれーす」「じどうしゃれー」「どうしゃれー
す」「じどうしゃれーす」などである。
【0012】次に、かな漢字システムは、ある「読み」
部分文字列が入っているレコードを辞書ファイルからバ
ッファに読み込み、その「読み」に対する候補である
「正書」と品詞や頻度などの「文法」を推論エンジンの
作業ファイルに転送する。かな漢字システムはまた、
「読み」の部分文字列のすべてに対して、その個数分だ
けこの処理を繰り返す。
【0013】次に、かな漢字システムは、推論エンジン
を働かせて、最も確からしい文字列をユーザーに返す。
【0014】以上のように、辞書ファイルをフロッピ・
ディスクまたはハードディスクに置くシステムでは、1
つの「読み」文字列につき、多数回のディスク・アクセ
スを生じ、かな漢字の変換速度をあまり高速にすること
ができない。
【0015】これを改善するためには、辞書ファイル全
体を主記憶にロードすればよいが、インテル(インテル
・コーポレーションの商標)8086アーキテクチャを
ベースとするMS−DOS(マイクロソフトの商標)の
下では、最大でも640KBの主記憶しか利用できない
ため、通常のサイズの辞書ファイルでは、主記憶にロー
ドすることが不可能である。
【0016】ところが、80386のような32ビット
・アドレッシングを可能とするCPUが使用され、4M
B〜64MB程度の主記憶が搭載され、Windows
(マイクロソフトの商標)やOS/2(IBMの商標)
のような拡張メモリを使用し且つ仮想記憶機能をサポー
トするオペレーティング・システムが使用されるように
なってくると、4MB程度のサイズの辞書ならば、その
全体を主記憶にロードすることは可能である。
【0017】しかし、ユーザーの要望により、名前辞
書、住所の辞書、医学の辞書などの複数の辞書を参照し
たりすることが一般的になり、また、かな漢字システム
の方でも、AI機能を搭載することによって一層膨大な
辞書が必要となるため、10MB〜100MBのサイズ
の辞書も利用されるようになってきており、依然とし
て、限られた実記憶に、辞書ファイル全体をロードする
ことが可能とは限らない。
【0018】それでも限られた実記憶に辞書ファイルを
ロードしようとすると、いわゆる仮想記憶の機能が必要
となるが、OS/2やWindowsのようなオペレー
ティング・システムは、データ・ファイルの主記憶への
ロードに対しては、標準では仮想記憶の機能を提供しな
いので、かな漢字システムの設計者自身が、そのような
仮想記憶機能を具備するように、プログラムを書く必要
がある。しかし、仮想記憶機能自体複雑な機能であっ
て、アプリケーション・プログラムの中で独自で実現す
るのは困難である。
【0019】
【発明が解決しようとする課題】この発明の目的は、オ
ペレーティング・システムの標準的な機能を利用して、
任意の大きさのかな漢字変換辞書を使用することを可能
ならしめることにある。
【0020】この発明の他の目的は、かな漢字変換速度
を低下させることなく、任意の大きさのかな漢字変換辞
書を使用することを可能ならしめることにある。
【0021】
【課題を解決するための手段】上記目的は、かな漢字変
換辞書を、プログラムとして一体に作成することによっ
て達成される。
【0022】特に、OS/2やWindowsのよう
な、ダイナミック・リンク・ライブラリ・ルーチン(以
下、DLLと称する)をサポートするオペレーティング
・システムにおいては、好適にはそのようなかな漢字変
換辞書プログラムは、DLLとして提供され、以って、
主記憶へのロード、スワップ・ファイルの作成などが、
オペレーティング・システムの標準的な機能を利用して
達成される。
【0023】さらに、OS/2 Ver2.1(OS/
2はIBM社の商標)のような32ビットAPIを提供
するオペレーティング・システムの下では、例えばIB
M社から提供されているC Set++のような32ビ
ット・コンパイラでかな漢字変換辞書プログラムをコン
パイルすることによって、32ビット・アドレッシング
の利点を享受し、より大きな辞書サイズ、より高性能の
かな漢字変換機能を実現することも可能となる。
【0024】
【実施例】以下、図面を参照して本発明の実施例につい
て説明する。
【0025】A.ハードウェア構成 図1を参照すると、本発明を実施するためのシステム構
成の概観図が示されている。この構成は、バス101
に、演算及び入出力制御機能をもつ中央処理装置(CP
U)102、プログラムをロードし、また、CPU10
2のための作業領域を与える主記憶(RAM)104、
コマンドや文字列、かな漢字変換のための変換指示など
をキー入力するためのキーボード106と、文字及び図
形を表示可能なディスプレイ装置108と、中央処理装
置を制御するためのオペレーティング・システム、かな
漢字変換プログラム・ファイルなどを格納したハードデ
ィスク(HDD)110と、フロッピ・デイスクからデ
ータを読取り、またはフロッピ・デイスクにデータを書
き込むためのフロッピ・デイスク・ドライブ(FDD)
112と、ディスプレイ装置108の画面上の任意の位
置をポイントしてその位置情報をCPUに伝えるための
マウス114を接続した通常の構成である。
【0026】好適には、キーボード106には、英数字
キー、記号入力キー、及び改行キー以外にも、かな漢字
変換モードに入るための漢字キー、「読み」を入力した
後、かな漢字変換処理を指示するための変換キーなどが
設けられている。
【0027】この実施例で使用されるCPUは、例え
ば、80386、80486、Pentium(インテ
ルの商標)またはそれらの互換チップである。
【0028】オペレーティング・システムとしては、W
indows(マイクロソフトの商標)、OS/2(I
BMの商標)などの、拡張メモリの使用、DLLのロー
ド機能、及び仮想記憶GUIマルチウインドウ環境をサ
ポートするものが望ましいが、MS−DOS(マイクロ
ソフトの登録商標)、PC−DOSなどの、標準ではD
LLをサポートしないオペレーティング・システムにお
いても、DOSエクステンダなどのプログラムを使用す
ることにより、本発明が利用可能となることに留意され
たい。
【0029】B.かな漢字変換プログラムの構造 B1.辞書プログラム 次に、本発明のかな漢字変換プログラムの構造を、C言
語のコード(または、擬似コード)を用いて説明する。
1つの例では、本発明のかな漢字変換プログラムは、以
下に示すヘッダ・ファイル dict.h と、ソース・ファイ
ル dict.c と、モジュール定義ファイル dict.defから
なる。
【0030】dict.h の内容は、次のとおりであって、
これは、辞書エントリの構造体を定義するものである。
【表1】
【0031】この構造体で、keyは検索に用いるキー
(読み)、dataは、キーに対応するデータ(語句)、gr
ammarは、かな漢字変換システムの推論エンジンが使用
する文法(品詞)、freqは、語句のあらわれる頻度であ
る。
【0032】dict.c の内容は、次のとおりであって、
ここには、実際の辞書のエントリの配列dict_dataと、
辞書を検索し、ヒットした辞書エントリに対するポイン
タを返す関数SearchDictDataとが記述される。尚、辞書
エントリと、検索関数とは、それぞれ別個のソース・フ
ァイルとして記述してもよい。
【0033】
【表2】 #include "dict.h" DICT_INFO dict_data[70000] = { {"じどうしゃ", "自動車", NOUN, HIGH, 0}, {"のる", "乗る", VERB, HIGH, 0}, ..... }; PDICT_INFO SearchDictData(key) unsigned char *key; { int num; // 32ビット・モードでは、intは32ビットをあらわす ..... return &dict_data[num]; }
【0034】上記のコードで、{"じどうしゃ", "自動
車", NOUN, HIGH, 0}が、辞書の1つのエントリであっ
て、DICT_INFOという構造体において、"じどうしゃ"が
「読み」、"自動車"が「語句」、NOUNがgrammar、HIGH
がfreqに対応する。freqは、この実施例では、HIGHと、
LOWとがあり、それぞれ、頻度が高いことと、頻度が低
いことを示す。grammarは、NOUN(名詞)以外に、VERB
(動詞)、ADJ(形容詞)などの値をとり得る。grammar
及びfreqが取り得る値は、ここでは示さないが、予めヘ
ッダ・ファイルで、enum によって定義されている。
【0035】また、SearchDictData(key)という関数
は、引数として与えられたkeyという文字列へのポイン
タに基づき、それと一致するキー(読み)をもつ辞書の
配列dict_dataの番号numをもとめ、dict_data[num]に対
して直接アクセスできるように、dict_data[num]のアド
レスを返す。
【0036】SearchDictData(key)の1つの実現方法
は、dict_data[70000]のエントリを予め「読み」の部分
でソートしておき、引数として与えられたkeyという文
字列へのポインタに基づき、dict_data[70000]のエント
リの「読み」の部分に2分探索を適用し、一致した読み
をもつエントリの番号numを得ることである。
【0037】その他、やはり辞書エントリを予め「読
み」の部分でソートしておき、読みの頭から2文字分に
対して(例えば、「じどうしゃ」の「じど」)、それに
一致する読みをもつ先頭の辞書エントリの番号を返すよ
うな索引テーブルを用意し、一致した辞書エントリの番
号から線形探索を行うなど、高速アクセスのためのさま
ざまな方法があり得る。
【0038】このことを実現するために、dict.c のよ
うな辞書プログラム・ソース・コードは、予め用意され
た辞書エントリのデータベースから、辞書エントリを抽
出する際に、一旦辞書エントリを読みに基づきソートし
たり、抽出された辞書エントリに基づき予め索引テーブ
ルを生成したりすることによって、ツールによって自動
生成することができる。
【0039】dict.def の内容は、以下のとおりであ
る。このモジュール定義ファイルは、SearchDictDataと
いう関数がエクスポートされ、以って、他のプログラム
から利用可能であることを記述する。
【表3】
【0040】これらを、コンパイルしリンクすることに
よって、例えば dict.dll という、辞書の内容とその検
索関数の両方を含むダイナミック・リンク・ライブラリ
・ルーチンが作成される。尚、dict.def におけるEXPOR
TS の次の行のSearchDictDataは、dict.dllをロードし
たプログラムで、SearchDictDataという関数を利用可能
であることを示す。
【0041】B2.辞書プログラムを呼出す側のプログ
ラムの例 辞書プログラムを呼出す側のプログラムの例は、以下の
とおりである。
【0042】
【表4】 #include "dict.h" HANDLE hLib; void Init(void) { ..... hLib = LoadLibrary(DLL辞書名); lpSearchDictData = GetProcAddress(hLib,"SearchDictData"); .... } void End(void) { ..... FreeLibrary(hLib); ..... } void main() { Init(); ..... while ( bProcess ) { ..... /* キーボードから文字が入力された */ if ( 入力された文字が変換キー ) { if ( (prDictData=(* lpSearchDictData)(key)) != NULL ) { /* キー(key)に対応するデータがあった時の処理 */ } else { /* キーに対応するデータがなかった時の処理 */ } } else { /* key に入力された文字を追加 */ } ..... } ..... End(); }
【0043】以下、上記プログラム・コード及び図2の
フローチャートを参照して、本発明の処理を説明する。
【0044】このプログラム・コードで、Init()におけ
るhLib = LoadLibrary(DLL辞書名)におけるDLL辞書名
は、例えば、上記で作成された"dict.dll"であり、これ
によって、dict.dllが主記憶にロードされる。これは、
図2のフローチャートでは、ステップ202に対応す
る。
【0045】lpSearchDictData = GetProcAddress(hLi
b,"SearchDictData")は、dict.dll中のSearchDictData
という関数を呼び出すためのアドレスを取得する手続き
である。
【0046】End()におけるFreeLibrary(hLib)は、hLib
= LoadLibrary(DLL辞書名)でロードされたDLL辞書
を解放する手続きである。
【0047】上記プログラム・コードで、bProcess
は、かな漢字システムが動作している間は1にとどまる
フラグであり、すなわち、かな漢字システムが動作して
いる間は、動作は、ステップ204とステップ218の
間のwhileのループを巡ることになる。
【0048】この while ループの内部で、キーボード
から文字が入力された後(図2のステップ202)、変
換キーが押されると、ステップ206での判断が肯定的
となり、ステップ208で、prDictData=(* lpSearchDi
ctData)(key)という関数呼び出しによって、DLL辞書
のエントリが検索される。そうして、その結果がNULLで
ないなら、ステップ212で一致が見つかったことに対
応し、ステップ214でのキーに対応するデータがあっ
た場合の処理、例えば、結果のデータを、語句に追加す
る処理が行われる。
【0049】尚、上記プログラム・コードでは示されて
いないが、prDictData=(* lpSearchDictData)(key)の、
keyによってポイントされる文字列は、キー入力された
文字列全体とは限らず、一般的には推論エンジンと呼ば
れるプログラムも上記プログラム・コード、または一括
したコンパイル処理される別のソース・コードに含ま
れ、この推論エンジンが、キー入力された文字列全体を
適当な部分文字列に分割して、その部分文字列各々をke
yとして複数回かな漢字変換辞書へのアクセスを行う。
【0050】prDictData=(* lpSearchDictData)(key)と
いう関数呼び出しの結果がNULLなら、キーに対応する辞
書エントリが見つからなかったことを意味するので、ス
テップ216では、推論エンジンによって別の部分文字
列を選ぶなどの処理が行われる。
【0051】ステップ206で、入力された文字が変換
キーの押し下げによって発生されたコードでないと判断
されたなら、単にkeyがポイントする文字列に、入力さ
れた文字を追加する処理が行われて、ステップ204に
戻る。
【0052】ステップ218での文字入力終了は、例え
ば再び漢字キーを押すことによって行われる。これによ
って、bProcess というフラグが0になり、処理はwhile
のループから脱出する。これは、図2のフローチャート
では、ステップ218からステップ220に進むことを
示す。
【0053】ステップ220では、End()の呼び出しに
よって、かな漢字変換プログラムDLLの開放が行われ
る。
【0054】尚、この実施例では、単一のかな漢字辞書
DLLがロードされ開放されているが、複数のかな漢字
辞書DLLを順次ロードし、GetProcAddress関数を利用
して個々のかな漢字辞書DLLの検索関数への呼び出し
アドレスを取得し、ステップ212で、その各々のロー
ドされたかな漢字辞書DLL毎に、上記検索を行うよう
にすることができる。その場合、ステップ220では、
ロードされた全てのかな漢字辞書DLLが解放される。
このような処理は、基本のかな漢字辞書以外に、医学
用、コンピュータ用語、などの専門的なかな漢字辞書を
1つまたは複数併用する場合に必要となる。
【0055】また、基本のかな漢字辞書DLLは常時ロ
ードし、それ以外の専門的なかな漢字辞書DLLは、ユ
ーザーの操作または設定に応じてロードし、あるいは解
放するようにしてもよい。
【0056】さらに、ユーザーが任意に「よみ」及び
「語句」を追加することができるような比較的小さいサ
イズのユーザー定義かな漢字変換辞書は、DLLような
プログラムの形式ではなく、従来のかな漢字変換システ
ムと同様に、データ・ファイルとして実現される。
【0057】C.他の実施例 上記実施例では、かな漢字辞書プログラムはDLLとし
て実現され、それは、必要に応じて、オペレーティング
・システムの標準的な機能を使用して主記憶上にロード
された。しかし、MS−DOS(マイクロソフトの商
標)などのシングル・タスク・オペレーティング・シス
テムは、標準では、DLLを主記憶上にロードする機能
はもたない。しかし、MS−DOSでも、80386、
80486のような1MBより上の拡張メモリを利用可
能なCPUを使用し、少なくとも4MBの主記憶を搭載
し、且つDOSエクステンダのような、拡張メモリへプ
ログラムをロードする機能をAPIとして提供するよう
になされたシステムでは、以下のような、辞書エントリ
と検索関数を含むソース・ファイルをコンパイルするこ
とで生成されるEXE形式のかな漢字辞書プログラムを使
用することが可能である。
【0058】
【表5】 #include "dict.h" DICT_INFO dict_data[70000] = { {"じどうしゃ", "自動車", NOUN, HIGH, 0}, {"のる", "乗る", VERB, HIGH, 0}, ..... }; PDICT_INFO SearchDictData(key) unsigned char *key; { int num; ..... return &dict_data[num]; } void main() { ..... while ( bProcess ) { ..... /* キーボードから文字が入力された */ if ( 入力された文字が変換キー ) { if ( (prDictData=SearchDictData(key)) != NULL ) { /* キーに対応するデータがあった時の処理 */ } else { /* キーに対応するデータがなかった時の処理 */ } } else { /* key に入力された文字を追加 */ } ..... } ..... }
【0059】D.検索処理の具体例 ユーザーが、「じどうしゃ」とキー入力し、それから変
換キーを押すと、推論エンジンは入力された文字列を適
当に分割してかな漢字DLLを検索する。
【表6】 key data ------------------------- ---------------------------- 「じ」「ど」「う」「しゃ」 「次」「度」「卯」「社」 「じ」「どう」「しゃ」 「次」「同」「社」 「じ」「どうしゃ」 「次」「同社」 「じど」「う」「しゃ」 (「じど」のキーが存在しない) 「じど」「うしゃ」 (「じど」のキーが存在しない) 「じどう」「しゃ」 「自動」「社」 「じどうしゃ」 「自動車」
【0060】すると、上記の表のような処理ステップを
経て、結局、「自動車」が選ばれる。尚、再度変換キー
が押されると、別の妥当な語句(もしあるなら)を検索
する処理が行われる。
【0061】
【発明の効果】以上説明したように、この発明によれ
ば、かな漢字辞書を、DLLまたはEXEなどの実行可
能プログラム形式で作成されるので、以下のような顕著
な効果が得られる。
【0062】(1) 実記憶よりも大きいかな漢字辞書であ
っても、オペレーティング・システムの標準的な仮想記
憶制御機構を利用して主記憶にロードすることが可能で
ある。そのような仮想記憶制御機構を利用するために、
かな漢字変換システムの設計者は、独自に特殊なコード
を書く必要はない。
【0063】(2) 大きいかな漢字辞書であっても、可能
な限り主記憶にロードされるので、検索処理が高速にな
る。
【0064】(3) 推論エンジンを記述するのと同じ言語
(好適にはCまたはC++)でかな漢字辞書を作成でき
るので、推論エンジンとかな漢字辞書とのインターフェ
ースをとりやすい。
【0065】(4) かな漢字辞書を作成するのに、特殊な
辞書作成ツールを用意する必要はなく、通常のコンパイ
ラ及びリンカを利用できる。
【図面の簡単な説明】
【図1】 本発明を実現するためのハードウェア構成の
ブロック図である。
【図2】 かな漢字変換処理のフローチャートを示す図
である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 弓削 誠仁 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内 (72)発明者 宮下 七郎 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】(a) 少なくとも、読み、及び該読みに対応
    する語句を含むかな漢字変換辞書のエントリを、所定の
    プログラミング言語のデータ配列またはリストとしてソ
    ース・コードに記述する段階と、(b) 指定された読みに
    応じて、上記かな漢字変換辞書のデータ配列またはリス
    トを検索することにより、対応する語句、または語句に
    対するポインタを与える検索機能を、上記所定のプログ
    ラミング言語で上記ソース・コードに記述する段階と、
    (c) 上記ソース・コードを、上記所定のプログラミング
    言語のコンパイラでコンパイルすることによって、かな
    漢字変換辞書プログラムを作成する段階を有する、 かな漢字変換システム用辞書プログラム作成方法。
  2. 【請求項2】上記所定のプログラミング言語が、Cまた
    はC++である、請求項1に記載のかな漢字変換システ
    ム用辞書プログラム作成方法。
  3. 【請求項3】上記かな漢字変換辞書プログラムが、ダイ
    ナミック・リンク・ライブラリ・ルーチン(DLL)と
    して作成される、請求項1に記載のかな漢字変換システ
    ム用辞書プログラム作成方法。
  4. 【請求項4】(a) 少なくとも、読み、及び該読みに対応
    する語句を含むかな漢字変換辞書のエントリを、所定の
    プログラミング言語のデータ配列またはリストとして第
    1のソース・コードに記述する段階と、(b) 指定された
    読みに応じて、上記かな漢字変換辞書のデータ配列また
    はリストを検索することにより、対応する語句、または
    語句に対するポインタを与える検索機能を、上記所定の
    プログラミング言語で第2のソース・コードに記述する
    段階と、(c) 上記第1及び第2のソース・コードを、上
    記所定のプログラミング言語のコンパイラでコンパイル
    することによって、かな漢字変換辞書プログラムを作成
    する段階を有する、 かな漢字変換システム用辞書プログラム作成方法。
  5. 【請求項5】上記所定のプログラミング言語が、Cまた
    はC++である、請求項4に記載のかな漢字変換システ
    ム用辞書プログラム作成方法。
  6. 【請求項6】上記かな漢字変換辞書プログラムが、ダイ
    ナミック・リンク・ライブラリ・ルーチン(DLL)と
    して作成される、請求項4に記載のかな漢字変換システ
    ム用辞書プログラム作成方法。
  7. 【請求項7】請求項3または請求項6の方法によって作
    成されたかな漢字変換辞書プログラムDLLを利用する
    かな漢字変換方法であって、(a) 上記かな漢字変換辞書
    プログラムDLLを主記憶にロードする段階と、(b) ユ
    ーザーからのキーボードによって入力された文字をバッ
    ファに格納する段階と、(c) ユーザーのかな漢字変換指
    示操作に応答して、上記かな漢字変換辞書プログラムD
    LLの検索機能に上記バッファに格納されている文字列
    を渡すことにより、該文字列に対応する語句を検索する
    段階を有する、 かな漢字変換方法。
  8. 【請求項8】ユーザーのかな漢字変換終了操作に応答し
    て、上記かな漢字変換辞書プログラムDLLを解放する
    段階をさらに有する、請求項7に記載のかな漢字変換方
    法。
  9. 【請求項9】請求項3または請求項6の方法によって作
    成された複数のかな漢字変換辞書プログラムDLLを利
    用するかな漢字変換方法であって、(a) 上記複数のかな
    漢字変換辞書プログラムDLLを順次主記憶にロードす
    る段階と、(b) ユーザーからキーボードによって入力さ
    れた文字をバッファに格納する段階と、(c) ユーザーの
    かな漢字変換指示操作に応答して、上記複数のかな漢字
    変換辞書プログラムDLLの検索機能に上記バッファに
    格納されている文字列を順次渡すことにより、該文字列
    に対応する語句を検索する段階を有する、かな漢字変換
    方法。
  10. 【請求項10】ユーザーのかな漢字変換終了操作に応答
    して、上記複数のかな漢字変換辞書プログラムDLLを
    解放する段階をさらに有する、請求項9に記載のかな漢
    字変換方法。
  11. 【請求項11】(a) 主記憶と、(b) 少なくとも、読み、
    及び該読みに対応する語句を含むかな漢字変換辞書のエ
    ントリを、所定のプログラミング言語のデータ配列また
    はリストとして含むかな漢字変換辞書プログラムDLL
    を呼び出し可能に保持する手段と、(c) 上記かな漢字変
    換辞書プログラムDLLを上記主記憶にロードする手段
    と、(d) キーボードと、(e) 上記キーボードによって入
    力された文字をバッファに格納する手段と、(f) 上記バ
    ッファに格納されている文字列に基づき、上記かな漢字
    変換辞書プログラムDLL中のかな漢字変換辞書のエン
    トリを検索する手段を具備する、かな漢字変換システ
    ム。
JP6294087A 1994-11-29 1994-11-29 かな漢字変換システム及びその辞書作成方法 Pending JPH08153090A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6294087A JPH08153090A (ja) 1994-11-29 1994-11-29 かな漢字変換システム及びその辞書作成方法
US08/563,815 US5745881A (en) 1994-11-29 1995-11-28 Kana-Kanji conversion system and a method for producing a Kana-Kanji conversion dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6294087A JPH08153090A (ja) 1994-11-29 1994-11-29 かな漢字変換システム及びその辞書作成方法

Publications (1)

Publication Number Publication Date
JPH08153090A true JPH08153090A (ja) 1996-06-11

Family

ID=17803124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6294087A Pending JPH08153090A (ja) 1994-11-29 1994-11-29 かな漢字変換システム及びその辞書作成方法

Country Status (2)

Country Link
US (1) US5745881A (ja)
JP (1) JPH08153090A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521608A (ja) * 2009-03-25 2012-09-13 マイクロソフト コーポレーション アプリケーションのための共有可能な分散型辞書
JP2016210138A (ja) * 2015-05-12 2016-12-15 コニカミノルタ株式会社 画像形成装置及びデータ構造

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2655399A (en) * 1998-02-02 1999-09-06 Pulsepoint Communications Dynamically loadable phrase book libraries for spoken language grammars in an interactive system
US6850906B1 (en) * 1999-12-15 2005-02-01 Traderbot, Inc. Real-time financial search engine and method
JPWO2004109541A1 (ja) * 2003-06-02 2006-07-20 富士通株式会社 携帯情報機器の入力データ変換装置、携帯情報機器、入力データ変換装置の制御プログラム
JP4769031B2 (ja) * 2005-06-24 2011-09-07 マイクロソフト コーポレーション 言語モデルを作成する方法、かな漢字変換方法、その装置、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体
JP7210130B2 (ja) * 2017-04-07 2023-01-23 富士通株式会社 符号化プログラム、符号化方法および符号化装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291363A (ja) * 1988-05-18 1989-11-22 Matsushita Electric Ind Co Ltd 辞書検索装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0628058B2 (ja) * 1983-06-17 1994-04-13 株式会社リコー 文書作成装置
JPS60142464A (ja) * 1983-12-28 1985-07-27 Fujitsu Ltd 音声入力による文章作成システム
JPS60251461A (ja) * 1984-05-28 1985-12-12 Matsushita Electric Ind Co Ltd 仮名漢字変換装置
US5047932A (en) * 1988-12-29 1991-09-10 Talent Laboratory, Inc. Method for coding the input of Chinese characters from a keyboard according to the first phonetic symbols and tones thereof
JPH02253369A (ja) * 1989-03-28 1990-10-12 Canon Inc 電子辞書
JP2640793B2 (ja) * 1992-01-17 1997-08-13 松下電器産業株式会社 共起辞書構築装置及びこの共起辞書を用いた文解析装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291363A (ja) * 1988-05-18 1989-11-22 Matsushita Electric Ind Co Ltd 辞書検索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521608A (ja) * 2009-03-25 2012-09-13 マイクロソフト コーポレーション アプリケーションのための共有可能な分散型辞書
JP2016210138A (ja) * 2015-05-12 2016-12-15 コニカミノルタ株式会社 画像形成装置及びデータ構造

Also Published As

Publication number Publication date
US5745881A (en) 1998-04-28

Similar Documents

Publication Publication Date Title
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
US5675818A (en) System and methods for improved sorting with national language support
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US8190613B2 (en) System, method and program for creating index for database
US20090106018A1 (en) Word translation device, translation method, and computer readable medium
US5537628A (en) Method for handling different code pages in text
JPH08180069A (ja) 単語辞書検索装置
US5899989A (en) On-demand interface device
JPH08153090A (ja) かな漢字変換システム及びその辞書作成方法
JPS6175957A (ja) 機械翻訳処理装置
JPH0375912B2 (ja)
JP2831837B2 (ja) 文書検索装置
JP2000322442A (ja) データベース検索装置およびデータベース検索プログラム記憶媒体
JPH0827803B2 (ja) テキストベース検索方法
JP3720882B2 (ja) 情報検索方法、情報検索システム及び情報検索装置
JP3045832B2 (ja) 適訳語選択方式
JPH0635971A (ja) 文書検索装置
JPH0561902A (ja) 機械翻訳システム
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JP3884001B2 (ja) 言語解析システムおよび方法
JPH0830626A (ja) 日本語電子化辞書検索装置
JPH0535788A (ja) 情報処理装置
JPH07129565A (ja) 情報処理装置
JPH0276067A (ja) 日本語ワードプロセッサの処理方式
JPH0566761U (ja) 日本語かな漢字変換装置