JPH09146937A - 文字列変換装置および文字列変換方法 - Google Patents

文字列変換装置および文字列変換方法

Info

Publication number
JPH09146937A
JPH09146937A JP7299975A JP29997595A JPH09146937A JP H09146937 A JPH09146937 A JP H09146937A JP 7299975 A JP7299975 A JP 7299975A JP 29997595 A JP29997595 A JP 29997595A JP H09146937 A JPH09146937 A JP H09146937A
Authority
JP
Japan
Prior art keywords
character string
conversion
english
reading
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7299975A
Other languages
English (en)
Other versions
JP3814000B2 (ja
Inventor
Hiroki Amochi
博喜 阿望
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP29997595A priority Critical patent/JP3814000B2/ja
Publication of JPH09146937A publication Critical patent/JPH09146937A/ja
Application granted granted Critical
Publication of JP3814000B2 publication Critical patent/JP3814000B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ローマ字入力モードにて入力された英文字列
を変換を正確かつ簡易に行なう。 【解決手段】 変換された文字列に、一文字文節が存在
する場合、ローマ字区切り変更処理を行なう。具体的に
は、注目かな文字について、英文字列に再変換し(ステ
ップST41)、このアルファベット文字列の一部を含
む英文字列混在文字列が、辞書に登録されているかを判
断し(ステップST43)、登録されている場合は、当
該位置でローマ字かな変換処理を行ない(ステップST
49)、得られたかな文字列について、辞書を用いて変
換を行なう。かかる処理は、可能なかぎり続けられる
(ステップST45)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字列変換装置
に関し、特に、辞書登録されたローマ字混入文字列の変
換に関する。
【0002】
【関連技術および発明が解決しようとする課題】かな漢
字変換において、英字で入力して、かな漢字変換を行な
う英字入力かな漢字変換方法が知られている。この英字
入力かな漢字変換方法において、英文字混在文字列を入
力する場合には、その英文字混在文字列について、その
綴りをそのまま入力し、後で逆変換を行なう方法があ
る。例えば、「originalの動作」という英文字
混入文字列を入力する場合には、英字入力モードにて、
「originalnodousa」と入力して、変換
キーを押す。すると、「おりぎなlの動作」と仮変換さ
れる。この状態で、逆変換する部分である「おりぎな
l」を指定して、逆変換キーを押すと、指定された部分
が「original」と英文字文字列に逆変換され
る。このように、文字列変換装置においては、英字入力
モードにて英文字混入文字列を入力する場合に、一旦正
しいスペルで英文字を入力しておいて後で逆変換する後
変換機能が採用されている。
【0003】しかしながら、かかる後変換機能を用いて
も、一旦逆変換する部分を指定して逆変換を行なうとい
う作業が必要となる。したがって、英文字混入文字列を
入力する場合には、英文字が混入しない文字列を入力す
る場合と比べて、作業性が低下する。
【0004】かかる問題を解決する為に、前記後変換が
行なわれた場合にはこれを自動的に辞書に登録し、次回
からは通常の漢字と同様に変換キーを押すだけで、英文
字に変換することも考えられる。しかし、かかる辞書機
能を用いても、以下の様な場合には、正確に変換できな
いという問題があった。
【0005】例えば、入力文字列「おりぎなl」に対し
て変換後文字列「original」が辞書登録してあ
る場合に、「original案で」という文字列に変
換する為に、「originalande」と入力し
て、変換キーを押したとする。この場合、前記入力文字
列は、所定のローマ読み規則(この場合、「la」=
「ぁ」とする)に基づいて、かな文字列「おりぎなぁん
で」として理解されて、例えば、変換後文字列「折技な
ぁんで」と変換されてしまう。
【0006】この発明は上記問題を解決し、ローマ字入
力モードにて入力された英文字列を変換を正確かつ簡易
に行なえる文字列変換装置および変換方法を提供するこ
とを目的とする。
【0007】
【課題を解決するための手段】請求項1の文字列変換装
置においては、英文字を含むかな文字列を変換前文字列
として、この変換前文字列に対応する変換後文字列を記
憶する辞書手段、ローマ字入力モードにて入力された英
文字列を、ローマ字読み規則に基づいて読み文字列を生
成するとともに、前記辞書手段を検索して前記読み文字
列中に前記変換前文字列が存在する場合は、これに対応
する英字文字列を変換後文字列として出力する変換手
段、を備えた文字列変換装置において、前記変換手段
は、前記ローマ字読み規則にとらわれることなく、前記
生成された読み文字列の一部のかな文字列について、前
記入力された英文字列中の英文字を含む読み文字列を得
て、前記辞書手段を検索できるよう構成されているこ
と、を備えたことを特徴とする。
【0008】請求項2の文字列変換装置においては、前
記変換手段は、変換候補文字列が変換候補として好まし
いか否かの判断規則を記憶する判断規則記憶手段を備
え、前記判断規則に基づいて、前記変換候補文字列が変
換候補として好ましくないと判断した場合に、前記入力
された英文字列中の英文字を含む読み文字列を得ること
を特徴とする。
【0009】請求項3の文字列変換装置においては、前
記入力された英文字列を記憶する英文字列記憶手段を備
え、前記変換手段は、生成した読み文字列の一部の文字
について、前記英文字列記憶手段を参照して、入力され
た英文字列中の英文字を含むかな文字列を得ることを特
徴とする。
【0010】請求項4の文字列変換装置においては、前
記変換手段は、前記入力された英文字列に、強制区分指
示命令が付加されている場合には、前記入力された英文
字列中の英文字列を含むかな文字列を得ることを特徴と
する。
【0011】請求項5の文字列変換装置においては、前
記変換手段は、 1)前記辞書手段に記憶されている変換前文字列中におけ
る英文字より前に位置するかな文字列と同じかな文字列
が、前記ローマ字読み規則に基づいて生成された読み文
字列中に存在するか否かを判断し、 2)存在する場合には、前記生成された読み文字列におい
て続くかな文字列について、対応する英文字を得て、両
英文字列が一致するか否かを判断し、 3)一致する場合には、前記入力された英文字列中の英文
字を含む読み文字列を得ること、を備えたことを特徴と
する。
【0012】請求項6の文字列変換方法においては、英
文字を含むかな文字列を変換前文字列として、この変換
前文字列に対応する変換後文字列を記憶しておき、ロー
マ字入力モードにて入力された英文字列を、ローマ字読
み規則に基づいて読み文字列を生成するとともに、前記
読み文字列中に前記変換前文字列が存在する場合は、こ
れに対応する英字文字列を変換後文字列として決定する
文字列変換方法において、前記読み文字列生成の際に、
前記ローマ字読み規則にとらわれることなく、前記生成
された読み文字列の一部のかな文字列について、前記入
力された英文字列中の英文字を含む読み文字列を得て、
この英文字列中の英文字を含む読み文字列中に前記変換
前文字列が存在するか否かも判断すること、を特徴とす
る。
【0013】請求項7の記憶媒体においては、コンピュ
ータが実行可能なプログラムを記憶したコンピュータ可
読の記憶媒体であって、前記プログラムは、請求項1な
いし請求項6のいずれかの装置又は方法を実現するもの
であることを特徴とする。
【0014】
【発明の効果】請求項1、請求項6の文字列変換装置ま
たは文字列変換方法においては、前記読み文字列生成の
際に、前記ローマ字読み規則にとらわれることなく、前
記生成された読み文字列の一部のかな文字列について、
前記入力された英文字列中の英文字を含む読み文字列を
得て、この英文字列中の英文字を含む読み文字列中に前
記変換前文字列が存在するか否かも判断する。これによ
り、入力された文字列から英文字を含む読み文字列を得
ることができる。したがって、ローマ字入力モードにて
入力された英文字列を変換を正確かつ簡易に行なえる。
【0015】請求項2の文字列変換装置においては、前
記変換手段は、変換候補文字列が変換候補として好まし
いか否かの判断規則を記憶する判断規則記憶手段を備
え、前記判断規則に基づいて、前記変換候補文字列が変
換候補として好ましくないと判断した場合に、前記入力
された英文字列中の英文字を含む読み文字列を得る。し
たがって、変換候補文字列が変換候補として好ましくな
い場合のみ、前記入力された英文字列中の英文字を含む
読み文字列を得ることができる。これにより、変換効率
を向上させることができる。
【0016】請求項3の文字列変換装置においては、前
記入力された英文字列を記憶する英文字列記憶手段を備
え、前記変換手段は、生成した読み文字列の一部の文字
について、前記英文字列記憶手段を参照して、入力され
た英文字列中の英文字を含むかな文字列を得る。したが
って、前記英文字列記憶手段を参照するだけで、入力さ
れた英文字列中の英文字を含むかな文字列を得ることが
できる。
【0017】請求項4の文字列変換装置においては、前
記変換手段は、前記入力された英文字列に、強制区分指
示命令が付加されている場合には、前記入力された英文
字列中の英文字列を含むかな文字列を得る。したがっ
て、文字列入力者の意図に合致した場合に、前記入力さ
れた英文字列中の英文字を含む読み文字列を得ることが
できる。これにより、変換効率を向上させることができ
る。
【0018】請求項5の文字列変換装置においては、前
記変換手段は、前記辞書手段に記憶されている変換前文
字列中における英文字より前に位置するかな文字列と同
じかな文字列が、前記ローマ字読み規則に基づいて生成
された読み文字列中に存在するか否かを判断して、存在
する場合には、前記生成された読み文字列において続く
かな文字列について、対応する英文字を得て、両英文字
列が一致するか否かを判断する。そして、両者が、一致
する場合には、前記入力された英文字列中の英文字を含
む読み文字列を得る。したがって、前記辞書手段に記憶
された変換前文字列を含むかな文字列が、前記読み文字
列中に存在する場合には、入力された文字列から英文字
を含む読み文字列を得ることができる。これにより、ロ
ーマ字入力モードにて入力された英文字列を変換を正確
かつ簡易に行なえる。
【0019】
【発明の実施の態様】
1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
す文字列変換装置1は、入力手段41、入出力制御手段
42、表示手段43、出力手段44、文字列記憶手段6
3、変換手段50および辞書手段70を備えている。
【0020】入力手段41には、各種の命令および変換
対象となる英数文字列が入力される。入出力制御手段4
2は、入力された英数文字列を文字列記憶手段63に与
える。 文字列記憶手段63は、英文字列記憶手段6
4、読み文字列記憶手段65、および表記文字列記憶手
段66を有している。入力された英数文字列は、英文字
列記憶手段64に記憶される。読み文字列記憶手段65
には、変換手段50で変換された読み文字列が記憶され
る。この読み文字列記憶手段65に記憶される文字列と
しては、かな文字列だけ、英数字文字列だけおよび双方
の組合わせのいずれの場合もある。表記文字列記憶手段
66には、変換手段50で変換された表記文字列が記憶
される。表記文字列としては、かな文字列、漢字文字
列、および英数字文字列のいずれの場合もある。
【0021】入出力制御手段42は、出力命令を受ける
と、表記文字列記憶手段66に記憶された表記文字列を
表示手段43に出力する。表示手段43は、この表記文
字列を表示する。出力手段44は、表記文字列記憶手段
66に記憶された表記文字列を出力する。
【0022】辞書手段70は、文法情報記憶手段71、
単語情報記憶手段72、共起用例情報記憶手段73、お
よび学習情報記憶手段74を有している。
【0023】文法情報記憶手段71は、単語間の文法的
な結びつきの正否に関する情報、その結びつきの強さに
関する情報等を記憶する。例えば、「名詞(助詞なし)
+接尾語は結びつきが強い、名詞(助詞なし)+名詞は
結びつきが強い」等の情報が記憶されている。
【0024】単語情報記憶手段72は、変換前文字列お
よび対応する変換後文字列を記憶する。変換前文字列に
は、かな文字だけ、英文字だけ、英数文字混じりのかな
文字のいずれの場合も含む。変換後文字列には、漢字、
カタカナ、英文字およびこれらの組合わせ文字列を含
む。具体的には、各々の単語の読み文字列、表記文字
列、品詞情報及び活用情報等が記憶される。
【0025】共起用例情報記憶手段73には、意味的な
結びつきの強い単語間の2項関係情報が記憶される。こ
の共起用例情報には、単に2つの結びつきの他に、
「人」、「花」等の属性単位の共起用例や、付加的な制
限情報を含むものである。付加的な制限情報としては、
例えば、「を」、「が」等の助詞情報、成立する向きの
情報等がある。共起用例としては、単語同志の結びつき
として、「暑い−夏」、「厚い−本」、「熱い−お湯」
等が記憶される。属性単位の共起用例として、「人
(彼、彼女、先生、恋人、等)に−会う」等が記憶され
る。属性単位の共起用例として、「花(チューリップ、
菊、等)が−咲く」等が記憶される。助詞の制限情報と
して、「話を−聞く」、「薬が−効く」、「機転が−利
く」等が記憶される。向きの制限情報として、「家庭−
教育」、「教育−過程」が記憶される。
【0026】かかる共起用例情報は、意味情報であり、
これを用いることにより同音語の多義性が解消される。
例えば、共起用例情報73による同音語の一例を示す
と、「あつい/ほん」という読みに対して変換処理を行
なう際に、共起用例情報73における「厚い−本」とい
う結びつきの情報から「厚い」が選択され、「熱い、暑
い」等は選択されない。したがって、「厚い/本」とい
う変換結果が即座に得られる。このように、共起用例情
報は、変換効率の向上を図るために用いられる。
【0027】学習情報記憶手段74は、複数の表記のう
ち、最近に使用された表記を優先して採用する場合の使
用情報である。
【0028】変換手段50は、読み文字列生成手段5
1、読み規則記憶手段52、基本解析手段53、文節区
切り処理手段54、自動辞書登録手段55、表記選択手
段56、およびローマ字区切り変更手段58を備えてい
る。
【0029】読み規則記憶手段52は、英文字列に対す
るローマ字読み文字列が記憶されている。読み文字列生
成手段51は、読み規則記憶手段52に記憶されたロー
マ字読み規則に基づいて、英文字列記憶手段64に記憶
された英文字列から読み文字列を生成して、読み文字列
記憶手段65に記憶する。
【0030】基本解析手段53は、辞書手段70の文法
情報記憶手段71および単語情報記憶手段72を参照し
て文節の区切り位置を推定する。
【0031】文節区切り処理手段54は、基本解析手段
52から出力される文節区切り候補に対して文法/単語
情報のチェックをすると共に、共起用例情報記憶手段7
3を参照して同音語選択処理等を行なう。さらに、文節
区切り処理手段54は文節区切り候補の絞り込みを行な
う。
【0032】表記選択手段56は、文節区切り処理手段
54の処理にて、表記が未決定の文節に対して表記の決
定を行なう。表記選択手段56は、切り出された文節の
単語部分を、かな文字列からローマ字文字列に変換する
逆ローマ字変換手段57を有している。なお、逆ローマ
字変換手段82は、表示文字サイズの変更も可能であ
る。
【0033】自動辞書登録手段55は、表記選択手段5
6で決定された単語が、辞書手段70の単語情報記憶手
段72に登録されていない場合には、この単語の読み、
表記文字列、品詞等の情報を単語情報記憶手段72に自
動登録する。
【0034】ローマ字区切り変更手段58は、判断規則
記憶手段59を有しており、以下の様にして、ローマ字
区切りを変更する。判断規則記憶手段59には、変換候
補文字列が変換候補として好ましいか否かの判断規則が
記憶されている。ローマ字区切り変更手段58は、この
判断規則に基づいて、読み文字列記憶手段65に記憶さ
れた読み文字列の一部の文字について、前記英文字列記
憶手段に記憶された英文字列を参照して、入力された英
文字列中の英文字を含むかな文字列を得る。得られた英
文字を含むかな文字列について、基本解析手段53およ
び文節区切り処理手段54は、再度文字列変換を行な
う。
【0035】かかる構成により、変換手段50は、ロー
マ字入力モードにて入力された英文字列を、ローマ字読
み規則に基づいて読み文字列を生成するとともに、前記
辞書手段を検索して前記読み文字列中に前記変換前文字
列が存在する場合は、これに対応する英字文字列を変換
後文字列として出力する。また、前記判断規則に基づい
て、前記変換候補文字列が変換候補として好ましくない
と判断した場合には、前記ローマ字読み規則にとらわれ
ることなく、前記生成された読み文字列の一部のかな文
字列について、前記入力された英文字列中の英文字を含
む読み文字列を得て、前記辞書手段を検索することがで
きる。
【0036】なお、本実施形態においては、判断規則記
憶手段59を設け、必要な場合にのみ、前記ローマ字区
切り処理を行なっているが、これを設けず、全てについ
て前記ローマ字区切り処理を行なうようにしてもよい。
【0037】2.ハードウェア構成 図2に、図1に示す文字列変換装置1をCPUを用いて
実現したハードウェア構成の一例を示す。
【0038】文字列変換装置1は、CPU23、メモリ
27、ハードディスク26、CRT30、FDD25、
キーボード28、マウス31およびバスライン29を備
えている。CPU23は、ハードディスク26に記憶さ
れた制御プログラムにしたがいバスライン29を介し
て、各部を制御する。
【0039】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスクから
読み出されてハードディスク26にインストールされた
ものである。なお、フレキシブルディスク以外に、CD
−ROM、ICカード等のプログラムを実体的に一体化
したコンピュータ可読の記憶媒体から、ハードディスク
にインストールさせるようにしてもよい。さらに、通信
回線を用いてダウンロードするようにしてもよい。
【0040】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0041】ハードディスク26には辞書データが記憶
される。メモリ27には各種の演算結果等が記憶され
る。CRT30には、変換候補等が表示される。
【0042】CRT30の表示について図3を用いて、
説明する。CRT30の編集画面100には、文章を表
示するエリアの他に、画面下方にエリア110が設けら
れている。エリア110には、各種メッセージや状態が
表示され、また、同音異義語の候補が表示される。エリ
ア110の拡大図を同図の右側部分に示す。エリア11
0の中のエリア120は、次候補群表示のための指示が
与えられたとき、それらの単語候補を表示する領域とし
て使用される。
【0043】ここで、[挿入]とは、キーボード4から
入力された文字列をカーソル102の直前に挿入するこ
とを意味しており、[確定]とは、かな漢字変換等のか
な文書変換をしてユーザが選択した単語を後で再度読み
に戻すことをしないモードになっていることを意味す
る。[連カナ漢]とは、かな漢字変換モードが連文節で
って、カナ入力であることを示している。
【0044】なお、上述の[挿入]については、所定の
制御キーを操作することにより、[挿入]と[上書]が
相互に適宜変更可能になっている。[カナ漢]について
も、同様に、ローマ字入力の[R漢]と相互に変更可能
である。
【0045】図3において、ユーザが、キーボード28
より文字列を入力し、変換キーを押下することにより、
後述するように、文字列変換処理が実行される。この結
果、画面のカーソル102の位置に、各々の読みで変換
された優先度の高い単語からなる文(もしくは文節)が
未確定の状態で表示される。このとき、次候補キーを押
下すると、表示された未確定単語のうち、先頭の文節の
候補群がエリア120に表示される。
【0046】本実施形態においては、スペースキーを、
かな文書変換キーおよび次候補キーに対応させている。
すなわち、読みを入力した直後にスペースキーが押下さ
れた時は、かな文書変換キーとして判断する。この状態
で、続けてスペースキーが入力したときには次候補キー
として処理される。なお、読みを入力せず、単にスペー
スキーが入力されたとき、又はコントロールキーとシフ
トキーとスペースキーとが同時に押下された時には、本
来の空白文字の入力として処理される。
【0047】候補の確定は、変換キーを押下したときの
状態(第1候補)でよければ、その時点でリターンキー
を押下するか、もしくは続いて読みキーを押下すること
でなされる。また、次候補キーを押下して候補群をエリ
ア120に表示した時には、その候補のいずれかを選択
(候補群には番号が付されていて、その番号を入力)し
たのち、リターンキー(確定キー)を押下することで確
定する。なお、読みが確定している時に入力したリター
ンキーは文字どおり改行キーを示す。
【0048】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、説明する。
【0049】3.1 自動登録および変換処理 図4のフローチャートを用いて、文書処理動作を説明す
る。ユーザは、キーボード28から、英文字列を入力す
る。CPU23は、英文字列が入力されるか否か判断し
ており(図4ステップST1)、英文字列が入力される
と、入力された英文字列をローマ字バッファ27aに記
憶する(図4ステップST3)。つぎに、入力された英
文字列について、以下に示すローマ字読み規則に基づい
て、ローマ字を読みが可能か否か判断する(ステップS
T5)。
【0050】ローマ字読み規則 規則1:ローマ字文字列がローマ字かな変換テーブルに
登録されている文字列の場合には、該当するローマ字文
字列をかな文字に変換する。
【0051】規則2:英子音文字が連続して入力された
場合は、最初の英子音文字を「っ」に変換し、以後規則
1を繰り返す。
【0052】CPU23は、ローマ字を読みが可能な場
合には、かな変換を行なう(ステップST7)。変換さ
れたかな文字は読み文字列バッファ27bに記憶される
(ステップST9)。たとえは、図5Aに示すような英
文字列が入力された場合、「DA」と入力された段階
で、母音であるので、かな変換処理が行なわれ、読み文
字列バッファ27bに、「だ」が記憶される。
【0053】このような処理を繰返す事により、入力さ
れた英文字列から読み文字列が生成される。例えば、図
5Aに示す文字列に対して、上述のローマ字かな変換規
則を適用すると、図5Bに示すような読み文字列が生成
されて読み文字列バッファ27bに記憶される。
【0054】このようにして、ローマ字バッファ27a
および読み文字列バッファ27bには、順次データが記
憶される。なお、ローマ字読みできない英字、数字、記
号キーの場合には、そのまま読み文字列バッファ27b
へ記憶される。
【0055】CPU23は、変換キーが操作されるか否
か判断しており(ステップST11)、変換キーが操作
されないうちは、ステップST1〜ステップST9の処
理が繰返される。この状態で、ユーザが変換キーを操作
すると、CPU23は、変換キーが操作されたと判断し
て、文節区切りおよび辞書変換処理を行なう(ステップ
ST13)。
【0056】ステップST13の処理は、従来の文節区
切りおよび辞書変換処理と同様である。簡単に説明する
と、辞書部26bに記憶されたデータ(単語情報、文法
情報等)により、読み文字列バッファ27bのデータに
ついて、読み文字列の文節候補が抽出される。さらに、
辞書部26bに記憶された他のデータを用いて、抽出さ
れた文節候補が、文法的、意味的にチェックされて文節
候補の絞り込みが行なわれる。かかる絞り込みととも
に、文節区切り処理がなされる。
【0057】つぎに、CPU23は、最小コスト法によ
り、変換候補を仮決定するとともに、仮決定した変換候
補を、表記文字列バッファ27cに記憶する(ステップ
ST15)。なお、最小コスト法以外に公知の方法を用
いてもよい。
【0058】つぎに、CPU23は、ローマ字区切り変
更処理が必要か否か判断する(図8ステップST1
9)。ローマ字区切り変更処理については後述する。ロ
ーマ字区切り変更処理が必要でないと判断した場合に
は、この表示文字列バッファ27cに記憶された文字列
を、CRT30に表示する(ステップST21)。
【0059】ユーザは、表示された変換結果について、
変換が正しいか否か判断し、正しい場合は、確定キーを
操作する。また、文節区切りが誤っていると判断した場
合は、文節区切り修正キーを操作する。また、文節区切
りは正しいが、間違った同音異義語が表示されている場
合には、次候補キーを操作する。
【0060】CPU23は、ステップST23にていず
れのキーが操作されたか判断する。もし、文節区切り修
正キーが操作された場合は、当該キーの内容に応じて、
文節区切り位置を変更して(ステップST25)、図4
ステップST13以下の処理を繰返す。
【0061】次候補キーが操作された場合は、CPU2
3は、逆ローマ字変換処理を行なう(ステップST2
7)。逆ローマ字変換処理について、簡単に説明する。
ここでは、図5Cの「だて」部分について、逆ローマ字
変換処理を行なうものとする。CPU23は、「だて」
を、ローマ字バッファ27aを参照して、英文字列に変
換する。そして、全角で表記した第1候補(「DAT
E」)と、半角サイズで表記した第2候補(「dat
e」)が生成される。
【0062】このように、逆ローマ字変換処理を行なう
ことにより入力された英文字列を変換する事ができる。
【0063】つぎに、CPU23は、これらの2つの候
補に加えて、辞書部26bから読み出した第3〜第7の
候補とを合成して、CRT30の候補表示エリア120
に提示する(図5D参照)。このようにして、逆ローマ
字変換された文字列が、辞書部26bに登録されている
候補とともに、表示され、ユーザの選択対象として提示
される。
【0064】ユーザは、エリア120に提示された次候
補の中から、「1.DATE」を選択する候補特定命令
を与える。CPU23は、かかる候補特定命令が与えら
れると、エリア120の表示を図5Eに示すように変化
させ、図5Fに示すように変更候補を表示する。
【0065】所望の変換結果が得られたので、ユーザ
は、確定キーを操作する。これにより、CPU23は、
確定処理を行なう(ステップST31)。これにより、
表記文字列バッファ27cに図5Fに示す文字列が記憶
される。
【0066】つぎに、CPU23は、逆ローマ字変換さ
れた文字列が前記確定文字列中に存在するか否か判断す
る(ステップST33)。存在する場合には、CPU2
3は、辞書部26bに当該逆ローマ字変換された文字列
を記憶する。この場合であれば、CPU23は、図9に
示すように、文字列「DATE」が読み「だて」とし
て、追加登録するとともに、学習情報を更新する。
【0067】このように、ユーザの辞書登録操作を一切
要求することなく、自動的に辞書部26bに新しい単語
が登録される。したがって、例えば、つぎにユーザが、
「ひづけのかくにんには、だてとにゅうりょくする。」
と文字入力して変換キーを押すと「日付の確認には、D
ATEと入力する。」と一回で正しくかな文書変換がで
きる。すなわち、日英辞書や英日辞書等を特別用意して
おかなくても、外国語の単語をオリジナルのまま入力し
てかな漢字混じり文章の中に混在させることが可能とな
るとともに、新規単語をユーザの操作により新規登録す
る必要もない。
【0068】このように、本実施形態においては、辞書
部26bに登録されていない単語が検出された場合に
は、変換候補として、これらのかな文字列を元のキー入
力時のローマ字文字列に逆変換して、大文字全角、小文
字半角、大文字半角、小文字全角等に変換し、ユーザに
次候補の1つとして提示する。さらに、元のかな文字列
のまま表示した文字列やひらがなをカタカナに変換した
文字列を、次候補の1つとして提示するとユーザの選択
範囲を拡大することができる。
【0069】なお、次候補の提示の順番として、逆ロー
マ字変換した文字列を優先的に提示するようにすると、
日本語と外国語をより区別することなくユーザが取扱え
るようになる。さらに、逆ローマ字変換の英大文字への
変換が先か、英子文字への変換が先か、或いは全角表記
が先か、半角表記文字列も次候補の1つとして表示する
か等は、ユーザの選択によりカスタマイズできるように
しておくと、ユーザが逆ローマ字変換をより利用しやす
くなる。
【0070】逆ローマ字変換された候補文字列が確定文
字列として採用された場合、辞書部26bに順次自動登
録することが可能となり、この機能は日本語と外国語と
を混在させた日本語文章を作成する場合、モード変換キ
ーや辞書登録操作をユーザに一切要求しないで新規外国
語を辞書登録できる。
【0071】このように、本実施形態においては、次候
補キーが押下された場合に、次候補対象として、入力さ
れた英文字に戻した文字列を表示するようにしている。
これにより、ユーザは、変換キーを操作するだけで、後
変換キー(かな変換された文字列を再び英文字列に変換
するキー)を操作することなく、所望の英文字列を得る
ことができる。さらに、かかる英文字列が確定された場
合は、これを自動登録するようにしている。したがっ
て、辞書に新たに登録する作業が不要となる。
【0072】なお、本実施形態においては、辞書に登録
する際、前記自動登録処理を行なったが、これに限定さ
れず、ユーザが後変換キーを操作して、英文字列に変換
され、かかる変換が確定した時に、辞書登録するように
してもよい。
【0073】3.2 ローマ字区切り変更処理つぎに、ロ
ーマ字区切り変更処理について説明する。ローマ字区切
り変更処理とは、入力文字列をローマ字読みする際に、
ユーザの意図とは異なる部分でローマ字読みをした為
に、辞書登録されている文字列に変換されない場合に、
入力文字列を前記ローマ字読み規則にとらわれることな
く、ローマ字読みする処理をいう。
【0074】例えば、辞書に「ATOK」が登録されて
おり、「ATOK用例」と変換する為に「atokyo
urei」を入力した場合、上記ローマ字読み規則で
は、「あときょうれい」とローマ字読みされてしまい、
ユーザの入力意図とはズレてしまう。ローマ字区切り変
更処理を行なう事により、これをユーザの意図通りロー
マ字読みさせて、正しい変換結果を得る事ができる。
【0075】CPU23は、図8ステップST19にお
いて、ローマ字区切り変更処理が必要である可能性が高
い場合には、図11ステップST41以下の処理を行な
う。本実施形態においては、CPU23は、一文字文節
がある場合は、ローマ字区切り変更処理が必要である可
能性が高い判断するようにした。
【0076】例えば、「ATOK用例」と変換する為
に、「atokyourei」と入力すると、「あとき
ょうれい」とローマ字読みされて、図7に示す辞書を参
照して「後,強冷」と変換される。この場合、漢字変換
された文字列に、一文字文節「後」が存在するので、ス
テップST19にて、ローマ字区切り変更処理が必要で
あると判断する。
【0077】CPU23は、該当文節における注目かな
文字について、フラグrmposが「0」の英文字で再
区切りを行なう。フラグrmposとは、入力された英
文字列をローマ字読みしたときに、母音となるか子音と
なるかを区別する為のフラグである。これは、入力文字
列をローマ字読みした段階で、ローマ字かな変換処理が
可能となった部分を、フラグrmpos[1]とし、そ
れ以外の部分は、フラグrmpos[0]とする。ま
た、注目かな文字は、最初は、当該文節の後から1番目
で、かつフラグrmpos[0]を含むかな文字とす
る。
【0078】具体的に説明すると、図10Aに示すよう
に、「atokyourei」と入力された場合、フラ
グrmposは、図10Bに示す様に、「1,0,1,
0,0,1,1,0,1,1」となる。そして、この場
合、注目かな文字は、「あ,と,き,ょ,う,れ,い」
の「れ」となる。したがって、この場合、「れ」を英文
字文字列「r」,「i」として、図10Dに示すよう
に、英文字混入読み文字列「あときょうr」に、かな変
換する。
【0079】CPU23は、この「あときょうr」が辞
書部26bに登録されているか否かを判断する(ステッ
プST43)。登録されていない場合には、つぎの区切
りが可能か否か判断し(ステップST45)、可能であ
る場合は、ステップST41の処理を繰返す。
【0080】この場合、つぎの区切りが可能であるの
で、つぎの、フラグrmpos[0]を含むかな文字
で、かな変換する。これにより、図10Eに示す様に、
「あとky」が得られる。CPU23は、この「あとk
y」が、辞書部26bに登録されているか否かを判断す
る(ステップST43)。登録されていない場合には、
つぎの区切りが可能か否か判断し(ステップST4
5)、可能である場合は、ステップST41の処理を繰
返す。
【0081】この場合、つぎの区切りが可能であるの
で、つぎの、フラグrmpos[0]を含むかな文字
で、かな変換する。これにより、図10Fに示す様に、
「あとk」が得られる。CPU23は、この「あとk」
が、辞書部26bに登録されているか否かを判断する
(ステップST43)。この場合、図7に示すように
「あとk」が登録されているので、当該位置でローマ字
かな変換処理を行ない(ステップST49)、図4ステ
ップST13以下の処理を行なう。
【0082】なお、ステップST13の処理を行なう事
により、入力文字列「atokyourei」は、「A
TOK用例」と変換される。
【0083】なお、ステップST45にて、つぎの区切
りが可能でない場合は、ローマ字区切り変更処理は不要
と判断して、図4ステップST15にて、仮決定された
変換候補を変換候補とする(ステップST47)。そし
て、図8ステップST21以下の処理を行なう。
【0084】このようにして、英文字を含む文字列を正
確に変換することができる。なお、本実施形態において
は、検索が成功するまで、読みの長い順に行なったが、
読みの短い順に行なうこともできる。さらに、検索が成
功すると処理を中止しているが、可能の場合全てについ
て検索を行ない、最も評価の高いものを選択するように
してもよい。
【0085】なお、本実施形態においては、一文字文節
がある場合は、ローマ字区切り変更処理が必要である可
能性が高いと判断して、前記ローマ字区切り変更処理を
するようにしたが、これに以外に、ローマ字区切り変更
処理が必要である可能性が高い場合を設定しておき、同
様の処理を行なうようにしてもよい。例えば、未登録語
の文節がある場合である。
【0086】未登録語の文節としては、例えば、「or
iginal」が辞書登録されており、「origin
alアプリ」と変換する為に、「originalap
ri」と入力したとする。この場合、「おりぎなぁぷ
り」と、かな変換され、漢字変換すると、例えば「折技
なぁぷり」となる。この場合、「なぁぷり」は未登録語
の文節となる。この様な場合も、前記一文字文節がある
場合と同様に、ローマ字区切り変更処理が必要である可
能性が高いと判断できる。
【0087】4.他の実施形態 上記実施形態においては、一旦漢字変換してからローマ
字区切り変更処理が必要か否か判断しているが、文字入
力がされた状態でローマ字区切り変更処理が必要である
か否か判断するようにしてもよい。例えば、シフトキー
を押した状態で文字入力がされた場合は、ローマ字区切
り変更処理が必要である可能性が高いと判断して、1回
目の英文字列からかな変換する状態で、前記ローマ字読
み規則にとらわれない区切り処理をするよう決定するこ
とができる。
【0088】例えば、辞書に「ATOK」が登録されて
おり、「このATOK用例を用いて」と変換する為に、
「konoAtokyoureiwomotiite」
と「A」をシフトキーを用いて入力した場合は、以下の
様にして、ローマ字かな変換する。
【0089】CPU23は、シフトキーを用いて入力さ
れた文字「A」から、英字の区切りに属しない箇所まで
で、ローマ字かな変換を行なう。すなわち、「kono
Atokyoureiwomotiite」のうち、
「Atokyourei」について、英字の区切りに属
しない箇所までの文字列「atokyour」で区切り
を行ない、「あときょうr」に、かな変換する。そし
て、この「あときょうr」が辞書にあるか否かを判断す
る。
【0090】ない場合には、上記と同様にして、再区切
り処理を行なう。このようにして、ユーザの命令がなく
ても、確実に英文字を含む文字列を変換することができ
る。
【0091】なお、この場合も、読みの短い順に行なう
こともできる。
【0092】このように、入力手段に英文字列が入力さ
れる際に、強制区分指示命令が付加されている場合に
は、前記入力された英文字列中の英文字列を含むかな文
字列を得る様にしてもよい。
【0093】また、以下の様にして、前記入力された英
文字列中の英文字を含む読み文字列を得る様にしてもよ
い。辞書に存在する文字列のうち、英文字を含む文字列
の当該英文字までのかなが含まれている部分があるか否
かをローマ字かな変換をした段階で判断する。そして、
存在する場合には、入力文字におけるこれにつづく英字
と、辞書に記憶されている文字列におけるこれに続く英
字が一致するか否か判断し、一致する場合にはその箇所
で英字区切りを行なう。
【0094】たとえば、「あとk」が登録されている場
合、「atokyourei」が入力されると「あとき
ょうれい」とローマ字かな変換がなされる。かかる入力
文字中に、辞書登録されている「あとk」の「あと」部
分の文字列(以下かな共通部という)があるか否かを判
断する。この場合、かな共通部が存在するので、入力文
字列の「あときょうれい」についてかな共通部に続く英
字を抽出する。なお、かな共通部に続く英字は、つぎの
母音の部分の前までの組合わせ全てが抽出される。した
がって、この場合、「k」および「ky」の2種類が抽
出される。辞書登録されている文字は、かな共通部につ
づく英字は「k」である。この場合、「k」と考えれ
は、両者が一致するので、この場合「atokyour
ei」は「atok」と「yourei」に区切られ
る。
【0095】この場合、全ての箇所についてかかる処理
を行なうのは効率が悪いので、上記一文字文節がある場
合、または未登録語がある場合のみ、かかる処理を行な
うようにしてもよい。
【0096】上記実施形態においては、ローマ字バッフ
ァを参照して、英文字に戻すようにしてローマ字区切り
変更処理を実行しているが、図6のローマ字読み規則を
逆読みして、英文字に戻すようにして実行するようにし
てもよい。
【0097】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。
【図面の簡単な説明】
【図1】本発明にかかる文字列変換装置1の機能ブロッ
ク図である。
【図2】図1に示す文字列変換装置1のハードウエア構
成の一例を示す図である。
【図3】CRT30の表示を示す図である。
【図4】変換処理のフローチャートを示す。
【図5】ローマ字バッファ、かなバッファ、表記文字バ
ッファのデータ内容および表示例を示す図である。
【図6】ローマ字読み規則を示す図である。
【図7】辞書部26bの内容を示す図である。
【図8】変換処理のフローチャートを示す。
【図9】辞書部26bに追加される単語データ内容を示
す図である。
【図10】ローマ字バッファ、かなバッファのデータ内
容を示す図である。
【図11】ローマ字区切り変更処理のフローチャートを
示す。
【符号の説明】
63・・・文字列記憶手段 50・・・変換手段 70・・・辞書手段 23・・・CPU 27・・・メモリ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】英文字を含むかな文字列を変換前文字列と
    して、この変換前文字列に対応する変換後文字列を記憶
    する辞書手段、 ローマ字入力モードにて入力された英文字列を、ローマ
    字読み規則に基づいて読み文字列を生成するとともに、
    前記辞書手段を検索して前記読み文字列中に前記変換前
    文字列が存在する場合は、これに対応する英字文字列を
    変換後文字列として出力する変換手段、 を備えた文字列変換装置において、 前記変換手段は、前記ローマ字読み規則にとらわれるこ
    となく、前記生成された読み文字列の一部のかな文字列
    について、前記入力された英文字列中の英文字を含む読
    み文字列を得て、前記辞書手段を検索できるよう構成さ
    れていること、 を備えたことを特徴とする文字列変換装置。
  2. 【請求項2】請求項1の文字列変換装置において、 前記変換手段は、変換候補文字列が変換候補として好ま
    しいか否かの判断規則を記憶する判断規則記憶手段を備
    え、前記判断規則に基づいて、前記変換候補文字列が変
    換候補として好ましくないと判断した場合に、前記入力
    された英文字列中の英文字を含む読み文字列を得るこ
    と、 を特徴とする文字列変換装置。
  3. 【請求項3】請求項2の文字列変換装置において、 前記入力された英文字列を記憶する英文字列記憶手段を
    備え、 前記変換手段は、生成した読み文字列の一部の文字につ
    いて、前記英文字列記憶手段を参照して、入力された英
    文字列中の英文字を含むかな文字列を得ること、 を特徴とする文字列変換装置。
  4. 【請求項4】請求項1の文字列変換装置において、 前記変換手段は、前記入力された英文字列に、強制区分
    指示命令が付加されている場合には、前記入力された英
    文字列中の英文字列を含むかな文字列を得ること、 を特徴とする文字列変換装置。
  5. 【請求項5】請求項1の文字列変換装置において、 前記変換手段は、 1)前記辞書手段に記憶されている変換前文字列中におけ
    る英文字より前に位置するかな文字列と同じかな文字列
    が、前記ローマ字読み規則に基づいて生成された読み文
    字列中に存在するか否かを判断し、 2)存在する場合には、前記生成された読み文字列におい
    て続くかな文字列について、対応する英文字を得て、両
    英文字列が一致するか否かを判断し、 3)一致する場合には、前記入力された英文字列中の英文
    字を含む読み文字列を得ること、 を備えたことを特徴とする文字列変換装置。
  6. 【請求項6】英文字を含むかな文字列を変換前文字列と
    して、この変換前文字列に対応する変換後文字列を記憶
    しておき、 ローマ字入力モードにて入力された英文字列を、ローマ
    字読み規則に基づいて読み文字列を生成するとともに、
    前記読み文字列中に前記変換前文字列が存在する場合
    は、これに対応する英字文字列を変換後文字列として決
    定する文字列変換方法において、 前記読み文字列生成の際に、前記ローマ字読み規則にと
    らわれることなく、前記生成された読み文字列の一部の
    かな文字列について、前記入力された英文字列中の英文
    字を含む読み文字列を得て、この英文字列中の英文字を
    含む読み文字列中に前記変換前文字列が存在するか否か
    も判断すること、 を特徴とする文字列変換方法。
  7. 【請求項7】コンピュータが実行可能なプログラムを記
    憶したコンピュータ可読の記憶媒体であって、前記プロ
    グラムは、請求項1ないし請求項6のいずれかの装置又
    は方法を実現するものであること、 を特徴とする記憶媒体。
JP29997595A 1995-11-17 1995-11-17 文字列変換装置および文字列変換方法 Expired - Fee Related JP3814000B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29997595A JP3814000B2 (ja) 1995-11-17 1995-11-17 文字列変換装置および文字列変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29997595A JP3814000B2 (ja) 1995-11-17 1995-11-17 文字列変換装置および文字列変換方法

Publications (2)

Publication Number Publication Date
JPH09146937A true JPH09146937A (ja) 1997-06-06
JP3814000B2 JP3814000B2 (ja) 2006-08-23

Family

ID=17879241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29997595A Expired - Fee Related JP3814000B2 (ja) 1995-11-17 1995-11-17 文字列変換装置および文字列変換方法

Country Status (1)

Country Link
JP (1) JP3814000B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112637A (ja) * 1998-10-06 2000-04-21 Ai Soft Kk データ入力装置、データの入力方法、および記録媒体
JP2013533996A (ja) * 2010-05-31 2013-08-29 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 英文と別の文字の混在入力に用いられる方法と装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112637A (ja) * 1998-10-06 2000-04-21 Ai Soft Kk データ入力装置、データの入力方法、および記録媒体
JP2013533996A (ja) * 2010-05-31 2013-08-29 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 英文と別の文字の混在入力に用いられる方法と装置

Also Published As

Publication number Publication date
JP3814000B2 (ja) 2006-08-23

Similar Documents

Publication Publication Date Title
EP0686286B1 (en) Text input transliteration system
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH07334625A (ja) 文字列入力装置
US20020035466A1 (en) Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
KR100213910B1 (ko) 한영 자동 변환기 및 방법
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JPH07334499A (ja) 文字列入力装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH05113964A (ja) 電子辞書
JPH10232863A (ja) かな漢字変換装置および方法、並びに記録媒体
JP3377942B2 (ja) 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体
JP2006012188A (ja) 文書処理方法及び装置
JPH08106461A (ja) 文書処理方法及び装置
KR0123403B1 (ko) 한·영 자동 전환 방법
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
KR0164405B1 (ko) 한/영 혼용문 자동구분방법
JPH10198678A (ja) かな漢字変換装置およびかな漢字変換方法
JPH0612453A (ja) 未知語抽出登録装置
JPH08171568A (ja) 複数言語入力方法
JPH0350668A (ja) 文字処理装置
KR100476100B1 (ko) 실용적인 중국어 입력 방법
JP2004355248A (ja) 電子辞書
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH0785026A (ja) 辞書更生方法及び装置
JPH08194698A (ja) 文字処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060602

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090609

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120609

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150609

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees