JPH09146937A

JPH09146937A - 文字列変換装置および文字列変換方法

Info

Publication number: JPH09146937A
Application number: JP7299975A
Authority: JP
Inventors: Hiroki Amochi; 博喜阿望
Original assignee: JustSystems Corp
Current assignee: JustSystems Corp
Priority date: 1995-11-17
Filing date: 1995-11-17
Publication date: 1997-06-06
Anticipated expiration: 2015-11-17
Also published as: JP3814000B2

Abstract

(57)【要約】【課題】ローマ字入力モードにて入力された英文字列
を変換を正確かつ簡易に行なう。【解決手段】変換された文字列に、一文字文節が存在
する場合、ローマ字区切り変更処理を行なう。具体的に
は、注目かな文字について、英文字列に再変換し（ステ
ップＳＴ４１）、このアルファベット文字列の一部を含
む英文字列混在文字列が、辞書に登録されているかを判
断し（ステップＳＴ４３）、登録されている場合は、当
該位置でローマ字かな変換処理を行ない（ステップＳＴ
４９）、得られたかな文字列について、辞書を用いて変
換を行なう。かかる処理は、可能なかぎり続けられる
（ステップＳＴ４５）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、文字列変換装置
に関し、特に、辞書登録されたローマ字混入文字列の変
換に関する。

【０００２】

【関連技術および発明が解決しようとする課題】かな漢
字変換において、英字で入力して、かな漢字変換を行な
う英字入力かな漢字変換方法が知られている。この英字
入力かな漢字変換方法において、英文字混在文字列を入
力する場合には、その英文字混在文字列について、その
綴りをそのまま入力し、後で逆変換を行なう方法があ
る。例えば、「ｏｒｉｇｉｎａｌの動作」という英文字
混入文字列を入力する場合には、英字入力モードにて、
「ｏｒｉｇｉｎａｌｎｏｄｏｕｓａ」と入力して、変換
キーを押す。すると、「おりぎなｌの動作」と仮変換さ
れる。この状態で、逆変換する部分である「おりぎな
ｌ」を指定して、逆変換キーを押すと、指定された部分
が「ｏｒｉｇｉｎａｌ」と英文字文字列に逆変換され
る。このように、文字列変換装置においては、英字入力
モードにて英文字混入文字列を入力する場合に、一旦正
しいスペルで英文字を入力しておいて後で逆変換する後
変換機能が採用されている。

【０００３】しかしながら、かかる後変換機能を用いて
も、一旦逆変換する部分を指定して逆変換を行なうとい
う作業が必要となる。したがって、英文字混入文字列を
入力する場合には、英文字が混入しない文字列を入力す
る場合と比べて、作業性が低下する。

【０００４】かかる問題を解決する為に、前記後変換が
行なわれた場合にはこれを自動的に辞書に登録し、次回
からは通常の漢字と同様に変換キーを押すだけで、英文
字に変換することも考えられる。しかし、かかる辞書機
能を用いても、以下の様な場合には、正確に変換できな
いという問題があった。

【０００５】例えば、入力文字列「おりぎなｌ」に対し
て変換後文字列「ｏｒｉｇｉｎａｌ」が辞書登録してあ
る場合に、「ｏｒｉｇｉｎａｌ案で」という文字列に変
換する為に、「ｏｒｉｇｉｎａｌａｎｄｅ」と入力し
て、変換キーを押したとする。この場合、前記入力文字
列は、所定のローマ読み規則（この場合、「ｌａ」＝
「ぁ」とする）に基づいて、かな文字列「おりぎなぁん
で」として理解されて、例えば、変換後文字列「折技な
ぁんで」と変換されてしまう。

【０００６】この発明は上記問題を解決し、ローマ字入
力モードにて入力された英文字列を変換を正確かつ簡易
に行なえる文字列変換装置および変換方法を提供するこ
とを目的とする。

【０００７】

【課題を解決するための手段】請求項１の文字列変換装
置においては、英文字を含むかな文字列を変換前文字列
として、この変換前文字列に対応する変換後文字列を記
憶する辞書手段、ローマ字入力モードにて入力された英
文字列を、ローマ字読み規則に基づいて読み文字列を生
成するとともに、前記辞書手段を検索して前記読み文字
列中に前記変換前文字列が存在する場合は、これに対応
する英字文字列を変換後文字列として出力する変換手
段、を備えた文字列変換装置において、前記変換手段
は、前記ローマ字読み規則にとらわれることなく、前記
生成された読み文字列の一部のかな文字列について、前
記入力された英文字列中の英文字を含む読み文字列を得
て、前記辞書手段を検索できるよう構成されているこ
と、を備えたことを特徴とする。

【０００８】請求項２の文字列変換装置においては、前
記変換手段は、変換候補文字列が変換候補として好まし
いか否かの判断規則を記憶する判断規則記憶手段を備
え、前記判断規則に基づいて、前記変換候補文字列が変
換候補として好ましくないと判断した場合に、前記入力
された英文字列中の英文字を含む読み文字列を得ること
を特徴とする。

【０００９】請求項３の文字列変換装置においては、前
記入力された英文字列を記憶する英文字列記憶手段を備
え、前記変換手段は、生成した読み文字列の一部の文字
について、前記英文字列記憶手段を参照して、入力され
た英文字列中の英文字を含むかな文字列を得ることを特
徴とする。

【００１０】請求項４の文字列変換装置においては、前
記変換手段は、前記入力された英文字列に、強制区分指
示命令が付加されている場合には、前記入力された英文
字列中の英文字列を含むかな文字列を得ることを特徴と
する。

【００１１】請求項５の文字列変換装置においては、前
記変換手段は、 1)前記辞書手段に記憶されている変換前文字列中におけ
る英文字より前に位置するかな文字列と同じかな文字列
が、前記ローマ字読み規則に基づいて生成された読み文
字列中に存在するか否かを判断し、 2)存在する場合には、前記生成された読み文字列におい
て続くかな文字列について、対応する英文字を得て、両
英文字列が一致するか否かを判断し、 3)一致する場合には、前記入力された英文字列中の英文
字を含む読み文字列を得ること、を備えたことを特徴と
する。

【００１２】請求項６の文字列変換方法においては、英
文字を含むかな文字列を変換前文字列として、この変換
前文字列に対応する変換後文字列を記憶しておき、ロー
マ字入力モードにて入力された英文字列を、ローマ字読
み規則に基づいて読み文字列を生成するとともに、前記
読み文字列中に前記変換前文字列が存在する場合は、こ
れに対応する英字文字列を変換後文字列として決定する
文字列変換方法において、前記読み文字列生成の際に、
前記ローマ字読み規則にとらわれることなく、前記生成
された読み文字列の一部のかな文字列について、前記入
力された英文字列中の英文字を含む読み文字列を得て、
この英文字列中の英文字を含む読み文字列中に前記変換
前文字列が存在するか否かも判断すること、を特徴とす
る。

【００１３】請求項７の記憶媒体においては、コンピュ
ータが実行可能なプログラムを記憶したコンピュータ可
読の記憶媒体であって、前記プログラムは、請求項１な
いし請求項６のいずれかの装置又は方法を実現するもの
であることを特徴とする。

【００１４】

【発明の効果】請求項１、請求項６の文字列変換装置ま
たは文字列変換方法においては、前記読み文字列生成の
際に、前記ローマ字読み規則にとらわれることなく、前
記生成された読み文字列の一部のかな文字列について、
前記入力された英文字列中の英文字を含む読み文字列を
得て、この英文字列中の英文字を含む読み文字列中に前
記変換前文字列が存在するか否かも判断する。これによ
り、入力された文字列から英文字を含む読み文字列を得
ることができる。したがって、ローマ字入力モードにて
入力された英文字列を変換を正確かつ簡易に行なえる。

【００１５】請求項２の文字列変換装置においては、前
記変換手段は、変換候補文字列が変換候補として好まし
いか否かの判断規則を記憶する判断規則記憶手段を備
え、前記判断規則に基づいて、前記変換候補文字列が変
換候補として好ましくないと判断した場合に、前記入力
された英文字列中の英文字を含む読み文字列を得る。し
たがって、変換候補文字列が変換候補として好ましくな
い場合のみ、前記入力された英文字列中の英文字を含む
読み文字列を得ることができる。これにより、変換効率
を向上させることができる。

【００１６】請求項３の文字列変換装置においては、前
記入力された英文字列を記憶する英文字列記憶手段を備
え、前記変換手段は、生成した読み文字列の一部の文字
について、前記英文字列記憶手段を参照して、入力され
た英文字列中の英文字を含むかな文字列を得る。したが
って、前記英文字列記憶手段を参照するだけで、入力さ
れた英文字列中の英文字を含むかな文字列を得ることが
できる。

【００１７】請求項４の文字列変換装置においては、前
記変換手段は、前記入力された英文字列に、強制区分指
示命令が付加されている場合には、前記入力された英文
字列中の英文字列を含むかな文字列を得る。したがっ
て、文字列入力者の意図に合致した場合に、前記入力さ
れた英文字列中の英文字を含む読み文字列を得ることが
できる。これにより、変換効率を向上させることができ
る。

【００１８】請求項５の文字列変換装置においては、前
記変換手段は、前記辞書手段に記憶されている変換前文
字列中における英文字より前に位置するかな文字列と同
じかな文字列が、前記ローマ字読み規則に基づいて生成
された読み文字列中に存在するか否かを判断して、存在
する場合には、前記生成された読み文字列において続く
かな文字列について、対応する英文字を得て、両英文字
列が一致するか否かを判断する。そして、両者が、一致
する場合には、前記入力された英文字列中の英文字を含
む読み文字列を得る。したがって、前記辞書手段に記憶
された変換前文字列を含むかな文字列が、前記読み文字
列中に存在する場合には、入力された文字列から英文字
を含む読み文字列を得ることができる。これにより、ロ
ーマ字入力モードにて入力された英文字列を変換を正確
かつ簡易に行なえる。

【００１９】

【発明の実施の態様】

１．機能ブロック図の説明本発明の一実施例を図面に基づいて説明する。図１に示
す文字列変換装置１は、入力手段４１、入出力制御手段
４２、表示手段４３、出力手段４４、文字列記憶手段６
３、変換手段５０および辞書手段７０を備えている。

【００２０】入力手段４１には、各種の命令および変換
対象となる英数文字列が入力される。入出力制御手段４
２は、入力された英数文字列を文字列記憶手段６３に与
える。文字列記憶手段６３は、英文字列記憶手段６
４、読み文字列記憶手段６５、および表記文字列記憶手
段６６を有している。入力された英数文字列は、英文字
列記憶手段６４に記憶される。読み文字列記憶手段６５
には、変換手段５０で変換された読み文字列が記憶され
る。この読み文字列記憶手段６５に記憶される文字列と
しては、かな文字列だけ、英数字文字列だけおよび双方
の組合わせのいずれの場合もある。表記文字列記憶手段
６６には、変換手段５０で変換された表記文字列が記憶
される。表記文字列としては、かな文字列、漢字文字
列、および英数字文字列のいずれの場合もある。

【００２１】入出力制御手段４２は、出力命令を受ける
と、表記文字列記憶手段６６に記憶された表記文字列を
表示手段４３に出力する。表示手段４３は、この表記文
字列を表示する。出力手段４４は、表記文字列記憶手段
６６に記憶された表記文字列を出力する。

【００２２】辞書手段７０は、文法情報記憶手段７１、
単語情報記憶手段７２、共起用例情報記憶手段７３、お
よび学習情報記憶手段７４を有している。

【００２３】文法情報記憶手段７１は、単語間の文法的
な結びつきの正否に関する情報、その結びつきの強さに
関する情報等を記憶する。例えば、「名詞（助詞なし）
＋接尾語は結びつきが強い、名詞（助詞なし）＋名詞は
結びつきが強い」等の情報が記憶されている。

【００２４】単語情報記憶手段７２は、変換前文字列お
よび対応する変換後文字列を記憶する。変換前文字列に
は、かな文字だけ、英文字だけ、英数文字混じりのかな
文字のいずれの場合も含む。変換後文字列には、漢字、
カタカナ、英文字およびこれらの組合わせ文字列を含
む。具体的には、各々の単語の読み文字列、表記文字
列、品詞情報及び活用情報等が記憶される。

【００２５】共起用例情報記憶手段７３には、意味的な
結びつきの強い単語間の２項関係情報が記憶される。こ
の共起用例情報には、単に２つの結びつきの他に、
「人」、「花」等の属性単位の共起用例や、付加的な制
限情報を含むものである。付加的な制限情報としては、
例えば、「を」、「が」等の助詞情報、成立する向きの
情報等がある。共起用例としては、単語同志の結びつき
として、「暑い−夏」、「厚い−本」、「熱い−お湯」
等が記憶される。属性単位の共起用例として、「人
（彼、彼女、先生、恋人、等）に−会う」等が記憶され
る。属性単位の共起用例として、「花（チューリップ、
菊、等）が−咲く」等が記憶される。助詞の制限情報と
して、「話を−聞く」、「薬が−効く」、「機転が−利
く」等が記憶される。向きの制限情報として、「家庭−
教育」、「教育−過程」が記憶される。

【００２６】かかる共起用例情報は、意味情報であり、
これを用いることにより同音語の多義性が解消される。
例えば、共起用例情報７３による同音語の一例を示す
と、「あつい／ほん」という読みに対して変換処理を行
なう際に、共起用例情報７３における「厚い−本」とい
う結びつきの情報から「厚い」が選択され、「熱い、暑
い」等は選択されない。したがって、「厚い／本」とい
う変換結果が即座に得られる。このように、共起用例情
報は、変換効率の向上を図るために用いられる。

【００２７】学習情報記憶手段７４は、複数の表記のう
ち、最近に使用された表記を優先して採用する場合の使
用情報である。

【００２８】変換手段５０は、読み文字列生成手段５
１、読み規則記憶手段５２、基本解析手段５３、文節区
切り処理手段５４、自動辞書登録手段５５、表記選択手
段５６、およびローマ字区切り変更手段５８を備えてい
る。

【００２９】読み規則記憶手段５２は、英文字列に対す
るローマ字読み文字列が記憶されている。読み文字列生
成手段５１は、読み規則記憶手段５２に記憶されたロー
マ字読み規則に基づいて、英文字列記憶手段６４に記憶
された英文字列から読み文字列を生成して、読み文字列
記憶手段６５に記憶する。

【００３０】基本解析手段５３は、辞書手段７０の文法
情報記憶手段７１および単語情報記憶手段７２を参照し
て文節の区切り位置を推定する。

【００３１】文節区切り処理手段５４は、基本解析手段
５２から出力される文節区切り候補に対して文法／単語
情報のチェックをすると共に、共起用例情報記憶手段７
３を参照して同音語選択処理等を行なう。さらに、文節
区切り処理手段５４は文節区切り候補の絞り込みを行な
う。

【００３２】表記選択手段５６は、文節区切り処理手段
５４の処理にて、表記が未決定の文節に対して表記の決
定を行なう。表記選択手段５６は、切り出された文節の
単語部分を、かな文字列からローマ字文字列に変換する
逆ローマ字変換手段５７を有している。なお、逆ローマ
字変換手段８２は、表示文字サイズの変更も可能であ
る。

【００３３】自動辞書登録手段５５は、表記選択手段５
６で決定された単語が、辞書手段７０の単語情報記憶手
段７２に登録されていない場合には、この単語の読み、
表記文字列、品詞等の情報を単語情報記憶手段７２に自
動登録する。

【００３４】ローマ字区切り変更手段５８は、判断規則
記憶手段５９を有しており、以下の様にして、ローマ字
区切りを変更する。判断規則記憶手段５９には、変換候
補文字列が変換候補として好ましいか否かの判断規則が
記憶されている。ローマ字区切り変更手段５８は、この
判断規則に基づいて、読み文字列記憶手段６５に記憶さ
れた読み文字列の一部の文字について、前記英文字列記
憶手段に記憶された英文字列を参照して、入力された英
文字列中の英文字を含むかな文字列を得る。得られた英
文字を含むかな文字列について、基本解析手段５３およ
び文節区切り処理手段５４は、再度文字列変換を行な
う。

【００３５】かかる構成により、変換手段５０は、ロー
マ字入力モードにて入力された英文字列を、ローマ字読
み規則に基づいて読み文字列を生成するとともに、前記
辞書手段を検索して前記読み文字列中に前記変換前文字
列が存在する場合は、これに対応する英字文字列を変換
後文字列として出力する。また、前記判断規則に基づい
て、前記変換候補文字列が変換候補として好ましくない
と判断した場合には、前記ローマ字読み規則にとらわれ
ることなく、前記生成された読み文字列の一部のかな文
字列について、前記入力された英文字列中の英文字を含
む読み文字列を得て、前記辞書手段を検索することがで
きる。

【００３６】なお、本実施形態においては、判断規則記
憶手段５９を設け、必要な場合にのみ、前記ローマ字区
切り処理を行なっているが、これを設けず、全てについ
て前記ローマ字区切り処理を行なうようにしてもよい。

【００３７】２．ハードウェア構成図２に、図１に示す文字列変換装置１をＣＰＵを用いて
実現したハードウェア構成の一例を示す。

【００３８】文字列変換装置１は、ＣＰＵ２３、メモリ
２７、ハードディスク２６、ＣＲＴ３０、ＦＤＤ２５、
キーボード２８、マウス３１およびバスライン２９を備
えている。ＣＰＵ２３は、ハードディスク２６に記憶さ
れた制御プログラムにしたがいバスライン２９を介し
て、各部を制御する。

【００３９】この制御プログラムは、ＦＤＤ２５を介し
て、プログラムが記憶されたフレキシブルディスクから
読み出されてハードディスク２６にインストールされた
ものである。なお、フレキシブルディスク以外に、ＣＤ
−ＲＯＭ、ＩＣカード等のプログラムを実体的に一体化
したコンピュータ可読の記憶媒体から、ハードディスク
にインストールさせるようにしてもよい。さらに、通信
回線を用いてダウンロードするようにしてもよい。

【００４０】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク２６にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをＦＤＤ２５
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの（例えば、
データ圧縮されているものを、解凍する等）、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。

【００４１】ハードディスク２６には辞書データが記憶
される。メモリ２７には各種の演算結果等が記憶され
る。ＣＲＴ３０には、変換候補等が表示される。

【００４２】ＣＲＴ３０の表示について図３を用いて、
説明する。ＣＲＴ３０の編集画面１００には、文章を表
示するエリアの他に、画面下方にエリア１１０が設けら
れている。エリア１１０には、各種メッセージや状態が
表示され、また、同音異義語の候補が表示される。エリ
ア１１０の拡大図を同図の右側部分に示す。エリア１１
０の中のエリア１２０は、次候補群表示のための指示が
与えられたとき、それらの単語候補を表示する領域とし
て使用される。

【００４３】ここで、［挿入］とは、キーボード４から
入力された文字列をカーソル１０２の直前に挿入するこ
とを意味しており、［確定］とは、かな漢字変換等のか
な文書変換をしてユーザが選択した単語を後で再度読み
に戻すことをしないモードになっていることを意味す
る。［連カナ漢］とは、かな漢字変換モードが連文節で
って、カナ入力であることを示している。

【００４４】なお、上述の［挿入］については、所定の
制御キーを操作することにより、［挿入］と［上書］が
相互に適宜変更可能になっている。［カナ漢］について
も、同様に、ローマ字入力の［Ｒ漢］と相互に変更可能
である。

【００４５】図３において、ユーザが、キーボード２８
より文字列を入力し、変換キーを押下することにより、
後述するように、文字列変換処理が実行される。この結
果、画面のカーソル１０２の位置に、各々の読みで変換
された優先度の高い単語からなる文（もしくは文節）が
未確定の状態で表示される。このとき、次候補キーを押
下すると、表示された未確定単語のうち、先頭の文節の
候補群がエリア１２０に表示される。

【００４６】本実施形態においては、スペースキーを、
かな文書変換キーおよび次候補キーに対応させている。
すなわち、読みを入力した直後にスペースキーが押下さ
れた時は、かな文書変換キーとして判断する。この状態
で、続けてスペースキーが入力したときには次候補キー
として処理される。なお、読みを入力せず、単にスペー
スキーが入力されたとき、又はコントロールキーとシフ
トキーとスペースキーとが同時に押下された時には、本
来の空白文字の入力として処理される。

【００４７】候補の確定は、変換キーを押下したときの
状態（第１候補）でよければ、その時点でリターンキー
を押下するか、もしくは続いて読みキーを押下すること
でなされる。また、次候補キーを押下して候補群をエリ
ア１２０に表示した時には、その候補のいずれかを選択
（候補群には番号が付されていて、その番号を入力）し
たのち、リターンキー（確定キー）を押下することで確
定する。なお、読みが確定している時に入力したリター
ンキーは文字どおり改行キーを示す。

【００４８】３．フローチャートつぎに、ハードディスク２６に記憶されているプログラ
ムについて、説明する。

【００４９】3.1 自動登録および変換処理図４のフローチャートを用いて、文書処理動作を説明す
る。ユーザは、キーボード２８から、英文字列を入力す
る。ＣＰＵ２３は、英文字列が入力されるか否か判断し
ており（図４ステップＳＴ１）、英文字列が入力される
と、入力された英文字列をローマ字バッファ２７ａに記
憶する（図４ステップＳＴ３）。つぎに、入力された英
文字列について、以下に示すローマ字読み規則に基づい
て、ローマ字を読みが可能か否か判断する（ステップＳ
Ｔ５）。

【００５０】ローマ字読み規則規則１：ローマ字文字列がローマ字かな変換テーブルに
登録されている文字列の場合には、該当するローマ字文
字列をかな文字に変換する。

【００５１】規則２：英子音文字が連続して入力された
場合は、最初の英子音文字を「っ」に変換し、以後規則
１を繰り返す。

【００５２】ＣＰＵ２３は、ローマ字を読みが可能な場
合には、かな変換を行なう（ステップＳＴ７）。変換さ
れたかな文字は読み文字列バッファ２７ｂに記憶される
（ステップＳＴ９）。たとえは、図５Ａに示すような英
文字列が入力された場合、「ＤＡ」と入力された段階
で、母音であるので、かな変換処理が行なわれ、読み文
字列バッファ２７ｂに、「だ」が記憶される。

【００５３】このような処理を繰返す事により、入力さ
れた英文字列から読み文字列が生成される。例えば、図
５Ａに示す文字列に対して、上述のローマ字かな変換規
則を適用すると、図５Ｂに示すような読み文字列が生成
されて読み文字列バッファ２７ｂに記憶される。

【００５４】このようにして、ローマ字バッファ２７ａ
および読み文字列バッファ２７ｂには、順次データが記
憶される。なお、ローマ字読みできない英字、数字、記
号キーの場合には、そのまま読み文字列バッファ２７ｂ
へ記憶される。

【００５５】ＣＰＵ２３は、変換キーが操作されるか否
か判断しており（ステップＳＴ１１）、変換キーが操作
されないうちは、ステップＳＴ１〜ステップＳＴ９の処
理が繰返される。この状態で、ユーザが変換キーを操作
すると、ＣＰＵ２３は、変換キーが操作されたと判断し
て、文節区切りおよび辞書変換処理を行なう（ステップ
ＳＴ１３）。

【００５６】ステップＳＴ１３の処理は、従来の文節区
切りおよび辞書変換処理と同様である。簡単に説明する
と、辞書部２６ｂに記憶されたデータ（単語情報、文法
情報等）により、読み文字列バッファ２７ｂのデータに
ついて、読み文字列の文節候補が抽出される。さらに、
辞書部２６ｂに記憶された他のデータを用いて、抽出さ
れた文節候補が、文法的、意味的にチェックされて文節
候補の絞り込みが行なわれる。かかる絞り込みととも
に、文節区切り処理がなされる。

【００５７】つぎに、ＣＰＵ２３は、最小コスト法によ
り、変換候補を仮決定するとともに、仮決定した変換候
補を、表記文字列バッファ２７ｃに記憶する（ステップ
ＳＴ１５）。なお、最小コスト法以外に公知の方法を用
いてもよい。

【００５８】つぎに、ＣＰＵ２３は、ローマ字区切り変
更処理が必要か否か判断する（図８ステップＳＴ１
９）。ローマ字区切り変更処理については後述する。ロ
ーマ字区切り変更処理が必要でないと判断した場合に
は、この表示文字列バッファ２７ｃに記憶された文字列
を、ＣＲＴ３０に表示する（ステップＳＴ２１）。

【００５９】ユーザは、表示された変換結果について、
変換が正しいか否か判断し、正しい場合は、確定キーを
操作する。また、文節区切りが誤っていると判断した場
合は、文節区切り修正キーを操作する。また、文節区切
りは正しいが、間違った同音異義語が表示されている場
合には、次候補キーを操作する。

【００６０】ＣＰＵ２３は、ステップＳＴ２３にていず
れのキーが操作されたか判断する。もし、文節区切り修
正キーが操作された場合は、当該キーの内容に応じて、
文節区切り位置を変更して（ステップＳＴ２５）、図４
ステップＳＴ１３以下の処理を繰返す。

【００６１】次候補キーが操作された場合は、ＣＰＵ２
３は、逆ローマ字変換処理を行なう（ステップＳＴ２
７）。逆ローマ字変換処理について、簡単に説明する。
ここでは、図５Ｃの「だて」部分について、逆ローマ字
変換処理を行なうものとする。ＣＰＵ２３は、「だて」
を、ローマ字バッファ２７ａを参照して、英文字列に変
換する。そして、全角で表記した第１候補（「ＤＡＴ
Ｅ」）と、半角サイズで表記した第２候補（「ｄａｔ
ｅ」）が生成される。

【００６２】このように、逆ローマ字変換処理を行なう
ことにより入力された英文字列を変換する事ができる。

【００６３】つぎに、ＣＰＵ２３は、これらの２つの候
補に加えて、辞書部２６ｂから読み出した第３〜第７の
候補とを合成して、ＣＲＴ３０の候補表示エリア１２０
に提示する（図５Ｄ参照）。このようにして、逆ローマ
字変換された文字列が、辞書部２６ｂに登録されている
候補とともに、表示され、ユーザの選択対象として提示
される。

【００６４】ユーザは、エリア１２０に提示された次候
補の中から、「１．ＤＡＴＥ」を選択する候補特定命令
を与える。ＣＰＵ２３は、かかる候補特定命令が与えら
れると、エリア１２０の表示を図５Ｅに示すように変化
させ、図５Ｆに示すように変更候補を表示する。

【００６５】所望の変換結果が得られたので、ユーザ
は、確定キーを操作する。これにより、ＣＰＵ２３は、
確定処理を行なう（ステップＳＴ３１）。これにより、
表記文字列バッファ２７ｃに図５Ｆに示す文字列が記憶
される。

【００６６】つぎに、ＣＰＵ２３は、逆ローマ字変換さ
れた文字列が前記確定文字列中に存在するか否か判断す
る（ステップＳＴ３３）。存在する場合には、ＣＰＵ２
３は、辞書部２６ｂに当該逆ローマ字変換された文字列
を記憶する。この場合であれば、ＣＰＵ２３は、図９に
示すように、文字列「ＤＡＴＥ」が読み「だて」とし
て、追加登録するとともに、学習情報を更新する。

【００６７】このように、ユーザの辞書登録操作を一切
要求することなく、自動的に辞書部２６ｂに新しい単語
が登録される。したがって、例えば、つぎにユーザが、
「ひづけのかくにんには、だてとにゅうりょくする。」
と文字入力して変換キーを押すと「日付の確認には、Ｄ
ＡＴＥと入力する。」と一回で正しくかな文書変換がで
きる。すなわち、日英辞書や英日辞書等を特別用意して
おかなくても、外国語の単語をオリジナルのまま入力し
てかな漢字混じり文章の中に混在させることが可能とな
るとともに、新規単語をユーザの操作により新規登録す
る必要もない。

【００６８】このように、本実施形態においては、辞書
部２６ｂに登録されていない単語が検出された場合に
は、変換候補として、これらのかな文字列を元のキー入
力時のローマ字文字列に逆変換して、大文字全角、小文
字半角、大文字半角、小文字全角等に変換し、ユーザに
次候補の１つとして提示する。さらに、元のかな文字列
のまま表示した文字列やひらがなをカタカナに変換した
文字列を、次候補の１つとして提示するとユーザの選択
範囲を拡大することができる。

【００６９】なお、次候補の提示の順番として、逆ロー
マ字変換した文字列を優先的に提示するようにすると、
日本語と外国語をより区別することなくユーザが取扱え
るようになる。さらに、逆ローマ字変換の英大文字への
変換が先か、英子文字への変換が先か、或いは全角表記
が先か、半角表記文字列も次候補の１つとして表示する
か等は、ユーザの選択によりカスタマイズできるように
しておくと、ユーザが逆ローマ字変換をより利用しやす
くなる。

【００７０】逆ローマ字変換された候補文字列が確定文
字列として採用された場合、辞書部２６ｂに順次自動登
録することが可能となり、この機能は日本語と外国語と
を混在させた日本語文章を作成する場合、モード変換キ
ーや辞書登録操作をユーザに一切要求しないで新規外国
語を辞書登録できる。

【００７１】このように、本実施形態においては、次候
補キーが押下された場合に、次候補対象として、入力さ
れた英文字に戻した文字列を表示するようにしている。
これにより、ユーザは、変換キーを操作するだけで、後
変換キー（かな変換された文字列を再び英文字列に変換
するキー）を操作することなく、所望の英文字列を得る
ことができる。さらに、かかる英文字列が確定された場
合は、これを自動登録するようにしている。したがっ
て、辞書に新たに登録する作業が不要となる。

【００７２】なお、本実施形態においては、辞書に登録
する際、前記自動登録処理を行なったが、これに限定さ
れず、ユーザが後変換キーを操作して、英文字列に変換
され、かかる変換が確定した時に、辞書登録するように
してもよい。

【００７３】3.2 ローマ字区切り変更処理つぎに、ロ
ーマ字区切り変更処理について説明する。ローマ字区切
り変更処理とは、入力文字列をローマ字読みする際に、
ユーザの意図とは異なる部分でローマ字読みをした為
に、辞書登録されている文字列に変換されない場合に、
入力文字列を前記ローマ字読み規則にとらわれることな
く、ローマ字読みする処理をいう。

【００７４】例えば、辞書に「ＡＴＯＫ」が登録されて
おり、「ＡＴＯＫ用例」と変換する為に「ａｔｏｋｙｏ
ｕｒｅｉ」を入力した場合、上記ローマ字読み規則で
は、「あときょうれい」とローマ字読みされてしまい、
ユーザの入力意図とはズレてしまう。ローマ字区切り変
更処理を行なう事により、これをユーザの意図通りロー
マ字読みさせて、正しい変換結果を得る事ができる。

【００７５】ＣＰＵ２３は、図８ステップＳＴ１９にお
いて、ローマ字区切り変更処理が必要である可能性が高
い場合には、図１１ステップＳＴ４１以下の処理を行な
う。本実施形態においては、ＣＰＵ２３は、一文字文節
がある場合は、ローマ字区切り変更処理が必要である可
能性が高い判断するようにした。

【００７６】例えば、「ＡＴＯＫ用例」と変換する為
に、「ａｔｏｋｙｏｕｒｅｉ」と入力すると、「あとき
ょうれい」とローマ字読みされて、図７に示す辞書を参
照して「後，強冷」と変換される。この場合、漢字変換
された文字列に、一文字文節「後」が存在するので、ス
テップＳＴ１９にて、ローマ字区切り変更処理が必要で
あると判断する。

【００７７】ＣＰＵ２３は、該当文節における注目かな
文字について、フラグｒｍｐｏｓが「０」の英文字で再
区切りを行なう。フラグｒｍｐｏｓとは、入力された英
文字列をローマ字読みしたときに、母音となるか子音と
なるかを区別する為のフラグである。これは、入力文字
列をローマ字読みした段階で、ローマ字かな変換処理が
可能となった部分を、フラグｒｍｐｏｓ［１］とし、そ
れ以外の部分は、フラグｒｍｐｏｓ［０］とする。ま
た、注目かな文字は、最初は、当該文節の後から１番目
で、かつフラグｒｍｐｏｓ［０］を含むかな文字とす
る。

【００７８】具体的に説明すると、図１０Ａに示すよう
に、「ａｔｏｋｙｏｕｒｅｉ」と入力された場合、フラ
グｒｍｐｏｓは、図１０Ｂに示す様に、「１，０，１，
０，０，１，１，０，１，１」となる。そして、この場
合、注目かな文字は、「あ，と，き，ょ，う，れ，い」
の「れ」となる。したがって、この場合、「れ」を英文
字文字列「ｒ」，「ｉ」として、図１０Ｄに示すよう
に、英文字混入読み文字列「あときょうｒ」に、かな変
換する。

【００７９】ＣＰＵ２３は、この「あときょうｒ」が辞
書部２６ｂに登録されているか否かを判断する（ステッ
プＳＴ４３）。登録されていない場合には、つぎの区切
りが可能か否か判断し（ステップＳＴ４５）、可能であ
る場合は、ステップＳＴ４１の処理を繰返す。

【００８０】この場合、つぎの区切りが可能であるの
で、つぎの、フラグｒｍｐｏｓ［０］を含むかな文字
で、かな変換する。これにより、図１０Ｅに示す様に、
「あとｋｙ」が得られる。ＣＰＵ２３は、この「あとｋ
ｙ」が、辞書部２６ｂに登録されているか否かを判断す
る（ステップＳＴ４３）。登録されていない場合には、
つぎの区切りが可能か否か判断し（ステップＳＴ４
５）、可能である場合は、ステップＳＴ４１の処理を繰
返す。

【００８１】この場合、つぎの区切りが可能であるの
で、つぎの、フラグｒｍｐｏｓ［０］を含むかな文字
で、かな変換する。これにより、図１０Ｆに示す様に、
「あとｋ」が得られる。ＣＰＵ２３は、この「あとｋ」
が、辞書部２６ｂに登録されているか否かを判断する
（ステップＳＴ４３）。この場合、図７に示すように
「あとｋ」が登録されているので、当該位置でローマ字
かな変換処理を行ない（ステップＳＴ４９）、図４ステ
ップＳＴ１３以下の処理を行なう。

【００８２】なお、ステップＳＴ１３の処理を行なう事
により、入力文字列「ａｔｏｋｙｏｕｒｅｉ」は、「Ａ
ＴＯＫ用例」と変換される。

【００８３】なお、ステップＳＴ４５にて、つぎの区切
りが可能でない場合は、ローマ字区切り変更処理は不要
と判断して、図４ステップＳＴ１５にて、仮決定された
変換候補を変換候補とする（ステップＳＴ４７）。そし
て、図８ステップＳＴ２１以下の処理を行なう。

【００８４】このようにして、英文字を含む文字列を正
確に変換することができる。なお、本実施形態において
は、検索が成功するまで、読みの長い順に行なったが、
読みの短い順に行なうこともできる。さらに、検索が成
功すると処理を中止しているが、可能の場合全てについ
て検索を行ない、最も評価の高いものを選択するように
してもよい。

【００８５】なお、本実施形態においては、一文字文節
がある場合は、ローマ字区切り変更処理が必要である可
能性が高いと判断して、前記ローマ字区切り変更処理を
するようにしたが、これに以外に、ローマ字区切り変更
処理が必要である可能性が高い場合を設定しておき、同
様の処理を行なうようにしてもよい。例えば、未登録語
の文節がある場合である。

【００８６】未登録語の文節としては、例えば、「ｏｒ
ｉｇｉｎａｌ」が辞書登録されており、「ｏｒｉｇｉｎ
ａｌアプリ」と変換する為に、「ｏｒｉｇｉｎａｌａｐ
ｒｉ」と入力したとする。この場合、「おりぎなぁぷ
り」と、かな変換され、漢字変換すると、例えば「折技
なぁぷり」となる。この場合、「なぁぷり」は未登録語
の文節となる。この様な場合も、前記一文字文節がある
場合と同様に、ローマ字区切り変更処理が必要である可
能性が高いと判断できる。

【００８７】４．他の実施形態上記実施形態においては、一旦漢字変換してからローマ
字区切り変更処理が必要か否か判断しているが、文字入
力がされた状態でローマ字区切り変更処理が必要である
か否か判断するようにしてもよい。例えば、シフトキー
を押した状態で文字入力がされた場合は、ローマ字区切
り変更処理が必要である可能性が高いと判断して、１回
目の英文字列からかな変換する状態で、前記ローマ字読
み規則にとらわれない区切り処理をするよう決定するこ
とができる。

【００８８】例えば、辞書に「ＡＴＯＫ」が登録されて
おり、「このＡＴＯＫ用例を用いて」と変換する為に、
「ｋｏｎｏＡｔｏｋｙｏｕｒｅｉｗｏｍｏｔｉｉｔｅ」
と「Ａ」をシフトキーを用いて入力した場合は、以下の
様にして、ローマ字かな変換する。

【００８９】ＣＰＵ２３は、シフトキーを用いて入力さ
れた文字「Ａ」から、英字の区切りに属しない箇所まで
で、ローマ字かな変換を行なう。すなわち、「ｋｏｎｏ
Ａｔｏｋｙｏｕｒｅｉｗｏｍｏｔｉｉｔｅ」のうち、
「Ａｔｏｋｙｏｕｒｅｉ」について、英字の区切りに属
しない箇所までの文字列「ａｔｏｋｙｏｕｒ」で区切り
を行ない、「あときょうｒ」に、かな変換する。そし
て、この「あときょうｒ」が辞書にあるか否かを判断す
る。

【００９０】ない場合には、上記と同様にして、再区切
り処理を行なう。このようにして、ユーザの命令がなく
ても、確実に英文字を含む文字列を変換することができ
る。

【００９１】なお、この場合も、読みの短い順に行なう
こともできる。

【００９２】このように、入力手段に英文字列が入力さ
れる際に、強制区分指示命令が付加されている場合に
は、前記入力された英文字列中の英文字列を含むかな文
字列を得る様にしてもよい。

【００９３】また、以下の様にして、前記入力された英
文字列中の英文字を含む読み文字列を得る様にしてもよ
い。辞書に存在する文字列のうち、英文字を含む文字列
の当該英文字までのかなが含まれている部分があるか否
かをローマ字かな変換をした段階で判断する。そして、
存在する場合には、入力文字におけるこれにつづく英字
と、辞書に記憶されている文字列におけるこれに続く英
字が一致するか否か判断し、一致する場合にはその箇所
で英字区切りを行なう。

【００９４】たとえば、「あとｋ」が登録されている場
合、「ａｔｏｋｙｏｕｒｅｉ」が入力されると「あとき
ょうれい」とローマ字かな変換がなされる。かかる入力
文字中に、辞書登録されている「あとｋ」の「あと」部
分の文字列（以下かな共通部という）があるか否かを判
断する。この場合、かな共通部が存在するので、入力文
字列の「あときょうれい」についてかな共通部に続く英
字を抽出する。なお、かな共通部に続く英字は、つぎの
母音の部分の前までの組合わせ全てが抽出される。した
がって、この場合、「ｋ」および「ｋｙ」の２種類が抽
出される。辞書登録されている文字は、かな共通部につ
づく英字は「ｋ」である。この場合、「ｋ」と考えれ
は、両者が一致するので、この場合「ａｔｏｋｙｏｕｒ
ｅｉ」は「ａｔｏｋ」と「ｙｏｕｒｅｉ」に区切られ
る。

【００９５】この場合、全ての箇所についてかかる処理
を行なうのは効率が悪いので、上記一文字文節がある場
合、または未登録語がある場合のみ、かかる処理を行な
うようにしてもよい。

【００９６】上記実施形態においては、ローマ字バッフ
ァを参照して、英文字に戻すようにしてローマ字区切り
変更処理を実行しているが、図６のローマ字読み規則を
逆読みして、英文字に戻すようにして実行するようにし
てもよい。

【００９７】なお、本実施形態においては、図１に示す
機能を実現する為に、ＣＰＵ２３を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。

【図面の簡単な説明】

【図１】本発明にかかる文字列変換装置１の機能ブロッ
ク図である。

【図２】図１に示す文字列変換装置１のハードウエア構
成の一例を示す図である。

【図３】ＣＲＴ３０の表示を示す図である。

【図４】変換処理のフローチャートを示す。

【図５】ローマ字バッファ、かなバッファ、表記文字バ
ッファのデータ内容および表示例を示す図である。

【図６】ローマ字読み規則を示す図である。

【図７】辞書部２６ｂの内容を示す図である。

【図８】変換処理のフローチャートを示す。

【図９】辞書部２６ｂに追加される単語データ内容を示
す図である。

【図１０】ローマ字バッファ、かなバッファのデータ内
容を示す図である。

【図１１】ローマ字区切り変更処理のフローチャートを
示す。

【符号の説明】

６３・・・文字列記憶手段５０・・・変換手段７０・・・辞書手段２３・・・ＣＰＵ２７・・・メモリ

Claims

【特許請求の範囲】

【請求項１】英文字を含むかな文字列を変換前文字列と
して、この変換前文字列に対応する変換後文字列を記憶
する辞書手段、ローマ字入力モードにて入力された英文字列を、ローマ
字読み規則に基づいて読み文字列を生成するとともに、
前記辞書手段を検索して前記読み文字列中に前記変換前
文字列が存在する場合は、これに対応する英字文字列を
変換後文字列として出力する変換手段、を備えた文字列変換装置において、前記変換手段は、前記ローマ字読み規則にとらわれるこ
となく、前記生成された読み文字列の一部のかな文字列
について、前記入力された英文字列中の英文字を含む読
み文字列を得て、前記辞書手段を検索できるよう構成さ
れていること、を備えたことを特徴とする文字列変換装置。
【請求項２】請求項１の文字列変換装置において、前記変換手段は、変換候補文字列が変換候補として好ま
しいか否かの判断規則を記憶する判断規則記憶手段を備
え、前記判断規則に基づいて、前記変換候補文字列が変
換候補として好ましくないと判断した場合に、前記入力
された英文字列中の英文字を含む読み文字列を得るこ
と、を特徴とする文字列変換装置。
【請求項３】請求項２の文字列変換装置において、前記入力された英文字列を記憶する英文字列記憶手段を
備え、前記変換手段は、生成した読み文字列の一部の文字につ
いて、前記英文字列記憶手段を参照して、入力された英
文字列中の英文字を含むかな文字列を得ること、を特徴とする文字列変換装置。
【請求項４】請求項１の文字列変換装置において、前記変換手段は、前記入力された英文字列に、強制区分
指示命令が付加されている場合には、前記入力された英
文字列中の英文字列を含むかな文字列を得ること、を特徴とする文字列変換装置。
【請求項５】請求項１の文字列変換装置において、前記変換手段は、 1)前記辞書手段に記憶されている変換前文字列中におけ
る英文字より前に位置するかな文字列と同じかな文字列
が、前記ローマ字読み規則に基づいて生成された読み文
字列中に存在するか否かを判断し、 2)存在する場合には、前記生成された読み文字列におい
て続くかな文字列について、対応する英文字を得て、両
英文字列が一致するか否かを判断し、 3)一致する場合には、前記入力された英文字列中の英文
字を含む読み文字列を得ること、を備えたことを特徴とする文字列変換装置。
【請求項６】英文字を含むかな文字列を変換前文字列と
して、この変換前文字列に対応する変換後文字列を記憶
しておき、ローマ字入力モードにて入力された英文字列を、ローマ
字読み規則に基づいて読み文字列を生成するとともに、
前記読み文字列中に前記変換前文字列が存在する場合
は、これに対応する英字文字列を変換後文字列として決
定する文字列変換方法において、前記読み文字列生成の際に、前記ローマ字読み規則にと
らわれることなく、前記生成された読み文字列の一部の
かな文字列について、前記入力された英文字列中の英文
字を含む読み文字列を得て、この英文字列中の英文字を
含む読み文字列中に前記変換前文字列が存在するか否か
も判断すること、を特徴とする文字列変換方法。
【請求項７】コンピュータが実行可能なプログラムを記
憶したコンピュータ可読の記憶媒体であって、前記プロ
グラムは、請求項１ないし請求項６のいずれかの装置又
は方法を実現するものであること、を特徴とする記憶媒体。