JP2000020511A - 日本語入力装置および方法 - Google Patents
日本語入力装置および方法Info
- Publication number
- JP2000020511A JP2000020511A JP10174941A JP17494198A JP2000020511A JP 2000020511 A JP2000020511 A JP 2000020511A JP 10174941 A JP10174941 A JP 10174941A JP 17494198 A JP17494198 A JP 17494198A JP 2000020511 A JP2000020511 A JP 2000020511A
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- notation
- katakana
- kana
- conversion candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
図に忠実に入力することができるかな漢字変換を提供す
る。 【解決手段】 かな漢字変換処理では、まず、変換辞書
を用いて変換候補を作成しようとする(S202)。こ
こで、カタカナ表記とするべき入力があるかを判断する
(S204)。カタカナ表記である場合(S204でY
ES)のときは、カタカナ表記の揺らぎの規則を用いて
変換候補を作成する(S206)。これで見つかる変換
候補は当然、カタカナ表記の変換候補である。この変換
候補にカタカナ表記の揺らぎの規則を逆適用して、ユー
ザが意図した入力に戻す(S208)。その後、すべて
の変換候補に対して、通常の変換のコスト計算(確から
しさの計算)を行い(S210)、所定値以上の値の変
換候補を表示する(S212)。この変換候補を確定す
ることで、望みの日本語入力を行うことができる。
Description
日本語入力に関し、特にかな変換を介してかな漢字交じ
りの日本語を入力する技術に関する。
するときに、かな漢字変換を用いることは通常行われて
いる。このかな漢字変換は、漢字に変換することばかり
ではなく、日本語の表記の多様性に合わせて、外来語等
は、カタカナに変換することもある。
対して統一的な表記はない。例えば、平成3年6月28
日に公表された内閣告示「外来語の表記」では、第1表
は「外来語や外国の地名・人名を書き表すのに一般的に
用いる仮名とする。」として、例えば「ファ」、「フ
ィ」、「ディ」「デュ」等を認めている。上述の内閣告
示の第2表は、「原音や原つづりになるべく近く書き表
そうとする場合に用いる仮名とする。」として、例えば
「ウィ」,「ヴァ」,「ヴ」,「ドゥ」等を認めてい
る。これらの第1表および第2表以外の表記について
も、「特別な音の書き表し方については、ここでは取決
めは行わず、自由とする。」として認める方向である。
は、自由に表記することができるといっても、1つの文
書中における表記は統一する必要がある。このため、従
来のかな漢字変換におけるカタカナへの変換は、例え
ば、「ヴァ」「ヴィ」,「ヴ」,「ヴェ」,「ヴォ」の
ような「表記の揺らぎ」を、「バ」,「ビ」,「ブ」,
「ベ」,「ボ」と同一視するように取り扱うものもあ
る。また、同様に、「ウィ」,「ウェ」,「ウォ」は、
「ウイ」,「ウエ」,「ウオ」とし、「(イ)アー」や
「(エ)アー」を「ヤー」(例えば、「コンベアー」を
「コンベヤー」)と同一視することも行われることがあ
る。単語の末尾の長音(ー)についても、また、略す場
合に統一する場合もある。このように統一して、変換辞
書へ登録している。
対する統一は、ユーザの意図とは無関係に行われてお
り、この結果、例えば、ユーザの入力した「ヴァイオリ
ン」は、「バイオリン」と統一されてしまう。
のカタカナの表記のゆれに対して、ユーザの意図に忠実
に入力することができるかな漢字変換を提供することに
ある。
に、本発明は、かな漢字変換による日本語入力装置にお
いて、カタカナ表記の揺らぎを統一する手段と、統一さ
れたカタカナ表記を元に戻す手段と、元に戻した表記を
変換候補として確からしさの計算を行う手段と、確から
しさに基づき変換候補を表示して確定する手段とを備え
ることを特徴とする。
表記も変換候補とすることもできる。
装置をコンピュータに構築させることができるプログラ
ムを格納した記録媒体も本発明に含まれる。
にはカタカナ表記で揺らぎを統一した表記で入力されて
おり、それを逆変換しているので、統一した表記を用い
て、コスト計算等を行うことができるとともに、ユーザ
の意図した表記でカタカナを入力することができる。
して詳細に説明する。
ピュータ・システム100を示す。図1において、11
0はコンピュータ本体であり、その内部にはCPU、メ
モリ、ハードディスク等が格納されている。コンピュー
タ本体110には、また、CD−ROMドライバ112
やフロッピーディスク・ドライバ114が設置されてお
り、プログラムのインストールや、データの保存等に用
いられている。
り、ディスプレイ140と共に、本発明の日本語入力の
ためのユーザ・インタフェースを提供している。即ち、
キーボード120からアルファベットを入力すると、ロ
ーマ字かな変換の規則に従って、アルファベットやかな
文字をディスプレイ140に表示したり、かな漢字変換
を行った場合の変換候補の選択をディスプレイ140の
表示からマウスにより行ったりする。
れる本発明のかな漢字変換処理について、図2のフロー
チャートを用いて説明する。
ーマ字かな変換処理を用いて、ローマ字で日本語を入力
して変換指示を出すと、図2に示したかな漢字処理が起
動される。ここでは例えば、「vaiorinn」とキ
ーボードから入力しているとする。かな漢字変換処理で
は、まず、「う゛ぁいおりん」と表示されているものに
対して、変換辞書を用いて変換候補を作成しようとする
(S202)。ここで、カタカナ表記とするべき入力が
あるかを判断する(S204)。この処理においては、
この場合、「va」と入力されているので通常の表記で
はなく、外来語表記であり、カタカナ表記であると判断
する。カタカナ表記である場合(S204でYES)の
ときは、例えば、上述のカタカナ表記の揺らぎの規則
(「ヴァ」と「バ」)を用いて表記を統一し(ばいおり
ん)、変換辞書等を用いて変換候補を作成する(S20
6)。これで見つかる変換候補は当然、カタカナ表記の
変換候補(バイオリン)である。このカタカナ表記の変
換候補に適用したカタカナ表記の揺らぎの規則を逆適用
して(「バ」と「ヴァ」)、ユーザが意図した入力に戻
す(「ヴァイオリン」)(S208)。その後、すべて
の変換候補に対して、通常の変換のコスト計算(確から
しさの計算)を行い(S210)、所定値以上の値の変
換候補を表示する(S212)。この場合コスト計算し
て、最大の変換候補から順に表示するのは、従来のかな
漢字変換と同様である。この変換候補を確定すること
で、望みの日本語入力を行うことができる。
ナ表記で入力することができる。
のカタカナ表示(上述の例では「バイオリン」)も変換
候補として、コスト計算の対象とすることもできる。
単語に関しては、変換辞書には、少なくとも上述の揺ら
ぎ規則を用いて統一された表記の単語は登録されている
必要がある。カタカナの単語の他の表記に関しては、全
てを登録する必要はない。
うにすることができる。
する。
は、ちょっと余分に“コスト”をかけて日本語らしさを
チェックすることもできるので、この場合は、揺らぎの
表記が出にくくなる可能性がある。
しておく。
辞書登録せずに、この揺らぎの規則を用いた処理にまか
せる。
名))は登録しても、ヴァスコダガマまでは登録しなく
てもよい。
ータ・システムばかりではなく、複数のシステムから構
成される例えばクライアント・サーバ・システム等に適
用してもよい。
媒体から、プログラムをシステムで読み出して実行する
ことにより、本発明の構成を実現することができる。こ
の記録媒体には、フロッピー・ディスク、CD−RO
M、磁気テープ、ROMカセット等がある。
力を用いると、変換辞書にはカタカナ表記で揺らぎを統
一した表記で入力されており、それを逆変換しているの
で、統一した表記を用いて、コスト計算等を行うことが
できるとともに、ユーザの意図した表記でカタカナを入
力することができる。
概要を示した図である。
である。
Claims (4)
- 【請求項1】 かな漢字変換による日本語入力装置にお
いて、 カタカナ表記の揺らぎを統一する手段と、 統一されたカタカナ表記を元に戻す手段と、 元に戻した表記を変換候補として確からしさの計算を行
う手段と、 確からしさに基づき変換候補を表示して確定する手段と
を備えることを特徴とする日本語入力装置。 - 【請求項2】 請求項1記載の日本語入力装置におい
て、さらに、カタカナ表記の揺らぎを統一した表記も変
換候補とすることを特徴とする日本語入力装置。 - 【請求項3】 かな漢字変換による日本語入力方法にお
いて、 カタカナ表記の揺らぎを統一し、 統一されたカタカナ表記を元に戻し、 元に戻した表記を変換候補として確からしさの計算を行
い、 確からしさに基づき変換候補を表示して確定することを
特徴とする日本語入力方法。 - 【請求項4】 請求項1または2記載の日本語入力装置
をコンピュータに構築させるプログラムを格納した記録
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10174941A JP2000020511A (ja) | 1998-06-22 | 1998-06-22 | 日本語入力装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10174941A JP2000020511A (ja) | 1998-06-22 | 1998-06-22 | 日本語入力装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000020511A true JP2000020511A (ja) | 2000-01-21 |
Family
ID=15987417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10174941A Pending JP2000020511A (ja) | 1998-06-22 | 1998-06-22 | 日本語入力装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000020511A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002288091A (ja) * | 2001-03-28 | 2002-10-04 | Seiko Epson Corp | メール、データの表示 |
-
1998
- 1998-06-22 JP JP10174941A patent/JP2000020511A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002288091A (ja) * | 2001-03-28 | 2002-10-04 | Seiko Epson Corp | メール、データの表示 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8538743B2 (en) | Disambiguating text that is to be converted to speech using configurable lexeme based rules | |
JPH07325828A (ja) | 文法チェックシステム | |
US20070276650A1 (en) | Techniques for customization of phonetic schemes | |
US7212963B2 (en) | System for distinguishing names in Asian writing systems | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
US20070277118A1 (en) | Providing suggestion lists for phonetic input | |
US7136805B2 (en) | System for distinguishing names of organizations in Asian writing systems | |
US6731802B1 (en) | Lattice and method for identifying and normalizing orthographic variations in Japanese text | |
JP2000020511A (ja) | 日本語入力装置および方法 | |
JP3953772B2 (ja) | 読みがな付与装置およびプログラム | |
JP3176588B2 (ja) | 手書き文字入力変換装置及び文書作成装置とコンピュータ読み取り可能な記録媒体 | |
JP2003202893A (ja) | 統計的言語モデルを作成するためのコーパス処理装置及び方法並びにプログラム | |
JPS6083136A (ja) | プログラム読上装置 | |
JP2958811B2 (ja) | 日本語文章処理装置 | |
JP2894736B2 (ja) | 文章検査方法 | |
JP2023072321A (ja) | 文書校正支援装置、文書校正支援方法及び文書校正支援プログラム | |
JP3417837B2 (ja) | 文章校正支援システムおよびそのシステムでの処理をコンピュータに行わせるためのプログラムを格納した記録媒体 | |
JP3118880B2 (ja) | 日本語文章処理装置 | |
JPH07200592A (ja) | 文章処理装置 | |
JPH10198664A (ja) | 日本語入力システム及び日本語入力プログラムを記録した媒体 | |
JP2575947B2 (ja) | 文節切出し装置 | |
JP2693467B2 (ja) | かな漢字変換処理における同音語候補の優先度制御方式 | |
JP3216725B2 (ja) | 文章構造解析装置 | |
JP2000020513A (ja) | 日本語入力装置および方法 | |
Lu et al. | Lexical analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050519 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061110 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130701 |