JP2000020511A - 日本語入力装置および方法 - Google Patents

日本語入力装置および方法

Info

Publication number
JP2000020511A
JP2000020511A JP10174941A JP17494198A JP2000020511A JP 2000020511 A JP2000020511 A JP 2000020511A JP 10174941 A JP10174941 A JP 10174941A JP 17494198 A JP17494198 A JP 17494198A JP 2000020511 A JP2000020511 A JP 2000020511A
Authority
JP
Japan
Prior art keywords
conversion
notation
katakana
kana
conversion candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10174941A
Other languages
English (en)
Inventor
Kaoru Okumura
薫 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Priority to JP10174941A priority Critical patent/JP2000020511A/ja
Publication of JP2000020511A publication Critical patent/JP2000020511A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 カタカナの表記のゆれに対して、ユーザの意
図に忠実に入力することができるかな漢字変換を提供す
る。 【解決手段】 かな漢字変換処理では、まず、変換辞書
を用いて変換候補を作成しようとする(S202)。こ
こで、カタカナ表記とするべき入力があるかを判断する
(S204)。カタカナ表記である場合(S204でY
ES)のときは、カタカナ表記の揺らぎの規則を用いて
変換候補を作成する(S206)。これで見つかる変換
候補は当然、カタカナ表記の変換候補である。この変換
候補にカタカナ表記の揺らぎの規則を逆適用して、ユー
ザが意図した入力に戻す(S208)。その後、すべて
の変換候補に対して、通常の変換のコスト計算(確から
しさの計算)を行い(S210)、所定値以上の値の変
換候補を表示する(S212)。この変換候補を確定す
ることで、望みの日本語入力を行うことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータへの
日本語入力に関し、特にかな変換を介してかな漢字交じ
りの日本語を入力する技術に関する。
【0002】
【従来の技術】従来から、コンピュータに日本語を入力
するときに、かな漢字変換を用いることは通常行われて
いる。このかな漢字変換は、漢字に変換することばかり
ではなく、日本語の表記の多様性に合わせて、外来語等
は、カタカナに変換することもある。
【0003】カタカナに変換するとき、外来語の表記に
対して統一的な表記はない。例えば、平成3年6月28
日に公表された内閣告示「外来語の表記」では、第1表
は「外来語や外国の地名・人名を書き表すのに一般的に
用いる仮名とする。」として、例えば「ファ」、「フ
ィ」、「ディ」「デュ」等を認めている。上述の内閣告
示の第2表は、「原音や原つづりになるべく近く書き表
そうとする場合に用いる仮名とする。」として、例えば
「ウィ」,「ヴァ」,「ヴ」,「ドゥ」等を認めてい
る。これらの第1表および第2表以外の表記について
も、「特別な音の書き表し方については、ここでは取決
めは行わず、自由とする。」として認める方向である。
【0004】さて、上述のようにカタカナ表記において
は、自由に表記することができるといっても、1つの文
書中における表記は統一する必要がある。このため、従
来のかな漢字変換におけるカタカナへの変換は、例え
ば、「ヴァ」「ヴィ」,「ヴ」,「ヴェ」,「ヴォ」の
ような「表記の揺らぎ」を、「バ」,「ビ」,「ブ」,
「ベ」,「ボ」と同一視するように取り扱うものもあ
る。また、同様に、「ウィ」,「ウェ」,「ウォ」は、
「ウイ」,「ウエ」,「ウオ」とし、「(イ)アー」や
「(エ)アー」を「ヤー」(例えば、「コンベアー」を
「コンベヤー」)と同一視することも行われることがあ
る。単語の末尾の長音(ー)についても、また、略す場
合に統一する場合もある。このように統一して、変換辞
書へ登録している。
【0005】しかし、これらのカタカナの表記のゆれに
対する統一は、ユーザの意図とは無関係に行われてお
り、この結果、例えば、ユーザの入力した「ヴァイオリ
ン」は、「バイオリン」と統一されてしまう。
【0006】
【発明が解決しようとする課題】本発明の目的は、上述
のカタカナの表記のゆれに対して、ユーザの意図に忠実
に入力することができるかな漢字変換を提供することに
ある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、かな漢字変換による日本語入力装置にお
いて、カタカナ表記の揺らぎを統一する手段と、統一さ
れたカタカナ表記を元に戻す手段と、元に戻した表記を
変換候補として確からしさの計算を行う手段と、確から
しさに基づき変換候補を表示して確定する手段とを備え
ることを特徴とする。
【0008】さらに、カタカナ表記の揺らぎを統一した
表記も変換候補とすることもできる。
【0009】この装置に用いられている方法およびこの
装置をコンピュータに構築させることができるプログラ
ムを格納した記録媒体も本発明に含まれる。
【0010】本発明の日本語入力を用いると、変換辞書
にはカタカナ表記で揺らぎを統一した表記で入力されて
おり、それを逆変換しているので、統一した表記を用い
て、コスト計算等を行うことができるとともに、ユーザ
の意図した表記でカタカナを入力することができる。
【0011】
【発明の実施の形態】本発明の実施形態を、図面を参照
して詳細に説明する。
【0012】図1は、本発明が実行される典型的なコン
ピュータ・システム100を示す。図1において、11
0はコンピュータ本体であり、その内部にはCPU、メ
モリ、ハードディスク等が格納されている。コンピュー
タ本体110には、また、CD−ROMドライバ112
やフロッピーディスク・ドライバ114が設置されてお
り、プログラムのインストールや、データの保存等に用
いられている。
【0013】120はキーボード、130はマウスであ
り、ディスプレイ140と共に、本発明の日本語入力の
ためのユーザ・インタフェースを提供している。即ち、
キーボード120からアルファベットを入力すると、ロ
ーマ字かな変換の規則に従って、アルファベットやかな
文字をディスプレイ140に表示したり、かな漢字変換
を行った場合の変換候補の選択をディスプレイ140の
表示からマウスにより行ったりする。
【0014】さて、図1のコンピュータにおいて実行さ
れる本発明のかな漢字変換処理について、図2のフロー
チャートを用いて説明する。
【0015】図1のキーボード120から、例えば、ロ
ーマ字かな変換処理を用いて、ローマ字で日本語を入力
して変換指示を出すと、図2に示したかな漢字処理が起
動される。ここでは例えば、「vaiorinn」とキ
ーボードから入力しているとする。かな漢字変換処理で
は、まず、「う゛ぁいおりん」と表示されているものに
対して、変換辞書を用いて変換候補を作成しようとする
(S202)。ここで、カタカナ表記とするべき入力が
あるかを判断する(S204)。この処理においては、
この場合、「va」と入力されているので通常の表記で
はなく、外来語表記であり、カタカナ表記であると判断
する。カタカナ表記である場合(S204でYES)の
ときは、例えば、上述のカタカナ表記の揺らぎの規則
(「ヴァ」と「バ」)を用いて表記を統一し(ばいおり
ん)、変換辞書等を用いて変換候補を作成する(S20
6)。これで見つかる変換候補は当然、カタカナ表記の
変換候補(バイオリン)である。このカタカナ表記の変
換候補に適用したカタカナ表記の揺らぎの規則を逆適用
して(「バ」と「ヴァ」)、ユーザが意図した入力に戻
す(「ヴァイオリン」)(S208)。その後、すべて
の変換候補に対して、通常の変換のコスト計算(確から
しさの計算)を行い(S210)、所定値以上の値の変
換候補を表示する(S212)。この場合コスト計算し
て、最大の変換候補から順に表示するのは、従来のかな
漢字変換と同様である。この変換候補を確定すること
で、望みの日本語入力を行うことができる。
【0016】このようにして、ユーザの意図したカタカ
ナ表記で入力することができる。
【0017】上記の処理において、表記の統一された後
のカタカナ表示(上述の例では「バイオリン」)も変換
候補として、コスト計算の対象とすることもできる。
【0018】上述の説明から分かるように、カタカナの
単語に関しては、変換辞書には、少なくとも上述の揺ら
ぎ規則を用いて統一された表記の単語は登録されている
必要がある。カタカナの単語の他の表記に関しては、全
てを登録する必要はない。
【0019】例えば、実際的な運用としては、以下のよ
うにすることができる。
【0020】(1)一般的な表記ならば、揺らぎも登録
する。
【0021】しかし、この揺らぎの規則を用いたもので
は、ちょっと余分に“コスト”をかけて日本語らしさを
チェックすることもできるので、この場合は、揺らぎの
表記が出にくくなる可能性がある。
【0022】例:バイオリンとヴァイオリンは両方登録
しておく。
【0023】(2)普段は現れそうにない表記ならば、
辞書登録せずに、この揺らぎの規則を用いた処理にまか
せる。
【0024】例:バスコダガマ(Vasco da Gama (人
名))は登録しても、ヴァスコダガマまでは登録しなく
てもよい。
【0025】本発明は、スタンド・アローンのコンピュ
ータ・システムばかりではなく、複数のシステムから構
成される例えばクライアント・サーバ・システム等に適
用してもよい。
【0026】本発明に関するプログラムを格納した記録
媒体から、プログラムをシステムで読み出して実行する
ことにより、本発明の構成を実現することができる。こ
の記録媒体には、フロッピー・ディスク、CD−RO
M、磁気テープ、ROMカセット等がある。
【0027】
【発明の効果】上記の説明のように、本発明の日本語入
力を用いると、変換辞書にはカタカナ表記で揺らぎを統
一した表記で入力されており、それを逆変換しているの
で、統一した表記を用いて、コスト計算等を行うことが
できるとともに、ユーザの意図した表記でカタカナを入
力することができる。
【図面の簡単な説明】
【図1】本発明が実装されるコンピュータ・システムの
概要を示した図である。
【図2】本発明の処理を説明するためのフローチャート
である。
【符号の説明】
100 コンピュータ・システム 110 コンピュータ本体 112 CD−ROMドライバ 114 フロッピーディスク・ドライバ 120 キーボード 140 ディスプレイ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 奥村 薫 アメリカ合衆国 ワシントン州 98052− 6399 レッドモンド ワン マイクロソフ ト ウェイ(番地なし) マイクロソフト コーポレイション内 Fターム(参考) 5B009 KA05 KC00 MA01 MA03 ME15

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 かな漢字変換による日本語入力装置にお
    いて、 カタカナ表記の揺らぎを統一する手段と、 統一されたカタカナ表記を元に戻す手段と、 元に戻した表記を変換候補として確からしさの計算を行
    う手段と、 確からしさに基づき変換候補を表示して確定する手段と
    を備えることを特徴とする日本語入力装置。
  2. 【請求項2】 請求項1記載の日本語入力装置におい
    て、さらに、カタカナ表記の揺らぎを統一した表記も変
    換候補とすることを特徴とする日本語入力装置。
  3. 【請求項3】 かな漢字変換による日本語入力方法にお
    いて、 カタカナ表記の揺らぎを統一し、 統一されたカタカナ表記を元に戻し、 元に戻した表記を変換候補として確からしさの計算を行
    い、 確からしさに基づき変換候補を表示して確定することを
    特徴とする日本語入力方法。
  4. 【請求項4】 請求項1または2記載の日本語入力装置
    をコンピュータに構築させるプログラムを格納した記録
    媒体。
JP10174941A 1998-06-22 1998-06-22 日本語入力装置および方法 Pending JP2000020511A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10174941A JP2000020511A (ja) 1998-06-22 1998-06-22 日本語入力装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10174941A JP2000020511A (ja) 1998-06-22 1998-06-22 日本語入力装置および方法

Publications (1)

Publication Number Publication Date
JP2000020511A true JP2000020511A (ja) 2000-01-21

Family

ID=15987417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10174941A Pending JP2000020511A (ja) 1998-06-22 1998-06-22 日本語入力装置および方法

Country Status (1)

Country Link
JP (1) JP2000020511A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288091A (ja) * 2001-03-28 2002-10-04 Seiko Epson Corp メール、データの表示

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288091A (ja) * 2001-03-28 2002-10-04 Seiko Epson Corp メール、データの表示

Similar Documents

Publication Publication Date Title
US8538743B2 (en) Disambiguating text that is to be converted to speech using configurable lexeme based rules
JPH07325828A (ja) 文法チェックシステム
US20070276650A1 (en) Techniques for customization of phonetic schemes
US7212963B2 (en) System for distinguishing names in Asian writing systems
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
US20070277118A1 (en) Providing suggestion lists for phonetic input
US7136805B2 (en) System for distinguishing names of organizations in Asian writing systems
US6731802B1 (en) Lattice and method for identifying and normalizing orthographic variations in Japanese text
JP2000020511A (ja) 日本語入力装置および方法
JP3953772B2 (ja) 読みがな付与装置およびプログラム
JP3176588B2 (ja) 手書き文字入力変換装置及び文書作成装置とコンピュータ読み取り可能な記録媒体
JP2003202893A (ja) 統計的言語モデルを作成するためのコーパス処理装置及び方法並びにプログラム
JPS6083136A (ja) プログラム読上装置
JP2958811B2 (ja) 日本語文章処理装置
JP2894736B2 (ja) 文章検査方法
JP2023072321A (ja) 文書校正支援装置、文書校正支援方法及び文書校正支援プログラム
JP3417837B2 (ja) 文章校正支援システムおよびそのシステムでの処理をコンピュータに行わせるためのプログラムを格納した記録媒体
JP3118880B2 (ja) 日本語文章処理装置
JPH07200592A (ja) 文章処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2575947B2 (ja) 文節切出し装置
JP2693467B2 (ja) かな漢字変換処理における同音語候補の優先度制御方式
JP3216725B2 (ja) 文章構造解析装置
JP2000020513A (ja) 日本語入力装置および方法
Lu et al. Lexical analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050519

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061110

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130701