JP4001872B2 - ローマ字カナ変換装置、その方法及びそのプログラム - Google Patents
ローマ字カナ変換装置、その方法及びそのプログラム Download PDFInfo
- Publication number
- JP4001872B2 JP4001872B2 JP2004046612A JP2004046612A JP4001872B2 JP 4001872 B2 JP4001872 B2 JP 4001872B2 JP 2004046612 A JP2004046612 A JP 2004046612A JP 2004046612 A JP2004046612 A JP 2004046612A JP 4001872 B2 JP4001872 B2 JP 4001872B2
- Authority
- JP
- Japan
- Prior art keywords
- kana
- information
- character
- roman
- mora
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims description 31
- 240000000220 Panda oleosa Species 0.000 claims abstract description 197
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 196
- 238000010606 normalization Methods 0.000 claims abstract description 17
- 238000006467 substitution reaction Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 25
- 238000012706 support-vector machine Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 3
- 230000002035 prolonged effect Effects 0.000 description 3
- 230000002940 repellent Effects 0.000 description 3
- 239000005871 repellent Substances 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000287462 Phalacrocorax carbo Species 0.000 description 1
- 241001168730 Simo Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004237 preparative chromatography Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
"ローマ字変換ソフト"、Vector Inc.、[平成16年2月10日検索]、インターネット<http://www.vector.co.jp/soft/win95/util/se215618.html> "ローマ字<−>ひらがな変換 RtoK by福太郎"、Vector Inc.、[平成16年2月10日検索]、インターネット<http://www.vector.co.jp/soft/win95/util/se287403.html>
図1は本発明のローマ字カナ変換装置の第1の実施の形態、ここでは読み仮名付与用に対応した装置の実施の形態を示すもので、図中、1はローマ字カナ変換表、2は対応表変換部、3は正規化表、4は長母音判定モデル、5は長母音判定部である。
第1の実施の形態では読み仮名付与用に対応した装置について説明したが、第2の実施の形態では読み上げ用に対応した装置の実施の形態について説明する。基本的な構成・動作は第1の実施の形態の場合と同様であり、長母音判定モデル4と、モデル判定部52及びカナ文字置換・追加部53における処理とが異なる。
[処理例1]
図6は第1の実施の形態によるローマ字カナ変換処理の一例を示すもので、ここでは長母音判定モデル4の学習器としてはSVMを用い、長母音判定モデル4における判定に用いる情報としては、判定しようとするモーラ単位の一の情報の行情報及び段情報と、モーラ単位でその前後の2つの情報の行情報及び段情報と、モーラ単位でその前の2つの情報の判定結果とした。なお、前後情報をどこまで使うかは一例であり、さらに多くの情報を使っても良い。
−2モーラ:行情報=なし
−2モーラ:段情報=なし
−1モーラ:行情報=なし
−1モーラ:段情報=なし
0モーラ:行情報=h
Oモーラ:段情報=o
1モーラ:行情報=T
1モーラ:段情報=T
2モーラ:行情報=k
2モーラ:段情報=a
という情報が長母音判定モデル4に入力され、「通常」という判定結果が得られる。
[処理例2]
図7は第2の実施の形態によるローマ字カナ変換処理の一例を示すもので、ここでは処理例1と同様、長母音判定モデル4の学習器としてはSVMを用い、長母音判定モデル4における判定に用いる情報としては、判定しようとするモーラ単位の一の情報の行情報及び段情報と、モーラ単位でその前後の2つの情報の行情報及び段情報と、モーラ単位でその前の2つの情報の判定結果とした。なお、前後情報をどこまで使うかは一例であり、さらに多くの情報を使っても良いことはいうまでない。
−2モーラ:行情報=h
−2モーラ:段情報=e
−1モーラ:行情報=a
−1モーラ:段情報=i
0モーラ:行情報=s
0モーラ:段情報=e
1モーラ:行情報=a
1モーラ:段情報=i
2モーラ:行情報=ty
2モーラ:段情報=o
という情報が長母音判定モデル4に入力される。長母音判定モデル4ではNo.1,2のモーラに対する判定結果(No.1=通常、No.2=長音置換)も判定情報に加えて「通常」という判定結果が得られる。
Claims (6)
- ローマ字で表記されたローマ字表記文字列を、カナ文字で表記されたカナ表記文字列に変換するローマ字カナ変換装置において、
モーラ単位のカナ文字とこれに対応するローマ字との関係を全てのモーラ単位のカナ文字について記述したローマ字カナ対応表を用いて、ローマ字表記文字列を、モーラ単位のローマ字とこれに対応するカナ文字を含む情報の集合からなるローマ字カナ対応文字列に変換する対応表変換手段と、
前記ローマ字カナ対応文字列を構成するモーラ単位の各情報についてカナ五十音表における各行及び各段の位置をローマ字で表した行情報及び段情報を付与する行・段情報付与手段と、
モーラ単位の一の情報の行情報及び段情報と、モーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報と、当該モーラ単位の一の情報をそのままとする「通常」または長音を追加する「長音追加」または長音に置換する「長音置換」のいずれであるかの出力値とからなる学習データを用いて予め学習した識別関数である長母音判定モデルと、
前記ローマ字カナ対応文字列を構成するモーラ単位の各情報について、その行情報及び段情報とモーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報とを前記長母音判定モデルに入力して、「通常」または「長音追加」または「長音置換」のいずれであるかの判定結果を得るモデル判定手段と、
前記ローマ字カナ対応文字列を構成するモーラ単位の情報のうち、「通常」と判定されたモーラ単位の情報のカナ文字についてはそのままとし、「長音追加」と判定されたモーラ単位の情報のカナ文字についてはその末尾に長音「ー」を追加し、「長音置換」と判定されたモーラ単位の情報のカナ文字についてはその末尾を長音「ー」に置換し、最終的なカナ表記文字列を出力するカナ文字置換・追加手段とを備えた
ことを特徴とするローマ字カナ変換装置。 - 請求項1記載のローマ字カナ変換装置において、
行・段情報付与手段は、ローマ字カナ対応文字列が同一のカナ文字に対応するローマ字を2種類以上含む場合、これを1種類に統一する正規化表を用いて正規化された行情報及び段情報を付与する
ことを特徴とするローマ字カナ変換装置。 - ローマ字カナ変換装置を用いて、ローマ字で表記されたローマ字表記文字列を、カナ文字で表記されたカナ表記文字列に変換するローマ字カナ変換方法において、
前記ローマ字カナ変換装置の対応表変換手段が、モーラ単位のカナ文字とこれに対応するローマ字との関係を全てのモーラ単位のカナ文字について記述したローマ字カナ対応表を用いて、ローマ字表記文字列を、モーラ単位のローマ字とこれに対応するカナ文字を含む情報の集合からなるローマ字カナ対応文字列に変換する対応表変換ステップと、
前記ローマ字カナ変換装置の行・段情報付与手段が、前記ローマ字カナ対応文字列を構成するモーラ単位の各情報についてカナ五十音表における各行及び各段の位置をローマ字で表した行情報及び段情報を付与する行・段情報付与ステップと、
前記ローマ字カナ変換装置のモデル判定手段が、前記ローマ字カナ対応文字列を構成するモーラ単位の各情報について、その行情報及び段情報とモーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報とを、モーラ単位の一の情報の行情報及び段情報と、モーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報と、当該モーラ単位の一の情報をそのままとする「通常」または長音を追加する「長音追加」または長音に置換する「長音置換」のいずれであるかの出力値とからなる学習データを用いて予め学習した識別関数である長母音判定モデルに入力して、「通常」または「長音追加」または「長音置換」のいずれであるかの判定結果を得るモデル判定ステップと、
前記ローマ字カナ変換装置のカナ文字置換・追加手段が、前記ローマ字カナ対応文字列を構成するモーラ単位の情報のうち、「通常」と判定されたモーラ単位の情報のカナ文字についてはそのままとし、「長音追加」と判定されたモーラ単位の情報のカナ文字についてはその末尾に長音「ー」を追加し、「長音置換」と判定されたモーラ単位の情報のカナ文字についてはその末尾を長音「ー」に置換し、最終的なカナ表記文字列を出力するカナ文字置換・追加ステップとを実行する
ことを特徴とするローマ字カナ変換方法。 - 請求項3記載のローマ字カナ変換方法において、
行・段情報付与ステップは、ローマ字カナ対応文字列が同一のカナ文字に対応するローマ字を2種類以上含む場合、これを1種類に統一する正規化表を用いて正規化された行情報及び段情報を付与する
ことを特徴とするローマ字カナ変換方法。 - コンピュータを、ローマ字で表記されたローマ字表記文字列を、カナ文字で表記されたカナ表記文字列に変換するローマ字カナ変換装置として機能させるローマ字カナ変換プログラムであって、
コンピュータに、
モーラ単位のカナ文字とこれに対応するローマ字との関係を全てのモーラ単位のカナ文字について記述したローマ字カナ対応表を用いて、ローマ字表記文字列を、モーラ単位のローマ字とこれに対応するカナ文字を含む情報の集合からなるローマ字カナ対応文字列に変換する対応表変換機能と、
前記ローマ字カナ対応文字列を構成するモーラ単位の各情報についてカナ五十音表における各行及び各段の位置をローマ字で表した行情報及び段情報を付与する行・段情報付与機能と、
前記ローマ字カナ対応文字列を構成するモーラ単位の各情報について、その行情報及び段情報とモーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報とを、モーラ単位の一の情報の行情報及び段情報と、モーラ単位でその前後一定の範囲に含まれる情報の行情報及び段情報と、当該モーラ単位の一の情報をそのままとする「通常」または長音を追加する「長音追加」または長音に置換する「長音置換」のいずれであるかの出力値とからなる学習データを用いて予め学習した識別関数である長母音判定モデルに入力して、「通常」または「長音追加」または「長音置換」のいずれであるかの判定結果を得るモデル判定機能と、
前記ローマ字カナ対応文字列を構成するモーラ単位の情報のうち、「通常」と判定されたモーラ単位の情報のカナ文字についてはそのままとし、「長音追加」と判定されたモーラ単位の情報のカナ文字についてはその末尾に長音「ー」を追加し、「長音置換」と判定されたモーラ単位の情報のカナ文字についてはその末尾を長音「ー」に置換し、最終的なカナ表記文字列を出力するカナ文字置換・追加機能とを実現させる
ことを特徴とするローマ字カナ変換プログラム。 - 請求項5記載のローマ字カナ変換プログラムにおいて、
前記行・段情報付与機能は、ローマ字カナ対応文字列が同一のカナ文字に対応するローマ字を2種類以上含む場合、これを1種類に統一する正規化表を用いて正規化された行情報及び段情報を付与する
ことを特徴とするローマ字カナ変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004046612A JP4001872B2 (ja) | 2004-02-23 | 2004-02-23 | ローマ字カナ変換装置、その方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004046612A JP4001872B2 (ja) | 2004-02-23 | 2004-02-23 | ローマ字カナ変換装置、その方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005235100A JP2005235100A (ja) | 2005-09-02 |
JP4001872B2 true JP4001872B2 (ja) | 2007-10-31 |
Family
ID=35017973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004046612A Expired - Lifetime JP4001872B2 (ja) | 2004-02-23 | 2004-02-23 | ローマ字カナ変換装置、その方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4001872B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7119682B2 (ja) | 2018-07-17 | 2022-08-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4773813B2 (ja) * | 2005-12-07 | 2011-09-14 | 日本電信電話株式会社 | 読み付与装置、読み付与方法及びプログラム |
-
2004
- 2004-02-23 JP JP2004046612A patent/JP4001872B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7119682B2 (ja) | 2018-07-17 | 2022-08-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2005235100A (ja) | 2005-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5599662B2 (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
CN1779783B (zh) | 普通拼写助记法 | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JP5809381B1 (ja) | 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム | |
KR100344947B1 (ko) | 한자입력장치 및 방법 | |
JP2009223463A (ja) | 同義性判定装置、その方法、プログラム及び記録媒体 | |
WO2019208507A1 (ja) | 言語特徴の抽出装置、固有表現の抽出装置、抽出方法、及びプログラム | |
JP4001872B2 (ja) | ローマ字カナ変換装置、その方法及びそのプログラム | |
JP5853595B2 (ja) | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP3664383B2 (ja) | 日本語入力システム、日本語入力方法、および、記録媒体 | |
JP5676517B2 (ja) | 文字列類似度計算装置、方法、及びプログラム | |
JP2006053866A (ja) | カタカナ文字列の表記ゆれの検出方法 | |
JP2009199434A (ja) | アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム | |
KR102571215B1 (ko) | 한글 기반 패스워드 추측 방법 | |
JPWO2020246175A5 (ja) | ||
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP3961858B2 (ja) | 翻字装置及びそのプログラム | |
KR102442109B1 (ko) | 타일 소진 미션 게임 시스템 | |
JP7106479B2 (ja) | 電子機器、文字入力方法およびプログラム | |
JP7367839B2 (ja) | 音声認識装置、制御方法、及びプログラム | |
JP6640788B2 (ja) | 言語変換プログラム及び言語変換装置 | |
JP4395620B2 (ja) | 表示制御装置及びプログラム | |
US10275429B2 (en) | Kernel based string descriptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20061221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070814 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070815 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4001872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110824 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120824 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130824 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |