JP5159657B2 - 複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 - Google Patents
複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 Download PDFInfo
- Publication number
- JP5159657B2 JP5159657B2 JP2009016439A JP2009016439A JP5159657B2 JP 5159657 B2 JP5159657 B2 JP 5159657B2 JP 2009016439 A JP2009016439 A JP 2009016439A JP 2009016439 A JP2009016439 A JP 2009016439A JP 5159657 B2 JP5159657 B2 JP 5159657B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- kanji
- conversion
- kana
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 156
- 240000000220 Panda oleosa Species 0.000 claims description 92
- 235000016496 Panda oleosa Nutrition 0.000 claims description 92
- 238000000605 extraction Methods 0.000 claims description 25
- 230000003287 optical effect Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Description
図1は、本発明の一実施形態に係る誤変換指摘装置1の機能構成を示す機能ブロック図である。
図2は、本実施形態の誤変換指摘装置1のハードウェア構成を示す図である。図2に示すように、制御部200を構成するCPU(Central Processing Unit)210(マルチプロセッサ構成ではCPU220等複数のCPUが追加されてもよい)、バスライン100、通信I/F(I/F:インタフェース)230、メインメモリ240、BIOS(Basic Input Output System)250、I/Oコントローラ260、ハードディスク270、光ディスクドライブ280及び半導体メモリ290を備える。なお、ハードディスク270、光ディスクドライブ280及び半導体メモリ290はまとめて記憶装置310と呼ばれる。
図3は、誤変換指摘処理のフローチャートである。
110 文章受付手段
120 漢字含み文字列抽出手段
130 異読仮名検索手段
140 異漢字変換検索表示手段
150 誤変換指摘手段
Claims (6)
- 複数種類の読み仮名を有する文字列の誤変換を指摘する誤変換指摘装置であって、
漢字変換後の文章の中から、単語を区切りとして漢字を含む文字列を抽出する漢字含み文字列抽出手段と、
前記漢字含み文字列抽出手段が抽出した前記文字列に対応する複数種類の読み仮名を検索する異読仮名検索手段と、
前記異読仮名検索手段が検索した前記複数種類の読み仮名の夫々に対応する漢字変換後の文字列を検索する異漢字変換検索表示手段と、
前記異漢字変換検索表示手段が検索した前記漢字変換後の文字列の中から、前記文章の中に含まれる異漢字変換後文字列を抽出する異漢字変換後文字列抽出手段と、
前記漢字含み文字列抽出手段が抽出した前記文字列の尤度と、前記異漢字変換後文字列抽出手段が抽出した前記異漢字変換後文字列の尤度とを当該各文字列の前記文章における出現確率に基づいて計算し、これらの尤度に基づき、前記漢字含み文字列抽出手段が抽出した前記文字列に誤変換があるか否かを判定する誤変換判定手段と、を備え、
前記誤変換があると判定された場合に、前記漢字含み文字列抽出手段が抽出した前記文字列に誤変換があることを指摘することを特徴とする誤変換指摘装置。 - 前記異漢字変換検索表示手段は、前記検索した前記漢字変換後の文字列を表示装置に表示することを特徴とする請求項1記載の誤変換指摘装置。
- 漢字を含む文字列と当該文字列の読み仮名との対応関係を記憶する対応読み仮名記憶手段と、
仮名と当該仮名の漢字変換後の文字列との対応関係を記憶する対応漢字含み文字列記憶手段と、を更に備え、
前記異読仮名検索手段は、
前記漢字含み文字列抽出手段が抽出した前記文字列について、前記対応読み仮名記憶手段を参照して複数種類の読み仮名を検索し、
前記異漢字変換検索表示手段は、
前記異読仮名検索手段が検索した前記複数種類の読み仮名の夫々について、前記対応漢字含み文字列記憶手段を参照して前記漢字変換後の文字列を検索することを特徴とする請求項2記載の誤変換指摘装置。 - コンピュータが、複数種類の読み仮名を有する文字列の誤変換を指摘する誤変換指摘方法であって、
漢字変換後の文章の中から、単語を区切りとして漢字を含む文字列を抽出するステップと、
前記抽出された前記文字列に対応する複数種類の読み仮名を検索するステップと、
前記検索された前記複数種類の読み仮名の夫々に対応する漢字変換後の文字列を検索するステップと、
前記検索した前記漢字変換後の文字列の中から、前記文章の中に含まれる異漢字変換後文字列を抽出するステップと、
前記抽出された前記文字列の尤度と、前記抽出された前記異漢字変換後文字列の尤度とを当該各文字列の前記文章における出現確率に基づいて計算し、これらの尤度に基づき、前記抽出された前記文字列に誤変換があるか否かを判定するステップと、を含み、
前記誤変換があると判定された場合に、前記抽出された前記文字列に誤変換があることを指摘することを特徴とする誤変換指摘方法。 - 前記検索された前記漢字変換後の文字列を表示装置に表示するステップ、をさらに含むことを特徴とする請求項4記載の誤変換指摘方法。
- 漢字を含む文字列と当該文字列の読み仮名との対応関係を記憶する対応読み仮名テーブルと、
仮名と当該仮名の漢字変換後の文字列との対応関係を記憶する対応漢字含み文字列テーブルと、を更に備え、
前記複数種類の読み仮名を検索するステップでは、
前記抽出された前記文字列について、前記対応読み仮名テーブルを参照して複数種類の読み仮名を検索し、
前記漢字変換後の文字列を検索し表示装置に表示するステップでは、
前記検索された前記複数種類の読み仮名の夫々について、前記対応漢字含み文字列テーブルを参照して前記漢字変換後の文字列を検索することを特徴とする請求項5記載の誤変換指摘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009016439A JP5159657B2 (ja) | 2009-01-28 | 2009-01-28 | 複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009016439A JP5159657B2 (ja) | 2009-01-28 | 2009-01-28 | 複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176260A JP2010176260A (ja) | 2010-08-12 |
JP5159657B2 true JP5159657B2 (ja) | 2013-03-06 |
Family
ID=42707204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009016439A Active JP5159657B2 (ja) | 2009-01-28 | 2009-01-28 | 複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5159657B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007193849A (ja) * | 2007-04-25 | 2007-08-02 | Microsoft Corp | かな漢字変換システムおよび方法 |
JP2008299675A (ja) * | 2007-05-31 | 2008-12-11 | Yahoo Japan Corp | かな混在表記抽出装置、方法及びプログラム |
-
2009
- 2009-01-28 JP JP2009016439A patent/JP5159657B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010176260A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105917327B (zh) | 用于将文本输入到电子设备中的系统和方法 | |
JP4301515B2 (ja) | 文章表示方法、情報処理装置、情報処理システム、プログラム | |
JP5599662B2 (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
KR101279676B1 (ko) | 언어 모델을 생성하기 위한 방법, 가나-간지 변환 방법 및그 장치 | |
WO2009035863A2 (en) | Mining bilingual dictionaries from monolingual web pages | |
CN101815996A (zh) | 检测名称实体和新词 | |
JP5646792B2 (ja) | 単語分割装置、単語分割方法、及び単語分割プログラム | |
KR101573854B1 (ko) | 관계어 기반 확률추정 방법을 이용한 통계적 문맥의존 철자오류 교정 장치 및 방법 | |
US20140156258A1 (en) | Foreign language writing support apparatus and method | |
US20060241936A1 (en) | Pronunciation specifying apparatus, pronunciation specifying method and recording medium | |
KR101049358B1 (ko) | 유사어 결정 방법 및 시스템 | |
JP2004303240A (ja) | 単語解析のためのシステムおよび方法 | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
CN116756382A (zh) | 检测敏感字符串的方法、装置、设置及存储介质 | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
JP5159657B2 (ja) | 複数種類の読み仮名を有する漢字含み文字列の誤変換を指摘する誤変換指摘装置及びその方法 | |
JP5583230B2 (ja) | 情報検索装置及び情報検索方法 | |
Hahn et al. | Optimizing CRFs for SLU tasks in various languages using modified training criteria | |
WO2007041328A1 (en) | Detecting segmentation errors in an annotated corpus | |
JP5047209B2 (ja) | 変換区切り位置に基づいて誤変換を指摘する誤変換指摘装置及びその方法 | |
WO2009139240A1 (ja) | 情報処理装置および情報処理方法ならびに記録媒体 | |
JP2010211004A (ja) | 辞書作成装置、辞書作成システム、辞書作成方法および辞書作成プログラム | |
JP5412137B2 (ja) | 機械学習装置及び方法 | |
JP5849675B2 (ja) | 文字入力用のプログラムおよび情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120410 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5159657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |