JP2006155529A - 辞書登録装置、辞書登録方法および辞書登録プログラム - Google Patents
辞書登録装置、辞書登録方法および辞書登録プログラム Download PDFInfo
- Publication number
- JP2006155529A JP2006155529A JP2004349050A JP2004349050A JP2006155529A JP 2006155529 A JP2006155529 A JP 2006155529A JP 2004349050 A JP2004349050 A JP 2004349050A JP 2004349050 A JP2004349050 A JP 2004349050A JP 2006155529 A JP2006155529 A JP 2006155529A
- Authority
- JP
- Japan
- Prior art keywords
- notation
- word
- dictionary
- conversion
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】単語を保持する辞書121を記憶する辞書記憶手段と、前記辞書121に登録されていない未知語の入力を受付ける入力受付部101と、単語の表記と該表記と意味内容が関連する単語の表記とを予め対応付けた表記変換規則情報に基づいて、前記入力受付部101が受付けた前記未知語の表記を変換する表記変換部102と、表記変換部102が表記を変換した単語および前記未知語を前記辞書に登録する単語登録部103とを備えた。
【選択図】 図1
Description
第1の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
第2の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
第3の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
第4の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
第5の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を、表記変換規則表120ではなく、単語の属性情報が格納された辞書を参照して当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
101 入力受付部
102 表記変換部
103 単語登録部
110 ユーザI/F
120 表記変換規則表
121 辞書
501 読み入力フィールド
502 表記入力フィールド
503 品詞入力フィールド
504 登録ボタン
505 キャンセルボタン
601 チェックボックス
602 登録ボタン
603 キャンセルボタン
701 閉じるボタン
901 未知語検出部
1201 変換表記判定部
1202 変換表記分割部
Claims (11)
- 単語を登録した辞書を記憶する辞書記憶手段と、
前記辞書に登録されていない未知語の入力を受付ける入力受付手段と、
単語の表記と該表記と意味内容が関連する単語の表記とを予め対応付けた表記変換規則情報に基づいて、前記入力受付手段が受付けた前記未知語の表記を意味内容が関連する単語の表記に変換する表記変換手段と、
前記表記変換手段による変換後の表記の単語および前記未知語を前記辞書に登録する単語登録手段と、
を備えたことを特徴とする辞書登録装置。 - 入力文書から前記辞書に登録されていない前記未知語を検出する未知語検出手段をさらに備え、
前記入力受付手段は、前記未知語検出手段が検出した前記未知語の入力を受付けることを特徴とする請求項1に記載の辞書登録装置。 - 前記表記変換規則情報を記憶する表記変換規則記憶手段をさらに備え、
前記表記変換手段は、前記表記変換規則情報に従い、前記未知語の表記の一部または全部を関連する単語の表記に変換して、前記未知語の表記を変換することを特徴とする請求項1または2に記載の辞書登録装置。 - 前記辞書は単語と単語の属性情報とを対応して保持し、
前記表記変換手段は、前記辞書が保持する単語の属性情報に従い、前記未知語の表記の一部または全部を同一の属性情報を持つ単語の表記に変換して、前記未知語の表記を変換することを特徴とする請求項1または2に記載の辞書登録装置。 - 前記表記変換手段による変換結果に基づいて、変換した表記が前記辞書に登録する単語の表記として妥当であるか否かを判定する変換表記判定手段と、
前記変換表記判定手段が登録する単語として妥当でないと判定した表記を構成要素に分割する変換表記分割手段とをさらに備え、
前記単語登録手段は、前記変換表記分割手段が分割した前記構成要素および前記未知語を前記辞書に登録することを特徴とする請求項1〜4のいずれか1つに記載の辞書登録装置。 - 前記変換表記判定手段は、前記表記変換手段が変換した表記の個数が予め定められた個数を超える場合に、前記辞書に登録する単語の表記として妥当でないと判定することを特徴とする請求項5に記載の辞書登録装置。
- 前記変換表記判定手段は、前記表記変換手段が変換した表記の文字列長が予め定められた文字列長を超える場合に、前記辞書に登録する単語の表記として妥当でないと判定することを特徴とする請求項5に記載の辞書登録装置。
- 前記変換表記分割手段は、前記表記変換手段が変換した表記の部分と変換しない表記の部分とを構成要素として分割することを特徴とする請求項5〜7のいずれか1つに記載の辞書登録装置。
- 前記変換表記分割手段は、前記表記変換手段が変換した表記を形態素解析し、形態素解析により求めた形態素を構成要素として分割することを特徴とする請求項5〜7のいずれか1つに記載の辞書登録装置。
- 単語を保持する辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語の入力を受付ける入力受付ステップと、
単語の表記と該表記と意味内容が関連する単語の表記とを予め対応付けた表記変換規則情報に基づいて、前記入力受付ステップが受付けた前記未知語の表記を変換する表記変換ステップと、
前記表記変換ステップが表記を変換した単語および前記未知語を前記辞書に登録する辞書登録ステップと、
を備えたことを特徴とする辞書登録方法。 - 単語を保持する辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語の入力を受付ける入力受付手順と、
単語の表記と該表記と意味内容が関連する単語の表記とを予め対応付けた表記変換規則情報に基づいて、前記入力受付手順が受付けた前記未知語の表記を変換する表記変換手順と、
前記表記変換手順が表記を変換した単語および前記未知語を前記辞書に登録する辞書登録手順と、
をコンピュータに実行させる辞書登録プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004349050A JP4192142B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004349050A JP4192142B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006155529A true JP2006155529A (ja) | 2006-06-15 |
JP4192142B2 JP4192142B2 (ja) | 2008-12-03 |
Family
ID=36633705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004349050A Expired - Fee Related JP4192142B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4192142B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009258293A (ja) * | 2008-04-15 | 2009-11-05 | Mitsubishi Electric Corp | 音声認識語彙辞書作成装置 |
JP2010157087A (ja) * | 2008-12-26 | 2010-07-15 | Fujitsu Ltd | 文例データベース構築プログラム、文例表示プログラム、文例データベース構築方法および文例表示方法 |
US11640502B2 (en) | 2020-03-09 | 2023-05-02 | Omron Corporation | Word registration device, word registration method, and word registration program stored on computer-readable storage |
-
2004
- 2004-12-01 JP JP2004349050A patent/JP4192142B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009258293A (ja) * | 2008-04-15 | 2009-11-05 | Mitsubishi Electric Corp | 音声認識語彙辞書作成装置 |
JP2010157087A (ja) * | 2008-12-26 | 2010-07-15 | Fujitsu Ltd | 文例データベース構築プログラム、文例表示プログラム、文例データベース構築方法および文例表示方法 |
US11640502B2 (en) | 2020-03-09 | 2023-05-02 | Omron Corporation | Word registration device, word registration method, and word registration program stored on computer-readable storage |
Also Published As
Publication number | Publication date |
---|---|
JP4192142B2 (ja) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4301515B2 (ja) | 文章表示方法、情報処理装置、情報処理システム、プログラム | |
JP4701292B2 (ja) | テキスト・データに含まれる固有表現又は専門用語から用語辞書を作成するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
CN109460552B (zh) | 基于规则和语料库的汉语语病自动检测方法及设备 | |
US9208140B2 (en) | Rule based apparatus for modifying word annotations | |
US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
US20130151957A1 (en) | Document analysis system, document analysis method, document analysis program and recording medium | |
JP5751431B2 (ja) | 不整合検出システム、方法、およびプログラム | |
Islam et al. | Real-word spelling correction using google web 1tn-gram data set | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP4192142B2 (ja) | 辞書登録装置、辞書登録方法および辞書登録プログラム | |
Alam et al. | Text normalization system for Bangla | |
CN106250354B (zh) | 处理文书的信息处理装置、信息处理方法以及程序 | |
CN112136136A (zh) | 输入错误检测装置、输入错误检测方法及输入错误检测程序 | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
WO2021107006A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH1011443A (ja) | 文書符号検査システム | |
JP5795302B2 (ja) | 形態素解析装置、方法、及びプログラム | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
JP4047895B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
US20240037129A1 (en) | Search device, search method, and recording medium | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
US20240354517A1 (en) | Systems and methods for detecting sensitive text in documents | |
JP6203083B2 (ja) | 未知語抽出装置及び未知語抽出方法 | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
JP4047894B2 (ja) | 文書校正装置およびプログラム記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080715 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080916 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080919 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |