JP4266240B1 - 項目判定システムおよび項目判定プログラム - Google Patents
項目判定システムおよび項目判定プログラム Download PDFInfo
- Publication number
- JP4266240B1 JP4266240B1 JP2008159419A JP2008159419A JP4266240B1 JP 4266240 B1 JP4266240 B1 JP 4266240B1 JP 2008159419 A JP2008159419 A JP 2008159419A JP 2008159419 A JP2008159419 A JP 2008159419A JP 4266240 B1 JP4266240 B1 JP 4266240B1
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- information
- item
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims description 72
- 238000000034 method Methods 0.000 abstract description 45
- 244000205754 Colocasia esculenta Species 0.000 description 38
- 235000006481 Colocasia esculenta Nutrition 0.000 description 38
- 240000000220 Panda oleosa Species 0.000 description 19
- 235000016496 Panda oleosa Nutrition 0.000 description 19
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 2
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】レコード抽出部12により複数のレコードからなるリスト情報から一のレコードが抽出され、文字列分割部13により前記レコードが各々の文字列に分割され、文字情報取得部14により前記分割された文字列の文字情報が取得される。項目種別判定部15は、前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列を当該特定文字列に関連する関連文字列として特定する。その後、項目種別判定部15は、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する。
【選択図】図1
Description
複数のレコードからなるリスト情報から前記レコードを取得するレコード抽出部と、
前記レコードを各々の文字列に分割する文字列分割部と、文字列を所定の項目種別から他の項目種別の文字列に変換させるための変換ルールを記憶する文字情報記録部と、前記分割された文字列を前記変換ルールにより変換した変換情報を含む当該文字列の文字情報を取得する文字情報取得部と、前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列から、当該隣接文字列の文字情報に含まれる変換情報と当該特定文字列とを比較することにより当該特定文字列に関連する関連文字列を特定し、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定部と、を備えている。
以下、図面を用いて本発明の第1実施形態を説明する。本実施形態における本発明の項目判定システムは、汎用コンピュータでなる端末Cにより構成されており、ディスプレイや入力機器(キーボード、マウス等)を備えている。
次に、本発明による項目判定システムの第2実施形態を説明する。図6は、本実施形態における機能ブロック図であり、文字情報の定義を記録する文字情報記録部21を備えている点で第1実施形態と異なっている。
次に、図面を用いて本発明による項目判定システムの第3実施形態を説明する。本実施形態における機能ブロック図は、第1実施形態と同様であるため、詳細な説明は省略する。なお、本実施形態における文字情報は、文字数であり、判定基準記録部22には、図7に示すような判定基準が記録されている。
次に、本発明による項目判定システムの第4実施形態を説明する。本実施形態における機能部は第2実施形態と同様であるが、文字情報が変換情報である点において第2実施形態と異なっている。なお、本実施形態における変換情報とは、所定の変換ルールに基づき変換された文字列とそのときの変換種別の対であり、文字情報記録部21には所定の変換ルールが記録されている。本実施例では、図8に示すような、漢字−かな、住所−郵便番号、住所−電話番号の相互の変換ルールを用いているが、他の変換ルールを用いても構わず、判定する項目種別により適宜変更可能である。また、本実施形態における隣接とは、レコードRにおいて完全に隣り合う場合だけでなく、所定範囲離れている場合も含んでいる。
次に、図面を用いて本発明による項目判定システムの第5実施形態を説明する。図9は本実施形態における機能ブロックであり、項目種別判定部15が、さらに、項目種別を予測する項目種別予測部15aおよび、予測結果判定部15bを備えている点において第2実施形態と異なっている。以下の説明では、第2実施形態と同様の機能部の説明は省略する。
次に、図面を用いて本発明による項目判定システムの第6実施形態を説明する。図13は本実施形態における機能ブロックであり、予測結果判定部15bに代えて文字列を所定の変換ルールに基づき変換する文字列変換部15cを備えている点において第5実施形態と異なっている。なお、本実施形態の文字情報記録部21には、図8の変換ルールが記録されている。
(1)上述の判定基準として正規表現を用いることも可能である。例えば、住所の判定基準として、“/.*[都道府県].*[市区郡].*/”を用いることができる。この例では、任意に文字列の後に“都道府県”のいずれかの文字があり、その後に任意の文字列があり、さらに“市区郡”のいずれかの文字と任意の文字列が後続する文字列を表している。このような正規表現を用いることにより、判定基準の表現に柔軟性が増し、好適である。なお、正規表現は、上述の実施形態の判定基準に代えてまたは共に用いても構わない。
11:リスト情報取得部
12:レコード抽出部
13:文字列分割部
14:文字情報取得部
15:項目種別判定部
16:統合情報生成部
21:文字情報記録部
22:判定基準記録部
Claims (4)
- レコードを構成する複数の文字列の各々の項目種別を判定する項目判定システムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得するレコード抽出部と、
前記レコードを各々の文字列に分割する文字列分割部と、
文字列を所定の項目種別から他の項目種別の文字列に変換させるための変換ルールを記憶する文字情報記録部と、
前記分割された文字列を前記変換ルールにより変換した変換情報を含む当該文字列の文字情報を取得する文字情報取得部と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列から、当該隣接文字列の文字情報に含まれる変換情報と当該特定文字列とを比較することにより当該特定文字列に関連する関連文字列を特定し、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定部と、を備えたことを特徴とする項目判定システム。 - レコードを構成する複数の文字列の各々の項目種別を判定する項目判定システムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得するレコード抽出部と、
前記レコードを各々の文字列に分割する文字列分割部と、
文字列を所定の項目種別から他の項目種別の文字列に変換させるための変換ルールを記憶する文字情報記録部と、
前記分割された文字列を前記変換ルールにより変換した変換情報を含む当該文字列の文字情報を取得する文字情報取得部と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列から、当該隣接文字列と当該特定文字列の文字情報に含まれる変換情報とを比較することにより当該特定文字列に関連する関連文字列を特定し、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定部と、を備えたことを特徴とする項目判定システム。 - レコードを構成する複数の文字列の各々の項目種別を判定し、文字列を所定の項目種別から他の項目種別の文字列に変換させるための変換ルールを記憶する文字情報記録部を備えた項目判定システムのための項目判定プログラムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得する機能と、
前記レコードを各々の文字列に分割する機能と、
前記分割された文字列を前記変換ルールにより変換した変換情報を含む当該文字列の文字情報を取得する機能と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列から、当該隣接文字列の文字情報に含まれる変換情報と当該特定文字列とを比較することにより当該特定文字列に関連する関連文字列を特定し、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定機能と、をコンピュータに実現させる項目判定プログラム。 - レコードを構成する複数の文字列の各々の項目種別を判定するし、文字列を所定の項目種別から他の項目種別の文字列に変換させるための変換ルールを記憶する文字情報記録部を備えた項目判定システムのための項目判定プログラムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得する機能と、
前記レコードを各々の文字列に分割する機能と、
前記分割された文字列を前記変換ルールにより変換した変換情報を含む当該文字列の文字情報を取得する機能と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列から、当該隣接文字列と当該特定文字列の文字情報に含まれる変換情報とを比較することにより当該特定文字列に関連する関連文字列を特定し、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定機能と、をコンピュータに実現させる項目判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008159419A JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008159419A JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4266240B1 true JP4266240B1 (ja) | 2009-05-20 |
JP2010003000A JP2010003000A (ja) | 2010-01-07 |
Family
ID=40785228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008159419A Active JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4266240B1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5659505B2 (ja) * | 2010-03-02 | 2015-01-28 | 凸版印刷株式会社 | 真贋判定装置及び真贋判定方法 |
JP6406653B1 (ja) * | 2017-10-20 | 2018-10-17 | 株式会社エスピック | 表認識処理装置 |
JP6524311B2 (ja) * | 2018-05-24 | 2019-06-05 | 株式会社エスピック | 表認識処理装置 |
-
2008
- 2008-06-18 JP JP2008159419A patent/JP4266240B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010003000A (ja) | 2010-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0844583B1 (en) | Method and apparatus for character recognition | |
US10747946B2 (en) | Non-transitory computer-readable storage medium, encoding apparatus, and encoding method | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
JP6599219B2 (ja) | 読み付与装置、読み付与方法、およびプログラム | |
JP2006301446A (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
JP4991407B2 (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
JP4266240B1 (ja) | 項目判定システムおよび項目判定プログラム | |
JPH09244969A (ja) | パーソナル情報抽出方法及び装置 | |
JPH1011434A (ja) | 情報認識装置 | |
WO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
US11080488B2 (en) | Information processing apparatus, output control method, and computer-readable recording medium | |
CN106250354A (zh) | 处理文书的信息处理装置、信息处理方法以及程序 | |
US20210182477A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP4054453B2 (ja) | 文字認識装置およびプログラム記録媒体 | |
JP5583230B2 (ja) | 情報検索装置及び情報検索方法 | |
JP5752073B2 (ja) | データ修正装置 | |
JP6556411B2 (ja) | 読み推定装置 | |
WO2020203276A1 (ja) | 新語候補抽出装置、新語候補抽出方法、及びプログラム | |
JP4192142B2 (ja) | 辞書登録装置、辞書登録方法および辞書登録プログラム | |
US20240037129A1 (en) | Search device, search method, and recording medium | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
US20210064586A1 (en) | Data processing device and data processing method | |
JPH08180064A (ja) | 文書検索方法及び文書ファイリング装置 | |
JP2006126883A (ja) | 情報検索装置及び情報検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090212 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4266240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |