JP2010003000A - 項目判定システムおよび項目判定プログラム - Google Patents
項目判定システムおよび項目判定プログラム Download PDFInfo
- Publication number
- JP2010003000A JP2010003000A JP2008159419A JP2008159419A JP2010003000A JP 2010003000 A JP2010003000 A JP 2010003000A JP 2008159419 A JP2008159419 A JP 2008159419A JP 2008159419 A JP2008159419 A JP 2008159419A JP 2010003000 A JP2010003000 A JP 2010003000A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- information
- item
- item type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 description 45
- 244000205754 Colocasia esculenta Species 0.000 description 38
- 235000006481 Colocasia esculenta Nutrition 0.000 description 38
- 240000000220 Panda oleosa Species 0.000 description 19
- 235000016496 Panda oleosa Nutrition 0.000 description 19
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】レコード抽出部12により複数のレコードからなるリスト情報から一のレコードが抽出され、文字列分割部13により前記レコードが各々の文字列に分割され、文字情報取得部14により前記分割された文字列の文字情報が取得される。項目種別判定部15は、前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列を当該特定文字列に関連する関連文字列として特定する。その後、項目種別判定部15は、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する。
【選択図】図1
Description
以下、図面を用いて本発明の第1実施形態を説明する。本実施形態における本発明の項目判定システムは、汎用コンピュータでなる端末Cにより構成されており、ディスプレイや入力機器(キーボード、マウス等)を備えている。
次に、本発明による項目判定システムの第2実施形態を説明する。図6は、本実施形態における機能ブロック図であり、文字情報の定義を記録する文字情報記録部21を備えている点で第1実施形態と異なっている。
次に、図面を用いて本発明による項目判定システムの第3実施形態を説明する。本実施形態における機能ブロック図は、第1実施形態と同様であるため、詳細な説明は省略する。なお、本実施形態における文字情報は、文字数であり、判定基準記録部22には、図7に示すような判定基準が記録されている。
次に、本発明による項目判定システムの第4実施形態を説明する。本実施形態における機能部は第2実施形態と同様であるが、文字情報が変換情報である点において第2実施形態と異なっている。なお、本実施形態における変換情報とは、所定の変換ルールに基づき変換された文字列とそのときの変換種別の対であり、文字情報記録部21には所定の変換ルールが記録されている。本実施例では、図8に示すような、漢字−かな、住所−郵便番号、住所−電話番号の相互の変換ルールを用いているが、他の変換ルールを用いても構わず、判定する項目種別により適宜変更可能である。また、本実施形態における隣接とは、レコードRにおいて完全に隣り合う場合だけでなく、所定範囲離れている場合も含んでいる。
次に、図面を用いて本発明による項目判定システムの第5実施形態を説明する。図9は本実施形態における機能ブロックであり、項目種別判定部15が、さらに、項目種別を予測する項目種別予測部15aおよび、予測結果判定部15bを備えている点において第2実施形態と異なっている。以下の説明では、第2実施形態と同様の機能部の説明は省略する。
次に、図面を用いて本発明による項目判定システムの第6実施形態を説明する。図13は本実施形態における機能ブロックであり、予測結果判定部15bに代えて文字列を所定の変換ルールに基づき変換する文字列変換部15cを備えている点において第5実施形態と異なっている。なお、本実施形態の文字情報記録部21には、図8の変換ルールが記録されている。
(1)上述の判定基準として正規表現を用いることも可能である。例えば、住所の判定基準として、“/.*[都道府県].*[市区郡].*/”を用いることができる。この例では、任意に文字列の後に“都道府県”のいずれかの文字があり、その後に任意の文字列があり、さらに“市区郡”のいずれかの文字と任意の文字列が後続する文字列を表している。このような正規表現を用いることにより、判定基準の表現に柔軟性が増し、好適である。なお、正規表現は、上述の実施形態の判定基準に代えてまたは共に用いても構わない。
11:リスト情報取得部
12:レコード抽出部
13:文字列分割部
14:文字情報取得部
15:項目種別判定部
16:統合情報生成部
21:文字情報記録部
22:判定基準記録部
Claims (4)
- レコードを構成する複数の文字列の各々の項目種別を判定する項目判定システムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得するレコード抽出部と、
前記レコードを各々の文字列に分割する文字列分割部と、
前記分割された文字列の文字情報を取得する文字情報取得部と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列を当該特定文字列に関連する関連文字列として特定すると共に、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定部と、を備えたことを特徴とする項目判定システム。 - 特定の項目種別に対応する文字情報と当該特定の項目種別に関連する関連項目種別に対応する文字情報とを関連付けて記録する判定基準記録部を備え、
前記項目種別判定部は、前記特定文字列の文字情報と関連文字列の文字情報に基づき前記判定基準記録部から前記特定の項目種別と前記関連項目種別とを検索し、当該検索結果に応じて当該特定文字列の項目種別と当該関連文字列の項目種別とを判定することを特徴とする請求項1記載の項目判定システム。 - 前記文字情報は、前記文字列を変換することにより得られる変換情報を含み、
前記項目種別判定部は、前記特定文字列と前記隣接文字列の前記変換情報とに基づき前記文字列と前記隣接文字列とが関連する文字列であると特定することを特徴とする請求項1記載の項目判定システム。 - レコードを構成する複数の文字列の各々の項目種別を判定する項目判定システムのための項目判定プログラムにおいて、
複数のレコードからなるリスト情報から前記レコードを取得する機能と、
前記レコードを各々の文字列に分割する機能と、
前記分割された文字列の文字情報を取得する機能と、
前記文字列から特定文字列を特定し、前記レコードにおいて当該特定文字列に隣接する文字列である隣接文字列を当該特定文字列に関連する関連文字列として特定すると共に、当該特定文字列の文字情報と当該関連文字列の文字情報とに基づき当該特定文字列と当該関連文字列の項目種別を判定する項目種別判定機能と、をコンピュータに実現させる項目判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008159419A JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008159419A JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4266240B1 JP4266240B1 (ja) | 2009-05-20 |
JP2010003000A true JP2010003000A (ja) | 2010-01-07 |
Family
ID=40785228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008159419A Active JP4266240B1 (ja) | 2008-06-18 | 2008-06-18 | 項目判定システムおよび項目判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4266240B1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011178075A (ja) * | 2010-03-02 | 2011-09-15 | Toppan Printing Co Ltd | 真贋判定装置及び真贋判定方法 |
JP6406653B1 (ja) * | 2017-10-20 | 2018-10-17 | 株式会社エスピック | 表認識処理装置 |
JP2019079488A (ja) * | 2018-05-24 | 2019-05-23 | 株式会社エスピック | 表認識処理装置 |
-
2008
- 2008-06-18 JP JP2008159419A patent/JP4266240B1/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011178075A (ja) * | 2010-03-02 | 2011-09-15 | Toppan Printing Co Ltd | 真贋判定装置及び真贋判定方法 |
JP6406653B1 (ja) * | 2017-10-20 | 2018-10-17 | 株式会社エスピック | 表認識処理装置 |
JP2019079488A (ja) * | 2018-05-24 | 2019-05-23 | 株式会社エスピック | 表認識処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4266240B1 (ja) | 2009-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9805025B2 (en) | Standard exact clause detection | |
US20060241934A1 (en) | Apparatus and method for translating Japanese into Chinese, and computer program product therefor | |
EP0844583A2 (en) | Method and apparatus for character recognition | |
JP6599219B2 (ja) | 読み付与装置、読み付与方法、およびプログラム | |
JP2006301446A (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
US11663408B1 (en) | OCR error correction | |
JP2014229091A (ja) | 文字入力用のプログラム | |
JP2008310772A (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
JP4266240B1 (ja) | 項目判定システムおよび項目判定プログラム | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
JP2007219620A (ja) | テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法 | |
JPH09244969A (ja) | パーソナル情報抽出方法及び装置 | |
US20200311059A1 (en) | Multi-layer word search option | |
JP2009009307A (ja) | 文書画像処理装置及びその方法 | |
JP2008204399A (ja) | 略語抽出方法、略語抽出装置およびプログラム | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
JP6807201B2 (ja) | 情報処理装置 | |
JPWO2009041661A1 (ja) | 情報処理装置、及びプログラム | |
WO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
WO2020203276A1 (ja) | 新語候補抽出装置、新語候補抽出方法、及びプログラム | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
US20240037129A1 (en) | Search device, search method, and recording medium | |
JP2000090193A (ja) | 文字認識装置および項目分類方法 | |
JPH08180064A (ja) | 文書検索方法及び文書ファイリング装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090212 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4266240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |