JP2006099346A - 情報変換装置及びプログラム - Google Patents
情報変換装置及びプログラム Download PDFInfo
- Publication number
- JP2006099346A JP2006099346A JP2004283740A JP2004283740A JP2006099346A JP 2006099346 A JP2006099346 A JP 2006099346A JP 2004283740 A JP2004283740 A JP 2004283740A JP 2004283740 A JP2004283740 A JP 2004283740A JP 2006099346 A JP2006099346 A JP 2006099346A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- word
- words
- dictionary
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 160
- 238000012545 processing Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 description 84
- 238000011161 development Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【解決手段】名称辞書に登録された情報では入力された文字列が表す顧客名称を判断できず、オペレータによって顧客名称が判断された場合に、入力文字列と判断された顧客名称の文字列を比較し、両文字列の不一致単語数が複数の場合には、顧客名称の文字列における不一致単語を正論理インデックスセットとして、入力文字列における不一致単語を副論理インデックスセットとして補助辞書に登録する((D)参照)。補助辞書に副論理インデックスセットとして登録されている各単語が次回以降に入力された文字列に含まれている場合には、入力文字列中の各単語を対応する正論理インデックスセットとして登録されている各単語に置換した文字列を生成し、生成した文字列も用いて入力文字列が表す顧客名称を判断する。
【選択図】図2
Description
12 コンピュータ
16 ディスプレイ
18 マウス
20 キーボード
22 HDD
28 ネットワーク
30 コンピュータ
Claims (8)
- 所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置であって、
識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、
補助辞書を記憶する第2記憶手段と、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段と、
前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が1個、かつ前記入力文字列における前記対象文字列との不一致単語数が1個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段と、
を備え、
前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断することを特徴とする情報変換装置。 - 文字列を構成する個々の単語に関する情報を登録するための基本語辞書を記憶する第3記憶手段を備え、
前記単語登録手段は、前記対象文字列における前記入力文字列との不一致単語数が1個、かつ前記入力文字列における前記対象文字列との不一致単語数が1個の場合は、前記入力文字列における前記対象文字列との不一致単語を、前記対象文字列における前記入力文字列との不一致単語の同義語として前記基本語辞書に登録し、
前記変換手段による、前記入力文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせの検索において、前記基本語辞書に第1の単語の同義語として登録されている第2の単語を含む入力文字列は、該入力文字列における前記第2の単語を前記第1の単語に置き換えた文字列と同一として扱われることを特徴とする請求項1記載の情報変換装置。 - 前記単語登録手段は、前記入力文字列における前記対象文字列との不一致単語を、前記対象文字列における前記入力文字列との不一致単語の同義語として前記基本語辞書に登録する際に、前記入力文字列における前記対象文字列との不一致単語が、特定の副単語群を構成する単語として前記補助辞書に登録されており、かつ前記特定の副単語群に対応する特定の主単語群に、前記対象文字列における前記入力文字列との不一致単語が含まれているか否か判定し、判定が肯定された場合は前記入力文字列における前記対象文字列との不一致単語及び前記対象文字列における前記入力文字列との不一致単語を前記補助辞書から削除することを特徴とする請求項2記載の情報変換装置。
- 前記単語登録手段は、前記主単語群及び前記副単語群を前記判断された対象に付与された識別情報と対応付けて前記補助辞書に登録し、
前記変換手段は、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合に、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、前記特定の副単語群及び前記特定の主単語群と同一の特定識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせが、前記生成した文字列を構成する単語の組合わせに含まれているか否か判定し、判定が肯定された場合に前記入力文字列を前記特定識別情報へ変換することを特徴とする請求項1記載の情報変換装置。 - 不要単語を登録するための不要単語辞書を記憶する第4記憶手段を更に備え、
前記単語登録手段は、前記変換手段によって判断された対象を表す対象文字列を入力された文字列を比較し、前記対象文字列には前記入力文字列との不一致単語が存在しておらず、かつ前記入力文字列には前記対象文字列との不一致単語が存在していた場合に、前記入力文字列における前記対象文字列との不一致単語を、前記判断された対象に付与された特定識別情報と対応付け不要単語として前記不要単語辞書に登録すると共に、前記入力文字列における前記対象文字列との不一致単語が、前記特定識別情報に対応する特定の副単語群を構成する単語として前記補助辞書に登録されているか否か判定し、判定が肯定された場合は前記入力文字列における前記対象文字列との不一致単語を前記補助辞書から削除することを特徴とする請求項4記載の情報変換装置。 - 前記単語登録手段は、前記補助辞書からの単語の削除を行うことで、特定の副単語群を構成する単語の数が1になり、かつ前記特定の副単語群に対応する特定の主単語群を構成する単語の数が1になるか否か判定し、判定が肯定された場合は、前記特定の副単語群を構成する単一の単語を、前記特定の副単語群に対応する特定の主単語群を構成する単一の単語の同義語として前記基本語辞書に登録すると共に、前記特定の副単語群及び前記特定の副単語に対応する特定の主単語群を前記補助辞書から削除することを特徴とする請求項3又は請求項5記載の情報変換装置。
- 入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックスが対応付られけて予め各々登録された基本語辞書を記憶する第3記憶手段と、
入力された文字列を構成する個々の単語に相当する文字列をキーにして前記基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換する単語変換手段と、
を更に備え、
前記基本語辞書以外の各辞書には、各単語が各単語に対応する前記論理インデックスとして登録されており、
前記変換手段及び前記不要単語登録手段は、前記入力された文字列として、前記入力された文字列が前記単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことを特徴とする請求項1乃至請求項6の何れか1項記載の情報変換装置。 - コンピュータを、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置として機能させるための情報変換プログラムであって、
前記コンピュータは、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、補助辞書を記憶する第2記憶手段を備え、
前記コンピュータを、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段、
及び、前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が1個、かつ前記入力文字列における前記対象文字列との不一致単語数が1個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段
として機能させると共に、
前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断する
ことを特徴とする情報変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004283740A JP3972310B2 (ja) | 2004-09-29 | 2004-09-29 | 情報変換装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004283740A JP3972310B2 (ja) | 2004-09-29 | 2004-09-29 | 情報変換装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006099346A true JP2006099346A (ja) | 2006-04-13 |
JP3972310B2 JP3972310B2 (ja) | 2007-09-05 |
Family
ID=36239106
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004283740A Active JP3972310B2 (ja) | 2004-09-29 | 2004-09-29 | 情報変換装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3972310B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019204207A (ja) * | 2018-05-22 | 2019-11-28 | 日鉄ソリューションズ株式会社 | 情報処理システム、情報処理方法及びプログラム |
JP2020035133A (ja) * | 2018-08-29 | 2020-03-05 | 沖電気工業株式会社 | 入金判定システム、入金判定装置、入金判定方法、および、プログラム |
-
2004
- 2004-09-29 JP JP2004283740A patent/JP3972310B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019204207A (ja) * | 2018-05-22 | 2019-11-28 | 日鉄ソリューションズ株式会社 | 情報処理システム、情報処理方法及びプログラム |
JP7107743B2 (ja) | 2018-05-22 | 2022-07-27 | 日鉄ソリューションズ株式会社 | 情報処理システム、情報処理方法及びプログラム |
JP2020035133A (ja) * | 2018-08-29 | 2020-03-05 | 沖電気工業株式会社 | 入金判定システム、入金判定装置、入金判定方法、および、プログラム |
JP7183629B2 (ja) | 2018-08-29 | 2022-12-06 | 沖電気工業株式会社 | 入金判定システム、入金判定装置、入金判定方法、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3972310B2 (ja) | 2007-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8055498B2 (en) | Systems and methods for building an electronic dictionary of multi-word names and for performing fuzzy searches in the dictionary | |
JP5603250B2 (ja) | 近似文字列マッチングのためのアーカイブ管理法 | |
US8756207B2 (en) | Systems and methods for identifying potential duplicate entries in a database | |
EP3435256B1 (en) | Optimal sort key compression and index rebuilding | |
JP2014235454A (ja) | 文字列探索方法、文字列探索装置および文字列探索プログラム | |
JPH09179872A (ja) | 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置 | |
WO2024114655A1 (zh) | 一种规则表达式匹配方法、装置及计算机可读存储介质 | |
JP6476886B2 (ja) | キーワード抽出システム、キーワード抽出方法、及び、コンピュータ・プログラム | |
CN116383412B (zh) | 基于知识图谱的功能点扩增方法和系统 | |
JP3972310B2 (ja) | 情報変換装置及びプログラム | |
JP2007535009A (ja) | リレーショナルデータベースの超集合のためのデータ構造と管理システム | |
WO2023087702A1 (zh) | 一种表格证件影像件的文本识别方法及计算设备 | |
CN114064820B (zh) | 一种基于混合架构的表格语义查询粗排方法 | |
US20180018366A1 (en) | Records based on bit-shifting | |
CN115796176A (zh) | 分词处理方法、计算机设备、存储介质和计算机程序产品 | |
CN113221558B (zh) | 一种快递地址纠错方法、装置、存储介质及电子设备 | |
US6469643B1 (en) | Information processing system | |
JP4076533B2 (ja) | 情報変換装置及びプログラム | |
JP3972309B2 (ja) | 情報変換装置及びプログラム | |
JP2003006231A (ja) | コンピュータ文字情報のインデックス作成及び検索を行なうための方法及びシステム | |
JP4139805B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
Bakar et al. | An evaluation of retrieval effectiveness using spelling‐correction and string‐similarity matching methods on Malay texts | |
JP3804609B2 (ja) | 検索チューニング方法および情報検索システム | |
JP2009093405A (ja) | データ検索のためのシステム、方法及びコンピュータプログラム | |
JP2016095723A (ja) | 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3972310 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100622 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130622 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |