JPH09319758A - 文字列群検索装置 - Google Patents

文字列群検索装置

Info

Publication number
JPH09319758A
JPH09319758A JP8134832A JP13483296A JPH09319758A JP H09319758 A JPH09319758 A JP H09319758A JP 8134832 A JP8134832 A JP 8134832A JP 13483296 A JP13483296 A JP 13483296A JP H09319758 A JPH09319758 A JP H09319758A
Authority
JP
Japan
Prior art keywords
character string
search
text
record
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8134832A
Other languages
English (en)
Inventor
Koji Takeuchi
宏司 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP8134832A priority Critical patent/JPH09319758A/ja
Publication of JPH09319758A publication Critical patent/JPH09319758A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】ダンプリストなどのテキスト解析で、隣接行に
渡って存在する検索文字列を捜査して、検索文字列の位
置を見つけ、解析箇所の目じるしとする。 【解決手段】解析対象のテキストを格納するテキスト記
憶部5と、解析箇所を指す検索文字列を入力する入力部
2と、該検索文字列を記憶する検索文字列群記憶部3
と、検索文字列で順次先頭からテキストのレコード行を
捜査し、隣接レコード行に渡る文字列の一致箇所を見つ
ける文字列検索部4と、各部を制御する制御部7と、結
果を可視化出力する出力部6と、を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ダンプリスト解
析に用いる文字列群検索装置に関し、特に、テキストを
捜査して、テキストの隣接レコードに渡る同じ位置に所
要の検索文字列を見つける文字列検索装置に関する。
【0002】
【従来の技術】従来、ダンプリストなど英数字列からな
るテキストを順次に先頭から捜査し、所要の制御符号を
見つけて、ダンプリストの解析箇所の目じるしにする。
このような場合、従来の全文検索技術が適用できる。
【0003】特開昭63−257029号公報によれ
ば、全文検索対象のテキストや検索文字列を検索し易い
形式に変換して、検索文字列をテキスト中から捜索する
全文検索を高速化する方式を開示している。該公報は、
検索文字列がテキスト中に含まれているか否を検査する
方式であって、ダンプリスト解析のように、検索対象文
字列を隣接レコードの同じ箇所に見つけられるか否かな
ど、文字列の一致箇所に条件がついている検索には適さ
ない。
【0004】
【発明が解決しようとする課題】テキストの隣接レコー
ド行に渡り、指定位置にある文字列を捜査するダンプリ
スト解析に適用できる文字列検索が解決課題である。従
来の文字列群検索装置では、隣接するレコード行に対し
て、レコード行内の桁位置を関連付ける考慮がなされて
いない。文字列検索装置は、検索対象テキストのレコー
ド行を順次に先頭から検索文字列を捜査し、捜査結果に
より、さらに次のレコード行を捜査し、最終的に検索対
象テキスト内で該検索文字列に一致する箇所を捜査して
いた。ダンプリングリスト解析においては、制御符号を
示す特定の文字列を検索文字列として捜査し、解析場所
を見つけることがある。この特定の文字列が隣接するレ
コード行の同じ桁位置に分かれて存在する場合がある。
【0005】
【課題を解決するための手段】この発明の目的は、テキ
ストから指定の検索文字列を捜査する装置において、隣
接レコード行に渡る指定位置にある複数検索文字列を捜
査できる文字列検索装置にある。
【0006】そのため、この発明は、レコードで区分さ
れるテキストを格納するテキスト記憶部と、前記テキス
トの検索箇所を示す第1および第2の検索文字列を含む
文字列群を入力する入力部と、前記入力部から入力した
前記文字列群を格納する検索文字列群記憶部と、前記テ
キストのレコードを順次に先頭から捜査して、前記第1
の検索文字列が存在する箇所を有するレコードを見つ
け、前記レコードの次レコードの前記箇所と同じ位置に
前記第2の検索文字列があるか否かを捜査する文字列検
索部と、前記捜査の結果を可視化出力する出力部と、前
記検索文字列群記憶部から検索文字列を前記文字列検索
部に渡し、テキスト中に前記検索文字列があるか否かを
前記文字列検索部に捜査させ、捜査結果を出力部に出力
させる制御部と、を有することを特徴とする。
【0007】文字列検索部は、テキスト記憶部のテキス
トのレコード行を順次に先頭から捜査して検索文字列に
一致する箇所を制御部に通知する。制御部は、一致した
箇所のレコード行位置と該レコード行内の桁位置を一時
記憶したうえで、検索文字列群記憶部の中の次の検索文
字列が、該レコード行の次レコード行の同一桁位置の文
字列と一致するかを文字列検索部に捜査させる。この捜
査を検索文字列群記憶部の中の検索文字列が無くなるま
で繰り返す。所要の検索文字列が、隣接レコード行の同
一位置に見つけることによって、リスト解析する場所が
特定できる。
【0008】
【発明の実施の形態】次に、この発明について図面を参
照して説明する。
【0009】この発明の一実施例の構成を示す図1を参
照すると、文字列群検索装置1は、検索文字列群を入力
する入力部2と、該検索文字列群を格納する検索文字列
群記憶部3と、テキストを捜査して検索文字列がある箇
所を見つける文字列検索部4と、テキストを格納するテ
キスト記憶部5と、捜査結果を可視化出力する出力部6
と、検索文字列群記憶部3,文字列検索部4,出力部5
に対するデータ受け渡しを制御する制御7と、を有す
る。
【0010】制御部7は、検索文字列群記憶部3から検
索文字列を一つずつ取り出して文字列検索部4に対し、
テキストを捜査して該検索文字列に一致する箇所を見つ
ける捜査を指示する。制御部7は、検索文字列群記憶部
3の一番目の検索文字列で検索する場合、テキスト記憶
部5のテキストのレコード行を順次に先頭から捜査する
ように文字列検索部4に指示する。また、検索文字列群
記憶部4の中の2番目の検索文字列で検索する場合で、
かつテキスト記憶部5のテキスト中で1番目の検索文字
列に一致する箇所が既にあったとき、一致した箇所の桁
位置の直後から、2番目の検索文字列の捜査を指示す
る。文字列検索部4は、制御部7から指示された検索文
字列をテキスト記憶部5のテキストのレコード行を捜査
し、一致する文字列箇所のレコード行位置と桁位置を制
御部7に通知する。一致する箇所がテキストにないとき
は終了する。制御部7は、検索文字列群記憶部3の全て
の検索文字列でテキスト記憶部5のテキストのレコード
行を捜査して、一致箇所のレコード行位置と該桁位置と
を出力する。
【0011】次に、この実施例の動作について、ダンプ
リスト31のテキストと検索文字列34を例示する図3
を援用し、フローチャートの図2を参照して説明する。
【0012】図3に示すダンプリスト31のテキスト
は、ACOS−2における通信回線上を流れる伝送デー
タを16進数でダンプ出力したものであり、テキスト記
憶部5に格納されている。16進ダンプ形式は、各行を
レコードとしてレコード番号32で識別され、隣接する
3レコード行で一グループをなしている。各レコード行
は、先頭から桁番号33で桁位置が識別される。各グル
ープの1レコード行目は、元の伝送データの1バイトの
コード表示であり、2レコード行目は元の伝送データの
1バイトの上位4ビットの16進数字に変換した値、3
レコード行目は元の伝送データの1バイトの下位4ビッ
トの16進数字に変換した値となっている。ダンプリス
ト31によれば、特別なダンプリスト編集の仕方とし
て、伝送データの論理的なヘッダ部とデータの区切りを
カンマによって行っている。検索文字列群の例として、
図3に示す「 000」341と「,300」342二
つの検索文字列が、入力部2から入力されて検索文字列
群記憶部3に格納されている場合の捜査と検索の動作を
説明する。制御部7は、検索文字列群記憶部3から1番
目の検索文字列「 000」341を取り出し、文字列
検索部4にテキストのレコード行を捜査させて、検索文
字列「 000」341に一致する箇所を見つける検索
を指示する。まず、捜査開始レコードをレコード行の1
番目に設定し(ステップ11)、捜査開始桁を1桁目に
設定し(ステップ12)、検索文字列を1番目に設定す
る(ステップ13)。文字列検索部4は、テキスト記憶
部5に格納されているテキストの1番目レコード行の1
桁から捜査し、制御部3から指示された検索文字列「
000」341に一致する箇所を見つける(ステップ1
4)。一致する箇所が見つからないとき(ステップ14
のN)、レコード行を次レコード行に順次移し(ステッ
プ15)、テキストの終りまでレコード行の捜査を続行
する(ステップ16)。図2の例では、7番目のレコー
ド行の55桁目に検索文字列「 000」341と一致
する箇所を見つけて制御部3に通知する(ステップ14
のY)。制御部3は、一致箇所の桁番号を記憶し(ステ
ップ17)、一致箇所のレコード行番号を記憶し(ステ
ップ18)、該桁番号,該レコード行番号を一致箇所の
暫定位置として記憶する(ステップ19)。制御部7
は、文字列検索部4からの暫定位置通知により、検索文
字列群記憶部3から2番目の検索文字列「,300」3
42を取り出し(ステップ20)、該検索文字列がない
とき(ステップ21のY)、該暫定位置を検索結果とし
て終了する(ステップ22)。検索文字列「,300」
342は検索文字列群記憶部3の2番目の検索文字列で
あるので(ステップ21のN)、次のレコード行の同一
桁位置(8レコード目55桁)に移って(ステップ2
3)、テキストが終りのときは捜査を終了する(ステッ
プ24のY)、テキストが終りでないとき、検索文字列
が一致するかを文字列検索部4に指示する(ステップ2
4のN)。
【0013】文字列検索部4は、2番目の検索文字
列「,300」342が次のレコード行番号の同じ桁番
号の位置にあるかをテキスト記憶部5を参照して判断す
る。図2の例では一致する箇所を見つけて(ステップ2
5のY)、一致した旨を制御部3に通知し、終了する
(ステップ22)。一致箇所が見つからないとき(ステ
ップ25のN)、レコード行番号を移し(ステップ2
6)、捜査を続行する(ステップ12)。制御部7は、
検索文字列群記憶部3にある全ての検索文字列の捜査が
終了したと判断し、(ステップ21のY)、出力部6に
レコード行番号と桁番号の一致箇所35(図2の例では
7レコード目の55桁目)を通知して終了する(ステッ
プ22)。
【0014】
【発明の効果】以上説明したようにこの発明によれば、
隣接レコード行に渡る、同一桁位置にある特定文字の並
び(文字列)に意味を持つダンプリスト解析において、
文字列を容易に検索できる。
【0015】更にこの発明によれば、検索結果に対し、
任意のオフセットレコード数あるいはオフセット桁数を
設ければ、検索文字列に一致した箇所の位置をオフセッ
トレコード数あるいはオフセット桁数だけ遡って表示出
力し、一致箇所を有するテキストファイル中のレコード
の前後関係をわかりやすく表示することができる。
【図面の簡単な説明】
【図1】この発明の一実施例による文字列群検索装置の
構成を示す図である。
【図2】この実施例の動作の流れを示す図である。
【図3】捜査の対象となるダンプリストのテキストと検
索文字列群を例示する図である。
【符号の説明】
1 文字列群検索装置 2 入力部 3 検索文字列群記憶部 4 文字列検索部 5 テキスト記憶部 6 出力部 7 制御部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 レコードで区分されるテキストを格納す
    るテキスト記憶部と、 検索条件を示す第1および第2の検索文字列を含む検索
    文字列群を入力する入力部と、 前記入力部から入力した前記検索文字列群を格納する検
    索文字列群記憶部と、 前記テキストのレコードを順次に先頭から捜査して、前
    記第1の検索文字列が存在する箇所を有するレコードを
    見つけ、前記レコードの次レコードの前記箇所と同じ位
    置に前記第2の検索文字列があるか否かを捜査する文字
    列検索部と、 前記捜査の結果を可視化出力する出力部と、 前記検索文字列群記憶部から検索文字列を前記文字列検
    索部に渡し、テキスト中に前記検索文字列があるか否か
    を前記文字列検索部に捜査させ、捜索結果を出力部に出
    力させる制御部と、 を有することを特徴とする文字列検索装置。
JP8134832A 1996-05-29 1996-05-29 文字列群検索装置 Pending JPH09319758A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8134832A JPH09319758A (ja) 1996-05-29 1996-05-29 文字列群検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8134832A JPH09319758A (ja) 1996-05-29 1996-05-29 文字列群検索装置

Publications (1)

Publication Number Publication Date
JPH09319758A true JPH09319758A (ja) 1997-12-12

Family

ID=15137512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8134832A Pending JPH09319758A (ja) 1996-05-29 1996-05-29 文字列群検索装置

Country Status (1)

Country Link
JP (1) JPH09319758A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04293161A (ja) * 1991-03-20 1992-10-16 Hitachi Ltd 文書検索方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04293161A (ja) * 1991-03-20 1992-10-16 Hitachi Ltd 文書検索方法および装置

Similar Documents

Publication Publication Date Title
US5060143A (en) System for string searching including parallel comparison of candidate data block-by-block
JP2693914B2 (ja) 検索システム
JPH09319758A (ja) 文字列群検索装置
US6963865B2 (en) Method system and program product for data searching
JP2812218B2 (ja) データ検索装置およびデータ検索方法
JPH05135102A (ja) 文書検索方式
JPH0773187A (ja) 検索システム
JPH0652222A (ja) 情報検索処理装置
JPH06162096A (ja) レコード検索方法
JP3224917B2 (ja) 名標辞書作成装置
JP2835065B2 (ja) 文字列検索方法
JPH0612550B2 (ja) デ−タ検索方式
KR100210634B1 (ko) 윈도우모드를 위한 검색레코드 연결방법
JPS63257030A (ja) 文字列検索回路
JPH0423167A (ja) コマンド検索方式
JPS6373422A (ja) 情報検索装置
JP2773657B2 (ja) 文字列検索装置
JPH0452967A (ja) 集合ファイルに対する論理積演算処理方式
JPS6383833A (ja) 文字列検索方法
JPH0131229B2 (ja)
JPH08115329A (ja) 文字列検索装置及び方法
JPH05120278A (ja) 文字列連結方法
JPH04337867A (ja) データベース検索システム
JPH07319906A (ja) 同義語検索処理方式および文字列検索システム
JPH0652227A (ja) 索引ファイル自動範囲設定検索表示装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981020