JPH08314958A - 議会議事録検索システムにおけるデータ登録方法 - Google Patents

議会議事録検索システムにおけるデータ登録方法

Info

Publication number
JPH08314958A
JPH08314958A JP7119529A JP11952995A JPH08314958A JP H08314958 A JPH08314958 A JP H08314958A JP 7119529 A JP7119529 A JP 7119529A JP 11952995 A JP11952995 A JP 11952995A JP H08314958 A JPH08314958 A JP H08314958A
Authority
JP
Japan
Prior art keywords
data
file
text
full
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7119529A
Other languages
English (en)
Inventor
Takeshi Matsushima
剛 松島
Hidekazu Hara
英一 原
Yumi Nogami
由美 野上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7119529A priority Critical patent/JPH08314958A/ja
Publication of JPH08314958A publication Critical patent/JPH08314958A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】議会議事録検索システムにおいて、書誌項目及
び本文の全文検索を実現するために、規約に基づいたデ
ータファイル、及び定義ファイルを作成するだけで、デ
ータチェック及び区切りコードを付与しながら編集し、
全文検索用データベースへ一括登録する事が可能なデー
タ登録方法。 【構成】データ登録方法は、主に図1のAPP定義ファ
イル5、データ一括変換処理部6、標準テキストファイ
ル7、標準テキストヘッダファイル8、データ一括登録
処理部9で構成され、規約に基づいたデータファイル及
び定義ファイルから、データのチェック及び区切りコー
ド付与をしながら文書編集し、全文検索用データベース
へ一括登録する。 【効果】本発明により、規約に基づいたデータファイル
及び定義ファイルを作成するだけで、議会議事録検索の
ための全文検索用データベースへ登録できるため、デー
タ作成及びデータ登録作業の効率向上が図れる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、議会議事録における全
文検索システムのデータ入力装置のデータ登録方法に係
り、特に項目間に必要な区切りコードの付与、及び文書
の編集の場合に好適なデータ登録方法に関する。
【0002】
【従来の技術】従来の全文検索システムの例として、特
開平04−274557号公報に記載されているもの等
がある。このシステムは、登録する際に文書の本文デー
タの他に、繰り返し現れる単語の重複を排除して作成さ
れる圧縮データの凝縮本文、及び凝縮本文中に現れる文
字の重複を排除して作成される圧縮データの文字成分表
を作成する。検索の際には、文字・単語・文書の順に検
索の対象範囲を段階的に広げていくことで、検索にかか
る時間を短縮しようとしている。これに対し議会議事録
の全文検索の場合は、本文データの全文検索のみなら
ず、会議名や日付などの書誌項目のみで検索したり、本
文データと書誌項目の両方を検索条件として検索する事
が多い。この際に、前記従来技術は複数項目を持つデー
タを登録する方法について配慮されておらず、複数項目
の区切りを識別するための特殊なコードを別途入力する
手間がかかってしまうという問題があった。
【0003】
【発明が解決しようとする課題】議会議事録に対する書
誌項目及び本文の全文検索を実現するために、データ登
録の際に各項目間の区切りコードを付与することにより
項目の区別を明確にする必要があるが、区切りコードが
特殊な文字コードのため入力に手間と労力がかかる。ま
た、各文書を切り分ける文書IDを管理するためのファ
イルを作成する必要があるため、複数文書の一括登録が
非常に難解なものとなっていた。
【0004】本発明の目的は、このような問題点を解決
するため、規約に基づいたファイルを作成することによ
り、議会議事録の全文検索用データベースへ容易に登録
できるデータ登録方法を提供することにある。
【0005】
【課題を解決するための手段】項目名と書誌データを記
述し一件分の記述が終わったら一レコード目に改行コー
ドを入力するなどの規約に基づいた書誌データファイ
ル、及び1件毎にファイル名がユニークな本文データフ
ァイルを設ける。このファイルを用いて、全文検索用デ
ータベースの項目情報や項目長、及び各項目への入力可
能文字種などの全文検索用データベースの定義情報を格
納したAPP定義ファイルに基づいて、書誌データファ
イル内の項目情報及び各項目の書誌データの入力文字種
のチェックを行う。更に、各項目間に必要な区切りコー
ドを付与し、全文検索用データベースへの一括登録処理
を行うために標準テキストファイル及び標準テキストヘ
ッダファイルを作成する手段を設ける。次に、全文検索
用データベースへ標準テキストファイル及び標準テキス
トヘッダファイルから一括登録する処理コマンドを実行
する手段を設ける。これら2つの手段を有することによ
り、規約に基づいたファイル群を作成することで、全文
検索用データベースへ複数文書を一括登録することを達
成している。
【0006】
【作用】規約に基づいたデータファイル及びAPP定義
ファイルを用いて、基準テキストファイル及び基準テキ
ストヘッダファイルを作成する手段は、項目間の区切り
コードの付与及び文書として編集する働きをし、標準テ
キストファイル及び標準テキストヘッダファイルは全文
検索用データベースへ複数文書を一括して登録できるよ
う整理する働きをし、標準テキストファイル及び標準テ
キストヘッダファイルから一括登録する処理コマンドの
作成及び実施手段は、登録者が一括登録処理コマンドを
知らなくても、一括登録処理が行える働きをする。
【0007】これにより、規約に基づいたデータファイ
ル及び定義ファイルからデータ登録が行えるので、上記
従来技術の課題を解決できる。
【0008】
【実施例】以下、本発明の一実施例を図面により詳細に
説明する。
【0009】図1は本発明に係るデータ入力装置のブロ
ック図、図2は各文書の書誌項目が格納されている書誌
データファイルのレコード形式、図3は議事録本文が格
納されている本文データファイル群のファイル形式及び
レコード形式、図4は全文検索用データベースの項目情
報などの定義情報を格納しているAPP定義ファイルの
レコード形式、図5は全文検索用データベースへ一括し
て登録するための文書を格納した標準テキストファイル
のファイル形式、図6は全文検索用データベースへ一括
して登録するための文書ID及び文書長を格納した標準
テキストヘッダファイル、図7はそれらの動作フローチ
ャートである。
【0010】図1において、1はキーボード、2はディ
スプレイ、3は書誌データファイル、4は本文データフ
ァイル群、5はAPP定義ファイル、6はデータ一括変
換処理部、7は標準テキストファイル、8は標準テキス
トヘッダファイル、9はデータ一括登録処理部、10は
全文検索用データベースである。
【0011】図2において、21は議会議事録文書一件
分の書誌項目、22は複数件数の書誌項目の境界を示す
改行コードである。
【0012】図3において、31は議会議事録文書一件
分の本文の質問部分、32は議会議事録文書一件分の本
文の答弁部分であり、31と32で議会議事録文書一件
分の本文となっている。図2及び図3において、図2の
21における最初の一件分の情報が、図3の31の文書
1.001及び32の文書1.002に対応し、図2の
次の一件分の情報が、図3の31の文書2.001及び
32の文書2.002に対応している。
【0013】図4において、41は全文検索用データベ
ースの書誌項目及び本文の分類及び項目名である。分類
は01が親となり、02及び03となる毎に子・孫の関
係となる。42は項目に入力可能な文字種の属性を指定
する入力文字属性情報である。定例会名の入力文字属性
情報は、「WideCheck」となっており、全角文
字のみ入力可能な文字であることを意味する。
【0014】図5において、51は分類01の区切りコ
ード、52は分類02の区切りコード、53は議会議事
録一件分の書誌情報及び本文である。
【0015】図6において、61は一件分の文書ID、
62は61の文書の文書長である。以下、本実施例の動
作について説明する。まず図1を用いてデータ入力装置
の動作概要を説明する。
【0016】キーボード1より入力されたデータ登録要
求に対し、データ一括変換処理部6はAPP定義ファイ
ル5に格納されている全文検索用データベース10の項
目名や入力可能な文字種の属性などの定義情報を読み込
み、各項目の定義情報を記憶する。書誌データファイル
3及び本文データファイル群4から、文書1件毎にデー
タ内容のチェック及び項目間の区切りコードを付与しな
がら標準テキストファイル7へ格納する。キーボード1
から入力された先頭の文書IDから自動採番した文書I
D及び文書長を標準テキストヘッダファイル8へ格納し
ている。
【0017】このようにして作成された標準テキストフ
ァイル7及び標準テキストヘッダファイル8は、データ
一括登録処理部9によって自動作成された処理コマンド
によって、全文検索用データベース10へ登録される。
【0018】次に本発明に係るデータ一括変換プログラ
ム及びデータ一括登録処理プログラムを用いたデータ登
録動作について、図1、図2、図3、図4、図5、図6
及び図7を用いて説明する。
【0019】書誌データファイル3及び本文データファ
イル群4の会議議事録データは、キーボード1より入力
されたデータ登録要求に対応するデータ一括変換処理部
6、及び全文検索用データベース10の項目情報などの
定義情報を格納したAPP定義ファイル5に制御されて
いる。
【0020】APP定義ファイル5に格納されている全
文検索用データベース10の項目情報や、各項目の項目
長及び入力可能文字種などの定義情報を読み込み、各項
目の各種定義情報を記憶する(101)。図4の41が
各項目における項目名及び項目長、42が入力可能文字
種の情報である。例えば、項目名「定例会名」は、項目
長30バイト、入力可能文字種は全角文字のみといった
情報となる。書誌データファイル3及び本文データファ
イル群4の終わりまで一件分の書誌項目データ及び本文
データを読み込み(102)、書誌データ及び本文デー
タと図4の書誌項目及び本文の項目情報41及び入力文
字属性情報42とを照合する。図2の21において、定
例会名の情報である「平成3年2月定例会」は、項目長
が18バイト、入力文字種は全て全角文字であるため、
照合の結果、定義に合った項目長、文字列であることが
わかる。定義に合った場合には(103)書誌項目及び
本文の項目情報41の分類に従い、区切りコード及び書
誌もしくは本文のデータを図5の議会議事録一件分の書
誌情報及び本文53へ格納する(104)。例えば図4
の41において、項目名「定例会名」は、分類01のた
め、図5の51である分類01の区切りコードを付与し
ている。104で格納した文書の文書長をバッファへ加
算する(105)。これを図2の議会議事録文書一件分
の書誌項目21、及び図3の議会議事録文書一件分の本
文31、32が終わるまで繰り返す。一件分照合が終わ
ったら(106)、キーボード1より入力された文書I
Dに基づいて、図6の一件分の文書ID61を格納し、
一件分の文書の文書長を格納したバッファを、図6の6
1の文書の文書長62へ格納する(107)。例えば、
キーボード1に入力された文書IDが「101」の場
合、図6の61の1レコード目は「101」となる。そ
の後次の文書を読み込むため、文書IDを加算し文書の
文書長を格納するためのバッファをクリアする(10
8)。先程の例の場合、図6の61の2レコード目は
「102」となる。書誌データファイル3及び本文デー
タファイル群4の終わりまで処理を行った後、標準テキ
ストファイル7及び標準テキストヘッダファイル8を全
文検索用データベースへ登録するため、データ一括登録
処理コマンドを実行する(109)。
【0021】以上述べた如き方法を用いることにより、
規約に基づいたファイル群を作成することで、全文検索
用データベースへ複数文書を一括登録を容易に実現して
いるため、データ作成及びデータ登録作業の効率向上が
図れる。
【0022】
【発明の効果】議会議事録の書誌項目及び本文を作成す
る際、規約に基づいた書誌データファイル、本文データ
ファイル群及び全文検索用データベースの項目情報等の
定義情報を格納したAPP定義ファイルを作成すること
で、議会議事録の全文検索用データベースへ容易に登録
できるため、データ作成及びデータ登録作業の効率向上
が図れる。
【図面の簡単な説明】
【図1】本発明に係るデータ入力装置のブロック図であ
る。
【図2】各文書の書誌項目が格納されている書誌データ
ファイルのレコード形式である。
【図3】議事録本文が格納されている本文データファイ
ル群のファイル形式及びレコード形式である。
【図4】全文検索用データベースの項目情報などの定義
情報を格納しているAPP定義ファイルのレコード形式
である。
【図5】全文検索用データベースへ一括して登録するた
めの文書を格納した標準テキストファイルのファイル形
式である。
【図6】全文検索用データベースへ一括して登録するた
めの文書ID及び文書長を格納した標準テキストヘッダ
ファイルである。
【図7】それらの動作フローチャートである。
【符号の説明】
1…キーボード、 2…ディスプレイ、 3…
書誌データファイル、4…本文データファイル群、5…
APP定義ファイル、6…データ一括変換処理部、7…
標準テキストファイル、8…標準テキストヘッダファイ
ル、9…データ一括登録処理部、 10…全文検索
用データベース。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】データ入力装置において、議会議事録の書
    誌項目及び本文の全文検索を行う場合、規約に基づいた
    データファイルについて、項目情報を格納している定義
    ファイルに従ってデータチェックを行い、各項目間に全
    文検索に必要な区切りコードを付与しながら編集し、全
    文検索用データベース登録用ファイルを作成する手段、
    及び全文検索用データベースへ登録する処理コマンドを
    作成し実施する手段を有し、書誌項目と本文との併用し
    た全文検索のためのデータ登録方法。
JP7119529A 1995-05-18 1995-05-18 議会議事録検索システムにおけるデータ登録方法 Pending JPH08314958A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7119529A JPH08314958A (ja) 1995-05-18 1995-05-18 議会議事録検索システムにおけるデータ登録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7119529A JPH08314958A (ja) 1995-05-18 1995-05-18 議会議事録検索システムにおけるデータ登録方法

Publications (1)

Publication Number Publication Date
JPH08314958A true JPH08314958A (ja) 1996-11-29

Family

ID=14763548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7119529A Pending JPH08314958A (ja) 1995-05-18 1995-05-18 議会議事録検索システムにおけるデータ登録方法

Country Status (1)

Country Link
JP (1) JPH08314958A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295218A (ja) * 2006-04-25 2007-11-08 Nippon Hoso Kyokai <Nhk> ノンリニア編集装置およびそのプログラム
CN102750608A (zh) * 2012-05-22 2012-10-24 山西优府信息技术开发有限公司 批量注册系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295218A (ja) * 2006-04-25 2007-11-08 Nippon Hoso Kyokai <Nhk> ノンリニア編集装置およびそのプログラム
CN102750608A (zh) * 2012-05-22 2012-10-24 山西优府信息技术开发有限公司 批量注册系统

Similar Documents

Publication Publication Date Title
JP2896634B2 (ja) 全文登録語検索装置および全文登録語検索方法
US5832476A (en) Document searching method using forward and backward citation tables
US6853992B2 (en) Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents
US5983171A (en) Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program
US6377946B1 (en) Document search method and apparatus and portable medium used therefor
JPH08190542A (ja) 文書データベース管理装置及び方法
US7401071B2 (en) Structured data retrieval apparatus, method, and computer readable medium
JP2004220176A (ja) データベース検索システム、その検索方法及び検索に用いられるデータファイルの作成方法並びにデータファイルを格納した記録媒体
JPH06301721A (ja) 全文デ−タベ−ス検索方法
JPH08314958A (ja) 議会議事録検索システムにおけるデータ登録方法
JP3253657B2 (ja) 文書検索方法
JP4255538B2 (ja) 構造化文書蓄積検索装置
JP2003288365A (ja) 付加情報管理方法及び付加情報管理システム
JP3239845B2 (ja) 全文検索装置および方法
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
KR100709379B1 (ko) 메타파일을 이용한 문서양식 제작방법
JP3448922B2 (ja) 電子文書記憶装置
JPH09259132A (ja) 情報登録検索装置及びその方法
JPH0635971A (ja) 文書検索装置
JPH01286020A (ja) プログラム検索方式
JPH04211868A (ja) Cd―romデータの検索用キーワードの作成方法
JPS60247756A (ja) デ−タベ−ス装置
JPH08287083A (ja) 辞書未登録語展開方法及び装置
CN117370527A (zh) 使用ChatGPT构建交通筑行业标准知识库的方法和系统
JPH06119331A (ja) 構造化文書の文書部品管理装置