JP7206415B2 - 日報データ整形装置 - Google Patents

日報データ整形装置 Download PDF

Info

Publication number
JP7206415B2
JP7206415B2 JP2021554828A JP2021554828A JP7206415B2 JP 7206415 B2 JP7206415 B2 JP 7206415B2 JP 2021554828 A JP2021554828 A JP 2021554828A JP 2021554828 A JP2021554828 A JP 2021554828A JP 7206415 B2 JP7206415 B2 JP 7206415B2
Authority
JP
Japan
Prior art keywords
daily report
item
cells
cell
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021554828A
Other languages
English (en)
Other versions
JPWO2021090567A1 (ja
JPWO2021090567A5 (ja
Inventor
圭一 庄司
嘉人 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MITSUBISHI ELECTRIC BUILDING SOLUTIONS CORPORATION
Original Assignee
MITSUBISHI ELECTRIC BUILDING SOLUTIONS CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MITSUBISHI ELECTRIC BUILDING SOLUTIONS CORPORATION filed Critical MITSUBISHI ELECTRIC BUILDING SOLUTIONS CORPORATION
Publication of JPWO2021090567A1 publication Critical patent/JPWO2021090567A1/ja
Publication of JPWO2021090567A5 publication Critical patent/JPWO2021090567A5/ja
Application granted granted Critical
Publication of JP7206415B2 publication Critical patent/JP7206415B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Description

本発明は、日報データの整形装置に関する。
ビルのオーナー等から委託され、当該ビルの設備保守や保安を請け負う、いわゆるビルメンテナンス事業では、オーナー等の委託者への報告書として日報が作成される。
このような日報は、例えばコンピュータ上に電子データとして作成される。例えばメンテナンスを行う現場作業者が保有するコンピュータには、日報のフォームデータが保存される。現場作業者はフォームデータに示された日時や作業内容等の項目に従って必要事項を入力する。
例えば図13に例示されるように、日報フォーム100A、100Bは、1レコード分の書式が、入力のマス目であるセルが複数行及び複数列に及ぶ、ラベル形式となっている。このようなラベル形式のデータが、1レコード分のデータが項目別に一行に配列され複数レコードが列状に並べられた、リスト形式に纏められることで、メンテナンス作業の統計的な傾向(例えば、問い合わせの頻繁な時間帯等)を求めることが出来る。
このようなデータの加工について、例えば特許文献1では、データを収集するデータ収集機能と、収集したデータをインデックス化するインデックス化機能と、インデックス化したデータからデータ検索又はフィルタリングするデータ検索・フィルタリング機能と、データを活用するデータ活用機能と、を備えた情報共有・活用システムが開示される。
また特許文献2では、手書き原稿上の複数の項目それぞれを対象項目として、対象項目に対応する領域画像をスキャン画像から抽出する第1抽出処理と、領域画像から文字列を抽出する第2抽出処理と、対象項目に対応する特徴データを読み出す第1読出処理と、抽出した文字列の特徴と特徴データで示される特徴との一致度を算出する第1算出処理と、一致度が閾値未満だと判断したことに応じて、対象項目を示す誤項目情報を記憶させる記憶処理とを実行する情報処理装置が開示される。
また特許文献3では、クライアント装置から表示要求された電子帳票の形式を規定するフォームデータに基づいて電子帳票を構成する縦線及び横線を検出し、検出した縦線及び横線に基づいて電子帳票を構成する矩形を検出し、検出した矩形の中から、当該矩形内にフォーム文字を含む項目矩形を抽出し、クライアント装置から所定のフォーム文字が指定された場合に、先に検出された矩形であって、当該所定のフォーム文字を含む所定の項目矩形に対して所定方向に隣接する矩形内に含まれる帳票実データを検索する電子帳票サーバ装置が開示される。
特開2012-215992号公報 特開2018-186411号公報 特開2007-179203号公報
ところで、例えば図13の日報フォーム100A,100Bのように、ビル110A,110Bごとに日報のフォーム(書式)が異なる場合がある。例えばオーナーごとに注視するポイントが異なる場合や、自由記述欄を増やす等の現場作業者の判断によって、日報のフォームがビル間で異なる場合がある。
このような場合に、例えば問合せ電話の多い時間帯をビル間で比較する等、複数のビル間の統計的な傾向を比較するときに、上述のように各ビルで日報のフォームにばらつきがあるため、これらを統一したリスト形式のデータに変換することが困難となる。
そこで本発明は、書式の異なるラベル形式の複数の日報データを、リスト形式に纏めることの可能な、日報データ整形装置を提供することを目的とする。
本発明に係る日報データ整形装置は、複数の行及び列に亘って項目セル及び入力セルが設けられたラベル形式の日報データを整形する。日報データ整形装置は、抽出項目文字記憶部、抽出項目探索部、候補セル設定部、属性判定部、及びリスト作成部を備える。抽出項目文字記憶部には、日報項目の文字である抽出項目文字及び日報項目の属性が、識別記号別に登録される。抽出項目探索部は、複数のレコードを含む日報データのうち、一つのレコード内の、所定の抽出項目文字またはその類語を含むセルである抽出項目セルを探索する。候補セル設定部は、探索された抽出項目セルの周囲のセルを候補セルに設定する。属性判定部は、候補セルの中から、所定の抽出項目文字に対応する日報項目の属性に適合する文字が入力された適合セルを探索する。リスト作成部は、所定の抽出項目文字と適合セル内の文字とを関連付ける。
上記発明によれば、抽出項目文字と、同文字に対応した属性の文字とを関連付けて日報データから抽出可能となり、日報データの書式に関係なく、上記関連付けに基づいたリストの形成が可能となる。
また上記発明において、候補セル設定部は、探索された抽出項目セルの周囲のセルに対して、所定の抽出項目文字とは異なる識別記号が付与された抽出項目文字またはその類語が含まれるセルを除外して、候補セルを設定してもよい。
上記発明によれば、抽出項目セルに関連付けられる文字として、日報項目の文字が抽出されることが避けられる。
また上記発明において、複数のレコードを含む日報データのうち、それぞれのレコードに付与された識別記号に基づいて、単一のレコードの境界を求める、探索範囲決定部を備えてもよい。
上記発明によれば、単一のレコードの境界を容易に求めることが出来る。
また上記発明において、所定の抽出項目文字と関連付けられた、それぞれのレコードから抽出された適合セル内の文字を、日報リスト内に一列に並べる日報リスト作成部を備えてもよい。
上記発明によれば、各レコードの適合セル内の文字が抽出項目別に一列に並べられた日報リストの作成が可能となる。
また上記発明において、抽出項目文字記憶部には、抽出項目セルの周囲のセルのうち、優先セルの位置が記憶されてもよい。この場合において、適合セルが複数探索されたときに、リスト作成部は、優先セルの位置に対応する適合セルの文字と、所定の抽出項目文字とを関連付ける。
上記発明によれば、項目の属性に加えて、抽出項目文字が入力されたセルとの相対位置に基づいて、適合セルの選択が行われる。したがって、日報セルの書式に応じた、適合セルの絞り込みが可能となる。
また上記発明において、リスト作成部は、適合セルが複数探索されたときであって、そのいずれのセルの位置も優先セルの位置に対応しないときに、複数の適合セルの文字と所定の抽出項目文字とを関連付けてもよい。
上記発明によれば、文字数適合セルの文字列への、日報リストデータへの反映漏れを防ぐことが出来る。
本発明によれば、書式の異なるラベル形式の複数の日報データを、リスト形式に纏めることが可能となる。
本実施形態に係る日報整形装置を含む、ビル運営管理システムを例示する全体構成図である。 本実施形態に係る日報整形装置の機能ブロックを例示する図である。 紙媒体の日報を例示する図である。 ラベル形式の日報データ(日報ラベルデータ)を例示する図である。 リスト形式の日報データ(日報リストデータ)を例示する図である。 抽出項目文字記憶部に記憶されるリスト(抽出設定リスト)を例示する図である。 本実施形態に係る日報整形プロセスを説明するフローチャート(1/2)である。 本実施形態に係る日報整形プロセスを説明するフローチャート(2/2)である。 レコードの境界を求めるステップ(S16)を説明する図である。 抽出項目セルの探索ステップ(S20)を説明する図である。 候補セルの設定ステップ(S22)を説明する図である。 候補セルから、他の抽出項目セルを除外するステップ(S24)を説明する図である。 ビルごとの日報のフォーム(書式)を例示する図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1には、本発明に係る日報整形装置を含む、ビル運営管理システムの一実施形態の全体構成図が例示される。このビル運営管理システムでは、複数のビルのデータが利用される。ビル運営管理システムは、複数の中央管理装置10A,10Bと、管理サーバ20を含んで構成される。
中央管理装置10A,10Bは、それぞれビルに設置される。各ビルの保守管理及び保安等に関するビル運営管理データが、中央管理装置10A,10Bに記憶される。中央管理装置10A,10Bは、例えばコンピュータから構成される。また中央管理装置10A,10Bは、図1に例示されるような、管理サーバ20と同様のハードウェア構成を備えていてよい。
中央管理装置10A,10Bには、コンピュータ12A,12Bから日報データが送信される。例えばビルのオーナー等から、ビルメンテナンス会社に当該ビルの運営を委託された場合に、当該ビルメンテナンス会社の社員等の現場作業員は、運営管理内容をオーナー等に報告するための日報を作成する。この日報は、現場作業員が保持するコンピュータ12A,12Bから入力される電子データであって、当該電子データが中央管理装置10A,10Bに送信される。日報データについては後述する。
管理サーバ20は、複数の中央管理装置10A,10Bと、インターネット等のネットワーク14により通信可能となっている。管理サーバ20は、中央管理装置10A,10Bから、それぞれのビル運営管理データを受信可能となっている。ビル運営管理データには日報データも含まれる。後述するように、管理サーバ20は、それぞれの中央管理装置10A,10Bからの日報データを加工、整形する日報データ整形装置として機能する。
管理サーバ20は、コンピュータから構成される。すなわち、管理サーバ20は、入出力コントローラ21、CPU22、ROM23、RAM24、及びハードディスクドライブ(HDD)25を備え、これらが内部バス28に接続される。さらに管理サーバ20は、マウスやキーボード等の入力部26と、ディスプレイ等の表示部27を備え、これらが内部バス28に接続される。
管理サーバ20の記憶部であるROM23には、図7、図8に例示される、日報整形プロセスを実行するためのプログラムが記憶される。また、このプログラムは、通信手段により提供することはもちろん、CD-ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
ROM23に記憶され、または通信手段や記録媒体から提供されたプログラムは、管理サーバ20を構成するコンピュータのCPU22により実行される。このプログラムの実行により、管理サーバ20は日報整形装置として、図2のような機能ブロックを備える。
すなわち、管理サーバ20は、抽出項目文字記憶部31、探索範囲決定部32、抽出項目探索部33、候補セル設定部34、属性判定部35、日報リスト作成部36、及び設定変更部37を備える。これらの機能ブロックの処理内容については後述する。
上述したように、管理サーバ20には、中央管理装置10A,10Bから日報データを含むビル運営管理データが送信される。後述するように、日報整形装置として機能する管理サーバ20は、受信した日報データを整形し、複数のビルに亘る、言い換えるとビル横断的な日報リストを作成する。
図3には、中央管理装置10Aから送信された日報データを紙媒体に印刷したときの例が示される。日報では、現場作業者が行った対応業務ごとにレコードが作成される。例えばレコードID1では、対応業務の内容として、ビル内の所定区域及び所定日時における、ブラインド、照明、及び空調の設定についての依頼を、現場作業者が受けて、同作業者が依頼内容を実行した旨が記録される。
日報には対応業務の概要を把握するための項目が設けられる。例えば発生日時、対応者、対応業務の内容、及びその処置と、終了日時が報告すべき項目として設定される。
このような日報のもととなる日報データは、上述したように、現場作業者の所有するコンピュータから入力される。図4には、コンピュータの表示部(ディスプレイ)に表示された、日報データの例が示される。日報データは、1レコード、つまり一つの対応業務報告データとして、複数の行及び列に亘って項目セル及び入力セルが設けられた、ラベル形式の書式を採っている。以下では適宜、ラベル形式の日報データを「日報ラベルデータ」と記載し、リスト形式の日報データを「日報リストデータ」と記載する。
図4のような日報ラベルデータは、コンピュータの表計算ソフトを用いて作成される。例えばマイクロソフト(登録商標)社のエクセル(登録商標)を用いて、日報ラベルデータのフォーム(書式)が作成される。
日報ラベルデータには、一つのレコード46に対して、複数の項目セル40A~40F及び入力セル44B~44Fが設けられる。項目セル40A~40Fには、入力内容を示す項目文字が予め入力される。また入力セル44B~44Fには、それぞれの項目セル40B~40Fに対応した、対応業務の内容が入力される。
なお、図4に例示される日報ラベルデータでは、表計算ソフトによるセルが複数連結されて一つの項目セルや入力セルが形成される。また連結後の項目セルや入力セルのそれぞれの境界には罫線が引かれる。以降の説明では、特に説明のある場合を除き、連結後のセルを単位として、セル同士の隣接関係が説明される。
このような、複数の行及び列に亘って項目セル及び入力セルが設けられた日報ラベルデータは、後述するように、管理サーバ20(日報データ整形装置)の日報整形プロセスを経て、図5に例示されるような日報リストデータに整形される。日報リストデータでは、一つのレコードが、項目ごとに一列に配列される。さらに各レコードの同一項目が行方向に配列される。
なお、図4の日報ラベルデータの各項目と、図5の日報リストデータの各項目は、予め対応付けられている。例えば日報ラベルデータの項目セル40A~40Fは、日報リストデータの項目セル50A,50C~50Gに対応する。
後述するように、管理サーバ20は、このような日報リストデータを、一つのビルの日報ラベルデータ、例えば中央管理装置10Aから提供された日報ラベルデータのみから作成することが可能となっている。また、管理サーバ20は、このような日報リストデータを、複数のビルの日報ラベルデータ、例えば中央管理装置10A,10Bから提供された日報ラベルデータから作成することが可能となっている。
図2、図6を参照して、抽出項目文字記憶部31には、日報ラベルデータから日報リストデータを作成するための情報である、抽出設定テーブルが記憶される。例えば抽出項目文字記憶部31には、日報ラベルデータ(図4参照)の項目セルに予め入力された、日報項目の文字である項目文字が、抽出項目文字として記憶される。
例えばこれらの抽出項目文字として、図4の日報ラベルデータの項目セルに記載された、発生日時(項目セル40Bの項目文字)、終了日時(項目セル40Cの項目文字)、対応者(項目セル40Dの項目文字)、内容(項目セル40Eの項目文字)、及び処置(項目セル40Fの項目文字)が、抽出項目文字記憶部31に登録(記憶)される。
図6の抽出設定テーブルを参照して、これらの抽出項目文字には、それぞれ識別記号(ID)が付与される。後述する図7では、この識別記号が抽出項目文字ID(k_CID)として示される。kには図6のID欄に付された数字が代入される。
抽出設定テーブルでは、いわゆるシソーラスが形成される。例えば抽出項目文字欄の隣には類語欄が形成される。この類語欄に、抽出項目文字の類語が登録される。例えば抽出項目文字「発生日時」の類語として、「受信日時」「受付日時」「生起日時」が登録される。
後述する日報整形プロセスでは、これらの類語に相当する文字が探索された場合に、当該類語(例えば「生起日時」)と対応付けられた入力文字(例えば「2019年8月1日 09:50」)が、日報リストの作成時に、抽出項目文字(例えば「発生日時」)と対応付けられた入力文字と同一の列に配列される。
さらに、抽出設定テーブルには、抽出項目の、日報項目としての属性が設定される。例えば抽出項目文字「発生日時」に対して、入力される文字列の属性として、「日時」が設定される。また抽出項目文字「内容」に対して、入力される文字列の属性として、「文字列」が設定される。
さらに抽出設定テーブルには、各項目に対して入力される文字数が設定される。例えば抽出項目文字「発生日時」に対して文字数は15文字未満に設定される。また抽出項目文字「内容」に対して文字数は無制限に設定される。
また、抽出設定テーブルには、優先セルの位置が設定される。優先セルとは、探索された項目セルの周囲のセルに対して設定されるものであって、当該周囲のセルのどの位置にあるセルを、当該項目セルに対する入力セル(対応入力セル)として、優先的に取り扱うかを定めるものである。例えば後述するように、ある項目セルに対して、属性条件及び文字数条件を満たした適合セルが複数抽出された場合に、優先セルに位置する適合セルが最終的に対応入力セルとして抽出される。
なお、抽出設定テーブルの設定内容は、入力部26(図1参照)から、設定変更部37(図2参照)を通して変更が可能となっている。例えば類語の追加や抽出項目文字の追加等の変更が、設定変更部37を介して行われる。
<日報整形プロセス>
図7、図8には、本実施形態に係る日報整形装置(管理サーバ20)による、日報整形プロセスのフローチャートが例示される。また図9~図12には、日報ラベルデータに対する操作の内容が例示される。
中央管理装置10A,10B(図1参照)の少なくとも一方から日報ラベルデータを受信すると、管理サーバ20の探索範囲決定部32(図2参照)は、日報ラベルデータのレコードID(k_RID)を抽出する(S10)。レコードIDは項目セル40A(図9参照)に入力された数字である。
さらに探索範囲決定部32は、日報ラベルデータのレコードID(k_RID)をカウントする(S12)。言い換えると、探索範囲決定部32は、日報ラベルデータに記録されたレコード数をカウントする。
さらに探索範囲決定部32は、それぞれのレコードに付与されたレコードIDに基づいて、単一のレコードの境界を求める。具体的には、探索範囲決定部32は、レコードIDを初期値(k_RID=1)に設定する(S14)とともに、その探索範囲をk_RID=1の境界50内に設定する(R16)。
次に抽出項目探索部33は、抽出項目文字記憶部31に記憶された抽出設定テーブル(図6参照)を参照して、抽出項目文字ID(k_CID)を初期値(k_CID=1)に設定する(S18)。これにより、抽出項目文字は「発生日時」及びその類語に設定される。
次に抽出項目探索部33は、設定された抽出項目文字(所定の抽出項目文字)またはその類語を含むセルである、抽出項目セルを、レコードの境界50内で探索する。具体的には、設定された抽出項目セルが、レコードの境界50内に存在するか否かを判定する(S20)。境界50内に抽出項目セルが無い場合には、設定された抽出項目文字のリスト化が見送られる(S38)。
一方、図10の項目セル40Bに例示されるように、ステップS20にて、抽出項目セルがレコードの境界50内に存在する場合に、管理サーバ20は、設定された抽出項目文字に対応する入力セル(以下適宜、対応入力セルと記載する)を探索する。
具体的には、候補セル設定部34は、ステップS20にて探索された抽出項目セルの周囲のセルを候補セルに設定する(S22)。例えば図11に例示されるように、抽出項目セルである項目セル40Bの、境界50内の隣接セルを候補セルとする。隣接セルとは、例えば抽出項目セルと、境界(罫線)の少なくとも一部が共通するようなセルを指す。図11では、破線で囲まれた項目セル40A、40D及び入力セル44Bが候補セルとして選択される。
さらに候補セル設定部34は、候補セルのうち、現在設定されている(つまり所定の)抽出項目文字のID(k_CID)とは異なるIDを持った抽出項目文字またはその類語を含むセルを、候補セルから除外する(S24)。例えば図6及び図12を参照して、現在設定されている抽出項目文字ID(k_CID=1)とは異なるID(CID=3)を持った抽出項目文字(対応者)を含む項目セル40Dが、候補セルから除外される。このような除外プロセスを設けることで、現在設定されているものとは異なる抽出項目文字を含むセルが、対応入力セルとして抽出されることを抑制可能となる。
さらに候補セル設定部34は、残された候補セルのうち、現在設定されている抽出項目文字「発生日時」の属性「日時」(図6参照)に適合する文字が入力されたセル(以下適宜、属性適合セルと記載する)が存在するか否かを判定する(S26)。
属性適合セルが候補セルの中には無い場合、日報リスト作成部36(図2参照)は、日報リストデータ(図5参照)の「発生日時」列の対応セルを空欄にして(S28)、ステップS38に進む。例えば発生日時セル50Cの列内における、レコードID=1の行のセルが空欄となる。
一方、属性適合セルが候補セルの中に存在する場合、属性判定部35は、属性適合セル内の文字数は、抽出設定テーブルに設定された文字数制限を満たすか(クリアするか)否かを判定する(S30)。なおこの判定において、属性適合セルは複数抽出されてもよい。
属性適合セルの中から文字制限を満たすセル(以下適宜、文字数適合セルと記載する)が無い場合、日報リスト作成部36(図2参照)は、日報リストデータ(図5参照)の対応セルを空欄にして(S28)、ステップS38に進む。
一方、文字数適合セルが属性適合セルの中から抽出されると、属性判定部35は、文字数適合セルが複数あるか否かを判定する(S32)。文字数適合セルが一つのみの場合、例えば入力セル44Bのみの場合、日報リスト作成部36は、当該文字数適合セルを対応入力セルとして、当該セル内の文字列「9/4 17:44」と、現在設定されている抽出項目文字とを関連付ける。さらに、日報リスト作成部36は、日報リスト(図5参照)に対して、発生日時セル50Cの列内における、レコードID=1の行のセル(対応セル)に文字列「9/4 17:44」を入力する(S34)。
一方、ステップS32にて、文字数適合セルが複数ある場合、日報リスト作成部36は、抽出設定テーブル(図6参照)の優先セル欄を参照して、抽出項目セルである項目セル40B(図12)に対して優先位置にあるセル(優先セル)を対応入力セルとして抽出する。さらに日報リスト作成部36は、当該対応入力セル内の文字列(「9/4 17:44」)と、現在設定されている抽出項目文字とを関連付ける。さらに、日報リスト作成部36は、日報リストデータ(図5参照)に対して、発生日時セル50Cの列内における、レコードID=1の行のセル(対応セル)に文字列「9/4 17:44」を入力する(S36)。
なお、複数の文字数適合セルが、いずれも優先セルに該当しない場合は、当該複数の文字数適合セル内の文字列を纏めて日報リストデータに入力してもよい。これにより、文字数適合セルの文字列への、日報リストデータへの反映漏れを防ぐことが出来る。
日報リストデータへの入力後、探索範囲決定部32(図2参照)は、現在設定されている抽出項目文字のID(k_CID)が最大値(k_CID=MAX)であるか否かを判定する(S38)。抽出項目文字のID(k_CID)が最大値でない場合、探索範囲決定部32は、抽出項目文字のID(k_CID)をインクリメントして(S40)、ステップS18に戻る。
一方、抽出項目文字のID(k_CID)が最大値である場合、探索範囲決定部32は、レコードIDが最大値(k_RID=MAX)であるか否かを判定する(S42)。レコードID(k_RID)が最大値でない場合、探索範囲決定部32は、レコードID(k_RID)をインクリメントして(S44)、ステップS16に戻る。レコードIDが最大値(k_RID=MAX)である場合に、日報整形プロセスは終了する。
上記のステップが、抽出項目文字のID(k_CID)の全てに対して実行されることで、日報リスト作成部36によって、1レコード内の各項目に対して入力された文字が、互いに関連付けられた状態で日報リストデータに入力される。さらに上記のステップが、日報ラベルデータのすべてのレコードに対して実行されることで、日報リスト作成部36によって、レコード内の各項目と関連付けられた、それぞれのレコードから抽出された適合セル内の文字が、日報リスト内に項目別に一列に配列される。
このように本実施形態に係る日報整形プロセスでは、日報ラベルデータの書式を問わずに、項目とその入力内容との関連付けが可能となり、さらにその関連付けに基づいた日報リストデータの作成が可能となる。したがって、それぞれ書式の異なる日報ラベルデータを纏めて一つの日報リストデータを作成することが可能となる。
10A,10B 中央管理装置、12A,12B コンピュータ、20 管理サーバ(日報データ整形装置)、31 抽出項目文字記憶部、32 探索範囲決定部、33 抽出項目探索部、34 候補セル設定部、35 属性判定部、36 日報リスト作成部、37 設定変更部、40A~40F 日報ラベルデータの項目セル、44A~44F 日報ラベルデータの入力セル、46 レコード、50 レコードの境界、50A~50G 日報リストデータの項目セル。

Claims (4)

  1. 複数の行及び列に亘って項目セル及び入力セルが設けられたラベル形式の日報データを整形する、日報データ整形装置であって、
    日報項目の文字である抽出項目文字及び前記日報項目の属性が、識別記号別に登録された抽出項目文字記憶部と、
    複数のレコードを含む前記日報データのうち、一つのレコード内の、所定の前記抽出項目文字またはその類語を含むセルである抽出項目セルを探索する抽出項目探索部と、
    探索された前記抽出項目セルの周囲のセルを候補セルに設定する、候補セル設定部と、
    前記候補セルの中から、前記所定の抽出項目文字に対応する前記日報項目の属性に適合する文字が入力された適合セルを探索する、属性判定部と、
    前記所定の抽出項目文字と前記適合セル内の文字とを関連付けるリスト作成部と、
    を備え、
    前記候補セル設定部は、探索された前記抽出項目セルの周囲のセルに対して、前記所定の抽出項目文字とは異なる識別記号が付与された前記抽出項目文字またはその類語が含まれるセルを除外して、前記候補セルを設定し、
    前記抽出項目文字記憶部には、前記抽出項目セルの周囲のセルのうち、優先セルの位置が記憶され、
    前記適合セルが複数探索されたときに、前記リスト作成部は、前記優先セルの位置に対応する前記適合セルの文字と、前記所定の抽出項目文字とを関連付け、
    前記リスト作成部は、前記適合セルが複数探索されたときであって、そのいずれのセルの位置も前記優先セルの位置に対応しないときに、複数の前記適合セルの文字と前記所定の抽出項目文字とを関連付け、
    さらに前記リスト作成部は、関連付けされた複数の前記適合セル内の文字列を纏めた状態で日報リストに入力する、
    日報データ整形装置。
  2. 請求項1に記載の、日報データ整形装置であって、
    複数のレコードを含む前記日報データのうち、それぞれのレコードに付与された識別記号に基づいて、単一のレコードの境界を求める、探索範囲決定部を備える、日報データ整形装置。
  3. 請求項1または2に記載の、日報データ整形装置であって、
    前記リスト作成部は、前記所定の抽出項目文字と関連付けられた、それぞれのレコードから抽出された前記適合セル内の文字を、前記日報リスト内に一列に並べる、
    日報データ整形装置。
  4. 請求項3に記載の、日報データ整形装置であって、
    前記リスト作成部は、前記日報リスト内に、抽出項目文字別に当該抽出項目文字と関連付けられた前記適合セルの文字を、レコード順に一列のセルに並べ、
    さらに、前記リスト作成部は、所定のレコードにおいて前記所定の抽出項目文字の周囲の前記候補セルの中に前記適合セルが無い場合に、前記日報リスト内の当該レコード及び当該抽出項目文字に対応するセルを空欄とする、
    日報データ整形装置。
JP2021554828A 2019-11-06 2020-09-07 日報データ整形装置 Active JP7206415B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019043352 2019-11-06
JPPCT/JP2019/043352 2019-11-06
PCT/JP2020/033708 WO2021090567A1 (ja) 2019-11-06 2020-09-07 日報データ整形装置

Publications (3)

Publication Number Publication Date
JPWO2021090567A1 JPWO2021090567A1 (ja) 2021-05-14
JPWO2021090567A5 JPWO2021090567A5 (ja) 2022-06-16
JP7206415B2 true JP7206415B2 (ja) 2023-01-17

Family

ID=75849882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021554828A Active JP7206415B2 (ja) 2019-11-06 2020-09-07 日報データ整形装置

Country Status (3)

Country Link
JP (1) JP7206415B2 (ja)
CN (1) CN114730356A (ja)
WO (1) WO2021090567A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2008192032A (ja) 2007-02-07 2008-08-21 Fuji Xerox Co Ltd 文書処理装置、文書処理方法、プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2008192032A (ja) 2007-02-07 2008-08-21 Fuji Xerox Co Ltd 文書処理装置、文書処理方法、プログラム

Also Published As

Publication number Publication date
CN114730356A (zh) 2022-07-08
JPWO2021090567A1 (ja) 2021-05-14
WO2021090567A1 (ja) 2021-05-14

Similar Documents

Publication Publication Date Title
US9251413B2 (en) Methods for automatic structured extraction of data in OCR documents having tabular data
US8799772B2 (en) System and method for gathering, indexing, and supplying publicly available data charts
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
US7653245B2 (en) System and method for coding and retrieval of a CAD drawing from a database
CN101021850A (zh) 单词检索设备、单词检索方法,以及记录介质
CN105209858B (zh) 企业场所数据的非确定性消岐和匹配
WO2018090468A1 (zh) 视频节目的搜索方法和装置
JPWO2008032780A1 (ja) 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム
JP5380040B2 (ja) 文書処理装置
JP4832952B2 (ja) データベース解析システム及びデータベース解析方法及びプログラム
JP2003524258A (ja) 電子ドキュメントを処理する方法および装置
CN107085568A (zh) 一种文本相似度判别方法及装置
US20060080293A1 (en) Procedure and mechanism for searching for information in databases
CN112395881B (zh) 物料标签的构建方法、装置、可读存储介质及电子设备
JP7206415B2 (ja) 日報データ整形装置
JP2014109852A (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP6677093B2 (ja) 表データ検索装置、表データ検索方法、及び表データ検索プログラム
KR101030250B1 (ko) 데이터 처리방법 및 데이터 처리 프로그램
JP2012203725A (ja) 法令分析支援装置、法令分析支援方法、及び法令分析支援プログラム
KR101078978B1 (ko) 문서 분류 시스템
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
US20050262433A1 (en) Computer product, data analysis support method, and data analysis support apparatus
JP2023003887A (ja) 書類画像処理システム、書類画像処理方法、および書類画像処理プログラム
JP7272037B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220421

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220421

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230104

R150 Certificate of patent or registration of utility model

Ref document number: 7206415

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150