JP2021197099A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2021197099A
JP2021197099A JP2020105584A JP2020105584A JP2021197099A JP 2021197099 A JP2021197099 A JP 2021197099A JP 2020105584 A JP2020105584 A JP 2020105584A JP 2020105584 A JP2020105584 A JP 2020105584A JP 2021197099 A JP2021197099 A JP 2021197099A
Authority
JP
Japan
Prior art keywords
image data
image
acquired
data
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020105584A
Other languages
English (en)
Inventor
永根 朴
Young Geun Park
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020105584A priority Critical patent/JP2021197099A/ja
Priority to CN202011421914.7A priority patent/CN113821752A/zh
Priority to US17/114,723 priority patent/US20210397872A1/en
Publication of JP2021197099A publication Critical patent/JP2021197099A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Library & Information Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】確認を要する箇所の特定に最新の文書の存在が必要とされる場合に比して、作業者の負担を軽減する。【解決手段】情報処理装置はプロセッサを有し、プロセッサは、監視の対象とするウェブサイトから、更新を含む第1の画像データを取得し、監視の対象とする文書データから第2の画像データを取得し、第1の画像データと第2の画像データを比較し、変化の可能性がある箇所を文書データの管理者に通知する。【選択図】図3

Description

本発明は、情報処理装置及びプログラムに関する。
業務上の文書は継続的に修正される。例えばマニュアルに使用される画像は、実製品で使用される画面の変更に合わせて修正される。ところで、マニュアル等の文書に修正が加えられた箇所の確認が必要とされる場合がある。この場合、修正後の文書(以下「最新の文書」とも呼ぶ)と修正前の文書(以下「既存の文書」ともいう)とが比較され、修正が加えられた箇所が特定される。
特開2013−8147号公報
修正が加えられた箇所の特定には、比較の対象である既存の文書と最新の文書の両方が必要になる。すなわち、既存の文書に修正を加えた最新の文書が必要になる。
ところで、業務上求められる整合性は、必ずしも継続的な関係がある文書間だけではない。例えばウェブサイトとその運用マニュアル、手順書、仕様書等の間でも整合性が要求される。
ただし、ウェブサイトと運用マニュアル等とは別の媒体であり、関連する文書の数も多い。また、ウェブサイトは、運用マニュアル等の既存の文書に対する最新の文書の関係にない。このため、ウェブサイトの画像が修正されても、対応する文書内から修正を要する画像を見つけ出すのは容易でない。
本発明は、確認を要する箇所の特定に最新の文書の存在が必要とされる場合に比して、作業者の負担を軽減することを目的とする。
請求項1に記載の発明は、プロセッサを有し、前記プロセッサは、監視の対象とするウェブサイトから、更新を含む第1の画像データを取得し、監視の対象とする文書データから第2の画像データを取得し、前記第1の画像データと前記第2の画像データを比較し、変化の可能性がある箇所を前記文書データの管理者に通知する情報処理装置である。
請求項2に記載の発明は、前記プロセッサは、前記第1の画像データと前記第2の画像データの一致率が予め定めた条件を満たす場合、当該第2の画像データを修正の可能性がある箇所として通知する、請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記予め定めた条件は、前記一致率が第1の閾値より低いことである、請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記予め定めた条件は、前記第1の閾値より小さい第2の閾値より前記一致率が高いことである、請求項3に記載の情報処理装置である。
請求項5に記載の発明は、前記プロセッサは、前記第2の閾値より前記一致率が小さい場合、前記第2の画像データを通知の対象から除外する、請求項4に記載の情報処理装置である。
請求項6に記載の発明は、前記プロセッサは、前記管理者に対し、通知の対象である前記第2の画像データの修正の要否の確認を要求する、請求項1に記載の情報処理装置である。
請求項7に記載の発明は、前記プロセッサは、修正が不要と指示された前記第2の画像データを次回以降の比較の対象から除外する、請求項6に記載の情報処理装置である。
請求項8に記載の発明は、コンピュータに、監視の対象とするウェブサイトから、更新を含む第1の画像データを取得する機能と、監視の対象とする文書データから第2の画像データを取得する機能と、前記第1の画像データと前記第2の画像データを比較し、変化の可能性がある箇所を前記文書データの管理者に通知する機能とを実現させるプログラムである。
請求項1記載の発明によれば、確認を要する箇所の特定に最新の文書の存在が必要とされる場合に比して、作業者の負担を軽減できる。
請求項2記載の発明によれば、修正の可能性が高い第2の画像データを通知できる。
請求項3記載の発明によれば、多重的に表示された情報により一致率が低下した可能性がある画像を修正の可能性がある箇所から除去できる。
請求項4記載の発明によれば、修正の可能性が高い画像を選択的に通知できる。
請求項5記載の発明によれば、継続性がない画像を修正の可能性がある箇所から除外できる。
請求項6記載の発明によれば、管理者の判断を通知の結果として記録できる。
請求項7記載の発明によれば、管理者が修正の可能性を否定した箇所を次回の通知の対象から除外できる。
請求項8記載の発明によれば、確認を要する箇所の特定に最新の文書の存在が必要とされる場合に比して、作業者の負担を軽減できる。
実施の形態で想定する情報処理システムの構成例を示す図である。 更新管理サーバのハードウェア上の構成例を説明する図である。 更新管理サーバの機能上の構成例を説明する図である。 画像データ取得部が監視の対象とするウェブサイトと取得された画像データの情報を説明する図である。(A)はウェブサイトの画像例を示し、(B)は取得画像データの例を示す。 更新確認部による比較の結果を説明する図である。 画像データ取得部が取得の対象とする文書データと取得された画像データの情報を説明する図である。(A)は文書データの例を示し、(B)は取得画像データの例を示す。 更新確認部による比較の結果を説明する図である。 データ比較部による画像データ間の比較の結果の例を説明する図である。 管理者の端末に表示される画面の一例を説明する図である。 管理者による修正の有無の指示を反映した比較結果データの例を示す図である。 更新管理サーバで実行される処理動作を説明するフローチャートである。 ウェブサイトから取得された画像データの一覧を示す図である。 文書データDBで管理される文書データの管理データと文書データDBから取得された画像データの一覧を示す図である。(A)は文書データDBで管理される文書データの管理データであり、(B)は取得画像データの一覧である。 ウェブサイトにおいて取得された画像データと文書データにおいて取得された画像データを比較した結果の例を説明する図である。 管理者による画像データに対する更新の必要性の有無を受け付けた結果の例を示す図である。 ウェブサイトからの画像データの取得が2回目以降であった場合における取得画像データの例を説明する図である。 文書データからの画像データの取得が2回目以降の場合における取得画像データの例を説明する図である。 管理者による前回の確認に応じて登録された管理データの例を示す図である。 ウェブサイトにおいて取得された画像データと文書データにおいて取得された画像データを比較した結果の例を説明する図である。 管理者による画像データに対する更新の必要性の有無を受け付けた結果の例を示す図である。
以下、添付図面を参照して、実施の形態について詳細に説明する。
<実施の形態>
<システム構成>
図1は、実施の形態で想定する情報処理システム1の構成例を示す図である。
図1に示す情報処理システム1は、監視の対象であるウェブサイト10と、インターネット20と、監視の対象に関連がある文書データのデータベース(以下「文書データDB」という)30と、更新管理サーバ40と、管理者が操作する端末50と、LAN(=Local Area Network)60で構成されている。
本実施の形態におけるウェブサイト10は、WWW(=World Wide Web)上のアドレスが与えられており、外部の装置からアクセスが可能な画像データをいう。このため、ウェブサイト10が存在する場所は、サーバ上に限らず、外部との通信が可能な装置や機械でもよい。
本実施の形態におけるウェブサイト10には、機械の操作パネルの画像、オペレーションシステムやファームウェアのバージョンアップ等に応じて表示される確認用の画像、アプリケーションソフトウェアのユーザインタフェースの画像も含まれる。
図1の場合、ウェブサイト10は、インターネット20上に存在するが、LAN60上に存在してもよい。
文書データDB30は、監視の対象であるウェブサイト10に関連がある文書データが記憶されているストレージである。図1の場合、文書データDB30は、LAN60上に存在するが、インターネット20上に存在してもよい。本実施の形態の場合、文書データは、例えば運用マニュアル、手順書、仕様書である。
更新管理サーバ40は、ウェブサイト10における画像の更新を監視し、関連する文書データのうち修正の必要性が高い画像を検出して管理者に通知する機能を提供する。更新管理サーバ40は、情報処理装置の一例である。
端末50は、いわゆるコンピュータであり、デスクトップ型のコンピュータやノート型のコンピュータを想定する。もっとも、端末50は、スマートフォンやタブレット型の端末でもよい。
<更新管理サーバ40の構成>
図2は、更新管理サーバ40のハードウェア上の構成例を説明する図である。
更新管理サーバ40は、装置全体の動作を制御する制御ユニット41と、データを記憶する記憶装置42と、入出力ポート43と、通信装置44とを有している。
制御ユニット41は、CPU(=Central Processing Unit)41Aと、BIOS(=Basic Input Output System)等が記憶されたROM(=Read Only Memory)と、ワークエリアとして用いられるRAM(=Random Access Memory)とを有している。制御ユニット41は、いわゆるコンピュータとして機能する。CPU41Aは、プロセッサの一例である。
記憶装置42は、例えば半導体メモリやハードディスク装置により構成される。記憶装置42には、オペレーティングシステムや本実施の形態で提案する機能を実現するプログラムが記憶されている。
この他、本実施の形態における記憶装置42には、ウェブサイト10(図1参照)から取得した画像データ(以下「取得画像データ」ともいう)42Aと、最新の取得画像データ42Aと前回の取得画像データ42Aとの間で更新の可能性が認められた画像データ(以下「更新画像データ」ともいう)42Bと、文書データDB30(図1参照)から取得した画像データ(以下「取得画像データ」ともいう)42Cと、最新の取得画像データ42Cと前回の取得画像データ42Cとの間で更新の可能性が認められた画像データ(以下「更新画像データ」ともいう)42Dと、更新が検出されたウェブサイト10側の画像と文書データ側の画像との比較の結果(以下「比較結果データ」という)42Eとが記憶されている。
図3は、更新管理サーバ40の機能上の構成例を説明する図である。図3に示す機能上の構成は、プログラムの実行を通じて実現される。
更新管理サーバ40の機能部は、ウェブサイト10から画像データを取得する画像データ取得部411と、取得画像データ42Aから更新の可能性が高い画像データを確認する更新確認部412と、文書データDB30から画像データを取得する画像データ取得部413と、取得画像データ42Cから更新の可能性が高い画像データを確認する更新確認部414と、ウェブサイト10から取得された更新画像データ42Bと文書データから取得された更新画像データ42Dとを比較するデータ比較部415と、比較結果データ42Eから更新の可能性が高い画像データの存在を管理者に通知する管理者通知部416と、通知された画像データに対する管理者の確認の結果や管理者による修正の指示を受け付ける修正受付部417とを有している。
取得画像データ42Aは、第1の画像データの一例であり、取得画像データ42Cは、第2の画像データの一例である。
画像データ取得部411は、監視の対象として管理者が指定した特定のウェブサイト10に含まれる画像データを取得する。監視の対象とするウェブサイト10は、URL(=Uniform Resource Locator)、ドメイン以下のURL等により指定される。前述したように、ウェブサイトには、機械の操作パネル等の画像も含まれる。なお、URLは、開発で用いたソースコード等から取得してもよい。また、取得されたURLの一部を監視の対象として管理者等が事前に指定してもよい。
特定のウェブサイト10は、個別に指定される他、サイトの種類、会社名、サービス名等により特定してもよい。
なお、画像データ取得部411は、インターネット上から画像データを自動的に収集するアプリケーションソフトウェア(以下「ボット」ともいう)でもよい。
図4は、画像データ取得部411(図3参照)が監視の対象とするウェブサイト10と取得された画像データの情報を説明する図である。(A)はウェブサイト10の画像例を示し、(B)は取得画像データ42Aの例を示す。
図4(A)は、「aaaサービス/ttta」で特定されるウェブサイト10を表している。
画像データ取得部411は、ウェブサイト10に含まれる「AAAAA」画像11を取得する。
図4(B)の例では、ウェブサイト10の1つのページには1つの画像が含まれる場合を想定しているが、1つのページに複数の画像が含まれてもよい。その場合には、画像データ毎に異なる名称が付され管理される。
図4(B)に示すように、取得画像データ42Aは、取得元であるウェブサイト10を特定するURLと取得した日付とが紐付けられている。図4の場合、日付は日時である。本実施の形態の場合、画像データ取得部411は、毎日1回、監視の対象であるウェブサイト10から画像データを取得する。なお、毎日1回は一例であり、1時間に1回、数時間に1回等でもよい。
図3の説明に戻る。
更新確認部412は、直前回に取得された画像データと最新の画像データを比較し、直前回の取得から今回の取得までの間に画像データに更新があったか否かを確認する機能を提供する。
本実施の形態の場合、更新確認部412は、マッチ率を使用して更新の有無を判定する。マッチ率の100%は2つの画像が一致することを意味し、マッチ率の0%は2つの画像が全く異なることを意味する。画像の一部に変化があった場合のマッチ率は、変化の多さに応じ、100%から0%の間の中間値を採る。
図5は、更新確認部412(図3参照)による比較の結果を説明する図である。図5に示す例は、「aaaサービス/ttta」で特定されるウェブサイト10と、「aaaサービス/tttb」で特定されるウェブサイト10と、「aaaサービス/tttc」で特定されるウェブサイト10のそれぞれについて比較の結果を表している。なお、図5では、省略しているが、残る3つのウェブサイト10についても同様に比較の結果が存在する。
図5の場合、同じウェブサイト10について取得された取得画像データ42Aのファイル名には日付の情報が付加されている。
図5の場合、1つのウェブサイト10について2つの取得画像データ42Aが記憶されている。1つは2月21日に取得された取得画像データ42Aであり、1つは2月22日に取得された取得画像データ42Aである。
図5の場合、「aaaサービス/ttta」で特定されるウェブサイト10について2月21日に取得された「AAAAA_0221」画像と、前日に取得された「AAAAA_0220」画像とのマッチ率は100%である。
ただし、2月22日に取得された「AAAAA_0222」画像は、前日に取得された「AAAAA_0221」画像とのマッチ率が95%に低下している。ここでのマッチ率は、「一致率」に想到する。
同様に、「aaaサービス/tttb」で特定されるウェブサイト10について2月21日に取得された「BBBBB_0221」画像と、前日に取得された「BBBBB_0220」画像とのマッチ率は100%である。
ただし、2月22日に取得された「BBBBB_0222」画像は、前日に取得された「BBBBB_0221」画像とのマッチ率が50%に低下している。
このため、更新確認部412は、「AAAAA_0222」画像と「BBBBB_0222」画像を、更新画像データ42Bとして出力する。
なお、更新と判定するマッチ率には閾値を用いてもよい。閾値は例えば96%とする。マッチングの誤差の可能性を考慮するためである。ここでの96%は、第1の閾値の一例である。
更新確認部412は、全ての取得画像データ42Aについて更新の可能性がなかった場合、更新画像データ42Bを出力することなく、処理を終了する。
図3の説明に戻る。
画像データ取得部413は、文書データDB30に記憶されている文書データから画像データを取得する。監視の対象とする文書データは、画像データ取得部411が取得の対象とするウェブサイトと関連がある文書データを事前に指定しておく。もっとも、文書データDB30に記憶されている全ての文書データを監視の対象としてもよい。
図6は、画像データ取得部413(図3参照)が取得の対象とする文書データと取得された画像データの情報を説明する図である。(A)は文書データの例を示し、(B)は取得画像データ42Cの例を示す。
図6(A)に例示した文書データのファイル名は、「789マニュアル.html」である。画像データ取得部413は、「789マニュアル」に含まれる「MMMMM」画像31を取得する。
図6(B)の例では、「123仕様書」から3つの画像データが取得され、「456手順書」から3つの画像データが取得され、「789マニュアル」から2つの画像データが取得されている。
図6(B)に示すように、取得画像データ42Cには、文書データを特定するファイル名と取得した日付とが紐付けられている。図6の場合、作成日付は日時である。本実施の形態の場合、画像データ取得部413は、文書データが更新された場合に画像データを取得する。
図3の説明に戻る。
更新確認部414は、直前回に取得された画像データと最新の画像データを比較し、直前回の取得から今回の取得までの間に画像データに更新があったか否かを確認する機能を提供する。
更新確認部414も、マッチ率を使用して更新の有無を判定する。マッチ率が100%の場合は2つの画像が一致することを意味し、0%の場合は2つの画像が全く異なることを意味する。画像の一部に変化があった場合のマッチ率は、変化の多さに応じ、100%から0%の間の中間値を採る。なお、誤差を考慮して5%未満は、実質的に0%とみなしてもよい。ここでの5%は第2の閾値の一例である。
更新確認部414は、文書データの最新の画像データを取得することを目的とする。
図7は、更新確認部414による比較の結果を説明する図である。図7の場合、同じ文書データから取得された取得画像データ42Cのファイル名には、作成又は修正された日付の情報とマッチ率が付加されている。
図7の場合、「123仕様書」について2月18日に取得された「GGGGG_0218」画像と、前回取得された不図示の画像とのマッチ率は100%である。ただし、2月23日に取得された「GGGGG_0223」画像は、前回取得された「GGGGG_0218」画像とのマッチ率が95%に低下している。
なお、更新と判定するマッチ率には閾値を用いてもよい。上限を与える閾値は例えば96%とする。スナップショットとして取得された画像データにバナー等が混入する可能性を考慮する。
更新確認部414は、全ての取得画像データ42Cについて更新の可能性がなかった場合、更新画像データ42Dを出力することなく、処理を終了する。
図3の説明に戻る。
データ比較部415は、ウェブサイト10について確認された更新画像データ42Bと文書データについて確認された更新画像データ42Dとを比較し、比較の結果を出力する。本実施の形態の場合、比較の結果としてマッチ率を出力する。
本実施の形態の場合、閾値には上限を与える閾値と下限を与える閾値の両方を用いる。上限を与える閾値は、第1の閾値の一例であり、バナー等によりマッチ率が低下した画像データを排除する目的で使用される。下限を与える閾値は、第2の閾値の一例であり、全く別の画像への更新を排除するために使用される。
図8は、データ比較部415(図3参照)による画像データ間の比較の結果の例を説明する図である。
図8の場合、ウェブサイト10から取得された「AAAAA」画像は、文書データの「123仕様書」に含まれる「GGGGG」画像と、「HHHHH」画像と、「IIIII」画像と、文書データの「456手順書」に含まれる「JJJJJ」画像と、「KKKKK」画像と、「LLLLL」画像と、文書データの「789マニュアル」に含まれる「MMMMM」画像と、「NNNNN」画像のそれぞれと比較される。
図8の場合、ウェブサイト10から取得された「AAAAA」画像と「123仕様書」から取得された「GGGGG」画像のマッチ率は100%である。
また、ウェブサイト10から取得された「AAAAA」画像と、「123仕様書」に含まれる「HHHHH」画像と「IIIII」画像と、「456手順書」に含まれる「KKKKK」画像と「LLLLL」画像と、「789マニュアル」に含まれる「NNNNN」画像とのマッチ率は0%である。
なお、ウェブサイト10から取得された「AAAAA」画像と「456仕様書」に含まれる「JJJJJ」画像とのマッチ率は90%であり、ウェブサイト10から取得された「AAAAA」画像と「789マニュアル」に含まれる「MMMMM」画像とのマッチ率は50%である。
また、ウェブサイト10から取得された「BBBBB」画像と「123仕様書」に含まれる「HHHHH」画像とのマッチ率は90%である。
図3の説明に戻る。
管理者通知部416は、管理者の確認を必要とするマッチ率が得られた画像データを、管理者の端末50(図1参照)に通知する機能部である。
図9は、管理者の端末50に表示される画面51の一例を説明する図である。
図9に示す画面51には、ウェブサイト10の「AAAAA」画像とのマッチ率が90%であった「456手順書」の「JJJJJ」画像と、ウェブサイト10の「AAAAA」画像とのマッチ率が50%であった「789マニュアル」の「MMMMM」画像と、ウェブサイト10の「BBBBB」画像とのマッチ率が90%であった「123仕様書」の「HHHHH」画像とが並べて表示されている。
「AAAAA」画像と「BBBBB」画像は、ウェブサイト10の更新画像データ42Bであり、「JJJJJ」画像と、「MMMMM」画像と、「HHHHH」画像は、文書データの更新画像データ42Dである。
図9の場合、対応する画像に紐づけてマッチ率の数値と、対応する文書データに対する修正の有無を入力するための欄とが配置されている。図9では、修正の有無を入力するための欄に「修正有無」とのタイトルが表示され、その欄には「修正する」とのラベルが付されたボタン52と、「修正しない」とのラベルが付されたボタン53とが表示されている。
管理者は実際の画像を確認しながら、修正の有無を判断し、ボタン52又は53を操作する。
図3の説明に戻る。
修正受付部417は、管理者が「修正する」を選択した更新画像データ42Dに対する修正を受け付ける機能部である。
なお、管理者が「修正する」を選択したのに、対応する文書データの更新画像データ42Dが実行されなかった場合、修正受付部417は、管理者通知部416を通じて管理者に修正を促すメールを通知する。
図10は、管理者による修正の有無の指示を反映した比較結果データ42Eの例を示す図である。図10に示す比較結果データ42Eは、図8に示す比較結果データ42Eに対応する。
図10に示す比較結果データ42Eは、修正受付部417の管理用である。図10の場合、「789マニュアル」の「MMMMM」画像についてのみ「修正する」が記録され、「456手順書」の「JJJJJ」画像と「123仕様書」の「HHHHH」画像については「修正しない」が記録されている。
いずれの画像についても、管理者の確認日は「2020/02/23」である。
図10の場合、「JJJJJ」画像と「HHHHH」画像について「修正しない」が記録されているが、実質的に修正の必要がないと管理者が判断した結果である。
例えばウェブサイト10から取得される画像データは、ある瞬間のスナップショットとして取得される。このため、時間に伴って位置や内容が変化するバナー広告等が、ウェブサイト10の「AAAAA」画像や「BBBBB」画像に重ねて表示されていた場合、マッチ率が低下する可能性がある。
しかし、バナー広告等の背後に表示されている画像データと文書データ側の画像データとは同じであることが起こり得る。図10の「修正しない」は、このような例を表している。
なお、「修正する」の指示を受け付けた場合、修正受付部417は、ウェブサイト10から画像データを取得する画像データ取得部411と文書データDB30から画像データを取得する画像データ取得部413に再度の取得を指示し、一連の比較を繰り返させる。
ユーザが文書データを正しい画像データに修正していれば、再度の確認において全ての画像データのマッチ率が100%となり、ループ処理が終了する。
<処理動作>
以下、実施の形態で想定する情報処理システム1で実行される処理動作を説明する。
以下では、更新を確認するプログラムを初めて実行する場合の動作(以下「初回の動作」という)と、2回目以降の動作について説明する。
<初回の動作>
図11は、更新管理サーバ40で実行される処理動作を説明するフローチャートである。図中に示す記号のSはステップを意味する。
処理を開始したCPU41A(図2参照)は、ウェブサイト10から画像データを取得する(ステップ1)。
本実施の形態の場合、画像データは、例えばJPEG(=Joint Photographic Experts Group)、PNG(=Portable Network Graphics)、GIF(=Graphics Interchange Format)のデータ形式を有するデータをいう。
CPU41Aがウェブサイト10から画像データを取得する範囲は、例えば管理者のDさんが端末50(図1参照)を用いて設定する。
管理者のDさんは、例えば新規サービスAに対して取得する範囲を設定する。範囲の指定は、例えば「www.fujixerox.co.jp/aaaサービス/ttt*」により行う。ここでの*は任意の意味である。従って「aaaサービス」の「ttt*」で特定される全てのウェブサイトが検索の範囲に含まれる。
CPU41Aは、指定されたウェブサイト10に定期的にアクセスし、各ウェブサイト10に含まれる画像データを取得する。例えば1日に1回取得される。
画像データが取得されると、CPU41Aは、取得した画像データについて更新の有無を確認し(ステップ2)、続いて、画像データに更新があるか否かを判定する(ステップ6)。
今回の処理動作は、初回の動作であるので、CPU41Aは、ステップ6において肯定結果を得る。肯定結果が得られた場合、CPU41Aは、更新があった画像データを保存する(ステップ7)。今回の場合、CPU41Aは、ウェブサイト10から取得した全ての画像データを保存する。
なお、ステップ6で否定結果が得られた場合、CPU41Aは、処理を終了する。
図12は、ウェブサイト10から取得された画像データ(すなわち取得画像データ42A)の一覧を示す図である。図12の場合、「aaaサービス」について設定されたウェブサイト10から、6つの画像データが取得されている。
図11の説明に戻る。
ステップ1と並行して、CPU41Aは、文書データDB30の文書データから画像データを取得する(ステップ3)。
CPU41Aが文書データDB30から画像データを取得する範囲も、例えば管理者のDさんが、端末50を用いて設定する。管理者のDさんは、例えば文書データDB30の「管理フォルダ」を、画像データを取得する場所として設定する。なお、管理者のDさんは、ウェブサイト10から取得した画像データと文書データから取得した画像データの比較を実行する時刻も設定する。例えば毎日の午前1時に設定する。
図13は、文書データDB30で管理される文書データの管理データと文書データDB30から取得された画像データ(すなわち取得画像データ42C)の一覧を示す図である。(A)は文書データDB30で管理される文書データの管理データであり、(B)は取得画像データ42Cの一覧である。
図13に示す管理データは、文書データを作成した担当者、文書データが関連するサービス、ファイル名、登録日、データサイズ、アクセス権限、更新日で構成される。図13の場合、「aaaサービス」に関する文書データが管理の対象である。
図13に示す取得画像データ42Cは、ファイル名、取得画像データ、作成日付で構成される。図13の場合、「aaaサービス」に関連する「管理フォルダ」から、8つの画像データが取得されている。
図11の説明に戻る。
文書データから画像データが取得されると、CPU41Aは、文書データに更新があるか否かを判定する(ステップ4)。
今回の処理動作は、初回の動作であるので、CPU41Aは、ステップ4において肯定結果を得る。なお、ステップ4で否定結果が得られた場合、CPU41Aは、文書データについての処理を終了する。
ステップ4で肯定結果が得られた場合、CPU41Aは、取得された画像データについて更新の有無を確認し(ステップ5)、続いて、画像データに更新があるか否かを判定する(ステップ6)。
今回の処理動作は、初回の動作であるので、CPU41Aは、ステップ6において肯定結果を得る。肯定結果が得られた場合、CPU41Aは、更新があった画像データを保存する(ステップ7)。今回の場合、CPU41Aは、文書データから取得した全ての画像データを保存する。
この判定により、文書データから取得された画像データは常に最新の状態に維持される。
次に、CPU41Aは、ウェブサイト10の画像データと文書データの画像データを比較する(ステップ8)。
図14は、ウェブサイト10において取得された画像データと文書データにおいて取得された画像データを比較した結果の例を説明する図である。
図14に示す例は、ウェブサイト10から取得された6つの画像データと、文書データから取得された8つの画像データとの比較の結果を示している。なお、図14では、ウェブサイト10から取得された6つの画像データのうち3つの画像データについて比較の結果を例示し、他の3つの画像データについては比較の結果を省略している。
図14では、矢印で示した行以外は、マッチ率が100%又は0%である。マッチ率の100%は、2つの画像が同じことを意味する。一方、マッチ率の0%は、2つの画像が全く異なることを意味する。
いずれの場合も、文書データの管理者に文書データ内の画像データの更新について確認を求める必要がない。
図14の例では、「aaaサービス/ttta」の「AAAAA」画像との間で3つの文書データについて矢印がある。「aaaサービス/tttb」の「BBBBB」画像との間で1つの文書データについて矢印がある。「aaaサービス/tttc」の「CCCCC」画像との間で2つの文書データについて矢印がある。
図11の説明に戻る。
ステップ8の比較が終わると、CPU41Aは、マッチ率が100%又は0%か否かを判定する(ステップ9)。
全ての比較結果のマッチ率が100か0%であった場合、CPU41Aは、肯定結果を得て、一連の処理を終了する。文書データの管理者に確認を求める必要がないためである。
なお、ステップ9で否定結果が得られた場合、CPU41Aは、文書データの管理者に確認が必要な画像データの存在を通知する(ステップ10)。この通知は、例えば電子メールとして管理者の端末50に送信される。
この後、CPU41Aは、管理者の端末50からの通知により、修正が有るか否かを判定する(ステップ11)。修正の必要が1つも指示されなかった場合、CPU41Aは、ステップ11で否定結果を得て一連の処理を終了する。
一方、ステップ11で肯定結果が得られた場合、CPU41Aは、ステップ8に戻り、更新があった画像データをウェブサイト10の画像データと再び比較する。これにより、修正の可否の確認が可能になる。
図15は、管理者による画像データに対する更新の必要性の有無を受け付けた結果の例を示す図である。
図15の場合、「456手順書」の「JJJJJ」画像と、「789マニュアル」の「MMMMM」画像と、「123仕様書」の「HHHHH」画像の3つの画像データについて「更新する」が選択され、他の3つの画像データについては「更新しない」が選択されている。
<2回目以降の動作>
以下では、ウェブサイト10からの2回目以降の画像データの処理動作を説明する。この処理動作も、図11に示すフローチャートに基づいて実行される。
この処理動作の場合も、CPU41A(図2参照)は、ウェブサイト10から画像データを取得する(ステップ1)。
今回の場合は、ステップ2において、前回に対して更新があった画像データが判断され、更新があった画像データが見つかった場合には、ステップ6で肯定結果が得られ、更新画像データ42Bが保存される。
図16は、ウェブサイト10からの画像データの取得が2回目以降であった場合における取得画像データ42Aの例を説明する図である。図16には、図12との対応部分に対応する符号を付して示している。
図16の場合、前回の取得から1日後の「2020/02/22」に「aaaサービス」の一部のウェブサイトに更新があり、他のウェブサイトでは更新がない場合を想定している。
なお、ウェブサイト10に更新があったか否かの判定は行われない。このため、全てのウェブサイト10から全ての画像データが取得され、ステップ6で画像データに更新があるか否かが判定される。
図16の場合には、各画像データにファイル名に日付を付して管理している。例えば前日の「2020/02/21」に取得された画像データは「AAAAA_0221」画像として管理し、本日である「2020/02/22」に取得された画像データを「AAAAA_0222」画像として管理する。
図16に示すテーブルには、前日に取得された画像データと新たに取得された画像データとのマッチ率が追加されている。
図16の場合、「aaaサービス」の「ttta」サイトに含まれる「AAAAA_0222」画像のマッチ率が95%に低下している。また、「aaaサービス」の「tttb」サイトに含まれる「BBBBB_0222」画像のマッチ率が50%に低下している。このため、これら2つの画像データが、ステップ6において抽出され、更新画像データ42Bとして保存される。
図11の説明に戻る。
一方、CPU41Aは、文書データDB30に記憶されている文書データについて更新の有無を判定する(ステップ4)。
文書データについて更新の記録がある場合、CPU41Aは、ステップ4で肯定結果を得る。この場合、CPU41Aは、ウェブサイト10から取得された画像データのうち更新が見つけられた画像データと、前回の取得回で取得されていた画像データとの比較が実行される(ステップ8)。
図17は、文書データからの画像データの取得が2回目以降の場合における取得画像データ42Cの例を説明する図である。図17には、図13との対応部分に対応する符号を付して示している。
図17の場合、「123仕様書」の「GGGGG」画像と、同仕様書の「HHHHH」画像と、同仕様書の「IIIII」画像について「更新あり」が記録されている。
図18は、管理者による前回の確認に応じて登録された管理データの例を示す図である。図18には、図15との対応部分に対応する符号を付して示している。
図18に示す管理データは、図15において「更新しない」との指示が与えられた画像データの情報に対応する。
図11の説明に戻る。
CPU41Aは、ステップ8において、ウェブサイト10から取得された画像データのうち更新があった画像データと、文書データから取得されている最新の画像データとを比較する。
図19は、ウェブサイト10において取得された画像データと文書データにおいて取得された画像データを比較した結果の例を説明する図である。図19には、図14との対応部分に対応する符号を付して示している。
図19では、矢印で示した行以外は、マッチ率が100%の場合、又は0%の場合、又は、前回の確認において管理者が「更新しない」を指示した場合である。
例えば「456手順書」の「LLLLL」画像については、「AAAAA」画像とのマッチ率が10%であるが、矢印は付していない。同様に、「123仕様書」の「IIIII」画像については、「CCCCC」画像とのマッチ率が60%であるが、矢印は付していない。また、「456手順書」の「KKKKK」画像については、「CCCCC」画像とのマッチ率が20%であるが、矢印は付していない。
このため、管理者には、「123仕様書」の「GGGGG」画像と、「456手順書」の「JJJJJ」画像と、「789マニュアル」の「MMMMM」画像と、「123仕様書」の「HHHHH」画像と、「456手順書」の「KKKKK」画像の5つが通知される。
図20は、管理者による画像データに対する更新の必要性の有無を受け付けた結果の例を示す図である。
図20の場合、新たに通知された5つの画像データについて「更新する」が選択された状態を表している。
このように、管理者は、ウェブサイト10上で更新があった画像データであった場合、対応する文書データに含まれる画像データの更新の必要性を少ない負担で判断することが可能になる。また、更新すべき画像データを見落とす可能性も低減される。
<他の実施の形態>
以上、本発明の実施の形態について説明したが、本発明の技術的範囲は前述した実施の形態に記載の範囲に限定されない。前述した実施の形態に、種々の変更又は改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
例えば前述の実施の形態におけるプロセッサは、広義的な意味でのプロセッサを指し、汎用的なプロセッサ(例えばCPU等)の他、専用的なプロセッサ(例えばGPU、ASIC(=Application Specific Integrated Circuit)、FPGA、プログラム論理デバイス等)を含む。
また、前述した各実施の形態におけるプロセッサの動作は、1つのプロセッサが単独で実行してもよいが、物理的に離れた位置に存在する複数のプロセッサが協働して実行してもよい。また、プロセッサにおける各動作の実行の順序は、前述した各実施の形態に記載した順序のみに限定されるものでなく、個別に変更してもよい。
1…情報処理システム、10…ウェブサイト、20…インターネット、40…更新管理サーバ、50…端末、60…LAN、411…画像データ取得部、412…更新確認部、413…画像データ取得部、414…更新確認部、415…データ比較部、416…管理者通知部、417…修正受付部

Claims (8)

  1. プロセッサを有し、
    前記プロセッサは、
    監視の対象とするウェブサイトから、更新を含む第1の画像データを取得し、
    監視の対象とする文書データから第2の画像データを取得し、
    前記第1の画像データと前記第2の画像データを比較し、変化の可能性がある箇所を前記文書データの管理者に通知する
    情報処理装置。
  2. 前記プロセッサは、前記第1の画像データと前記第2の画像データの一致率が予め定めた条件を満たす場合、当該第2の画像データを修正の可能性がある箇所として通知する、請求項1に記載の情報処理装置。
  3. 前記予め定めた条件は、前記一致率が第1の閾値より低いことである、請求項2に記載の情報処理装置。
  4. 前記予め定めた条件は、前記第1の閾値より小さい第2の閾値より前記一致率が高いことである、請求項3に記載の情報処理装置。
  5. 前記プロセッサは、前記第2の閾値より前記一致率が小さい場合、前記第2の画像データを通知の対象から除外する、請求項4に記載の情報処理装置。
  6. 前記プロセッサは、前記管理者に対し、通知の対象である前記第2の画像データの修正の要否の確認を要求する、請求項1に記載の情報処理装置。
  7. 前記プロセッサは、修正が不要と指示された前記第2の画像データを次回以降の比較の対象から除外する、請求項6に記載の情報処理装置。
  8. コンピュータに、
    監視の対象とするウェブサイトから、更新を含む第1の画像データを取得する機能と、
    監視の対象とする文書データから第2の画像データを取得する機能と、
    前記第1の画像データと前記第2の画像データを比較し、変化の可能性がある箇所を前記文書データの管理者に通知する機能と
    を実現させるプログラム。
JP2020105584A 2020-06-18 2020-06-18 情報処理装置及びプログラム Pending JP2021197099A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020105584A JP2021197099A (ja) 2020-06-18 2020-06-18 情報処理装置及びプログラム
CN202011421914.7A CN113821752A (zh) 2020-06-18 2020-12-08 信息处理装置、信息处理方法以及计算机可读介质
US17/114,723 US20210397872A1 (en) 2020-06-18 2020-12-08 Information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020105584A JP2021197099A (ja) 2020-06-18 2020-06-18 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2021197099A true JP2021197099A (ja) 2021-12-27

Family

ID=78924914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020105584A Pending JP2021197099A (ja) 2020-06-18 2020-06-18 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US20210397872A1 (ja)
JP (1) JP2021197099A (ja)
CN (1) CN113821752A (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7283267B2 (en) * 2001-02-19 2007-10-16 Minolta Co., Ltd. Data processing device, data processing method, and data processing program for recognizing characters in a URL
JP2006332912A (ja) * 2005-05-24 2006-12-07 Sharp Corp 画像形成装置、画像検索方法、制御プログラムおよびコンピュータ読取り可能な記録媒体ならびに画像検索装置
US9262396B1 (en) * 2010-03-26 2016-02-16 Amazon Technologies, Inc. Browser compatibility checker tool
CN109195568A (zh) * 2016-06-17 2019-01-11 株式会社汤山制作所 检验辅助系统和药品分发装置
US10218728B2 (en) * 2016-06-21 2019-02-26 Ebay Inc. Anomaly detection for web document revision

Also Published As

Publication number Publication date
CN113821752A (zh) 2021-12-21
US20210397872A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US11768848B1 (en) Retrieving, modifying, and depositing shared search configuration into a shared data store
US11436268B2 (en) Multi-site cluster-based data intake and query systems
US10621211B2 (en) Language tag management on international data storage
US8181071B2 (en) Automatically managing system downtime in a computer network
US9703554B2 (en) Custom code migration suggestion system based on actual change references
US9753954B2 (en) Data node fencing in a distributed file system
US20160266977A1 (en) Information processing system, information processing apparatus, and information processing method
JP2020013400A (ja) 装置およびコンピュータプログラム
US20140289370A1 (en) Log management system, log management method, image forming apparatus and control method thereof, and non-transitory computer-readable medium
JP6865042B2 (ja) ナレッジ管理装置、ナレッジ管理方法およびコンピュータプログラム
US8903774B2 (en) Techniques for leveraging replication to provide rolling point in time backup with simplified restoration through distributed transactional re-creation
JP2021197099A (ja) 情報処理装置及びプログラム
US20170078509A1 (en) Information processing system and information processing method
US10438011B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2005276042A (ja) システム監視業務支援システム及び支援プログラム
JP5578106B2 (ja) 情報処理システム及び帳票イメージ保管サーバ
US11310386B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP7119582B2 (ja) 情報処理システム、及び管理サーバ
US20230053643A1 (en) Information processing device, information processing system, and non-transitory computer readable medium
JP2023107599A (ja) インシデント管理装置、及びインシデント管理方法
JP2010257019A (ja) 文書管理装置、文書管理方法およびそのプログラム
JP2018156525A (ja) 情報処理装置、情報処理システム、処理実行方法、およびプログラム
CN107632805B (zh) 终端设备和终端控制方法
JP2024043377A (ja) 情報処理装置及びプログラム
JP2022115738A (ja) プログラム及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240409