CN113821752A - 信息处理装置、信息处理方法以及计算机可读介质 - Google Patents

信息处理装置、信息处理方法以及计算机可读介质 Download PDF

Info

Publication number
CN113821752A
CN113821752A CN202011421914.7A CN202011421914A CN113821752A CN 113821752 A CN113821752 A CN 113821752A CN 202011421914 A CN202011421914 A CN 202011421914A CN 113821752 A CN113821752 A CN 113821752A
Authority
CN
China
Prior art keywords
image data
image
data
acquired
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011421914.7A
Other languages
English (en)
Inventor
朴永根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN113821752A publication Critical patent/CN113821752A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Library & Information Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供信息处理装置、信息处理方法以及计算机可读介质。信息处理装置具有处理器,所述处理器从作为监视对象的网站取得包含更新的第1图像数据,从作为监视对象的文档数据取得第2图像数据,对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。

Description

信息处理装置、信息处理方法以及计算机可读介质
技术领域
本发明涉及信息处理装置、信息处理方法以及计算机可读介质。
背景技术
业务方面的文档会被连续修改。例如,在手册中使用的图像会根据在实际产品中使用的画面的变更而被修改。然而,有时需要确认手册等文档中被进行修改的位置。在该情况下,将修改后的文档(以下,也称为“最新文档”)与修改前的文档(以下,也称为“现有文档”)进行比较,确定被进行了修改的位置。并且,作为相关技术文献,例如可举出日本特开2013-8147号公报。
为了确定被进行了修改的位置,需要作为比较对象的现有文档和最新文档这两者。即,需要对现有文档进行了修改后的最新文档。
然而,业务上所要求的匹配性不一定仅是在具有连续性关系的文档之间。例如在网站与其使用手册、过程书、说明书等之间也要求匹配性。
但是,网站和使用手册等是不同的介质,关联的文档的数量也多。并且,网站与相对于使用手册等现有文档的最新文档没有关联。因此,即使网站的图像被修改,也不容易从对应的文档内找到需要修改的图像。
发明内容
本发明的目的在于,与为了确定需要确认的位置而需要存在最新文档的情况相比,减轻作业者的负担。
根据本发明的第1方案,提供信息处理装置,该信息处理装置具有处理器,所述处理器从作为监视对象的网站取得包含更新的第1图像数据,从作为监视对象的文档数据取得第2图像数据,对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
根据本发明的第2方案,在所述第1图像数据与所述第2图像数据的一致率满足预先规定的条件的情况下,所述处理器将该第2图像数据作为有可能要进行修改的部位来进行通知。
根据本发明的第3方案,在所述预先规定的条件中,所述一致率比第1阈值低。
根据本发明的第4方案,在所述预先规定的条件中,所述一致率比小于所述第1阈值的第2阈值高。
根据本发明的第5方案,在所述一致率比所述第2阈值小的情况下,所述处理器将所述第2图像数据从通知的对象中排除。
根据本发明的第6方案,所述处理器请求所述管理者确认是否需要对作为通知的对象的所述第2图像数据进行修改。
根据本发明的第7方案,所述处理器将被指示为不需要修改的所述第2图像数据从下次以后的比较对象中排除。
根据本发明的第8方案,提供计算机可读介质,其存储使计算机执行处理的程序,其中,
所述处理具有如下的工序:从作为监视对象的网站取得包含更新的第1图像数据;从作为监视对象的文档数据取得第2图像数据;以及对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
根据本发明的第9方案,提供信息处理方法,该信息处理方法具有如下的工序:从作为监视对象的网站取得包含更新的第1图像数据;从作为监视对象的文档数据取得第2图像数据;以及对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
(效果)
根据所述第1方案,与为了确定要确认的位置而需要存在最新文档的情况相比,能够减轻作业者的负担。
根据所述第2方案,能够通知需要修改的可能性较高的第2图像数据。
根据所述第3方案,能够将有可能由于多重显示的信息而导致一致率下降的图像从有可能修改的部位中去除。
根据所述第4方案,能够选择性地通知需要修改的可能性较高的图像。
根据所述第5方案,能够将没有连续性的图像从有可能修改的位置中排除。
根据所述第6方案,能够将管理者的判断记录为通知的结果。
根据所述第7方案,能够将被管理者否定了修改的可能性的部位从下次的通知对象中排除。
根据所述第8方案,与为了确定要确认的位置而需要存在最新文档的情况相比,能够减轻作业者的负担。
根据所述第9方案,与为了确定要确认的位置而需要存在最新文档的情况相比,能够减轻作业者的负担。
附图说明
图1是示出在实施方式中设想的信息处理系统的结构例的图。
图2是对更新管理服务器的硬件上的结构例进行说明的图。
图3是对更新管理服务器的功能上的结构例进行说明的图。
图4是对作为由图像数据取得部监视的对象的网站和所取得的图像数据的信息进行说明的图。(A)示出网站的图像例,(B)示出取得图像数据的例子。
图5是对更新确认部的比较结果进行说明的图。
图6是对作为图像数据取得部所取得的对象的文档数据和所取得的图像数据的信息进行说明的图。(A)示出文档数据的例子,(B)示出取得图像数据的例子。
图7是对更新确认部的比较结果进行说明的图。
图8是对数据比较部的图像数据之间的比较结果的例子进行说明的图。
图9是对管理者的终端所显示的画面的一例进行说明的图。
图10是示出反映了管理者的修改有无的指示的比较结果数据的例子的图。
图11是对由更新管理服务器执行的处理动作进行说明的流程图。
图12是示出从网站取得的图像数据的列表的图。
图13是示出由文档数据DB管理的文档数据的管理数据和从文档数据DB取得的图像数据的列表的图。(A)是由文档数据DB管理的文档数据的管理数据,(B)是取得图像数据的列表。
图14是说明对在网站中取得的图像数据和在文档数据中取得的图像数据进行比较的结果的例子的图。
图15是示出受理了管理者对是否需要更新图像数据的指示的结果的例子的图。
图16是对从网站取得图像数据为第2次以后的情况下的取得图像数据的例子进行说明的图。
图17是对从文档数据取得图像数据为第2次以后的情况下的取得图像数据的例子进行说明的图。
图18是示出根据管理者的上次确认而登记的管理数据的例子的图。
图19是说明对在网站中取得的图像数据和在文档数据中取得的图像数据进行比较的结果的例子的图。
图20是示出受理了管理者对是否需要更新图像数据的指示的结果的例子的图。
具体实施方式
以下,参照附图对实施方式进行详细说明。
<实施方式>
<系统结构>
图1是示出在实施方式中设想的信息处理系统1的结构例的图。
图1所示的信息处理系统1由作为监视对象的网站10、因特网20、与监视对象相关联的文档数据的数据库(以下,称为“文档数据DB”)30、更新管理服务器40、管理者操作的终端50、LAN(=Local Area Network:局域网)60构成。
本实施方式的网站10被赋予了WWW(=World Wide Web:万维网)上的地址,是指能够从外部装置访问的图像数据。因此,网站10存在的场所不限于服务器上,可以是能够与外部进行通信的装置或机器。
在本实施方式的网站10中还包含机器的操作面板的图像、对应着操作系统或固件的版本升级等显示的确认用的图像、应用软件的用户界面的图像。
虽然在图1的情况下网站10存在于因特网20上,但也可以存在于LAN 60上。
文档数据DB 30是存储有与作为监视对象的网站10相关联的文档数据的存储器。在图1的情况下,文档数据DB 30存在于LAN 60上,但也可以存在于因特网20上。在本实施方式的情况下,文档数据例如是使用手册、过程书、说明书。
更新管理服务器40提供如下的功能:对网站10中的图像更新进行监视,检测出所关联的文档数据中的非常需要修改的图像并通知给管理者。更新管理服务器40是信息处理装置的一例。
终端50是所谓的计算机,设想台式计算机或笔记本型计算机。当然,终端50也可以是智能手机或平板型的终端。
<更新管理服务器40的结构>
图2是对更新管理服务器40的硬件上的结构例进行说明的图。
更新管理服务器40具有对装置整体的动作进行控制的控制单元41、存储数据的存储装置42、输入输出端口43以及通信装置44。
控制单元41具有CPU(=Central Processing Unit:中央处理器)41A、存储有BIOS(=Basic Input Output System:基本输入输出系统)等的ROM(=Read Only Memory:只读存储器)以及作为工作区使用的RAM(=Random Access Memory:随机存取存储器)。控制单元41作为所谓的计算机而发挥功能。CPU 41A是处理器的一例。
存储装置42例如由半导体存储器或硬盘装置构成。在存储装置42中存储有操作系统或实现在本实施方式中提出的功能的程序。
此外,在本实施方式的存储装置42中存储有从网站10(参照图1)取得的图像数据(以下,也称为“取得图像数据”)42A、被认为在最新的取得图像数据42A和上次的取得图像数据42A之间存在更新的可能性的图像数据(以下,也称为“更新图像数据”)42B、从文档数据DB 30(参照图1)取得的图像数据(以下,也称为“取得图像数据”)42C、被认为在最新的取得图像数据42C与上次的取得图像数据42C之间存在更新的可能性的图像数据(以下,也称为“更新图像数据”)42D、被检测到更新的网站10侧的图像与文档数据侧的图像的比较结果(以下,称为“比较结果数据”)42E。
图3是对更新管理服务器40的功能上的结构例进行说明的图。图3所示的功能上的结构通过程序的执行来实现。
更新管理服务器40的功能部具有:图像数据取得部411,其从网站10取得图像数据;更新确认部412,其在取得图像数据42A中确认更新的可能性的图像数据;图像数据取得部413,其从文档数据DB 30取得图像数据;更新确认部414,其在取得图像数据42C中确认更新的可能性较高的图像数据;数据比较部415,其对从网站10取得的更新图像数据42B和从文档数据取得的更新图像数据42D进行比较;管理者通知部416,其根据比较结果数据42E而向管理者通知存在更新的可能性较高的图像数据的情况;以及修改受理部417,其受理管理者对所通知的图像数据进行确认的确认结果或管理者下达的修改指示。
取得图像数据42A是第1图像数据的一例,取得图像数据42C是第2图像数据的一例。
图像数据取得部411取得由管理者指定为监视对象的特定的网站10中所包含的图像数据。作为监视对象的网站10通过URL(=Uniform Resource Locator:统一资源定位符)、域以下的URL等来指定。如上所述,在网站中还包含机器的操作面板等的图像。另外,URL也可以从开发中使用的源代码等中取得。并且,管理者等也可以事先将所取得的URL的一部分指定为监视对象。
除了个别指定之外,特定的网站10还可以通过站点的种类、公司名称、服务名等来确定。
另外,图像数据取得部411也可以是从因特网上自动地收集图像数据的应用软件(以下,也称为“机器人程式”)。
图4是对作为由图像数据取得部411(参照图3)监视的对象的网站10和所取得的图像数据的信息进行说明的图。(A)示出网站10的图像例,(B)示出取得图像数据42A的例子。
图4的(A)表示由“aaa服务/ttta”确定的网站10。
图像数据取得部411取得网站10所包含的“AAAAA”图像11。
在图4的(B)的例子中,设想了在网站10的1页中包含1个图像的情况,但在1页中也可以包含多个图像。在该情况下,对每个图像数据赋予不同的名称来进行管理。
如图4的(B)所示,在取得图像数据42A中,将确定作为获取源的网站10的URL和进行取得的日期关联起来。在图4的情况下,日期是日期时间。在本实施方式的情况下,图像数据取得部411每天1次地从作为监视对象的网站10取得图像数据。另外,每天1次是一例,也可以是1小时1次,几个小时1次等。
回到图3的说明。
更新确认部412提供如下的功能:对上一次取得的图像数据和最新的图像数据进行比较,确认在从上一次进行取得至本次的取得之间的期间图像数据是否有更新。
在本实施方式的情况下,更新确认部412使用匹配率来判定更新的有无。匹配率为100%意味着两个图像一致,匹配率为0%意味着图像完全不同。图像的一部分有变化的情况下的匹配率根据变化的多少而取100%到0%之间的中间值。
图5是对更新确认部412(参照图3)的比较结果进行说明的图。图5所示的例子表示针对通过“aaa服务/ttta”而确定的网站10、通过“aaa服务/tttb”而确定的网站10、和通过“aaa服务/tttc”而确定的网站10分别进行比较的结果。另外,虽然在图5中进行了省略,但剩余的3个网站10也同样存在比较结果。
在图5的情况下,对从相同的网站10取得的取得图像数据42A的文件名添加日期的信息。
在图5的情况下,在1个网站10中存储有2个取得图像数据42A。1个是在2月21日取得的取得图像数据42A,1个是在2月22日取得的取得图像数据42A。
在图5的情况下,针对通过“aaa服务/ttta”而确定的网站10,在2月21日取得的“AAAAA_0221”图像与前一天取得的“AAAAA_0220”图像的匹配率为100%。
但是,在2月22日取得的“AAAAA_0222”图像与前一天取得的“AAAAA_0221”图像的匹配率下降到95%。这里的匹配率对应“一致率”。
同样,针对通过“aaa服务/tttb”确定的网站10,在2月21日取得的“BBBBB_0221”图像与前一天取得的“BBBBB_0220”图像的匹配率为100%。
但是,在2月22日取得的“BBBBB_0222”图像与前一天取得的“BBBBB_0221”图像的匹配率下降到50%。
因此,更新确认部412将“AAAAA_0222”图像和“BBBBB_0222”图像作为更新图像数据42B而输出。
另外,在用来判定更新的匹配率中也可以使用阈值。阈值例如为96%。这是因为考虑到匹配误差的可能性。这里的96%是第1阈值的一例。
在全部的取得图像数据42A没有更新的可能性的情况下,更新确认部412不输出更新图像数据42B并结束处理。
回到图3的说明。
图像数据取得部413从存储于文档数据DB 30的文档数据中取得图像数据。作为监视对象的文档数据,事先指定与作为图像数据取得部411的取得对象的网站相关联的文档数据。当然,也可以将存储于文档数据DB 30的全部的文档数据设为监视对象。
图6是对作为图像数据取得部413(参照图3)的取得对象的文档数据和所取得的图像数据的信息进行说明的图。(A)示出文档数据的例子,(B)示出取得图像数据42C的例子。
图6的(A)所例示的文档数据的文件名是“789手册.html”。图像数据取得部413取得“789手册”所包含的“MMMMM”图像31。
在图6的(B)的例子中,从“123说明书”取得3个图像数据,从“456过程书”取得3个图像数据,从“789手册”取得2个图像数据。
如图6的(B)所示,在取得图像数据42C中,确定文档数据的文件名和所取得的日期被关联起来。在图6的情况下,创建日期是日期时间。在本实施方式的情况下,图像数据取得部413在文档数据被更新的情况下取得图像数据。
回到图3的说明。
更新确认部414提供如下的功能:对上一次取得的图像数据和最新的图像数据进行比较,确认在上一次取得起至本次的取得的期间图像数据是否有更新。
更新确认部414也使用匹配率来判定更新的有无。在匹配率为100%的情况下意味着2个图像一致,在0%的情况下意味着2个图像完全不同。图像的一部分存在变化的情况下的匹配率根据变化的多少而取100%到0%之间的中间值。另外,考虑到误差,小于5%实际上可以视为0%。这里的5%是第2阈值的一例。
更新确认部414的目的在于取得文档数据的最新的图像数据。
图7是对更新确认部414的比较结果进行说明的图。在图7的情况下,对从相同的文档数据取得的取得图像数据42C的文件名添加创建或修改后的日期的信息和匹配率。
在图7的情况下,针对“123说明书”,在2月18日取得的“GGGGG_0218”图像与上次取得的未图示的图像的匹配率为100%。但是,在2月23日取得的“GGGGG_0223”图像与上次取得的“GGGGG_0218”图像的匹配率下降到95%。
另外,在判定更新的匹配率中也可以使用阈值。阈值的上限例如为96%。考虑通过单帧采集而取得的图像数据中混入有标题等的可能性。
在全部的取得图像数据42C没有更新的可能性的情况下,更新确认部414不输出更新图像数据42D并结束处理。
回到图3的说明。
数据比较部415比较对网站10进行确认得到的更新图像数据42B和对文档数据进行确认得到的更新图像数据42D,并输出比较结果。在本实施方式的情况下,作为比较结果而输出匹配率。
在本实施方式的情况下,作为阈值使用给出上限的阈值和给出下限的阈值这两者。给出上限的阈值是第1阈值的一例,其目的在于排除由于标题等而降低了匹配率的图像数据。给出下限的阈值是第2阈值的一例,其用于排除掉更新成完全不同的图像的情况。
图8是对基于数据比较部415(参照图3)对图像数据间进行比较的比较结果的例子进行说明的图。
在图8的情况下,将从网站10取得的“AAAAA”图像分别与文档数据的“123说明书”中所包含的“GGGGG”图像、“HHHHH”图像、“IIIII”图像、文档数据的“456过程书”中所包含的“JJJJJ”图像、“KKKKK”图像、“LLLLL”图像、文档数据的“789手册”中所包含的“MMMMM”图像、“NNNNN”图像进行比较。
在图8的情况下,从网站10取得的“AAAAA”图像与从“123说明书”取得的“GGGGG”图像的匹配率是100%。
并且,从网站10取得的“AAAAA”图像与“123说明书”中所包含的“HHHHH”图像和“IIIII”图像、“456过程书”中所包含的“KKKKK”图像和“LLLLL”图像、“789手册”中所包含的“NNNNN”图像的匹配率是0%。
另外,从网站10取得的“AAAAA”图像与“456说明书”中所包含的“JJJJJ”图像之间的匹配率是90%,从网站10取得的“AAAAA”图像与“789手册”中所包含的“MMMMM”图像的匹配率是50%。
并且,从网站10取得的“BBBBB”图像与“123说明书”所包含的“HHHHH”图像的匹配率是90%。
回到图3的说明。
管理者通知部416是将具有需要管理者确认的匹配率的图像数据通知给管理者的终端50(参照图1)的功能部。
图9是对管理者的终端50所显示的画面51的一例进行说明的图。
在图9所示的画面51上并排显示有与网站10的“AAAAA”图像之间的匹配率为90%的“456过程书”的“JJJJJ”图像、与网站10的“AAAAA”图像之间的匹配率为50%的“789手册”的“MMMMM”图像、与网站10的“BBBBB”图像之间的匹配率为90%的“123说明书”的“HHHHH”图像。
“AAAAA”图像和“BBBBB”图像是网站10的更新图像数据42B,“JJJJJ”图像、“MMMMM”图像以及“HHHHH”图像是文档数据的更新图像数据42D。
在图9的情况下,与对应的图像相关联地配置有匹配率的数值和用于输入对应的文档数据有无修改的栏。在图9中,在用于输入有无修改的栏中显示有带“修改有无”的标题,在该栏中显示有带“修改”的标签的按钮52和带“不修改”的标签的按钮53。
管理者一边确认实际的图像,一边判断修改的有无并对按钮52或53进行操作。
回到图3的说明。
修改受理部417是受理对被管理者选择了“修改”的更新图像数据42D进行的修改的功能部。
另外,在管理者选择了“修改”,但对应的文档数据的更新图像数据42D没有被执行的情况下,修改受理部417通过管理者通知部416将催促修改的邮件发送给管理者。
图10是示出反映出管理者针对有无修改下达的指示的比较结果数据42E的例子的图。图10所示的比较结果数据42E与图8所示的比较结果数据42E对应。
图10所示的比较结果数据42E用于管理修改受理部417。在图10的情况下,仅对“789手册”的“MMMMM”图像记录了“修改”,对“456过程书”的“JJJJJ”图像和“123说明书”的“HHHHH”图像记录了“不修改”。
无论是哪一个图像,管理者的确认日都是“2020/02/23”。
在图10的情况下,对“JJJJJ”图像和“HHHHH”图像记录了“不修改”,但实际上是管理者判断不需要修改的结果。
例如从网站10取得的图像数据是通过某个瞬间的单帧采集而取得的。因此,在位置或内容随时间变化的标题广告等与网站10的“AAAAA”图像或“BBBBB”图像重叠显示的情况下,匹配率有可能下降。
然而,在标题广告等的背后显示的图像数据可能与文档数据侧的图像数据相同。图10的“不修改”表示的就是这样的例子。
另外,在受理了“修改”的指示的情况下,修改受理部417指示从网站10取得图像数据的图像数据取得部411和从文档数据DB 30取得图像数据的图像数据取得部413再次进行取得,并重复一系列的比较。
只要用户将文档数据修正为正确的图像数据,则在再次确认中全部的图像数据的匹配率为100%,循环处理结束。
<处理动作>
以下,对由在实施方式中设想的信息处理系统1执行的处理动作进行说明。
以下,对初次执行确认更新的程序的情况的动作(以下,称为“初次动作”)和第2次以后的动作进行说明。
<初次的动作>
图11是对由更新管理服务器40执行的处理动作进行说明的流程图。图中所示的标号的S的意思是步骤。
开始了处理的CPU 41A(参照图2)从网站10取得图像数据(步骤1)。
在本实施方式的情况下,图像数据是指例如具有JPEG(=Joint PhotographicExperts Group)、PNG(=Portable Network Graphics)、GIF(=GraphicsInterchangeFormat)的数据格式的数据。
CPU 41A从网站10取得图像数据的范围例如是由作为管理者的D先生使用终端50(参照图1)来设定的。
管理者的D先生例如对新服务A设定取得的范围。范围的指定例如通过“www.fujixerox.co.jp/aaa服务/ttt*”来进行。这里的*是任意的意思。因此,“aaa服务”的“ttt*”所确定的全部的网站都包含在检索范围内。
CPU 41A定期地访问所指定的网站10,取得各网站10所包含的图像数据。例如每天取得1次。
当取得图像数据时,CPU 41A对所取得的图像数据确认有无更新(步骤2),接着,判定图像数据是否有更新(步骤6)。
由于本次的处理动作是初次的动作,所以CPU 41A在步骤6中获得肯定结果。在得到肯定结果的情况下,CPU 41A保存存在更新的图像数据(步骤7)。在本次的情况下,CPU41A保存从网站10取得的全部的图像数据。
另外,当在步骤6中得到否定结果的情况下,CPU 41A结束处理。
图12是示出从网站10取得的图像数据(即取得图像数据42A)的列表的图。在图12的情况下,从针对“aaa服务”而设定的网站10取得6个图像数据。
回到图11的说明。
与步骤1并行地,CPU 41A从文档数据DB 30的文档数据取得图像数据(步骤3)。
CPU 41A从文档数据DB 30取得图像数据的范围例如也是由作为管理者的D先生使用终端50来设定的。作为管理者的D先生例如将文档数据DB 30的“管理文件夹”设定为取得图像数据的场所。另外,作为管理者的D先生还设定执行从网站10取得的图像数据和从文档数据取得的图像数据的比较的时刻。例如设定为每天的上午1点。
图13是示出由文档数据DB 30管理的文档数据的管理数据和从文档数据DB 30取得的图像数据(即取得图像数据42C)的列表的图。(A)是由文档数据DB 30管理的文档数据的管理数据,(B)是取得图像数据42C的列表。
图13所示的管理数据由创建文档数据的负责人、与文档数据相关联的服务、文件名、登记日、数据大小、访问权限、更新日构成。在图13的情况下,与“aaa服务”相关的文档数据是管理的对象。
图13所示的取得图像数据42C由文件名、取得图像数据、创建日期构成。在图13的情况下,从与“aaa服务”相关联的“管理文件夹”取得8个图像数据。
回到图11的说明。
当从文档数据取得图像数据时,CPU 41A判定文档数据是否有更新(步骤4)。
由于本次的处理动作是初次的动作,所以CPU 41A在步骤4中得到肯定结果。另外,当在步骤4中得到否定结果的情况下,CPU 41A结束对文档数据的处理。
当在步骤4中得到肯定结果的情况下,CPU 41A对所取得的图像数据确认有无更新(步骤5),接着,判定图像数据是否有更新(步骤6)。
由于本次的处理动作是初次的动作,所以CPU 41A在步骤6中得到肯定结果。在得到肯定结果的情况下,CPU 41A保存存在更新的图像数据(步骤7)。在本次的情况下,CPU41A保存从文档数据取得的全部的图像数据。
通过该判定,从文档数据取得的图像数据始终被维持为最新的状态。
接着,CPU 41A对网站10的图像数据和文档数据的图像数据进行比较(步骤8)。
图14是说明对在网站10中取得的图像数据和在文档数据中取得的图像数据进行比较的结果的例子的图。
图14所示的例子示出了从网站10取得的6个图像数据与从文档数据取得的8个图像数据的比较结果。另外,在图14中,针对从网站10取得的6个图像数据中的3个图像数据例示了比较结果,对其他的3个图像数据省略了比较结果。
在图14中,除了用箭头表示的行以外,匹配率是100%或0%。匹配率为100%意味着2个图像相同。另一方面,匹配率为0%意味着2个图像完全不同。
无论是哪一种情况,都不需要文档数据的管理者对文档数据内的图像数据的更新进行确认。
在图14的例子中,针对“aaa服务/ttta”的“AAAAA”图像,存在3个文档数据被箭头表示。针对“aaa服务/tttb”的“BBBBB”图像,存在1个文档数据被箭头表示。针对“aaa服务/tttc”的“CCCCC”图像,存在2个文档数据被箭头表示。
回到图11的说明。
当步骤8的比较结束时,CPU 41A判定匹配率是否为100%或0%(步骤9)。
在全部的比较结果的匹配率是100%或0%的情况下,CPU 41A得到肯定结果而结束一系列的处理。这是因为不需要文档数据的管理者进行确认。
另外,当在步骤9中得到否定结果的情况下,CPU 41A通知文档数据的管理者存在需要确认的图像数据(步骤10)。该通知例如以电子邮件的方式被发送到管理者的终端50。
之后,CPU 41A根据来自管理者的终端50的通知,判定是否有修改(步骤11)。在需要修改的连一个都没有的情况下,CPU 41A在步骤11中得到否定结果而结束一系列的处理。
另一方面,当在步骤11中得到肯定结果的情况下,CPU 41A返回到步骤8,将存在更新的图像数据与网站10的图像数据再次进行比较。由此,能够确认可否修改。
图15是示出受理了管理者的是否需要对图像数据进行更新的指示的结果的例子的图。
在图15的情况下,对“456过程书”的“JJJJJ”图像、“789手册”的“MMMMM”图像以及“123说明书”的“HHHHH”图像这3个图像数据选择了“更新”,对其他3个图像数据选择了“不更新”。
<第2次以后的动作>
以下,对第二次以及以后从网站10取得图像数据的情况下的处理动作进行说明。该处理动作也是基于图11所示的流程图来执行的。
在该处理动作的情况下,CPU 41A(参照图2)也从网站10取得图像数据(步骤1)。
在本次情况下,在步骤2中,判断出相对于上一次存在更新的图像数据,在发现了存在更新的图像数据的情况下,在步骤6中得到肯定结果,保存更新图像数据42B。
图16是对第2次以及以后从网站10取得图像数据的情况下的图像数据42A的例子进行说明的图。在图16中,对与图12的对应部分标注对应的标号而示出。
在图16的情况下,设想了在上次取得起1天后的“2020/02/22”,在“aaa服务”的一部分网站中有更新,在其他网站中没有更新的情况。
另外,不进行在网站10中是否有更新的判定。因此,从全部的网站10取得全部的图像数据,在步骤6中判定图像数据是否有更新。
在图16的情况下,在各图像数据中,对文件名标注日期而进行管理。例如,将在前一天的“2020/02/21”取得的图像数据作为“AAAAA_0221”图像来管理,将在当天的“2020/02/22”取得的图像数据作为“AAAAA_0222”图像来管理。
在图16所示的表中追加有在前一天取得的图像数据与新取得的图像数据之间的匹配率。
在图16的情况下,“aaa服务”的“ttta”站点所包含的“AAAAA_0222”图像的匹配率下降到95%。并且,“aaa服务”的“tttb”站点所包含的“BBBBB_0222”图像的匹配率下降到50%。因此,这2个图像数据在步骤6中被提取,并作为更新图像数据42B被保存。
回到图11的说明。
另一方面,CPU 41A对存储于文档数据DB 30的文档数据判定有无更新(步骤4)。
在文档数据有更新的记录的情况下,CPU 41A在步骤4中得到肯定结果。在该情况下,CPU 41A将从网站10取得的图像数据中的被发现存在更新的图像数据与在上次获取中取得的图像数据进行比较(步骤8)。
图17是对在第2次以及以后从文档数据取得图像数据的情况下的取得图像数据42C的例子进行说明的图。在图17中,对与图13的对应部分标注对应的标号而示出。
在图17的情况下,在“123说明书”的“GGGGG”图像、该说明书的“HHHHH”图像以及该说明书的“IIIII”图像中记录了“有更新”。
图18是示出根据管理者的上次确认而登记的管理数据的例子的图。在图18中,对与图15的对应部分标注对应的标号而示出。
图18所示的管理数据与在图15中被指示“不更新”的图像数据的信息对应。
回到图11的说明。
CPU 41A在步骤8中对从网站10取得的图像数据中的存在更新的图像数据和从文档数据取得的最新的图像数据进行比较。
图19是说明对在网站10中取得的图像数据和在文档数据中取得的图像数据进行比较的结果的例子的图。在图19中,对与图14的对应部分标注对应的标号而示出。
在图19,除了用箭头表示的行以外,是匹配率为100%的情况或0%的情况,或者在上次确认中管理者指示了“不更新”的情况。
例如,对于“456过程书”的“LLLLL”图像,虽然与“AAAAA”图像之间的匹配率为10%,但没有标注箭头。同样,对于“123说明书”的“IIIII”图像,虽然与“CCCCC”图像之间的匹配率为60%,但没有标注箭头。并且,对于“456过程书”的“KKKKK”图像,虽然与“CCCCC”图像之间的匹配率为20%,但没有标注箭头。
因此,向管理者通知“123说明书”的“GGGGG”图像、“456过程书”的“JJJJJ”图像、“789手册”的“MMMMM”图像、“123说明书”的“HHHHH”图像以及“456过程书”的“KKKKK”图像这5个图像。
图20是示出受理了管理者的是否需要对图像数据进行更新的指示的结果的例子的图。
在图20的情况下,示出了对新通知的5个图像数据选择了“更新”的状态。
这样,当在网站10上有存在更新的图像数据的情况下,管理者能够以较小的负担判断是否需要更新相应的文档数据所包含的图像数据。并且,还降低了忽视掉应该更新的图像数据的可能性。
<其他实施方式>
以上,对本发明的实施方式进行了说明,但本发明的技术范围不限于上述实施方式中记载的范围。从权利要求书的记载中显而易见的是,通过对上述实施方式进行各种变更或改进而获得的实施方式也包括在本发明的技术范围内。
例如上述实施方式的处理器是指广义上的处理器,除了通用的处理器(例如CPU等)之外,还包含专用的处理器(例如GPU、ASIC(=Application Specific IntegratedCircuit)、FPGA、程序逻辑设备等)。
并且,上述各实施方式的处理器的动作可以由1个处理器单独执行,但也可以由物理上分离的位置上所存在的多个处理器协同动作而执行。并且,处理器中的各动作的执行顺序不仅限于上述各实施方式记载的顺序,也可以单独地变更。

Claims (9)

1.一种信息处理装置,其中,
该信息处理装置具有处理器,
所述处理器从作为监视对象的网站取得包含更新的第1图像数据,从作为监视对象的文档数据取得第2图像数据,对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
2.根据权利要求1所述的信息处理装置,其中,
在所述第1图像数据与所述第2图像数据的一致率满足预先规定的条件的情况下,所述处理器将该第2图像数据作为有可能要进行修改的部位来进行通知。
3.根据权利要求2所述的信息处理装置,其中,
所述预先规定的条件是指所述一致率比第1阈值低。
4.根据权利要求3所述的信息处理装置,其中,
所述预先规定的条件是指所述一致率比小于所述第1阈值的第2阈值高。
5.根据权利要求4所述的信息处理装置,其中,
在所述一致率比所述第2阈值小的情况下,所述处理器将所述第2图像数据从通知的对象中排除。
6.根据权利要求1所述的信息处理装置,其中,
所述处理器请求所述管理者确认是否需要对作为通知的对象的所述第2图像数据进行修改。
7.根据权利要求6所述的信息处理装置,其中,
所述处理器将被指示为不需要修改的所述第2图像数据从下次以后的比较对象中排除。
8.一种计算机可读介质,其存储使计算机执行处理的程序,其中,
所述处理具有如下的工序:
从作为监视对象的网站取得包含更新的第1图像数据;
从作为监视对象的文档数据取得第2图像数据;以及
对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
9.一种信息处理方法,该信息处理方法具有如下的工序:
从作为监视对象的网站取得包含更新的第1图像数据;
从作为监视对象的文档数据取得第2图像数据;以及
对所述第1图像数据和所述第2图像数据进行比较,将有可能发生变化的部位通知给所述文档数据的管理者。
CN202011421914.7A 2020-06-18 2020-12-08 信息处理装置、信息处理方法以及计算机可读介质 Pending CN113821752A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-105584 2020-06-18
JP2020105584A JP2021197099A (ja) 2020-06-18 2020-06-18 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
CN113821752A true CN113821752A (zh) 2021-12-21

Family

ID=78924914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011421914.7A Pending CN113821752A (zh) 2020-06-18 2020-12-08 信息处理装置、信息处理方法以及计算机可读介质

Country Status (3)

Country Link
US (1) US20210397872A1 (zh)
JP (1) JP2021197099A (zh)
CN (1) CN113821752A (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7283267B2 (en) * 2001-02-19 2007-10-16 Minolta Co., Ltd. Data processing device, data processing method, and data processing program for recognizing characters in a URL
JP2006332912A (ja) * 2005-05-24 2006-12-07 Sharp Corp 画像形成装置、画像検索方法、制御プログラムおよびコンピュータ読取り可能な記録媒体ならびに画像検索装置
US9262396B1 (en) * 2010-03-26 2016-02-16 Amazon Technologies, Inc. Browser compatibility checker tool
WO2017217366A1 (ja) * 2016-06-17 2017-12-21 株式会社湯山製作所 鑑査支援システム、薬品払出装置
US10218728B2 (en) * 2016-06-21 2019-02-26 Ebay Inc. Anomaly detection for web document revision

Also Published As

Publication number Publication date
JP2021197099A (ja) 2021-12-27
US20210397872A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US8214508B2 (en) Support apparatus, program, information processing system and support method
US10621212B2 (en) Language tag management on international data storage
US20070192871A1 (en) Document management method and apparatus thereof
US11651607B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
EP3121778A1 (en) Information processing apparatus, information processing method, and program
US20110202574A1 (en) Document management device, document management method and computer readable medium
US11531689B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2010191519A (ja) 文書管理装置、方法、及び、プログラム
CN111949607A (zh) 一种udt文件的监控方法、系统和装置
US20070006221A1 (en) Software install environment constructing apparatus
US20210174011A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN113821752A (zh) 信息处理装置、信息处理方法以及计算机可读介质
JP2011253294A (ja) 情報処理装置および制御方法およびプログラム
US10438011B2 (en) Information processing apparatus and non-transitory computer readable medium
US20220083576A1 (en) Information processing system and non-transitory computer readable medium
JP5382303B2 (ja) 情報解析システム、端末装置、サーバ装置、情報解析方法、及びプログラム
CN113033169A (zh) 业务数据处理方法和装置
US8788537B2 (en) Computer readable medium storing information processing program, information processing apparatus, and information processing method
JP6571705B2 (ja) 情報管理装置、情報管理方法及び情報管理プログラム
WO2022107406A1 (ja) 情報処理システム、情報処理方法及び計算機
US11310386B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN107632805B (zh) 终端设备和终端控制方法
JPH10340261A (ja) 文書閲覧システム
US20230409521A1 (en) Automatic preservation
US20230053643A1 (en) Information processing device, information processing system, and non-transitory computer readable medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination