CN111159608A - 信息处理装置、存储介质及信息处理方法 - Google Patents

信息处理装置、存储介质及信息处理方法 Download PDF

Info

Publication number
CN111159608A
CN111159608A CN201910368747.5A CN201910368747A CN111159608A CN 111159608 A CN111159608 A CN 111159608A CN 201910368747 A CN201910368747 A CN 201910368747A CN 111159608 A CN111159608 A CN 111159608A
Authority
CN
China
Prior art keywords
information
user
processing apparatus
job
availability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910368747.5A
Other languages
English (en)
Inventor
宇野渉
尾崎良太
加藤典司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN111159608A publication Critical patent/CN111159608A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Abstract

一种信息处理装置、存储介质及信息处理方法,信息处理装置具备:获取部,从用户所浏览的多个第一信息获取所述第一信息中所记载的内容的信息即内容信息;提取部,从由所述用户进行作业的对象即第二信息提取由所述用户进行了编辑的部分;及确定部,在所述多个第一信息中,从所述内容信息确定所述用户在对所述部分进行编辑时或编辑前后浏览的第一信息。

Description

信息处理装置、存储介质及信息处理方法
技术领域
本发明涉及一种信息处理装置、存储介质及信息处理方法。
背景技术
例如,专利文献1中记载有一种服务器装置,其能够提高对网页等的用户的关注度的精度。该服务器装置具备:信息获取单元,从终端装置获取终端装置对显示区域的滚动操作信息和用于确认显示在显示区域的内容的内容确定信息;及关注度计算单元,根据所获取的滚动操作信息,计算对通过所获取的内容确定信息确定的内容的用户的关注度。并且,该关注度计算单元在根据滚动操作信息计算关注度时,根据与对影响用户掌握目录的内容的时间的参数对应的加权调整关注度。
专利文献1:日本专利第5185240号公报
然而,当参考多个网页的记载进行信息的编辑时,有时存在在进行编辑时有用的网页和无用的网页。
发明内容
本发明的目的在于提供一种信息处理装置、存储介质及信息处理方法,该信息处理装置中,当利用第一信息的记载进行第二信息的编辑时,能够确定对第二信息中的某一部分进行了编辑时所使用的第一信息。
为了实现上述目的,第1方式所涉及的信息处理装置,其具备:获取部,从用户所浏览的多个第一信息获取所述第一信息中所记载的内容的信息即内容信息;提取部,从由所述用户进行作业的对象即第二信息提取由所述用户进行了编辑的部分;及确定部,在所述多个第一信息中,从所述内容信息确定所述用户在对所述部分进行编辑时或编辑前后浏览的第一信息。
并且,第2方式所涉及的信息处理装置,在第1方式所涉及的信息处理装置中,所述获取部还获取与所述用户对所述第一信息进行的操作有关的信息即交互信息,所述确定部还利用所述交互信息,进一步将所述经确定的第一信息确定为具有可用性的第一信息。
并且,第3方式所涉及的信息处理装置,在第2方式所涉及的信息处理装置中,所述交互信息为与所述用户对在所述编辑之前或所述编辑之后浏览的第一信息进行的操作有关的信息。
并且,第4方式所涉及的信息处理装置,在第3方式所涉及的信息处理装置中,所述交互信息包括所述用户从通过所使用的输入设备对所述第一信息进行的操作内容得到的信息。
并且,第5方式所涉及的信息处理装置,在第4方式所涉及的信息处理装置中,所述交互信息还包括所述用户浏览了所述第一信息的时间即浏览时间。
并且,第6方式所涉及的信息处理装置,在第1方式~第5方式中的任一个方式所涉及的信息处理装置中,当通过所述提取部提取的部分被所述用户编辑了2次时,所述确定部将第2次编辑时确定的第一信息确定为可用性比第1次编辑时确定的第一信息高。
并且,第7方式所涉及的信息处理装置,在第6方式所涉及的信息处理装置中,根据从所述内容信息得到的特征量导出表示所述第一信息的可用性的值,所述确定部将表示记载有所述部分中新记载的内容的第一信息的可用性的值输出为比表示最初确定的第一信息的可用性的值大,并且将表示所述最初确定的第一信息的可用性的值输出为比表示所述用户所浏览的第一信息中未确定的第一信息的可用性的值小。
并且,第8方式所涉及的信息处理装置,在第1方式~第5方式中的任一个方式所涉及的信息处理装置中,所述获取部还获取与所述用户在所述第一信息的浏览之前、浏览中及浏览之后中的至少一个时间对所述第二信息进行的作业有关的作业信息,所述确定部还利用所述作业信息进一步将所述经确定的第一信息确定为具有可用性的第一信息。
并且,第9方式所涉及的信息处理装置,在第1方式所涉及的信息处理装置中,所述获取部还获取与所述用户对所述第一信息进行的操作有关的信息即交互信息和与所述用户在所述第一信息的浏览之前、浏览中及浏览之后中的至少一个时间对所述第二信息进行的作业有关的作业信息,所述确定部根据从所述内容信息、所述交互信息及所述作业信息中的至少一个得到的特征量导出表示所述第一信息的可用性的值,并根据所导出的表示可用性的值进一步确定具有可用性的第一信息。
并且,第10方式所涉及的信息处理装置,在第9方式所涉及的信息处理装置中,当根据表示所述可用性的值对所述用户判定为获取所述第一信息的可用性的评价时,所述获取部还从所述用户获取与所述第一信息有关的可用性的评价。
并且,第11方式所涉及的信息处理装置,在第10方式所涉及的信息处理装置中,将所述特征量作为输入,并利用输出表示所述可用性的值的机器学习模型来进行所述具有可用性的第一信息的确定,且还具备更新部,该更新部将通过所述获取部获取的评价与和所述评价对应的特征量的对组作为学习用数据而输入到所述机器学习模型,并更新所述机器学习模型。
而且,为了实现上述目的,第12方式所涉及的存储介质,其存储有使计算机作为第1方式至第11方式中任一方式所涉及的信息处理装置所具备的各部而发挥功能的程序。
而且,为了实现上述目的,第13方式所涉及的信息处理方法,其包括如下步骤:获取步骤,从用户所浏览的多个第一信息获取所述第一信息中所记载的内容的信息即内容信息;提取步骤,从由所述用户进行作业的对象即第二信息提取由所述用户进行了编辑的部分;及确定步骤,在所述多个第一信息中,从所述内容信息确定所述用户在对所述部分进行编辑时或编辑前后浏览的第一信息。
发明效果
根据第1方式、第12方式及第13方式,具有如下效果,即当利用第一信息的记载进行第二信息的编辑时,能够确定对第二信息中的某一部分进行了编辑时所使用的第一信息。
根据第2方式,具有如下效果,即与未利用交互信息的情况相比,能够高精度地确定具有可用性的第一信息。
根据第3方式,具有如下效果,即作为交互信息,与未考虑操作的时间的情况相比,能够有效地进行具有可用性的第一信息的确定。
根据第4方式,具有如下效果,即作为交互信息,与未考虑输入设备的情况相比,能够更适当地进行具有可用性的第一信息的确定。
根据第5方式,具有如下效果,即作为交互信息,与未考虑浏览时间的情况相比,能够更适当地进行具有可用性的第一信息的确定。
根据第6方式,具有如下效果,即与未考虑由用户进行的编辑次数的情况相比,能够高精度地确定具有可用性的第一信息。
根据第7方式,具有如下效果,即与未考虑表示第一信息的可用性的值的情况相比,能够高精度地确定具有可用性的第一信息。
根据第8方式,具有如下效果,即与未利用作业信息的情况相比,能够高精度地确定具有可用性的第一信息。
根据第9方式,具有如下效果,即与未考虑可从内容信息、交互信息及作业信息中的至少一个得到的特征量的情况相比,能够高精度地确定具有可用性的第一信息。
根据第10方式,具有如下效果,即与未考虑用户的评价的情况相比,能够高精度地确定具有可用性的第一信息。
根据第11方式,具有如下效果,即与未将用户的评价与特征量的对组考虑为学习用数据的情况相比,能够高精度地确定具有可用性的第一信息。
附图说明
根据以下附图,对本发明的实施方式进行详细叙述。
图1为表示实施方式所涉及的网络系统的结构的一例的图;
图2为表示实施方式所涉及的服务器装置的电结构的一例的框图;
图3为表示实施方式所涉及的服务器装置的功能性结构的一例的框图;
图4为表示实施方式所涉及的浏览历史记录的一例的图;
图5为表示实施方式所涉及的内容信息的一例的图;
图6为表示实施方式所涉及的交互信息的一例的图;
图7为表示实施方式所涉及的作业信息的一例的图;
图8为表示实施方式所涉及的特征量的一例的图;
图9为表示通过实施方式所涉及的学习处理程序进行的特征量创建处理的流程的一例的流程图;
图10为表示通过实施方式所涉及的学习处理程序进行的学习处理的流程的一例的流程图;
图11为表示通过实施方式所涉及的确定处理程序进行的处理的流程的一例的流程图。
符号说明
10-服务器装置,12-控制部,12A-CPU,12B-ROM,12C-RAM,12D-I/O,14-存储部,14A-学习处理程序,14B-确定处理程序,16-显示部,18-操作部,20-通信部,30-第1获取部,32-导出部,34-生成部,40-第2获取部,42-提取部,44-确定部,46-更新部,50-终端装置,50A-网络浏览器,90-网络系统。
具体实施方式
以下,参考附图,对用于实施本发明一方式的一例进行详细说明。
图1为表示本实施方式所涉及的网络系统90的结构的一例的图。
如图1所示,本实施方式所涉及的网络系统90具备服务器装置10和终端装置50。另外,服务器装置10为信息处理装置的一例。服务器装置10中,作为一例,适用服务器计算机、个人电脑(PC:Personal Computer)等通用的计算机装置。
本实施方式所涉及的服务器装置10经由网络N与终端装置50连接。另外,网络N中,作为一例,适用互联网、LAN(Local Area Network:局域网)、WAN(Wide Area Network:广域网)等。本实施方式所涉及的终端装置50中,作为一例,适用个人电脑(PC)等通用的计算机装置、智能手机、平板终端等能够移动的计算机装置等。
本实施方式所涉及的终端装置50中安装有网络浏览器50A。该网络浏览器50A为经由网络N访问网站,并浏览由所访问的网站提供的网页的软件。
图2为表示本实施方式所涉及的服务器装置10的电结构的一例的框图。
如图2所示,本实施方式所涉及的服务器装置10具备控制部12、存储部14、显示部16、操作部18及通信部20。
控制部12具备CPU(Central Processing Unit:中央处理器)12A、ROM(Read OnlyMemory:只读存储器)12B、RAM(Random Access Memory:随机存取存储器)12C及输入输出接口(I/O)12D,且这些各部经由总线分别连接。
I/O12D中连接有包括存储部14、显示部16、操作部18及通信部20的各功能部。这些各功能部能够经由I/O12D与CPU12A相互通信。
控制部12可以被构成为控制服务器装置10的一部分动作的子控制部,也可以构成为控制服务器装置10整体的动作的主控制部的一部分。控制部12的各块体的一部分或全部中例如使用LSI(Large Scale Integration:大规模集成)等集成电路或IC(IntegratedCircuit:集成电路)芯片组。上述各块体中可以使用独立的电路,也可以集成一部分或全部而成的电路。上述各块体彼此可以设置为一体,也可以单独设置一部分块体。并且,上述各块体的每个中,其一部分可以单独设置。控制部12的集成化中,LSI并无限制,可以使用专用电路或通用处理器。
作为存储部14,例如使用HDD(Hard Disk Drive:硬盘驱动器)、SSD(Solid StateDrive:固态驱动器)、闪存器等。存储部14中存储用于实现本实施方式所涉及的学习处理的学习处理程序14A及用于实现本实施方式所涉及的第一信息确定处理的确定处理程序14B。另外,这些学习处理程序14A及确定处理程序14B也可存储于ROM12B。
学习处理程序14A及确定处理程序14B例如可以预先安装在服务器装置10。学习处理程序14A及确定处理程序14B可以通过存储在非易失性存储介质,或者经由网络N分布,且适当地安装到服务器装置10来实现。另外,作为非易失性存储介质的例,设想CD-ROM(Compact Disc Read Only Memory:光盘只读存储器)、磁光盘、HDD、DVD-ROM(DigitalVersatile Disc Read Only Memory:数字多功能只读存储器)、闪存器、存储卡等。
显示部16中例如使用液晶显示器(LCD:Liquid Crystal Display)或有机EL(Electro Luminescence:电致发光)显示器等。显示部16可以一体地具有触摸面板。操作部18中例如设置有键盘或鼠标等操作输入用设备。显示部16及操作部18从服务器装置10的用户接收各种指示。显示部16显示根据从用户接收的指示执行的处理的结果或对处理的通知等各种信息。
通信部20与互联网、LAN、WAN等网络N连接,且能够在与终端装置50之间经由网络N而通信。
然而,如上所述,当利用多个第一信息(作为一例,网页等)的记载,用户进行作业中的第二信息(作为一例,文档或源代码等)的编辑时,有时存在在进行编辑时有用的第一信息和无用的第一信息。该情况下,若能够确定第一信息用于第二信息的编辑,则可成为对编辑有用判定的基准。然而,未进行确定第一信息用于第二信息的编辑。
因此,本实施方式所涉及的服务器装置10的CPU12A通过将存储在存储部14中的学习处理程序14A及确定处理程序14B的每一个写入RAM12C而执行来作为图3所示的各部而发挥功能。
图3为表示本实施方式所涉及的服务器装置10的功能性结构的一例的框图。
如图3所示,本实施方式所涉及的服务器装置10的CPU12A通过执行学习处理程序14A来作为第1获取部30、导出部32及生成部34而发挥功能,并且通过执行确定处理程序14B来作为第2获取部40、提取部42、确定部44及更新部46而发挥功能。另外,本实施方式中,将第1获取部30及第2获取部40独立示出,但也可以将这些第1获取部30及第2获取部40作为1个获取部而一体地实现。
首先,参考图4~图8对本实施方式所涉及的学习处理进行说明。
图4为表示本实施方式所涉及的浏览历史记录的一例的图。
图5为表示本实施方式所涉及的内容信息的一例的图。
图6为表示本实施方式所涉及的交互信息的一例的图。
图7为表示本实施方式所涉及的作业信息的一例的图。
图8为表示本实施方式所涉及的特征量的一例的图。
本实施方式所涉及的第1获取部30获取由终端装置50的用户利用网络浏览器50A浏览的网页的浏览历史记录,并将所获取的浏览历史记录存储于存储部14。该浏览历史记录作为一例,如图4所示,包括URL(Uniform Resource Locator:统一资源定位符)、标题、浏览开始时刻等信息。另外,网页为第一信息的一例。其中,第一信息只要是能够获取日志的信息即可,而并不限定于网页。
并且,第1获取部30从作为浏览历史记录而获取的网页获取网页中所记载的内容的信息即内容信息。该内容信息中,作为一例,如图5所示,可以包括浏览开始时刻、URL、标题、前浏览页的URL、页面正文等信息。并且,内容信息中还可以包括DOCTYPE(html的版本)、窗口大小、文档大小等信息。
并且,第1获取部30按作为浏览历史记录获取的网页获取与用户对网页进行的操作有关的信息即交互信息。该交互信息包括用户从通过所使用的输入设备对网页进行的操作内容得到的信息。在此所述的输入设备中,作为一例使用键盘或鼠标等。交互信息中,作为一例,如图6所示,包括URL、标题、浏览开始时刻、浏览结束时刻、浏览时间、输入设备的一例即鼠标的位置推移、滚动等信息。更具体而言,交互信息中包括网页的浏览开始时刻、浏览结束时刻、窗口上是否有鼠标、每个规时间间的浏览位置、鼠标的移动位置、滚动距离、标签的转换、复印操作的次数、拖动操作的次数、连接的点击次数等信息。并且,作为获取交互信息的单元,例如可以作为网络浏览器50A的扩展功能而实现,也可以利用嵌入网页的javascript(注册商标)来实现。
并且,第1获取部30获取与由对用户进行作业的对象即作业对象数据进行的作业有关的作业信息。本实施方式中,用户通过终端装置50对作业对象数据进行作业。作为该作业对象数据,作为一例,包括文档或源代码等。例如,当用户进行编程时,该作业信息中,作为一例,如图7所示,包括作业对象数据的一例即源代码的编辑历史记录、时间戳、有无错误等信息。另一方面,例如当用户正在创建某种文档时,作业信息中包括作业对象数据的一例即文档的编辑历史记录、时间戳等。文档的编辑中,作为一例,包括文档创建软件中的文档的创建及编辑、演示软件中的演示用幻灯片的创建及编辑、电子邮件软件中的电子邮件的创建及编辑等。另外,作业对象数据为第二信息的一例。
通过上述得到的浏览历史记录、内容信息、交互信息及作业信息存储于存储部14。
本实施方式所涉及的导出部32将上述内容信息、交互信息及作业信息作为输入而导出用于输入到后述机器学习模型的特征量。其中,导出部32例如对照从网页得到的内容信息的浏览开始时刻、交互信息的浏览开始时刻即作业信息的时间戳,将接近网页的浏览时刻的作业信息与该网页建立关联。由此,对网页,与内容信息、交互信息及作业信息建立关联。
并且,作为从作业信息得到的特征量,作为一例,如图8所示,包括浏览中文档的编辑的有无、编辑次数、错误发生次数、函数的含有数、已编辑的行数、浏览之前与之后的编辑距离等。并且,作为从交互信息得到的特征量,作为一例,如图8所示,包括浏览时间、鼠标光标的移动次数、鼠标光标的移动距离(还包括x轴方向、y轴方向。)、鼠标光标的移动距离除以浏览时间而得到的鼠标光标的移动速度、……、滚动最大值等。并且,可以组合内容信息及作业信息。例如,当对用户的作业进行编程时,在网页的浏览之前、浏览中及浏览之后的任意时间进行了编辑的源代码中包含的函数可以将该网页中包含的个数作为特征量。并且,可以利用内容信息及浏览历史记录,将评价对象的网页是否通过来自前浏览页的链接而被浏览的情况作为特征量,也可以将前浏览页的文本与评价对象的网页的文本的类似的作为特征量。
从上述内容信息、交互信息及作业信息得到的特征量存储于存储部14。另外,特征量可以从多个信息的组合导出,也可以从每一个信息导出。
本实施方式所涉及的生成部34将通过导出部32导出的特征量作为输入而生成用于判定网页是否对用户有用的机器学习模型。作为一例,将上述特征量与用户明确给出的正确标签的对组作为学习用数据进行机器学习。另外,作为机器学习的算法,作为一例可举出支持向量机、随机森林、梯度增强、XGboost、神经网络(包括深度神经网络)等。并且,关于该机器学习模型的输出值,可用性的有无可以用0(无可用性)、1(有可用性)这2值表示,也可以用0以上且1以下的概率表示。通过上述生成的机器学习模型存储于存储部14。
接着,对本实施方式所涉及的第一信息确定处理进行说明。另外,本实施方式所涉及的第一信息为网页。
本实施方式所涉及的第2获取部40从由终端装置50的用户利用网络浏览器50A浏览的多个网页获取网页中所记载的内容信息。并且,第2获取部40获取与用户对网页进行的操作有关的交互信息。另外,关于该交互信息,作为一例为与用户在编辑之前或编辑之后对浏览的网页进行的操作有关的信息。编辑之前是指,包括即将进行编辑之前或编辑前的规时间间内(例如,30分以内等),编辑之后是指,包括刚编辑之后或编辑后的规时间间内(例如,30分以内等)。并且,第2获取部40获取与用户在网页的浏览之前、浏览中及浏览之后中的至少一个时间对作业对象数据进行的作业有关的作业信息。这些内容信息、交互信息及作业信息用于具有可用性的网页的确定,但也可以是仅包括内容信息及作业信息而不包括交互信息的结构。
本实施方式所涉及的提取部42相对于用户进行作业的对象即作业对象数据,抽取用户进行了编辑的部分。
本实施方式所涉及的确定部44在多个网页中,从内容信息确定用户在对上述部分进行编辑中或编辑前后浏览的网页。具体而言,作为一例,对照从网页得到的内容信息的浏览开始时刻、交互信息的浏览开始时刻即作业信息的时间戳,将接近网页的浏览时刻的作业信息与该网页建立关联。由此,对网页,与内容信息、交互信息及作业信息建立关联。
并且,通过用户对作业对象数据进行了编辑的部分中所记载的信息中是否存在内容信息的至少一部分来进行网页的确定。即,当在进行了编辑的部分中所记载的信息中存在内容信息的至少一部分时,将该网页确定为用于作业对象数据的编辑中的网页。换言之,该网页用于改进通过由用户进行的作业得到的产物(作为一例,文档或源代码等),且能够视为对用户有用。
并且,确定部44可以根据从上述内容信息、交互信息及作业信息中的至少一个得到的特征量导出在上述中的确定的表示网页的可用性的值,且根据所导出的表示可用性的值确定具有可用性的网页。该情况下,将上述特征量作为输入,且利用输出表示可用性的值的机器学习模型来进行具有可用性的网页的确定。如上所述,该机器学习模型为预先利用学习用数据进行了机器学习的模型。另外,作为表示可用性的值、即机器学习模型的输出值,如上所述,可用性的有无可由0(无可用性)、1(有可用性)这2值表示,也可以由0以上且1以下的概率表示。
并且,当根据通过确定部44导出的表示可用性的值,对用户判定为获取网页的可用性的评价时,第2获取部40可以从用户获取与网页有关的可用性的评价。具体而言,作为一例,表示可用性的值小于阈值而并不充分高的情况等中,向终端装置50发送评价的请求。当发送评价的请求时,作为一例,用户可以在浏览中的网页上,将该网页的评价显示于能够输入的UI(User Interface:用户界面)画面(省略图示),并向用户提示评价的输入。作为该评价,作为一例,可以是“好、坏、两者均不是”的选择项,也可以是多个阶段(例如,1~5这5个阶段等)的评价。
本实施方式所涉及的更新部46将通过第2获取部40获取的评价与和该评价对应的特征量的对组作为学习用数据输入于机器学习模型,并更新机器学习模型。机器学习模型的更新可以在每次追加新的学习用数据时进行,也可以在新的学习用数据被收集规定数量以上之后根据数据数量进行,也可以定期进行。
并且,当通过提取部42抽取的部分被用户编辑2次时,确定部44可以将第2次编辑时确定的网页确定为可用性比第1次编辑时确定的网页高。该情况下,确定部44将表示记载有该部分中新记载的内容的网页的可用性的值输出为比表示最初确定的网页的可用性的值大,并将表示最初确定的网页的可用性的值输出为比表示用户所浏览的网页中未经确定的网页的可用性的值小。另外,在此所述的表示可用性的值是指上述机器学习模型的输出值。
接着,参考图9~图11,对本实施方式所涉及的服务器装置10的作用进行说明。另外,图9~图11所示的流程图中,将用户一边参考网页一边对源代码进行编辑的作业作为对象进行说明。
图9为表示通过本实施方式所涉及的学习处理程序14A进行的特征量创建处理的流程的一例的流程图。
首先,对服务器装置10做出特征量创建处理的执行开始的指示时,执行以下各步骤。
在图9的步骤100中,第1获取部30将表示网页的浏览历史记录的个数的i设定为0。
在步骤102中,第1获取部30作为一例获取如上述图4所示那样的第i个浏览历史记录。具体而言,获取终端装置50的用户利用网络浏览器50A浏览的网页的浏览历史记录。
在步骤104中,第1获取部30作为一例获取如上述图5所示那样的第i个内容信息。具体而言,从在步骤102中作为浏览历史记录获取的网页获取内容信息。
在步骤106中,第1获取部30作为一例获取如上述图6所示那样的第i个交互信息。具体而言,对于作为浏览历史记录获取的网页,获取与用户进行的操作有关的信息即交互信息。
在步骤108中,第1获取部30作为一例获取如上述图7所示那样的与第i个浏览历史记录有关联的作业信息。具体而言,在作为浏览历史记录获取的网页的浏览中,在浏览前及浏览之后的任意时间获取与用户对作业对象数据进行的作业有关的作业信息。
在步骤110中,导出部32从在步骤104~步骤108中获取的内容信息、交互信息及作业信息的每一个,作为一例导出如上述图8所示那样的特征量。具体而言,例如当作业对象数据为源代码时,作为一例,从作业信息及内容信息导出网页浏览之后的源代码的编辑的有无、网页浏览中的源代码的编辑次数、有无网页浏览之后的源代码的错误、网页中所包含的函数的源代码中的含有数等。并且,作为一例,从交互信息导出网页的浏览时间、鼠标光标的移动次数、鼠标光标的移动距离、鼠标光标的移动速度、鼠标光标的x轴方向上的最大位置及最小位置、鼠标光标的y轴方向上的最大位置及最小位置、滚动次数、滚动频率、滚动距离等。
在步骤112中,导出部32将在步骤110中导出的特征量存储于存储部14。
在步骤114中,导出部32判定浏览历史记录的剩余数是否为0。当判定为浏览历史记录的剩余数并非0时(当为否定判时间),移到步骤116,当判定浏览历史记录的剩余数为0时(当为肯定判时间),结束通过本学习处理程序14A进行的特征量创建处理。
另一方面,在步骤116中,导出部32重复将表示浏览历史记录的个数的i增大1个,并返回步骤102的步骤。
图10为表示通过本实施方式所涉及的学习处理程序14A进行的学习处理的流程的一例的流程图。
首先,对服务器装置10做出学习处理的执行开始的指示时,执行以下各步骤。
在图10的步骤120中,生成部34获取存储在存储部14的特征量。
在步骤122中,生成部34获取正确标签。具体而言,对作为浏览历史记录获取的各网页,将由用户赋予的评价(作为一例,0、1这2值等)作为正确标签而获取。
在步骤124中,生成部34将在步骤122中获取的带正确标签的特征量作为输入而生成利用机器学习算法输出表示可用性的值的机器学习模型。
在步骤126中,生成部34将在步骤124中生成的机器学习模型存储于存储部14,并结束通过本学习处理程序14A进行的学习处理。
图11为表示通过本实施方式所涉及的确定处理程序14B进行的处理的流程的一例的流程图。
首先,对服务器装置10做出第一信息确定处理的执行开始的指示时,执行以下各步骤。另外,本实施方式中,作为在用户对作业对象数据进行了编辑的部分中所记载的信息中记载有内容信息的至少一部分的情况而进行说明。
在图11的步骤130中,第2获取部40读取存储在存储部14的机器学习模型。
在步骤132中,第2获取部40从作为与评价对象的网页建立了关联的内容信息、交互信息及作业信息的每一个或组合获取多个特征量。
在步骤134中,对于从在步骤130中读取的机器学习模型输出的表示可用性的值Prob,确定部44根据获取数据数、数据特性等信息设定阈值(上限、下限)。
在步骤136中,确定部44将表示作为评价对象的网页的浏览历史记录的个数的i设定为0。
在步骤138中,确定部44对在步骤130中读取的机器学习模型输入在步骤132中获取的多个特征量,并导出和与多个特征量建立了关联的网页有关的表示可用性的值Prob。另外,当与作为评价对象的网页有关联的特征量为多个时,机器学习模型对多个特征量输出1个表示可用性的值Prob。本实施方式中,将表示可用性的值Prob设为0以上且1以下的概率。
在步骤140中,确定部44判定是否为下限阈值≤Prob≤上限阈值。当判定为下限阈值≤Prob≤上限阈值时(当为肯定判时间),移到步骤142,当判定为并非下限阈值≤Prob≤上限阈值时(当为否定判时间),移到步骤148。
在步骤142中,第2获取部40将用于对用户要求评价赋予的UI画面(省略图示)显示于终端装置50,并经由终端装置50获取对网页的用户的评价。具体而言,如上所述,用户可以选择性输入“好、坏、两者均不是”的评价,且将多个阶段(例如,1~5这5个阶段等)中的任一个阶段作为评价而输入。
在步骤144中,更新部46将在步骤142中获取的用户评价与和该用户评价对应的特征量的对组作为新的学习用数据而输入于机器学习模型,并更新机器学习模型。
在步骤146中,确定部44判定浏览历史记录的剩余数是否为0。当判定浏览历史记录的剩余数并非0时(当为否定判时间),移到步骤148,当判定浏览历史记录的剩余数为0时(当为肯定判时间),结束通过本确定处理程序14B进行的第一信息确定处理。
另一方面,在步骤148中,确定部44将表示浏览历史记录的个数的i增加1个,并返回步骤138而重复进行处理。
如此根据本实施方式,当利用多个网页的记载,用户进行作业对象数据的编辑时,确定从多个网页确定作业对象数据的编辑中使用的网页、即对用户有用的网页。
以上,作为实施方式所涉及的信息处理装置的一例例示服务器装置并进行了说明。实施方式可以是用于使计算机执行服务器装置所具备的各部份功能的程序的方式。实施方式也可以是存储有该程序的计算机能够读取的存储介质的方式。
除此以外,在上述实施方式中进行了说明的服务器装置的结构为一例,在不脱离宗旨的范围内可以根据情况而进行变更。
并且,在上述实施方式中进行了说明的程序的处理的流程也为一例,在不脱离宗旨的范围内可以删除不必要的步骤,也可以追加新的步骤,或替换处理顺序。
并且,上述实施方式中,对通过执行程序,且利用计算机并通过软件结构来实现实施方式所涉及的处理中的情况进行了说明,但并不限定于此。实施方式例如也可以通过硬件结构、硬件结构与软件结构的组合来实现。
上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的确定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。

Claims (13)

1.一种信息处理装置,其具备:
获取部,从用户所浏览的多个第一信息获取所述第一信息中所记载的内容的信息即内容信息;
提取部,从由所述用户进行作业的对象即第二信息提取由所述用户进行了编辑的部分;及
确定部,在所述多个第一信息中,从所述内容信息确定所述用户在对所述部分进行编辑时或编辑前后浏览的第一信息。
2.根据权利要求1所述的信息处理装置,其中,
所述获取部还获取与所述用户对所述第一信息进行的操作有关的信息即交互信息,
所述确定部还利用所述交互信息,进一步将所述经确定的第一信息确定为具有可用性的第一信息。
3.根据权利要求2所述的信息处理装置,其中,
所述交互信息为与所述用户对在所述编辑之前或所述编辑之后浏览的第一信息进行的操作有关的信息。
4.根据权利要求3所述的信息处理装置,其中,
所述交互信息包括所述用户从通过所使用的输入设备对所述第一信息进行的操作内容得到的信息。
5.根据权利要求4所述的信息处理装置,其中,
所述交互信息还包括所述用户浏览了所述第一信息的时间即浏览时间。
6.根据权利要求1至5中任一项所述的信息处理装置,其中,
当通过所述提取部提取的部分被所述用户编辑了2次时,所述确定部将第2次编辑时确定的第一信息确定为可用性比第1次编辑时确定的第一信息高。
7.根据权利要求6所述的信息处理装置,其中,
根据从所述内容信息得到的特征量导出表示所述第一信息的可用性的值,
所述确定部将表示记载有所述部分中新记载的内容的第一信息的可用性的值输出为比表示最初确定的第一信息的可用性的值大,并且将表示所述最初确定的第一信息的可用性的值输出为比表示所述用户所浏览的第一信息中未确定的第一信息的可用性的值小。
8.根据权利要求1至5中任一项所述的信息处理装置,其中,
所述获取部还获取与所述用户在所述第一信息的浏览之前、浏览中及浏览之后中的至少一个时间对所述第二信息进行的作业有关的作业信息,
所述确定部还利用所述作业信息进一步将所述经确定的第一信息确定为具有可用性的第一信息。
9.根据权利要求1所述的信息处理装置,其中,
所述获取部还获取与所述用户对所述第一信息进行的操作有关的信息即交互信息和与所述用户在所述第一信息的浏览之前、浏览中及浏览之后中的至少一个时间对所述第二信息进行的作业有关的作业信息,
所述确定部根据从所述内容信息、所述交互信息及所述作业信息中的至少一个得到的特征量导出表示所述经确定的第一信息的可用性的值,并根据所导出的表示可用性的值进一步确定具有可用性的第一信息。
10.根据权利要求9所述的信息处理装置,其中,
当根据表示所述可用性的值对所述用户判定为获取所述第一信息的可用性的评价时,所述获取部还从所述用户获取与所述第一信息有关的可用性的评价。
11.根据权利要求10所述的信息处理装置,其中,
将所述特征量作为输入,并利用输出表示所述可用性的值的机器学习模型来进行所述具有可用性的第一信息确定,且还具备更新部,该更新部将通过所述获取部获取的评价与和所述评价对应的特征量的对组作为学习用数据而输入到所述机器学习模型,并更新所述机器学习模型。
12.一种存储介质,其存储有使计算机作为权利要求1至11中任一项所述的信息处理装置所具备的各部而发挥功能的程序。
13.一种信息处理方法,其包括如下步骤:
获取步骤,从用户所浏览的多个第一信息获取所述第一信息中所记载的内容的信息即内容信息;
提取步骤,从由所述用户进行作业的对象即第二信息提取由所述用户进行了编辑的部分;及
确定步骤,在所述多个第一信息中,从所述内容信息确定所述用户在对所述部分进行编辑时或编辑前后浏览的第一信息。
CN201910368747.5A 2018-11-08 2019-05-05 信息处理装置、存储介质及信息处理方法 Pending CN111159608A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-210594 2018-11-08
JP2018210594A JP7230439B2 (ja) 2018-11-08 2018-11-08 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
CN111159608A true CN111159608A (zh) 2020-05-15

Family

ID=70551342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910368747.5A Pending CN111159608A (zh) 2018-11-08 2019-05-05 信息处理装置、存储介质及信息处理方法

Country Status (3)

Country Link
US (1) US20200150855A1 (zh)
JP (1) JP7230439B2 (zh)
CN (1) CN111159608A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200057959A1 (en) 2018-08-15 2020-02-20 Salesforce.Com, Inc. Reducing instances of inclusion of data associated with hindsight bias in a training set of data for a machine learning system
EP4052118A4 (en) * 2019-10-30 2023-11-08 Alectio, Inc. AUTOMATIC REDUCTION OF TRAINING AMOUNTS FOR MACHINE LEARNING PROGRAMS

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301676A (ja) * 1993-04-16 1994-10-28 Fuji Xerox Co Ltd 文書管理装置
JPH0863465A (ja) * 1994-08-17 1996-03-08 Fuji Xerox Co Ltd 参照履歴表示装置
US20030158855A1 (en) * 2002-02-20 2003-08-21 Farnham Shelly D. Computer system architecture for automatic context associations
US20090049073A1 (en) * 2007-08-13 2009-02-19 Samsung Electronics Co., Ltd Method and apparatus for encoding/decoding metadata
CN102667741A (zh) * 2009-11-26 2012-09-12 乐天株式会社 信息处理装置、终端装置、关注内容判定方法、关注内容判定程序、终端程序、记录有程序的记录介质及信息提供系统
US20140033101A1 (en) * 2008-05-29 2014-01-30 Adobe Systems Incorporated Tracking changes in a database tool
CN104657451A (zh) * 2015-02-05 2015-05-27 百度在线网络技术(北京)有限公司 页面的处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062831A (ja) 2002-07-31 2004-02-26 Minolta Co Ltd プリントシステム及びプリンタ
US20160132645A1 (en) * 2014-11-07 2016-05-12 Qsi Management, Llc System and architecture for providing shared patient data notifications
JP2018028727A (ja) 2016-08-15 2018-02-22 株式会社日立製作所 映像ファイル管理システム及び映像ファイル管理方法
US11403006B2 (en) * 2017-09-29 2022-08-02 Coupa Software Incorporated Configurable machine learning systems through graphical user interfaces
US10880299B2 (en) * 2018-05-30 2020-12-29 Jumio Corporation Machine learning for document authentication

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301676A (ja) * 1993-04-16 1994-10-28 Fuji Xerox Co Ltd 文書管理装置
JPH0863465A (ja) * 1994-08-17 1996-03-08 Fuji Xerox Co Ltd 参照履歴表示装置
US20030158855A1 (en) * 2002-02-20 2003-08-21 Farnham Shelly D. Computer system architecture for automatic context associations
US20090049073A1 (en) * 2007-08-13 2009-02-19 Samsung Electronics Co., Ltd Method and apparatus for encoding/decoding metadata
US20140033101A1 (en) * 2008-05-29 2014-01-30 Adobe Systems Incorporated Tracking changes in a database tool
CN102667741A (zh) * 2009-11-26 2012-09-12 乐天株式会社 信息处理装置、终端装置、关注内容判定方法、关注内容判定程序、终端程序、记录有程序的记录介质及信息提供系统
CN104657451A (zh) * 2015-02-05 2015-05-27 百度在线网络技术(北京)有限公司 页面的处理方法及装置

Also Published As

Publication number Publication date
JP2020077241A (ja) 2020-05-21
US20200150855A1 (en) 2020-05-14
JP7230439B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
KR101524897B1 (ko) 임시 편집 표면을 이용한 문서 편집
CN113110988B (zh) 利用定义的输入格式来测试应用
US9383912B2 (en) Data pasting method and apparatus
RU2419852C2 (ru) Формирователь моментального снимка электронных данных
US20170075513A1 (en) Surf Software
US20160012082A1 (en) Content-based revision history timelines
CN105095441A (zh) 一种信息获取方法及装置
CN108595697B (zh) 网页集成方法、装置及系统
JPWO2019224891A1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
CN111159608A (zh) 信息处理装置、存储介质及信息处理方法
CN112417133A (zh) 排序模型的训练方法和装置
US9208142B2 (en) Analyzing documents corresponding to demographics
US10163118B2 (en) Method and apparatus for associating user engagement data received from a user with portions of a webpage visited by the user
US20140282477A1 (en) Automatic updating of data in application programs
US11194885B1 (en) Incremental document object model updating
CN113127117A (zh) 基于Qt开发框架的界面分页显示方法、装置、系统及介质
CN112069807A (zh) 文本数据的主题提取方法、装置、计算机设备及存储介质
CN107168997B (zh) 基于人工智能的网页原创评估方法、装置及存储介质
JP2020091333A (ja) 表示制御方法、装置、及びプログラム
JP5727964B2 (ja) リンク領域強調表示装置およびその動作方法
EP3942452B1 (en) Cross-browser techniques for efficient document pagination
CN113760247A (zh) 前端代码的生成方法、装置、电子设备及存储介质
CN117215947A (zh) 一种页面白屏检测方法、装置、计算机设备及存储介质
CN112328788A (zh) 一种文章的分类方法、装置及计算机系统
CN114238839A (zh) 一种页面生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information

Address after: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan

Applicant after: Fuji film business innovation Co.,Ltd.

Address before: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan

Applicant before: Fuji Xerox Co.,Ltd.

CB02 Change of applicant information
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination