WO2021049272A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
WO2021049272A1
WO2021049272A1 PCT/JP2020/031576 JP2020031576W WO2021049272A1 WO 2021049272 A1 WO2021049272 A1 WO 2021049272A1 JP 2020031576 W JP2020031576 W JP 2020031576W WO 2021049272 A1 WO2021049272 A1 WO 2021049272A1
Authority
WO
WIPO (PCT)
Prior art keywords
tag
information processing
tags
web page
information
Prior art date
Application number
PCT/JP2020/031576
Other languages
English (en)
French (fr)
Inventor
佳和子 小堀
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2021545190A priority Critical patent/JPWO2021049272A1/ja
Priority to US17/640,432 priority patent/US20220342955A1/en
Publication of WO2021049272A1 publication Critical patent/WO2021049272A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Definitions

  • the present invention relates to an information processing device, an information processing method, and a program.
  • Patent Documents 1 to 3 describe techniques for collecting, storing and managing information on the Web. For example, in Patent Document 1, by detecting an operation in the reading unit and automatically creating index information at a preset operation, an index for a document actually created, edited, or viewed by the user himself / herself is obtained. It states that the information is automatically created and that the index information can be used to later retrieve and recall the document.
  • Patent Document 2 describes that information on the network is acquired, the acquired information is indexed to create an index database, and the latest information is searched.
  • Patent Document 3 includes a bookmark and tag setting device that automatically saves and organizes search terms used by the user and clicked search results and provides them to the user to improve the convenience of information retrieval and information organization. Have been described.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a technique for appropriately and efficiently collecting necessary information from a huge amount of information on the Web.
  • the first aspect relates to an information processing device.
  • the information processing device is a designation means that accepts the designation of a plurality of tags at a timing prior to the input for search. It has a storage processing means for storing browsing information including a URL (Uniform Resource Locator) of a browsed web page in a storage unit in association with the designated tag.
  • URL Uniform Resource Locator
  • the second aspect relates to information processing methods performed by at least one computer.
  • the information processing method according to the second aspect is that the information processing device Accepts multiple tag specifications at the timing before input for search, This includes storing browsing information including the URL (Uniform Resource Locator) of the browsed web page in the storage unit in association with the designated tag.
  • URL Uniform Resource Locator
  • this invention may be a program that causes at least one computer to execute the method of the second aspect, or a recording medium that can be read by a computer that records such a program. You may.
  • This recording medium includes non-temporary tangible media.
  • This computer program includes computer program code that causes the computer to perform its processing method on an information processing device when executed by the computer.
  • the various components of the present invention do not necessarily have to be independent of each other, and a plurality of components are formed as one member, and one component is formed of a plurality of members. It may be that a certain component is a part of another component, a part of a certain component overlaps with a part of another component, and the like.
  • the order of description does not limit the order in which the plurality of procedures are executed. Therefore, when implementing the method and computer program of the present invention, the order of the plurality of procedures can be changed within a range that does not hinder the contents.
  • the method of the present invention and the plurality of procedures of the computer program are not limited to being executed at different timings. Therefore, another procedure may occur during the execution of a certain procedure, a part or all of the execution timing of the certain procedure and the execution timing of the other procedure may overlap, and the like.
  • (First Embodiment) There are three tasks for analyzing information on the Internet.
  • the tag is data including a character string for giving meaning to the information obtained as a result of the search, or a character string such as a word or phrase for classifying or identifying.
  • the tag further contains other information.
  • Necessary information is information created from analysis results to achieve the purpose of information analysis.
  • the information processing device 100 of the present embodiment executes an application having a browser function, connects to the Internet, searches for necessary information, and displays a website, or displays a website in order to analyze information on the Internet.
  • the tag added to the information obtained by searching the Internet may be a word or phrase different from the search keyword used at the time of the search.
  • FIG. 1 is a functional block diagram showing a logical configuration of the information processing device 100 of the present embodiment.
  • the information processing device 100 includes a designation unit 102 and a storage processing unit 104.
  • the designation unit 102 accepts the designation of a plurality of tags at a timing prior to the input for the search.
  • the storage processing unit 104 stores browsing information including the URL (Uniform Resource Locator) of the browsed web page in the storage device 110 (history DB 112 and tag history DB 116 described later) in association with the designated tag.
  • URL Uniform Resource Locator
  • the storage device 110 includes a plurality of databases (hereinafter, also referred to as "DB" (DataBase)) described later.
  • DB DataBase
  • the data stored in the information processing apparatus 100 may be in other file formats (for example, CSV (Comma-Separated Values), text file, etc.).
  • the storage device 110 may store an image or moving image file included in the site.
  • the storage device 110 may be provided inside the information processing device 100 or may be provided outside.
  • the storage device 110 may be physically a plurality of storage devices.
  • FIG. 2 is a block diagram showing a hardware configuration example of the computer 60 that realizes the information processing device 100.
  • the information processing device 100 may be realized by a plurality of computers 60.
  • the computer 60 includes a CPU (Central Processing Unit) 62, a memory 64, a program 80 that realizes components of each server and user terminal loaded in the memory 64, a storage 66 that stores the program 80, and I / O (Input /). It includes an Output) 68 and an interface (communication I / F70) for connecting to three communication networks.
  • CPU Central Processing Unit
  • memory 64 a memory 64
  • program 80 that realizes components of each server and user terminal loaded in the memory 64
  • a storage 66 that stores the program 80
  • I / O Input /
  • It includes an Output) 68 and an interface (communication I / F70) for connecting to three communication networks.
  • the CPU 62, the memory 64, the storage 66, the I / O 68, and the communication I / F 70 are connected to each other via the bus 69, and each server and the user terminal are controlled by the CPU 62.
  • the method of connecting the CPU 62 and the like to each other is not limited to the bus connection.
  • the memory 64 is a memory such as a RAM (RandomAccessMemory) or a ROM (ReadOnlyMemory).
  • the storage 66 is a storage device such as a hard disk, an SSD (Solid State Drive), or a memory card.
  • the storage 66 may be a memory such as a RAM or a ROM.
  • the storage 66 may be provided inside the computer 60, or may be provided outside the computer 60 and may be connected to the computer 60 by wire or wirelessly if the computer 60 is accessible. Alternatively, it may be detachably provided on the computer 60.
  • the CPU 62 reads the program 80 stored in the storage 66 into the memory 64 and executes it, so that each function of each unit of the information processing apparatus 100 of FIG. 1 can be realized.
  • the I / O 68 controls the input / output of data and control signals between the computer 60 and other input / output devices.
  • the other input / output devices include, for example, an input device 72 such as a keyboard, a touch panel, a mouse, and a microphone connected to the computer 60, and an output such as a display (referred to as a display device 74 in the figure), a printer, and a speaker. Includes a device (not shown) and an interface between these input / output devices and the computer 60.
  • the I / O 68 may perform data input / output control with a reading or writing device (not shown) of another recording medium.
  • the communication I / F 70 is a network connection interface for communicating between the computer 60 and an external device.
  • the communication I / F 70 may be a network interface for connecting to a wired line or a network interface for connecting to a wireless line.
  • the computers 60 that realize the information processing device 100 are connected to each other via the communication network 3 by the communication I / F 70.
  • Each component of the information processing apparatus 100 of FIG. 1 is realized by an arbitrary combination of hardware and software of the computer 60 of FIG. And, it is understood by those skilled in the art that there are various modifications of the realization method and the device.
  • the functional block diagram showing the information processing apparatus 100 of each embodiment described below shows blocks of logical functional units, not configurations of hardware units. Further, in each figure, the configuration of the portion not related to the essence of the present invention is omitted and is not shown.
  • the storage processing unit 104 further includes the title of the browsed web page in the browsing information and stores it in the history DB 112.
  • the information processing device 100 can further include a display processing unit 140 (FIG. 27) that associates the title of the web page with the tag and displays it on the display unit (display device 74).
  • FIG. 3 is a diagram showing an example of a data structure of the history DB 112 that stores browsing information.
  • the history DB 112 stores the identification information (called a history ID) given to each browsing information, the time information when the web page is accessed, the URL of the web page, and the title of the web page in association with each other. There is.
  • the history DB 112 may include at least the URL of the web page.
  • a plurality of tags may be stored in the tag DB 114 in advance.
  • the designation unit 102 accepts the designation of at least one tag from the plurality of tags stored in the tag DB 114.
  • the storage processing unit 104 associates a tag specified in advance with browsing information and stores it.
  • the tag may be at least linked to the URL of the web page.
  • a plurality of tags designated by the designation unit 102 at a timing prior to the input for search are stored in the tag DB 114.
  • the timing before the input for the search is not particularly limited as long as it is the timing before the web page is displayed or downloaded by selecting the site to be browsed from the search results obtained by executing the Internet search. .. Then, the storage processing unit 104 stores the tag specified in advance in association with the browsing information at the timing of browsing the web page.
  • FIG. 4 is a diagram showing an example of the data structure of the tag DB 114.
  • Tag information is stored in the tag DB 114, and the tag information includes a tag ID that identifies the tag, a tag, and an active flag.
  • tags are stored in the tag DB 114, it is possible to specify a tag to be added to the result obtained by the search from now on before the search.
  • the active flag of the tag designated to be assigned is set to "1"
  • the active flag of the tag not specified is set to "0", but these are not limited.
  • the tag information stored in the tag DB 114 may be edited by the operator on the editor screen.
  • the designation unit 102 receives the tags input and designated by the operator on the tag selection editor screen 200, and stores the tags designated by the operator in the tag DB 114.
  • FIG. 5 is a diagram showing an example of the tag selection editor screen 200.
  • the information processing device 100 can display various screens including the tag selection editor screen 200 on the display device 74 of FIG.
  • the tag selection editor screen 200 includes a tag field 202 and an active designation field 204 that specifies whether or not to add the tag of the tag field 202 to browsing information.
  • a tag designated in advance is displayed in the tag field 202.
  • the active designation field 204 is, for example, a check box, and the checked tag is added to the browsing information.
  • "1" is set in the active flag of the tag DB 114 in FIG.
  • "0" is set in the active flag of the tag DB 114 in FIG.
  • FIG. 6 is a diagram showing an example of the data structure of the tag history DB 116.
  • the tagging history information stored in the tag history DB 116 is a combination of a tag history ID that identifies the history information, a history ID of the browsing information to which the tag is attached, and a tag ID of the tag attached to the browsing information. It is attached and memorized. For example, since the browsing information having the history ID of 1 in the history DB 112 of FIG. 3 is given two tags "apple” and "mandarin orange", the tag IDs 1 and 2 of "apple” and “mandarin orange” are used. Each is tied.
  • FIG. 7 is a flowchart showing an example of the procedure of information analysis.
  • the analyst receives the research theme (step S1). Using a browser, the analyst inputs a search word for research on a search engine site (step S3) and executes a search (step S5). The search result is displayed (step S7). The analyst browses the search results, and if there is a site of interest (with step S9), the analyst accesses and browses the site (step S11).
  • step S15 the process 120 of steps S15 to S21 is executed by the storage processing unit 104.
  • the storage processing unit 104 refers to the tag DB 114, and when there is a tag for which the active flag is set (Y in step S15), links the tag to the browsing information of the site that browsed the tag (step S17). If there is no tag for which the active flag is set (N in step S15), step S17 is bypassed.
  • the storage processing unit 104 saves the browsing information of the browsing page of the site in the history DB 112 (step S19). Further, as described in the embodiment described later, the storage processing unit 104 may save the content itself of the browsing page in the file format specified in advance when the saving of the browsing page is specified in advance. For example, from a browser, save in at least one file format such as an HTML (HyperTextMarkupLanguage) file, a PDF (PortableDocumentFormat) file, a text file, and a screenshot image file.
  • HTML HyperTextMarkupLanguage
  • PDF PortableDocumentFormat
  • the storage processing unit 104 associates the tag with the browsing information (URL or the like) and saves it in the tag history DB 116 (step S21). If there is another site of interest from the search results, the process returns to step S7 and the process is repeated.
  • step S9 If there is no site of interest in step S9 (nothing in step S9), the analyst refers to the information of the survey contents so far (step S23) and extracts a new search word (step S25). Then, returning to step S3, the analyst inputs the extracted new word and performs a re-search.
  • FIG. 8 is a flowchart showing an example of the operation of the information processing apparatus 100 of the present embodiment.
  • FIG. 9 is a diagram for explaining the detailed functions of the information processing apparatus 100 and the flow of data.
  • FIG. 10 is a diagram for explaining changes in records in the database during the operation flow of FIG.
  • the information processing apparatus 100 includes a page display unit 130, a history creation function 132, a tag history addition function 134, a tag selection editor 136, and a history viewer 138.
  • the tag selection editor 136 corresponds to the designated unit 102 in FIG.
  • the history creation function 132 and the tag history addition function 134 correspond to the storage processing unit 104 of FIG.
  • the page display unit 130 is, for example, a browser.
  • the history viewer 138 displays the browsing history created by the storage processing unit 104 of the information processing apparatus 100.
  • the history creation function 132, the tag history addition function 134, the tag selection editor 136, and the history viewer 138 can be added as add-ons to the browser (page display unit 130), for example.
  • the tag selection editor 136 displays the tag selection editor screen 200 and accepts the tag designation.
  • the history viewer 138 corresponds to the display processing unit 140 and displays the history screen 210.
  • the tag selection editor 136 (designation unit 102) displays the tag selection editor screen 200 and accepts the designation of the tag to be automatically added to the browsing information (step S101).
  • the active designation field 204 of "mandarin orange" is checked.
  • the tag selection editor 136 (designation unit 102) sets "1" to the active flag of the tag DB 114 of the tag designated to be automatically assigned (step S103).
  • 1 is set in the active flag of the "mandarin orange" of the tag having the tag ID of 2.
  • the steps S101 and S103 are performed after receiving the search theme in step S1 of FIG. 7 and before inputting the search word in step S3.
  • the analyst performs a search on the page display unit 130 (browser) (corresponding to steps S3 and S5 in FIG. 7), selects the site to be browsed from the search results, and accesses and browses the site.
  • the history creation function 132 memory processing unit 104 displays the access time, the URL, and the title in the history DB 112 as browsing information of the browsed site. Save and create a history (step S107).
  • a record having a history ID of 3 is added to the history DB 112.
  • Step S107 of FIG. 8 corresponds to step S19 of FIG.
  • step S105 there are various possible timings when the storage processing unit 104 determines that the analyst has browsed the site. For example, at least one of when a site selection operation is accepted for browsing, when the selected site is accessed, and when the download of the web page of the selected site is completed.
  • the tag history addition function 134 (storage processing unit 104) stores the tag whose active flag is 1 in the tag DB 114 in the tag history DB 116 and associates it with the browsing information (step S109).
  • Step S109 of FIG. 8 corresponds to step S21 of FIG.
  • a record having a tag history ID of 4 in the tag history DB 116 is added, and the history ID (3) and the tag ID (2) are associated with each other.
  • tagging can be performed by accepting operator operations at arbitrary timings. For example, when the operator wants to add a tag other than the tag that is automatically added after browsing the page, the tag may be added manually. For example, a tag may be set by opening an operation menu for manually assigning a tag, accepting input to a text input box or selecting from a pull-down menu.
  • the tags that have already been assigned may be selected, the operation menu may be displayed by right-clicking, and the delete operation may be selected.
  • the storage processing unit 104 adds or deletes the tag according to the received operation content.
  • the accumulated browsing history can be browsed using the history viewer 138.
  • the history viewer 138 displays the history screen 210.
  • the tag history DB 116 is referred to, and a pair of the tag ID and the history ID is acquired (step S111).
  • the acquired tag ID and the data corresponding to the history ID are acquired from the tag DB 114 and the history DB 112, respectively, and associated with each other (step S113).
  • a tag (mandarin orange) is associated with the browsing information (access time, URL, title) whose history ID of the history screen 210 is 3.
  • the history viewer 138 displays the browsing information and the tag acquired in step S113 on the history screen 210 (step S115).
  • the processing of steps S111 to S115 is repeated for each record in the tag history DB 116.
  • acquisition means that the own device retrieves data or information stored in another device or storage medium (active acquisition), and is output to the own device from the other device. Includes at least one of entering data or information (passive acquisition).
  • active acquisition include making a request or inquiry to another device and receiving the reply, and accessing and reading another device or storage medium.
  • passive acquisition may be receiving information to be delivered (or transmitted, push notification, etc.).
  • acquisition may be to select and acquire the received data or information, or to select and receive the delivered data or information.
  • FIG. 11 is a diagram showing an example of the history screen 210 created in this way.
  • the history screen 210 includes a browsing information list display field 212 including a site title (name), a storage date / time (or access time), and a plurality of added tags.
  • the tag designated before the input for search by the designation unit 102 is associated with the information of the browsed site and stored. Can be done. Therefore, when the accumulated browsing information is analyzed later, it can be efficiently analyzed based on the tag.
  • the information processing device 100 of the present embodiment specifies in advance a method of storing not only a character string but also a web page content as a tag, and the web page content is designated as browsing information. It is the same except that it is saved by the method.
  • the designation unit 102 accepts the designation of the storage method of the web page.
  • the storage processing unit 104 stores the web page in the storage device 110 by the designated storage method.
  • FIG. 12 is a diagram showing an example of the data structure of the tag method DB 118.
  • the tag method DB 118 includes a tag ID that identifies the tag method and a tag storage method.
  • the tag storage method includes screenshot storage, PDF storage, and nothing (in other words, data storage is not performed and tags such as character strings are added).
  • the display processing unit 140 displays the saved web page on the display unit.
  • Screenshot image files, PDF files, etc. are saved in a predetermined folder of the storage device 110 or a folder designated at any time.
  • the storage processing unit 104 assigns the file name (path name) of the file to be saved according to a predetermined rule using a history ID, an access time, and the like.
  • the display processing unit 140 can read the saved file of the web page corresponding to the history ID.
  • FIG. 13 is a flowchart showing an example of the operation of the information processing device 100.
  • FIG. 14 is a diagram for explaining the detailed functions of the information processing apparatus 100 and the flow of data.
  • FIG. 15 is a diagram for explaining changes in records in the database during the operation flow of FIG. 13.
  • the flow of FIG. 13 further includes step S201 in the flow of FIG. Further, step S203 is included instead of step S109 of the flow of FIG.
  • the designation unit 102 refers to the tag method DB 118, and reflects the method ID included in the tag method DB 118 in the tag DB 114 (step S201).
  • FIG. 15A shows an example of the tag DB 114.
  • step S203 of FIG. 13 the tag history addition function 134 associates the tag with the active flag 1 of the tag DB 114 with the browsing information and saves it in the tag history DB 116.
  • the tag history ID (4) is associated with saving data
  • the tag history ID (5) is associated with no data.
  • the storage processing unit 104 creates a screenshot image file of the web page being browsed, and uses the history ID, access time, and the like as described above.
  • a file name (path name) is given according to a predetermined rule, and the file is saved in a predetermined folder of the storage device 110.
  • step S113 of FIG. 13 the data corresponding to the tag ID and the history ID acquired in step S111 are acquired from the tag DB 114 and the history DB 112, respectively, and associated with each other.
  • "screenshot save” and “mandarin orange” are associated with the browsing information of the history ID (3) of the history screen 210 as tags.
  • step S115 the history viewer 138 displays the history screen 210.
  • the display processing unit 140 can read the saved site file from the storage device 110 from the path name corresponding to the history ID and the access time.
  • FIG. 16 is a diagram showing an example of the history screen 210.
  • a data display field 214 is further included.
  • the data display field 214 displays the data saved by the storage method specified by the tag associated with the browsing information.
  • the data of the browsed site can be saved in a specified method, so that the site is accessed when the stored information is browsed later. You can view the web page without having to. As a result, the load on the communication band can be reduced by reducing the number of times the site is accessed.
  • the information processing device 100 of the present embodiment is the same as the above-described embodiment except that the tag stored in the tag DB 114 can be edited.
  • FIG. 17 is a functional block diagram showing a logical configuration of the information processing device 100 of the present embodiment.
  • the information processing device 100 further includes a tag updating unit 150 that accepts tag editing (change, addition, deletion) and updates the tag according to the content of the editing.
  • FIG. 18 is a flowchart showing an example of the operation of the information processing device 100 of the present embodiment.
  • the flow of FIG. 18 further includes step S301 in addition to the flow of FIG.
  • the tag selection editor screen 200 includes a UI that accepts at least one operation of adding, editing, and deleting tags.
  • the tag update unit 150 accepts at least one operation of adding, editing, and deleting a tag by using the tag editor screen, and updates the tag DB 114.
  • the tag update unit 150 accepts tags added, edited, or deleted by the operator using the tag selection editor screen 200 (FIG. 5), and updates the tag DB 114.
  • the tag selection editor screen 200 includes a tag field 202 and an active designation field 204 that specifies whether or not to add the tag entered in the tag field 202 to the browsing information.
  • the tag field 202 is, for example, a text box, and the operator can input and add a tag to be added to the tag field 202, or edit a tag that has already been input.
  • the UI (Use Interface) of the tag selection editor screen 200 in FIG. 5 is an example.
  • a list box containing a plurality of predetermined tag candidates, a combo box, a drum roll type selection box, and the like may be used.
  • a UI for example, a delete button for deleting the tag input in the tag field 202 may be included.
  • tags can be added, edited, and deleted, so that the tags assigned during information collection can be changed.
  • the information processing device 100 of the present embodiment is the same as the above-described embodiment except that the storage method of the site can be edited.
  • FIG. 19 is a functional block diagram showing a logical configuration of the information processing device 100 of the present embodiment.
  • the information processing apparatus 100 further includes a tag method update unit 152 that accepts editing (change, addition, deletion) of the storage method and updates the storage method of the tag method DB 118 according to the content of the editing.
  • FIG. 20 is a flowchart showing an example of the operation of the information processing apparatus 100 of the present embodiment.
  • the flow of FIG. 20 further includes step S401 in addition to the flow of FIG.
  • the tag method editing screen (not shown) includes a UI that accepts at least one operation of adding, editing, and deleting a tag method.
  • the tag method updating unit 152 accepts at least one operation of adding, editing, and deleting the tag method using the tag method editing screen, and updates the tag method DB 118.
  • the tag method can be added, edited, and deleted, so that the tag method assigned during the information collection can be changed.
  • FIG. 21 is a functional block diagram showing a logical configuration of the information processing device 100 of the present embodiment.
  • the information processing device 100 of the present embodiment includes both the tag updating unit 150 of the third embodiment and the tag method updating unit 152 of the fourth embodiment.
  • FIG. 22 is a flowchart showing an example of the operation of the information processing apparatus 100 of the present embodiment.
  • the flow of FIG. 22 further includes steps S301 and S401 in addition to the flow of FIG. Step S301 and step S401 of FIG. 22 are the same as step S301 of FIG. 18 and step S401 of FIG.
  • the information processing device 100 of the present embodiment is different from the above-described embodiment in that the tag has a tree structure.
  • a tree structure of a plurality of tags is preset.
  • the designation unit 102 accepts the designated tag and the tag higher than the tag in the tree structure as the designated tag.
  • FIG. 23 is a diagram showing an example of a data structure of information regarding tags having a tree structure.
  • FIG. 23 A
  • FIG. 23 (A) As shown in b), the tree structure is stored in the tree tag table 160.
  • a tree tag ID is assigned to each tag, and the ID of the tag of its own parent (upper hierarchy immediately before) is associated with each tag and stored. Since the tag with the tag name "A" is the highest-level tag itself, the tag ID of the parent does not exist, so it is "Null".
  • the display processing unit 140 further displays a tree structure of a plurality of tags on the display unit.
  • the display processing unit 140 displays the added tag by adding a line associated with another tag to the tree structure.
  • FIG. 24 is a diagram showing an example of the tree screen 220 showing the tree structure of the tag.
  • "Mr. T” and "X organization” linked by the related line L1 indicated by the broken line are tags that are later associated by the operator.
  • "Y University” and "X Institution” linked by the related line L2 indicated by the alternate long and short dash line are also tags that are later associated by the operator.
  • FIG. 25 is a diagram showing an example of a data structure of information regarding the relation line added to the tag of the tree structure of FIG. 23.
  • a tree structure as shown in FIG. 23A is displayed on the screen.
  • the operator selects a pair of two tags (called P1 and P2) that he / she wants to connect with a related line and a line type.
  • the information processing device 100 of the present embodiment accepts an operation by an operator on the screen by a GUI (Graphical User Interface).
  • GUI Graphic User Interface
  • FIG. 25 (a) is a diagram showing an example of the data structure of the relation line table 164.
  • a related line ID is assigned to each related line, and the tag IDs of the tag pairs P1 and P2 connected by the related line and the line ID indicating the line type of the related line are associated and stored in the related line table 164.
  • a memo input by the operator can be attached to the relation line, and the content of the input memo is also stored in association with the relation line table 164.
  • the memo "classmate" attached to the relation line between the tag C and the tag E is stored.
  • the tag D and the tag E are associated with each other by a broken line, and are stored in the relation line table 164 as the relation line ID2.
  • the tag B and the tag D are connected by a alternate long and short dash line and are stored in the association line table 164 as the association line ID3.
  • the line type ID of the alternate long and short dash line is 2.
  • the color and thickness of the line may be different in order to distinguish the related lines.
  • a plurality of different related lines may be stored in the line type table 162 by differentiating at least one of the line type, the line color, and the line thickness.
  • the operator may select from a plurality of different association lines prepared in advance in the line type table 162, or the association lines having different line types, line colors, and line thicknesses specified by the operator can be selected. It may be stored in the line type table 162.
  • FIG. 26 is a diagram showing an example in which the history screen 210 further includes the tree structure display unit 230.
  • the designation unit 102 can also accept the selection of the designated tag on the tree structure display unit 230. For example, if the tag "Mr. A" is specified (1 is set in the active flag), is there a BB indicating AA of all the tags (User, **) located higher than "Mr. A"? The institution, ** laboratory) will be automatically added to the browsing information accessed after that.
  • the tree structure of the tag can also be edited on the tree structure display unit 230.
  • a tree structure may be created using a GUI (Graphical User Interface).
  • a plurality of tags can be specified in a tree structure, a plurality of tags can be efficiently and automatically associated with the browsing information.
  • the tree structure allows tags to be systematically attached, information analysis can be performed more efficiently. Since the browsing information accumulated by combining a plurality of tags can be extracted, the necessary information can be efficiently acquired.
  • the designation unit 102 may accept other tags by user input.
  • the history screen 210 may accept the designation of a tag to be added to the browsing information.
  • the storage processing unit 104 stores the added other tags in association with the browsing information. Specifically, the storage processing unit 104 associates the tag ID of the added other tag with the history ID of the browsing information, and updates the tag history DB 116.
  • the tag attached to the browsing information is managed by the tag history DB 116, but in another embodiment, the storage processing unit 104 is the tag itself attached to each browsing information of the history DB 112. Alternatively, the tag ID may be directly linked and stored.
  • a specification means that accepts the specification of multiple tags at the timing before the input for search
  • An information processing device including a storage processing means for storing browsing information including a URL (Uniform Resource Locator) of a browsed web page in a storage unit in association with the designated tag.
  • the storage processing means further includes the title of the browsed web page in the browsing information and stores it in the storage unit.
  • An information processing device further comprising a display processing means for associating the title of the web page with the tag and displaying the tag on the display unit. 3. 3. 1. 1. Or 2.
  • the designating means receives the designation of at least one tag from the plurality of tags stored in the storage unit, and receives the designation of at least one tag.
  • the storage processing means is an information processing device that associates a tag specified at the time of browsing the web page with the URL and stores it in the storage unit. 4. 3. 3. In the information processing device described in The designation means accepts other tags by user input and receives The storage processing means is an information processing device that adds the other tag to the browsing information. 5. 4.
  • the designation means is an information processing device that accepts a designated tag and a tag higher than the tag in the tree structure as a designated tag. 6. 5.
  • the display processing means is an information processing device that displays the added tag by adding a line associated with another tag to the tree structure. 7. 1. 1. From 6.
  • a tag updating means for accepting editing of the tag and updating the tag according to the content of the editing. 8. 1. 1. From 7.
  • the designation means accepts the designation of the storage method of the web page and accepts the designation.
  • the storage processing means is an information processing device that stores the web page in the designated storage method. 9. 8. In the information processing device described in An information processing device further comprising a display processing means for displaying the saved web page on a display unit. 10. 8. Or 9. In the information processing device described in An information processing device further comprising a method updating means for accepting editing of the saving method and updating the saving method according to the content of the editing.
  • Information processing device Accepts multiple tag specifications at the timing before input for search, An information processing method in which browsing information including a URL (Uniform Resource Locator) of a browsed web page is associated with the designated tag and stored in a storage unit. 12. 11. In the information processing method described in The information processing device Further, the title of the browsed web page is further included in the browsing information and stored in the storage unit. An information processing method for associating the title of the web page with the tag and displaying the tag on the display unit. 13. 11. Or 12. In the information processing method described in The information processing device A plurality of the tags are stored in the storage unit in advance, and the tags are stored in the storage unit in advance.
  • URL Uniform Resource Locator
  • the information processing device further An information processing method that accepts editing of the tag and updates the tag according to the content of the editing. 18. 11. From 17.
  • the information processing method described in any one of The information processing device Accepting the specification of the storage method of the web page, An information processing method for storing the web page in the designated storage method. 19. 18.
  • the information processing method described in The information processing device further An information processing method for displaying the saved web page on a display unit. 20. 18. Or 19.
  • In the information processing method described in The information processing device further An information processing method that accepts editing of the storage method and updates the storage method according to the content of the editing.
  • Procedure for storing a plurality of the tags in the storage unit in advance A procedure for accepting the designation of at least one tag from a plurality of the tags stored in the storage unit.
  • the designation means is a procedure for accepting other tags by user input.
  • the storage processing means is a program for causing a computer to execute a procedure for adding the other tags to the browsing information. 25. 24.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

情報処理装置(100)は、検索のための入力より前のタイミングで、複数のタグの指定を受け付ける指定部(102)と、閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定されたタグに紐づけて履歴DB(112)およびタグ履歴DB(116)に記憶させる記憶処理部(104)と、を備える。

Description

情報処理装置、情報処理方法、およびプログラム
 本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
 特許文献1~3には、ウェブ上の情報を収集し、記憶および管理する技術が記載されている。例えば、特許文献1には、閲覧部での動作を検知して、予め設定した動作時に自動的にインデックス情報を作成することで、ユーザ自身が実際に作成、編集、あるいは、閲覧した文書に対するインデックス情報を自動的に作成し、このインデックス情報を用いて後に文書を検索して呼び出せることが記載されている。
 特許文献2には、ネットワーク上の情報を取得し、取得した情報をインデックス処理してインデックスデータベースを作成し、最新の情報を検索することが記載されている。特許文献3には、ユーザによって使用された検索語句、クリックされた検索結果を自動的に保存および整理してユーザに提供し、情報検索および情報整理の利便性を向上させるブックマークおよびタグ設定装置が記載されている。
特開2000-285134号公報 特開2001-222535号公報 特開2008-071259号公報
 ウェブ上の情報を調べる場合に、同じウェブサイトを再度アクセスするとき、そのURL(Uniform Resource Locator)を登録していることが望ましい。ただし、URLが多くなると、URLがどのようなサイトなのかが管理しにくくなる。
 本発明は上記事情に鑑みてなされたものであり、その目的とするところは、ウェブ上の膨大な情報の中から、必要な情報を適正に効率よく収集するための技術を提供する。
 本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
 第一の側面は、情報処理装置に関する。第一の側面に係る情報処理装置は、検索のための入力より前のタイミングで、複数のタグの指定を受け付ける指定手段と、
 閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる記憶処理手段と、を有する。
 第二の側面は、少なくとも1つのコンピュータにより実行される情報処理方法に関する。第二の側面に係る情報処理方法は、情報処理装置が、
 検索のための入力より前のタイミングで、複数のタグの指定を受け付け、
 閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる、ことを含む。
 なお、本発明の他の側面としては、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
 このコンピュータプログラムは、コンピュータにより実行されたとき、コンピュータに、情報処理装置上で、その処理方法を実施させるコンピュータプログラムコードを含む。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
 また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
 また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障のない範囲で変更することができる。
 さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
 上記各側面によれば、インターネット上に散在する様々な情報の中から、必要な情報を適正に効率よく収集するための技術を提供できる。
本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 情報処理装置を実現するコンピュータのハードウェア構成例を示すブロック図である。 履歴DBのデータ構造の一例を示す図である。 タグDBのデータ構造の一例を示す図である。 タグ選択エディタ画面の一例を示す図である。 タグ履歴DBのデータ構造の一例を示す図である。 情報分析の手順の一例を示すフローチャートである。 本実施形態の情報処理装置の動作の一例を示すフローチャートである。 情報処理装置の詳細な機能とデータの流れを説明するための図である。 図8の動作フロー時のデータベースのレコードの変化を説明するための図である。 履歴画面の一例を示す図である。 タグ方式DBのデータ構造の一例を示す図である。 情報処理装置の動作の一例を示すフローチャートである。 情報処理装置の詳細な機能とデータの流れを説明するための図である。 図13の動作フロー時のデータベースのレコードの変化を説明するための図である。 履歴画面の一例を示す図である。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 本実施形態の情報処理装置の動作の一例を示すフローチャートである。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 本実施形態の情報処理装置の動作の一例を示すフローチャートである。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 本実施形態の情報処理装置の動作の一例を示すフローチャートである。 ツリー構造のタグに関する情報のデータ構造の一例を示す図である。 ツリー画面の一例を示す図である。 図23のツリー構造のタグに追加される関連線に関する情報のデータ構造の例を示す図である。 履歴画面にツリー画面を含んだ例を示す図である。 情報処理装置の変形例の論理的な構成を示す機能ブロック図である。
 以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
(第1の実施の形態)
 インターネット上で情報分析を行うための作業は、以下の3つである。
(a)収集:必要な情報が含まれる可能性のある複数のサイト情報を収集する。
(b)処理:アクセスしたサイトの中で役立つと思われる情報に付加情報を付けて保存する。
(c)加工:付加情報に基づいて、再度サイトを閲覧しながら、情報を取捨選択し、必要な情報に加工する。
 付加情報とは、後でサイトに記載されている情報の内容が分かるように、あるいは、検索をかけて探し出しやすくするための情報である。本実施形態では、この付加情報をタグと呼ぶ。本実施形態では、タグとは、検索した結果得られる情報を、意味付けするための文字列、あるいは、分類または識別するための単語やフレーズ等の文字列を含むデータである。他の実施形態では、さらに、タグは他の情報を含む。
 必要な情報とは、情報分析の目的を果たすための分析結果から作成される情報である。
 本実施形態の情報処理装置100は、インターネット上で情報分析を行うために、ブラウザ機能を有するアプリケーションを実行し、インターネットに接続して、必要な情報を検索するなどしてウェブサイトを表示、またはウェブサイトの情報を記憶する。なお、インターネットを検索して得られた情報に付加されるタグは、検索時に用いられた検索キーワードとは異なる単語やフレーズであってよい。
 図1は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。
 情報処理装置100は、指定部102と、記憶処理部104と、を備える。
 指定部102は、検索のための入力より前のタイミングで、複数のタグの指定を受け付ける。記憶処理部104は、閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定されたタグに紐づけて記憶装置110(後述する履歴DB112およびタグ履歴DB116)に記憶させる。
 記憶装置110は、後述する複数のデータベース(以下、「DB」(DataBase)とも呼ぶ)を含む。ただし、情報処理装置100は、データベース構造に限定されない。情報処理装置100に記憶されるデータは、その他のファイル形式(例えば、CSV(Comma-Separated Values)、テキストファイルなど)でもよい。また、記憶装置110には、サイトに含まれる画像または動画ファイル等を記憶してもよい。記憶装置110は、情報処理装置100の内部に設けられてもよいし、外部に設けられてもよい。記憶装置110は、物理的に複数の記憶装置であってもよい。
 図2は、情報処理装置100を実現するコンピュータ60のハードウェア構成例を示すブロック図である。情報処理装置100は複数のコンピュータ60により実現されてもよい。
 コンピュータ60は、CPU(Central Processing Unit)62、メモリ64、メモリ64にロードされた各サーバおよびユーザ端末の構成要素を実現するプログラム80、そのプログラム80を格納するストレージ66、I/O(Input/Output)68、および通信ネットワーク3接続用のインタフェース(通信I/F70)を備える。
 CPU62、メモリ64、ストレージ66、I/O68、通信I/F70は、バス69を介して互いに接続され、CPU62により各サーバおよびユーザ端末がそれぞれ制御される。ただし、CPU62などを互いに接続する方法は、バス接続に限定されない。
 メモリ64は、RAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。ストレージ66は、ハードディスク、SSD(Solid State Drive)、またはメモリカードなどの記憶装置である。
 ストレージ66は、RAMやROMなどのメモリであってもよい。ストレージ66は、コンピュータ60の内部に設けられてもよいし、コンピュータ60がアクセス可能であれば、コンピュータ60の外部に設けられ、コンピュータ60と有線または無線で接続されてもよい。あるいは、コンピュータ60に着脱可能に設けられてもよい。
 CPU62が、ストレージ66に記憶されるプログラム80をメモリ64に読み出して実行することにより、図1の情報処理装置100の各ユニットの各機能を実現することができる。
 I/O68は、コンピュータ60と他の入出力装置間のデータおよび制御信号の入出力制御を行う。他の入出力装置とは、たとえば、コンピュータ60に接続されるキーボード、タッチパネル、マウス、およびマイクロフォン等の入力装置72と、ディスプレイ(図中、表示装置74と示す)、プリンタ、およびスピーカ等の出力装置(不図示)と、これらの入出力装置とコンピュータ60のインタフェースとを含む。さらに、I/O68は、他の記録媒体の読み取りまたは書き込み装置(不図示)とのデータの入出力制御を行ってもよい。
 通信I/F70は、コンピュータ60と外部の装置との通信を行うためのネットワーク接続用インタフェースである。通信I/F70は、有線回線と接続するためのネットワークインタフェースでもよいし、無線回線と接続するためのネットワークインタフェースでもよい。たとえば、情報処理装置100を実現するコンピュータ60は、通信I/F70により通信ネットワーク3を介して互いに接続される。
 図1の情報処理装置100の各構成要素は、図2のコンピュータ60のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各実施形態の情報処理装置100を示す機能ブロック図は、ハードウェア単位の構成ではなく、論理的な機能単位のブロックを示している。また、各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
 記憶処理部104は、さらに、閲覧したウェブページのタイトルをさらに閲覧情報に含めて履歴DB112に記憶させる。情報処理装置100は、さらに、ウェブページのタイトルと、タグを関連付けて表示部(表示装置74)に表示させる表示処理部140(図27)をさらに備えることができる。
 図3は、閲覧情報を記憶する履歴DB112のデータ構造の一例を示す図である。履歴DB112は、各閲覧情報に付与される識別情報(履歴IDと呼ぶ)と、ウェブページにアクセスした時刻情報と、当該ウェブページのURLと、当該ウェブページのタイトルとを紐付けて記憶している。ただし、履歴DB112は、少なくとも当該ウェブページのURLを含んでいればよい。
 さらに、情報処理装置100において、複数のタグをタグDB114に予め記憶しておいてもよい。この場合、指定部102は、タグDB114に記憶されている複数のタグの中から、少なくとも一つのタグの指定を受け付ける。記憶処理部104は、ウェブページを閲覧時に、予め指定されていたタグを閲覧情報に紐付けて記憶させる。ただし、タグは、少なくともウェブページのURLに紐付けられていればよい。
 指定部102により検索のための入力より前のタイミングで指定される複数のタグは、タグDB114に記憶されている。検索のための入力より前のタイミングとは、インターネット検索を実行して得られた検索結果の中から閲覧するサイトを選択してウェブページを表示またはダウンロードする前のタイミングであれば、特に限定されない。そして、記憶処理部104は、事前に指定されているタグを、ウェブページを閲覧したタイミングで閲覧情報に紐付けて記憶させる。
 図4は、タグDB114のデータ構造の一例を示す図である。タグDB114には、タグ情報が記憶されており、タグ情報は、タグを識別するタグIDと、タグと、アクティブフラグと、含む。タグDB114は、複数のタグが記憶されているが、検索の前に、これから検索して得られる結果に対して付与したいタグを指定することができる。図4のタグDB114の例では、付与すると指定されたタグのアクティブフラグを「1」とし、指定されていないタグのアクティブフラグを「0」としているが、これら限定されない。
 タグDB114に記憶されるタグ情報は、オペレータによりエディタ画面で編集できてもよい。指定部102は、タグ選択エディタ画面200にオペレータが入力および指定したタグを受け付け、オペレータにより指定されたタグを、タグDB114に記憶させる。図5は、タグ選択エディタ画面200の一例を示す図である。情報処理装置100は、タグ選択エディタ画面200を含む各種の画面を図2の表示装置74に表示させることができる。
 タグ選択エディタ画面200は、タグ欄202と、タグ欄202のタグを閲覧情報に付与するか否かを指定するアクティブ指定欄204とを含む。タグ欄202は、予め指定されているタグが表示される。アクティブ指定欄204は、例えば、チェックボックスであり、チェックされたタグが閲覧情報に付与される。アクティブ指定欄204でチェックされたタグについて、図4のタグDB114のアクティブフラグに「1」がセットされる。アクティブ指定欄204のチェックが外されたタグについては、図4のタグDB114のアクティブフラグに「0」がセットされる。
 記憶処理部104により閲覧情報にタグ情報に指定されているタグが付与されると、タグ履歴DB116にタグ付与の履歴情報が記憶される。図6は、タグ履歴DB116のデータ構造の一例を示す図である。タグ履歴DB116に記憶されるタグ付与の履歴情報は、履歴情報を識別するタグ履歴IDと、タグが付与された閲覧情報の履歴IDと、当該閲覧情報に付与されたタグのタグIDとが紐付けされて記憶される。例えば、図3の履歴DB112の履歴IDが1の閲覧情報には、2つのタグ「リンゴ」と「みかん」が付与されているので、「リンゴ」と「みかん」のタグIDの1と2がそれぞれ紐付けられている。
 ここで、情報処理装置100を用いてインターネット上で情報を調査および分析する手順について説明する。図7は、情報分析の手順の一例を示すフローチャートである。
 まず、分析者は、調査のテーマを受領する(ステップS1)。分析者は、ブラウザを用いて、検索エンジンサイトで調査のための検索単語を入力し(ステップS3)、検索を実行する(ステップS5)。検索結果が表示される(ステップS7)。分析者は、検索結果を閲覧し、気になるサイトがあれば(ステップS9の有)、そのサイトにアクセスして閲覧する(ステップS11)。
 そして、ステップS15~ステップS21の処理120が記憶処理部104によって実施される。記憶処理部104は、タグDB114を参照し、アクティブフラグがセットされているタグがある場合(ステップS15のY)、当該タグを閲覧したサイトの閲覧情報に紐付けする(ステップS17)。アクティブフラグがセットされているタグがない場合(ステップS15のN)、ステップS17をバイパスする。
 そして、記憶処理部104は、サイトの閲覧ページの閲覧情報を履歴DB112に保存する(ステップS19)。さらに、記憶処理部104は、後述する実施形態で説明するように、予め閲覧ページの保存が指定されている場合、予め指定されているファイル形式で閲覧ページのコンテンツ自体を保存してもよい。例えば、ブラウザから、HTML(HyperText Markup Language)ファイル、PDF(Portable Document Format)ファイル、テキストファイル、および、スクリーンショットの画像ファイル等の少なくともいずれか一つのファイル形式で保存する。
 そして、記憶処理部104は、閲覧情報(URL等)にタグを紐付けてタグ履歴DB116に保存する(ステップS21)。検索結果の中から他に気になるサイトがあれば、ステップS7に戻り、処理を繰り返す。
 ステップS9で気になるサイトがなかった場合(ステップS9の無)、分析者は、いままでの調査内容の情報を参照し(ステップS23)、新しい検索単語を抽出する(ステップS25)。そして、ステップS3に戻り、分析者は、抽出した新しい単語を入力し、再検索を行う。
 情報処理装置100は、この図7の情報分析手順の処理120における閲覧情報にタグを付与するための処理を自動で行う。以下、情報処理装置100の動作について詳細に説明する。図8は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。図9は、情報処理装置100の詳細な機能とデータの流れを説明するための図である。図10は、図8の動作フロー時のデータベースのレコードの変化を説明するための図である。
 図9において、情報処理装置100は、ページ表示部130と、履歴作成機能132と、タグ履歴追加機能134と、タグ選択エディタ136と、履歴ビューア138と、を含む。
 タグ選択エディタ136は、図1の指定部102に相当する。履歴作成機能132と、タグ履歴追加機能134は、図1の記憶処理部104に相当する。
 ページ表示部130は、例えば、ブラウザである。履歴ビューア138は、情報処理装置100の記憶処理部104によって作成された閲覧履歴を表示する。
 履歴作成機能132、タグ履歴追加機能134、タグ選択エディタ136、および履歴ビューア138は、例えば、ブラウザ(ページ表示部130)のアドオンとしてそれぞれ機能追加することができる。
 タグ選択エディタ136は、タグ選択エディタ画面200を表示し、タグの指定を受け付ける。履歴ビューア138は、表示処理部140に相当し、履歴画面210を表示する。
 まず、タグ選択エディタ136(指定部102)は、タグ選択エディタ画面200を表示して、閲覧情報に自動付与するタグの指定を受け付ける(ステップS101)。ここでは、複数のタグのうち、「みかん」のアクティブ指定欄204がチェックされている。
 タグ選択エディタ136(指定部102)は、自動的に付与すると指定されたタグのタグDB114のアクティブフラグに「1」をセットする(ステップS103)。図10(a)の例では、タグIDが2のタグの「みかん」のアクティブフラグに1がセットされている。このステップS101とステップS103は、図7のステップS1で調査テーマを受領した後、ステップS3の検索単語の入力より前に行われる。
 ここで、分析者は、ページ表示部130(ブラウザ)で検索を行い(図7のステップS3、ステップS5に対応)、検索結果の中から閲覧したいサイトを選び、サイトにアクセスして閲覧する。分析者によりサイトが閲覧されると(ステップS105のYES)、履歴作成機能132(記憶処理部104)は、閲覧されたサイトの閲覧情報として、アクセス時刻と、URLと、タイトルとを履歴DB112に保存し、履歴を作成する(ステップS107)。図10(b)の例では、履歴DB112に履歴IDが3のレコードが追加されている。この図8のステップS107が、図7のステップS19に相当する。
 ステップS105で、記憶処理部104により分析者がサイトを閲覧したと判定されるタイミングは様々考えられる。例えば、閲覧のためにサイトの選択操作を受け付けたとき、選択されたサイトにアクセスしたとき、および、選択されたサイトのウェブページのダウンロードが完了したとき、の少なくともいずれか一つである。
 そして、タグ履歴追加機能134(記憶処理部104)は、タグDB114でアクティブフラグが1であるタグをタグ履歴DB116に記憶し、閲覧情報と紐付ける(ステップS109)。この図8のステップS109が、図7のステップS21に相当する。図10(c)の例では、タグ履歴DB116のタグ履歴IDが4のレコードが追加されていて、履歴ID(3)とタグID(2)が紐付けられている。
 他のページが閲覧されると、さらに、履歴DB112に閲覧情報が同様に追加され、タグ履歴DB116にも閲覧情報とタグの紐付け情報が同様に追加される。このようにして閲覧履歴が蓄積されている。また、タグの付与は、自動付与以外にも、オペレータの操作を任意のタイミングで受け付けて行うことができる。例えば、ページを閲覧した上で、自動付与設定されているタグ以外のタグを付与したいとオペレータが考えた場合などに、手動でタグを付与できてよい。例えば、タグを手動で付与するための操作メニューを開いて、テキスト入力ボックスへの入力、あるいは、プルダウンメニューでの選択を受け付け、タグを設定できてよい。さらに、既に付与されているタグについて、例えば、付与済みのタグを選択し、右クリックで操作メニューを表示させて削除操作を選択するなどして削除できてもよい。受け付けた操作内容に従い、記憶処理部104は、当該タグを追加または削除する。
 蓄積された閲覧履歴は履歴ビューア138を用いて閲覧できる。履歴ビューア138は、履歴画面210を表示する。このとき、まず、タグ履歴DB116を参照し、タグIDと履歴IDのペアを取得する(ステップS111)。そして、取得したタグIDと履歴IDに対応するデータをそれぞれタグDB114と履歴DB112から取得して紐付ける(ステップS113)。図9の例では、履歴画面210の履歴IDが3の閲覧情報(アクセス時刻、URL、タイトル)にタグ(みかん)が紐付けられている。
 そして、履歴ビューア138は、ステップS113で取得した閲覧情報とタグを履歴画面210に表示させる(ステップS115)。ステップS111~ステップS115の処理は、タグ履歴DB116のレコード毎に繰り返される。
 実施形態において「取得」とは、自装置が他の装置や記憶媒体に格納されているデータまたは情報を取りに行くこと(能動的な取得)、および、自装置に他の装置から出力されるデータまたは情報を入力すること(受動的な取得)の少なくとも一方を含む。能動的な取得の例は、他の装置にリクエストまたは問い合わせしてその返信を受信すること、及び、他の装置や記憶媒体にアクセスして読み出すこと等がある。また、受動的な取得の例は、配信(または、送信、プッシュ通知等)される情報を受信すること等がある。さらに、「取得」とは、受信したデータまたは情報の中から選択して取得すること、または、配信されたデータまたは情報を選択して受信することであってもよい。
 図11は、このようにして作成された履歴画面210の一例を示す図である。履歴画面210は、サイトのタイトル(名称)と、保存日時(またはアクセス時刻)と、付与された複数のタグとを含む閲覧情報リスト表示欄212を含んでいる。
 以上説明したように、本実施形態の情報処理装置100によれば、指定部102により検索のための入力よりも前に指定されたタグを、閲覧されたサイトの情報に紐付けて記憶することができる。このため、蓄積された閲覧情報を後で分析する場合に、タグに基づいて、効率よく分析することができる。
(第2の実施の形態)
 本実施形態の情報処理装置100は、上記実施形態とは、タグとして文字列だけでなく、ウェブページのコンテンツを保存する方式を予め指定しておき、閲覧情報にウェブページのコンテンツを指定された方式で保存する点以外は同じである。
 指定部102は、ウェブページの保存方式の指定を受け付ける。記憶処理部104は、指定された保存方式でウェブページを記憶装置110に記憶させる。
 図12は、タグ方式DB118のデータ構造の一例を示す図である。タグ方式DB118は、タグ方式を識別するタグIDと、タグの保存方式とを含む。ここでは、タグの保存方式として、スクリーンショット保存と、PDF保存と、何もしない(言い換えると、データ保存は行わず、文字列などのタグを付与する)とを含んでいる。
 表示処理部140は、保存されたウェブページを表示部に表示させる。
 スクリーンショットの画像ファイルやPDFファイル等は、記憶装置110の予め定められたフォルダまたは随時指定されるフォルダに保存される。例えば、記憶処理部104は、保存されるファイルのファイル名(パス名)として、履歴ID、アクセス時刻等を用いた所定の規則に従い付与する。これにより、表示処理部140は、履歴IDに対応するウェブページの保存されたファイルを読み出すことができる。
 図13は、情報処理装置100の動作の一例を示すフローチャートである。図14は、情報処理装置100の詳細な機能とデータの流れを説明するための図である。図15は、図13の動作フロー時のデータベースのレコードの変化を説明するための図である。
 図13のフローは、図8のフローにステップS201をさらに含んでいる。さらに、図13のフローのステップS109の替わりにステップS203を含む。指定部102は、タグ方式DB118を参照し、タグ方式DB118に含まれる方式IDをタグDB114に反映する(ステップS201)。図15(a)にタグDB114の一例を示す。
 図13のステップS203で、タグ履歴追加機能134は、タグDB114のアクティブフラグが1のタグを閲覧情報に紐付けしてタグ履歴DB116に保存する。図15(c)の例では、タグ履歴ID(4)にデータをスクショ保存が、タグ履歴ID(5)にデータなしが紐付けられている。
 このとき、記憶処理部104は、タグにスクショ保存が紐付けられている場合、閲覧されているウェブページのスクリーンショット画像ファイルを作成し、上記したように、履歴ID、アクセス時刻等を用いた所定の規則に従いファイル名(パス名)を付けて記憶装置110の所定のフォルダに保存する。
 そして、図13のステップS113では、ステップS111で取得したタグIDと履歴IDに対応するデータをそれぞれタグDB114と履歴DB112から取得して紐付ける。図14の例では、履歴画面210の履歴ID(3)の閲覧情報にタグとして「スクショ保存」と「みかん」が紐付けられている。そして、ステップS115で履歴ビューア138は履歴画面210を表示する。このとき、表示処理部140は、履歴IDやアクセス時刻に対応するパス名から保存されたサイトのファイルを記憶装置110から読み出すことができる。
 図16は、履歴画面210の一例を示す図である。図11の履歴画面210に加え、さらに、データ表示欄214を含んでいる。データ表示欄214は、閲覧情報に紐付けられたタグで指定された保存方式で保存されたデータを表示する。
 以上説明したように、本実施形態の情報処理装置100によれば、閲覧したサイトのデータを指定した方式で保存することができるので、後で蓄積された情報を閲覧するときに、サイトにアクセスせずにウェブページを見ることができる。これにより、サイトへのアクセス回数を減らすことで通信帯域への負荷を小さくすることができる。
(第3の実施の形態)
 本実施形態の情報処理装置100は、上記実施形態とは、タグDB114に記憶されるタグを編集できる点以外は、同じである。図17は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。情報処理装置100は、タグの編集(変更、追加、削除)を受け付け、当該編集の内容に従いタグを更新するタグ更新部150をさらに備える。
 図18は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。図18のフローは、図13のフローに加え、さらにステップS301を含む。
 タグ選択エディタ画面200は、タグを追加、編集、および削除の少なくともいずれか一つの操作を受け付けるUIを含む。ステップS301では、タグ更新部150は、タグのエディタ画面を用いて、タグの追加、編集、および削除の少なくともいずれか一つの操作を受け付け、タグDB114を更新する。
 タグ更新部150は、タグ選択エディタ画面200(図5)を用いてオペレータが追加、編集、または削除したタグを受け付け、タグDB114を更新する。
 タグ選択エディタ画面200は、タグ欄202と、タグ欄202に入力されたタグを閲覧情報に付与するか否かを指定するアクティブ指定欄204とを含む。タグ欄202は、例えば、テキストボックスであり、オペレータは当該タグ欄202に付与したいタグを入力して追加したり、既に入力されているタグを編集したりできる。
 図5のタグ選択エディタ画面200のUI(Use Interface)は一例である。他の例として、予め指定された複数のタグ候補を含むリストボックス、コンボボックス、ドラムロール式の選択ボックスなどでもよい。また、図示していないが、タグ欄202に入力されたタグを削除するUI(例えば、削除ボタンなど)を含んでもよい。
 以上説明したように、本実施形態の情報処理装置100によれば、タグを追加、編集、および削除することができるので、情報収集の途中で付与するタグを変更することができる。
(第4の実施の形態)
 本実施形態の情報処理装置100は、サイトの保存方式を編集できる点以外は、上記実施形態と同じである。図19は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。情報処理装置100は、保存方式の編集(変更、追加、削除)を受け付け、編集の内容に従いタグ方式DB118の保存方式を更新するタグ方式更新部152をさらに備える。
 図20は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。図20のフローは、図13のフローに加え、さらにステップS401を含む。
 タグ方式編集画面(不図示)は、タグ方式を追加、編集、および削除の少なくともいずれか一つの操作を受け付けるUIを含む。ステップS401では、タグ方式更新部152は、タグ方式編集画面を用いて、タグ方式の追加、編集、および削除の少なくともいずれか一つの操作を受け付け、タグ方式DB118を更新する。
 以上説明したように、本実施形態の情報処理装置100によれば、タグ方式を追加、編集、および削除することができるので、情報収集の途中で付与するタグ方式を変更することができる。
(第5の実施の形態)
 図21は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。本実施形態の情報処理装置100は、第3実施形態のタグ更新部150と、第4実施形態のタグ方式更新部152の両方を備える。
 図22は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。図22のフローは、図13のフローに加え、さらにステップS301とステップS401とを含む。図22のステップS301とステップS401は、図18のステップS301と図20のステップS401と同じである。
 本実施形態によれば、第3実施形態と第4実施形態と同様な効果を奏する。
(第6の実施の形態)
 本実施形態の情報処理装置100は、タグがツリー構造を有する点で上記実施形態と相違する。
 複数のタグのツリー構造が予め設定されている。
 指定部102は、ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける。
 図23は、ツリー構造のタグに関する情報のデータ構造の一例を示す図である。
 図23(a)に示すような、タグ名が「A」、「B」、「C」、「D」、「E」の複数のタグのツリー構造が予め定められている場合、図23(b)に示すように、ツリータグテーブル160にツリー構造が記憶されている。各タグには、ツリータグIDが付与されており、タグ毎に自身の親(直前の上位の階層)のタグのIDを紐付けて記憶している。タグ名「A」のタグは自身が最上位のタグであるので、親のタグIDは存在しないために、「Null」となっている。
 表示処理部140は、さらに、複数のタグのツリー構造を表示部に表示させる。表示処理部140は、追加されたタグを、別のタグに紐付ける線をツリー構造に追加して表示させる。図24は、タグのツリー構造の示すツリー画面220の一例を示す図である。ツリー画面220において、破線で示される関連線L1で結び付けられている「Tさん」と「X機関」がオペレータにより後から関連付けられたタグである。さらに、一点鎖線で示される関連線L2で結び付けられている「Y大学」と「X機関」もオペレータにより後から関連付けられたタグである。
 図25は、図23のツリー構造のタグに追加される関連線に関する情報のデータ構造の例を示す図である。例えば、図23(a)に示すようなツリー構造が画面表示されているとする。オペレータは、関連線で結び付けたい2つのタグのペア(P1とP2と呼ぶ)と、線の種類とを選択する。なお、本実施形態の情報処理装置100は、GUI(Graphical User Interface)により画面上でのオペレータによる操作を受け付ける。
 一例として、まず、図25(a)に示すように、タグCとタグEが選択され、破線の関連線で結び付けられたとする。図25(b)に示す線種テーブル162から、種類が破線の線IDは1となる。図25(c)は、関連線テーブル164のデータ構造の一例を示す図である。関連線毎に関連線IDが付与され、関連線で結ばれるタグのペアP1とP2のタグIDと、関連線の線種を示す線IDと、が対応付けられて関連線テーブル164に記憶される。さらに、関連線には、オペレータが入力したメモを付けることができ、入力されたメモの内容も当該関連線テーブル164に対応付けて記憶される。ここでは、タグCとタグEの関連線に付けられたメモ「同級生」が記憶されている。
 同様に、タグDとタグEが破線で関連付けられ、関連線ID2として関連線テーブル164に記憶されている。さらに、タグBとタグDが一点鎖線で結び付けられ、関連線ID3として関連線テーブル164に記憶されている。一点鎖線の線種IDは2となっている。なお、関連線を区別するために、実線、破線、一点鎖線、二点鎖線、二重線などの線種を変えるほかに、線の色や線の太さを異ならせてもよい。線種、線の色、および線の太さの少なくともいずれか一つを異ならせて、複数の異なる関連線を線種テーブル162に記憶してもよい。線種テーブル162に予め準備されている複数の異なる関連線の中から、オペレータが選択してもよいし、オペレータが指定した、線種、線の色、および線の太さの異なる関連線を線種テーブル162に記憶してもよい。
 図26は、履歴画面210にさらにツリー構造表示部230を含んだ例を示す図である。
 指定部102は、ツリー構造表示部230上で、指定するタグの選択を受け付けることもできる。例えば、タグ「A氏」をタグ指定(アクティブフラグに1をセット)すると、「A氏」より上位に位置する全ての複数のタグ(User、**のAAを示すBBはあるのか、**機関、**研究所)が、その後にアクセスされた閲覧情報に自動的に付与されることになる。
 また、タグのツリー構造の編集は、ツリー構造表示部230上で行うこともできる。GUI(Graphical User Interface)を用いて、ツリー構造を作成できてもよい。
 以上説明したように、本実施形態によれば、複数のタグをツリー構造で指定することができるので、複数のタグを効率よく自動的に関連付けて閲覧情報に紐付けることができる。また、ツリー構造なのでタグを系統立って付与できるので、情報分析をより効率よく行うことができる。複数のタグを組み合わせて蓄積した閲覧情報を抽出することができるので、効率よく必要な情報を取得することができる。
 以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
 たとえば、指定部102は、ユーザ入力により他のタグを受け付けてもよい。例えば、履歴画面210において、閲覧情報に対して追加するタグの指定を受け付けてもよい。記憶処理部104は、追加された他のタグを閲覧情報に紐付けて記憶する。具体的には、記憶処理部104は、追加された他のタグのタグIDと閲覧情報の履歴IDを紐付け、タグ履歴DB116を更新する。
 また、上記実施形態では、閲覧情報に付与されたタグをタグ履歴DB116で管理する構成としていたが、他の実施形態では、記憶処理部104は、履歴DB112の各閲覧情報に付与されたタグそのものまたはタグIDを直接紐付けて記憶させてもよい。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 なお、本発明において利用者に関する情報を取得、利用する場合は、これを適法に行うものとする。
 上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1. 検索のための入力より前のタイミングで、複数のタグの指定を受け付ける指定手段と、
 閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる記憶処理手段と、を備える情報処理装置。
2. 1.に記載の情報処理装置において、
 前記記憶処理手段は、さらに、前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させ、
 前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる表示処理手段をさらに備える、情報処理装置。
3. 1.または2.に記載の情報処理装置において、
 複数の前記タグを記憶部に予め記憶しておき、
 前記指定手段は、前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付け、
 前記記憶処理手段は、前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる、情報処理装置。
4. 3.に記載の情報処理装置において、
 前記指定手段は、ユーザ入力により他のタグを受け付け、
 前記記憶処理手段は、前記他のタグを前記閲覧情報に追加する、情報処理装置。
5. 4.に記載の情報処理装置において、
 前記複数のタグのツリー構造が予め設定されており、
 前記指定手段は、前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける、情報処理装置。
6. 5.に記載の情報処理装置において、
 複数のタグのツリー構造を表示部に表示させる表示処理手段を備え、
 前記表示処理手段は、追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる、情報処理装置。
7. 1.から6.のいずれか一つに記載の情報処理装置において、
 前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新するタグ更新手段をさらに備える、情報処理装置。
8. 1.から7.のいずれか一つに記載の情報処理装置において、
 前記指定手段は、前記ウェブページの保存方式の指定を受け付け、
 前記記憶処理手段は、指定された前記保存方式で前記ウェブページを記憶させる、情報処理装置。
9. 8.に記載の情報処理装置において、
 保存された前記ウェブページを表示部に表示させる表示処理手段をさらに備える、情報処理装置。
10. 8.または9.に記載の情報処理装置において、
 前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する方式更新手段をさらに備える情報処理装置。
11. 情報処理装置が、
 検索のための入力より前のタイミングで、複数のタグの指定を受け付け、
 閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる情報処理方法。
12. 11.に記載の情報処理方法において、
 前記情報処理装置が、
 さらに、前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させ、
 前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる、情報処理方法。
13. 11.または12.に記載の情報処理方法において、
 前記情報処理装置が、
 複数の前記タグを記憶部に予め記憶しておき、
 前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付け、
 前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる、情報処理方法。
14. 13.に記載の情報処理方法において、
 前記情報処理装置が、
 ユーザ入力により他のタグを受け付け、
 前記他のタグを前記閲覧情報に追加する、情報処理方法。
15. 14.に記載の情報処理方法において、
 前記情報処理装置が、
 前記複数のタグのツリー構造が予め設定されており、
 前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける、情報処理方法。
16. 15.に記載の情報処理方法において、
 前記情報処理装置が、さらに、
 複数のタグのツリー構造を表示部に表示させ、
 追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる、情報処理方法。
17. 11.から16.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、さらに、
 前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新する、情報処理方法。
18. 11.から17.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、
 前記ウェブページの保存方式の指定を受け付け、
 指定された前記保存方式で前記ウェブページを記憶させる、情報処理方法。
19. 18.に記載の情報処理方法において、
 前記情報処理装置が、さらに、
 保存された前記ウェブページを表示部に表示させる、情報処理方法。
20. 18.または19.に記載の情報処理方法において、
 前記情報処理装置が、さらに、
 前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する、情報処理方法。
21. コンピュータに、
 検索のための入力より前のタイミングで、複数のタグの指定を受け付ける手順、
 閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる手順、を実行させるためのプログラム。
22. 21.に記載のプログラムにおいて、さらに、
 前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させる手順、
 前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる手順、をコンピュータに実行させるためのプログラム。
23. 21.または22.に記載のプログラムにおいて、
 複数の前記タグを記憶部に予め記憶する手順、
 前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付ける手順、
 前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる手順、をコンピュータに実行させるためのプログラム。
24. 23.に記載のプログラムにおいて、
 前記指定手段は、ユーザ入力により他のタグを受け付ける手順、
 前記記憶処理手段は、前記他のタグを前記閲覧情報に追加する手順、をコンピュータに実行させるためのプログラム。
25. 24.に記載のプログラムにおいて、
 前記複数のタグのツリー構造が予め設定されており、
 前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける手順、をコンピュータに実行させるためのプログラム。
26. 25.に記載のプログラムにおいて、さらに、
 複数のタグのツリー構造を表示部に表示させる手順、
 追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる手順、をコンピュータに実行させるためのプログラム。
27. 21.から26.のいずれか一つに記載のプログラムにおいて、さらに、
 前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新する手順、をコンピュータに実行させるためのプログラム。
28. 21.から27.のいずれか一つに記載のプログラムにおいて、
 前記ウェブページの保存方式の指定を受け付ける手順、
 指定された前記保存方式で前記ウェブページを記憶させる手順、をコンピュータに実行させるためのプログラム。
29. 28.に記載のプログラムにおいて、さらに、
 保存された前記ウェブページを表示部に表示させる手順、をコンピュータに実行させるためのプログラム。
30. 28.または29.に記載のプログラムにおいて、さらに、
 前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する手順、をコンピュータに実行させるためのプログラム。
 この出願は、2019年9月10日に出願された日本出願特願2019-164594号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
3 通信ネットワーク
60 コンピュータ
62 CPU
64 メモリ
66 ストレージ
68 I/O
69 バス
70 通信I/F
72 入力装置
74 表示装置
80 プログラム
100 情報処理装置
102 指定部
104 記憶処理部
110 記憶装置
112 履歴DB
114 タグDB
116 タグ履歴DB
118 タグ方式DB
120 処理
130 ページ表示部
132 履歴作成機能
134 タグ履歴追加機能
136 タグ選択エディタ
138 履歴ビューア
140 表示処理部
150 タグ更新部
152 タグ方式更新部
200 タグ選択エディタ画面
202 タグ欄
204 アクティブ指定欄
210 履歴画面
212 閲覧情報リスト表示欄
214 データ表示欄
220 ツリー画面
230 ツリー構造表示部

Claims (30)

  1.  検索のための入力より前のタイミングで、複数のタグの指定を受け付ける指定手段と、
     閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる記憶処理手段と、を備える情報処理装置。
  2.  請求項1に記載の情報処理装置において、
     前記記憶処理手段は、さらに、前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させ、
     前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる表示処理手段をさらに備える、情報処理装置。
  3.  請求項1または2に記載の情報処理装置において、
     複数の前記タグを記憶部に予め記憶しておき、
     前記指定手段は、前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付け、
     前記記憶処理手段は、前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる、情報処理装置。
  4.  請求項3に記載の情報処理装置において、
     前記指定手段は、ユーザ入力により他のタグを受け付け、
     前記記憶処理手段は、前記他のタグを前記閲覧情報に追加する、情報処理装置。
  5.  請求項4に記載の情報処理装置において、
     前記複数のタグのツリー構造が予め設定されており、
     前記指定手段は、前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける、情報処理装置。
  6.  請求項5に記載の情報処理装置において、
     複数のタグのツリー構造を表示部に表示させる表示処理手段を備え、
     前記表示処理手段は、追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる、情報処理装置。
  7.  請求項1から6のいずれか一項に記載の情報処理装置において、
     前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新するタグ更新手段をさらに備える、情報処理装置。
  8.  請求項1から7のいずれか一項に記載の情報処理装置において、
     前記指定手段は、前記ウェブページの保存方式の指定を受け付け、
     前記記憶処理手段は、指定された前記保存方式で前記ウェブページを記憶させる、情報処理装置。
  9.  請求項8に記載の情報処理装置において、
     保存された前記ウェブページを表示部に表示させる表示処理手段をさらに備える、情報処理装置。
  10.  請求項8または9に記載の情報処理装置において、
     前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する方式更新手段をさらに備える情報処理装置。
  11.  情報処理装置が、
     検索のための入力より前のタイミングで、複数のタグの指定を受け付け、
     閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる情報処理方法。
  12.  請求項11に記載の情報処理方法において、
     前記情報処理装置が、
     さらに、前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させ、
     前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる、情報処理方法。
  13.  請求項11または12に記載の情報処理方法において、
     前記情報処理装置が、
     複数の前記タグを記憶部に予め記憶しておき、
     前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付け、
     前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる、情報処理方法。
  14.  請求項13に記載の情報処理方法において、
     前記情報処理装置が、
     ユーザ入力により他のタグを受け付け、
     前記他のタグを前記閲覧情報に追加する、情報処理方法。
  15.  請求項14に記載の情報処理方法において、
     前記情報処理装置が、
     前記複数のタグのツリー構造が予め設定されており、
     前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける、情報処理方法。
  16.  請求項15に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     複数のタグのツリー構造を表示部に表示させ、
     追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる、情報処理方法。
  17.  請求項11から16のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新する、情報処理方法。
  18.  請求項11から17のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、
     前記ウェブページの保存方式の指定を受け付け、
     指定された前記保存方式で前記ウェブページを記憶させる、情報処理方法。
  19.  請求項18に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     保存された前記ウェブページを表示部に表示させる、情報処理方法。
  20.  請求項18または19に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する、情報処理方法。
  21.  コンピュータに、
     検索のための入力より前のタイミングで、複数のタグの指定を受け付ける手順、
     閲覧したウェブページのURL(Uniform Resource Locator)を含む閲覧情報を、指定された前記タグに紐づけて記憶部に記憶させる手順、を実行させるためのプログラム。
  22.  請求項21に記載のプログラムにおいて、さらに、
     前記閲覧したウェブページのタイトルをさらに前記閲覧情報に含めて前記記憶部に記憶させる手順、
     前記ウェブページの前記タイトルと、前記タグを関連付けて表示部に表示させる手順、をコンピュータに実行させるためのプログラム。
  23.  請求項21または22に記載のプログラムにおいて、
     複数の前記タグを記憶部に予め記憶する手順、
     前記記憶部に記憶されている複数の前記タグの中から、少なくとも一つのタグの指定を受け付ける手順、
     前記ウェブページを閲覧時に指定されていたタグを前記URLに紐付けて前記記憶部に記憶させる手順、をコンピュータに実行させるためのプログラム。
  24.  請求項23に記載のプログラムにおいて、
     前記指定手段は、ユーザ入力により他のタグを受け付ける手順、
     前記記憶処理手段は、前記他のタグを前記閲覧情報に追加する手順、をコンピュータに実行させるためのプログラム。
  25.  請求項24に記載のプログラムにおいて、
     前記複数のタグのツリー構造が予め設定されており、
     前記ツリー構造のうち、指定されたタグおよび当該タグの上位のタグを指定されたタグとして受け付ける手順、をコンピュータに実行させるためのプログラム。
  26.  請求項25に記載のプログラムにおいて、さらに、
     複数のタグのツリー構造を表示部に表示させる手順、
     追加された前記タグを、別のタグに紐付ける線を前記ツリー構造に追加して表示させる手順、をコンピュータに実行させるためのプログラム。
  27.  請求項21から26のいずれか一項に記載のプログラムにおいて、さらに、
     前記タグの編集を受け付け、当該編集の内容に従い前記タグを更新する手順、をコンピュータに実行させるためのプログラム。
  28.  請求項21から27のいずれか一項に記載のプログラムにおいて、
     前記ウェブページの保存方式の指定を受け付ける手順、
     指定された前記保存方式で前記ウェブページを記憶させる手順、をコンピュータに実行させるためのプログラム。
  29.  請求項28に記載のプログラムにおいて、さらに、
     保存された前記ウェブページを表示部に表示させる手順、をコンピュータに実行させるためのプログラム。
  30.  請求項28または29に記載のプログラムにおいて、さらに、
     前記保存方式の編集を受け付け、前記編集の内容に従い前記保存方式を更新する手順、をコンピュータに実行させるためのプログラム。
PCT/JP2020/031576 2019-09-10 2020-08-21 情報処理装置、情報処理方法、およびプログラム WO2021049272A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021545190A JPWO2021049272A1 (ja) 2019-09-10 2020-08-21
US17/640,432 US20220342955A1 (en) 2019-09-10 2020-08-21 Information processing apparatus, information processing method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-164594 2019-09-10
JP2019164594 2019-09-10

Publications (1)

Publication Number Publication Date
WO2021049272A1 true WO2021049272A1 (ja) 2021-03-18

Family

ID=74867340

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/031576 WO2021049272A1 (ja) 2019-09-10 2020-08-21 情報処理装置、情報処理方法、およびプログラム

Country Status (3)

Country Link
US (1) US20220342955A1 (ja)
JP (1) JPWO2021049272A1 (ja)
WO (1) WO2021049272A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022091308A (ja) * 2020-12-09 2022-06-21 株式会社日立製作所 ストレージシステム及びデータ削除方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094634A (ja) * 2002-08-30 2004-03-25 Ntt Advanced Technology Corp 情報検索方法および情報検索システム
JP2011039743A (ja) * 2009-08-10 2011-02-24 Hitachi Information Systems Ltd WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP2016509729A (ja) * 2013-01-28 2016-03-31 アマゾン テクノロジーズ インコーポレイテッド 閲覧セッション履歴を共有するためのアーキテクチャ

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010010046A1 (en) * 1997-09-11 2001-07-26 Muyres Matthew R. Client content management and distribution system
US20020049708A1 (en) * 2000-05-02 2002-04-25 Moneymaker Vincent B. Diverse data compilation, management and manipulation in a static interface environment
US20020091735A1 (en) * 2001-01-08 2002-07-11 Yung-Chung Chen. Method and apparatus for locating geographically classified establishment information
US7802181B2 (en) * 2004-11-12 2010-09-21 Justsystems Corporation Document processing device and document processing method
US20080126495A1 (en) * 2006-07-07 2008-05-29 Adknowledge, Inc. Method and system for providing electronic communications with dynamically provided content to third party mail transfer agents
US8447722B1 (en) * 2009-03-25 2013-05-21 Mcafee, Inc. System and method for data mining and security policy management
CA2795128A1 (en) * 2010-03-31 2011-10-06 Mediamath, Inc. Systems and methods for integration of a demand side platform
US8769037B2 (en) * 2010-11-30 2014-07-01 International Business Machines Corporation Managing tag clouds
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US8626135B1 (en) * 2011-10-17 2014-01-07 Google Inc. Communication redirect via short-range communication for digital item retrieval
US9858244B1 (en) * 2012-06-27 2018-01-02 Amazon Technologies, Inc. Sampling a part of a content item
US9672541B2 (en) * 2014-07-16 2017-06-06 Turn Inc. Visual tag editor
US9832078B2 (en) * 2015-01-06 2017-11-28 Netapp, Inc. Stateless resource management
US10423709B1 (en) * 2018-08-16 2019-09-24 Audioeye, Inc. Systems, devices, and methods for automated and programmatic creation and deployment of remediations to non-compliant web pages or user interfaces
US11076005B2 (en) * 2017-06-09 2021-07-27 DMD Marketing, LP System and method for identifying and tagging users
US20190347068A1 (en) * 2018-05-10 2019-11-14 Microsoft Technology Licensing, Llc Personal history recall

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094634A (ja) * 2002-08-30 2004-03-25 Ntt Advanced Technology Corp 情報検索方法および情報検索システム
JP2011039743A (ja) * 2009-08-10 2011-02-24 Hitachi Information Systems Ltd WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP2016509729A (ja) * 2013-01-28 2016-03-31 アマゾン テクノロジーズ インコーポレイテッド 閲覧セッション履歴を共有するためのアーキテクチャ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SAIKI, YUUTA ET AL.: "A Personalized Web Search based on a Classification of Users' Preference using Structured Tag Representation", PSJ SIG TECHNICAL REPORTS 2009, vol. 4, 15 December 2009 (2009-12-15), pages 1 - 7 *

Also Published As

Publication number Publication date
JPWO2021049272A1 (ja) 2021-03-18
US20220342955A1 (en) 2022-10-27

Similar Documents

Publication Publication Date Title
CA2410747C (en) System and method for saving browsed data
US8572202B2 (en) Persistent saving portal
US8533199B2 (en) Intelligent bookmarks and information management system based on the same
WO2007030684A2 (en) Annotating documents in a collaborative application with data in disparate information systems
JP5539127B2 (ja) 文書管理システム、検索指定方法、プログラム
JP3628528B2 (ja) 検索支援装置及び方法並びにその装置での処理をコンピュータにて行なわせるためのプログラムを格納した記録媒体
US20060036609A1 (en) Method and apparatus for processing data acquired via internet
WO2021049272A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JPH11338810A (ja) 情報端末装置、環境設定方法及び記録媒体
US10712969B2 (en) Trash commands for storage systems
JP4253315B2 (ja) 知識情報収集システムおよび知識情報収集方法
US20070061276A1 (en) Device and method for registering a plurality of types of information
JP3725088B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP7251876B1 (ja) サーバ装置、サーバ装置の制御方法、及びプログラム
JP3725837B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP3708893B2 (ja) 知識情報収集システムおよび知識情報収集方法
Finn Batch-load authority control cleanup using MarcEdit and LTI
JP6939473B2 (ja) 文書処理装置及びプログラム
JP3725836B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP2017045349A (ja) ホームページ作成支援装置およびその方法
JP3708894B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP3725835B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP2006023878A (ja) データ抽出システム
JP2008112208A (ja) 情報自動分類方法と情報検索及び分析方法
KR20240076363A (ko) 논문작성시 참고문헌의 관리 및 인용정보 삽입을 하기 위한 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20863737

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021545190

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20863737

Country of ref document: EP

Kind code of ref document: A1