WO2015087632A1 - データ処理方法およびデータ処理サーバ - Google Patents

データ処理方法およびデータ処理サーバ Download PDF

Info

Publication number
WO2015087632A1
WO2015087632A1 PCT/JP2014/078682 JP2014078682W WO2015087632A1 WO 2015087632 A1 WO2015087632 A1 WO 2015087632A1 JP 2014078682 W JP2014078682 W JP 2014078682W WO 2015087632 A1 WO2015087632 A1 WO 2015087632A1
Authority
WO
WIPO (PCT)
Prior art keywords
file
data processing
combination
data
user terminal
Prior art date
Application number
PCT/JP2014/078682
Other languages
English (en)
French (fr)
Inventor
大介 鬼頭
圭 北原
直樹 下間
暖 山本
聡 屋代
和博 古田
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to CN201480050607.9A priority Critical patent/CN105531704B/zh
Priority to US15/022,220 priority patent/US20160224582A1/en
Publication of WO2015087632A1 publication Critical patent/WO2015087632A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Definitions

  • the present invention relates to a technique for performing data processing by appropriately combining a plurality of files.
  • Patent Document 1 and Patent Document 2 as known techniques for processing a plurality of data in combination.
  • a plurality of files are divided and a part of the files is combined as a pair.
  • each file is divided into subtrees of an appropriate size, and the subtrees are paired based on the similarity of the leaf nodes between the files (the ratio of the number of the same leaf nodes to the total leaf nodes).
  • Judge as to combine the similarity of file tag structures (parent-child relationship, sibling relationship, etc.) is used to determine which files are combined as a pair.
  • the above-mentioned known technique is suitable for processing a combination of files with high content similarity such as high similarity of leaf nodes of files or high similarity of tag structure. It is difficult to process in combination. Another problem is that files of different formats cannot be processed in combination.
  • the present invention makes it possible to process data with an appropriate combination even if the file structure is not similar or a file with a different format. It is an object of the present invention to provide a data processing method that can be easily executed even if there is a data processing server that implements the data processing method.
  • a typical example of the present invention is as follows. That is, the present invention receives a designation of a first file and a second file and a data processing execution request related to a specific function from a storage unit that stores a plurality of files and a user terminal.
  • the first file and the second file are acquired from the storage unit, the structures of the acquired first file and the second file are analyzed, and each of the first file and the second file is analyzed.
  • a processor that executes the data processing by combining the elements when there are elements having the same number of elements, and transmits the execution result to the user terminal.
  • FIG. 1 is a block diagram showing a hardware and software configuration of a data processing system according to a first embodiment of the present invention.
  • the data processing system includes one or more data processing servers (data processing devices) 101, one or more data disclosure servers (data disclosure devices) 141, and one or more user terminals (computers) 121.
  • the data publishing server is a server that publishes and holds various data to the general public, and is intended to be used by general citizens and specialized data processors to provide new services using this data. It is a thing. Examples of the data to be disclosed include public data such as map information of prefectures and information on public institutions such as schools and government offices, and results obtained by processing these public data independently.
  • 2 (A) to 2 (C) are diagrams showing examples of public data disclosed in the first embodiment of the present invention.
  • the population information of Kanagawa Prefecture, the location information of the government office, and the prefectures are shown respectively. It is a figure which shows an example of no boundary line information.
  • the data processing server 101 and the user terminal 121 are connected to a network via an interface (hereinafter referred to as I / F) 104 and an I / F 123, respectively.
  • the data processing server 101 receives an execution request for data processing related to a specific function and responds to a data processing execution result to an external device such as the user terminal 121 via the I / F 104.
  • the data processing server 101 includes a CPU (Central Processing Unit) 103, a memory (storage device) 102, and an I / F 104.
  • the CPU 103 receives a data processing execution request from an external device such as the user terminal 121 via the I / F 104, executes the requested data processing, and transmits a data processing execution result to the requesting external device.
  • the memory 102 includes a function execution unit 105, a data combination management unit 106, a data analysis unit 107, a data acquisition unit 108, a data conversion unit 109, a user cooperation unit 110, data combination information 111, data acquisition destination information 112, and combination history information 113.
  • the file information 114 is connected to the CPU 103 and the I / F 104.
  • the function execution unit 105, the data combination management unit 106, the data analysis unit 107, the data acquisition unit 108, the data conversion unit 109, and the user cooperation unit 110 are programs executed by the CPU 103.
  • the user terminal 121 includes a CPU 124, a memory 122, an I / F 123, and a display device 125.
  • the CPU 124 makes an execution request for data processing related to a specific function to the data processing server 101 and the like, receives an execution result from the data processing server 101 and the like via the I / F 123.
  • the memory 122 includes a server cooperation unit 126 and a user cooperation unit 127, and is connected to the CPU 124 and the I / F 123.
  • the server cooperation unit 126 and the user cooperation unit 127 are programs executed by the CPU 124.
  • the display device 125 displays the execution result received from the data processing server 101 or the like.
  • the data combination information 111 is information related to data combinations managed by the data processing server 101.
  • FIG. 4 is a diagram showing an example of the data combination information 111 according to the first embodiment of the present invention.
  • the data combination information 111 includes two data items 401 and 402. Items 401 and 402 indicate information registered in the data processing server 101 as data combination candidates.
  • the data combination information 111 is used, for example, as information for determining whether or not to combine data when there is one designated data (file) from the user terminal user terminal.
  • “Kanagawa population.csv” and “Kanagawa map.xml” are combination candidates, and elements of each row of “a.csv” and ⁇ place> tag elements of “b.xml” are combination candidates.
  • the combination candidate may be specified by, for example, specifying a URL and making the data in the URL as a combination candidate, or by specifying only the file format and its elements instead of the file name. Further, three or more data may be set as combination candidates.
  • the data acquisition destination information 112 indicates information related to an acquisition destination for the data processing server 101 to acquire public data.
  • FIG. 5 is a diagram illustrating an example of the data acquisition destination information 112 according to the first embodiment of this invention.
  • the data acquisition destination information 112 includes two data items 501 and 502.
  • An item 501 indicates the name of the data acquisition destination.
  • An item 502 indicates location information of a data acquisition destination, and is expressed by, for example, a URL.
  • the fourth record indicates that the data processing server 101 can acquire data published by the data processor from “http: //dataprocessor1.xx”.
  • the combination history information 113 indicates history information regarding the execution result of the data combination processing executed by the data processing server 101 in the past in response to a request from the user terminal 121 or the like.
  • FIG. 6 is a diagram illustrating an example of the combination history information 113 according to the first embodiment of this invention.
  • the combination history information 113 includes three data items 601, 602, and 603.
  • An item 601 indicates the date and time when the data combination was performed. Items 602 and 603 indicate data to be combined. For example, FIG. 6 shows that “Kanagawa Land Price.csv” and “Kanagawa Map.xml” were processed in combination at 2013/7/1 12:00.
  • As the combination history information 113 information other than the above, for example, information as to whether a certain combination of data is appropriate may be used.
  • a desired result is obtained, that is, whether the data is correctly processed by the processing program and a meaningful result is obtained.
  • the user may be inquired via the user terminal 121, and the inquiry result may be stored in the memory 102 or the like as combination history information 113. This makes it possible to refer to the history later for any combination of data from which a processing result having utility value can be obtained.
  • the file information 114 is information relating to data such as a file stored in the memory 102 of the data processing server 101, and indicates, for example, data acquired from the data disclosure server 141 or storage data uniquely created by the user.
  • the function execution unit 105 executes processing based on various functions provided by the data processing server 101. There may be a plurality of functions, for example, a function of displaying a specific facility on a map, a function of grasping various public transportation information, or the like.
  • the function execution unit 105 executes data processing based on a data processing execution request related to a specific function from the user terminal 121. In executing data processing, data input may be received to execute processing.
  • the data combination management unit 106 adds or deletes new combination candidates from the data combination information 111. In addition, the data combination management unit 106 determines which data is to be combined when the function execution unit 105 is executed.
  • the data analysis unit 107 analyzes input data. For example, when an xml file is input, the data analysis unit 107 analyzes a tag structure constituting the file.
  • the data acquisition unit 108 acquires data from outside the data disclosure server 141 and the like. Data acquisition may be performed based on a request from the user terminal 121 or may be performed in accordance with the execution of the function execution unit 105.
  • the data conversion unit 109 performs data conversion such as converting an xml file into a csv file.
  • the user cooperation unit 110 receives a data processing execution request from the user terminal 121 and responds to the execution result to the user terminal 121.
  • the server cooperation unit 126 cooperates with an external server such as the data processing server 101 to transmit data input to the user terminal 121 and a data processing execution request to the external server. In addition, the server cooperation unit 126 receives a response result from an external server.
  • the user cooperation unit 127 receives the input operation information as an operation request, and performs processing such as execution of an operation requested by the user and display of an operation result. .
  • Data combination processing and data combination estimation processing are performed when a data transmission and data processing execution request is received from the user terminal 121 to the data processing server 101.
  • the registration of the data combination information is performed based on a request from the user terminal 121 at an arbitrary or specific timing, or is determined by the data processing server 101.
  • Acquisition of related data is performed based on a request from the user terminal 121 or automatically in accordance with execution of data processing based on a specific function in the data processing server 101.
  • FIG. 7 is a flowchart showing an example of basic data combination processing executed by the data processing server 101 according to the first embodiment of the present invention.
  • the CPU 103 of the data processing server 101 receives from the user terminal 121 designation of a plurality of files (input data) and an execution request for data processing related to a specific function (step 701). For example, when the user designates file a and file b on the data processing server 101 as input data using the user terminal 121 and instructs execution of data processing based on a specific function, the CPU 103 of the data processing server 101 inputs The specification of file a and file b as data and a data processing execution request related to a specific function are accepted.
  • the CPU 103 determines whether or not a plurality of files are designated (step 702). If a plurality of files are not designated (NO in step 702), the requested data processing for the designated file is performed. (Step 703), the execution result is transmitted to the user user terminal 121 (step 704), and the process is terminated.
  • the CPU 103 acquires the designated file from the memory 102 or the like, analyzes the structure of the file, and obtains the number of elements constituting the file (step). 705).
  • the CPU 103 determines whether there are the same, the same, or different elements between files (step 706), and if there is no corresponding item (NO in step 706), the data can be combined and processed. An execution result indicating that it cannot be transmitted is transmitted to the user terminal 121, and the process is terminated. On the other hand, if there is a corresponding item in step 706 (YES in step 706), the CPU 103 determines whether there are a plurality of combinations of such elements (step 707). For example, if the file is a. xml and b. A specific explanation will be given on the assumption of xml. For example, a. 5 ⁇ place> elements of xml, b.
  • the CPU 103 determines in step 706 that there are the same number of elements between files. A. 10 ⁇ place2> elements of xml, b. If there are ten ⁇ station> elements in xml, the CPU 103 determines in step 707 that there are a plurality of element combinations. When there are not a plurality of element combinations (NO in step 707), the CPU 103 combines the elements determined in step 706, executes the data processing requested from the user terminal 121 (step 703), and displays the execution result as the user. The message is transmitted to the terminal 121 (step 704), and the process is terminated.
  • the CPU 103 transmits these to the user terminal 121 as element combination candidates (step 708).
  • the CPU 124 of the user terminal 121 displays the element combination candidates received via the I / F 123 on the display device 125.
  • the CPU 103 of the data processing server 101 receives element combination data selected and input from the user terminal 121.
  • the received data is processed in step 701 (step 709), the execution result is transmitted to the user terminal 121 (step 704), and the process is terminated.
  • step 708 in addition to allowing the user to select and process element combination candidates for processing, for example, in combination history information 113, information on the quality of each combination is also registered, and element combinations with good evaluation are registered.
  • the data processing server 101 may be selected.
  • the combination information may be evaluated based on, for example, the result of the data processing executed by the user in step 703, and the evaluation result may be registered in the combination history information 113.
  • step 706 if there is no element with the same number between files, the elements to be combined in one file are padded according to the number of specific elements in the other file (elements with an empty value are added). Etc.) may be processed.
  • the process may be executed by combining data only for the part where the element value is common.
  • FIG. 8 is a flowchart showing an example of the data combination estimation process executed by the data processing server 101 according to the first embodiment of the present invention.
  • the CPU 103 of the data processing server 101 refers to the data combination information 111 (FIG. 4) on the memory 102 and estimates data (element) combination candidates. Will be explained.
  • the CPU 103 of the data processing server 101 receives from the user terminal 121 designation of one file (input data) and an execution request for data processing related to a specific function (step 801).
  • the CPU 103 refers to the data combination information 111 on the memory 102 and estimates data combination candidates (step 802).
  • the CPU 103 refers to the data combination information 111 shown in FIG. 4 to determine whether there is a file that can be combined with the designated file. If there is a file that can be combined, the CPU 103 sets this file data combination as a combination candidate. presume.
  • this estimation method for example, with reference to the combination history information 113, the presence / absence of a combination that is often performed for the designated file is determined.
  • step 803 If there is no combination candidate (NO in step 803), the CPU 103 transmits this fact to the user terminal 121 (step 804) and ends the process. If there is a combination candidate in step 803 (YES in step 803), the combination candidate is transmitted to the user terminal 121 (step 805).
  • the combination candidates are displayed on the display device 125 of the user terminal 121.
  • the CPU 103 of the data processing server 101 analyzes the structure of the selected combination file and determines whether the number of elements is the same between the files. Judgment is made (step 806).
  • the combination information of the element including the combination of the ⁇ population> element of the c.xml file of the fourth record of the data combination information 111 (FIG. 4) and the ⁇ map> element of the d.xml file is used as the element combination candidate as the user terminal.
  • the CPU 103 of the data processing server 101 displays the ⁇ population> element of the selected c.xml file.
  • the number of ⁇ map> elements in the d.xml file are the same.
  • the CPU 103 executes the requested data processing according to the element having the smaller number (step 807), and transmits the execution result to the user terminal 121. (Step 808), the process ends. For example, if there are 10 ⁇ population> elements and 20 ⁇ map> elements, the requested data processing is executed for the smaller 10 elements. If the number of elements is the same (YES in step 806), the CPU 103 executes the requested data processing (step 809), transmits the execution result to the user terminal 121, and ends the processing.
  • the data processing server 101 estimates the element combination candidates and enables them to be displayed on the display device 125 of the user terminal 121, so that the user who has little knowledge about the data combination method can be used. However, the operation can be easily performed.
  • FIG. 9 is a flowchart illustrating an example of a data combination process based on user association executed by the data processing server 101 according to the first embodiment of the present invention.
  • the CPU 103 of the data processing server 101 accepts an execution request for data processing related to the designation of a file and a specific function from the user (step 901).
  • the CPU 103 analyzes the structure of the designated file (step 902). For example, as shown in FIG.
  • the CPU 103 looks at the contents of the file and confirms that the structure is in the form shown in FIG.
  • the CPU 103 transmits the analysis result of the file structure to the user terminal 121 (step 903).
  • the analysis result of the file structure is displayed on the display device 125 of the user terminal 121, and the user specifies which element is to be combined with which element.
  • FIG. 3 is an example in which a.csv and b.kml are input, and the two files are combined and processed by the CPU 103 of the data processing server 101.
  • the analysis result of the structure of each input file is presented to the user on a GUI such as a browser in the form as shown in FIG.
  • the user associates which element is combined with which element.
  • the linking may be performed by connecting elements with a line on the GUI, for example.
  • the elements in each row of a.csv are linked to the ⁇ placemark> element of b.kml.
  • designation of element combinations from the user is accepted.
  • the combination may be specified in a one-to-one relationship, for example, the element in the first line of a.csv and the first ⁇ placemark> element in b.kml, or in each line of a.csv
  • a group of elements such as a set of elements and a set of ⁇ placemark> elements of b.kml may be specified.
  • the CPU 103 determines whether the combination of elements designated by the user is designated in units of groups (step 904). If not in group units (NO in step 904), the CPU 103 executes the requested data processing (step 906), transmits the execution result to the user terminal 121 (step 907), and ends the processing. To do. In the case of designation in group units (YES in step 904), the CPU 103 determines whether the number of designated combination elements is the same (step 905). If the numbers are the same (YES in step 905), the CPU 103 executes the requested data processing, transmits the execution result to the user terminal 121, and ends the processing. If the numbers are not the same (NO in step 905), the CPU 103 executes the requested data processing according to the element having the smaller number (step 908), transmits the execution result to the user terminal 121, and performs the processing. finish.
  • the data processing server 101 regards each row of a.csv as one element, and specifies an element of b.kml that has the same number as this element.
  • the ⁇ placemark> element corresponds.
  • each element of a.csv corresponds to, for example, it is determined that elements having a common value correspond to each other, and data is combined and processed.
  • the first element of a.csv has a value of “Totsuka Ward”
  • the first ⁇ placemarkm> element of b.kml has the same value of “Totsuka Ward”. Judge that it will respond.
  • this association may be performed by designation by the user.
  • FIG. 10 is a flowchart showing an example of a data combination candidate registration process executed by the data processing server 101 according to the first embodiment of the present invention.
  • the CPU 103 of the data processing server 101 determines whether combination candidates are to be automatically registered (step 1001). For example, this may be determined based on a mode in which registration to the data processing server 101 is automatically performed, manually performed by the user, or both are supported.
  • the CPU 103 receives a combination candidate registration request from the user terminal 121, and registers the candidate specified by the user in the data combination information 111 on the memory 102 (step 1002). If the registration is automatic (YES in step 1001), the CPU 103 refers to the combination history information 113 on the memory 102 (step 1003), and the data combination on the memory 102 that has a high combination frequency and has not yet been registered. Registration is made in the information 111 (step 1004). In step 1002, the combination candidates may be registered only when the data processing is actually performed using the combination candidates and, as a result, no error or the like occurs and the data is correctly processed.
  • combination candidates not only information on combination candidates but also information on corresponding functions (for example, when the data processing server 101 has a large number of data processing functions, which function uses information on each registered combination candidate) May also be registered. Also, summary information as to what kind of result can be obtained by performing processing in combination may be registered.
  • the data processing server 101 patterns and manages the above processing and provides it so that it can be used by a large number of users.
  • the data processing server 101 uses the related data (for example, the same as in Kawasaki City or Yokosuka City).
  • FIG. 11 is a flowchart showing an example of related data acquisition processing executed by the data processing server 101 according to the first embodiment of the present invention.
  • the CPU 103 of the data processing server 101 receives an execution request for data processing related to designation of a file and combination data and a specific function (step 1101).
  • the CPU 103 executes the requested data processing and determines whether the data processing has been executed correctly without causing an error (step 1102).
  • step 1102 If the process has not been executed correctly (NO in step 1102), the data processing result is transmitted to the user terminal 121 (step 1104), and the process ends. If the process is correctly executed (YES in step 1102), the CPU 103 determines whether or not to pattern the data process requested by the user terminal 121 by inquiring the user via the user terminal 121 (step 1103). ). If the data processing is not patterned (NO in step 1103), the CPU 103 transmits the data processing result to the user terminal 121 and ends the processing. In step 1103, when the CPU 103 determines that the answer is input from the user terminal 121 by the user's operation and that the process is to be patterned, for example, from the user terminal 121, the CPU 103 performs step 1101 from the user.
  • the input source information of the specified file and combination data is provided, and related data is searched and acquired based on the information (step 1105).
  • Acquisition of related data may be realized by, for example, providing input source information such as a URL where a file is disclosed by a user and acquiring other data at the URL. For example, if the file specified by the user is Yokohama-shi.csv and there is another file such as Yokosuka-shi.csv in the URL where the input file is disclosed, these are acquired as related data.
  • the acquisition target may be filtered by referring to, for example, file name information.
  • the data specified by the user is obtained by checking whether the data such as Tokyo.csv is in the location of the input source information provided by the user. Then, it is obtained by checking whether there is data such as Kawasaki City.csv as related data. For example, as city information of Kanagawa Prefecture, it is possible to manage that the city of Yokohama and Kawasaki city are related in the form of dictionary information and judge it by referring to it. As a result of searching related data in step 1105, the CPU 103 determines whether there is related data (step 1106).
  • step 1106 If there is no related data (NO in step 1106), the CPU 103 transmits the data processing result to the user terminal 121. To end the process. If there is related data (YES in step 1106), the CPU 103 acquires the related data and stores it in the memory 102 or the like (step 1107). Thereafter, the CPU 103 makes the acquired related data available for use as a data combination candidate for presentation to the user (step 1108), transmits the processing result to the user terminal 121, and ends the processing.
  • processing pattern information indicating what kind of data processing is to be performed is defined in the data processing server 101, and a file designated by the user or data related thereto is defined. Data acquired by the data processing server 101 may be managed in association with each other. Then, when there is a request from the user terminal 121, it may be called appropriately.
  • the data processing by the data processing server 101 is performed instead of starting execution of data processing by the data processing server 101 after the user specifies all files.
  • the data processing by the data processing server 101 is performed.
  • the user may specify a file name by using a console or a browser, or display a data processing component as shown in FIG. 13 on a browser such as a web browser, for example.
  • a data object representing data such as a file may be connected.
  • FIG. 13 when data objects of data A and data B are connected to the data processing component, the data is input to the data processing component.
  • the data combination processing (hereinafter referred to as data combination processing during input) in the present embodiment will be described below.
  • the data processing server 101 determines whether the input is appropriate for executing a predetermined function, and searches the user for data that can be a candidate combination of the input. Make a presentation.
  • the processing method it is possible to assist the user in determining the combination candidate selection at an early stage, and it is possible to reduce the effort of the user who searches for the combination candidate.
  • FIG. 12 is a flowchart showing an example of data combination processing in the middle of input, which is executed by the data processing server 101 according to the second embodiment of the present invention.
  • the CPU 103 of the data processing server 101 waits until data is designated from the user terminal 121 (step 1201).
  • the CPU 103 determines whether data specification has been accepted (step 1201). If the data specification has not been accepted (NO in step 1202), the process returns to step 1201, and if data specification has been accepted (YES in step 1202).
  • step 1203 data that is considered to be closely related to the data specified in step 1202 is searched (step 1203).
  • the CPU 103 determines from the combination history information 113 data that is often used in combination with designated data, and determines that the data is closely related to the designated data.
  • the CPU 103 refers to the data combination information 111 on the memory 102 and determines whether there is the specified data. If the specified data is registered, for example, the data to be combined is designated as the specified data. It may be determined that the data is closely related.
  • the CPU 103 determines whether or not a data processing execution request is received from the user terminal 121 (step 1204). For example, in the functional component as shown in FIG. 13, a process execution button or the like is provided, and if the CPU 103 of the data processing server 101 does not detect the execution button being pressed, it is determined that the execution request has not been received yet. If it is detected that the execution button has been pressed, it may be determined that an execution request has been received. When a data processing execution request is received (YES in step 1204), the CPU 103 transmits the requested data processing execution result to the user terminal 121 (step 1205), and ends the processing.
  • the CPU 103 determines that data that is determined to be data closely related to the specified data in the search processing in step 1203 is combined with the specified data. It transmits to the user terminal 121 as a candidate (step 1206). Data candidates to be combined are presented to the user via the display device 125 of the user terminal 121.
  • the above processing is performed when the data processing server 101 makes a request to execute data processing when, for example, the user wants to perform some processing using certain data and does not know what other data should be combined. Is a process that takes into account that it takes time to receive.
  • the user terminal can inquire about related data.
  • the processing may be such that it is received and responded directly via 121.
  • the data processing server 101 receives a user inquiry such as which data is related to a certain data and what can be done with the certain data via the user terminal 121, and the combination history so far is received.
  • a candidate that can be performed using related data or data is obtained, and this is presented to the user via the user terminal 121, and the user may select it. .
  • the CPU 103 receives a data processing execution request for the combination target selected and input by the user from the user terminal 121 (step 1207).
  • Data processing is executed (step 1208), the execution result is transmitted to the user terminal 121, and the processing ends.
  • the data processing server includes data combination information that is information relating to a combination of data, and public data.
  • Data acquisition destination information that is information about the acquisition destination for acquiring data
  • combination history information that is history information related to data combination processing performed in the past by the data processing server
  • files held by the data processing server etc.
  • File information that is information about data.
  • the data processing server analyzes the input file based on the input file or operation request instruction from the user, and counts the number of each element in each input file, and whether there are the same, the same or different elements among the input files If there are corresponding elements, it is determined whether there are many combinations of such elements, and if there are many, the candidates are presented to the user, and data processing is performed based on the user's selection results. Do.
  • the data processing server also estimates data combination candidates based on the combination history information and the like. Further, the data processing server allows the user to specify the data combination, not only by selecting from the data combination candidates, but also by linking elements based on the structure analysis result of the input file. As another form of the data processing server, the data processing server further waits until the input file is designated by the user.
  • the data processing server refers to the combination history information etc. If deep data is searched and an operation request from the user has not yet been made, the data determined to be deeply related is presented to the user, and data processing is performed based on the selection result of the user.
  • DESCRIPTION OF SYMBOLS 101 ... Data processing server, 102, 122 ... Memory, 103, 124 ... CPU, 104, 123 ... 1 / F, 105 ... Function execution part, 106 ... Data combination management part 107 ... Data analysis unit, 108 ... Data acquisition unit, 109 ... Data conversion unit, 110 ... User cooperation unit, 111 ... Data combination information, 112 ... Data acquisition destination information, 113 ... Combination history information, 114 ... File information, 121 ... User terminal, 125 ... Display device, 126 ... Server cooperation unit, 127 ... User cooperation unit, 141 ... Data publishing server.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ファイル構造が類似しないファイルや、形式の異なるファイルであっても、データを適切に組合せて処理可能にし、また、データの組合せや処理にあたっては、知識の少ないユーザであっても容易に実行可能とする。 ユーザ端末から、第1のファイルおよび第2のファイルの指定と、特定の機能に関わるデータ処理の実行要求を受信し、指定された前記第1のファイルおよび前記第2のファイルを前記記憶部から取得し、取得した前記第1のファイルおよび前記2のファイルの構造を解析し、前記第1のファイルおよび前記第2のファイルのそれぞれを構成する各要素の個数が同じ要素がある場合、該要素同士を組合せて前記データ処理を実行し、該実行結果を前記ユーザ端末に送信する。

Description

データ処理方法およびデータ処理サーバ
本発明は、複数のファイルを適切に組合せてデータ処理を行う技術に関する。
 近年、企業や社会活動で発生するデータは爆発的に増加している。一方で、情報通信技術の進展に伴い、大量データの収集・蓄積・解析等が容易になってきている。また最近では、多種多様なデータの一つとして、公共データの活用による新サービスの創出への期待が高まっている。このような背景のもと、政府は公共データを開放し、民間での公共データの再利用を簡単に行えるようにすることで、政府の透明性を高めるとともに、公共サービスの質向上等を図ろうとしている。公共データを活用したサービスの一例として、町中のレンタル用の共用自転車の空き状況をリアルタイムで検索できるサービス等がある。公共データの公開、活用により上記のような有益なサービスを実現できる一方、公共データの取扱いにあたっては、どこにどのようなデータがあるかわからない、使い勝手が低い、多種多様なデータをどう組合わせて処理したらよいか判断が難しい等の問題がある。
 複数のデータを組合せて処理させる公知技術として、特許文献1、特許文献2がある。特許文献1によれば、複数のファイルを分割し、ファイルの一部分同士をペアとして組合わせる。具体的には各ファイルを適度な大きさの部分木に分割し、各ファイル間での当該部分木の葉ノードの類似度(全葉ノードに対する同一葉ノード数の割合)に基づき、上記部分木をペアとして組合せるか判断する。また、特許文献2によれば、ファイルのタグ構造(親子関係、兄弟関係など)の類似度を利用し、どのファイル同士をペアとして組合せるかの判断を行う。
特許第4992072号 特許第4878624号
 上記公知技術は、ファイルの葉ノードの類似度が高い、またはタグ構造の類似度が高いなど、中身の類似度の高いファイルを組合せて処理させるのには向いているが、そうでないファイルについては、組合せて処理させるのは難しい。また、形式の異なるファイル同士については、組合せて処理できないという問題がある。
 以上を踏まえ、本発明は、ファイル構造が類似しないファイルや、形式の異なるファイルであっても、データを適切に組合せて処理可能にし、また、データの組合せや処理にあたっては、知識の少ないユーザであっても容易に実行可能なデータの処理方法およびこれを実施するデータ処理サーバを提供することを目的とする。
 本発明の代表的な一例を示せば以下の通りである。すなわち、本発明は、複数のファイルを記憶する記憶部と、ユーザ端末から、第1のファイルおよび第2のファイルの指定と、特定の機能に関わるデータ処理の実行要求を受信し、指定された前記第1のファイルおよび前記第2のファイルを前記記憶部から取得し、取得した前記第1のファイルおよび前記2のファイルの構造を解析し、前記第1のファイルおよび前記第2のファイルのそれぞれを構成する各要素の個数が同じ要素がある場合、該要素同士を組合せて前記データ処理を実行し、該実行結果を前記ユーザ端末に送信するプロセッサと、を具備することを特徴とする。
 本発明によれば、ファイル構造が類似しないファイルや、形式の異なるファイルであっても、データを適切に組合せて処理可能にし、また、データの組合せや処理にあたっては、知識の少ないユーザであっても容易に実行することができる。
本発明の第1の実施例に係るデータ処理システムのハードウェアおよびソフトウェア構成の一例を示すブロック図である。 本発明の第1の実施例に係る公開される公共データ(神奈川県の人口情報)の一例を示す説明図である。 本発明の第1の実施例に係る公開される公共データ(役所の所在地情報)の一例を示す説明図である。 本発明の第1の実施例に係る公開される公共データ(都道府県の境界線情報)の一例を示す説明図である。 本発明の第1の実施例に係るファイル間でのデータの組合せ方法の一例を示す説明図である。 本発明の第1の実施例に係るデータ組合せ情報111の一例を示す図である。 本発明の第1の実施例に係るデータ取得先情報112の一例を示す図である。 本発明の第1の実施例に係る組合せ履歴情報113の一例を示す図である。 本発明の第1の実施例に係るデータ処理サーバ101が実行する、基本的なデータ組合せ(ペア作成)についての処理の一例を示すフローチャートである。 本発明の第1の実施例に係るデータ処理サーバ101が実行する、データ組合せ推定についての処理の一例を示すフローチャートである。 本発明の第1の実施例に係るデータ処理サーバ101が実行する、ユーザ紐付けに基づくデータ組合せについての処理の一例を示すフローチャートである。 本発明の第1の実施例に係るデータ処理サーバ101が実行する、データ組合せ情報111の登録についての処理の一例を示すフローチャートである。 本発明の第1の実施例に係るデータ処理サーバ101が実行する、関連データの取得についての処理の一例を示すフローチャートである。 本発明の第2の実施例に係るデータ処理サーバ101が実行する、入力途中でのデータ処理についての処理の一例を示すフローチャートである。 本発明の第2の実施例に係るデータ処理サーバ101へのデータ入力の指定方法の一例を示す説明図である。
 以下、本発明の実施の形態について説明する。尚、以下に説明する実施の形態は一例であって、本発明はこれに限定されるものではない。
 図1~図11を用いて第1の実施例を説明する。
 図1は、本発明の第1の実施例に係るデータ処理システムのハードウェアおよびソフトウェア構成を示すブロック図である。データ処理システムは、1以上のデータ処理サーバ(データ処理装置)101と、1以上のデータ公開サーバ(データ公開装置)141と、1以上のユーザ端末(計算機)121と、を備える。尚、データ公開サーバとは、様々なデータを一般に公開、保持するサーバであり、一般市民や専門のデータ加工業者等がこのデータを使って新たなサービスを提供する等に利用されることを意図したものである。公開するデータとしては、例えば都道府県の地図情報や、学校や役所等の公共機関の情報といった、公共データや、これら公開データを独自に加工した結果等である。図2(A)~図2(C)は、本発明の第1の実施例に係る公開される公共データの一例を示す図であり、それぞれ神奈川県の人口情報、役所の所在地情報、都道府県の境界線情報の一例を示す図である。
 データ処理サーバ101、ユーザ端末121は、それぞれインタフェース(以下、I/Fと記す)104、I/F123を介してネットワークに接続される。データ処理サーバ101は、I/F104を介して、ユーザ端末121等の外部機器に対して、特定機能に関わるデータ処理の実行要求の受信やデータ処理実行結果の応答等を行う。
 データ処理サーバ101は、CPU(中央演算処理装置)103、メモリ(記憶装置)102およびI/F104を備える。CPU103は、I/F104を介してユーザ端末121等の外部機器からのデータ処理実行要求の受信および要求されたデータ処理の実行や、要求元外部機器に対してデータ処理実行結果の送信などを行う。メモリ102は、機能実行部105、データ組合せ管理部106、データ解析部107、データ取得部108、データ変換部109、ユーザ連携部110、データ組合せ情報111、データ取得先情報112、組合せ履歴情報113、ファイル情報114から構成されており、CPU103、I/F104と接続されている。機能実行部105、データ組合せ管理部106、データ解析部107、データ取得部108、データ変換部109、ユーザ連携部110は、CPU103により実行されるプログラムである。
 ユーザ端末121は、CPU124、メモリ122、I/F123および表示装置125を備える。CPU124は、I/F123を介してデータ処理サーバ101等への特定機能に関わるデータ処理の実行要求や、データ処理サーバ101等からの実行結果の受信等を行う。メモリ122はサーバ連携部126、ユーザ連携部127から構成されており、CPU124、I/F123と接続されている。サーバ連携部126とユーザ連携部127は、CPU124により実行されるプログラムである。表示装置125は、データ処理サーバ101等から受信した実行結果等を表示する。
 次に、本実施形態のデータ処理システムのソフトウェア構成の詳細(データ管理サーバ101のメモリ102、ユーザ端末121のメモリ122の記憶情報)について説明する。
 最初にデータ管理サーバ101のメモリ102に記憶されたプログラム以外の情報(111~114)について説明し、その後、メモリ102に記憶されたプログラム(105~110)について説明する。
 データ組合せ情報111は、データ処理サーバ101が管理するデータの組合せに関する情報である。図4は、本発明の第1の実施例に係るデータ組合せ情報111の一例を示す図である。データ組合せ情報111は、項目401、402の二つのデータ項目を含む。項目401、402は、データの組合せ候補としてデータ処理サーバ101に登録されている情報を示す。データ組合せ情報111は、例えば、ユーザ端末ユーザ端末からの指定データ(ファイル)が1つの場合に、データを組合せるか否かの判断等を行うための情報として利用される。図4では、例えば「神奈川人口.csv」と「神奈川地図.xml」が組合せ候補であり、「a.csv」の各行の要素と「b.xml」の<place>タグの要素が組合せ候補であることを示している。尚、組合せ候補の指定は上記以外に、例えばURLを指定して、上記URLにあるデータ同士を組合せ候補にしたり、ファイル名ではなくファイル形式とその要素のみ指定して組合せ候補にしてもよい。また、三つ以上のデータを組合せ候補にしてもよい。
 データ取得先情報112は、データ処理サーバ101が公開データを取得するための取得先に関する情報を示す。図5は、本発明の第1の実施例のデータ取得先情報112の一例を示す図である。データ取得先情報112は、項目501、502の二つのデータ項目を含む。項目501は、データ取得先の名称を示す。項目502は、データ取得先の場所情報を示し、例えばURL等で表現される。例えば図5において、4レコード目は、データ処理サーバ101は、データ加工業者が公開するデータを「http://dataprocessor1.xx」から取得できることを示す。
 組合せ履歴情報113は、ユーザ端末121からの要求等によって過去にデータ処理サーバ101が実行したデータの組合せ処理の実行結果に関する履歴情報を示す。図6は、本発明の第1の実施例に係る組合せ履歴情報113の一例を示す図である。組合せ履歴情報113は、項目601、602、603の三つのデータ項目を含む。項目601は、データの組合せが行われた日時を示す。項目602、603は、組合せの対象となったデータを示す。例えば図6では、2013/7/1 12:00に「神奈川地価.csv」と「神奈川地図.xml」が組合せて処理されたことを示す。尚、組合せ履歴情報113として、上記以外の情報、例えばあるデータの組合せが適切であるかの情報などを使用してもよい。例えば、あるデータを組合せ、この組合せデータを所定の処理プログラムで処理させた時に、所望の結果が得られたか、即ち、その処理プログラムによって正しくデータが処理され、意味のある結果が得られたかをユーザ端末121を介してユーザに問合せし、その問合せ結果も組合せ履歴情報113としてメモリ102等に記憶するようにしてもよい。これにより、利用価値のある処理結果を得られるデータの組合せはどれか、後で履歴を参照して参考にすることができる。
 ファイル情報114は、データ処理サーバ101のメモリ102等に記憶するファイル等のデータに関する情報であり、例えばデータ公開サーバ141から取得したデータであったり、ユーザが独自に作成した記憶データなどを示す。
 次に、データ管理サーバ101のメモリ102に記憶されたプログラム(105~110)について説明する。機能実行部105は、データ処理サーバ101が提供する各種機能に基づく処理を実行する。機能は複数あってもよく、例えば地図上に特定の施設を表示する機能であったり、様々な公共の交通機関の情報を把握する機能等であってもよい。機能実行部105は、ユーザ端末121からの特定機能に関するデータ処理の実行要求等に基づきデータ処理を実行する。また、データ処理の実行にあたり、データの入力を受け付けて処理を実行するようにしてもよい。データ組合せ管理部106は、データ組合せ情報111への新たな組合せ候補の追加や削除を行う。また、データ組合せ管理部106は、機能実行部105の実行にあたり、どのデータを組合せるかの判断等を行う。データ解析部107は、入力されたデータの解析を行う。例えば、xmlファイルが入力された場合、データ解析部107は、ファイルを構成するタグ構造の解析等を行う。データ取得部108は、データ公開サーバ141等の外部からデータの取得を行う。データの取得は、ユーザ端末121の要求等に基づき行ってもよいし、機能実行部105の実行に合わせて行ってもよい。データ変換部109は、例えばxmlファイルをcsvファイルに変換するなど、データの変換を行う。ユーザ連携部110は、ユーザ端末121からのデータ処理実行要求の受信やユーザ端末121への実行結果の応答等を行う。
 次にユーザ端末121のメモリ122に記憶される情報について説明する。サーバ連携部126は、データ処理サーバ101など外部のサーバと連携し、ユーザ端末121に入力されたデータやデータ処理実行要求を外部のサーバに送信する。また、サーバ連携部126は、外部のサーバからの応答結果の受信等を行う。ユーザが、ユーザ端末121を用いて所望の操作を行うと、入力された操作情報を、操作要求としてユーザ連携部127が受付け、ユーザが要求する操作の実行、操作結果の表示等の処理を行う。
 以上、本実施例におけるデータ処理システムのハードウェアおよびソフトウェア構成について説明した。次に、前述のハードウェアおよびソフトウェア構成に基づいて、第1の実施例における、基本的なデータ組合せ処理、データ組合せ推定処理、ユーザ紐付けに基づくデータ組合せ処理、データ組み合わせ情報の登録処理、関連データの取得処理について説明する。データ組合せ処理やデータ組合せ推定処理は、ユーザ端末121からデータ処理サーバ101に対してデータの送信及びデータ処理実行要求があった時などに行う。データ組合せ情報の登録は、任意又は特定のタイミングで、ユーザ端末121からの要求に基づき行う、または、データ処理サーバ101が判断して行う。関連データの取得は、ユーザ端末121からの要求に基づいて行う、または、データ処理サーバ101での特定機能に基づくデータ処理の実行に合わせて自動的に行う。以下に各処理の詳細を示す。
<基本的なデータ組合せ処理>
 図7は、本発明の第1の実施例に係るデータ処理サーバ101が実行する、基本的なデータ組合せ処理の一例を示すフローチャートである。先ずデータ処理サーバ101のCPU103は、ユーザ端末121から、複数のファイル(入力データ)の指定と、特定の機能に関わるデータ処理の実行要求を受け付ける(ステップ701)。例えばユーザがユーザ端末121を用いて、データ処理サーバ101上のファイルaとファイルbを入力データとして指定し、特定の機能に基づくデータ処理の実行を指示すると、データ処理サーバ101のCPU103は、入力データとしてファイルaとファイルbの指定と、特定の機能に関わるデータ処理実行要求を受け付ける。次にCPU103は、複数のファイルが指定されているかを判断し(ステップ702)、複数のファイルが指定されていない場合は(ステップ702でNO)、指定されたファイルに対して要求されたデータ処理を実行し(ステップ703)、その実行結果をユーザユーザ端末121に送信して(ステップ704)、処理を終了する。複数のファイルが指定されている場合は(ステップ702でYES)、CPU103は、メモリ102等から指定ファイルを取得して、ファイルの構造を解析し、ファイルを構成する各要素の個数を求める(ステップ705)。そして、CPU103は、ファイル間で個数が同じ、同一の又は異なる要素があるかを判断し(ステップ706)、該当するものがない場合は(ステップ706でNO)、データを組合せて処理することができない等の実行結果をユーザ端末121に送信して、処理を終了する。一方、ステップ706で該当するものがある場合は(ステップ706でYES)、CPU103は、そのような要素の組合せが複数あるかを判断する(ステップ707)。例えばファイルがa.xmlとb.xmlであると仮定して、具体的に説明する。例えばa.xmlの<place>要素が5個で、b.xmlの<school>要素が5個だった場合、ステップ706において、CPU103により、ファイル間で個数が同じ要素があると判断される。さらにa.xmlの<place2>要素が10個で、b.xmlの<station>要素が10個だった場合、ステップ707において、CPU103により、要素の組合せが複数あると判断される。要素の組合せが複数ない場合は(ステップ707でNO)、CPU103は、ステップ706で判断した要素を組合せて、ユーザ端末121から要求されたデータ処理を実行し(ステップ703)、その実行結果をユーザ端末121に送信して(ステップ704)、処理を終了する。要素の組合せが複数ある場合は(ステップ707でYES)、CPU103は、これらを、要素の組合せ候補として、ユーザ端末121に送信する(ステップ708)。ユーザ端末121のCPU124は、I/F123を介して受信した要素の組合せ候補を表示装置125に表示する。ユーザが、表示装置125に表示された複数の要素の組合せ候補の中から所望の要素の組合せを選択入力すると、データ処理サーバ101のCPU103は、ユーザ端末121から選択入力された要素の組合せデータを受信し、ステップ701で要求されたデータ処理を実行し(ステップ709)、その実行結果をユーザ端末121に送信して(ステップ704)、処理を終了する。 
 尚、ステップ708において、ユーザに要素の組合せ候補を選択入力させて処理させる以外に、例えば組合せ履歴情報113において、各組合せの良し悪しの情報も登録しておき、その評価がよい要素の組合せをデータ処理サーバ101に選択させるようにしてもよい。組合せの良し悪しの情報は、例えばユーザがステップ703で実行したデータ処理の結果をもとに評価し、その評価結果を組合せ履歴情報113に登録してもよい。また、ステップ706において、ファイル間で個数が同じ要素がない場合は、一方のファイルの組合せ対象の要素を、他方のファイルの特定の要素の個数に合わせてパディング(値が空の要素を追加するなど)して処理させるようにしてもよい。また例えば、ファイルaの<big city>要素が50個で、ファイルbの<coast>要素が100個というように要素の個数が異なる場合でも、<big city>要素に「横浜市」という値があり、<coast>要素にも「横浜市」という共通の値がある場合は、その共通の部分についてだけデータを組合せて処理するなど、組合せようとする要素について、双方の個数が異なる場合であっても、要素の値として共通のものがある場合は、この要素の値が共通の部分だけについてデータを組合せて処理を実行するようにしてもよい。
 次に、本発明の第1の実施例に係るデータ組合せ推定処理について説明する。事前に登録されたデータ(要素)の組合せ候補情報や過去の組合せ履歴情報113を参照して、データの組合せ候補を推定するすることで、データ組合せ精度を高めて、より意味のある処理結果を得ることができる。
<データ組合せ推定処理>
 図8は、本発明の第1の実施例に係るデータ処理サーバ101が実行する、データ組合せ推定処理の一例を示すフローチャートである。図7のステップ702において、指定ファイルが複数でない場合に、データ処理サーバ101のCPU103により、メモリ102上のデータ組合せ情報111(図4)を参照し、データ(要素)の組合せ候補を推定する処理を説明する。先ずデータ処理サーバ101のCPU103は、ユーザ端末121から、1つのファイル(入力データ)の指定と、特定の機能に関わるデータ処理の実行要求を受け付ける(ステップ801)。次にCPU103は、メモリ102上のデータ組合せ情報111を参照して、データの組合せ候補を推定する(ステップ802)。具体的には、CPU103は、図4に示すデータ組合せ情報111を参照して、指定ファイルと組合せ可能なファイルの有無を判断し、組合せ可能なファイルがあれば、このファイルデータ組合せを組合せ候補として推定する。尚、この推定方法以外に、例えば組合せ履歴情報113を参照して、指定ファイルについてよく行われている組合せの有無を判断し、そのような組合せがあれば、これを組合せ候補としてもよい。組合せ候補が無い場合は(ステップ803でNO)、CPU103は、この旨をユーザ端末121に送信して(ステップ804)、処理を終了する。ステップ803において組合せ候補がある場合は(ステップ803でYES)、組合せ候補をユーザ端末121に送信する(ステップ805)。組合せ候補はユーザ端末121の表示装置125に表示される。ユーザが表示装置125に表示された組合せ候補から所望の組合せ候補を選択入力すると、データ処理サーバ101のCPU103は、選択入力された組合せファイルの構造を解析し、ファイル間で要素の個数が同じか判断する(ステップ806)。例えばデータ組合せ情報111(図4)の4レコード目のc.xmlファイルの<population>要素とd.xmlファイルの<map>要素の組合せを含む要素の組合せ情報が、要素の組合せ候補としてユーザ端末121の表示装置125に表示され、ユーザが<population>要素と<map>要素を組合せ候補として選択入力した場合、データ処理サーバ101のCPU103は、選択入力されたc.xmlファイルの<population>要素の個数とd.xmlファイルの<map>要素の個数が同じか判断する。要素の個数が同じでない場合(ステップ806でNO)、CPU103は、個数が少ない方の要素に合わせて要求されたデータ処理を実行し(ステップ807)、その実行結果をユーザ端末121に送信して(ステップ808)、処理を終了する。例えば前述の<population>要素が10個で<map>要素が20個だった場合、個数が少ない方の要素10個分について要求されたデータ処理を実行する。要素の個数が同じ場合(ステップ806でYES)、CPU103は要求されたデータ処理を実行し(ステップ809)、その実行結果をユーザ端末121に送信して、処理を終了する。以上説明したデータ組合せ推定処理により、データ処理サーバ101が要素の組合せ候補を推定し、これをユーザ端末121の表示装置125に表示可能としたので、データの組合せ方法についてあまり知識のないユーザであっても容易に操作を行うことができる。
 次に、本実施例における、ユーザ紐付けに基づくデータ組合せ処理について説明する。本処理は、データの組合せ方やデータ構造についてある程度の知識のあるユーザが行うことを想定し、より自由にデータの組合せをカスタマイズできるようにしたものである。
<ユーザ紐付けに基づくデータ組合せ処理>
 図9は、本発明の第1の実施例に係るデータ処理サーバ101が実行する、ユーザ紐付けに基づくデータ組合せ処理の一例を示すフローチャートである。先ずデータ処理サーバ101のCPU103は、ユーザからファイルの指定と特定の機能に関わるデータ処理の実行要求を受け付ける(ステップ901)。次にCPU103は、指定ファイルの構造を解析する(ステップ902)。例えば図3に示すように、指定ファイルがb.kmlであった場合、CPU103が、ファイルの中身を見て、その構造が図3に示す形になっていることを確認する。CPU103は、ファイル構造の解析結果をユーザ端末121に送信する(ステップ903)。ファイル構造の解析結果はユーザ端末121の表示装置125に表示され、ユーザはどの要素とどの要素を組合せるか指定する。この処理について、図3を例に説明する。図3は、a.csvとb.kmlを入力として、二つのファイルを組合せてデータ処理サーバ101のCPU103に処理させる例である。例えば各入力ファイルの構造の解析結果が図3に示すような形で、ブラウザ等のGUI上でユーザに提示される。ユーザは提示された情報をもとに、どの要素とどの要素を組合せるか紐付けを行う。紐付けは、例えばGUI上で要素と要素を線で結ぶ等して行ってよい。例えば図3では、a.csvの各行の要素が、b.kmlの<placemark>要素に紐付けされている。このようにして、ユーザから要素の組合せの指定を受け付ける。尚、組合せの指定は、例えばa.csvの一行目の要素とb.kmlの一番目の<placemark>要素というように、一対一の関係で指定してもよいし、a.csvの各行の要素の集合と、b.kmlの<placemark>要素の集合というようにグループ単位で指定してもよい。
 次にCPU103は、ユーザにより指定された要素の組合せが、グループ単位での指定か判断する(ステップ904)。グループ単位での指定でない場合は(ステップ904でNO)、CPU103は、要求されたデータ処理を実行し(ステップ906)、その実行結果をユーザ端末121に送信して(ステップ907)、処理を終了する。グループ単位での指定の場合(ステップ904でYES)、CPU103は、指定された組合せ要素の個数が同じか判断する(ステップ905)。個数が同じ場合は(ステップ905でYES)、CPU103は、要求されたデータ処理を実行し、その実行結果をユーザ端末121に送信して、処理を終了する。個数が同じでない場合(ステップ905でNO)、CPU103は個数が少ない方の要素に合わせて要求されたデータ処理を実行し(ステップ908)、その実行結果をユーザ端末121に送信して、処理を終了する。
 以上が、ユーザ紐付けに基づくデータ組合せ処理の内容である。尚、ここでは、データの組合せの指定をユーザによる紐付けによって行ったが、上記データ組合せ推定処理フローを用いて同様のことを行ってもよい。この場合、例えば図3の例では、データ処理サーバ101は、a.csvの各行を一つの要素とみなして、この要素と個数が同じb.kmlの要素を特定する。図3の例では、<placemark>要素が該当する。さらに、a.csvの各要素がどの<placemark>要素に対応づくかについては、例えば、共通の値を持つ要素同士が対応づくと判断してデータを組合せて処理させる。図3の例では、a.csvの最初の要素は「戸塚区」という値を持ち、b.kmlの一番目の<placemark >要素が同じ「戸塚区」という値を持っているため、双方が対応づくと判断する。但し、上記処理方法以外に、この対応付けをユーザによる指定によって行ってもよい。 
 次に、本発明の第1の実施例に係るデータ組合せ候補の登録処理について説明する。本処理によって登録されたデータ組合せ候補は、以降ユーザがデータの組合せを行う際に参考にすることができる。
<データ組合せ候補の登録処理>
 図10は、本発明の第1の実施例に係るデータ処理サーバ101が実行する、データ組合せ候補の登録処理の一例を示すフローチャートである。データ処理サーバ101のCPU103は、組合せ候補の登録を自動的に行うことになっているか判断する(ステップ1001)。例えばこれは、データ処理サーバ101への登録を自動的に行うか、ユーザによる手動で行うか、双方に対応するか等のモードを設けておき、それに基づき判断してもよい。登録が自動でない場合(ステップ1001でNO)、CPU103は、ユーザ端末121から組合せ候補の登録要求を受け付け、ユーザが指定した候補をメモリ102上のデータ組合せ情報111に登録する(ステップ1002)。登録が自動の場合(ステップ1001でYES)、CPU103は、メモリ102上の組合せ履歴情報113を参照し(ステップ1003)、組合せ頻度が高いもので、まだ未登録のものをメモリ102上のデータ組合せ情報111に登録する(ステップ1004)。尚、ステップ1002において、組合せ候補の登録は、実際に上記組合せ候補を用いてデータ処理を実行した結果、エラー等が生じず正しくデータ処理された場合のみ登録するようにしてもよい。また、登録にあたり、組合せ候補の情報だけでなく、対応する機能の情報(例えばデータ処理サーバ101が多数のデータ処理機能を備える場合、そのうちのどの機能が各登録された組合せ候補の情報を使うかを示す情報)も登録してもよい。また、組合せて処理を行うことでどのような結果が得られるかのサマリ情報も登録してもよい。
 次に、本発明の第1の実施例に係る関連データの取得処理について説明する。例えば、データの組合せは異なるが処理内容は同様であるといったものが存在する。例えば横浜市の住民があるデータを組合せて処理を行ったとすると、それと同様の処理を川崎市の住民や横須賀市の住民も行いたいということが起こり得る。このような可能性に備えて、データ処理サーバ101が上記のような処理をパタン化して管理して、多数のユーザが使えるように提供することで、ユーザの利便性向上を図ることができる。上記の実現にあたり、例えばユーザの操作に応じてユーザ端末121が横浜市のデータを使って、ある処理を実施した場合に、データ処理サーバ101は、関連するデータ(例えば川崎市や横須賀市の同様のデータ)についても取得を行って事前にデータを準備し、以降ユーザからの同様の処理の問合せに備える。また、事前に取得したデータをもとに、例えば他の都市についても同様の処理ができるということをユーザ端末121を介してユーザに候補として提示するようにしてもよい。関連データの取得処理の詳細を以下に示す。
<関連データの取得処理>
 図11は、本発明の第1の実施例に係るデータ処理サーバ101が実行する、関連データの取得処理の一例を示すフローチャートである。先ずデータ処理サーバ101のCPU103は、ファイルおよび組合せデータの指定と特定の機能に関わるデータ処理の実行要求を受け付ける(ステップ1101)。次にCPU103は、要求されたデータ処理を実行し、エラー等生じず正しくデータ処理が実行されたか判断する(ステップ1102)。正しく処理が実行されなかった場合(ステップ1102でNO)、そのデータ処理結果をユーザ端末121に送信して(ステップ1104)、処理を終了する。正しく処理が実行された場合(ステップ1102でYES)、CPU103は、ユーザ端末121によって要求されたデータ処理をパタン化するかどうか、ユーザ端末121を介してユーザに問合せる等して判断する(ステップ1103)。データ処理をパタン化しない場合(ステップ1103でNO)、CPU103は、データ処理結果をユーザ端末121に送信して、処理を終了する。ステップ1103において、CPU103は、ユーザの操作によりユーザ端末121に入力された、処理をパタン化する旨の回答を、ユーザ端末121から得るなどしてパタン化すると判断した場合は、ユーザからステップ1101で指定されたファイルおよび組合せデータの入力元情報の提供を受け、その情報をもとに関連データの探索、取得を行う(ステップ1105)。関連データの取得は、例えばユーザからファイルが公開されているURL等、入力元情報を提供して貰い、そのURLにあるその他のデータを取得することで実現してもよい。例えばユーザが指定したファイルが横浜市.csvであり、その入力ファイルが公開されているURLに横須賀市.csv等の別のファイルがある場合は、それらを関連データとして取得するなど。また、関連データの取得にあたっては、例えばファイル名の情報を参考にする等して、取得対象をフィルタリングしてもよい。例えばユーザが指定したファイルが神奈川県.csvなら、関連データとして東京都.csv等のデータがユーザ提供の入力元情報の場所にあるか見て取得し、ユーザが指定したファイルが横浜市.csvなら、関連データとして川崎市.csv等のデータがあるか見て取得するなどである。これは例えば神奈川県の都市情報として、横浜市と川崎市が関連するということを辞書情報のような形で管理しておき、それを参照して判断するようにしてもよい。CPU103は、ステップ1105で関連データの探索を行った結果、関連データがあるか判断し(ステップ1106)、関連データがない場合は(ステップ1106でNO)、ユーザ端末121にデータ処理結果を送信して、処理を終了する。関連データがある場合は(ステップ1106でYES)、CPU103は、上記関連データを取得しメモリ102等に保存する(ステップ1107)。そして、CPU103は、以降、取得した関連データをデータの組合せ候補としてユーザへの提示等に使用可能にし(ステップ1108)、ユーザ端末121に処理結果を送信して、処理を終了する。尚、ステップ1103のデータ処理のパタン化においては、例えばどのようなデータ処理を行うものかを示す処理パタン情報等をデータ処理サーバ101内に定義し、ユーザが指定したファイルやそれに関連するデータとしてデータ処理サーバ101が取得してきたデータを対応付けて管理してもよい。そして、ユーザ端末121からの要求があった際など、適宜呼出せるようにしてもよい。
 以上が、第1の実施例の基本的なデータ組合せ処理、データ組合せ推定処理、ユーザ紐付けに基づくデータ組合せ処理、データ組み合わせ情報の登録処理、関連データの取得処理の説明である。
 次に、本発明の第2の実施例を説明する。第1の実施例では、ユーザが全てのファイルを指定してから、データ処理サーバ101によるデータ処理を開示する例をとり説明した。第2の実施例では、ユーザが全てのファイルを指定してからデータ処理サーバ101によるデータ処理の実行を開始するのではなく、ユーザが一つでもファイルを指定すると、データ処理サーバ101によるデータ処理を開始する。ユーザは、例えばコンソールやブラウザ等を使ってファイル名を指定する等して行ってもよいし、例えば図13に示すようなデータ処理コンポーネントをWebブラウザ等のブラウザ上に表示させ、そのデータ処理コンポーネントと、ファイル等のデータを表すデータオブジェクトを結ぶことで実現してもよい。例えば図13の例では、データ処理コンポーネントに対してデータAやデータBのデータオブジェクトを結ぶと、それらのデータがデータ処理コンポーネントに入力されるようにする等である。
 以下に本実施例におけるデータ組合せ処理(以下では入力途中でのデータ組合せ処理と呼ぶ)について説明する。本処理では、ユーザが一つでも入力を指定すると、データ処理サーバ101は、その入力は所定の機能を実行する上で適切かの判断や、またその入力の組合せ候補となりうるデータを探してユーザへの提示を行う。これにより、例えばある入力が一つ決まっていて、それに対して他のデータ(他の入力)を組合せて何らかの処理をさせたいという場合に、ユーザから全ての入力の指定を完了して貰ってから処理する方法に比べて、早い段階でユーザの組合せ候補選定の判断を支援することができ、組合せ候補を探すユーザの手間削減を図ることができる。尚、本実施例のデータ処理システムのハードウェアおよびソフトウェア構成は、第1の実施例と同様であるため、説明は省略する。
<入力途中でのデータ組合せ処理>
 図12は、本発明の第2の実施例に係るデータ処理サーバ101が実行する、入力途中でのデータ組合せ処理の一例を示すフローチャートである。先ずデータ処理サーバ101のCPU103は、ユーザ端末121からデータが指定されるまで待機する(ステップ1201)。CPU103は、データの指定を受け付けたか判断し(ステップ1201)、データの指定を受け付けていない場合は(ステップ1202でNO)、ステップ1201に戻り、データの指定を受け付けた場合は(ステップ1202でYES)、メモリ102上の組合せ履歴情報113等を参照して、ステップ1202で指定されたデータと関係の深いと考えられるデータを検索する(ステップ1203)。例えばCPU103は、組合せ履歴情報113から、指定データとよく組合せて使用されているデータを割出し、当該データを上記指定データと関係の深いデータであると判断する。上記以外に、例えばCPU103は、メモリ102上のデータ組合せ情報111を参照して、上記指定データが有るか判断し、登録されている場合は、その組合せ対象とされているデータを、指定データと関係の深いデータであると判断してもよい。
 そして、CPU103は、ユーザ端末121からデータ処理の実行要求の受信の有無を判断する(ステップ1204)。これは例えば図13に示すような機能コンポーネントにおいて処理の実行ボタン等を設け、データ処理サーバ101のCPU103が、実行ボタンの押下を検出していない場合は実行要求をまだ受信していないと判断し、実行ボタンの押下を検出した場合は実行要求を受信したと判断するようにしてもよい。データ処理の実行要求を受信した場合は(ステップ1204でYES)、CPU103は、要求されたデータ処理の実行結果をユーザ端末121に送信して(ステップ1205)、処理を終了する。データ処理の実行要求をまだ受信していない場合は(ステップ1204でNO)、CPU103は、ステップ1203の検索処理において、指定データと関係の深いデータと判断したものを、指定データに組合せるデータの候補として、ユーザ端末121に送信する(ステップ1206)。組合せるデータの候補はユーザ端末121の表示装置125を介してユーザに提示される。以上の処理は、例えばユーザがあるデータを使って何か処理をしたい時に、他にどのようなデータを組合せて処理したらよいかわからないような場合には、データ処理サーバ101がデータ処理の実行要求を受信するまでに時間を要するということを考慮した処理である。このようにデータ処理の実行要求を受信するまでに要する時間等をもとに、組合せるデータの候補をユーザに提示する又は提示しない処理方法以外に、関連データについてのユーザの問合せを、ユーザ端末121を介して、直接、受信し、応答するような処理にしてもよい。例えばデータ処理サーバ101は、あるデータに関連するデータはどれか、またあるデータを使ってどんなことができるかなどのユーザの問合せをユーザ端末121を介して受信し、それに対して、これまでの組合せ履歴情報113やデータ組合せ情報111をもとに、関連するデータやデータを使って行えることの候補を求めて、これをユーザ端末121を介してユーザに提示し、ユーザに選択させるようにしてもよい。
 ユーザは、ステップ1206で提示されたものから組合せ対象を選択入力すると、CPU103は、ユーザ端末121から、ユーザにより選択入力された組合せ対象のデータ処理実行要求を受信し(ステップ1207)、要求されたデータ処理を実行し(ステップ1208)、その実行結果をユーザ端末121に送信して、処理を終了する。
 以上が、本発明の第2の実施例の説明である。
 以上説明した本発明の実施の形態によれば、例えば、データ処理サーバとユーザ端末を含んで構成されるデータ処理システムにおいて、データ処理サーバはデータの組合せに関する情報であるデータ組合せ情報と、公開データを取得してくるための取得先に関する情報であるデータ取得先情報と、過去にデータ処理サーバが行ったデータの組合せ処理に関する履歴情報である組合せ履歴情報と、データ処理サーバが保持するファイル等のデータに関する情報であるファイル情報とを備える。
 データ処理サーバはユーザからの入力ファイルや操作要求の指示に基づき、入力ファイルを解析し、各入力ファイルにおいて要素ごとに個数を集計し、入力ファイル間で個数が同じ、同一のまたは異なる要素の有無を判断し、該当する要素が存在する場合は、そのような要素同士の組合せ候補が多数あるか判断し、多数あれば上記候補をユーザに提示して、ユーザの選択結果に基づいてデータ処理を行う。また、データ処理サーバは組合せ履歴情報等をもとに、データ組合せの候補の推定を行う。さらにデータ処理サーバは、ユーザによるデータ組合せの指定に関して、データ組合せの候補からの選択以外に、入力ファイルの構造解析結果をもとにした要素間の紐付けによっても行えるようにする。データ処理サーバの他の形態として、データ処理サーバはさらに、ユーザから入力ファイルの指定が来るまで待機し、一つでも入力ファイルの指定があれば、組合せ履歴情報等を参考に上記入力と関連の深いデータを検索し、ユーザからの操作要求がまだ行われていない場合は、上記関連の深いと判断したデータをユーザに提示し、ユーザの選択結果に基づいてデータ処理を行う。
 これらによって、本発明の一実施形態によれば、ファイル構造が類似しないファイルや、形式の異なるファイルであっても、データを適切に組合せて処理を行うことができる。また、データの組合せ候補の提示等を行うことで、データの組合せ方法についてあまり知識のないユーザであっても容易に処理を行えるようにする。一方で、データ構造や組合せ方法についてある程度の知識のあるユーザに対しては、より自由なデータの組合せのカスタマイズを可能にする。
 以上、本発明の実施の形態について説明したが、本発明はこうした実施の形態に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内において様々な形態で実施し得ることは勿論である。
101・・・データ処理サーバ、102、122・・・メモリ、103、124・・・CPU、104、123・・・1/F、105・・・機能実行部、106・・・データ組合せ管理部、107・・・データ解析部、108・・・データ取得部、109・・・データ変換部、110・・・ユーザ連携部、111・・・データ組合せ情報、112・・・データ取得先情報、113・・・組合せ履歴情報、114・・・ファイル情報、121・・・…ユーザ端末、125・・・表示装置、126・・・サーバ連携部、127・・・ユーザ連携部、141・・・データ公開サーバ。

Claims (12)

  1.  複数のファイルを記憶する記憶部と、
     ユーザ端末から、第1のファイルおよび第2のファイルの指定と、特定の機能に関わるデータ処理の実行要求を受信し、
     指定された前記第1のファイルおよび前記第2のファイルを前記記憶部から取得し、
     取得した前記第1のファイルおよび前記第2のファイルの構造を解析し、
     前記第1のファイルおよび前記第2のファイルのそれぞれを構成する各要素のうち個数が同じ要素がある場合、該要素同士を組合せて前記データ処理を実行し、
     該実行結果を前記ユーザ端末に送信するプロセッサと、
     を具備する、
     ことを特徴とするデータ処理サーバ。
  2.  前記プロセッサは、前記第一のファイルおよび前記第二のファイルで前記個数が同じ要素が複数ある場合は、該要素同士の組合せを、組合せ候補情報として前記ユーザ端末に送信し、前記ユーザ端末から、組合せ候補の指定を受け、該指定された要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項1に記載のデータ処理サーバ。
  3.  前記記憶部は、さらにデータの組合せ履歴情報を記憶し、
     前記プロセッサは、
     前記ユーザ端末からファイルの指定と前記データ処理の実行要求を受信した際に、前記記憶部の前記組合せ履歴情報を参照して、組合せ頻度が高いファイルの組合せがあるかを判断し、ある場合は該ファイルの組合せを、組合せ候補として前記ユーザ端末に送信し、前記ユーザ端末から組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項1に記載のデータ処理サーバ。
  4.  前記プロセッサは、前記ユーザ端末から前記組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素の個数が同じか否か判断し、個数が同じ場合は、該要素同士を組合せて前記データ処理を実行し、個数が同じでない場合は、少ない方の要素の個数分だけ要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項3に記載のデータ処理サーバ。
  5.  前記プロセッサは、要求された前記データ処理を実行し、該データ処理が正しく行われたか否かを判断し、該データ処理が正しく行われた場合、前記ユーザ端末から前記データ処理のパタン化の指示を受け、前記ユーザ端末から指定された前記第1のファイルおよび前記第2のファイルの取得元情報を受信し、前記取得元情報をもとに前記第1のファイルおよび前記第2のファイルのそれぞれと関連のあるデータを取得し、該取得データを、組み合わせ候補として前記ユーザ端末に送信する、
     ことを特徴とする請求項1に記載のデータ処理サーバ。
  6.  前記プロセッサは、前記ファイルの指定を受け、前記組合せ履歴情報を参照し、前記組合せ履歴情報において高い頻度で行われているファイルの組合せを判別し、そのうち前記指定ファイルに関連するファイルの組合せがあるか否かを判断し、ある場合は該ファイルを前記指定ファイルと関連の深いファイルと判断し、該関連の深いファイルを、前記指定ファイルに組合せるファイルの候補として前記ユーザ端末に送信し、前記ユーザ端末から組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項3に記載のデータ処理サーバ。
  7.  ユーザ端末と接続されたデータ処理サーバにおけるデータ処理方法であって、
     ユーザ端末から、第1のファイルおよび第2のファイルの指定と、特定の機能に関わるデータ処理の実行要求を受信し、
     指定された前記第1のファイルおよび前記第2のファイルを記憶部から取得し、
     取得した前記第1のファイルおよび前記第2のファイルの構造を解析し、
     前記第1のファイルおよび前記第2のファイルのそれぞれを構成する各要素のうち個数が同じ要素がある場合、該要素同士を組合せて前記データ処理を実行し、
     該実行結果を前記ユーザ端末に送信する、
     ことを特徴とするデータ処理方法。
  8.  前記第一のファイルおよび前記第二のファイルで前記個数が同じ要素が複数ある場合は、該要素同士の組合せを、組合せ候補情報として前記ユーザ端末に送信し、前記ユーザ端末から、組合せ候補の指定を受け、該指定された要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項7に記載のデータ処理方法。
  9.  前記ユーザ端末からファイルの指定と前記データ処理の実行要求を受信した際に、前記記憶部に記憶されている組合せ履歴情報を参照して、組合せ頻度が高いファイルの組合せがあるかを判断し、ある場合は該ファイルの組合せを、組合せ候補として前記ユーザ端末に送信し、前記ユーザ端末から組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項7に記載のデータ処理方法。
  10.  前記ユーザ端末から前記組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素の個数が同じか否か判断し、個数が同じ場合は、該要素同士を組合せて前記データ処理を実行し、個数が同じでない場合は、少ない方の要素の個数分だけ要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項9に記載のデータ処理方法。
  11.  要求された前記データ処理を実行し、該データ処理が正しく行われたか否かを判断し、該データ処理が正しく行われた場合、前記ユーザ端末から前記データ処理のパタン化の指示を受け、前記ユーザ端末から指定された前記第1のファイルおよび前記第2のファイルの取得元情報を受信し、前記取得元情報をもとに前記第1のファイルおよび前記第2のファイルのそれぞれと関連のあるデータを取得し、該取得データを、組み合わせ候補として前記ユーザ端末に送信する、
     ことを特徴とする請求項7に記載のデータ処理方法。
  12.  前記ファイルの指定を受け、前記組合せ履歴情報を参照し、前記組合せ履歴情報において高い頻度で行われているファイルの組合せを判別し、そのうち前記指定ファイルに関連するファイルの組合せがあるか否かを判断し、ある場合は該ファイルを前記指定ファイルと関連の深いファイルと判断し、該関連の深いファイルを、前記指定ファイルに組合せるファイルの候補として前記ユーザ端末に送信し、前記ユーザ端末から組合せ候補の指定を受け、該指定されたファイルの組合せについて、該ファイルそれぞれを構成する要素同士を組合せて前記データ処理を実行する、
     ことを特徴とする請求項9に記載のデータ処理方法。
PCT/JP2014/078682 2013-12-10 2014-10-29 データ処理方法およびデータ処理サーバ WO2015087632A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201480050607.9A CN105531704B (zh) 2013-12-10 2014-10-29 数据处理方法以及数据处理服务器
US15/022,220 US20160224582A1 (en) 2013-12-10 2014-10-29 Data processing method and data processing server

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-254626 2013-12-10
JP2013254626A JP6173896B2 (ja) 2013-12-10 2013-12-10 データ処理方法およびデータ処理サーバ

Publications (1)

Publication Number Publication Date
WO2015087632A1 true WO2015087632A1 (ja) 2015-06-18

Family

ID=53370949

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/078682 WO2015087632A1 (ja) 2013-12-10 2014-10-29 データ処理方法およびデータ処理サーバ

Country Status (4)

Country Link
US (1) US20160224582A1 (ja)
JP (1) JP6173896B2 (ja)
CN (1) CN105531704B (ja)
WO (1) WO2015087632A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595523B (zh) * 2018-03-27 2021-12-17 广东电网有限责任公司广州供电局 设备数据检索模型构建方法、装置及计算机设备
GB201818997D0 (en) * 2018-11-22 2019-01-09 Palantir Technologies Inc Providing external access to a prcoessing platform
CA3157986A1 (en) * 2019-10-24 2021-04-29 Canopy Software Inc. Systems and methods for identifying compliance-related information associated with data breach events

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135221A (ja) * 2003-10-31 2005-05-26 Turbo Data Laboratory:Kk 表形式データの結合方法、結合装置およびプログラム
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
JP2010182183A (ja) * 2009-02-06 2010-08-19 Toshiba Corp 構造化文書間整合管理装置及びプログラム
JP2010231766A (ja) * 2009-03-02 2010-10-14 Fujitsu Ltd 文書検査装置、コンピュータ読み取り可能な記録媒体および文書検査方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4281185B2 (ja) * 1999-03-25 2009-06-17 ソニー株式会社 編集装置および方法
US20020111936A1 (en) * 2001-01-19 2002-08-15 Ec Outlook, Inc. System and method for analyzing computer intelligible electronic data
JP2003337728A (ja) * 2002-05-17 2003-11-28 Hitachi Ltd データファイル履歴管理方法およびその装置
US7426520B2 (en) * 2003-09-10 2008-09-16 Exeros, Inc. Method and apparatus for semantic discovery and mapping between data sources
WO2006041104A1 (ja) * 2004-10-13 2006-04-20 Nissay Information Technology Co., Ltd. データ管理装置およびその方法
JP4652833B2 (ja) * 2005-01-31 2011-03-16 富士通株式会社 個人認証装置および個人認証方法
US20110177774A1 (en) * 2010-01-13 2011-07-21 Qualcomm Incorporated Dynamic generation, delivery, and execution of interactive applications over a mobile broadcast network
US8219596B2 (en) * 2010-03-08 2012-07-10 Sap Ag System and method of optimizing performance of schema matching
CN102375847B (zh) * 2010-08-17 2014-06-04 富士通株式会社 形成用于生成文档模板的合并树的方法以及装置
CN102340429B (zh) * 2011-10-12 2014-05-07 北京锐安科技有限公司 一种互联网协议还原自动化检测方法
JP5426710B2 (ja) * 2012-03-19 2014-02-26 株式会社東芝 検索支援装置、検索支援方法およびプログラム
US9098550B2 (en) * 2012-05-17 2015-08-04 Sap Se Systems and methods for performing data analysis for model proposals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135221A (ja) * 2003-10-31 2005-05-26 Turbo Data Laboratory:Kk 表形式データの結合方法、結合装置およびプログラム
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
JP2010182183A (ja) * 2009-02-06 2010-08-19 Toshiba Corp 構造化文書間整合管理装置及びプログラム
JP2010231766A (ja) * 2009-03-02 2010-10-14 Fujitsu Ltd 文書検査装置、コンピュータ読み取り可能な記録媒体および文書検査方法

Also Published As

Publication number Publication date
JP2015114743A (ja) 2015-06-22
JP6173896B2 (ja) 2017-08-02
US20160224582A1 (en) 2016-08-04
CN105531704B (zh) 2019-05-10
CN105531704A (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
US8904493B1 (en) Image-based challenge-response testing
US10825114B2 (en) Identifying correlated services during processing services
CN103258057B (zh) 在电子地图界面上展示兴趣点poi的方法和装置
CN109104354B (zh) 入群、建群方法及其设备
CN102591867B (zh) 一种基于移动设备位置的搜索服务方法
CN104834727A (zh) 展示地图数据、提供地图数据的方法、终端设备及服务器
CN101408877A (zh) 树节点加载系统及其方法
US9262550B2 (en) Processing semi-structured data
EP1879118A1 (en) Search server
JP6173896B2 (ja) データ処理方法およびデータ処理サーバ
US20140089825A1 (en) Apparatus and method for writing mash-up using mash-up block user interface
JP2009145549A (ja) 広告情報提供装置、広告情報提供方法及び広告情報提供プログラム
CN104182486A (zh) 电子地图展现方法和装置
US20160117352A1 (en) Apparatus and method for supporting visualization of connection relationship
US20120072359A1 (en) Location Based Friend Finding
CN113742172B (zh) 一种服务器日志的采集方法、系统及相关装置
KR20220130633A (ko) 지도 정보의 처리 방법, 장치, 전자 설비 및 저장 매체
CN106462603A (zh) 对多个实体隐含的查询的歧义消除
CN109462649A (zh) 一种远程文件分析方法、装置、系统及其存储介质
KR101770299B1 (ko) 데이터 전송 방법 및 장치와 데이터 처리 방법 및 장치
CN113923250B (zh) 一种辅助网络服务编排的方法、装置及系统
JP2002149681A (ja) 不動産物件の検索サービス方法、検索サービスシステム、検索システム、検索依頼装置、検索仲介装置及び検索装置
JPWO2021065550A5 (ja)
JP2001350794A (ja) データベース検索用キーワードに基づくコミュニケーション装置及び方法並びに記録媒体
JP5575971B1 (ja) 帳票データ管理サーバ、および帳票データ管理プログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201480050607.9

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14869484

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15022220

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14869484

Country of ref document: EP

Kind code of ref document: A1