WO2012014918A1 - フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム - Google Patents

フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム Download PDF

Info

Publication number
WO2012014918A1
WO2012014918A1 PCT/JP2011/067055 JP2011067055W WO2012014918A1 WO 2012014918 A1 WO2012014918 A1 WO 2012014918A1 JP 2011067055 W JP2011067055 W JP 2011067055W WO 2012014918 A1 WO2012014918 A1 WO 2012014918A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
document file
document
digital
unit
Prior art date
Application number
PCT/JP2011/067055
Other languages
English (en)
French (fr)
Inventor
守本 正宏
喜勝 白井
秀樹 武田
真利 大野
Original Assignee
株式会社Ubic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Ubic filed Critical 株式会社Ubic
Priority to CN201180005035.9A priority Critical patent/CN102959578B/zh
Priority to US13/514,981 priority patent/US8549037B2/en
Priority to KR1020127014182A priority patent/KR20130095171A/ko
Priority to EP11812507.9A priority patent/EP2506208A4/en
Publication of WO2012014918A1 publication Critical patent/WO2012014918A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Definitions

  • the present invention relates to a forensic system, a forensic method, and a forensic program, and more particularly, to a forensic system, a forensic method, and a forensic program for outputting digital document information related to a lawsuit.
  • Patent Document 1 discloses a forensic system in which a fraudulent person can be efficiently identified by a method capable of proving evidence retention, and the specific reliability is hardly affected by human factors.
  • Patent Document 2 discloses a forensic information insurance system that pays insurance money for damages caused by leakage of personal information, and includes forensics that perform subsequent actions such as identification of criminals and legal measures. A system is disclosed.
  • an object of the present invention is to provide a forensic system, a forensic method, and a forensic program that output a document file that requires a minimum translation instead of analyzing all document files. .
  • a forensic system of the present invention acquires digital information recorded in a plurality of computers or servers, and analyzes the acquired digital information.
  • a digital information acquisition unit that acquires digital information including user information relating to a user who uses a computer or a server; a recording unit that records digital information acquired by the digital information acquisition unit;
  • a display unit that displays user information, a designation receiving unit that accepts designation of at least one or more document files included in the digital document information, and accepts designation of which language the document file accepted is translated into; , Accept the specified document file
  • a translation processing unit for translating into a specific language, a common document file extracting unit for extracting a common document file showing the same contents as the designated document file from the digital document information recorded in the recording unit, and the extracted common document Based on the translation related information and the translation related information generating unit that generates translation related information indicating that the file has been translated by using the translated content of the translated document file, the document file related to the lawsuit is output. And an output unit. The output of the document
  • the “digital information acquisition unit” acquires digital information recorded in a plurality of computers or servers.
  • the digital information acquisition unit stores digital information recorded in the computer or server on an electronic medium. Copy and copy to the forensic system via the electronic medium, or connect the computer or server to the forensic system via a network line, and transfer the digital information recorded on the computer or server to the forensic system. conservee and collect digital information by copying it.
  • the “translation related information generation unit” generates information indicating a translated document file among a plurality of document files.
  • the translation related information may be recorded in the incidental information of the document file that has received the designation.
  • Translation related information is data that enables the forensic system to determine whether or not a document file has been translated. Specifically, this indicates that the computer can determine which document file is translated into which language.
  • the “translation related information generation unit” may record the translation related information in the incidental information of the common document file, for example.
  • the “translation related information generation unit” may record translation related information in the recording unit, for example.
  • the “server” is a single server or more, and may be configured by a plurality of servers, for example. Further, for example, the “server” may be any one of two or more of a mail server, a file server, and a document management server.
  • Display refers to a display or the like that can display digital information.
  • the “output unit” outputs digital document information as some kind of production or electronic data, and may be any one of a printer, a digital document file creation device, and a display unit, for example.
  • the translation related information further indicates information indicating that the common document file and the translated document file have the same translation contents, and the output priority of the document file in the output unit
  • the output unit may control whether to output each document file based on the information indicating the priority order.
  • “Information indicating that the content is the same translation” is data for the forensic system to determine that each document file indicates the same content. Specifically, the same translation content may be indicated by a hash name or other numerical number, symbol or character recorded in the control unit.
  • the “information indicating priority” is information indicating that the output unit of the forensic system is a priority to be output from a predetermined document file.
  • the priority is indicated by a numerical number, a symbol, or a character. May be indicated.
  • the forensic system of the present invention further includes a data format determination unit that determines the data format of the document file of the digital document information recorded by the recording unit, and the output unit includes the document file determined by the data format determination unit.
  • the data format determination unit determines the data format of the document file of the recorded document information, specifically, the data format of a word document, Excel document, PowerPoint document, PDF document, or the like.
  • the word document and the power point document have different data formats. Control to output the document.
  • the forensic system of the present invention further includes an incidental information setting unit that sets incidental information indicating whether each of the extracted document files of the digital document information is related to a lawsuit via the display unit.
  • the output unit may output a document file related to the lawsuit based on the translation-related information and the incidental information.
  • the forensic system of the present invention further includes a language determination unit that determines which language is described for each of a plurality of document files from the recorded digital document information, and the recording unit includes: Depending on the result of the language determined by the language determination unit, a plurality of document files may be organized and recorded in folders for each language.
  • the forensic method of the present invention is a forensic method for acquiring digital information recorded in a plurality of computers or servers, and analyzing the acquired digital information.
  • Digital information including user information about a user who uses the computer or the server, records the digital information acquired by the digital information acquisition unit, displays the recorded digital information and user information, Accepts specification of at least one or more document files included in digital document information, accepts specification of which language the specified document file is translated into, and translates the accepted document file into the accepted language From the digital document information recorded in the recording section.
  • a common document file showing the same contents as the file is extracted, and translation-related information is generated to indicate that the extracted common document file has been translated by using the translated contents of the translated document file.
  • a document file related to the lawsuit is output based on the information.
  • the output of the document file may be any one of paper output by a printer, output by saving an electronic medium by a digital document file creation apparatus in a recording medium, and output displayed on a display unit.
  • the forensic program of the present invention is a forensic program for acquiring digital information recorded in a plurality of computers or servers, and analyzing the acquired digital information.
  • a function of acquiring digital information including user information relating to a user who uses the plurality of computers or servers, a function of recording the digital information acquired by the digital information acquisition unit, and the recorded digital information and use
  • a function for displaying user information a function for accepting designation of at least one or more document files included in the digital document information, a designation for translating the designated document file into which language, and a designation accepted.
  • Document file in the language that accepted the specification A function to translate, a function to extract a common document file showing the same contents as the designated document file from the digital document information recorded in the recording unit, and the extracted common document file to the translated document file A function for generating translation-related information indicating that translation has been performed by using the translation content and a function for outputting a document file related to a lawsuit based on the translation-related information are realized.
  • the output of the document file may be any one of paper output by a printer, output by saving an electronic medium by a digital document file creation apparatus in a recording medium, and output displayed on a display unit.
  • the specification of at least one or more document files included in the digital document information is received, the specification of which language the specified document file is to be translated is received, The document file that has received the specification is translated into the language that has received the specification, and a common document file that shows the same content as the specified document file is extracted from the digital document information recorded in the recording unit and extracted.
  • FIG. 1 is a functional block diagram illustrating a configuration of a forensic system according to a first embodiment of the present invention.
  • the figure showing the flow of the forensic system service of this invention The figure showing the processing flow of the forensic system of this invention
  • the figure which shows the translation relevant information of the forensic system of this invention The figure which shows the example of a screen displayed on the display part of the forensic system of this invention (the 1)
  • the figure which shows the example of a screen (the 2) displayed on the display part of the forensic system of this invention
  • FIG. 1 is a functional block diagram showing a configuration of a forensic system 1 in an embodiment of the present invention.
  • a forensic system 1 shown in FIG. 1 is configured by a plurality of document files in the forensic system 1 that acquires digital information recorded in a plurality of computers (PCs 2 to 5) or a server 10 and analyzes the acquired digital information.
  • Digital information acquisition unit 20 for acquiring digital information including digital document information to be processed and user information regarding users who use a plurality of computers or servers, and recording the digital information acquired by the digital information acquisition unit 20
  • the recording unit 30, the display unit 40 that displays the recorded digital information and the user information, the specification of at least one or more document files included in the digital document information is accepted, and the document file that has received the designation is A designation accepting unit 90 for accepting designation of whether to translate into a language;
  • the translation processing unit 140 that translates the document file that has received the specification into the language that has received the specification, and the common document file that shows the same contents as the specified document file are extracted from the digital document information recorded in the recording unit 30
  • a common document file extracting unit 130, a translation related information generating unit 110 that generates translation related
  • the control unit 160 includes a display control unit 45, a data format conversion unit 60, a language determination unit 80, a management unit 85, a search unit 100, a translation related information generation unit 110, a common document file extraction unit 130, a translation processing unit 140, and a CPU 150. It is to be prepared.
  • the forensic system 1 includes a data input device such as a touch panel when the keyboard, mouse, or display unit 40 has a touch panel function.
  • the data input device includes an incidental information setting unit 70 and a designation receiving unit 90.
  • the designation receiving unit 90 and the incidental information setting unit 70 may be different data input devices or the same data input device.
  • the output unit 120 is a recording device or a printer that records data on an electronic medium.
  • the configuration of the forensic system 1 as shown in FIG. 1 is realized by calculating and executing a forensic program read into an auxiliary storage device (not shown) by the CPU 150 on the computer.
  • the forensic program is stored in a storage medium such as a CD-ROM or distributed via a network such as the Internet and installed in a computer.
  • the forensic system 1 will be described as a personal computer.
  • the forensic system 1 may be a server, a portable terminal type computer, or the like, and will be described in a second embodiment to be described later. It may be a network type system configuration.
  • the digital information acquisition unit 20 acquires digital information recorded in the PCs 2 to 5 or the server 10 used by the user.
  • the digital information acquisition unit 20 copies the digital information recorded in the PCs 2 to 5 or the server 10 to a certain electronic medium (for example, USB, CD, DVD, etc.), and digitally transmits the digital information to the forensic system via the electronic medium. Have the information copied.
  • a certain electronic medium for example, USB, CD, DVD, etc.
  • the digital information acquisition unit 20 converts the digital information recorded in the PCs 2 to 5 or the server 10 into data via the network. By receiving the transmission, the digital information is collected and collected.
  • Translation-related information is data that allows the forensic system to determine whether or not a document file has been translated. Specifically, this indicates that the computer can determine which document file is translated into which language.
  • the translation related information generation unit 110 generates information indicating a translated document file among a plurality of document files.
  • the translation-related information may be recorded in the accompanying information of the document file whose designation is accepted by the designation receiving unit 90.
  • the translation related information generation unit 110 may record translation related information in the incidental information of the common document file, for example.
  • the translation related information generation unit 110 may record translation related information in the recording unit 30, for example.
  • the digital information acquisition unit 20 acquires second digital information including second digital document information and second user information recorded in a server (referred to as a second server) different from the server 10. It may be a thing.
  • the forensic system 1 may be able to use not only the digital information of the server 10 but also the second digital document information recorded in the second server.
  • the forensic system 1 determines, for example, the translation related information, information indicating that the common document file and the translated document file have the same translation content, and the output priority of the document file in the output unit 120.
  • the output unit 120 controls whether or not each document file can be output based on the information indicating the priority order.
  • the information indicating the same translation content is data for the forensic system 1 to determine that each document file indicates the same content.
  • the same translation content may be indicated by a hash name or other numerical number, symbol or character recorded in the control unit.
  • the information indicating the priority order is information indicating that the output unit 30 of the forensic system 1 is a priority order to be output from a predetermined document file.
  • the priority order is expressed by a numerical number, a symbol, or a character. May be shown.
  • the forensic system 1 further includes a data format discrimination unit 60 that discriminates the data format of the document file of the digital document information recorded by the recording unit 30, and the output unit 120 detects the document file discriminated by the data format discrimination unit 60. Among them, when the translated document file and the common document file have different data formats, control is performed so that the common document file having a different data format is output.
  • the display unit 40 displays the display content according to an instruction from the display control unit 45 configured in the control unit 160.
  • the server 10 is a single server or more, and may be constituted by a plurality of servers, for example, and may be at least any two or more of a mail server, a file server, and a document management server.
  • the forensic system 1 may be a system that can be used simultaneously by a plurality of operators.
  • the language in which the operator is described for each document file is recorded as incidental information (for example, language tag information). Further, the language determination unit 80 determines which language is described for each document file, and displays information indicating which language is described for each document file as additional information (for example, it may be recorded as language Tag information) or may be recorded as translation related information as shown in FIG.
  • the language determination unit 80 generates, for example, a plurality of partial character strings from a character string in a predetermined language according to a predetermined rule, searches a character string of a document file stored in the recording unit 30, and generates the generated partial characters. By searching for a character string that matches the string and evaluating the language to which each partial character string may belong and the possibility, the language to which the character string of the predetermined document file belongs is determined.
  • the output unit 120 outputs digital document information as some kind of production, and may be a printer or a recording device that records digital information on an electronic medium, for example.
  • the output unit 120 may be the display unit 40 and may display and output digital document information.
  • the translation processing unit 140 is a database in which translation resources classified into a plurality of classification items in advance for each field are registered, and entries, translations, parts of speech, meanings, and the like are registered as translation resources.
  • the classification items have a hierarchical format such that the root, the upper hierarchy, the middle hierarchy, and the lower hierarchy correspond to, for example, a large item, a middle item, and a small item.
  • the translation processing unit 140 selects a translation resource related to the classification item associated with the digital document information, and based on the selected translation resource, converts the original document and operation information in the input data into at least one other language. It is what you translate into.
  • the forensic system 1 selects and collects digital information related to the lawsuit and collects the digital information recorded in the PCs 2 to 5 and the server 10 for preparatory work for submission of evidence to the court (Preservation). To do.
  • the forensic system 1 registers the collected and collected digital information in a database such as the recording unit 30, analyzes the digital information (Analysis), and subdivides it by keyword search and filter processing.
  • the recording unit 30 may be included in the computer of the forensic system 1 or may be stored in a server as a separate body from the computer.
  • the forensic system 1 reviews the subdivided digital information on the display unit 40, and the operator sets the incidental information for the digital document information via the incidental information setting unit 70.
  • the control unit 160 has a maintenance collection analysis function, a process analysis search function, a Review function, and a Production function.
  • the maintenance collection / analysis function of the control unit 160 is a case management function (function of the management unit 85) so that data management can be performed for each case, and analysis of the file type and possession amount for each target person / evidence.
  • the file analysis function (function of the search unit 100) that enables the analysis of the search target file
  • the file type selection extraction function (function of the control unit 160) that enables selection of the file type to be searched and browsed
  • the selected It has a maintenance collection function (control unit 160) that enables maintenance collection of files as separate files.
  • the processing analysis search function of the control unit 160 has a full-text search function and a frequently used phrase top extraction function (function of the search unit 100).
  • This full-text search function supports multiple languages, enables AND OR NOT search by Boolean operation, enables search using parentheses by Grouping operation, highlights the searched phrase, and functions to make Meta Data Have
  • the full text search function has an advanced search function, and can perform neighborhood search, regular expression search, and the like.
  • the frequently used phrase top extracting function extracts a frequently used phrase within a certain digital document information.
  • the Review function of the control unit 160 is set with, for example, an E-Mail Family browsing processing function (a function of the search unit 100) that can browse E-Mail Family collectively, or one evaluation or a plurality of evaluations as supplementary information.
  • a free design Tag function (function of the search unit 100) that can be searched on the basis of the evaluation
  • a free design BookMark function (function of the search unit 100) that enables the search of a MarkMark that has been set with a hierarchical BookMark, and an arbitrary number of characters
  • a free input comment field (function of the management unit 85) provided with an inputable comment field, a simultaneous browsing function for the above-mentioned plurality of operators to confirm digital document information, a case for each viewer account when reviewing Each access right, administrator authority, view-only authority, etc.
  • Access right control function (function of the management unit 85), in-document write Memo function (function of the management unit 85) that enables writing in the document without changing the body of the digital document information, number of review completed documents (%)
  • Case Management function (function of the management unit 85) that enables display
  • E-mail Threading function (function of the management unit 85) that displays E-mail threads (reply, transfer, etc.)
  • mail exchange E-mail analysis display function for graphical display (function of statistical data creation unit 130)
  • similar document display function for automatically classifying and displaying similar documents such as Draft and old version (function of management unit 85), difference of similar documents Similar document difference highlight function that highlights only the part (function of the management unit 85), search hit Having a search to display only the peripheral portion of the phrase Hit partial longitudinal sentence display function (function of the search unit 100).
  • the Production function of the control unit 160 is a function for outputting various XML files such as actual files, meta information, and tag information, CSV output, image output, and various load file outputs (by the instruction from the management unit 85, the output unit 120 And a Batch Printing function (a function that can be output by the output unit 120 according to an instruction from the management unit 85) for printing a plurality of selected digital document information.
  • the forensic system 1 performs production so that the output unit 120 generates data on the electronic medium.
  • the data is recorded on the electronic medium in a predetermined format by a recording device that records the data on the electronic medium.
  • the digital information acquisition unit 20 uses, for example, digital document information formed of a document file in a general format such as Word format, PDF format, PPT format, Excel format, and usage related to a user who uses the PC 2 to 5 or the server 10. Digital information including person information is acquired (ST1).
  • digital document information formed of a document file in a general format such as Word format, PDF format, PPT format, Excel format, and usage related to a user who uses the PC 2 to 5 or the server 10.
  • Digital information including person information is acquired (ST1).
  • access history information may be included as digital information.
  • the access history information indicates that the users using the PCs 2 to 5 have accessed the digital document information recorded in the server 10 via the network. For example, it indicates a user ID indicating who the user is and which digital document information the user has accessed at which time.
  • PCs 2 to 5 used by the user are described as four as an example, but are not limited to four, and may be a plurality of PCs.
  • the digital information acquisition unit 20 records the acquired digital information in the recording unit 30 (ST2).
  • Display unit 40 displays digital information (digital document information and user information, access history information, user information, title of digital information, etc.) via control unit 160 (ST3).
  • the display unit 40 may display all user information, digital document information, and access history information in response to an instruction from the display control unit 45, or display at least one of these pieces of information.
  • at least one of the attribute information of the information (for example, the user's name, the file name of the document file, the person who accessed it, the time, the document file, etc.) may be displayed.
  • the operator logs in the forensic system 1 while confirming the screen of the display unit 40, and further creates Case (unit of the highest data group in the database of the forensic system 1). Further, the operator sets and manages a connection destination of a server or the like corresponding to the recording unit 30 in which the digital information is recorded while checking the screen of the display unit 40 (in this case, there are a plurality of recording units 30). . Further, the operator sets and manages the Customian (data holding target person) while checking the screen of the display unit 40.
  • the operator While checking the screen of the display unit 40, the operator creates and manages the status (the middle data group unit of the database of the forensic system 1) composed of the digital document information collected and maintained. Next, while confirming the screen of the display unit 40, the operator relates the Customian to the collected information and the collected target.
  • the operator may preset which Customian is related to the lawsuit for a plurality of Targets composed of digital document information acquired from the PCs 2 to 5 or the server. .
  • the operator selects plural or single targets to be analyzed while confirming the screen of the display unit 40.
  • control unit 160 can acquire the digital information recorded in the recording unit 30 and analyze the digital information by various functional units.
  • the forensic system 1 includes statistical data represented by the data capacity for each data format of the digital document information recorded in the recording unit 30 or statistical data represented by the data capacity for each data format of the digital document information retrieved by the retrieval unit 100.
  • a control unit 160 for creating data is provided.
  • the operator selects a predetermined Path (directory) from the target target and the target corresponding to the target target, and the analysis result of the number of files and the capacity of each customian.
  • a list can be displayed.
  • the operator can display a list of the analysis results of the number of files and the capacity for each Path as a chart while checking the screen of the display unit 40.
  • the operator can display a list of analysis results of the number of files and the capacity for each Path (directory) while checking the screen of the display unit 40.
  • the operator can display a list of the analysis results of the number of files and the capacity for each File Type as a chart while checking the screen of the display unit 40.
  • the operator can display a list of the analysis results of the number of files and the capacity for each file type while checking the screen of the display unit 40.
  • the operator can display a list of the analysis results of the number of files and the capacity for each file type as a chart while checking the screen of the display unit 40. Further, the operator can display a list of the analysis results of the number of files and the capacity for each file type as a chart, while checking the screen of the display unit 40 only for files that can be searched for text.
  • This text searchable file is performed by the control unit 160 on a file from which text information can be extracted from digital document information recorded in the recording unit 30 in advance.
  • the designation receiving unit 90 receives designation of at least one or more document files included in the digital document information, and to which language the designated document file is translated. Is accepted (ST4).
  • the operator selects a document file to be translated and a term to be translated into while confirming the screen of the display unit 40.
  • the translation processing unit 140 automatically translates the document file that has been designated by the designation accepting unit 90 into the language that has been designated by the designation accepting unit 90 (ST5). Note that the person in charge of translation may translate the document file that has been designated by the designation receiving unit 90 into a language that has been designated by the designation receiving unit 90.
  • the common document file extraction unit 130 extracts from the digital document information recorded in the recording unit 30 a common document file that shows the same contents as the document file specified by the specification receiving unit 90 (ST6).
  • the common document file extraction unit 130 can extract the common document file by using the hash table of the document file recorded in the recording unit 30. Specifically, the common document file extraction unit 130 records the ID name of the document file, the file name, the path name, the hash name, and the language name indicating the language content of the document file as shown in FIG. To do. Then, if the hash name is the same, the common document file extraction unit 130 can extract a document file having the same hash name as a common document file other than the document file for which the designation is accepted.
  • the common document file extraction unit 130 includes an algorithm for determining the identity of the text data contents of the document file, and the common document file that is the same document file as the document file for which the designation has been received is determined by the algorithm. It may be extracted.
  • the translation related information generation unit 110 generates translation related information indicating that the common document file extraction unit 130 has translated the extracted common document file by using the translated content of the translated document file ( ST7).
  • the translation related information generation unit 110 may generate translation related information when the operator sets the translation related information via the designation receiving unit 90.
  • the output unit 120 outputs a document file related to the lawsuit based on the translation related information (ST7).
  • the translation related information includes information indicating that the common document file and the document file specified by the specification receiving unit 90 have the same translation content, and information indicating the output priority of the document file in the output unit 120.
  • the output unit 120 is provided and controls whether or not a document file can be output based on information indicating priority.
  • the fact that the hash names shown in FIG. 4 are the same is information indicating the same translation content, and the smaller the number of ID numbers, the higher the priority output.
  • Information indicating the priority order is information indicating the same translation content, and the smaller the number of ID numbers, the higher the priority output.
  • the forensic system 1 further includes a data format determination unit 60 that determines the data format of the document file of the digital document information recorded by the recording unit 120, and the output unit 120 includes the document file determined by the data format determination unit 60.
  • the data format determination unit 60 determines the data format of the document file of the recorded document information, specifically, the data format of a word document, an Excel document, a power point document, a PDF document, or the like.
  • the translated document file is a word document and a common document file showing the same contents as the word document meets the PowerPoint document
  • the word document and the PowerPoint document have different data formats. Is also output.
  • control unit 160 reviews (confirms) the digital document information for which the access right is set for the Customian
  • the access right is set wider as the person has a higher position in the organization.
  • a large amount of documents that are not related to lawsuits that the person has never viewed will actually be collected, and the documents related to the person from the enormous amount of information collected. Analyzing just to find out is labor intensive and expensive.
  • control unit 160 may extract only the digital document information accessed by the specific person based on the access history information regarding the specified specific person (Custodian).
  • the access history information indicates that a user using one of a plurality of computers has accessed the digital document information recorded on the server. For example, it includes a user ID indicating who the user is and access information indicating which digital document information the user has accessed at which time.
  • the ID information when using the computer or server and access history information are recorded in the storage unit 30 in advance, so that the correspondence between the ID of the user and the document file accessed by the user is obtained. Thus, extraction becomes possible.
  • the digital document information extraction unit 60 can extract document files related to a plurality of Customians.
  • Target when the operator has set the relationship between Target and Customian, it is determined that it is related as Customian in units of Target, and the designation receiving unit 90 is actually included in the selected Target. Only the document file accessed by the Custodian specified by is extracted.
  • the operator can perform a search while confirming the screen of the display unit 40 by the function of the search unit 100. Further, the operator can perform simple browsing while confirming the screen of the display unit 40 by the function of the display control unit 45. The operator can grasp the contents of the digital document information by this simple browsing.
  • the operator instructs the CPU 150 to output a document file related to the lawsuit from the output unit 120 based on the incidental information.
  • CPU150 which received the instruction
  • the forensic system 1 includes an incidental information setting unit 70 for setting incidental information indicating whether each of the extracted document files of digital document information is related to a lawsuit via the display unit 40.
  • the output unit 120 may output a document file related to the lawsuit based on the translation-related information and the incidental information.
  • the output unit 120 outputs only the document file designated by the designation receiving unit 90 (having the same hash name and the highest priority) and assigned with “Hot”.
  • the output unit 120 may output a document file designated by the designation receiving unit 90 (having the same hash name and having the highest priority) and assigned as “Hot” and “Responsive”.
  • FIG. 5 is a screen example displayed on the display unit 40.
  • the control unit 160 creates a directory for each meta information based on the determination result of the language determination unit 80, and outputs a target document file under the directory.
  • Tag is selected in Output Language
  • a directory is created for each selected tag, and the target document file is output under the directory.
  • FIG. 6 is a screen example displayed on the display unit 40. If there is a translated document file in the document file, the document file expressed in each language can be switched and displayed by clicking the symbol T. If a plurality of document files exist in the same data format, the document file with the designated ID number can be switched and displayed by clicking the symbol S.
  • the forensic system 1 is composed of a plurality of forensic system servers, wherein the digital information extraction unit and the search unit are separated into the forensic system server, and further separated.
  • the forensic system may be connected via a network.
  • the forensic system 1 may have a network type system configuration as shown in FIG.
  • the forensic system 1 of the second embodiment is the same as each processing unit of the forensic system 1 described in the first embodiment, but the respective processing units are distributed and arranged in a plurality of servers.
  • the servers are connected via a network. For this reason, the servers may be distributed in the country, or the servers may be distributed in any country.
  • the display unit 40 is provided in each of the client PCs 170 to 172.
  • the display response can be improved by collecting the data transmission / reception in a virtual client server in a batch between the plurality of client PCs and the UI server.
  • the forensic system 1 may be configured by a computer as in the first embodiment, or the forensic system 1 may be configured by a network type system as in the second embodiment.
  • the incidental information setting unit 70 and the designation receiving unit 90 correspond to data input devices provided in the respective client PCs 170 to 172.
  • the specification of at least one or more document files included in the digital document information is received, the specification of which language the specified document file is to be translated is received, and the document file that has received the specification is
  • a common document file having the same contents as the designated document file is extracted from the digital document information recorded in the recording unit after being translated into the language in which the designation is accepted, and the extracted common document file is translated. Analyzing all translated document files by generating translation-related information indicating that the document file was translated by using the translation contents of the document file, and outputting the document file related to the lawsuit based on the translation-related information Instead, it is possible to output the minimum necessary translated document file.
  • the forensic system 1 can reduce the redundant translation of digital document information with the same content.
  • the forensic system 1 includes the language determination unit 80 and the search unit 100, and the supplementary information setting unit 70 detects the retrieved document.
  • the digital document information recorded on the server is only accessed by a specific person and may be related to litigation by a predetermined search. It becomes possible to narrow down the population of information.
  • a document file converted by the control unit 160 is processed in the same process as the converted data format before being output by the output unit 120.
  • the wasteful process of data format conversion can be reduced, and the risk of quality deterioration of digital document information can be eliminated.
  • the forensic system 1 since the statistical data can be visualized and provided to the operator when the control unit 160 is provided, it is possible to quickly grasp the effort required for preparing the lawsuit.
  • the digital information acquisition unit 20 further acquires only digital document information and folder information created after the date and time previously measured by the control unit 160, and the acquired digital document
  • the digital information acquisition unit 20 When acquiring only user information and access history information related to information and folder information, it is possible to collect differences in digital information and reduce the load of acquiring the same digital information from a server or the like every time. .
  • the control unit 160 and the search unit 100 are each separated into servers for forensic systems, the calculation process of each processing unit is distributed by each server, so that the entire system The processing capacity can be improved.
  • the incidental information setting unit 70 can set incidental information by different operators. It is possible to perform preparatory work at an early stage by determining whether such a determination is made by multiple persons.
  • the forensic system 1 of the first embodiment and the second embodiment can be configured by combining the entire system or each processing unit.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

 翻訳済に関するデジタル文書情報を提出するに際し、訴訟の証拠資料作成のための作業負荷の軽減を図ることができる。 デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する。

Description

フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
本発明はフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムに関し、特に訴訟に関連するデジタル文書情報を出力するためのフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムに関するものである。
 従来、フォレンジックという不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする手段や技術が提案されている。
 特に、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告及び被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負うため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
 一方、ITの急速な発達と普及に伴い、今日のビジネスの世界ではほとんどの情報がコンピュータで作成されているため、同一企業内であっても多くのデジタル情報が氾濫しており、特に、多国籍企業においては、複数の言語で記載されたデジタル文書情報が多く氾濫している。
 そのため、訴訟で標準となる言語で記載されていないデジタル文書情報の翻訳費用が膨大なコストとなるにもかかわらず、法廷への証拠資料提出のための準備作業を行う過程において、複数の文書ファイルが同一内容を記すものであっても、それぞれ独立に翻訳してしまうという重複翻訳の無駄が生じていた。
 近年、フォレンジックシステムに関する技術が、特許文献1及び特許文献2に提案されている。特許文献1には、証拠性保持の証明が可能な方法で不正行為者の特定が効率的に実施でき、その特定の信頼性が人的要素に影響され難いフォレンジックシステムについて開示されている。
 また、特許文献2には、個人情報の漏洩による損害に対して保険金を支払う情報損害保険システムであって、犯人の特定及び法的措置という事後対応を行うフォレンジックを損害補填の内容とするフォレンジックシステムについて開示されている。
特開2006-178521公報 特開2007-148731公報
 しかしながら、例えば、特許文献1及び特許文献2のようなフォレンジックシステムでは、デジタル文書情報に含まれる、訴訟と関連性のある文書ファイルを収集する際に、その全ての文書ファイルを収集することが可能であるが、結果として膨大な情報を収集することとなってしまい、同一の内容を記した文書ファイルを重複して収集してしまうことになる。
 そのため、その重複した文書ファイルの中から、翻訳に必要な文書ファイルだけを探し出すために分析及び確認することは、多大な労力と費用がかかるという問題があった。
 そこで、本発明は、上記事情に鑑み、全ての文書ファイルを分析するのではなく最低限翻訳を要する文書ファイルを出力するフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムを提供することを目的とするものである。
 本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得するデジタル情報取得部と、デジタル情報取得部により取得されたデジタル情報を記録する記録部と、記録されたデジタル情報と前記利用者情報とを表示する表示部と、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定を受け付けた文書ファイルをいずれの言語に翻訳するかの指定を受け付ける指定受付部と、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳する翻訳処理部と、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する共通文書ファイル抽出部と、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する翻訳関連情報生成部と翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する出力部とを備えたことを特徴とするものである。また、上記文書ファイルの出力は、プリンタによる紙出力、デジタル文書ファイル作成装置による電子媒体を記録媒体に保存することによる出力、表示部に表示される出力のいずれかであればよい。
 「デジタル情報取得部」は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得するものであって、取得する方法としては、例えば、上記コンピュータまたはサーバに記録されたデジタル情報をある電子媒体にコピーし、当該電子媒体を介してフォレンジックシステムにコピーさせるか、もしくは上記コンピュータまたはサーバと、フォレンジックシステムをネットワーク回線を介して接続し、コンピュータまたはサーバに記録されたデジタル情報をフォレンジックシステムにデジタル情報をコピーする等により、デジタル情報の保全収集を行う。
 「翻訳関連情報生成部」は、複数の文書ファイルのうち、翻訳された文書ファイルであることを示す情報を生成するものである。例えば、翻訳関連情報を、指定を受け付けた文書ファイルの付帯情報に記録するものであってもよい。
 「翻訳関連情報」は、文書ファイルが翻訳されたものであるか否かをフォレンジックシステムが判別できるようにするデータである。具体的には、どの文書ファイルをどの言語により翻訳されたものであるかをコンピュータが判別できるように示すものである。
 また、「翻訳関連情報生成部」は、例えば、翻訳関連情報を、共通文書ファイルの付帯情報に記録するものであってもよい。
 また、「翻訳関連情報生成部」は、例えば、翻訳関連情報を、記録部に記録するものであってもよい。
 「サーバ」は、単数以上のサーバであって、例えば、複数のサーバにより構成されるものであってもよい。また、例えば、「サーバ」は、メールサーバ、ファイルサーバ、文書管理サーバのいずれか2つ以上であることを特徴とするものであってもよい。
 「表示部」は、デジタル情報を表示できるディスプレイ等をいう。
 「出力部」は、デジタル文書情報を何らかのプロダクションまたは電子データとして出力するものであって、例えば、プリンタ、デジタル文書ファイル作成装置、表示部のいずれかであればよい。
 本発明のフォレンジックシステムは、翻訳関連情報は、更に、共通文書ファイルと、翻訳された文書ファイルとが同一の翻訳内容であることを示す情報と、出力部における、文書ファイルの出力優先順位を示す情報とを備えたものであって、出力部は、優先順位を示す情報に基づいて、文書ファイル毎の出力の可否を制御するものであってもよい。
 「同一の翻訳内容であることを示す情報」とは、それぞれの文書ファイルが同一の内容を示すものであることをフォレンジックシステムが判別するためのデータである。具体的には、制御部に記録されたハッシュ名やその他の数値番号、記号または文字等によりその同一の翻訳内容であることを示してもよい。
 「優先順位を示す情報」とは、フォレンジックシステムの出力部が、所定の文書ファイルの出力すべき優先順位であることを示す情報であって、例えば、数値番号、記号または文字等によりその優先順位を示してもよい。
 本発明のフォレンジックシステムは、更に、記録部により記録されたデジタル文書情報の文書ファイルのデータ形式を判別するデータ形式判別部を備え、出力部は、データ形式判別部により判別された文書ファイルのうち、翻訳された文書ファイルと、共通文書ファイルが異なるデータ形式である際に、データ形式が異なる共通文書ファイルは出力するように制御するものであってもよい。例えば、データ形式判別部が、記録された文書情報の文書ファイルのデータ形式を判別する、具体的にはワード文書、エクセル文書、パワーポイント文書、PDF文書等のデータ形式を判別する。そして、例えば、翻訳された文書ファイルがワード文書であり、該ワード文書と同一の内容を示す共通文書ファイルがパワーポイント文書等であった際、ワード文書とパワーポイント文書は異なるデータ形式であるので、パワーポイント文書も出力するように制御する。
 本発明のフォレンジックシステムは、更に、表示部を介して、抽出されたデジタル文書情報の文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定する付帯情報設定部を備えるものであって、出力部は、翻訳関連情報及び付帯情報に基づき、訴訟に関連する文書ファイルを出力するものであってもよい。
 本発明のフォレンジックシステムは、更に、記録されたデジタル文書情報から、複数の文書ファイル毎にいずれの言語で記述されたものであるかを判定する言語判定部を備えるものであって、記録部は、言語判定部により判定された言語の結果に応じて、複数の文書ファイルを言語毎のフォルダに整理して記録するようにするものであってもよい。
 本発明のフォレンジック方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、複数の文書ファイルにより構成されるデジタル文書情報と、前記複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得し、デジタル情報取得部により取得されたデジタル情報を記録し、記録されたデジタル情報と利用者情報とを表示し、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力することを特徴とする。また、上記文書ファイルの出力は、プリンタによる紙出力、デジタル文書ファイル作成装置による電子媒体を記録媒体に保存することによる出力、表示部に表示される出力のいずれかであればよい。
 本発明のフォレンジックプログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、コンピュータに、複数の文書ファイルにより構成されるデジタル文書情報と、前記複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得する機能と、デジタル情報取得部により取得されたデジタル情報を記録する機能と、記録されたデジタル情報と利用者情報とを表示する機能と、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付ける機能と、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳する機能と、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する機能と、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する機能と、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する機能とを実現させるものである。また、上記文書ファイルの出力は、プリンタによる紙出力、デジタル文書ファイル作成装置による電子媒体を記録媒体に保存することによる出力、表示部に表示される出力のいずれかであればよい。
 なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
 本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、前記指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力することにより、全ての文書ファイルを分析するのではなく、最低限翻訳を要する文書ファイルを出力することを可能とする。
本発明の第1の実施形態におけるフォレンジックシステムの構成を表す機能ブロック図 本発明のフォレンジックシステムサービスの流れを表す図 本発明のフォレンジックシステムの処理フローを表す図 本発明のフォレンジックシステムの翻訳関連情報を示す図 本発明のフォレンジックシステムの表示部に表示される画面例(その1)を示す図 本発明のフォレンジックシステムの表示部に表示される画面例(その2)を示す図 本発明の第2の実施形態におけるフォレンジックシステムの構成を表す機能ブロック図
 以下、本発明の実施の形態について、図面を参照しながら説明する。
 図1は、本発明の実施形態におけるフォレンジックシステム1の構成を表す機能ブロック図である。
 図1に示すフォレンジックシステム1は、複数のコンピュータ(PC2~5)またはサーバ10に記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステム1において、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得するデジタル情報取得部20と、デジタル情報取得部20により取得されたデジタル情報を記録する記録部30と、記録されたデジタル情報と前記利用者情報とを表示する表示部40と、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定を受け付けた文書ファイルをいずれの言語に翻訳するかの指定を受け付ける指定受付部90と、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳する翻訳処理部140と、記録部30に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する共通文書ファイル抽出部130と、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する翻訳関連情報生成部110と翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する出力部120とを備えたものである。
 制御部160は、表示制御部45、データ形式変換部60、言語判定部80、管理部85、検索部100、翻訳関連情報生成部110、共通文書ファイル抽出部130、翻訳処理部140、CPU150を備えるものである。
 また、フォレンジックシステム1は、キーボード、マウスまたは表示部40がタッチパネル機能を備えるときにはタッチパネルなどのデータ入力装置を備え、このデータ入力装置として、付帯情報設定部70及び指定受付部90がある。
 指定受付部90及び付帯情報設定部70は、それぞれ別のデータ入力装置であってもよいし、同一のデータ入力装置であってもよい。
 また、出力部120は、電子媒体にデータを記録する記録装置またはプリンタ等である。
 なお、図1に示すようなフォレンジックシステム1の構成は、補助記憶装置(不図示)に読み込まれたフォレンジックプログラムをコンピュータ上でCPU150により計算・実行することにより実現される。このとき、このフォレンジックプログラムは、CD-ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものである。
 以下、本発明の第1の実施形態では、フォレンジックシステム1はパーソナルコンピュータとして説明するが、フォレンジックシステム1は、サーバ、携帯端末型のコンピュータ機等であってもよいし、後述する第2の実施形態のようなネットワーク型のシステム構成であってもよい。
 デジタル情報取得部20は、利用者が利用していたPC2~5またはサーバ10に記録されたデジタル情報を取得するものである。
 例えば、デジタル情報取得部20は、PC2~5またはサーバ10に記録されたデジタル情報をある電子媒体(例えば、USB、CD、DVD等)にコピーし、当該電子媒体を介してフォレンジックシステムに、デジタル情報をコピーさせる。
 また、PC2~5またはサーバ10と、フォレンジックシステム1とをネットワーク回線を介して接続した場合、デジタル情報取得部20は、PC2~5またはサーバ10に記録されたデジタル情報を、ネットワークを介してデータ送信を受け付けることにより、デジタル情報の保全収集を行う。
 翻訳関連情報は、文書ファイルが翻訳されたものであるか否かをフォレンジックシステムが判別できるようにするデータである。具体的には、どの文書ファイルをどの言語により翻訳されたものであるかをコンピュータが判別できるように示すものである。
 翻訳関連情報生成部110は、複数の文書ファイルのうち、翻訳された文書ファイルであることを示す情報を生成するものである。例えば、翻訳関連情報を、指定受付部90により、指定を受け付けた文書ファイルの付帯情報に記録するものであってもよい。
 また、翻訳関連情報生成部110は、例えば、翻訳関連情報を、共通文書ファイルの付帯情報に記録するものであってもよい。
 また、翻訳関連情報生成部110は、例えば、翻訳関連情報を、記録部30に記録するものであってもよい。
 また、デジタル情報取得部20は、サーバ10とは異なるサーバ(第二のサーバという)に記録された、第二のデジタル文書情報及び第二の利用者情報を含む第二のデジタル情報を取得するものであってもよい。
 この場合、フォレンジックシステム1は、サーバ10のデジタル情報のみならず、第二のサーバに記録された第二のデジタル文書情報を用いることができるものであってもよい。
 フォレンジックシステム1は、例えば、翻訳関連情報が、更に、共通文書ファイルと、翻訳された文書ファイルとが同一の翻訳内容であることを示す情報と、出力部120における、文書ファイルの出力優先順位を示す情報とを備えたものであって、出力部120は、優先順位を示す情報に基づいて、文書ファイル毎の出力の可否を制御するものである。
 同一の翻訳内容であることを示す情報は、それぞれの文書ファイルが同一の内容を示すものであることをフォレンジックシステム1が判別するためのデータである。具体的には、制御部に記録されたハッシュ名やその他の数値番号、記号または文字等によりその同一の翻訳内容であることを示してもよい。
 優先順位を示す情報は、フォレンジックシステム1の出力部30が、所定の文書ファイルの出力すべき優先順位であることを示す情報であって、例えば、数値番号、記号または文字等によりその優先順位を示してもよい。
 フォレンジックシステム1は、更に、記録部30により記録されたデジタル文書情報の文書ファイルのデータ形式を判別するデータ形式判別部60を備え、出力部120は、データ形式判別部60により判別された文書ファイルのうち、翻訳された文書ファイルと、共通文書ファイルが異なるデータ形式である際に、データ形式が異なる共通文書ファイルは出力するように制御する。
 表示部40は、制御部160に構成される表示制御部45の指示により表示内容を表示する。
 デジタル情報取得部20は、n回目(n=2,3,・・・)にデジタル情報を取得する際、制御部160により計時された日時を表わす情報に基づいて、n-1回目にデジタル情報を取得した時点より以後に、PC2~5またはサーバ10に作成された、デジタル文書情報及びフォルダ情報のみを取得するものであってもよい。
 サーバ10は、単数以上のサーバであって、例えば、複数のサーバにより構成されるものであってもよく、少なくともメールサーバ、ファイルサーバ、文書管理サーバのいずれか2つ以上であってもよい。
 フォレンジックシステム1は、更に複数のオペレータが同時に利用できるものであってもよい。
 そして、複数のオペレータがデジタル文書情報を同時に確認しながら、複数の付帯情報設定部70を介して、付帯情報を設定することができる。
 具体的には、オペレータが文書ファイル毎に、どの言語で記述されたものであるかを付帯情報(例えば、言語Tag情報)として記録する。また、言語判定部80が、文書ファイル毎に、どの言語で記述されたものであるかを判別し、どの言語で記述されたものであるかを示す情報を、文書ファイル毎に、付帯情報(例えば、言語Tag情報)として記録してもよいし、後述する図4に示すような翻訳関連情報として記録してもよい。
 言語判定部80は、例えば、所定の言語の文字列から、所定の規則に従って複数の部分文字列を生成し、記録部30に記憶された文書ファイルの文字列を検索し、生成された部分文字列と一致する文字列を探し出し、各部分文字列が属する可能性がある言語とその可能性を評価することにより、所定の文書ファイルの文字列が属する言語を決定する。
 出力部120は、デジタル文書情報を何らかのプロダクションとして出力するものであって、例えば、プリンタまたは、電子媒体にデジタル情報を記録する記録装置であればよい。また、出力部120は、表示部40であってもよく、デジタル文書情報を表示出力するものであってもよい。
 翻訳処理部140は、分野毎に予め複数の分類項目に分類された翻訳資源が登録されたデータベースであって、見出語、訳語、品詞、意味等が翻訳資源として登録されている。翻訳処理部140は、例えば、ルート、上位階層、中位階層及び下位階層が各々に、例えば、大項目、中項目及び小項目に相当するように、分類項目が階層形式を有している。翻訳処理部140は、デジタル文書情報に関連付けられた分類項目に関連する翻訳資源を選択し、選択された翻訳資源に基づいて、入力データ中の原文書や操作情報等を少なくとも1つの他の言語に翻訳するものである。
 以下、図2のサービスフローを参照しながら、フォレンジックシステム1の法廷への証拠資料提出のための準備作業を行う手順を簡単に説明する。
 まず、フォレンジックという不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする必要がある。
 特に、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告及び被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負うため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
 そこで、フォレンジックシステム1は、訴訟に関連するデジタル情報を選別し、法廷への証拠資料提出のための準備作業を行うべく、PC2~5やサーバ10に記録されたデジタル情報を保全収集(Preservation)する。
 その後、フォレンジックシステム1は、保全収集したデジタル情報を記録部30のようなデータベースに登録し、デジタル情報を分析(Analysis)し、キーワード検索やフィルタ処理により、細分化する。
 この記録部30は、フォレンジックシステム1のコンピュータに含める構成であってもよいし、コンピュータとは別体としてサーバに保存してもよい。
 そして、フォレンジックシステム1は、細分化したデジタル情報を表示部40上でレビュー(Review)し、オペレータが付帯情報設定部70を介して、デジタル文書情報に対して付帯情報を設定する。
 制御部160は、保全収集分析機能、処理分析検索機能、Review機能、Production機能を有する。
 例えば、制御部160の保全収集分析機能は、案件毎のデータ管理が可能となるようにCase管理機能(管理部85の機能)、対象者・証拠物毎にファイルの種類や所持量の分析ができ、検索対象ファイルの分析も可能とするファイル分析機能(検索部100の機能)、検索・閲覧対象となるファイルタイプの選択可能とするファイル種類選択抽出機能(制御部160の機能)、選択したファイルを別ファイルとして保全収集が可能となる保全収集機能(制御部160)を有する。また、制御部160の処理分析検索機能は、全文検索機能と、頻出語句トップ抽出機能を有する(検索部100の機能)。
 この全文検索機能は、多言語に対応し、Boolean演算により、AND OR NOT検索を可能とし、Grouping演算によりカッコを用いた検索を可能とし、検索した語句のハイライト表示機能、Meta Dataにする機能を有する。また、全文検索機能は、高度検索機能を有し、近傍検索や正規表現検索等を可能とする。頻出語句トップ抽出機能は、あるデジタル文書情報内部における頻出語句を抽出するものである。
 また、制御部160のReview機能は、例えば、E-mail Familyをまとめて閲覧できるE-mail Family閲覧処理機能(検索部100の機能)や、1つの評価または複数の評価を付帯情報として設定されたものを当該評価に基づいて検索できる自由設計Tag機能(検索部100の機能)、階層構造BookMark設定されたもののBookMark検索を可能とする自由設計BookMark機能(検索部100の機能)、任意の文字数入力可能なコメント欄を設けた自由入力コメント欄(管理部85の機能)、上述した複数のオペレータがデジタル文書情報を確認するための同時閲覧機能、Reviewする際、閲覧者のアカウント毎に、Case毎のアクセス権、管理者権限、閲覧のみ権限等の設定可能にしたアクセス権制御機能(管理部85の機能)、デジタル文書情報の本文に変更を加えずに文書内に書き込みを可能とする文書内書き込みMemo機能(管理部85の機能)、Review完了文書数(%)表示を可能とするCase Management機能(管理部85の機能)、E-mailスレッド(返信、転送等)を一括表示するE-mail Threading機能(管理部85の機能)、メールのやり取りをグラフィカルに表示するメール分析表示機能(統計データ作成部130の機能)、Draft、古いVersion等の類似文書を自動分類して表示する類似文書表示機能(管理部85の機能)、類似文書の差の部分のみをハイライト表示する類似文書差分ハイライト機能(管理部85の機能)、検索Hitした語句の周辺部分のみを表示する検索Hit部分前後文章表示機能(検索部100の機能)を有する。
 また、制御部160のProduction機能は、実ファイル、メタ情報、Tag情報等のXML出力、CSV出力、画像出力、各種ロードファイル出力の各種出力機能(管理部85からの指示により、出力部120により出力できる機能)、選択された複数のデジタル文書情報の印刷するBatch Printing機能(管理部85からの指示により、出力部120により出力できる機能)を有する。
 最後に、フォレンジックシステム1は、出力部120により電子媒体にデータを生成するようにプロダクション(Production)する。例えば、電子媒体にデータを記録する記録装置により、所定のフォーマットのデータ形式により、電子媒体に記録する。
 次に、図3のフローチャートを参照しながら、フォレンジックシステム1の法廷への証拠資料提出のための準備作業を行う手順を詳細に説明する。
 まず、デジタル情報取得部20は、例えば、Word形式、PDF形式、PPT形式、Excel形式のような汎用フォーマットによる文書ファイルからなるデジタル文書情報と、PC2~5またはサーバ10を利用する利用者に関する利用者情報とを含むデジタル情報を取得する(ST1)。
 なお、デジタル情報として、アクセス履歴情報を含めてもよい。このアクセス履歴情報は、図1に示すように、サーバ10に記録されたデジタル文書情報に対して、PC2~5を利用した利用者が、ネットワークを介してアクセスしたことを示すものであって、例えば、利用者はだれであるかを示す利用者IDと、どの時期にその利用者がどのデジタル文書情報にアクセスしたかを示すものである。
 なお、利用者が利用するPC2~5は、例として4台で説明しているが、4台に限るものではなく、複数のPCであればよい。
 次に、デジタル情報取得部20は、取得したデジタル情報を記録部30に記録する(ST2)。
 表示部40は、制御部160を介して、デジタル情報(デジタル文書情報及び利用者情報、更に、アクセス履歴情報、利用者情報、デジタル情報のタイトル等)を表示する(ST3)。
 例えば、表示部40は、表示制御部45からの指示に応じて、利用者情報、デジタル文書情報、アクセス履歴情報を全て表示してもよいし、それらの情報のうち少なくとも一つを表示してもよいし、それらの情報の属性情報(例えば、利用者の氏名、文書ファイルのファイル名、アクセスした者、時期、文書ファイル等)のうち少なくとも一つを表示してもよい。
 また、フォレンジックシステム1の表示部40を介した、その他の機能について説明する。例えば、オペレータは、表示部40の画面を確認しながら、フォレンジックシステム1にログインし、更にCase(フォレンジックシステム1のデータベースの最上位のデータグループの単位)を作成する。また、オペレータは、表示部40の画面を確認しながら、デジタル情報が記録された記録部30に相当するサーバ等の接続先の設定と管理を行う(この場合、記録部30は複数存在する)。また、オペレータは、表示部40の画面を確認しながら、Custodian(データ保持対象者)の設定をし、管理をする。オペレータは、表示部40の画面を確認しながら、情報収集及び保全収集されたデジタル文書情報から構成されるTarget(フォレンジックシステム1のデータベースの中位のデータグループ単位)の作成と状態管理をする。次に、オペレータは、表示部40の画面を確認しながら、情報収集及び保全収集したTargetにCustodianを関係付ける。
 例えば、オペレータは、表示部40を確認しながら、PC2~5またはサーバから取得したデジタル文書情報から構成される複数のTargetに対して、どのCustodianが訴訟に関連したかを予め設定してもよい。
 最後に、オペレータは、表示部40の画面を確認しながら、分析対象のTargetを複数または単数選択する。
 このように、制御部160は、記録部30に記録されたデジタル情報を取得し、各種機能部により、デジタル情報を分析することができる。
 フォレンジックシステム1は、記録部30に記録されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データ、または検索部100により検索されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データを作成する制御部160を備えている。
 例えば、オペレータは、表示部40の画面を確認しながら、分析対象のCustodianとそのCustodianと対応づいたTarget内から所定のPath(ディレクトリ)を選択し、Custodian毎のファイル数及び容量の分析結果のリストを表示できる。また、オペレータは、表示部40の画面を確認しながら、Path毎のファイル数及び容量の分析結果のリストをチャートとして表示できる。更に、オペレータは、表示部40の画面を確認しながら、Path(ディレクトリ)毎のファイル数及び容量の分析結果をリスト表示できる。また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数及び容量の分析結果のリストをチャートとして表示できる。また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数及び容量の分析結果のリストを表示できる。
 また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数及び容量の分析結果のリストをチャートとして表示できる。更に、オペレータは、表示部40の画面を確認しながら、テキスト検索可能なファイルのみをFile Type毎のファイル数及び容量の分析結果のリストをチャートとして表示できる。このテキスト検索可能なファイルは、予め制御部160により、記録部30に記録されたデジタル文書情報からテキスト情報が抽出可能なものに対して行われる。
 次に、図4に示すフローチャートの説明に戻ると、指定受付部90が、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付ける(ST4)。
 オペレータは、表示部40の画面を確認しながら、翻訳したい文書ファイルと、どの用語に翻訳したいかを選択する。
 翻訳処理部140は、指定受付部90により指定を受け付けた文書ファイルを、指定受付部90により指定を受け付けた言語に自動翻訳を行う(ST5)。なお、翻訳担当者のものが、指定受付部90により指定を受け付けた文書ファイルを、指定受付部90により指定を受け付けた言語に翻訳を行ってもよい。
 共通文書ファイル抽出部130は、記録部30に記録されたデジタル文書情報から、指定受付部90により指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する(ST6)。
 共通文書ファイル抽出部130は、記録部30に記録された文書ファイルのハッシュテーブルを利用することにより、共通文書ファイルを抽出することができる。具体的には、共通文書ファイル抽出部130は、図4に示すような、文書ファイルのID名、ファイル名と、パス名、ハッシュ名、文書ファイルの言語内容を示す言語名を対応づけて記録する。そして、共通文書ファイル抽出部130は、ハッシュ名が同一であれば、指定を受け付けた文書ファイル以外で、ハッシュ名が同一な文書ファイルを共通文書ファイルとして抽出することができる。
 また、共通文書ファイル抽出部130は、文書ファイルのテキストデータの内容の同一性を判別するアルゴリズムを備えており、そのアルゴリズムにより、指定を受け付けた文書ファイルと同一の文書ファイルである共通文書ファイルを抽出してもよい。
 翻訳関連情報生成部110は、共通文書ファイル抽出部130により、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する(ST7)。なお、翻訳関連情報生成部110は、オペレータが指定受付部90を介して、翻訳関連情報を設定することにより、翻訳関連情報を生成するものであってもよい。
 出力部120は、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する(ST7)。翻訳関連情報は、共通文書ファイルと、指定受付部90により指定された文書ファイルとが同一の翻訳内容であることを示す情報と、出力部120における、文書ファイルの出力優先順位を示す情報とを備えたものであって出力部120は、優先順位を示す情報に基づいて、文書ファイルの出力の可否を制御する。
 具体的には、図4に示すハッシュ名が同一であることは、同一の翻訳内容であることを示す情報であって、ID番号の番号数が小さいほど、優先して出力するものとして、出力優先順位を示す情報となる。
 また、フォレンジックシステム1は、記録部120により記録されたデジタル文書情報の文書ファイルのデータ形式を判別するデータ形式判別部60を備え、出力部120は、データ形式判別部60により判別された文書ファイルのうち、指定された文書ファイルと、共通文書ファイルが異なるデータ形式である際に、データ形式が異なる共通文書ファイルは出力するように制御する。具体的には、ハッシュ名が同一であっても、異なるデータ形式であれば、出力部120は、共通文書ファイルは出力するように制御する。例えば、データ形式判別部60が、記録された文書情報の文書ファイルのデータ形式を判別する、具体的にはワード文書、エクセル文書、パワーポイント文書、PDF文書等のデータ形式を判別する。そして、例えば、翻訳された文書ファイルがワード文書であり、該ワード文書と同一の内容を示す共通文書ファイルがパワーポイント文書で会った際、ワード文書とパワーポイント文書は異なるデータ形式であるので、パワーポイント文書も出力するように制御する。
 なお、制御部160は、Custodianにアクセス権が設定されているデジタル文書情報をレビュー(確認)するに際し、その者が組織内での地位が上位であるほどアクセス権は、広く設定されていることが多いため、実際にはその者が閲覧したこともない訴訟とは関連性の無い書類が大量に収集されてしまうことになり、その収集した膨大な情報の中から、その者に関係する書類だけを探し出すために分析することは、多大な労力と費用がかかる。
 そこで、制御部160は、指定された特定の者(Custodian)に関するアクセス履歴情報に基づいて、特定の者がアクセスしたデジタル文書情報のみを抽出してもよい。
 例えば、オペレータが、Custodianである甲氏を指定した場合、選択されたTarget内のデジタル文書情報内で、甲氏がアクセスした文書ファイルのみを抽出する。アクセス履歴情報を用いることにより、甲氏が実際にアクセス(例えば、閲覧、編集、作成)した文書ファイルの抽出が可能となる。アクセス履歴情報は、複数のコンピュータのいずれかを利用した利用者が、サーバに記録されたデジタル文書情報に対して、アクセスしたことを示すものである。例えば、利用者はだれであるかを示す利用者IDと、どの時期にその利用者がどのデジタル文書情報にアクセスしたかを示すアクセス情報とを含むものである。予め、甲氏のコンピュータやサーバ利用時のID情報と、アクセス履歴情報とが記憶部30に記録されていることにより、甲氏のIDと甲氏がアクセスした文書ファイルとの対応関係を取ることにより、抽出が可能となる。
 なお、甲氏を例に説明したが、甲氏に加え、乙氏など複数のCustodianを指定した場合、デジタル文書情報抽出部60は、複数のCustodianに関連する文書ファイルを抽出することができる。
 また、上述したように、オペレータが、TargetとCustodianとの関係を設定している場合、あくまでTarget単位でCustodianとして、関連していると判断し、選択されたTarget内で実際に指定受付部90により指定されたCustodianがアクセスした文書ファイルのみを抽出する。
 更に、オペレータは、検索部100の機能により、表示部40の画面を確認しながら、検索を行うことができる。また、オペレータは、表示制御部45の機能により、表示部40の画面を確認しながら、簡易閲覧を行うことができる。オペレータは、この簡易閲覧により、デジタル文書情報の内容を把握できる。
 また、フォレンジックシステム1を利用するに際し、訴訟に関連する情報であれば、「Hot」、関連する可能性があるものは「Responsive」とし、関連する可能性がないものは「Not Responsive」として、ファイル毎にタグ(付帯情報)が付与される。具体的には、Batchリストのファイル行をクリックするとタグの入力が可能となる。
 そして、オペレータは、出力部120から、付帯情報に基づき、訴訟に関連する文書ファイルを出力するように、CPU150に対して、指示する。オペレータから指示を受け付けたCPU150は、出力部120が出力するように制御する。例えば、Hotと付与された文書ファイルのみを出力しもよいし、Hot及びResponsiveと付与された文書ファイルを出力してもよい。
 また、フォレンジックシステム1は、表示部40を介して、抽出されたデジタル文書情報の文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定する付帯情報設定部70を備えるものであって、出力部120は、翻訳関連情報及び付帯情報に基づき、訴訟に関連する文書ファイルを出力するものであってもよい。
 具体的には、出力部120は、指定受付部90に指定された文書ファイル(ハッシュ名同一で優先順位が最も高いもの)であって、Hotと付与された文書ファイルのみを出力する。もしくは、出力部120は、指定受付部90に指定された文書ファイル(ハッシュ名同一で優先順位が最も高いもの)であって、Hot及びResponsiveと付与された文書ファイルを出力してもよい。
 また、図5は、表示部40に表示される画面例である。具体的には、制御部160は、Output LanguageでAutoを選択した場合、言語判定部80の判定結果をメタ情報毎にディレクトリを作成し、その配下の対象の文書ファイルを出力する。一方、Output LanguageでTagを選択した場合、選択したタグ毎にディレクトリを作成し、その配下に対象の文書ファイルを出力する。1つの文書ファイルに複数言語が存在する場合、それぞれの言語フォルダに同じ文書ファイルを配置する。タグが紐づいていないドキュメントは出力対象にしない。
 また、図6は、表示部40に表示される画面例である。文書ファイルに翻訳した文書ファイルが存在する場合、符号Tをクリックすることにより、それぞれの言語により表現された文書ファイルを切り替え表示することができる。また、同データ形式に複数の文書ファイルが存在した場合、符号Sをクリックすることにより、指定されたID番号の文書ファイルを切り替え表示することができる。
 また、フォレンジックシステム1は、複数のフォレンジックシステム用サーバにより構成されるものであって、デジタル情報抽出部と、検索部とがそれぞれ、フォレンジックシステム用サーバに分離されたものであり、更に、分離されたフォレンジックシステムがネットワークを介して、接続されたものであってもよい。
 また、第2の実施形態について、図7を参照しながら、説明する。
 フォレンジックシステム1は、図7に示すような、ネットワーク型のシステム構成であってもよい。第2の実施形態のフォレンジックシステム1は、第1の実施形態で説明したフォレンジックシステム1の各処理部と同様であるが、それぞれの処理部は複数のサーバに分散して配置されている。サーバ間は、ネットワークを介して接続されている。このため、国内にサーバを分散して配置してもよいし、国内外を問わずサーバを分散して配置してもよい。
 なお、表示部40は、それぞれのクライアントPC170~172に備わっている。そして、複数のクライアントPCとUIサーバとの間に、仮想クライアントサーバに一括してデータ送受信をまとめることにより、表示レスポンスの向上を可能とする。
 このようにして、第1の実施形態のようにコンピュータによりフォレンジックシステム1を構成してもよいし、第2の実施形態のようにネットワーク型のシステムによりフォレンジックシステム1を構成してもよい。
 また、フォレンジックシステム1によれば、付帯情報設定部70及び指定受付部90は、それぞれのクライアントPC170~172に備わるデータ入力装置が該当する。
 フォレンジックシステム1によれば、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、前記指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力することにより、全ての翻訳済み文書ファイルを分析するのではなく、最低限必要な翻訳済み文書ファイルを出力することを可能とする。これにより、同一内容のデジタル文書情報の重複翻訳の軽減を図ることができる
 フォレンジックシステム1によれば、言語判定部80と、検索部100とを備え、付帯情報設定部70が、検索された文書ファイルに対して、付帯情報を設定するに際し、サーバに記録されたデジタル文書情報のうち、特定の者がアクセスしたもののみであって、所定の検索により、訴訟に関連する可能性のあるデジタル文書情報の母集団を絞り込むことが可能になる。
 フォレンジックシステム1によれば、制御部160により変換された文書ファイルが、出力部120により出力される前までの間、変換されたデータ形式と同一のまま処理されるに際し、処理フローの中途でのデータフォーマット変換の無駄な工程を削減でき、デジタル文書情報の品質劣化のリスクを排除することができる。
 フォレンジックシステム1によれば、更に、制御部160を備えた際に、統計データをオペレータに可視化して提供できるため、訴訟準備に要する労力を早期に把握することができる。
 フォレンジックシステム1によれば、更に、デジタル情報取得部20は、以前に制御部160により計時された日時より以後に作成された、デジタル文書情報及びフォルダ情報のみを取得し、該取得されたデジタル文書情報及びフォルダ情報に関連する利用者情報及びアクセス履歴情報のみを取得するに際し、デジタル情報の差分収集を可能とし、毎回サーバ等から同一のデジタル情報を重複して取得する負荷を軽減することができる。
 フォレンジックシステム1によれば、制御部160と、検索部100とがそれぞれ、フォレンジックシステム用サーバに分離されたものであるに際し、それぞれのサーバにより各処理部の計算工程を分散することにより、システム全体の処理能力を向上させることができる。
 フォレンジックシステム1によれば、複数のオペレータが同時に利用できるものである際には、付帯情報設定部70は、異なるオペレータにより付帯情報を設定することができることにより、法廷への証拠資料であるか否かの判定を複数人で判定することで早期に準備作業を行うことを可能にする。
 以上、本発明の実施形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることは明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
 また第1の実施形態と第2の実施形態のフォレンジックシステム1は、それぞれのシステム全体または、それぞれの各処理部を組み合わせて構成することができる。
1   フォレンジックシステム
2~5 PC
10  サーバ
20  デジタル情報取得部
30  記録部
40  表示部
45  表示制御部
60  データ形式判別部
70  付帯情報設定部
80  言語判定部
90  指定受付部
100 検索部
110 翻訳関連情報生成部
120 出力部
130 共通文書ファイル抽出部
140 翻訳処理部
150 CPU
160 制御部
170~172 クライアントPC

Claims (11)

  1.  複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、
     複数の文書ファイルにより構成されるデジタル文書情報と、前記複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得するデジタル情報取得部と、
     前記デジタル情報取得部により取得されたデジタル情報を記録する記録部と、
     前記記録されたデジタル情報と前記利用者情報とを表示する表示部と、
     前記デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、該指定を受け付けた文書ファイルをいずれの言語に翻訳するかの指定を受け付ける指定受付部と、
     前記指定を受け付けた文書ファイルを、前記指定を受け付けた言語に翻訳する翻訳処理部と、
     前記記録部に記録されたデジタル文書情報から、前記指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する共通文書ファイル抽出部と、
     前記抽出された共通文書ファイルが、前記翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する翻訳関連情報生成部と、
     前記翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する出力部とを備えたことを特徴とするフォレンジックシステム。
  2.  前記翻訳関連情報生成部は、更に、前記翻訳関連情報を、前記指定を受け付けた文書ファイルの付帯情報に記録するものであることを特徴とする請求項1記載のフォレンジックシステム。
  3.  前記翻訳関連情報生成部は、前記翻訳関連情報を、前記共通文書ファイルの付帯情報に記録するものであることを特徴とする請求項1記載のフォレンジックシステム。
  4.  前記翻訳関連情報生成部は、前記翻訳関連情報を、前記記録部に記録するものであることを特徴とする請求項1記載のフォレンジックシステム。
  5.  前記翻訳関連情報は、更に、前記共通文書ファイルと、前記指定された文書ファイルとが同一の翻訳内容であることを示す情報と、前記出力部における、前記文書ファイルの出力優先順位を示す情報とを備えたものであって、
     前記出力部は、前記優先順位を示す情報に基づいて、文書ファイルの出力の可否を制御することを特徴とする請求項1から4いずれか1項記載のフォレンジックシステム。
  6.  前記フォレンジックシステムは、更に、
     前記記録部により記録されたデジタル文書情報の文書ファイルのデータ形式を判別するデータ形式判別部を備え、
     前記出力部は、前記データ形式判別部により判別された文書ファイルのうち、前記指定された文書ファイルと、前記共通文書ファイルが異なるデータ形式である際に、前記データ形式が異なる共通文書ファイルは出力するように制御することを特徴とする請求項5記載のフォレンジックシステム。
  7.  前記出力部は、プリンタ、デジタル文書ファイル作成装置、前記表示部のいずれかであることを特徴とする請求項1から6いずれか1項記載のフォレンジックシステム。
  8.  前記フォレンジックシステムは、更に、
     前記抽出されたデジタル文書情報の文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定する付帯情報設定部を備えるものであって、
     前記出力部は、前記翻訳関連情報及び付帯情報に基づき、訴訟に関連する文書ファイルを出力するものであることを特徴とする請求項1から7いずれか1項記載のフォレンジックシステム。
  9.  前記フォレンジックシステムは、更に、
     前記記録されたデジタル文書情報から、前記複数の文書ファイル毎にいずれの言語で記述されたものであるかを判定する言語判定部を備えるものであって、
     前記記録部は、前記言語判定部により判定された言語の結果に応じて、前記複数の文書ファイルを言語毎のフォルダに整理して記録するようにすることを特徴とする請求項1から8いずれか1項記載のフォレンジックシステム。
  10.  複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、
     複数の文書ファイルにより構成されるデジタル文書情報と、前記複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得し、
     前記デジタル情報取得部により取得されたデジタル情報を記録し、
     前記記録されたデジタル情報と前記利用者情報とを表示し、
     前記デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、該指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、
     前記指定を受け付けた文書ファイルを、前記指定を受け付けた言語に翻訳し、
     前記記録部に記録されたデジタル文書情報から、前記指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、
     前記抽出された共通文書ファイルが、前記翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、
     前記翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力することを特徴とするフォレンジック方法。
  11.  複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、
     コンピュータに、
     複数の文書ファイルにより構成されるデジタル文書情報と、前記複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得する機能と、
     前記デジタル情報取得部により取得されたデジタル情報を記録する機能と、
     前記記録されたデジタル情報と前記利用者情報とを表示する機能と、
     前記デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、該指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付ける機能と、
     前記指定を受け付けた文書ファイルを、前記指定を受け付けた言語に翻訳する機能と、
     前記記録部に記録されたデジタル文書情報から、前記指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出する機能と、
     前記抽出された共通文書ファイルが、前記翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成する機能と、
     前記翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力する機能とを実現させるためのフォレンジックプログラム。
PCT/JP2011/067055 2010-07-28 2011-07-27 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム WO2012014918A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201180005035.9A CN102959578B (zh) 2010-07-28 2011-07-27 取证系统、取证方法及取证程序
US13/514,981 US8549037B2 (en) 2010-07-28 2011-07-27 Forensic system, forensic method, and forensic program
KR1020127014182A KR20130095171A (ko) 2010-07-28 2011-07-27 포렌식 시스템과 포렌식 방법 및 포렌식 프로그램
EP11812507.9A EP2506208A4 (en) 2010-07-28 2011-07-27 JUDICIAL SYSTEM, METHOD AND PROGRAM

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-169173 2010-07-28
JP2010169173A JP4995950B2 (ja) 2010-07-28 2010-07-28 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Publications (1)

Publication Number Publication Date
WO2012014918A1 true WO2012014918A1 (ja) 2012-02-02

Family

ID=45530122

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/067055 WO2012014918A1 (ja) 2010-07-28 2011-07-27 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Country Status (6)

Country Link
US (1) US8549037B2 (ja)
EP (1) EP2506208A4 (ja)
JP (1) JP4995950B2 (ja)
KR (1) KR20130095171A (ja)
CN (1) CN102959578B (ja)
WO (1) WO2012014918A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015033606A1 (ja) * 2013-09-05 2015-03-12 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
US20150293932A1 (en) * 2013-06-21 2015-10-15 Ubic, Inc Digital information analysis system, digital information analysis method, and digital information analysis program
CN110825872A (zh) * 2019-09-11 2020-02-21 成都数之联科技有限公司 一种提取和分类诉讼请求信息的方法及系统

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5567049B2 (ja) 2012-02-29 2014-08-06 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
JP5530476B2 (ja) 2012-03-30 2014-06-25 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
JP5526209B2 (ja) 2012-10-09 2014-06-18 株式会社Ubic フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5823942B2 (ja) 2012-10-09 2015-11-25 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP5823943B2 (ja) 2012-10-10 2015-11-25 株式会社Ubic フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5827208B2 (ja) 2012-11-30 2015-12-02 株式会社Ubic 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP5827206B2 (ja) 2012-11-30 2015-12-02 株式会社Ubic 文書管理システムおよび文書管理方法並びに文書管理プログラム
EP2962212A4 (en) * 2013-02-28 2016-09-21 Hewlett Packard Entpr Dev Lp RESOURCES REFERENCE CLASSIFICATION
JP2014191800A (ja) * 2013-03-28 2014-10-06 Ubic:Kk 文書管理システムおよび文書管理方法並びに文書管理プログラム
US10438634B2 (en) * 2013-04-05 2019-10-08 Avid Technology, Inc. Content-based unique material identifiers
JP5603468B1 (ja) 2013-07-31 2014-10-08 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
TW201508525A (zh) 2013-08-29 2015-03-01 Ubic Inc 文件分類系統、文件分類方法及文件分類程式
US10453071B2 (en) 2013-09-09 2019-10-22 UnitedLex Corp. Interactive case management system
JP5592552B1 (ja) 2013-10-25 2014-09-17 株式会社Ubic 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム
JP5723067B1 (ja) * 2014-02-04 2015-05-27 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム
US9977825B2 (en) 2014-02-04 2018-05-22 Ubic, Inc. Document analysis system, document analysis method, and document analysis program
US10354062B2 (en) * 2014-07-24 2019-07-16 Schatz Forensic Pty Ltd System and method for simultaneous forensic, acquisition, examination and analysis of a computer readable medium at wire speed

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644325A (ja) * 1991-10-24 1994-02-18 American Teleph & Telegr Co <Att> A−v知覚可能情報セグメントのアクセス方法
JPH11272671A (ja) * 1998-03-20 1999-10-08 Toshiba Corp 機械翻訳装置及び機械翻訳方法
JP2003288365A (ja) * 2002-03-28 2003-10-10 Toshiba Corp 付加情報管理方法及び付加情報管理システム
JP2003345798A (ja) * 2002-05-23 2003-12-05 Nippon Telegr & Teleph Corp <Ntt> 翻訳制御方法,翻訳制御装置およびその処理プログラム
JP2006178521A (ja) 2004-12-20 2006-07-06 Ubic:Kk デジタル・フォレンジックの方法及びフォレンジックitセキュリティシステム
JP2007148731A (ja) 2005-11-28 2007-06-14 Ubic:Kk フォレンジック事後対応付き情報損害保険システム
JP2009276862A (ja) * 2008-05-13 2009-11-26 Ricoh Co Ltd 文書管理システム、サーバ装置、クライアント装置、文書管理方法、プログラムおよび記録媒体
JP2009294896A (ja) * 2008-06-05 2009-12-17 Hitachi Ltd データ保管装置、記憶装置に記憶されたデータの開示プログラム、及びデータの開示方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493706B1 (en) * 1999-10-26 2002-12-10 Cisco Technology, Inc. Arrangement for enhancing weighted element searches in dynamically balanced trees
US7043489B1 (en) * 2001-02-23 2006-05-09 Kelley Hubert C Litigation-related document repository
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
US20040006594A1 (en) 2001-11-27 2004-01-08 Ftf Technologies Inc. Data access control techniques using roles and permissions
EP1485825A4 (en) * 2002-02-04 2008-03-19 Cataphora Inc DETAILED EXPLORATION TECHNIQUE OF SOCIOLOGICAL DATA AND CORRESPONDING APPARATUS
US8214391B2 (en) 2002-05-08 2012-07-03 International Business Machines Corporation Knowledge-based data mining system
CA2495586C (en) * 2002-08-15 2014-05-06 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Health Method and system for aggregating and disseminating time-sensitive information
US20050086179A1 (en) 2003-06-04 2005-04-21 Mehmet Badisse D. System and method for managing cases
US20060129445A1 (en) 2004-12-09 2006-06-15 Mccallum Rodney H Jr System and method for scheduling a litigation event
US7814102B2 (en) 2005-12-07 2010-10-12 Lexisnexis, A Division Of Reed Elsevier Inc. Method and system for linking documents with multiple topics to related documents
JP4100637B2 (ja) * 2005-12-08 2008-06-11 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法
JP2007172221A (ja) 2005-12-21 2007-07-05 Nippon Telegraph & Telephone East Corp 検疫システム、検疫装置、検疫方法、及び、コンピュータプログラム
US8391614B2 (en) * 2006-01-25 2013-03-05 Equivio Ltd. Determining near duplicate “noisy” data objects
JP2007334412A (ja) 2006-06-12 2007-12-27 Fuji Xerox Co Ltd 検索プログラムおよび検索装置
EP2044533A2 (en) * 2006-07-17 2009-04-08 Total Recall Aps A computer-implemented translation tool
US7716196B2 (en) * 2006-08-07 2010-05-11 Cisco Technology, Inc. Method for culling a litigation discovery file set
JP2008097484A (ja) 2006-10-16 2008-04-24 Hitachi Ltd ログ管理システムおよびフォレンジック調査方法
US7853611B2 (en) 2007-02-26 2010-12-14 International Business Machines Corporation System and method for deriving a hierarchical event based database having action triggers based on inferred probabilities
JP2009015659A (ja) 2007-07-05 2009-01-22 Sky Kk ファイル監視装置およびファイル監視プログラム
US7890493B2 (en) * 2007-07-20 2011-02-15 Google Inc. Translating a search query into multiple languages
US20090150168A1 (en) 2007-12-07 2009-06-11 Sap Ag Litigation document management
US8112406B2 (en) 2007-12-21 2012-02-07 International Business Machines Corporation Method and apparatus for electronic data discovery
JP5102650B2 (ja) 2008-02-26 2012-12-19 株式会社リコー 情報検索システム、情報検索方法、情報検索プログラム及び記録媒体
US8171041B2 (en) * 2008-05-15 2012-05-01 Enpulz, L.L.C. Support for international search terms
US8214364B2 (en) 2008-05-21 2012-07-03 International Business Machines Corporation Modeling user access to computer resources
US8572376B2 (en) 2009-03-27 2013-10-29 Bank Of America Corporation Decryption of electronic communication in an electronic discovery enterprise system
US8412628B2 (en) 2009-04-27 2013-04-02 Asset Acceptance, Llc System and method for legal document authoring and electronic court filing
CA2718579C (en) * 2009-10-22 2017-10-03 National Research Council Of Canada Text categorization based on co-classification learning from multilingual corpora
US8428227B2 (en) * 2010-05-18 2013-04-23 Certicall, Llc Certified communications system and method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644325A (ja) * 1991-10-24 1994-02-18 American Teleph & Telegr Co <Att> A−v知覚可能情報セグメントのアクセス方法
JPH11272671A (ja) * 1998-03-20 1999-10-08 Toshiba Corp 機械翻訳装置及び機械翻訳方法
JP2003288365A (ja) * 2002-03-28 2003-10-10 Toshiba Corp 付加情報管理方法及び付加情報管理システム
JP2003345798A (ja) * 2002-05-23 2003-12-05 Nippon Telegr & Teleph Corp <Ntt> 翻訳制御方法,翻訳制御装置およびその処理プログラム
JP2006178521A (ja) 2004-12-20 2006-07-06 Ubic:Kk デジタル・フォレンジックの方法及びフォレンジックitセキュリティシステム
JP2007148731A (ja) 2005-11-28 2007-06-14 Ubic:Kk フォレンジック事後対応付き情報損害保険システム
JP2009276862A (ja) * 2008-05-13 2009-11-26 Ricoh Co Ltd 文書管理システム、サーバ装置、クライアント装置、文書管理方法、プログラムおよび記録媒体
JP2009294896A (ja) * 2008-06-05 2009-12-17 Hitachi Ltd データ保管装置、記憶装置に記憶されたデータの開示プログラム、及びデータの開示方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2506208A4

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150293932A1 (en) * 2013-06-21 2015-10-15 Ubic, Inc Digital information analysis system, digital information analysis method, and digital information analysis program
US9690797B2 (en) * 2013-06-21 2017-06-27 Ubic, Inc Digital information analysis system, digital information analysis method, and digital information analysis program
WO2015033606A1 (ja) * 2013-09-05 2015-03-12 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
CN110825872A (zh) * 2019-09-11 2020-02-21 成都数之联科技有限公司 一种提取和分类诉讼请求信息的方法及系统
CN110825872B (zh) * 2019-09-11 2023-05-23 成都数之联科技股份有限公司 一种提取和分类诉讼请求信息的方法及系统

Also Published As

Publication number Publication date
CN102959578A (zh) 2013-03-06
JP4995950B2 (ja) 2012-08-08
US8549037B2 (en) 2013-10-01
US20120290578A1 (en) 2012-11-15
JP2012032859A (ja) 2012-02-16
EP2506208A4 (en) 2013-09-11
KR20130095171A (ko) 2013-08-27
EP2506208A1 (en) 2012-10-03
CN102959578B (zh) 2014-05-28

Similar Documents

Publication Publication Date Title
JP4995950B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4898934B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4868191B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US20210342404A1 (en) System and method for indexing electronic discovery data
JP2008515061A (ja) 概念的メタデータおよび文脈的メタデータの検索エンジンを用いたウェブ上におけるデータ要素の検索方法
JP5669785B2 (ja) フォレンジックシステム
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
JP2014109852A (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP5690301B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2011086156A (ja) 漏洩情報追跡システムおよび漏洩情報追跡プログラム
JP5087169B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP5834130B2 (ja) フォレンジックシステム
JP4980488B2 (ja) フォレンジックシステム及びフォレンジックプログラム
TWI769835B (zh) 資訊檢索系統
Meuschke Hybrid Plagiarism Detection System
JP5573051B2 (ja) ブックマークサービス提供装置、およびブックマークサービス提供装置の動作方法
Browne Indexing of free, web-based electronic resources
TW201437951A (zh) 文件管理系統、文件管理方法及文件管理程式

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180005035.9

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11812507

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20127014182

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 13514981

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2011812507

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE