WO2021241602A1 - 情報検索システム - Google Patents

情報検索システム Download PDF

Info

Publication number
WO2021241602A1
WO2021241602A1 PCT/JP2021/019885 JP2021019885W WO2021241602A1 WO 2021241602 A1 WO2021241602 A1 WO 2021241602A1 JP 2021019885 W JP2021019885 W JP 2021019885W WO 2021241602 A1 WO2021241602 A1 WO 2021241602A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
database
search
keyword
local
Prior art date
Application number
PCT/JP2021/019885
Other languages
English (en)
French (fr)
Inventor
祐輔 竹村
晃 假谷
智 桑原
彩香 衛藤
伸幸 諸岡
大輝 重岡
秀同 竹中
大悟 伊藤
Original Assignee
Jfeスチール株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jfeスチール株式会社 filed Critical Jfeスチール株式会社
Priority to EP21813981.4A priority Critical patent/EP4145302A4/en
Priority to US17/999,850 priority patent/US20230222145A1/en
Priority to MX2022014969A priority patent/MX2022014969A/es
Priority to KR1020227041836A priority patent/KR20230003182A/ko
Priority to CN202180036732.4A priority patent/CN115668175A/zh
Priority to JP2021559003A priority patent/JP7004122B1/ja
Priority to BR112022023835A priority patent/BR112022023835A2/pt
Publication of WO2021241602A1 publication Critical patent/WO2021241602A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24561Intermediate data storage techniques for performance improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Definitions

  • This disclosure relates to an information retrieval system.
  • the data in the maintenance work in the manufacturing industry etc. was the data (paper data) described on the paper.
  • paper data In an information retrieval system in maintenance work, it is important to digitize these paper data, store them together, and create a database. Advances in search technology have improved the accuracy of search results, and the digitization of paper data and the creation of databases are being promoted.
  • failures, defects, causes, countermeasures, etc. of equipment, etc. are stored in a database each time, and when similar failures or defects occur, they are referred to as past cases to avoid defects and recover. We are trying to shorten the time. Information such as work standards and manuals is also stored in the database. Therefore, the information stored in the database becomes enormous.
  • Patent Document 1 discloses an information retrieval system capable of obtaining good search results even by a person who has little knowledge and experience and has difficulty in inputting an appropriate keyword.
  • This disclosure was made in view of such issues, and an object of the present disclosure is to provide an information retrieval system capable of high-speed retrieval even when it is commonly used in a plurality of districts.
  • the information retrieval system of this disclosure is A database that stores multiple information that can be searched by text, and The question text reception department that accepts question texts in natural language format, An input search keyword extractor that extracts input search keywords from the question text, A search execution unit that executes a search process for the database using the input search keyword and a keyword related to the input search keyword.
  • a local management device that stores district materials in a local database, Character extraction processing and file format conversion according to the size of the material are executed for the material stored in the local database, stored in the temporary storage unit as the storage material, and the storage material is stored in the database. It is equipped with an information management device for output.
  • FIG. 1 is a block diagram showing a schematic configuration of an information retrieval system according to an embodiment of the present disclosure.
  • FIG. 2 is a diagram showing an example of keywords stored in the common keyword dictionary.
  • FIG. 3 is a diagram showing an example of information type determination keywords stored in the information type determination dictionary.
  • FIG. 4 is a flowchart for explaining the operation of the information management device of the information retrieval system of the embodiment.
  • FIG. 5 is a diagram illustrating the hierarchical structure of the database.
  • FIG. 6 is a diagram illustrating the displayed search results.
  • FIG. 7 is a flowchart for explaining the operation of information retrieval of the information retrieval system of the embodiment.
  • FIG. 8 is a functional block diagram of the computer.
  • FIG. 9 is a diagram illustrating a database for language search processing.
  • equipment maintenance work information in the manufacturing industry is stored in a database as text-searchable information, and when a failure or malfunction occurs, the searcher inputs the situation as a sentence, so that the information can be referred from the database.
  • An information retrieval system capable of searching for information on past cases will be described as an example.
  • the searcher can perform recovery work based on the searched information.
  • the equipment maintenance work information includes, for example, information such as work standards and manuals in which failures, malfunctions, causes, countermeasures, etc. of equipment and the like are described.
  • cases related to failures or malfunctions may be referred to as "failure cases".
  • the search use of the information retrieval system of the present disclosure is not limited to the above.
  • the information retrieval system of the present disclosure can be used in addition to supporting equipment maintenance work such as equipment failure recovery work.
  • the information retrieval system of the present disclosure can be applied to, for example, in the business field, to search past cases for the contents of inquiries from customers and to present the optimum answer.
  • the information retrieval system of the present disclosure can be applied to, for example, in the field of product design, searching documents such as manufacturing results and technical papers similar to inquiries from customers and proposing an optimum product design.
  • FIG. 1 is a block diagram showing a schematic configuration of an information retrieval system according to an embodiment of the present disclosure.
  • the information retrieval system includes an information retrieval device 10 that executes search processing, a database 12 that stores a plurality of text-searchable information, an input device 14 such as a keyboard and a mouse connected to the information retrieval device 10, and information retrieval. It is configured to include a display device 16 such as a display connected to the device 10. Further, the information retrieval system includes a searcher-side terminal 20, a local management apparatus 100, and an information management apparatus 110 connected to the information retrieval device 10 via the network 18.
  • the network 18 is a communication network such as a LAN (Local Area Network). However, the network 18 is not limited to this, and the network 18 is a communication network in which a general public line such as WAN (Wide Area Network) or VPN (Virtual Private Network) is partially interposed in addition to a public communication network such as the Internet. It's okay.
  • the information retrieval device 10, the searcher-side terminal 20, the local management device 100, and the information management device 110 are each realized by a computer and a program.
  • An example of the searcher side terminal 20 is a personal computer (PC), a tablet computer, or the like, and the input device 22 and the display device 24 are connected or integrated.
  • PC personal computer
  • tablet computer or the like
  • An example of the local management device 100 is a personal computer or the like, which includes a local database 104.
  • the local management device 100 may include an input device and a display device.
  • An example of the information management device 110 is a personal computer or the like, which includes a temporary storage unit 112.
  • the information management device 110 may include an input device and a display device.
  • the configuration of the information retrieval system of FIG. 1 is an example, and it is not necessary to include a part of the components.
  • the information retrieval system may include other components.
  • the information retrieval system may be configured such that information is input / output using the searcher side terminal 20 without providing the input device 14 and the display device 16.
  • the information retrieval system may include a plurality of local management devices 100 in each of the plurality of districts. Although only one local management device 100 is shown in FIG. 1 because the configuration is the same, in the present embodiment, the information retrieval system includes a plurality of local management devices 100. Further, each of the plurality of local management devices 100 is physically arranged in each of the plurality of districts in which the information retrieval system is commonly used.
  • the text may be not only the text input from the beginning, but also the text of the voice using the voice recognition engine, and the text of the text in the paper medium using OCR (Optical Character Reader). good.
  • OCR Optical Character Reader
  • search processing can be performed on the characters or file names embedded in the drawings.
  • the information stored in the database 12 includes information such as a failure of a device or the like, a malfunction and its cause, a work standard such as a coping method thereof, and a manual.
  • the database 12 includes a plurality of failure cases. It is preferable that the temporary storage unit 112 and the file storage area are managed by using the same hierarchical structure.
  • the database 12 is configured to include a language search processing database in which the language search processing by the search execution unit 40 is performed, which is associated with the material stored in the file storage area.
  • the language search processing database stores the character information obtained by the processing of the information management device 110 for the material of the local database 104, the hierarchical information of the material in the local database 104, and the material in the database 12. Contains link information for compressed material. Since the database 12 has a database for language search processing, it is not necessary for the search execution unit 40 to directly search the materials stored in the database 12, and only the database for language search processing can be searched. It is possible to search materials efficiently.
  • the database for language search processing includes districts where past cases exist, classifications, classifications of past cases (item 1), document classifications (item 2), and link destinations to files.
  • RDB relational database
  • the database for language search processing may have a structure in which these items are collectively stored as one record.
  • the language search processing database may be configured to divide these items into a plurality of tables and join the plurality of tables using identification information (for example, ID number) as a key.
  • the database 12 periodically adds materials stored in the local database 104 in a plurality of districts to expand the information to be searched.
  • the materials stored in the local database 104 of each district are converted into a file format suitable for storing the database 12 by the information management device 110, and stored in the temporary storage unit 112 as storage materials. ..
  • the information management device 110 outputs the storage material stored in the temporary storage unit 112 at a periodic timing when the database 12 expands the information. That is, the materials stored in the local database 104 of each district are taken into the database 12 after the file format is converted by the information management device 110. At the same time, the necessary data records are added to the database for language search processing.
  • the information retrieval device 10 includes a question text reception unit 26, a natural language processing unit 28, a common keyword dictionary 30, a local keyword dictionary 102, a search candidate keyword reading unit 32, a search keyword storage unit 34, and information type determination.
  • a unit 36, an information type determination dictionary 38, a search execution unit 40, and a search candidate keyword change request reception unit 42 are included.
  • the natural language processing unit 28 includes an input search keyword extraction unit 44 and an information type determination keyword extraction unit 46.
  • the configuration of the information retrieval device 10 in FIG. 1 is an example, and it is not necessary to include a part of the components. Further, the information retrieval device 10 may include another component.
  • the information retrieval device 10 does not include the common keyword dictionary 30, the local keyword dictionary 102, and the information type determination dictionary 38, and these dictionaries provided outside the information retrieval device 10 are accessed via the network 18. It may be configured to be accessed.
  • the question text reception unit 26 sequentially receives question texts in natural language format input by the searcher via the input device 22 of the searcher side terminal 20 via the network 18.
  • the searcher side terminal 20 for example, "A failure of the XX device has occurred in the XX equipment. Is there a similar example in the past?", "What kind of failure is ⁇ failure?", " ⁇ ⁇ Natural language format question sentences such as "What is the procedure for replacing parts?" And “Why is the inverter trip?" Can be input sequentially.
  • the natural language processing unit 28 performs natural language processing such as known morphological analysis on the question text received by the question text reception unit 26, and extracts words.
  • the input search keyword extraction unit 44 of the natural language processing unit 28 extracts the input search keyword used in the search from the input question text.
  • the input search keyword extraction unit 44 refers to, for example, the common keyword dictionary 30 and the local keyword dictionary 102, which will be described in detail later, and inputs a word registered in the common keyword dictionary 30 or the local keyword dictionary 102 as an input search keyword. Can be extracted as.
  • the input search keyword extraction unit 44 may use the "XX equipment” and "XX equipment” and "XX equipment” when, for example, a question sentence "A device failure has occurred in the XX equipment.
  • the input search keyword extraction unit 44 extracts the word " ⁇ failure” as an input search keyword when, for example, a question sentence "What kind of failure is ⁇ failure?" Is input.
  • the input search keyword extraction unit 44 extracts the word " ⁇ parts” as an input search keyword when, for example, a question sentence "What is the procedure for replacing parts?" Is input.
  • the input search keyword extraction unit 44 extracts the words "inverter” and “trip” as input search keywords when, for example, the question sentence "why is the trip of the inverter?" Is input.
  • the information type determination keyword extraction unit 46 of the natural language processing unit 28 extracts the information type determination keyword used for determining the information type that is the search intention from the input question text. For this extraction, the information type determination keyword extraction unit 46 refers to the information type determination dictionary 38, which will be described in detail later, and extracts the words registered in the information type determination dictionary 38 as the information type determination keywords. be able to. In the information type determination keyword extraction unit 46, for example, when the question sentence "A failure of the XX device has occurred in the XX equipment. Is there a similar example in the past?" Is input, the "failure” and the "similar example” are input. Is extracted as a keyword for determining the type of information.
  • the information type determination keyword extraction unit 46 extracts the word "failure type” as an information type determination keyword when, for example, a question sentence "What type of failure is ⁇ failure?" Is input. do.
  • the information type determination keyword extraction unit 46 extracts the word "replacement procedure” as an information type determination keyword when, for example, a question sentence "What is the replacement procedure for parts?" Is input.
  • the information type determination keyword extraction unit 46 extracts the word "reason” as an input search keyword when, for example, a question sentence "why is the inverter trip?" Is input.
  • keywords having the same meaning as each other are registered in the common keyword dictionary 30 in association with each other. Further, in the common keyword dictionary 30, keywords having similar meanings to each other are registered in association with each other. However, in the common keyword dictionary 30, only keywords having the same meaning as each other may be registered, or only keywords having the same meaning as each other may be registered. Instead of or in addition to this, keywords that are considered to be highly related to each other can be associated with each other and registered in advance.
  • FIG. 2 shows an example of keywords registered in advance in the common keyword dictionary 30. Keywords belonging to the same line are related to each other and are associated with each other.
  • the search candidate keyword reading unit 32 refers to the common keyword dictionary 30 every time the input search keyword extraction unit 44 extracts the input search keyword, and reads out the keyword related to the input search keyword as the search candidate keyword. For example, when the input search keyword is " ⁇ equipment”, the search candidate keyword reading unit 32 uses “AA equipment”, “A'A' equipment”, and “A” A “” as synonyms from the common keyword dictionary 30. Is read, and "aaa” and “a'a'a'” are read as synonyms. That is, the search candidate keyword reading unit 32 reads "AA equipment”, “A'A'equipment”, "A” A "", "aaa”, and “a'a'a'” as search candidate keywords.
  • the search candidate keyword reading unit 32 may read not all of the synonyms and synonyms but a part of them from the common keyword dictionary 30 and use them as search candidate keywords. As an example, the search candidate keyword reading unit 32 may read only synonyms.
  • the local keyword dictionary 102 registers district keywords that are keywords used in a specific district.
  • the district keyword may be registered in the local keyword dictionary 102 by the administrator. Similar to the common keyword dictionary 30, the local keyword dictionary 102 may have a structure in which keywords belonging to the same line are related to each other and are associated with each other. Similar to the common keyword dictionary 30, the local keyword dictionary 102 may be registered with synonymous keywords associated with each other. Further, in the local keyword dictionary 102, similar keywords may be registered in association with each other, as in the common keyword dictionary 30.
  • each may register a district keyword for each district.
  • the local keyword dictionary 102 may be one, and may be configured so that each of the registered district keywords can be distinguished from which district the keyword is used.
  • the search candidate keyword reading unit 32 reads out the keyword related to the input search keyword by referring to the common keyword dictionary 30.
  • district keywords are keywords used in a particular district.
  • the district keyword may be, for example, a word used only in a factory or business establishment in a limited district, or a word that has a corresponding common word but is commonly used in a limited district. ..
  • the district keywords of the X district are registered in the local keyword dictionary 102 for the X district.
  • the search candidate keyword reading unit 32 reads the related keyword from the local keyword dictionary 102 as the search candidate keyword.
  • the search candidate keyword reading unit 32 refers to the common keyword dictionary 30 when the input search keyword is not registered in the local keyword dictionary 102. For example, when the input search keyword is the district keyword "XX equipment”, the search candidate keyword reading unit 32 reads "EE equipment” as a synonym from the local keyword dictionary 102, and reads "X'X' equipment” as a synonym. It may be read out and these may be used as search candidate keywords.
  • the district keyword may be associated with the keyword registered in the common keyword dictionary 30 in the local keyword dictionary 102.
  • the search candidate keyword reading unit 32 may read the keyword related to the input search keyword by referring to the common keyword dictionary 30 and the local keyword dictionary 102.
  • the district keyword "XX equipment” in the local keyword dictionary 102 may be associated with "XX equipment” registered in the common keyword dictionary 30 as a synonym.
  • the search candidate keyword reading unit 32 reads " ⁇ equipment” by referring to the local keyword dictionary 102, and further refers to the common keyword dictionary 30 to read "AA equipment”.
  • search candidate keyword reading unit 32 can set the search candidate keyword without omission by referring to both the common keyword dictionary 30 and the local keyword dictionary 102.
  • the search keyword storage unit 34 stores the input search keyword obtained as described above and the search candidate keyword as the search keyword. For example, when a question sentence is additionally input, the search keyword storage unit 34 may cumulatively store the additional input search keyword and the additional search candidate keyword as the search keyword.
  • the information type determination unit 36 determines the search intention based on the information type determination keyword extracted from the question text.
  • the information type determination unit 36 refers to the information type determination dictionary 38 and determines the information type to be searched based on the information type determination keyword.
  • FIG. 3 shows an example of the information type determination keyword stored in the information type determination dictionary 38.
  • the information type determination keyword that can be extracted from the question text and the information type corresponding to the information type determination keyword are registered in association with each other. For example, the information type determination keywords "failure” and "similar example” are registered in association with "failure case” as the information type.
  • “manual” is associated and registered as an information type with respect to the information type determination keywords such as "type of failure” and "replacement procedure”. Further, the information stored in the database 12 is divided into a plurality of groups and managed for each information type. For example, in the database 12, “failure cases” may be stored under one folder, for example, “past cases”, and “manuals” may be stored under another folder.
  • the search execution unit 40 performs a text-based search process on the information stored in the database 12 using the search keywords stored in the search keyword storage unit 34. That is, the search execution unit 40 executes a search process on the database 12 using the input search keyword and the keyword related to the input search keyword.
  • the search execution unit 40 performs a search process on information belonging to at least a group corresponding to the information type determined by the information type determination unit 36 among the plurality of groups of the database 12.
  • the search candidate keyword change request receiving unit 42 accepts additions and deletions of words registered in the common keyword dictionary 30 and the local keyword dictionary 102 from the searcher.
  • the searcher can, for example, add a new synonym to cause the search execution unit 40 to further execute the search process without omission.
  • the local management device 100 is located in each of a plurality of districts that commonly use the information retrieval system, and manages the local database 104 in that district.
  • the local management device 100 may be equipped with, for example, an input device and may be operated by the district manager.
  • the local database 104 stores materials created at a factory or business office in the district.
  • the created material may be automatically stored in the local database 104 by the district system including the local management device 100, or may be stored in the local database 104 by the administrator.
  • the materials stored in the local database 104 include materials such as failure cases of devices and manuals.
  • the material stored in the local database 104 is converted into a file format suitable for the database 12 by the information management device 110 as described above, and is periodically stored in the database 12.
  • the information management device 110 converts the file format of the material stored in the local database 104 in the plurality of districts and stores it in the temporary storage unit 112 as the storage material. Then, the information management device 110 outputs the storage material at a periodic timing when the database 12 expands the information.
  • FIG. 4 is a flowchart for explaining the operation of the information management device 110.
  • the information management device 110 acquires new materials stored in local databases 104 in a plurality of districts, for example, at regular timings. As another example, the information management device 110 may acquire the new material as soon as the new material is stored in the local database 104.
  • the information management device 110 proceeds to the process of step S2 when the size of the acquired material is equal to or less than the threshold value (Yes in step S1).
  • the threshold is 1 MB as an example.
  • the information management device 110 executes a character extraction process for extracting only character information from the acquired material (step S2).
  • the character information is stored in the database 12 and is used to speed up the text-based search process executed by the search execution unit 40.
  • the information management device 110 converts a material having a size equal to or less than the threshold value into the first file format.
  • the first file format is a file format in which the entire material is compressed and can be directly downloaded by the searcher from the search screen (see FIG. 6).
  • the first file format may be, for example, PDF (Portable Document Format).
  • the information management device 110 stores the extracted character information and the material converted into the first file format in the temporary storage unit 112 as storage material (step S3).
  • the information management device 110 proceeds to the process of step S4 when the size of the acquired material is not equal to or less than the threshold value (No in step S1).
  • the information management device 110 executes a character extraction process for extracting only character information from the acquired material (step S4).
  • the process of step S4 is the same as the process of step S2.
  • the information management device 110 converts a material having a size larger than the threshold value into a second file format.
  • the second file format is a file format that includes link information for the entire material or a part excluding textual information.
  • the link destination is the original storage location of the material acquired by the information management device 110, that is, the local database 104 in a certain district.
  • the searcher can access the material of the linked local database 104 from the search screen (see FIG. 6).
  • the second file format may be, for example, HTML (HyperText Markup Language). Then, the information management device 110 stores the extracted character information and the material converted into the second file format in the temporary storage unit 112 as storage material (step S5).
  • the information management device 110 outputs the storage material stored in the temporary storage unit 112 to the database 12 at a periodic timing, for example (step S6).
  • the information management device 110 executes the above processing, the character information and the compressed material or link information are stored in the database 12 and the temporary storage unit 112. That is, since it is possible to suppress the increase in the size of the database 12, the information retrieval system of the present embodiment can perform a high-speed search. Further, since it is possible to suppress an increase in the capacity of the database 12 and the temporary storage unit 112, it is possible to construct a compact system. As an example, the information management device 110 can compress a material containing an image of 3 MB or more to about 5 kB by converting it into HTML as a second file format.
  • each of the local databases 104 in the plurality of districts has a common hierarchical structure with the database 12.
  • FIG. 5 is a diagram illustrating the hierarchical structure of the database.
  • the hierarchical structure has districts, divisions, items 1, items 2, etc. from the top.
  • the local database 104 in the X district has a hierarchical structure of folders as shown in FIG. 5 as a specific example.
  • This hierarchical structure is the same as that of the database 12, and it is preferable that it is common to both the Y district and the Z district.
  • the local database 104 has the same hierarchical structure as the database 12, the materials displayed including the links in the search results, that is, the materials whose main body is stored only in the local database 104, are also searched. It becomes possible for a person to easily grasp the storage destination.
  • the database 12 and the local database 104 have a hierarchical structure of folders shown in FIG. 5, it is possible to accurately search for materials such as drawings and photographs that do not include text information.
  • the search process can be performed not only on the embedded characters but also on the file name.
  • the folder hierarchy as shown in FIG. 5 as the file name in the search process, the contents of the material can be determined more accurately.
  • the information management device 110 uses the character information of the "BB device” stored under the "past case” folder, for example, "X district ⁇ cold extension ⁇ past”. "Case ⁇ BB device”. Further, in the character extraction process, the information management device 110 sets the character information of the "BB device” stored under the "manual” folder as, for example, "X district ⁇ cold-rolled ⁇ manual ⁇ BB device”.
  • the information management device 110 executes a character extraction process for extracting the file name and folder path of the material as the character information when the material does not include the character information.
  • the materials that do not include the character information and cannot be distinguished by the file name are stored in the database 12 so as to be distinguishable.
  • the textual information of these materials includes the folder path, the contents of each are suggested.
  • the search execution unit 40 executes a search for "an example of a failure of a BB device"
  • the search execution unit 40 extracts a material whose character information is "X district ⁇ cold extension ⁇ past case ⁇ BB device" as search information.
  • the information management device 110 may individually extract the file name and the folder path and use each as a search target.
  • the information management device 110 may extract "X district ⁇ cold spread ⁇ past case" and "BB device", respectively, and use these as character information.
  • the information management device 110 can distinguish the drawing and photographic materials from the document materials by setting the threshold value (step S1 in FIG. 4) to an appropriate value.
  • the information management device 110 executes the character extraction process of step S4 of FIG. 4 on the drawing and photographic materials to convert them into a second file format including the link information. That is, the photo that does not contain the character information can be searched in the state of being stored in the local database 104 without being copied to the database 12.
  • the character extraction process that extracts the file name and folder path of the material as character information, the photos and the like that do not contain the character information stored in the local database 104 are leaked without increasing the capacity of the database 12. It is possible to search without having to search.
  • the character extraction processing and the material compression processing in the information management device 110 have a high load, and in order to carry out a large amount of processing, specifications with high calculation processing capacity are required. Since the present embodiment has a scheduling function for executing the processing of the information management device 110 for each district, it is possible to equalize the processing load. That is, a large amount of processing can be performed without requiring the information management device 110 to have a high calculation processing capacity.
  • FIG. 6 is a diagram illustrating a search result displayed on, for example, the display device 24 after the search process.
  • the search execution unit 40 performs a search process of the database 12 in response to the input of the question sentence "Why is the trip of the inverter?", And acquires a plurality of searched information.
  • a plurality of searched information may be referred to as "detection information”.
  • the detection information includes a mixture of information in a plurality of file formats converted by the information management device 110 according to the size of the original material.
  • the first information with a downloadable file attached and the second information displayed including a link to the material stored in the local database 104 are shown.
  • the search execution unit 40 searches for the first information and the second information stored as text in the database 12 by the character extraction process executed by the information management device 110.
  • the search execution unit 40 displays the registration date, reference number, registration district, and outline in text, and displays the downloadable file or link as a search result to the searcher. Regardless of which file format is converted by the information management device 110, the searcher can know the content of the full text of the material as the search result.
  • the search execution unit 40 can filter and display the search results according to the hierarchical structure of the database 12 and the local database 104. This makes the search results easier to read.
  • FIG. 7 is a flowchart for explaining the search processing operation of the information retrieval system.
  • the question text reception unit 26 of the information retrieval device 10 accepts the question text input by the searcher on the searcher side terminal 20 via the input device 22 (step S101).
  • the natural language processing unit 28 performs natural language processing such as morphological analysis on the question sentence received by the question sentence receiving unit 26, and extracts a word (independent word) (step S102).
  • the input search keyword extraction unit 44 extracts (selects) the input search keyword from the words extracted by the natural language processing (step S103).
  • the search candidate keyword reading unit 32 refers to the keyword dictionary (common keyword dictionary 30 and local keyword dictionary 102), and reads out the keyword related to the input search keyword as the search candidate keyword (step S104).
  • the search candidate keyword reading unit 32 refers to the common keyword dictionary 30 when the input search keyword is not registered in the local keyword dictionary 102.
  • the search keyword storage unit 34 stores the input search keyword and the search candidate keyword read by the search candidate keyword reading unit 32 (step S105).
  • the information search device 10 causes the display device 24 to display the search keywords stored in the search keyword storage unit 34, and if necessary, the searcher selects a search keyword that the searcher does not want from among the plurality of displayed search keywords. Can be excluded from (step S106).
  • the information type determination unit 36 refers to the information type determination dictionary 38 and determines the information type (search intention) based on the information type determination keyword extracted by the information type determination keyword extraction unit 46 (step S107).
  • the search execution unit 40 searches for information stored in a group corresponding to the information type determined by the information type determination unit 36 or the information type manually selected by the searcher in the database 12.
  • a text-based search process is performed using keywords (step S108).
  • the information retrieval device 10 displays the search result on the display device 24 on the searcher side (step S109).
  • the information retrieval device 10, the searcher-side terminal 20, the local management device 100, and the information management device 110 may be computers as shown in FIG. 8, respectively.
  • the computer has a memory (storage device), a CPU (processing device), a hard disk drive (HDD), a display control unit that controls the display of the display device 16 or the display device 24, a communication control unit for connecting to the network 18, and the like. It is connected via.
  • the operating system (OS) and the application program for carrying out the processing in the above embodiment can be stored in the HDD, and are read from the HDD to the memory when executed by the CPU.
  • the CPU controls the display control unit, the communication control unit, and the like to perform necessary operations.
  • the data in the process of processing is stored in the memory, and if necessary, is stored in the HDD.
  • the above-mentioned various functions are realized by organically linking hardware such as a CPU and memory with an OS and necessary application programs.
  • Information retrieval device 12
  • Database 14
  • Input device 16
  • Display device 18
  • Network 20
  • Searcher side terminal 22
  • Input device 24
  • Display device 26
  • Question text reception unit 28
  • Natural language processing unit 30
  • Common keyword dictionary 32
  • Search candidate keyword reader 34
  • Search keyword storage unit 36
  • Information type judgment unit 38
  • Information type judgment dictionary 40
  • Search execution unit 42
  • Search candidate keyword change request reception unit 44
  • Information type judgment keyword extraction unit 100
  • Local management device 102
  • Local keyword dictionary 104
  • Information Management device 112

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Liquid Crystal Substances (AREA)

Abstract

複数の地区で共通に用いられる場合でも高速な検索が可能な情報検索システムが提供される。情報検索システムは、テキスト検索可能な複数の情報を格納するデータベース(12)と、自然言語形式の質問文章を受け付ける質問文章受付部(26)と、質問文章から入力検索キーワードを抽出する入力検索キーワード抽出部(44)と、入力検索キーワード及び入力検索キーワードに関連するキーワードを用いてデータベースに対して検索処理を実行する検索実行部(40)と、地区の資料をローカルデータベース(104)に格納するローカル管理装置(100)と、ローカルデータベースに格納された資料に対して文字抽出処理及び資料のサイズに応じたファイル形式の変換を実行し、格納用資料として一時記憶部に記憶し、格納用資料をデータベースに出力する情報管理装置(110)と、を備える。

Description

情報検索システム
 本開示は、情報検索システムに関する。
 従来、製造業等での保全業務における資料は、紙面に記載されたデータ(紙データ)であった。保全業務における情報検索システムでは、これらの紙データを電子化し、まとめて蓄積してデータベース化することが重要である。検索技術の進歩によって、検索結果の精度が向上し、紙データの電子化とデータベース化が進められている。
 例えば製造業では、装置等の故障、不具合、原因及び対処法等を、都度データベース化し、同様の故障、不具合が発生した場合には過去の事例として参考にすることで、不具合回避、復旧までの時間短縮を図っている。また、データベースには、作業標準、マニュアル等の情報も格納されている。このため、データベースに格納された情報は膨大なものとなる。
 このような膨大なデータの中から必要とする情報を入手する手法として、従来、与えられた文字列をキーワードとして、それに一致するものを検索結果として出力するテキスト検索処理がある。例えば特許文献1は、知識、経験が浅く、適正なキーワード入力が困難な者でも、良好な検索結果を得ることが可能な情報検索システムを開示する。
特開2019-121392号公報
 ここで、多くの地区にある工場及び事業所等が共通の情報検索システムを用いる場合に、多くの地区からの資料を画一的に収集するとデータベースのサイズが大きくなり、高速な検索ができなくなるおそれがある。
 本開示は、かかる課題に鑑みてなされたものであり、複数の地区で共通に用いられる場合でも高速な検索が可能な情報検索システムを提供することを目的とする。
 本開示の情報検索システムは、
 テキスト検索可能な複数の情報を格納するデータベースと、
 自然言語形式の質問文章を受け付ける質問文章受付部と、
 前記質問文章から入力検索キーワードを抽出する入力検索キーワード抽出部と、
 前記入力検索キーワード及び前記入力検索キーワードに関連するキーワードを用いて前記データベースに対して検索処理を実行する検索実行部と、
 地区の資料をローカルデータベースに格納するローカル管理装置と、
 前記ローカルデータベースに格納された前記資料に対して文字抽出処理及び前記資料のサイズに応じたファイル形式の変換を実行し、格納用資料として一時記憶部に記憶し、前記格納用資料を前記データベースに出力する情報管理装置と、を備える。
 本開示によれば、複数の地区で共通に用いられる場合でも高速な検索が可能な情報検索システムを提供することができる。
図1は、本開示の一実施形態に係る情報検索システムの概略構成を示すブロック図である。 図2は、共通キーワード辞書に格納されたキーワードの一例を示す図である。 図3は、情報種類判断用辞書に格納された情報種類判断用キーワードの一例を示す図である。 図4は、実施形態の情報検索システムの情報管理装置の動作を説明するためのフローチャートである。 図5は、データベースの階層構造を例示する図である。 図6は、表示される検索結果を例示する図である。 図7は、実施形態の情報検索システムの情報検索の動作を説明するためのフローチャートである。 図8は、コンピュータの機能ブロック図である。 図9は、言語検索処理用データベースを例示する図である。
 本実施形態では、製造業における設備保全作業情報をテキスト検索可能な情報としてデータベース化しておき、故障、不具合が発生した場合に、検索者がその状況を文章として入力することによって、データベースから参考になる過去の事例の情報を検索することができる情報検索システムを一例として説明する。検索者は、検索された情報に基づいて復旧作業を行うことができる。ここで、設備保全作業情報は、例えば装置等の故障、不具合、原因、及び対処法等が記載された作業標準及びマニュアル等の情報を含む。また、以下において、故障又は不具合に関する事例を「故障事例」と称することがある。
 本開示の情報検索システムの検索用途は上記に限定されない。本開示の情報検索システムは、設備故障復旧作業等の設備保全作業の支援以外にも用いることができる。本開示の情報検索システムは、例えば営業分野において、顧客からの問合せ内容に対して過去の事例を検索し、最適な回答を提示することに適用できる。本開示の情報検索システムは、例えば商品設計分野において、顧客からの引合いに対して類似の製造実績、技術論文等の文献を検索し、最適な製品設計を提案することに適用できる。
 図1は、本開示の一実施形態に係る情報検索システムの概略構成を示すブロック図である。情報検索システムは、検索処理を実行する情報検索装置10と、テキスト検索可能な複数の情報を格納するデータベース12と、情報検索装置10に接続されたキーボード、マウス等の入力装置14と、情報検索装置10に接続されたディスプレイ等の表示装置16とを備えて構成される。また、情報検索システムは、ネットワーク18を介して情報検索装置10と接続される検索者側端末20、ローカル管理装置100及び情報管理装置110を備えて構成される。
 ネットワーク18は、LAN(Local Area Network)等の通信網である。しかしこれに限定されず、ネットワーク18は、インターネット等の公衆通信網の他、WAN(Wide Area Network)又はVPN(Virtual Private Network)のような一般公衆回線を一部に介在させた通信網であってよい。情報検索装置10、検索者側端末20、ローカル管理装置100及び情報管理装置110は、それぞれコンピュータとプログラムとによって実現される。検索者側端末20の例は、パーソナルコンピュータ(PC)、タブレット型コンピュータ等であり、入力装置22及び表示装置24が接続又は一体化されている。ローカル管理装置100の例はパーソナルコンピュータ等であって、ローカルデータベース104を備える。ローカル管理装置100は入力装置及び表示装置を備えてよい。情報管理装置110の例はパーソナルコンピュータ等であって、一時記憶部112を備える。情報管理装置110は入力装置及び表示装置を備えてよい。
 ここで、図1の情報検索システムの構成は一例であり、構成要素の一部を含まなくてよい。また、情報検索システムは別の構成要素を備えてよい。例えば、情報検索システムは、入力装置14及び表示装置16を備えずに、検索者側端末20を用いて情報の入出力が行われる構成であってよい。また、情報検索システムは複数の地区のそれぞれにある複数のローカル管理装置100を備えてよい。構成が同じであるため図1において1つのローカル管理装置100のみを示しているが、本実施形態において、情報検索システムは複数のローカル管理装置100を備える。また、複数のローカル管理装置100のそれぞれは、情報検索システムを共通に用いる複数の地区のそれぞれに物理的に配置されている。
 データベース12内にはファイル記憶領域があり、ファイル記憶領域に、文書、図面、写真等が格納される。文章は、初めからテキスト入力されたもののみならず、音声認識エンジンを用いて、音声をテキスト化したものでよく、OCR(Optical Character Reader)を用いて紙媒体中の文章をテキスト化したものでよい。図面、写真を格納する場合には図面中に埋め込まれた文字あるいはファイル名に対して検索処理を行うことができる。データベース12に格納される情報には、装置等の故障、不具合とその原因、さらにはその対処法等の作業標準、マニュアル等の情報が含まれる。本実施形態において、データベース12は複数の故障事例を含む。一時記憶部112とファイル記憶領域とは、同じ階層構造を用いてファイル管理が行われることが好ましい。
 また、データベース12は、上記のファイル記憶領域に保存される資料に関連づけられた、検索実行部40による言語検索処理が行われる言語検索処理用データベースを含んで構成される。言語検索処理用データベースには、後に記述するように、ローカルデータベース104の資料に対する情報管理装置110の処理によって得られた文字情報と、その資料のローカルデータベース104における階層情報と、データベース12内に格納される圧縮された資料のリンク情報が含まれている。データベース12が言語検索処理用データベースを有しているため、検索実行部40が直接、データベース12内に格納されている資料を検索する必要がなく、言語検索処理用データベースのみを検索することで、効率的に資料の検索が可能となる。
 ここで、言語検索処理用データベースは、例えば図9に示すように、過去事例の存在する地区、区分、過去事例などの分類(項目1)、書類の区分(項目2)、ファイルへのリンク先、ファイルから抽出した文字情報などを項目としたデータを抽出できるRDB(relational database)である。言語検索処理用データベースは、これらの項目をまとめて1レコードとして保存した構成であってよい。また、言語検索処理用データベースは、これらの項目を複数のテーブルに分けて、識別情報(例えばID番号)などをキーとして複数のテーブルが結合される構成であってよい。
 データベース12は、複数の地区にあるローカルデータベース104に格納された資料を定期的に追加して、検索される情報を拡充する。後に詳述するように、各地区のローカルデータベース104に格納された資料は、情報管理装置110によってデータベース12の格納に適するファイル形式に変換されて、格納用資料として一時記憶部112に記憶される。情報管理装置110は、データベース12が情報を拡充する定期的なタイミングで、一時記憶部112に記憶した格納用資料を出力する。つまり、各地区のローカルデータベース104に格納された資料は、情報管理装置110によるファイル形式の変換を経て、データベース12に取り込まれる。また、同じタイミングで、言語検索処理用データベースにも必要なデータレコードが追加される。
 情報検索装置10は、質問文章受付部26と、自然言語処理部28と、共通キーワード辞書30と、ローカルキーワード辞書102と、検索候補キーワード読出部32と、検索キーワード記憶部34と、情報種類判断部36と、情報種類判断用辞書38と、検索実行部40と、検索候補キーワード変更要望受付部42とを備えて構成される。自然言語処理部28は、入力検索キーワード抽出部44及び情報種類判断用キーワード抽出部46を含む。ここで、図1の情報検索装置10の構成は一例であり、構成要素の一部を含まなくてよい。また、情報検索装置10は別の構成要素を備えてよい。例えば、情報検索装置10は、共通キーワード辞書30、ローカルキーワード辞書102及び情報種類判断用辞書38を備えずに、情報検索装置10の外部に設けられたこれらの辞書に、ネットワーク18を経由してアクセスする構成であってよい。
 これらの各機能ブロックは概略として次のような機能を有する。質問文章受付部26は、検索者によって検索者側端末20の入力装置22を介して入力された自然言語形式の質問文章を、ネットワーク18を経由して逐次受け付ける。検索者側端末20には、例えば、「○○設備で××装置の故障が発生。過去に類似例があるか?」、「故障の種類が△△故障であるものは?」、「□□部品の交換手順は?」、「インバータのトリップの理由は?」といった自然言語形式の質問文章が逐次入力され得る。
 自然言語処理部28は、質問文章受付部26で受け付けた質問文章に対して既知の形態素解析等の自然言語処理を行い、単語を抽出する。自然言語処理部28の入力検索キーワード抽出部44は、入力された質問文章から検索で使用する入力検索キーワードを抽出する。この抽出のため、入力検索キーワード抽出部44は、例えば後に詳細に説明する共通キーワード辞書30及びローカルキーワード辞書102を参照し、共通キーワード辞書30又はローカルキーワード辞書102に登録された単語を入力検索キーワードとして抽出することができる。入力検索キーワード抽出部44は、例えば「○○設備で××装置の故障が発生。過去に類似例があるか?」という質問文章が入力された場合に、「○○設備」及び「××装置」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「故障の種類が△△故障であるものは?」という質問文章が入力された場合に、「△△故障」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「□□部品の交換手順は?」という質問文章が入力された場合に、「□□部品」という単語を入力検索キーワードとして抽出する。入力検索キーワード抽出部44は、例えば「インバータのトリップの理由は?」という質問文章が入力された場合に、「インバータ」及び「トリップ」という単語を入力検索キーワードとして抽出する。
 自然言語処理部28の情報種類判断用キーワード抽出部46は、入力された質問文章の中から検索意図である情報種類を判断するのに使用される情報種類判断用キーワードを抽出する。この抽出のため、情報種類判断用キーワード抽出部46は、後に詳細に説明する情報種類判断用辞書38を参照し、情報種類判断用辞書38に登録された単語を情報種類判断用キーワードとして抽出することができる。情報種類判断用キーワード抽出部46は、例えば「○○設備で××装置の故障が発生。過去に類似例があるか?」という質問文章が入力された場合に、「故障」及び「類似例」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「故障の種類が△△故障であるものは?」という質問文章が入力された場合に、「故障の種類」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「□□部品の交換手順は?」という質問文章が入力された場合に、「交換手順」という単語を情報種類判断用キーワードとして抽出する。情報種類判断用キーワード抽出部46は、例えば「インバータのトリップの理由は?」という質問文章が入力された場合に、「理由」という単語を入力検索キーワードとして抽出する。
 共通キーワード辞書30には、関連するキーワード同士が互いに対応付けされて予め登録され、格納されている。この実施形態では、共通キーワード辞書30には、互いに同義のキーワード同士が互いに対応付けされて登録されている。また、共通キーワード辞書30には、互いに類義のキーワード同士が互いに対応付けされて登録されている。しかし、共通キーワード辞書30には、互いに同義のキーワードだけを登録してよいし、互いに類義のキーワードだけを登録してよい。これに代えて又は加えて、互いに関連性が高いと思われるキーワード同士を互いに対応付けして予め登録することもできる。
 図2は、共通キーワード辞書30に予め登録されたキーワードの一例を示す。同じ行に属するキーワード同士が互いに関連するキーワードであり、互いに対応付けされている。
 検索候補キーワード読出部32は、例えば入力検索キーワード抽出部44が入力検索キーワードを抽出する度に共通キーワード辞書30を参照し、入力検索キーワードに関連するキーワードを検索候補キーワードとして読み出す。検索候補キーワード読出部32は、例えば入力検索キーワードが「○○設備」の場合に、共通キーワード辞書30から、同義語として「AA設備」、「A´A´設備」、「A"A"」を読み出し、類義語として「aaa」、「a´a´a´」を読み出す。つまり、検索候補キーワード読出部32は、検索候補キーワードとして、「AA設備」、「A´A´設備」、「A"A"」、「aaa」及び「a´a´a´」を読み出す。ここで、検索候補キーワード読出部32は、共通キーワード辞書30から同義語及び類義語の全てでなく、一部を読み出して、検索候補キーワードとしてよい。一例として、検索候補キーワード読出部32は、同義語だけを読み出してよい。
 ローカルキーワード辞書102は、特定の地区で使用されるキーワードである地区キーワードを登録する。地区キーワードは管理者によってローカルキーワード辞書102に登録されてよい。ローカルキーワード辞書102は、共通キーワード辞書30と同じように、同じ行に属するキーワード同士が互いに関連するキーワードであり、互いに対応付けされている構成であってよい。ローカルキーワード辞書102は、共通キーワード辞書30と同じように、同義のキーワードが互いに対応付けされて登録されていてよい。また、ローカルキーワード辞書102は、共通キーワード辞書30と同じように、類義のキーワードが互いに対応付けされて登録されていてよい。ローカルキーワード辞書102が、地区キーワードを登録し、優先的に検索候補キーワード読出部32によって参照されることによって、共通キーワード辞書30で全ての用語を管理する必要がなくなる。そのため、共通キーワード辞書30のサイズが大きくなって検索の速度が低下することを回避することができる。ローカルキーワード辞書102は複数であって、それぞれが各地区の地区キーワードを登録してよい。また、ローカルキーワード辞書102は1つであって、登録している地区キーワードのそれぞれについて、どの地区で使用されるキーワードであるかを区別できるように構成されてよい。
 本実施形態において、検索候補キーワード読出部32は、入力検索キーワードがローカルキーワード辞書102に登録されていない場合に、共通キーワード辞書30を参照して入力検索キーワードに関連するキーワードを読み出す。上記のように、地区キーワードは、特定の地区で使用されるキーワードである。地区キーワードは、例えば限られた地区の工場又は事業所でのみ用いられる単語であってよいし、対応する共通の単語があるが限られた地区において慣用的に用いられている単語であってよい。例えばローカルキーワード辞書102が複数である場合に、X地区の地区キーワードは、X地区用のローカルキーワード辞書102に登録される。例えばローカルキーワード辞書102が1つである場合に、X地区の地区キーワードは、X地区と紐づけられた上で、ローカルキーワード辞書102に登録される。検索候補キーワード読出部32は、入力検索キーワードがローカルキーワード辞書102に登録されている場合に、ローカルキーワード辞書102から関連するキーワードを検索候補キーワードとして読み出す。検索候補キーワード読出部32は、入力検索キーワードがローカルキーワード辞書102に登録されていない場合に、共通キーワード辞書30を参照する。検索候補キーワード読出部32は、例えば入力検索キーワードが地区キーワードである「XX設備」の場合に、ローカルキーワード辞書102から同義語として「EE設備」を読み出し、類義語として「X´X´設備」を読み出して、これらを検索候補キーワードとしてよい。
 ここで、ローカルキーワード辞書102において地区キーワードが共通キーワード辞書30に登録されたキーワードに対応付けられていてよい。このとき、検索候補キーワード読出部32は、入力検索キーワードが地区キーワードである場合に、共通キーワード辞書30及びローカルキーワード辞書102を参照して入力検索キーワードに関連するキーワードを読み出してよい。例えば、ローカルキーワード辞書102において地区キーワードである「XX設備」は、類義語として共通キーワード辞書30に登録されている「○○設備」に対応付けられてよい。検索候補キーワード読出部32は、例えば入力検索キーワードが「XX設備」の場合に、ローカルキーワード辞書102を参照して「○○設備」を読み出し、さらに共通キーワード辞書30を参照して「AA設備」、「A´A´設備」、「A"A"」、「aaa」及び「a´a´a´」を読み出して、これらを検索候補キーワードとしてよい。検索候補キーワード読出部32は、共通キーワード辞書30及びローカルキーワード辞書102の両方を参照することによって、漏れなく検索候補キーワードを設定することができる。
 検索キーワード記憶部34は、上記のように得られる入力検索キーワードと、検索候補キーワードとを、検索キーワードとして記憶する。検索キーワード記憶部34は、例えば質問文章が追加的に入力された場合に、追加の入力検索キーワードと、追加の検索候補キーワードとを、検索キーワードとして累積的に記憶してよい。
 情報種類判断部36は、質問文章から抽出された情報種類判断用キーワードに基づき、検索意図を判断する。情報種類判断部36は、情報種類判断用辞書38を参照し、情報種類判断用キーワードに基づき検索すべき情報種類を判断する。図3は、情報種類判断用辞書38に格納された情報種類判断用キーワードの一例を示す。情報種類判断用辞書38には、質問文章から抽出され得る情報種類判断用キーワードと、情報種類判断用キーワードに対応する情報種類とが対応付けられて登録されている。例えば「故障」及び「類似例」という情報種類判断用キーワードに対して、情報種類として「故障事例」が対応付けられて登録されている。また、例えば「故障の種類」及び「交換手順」という情報種類判断用キーワードに対して、情報種類として「マニュアル」が対応付けられて登録されている。また、データベース12に格納される情報は、情報種類毎に複数のグループに区分されて管理されている。例えば、データベース12において、「故障事例」は例えば「過去事例」という1つのフォルダの下にあるように格納され、「マニュアル」は別のフォルダの下にあるように格納されてよい。
 検索実行部40は、データベース12に格納された情報に対して、検索キーワード記憶部34に記憶された検索キーワードを用いたテキストベースの検索処理を行う。つまり、検索実行部40は、入力検索キーワード及び入力検索キーワードに関連するキーワードを用いて、データベース12に対して検索処理を実行する。検索実行部40は、データベース12の複数のグループのうち、少なくとも情報種類判断部36によって判断された情報種類に対応するグループに属する情報に対して検索処理を行う。
 検索候補キーワード変更要望受付部42は、検索者から共通キーワード辞書30及びローカルキーワード辞書102に登録される単語の追加及び削除を受け付ける。検索者は、例えば新たな類義語を追加することによって、検索実行部40にさらに漏れのない検索処理を実行させることが可能になる。
 ローカル管理装置100は、情報検索システムを共通に用いる複数の地区のそれぞれにあって、その地区のローカルデータベース104を管理する。ローカル管理装置100は例えば入力装置を備え、地区の管理者によって操作されてよい。
 ローカルデータベース104は、地区の工場又は事業所において作成された資料を格納する。作成された資料は、ローカル管理装置100を含む地区のシステムによって自動的にローカルデータベース104に格納されてよいし、管理者によってローカルデータベース104に格納されてよい。ローカルデータベース104に格納される資料は、装置等の故障事例、マニュアル等の資料を含む。ローカルデータベース104に格納される資料は、上記のように情報管理装置110によってデータベース12に適するファイル形式に変換されて、定期的にデータベース12に格納される。
 情報管理装置110は、複数の地区にあるローカルデータベース104に格納された資料のファイル形式を変換して、格納用資料として一時記憶部112に記憶する。そして、情報管理装置110は、データベース12が情報を拡充する定期的なタイミングで格納用資料を出力する。
 図4は、情報管理装置110の動作を説明するためのフローチャートである。情報管理装置110は、例えば定期的なタイミングで、複数の地区にあるローカルデータベース104に格納された新たな資料を取得する。別の例として、情報管理装置110は、ローカルデータベース104に新たな資料が格納されるとすぐに、その新たな資料を取得してよい。
 情報管理装置110は、取得した資料のサイズが閾値以下である場合に(ステップS1のYes)、ステップS2の処理に進む。閾値は一例として1MBである。
 情報管理装置110は、取得した資料から文字情報だけを抽出する文字抽出処理を実行する(ステップS2)。文字情報は、データベース12に格納されて、検索実行部40が実行するテキストベースの検索処理を高速化するのに用いられる。
 情報管理装置110は、閾値以下のサイズの資料を第1のファイル形式に変換する。第1のファイル形式は、資料全体を圧縮して、検索画面(図6参照)から検索者が直接的にダウンロード可能であるようなファイルの形式である。第1のファイル形式は、例えばPDF(Portable Document Format)であってよい。そして、情報管理装置110は、抽出した文字情報と第1のファイル形式に変換した資料とを、格納用資料として一時記憶部112に記憶する(ステップS3)。
 情報管理装置110は、取得した資料のサイズが閾値以下でない場合に(ステップS1のNo)、ステップS4の処理に進む。
 情報管理装置110は、取得した資料から文字情報だけを抽出する文字抽出処理を実行する(ステップS4)。ステップS4の処理は、ステップS2の処理と同じである。
 情報管理装置110は、閾値より大きいサイズの資料を第2のファイル形式に変換する。第2のファイル形式は、資料の全体又は文字情報を除く部分に対してのリンク情報を含むファイルの形式である。リンク先は、情報管理装置110が取得した資料のもとの保存場所、すなわち、ある地区のローカルデータベース104である。検索者は、検索画面(図6参照)からリンク先のローカルデータベース104の資料にアクセスすることができる。第2のファイル形式は、例えばHTML(HyperText Markup Language)であってよい。そして、情報管理装置110は、抽出した文字情報と第2のファイル形式に変換した資料とを、格納用資料として一時記憶部112に記憶する(ステップS5)。
 情報管理装置110は、一時記憶部112に記憶した格納用資料を、例えば定期的なタイミングでデータベース12に出力する(ステップS6)。
 ここで、複数の地区で生成される多くの資料をそのままデータベース12に格納すると、データベース12のサイズが大きくなり、高速な検索ができなくなるおそれがある。また、データベース12及び一時記憶部112の容量を大きくする必要がある。本実施形態においては、情報管理装置110が上記の処理を実行するので、文字情報と、圧縮された資料又はリンク情報とがデータベース12及び一時記憶部112に保存される。つまり、データベース12のサイズが大きくなることを抑制できるため、本実施形態の情報検索システムは高速な検索が可能である。また、データベース12及び一時記憶部112の容量が大きくなることを抑制できるため、コンパクトなシステム構築が可能になる。一例として、情報管理装置110は、第2のファイル形式としてHTMLに変換することによって、3MB以上の画像を含む資料を5kB程度に圧縮することができる。
 ここで、複数の地区にあるローカルデータベース104のそれぞれは、データベース12と共通の階層構造を有することが好ましい。図5は、データベースの階層構造を例示する図である。例えば、階層構造は上位から地区、区分、項目1、項目2等を有する。X地区のローカルデータベース104は、具体例として図5に示すようなフォルダの階層構造を有している。この階層構造は、データベース12と同じものであって、Y地区でも、Z地区でも共通であることが好ましい。このように、ローカルデータベース104がデータベース12と同じ階層構造を有することによって、検索結果においてリンクを含んで表示される資料、すなわち、資料本体はローカルデータベース104だけに格納されている資料についても、検索者が容易に格納先を把握することが可能になる。
 また、データベース12及びローカルデータベース104が図5に示すフォルダの階層構造を有することによって、文字情報を含まない図面及び写真等の資料を正確に検索することが可能になる。上記のように、資料が図面及び写真である場合に、埋め込まれた文字だけでなくファイル名に対して検索処理が行なわれ得る。検索処理の際に、ファイル名として、図5のようなフォルダの階層を含むことによって、資料の内容をより正確に判別することができる。
 例えば、ファイル名を「BB装置」とする文字情報を含まない2つの写真が、X地区のローカルデータベース104の「過去事例」フォルダと「マニュアル」フォルダのそれぞれの下に格納されたとする。情報管理装置110は、文字抽出処理(図4のステップS2又はステップS4)において、「過去事例」フォルダの下に格納された「BB装置」の文字情報を、例えば「X地区¥冷延¥過去事例¥BB装置」とする。また、情報管理装置110は、文字抽出処理において、「マニュアル」フォルダの下に格納された「BB装置」の文字情報を、例えば「X地区¥冷延¥マニュアル¥BB装置」とする。つまり、情報管理装置110は、資料が文字情報を含まない場合に、資料のファイル名及びフォルダパスを文字情報として抽出する文字抽出処理を実行する。このように、情報管理装置110の文字抽出処理によって、文字情報を含まず、かつファイル名で区別できない資料が、区別可能なようにデータベース12に格納される。また、これらの資料の文字情報は、フォルダパスを含むため、それぞれの内容が示唆される。例えば、検索実行部40は、「BB装置の故障の実例」について検索を実行する場合に、文字情報を「X地区¥冷延¥過去事例¥BB装置」とする資料を検索情報として抽出し、文字情報を「X地区¥冷延¥マニュアル¥BB装置」とする資料を除外することができる。また、検索実行部40は、「BB装置の操作方法」について検索を実行する場合に、文字情報を「X地区¥冷延¥マニュアル¥BB装置」とする資料を検索情報として抽出し、文字情報を「X地区¥冷延¥過去事例¥BB装置」とする資料を除外することができる。また、検索実行部40は、「Y地区のBB装置の外観」について検索を実行する場合に、これらの資料を誤って検索情報に含めることを回避することができる。このように、文字情報を含まない図面及び写真等の資料を正確に検索することが可能である。フォルダの階層をファイル名に含ませる場合について説明したが、別の例として、情報管理装置110はファイル名とフォルダパスを個別に抽出し、それぞれを検索対象としてよい。具体例として、情報管理装置110は「X地区¥冷延¥過去事例」と「BB装置」とをそれぞれ抽出して、これらを文字情報としてよい。
 ここで、一般に図面及び写真は、文書に比べてサイズが大きい。したがって、情報管理装置110は、閾値(図4のステップS1)を適切な値に設定することによって、図面及び写真の資料を、文書の資料と区別することが可能である。この場合に、情報管理装置110は、図面及び写真の資料に対して図4のステップS4の文字抽出処理を実行して、リンク情報を含む第2のファイル形式に変換する。つまり、文字情報を含まない写真は、データベース12にコピーされることなく、ローカルデータベース104に格納された状態で検索され得る。資料のファイル名及びフォルダパスを文字情報として抽出する文字抽出処理が実行されることによって、データベース12の容量を大きくすることなく、ローカルデータベース104に格納される文字情報を含まない写真等についても漏らさずに検索対象とすることが可能である。
 ここで、情報管理装置110における文字抽出処理及び資料の圧縮処理などは、負荷が高く、大量の処理を実施するには、計算処理能力が高いスペックが必要となる。本実施形態では、情報管理装置110の処理を地区毎に実施するようなスケジューリング機能を有しているため、処理負荷の平準化を図ることが可能となる。つまり、情報管理装置110に高い計算処理能力を求めることなく、大量の処理を実施することができる。
 図6は、検索処理の後で例えば表示装置24に表示される検索結果を例示する図である。図6の例において、検索実行部40は「インバータのトリップの理由は?」という質問文章の入力に対して、データベース12の検索処理を行って、検索された複数の情報を取得する。以下において、検索された複数の情報を「検出情報」と称することがある。検出情報は、情報管理装置110によって、もとの資料のサイズに応じて変換された複数のファイル形式の情報を混在して含む。図6の例では、例えばダウンロード可能なファイルが添付された第1の情報、及び、ローカルデータベース104に格納された資料へのリンクを含んで表示された第2の情報が示されている。検索実行部40は、情報管理装置110によって実行された文字抽出処理によってデータベース12にテキストとして格納された第1の情報及び第2の情報を検索する。検索実行部40は、登録年月日、整理番号、登録地区及び概要をテキストで表示するとともに、ダウンロード可能なファイル又はリンクを検索結果として検索者に表示する。情報管理装置110によってどのファイル形式に変換された場合であっても、検索者は検索結果である資料の全文の内容を知ることができる。
 また、本実施形態において、検索実行部40は上記のデータベース12及びローカルデータベース104の階層構造に合わせて、検索結果をフィルタリングして表示することが可能である。このことによって、検索結果がより見やすいものになる。
 図7は、情報検索システムの検索の処理動作を説明するためのフローチャートである。
 まず、情報検索装置10の質問文章受付部26が、検索者が検索者側端末20で入力装置22を介して入力した質問文章を受け付ける(ステップS101)。
 つづいて、自然言語処理部28が、質問文章受付部26で受け付けた質問文章に対して形態素解析等の自然言語処理を行い、単語(自立語)を抽出する(ステップS102)。
 つづいて、入力検索キーワード抽出部44が自然言語処理により抽出された単語から入力検索キーワードを抽出(選択)する(ステップS103)。
 ついで、検索候補キーワード読出部32が、キーワード辞書(共通キーワード辞書30及びローカルキーワード辞書102)を参照し、入力検索キーワードに関連するキーワードを検索候補キーワードとして読み出す(ステップS104)。ここで、検索候補キーワード読出部32は、入力検索キーワードがローカルキーワード辞書102に登録されていない場合に、共通キーワード辞書30を参照する。
 検索キーワード記憶部34は、入力検索キーワード及び、検索候補キーワード読出部32で読み出された検索候補キーワードを記憶する(ステップS105)。
 情報検索装置10は、検索キーワード記憶部34が記憶した検索キーワードを、表示装置24に表示させ、必要に応じて、表示された複数の検索キーワードのうち、検索者が所望しない検索キーワードを検索者に除外させることができる(ステップS106)。
 情報種類判断部36は、情報種類判断用辞書38を参照し、情報種類判断用キーワード抽出部46で抽出された情報種類判断用キーワードに基づき情報種類(検索意図)を判断する(ステップS107)。
 検索実行部40は、データベース12内の、情報種類判断部36が判断した情報種類あるいは検索者によって手動で選択された情報種類に対応するグループに格納された情報等に対して、選択された検索キーワードでテキストベースの検索処理を行う(ステップS108)。
 情報検索装置10は、検索結果を検索者側の表示装置24に表示する(ステップS109)。
 ここで、情報検索装置10、検索者側端末20、ローカル管理装置100及び情報管理装置110は、それぞれ図8のようなコンピュータであってよい。コンピュータは、メモリ(記憶装置)、CPU(処理装置)、ハードディスクドライブ(HDD)、表示装置16又は表示装置24の表示を制御する表示制御部、ネットワーク18に接続するための通信制御部等がバスを介して接続されている。オペレーティングシステム(OS)及び上記実施形態における処理を実施するためのアプリケーションプログラムは、HDDに格納することができ、CPUにより実行される際にはHDDからメモリに読み出される。必要に応じてCPUは、表示制御部、通信制御部等を制御して必要な動作を行わせる。また、処理途中のデータについては、メモリに格納され、必要があればHDDに格納される。上記の各種機能は、CPU、メモリ等のハードウエアとOS及び必要なアプリケーションプログラムとを有機的に協働させることにより実現される。
 以上のように、この実施形態の情報検索システムによれば、上記の構成を備えることによって、複数の地区で共通に用いられる場合でも高速な検索が可能である。
 以上、図示例に基づいて説明したが、本開示は上記の実施形態に限定されず、要旨を逸脱しない範囲において各種の改良及び変更を行うことができる。
 本開示よれば、複数の地区で共通に用いられる場合でも高速な検索が可能な情報検索システムを提供することができる。
 10 情報検索装置
 12 データベース
 14 入力装置
 16 表示装置
 18 ネットワーク
 20 検索者側端末
 22 入力装置
 24 表示装置
 26 質問文章受付部
 28 自然言語処理部
 30 共通キーワード辞書
 32 検索候補キーワード読出部
 34 検索キーワード記憶部
 36 情報種類判断部
 38 情報種類判断用辞書
 40 検索実行部
 42 検索候補キーワード変更要望受付部
 44 入力検索キーワード抽出部
 46 情報種類判断用キーワード抽出部
 100 ローカル管理装置
 102 ローカルキーワード辞書
 104 ローカルデータベース
 110 情報管理装置
 112 一時記憶部

Claims (7)

  1.  テキスト検索可能な複数の情報を格納するデータベースと、
     自然言語形式の質問文章を受け付ける質問文章受付部と、
     前記質問文章から入力検索キーワードを抽出する入力検索キーワード抽出部と、
     前記入力検索キーワード及び前記入力検索キーワードに関連するキーワードを用いて前記データベースに対して検索処理を実行する検索実行部と、
     地区の資料をローカルデータベースに格納するローカル管理装置と、
     前記ローカルデータベースに格納された前記資料に対して文字抽出処理及び前記資料のサイズに応じたファイル形式の変換を実行し、格納用資料として一時記憶部に記憶し、前記格納用資料を前記データベースに出力する情報管理装置と、を備える、情報検索システム。
  2.  前記情報管理装置は、前記資料のサイズが閾値以下である場合に、前記資料を第1のファイル形式に変換し、前記資料のサイズが閾値以下でない場合に、前記資料を前記ローカルデータベースへのリンク情報を含む第2のファイル形式に変換する、請求項1に記載の情報検索システム。
  3.  前記ローカルデータベースは、前記データベースと同じ階層構造を有する、請求項1又は2に記載の情報検索システム。
  4.  前記ローカル管理装置は複数の地区のそれぞれにあって、ネットワークを介して前記情報管理装置と接続される、請求項1から3のいずれか一項に記載の情報検索システム。
  5.  前記情報管理装置は、前記資料が文字情報を含まない場合に、前記資料のファイル名及びフォルダパスを文字情報として抽出する前記文字抽出処理を実行する、請求項1から4のいずれか一項に記載の情報検索システム。
  6.  前記データベースは、言語検索処理用データベースと、前記一時記憶部より取得した資料を保存するファイル記憶領域と、を含んで構成される、請求項1から5のいずれか一項に記載の情報検索システム。
  7.  前記一時記憶部と、前記データベースに含まれる前記ファイル記憶領域とは、同じ階層構造を用いてファイル管理が行われる、請求項6に記載の情報検索システム。
PCT/JP2021/019885 2020-05-28 2021-05-25 情報検索システム WO2021241602A1 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
EP21813981.4A EP4145302A4 (en) 2020-05-28 2021-05-25 INFORMATION SEARCH SYSTEM
US17/999,850 US20230222145A1 (en) 2020-05-28 2021-05-25 Information search system
MX2022014969A MX2022014969A (es) 2020-05-28 2021-05-25 Sistema de busqueda de informacion.
KR1020227041836A KR20230003182A (ko) 2020-05-28 2021-05-25 정보 검색 시스템
CN202180036732.4A CN115668175A (zh) 2020-05-28 2021-05-25 信息检索系统
JP2021559003A JP7004122B1 (ja) 2020-05-28 2021-05-25 情報検索システム
BR112022023835A BR112022023835A2 (pt) 2020-05-28 2021-05-25 Sistema de busca de informações

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-093683 2020-05-28
JP2020093683 2020-05-28

Publications (1)

Publication Number Publication Date
WO2021241602A1 true WO2021241602A1 (ja) 2021-12-02

Family

ID=78744417

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/019885 WO2021241602A1 (ja) 2020-05-28 2021-05-25 情報検索システム

Country Status (9)

Country Link
US (1) US20230222145A1 (ja)
EP (1) EP4145302A4 (ja)
JP (1) JP7004122B1 (ja)
KR (1) KR20230003182A (ja)
CN (1) CN115668175A (ja)
BR (1) BR112022023835A2 (ja)
MX (1) MX2022014969A (ja)
TW (1) TWI769835B (ja)
WO (1) WO2021241602A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003114855A (ja) * 2001-10-04 2003-04-18 Sharp Corp ネットワークスキャナ
JP2005165986A (ja) * 2003-12-05 2005-06-23 Mitsubishi Heavy Ind Ltd 電子ファイリングシステム及び電子ファイルの表示方法
JP2005182280A (ja) * 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
JP2009110231A (ja) * 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
US20090313574A1 (en) * 2008-06-16 2009-12-17 Microsoft Corporation Mobile document viewer

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9213709B2 (en) * 2012-08-08 2015-12-15 Amazon Technologies, Inc. Archival data identification
TWI497035B (zh) * 2012-12-04 2015-08-21 Chunghwa Wideband Best Network Co Ltd 地理資訊快速查找與瀏覽系統
TWI578175B (zh) * 2012-12-31 2017-04-11 威盛電子股份有限公司 檢索方法、檢索系統以及自然語言理解系統
US9912625B2 (en) * 2014-11-18 2018-03-06 Commvault Systems, Inc. Storage and management of mail attachments
JP6072334B1 (ja) * 2016-06-09 2017-02-01 株式会社Cygames 情報処理システム及び方法、並びにプログラム
JP6947155B2 (ja) 2018-01-05 2021-10-13 Jfeスチール株式会社 情報検索システム
TWI698756B (zh) * 2018-11-08 2020-07-11 中華電信股份有限公司 查詢服務之系統與方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003114855A (ja) * 2001-10-04 2003-04-18 Sharp Corp ネットワークスキャナ
JP2005165986A (ja) * 2003-12-05 2005-06-23 Mitsubishi Heavy Ind Ltd 電子ファイリングシステム及び電子ファイルの表示方法
JP2005182280A (ja) * 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
JP2009110231A (ja) * 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
US20090313574A1 (en) * 2008-06-16 2009-12-17 Microsoft Corporation Mobile document viewer

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ETO, AYAKA ET AL.: "Development of Control Maintenance Support System", JFE TECHNICAL REPORT, 28 February 2020 (2020-02-28), pages 54 - 58, XP009540855 *
See also references of EP4145302A4 *

Also Published As

Publication number Publication date
EP4145302A4 (en) 2023-11-01
JP7004122B1 (ja) 2022-01-21
TWI769835B (zh) 2022-07-01
CN115668175A (zh) 2023-01-31
MX2022014969A (es) 2023-01-11
KR20230003182A (ko) 2023-01-05
US20230222145A1 (en) 2023-07-13
EP4145302A1 (en) 2023-03-08
BR112022023835A2 (pt) 2022-12-20
JPWO2021241602A1 (ja) 2021-12-02
TW202147145A (zh) 2021-12-16

Similar Documents

Publication Publication Date Title
CN109992645B (zh) 一种基于文本数据的资料管理系统及方法
US9639609B2 (en) Enterprise search method and system
EP1745396B1 (en) Document information mining tool
US20040024778A1 (en) System for indexing textual and non-textual files
EP2506208A1 (en) Forensic system and forensic method, and forensic program
US10372718B2 (en) Systems and methods for enterprise data search and analysis
US10915543B2 (en) Systems and methods for enterprise data search and analysis
JP2019121392A (ja) 情報検索システム
TWI682286B (zh) 利用文字解析結果與自然語言輸入的文件搜尋系統
EP3553696B1 (en) Generating a structured document based on a machine readable document and artificial intelligence-generated annotations
JP7004122B1 (ja) 情報検索システム
WO2021241601A1 (ja) 情報検索システム
JP7004123B1 (ja) 情報検索システム
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
US7386794B2 (en) Apparatus and method for performing the management of operation history
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
CN115269848A (zh) 一种科技文献数据分类方法
JP2990314B2 (ja) データ管理装置
JPH0981581A (ja) データベースの作成方法
Garg Cross Lingual Information Retrieval and Error Tracking in search engine
Palmer CSE 400 Professor: Camillo J. Taylor Advisor: Pat Palmer April 11, 2005
JP2001331512A (ja) 文書管理方法
JP2003167767A (ja) ファイル管理方法と装置、ファイル検索方法と装置

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2021559003

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21813981

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20227041836

Country of ref document: KR

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2021813981

Country of ref document: EP

Effective date: 20221128

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112022023835

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112022023835

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20221123

NENP Non-entry into the national phase

Ref country code: DE