WO2021192050A1 - 分析支援プログラム、システム、及び方法 - Google Patents

分析支援プログラム、システム、及び方法 Download PDF

Info

Publication number
WO2021192050A1
WO2021192050A1 PCT/JP2020/013068 JP2020013068W WO2021192050A1 WO 2021192050 A1 WO2021192050 A1 WO 2021192050A1 JP 2020013068 W JP2020013068 W JP 2020013068W WO 2021192050 A1 WO2021192050 A1 WO 2021192050A1
Authority
WO
WIPO (PCT)
Prior art keywords
feature amount
words
word
idea information
idea
Prior art date
Application number
PCT/JP2020/013068
Other languages
English (en)
French (fr)
Inventor
広司 平松
村瀬 太一
聡一 西山
太郎 小田切
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to PCT/JP2020/013068 priority Critical patent/WO2021192050A1/ja
Priority to JP2022509843A priority patent/JPWO2021192050A1/ja
Publication of WO2021192050A1 publication Critical patent/WO2021192050A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Definitions

  • the disclosed technology relates to analysis support programs, analysis support systems, and analysis support methods.
  • the KJ method is a method of analyzing a large amount of ideas by writing ideas one by one on one sheet of paper, moving the position of each sheet of paper, and organizing the whole from a bird's-eye view.
  • the relationships between ideas are visualized and analyzed by taking steps of grouping, labeling, illustration, and writing for various ideas. Each of these steps is generally performed by a person in charge who is familiar with the purpose of analysis and analysis methods such as the KJ method.
  • a classification processing device that extracts an appropriate classification ontology from a document to be classified and performs optimum classification.
  • This device stores words or compound words included in a predetermined keyword source document in advance as a classification ontology in relation to a specific field.
  • this device analyzes the text data corresponding to the document to be classified, extracts the words or compound words included in the document to be classified as the words to be classified, compares the classification ontology and the words to be classified, and classifies them. Determine the classification to which the target document belongs.
  • an idea support system has been proposed in which keywords based on word sets are automatically attached to documents and the relationships between documents are presented based on an automatically structured document set.
  • This system structures the dictionary created by the dictionary generating means, and structures the document set in the information storage means and the selected document set.
  • this system displays the processing results of each of the word set structuring means and the document set structuring means.
  • the disclosed technology aims to support analysis by appropriately classifying multiple ideas according to the purpose of analysis.
  • the disclosed technology accepts a plurality of idea information indicating an idea described including one or more words. Further, the disclosed technique is based on a plurality of types of databases in which a synthetic feature amount obtained by synthesizing a feature amount based on each meaning of a word included in the idea information and a feature amount based on the word and the meaning of the word are associated with each other. Compare with the features of words contained in the selected database. Then, the disclosed technique presents one or more words related to the plurality of idea information from the words included in the selected database. Further, the disclosed technique selects each of the plurality of idea information based on the degree of similarity between the feature amount of one or more words selected from the presented words and the feature amount of each of the idea information. Correspond to the word that was given.
  • the analysis support system 10 functionally includes a reception unit 12, a presentation unit 14, and a classification unit 16. Further, the type-specific DB (Database) 20 is stored in the predetermined storage area of the analysis support system 10.
  • the reception unit 12 receives a target file in which a plurality of idea information (hereinafter, referred to as "idea information group") indicating an idea described including one or more words is stored.
  • a target file in which a plurality of idea information (hereinafter, referred to as "idea information group") indicating an idea described including one or more words is stored.
  • Each of the idea information is, for example, as shown in FIG. 2, text data in which an idea number, which is identification information of each idea, is added to each of a plurality of ideas obtained by brainstorming.
  • the file format of the target file 30 may be any format that can process data, such as CSV format, XML format, and text format.
  • the reception unit 12 displays the reception screen 32 as shown in FIG. 3 on the display unit provided in the analysis support system 10 and receives the target file 30 in which the idea information group is stored.
  • the reception screen 32 includes a text box 34 for designating the target file 30 and a decision button 36 for instructing the reading of the designated target file 30.
  • the reception unit 12 performs morphological analysis and other vocabulary processing on each of the plurality of idea information included in the received target file 30, and extracts a predetermined word.
  • the reception unit 12 extracts a predetermined word according to a predetermined extraction rule, such as a noun or adjective, a content word, or a word whose part of speech does not correspond to a predetermined exclusion word.
  • a predetermined extraction rule such as a noun or adjective, a content word, or a word whose part of speech does not correspond to a predetermined exclusion word.
  • the reception unit 12 derives a feature amount based on the meaning of each of the extracted words.
  • the feature amount of the word is shown in the parentheses after the word.
  • the reception unit 12 can extract, for example, a feature amount (hereinafter, also referred to as “word vector”) of a vector expression by Word2Vec.
  • the reception unit 12 derives a synthetic feature amount for the idea information group from the feature amount of each word extracted from each of the plurality of idea information. For example, when the reception unit 12 derives a word vector as a feature amount of each word, the reception unit 12 derives the composite feature amount by synthesizing the word vector for each word.
  • the reception unit 12 passes the derived synthetic feature amount to the presentation unit 14, and delivers the word extracted from each idea information and the feature amount of the word to the classification unit 16.
  • the presentation unit 14 is based on the synthetic feature amount passed from the reception unit 12 and the feature amount of the word included in the database selected from the type-specific DB 20, and the idea information is derived from the words included in the selected database. Present one or more words associated with the group.
  • the words included in the database will be referred to as "DB words" in order to distinguish them from the words included in the idea information.
  • the type-specific DB 20 includes a plurality of types of databases in which words extracted from a predetermined document set and features based on the meaning of the words in the predetermined document set are associated with each other.
  • the type of database differs depending on what kind of document set the database is based on, depending on the purpose of analysis of the idea information group.
  • Document sets represent, for example, corporate web pages, online dictionaries such as Wikipedia (registered trademark), document sets in specific fields such as patent documents, databases of newspaper articles, and ideas obtained in past workshops. It can be a set of idea information.
  • a company's web page can include a company that performs business related to the purpose of analysis, a company that conducts a workshop, and the like.
  • FIG. 5 shows an example of DB20 by type.
  • the type-specific DB 20 includes a database 21 generated from an online dictionary and a database 22 generated from a Web page of company A. Since the original document sets of the databases 21 and 22 are different, the words included in the databases 21 and 22 are different. Further, even if the same words are included in the databases 21 and 22 (“environment” in the example of FIG. 5), the original document sets for deriving the features are different, so that the databases have different features. In some cases.
  • the presentation unit 14 displays, for example, the selection screen 38 as shown in FIG. 6 on the display unit included in the analysis support system 10, and is information for identifying the database selected by the user. Accept selection information.
  • the selection screen 38 includes a selection area 40 including a selection component such as a radio button for selecting one of a plurality of databases included in the type-specific DB 20, and an analysis start button 42. Is included.
  • the analysis start button 42 is selected, the presentation unit 14 receives DB selection information for identifying the database selected in the selection area 40.
  • the presentation unit 14 compares the synthetic feature amount of the idea information group passed from the reception unit 12 with the feature amount of each DB word included in the selected database, and gives an idea. Extract DB words related to the information group. For example, the presentation unit 14 extracts DB words whose feature quantities have a certain degree of similarity equal to or higher than a predetermined value or a higher predetermined number. As shown in D of FIG. 4, the presentation unit 14 presents the extracted DB word as a word list 44. The extracted DB words are displayed in the word list 44 in a selectable state.
  • the presentation unit 14 may display the DB words to be displayed in the word list 44 in descending order of the degree of similarity between the feature amount and the synthetic feature amount of the DB word. Further, as shown in FIG. 7, the presentation unit 14 may display the DB words displayed in the word list 44 by leveling them based on the degree of similarity with the synthetic feature amount.
  • FIG. 7 shows an example in which DB words having a feature amount similarity equal to or higher than a predetermined value or a higher predetermined number are displayed by leveling them into high, medium, and low relevance levels in descending order of similarity. ..
  • the classification unit 16 selects each of the plurality of idea information based on the similarity between the feature amount of one or more DB words selected from the word list 44 and each feature amount of each idea information. Correspond to a word.
  • the classification unit 16 receives word selection information for identifying a DB word selected from the word list 44. For example, in the word list 44 shown in FIG. 4 or FIG. 7, the DB words “environment” and “system” are selected, and in this case, the classification unit 16 uses the words “environment” and “system”. Accept as selection information.
  • the classification unit 16 may accept not only the DB word presented by the word list 44 but also a word arbitrarily input by the user as word selection information.
  • the classification unit 16 derives the feature amount of each idea information based on the word extracted from each idea information and the feature amount of the word passed from the reception unit 12.
  • the feature amount of each idea information is the feature amount of the word included in each idea information, and when the idea information includes a plurality of words, the feature amount of each of the plurality of words is combined. ..
  • the classification unit 16 associates each idea information with a DB word having a higher degree of similarity to the feature amount of each idea information among each of the DB words indicated by the word selection information. In this way, each idea information is classified. It should be noted that the idea information whose similarity is equal to or less than a predetermined value with the feature amount of any DB word may be treated as unclassified without being associated with any DB word.
  • the classification is classified into the idea information of idea numbers 1 and 4 associated with the DB word "environment" and the idea information of idea numbers 3 and 5 associated with the DB word "system”. The result 46 is shown. The idea information of idea number 2 is unclassified.
  • the classification unit 16 outputs the classification result 46.
  • the classification result 46 is not limited to the above example.
  • the classification unit 16 sets the similarity between the feature amount of the idea information and the feature amount of the DB word in the similarity space having the similarity degree with two or more DB words as each axis among the selected DB words. Based on this, each of the plurality of idea information may be associated with each other. For example, as shown in FIG. 9, the classification unit 16 prepares a similarity space having each of the DB words “environment” and “system” as two axes.
  • the classification unit 16 has a degree of similarity between the feature amount of the idea information and the feature amount of the DB word "environment”, and a similarity degree corresponding to the degree of similarity between the feature amount of the idea information and the feature amount of the DB word "system”.
  • Symbols, marks, icons, etc. indicating each idea information are arranged at positions on the space to obtain the classification result 46.
  • FIG. 9 shows an example of a two-axis similarity space, it may be a three-axis or more similarity space.
  • the classification unit 16 may output information related to the idea information group together with the classification result 46 of each of the plurality of idea information. For example, as shown in FIG. 10, the classification unit 16 can also present the output information 48 including the classification result 46 by adding the information of the related idea 50 and the related word 52.
  • the related idea 50 can be presented using, for example, a card prepared in advance in which the idea or the information supporting the idea is described including one or more words.
  • Each card is associated with a feature amount according to the information indicated by the card.
  • the feature amount can be a combination of the feature amount of each word included in the card, similarly to the feature amount of each idea information described above.
  • the classification unit 16 presents a card associated with a feature amount whose similarity with the feature amount of the DB word selected from the word list 44 is equal to or more than a predetermined value from a plurality of cards prepared in advance. can do.
  • the card may include an illustration showing the information written on the card.
  • the related word 52 may be, for example, a DB word included in the selected database and having a feature amount whose similarity with the feature amount of the word selected from the word list 44 is equal to or more than a predetermined value. can.
  • the idea By outputting information related to the idea information group such as the related idea 50 and the related word 52 described above together with the classification result 46, the idea can be developed when analyzing the idea information group based on the classification result 46. , It is possible to output useful information for summarizing.
  • the analysis support system 10 can be realized by, for example, the computer 60 shown in FIG.
  • the computer 60 includes a CPU (Central Processing Unit) 61, a memory 62 as a temporary storage area, and a non-volatile storage unit 63. Further, the computer 60 includes an input / output device 64 such as an input unit and a display unit, and an R / W (Read / Write) unit 65 that controls reading and writing of data to the storage medium 69. Further, the computer 60 includes a communication I / F (Interface) 66 connected to a network such as the Internet.
  • the CPU 61, the memory 62, the storage unit 63, the input / output device 64, the R / W unit 65, and the communication I / F 66 are connected to each other via the bus 67.
  • the storage unit 63 can be realized by an HDD (Hard Disk Drive), an SSD (Solid State Drive), a flash memory, or the like.
  • the storage unit 63 as a storage medium stores an analysis support program 70 for causing the computer 60 to function as the analysis support system 10.
  • the analysis support program 70 has a reception process 72, a presentation process 74, and a classification process 76.
  • the storage unit 63 has an information storage area 80 in which information constituting the type-specific DB 20 is stored.
  • the CPU 61 reads the analysis support program 70 from the storage unit 63, expands it into the memory 62, and sequentially executes the processes included in the analysis support program 70.
  • the CPU 61 operates as the reception unit 12 shown in FIG.
  • the CPU 61 operates as the presentation unit 14 shown in FIG. 1 by executing the presentation process 74.
  • the CPU 61 operates as the classification unit 16 shown in FIG. 1 by executing the classification process 76.
  • the CPU 61 reads information from the information storage area 80 and expands the selected database among the databases included in the type-specific DB 20 into the memory 62.
  • the computer 60 that has executed the analysis support program 70 functions as the analysis support system 10.
  • the CPU 61 that executes the program is hardware.
  • the functions realized by the analysis support program 70 can also be realized by, for example, a semiconductor integrated circuit, more specifically, an ASIC (Application Specific Integrated Circuit) or the like.
  • a semiconductor integrated circuit more specifically, an ASIC (Application Specific Integrated Circuit) or the like.
  • the analysis support process is an example of an analysis support method of the disclosed technology.
  • step S12 the reception unit 12 displays, for example, the reception screen 32 as shown in FIG. 3 on the display unit included in the analysis support system 10, and receives the target file 30 in which the idea information group is stored.
  • step S14 the reception unit 12 morphologically analyzes each of the plurality of idea information contained in the received target file 30, extracts a predetermined word, and determines the meaning of each of the extracted words. Derivation of features based on. Then, the reception unit 12 derives a synthetic feature amount for the idea information group from the feature amount of each word extracted from each of the plurality of idea information. The reception unit 12 passes the derived synthetic feature amount to the presentation unit 14, and passes the word extracted from each idea information and the feature amount of the word to the classification unit 16.
  • step S16 the presentation unit 14 displays, for example, the selection screen 38 as shown in FIG. 6 on the display unit included in the analysis support system 10, and uses information for identifying the database selected by the user. Accepts certain DB selection information.
  • step S18 the presentation unit 14 calculates the degree of similarity between the synthetic feature amount of the idea information group passed from the reception unit 12 and the feature amount of each DB word included in the selected database. Then, the presentation unit 14 extracts the DB words whose similarity between the synthetic feature amount and the DB feature amount is equal to or higher than a predetermined value or a higher predetermined number, and presents the extracted DB words as a word list 44.
  • step S20 the classification unit 16 receives word selection information for identifying the DB word selected from the word list 44.
  • step S22 the classification unit 16 derives the feature amount of each idea information based on the word extracted from each idea information and the feature amount of the word passed from the reception unit 12. Then, the classification unit 16 selects each of the plurality of idea information based on the similarity between the feature amount of the DB word selected from the word list 44 in step S20 and each feature amount of each idea information. Classification is performed by associating with the DB word, and the classification result 46 is output.
  • step S24 it is determined whether or not the classification unit 16 has received the instruction to change the selection of the DB word. This determination can be determined, for example, by whether or not an instruction to display the word list 44 has been accepted. When the instruction to change the selection of the DB word is received, the process returns to step S20. This makes it possible to easily perform trial and error in classifying the idea information. If the instruction to change the selection of the DB word is not accepted, the analysis support process ends.
  • the analysis support system accepts a plurality of idea information indicating an idea described by including one or more words, and is based on the meaning of each of the words included in the idea information.
  • a composite feature quantity is derived by synthesizing the feature quantity.
  • the DB word related to the idea information group is selected from the DB word included in the selected database.
  • each of the plurality of idea information is associated with the selected DB word based on the degree of similarity between the feature amount of one or more DB words selected from the presented DB words and the feature amount of each idea information. Classify by. As a result, it is possible to appropriately classify a plurality of ideas according to the purpose of the analysis and support the analysis.
  • the DB words presented as the word list are also different, and the DB words selected from the DB words are also different.
  • the feature amount may be different because the type of the document set that is the source of the database is different. Therefore, as shown in FIG. 13, different classification results 46 are output according to the selected database and the selected DB word even in the same idea information group.
  • the present invention is not limited to this.
  • it can be applied when analyzing various opinions and ideas such as analysis of questionnaire responses.
  • the analysis support system may be further configured to include a plurality of display devices and an information processing device that controls the display on the display devices.
  • the information selected from the idea information, the related idea, the related word, etc. displayed in the output information as shown in FIG. 10 may be transferred to another display device and displayed.
  • the idea information and the related words may be displayed as a card in the same manner as the related ideas. As a result, it becomes possible to further discuss and use the cards displayed on other display devices.
  • a plurality of databases may be selected.
  • a plurality of selected databases may be integrated to present DB words having a feature amount similar to the synthetic feature amount of the idea information group.
  • the mode in which the analysis support program is stored (installed) in the storage unit in advance has been described, but the present invention is not limited to this.
  • the program according to the disclosed technique can also be provided in a form stored in a storage medium such as a CD-ROM, a DVD-ROM, or a USB memory.
  • Analysis support system 12 Reception department 14 Presentation department 16 Classification department 20 DB by type 21, 22 Database 30 Target file 32 Reception screen 38 Selection screen 44 Word list 46 Classification result 50 Related ideas 52 Related words 60 Computer 61 CPU 62 Memory 63 Storage unit 69 Storage medium 70 Analysis support program

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

発想情報群に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、DB単語とそのDB単語の意味に基づく特徴量とを対応付けた複数種類のデータベース(21、22)から選択されたデータベースに含まれるDB単語の特徴量とに基づいて、選択されたデータベースに含まれるDB単語から、発想情報群に関連するDB単語を提示し、提示したDB単語から選択された1以上のDB単語の特徴量と、各発想情報の特徴量との類似度に基づいて、複数の発想情報の各々を、選択されたDB単語に対応付けることにより分類する。同じ発想情報群であっても、選択するデータベース及び選択するDB単語に応じて、異なる分類結果(46)が出力されることになり、複数の発想を分析の目的に応じて適切に分類し、分析を支援する。

Description

分析支援プログラム、システム、及び方法
 開示の技術は、分析支援プログラム、分析支援システム、及び分析支援方法に関する。
 ワークショップやブレインストーミングなどで大量に出たアイデアや意見(以下、「発想」という)を、KJ法等を用いて整序し、問題解決に結びつけていくことが行われている。KJ法とは、1枚の紙に1つずつ発想を書き込んでいき、それぞれの紙の位置を移動させながら、全体を俯瞰して整理整頓することにより、大量の発想を分析する方法である。KJ法では、様々な発想に対して、グループ化、ラベル化、図解化、及び文章化のステップを踏むことで、発想間の関係性を視覚化し、分析が行われる。この各ステップは、分析の目的や、KJ法等の分析手法に精通した担当者等により行われることが一般的である。
 また、文書の分類及び分析に関しては、従来から様々な手法が提案されている。例えば、分類対象の文書から適当な分類オントロジーを抽出して、最適な分類を行う分類処理装置が提案されている。この装置は、所定のキーワード元文書に含まれる単語又は複合語を特定の分野に関連させて予め分類オントロジーとして記憶している。また、この装置は、分類対象の文書に対応するテキストデータを解析し、当該分類対象の文書に含まれる単語又は複合語を分類対象語句として抽出し、分類オントロジー及び分類対象語句を比較し、分類対象の文書が属する分類を判別する。
 また、単語集合によるキーワードを自動的に文書に付け、自動的に構造化された文書集合に基づいて文書間の関連性を提示する発想支援システムが提案されている。このシステムは、辞書生成手段が作成した辞書を構造化し、情報蓄積手段内の文書集合及び選択された文書集合を構造化する。また、このシステムは、単語集合構造化手段及び文書集合構造化手段のそれぞれの処理結果を表示する。
特開2003-108569号公報 特開平8-329106号公報
 上述したように、様々な発想を分析するためには、分析の目的や、KJ法等の分析手法に精通した担当者等により、グループ化、ラベル化、類似単語特定等のステップを踏む必要がある。また、大量の発想の分類に、上述の従来技術のような文書を分類する手法を適用した場合には、分析の目的に応じた適切な分類が行えない場合がある。
 一つの側面として、開示の技術は、複数の発想を分析の目的に応じて適切に分類し、分析を支援することを目的とする。
 一つの態様として、開示の技術は、1以上の単語を含んで記述された発想を示す複数の発想情報を受け付ける。また、開示の技術は、前記発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、単語と前記単語の意味に基づく特徴量とを対応付けた複数種類のデータベースから選択されたデータベースに含まれる単語の特徴量とを比較する。そして、開示の技術は、前記選択されたデータベースに含まれる単語から、前記複数の発想情報に関連する1以上の単語を提示する。さらに、開示の技術は、提示した単語から選択された1以上の単語の特徴量と、前記発想情報の各々の特徴量との類似度に基づいて、前記複数の発想情報の各々を、前記選択された単語に対応付ける。
 一つの側面として、複数の発想を分析の目的に応じて適切に分類し、分析を支援することができる、という効果を有する。
本実施形態に係る分析支援システムの機能ブロック図である。 発想情報群を示す対象ファイルの一例を示す図である。 受付画面の一例を示す図である。 単語リストの提示を説明するための図である。 種類別DBの一例を示す図である。 選択画面の一例を示す図である。 単語リストの他の例を示す図である。 分類結果を説明するための図である。 分類結果の他の例を示す図である。 分類結果を含む出力情報の一例を示す図である。 本実施形態に係る分析支援システムとして機能するコンピュータの概略構成を示すブロック図である。 本実施形態における分析支援処理の一例を示すフローチャートである。 同じ発想情報群に対して、異なるデータベースが選択された場合の分類結果を説明するための図である。
 以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。以下の実施形態では、ワークショップやブレインストーミングにより得られたアイデアや意見等の発想の分析を支援する場合について説明する。
 図1に示すように、本実施形態に係る分析支援システム10は、機能的には、受付部12と、提示部14と、分類部16とを含む。また、分析支援システム10の所定の記憶領域には、種類別DB(Database)20が記憶される。
 受付部12は、1以上の単語を含んで記述された発想を示す複数の発想情報(以下、「発想情報群」という)が記憶された対象ファイルを受け付ける。発想情報の各々は、例えば、図2に示すように、ブレインストーミングで得られた複数の発想の各々に、各発想の識別情報である発想番号を付与したテキストデータである。対象ファイル30のファイル形式は、CSV形式、XML形式、テキスト形式等、データ処理可能な形式であればよい。
 受付部12は、例えば、図3に示すような受付画面32を分析支援システム10が備える表示部に表示して、発想情報群が記憶された対象ファイル30を受け付ける。図3の例では、受付画面32には、対象ファイル30を指定するテキストボックス34、及び指定した対象ファイル30の読み込みを指示するための決定ボタン36が含まれている。
 また、受付部12は、受け付けた対象ファイル30に含まれる複数の発想情報の各々を形態素解析等の単語化処理を実施し、所定の単語を抽出する。例えば、受付部12は、品詞が名詞又は形容詞、内容語、予め定めた除外単語に該当しない単語等、予め定めた抽出ルールで所定の単語を抽出する。受付部12は、図4のAに示すように、抽出した単語の各々について、その単語の意味に基づく特徴量を導出する。図4では、単語の後のかっこ書きの中に、その単語の特徴量を表記している。受付部12は、例えば、Word2Vecによるベクトル表現の特徴量(以下、「単語ベクトル」とも言う)を抽出することができる。
 さらに、受付部12は、図4のBに示すように、複数の発想情報の各々から抽出した各単語の特徴量から、発想情報群についての合成特徴量を導出する。例えば、受付部12は、各単語の特徴量として単語ベクトルを導出している場合、各単語についての単語ベクトルを合成することにより、合成特徴量を導出する。
 受付部12は、導出した合成特徴量を提示部14へ受け渡し、各発想情報から抽出した単語とその単語の特徴量とを分類部16へ受け渡す。
 提示部14は、受付部12から受け渡された合成特徴量と、種類別DB20から選択されたデータベースに含まれる単語の特徴量とに基づいて、選択されたデータベースに含まれる単語から、発想情報群に関連する1以上の単語を提示する。以下では、データベースに含まれる単語を、発想情報に含まれる単語と区別するため、「DB単語」と表記する。
 種類別DB20には、所定の文書集合から抽出された単語と、所定の文書集合内におけるその単語の意味に基づく特徴量とを対応付けたデータベースが複数種類含まれる。データベースの種類は、発想情報群の分析の目的に応じて、どのような文書集合に基づいて生成されたデータベースかにより異なる。文書集合は、例えば、企業のウェブページ、ウィキペディア(登録商標)等のオンライン辞書、特許文献等の特定分野の文書集合、新聞記事のデータベース、過去に行われたワークショップで得られた発想を示す発想情報の集合等とすることができる。企業のウェブページには、分析の目的に関連する業務を行う企業や、ワークショップを行う対象の企業等のウェブページを含めることができる。
 図5に、種類別DB20の一例を示す。図5の例では、種類別DB20は、オンライン辞書から生成されたデータベース21、企業Aのウェブページから生成されたデータベース22が含まれている。各データベース21、22は、元となる文書集合が異なるため、データベース21、22に含まれる単語は異なる。また、各データベース21、22に同一の単語が含まれているとしても(図5の例では「環境」)、特徴量を導出するための元の文書集合が異なるため、それぞれ異なる特徴量を持つ場合がある。
 具体的には、提示部14は、例えば、図6に示すような選択画面38を分析支援システム10が備える表示部に表示して、ユーザにより選択されたデータベースを特定するための情報であるDB選択情報を受け付ける。図6の例では、選択画面38には、種類別DB20に含まれる複数のデータベースからいずれかのデータベースを選択するための、ラジオボタン等の選択部品を含む選択領域40と、分析開始ボタン42とが含まれる。分析開始ボタン42が選択されると、提示部14は、選択領域40で選択されているデータベースを特定するためのDB選択情報を受け付ける。
 提示部14は、図4のCに示すように、受付部12から受け渡された発想情報群の合成特徴量と、選択されたデータベースに含まれる各DB単語の特徴量とを比較し、発想情報群に関連するDB単語を抽出する。例えば、提示部14は、特徴量の類似度が所定値以上、又は上位所定個となるDB単語を抽出する。提示部14は、図4のDに示すように、抽出したDB単語を単語リスト44として提示する。単語リスト44には、抽出されたDB単語が選択可能な状態で表示される。
 なお、提示部14は、単語リスト44に表示するDB単語を、そのDB単語の特徴量と合成特徴量との類似度が高い順に並べて表示してもよい。さらに、提示部14は、図7に示すように、単語リスト44に表示するDB単語を、合成特徴量との類似度に基づいてレベル分けして表示してもよい。図7では、特徴量の類似度が所定値以上、又は上位所定個となるDB単語を、さらに類似度が高い順に、関連度高、中、低にレベル分けして表示した例を示している。
 分類部16は、単語リスト44から選択された1以上のDB単語の特徴量と、各発想情報の各々の特徴量との類似度に基づいて、複数の発想情報の各々を、選択されたDB単語に対応付ける。
 具体的には、分類部16は、単語リスト44から選択されたDB単語を特定するための単語選択情報を受け付ける。例えば、図4又は図7に示す単語リスト44では、DB単語「環境」及び「制度」が選択された状態を示しており、この場合、分類部16は、「環境」及び「制度」を単語選択情報として受け付ける。なお、分類部16は、単語リスト44により提示されたDB単語だけでなく、ユーザにより任意に入力された単語を単語選択情報として受け付けてもよい。
 また、分類部16は、受付部12から受け渡された、各発想情報から抽出した単語とその単語の特徴量とに基づいて、各発想情報の特徴量を導出する。各発想情報の特徴量は、各発想情報に含まれる単語の特徴量であり、発想情報に複数の単語が含まれる場合には、その複数の単語の各々の特徴量を合成した特徴量である。
 分類部16は、図8に示すように、単語選択情報が示すDB単語の各々のうち、各発想情報の特徴量との類似度がより高いDB単語に各発想情報を対応付ける。これにより、各発想情報を分類する。なお、いずれのDB単語の特徴量とも類似度が所定値以下となる発想情報については、いずれのDB単語にも対応付けることなく、未分類として扱ってもよい。図8の例では、DB単語「環境」に対応付けられた発想番号1及び4の発想情報と、DB単語「制度」に対応付けられた発想番号3及び5の発想情報とに分類された分類結果46を示している。なお、発想番号2の発想情報は未分類となっている。分類部16は、分類結果46を出力する。
 なお、分類結果46は、上記の例に限定されない。例えば、分類部16は、選択されたDB単語のうち、2以上のDB単語との類似度を各軸とする類似度空間に、発想情報の特徴量とDB単語の特徴量との類似度に基づいて、複数の発想情報の各々を対応付けてもよい。例えば、図9に示すように、分類部16は、DB単語「環境」及び「制度」の各々を2軸とする類似度空間を用意する。そして、分類部16は、発想情報の特徴量とDB単語「環境」の特徴量との類似度、及び発想情報の特徴量とDB単語「制度」の特徴量との類似度に対応する類似度空間上の位置に、各発想情報を示す記号、マーク、アイコン等を配置し分類結果46とする。なお、図9では、2軸の類似度空間の例を示しているが、3軸以上の類似度空間であってもよい。
 また、分類部16は、複数の発想情報の各々の分類結果46と共に、発想情報群に関連する情報を出力するようにしてもよい。例えば、図10に示すように、分類部16は、分類結果46を含む出力情報48に、関連アイデア50及び関連単語52の情報を加えて提示することもできる。
 関連アイデア50は、例えば、発想又は発想を支援する情報が1以上の単語を含んで記述された、予め用意されたカードを用いて提示することができる。各カードには、カードが示す情報に応じた特徴量を対応付けておく。特徴量は、上記の各発想情報の特徴量と同様に、カードに含まれる各単語の特徴量を合成したものとすることができる。分類部16は、例えば、予め用意された複数のカードの中から、単語リスト44から選択されたDB単語の特徴量との類似度が所定値以上となる特徴量が対応付けられたカードを提示することができる。なお、カードには、図10に示すように、カードに記述された情報を示すイラストが含まれていてもよい。
 関連単語52は、例えば、選択されたデータベースに含まれるDB単語であって、単語リスト44から選択された単語の特徴量との類似度が所定値以上となる特徴量を持つ単語とすることができる。
 上記の関連アイデア50及び関連単語52のような、発想情報群に関連する情報を分類結果46と共に出力することで、分類結果46に基づいて発想情報群を分析する際に、発想を発展させたり、まとめたりするための有用な情報を出力することができる。
 分析支援システム10は、例えば図11に示すコンピュータ60で実現することができる。コンピュータ60は、CPU(Central Processing Unit)61と、一時記憶領域としてのメモリ62と、不揮発性の記憶部63とを備える。また、コンピュータ60は、入力部、表示部等の入出力装置64と、記憶媒体69に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)部65とを備える。また、コンピュータ60は、インターネット等のネットワークに接続される通信I/F(Interface)66を備える。CPU61、メモリ62、記憶部63、入出力装置64、R/W部65、及び通信I/F66は、バス67を介して互いに接続される。
 記憶部63は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部63には、コンピュータ60を、分析支援システム10として機能させるための分析支援プログラム70が記憶される。分析支援プログラム70は、受付プロセス72と、提示プロセス74と、分類プロセス76とを有する。また、記憶部63は、種類別DB20を構成する情報が記憶される情報記憶領域80を有する。
 CPU61は、分析支援プログラム70を記憶部63から読み出してメモリ62に展開し、分析支援プログラム70が有するプロセスを順次実行する。CPU61は、受付プロセス72を実行することで、図1に示す受付部12として動作する。また、CPU61は、提示プロセス74を実行することで、図1に示す提示部14として動作する。また、CPU61は、分類プロセス76を実行することで、図1に示す分類部16として動作する。また、CPU61は、情報記憶領域80から情報を読み出して、種類別DB20に含まれるデータベースのうち、選択されたデータベースをメモリ62に展開する。これにより、分析支援プログラム70を実行したコンピュータ60が、分析支援システム10として機能することになる。なお、プログラムを実行するCPU61はハードウェアである。
 なお、分析支援プログラム70により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
 次に、本実施形態に係る分析支援システム10の作用について説明する。分析支援システム10において、分析支援処理の開始が指示されると、分析支援システム10が、図12に示す分析支援処理を実行する。なお、分析支援処理は、開示の技術の分析支援方法の一例である。
 ステップS12で、受付部12が、例えば、図3に示すような受付画面32を分析支援システム10が備える表示部に表示して、発想情報群が記憶された対象ファイル30を受け付ける。
 次に、ステップS14で、受付部12が、受け付けた対象ファイル30に含まれる複数の発想情報の各々を形態素解析し、所定の単語を抽出し、抽出した単語の各々について、その単語の意味に基づく特徴量を導出する。そして、受付部12が、複数の発想情報の各々から抽出した各単語の特徴量から、発想情報群についての合成特徴量を導出する。受付部12は、導出した合成特徴量を提示部14へ受け渡し、各発想情報から抽出した単語とその単語の特徴量とを分類部16へ受け渡す。
 次に、ステップS16で、提示部14が、例えば、図6に示すような選択画面38を分析支援システム10が備える表示部に表示して、ユーザにより選択されたデータベースを特定するための情報であるDB選択情報を受け付ける。
 次に、ステップS18で、提示部14が、受付部12から受け渡された発想情報群の合成特徴量と、選択されたデータベースに含まれる各DB単語の特徴量との類似度を算出する。そして、提示部14が、合成特徴量とDB特徴量との類似度が所定値以上、又は上位所定個となるDB単語を抽出し、抽出したDB単語を単語リスト44として提示する。
 次に、ステップS20で、分類部16が、単語リスト44から選択されたDB単語を特定するための単語選択情報を受け付ける。
 次に、ステップS22で、分類部16が、受付部12から受け渡された、各発想情報から抽出した単語とその単語の特徴量とに基づいて、各発想情報の特徴量を導出する。そして、分類部16が、上記ステップS20で単語リスト44から選択されたDB単語の特徴量と、各発想情報の各々の特徴量との類似度に基づいて、複数の発想情報の各々を、選択されたDB単語に対応付けることにより分類し、分類結果46を出力する。
 次に、ステップS24で、分類部16が、DB単語の選択を変更する指示を受け付けたか否かを判定する。この判定は、例えば、単語リスト44を表示する指示を受け付けたか否かにより判定することができる。DB単語の選択を変更する指示を受け付けた場合には、処理はステップS20に戻る。これにより、発想情報の分類の試行錯誤を容易に行うことができる。DB単語の選択を変更する指示を受け付けていない場合には、分析支援処理は終了する。
 以上説明したように、本実施形態に係る分析支援システムによれば、1以上の単語を含んで記述された発想を示す複数の発想情報を受け付け、発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量を導出する。そして、複数種類のデータベースから選択されたデータベースに含まれるDB単語の特徴量と合成特徴量との類似度に基づいて、選択されたデータベースに含まれるDB単語から、発想情報群に関連するDB単語を提示する。また、提示したDB単語から選択された1以上のDB単語の特徴量と、各発想情報の特徴量との類似度に基づいて、複数の発想情報の各々を、選択されたDB単語に対応付けることにより分類する。これにより、複数の発想を分析の目的に応じて適切に分類し、分析を支援することができる。
 例えば、本実施形態に係る分析支援システムによれば、選択するデータベースが異なる場合には、単語リストとして提示されるDB単語も異なることとなり、そこから選択されるDB単語も異なる。また、同一のDB単語が選択されたとしても、データベースの元となる文書集合の種類が異なるため、その特徴量が異なる場合もある。そのため、図13に示すように、同じ発想情報群であっても、選択するデータベース及び選択するDB単語に応じて、異なる分類結果46が出力されることになる。
 なお、上記実施形態では、ワークショップ等のブレインストーミングにより得られた発想の分析を支援する場合について説明したが、これに限定されない。例えば、アンケートの回答の分析等、様々な意見やアイデアを分析する場合に適用することができる。
 また、上記実施形態では、分析支援システムが1つのコンピュータで実現されている場合について説明したが、各機能構成をそれぞれ異なるコンピュータで実現した分散構成としてもよい。また、分析支援システムは、複数の表示装置、及びそれらの表示装置への表示を制御する情報処理装置をさらに含んで構成されてもよい。この場合、例えば、図10に示すような出力情報に表示された発想情報、関連アイデア、関連単語等から選択された情報を、他の表示装置に転送して表示するようにしてもよい。この際、発想情報及び関連単語についても、関連アイデアと同様にカードとして表示するようにしてもよい。これにより、他の表示装置に表示されたカードに基づいて、さらに議論を行う等の利用が可能となる。
 また、上記実施形態では、種類別DBから1つのデータベースを選択する場合について説明したが、複数のデータベースを選択するようにしてもよい。この場合、選択された複数のデータベースを統合して、発想情報群の合成特徴量と類似する特徴量を持つDB単語を提示するようにすればよい。
 また、上記実施形態では、分析支援プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD-ROM、DVD-ROM、USBメモリ等の記憶媒体に記憶された形態で提供することも可能である。
10   分析支援システム
12   受付部
14   提示部
16   分類部
20   種類別DB
21、22    データベース
30   対象ファイル
32   受付画面
38   選択画面
44   単語リスト
46   分類結果
50   関連アイデア
52   関連単語
60   コンピュータ
61   CPU
62   メモリ
63   記憶部
69   記憶媒体
70   分析支援プログラム

Claims (20)

  1.  1以上の単語を含んで記述された発想を示す複数の発想情報を受け付け、
     前記発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、単語と前記単語の意味に基づく特徴量とを対応付けた複数種類のデータベースから選択されたデータベースに含まれる単語の特徴量とに基づいて、前記選択されたデータベースに含まれる単語から、前記複数の発想情報に関連する1以上の単語を提示し、
     提示した単語から選択された1以上の単語の特徴量と、前記発想情報の各々の特徴量との類似度に基づいて、前記複数の発想情報の各々を、前記選択された単語に対応付ける
     ことを含む処理をコンピュータに実行させるための分析支援プログラム。
  2.  前記複数種類のデータベースの各々に含まれる単語は、発想情報の分析の目的に応じた複数種類の文書集合の各々に含まれる単語である請求項1に記載の分析支援プログラム。
  3.  前記複数種類の文書集合は、企業のウェブページ、オンライン辞書、特定分野の文書集合、新聞記事のデータベース、及び過去に行われたワークショップで出た発想を示す発想情報の集合の少なくとも1つを含む請求項2に記載の分析支援プログラム。
  4.  前記発想情報に関連する1以上の単語を提示する際、提示する単語の特徴量と前記合成特徴量との類似度が高い順に所定個の単語を提示する請求項1~請求項3のいずれか1項に記載の分析支援プログラム。
  5.  前記所定個の単語を、前記合成特徴量との類似度に基づいてレベル分けして提示する請求項4に記載の分析支援プログラム。
  6.  単語の選択が変更される都度、前記複数の発想情報の各々の、前記選択された単語への対応付けを変更する請求項1~請求項5のいずれか1項に記載の分析支援プログラム。
  7.  前記複数の発想情報の各々を前記選択された単語に対応付けることは、前記選択された単語のうち、2以上の単語の特徴量と発想情報の特徴量との類似度を各軸とする類似度空間に、前記選択された単語の特徴量と前記発想情報の特徴量との類似度に基づいて、前記複数の発想情報の各々を対応付けることを含む請求項1~請求項6のいずれか1項に記載の分析支援プログラム。
  8.  前記複数の発想情報の各々の分類結果と共に、前記選択されたデータベースに含まれる単語であって、前記選択された単語の特徴量との類似度が所定値以上となる特徴量を持つ単語を提示する請求項1~請求項7のいずれか1項に記載の分析支援プログラム。
  9.  前記複数の発想情報の各々の分類結果と共に、予め用意された発想又は発想を支援する情報であって、1以上の単語を含んで記述されたカードのうち、前記選択された単語の特徴量との類似度が所定値以上となる特徴量を持つカードを提示する請求項1~請求項8のいずれか1項に記載の分析支援プログラム。
  10.  1以上の単語を含んで記述された発想を示す複数の発想情報を受け付ける受付部と、
     前記発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、単語と前記単語の意味に基づく特徴量とを対応付けた複数種類のデータベースから選択されたデータベースに含まれる単語の特徴量とに基づいて、前記選択されたデータベースに含まれる単語から、前記複数の発想情報に関連する1以上の単語を提示する提示部と、
     提示した単語から選択された1以上の単語の特徴量と、前記発想情報の各々の特徴量との類似度に基づいて、前記複数の発想情報の各々を、前記選択された単語に対応付ける分類部と、
     を含む分析支援システム。
  11.  前記複数種類のデータベースの各々に含まれる単語は、発想情報の分析の目的に応じた複数種類の文書集合の各々に含まれる単語である請求項10に記載の分析支援システム。
  12.  前記複数種類の文書集合は、企業のウェブページ、オンライン辞書、特定分野の文書集合、新聞記事のデータベース、及び過去に行われたワークショップで出た発想を示す発想情報の集合の少なくとも1つを含む請求項11に記載の分析支援システム。
  13.  前記提示部は、前記発想情報に関連する1以上の単語を提示する際、提示する単語の特徴量と前記合成特徴量との類似度が高い順に所定個の単語を提示する請求項10~請求項12のいずれか1項に記載の分析支援システム。
  14.  前記提示部は、前記所定個の単語を、前記合成特徴量との類似度に基づいてレベル分けして提示する請求項13に記載の分析支援システム。
  15.  前記分類部は、単語の選択が変更された場合に、前記複数の発想情報の各々の、前記選択された単語への対応付けを変更する請求項10~請求項14のいずれか1項に記載の分析支援システム。
  16.  前記分類部は、前記選択された単語のうち、2以上の単語の特徴量と発想情報の特徴量との類似度を各軸とする類似度空間に、前記選択された単語の特徴量と前記発想情報の特徴量との類似度に基づいて、前記複数の発想情報の各々を対応付ける請求項10~請求項15のいずれか1項に記載の分析支援システム。
  17.  前記分類部は、前記複数の発想情報の各々の分類結果と共に、前記選択されたデータベースに含まれる単語であって、前記選択された単語の特徴量との類似度が所定値以上となる特徴量を持つ単語を提示する請求項10~請求項16のいずれか1項に記載の分析支援システム。
  18.  前記分類部は、前記複数の発想情報の各々の分類結果と共に、予め用意された発想又は発想を支援する情報であって、1以上の単語を含んで記述されたカードのうち、前記選択された単語の特徴量との類似度が所定値以上となる特徴量を持つカードを提示する請求項10~請求項17のいずれか1項に記載の分析支援システム。
  19.  1以上の単語を含んで記述された発想を示す複数の発想情報を受け付け、
     前記発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、単語と前記単語の意味に基づく特徴量とを対応付けた複数種類のデータベースから選択されたデータベースに含まれる単語の特徴量とに基づいて、前記選択されたデータベースに含まれる単語から、前記複数の発想情報に関連する1以上の単語を提示し、
     提示した単語から選択された1以上の単語の特徴量と、前記発想情報の各々の特徴量との類似度に基づいて、前記複数の発想情報の各々を、前記選択された単語に対応付ける
     ことを含む処理をコンピュータが実行する分析支援方法。
  20.  1以上の単語を含んで記述された発想を示す複数の発想情報を受け付け、
     前記発想情報に含まれる単語の各々の意味に基づく特徴量を合成した合成特徴量と、単語と前記単語の意味に基づく特徴量とを対応付けた複数種類のデータベースから選択されたデータベースに含まれる単語の特徴量とに基づいて、前記選択されたデータベースに含まれる単語から、前記複数の発想情報に関連する1以上の単語を提示し、
     提示した単語から選択された1以上の単語の特徴量と、前記発想情報の各々の特徴量との類似度に基づいて、前記複数の発想情報の各々を、前記選択された単語に対応付ける
     ことを含む処理をコンピュータに実行させるための分析支援プログラムを記憶した記憶媒体。
PCT/JP2020/013068 2020-03-24 2020-03-24 分析支援プログラム、システム、及び方法 WO2021192050A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2020/013068 WO2021192050A1 (ja) 2020-03-24 2020-03-24 分析支援プログラム、システム、及び方法
JP2022509843A JPWO2021192050A1 (ja) 2020-03-24 2020-03-24

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/013068 WO2021192050A1 (ja) 2020-03-24 2020-03-24 分析支援プログラム、システム、及び方法

Publications (1)

Publication Number Publication Date
WO2021192050A1 true WO2021192050A1 (ja) 2021-09-30

Family

ID=77891142

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/013068 WO2021192050A1 (ja) 2020-03-24 2020-03-24 分析支援プログラム、システム、及び方法

Country Status (2)

Country Link
JP (1) JPWO2021192050A1 (ja)
WO (1) WO2021192050A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157261A (ja) * 2000-11-22 2002-05-31 Fujitsu Ltd アイデアバンキング方法および記録媒体
JP2013127684A (ja) * 2011-12-16 2013-06-27 Kyocera Document Solutions Inc データ処理プログラム、及びデータ処理装置
JP2017059077A (ja) * 2015-09-18 2017-03-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125454A (ja) * 2011-12-15 2013-06-24 Azbil Corp 発想支援装置、方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157261A (ja) * 2000-11-22 2002-05-31 Fujitsu Ltd アイデアバンキング方法および記録媒体
JP2013127684A (ja) * 2011-12-16 2013-06-27 Kyocera Document Solutions Inc データ処理プログラム、及びデータ処理装置
JP2017059077A (ja) * 2015-09-18 2017-03-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム

Also Published As

Publication number Publication date
JPWO2021192050A1 (ja) 2021-09-30

Similar Documents

Publication Publication Date Title
US20240152559A1 (en) Related notes and multi-layer search in personal and shared content
Žižka et al. Text mining with machine learning: principles and techniques
Neudecker et al. A survey of OCR evaluation tools and metrics
US9558271B1 (en) Ontology development for profile matching
US20110202528A1 (en) System and method for identifying fresh information in a document set
US11714963B2 (en) Content modification using natural language processing to include features of interest to various groups
Sulova et al. Using text mining to classify research papers
Baquero et al. Predicting the programming language: Extracting knowledge from stack overflow posts
US20060242113A1 (en) Cybernetic search with knowledge maps
JP2006323517A (ja) テキスト分類装置およびプログラム
Hasugian et al. Implementation of Tf-Idf and cosine similarity algorithms for classification of documents based on abstract scientific journals
WO2008062822A1 (fr) Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte
US20200293581A1 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
KR20230057114A (ko) 기술 문서 데이터 베이스를 통한 키워드 도출 방법 및 장치
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
WO2021192050A1 (ja) 分析支援プログラム、システム、及び方法
Junger Automation first–the subject cataloguing policy of the Deutsche Nationalbibliothek
CN112949287B (zh) 热词挖掘方法、系统、计算机设备和存储介质
JP3929418B2 (ja) 情報探索プログラム及び情報探索プログラムを記録した媒体
Pokorny Automatic subject indexing and classification using text recognition and computer-based analysis of tables of contents
EP3261053A1 (en) Information processing device, method, and program
US20120047128A1 (en) Open class noun classification
Alvares et al. Sentiment analysis using opinion mining
Das et al. Prioritizing Public Grievance Redressal Using Text Mining and Sentimental Analysis
JP2019197459A (ja) 案件振分支援システム、案件振分支援装置、及び案件振分支援方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20927864

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022509843

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20927864

Country of ref document: EP

Kind code of ref document: A1