JP7117044B1 - 発想支援プログラム及び方法 - Google Patents

発想支援プログラム及び方法 Download PDF

Info

Publication number
JP7117044B1
JP7117044B1 JP2021189051A JP2021189051A JP7117044B1 JP 7117044 B1 JP7117044 B1 JP 7117044B1 JP 2021189051 A JP2021189051 A JP 2021189051A JP 2021189051 A JP2021189051 A JP 2021189051A JP 7117044 B1 JP7117044 B1 JP 7117044B1
Authority
JP
Japan
Prior art keywords
information data
terms
topics
limited
specific target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021189051A
Other languages
English (en)
Other versions
JP2022117931A (ja
Inventor
成年 川上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Application granted granted Critical
Publication of JP2022117931A publication Critical patent/JP2022117931A/ja
Publication of JP7117044B1 publication Critical patent/JP7117044B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】発想を支援することができる発想支援プログラム及びその方法を提供する。【解決手段】発想支援プログラムは、特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、潜在的ディリクレ配分法により、第1情報データにおける、複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する処理と、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する処理とを実行させる。【選択図】図2

Description

本発明は、発想支援プログラム及び方法に関する。
特許文献1には、発想支援プログラムが開示されている。
特許第6830636号公報
特許文献1では、コーディングルール処理が設定されている。しかしながら、複数のコードの各々に対応した複数の用語を抽出してコーディングルールを設定する処理は難易度が高い場合があるという課題がある。
本発明は、このような従来の問題を解決するためになされたもので、発想を支援することを目的とする。
本発明は、コンピュータに、特定対象について取得された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、潜在的ディリクレ配分法により、第1情報データにおける、特定対象に特有の複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する処理と、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する処理とを実行させる発想支援プログラムである。
本発明は、コンピュータが、特定対象について取得された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出し、潜在的ディリクレ配分法により、第1情報データにおける、特定対象に特有の複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出し、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する発想支援方法である。
本発明の発想支援プログラム及び方法によれば、発想を支援することができる。
発想支援プログラムを実行する装置のブロック図 発想支援プログラムの処理を示すフローチャート トピックとそれに対応する抽出語の集合の一例を示す図 第2情報データから生成された共起ネットワークを示す図
以下、実施形態である発想支援プログラム及びその方法について、図を参照して詳細に説明をする。なお、実施形態では、特定の掃除機メーカーA社の新規用途の発想支援を行う例を示すが、分析対象はこれに限られず、分析目的に応じて、品質、状態、ニーズ、便益、機構、部品、機能、効果、構成、構造、用途等の発想を支援することでもよい。
図1は、実施形態の発想支援プログラムを実行するための情報処理装置のブロック図である。
システムバス108を介して、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、HDD(Hard Disk Drive)105、外部I/F(Interface)106、及び、入力部107が接続される。CPU101とROM102とRAM103とで制御部104を構成する。
ROM102は、CPU101により実行されるプログラムや閾値を予め記憶する。ROM102は、後述する第1情報データや第2情報データを記憶する。
RAM103は、CPU101が実行するプログラムを展開するエリアと、プログラムによるデータ処理の作業領域となるワークエリアなどの様々なメモリエリア等を有する。RAM103は、後述する第1情報データや第2情報データを記憶してもよい。
HDD105は、入力部107から入力された第1情報データや第2情報データ等のテキストデータ(自然言語文データ)等を記憶する。なお、第1情報データや第2情報データは外部I/F106を介して、外部装置から取得してもよい。
外部I/F106は、例えばクライアント端末(PC)などの外部装置と通信するためのインターフェースである。外部I/F106は、外部装置とデータ通信を行うインターフェースであれば良く、たとえば、外部装置にローカルに接続する機器(USBメモリ等)であってもよいし、有線又は無線ネットワークを介して通信するためのネットワークインターフェースであってもよい。
外部I/F106は、液晶ディスプレイ等の表示装置(不図示)と接続する。外部I/F106は、個人が所有するスマートフォン、タブレット等の携帯端末に接続する。
入力部107は、キーボード、マウス、スキャナ(読取装置)等の入力装置である。
図2は、実施形態の発想支援プログラムの処理手順を示すフローチャートである。実施形態では、分析対象を特定の掃除機メーカーとした場合の発想支援について説明する。もちろん、分析対象はこれに限られない。
まず、特定対象に限定した第1情報データを取得する(STEP1)。実施形態では、第1情報データを、J-PlatPatなどの特許情報データベースから取得する。実施形態では、検索対象を特定の掃除機メーカーとした検索によりヒットした特許出願のうち、938件の特許出願の要約書を分析の対象とした。なお、抽出する件数は938件に限られず、解析目的に応じて増減させて良い。また、分析対象は要約書に限られず明細書本文でもよいし、請求の範囲でもよい。
なお、実施形態では、第1情報データを特許情報データベースから取得するが、情報の取得源はこれに限られず、クレーム情報、顧客レビュー、顧客アンケート、顧客インタビュー、公開技報、マニュアル、単行本、国内技術雑誌、非技術雑誌、外国学会論文、国内学会論文、企業技報、団体機関誌、予稿集、及び、J-GLOBAL等の自然言語文の技術情報が集約されたデータベース、などからも適宜取得してもよい。
第1情報データは、ROM102やRAM103やHDD105に記憶される。
制御部104は、第1情報データ938件について形態素解析処理を実行する(STEP2)。これにより、第1情報データ938件のテキスト全体から分析対象となる多数の用語(第1用語)を抽出する処理を実行する。
形態素解析とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報に基づき、形態素(言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する処理のことをいう。
次に、制御部104は、潜在的ディリクレ配分法により、第1情報データにおける、分析対象に特有の複数のトピックと、複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する(STEP3)。
潜在的ディリクレ配分法(Latent Dirichlet Allocation、以下LDAともいう。)とは、1つの文章が複数の潜在的トピックから確率的に生成されると仮定した言語モデルの一種である。文書内の各単語はあるトピックが持つ確率分布に従って出現すると仮定される。LDAでは、トピックごとに単語の出現頻度分布を想定することで、トピック間の類似性やその意味を解析できる。
LDAでは、文章(ここでは、多数の自然言語文からなる第1情報データ)を形態素解析した後に、コーパスを作成し、トピック分類する処理を実行する。LDA処理は、PythonライブラリのGensim等のLDAアルゴリズムを有するソフトウェアを使用すれば実行可能である。なお、トピック抽出処理はLDAに限られず、その他のモデルを使用しても良い。
図3は、LDA処理にて出力されたトピックとそれに対応する抽出語(第1用語)の集合の一例を示す。図に示すように、LDA処理にて複数のトピック(topic#1~#14)が抽出されるとともに、トピック毎に対して出現頻度の高い順に用語(第1用語)の集合が抽出される(ここでは、トピック毎に出現頻度順に各5個の用語が抽出されている。)。このようにして、第1情報データから、複数のトピック(#1~#14)と、当該複数のトピックの各々に対応する5つの用語の集合が抽出される。なお、用語の数は5つに限られず、目的に応じて適宜増減させてよい。また、トピックの数は14に限られず、目的に応じて増減させて良い。図では、わかりやすさのため、topic#1~#14には、それぞれ「制御性」、「格納性」等の名称をつけている。これらトピックは、特定の掃除機メーカーA社の製品に存在する特有の特徴的なトピックといえる。
抽出されたトピック、及び、トピック毎の出現頻度順の複数の用語は、ROM102やRAM103やHDD105に記憶される。
次に、上記特定対象(ここではA社)に限定しない第2情報データを取得する(STEP4)。実施形態では、第2情報データを、J-PlatPatなどの特許情報データベースから取得する。
実施形態では、検索対象を特定の掃除機メーカー以外の任意の対象も含む検索によりヒットした特許出願のうち2989件の特許出願を分析の対象とした。なお、抽出する件数は2989件に限られず、多いことが好ましい。すなわち、第2情報データは、第1情報データより、多数の自然言語文からなることが好ましい。これにより、A社に限定されない大量の情報データから、幅広くアイデアを抽出することができる。
検索対象については特定の掃除機メーカーを含んでも含まなくてもよく、特定の掃除機メーカー以外の技術からも幅広くアイデアを抽出することが好ましい。すなわち、第2情報データは、第1情報データ以外の技術や用途に関する自然言語文を含むことが好ましい。第2情報データは、ROM102やRAM103やHDD105に記憶される。
なお、実施形態では、第2情報データを特許情報データベースから取得するが、情報の取得源はこれに限られず、クレーム情報、顧客レビュー、顧客アンケート、顧客インタビュー、公開技報、マニュアル、単行本、国内技術雑誌、非技術雑誌、外国学会論文、国内学会論文、企業技報、団体機関誌、予稿集、及び、J-GLOBAL等の技術情報が集約されたデータベース、などからも適宜取得してもよい。
制御部104は、第2情報データ2989件について形態素解析処理を実行する(STEP5)。これにより、第2情報データのテキスト全体から分析対象となる用語(第2用語)を抽出する処理を実行する。
なお、発明の発想、用途の発想を行う場合には、特許情報を取得・処理することでもよく、潜在ニーズの発想を行う場合には、アンケートデータやレビューデータを取得・処理することでもよい。
制御部104は、STEP5で形態素解析により抽出された用語(第2用語)と、特定の掃除機メーカー特有の複数のトピック(#1~#14)の各々における複数の第1用語との共起関係を抽出する(STEP6)。
図4の共起ネットワークは、掃除機メーカーA社特有のトピック「分離性」とトピック「清浄性」に含まれる用語(第1用語)と、STEP5で形態素解析処理により第2情報データから抽出された用語(第2用語)とのJaccard係数を計算して生成されたものである。共起性の尺度は、Jaccard係数に限られない。例えば、Dice係数やSimpson係数や共起頻度やコサイン距離やユークリッド距離でもよい。
図4は、第2情報データ中の用語とトピック「分離性」とトピック「清浄性」との共起ネットワークを示す。図4に示すように、トピック「分離性」とトピック「清浄性」を構成する用語(第1用語:図中の四角で囲われた文字)と共起する第2情報データ中の用語(第2用語:図中の丸で囲われた文字)は大量に存在する。これら多数の用語は、トピック「分離性」とトピック「清浄性」と何らかの共起関係を有する用語といえる。実施形態で収集した特許情報は特定の掃除機メーカーの業務範囲以外の対象を含むことから、特定の掃除機メーカーの業務範囲に限定されることなく幅広い用語が抽出されていることがわかる。
なお、図4は、トピック「分離性」と「清浄性」(に含まれる用語)と共起する用語の関係を図示した共起ネットワークを示すが、発想や分析の目的に応じて、共起ネットワークを生成するトピックを単数・複数・多数、適宜選択して共起関係を抽出してもよい。例えば、トピック「格納性」及び「制御性」を加えて共起関係を抽出してもよいし、すべてのトピックとの共起関係を抽出してもよいし、ひとつのトピックとの共起関係を抽出してもよい。
図に示すように、トピック「分離性」、「清浄性」に関連する用語として、「エアシャワー装置」や「換気装置」があることがわかる(図中の矢印A、B)。例えば、この「エアシャワー装置」や「換気装置」という用語を、A社の製品に存在するトピック「分離性」、「清浄性」を適用できる新規用途の候補として発想するヒントとすることができる。このように、特定の掃除機メーカーA社の製品に存在する特有のトピックと共起する、特定の掃除機メーカーA社に限定されない第2用語を抽出することにより、発想を支援することができる。
以上、実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
101 CPU、102 ROM、103 RAM、104 制御部、105 HDD、106 外部I/F、107 入力部、108 システムバス

Claims (2)

  1. コンピュータに、
    特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、
    潜在的ディリクレ配分法により、前記第1情報データにおける、前記特定対象に特有の複数のトピックの各々におけ前記複数の第1用語を抽出する処理と、
    前記特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、前記特定対象に特有の前記複数のトピックの各々における前記複数の第1用語に共起する、前記第2情報データ中の第2用語を表示する処理と、
    を実行させる発想支援プログラム。
  2. コンピュータが、
    特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出し、
    潜在的ディリクレ配分法により、前記第1情報データにおける、前記特定対象に特有の複数のトピックの各々におけ前記複数の第1用語を抽出し、
    前記特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、前記特定対象に特有の前記複数のトピックの各々における前記複数の第1用語に共起する、前記第2情報データ中の第2用語を表示する、発想支援方法。
JP2021189051A 2021-01-31 2021-11-19 発想支援プログラム及び方法 Active JP7117044B1 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2021014051 2021-01-31
JP2021014051 2021-01-31
JP2021026867 2021-02-23
JP2021026849 2021-02-23
JP2021026849 2021-02-23
JP2021026867 2021-02-23

Publications (2)

Publication Number Publication Date
JP2022117931A JP2022117931A (ja) 2022-08-12
JP7117044B1 true JP7117044B1 (ja) 2022-08-12

Family

ID=82750345

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021189051A Active JP7117044B1 (ja) 2021-01-31 2021-11-19 発想支援プログラム及び方法
JP2021214359A Pending JP2022117938A (ja) 2021-01-31 2021-12-28 情報マップ生成プログラム及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021214359A Pending JP2022117938A (ja) 2021-01-31 2021-12-28 情報マップ生成プログラム及び方法

Country Status (1)

Country Link
JP (2) JP7117044B1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007060780A1 (ja) 2005-11-22 2007-05-31 Nec Corporation 発想支援装置、発想支援方法および発想支援用プログラム
JP2012014476A (ja) 2010-07-01 2012-01-19 National Institute Of Information & Communication Technology 類似度算出装置、類似度算出方法、及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6586614B1 (ja) * 2019-02-22 2019-10-09 成年 川上 特許マップ生成プログラム及びその方法
JP2021047469A (ja) * 2019-09-15 2021-03-25 成年 川上 特許マップ生成プログラム及びその方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007060780A1 (ja) 2005-11-22 2007-05-31 Nec Corporation 発想支援装置、発想支援方法および発想支援用プログラム
JP2012014476A (ja) 2010-07-01 2012-01-19 National Institute Of Information & Communication Technology 類似度算出装置、類似度算出方法、及びプログラム

Also Published As

Publication number Publication date
JP2022117931A (ja) 2022-08-12
JP2022117938A (ja) 2022-08-12

Similar Documents

Publication Publication Date Title
JP6783483B2 (ja) 表示装置
US20200342181A1 (en) Method and system for automatic formality classification
US20190163691A1 (en) Intent Based Dynamic Generation of Personalized Content from Dynamic Sources
Tanaka-Ishii et al. Computational constancy measures of texts—Yule's K and Rényi's entropy
Chen et al. Mining user requirements to facilitate mobile app quality upgrades with big data
JP5379138B2 (ja) 領域辞書の作成
US10346546B2 (en) Method and system for automatic formality transformation
JP6705318B2 (ja) 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム
Pavan Kumar et al. Novel text preprocessing framework for sentiment analysis
Kristensson et al. A design engineering approach for quantitatively exploring context-aware sentence retrieval for nonspeaking individuals with motor disabilities
US9772991B2 (en) Text extraction
Meetei et al. Low resource language specific pre-processing and features for sentiment analysis task
Elnagar et al. Comparative study of sentiment classification for automated translated Latin reviews into Arabic
Hara et al. Evaluating the impact of re-training a lexical disambiguation model on domain adaptation of an HPSG parser
Kumova Metin et al. Measuring collocation tendency of words
JP7117044B1 (ja) 発想支援プログラム及び方法
Patel et al. Influence of Gujarati STEmmeR in supervised learning of web page categorization
CN108763258B (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
JP7351502B2 (ja) 変数データ生成装置、予測モデル生成装置、変数データ生産方法、予測モデル生産方法、プログラム及び記録媒体
Chen et al. An opinion mining framework for Cantonese reviews
JP2022042030A (ja) 情報処理システム、及び情報処理プログラム
Alian et al. Unsupervised learning blocking keys technique for indexing Arabic entity resolution
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JP2020149539A (ja) 対話型システムの支援装置、及び対話型システムの支援方法
Oco et al. Resources for Philippine languages: Collection, annotation, and modeling

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211119

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R150 Certificate of patent or registration of utility model

Ref document number: 7117044

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150