JPWO2020039871A1 - 探索システムおよび探索方法 - Google Patents

探索システムおよび探索方法 Download PDF

Info

Publication number
JPWO2020039871A1
JPWO2020039871A1 JP2020538267A JP2020538267A JPWO2020039871A1 JP WO2020039871 A1 JPWO2020039871 A1 JP WO2020039871A1 JP 2020538267 A JP2020538267 A JP 2020538267A JP 2020538267 A JP2020538267 A JP 2020538267A JP WO2020039871 A1 JPWO2020039871 A1 JP WO2020039871A1
Authority
JP
Japan
Prior art keywords
search
graph
relationship
physical characteristic
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020538267A
Other languages
English (en)
Other versions
JP7026973B2 (ja
Inventor
道子 吉武
道子 吉武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute for Materials Science
Original Assignee
National Institute for Materials Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute for Materials Science filed Critical National Institute for Materials Science
Publication of JPWO2020039871A1 publication Critical patent/JPWO2020039871A1/ja
Application granted granted Critical
Publication of JP7026973B2 publication Critical patent/JP7026973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24526Internal representations for queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases

Abstract

関係性が既に知られた物性パラメータ対のデータベースから、物性パラメータをノード、その関係性をエッジとするグラフを生成し、生成したグラフの経路探索をする探索システムにおいて、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を有効活用する。【解決手段】探索システムは、上記データベースと、上記グラフを生成するグラフ生成部と、上記グラフに対する探索を実行するグラフ探索部に加えて、ユーザーインターフェースと、各ユーザーに対応するユーザー情報蓄積部とをさらに備える。ユーザーは独自に持つ物性パラメータ間の関係性情報をユーザー情報蓄積部に入力し、その関係性情報を上記グラフに統合することにより、ユーザーに固有の探索を実行する。また、ユーザーが実施した探索の履歴をユーザー情報蓄積部に蓄積し、その探索履歴を解析することによって、ユーザーに新たな知見を提供することができる。

Description

本発明は、データベースを使った探索システムおよび探索方法に関し、特に複数の物性パラメータの間の関係性の探索に好適に利用できるものである。
材料研究における予測や設計の目標は、目的の特性を持つ材料を特定することである。このために旧来から多用されてきた手法は、条件−特性チャートから目的の特性を持つ材料の特定を目指す手法である。これは複数の条件のうち特定の1つの条件のみを変化させたときの特性の変化を観測してチャートを作成し、そのチャートを補間または外挿することによって、目的の特性を持つ条件を求め、それに合致する材料を特定する方法である。ここでいう「チャート」とは、折れ線グラフ等を表す「グラフ」と同義であるが、後述する、ノードとエッジから成る「グラフ」と区別する目的で別の語を用いる。
このとき、複数の条件のうち特定の1つの条件のみを変化させたときの特性の変化は、自ら実験を行って入手することが多い。多数の文献を調査しても上記特定の条件以外の条件がすべて同じであるデータを大量に入手することは困難だからである。
特許文献1には、所望の特性を有する新規材料の構成物質情報を、客観的に探索することが可能な探索システムが開示されている。
同文献に開示される探索システムは、複数(多数)の物質についてそれぞれ複数の物性パラメータ情報を有するデータベースを備える。このとき、データベースには、物質によっては実データが与えられていない物性パラメータがあってもよい。検索対象の物性パラメータを1つの軸とし、他の物性パラメータの一部をその他の軸として、2次元または3次元以上の空間を作成して、上記データベース内の各物質をマッピングする。このとき、実データのない物性パラメータについては、多変量解析、所定の論理式に基づく計算、または、第1原理計算などを使って予測した仮想データによって補う。実データと仮想データをマッピングして得られた探索マップにおいて、予め規定したルールに基づいて、所望の特性を有する物質を特定するとされる。
特許文献2には、複数の物性パラメータの任意の組合せのうち、既に知られている関係性に基づいて、有意な関係性を有する、物性パラメータの未知の組合せを探索することができる、探索システム及び探索方法が開示されている。この探索システムは、データベースとグラフ生成部とグラフ探索部とを備え、以下のように構成される。データベースは、互いに関係性を有する物性パラメータの複数の対を記憶し、グラフ生成部は、データベースに記憶された複数の物性パラメータをノードとし、関係性を有すると記憶された物性パラメータ対に対応するノード間をエッジとする、グラフを生成する。グラフ探索部は、与えられる探索条件に基づいてグラフ生成部から生成されたグラフを探索し、探索結果を出力する。
特開2007−18444号公報 国際公開第WO2017/221444号
特許文献1及び2について本発明者が検討した結果、以下のような新たな課題があることがわかった。
特許文献1に記載される技術では、仮想データを予測するために、複数の物性パラメータ相互の関係性を利用するが、その関係性は既に知られている関係性に限られることとなる。
これに対し本願の発明者は、多数の技術分野を横断的に見た場合には、物性パラメータの数が非常に多くなるため、関係性の有無に依らない任意の組合せの中から、未知の、しかし有意な関係性を抽出することが可能であることを見出し、その解決方法として特許文献2に記載される探索システムを提案した。
特許文献2に示される探索システム及び探索方法によれば、相互に関係性の低い分野を含むあらゆる分野を横断的に探索することができ、もって有意な関係性を有する物性パラメータの未知の組合せを抽出することができる。
本発明者は、従来の探索システムでは、ユーザーが探索式等の探索条件を与えて探索結果を得る受動的な利用態様に留まり、ユーザーがインタラクティブに探索に関与する利用態様が十分ではなく、ユーザーが独自に持つ知見を探索に利用することができないという課題があることを新たに見出した。
例えば、ユーザーが独自にデータベースを有している場合であっても、当該探索システムにおいては、そのデータベースを有効に活用することができないという課題がある。特許文献2に示されるなどの探索システムでは、できる限り多くの分野において知られている物性パラメータの関係性が含まれていることが前提となる。換言すれば、ユーザーに提供される探索範囲は、システム側が備えているデータベースに制限されるからである。
また、ユーザーは探索の目的を達するために一定の仮説のもとで複数回の探索を繰り返すことが多いが、その仮説の背景となったユーザー独自の知見は、目的達成のための探索の効率化(例えば探索回数の低減)などには活かすことができない。ただしこの場合、ユーザーの知見は明確になっていない場合が多い。
本発明の目的は、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる探索システム及び探索方法を提供することである。
このような課題を解決するための手段を以下に説明するが、その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
一実施の形態によれば、下記の通りである。
すなわち、データベースとグラフ生成部とグラフ探索部とを備える探索システムであって、以下のように構成される。
データベースは、互いに関係性を有する物性パラメータの複数の対を記憶し、グラフ生成部は、データベースに記憶された複数の物性パラメータをノードとし、関係性を有すると記憶された物性パラメータ対に対応するノード間をエッジとする、グラフを生成する。グラフ探索部は、与えられる探索条件に基づいてグラフ生成部から生成されたグラフを探索し、探索結果を出力する。
探索システムは、ユーザーインターフェースと各ユーザーに対応するユーザー情報蓄積部とをさらに備える。ユーザーインターフェースを介して直接入力されまたは入力された探索条件の探索履歴を含むユーザー情報は、ユーザー情報蓄積部に保存され、データベースまたは探索対象のグラフと照合または統合されて、ユーザーに固有の参考情報をフィードバックし、または、ユーザーに固有の探索を実行する。なお、ここでいう「ユーザー」は単一人の人に限られず、複数人によるユーザーグループであってもよい。
前記一実施の形態によって得られる効果を簡単に説明すれば下記のとおりである。
すなわち、関係性が既に知られた物性パラメータ対のデータベースから、物性パラメータをノード、その関係性をエッジとするグラフを生成し、生成したグラフの経路探索する探索システムにおいて、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる探索システム及び探索方法を提供することができる。
図1は、実施形態1に係る探索システムの構成例を示すブロック図である。 図2は、本発明の探索システム及び探索方法が実装されるハードウェアシステムの一例を示すブロック図である。 図3は、実施形態1に係る探索システムのデータベースの構成例を示す説明図である。 図4は、生成されるグラフの一例(有向グラフの場合)を示す説明図である。 図5は、生成されるグラフの一例(無向グラフの場合)を示す説明図である。 図6は、有向グラフの経路探索結果の一例を示す説明図である。 図7は、無向グラフの経路探索結果の一例を示す説明図である。 図8は、探索式を例示する説明図である。 図9は、表示オプションを例示する説明図である。 図10は、実施形態1に係る探索システム構成の変形例を示すブロック図である。 図11は、実施形態1に係る探索システム構成のさらなる変形例を示すブロック図である。 図12は、入力フォームの変形例を示す説明図である。 図13は、ノードの属性を記述するための別の入力フォームの一例を示す説明図である。 図14は、実施形態2に係る探索システムの構成例を示すブロック図である。 図15は、ユーザーデータによってエッジが追加されたグラフの一例(有向グラフの場合)を示す説明図である。 図16は、ユーザーデータによってエッジが追加されたグラフ(図15)の経路探索結果の一例を示す説明図である。 図17は、ユーザーデータによって新たなノードとエッジを含む部分グラフが追加されたグラフの一例(有向グラフの場合)を示す説明図である。 図18は、ユーザーデータによって新たなノードとエッジを含む部分グラフが追加されたグラフ(図17)の経路探索結果の一例を示す説明図である。 図19は、システム側データベースとユーザー側データベースとを統合したようすを示す説明図である。 図20は、実施形態3に係る探索システムの構成例を示すブロック図である。 図21は、実施形態4に係る探索システムの構成例を示すブロック図である。 図22は、ユーザー側データベースとシステム側データベースとを照合するようすを示す説明図である。 図23は、純金属のビッカース硬度が融点に対して正の相関をもつ事を示す実験データ(チャート)である。 図24は、遷移金属炭化物のビッカース硬度がそれを構成する金属の融点に対して負の相関をもつ事を示す実験データ(チャート)である。 図25は、実施形態2〜4に係る探索方法の構成例を示すフローチャートである。 図26は、実施形態5及び6に係る探索システムの構成例を示すブロック図である。 図27は、実施形態5〜6に係る探索方法の構成例を示すフローチャートである。 図28は、実施形態7に係る探索システムの構成例を示すブロック図である。 図29は、物性パラメータ関係性情報抽出部の一構成例を示すブロック図である。 図30は、実施形態7に係る探索方法の構成例を示すフローチャートである。
1.実施の形態の概要
先ず、本願において開示される代表的な実施の形態について概要を説明する。代表的な実施の形態についての概要説明で括弧を付して参照する図面中の参照符号はそれが付された構成要素の概念に含まれるものを例示するに過ぎない。
〔1〕<ユーザーインターフェースとユーザー情報蓄積部を備える探索システム>
本発明の代表的な実施の形態は、データベース(1)とグラフ生成部(2)とグラフ探索部(4)とを備える探索システム(10)であって、以下のように構成される(図1)。
探索システム(10)は、ユーザーインターフェース(5)とユーザー情報蓄積部(6)とをさらに備える。
前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶し、前記グラフ生成部は、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフ(3)を生成する。前記グラフ探索部は、前記ユーザーインターフェースを介して、与えられる探索条件(探索式を含む)に基づいて前記グラフを探索し、探索結果を出力する。
前記ユーザーインターフェースは、ユーザー識別情報に基づいて識別されるユーザーごとに、当該ユーザーから入力されるデータを前記ユーザー情報蓄積部に保持させる。ここでユーザーは単一人の人に限られず、複数人によるユーザーグループであってもよい。
これにより、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる。
〔2〕<ユーザー側データベースと統合>
〔1〕項の探索システムにおいて、前記データベースを第1データベース(1)とし、前記パラメータ対を第1パラメータ対とし、前記ユーザーインターフェースは、第2データベース(50)を入力可能なデータベース入力部(51)をさらに備える(図14)。
前記データベース入力部は、前記第2データベースから互いに関係性を有する物性パラメータの対を第2パラメータ対として抽出可能に構成され、前記第2パラメータ対及びその関連性情報を前記ユーザー情報蓄積部(6)に保持させることを可能とするように構成される。
前記グラフ生成部が生成する前記グラフは、前記第1パラメータ対に加えてさらに前記第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に加えてさらに前記第2パラメータ対に対応するノード間をエッジとするグラフである。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報を、有効活用することができる。
〔3〕<ユーザー側データベースと統合;パラメータ名の整合>
〔2〕項の探索システムにおいて、前記データベース入力部は、物性パラメータ関係性情報抽出部(52)と、物性パラメータ整合部(53)と、シソーラス辞書(54)とをさらに備える(図20)。
前記物性パラメータ関係性情報抽出部は、前記第2データベースから複数の第2物性パラメータ名を抽出する。前記物性パラメータ整合部は、前記シソーラス辞書を参照して、前記複数の第2物性パラメータ名を前記第1データベースに記憶されている複数の第1物性パラメータ名と照合して、相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更することにより物性パラメータ名の整合をとる。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報と探索システム側がユーザーに依らず共通に持つ関係性情報との間で、表現の違いなどの外見的な不整合を解消し、ユーザーが持つ情報をより有効に活用することができる。
〔4〕<ユーザー側データベースと統合;関係性情報の照合>
〔3〕項の探索システムにおいて、前記ユーザーインターフェースは、関係性情報照合部(55)をさらに備える(図21)。
前記関係性情報照合部は、前記第1パラメータ対と前記第2パラメータ対との間で、同じ物性パラメータの対についての関係性情報を照合し、照合結果を出力する。
これにより、ユーザーは、自身が独自に持つ物性パラメータ間の関係性情報の正当性、完全性等を検証することができる。
〔5〕<探索履歴の保持と管理>
〔1〕項の探索システムにおいて、前記ユーザーインターフェースは、探索インターフェース(56)と探索履歴管理部(57)とをさらに備える(図26)。
前記探索インターフェースは、ユーザーが指定する探索条件を前記グラフ探索部に入力し、前記グラフ探索部から出力される探索結果をユーザーに出力する。前記探索履歴管理部は、前記探索条件とそれに対応する探索結果のうち少なくとも探索条件を、前記探索履歴保持部に探索履歴として保持する。
前記ユーザーインターフェースは、前記探索履歴保持部に保持される前記探索履歴を、ユーザーによって参照することが可能なように構成されている。
これにより、ユーザーは、自身が行った探索履歴を管理することができる。
〔6〕<探索履歴の解析>
〔5〕項の探索システムにおいて、前記ユーザーインターフェースは、探索履歴解析部(58)をさらに備えるとより好適である(図26)。
前記探索履歴解析部は、前記探索履歴保持部に保持される前記探索履歴を解析して、解析結果をユーザーに提示する。
これにより、ユーザーは自身が行った探索の履歴から得られる知見を得て、以降の探索に利用することができる。
〔7〕<物性パラメータ関係性データ抽出部>
〔1〕項の探索システムは、物性パラメータ関係性情報抽出部(71)をさらに備え、前記物性パラメータ関係性データ抽出部は、学習モデル生成部(72)と関係性抽出部(75)とを備える(図28、図29)。
前記学習モデル生成部は、供給される学習データから、物性名モデルと関係性表現モデルとを学習モデルとして生成して(73,74)前記関係性抽出部に供給する。
前記学習データには物性名とその関係性を規定する文書データが含まれ、前記関係性抽出部には、前記文書データが入力される。前記関係性抽出部は、前記物性名モデルから作成する物性名リストと、前記関係性表現モデルから作成する関係性表現リストとを用いて、入力された前記文書データにおける物性名と関係性表現との位置関係に基づいて、因果関係を持つ物性パラメータ対に対応する2個の物性名とその関係性とを表す関係性表現とを含むトリプルを抽出して出力データとして出力する。ここで、学習モデル生成部(72)に入力される学習データと、関係性抽出部(75)へ入力される学習データは、基本的には、互いに異なる文書データである。
前記探索システムは、前記出力データによって、前記データベースの内容を更新する。物性名とその関係性を規定する文書データとは、例えば教科書的文書である。学習データは、このような物性名とその関係性を規定する文書データの他に、正確な物性名が列挙されている科学用語辞典の見出しやデータハンドブックの索引などを含むとより好適である。
これにより、物性パラメータ関係データベース(1)を更新する管理負担を軽減することができる。
〔8〕<物性パラメータ関係性情報抽出部にクリーニング部を追加>
〔7〕項において、前記物性パラメータ関係性情報抽出部は、コーパス(79)が入力されるクリーニング部(80)をさらに備える(図29)。
前記クリーニング部は、前記コーパスに基づいて、前記関係抽出部によって抽出された前記トリプルから、物性パラメータ対の関係性を示すものではないと判断されるトリプルを除去して、前記出力データとする。
これにより、物性パラメータ関係データベース(1)を更新する際の、データの信頼性についての管理負担を軽減することができる。
〔9〕<ユーザー情報蓄積部を備える探索方法>
本発明の代表的な実施の形態は、第1データベース(S1)からグラフを生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含む、探索方法であって、以下のように構成される(図25)。
前記第1データベースは、互いに関係性を有する物性パラメータの複数の第1パラメータ対を記憶する。
前記グラフは、前記第1パラメータ対に含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に対応するノード間をエッジとする、グラフである。
前記グラフ探索工程は、与えられる探索条件(探索式を含む)に基づいて前記グラフを探索し、探索結果を出力する(S10)。
前記探索方法は、データベース入力工程(S5)をさらに含む。
前記データベース入力工程は、入力される第2データベースから第2パラメータ対を抽出して、ユーザー識別情報に基づいて識別されるユーザーごとに、ユーザー情報蓄積部(S8)に記憶する。ここでユーザーは単一人の人に限られず、複数人によるユーザーグループであってもよい。
ここで、前記第2パラメータ対とは、互いに関係性を有する物性パラメータの対であって、前記第2データベースに記憶されている。
これにより、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる。
〔10〕<ユーザー側データベースと統合>
〔9〕項の探索方法(図25)において、前記グラフ生成工程で生成される前記グラフは、前記第1パラメータ対に加えてさらに前記第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に加えてさらに前記第2パラメータ対に対応するノード間をエッジとするグラフである。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報を、有効活用することができる。
〔11〕<ユーザー側データベースと統合;パラメータ名の整合>
〔10〕項の探索方法は、物性パラメータ関係性情報抽出工程(S6)と、物性パラメータ整合工程(S7)とをさらに含む(図25)。
前記物性パラメータ関係性情報抽出工程は、前記第2データベースから複数の第2物性パラメータ名を抽出する。前記物性パラメータ整合工程は、シソーラス辞書を参照して、前記複数の第2物性パラメータ名を前記第1データベースに記憶されている複数の第1物性パラメータ名と照合して、相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更することにより物性パラメータ名の整合をとる。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報と探索システム側がユーザーに依らず共通に持つ関係性情報との間で、表現の違いなどの外見的な不整合を解消し、ユーザーが持つ情報をより有効に活用することができる。
〔12〕<ユーザー側データベースと統合;関係性情報の照合>
〔11〕項の探索方法は、関係性情報照合工程(S9)をさらに含む(図25)。
前記関係性情報照合工程は、前記第1パラメータ対と前記第2パラメータ対との間で、同じ物性パラメータの対についての関係性情報を照合し、照合結果を出力する(S11)。
これにより、ユーザーは、自身が独自に持つ物性パラメータ間の関係性情報の正当性、完全性等を検証することができる。
〔13〕<探索履歴の保持と管理>
本発明の代表的な実施の形態は、データベース(S1)からグラフを生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含む、探索方法であって、以下のように構成される(図27)。
前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶する。
前記グラフは、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフである。
前記グラフ探索工程は、探索条件入力工程(S4)を介して与えられる探索条件(探索式を含む)に基づいて前記グラフを探索し、探索結果を出力する(S10)。
前記探索方法は、探索履歴管理工程(S12)をさらに含む。
前記探索履歴管理工程は、前記探索条件入力工程を介して与えられる前記探索条件とそれに対応する探索結果のうち少なくとも探索条件を探索履歴として、ユーザー識別情報に基づいて識別されるユーザーごとに、探索履歴保持部(S13)に記憶し、ユーザー識別情報に基づいて許可されるユーザーに当該探索履歴の参照を許す。
これにより、ユーザーは、自身または自身に許可を与えた他のユーザーが行った探索履歴を参照することができ、自身の探索方針に適切なフィードバックを与え、効率を向上することができる。
〔14〕<探索履歴の解析>
〔13〕項の探索方法は、探索履歴解析工程(S15)をさらに備える(図27)。
前記探索履歴解析工程は、前記探索履歴保持部に保持される前記探索履歴を解析して、解析結果をユーザーに提示する(S16)。
これにより、ユーザーは自身が行った探索の履歴から得られる知見を得て、以降の探索に利用することができる。
〔15〕<物性パラメータ関係性データ抽出工程を含む探索方法>
本発明の代表的な実施の形態は、データベース(S1)からグラフを生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含む、探索方法であって、以下のように構成される(図30)。
前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶する。前記グラフは、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフである。前記グラフ探索工程は、与えられる探索条件(探索式を含む)に基づいて前記グラフを探索し、探索結果を出力する(S10)。
前記探索方法は、学習モデル生成工程(S21)と関係性抽出工程(S24)とをさらに含む。
前記学習モデル生成部は、供給される学習データ(S20)から、物性名モデルと関係性モデルとを学習モデルとして生成(S22,S23)して前記関係性抽出工程に供給する。
前記学習データには物性名とその関係性を規定する文書データが含まれ、前記関係性抽出工程には、前記文書データが入力される。前記関係性抽出工程は、前記物性名モデルから作成する物性名リストと、前記関係性表現モデルから作成する関係性表現リストとを用いて、入力された前記文書データにおける物性名と関係性表現との位置関係に基づいて、因果関係を持つ物性パラメータ対に対応する2個の物性名とその関係性とを表す関係性表現とを含むトリプルを抽出して出力データとして出力する。
前記探索方法は、前記出力データによって、前記データベースの内容を更新する。物性名とその関係性を規定する文書データとは、例えば教科書的文書である。学習データは、このような物性名とその関係性を規定する文書データの他に、正確な物性名が列挙されている科学用語辞典の見出しやデータハンドブックの索引などを含むとより好適である。
これにより、物性パラメータ関係データベース(1)を更新する管理負担を軽減することができる。
〔16〕<クリーニング工程を追加>
〔15〕項の探索方法は、コーパスが入力されるクリーニング工程(S25)をさらに含むとより好適である(図30)。
前記クリーニング工程は、前記コーパスに基づいて、前記関係性抽出工程によって抽出された前記トリプルから、物性パラメータ対の関係性を示すものではないと判断されるトリプルを除去して、前記出力データとする。
これにより、物性パラメータ関係データベース(1)を更新する際の、データの信頼性についての管理負担を軽減することができる。
2.実施の形態の詳細
実施の形態について更に詳述する。
〔実施形態1〕
図1は、実施形態1に係る探索システムの構成例を示すブロック図である。
探索システム10は、物性パラメータの関係性を記憶する物性パラメータ関係性データベース1とグラフ生成部2とグラフ探索部4とユーザーインターフェース5とを備える。
物性パラメータ関係性データベース1には、互いに関係性を有する物性パラメータの複数の対が記憶される。このときの互いに関係性を有する物性パラメータの対は、科学的根拠に基づいた関係性、即ち、理論的に説明された関係性に基づくものだけではなく、理論的な説明が未だなされておらず、また、定式化もされていない段階であっても、実験データから明確な相関が認められることによって、関係性の存在が知られている物性パラメータの対を含めることができる。なお、「理論的に説明された関係性」には、定理や公式のように定式化された関係性の他、相関の有無や相関係数の正負(一方が増加するときに他方も増加するか減少するかなど)が説明されている半定量的、あるいは、定性的な関係性までもが広く含まれていてよい。このとき、如何なる分野で知られている関係性であっても特に排除される必要はなく、あらゆる分野で関係性が知られている物性パラメータ対を含めることができる。
グラフ生成部2は、物性パラメータ関係性データベース1に記憶された複数の物性パラメータをノードとし、関係性を有する物性パラメータ対に対応するノード間をエッジとする、グラフ3を生成する。
ユーザーインターフェース5は、上述したようにグラフ探索部4に対して探索式などの探索条件を与え、探索結果を外部に出力することができる。ユーザーインターフェース5は、必ずしもヒューマンインターフェースに限られるものではなく、他のデータベースや検索システムとのインターフェースであってもよい。
グラフ探索部4は、ユーザーインターフェース5を介して、与えられる探索条件に基づいてグラフ3を探索しその探索結果を出力する。グラフ探索部4には、グラフ理論などの数学的なアルゴリズムに基づく、種々の経路探索手法を適用することができる。
これにより、探索システム10は、複数の物性パラメータの任意の組合せのうち、既に知られている関係性に基づいて、有意な関係性を有する物性パラメータの未知の組合せを探索することができる。物性パラメータ関係性データベース1に記憶される、互いに関係性を有する物性パラメータ対は、できる限り多くの技術分野から収集されるとよい。本発明では、多くの技術分野から収集された物性の関係性を、1つのグラフ3に集約して表現し、グラフ3を対象とした経路探索を可能としている。ここで「1つのグラフ」とは、複数のノードとそれらを接続する複数のエッジを有し、全てのノードがエッジによって直接または間接に接続されている範囲を意味し、複数のグラフ(部分グラフと呼ばれる場合もある)の集合であってもよい。グラフ3を用いて表現することによって、そのエッジに対応する関係性がどのような技術分野で知られていたかに関わらず、単純にエッジの有無のみに基づく経路を探索することができるため、多くの分野を横断的に探索することができる。その結果、物性パラメータの既に知られた関係性に留まらず、有意な関係性を有する未知の組合せをも発見することができる。互いに異なる技術分野においてのみ知られていた関係性を、グラフに統合して表すことによって、すべての関係性がどの技術分野で知られていたかに関わらず、グラフ全体を対象とした経路探索をすることができるため、知られていなかった物性パラメータ間の関係性を新たに発見する可能性がある。
探索システム10は、ユーザー情報蓄積部6をさらに備え、ユーザーインターフェース5を介して、ユーザー識別情報に基づいて識別されるユーザーごとに、当該ユーザーによってユーザー入力として入力されるデータ(ユーザーデータ)をユーザー情報蓄積部6に保持させる。当該ユーザーが入力したユーザーデータに関連する情報を、探索システム10から出力することができるように構成してもよい。
ユーザーデータは、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関連する知見であればよい。ユーザーデータは、例えば、理論的には説明されていないものの、ユーザーが実験等によって見出した物性パラメータ間の関係性情報であり得る。より詳しくは、実施形態2〜4で説明する。また、ユーザーデータは、ユーザーが入力する一連の探索条件であり得る。より詳しくは、実施形態5で説明する。ここで「ユーザー」は単一人の人に限られず、複数人によるユーザーグループであってもよい。例えば同じ研究開発プロジェクトに従事する複数のユーザーを1つのユーザーグループとして、その中でユーザーデータを共有するように構成しても良い。
これにより、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる。
<ハードウェア/ソフトウェア実装形態>
本発明の探索システム10は、記憶装置と計算機を備えたハードウェアシステム上に、ソフトウェアとして機能構築される。
図2は、本発明の探索システム10が実装されるハードウェアシステムの一例を示すブロック図である。
サーバー100とユーザー側のワークステーション110,120が、インターネットなどのネットワーク200に接続されている。サーバー100は、計算機101、記憶装置102、ネットワークインターフェース103、入力部104及び表示部105を有する。
ネットワーク200を介する入出力で十分であれば、入力部104及び表示部105は具備されなくても良い。ユーザー側のワークステーション110,120もそれぞれ、計算機111,121、記憶装置112,122、ネットワークインターフェース113,123、入力部114,124及び表示部115,125を有する。一方、ネットワーク200に接続されない態様で実装することもできる。サーバー100からネットワークインターフェース103を省略し、本発明の探索システム10のすべてを、計算機101、記憶装置102、入力部104及び表示部105に実装すればよい。
探索システム10の物性パラメータ関係性データベース1は記憶装置102に記憶される。グラフ生成部2は計算機101上で動作するソフトウェアである。グラフ生成部2によって生成されるグラフ3は、中間データとして記憶装置102に記憶され、計算機101上にソフトウェアとして実装されるグラフ探索部4の入力データとされる。
探索システム10のユーザーインターフェース5は、ユーザー側のワークステーション110,120の入力部114,124及び表示部115,125を使って実装される。ユーザー側のワークステーション110,120からユーザーインターフェース5を介して、グラフ探索部4に探索条件が与えられ探索結果が応答される。ユーザー情報蓄積部6は、ユーザー側のワークステーション110,120の記憶装置112,122に実装されても、サーバー100の記憶装置102に実装されても良い。
グラフ探索部4は、サーバー100ではなくまたはサーバー100に加えて、ユーザー側のワークステーション110,120の計算機111,121上にソフトウェアとして実装されても良い。このとき、グラフ3は、ユーザー側のワークステーション110,120からの要求に応じてサーバー100から供給される。グラフ3は、その経路探索に先立って、予めダウンロードし、ワークステーション110,120の記憶装置112、122上に格納されるように構成しても良い。これにより、グラフ探索部4による経路探索処理が高速化される。特に、多数のユーザーが同時にグラフ探索処理を実行する場合に、サーバー100に処理の負荷が集中するのを防止することができる。
さらに、グラフ生成部2についても、ユーザー側のワークステーション110,120の計算機111,121上にソフトウェアとして実装されても良い。この場合も、同様に、多数のユーザーが同時にグラフ探索処理を実行する場合に、サーバー100に処理の負荷が集中するのを防止することができる。
本実施形態1に係る探索システム10についてさらに詳しく説明する。
<有向グラフ/無向グラフ>
図3は、物性パラメータ関係性データベース1の構成例を示す説明図である。一例としてデータベース1の入力フォーム11を示す。入力フォーム11は、互いに関係性を有する物性パラメータの対を各行とする表形式である。第1列は原因側物性パラメータ、第2列は結果側物性パラメータである。必ずしも原因側と結果側に分ける必要はないが、因果関係に方向性がある関係性についても表現することができるメリットがある。一方、双方向に関係性がある場合には、原因側と結果側の物性パラメータを入れ替えた2行を使って、その関係性が記述される。
図3に例示されるように、教科書X1に理論的関係性として、「D=A+B」が定式化されているとき、原因側の物性パラメータがA及びB、結果側物性パラメータがDとなり(2行目〜3行目)、「A=f(B)」が定式化されているとき、fはBを入力としAを出力とする関数であって逆関数が定義できないときには、原因側の物性パラメータがB、結果側物性パラメータがAとなる(4行目)。論文Y1に物性パラメータDとEが良い相関を持つというデータ(グラフ)が示されているとき、その関係性が5行目と6行目に入力されている。同様に学会Zにおいて、物性パラメータCとEが良い相関を持つというデータ(グラフ)が発表されているとき、その関係性が7行目と8行目に入力されている。以下同様に、論文Y2に示された物性パラメータMとCの関係性が9行目と10行目に、教科書X2に示された理論式から導かれる、物性パラメータKとJ、KとL、JとL、LとJの関係性が11行目から15行目に、その他、理論的あるいは経験的に知られている物性パラメータIとK、GとC、GとF、GとI、IとF、LとH、GとHの関係性が16行目から23行目に、それぞれ入力されている。
入力フォーム11に記入されて入力された、複数の物性パラメータ対の関係性は、計算機に取り込まれて物性パラメータ関係性データベース1として記憶される。グラフ生成部2はこのデータベース1を入力として、各物性パラメータをノードとし、物性パラメータ相互の関係性の有無をエッジとするグラフ3を生成する。なお、図3では入力フォーム11と物性パラメータ関係性データベース1とを明確に区別して表記したが、入力フォーム11そのものを物性パラメータ関係性データベース1と呼んでもよい。入力フォーム11の同じ行に記載される2つ1組の物性パラメータ(対)を、2つのノードとしその2つのノード間にエッジが規定されるとすれば、グラフと等価の情報だからである。
なお、教科書X1、X2、論文Y1、Y2、学会発表Zは、まったく異なる分野における教科書、論文、学会発表等であることが望ましい。これにより、教科書X1で知られていた物性パラメータAとDの関係性、論文Y1で知られていた物性パラメータDとEの関係性、学会発表Zで知られていた物性パラメータEとCの関係性、論文Y2で知られていた物性パラメータCとMの関係性、及び、教科書X2で知られていた物性パラメータMとJの関係性を順次辿って、物性パラメータAとJが関係性を有するという新たな知見を得ることができる。ここで得られる新たな関係性は、数学的に存在し得る関係性に過ぎず、現実に有効な関係性であるかどうかは物理的な評価を待って判断される必要があるかもしれないが、少なくともユーザーである研究者に気付きを提供するという価値がある。
図4に、生成されるグラフ3が有向グラフである場合の一例を示す。一方、グラフ3は無向グラフでも良い。図5に、生成されるグラフ3が無向グラフである場合の一例を示す。
<経路探索>
グラフ探索部4は、このグラフ3を対象として、与えられた探索条件(探索式を含む)で経路探索を実行する。例えばユーザーが物性パラメータAを原因側とし、Hを結果側とする因果関係の有無を知りたいと考えた場合には、グラフ探索部4に、ノードAを始点、ノードHを終点とすることを探索条件として与えて、経路探索を実行させる。その結果、図4に示す有向グラフの場合には、図6に示すような経路探索結果が得られ、図5に示す無向グラフの場合には、図7に示すような経路探索結果が得られる。
グラフ探索部4に与える探索条件は、上述の始点と終点とするほか、任意に変更することができる。例えば、探索条件として、終点とその終点に至るノード数を指定して、グラフ探索部4に、その終点に至る経路の長さがそのノード数以内である経路をすべてリストアップさせることもできる。これによって、ある特定の物性パラメータと比較的関係性の強い物性パラメータを網羅的にリストアップすることができる。
図8は探索式を例示する説明図であり、図9は表示オプションを例示する説明図である。表示オプションは、探索式と合わせて指定することができ、探索式による探索結果の表示態様や付加情報の表示を指定することがきる。
探索式query 1, “search paths from A to B”は、物性パラメータAに対応するノードAを始点とし、物性パラメータBに対応するノードBを終点とする経路の探索を指示する探索式である。例えば図9に示した、option 1, “all paths”、option 2, “shortest path”、option 3, “within p paths”等の、探索結果についての表示オプションを合わせて指定することができる。
表示オプションoption 1, “all paths”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路を表示させるためのオプションである。
表示オプションoption 2, “shortest path”は、探索式で指定された探索条件に合致するすべての経路のうち最短の経路を表示させるためのオプションである。さらに例えば“shortest q paths”のように、短い方から順にq個の経路を表示することができるような表示オプションを追加しても良い。
表示オプションoption 3, “within p paths”は、探索式で指定された探索条件に合致するすべての経路のうち所定の長さp以下の経路を表示させるためのオプションである。「p1以上p2以下」のような範囲指定を可能とするオプションを追加してもよい。
その他、例えばoption 6, “common paths with from A to X”、option 7, “uncommon paths with from A to X”、option 8, “common paths with from Y to B”、option 9, “uncommon paths with from Y to B”、option 10, “around the end node within c1 paths”、option 11, “similar paths”等の、探索結果についての表示オプションを指定することができる。
表示オプションoption 6, “common paths with from A to X”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路のうち、始点であるノードAを共通として異なる終点ノードXへ至る経路と共通する経路を表示させるためのオプションである。
一方、表示オプションoption 7, “uncommon paths with from A to X”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路のうち、始点であるノードAを共通として異なる終点ノードXへ至る経路と共通しない経路を表示させるためのオプションである。
表示オプションoption 8, “common paths with from Y to B”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路のうち、終点であるノードBを共通として異なる始点ノードYからの経路と共通する経路を表示させるためのオプションである。
一方、表示オプションoption 9, “uncommon paths with from Y to B”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路のうち、終点であるノードBを共通として異なる始点ノードYからの経路と共通しない経路を表示させるためのオプションである。
表示オプションoption 10, “around the end node within c1 paths”は、探索式query 1-4で指定された終点ノードBの周辺を経路長c1以下の範囲で、探索結果と合わせて表示させるためのオプションである。
表示オプションoption 11, “similar paths”は、探索式で指定された「ノードAを始点としノードBを終点とする」という探索条件に合致するすべての経路のうち、始点及び終点がいずれも異なるもののうち、共通する経路が多い別の探索条件を表示させるためのオプションである。共通する経路の数の指定方法は任意である。
図9に例示はしていないが、他の表示オプションを追加してもよい。例えば、終点ノードBをさらなる始点として、所定の経路長条件(経路長p以下、p1以上p2以下、p2以上など)を満たすような、終点ノードの周辺を表示するオプションを追加してもよい。
なお、経路の長さは、始点ノードから終点ノードに至る経路において経由するノードの数またはエッジの数であるとして説明する。さらにエッジに長さの属性を与えて、経路長はその経路で通過するエッジの長さの合計として規定されても良い。経路長については、特筆しない限り、本明細書に全体において本解釈が適用される。
探索式query 2, “search paths from A to B including D in the paths”、query 3, “search paths from A to B excluding D in the paths”は、ノードAを始点としノードBを終点とする経路のうち物性パラメータDに対応するノードDを経路内に含む、または含まない経路の探索を指示する探索式である。これらの探索式にも、例えばoption 1, “all paths”、option 2, “shortest path”、option 3, “within p path”等の、探索結果についての表示オプションを合わせて指定することができる。
探索式query 4, “search paths from A to B within n paths”は、ノードAを始点としノードBを終点とする経路のうち所定の長さn以下の経路の探索を指示する探索式である。この探索式にも、例えばoption 1, “all paths”、option 2, “shortest path”、option 3, “within p path”等の、探索結果についての表示オプションを合わせて指定することができる。経路長によって探索結果を制限する点で、表示オプションoption 3, “within p path”と相違する。さらに、表示オプションoption 4 “difference within n-paths/[other opt.]”を指定することができる。表示オプションoption 4 “difference within n-paths/[other opt.]”は、他の表示オプションを指定することによって制限された探索結果との差分を表示するためのオプションである。
探索式query 5, “search paths around M within m paths”は、物性パラメータMに対応するノードMの周辺の長さmノード以下の経路または部分グラフを探索結果として出力する探索式である。この探索式ではノードMが始点か終点かを問わない。探索式query 6, “search paths from M within m paths”または “to M within m paths”は、始点をノードMとし、または終点をノードMとする、周辺の長さmノード以下の経路または部分グラフを、探索結果として出力する探索式である。
また、探索式query 7, “search paths around M within m1-m2 paths”は、物性パラメータMに対応するノードMの周辺の長さm1ノード以上長さm2ノード以下の経路または部分グラフを探索結果として出力する探索式である。この探索式ではノードMが始点か終点かを問わない。探索式query 8, “search paths from M within m1-m2 paths”または “to M within m1-m2 paths”は、始点をノードMとし、または終点をノードMとする、周辺の長さm1ノード以上長さm2ノード以下の経路または部分グラフを、探索結果として出力する探索式である。
探索式query 5からquery 8など、探索結果として部分グラフを出力する探索式には、表示オプションとしてoption 12, “similar graph”を指定することができる。
表示オプションoption 12, “similar graph”は、探索結果である部分グラフと類似するグラフを探索結果とする別の探索式を表示させるためのオプションである。グラフの類似の程度を指定する方法は任意である。例えば、類似の程度を表す指標として、グラフ理論で一般的に用いられる類似度を適用することができる。部分グラフ内の各ノード及び各エッジを、比較すべき2つの部分グラフの間で1:1対応付けできたときに、2つの部分グラフが等しい、即ち最大の類似度を有すると定義し、対応付けできないノードやエッジの数や属性を数値化して、前記最大の類似度から減ずることによって、類似度を定量化することができる。
なお、図8及び図9を引用して説明した探索条件(探索式)および表示オプションの与え方は、一例であって、この一部のみを実装し、他の探索式や表示オプションに変更し、または追加するなど、実装態様は任意である。
<信頼度情報付きエッジ>
グラフ3のエッジには、物性パラメータ対の関係性の信頼度情報を属性の一つとして付加することができる。理論的に証明されて広く認知されている関係性は極めて信頼度が高い一方、2つの物性パラメータ間に相関があることを示す実験データが得られてはいるものの、再現性を確認する追実験のデータがまだ得られておらず、また関係性を説明する理論的説明も仮説の域を出ていないような場合には、その関係性の信頼度は低いものとして扱いたい場合がある。このような信頼度情報を、データベース1に追加入力しておき、グラフ3では例えば、エッジの長さに対応付け、グラフ探索部4では経路の長さとして扱うことができる。例えば、信頼度の高いエッジの長さを1とし、信頼度が低くなるにしたがって、2、3、4などと長いエッジを対応付けることができる。
<優先付け>
グラフ探索部4から複数の経路探索結果が出力される場合には、優先付けされると好適である。
図10は、実施形態1に係る探索システム構成の変形例を示すブロック図である。探索システム10は、さらに優先度決定部9を備える。優先度決定部9は、グラフ探索部4から出力される経路探索結果に優先度を与えて出力する。
優先度決定のための評価項目は、例えば、信頼度、エッジ数、物性値の測定可能性、物性値のデータベースのデータ量、および物性の値である。複数の項目を複合評価して優先度を決定しても良い。各項目の内容を以下に示す。
(a)信頼度: 関係性が厳密に理論的か、半定量的か、定性的か、経験的かを示す。
(b)エッジ数: 関係する物性の数およびそれに対して重みをつけた量を示す。ここで、関連する物性の数は当該ノードに入出するエッジの矢印の数(出は+、入は−とする)であり、重みづけをする量はそのエッジの矢印の長さや太さに関する属性を定量化したものである。
(c)物性値の測定可能性: 原理的に当該物性値を測定可能で測定方法もある、原理的には測定可能であるが測定方法が知られていない、および原理的に測定不能の何れかを示す。
(d)物性値のデータベースのデータ量: データベースに格納されている、当該物性値のデータ量を示す。
(e)物性の値: 当該物性の物性値そのものを示す。
このうち、(a)はエッジの属性であり、残りの(b)から(e)はノードの属性である。
優先度決定のための評価方法は、ノードの属性である上記項目の(b)から(e)を各々単独に評価する項目別評価方法と、上記項目の(a)から(e)のうちの少なくとも複数を組み合わせて評価する複合評価方法の2つに大別される。各項目は数値化されてスコアで表現される。
また、複合評価方法は、どの評価項目を重視するかなどにより、以下のような種々のコースに分けられる。
(i)信頼度重視コース: 信頼度を重視
(ii)制御重視コース: 制御対象の物性パラメータに対応するノードに入力しているエッジの数に重み付けすることにより、当該物性パラメータの制御性を重視
(iii)実測値重視コース: 物性値の測定可能性を重視
(iv)データ量重視コース: 物性値の測定可能性を重視
(v)物性限定コース: 所定の物性パラメータの値が特定の値または範囲にあることを重視
(vi)ユニバーサルコース: 複数の評価項目を概ね均等に重み付け
各コースを構成する項目毎に重みをつけたスコアを加算した重みづけ加算スコアを求め、その重みづけ加算スコア順に優先度を決定する。
<条件付きの関係性>
物性パラメータ対の関係性には、その有無や内容が条件によって変化するものがある。例えば、引っ張り強さとビッカース硬度は、遷移金属炭化物であることを条件として比例関係となる。引っ張り強度がせん断強度で決まる場合に、引っ張り強さとビッカース硬度は比例関係となるが、遷移金属炭化物の引っ張り強度がせん断強度で決まるからである。また、超塑性を示さない物質であることを条件として、引っ張り強さと結合ポテンシャルの深さには関係性が存在する。したがって、物性パラメータの関係性を探索する上では、このような条件を勘案して経路の有無や距離を判断する必要がある。
物性パラメータ対の条件付きの関係性に対応するために、物性パラメータ関係性データベース1において物性パラメータ対にその条件を対応付けて規定し、グラフ生成部2はその条件をエッジの属性として付加する。グラフ探索部4を条件付きのエッジに対応することができるグラフ探索アルゴリズムを実装したソフトウェアに変更することによって解決することができる。これにより、図1の構成を変更することなく、そのまま条件付きの関係性に対応することができる。
一方、グラフ探索部4を、条件付きエッジを有するグラフを前提としない、一般的なグラフ探索アルゴリズムを実装したソフトウェアとすることもできる。グラフの経路探索は、純粋に数学的なアルゴリズムが確立されており、それを実装したソフトウェアライブラリが既に提供されているので、これらをそのままあるいは最小限の設計変更で、本発明のグラフ探索部4に適用することができる。
図11は、実施形態1に係る探索システム構成のさらなる変形例を示すブロック図である。探索システム10は、さらに条件抽出部7と経路評価部8とを備える。
物性パラメータ関係性データベース1には、互いに関係性を有する物性パラメータの複数の対のうち、関係性の有無を規定する条件が存在する対については、その条件がさらに記憶される。条件抽出部7は、物性パラメータ関係性データベース1からその条件を、当該条件によって関係性の有無が規定される対に対応するエッジ(条件付きエッジ)と対応付けて抽出する。グラフ探索部4は、グラフ3の経路探索を行って探索結果を出力するが、このとき、条件付きエッジの有無は考慮されない。経路評価部8は、抽出された経路に条件付きエッジが含まれるか否かを判定し、条件付きエッジが含まれる経路については、その条件が満足されるか否かを判定する。条件が満足されない場合には、グラフ探索部4が出力した結果から除外して、探索結果として出力する。
これにより、その関係性に対応する物性パラメータの値、或いは、別の物性パラメータの値によって、関係性の有無が変化するような、複雑な関係性をも探索の対象に含めることができる。一方、グラフ探索部4は、条件付きエッジを含むグラフを探索することができるような機能を追加する必要はなく、実施形態1と全く同様に、一般のグラフ探索ソフトウェアを適用することができる。
優先度決定部9は図10を引用して説明した上述の変形例と同様に機能するが、省略されてもよい。
<入力フォーム>
優先度決定のための評価項目、例えば、信頼度、エッジ数、物性値の測定可能性、物性値のデータベースのデータ量、物性の値、及び上述の条件は、エッジの属性であれば図3に示した入力フォーム11に項目を追加して、ノードの属性であれば別の入力フォームを利用して、物性パラメータ関係性データベース1に入力することができる。
図12は、入力フォーム11の変形例を示す説明図である。図3に示した入力フォーム11の例と比較すると、関係性の有無、関係性メモ、関係性分類1、関係性分類2、条件ノード、条件及び関係性が追加されている。関係性分類は、例えば、上述の信頼度情報であってもよい。条件ノードは、条件が特定の物性パラメータの値(内容)である場合に、その物性パラメータに対応するノードを記載し、条件にはその値または内容を記載する。「関係性」の項には、その関係性が定式化されているときにその式が、また、関係性が経験的なものである場合にはその近似式が、それぞれ記載される。式に代えて、または、式が規定される物性パラメータ対と混在させて、定性的な関係性が記載されても良い。例えば、正の相関を持つか負の相関を持つかが記載されてもよい。探索結果である経路上のすべての式を使用することによって、新たに見出された物性パラメータ対の関係性を定式化することができる。探索結果である経路に定性的な関係性が含まれている場合には、新たに見出された物性パラメータ対の定性的な関係性を見出すことができる。
図13は、ノードの属性を記述するための別の入力フォーム12の一例を示す説明図である。物性パラメータに対応するノードごとに、出力するエッジ数、入力されるエッジ数、接続されるエッジ数の合計、測定可能性、データベースデータ量、物性の値などの項目が記述されている。出力されるエッジ数、入力されるエッジ数、接続されるエッジ数の合計は、図12の入力フォームに基づいてグラフを生成し、そのトポロジーから求めることができるので、省略されても良い。
「測定可能性」の項には、「原理的に当該物性値を測定可能で測定方法もある」、「原理的には測定可能であるが測定方法が知られていない」、または「原理的に測定不能」の何れかが記述される。「データベースのデータ量」の項には、当該物性値のデータ量が記述される。「物性の値」の項には、当該物性の物性値そのものが記述される。ピンポイントの値に代えて、範囲で規定されてもよい。
なお、本実施形態1では、入力フォーム11,12、物性パラメータ関係性データベース1とグラフ3とを区別して説明したが、入力フォーム11,12そのものを物性パラメータ関係性データベース1とし、または、グラフ3をグラフ形式のデータベースとして管理することもできる。
一般に「データベース」とは、複数のユーザーによる利用を可能とするためにまとめられたデータの集合体である。データベースは階層型、ネットワーク型、リレーショナル型などいくつかの形式に分類することができるが、本願発明で言うところのデータベース1は、どのような形式であってもよい。本願発明のデータベース1は、少なくとも、グラフ3を構成するデータ、即ち、各ノードに対応する物性パラメータと、エッジに対応する物性パラメータ対の間の関係性を、データの集合体として含んでいれば良く、グラフ3を構成するデータの集合体のみで構成されてもよい。
このような実施形態の変形は、以下の各実施形態にも同様に適用することができる。
〔実施形態2〕<ユーザー側データベースと統合>
図1に示したユーザー入力から入力されるユーザーデータは、ユーザーが実験等によって見出した物性パラメータ間の関係性情報であり得る。
図14は、実施形態2に係る探索システム10の構成例を示すブロック図である。
実施形態2に係る探索システム10は、ユーザーインターフェース5にデータベース入力部51を備え、ユーザー側データベース50から入力されるユーザー側物性パラメータ関係性情報61を、ユーザー情報蓄積部6に保持する。
本実施形態2では、システム側に保持されている物性パラメータ間の関係性データと、ユーザー側物性パラメータ関係性情報61に規定される物性パラメータ間の関係性データとを統合して、グラフ3を生成する。
ここで「システム側」とは特定のユーザーに限定されることなく、広範囲の複数ユーザーが利用することができるような構成を指す一方、「ユーザー側」とは特定のユーザーまたはユーザーグループにのみ利用可能とされているような構成を指す。
物性パラメータ関係性データベース1に規定されている、システム側に保持されている物性パラメータ間の関係性データについての物性パラメータ対を第1パラメータ対と呼び、ユーザー情報蓄積部6に保持されるユーザー側物性パラメータ関係性情報61に規定される物性パラメータ対を第2パラメータ対と呼ぶこととする。グラフ生成部2によって生成されるグラフ3は、第1パラメータ対に加えてさらに第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、第1パラメータ対に加えてさらに第2パラメータ対に対応するノード間をエッジとするグラフである。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報を、有効活用することができる。
例えば、システム側に保持されている物性パラメータ間の関係性データについての物性パラメータ対から生成されるグラフのノードの数、種類には変化がないが、エッジが追加される場合である。ユーザー側物性パラメータ関係性情報61に、システム側では知られていなかった物性パラメータ対が記載されているために、グラフ3にはその関係性対応するエッジが追加される。
図15は、ユーザーデータによってエッジが追加されたグラフの一例(有向グラフの場合)を示す説明図である。図4に示すグラフが、システム側の物性パラメータ関係性情報から求めたグラフであるとき、ノードEとノードGとの間に双方向のエッジ(図15には太線の双方向矢印で示す)が追加される。
図16は、ユーザーデータによってエッジが追加されたグラフ(図15)の経路探索結果の一例を示す説明図である。エッジが追加される前の探索結果(図6)と比較すると、新たに経路[A−D−E−G−H]と経路[A−D−E−G−I−K−J−L−H]が探索結果として抽出される。
また例えば、システム側に保持されている物性パラメータ間の関係性データについての物性パラメータ対から生成されるグラフに新たなノードが追加される場合である。ユーザー側物性パラメータ関係性情報61に、システム側では知られていなかった物性パラメータ対が記載されているために、グラフ3にはその関係性に対応するエッジが追加される。
図17は、ユーザーデータによって新たなノードと新たなエッジを含む部分グラフが追加されたグラフの一例(有向グラフの場合)を示す説明図である。図4に示すグラフが、システム側の物性パラメータ関係性情報から求めたグラフ(システム側グラフ)であるとき、ノードN,O,P(図17には二重線の円で示す)、その相互間の双方向のエッジ、及び、ノードN,O,Pとシステム側グラフのノードB,E,G,Hとの間のエッジが追加される。
図18は、ユーザーデータによって新たなノードとエッジを含む部分グラフが追加されたグラフ(図17)の経路探索結果の一例を示す説明図である。部分グラフが追加される前の探索結果(図6)と比較すると、経路[A−D−E−O−P−G−H],[A−D−E−O−P−G−C−M−J−L−H],[A−D−E−O−N−P−G−H]及び[A−D−E−O−N−P−G−C−M−J−L−H]が探索結果として新たに抽出される。
図5の無向グラフにエッジが追加された場合、及びノードとエッジを含む部分グラフが追加された場合についても同様に、新たな探索結果が抽出され得る。
ユーザーデータによって変更された新たなグラフは、当該ユーザーに限って、または当該ユーザーから許可された他のユーザー(当該ユーザーグループ)に限って、グラフ探索部4の探索対象とされる。このときの新たなグラフは、当該ユーザーグループに属するユーザーがログインしている期間にのみ、生成され一時的に保持されてもよいし、一度作成された後は、半恒久的に保持され、ユーザーグループごとに管理されてもよい。また、同じユーザーが種々のユーザーデータをユーザー側物性パラメータ関係性情報として入力することを可能としてもよい。
例えば、ユーザー側物性パラメータ関係性情報61に、システム側の物性パラメータ関係性データベース1に規定されていない、第2パラメータ対が含まれている場合に、その第2パラメータ対が因果関係を有することを理論的な根拠を見出すことができる。
より具体的な例を示す。
図19は、ユーザー側データベース50とシステム側データベース1とを統合するようすを示す説明図である。システム側データベース1は、図14の物性パラメータ関係性データベース1に相当し、これをグラフ3として表現したものである。
ユーザーは経験的に、湿度が高いと製品に剥離が生じやすい事を示す実験データを持っており、その関係性が、「湿度」と「剥離」をパラメータ対とする関係性として、ユーザー側データベース50に保持されている。
一方、システム側データベース1には、「湿度」に対応する「水蒸気圧」と、「剥離」に対応する「密着性」とが物性パラメータのノードとして含まれているが、「水蒸気圧」ノードと「密着性」ノードとの間にエッジはない。即ち、物性パラメータ関係性データベース1では、「水蒸気圧」と「密着性」との間の直接の関係性は認知されていない。
ユーザー側データベース50とシステム側データベース1とを統合するためには、まず物性パラメータ名の対応関係を明確にする。ここでは、ユーザー側の「湿度」とシステム側の「水蒸気圧」、及びユーザー側の「剥離」とシステム側の「密着性」とは、それぞれ同義の物性パラメータであるとして統合する。このような物性パラメータ名の対応付けは、人手で行っても良いし、後述の実施形態3に示すように、探索システム10に物性パラメータを整合させる機能を持たせることによって実現しても良い。
この例においてユーザー側データベース50とシステム側データベース1とを統合すると、「水蒸気圧」(「湿度」と同義)ノードと「密着性」(「剥離」と同義)ノードとの間にエッジが追加されたグラフが生成される。追加されたエッジは、図19では破線で示されている。これは対応する関係性が、実験データによって経験的に得られたものに過ぎないため、実施形態1において「信頼度情報付きエッジ」として説明したように、「経験的」という信頼度情報をエッジの属性として付与したものである。
ユーザーが、「水蒸気圧」(「湿度」と同義)ノードと「密着性」(「剥離」と同義)ノードとの間の経路探索を行うと、その結果として、自身が経験的に知っている直接の因果関係の他に、「水蒸気圧」を始点として、「吸着量」、「表面張力」、「界面エネルギー」を順次経由して「密着性」に至るという経路が抽出される。この経路は、システム側の物性パラメータ関係性データベース1に基づいて説明される因果関係である。例えば、システム側の物性パラメータ関係性データベース1が理論的に説明された関係性のみに基づくものであれば、ユーザーは、自身が経験的に得た「湿度が高いと製品に剥離が生じやすい」という知見を裏付ける、理論的根拠を見出すことができる。ユーザーはこのような理論的根拠を知ることによって、例えば表面張力の大きな材料に変更することによって密着性を高める、即ち剥離を防止するための対策をとることができる。さらに、それらの関係性が定式化されていれば、改善された密着性を定量的に見積もることもできる。
本実施形態において、ユーザー側データベース50とシステム側データベース1とを統合する例として、グラフ3について言えば和集合を作成してグラフ3を拡張する例を中心に説明した。しかし、和集合に限定される必要はなく、部分マッチングを適用して求めた差集合などであってもよい。
〔実施形態3〕<ユーザー側データベースと統合;パラメータ名の整合>
図20は、本実施形態3に係る探索システム10の構成例を示すブロック図である。
本実施形態3に係る探索システム10においては、実施形態2について説明したデータベース入力部51に、物性パラメータ関係性情報抽出部52と、物性パラメータ整合部53と、シソーラス辞書54とをさらに備える。他の構成と動作は図14を引用して説明した実施形態2と同様であるので説明を省略する。
物性パラメータ関係性データベース1に規定されている、システム側に保持されている物性パラメータ間の関係性データについての物性パラメータを第1パラメータと呼び、ユーザー情報蓄積部6に保持されるユーザー側物性パラメータ関係性情報61に規定される物性パラメータを第2パラメータと呼ぶこととする。
物性パラメータ関係性情報抽出部52は、ユーザー側データベース50から複数の第2物性パラメータの名称(第2物性パラメータ名)を抽出する。物性パラメータ整合部53は、シソーラス辞書54を参照して、ユーザー側データベース50から抽出した複数の第2物性パラメータ名を、システム側の物性パラメータ関係性データベース1に記憶されている複数の第1物性パラメータの名称(第1物性パラメータ名)と照合する。両者が相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更することにより、物性パラメータ名の整合をとる。照合の結果をユーザーに対して出力するように構成してもよい。
ここで、シソーラス辞書54は、例えばオントロジーを利用して作成することができる。オントロジーとは、あるドメイン内の概念とそれらの概念間の関係のセットとしての知識の形式的な表現を意味する。オントロジーは、あるドメインをモデル化するため使われる、すなわちそこに存在するオブジェクトや概念のタイプとそれらの特性や関係の、共有される語彙を提供する。したがって、オントロジーを利用すれば、ノードとなる物性パラメータについて、同一の意味や概念に共有語彙を当て、異なる分野で同一の語彙が別の意味に使われる、いわゆる語彙の混同が生じている場合に、別の語彙を当てはめることができる。例えば、「仕事関数」という用語に語彙の混同が発生する場合がある。「仕事関数」が本来は表面に対してのみ定義される物性パラメータであるべきとされている技術分野において、界面に対して定義される「界面の仕事関数」が「実効仕事関数」と記述される場合がある。一方、界面に対して定義される「実効仕事関数」を単に「仕事関数」と呼ぶ習慣がある分野において、本来の「仕事関数」が「真空仕事関数」と記述される場合がある。このような語彙の混同がある場合に、文理上の一致/不一致よりも本質的な意味づけを優先して物性パラメータを扱うために、オントロジーは有効である。このため、技術分野ごとにオントロジーが公開されている場合がある。
このように、公開され或いは提供されているオントロジーを利用して、システム側とは異なる物性パラメータ名を使って規定された、ユーザー側の物性パラメータの関係性情報を、システム側の物性パラメータ関係性データベース1に整合させることができる。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報と探索システム側がユーザーに依らず共通に持つ関係性情報との間で、表現の違いなどの外見的な不整合を解消し、ユーザーが持つ情報をより有効に活用することができる。
〔実施形態4〕<ユーザー側データベースと統合;関係性情報の照合>
図21は、本実施形態4に係る探索システム10の構成例を示すブロック図である。実施形態3(図20)に示した探索システム10のユーザーインターフェース5に、関係性情報照合部55をさらに備える。他の構成と動作は図20を引用して説明した実施形態3と同様であるので説明を省略する。
ここで、実施形態2の場合と同様に、物性パラメータ関係性データベース1に規定されている、システム側に保持されている物性パラメータ間の関係性データについての物性パラメータ対を第1パラメータ対と呼び、ユーザー情報蓄積部6に保持されるユーザー側物性パラメータ関係性情報61に規定される物性パラメータ対を第2パラメータ対と呼ぶこととする。
関係性情報照合部55は、システム側の物性パラメータ関係性データベース1に規定されている第1パラメータ対と、当該第1パラメータ対と同じ物性パラメータの対についてユーザー側データベース50に規定されている第2パラメータ対との間で、その関係性情報を照合し、照合結果を出力する。
これにより、ユーザーは、自身が独自に持つ物性パラメータ間の関係性情報の正当性、完全性等を検証することができる。
同じ物性パラメータの対についての関係性であれば、本来は、まったく同じであることが期待される。しかしながら、システム側の物性パラメータ関係性が網羅的な条件下で規定されているのに対して、ユーザー側データベース50に規定されている関係性は、そのユーザーが必要な範囲内の条件で規定されている可能性が高い。例えば、一定の条件下ではその物性パラメータ対が正の相関係数(正比例関係)を持ち、別の条件下では負の相関係数(反比例関係)を持つ場合がある。システム側の物性パラメータの関係性は、その関係性を網羅的に規定するために、第1パラメータ対に条件付きエッジを対応付けて規定する。一方、ユーザーが一方の条件下での特性にしか興味がない、或いはその条件下での実験データしか収集されていない、などの事情により、第2パラメータ対には条件なしエッジが対応付けられる。このように、同じ物性パラメータ対についても条件の有無の異なるエッジが対応付けられる場合がある。
本実施形態4における関係性情報照合部55は、システム側の物性パラメータ関係性データベース1に規定されている第1パラメータ対と、ユーザー側データベース50に規定されている第2パラメータ対との間で、その関係性について条件の有無についての違いがあることを、関係性情報照合結果として出力する。上述の例では関係性情報照合部55は、上述の物性パラメータ対について、条件の有無がシステム側データベースとユーザー側データベースとの間で相違することを検出して出力することができる。
これにより、ユーザーは、第2パラメータ対がある一定の条件の下では、ユーザー側データベース50に規定されているのとは異なる関係性を示すことに気付くことができる。ユーザーがそのような知見を既に持っている場合であっても、そのような知見が正しかったことを確認することができる点で有益である。
より具体的な例を示す。
図22は、ユーザー側データベース50とシステム側データベース1とを照合するようすを示す説明図である。システム側データベース1は、図14の物性パラメータ関係性データベース1に相当し、これをグラフ3として表現したものである。
ユーザーは経験的に、遷移金属炭化物のビッカース硬度が融点に対して負の相関をもつ事を示す実験データ(図中のチャート)を持っており、その関係性が、「融点」と「ビッカース硬度」をパラメータ対とする関係性として、ユーザー側データベース50に保持されている。
この例において、「融点」と「ビッカース硬度」の対についての関係性情報を照合すると、関係性情報照合部55は照合結果として、システム側データベース1に格納されている、ノード「融点」からノード「ビッカース硬度」の経路を、例えば以下のような内容を出力する。
(1)「融点」から「結合ポテンシャルの深さ」と「引張り強さ」を経て「ビッカース硬度」に至る経路であること。
(2)「融点」から「結合ポテンシャルの深さ」へのエッジは、「1種類の結合からなる物質なら比例関係(正の相関)である」という条件付きであること。
(3)「結合ポテンシャルの深さ」から「引張り強さ」へのエッジは、「超塑性を示さない物質なら」という条件付きであること。
(4)「引張り強さ」から「ビッカース硬度」へのエッジは、「遷移金属炭化物なら比例関係(正の相関)である」という条件付きであること。
ユーザーはこの照合結果から、自身の持つ実験データが、遷移金属炭化物についてのデータであることから、上記(3)(4)の条件は満たされるが、(2)の条件は満たされないことを知ることができる。即ち、「遷移金属炭化物」は「1種類の結合からなる物質」ではないので、「融点」から「結合ポテンシャルの深さ」との関係性が正の相関となるとは限らないことに気づくことができる。
さらに、図22には図示されていないが、システム側データベース1に、図23、図24に示されるような、関係性を示すデータが格納されていれば、ユーザーにより深い検討を可能とする環境を提供することができる。図23は、純金属のビッカース硬度が融点に対して正の相関をもつ事を示す実験データ(チャート)であり、図24は、遷移金属炭化物のビッカース硬度がそれを構成する金属の融点に対して負の相関をもつ事を示す実験データ(チャート)である。
純金属のような一種類の結合からなる物質では、結合エネルギーの深さと融点、及び、結合エネルギーとビッカース硬度のいずれもが正の相関を持ち、図23に示されるような、融点とビッカース硬度との間にも正の相関がある。一方、遷移金属炭化物においては、ユーザーが持つ実験データのように、融点とビッカース硬度の間には負の相関が見られる(図22)。これは、結合ポテンシャル深さとビッカース硬度は正の関係にあるが、遷移金属炭化物においては、融点は結合ポテンシャルと正の関係性にはないためであると考えられる。さらに、遷移金属炭化物の融点が、構成遷移金属の融点でほぼ決定されることが知られており、図24に示されるようにビッカース硬度は構成遷移金属の融点とは負の相関にあることから、遷移金属炭化物において融点とビッカース硬度の間に負の相関がある理由は、以下のように説明される。
遷移金属炭化物中には、遷移金属―炭素結合と遷移金属同士の結合の2種類の結合が存在し、融点は遷移金属同士の結合のポテンシャル深さで決定される一方、ビッカース硬度は遷移金属―炭素結合ポテンシャル深さで決定されるからである。この系の場合、系全体の結合ポテンシャル深さは、遷移金属―炭素結合のポテンシャル深さで決定されるため、純金属で成立していた「融点と結合ポテンシャルとの間の正の関係性」が保たれない。
このように、ユーザー側データベースを、システム側データベース1(図14の物性パラメータ関係性データベース1)と照合することによって、ユーザーに新たな気づきを提供することができ、それを起点として新たな知見を得ることもできる。上述の例でユーザーが図24の関係性を新たな知見とすることができた場合には、構成する遷移金属の種類を適切に選択することによって、所望のビッカース硬度を有する遷移金属炭化物を特定することできることとなる。これは、実験によらずに最適材料を選定することができる点で、工業的な価値が極めて高い。
なお、実施形態3及び4において説明した、システム側データベースとユーザー側データベースとの間の照合は、その後のデータベースの統合を前提とするものではない。即ち、照合のみ行って、グラフを統合せず、またグラフの経路探索を実行しなくてもよい。また、照合の結果として、グラフの差集合や部分グラフを出力することができるように構成してもよい。
〔ユーザー側データベースと統合/照合する探索方法〕
以上のように実施形態2〜4で説明した本発明の探索システム10は、実施形態1の「ハードウェア/ソフトウェア実装形態」において図2を引用して説明したとおり、記憶装置と計算機を備えたハードウェアシステム上に、ソフトウェアとして機能構築することができる。したがって、本発明は、記憶装置と計算機を備えたハードウェアシステムを使う探索方法として位置付けることができる。
図25は、実施形態2〜4に係る探索方法の構成例を示すフローチャートである。
実施形態2〜4に係る探索方法は、入力工程(S1)で入力された物性パラメータ関係性データベース(図1の符合1)からグラフ(図1の符合3)を生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含み、以下のように構成される。
物性パラメータ関係性データベース(1)は、実施形態1〜4で説明したように、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶する。これを第1パラメータ対と呼ぶこととする。グラフ生成工程(S2)は、この第1パラメータ対に含まれる複数の物性パラメータをノードとし、それに対応するノード間をエッジとする、グラフ(3)を生成する。グラフ探索工程(S3)は、探索条件入力工程(S4)から与えられる探索条件(探索式を含む)に基づいてグラフ(3)を探索する。
実施形態2〜4に係る探索方法は、ユーザーデータベース入力工程(S5)をさらに含む。
ユーザーデータベース入力工程(S5)は、入力されるユーザー側データベースから第2パラメータ対を抽出して、ユーザー識別情報に基づいて識別されるユーザーごとに、ユーザー情報蓄積部(S8)に記憶する。ここで、第2パラメータ対は、ユーザー側データベースに記憶されている、互いに関係性を有する物性パラメータの対である。また、ユーザーは単一人の人に限られず、複数人によるユーザーグループであってもよい。
これにより、ユーザーが有形無形に持つ、物性パラメータ間の関係性情報に関する知見を、有効活用することができる。
上述の探索方法において、グラフ生成工程(S2)は、物性パラメータ関係性データベースに記憶される複数の第1パラメータ対に加えて、ユーザー側データベースから抽出された第2パラメータ対についても統合して、グラフ(3)を生成することができる。即ち、生成されるグラフ(3)は、第1パラメータ対に加えてさらに第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、第1パラメータ対に加えてさらに第2パラメータ対に対応するノード間をエッジとするグラフとなる。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報を、有効活用することができる。
上述の探索方法は、さらに、物性パラメータ関係性情報抽出工程(S6)と、物性パラメータ整合工程(S7)とを含んでもよい。
物性パラメータ関係性情報抽出工程(S6)は、ユーザー側データベースから複数の第2物性パラメータ名を抽出する。物性パラメータ整合工程(S7)は、シソーラス辞書を参照して、物性パラメータ名の整合をとる。例えば、物性パラメータ整合工程(S7)は、第2物性パラメータ名を第1物性パラメータ名と照合して、相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更する。
これにより、ユーザーが独自に持つ物性パラメータ間の関係性情報と探索システム側がユーザーに依らず共通に持つ関係性情報との間で、表現の違いなどの外見的な不整合を解消し、ユーザーが持つ情報をより有効に活用することができる。
上述の探索方法は、さらに関係性情報照合工程(S9)を含むとより好適である。
関係性情報照合工程(S9)は、第1パラメータ対と第2パラメータ対との間で、同じ物性パラメータの対についての関係性情報を照合し、照合結果を出力する(S11)。
これにより、ユーザーは、自身が独自に持つ物性パラメータ間の関係性情報の正当性、完全性等を検証することができる。
〔実施形態5〕<探索履歴の保持と管理>
図1に示したユーザー入力から入力されるユーザーデータは、ユーザーが実験等によって見出した物性パラメータ間の関係性情報であり得る。
図26は、実施形態5に係る探索システム10の構成例を示すブロック図である。
本実施形態5に係る探索システム10は、ユーザーインターフェース5に探索インターフェース56と探索履歴管理部57とを備える。グラフ探索部4における一連の探索を実行するために、探索インターフェース56から入力された探索条件を、探索履歴管理部57を介してユーザー情報蓄積部6に探索履歴62として保持する。探索履歴62には探索条件だけではなく、それに対応する探索結果が含まれてもよい。
ユーザーは、ユーザー情報蓄積部6に保持される探索履歴62を、ユーザーインターフェース5を介して参照することができる。
これにより、ユーザーは、自身が行った探索履歴を管理することができる。例えば、過去に実施した探索を参考にして、今後の探索方針に反映することができる。ユーザーは、自身が行った探索の履歴に限らず、他のユーザーが過去に行った探索の履歴も参照できるように構成することができる。他のユーザーに、またはどのユーザーに、自身の探索履歴の参照することを許可するかを、ユーザーごとに管理する手段を例えば探索履歴管理部57に持たせることができる。
〔実施形態6〕<探索履歴の解析>
図26に示した実施形態5の探索システム10において、ユーザーインターフェース5は、探索履歴解析部58をさらに備えてもよい。他の構成と動作は図26を引用して説明した実施形態5と同様であるので説明を省略する。
探索履歴解析部58は、ユーザー情報蓄積部6に保持される探索履歴62を解析して、その結果として参考情報をユーザーに提示する。例えば、ユーザーが既に過去に実行したことがある探索を再び実行しようとしたときに、既に探索済みである旨を警告する。
これにより、ユーザーは自身が行った探索の履歴から得られる知見を得て、以降の探索に利用することができる。
探索履歴解析部58は、さらに機械学習機能を備えることができる。例えば、探索履歴を対象とした機械学習を行ってユーザーの探索目標を推論し、推奨する探索式や探索範囲などの探索条件を、参考情報としてユーザーに提供することができる。
このとき、探索対象とする探索履歴は、ユーザーの探索目標を推論するときには当該ユーザーによる探索履歴に限定されるが、普遍的な探索傾向を学習するために、他のユーザーの探索履歴を対象とすることもできる。技術的問題ではないが、実用上は各ユーザーから、そのユーザーの探索履歴を普遍的な探索傾向を学習する目的で使用することについての同意を得ておく必要がある。
他の技術分野における他のユーザーの探索履歴を参考にすることにより、より高精度に、推奨すべき探索式や探索範囲などの探索条件を推論によって求めることができる。物性パラメータ間の関係性を規定する数式が、全く異なる技術分野において、全く異なる物性パラメータ間の関係性を規定するときにも、全く同じ形式または非常に似た形式になることがあるからである。全く同じ形式の数式によって規定される関係性は、グラフにおいては同一のトポロジーとなるので、グラフ理論に基づくアルゴリズムを用いた探索ソフトウェアを利用することができる。
より具体的な実施形態について説明する。
<ユーザー自身の探索履歴の利用>
ユーザーが探索を行ったときに、そのユーザーの探索履歴を参照して、ユーザーに気付きを促すことができるような参考情報を出力する。ここで、ユーザーは一個人である場合の他、例えば同一の研究テーマに従事するユーザーグループであってもよい。参考情報の出力は、例えば探索結果の表示、経路情報、部分グラフのデータとしての出力など、いかなる態様でもよい。
(1)ノードAを始点としノードBを終点とする経路のうち所定の長さn以下の経路の探索(図8の探索式query 4, “search paths from A to B within n paths”)が実行されたとき、同じ始点及び同じ終点を指定した探索履歴を参照して、それらの探索結果と、現在の探索結果との差分を参考情報として出力する。
参照に適した探索履歴の検索式は例えば、図8に示すquery 1, “search paths from A to B”)、query 2, “search paths from A to B including D in the paths”)、query 3, “search paths from A to B excluding D in the paths”)、query 4, “search paths from A to B within n paths”)等である。
過去に抽出されなかったが今回の探索で新たに抽出された経路に優先的に着目させることにより、ユーザーに新たな気付きを促すことができる。
(2)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、同じ始点Aで異なる終点(X)を指定した探索、及び/または異なる始点(Y)で同じ終点(B)を指定した探索履歴を参照して、それらの探索結果と現在の探索結果との共通経路、非共通経路、または探索結果の経路の和集合グラフを参考情報として出力する。
過去に探索されたことがある、異なる始点または異なる終点を指定した経路との共通点や差異点をユーザーに示すことにより、探索方針の確認や見直しの機会を提供することができる。
(3)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、終点(B)を始点として指定した探索(例えば図8に示すquery 1-4, “search paths from B to Z [ ・・・ ]”)、及び/または終点(B)の周辺の経路(例えば図8に示すquery 5, “search paths around B within m paths”)の履歴を参照して、それらの探索結果と現在の探索結果との共通経路、非共通経路、または探索結果の経路の和集合グラフを参考情報として出力する。
これにより、ユーザーが気づいていなかった新たな始点の候補、或いは終点の候補をユーザーに示し、気付きを促すことができる。
(4)ノードM周辺の長さm1ノード以下の経路を探索(例えば図8に示すquery 5, “search paths around M within m1 paths”)が実行されたとき、同じノードM周辺の異なる長さmiノード以下の経路探索履歴を参照して、その履歴の探索結果及び/またはその履歴の探索結果である経路を現在の探索結果である経路から減殺した差分を参考情報として出力する。
過去に抽出されなかったが今回の探索で新たに抽出された経路に優先的に着目させることにより、ユーザーに新たな気付きを促すことができる。
(5)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、その探索結果と経路の多くを共有する探索履歴を付加情報として出力する。同じような物性を経由しながら、始点A・終点Bとは異なる出発・目的物性の始点ノードA’・終点ノードB’を発見することができる。これにより、AをA’に置き換える、BをB’に置き換えるなどの発想を、ユーザーに促すことができる。
(6)ノードM周辺の長さm1ノード以下の経路を探索(例えば図8に示すquery 5, “search paths around M within m1 paths”)が実行されたとき、その探索結果の部分グラフと、グラフとしての形状が類似する部分グラフを持つ探索履歴を参考情報として出力する。
これにより、ユーザーが過去に探索した物性と一定の関連性を持つ物性パラメータ群を、代替案としてユーザーに提示する機能を提供することができる。
例えば、同じ数式が全く別の分野において全く別の物性間の関係性を理論的に説明することがある。ユーザーが探索している分野では未だ理論的に説明されていない関係性でも、他の分野、他の物性間の関係性と類似することがわかれば、ユーザーは、同じ数式で説明することができるのではないかという仮説を立てることができる。「同じ数式で説明する」という極端な仮説ではないまでも、類似の関連性を持つ物性群を提示されることにより、ユーザーは何らかの気付きを促されることが期待される。
<他のユーザーの探索履歴の利用>
ユーザーが探索を行ったときに、そのユーザーに限らず他のユーザーの探索履歴をも参照して、探索を行ったユーザーに気付きを促すことができるような参考情報を出力する。
(1)ノードAを始点としノードBを終点とする経路のうち所定の長さn以下の経路の探索(図8の探索式query 4, “search paths from A to B within n paths”)が実行されたとき、同じ始点及び同じ終点を指定した他のユーザーの探索履歴を参照して、他のユーザーが最も選んでいる経路や最も選んでいない経路を参考情報として出力する。
(2)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、同じ始点Aで異なる終点(X)を指定した探索、及び/または異なる始点(Y)で同じ終点(B)を指定した、他のユーザーの探索履歴を参照して、他のユーザーが最も選んでいる異なる終点(X1)、最も選んでいる異なる始点(Y1)、最も選んでいない異なる終点(X2)、最も選んでいない異なる始点(Y2)を参考情報として出力する。また、ユーザー自身が実行した、始点Aから終点Bへの探索結果である経路と、他のユーザーの探索履歴による経路との共通経路、非共通経路、2つの経路からなる和集合グラフなどを、参考情報として出力してもよい。このとき、他のユーザーの探索履歴による経路としては、例えば、始点Aから他のユーザーが最も選んでいる終点(X1)への経路、始点Aから他のユーザーが最も選んでいない終点(X2)への経路、他のユーザーが最も選んでいる始点(Y1)から終点(B)への経路、他のユーザーが最も選んでいない始点(Y2)から終点(B)への経路、などである。
(3)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、終点(B)を始点として指定した他のユーザーの探索(例えば図8に示すquery 1-4, “search paths from B to Z [ ・・・ ]”)、及び/または終点(B)の周辺の経路(例えば図8に示すquery 5, “search paths around B within m paths”)の履歴を参照して、他のユーザーの探索範囲を参考情報として出力する。また、他のユーザーが最も多く探索している終点(Z1)、最も少ない回数の探索履歴を持つ終点(Z2)、今回と過去の探索された範囲内に存在しながら、終点として探索されたことのないノード(Z3)等をさらに参考情報として出力しても良い。
(4)ノードM周辺の長さm1ノード以下の経路を探索(例えば図8に示すquery 5, “search paths around M within m1 paths”)が実行されたとき、他のユーザーによる同じノードM周辺の異なる長さmiノード以下の経路探索履歴を参照して、最も多く探索されている探索式、最も回数の少ない探索式等のリスト、または現在の探索結果との差分を、参考情報として出力することができる。
(5)ノードAを始点としノードBを終点とする経路の探索(図8の探索式query 1-4, “search paths from A to B [ ・・・ ]”)が実行されたとき、その探索結果と経路の多くを共有する、他のユーザーによる探索履歴を付加情報として出力する。同じような物性を経由しながら、始点A・終点Bとは異なる出発・目的物性の始点ノードA’・終点ノードB’を発見することができる。これにより、AをA’に置き換える、BをB’に置き換えるなどの発想を、ユーザーに促すことができる。
(6)ノードM周辺の長さm1ノード以下の経路を探索(例えば図8に示すquery 5, “search paths around M within m1 paths”)が実行されたとき、その探索結果の部分グラフと、グラフとしての形状が類似する部分グラフを持つ、他のユーザーによる探索履歴を参考情報として出力する。
これにより、他のユーザーが過去に探索した物性と一定の関連性を持つ物性パラメータ群を、代替案としてユーザーに提示する機能を提供することができる。
〔ユーザーの探索履歴を、保持、管理、解析して利用する探索方法〕
以上のように実施形態5〜6で説明した本発明の探索システム10は、実施形態1の「ハードウェア/ソフトウェア実装形態」において図2を引用して説明したとおり、記憶装置と計算機を備えたハードウェアシステム上に、ソフトウェアとして機能構築することができる。したがって、本発明は、記憶装置と計算機を備えたハードウェアシステムを使う探索方法として位置付けることができる。
図27は、実施形態5〜6に係る探索方法の構成例を示すフローチャートである。
実施形態5〜6に係る探索方法は、物性パラメータ関係性データベース入力工程(S1)で入力された物性パラメータ関係性データベース(図1の符合1)からグラフ(図1の符合3)を生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含み、以下のように構成される。
物性パラメータ関係性データベース(1)は、実施形態5〜6で説明したように、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶する。グラフ生成工程(S2)は、このパラメータ対に含まれる複数の物性パラメータをノードとし、それに対応するノード間をエッジとする、グラフ(3)を生成する。グラフ探索工程(S3)は、探索条件入力工程(S4)から与えられる探索条件(探索式を含む)に基づいてグラフ(3)を探索する。
実施形態5〜6に係る探索方法は、探索履歴管理工程(S12)をさらに含む。
探索履歴管理工程(S12)は、探索条件入力工程(S4)を介して与えられる探索条件を探索履歴として、ユーザー識別情報に基づいて識別されるユーザーごとに、探索履歴保持部(S13)に記憶する。探索履歴としては、探索条件に対応する探索結果も合わせて探索履歴保持部(S13)に記憶することができる。ユーザーは、記憶されている探索履歴を参照して探索履歴参照結果(S14)を得ることができる。自身の探索履歴に限定されるとは限らず、当該探索を行ったユーザーから参照することを許可された探索履歴を参照することができる。
これにより、ユーザーは、自身または自身に許可を与えた他のユーザーが行った探索履歴を参照することができ、自身の探索方針に適切なフィードバックを与え、効率を向上することができる。
上述の探索方法は、探索履歴解析工程(S15)をさらに備えるとより好適である。
探索履歴解析工程(S15)は、探索履歴保持部(S13)に保持される探索履歴を解析して、解析結果(S16)をユーザーに提示する。解析の具体例は、「ユーザー自身の探索履歴の利用」、「他のユーザーの探索履歴の利用」に上述した通りである。
これにより、ユーザーは自身が行った探索の履歴から得られる知見を得て、以降の探索に利用することができる。
〔実施形態7〕<物性パラメータ関係性情報抽出部>
図1に示した実施形態1の探索システム10において、物性パラメータ関係性情報抽出部71をさらに備えてもよい。物性パラメータ関係性情報抽出部71は、学習データ70として入力される教科書的文書や論文等の自然言語を対象とする深層学習によって、物性パラメータ対とその関係性の情報を抽出して、物性パラメータ関係性データベース1に供給する。
図28は、本実施形態7に係る探索システム10の構成例を示すブロック図である。
探索システム10は、学習データ70から物性パラメータ対とその関係性情報を抽出して物性パラメータ関係性データベース1に供給する、物性パラメータ関係性情報抽出部71をさらに備える。他の構成と動作は図1,10,11,14,20,21,26を引用して説明した実施形態1〜6と同様であるので説明を省略する。
図29は、物性パラメータ関係性情報抽出部71の一構成例を示すブロック図である。
物性パラメータ関係性情報抽出部71は、学習モデル生成部72と関係性抽出部75を備え、さらにコーパス79が入力されるクリーニング部80を備えてもよい。
学習モデル生成部72は、入力される学習データ70から物性名を抽出する物性名モデル生成部73と関係性表現を抽出する関係性表現モデル生成部74を有する。物性名モデル生成部73は物性名モデルを、関係性表現モデル生成部74は関係性表現モデルを、それぞれ学習モデルとして生成して関係性抽出部75に供給する。
関係性抽出部75は、位置関係判定部78を有し、2つの物性名とその関係性を示す関係性表現からなるトリプルを抽出する。ここで「トリプル」とは「AとBがCの関係にある」というような表現である。関係性抽出部75は、学習モデル生成部72から供給される物性名モデルと関係性表現モデルから、物性名リスト76と関係性表現リスト77とを生成して位置関係判定部78に供給する。位置関係判定部78は、物性名リスト76と関係性表現リスト77に含まれる物性名と関係表現の単語の、入力された学習データ70に含まれる文章における位置関係から、トリプルを抽出して出力する。位置関係を判定する自然言語処理には、共起、Word2Vecなどの公知のアルゴリズムを採用することができる。「共起」は、2語または複数の語が文章中に近接して出現する場合に、相互の関係性が深いと推定するアルゴリズムであって、関係性を有する物性パラメータの対を抽出する処理に適用することができる。関係性を有するとして抽出された2語の近傍には、その関係性を記述する語が記述されている可能性が高いので、関係性を表す語をさらに抽出して、「トリプル」とすることができる。「Word2Vec」は、複数の語の概念を多次元空間上にベクトル表現し、ベクトルのなす角度を2つの語の関係の密度(密か疎か)に対応付ける、自然言語処理におけるアルゴリズムであり、ニューラルネットワークによる自然言語処理で採用されることが多い。密な関係を有する語の対を抽出する処理に利用することができる。
トリプルを抽出した出力データには、物性名以外の事象の関係性が含まれる場合があるので、コーパス79を用いたクリーニング部80において、不適当なデータを除去して、物性パラメータ関係データベース1に供給する。ここでコーパス(corpus)とは、技術用語辞典等に基づいて、物性パラメータにその品詞、統語などの付帯的な属性を構造化したデータベースである。
これにより、物性パラメータ関係データベース1を更新する管理負担を軽減することができる。
本実施形態では、コーパス79が探索システム10内に保持されている構成例を示したが、外部から供給されてもよい。
クリーニング部80の出力には、物性パラメータ関係データベース1に既に含まれている物性パラメータ対の関係性が重複して含まれる可能性がある。探索システム10には、物性パラメータ関係データベース1に既に含まれている物性パラメータ対の関係性と、物性パラメータ関係性情報抽出部71で抽出された物性パラメータ対の関係性とを照合して、矛盾等がないことを確認する検証部をさらに備えてもよい。これにより、物性パラメータ関係データベース1の信頼性を保つことができる。
入力する学習データ70には、物性名とその関係性を規定する文書データ、例えば、教科書等の文書が含まれている必要がある。教科書には一般に、多くの専門家によって直接、間接に精査されて学術的に真実であることが確認された事実のみが記載されているので、物性パラメータ間の誤った関係性が物性パラメータ関係データベース1に混入する恐れが軽減される。また、学習データ70は、自然言語による文書、即ちテキストデータの他、数式を含んでいてもよい。数式はMath MLなど周知の形式で表現されているとよい。一方、教科書等の文献ではテキストデータを伴うpdfで提供されていても数式は画像データである場合が多い。画像データから変数パラメータや関数、演算子、イコール(“=”)などの配置を解析することにより、変数パラメータ間の関係性を理解することができる。変数パラメータは、符合、記号で表されるので、当該学習データ内での物性名と符合、記号との対応付けを参照することにより、学習データ内の数式が画像データであっても、その数式から物性名モデル及び関係性モデルの学習モデルとして抽出することができる。
入力する学習データ70には、物性名とその関係性を規定する文書データの他に、正確な物性名を列挙するデータを含んでいてもよい。例えば、科学用語辞典の見出しやデータハンドブックの索引、ウィキベディアのタグなどがこれに相当する。このような学習データを物性名モデル生成部73の入力とすることにより、生成される物性名リスト76の精度と網羅性が向上し、学習モデルの質が向上する。また、学習モデル生成のすべてを自動化するのではなく、人手によって作成した学習モデルを物性パラメータ関係性情報抽出部71に入力できるように構成してもよい。以下に、いくつかの変形例として説明する。
〔変形例1〕
教科書的文書や論文などの自然言語の学習データに加えて、教科書的文書から人手によって抽出した物性名と関係性表現とを更なる学習データとして、学習モデル生成部72に入力してもよい。学習モデル生成部72は、固有表現抽出を行うことにより、人手によって抽出された物性名と関係性表現が学習データ内の自然言語に出現するパターンを学習し、他の物性名と関係性表現をさらに抽出して、物性名モデル及び関係性モデルの学習モデルを生成することができる。
〔変形例2〕
学習モデル生成部72から物性名モデル生成部73を省略し、代わりに、物性名の辞書、教科書的文書等から人手によって抽出した物性名を、関係性抽出部75の物性名リスト76として直接入力することができる。辞書等から抽出して入力した物性名以外の物性名をさらに抽出することはできないが、物性名以外の単語を誤って抽出する恐れがなくなり、コーパス79及びクリーニング部80の処理負担を軽減し、または省略することができる。
〔変形例3〕
学習モデル生成部72全体を省略し、代わりに、教科書的文書等から人手によって抽出した物性名及びその関係性を、学習データとして位置関係判定部78に直接入力することができる。さらに、教科書的文書や論文、その他の物性について記述した文書をベクトル化し、単語ベクトルとして、位置関係判定部78に直接入力することができる。
人手によって物性名及びその関係性を抽出した学習データでは、関係性を「比例」、「反比例」、「指数」、「対数」、「二乗比例」、「単調増加(定性的関係)」、「単調減少(定性的関係)」等に、ある程度類型化することによって、事前の人手による学習データ抽出における負担を軽減することができる上、関係性抽出部75の処理の負荷を軽減することができる。一方、関係性抽出部75の処理対象である教科書的文書において、上述の類型として明確に定義された表現とは異なる表現が用いられていても、固有表現抽出などのさらなる処理を追加しない限り、関係性情報として抽出することができない。教科書的文書等に基づく単語ベクトルを位置関係判定部78に入力することによって、上記類型とは異なる表現による関係性を、補完的に抽出することができる。
この変形例においても、物性名以外の単語を誤って抽出する恐れは少なくなるので、コーパス79及びクリーニング部80の処理負担を軽減し、または省略することができる。
〔物性パラメータ関係性情報抽出工程を含む探索方法〕
以上のように実施形態7で説明した本発明の探索システム10は、実施形態1の「ハードウェア/ソフトウェア実装形態」において図2を引用して説明したとおり、記憶装置と計算機を備えたハードウェアシステム上に、ソフトウェアとして機能構築することができる。したがって、本発明は、記憶装置と計算機を備えたハードウェアシステムを使う探索方法として位置付けることができる。
図30は、実施形態7に係る探索方法の構成例を示すフローチャートである。
実施形態7に係る探索方法は、物性パラメータ関係性データベース入力工程(S1)で入力された物性パラメータ関係性データベース(図1の符合1)から、グラフ(図1の符合3)を生成するグラフ生成工程(S2)と、グラフ探索工程(S3)とを含み、以下のように構成される。
物性パラメータ関係性データベース(1)は、実施形態1〜6で説明したように、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶する。グラフ生成工程(S2)は、このパラメータ対に含まれる複数の物性パラメータをノードとし、それに対応するノード間をエッジとする、グラフ(3)を生成する。グラフ探索工程(S3)は、探索条件入力工程(S4)から与えられる探索条件(探索式を含む)に基づいてグラフ(3)を探索する。
実施形態7に係る探索方法は、学習モデル生成工程(S21)と関係性抽出工程(S24)とをさらに含む。
学習モデル生成部(S21)は、供給される学習データ(S20)から、物性名モデルと関係性モデルとを学習モデルとして生成(S22,S23)して関係性抽出工程(S24)に供給する。
関係性抽出工程(S24)には、学習データ(S20)から自然言語による文書データが入力される。関係性抽出工程(S24)は、前記物性名モデルから作成する物性名リストと、前記関係性表現モデルから作成する関係性表現リストとを用いて、入力された前記文書データにおける物性名と関係性表現との位置関係に基づいて、因果関係を持つ物性パラメータ対に対応する2個の物性名とその関係性とを表す関係性表現とを含むトリプルを抽出して出力データとして出力する。
本探索方法は、その出力データによって、物性パラメータ関係性データベース(1)の内容を更新する。
これにより、物性パラメータ関係データベース(1)を更新する管理負担を軽減することができる。
上述の探索方法は、コーパスが入力されるクリーニング工程(S25)をさらに含むとより好適である。
クリーニング工程(S25)は、コーパスに基づいて、関係性抽出工程(S24)によって抽出されたトリプルから、物性パラメータ対の関係性を示すものではないと判断されるトリプルを除去して、前記出力データとする。
これにより、物性パラメータ関係データベース(1)を更新する際の、データの信頼性についての管理負担を軽減することができる。
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
本発明は、データベースを使った探索システムおよび探索方法に関し、特に複数の物性パラメータの間の関係性の探索に好適に利用できる。
1 物性パラメータ関係性データベース
2 グラフ生成部
3 グラフ
4 グラフ探索部
5 ユーザーインターフェース
6 ユーザー情報蓄積部
7 条件抽出部
8 経路評価部
9 優先度決定部
10 探索システム
11 物性パラメータ関係性データベースの入力フォーム
12 ノードの属性を記述するための入力フォーム
50 ユーザー側データベース
51 データベース入力部
52 物性パラメータ関係性情報抽出部
53 物性パラメータ整合部
54 シソーラス辞書
55 関係性情報照合部
56 探索インターフェース
57 探索履歴管理部
58 探索履歴解析部
61 ユーザー側物性パラメータ関係性情報
62 探索履歴
70 学習データ
71 物性パラメータ関係性情報抽出部
72 学習モデル生成部
73 物性名モデル生成部
74 関係性表現モデル生成部
75 関係性抽出部
76 物性名リスト
77 関係性表現リスト
78 位置関係判定部
79 コーパス
80 クリーニング部
100 サーバー
110、120 ワークステーション
101、111、121 計算機
102、112、122 記憶装置
103、113、123 ネットワークインターフェース
104、114、124 入力部
105、115、125 表示部
200 ネットワーク

Claims (16)

  1. データベースとグラフ生成部とグラフ探索部とを備える探索システムであって、
    ユーザーインターフェースとユーザー情報蓄積部とをさらに備え、
    前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶し、
    前記グラフ生成部は、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフを生成可能に構成され、
    前記グラフ探索部は、前記ユーザーインターフェースを介して、与えられる探索条件に基づいて前記グラフを探索し、探索結果を出力可能に構成され、
    前記ユーザーインターフェースは、ユーザー識別情報に基づいて識別されるユーザーごとに、当該ユーザーから入力されるデータを前記ユーザー情報蓄積部に保持させることを可能とするように構成される、
    探索システム。
  2. 請求項1において、
    前記データベースを第1データベースとし、
    前記パラメータ対を第1パラメータ対とし、
    前記ユーザーインターフェースは、第2データベースを入力可能なデータベース入力部をさらに備え、
    前記データベース入力部は、前記第2データベースから互いに関係性を有する物性パラメータの対を第2パラメータ対として抽出可能に構成され、前記第2パラメータ対及びその関連性情報を前記ユーザー情報蓄積部に保持させることを可能とするように構成され、
    前記グラフ生成部が生成する前記グラフは、前記第1パラメータ対に加えてさらに前記第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に加えてさらに前記第2パラメータ対に対応するノード間をエッジとするグラフである、
    探索システム。
  3. 請求項2において、
    前記データベース入力部は、物性パラメータ関係性情報抽出部と、物性パラメータ整合部と、シソーラス辞書とをさらに備え、
    前記物性パラメータ関係性情報抽出部は、前記第2データベースから複数の第2物性パラメータ名を抽出可能に構成され、
    前記物性パラメータ整合部は、前記シソーラス辞書を参照して、前記複数の第2物性パラメータ名を前記第1データベースに記憶されている複数の第1物性パラメータ名と照合して、相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更することにより物性パラメータ名を整合可能に構成される、
    探索システム。
  4. 請求項3において、
    前記ユーザーインターフェースは、関係性情報照合部をさらに備え、
    前記関係性情報照合部は、前記第1パラメータ対と前記第2パラメータ対との間で、同じ物性パラメータの対についての関係性情報を照合し、照合結果を出力可能に構成される、
    探索システム。
  5. 請求項1において、
    前記ユーザーインターフェースは、探索インターフェースと探索履歴管理部とをさらに備え、
    前記探索インターフェースは、ユーザーが指定する探索条件を前記グラフ探索部に入力し、前記グラフ探索部から出力される探索結果をユーザーに出力可能に構成され、
    前記探索履歴管理部は、前記探索条件とそれに対応する探索結果のうち少なくとも探索条件を、前記ユーザー情報蓄積部に探索履歴として保持可能に構成され、
    前記ユーザーインターフェースは、前記ユーザー情報蓄積部に保持される前記探索履歴を、ユーザーによって参照可能に構成される、
    探索システム。
  6. 請求項5において、
    前記ユーザーインターフェースは、探索履歴解析部をさらに備え、
    前記探索履歴解析部は、前記ユーザー情報蓄積部に保持される前記探索履歴を解析して、解析結果をユーザーに提示可能に構成される、
    探索システム。
  7. 請求項1において、
    前記探索システムは、物性パラメータ関係性情報抽出部をさらに備え、
    前記物性パラメータ関係性データ抽出部は、学習モデル生成部と関係性抽出部とを備え、
    前記学習モデル生成部は、供給される学習データから、物性名モデルと関係性表現モデルとを学習モデルとして生成して前記関係性抽出部に供給し、
    前記学習データには物性名とその関係性を規定する文書データが含まれ、前記関係性抽出部には、前記文書データが入力され、前記物性名モデルから作成する物性名リストと、前記関係性表現モデルから作成する関係性表現リストとを用いて、入力された前記文書データにおける物性名と関係性表現との位置関係に基づいて、因果関係を持つ物性パラメータ対に対応する2個の物性名とその関係性とを表す関係性表現とを含むトリプルを抽出して出力データとし、
    前記探索システムは、前記出力データによって、前記データベースの内容を更新する、
    探索システム。
  8. 請求項7において、
    前記物性パラメータ関係性情報抽出部は、コーパスが入力されるクリーニング部をさらに備え、
    前記クリーニング部は前記コーパスに基づいて、前記関係抽出部によって抽出された前記トリプルから、物性パラメータ対の関係性を示すものではないと判断されるトリプルを除去して、前記出力データとする、
    探索システム。
  9. 第1データベースからグラフを生成するグラフ生成工程と、グラフ探索工程とを含む、探索方法であって、
    前記第1データベースは、互いに関係性を有する物性パラメータの複数の第1パラメータ対を記憶し、
    前記グラフは、前記第1パラメータ対に含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に対応するノード間をエッジとする、グラフであり、
    前記グラフ探索工程は、与えられる探索条件に基づいて前記グラフを探索し、
    前記探索方法は、データベース入力工程をさらに含み、
    前記データベース入力工程は、入力される第2データベースから第2パラメータ対を抽出して、ユーザー識別情報に基づいて識別されるユーザーごとに、ユーザー情報蓄積部に記憶し、
    前記第2パラメータ対は、互いに関係性を有する物性パラメータの対であって、前記第2データベースに記憶される、
    探索方法。
  10. 請求項9において、
    前記グラフ生成工程で生成される前記グラフは、前記第1パラメータ対に加えてさらに前記第2パラメータ対のいずれかに含まれる複数の物性パラメータをノードとし、前記第1パラメータ対に加えてさらに前記第2パラメータ対に対応するノード間をエッジとするグラフである、
    探索方法。
  11. 請求項10において、前記探索方法は、物性パラメータ関係性情報抽出工程と、物性パラメータ整合工程とをさらに含み、
    前記物性パラメータ関係性情報抽出工程は、前記第2データベースから複数の第2物性パラメータ名を抽出し、
    前記物性パラメータ整合工程は、シソーラス辞書を参照して、前記複数の第2物性パラメータ名を前記第1データベースに記憶されている複数の第1物性パラメータ名と照合して、相違する場合に第2物性パラメータ名を第1物性パラメータ名に変更することにより物性パラメータ名の整合をとる、
    探索方法。
  12. 請求項10において、前記探索方法は、関係性情報照合工程をさらに含み、
    前記関係性情報照合工程は、前記第1パラメータ対と前記第2パラメータ対との間で、同じ物性パラメータの対についての関係性情報を照合し、照合結果を出力する、
    探索方法。
  13. データベースからグラフを生成するグラフ生成工程と、グラフ探索工程とを含む、探索方法であって、
    前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶し、
    前記グラフは、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフであり、
    前記グラフ探索工程は、探索条件入力工程を介して与えられる探索条件に基づいて前記グラフを探索し、
    前記探索方法は、探索履歴管理工程をさらに含み、
    前記探索履歴管理工程は、前記探索条件入力工程を介して与えられる前記探索条件とそれに対応する探索結果のうち少なくとも探索条件を探索履歴として、ユーザー識別情報に基づいて識別されるユーザーごとに、探索履歴保持部に記憶し、ユーザー識別情報に基づいて許可されるユーザーに当該探索履歴の参照を許す、
    探索方法。
  14. 請求項13において、前記探索方法は、探索履歴解析工程をさらに備え、
    前記探索履歴解析工程は、前記探索履歴保持部に保持される前記探索履歴を解析して、解析結果を出力する、
    探索方法。
  15. データベースからグラフを生成するグラフ生成工程と、グラフ探索工程とを含む、探索方法であって、
    前記データベースは、互いに関係性を有する物性パラメータの複数のパラメータ対を記憶し、
    前記グラフは、前記パラメータ対に含まれる複数の物性パラメータをノードとし、前記パラメータ対に対応するノード間をエッジとする、グラフであり、
    前記グラフ探索工程は、与えられる探索条件に基づいて前記グラフを探索し、
    前記探索方法は、学習モデル生成工程と関係性抽出工程とをさらに含み、
    前記学習モデル生成部は、供給される学習データから、物性名モデルと関係性モデルとを学習モデルとして生成して前記関係性抽出工程に供給し、
    前記学習データには物性名とその関係性を規定する文書データが含まれ、前記関係性抽出工程には、前記文書データが入力され、
    前記関係性抽出工程は、前記物性名モデルから作成する物性名リストと、前記関係性表現モデルから作成する関係性表現リストとを用いて、入力された前記文書データにおける物性名と関係性表現との位置関係に基づいて、因果関係を持つ物性パラメータ対に対応する2個の物性名とその関係性とを表す関係性表現とを含むトリプルを抽出して出力データとして出力し、
    前記探索方法は、前記出力データによって、前記データベースの内容を更新する、
    探索方法。
  16. 請求項15において、前記探索方法は、コーパスが入力されるクリーニング工程をさらに含み、
    前記クリーニング工程は、前記コーパスに基づいて、前記関係性抽出工程によって抽出された前記トリプルから、物性パラメータ対の関係性を示すものではないと判断されるトリプルを除去して、前記出力データとする、
    探索方法。
JP2020538267A 2018-08-23 2019-08-01 探索システムおよび探索方法 Active JP7026973B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018155925 2018-08-23
JP2018155925 2018-08-23
PCT/JP2019/030108 WO2020039871A1 (ja) 2018-08-23 2019-08-01 探索システムおよび探索方法

Publications (2)

Publication Number Publication Date
JPWO2020039871A1 true JPWO2020039871A1 (ja) 2021-09-30
JP7026973B2 JP7026973B2 (ja) 2022-03-01

Family

ID=69592863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020538267A Active JP7026973B2 (ja) 2018-08-23 2019-08-01 探索システムおよび探索方法

Country Status (4)

Country Link
US (1) US11544295B2 (ja)
EP (1) EP3825867A4 (ja)
JP (1) JP7026973B2 (ja)
WO (1) WO2020039871A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3822826A1 (en) * 2019-11-15 2021-05-19 Siemens Energy Global GmbH & Co. KG Database interaction and interpretation tool
WO2021166728A1 (ja) * 2020-02-19 2021-08-26 国立研究開発法人物質・材料研究機構 情報処理方法、探索システムおよび探索方法
CN111324643B (zh) * 2020-03-30 2023-08-29 北京百度网讯科技有限公司 知识图谱的生成方法、关系挖掘方法、装置、设备和介质
CN112131261B (zh) * 2020-10-09 2024-02-09 腾讯科技(深圳)有限公司 基于社区网络的社区查询方法、装置和计算机设备
JP7093144B1 (ja) 2022-04-26 2022-06-29 Gc株式会社 テスト支援プログラム、テスト支援装置、ならびに、テスト支援方法
JP7454735B1 (ja) 2023-08-09 2024-03-22 長瀬産業株式会社 情報処理装置、情報処理方法、プログラム、及び記録媒体
JP7458543B1 (ja) 2023-08-09 2024-03-29 長瀬産業株式会社 情報処理装置、情報処理方法、プログラム、及び記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207906A (ja) * 1997-01-27 1998-08-07 Fuji Xerox Co Ltd 検索履歴管理装置
WO2017221444A1 (ja) * 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7865534B2 (en) * 2002-09-30 2011-01-04 Genstruct, Inc. System, method and apparatus for assembling and mining life science data
JP4780554B2 (ja) 2005-07-11 2011-09-28 大和 寛 新規材料の構成物質情報探索方法、及び新規材料の構成物質情報探索システム
KR101133993B1 (ko) * 2010-11-02 2012-04-09 한국과학기술정보연구원 추론 검증 및 점증적 추론을 위한 트리플 저장 방법 및 장치 그리고 이에 적합한 추론 의존성 색인 방법 및 장치
EP3113042A1 (en) * 2015-07-01 2017-01-04 Alcatel Lucent A method for providing contextual information, an information processing system and a computer program product
US10373525B2 (en) * 2015-09-28 2019-08-06 International Business Machines Corporation Integrated curriculum based math problem generation
US10726202B2 (en) * 2017-03-23 2020-07-28 Bioz, Inc. Inclusion of protocol conditions within search engine results
CN110741360A (zh) * 2017-04-03 2020-01-31 美国化学协会 用于查询和索引优化以用于在来自数据库的配方数据结构的实例中检索数据的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207906A (ja) * 1997-01-27 1998-08-07 Fuji Xerox Co Ltd 検索履歴管理装置
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
WO2017221444A1 (ja) * 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置

Also Published As

Publication number Publication date
US11544295B2 (en) 2023-01-03
JP7026973B2 (ja) 2022-03-01
WO2020039871A1 (ja) 2020-02-27
US20210303601A1 (en) 2021-09-30
EP3825867A1 (en) 2021-05-26
EP3825867A4 (en) 2021-09-15

Similar Documents

Publication Publication Date Title
JP7026973B2 (ja) 探索システムおよび探索方法
Zhong et al. A scientometric analysis and critical review of construction related ontology research
Yao et al. Mashup recommendation by regularizing matrix factorization with API co-invocations
CN100583804C (zh) 基于专家值传播算法的社会网络专家信息处理系统及方法
Kong et al. Application of fuzzy soft set in decision making problems based on grey theory
Chen et al. Recommendation based on contextual opinions
US11138772B2 (en) Search system, search method, and material property database management apparatus
WO2021213314A1 (zh) 数据处理方法、装置及计算机可读存储介质
US7757163B2 (en) Method and system for characterizing unknown annotator and its type system with respect to reference annotation types and associated reference taxonomy nodes
Nigam et al. Job recommendation through progression of job selection
WO2012159057A1 (en) System and method for conducting processor-assisted indexing and searching
KR20140067697A (ko) 협업 파트너 검색 서비스를 제공하는 시스템 및 방법
Issa et al. Revealing the conceptual schemas of RDF datasets
Sztyler et al. LODE: Linking digital humanities content to the web of data
Browne et al. Integrating textual analysis and evidential reasoning for decision making in engineering design
Ceravolo et al. Bottom-up extraction and trust-based refinement of ontology metadata
Kaufmann et al. Combining bottom-up and top-down generation of interactive knowledge maps for enterprise search
JP2018147351A (ja) 知識モデル構築システム及び知識モデル構築方法
Zhitomirsky-Geffet et al. Maximizing agreement on diverse ontologies with “wisdom of crowds” relation classification
KR101691379B1 (ko) 기술 협력 파트너 추천 장치 및 방법
CN114706989A (zh) 一种基于技术创新资产为知识库的智能推荐方法
Boeva et al. Identifying a group of subject experts using formal concept analysis
Kavitha et al. Learning to rank experts using combination of multiple features of expertise
Panahiazar et al. Context aware recommendation engine for metadata submission
Wang et al. Considering social information in constructing research topic maps

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210128

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220208

R150 Certificate of patent or registration of utility model

Ref document number: 7026973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150