JP2022187507A - 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム - Google Patents

技術調査支援装置、技術調査支援方法、および技術調査支援プログラム Download PDF

Info

Publication number
JP2022187507A
JP2022187507A JP2021095518A JP2021095518A JP2022187507A JP 2022187507 A JP2022187507 A JP 2022187507A JP 2021095518 A JP2021095518 A JP 2021095518A JP 2021095518 A JP2021095518 A JP 2021095518A JP 2022187507 A JP2022187507 A JP 2022187507A
Authority
JP
Japan
Prior art keywords
information
search
unit
user terminal
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021095518A
Other languages
English (en)
Other versions
JP7029204B1 (ja
Inventor
謙互 中嶋
Kengo Nakajima
一 白坂
Hajime Shirasaka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Samurai Inc
Original Assignee
AI Samurai Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Samurai Inc filed Critical AI Samurai Inc
Priority to JP2021095518A priority Critical patent/JP7029204B1/ja
Application granted granted Critical
Publication of JP7029204B1 publication Critical patent/JP7029204B1/ja
Publication of JP2022187507A publication Critical patent/JP2022187507A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】検索ミスを低減することができ、ユーザの経験によらず一定水準の検索をすることが可能であって、検索時間を短縮させることができる技術調査支援装置等を提供する。【解決手段】技術調査支援装置は、ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力部と、前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行部と、前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行部の検索を繰り返し実行することで技術俯瞰情報を更新する生成部と、前記技術俯瞰情報を前記ユーザ端末へ出力する出力部と、を備える。【選択図】 図1

Description

本発明は、技術調査支援装置、技術調査支援方法、および技術調査支援プログラムに関する。
近年、膨大な文書のなかから、条件に近い内容の文書を検索するシステムが提案されている(例えば、特許文献1)。特許文献1には、文書情報を所定の構成単位に分解し、検索クエリとして、構成単位に含まれるキーワードに基づく構成単位ごとの検索式を生成することが記載されている。特許文献1のシステムによれば、生成された検索式はユーザに提示される。そのため、ユーザは、どのような検索式で検索が行われるのかを事前に確認することができ、検索の妥当性を確認することができる。
国際出願PCT/JP2020/021848号明細書
しかし、特許文献1のシステムに基づくと、コンピュータ処理に基づき検索式が生成されるため、検索範囲が不透明であると指摘されている。また、その検索式が妥当であるかの判断は、技術的知識および検索経験の浅いユーザにとっては困難であるという問題があった。また、検索の結果、文書の一部にしか条件に近い内容が記載されておらず、文書の全体としては類似度が低い文書が検索される場合が生じ得る。ユーザが意図しない文書が検索された場合、条件に用いるキーワード、文節、文章等の選定を最初からやり直す必要が生じる。そして、条件に近い内容の文書が検索されるまで、検索条件の選定を何回も繰り返すことになる。
すなわち、書誌事項である出願番号、出願日、特許番号、登録日、発明の名称、出願人、権利者、国際特許分類などを項目別に一次検索を行い 次に、一次検索された特許情報(文書)から、さらに細分化しようとすると、検索しようとする技術に精通した技術者が時間を掛け、手作業で階層別、分類別検索などをしなければならなかった。そのため、技術に精通している熟練ユーザと経験が浅いユーザとでは、検索の精度に差が生じ、また無駄な時間や労力および多大な費用を費やす必要があり、企業として大きな損失となる。そこで、検索結果を効率的に絞り込むことが求められている。
本発明は上記に鑑みてなされたものであり、検索ミスを低減することができ、ユーザの経験によらず一定水準の検索をすることが可能であって、検索時間を短縮させることができる技術調査支援装置および技術調査支援方法並びに技術調査支援プログラムを提供することができる。
本発明の一実施形態による技術調査支援装置は、書誌情報と先行文書情報を備える文書データを複数記憶する文書情報データベースと、ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力部と、前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行部と、前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行部の検索を繰り返し実行することで技術俯瞰情報を更新する生成部と、前記技術俯瞰情報を前記ユーザ端末へ出力する出力部と、を備える。
また、本発明の一実施形態における技術調査支援装置において、前記生成部は、前記ユーザ端末から送信された前記検索キーワードに関連するヒント情報を生成する。
また、本発明の一実施形態における技術調査支援装置において、前記検索条件の履歴情報をフィードバックする記憶部と、前記フィードバックされた前記履歴情報を機械学習する、学習部を、さらに備え、前記出力部は、機械学習された前記履歴情報に基づき、前記検索キーワードに関連する推奨キーワードをヒント情報として出力する。
また、本発明の一実施形態における技術調査支援装置において、各検索キーワードに関する上位語、下位語、同義語及び類義語としての類義語辞書を格納する類義語データベースを備え、前記出力部は、前記類義語データベースから、各検索キーワードに対応付けて前記類義語を出力する。
また、本発明の一実施形態における技術調査支援装置において、前記入力部は、複数の前記検索キーワードを含む文書情報を受け付けることが可能であって、前記検索実行部は、前記文書情報に基づいて、前記文書情報を含む先行文書情報の検索を繰り返し実行する。
また、本発明の一実施形態における技術調査支援装置において、前記生成部は、入力された前記検索キーワードに基づき、検索式を生成する。
本発明の一実施形態における技術調査支援方法は、コンピュータに、書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶するステップと、ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力ステップと、前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行ステップと、前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行ステップの検索を繰り返し実行することで技術俯瞰情報を更新する生成ステップと、前記技術俯瞰情報を前記ユーザ端末へ出力する出力ステップと、を実行させる。
本発明の一実施形態における技術調査支援プログラムは、コンピュータに、書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶する機能と、ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力機能と、前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行機能と、前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行機能の検索を繰り返し実行することで技術俯瞰情報を更新する生成機能と、前記技術俯瞰情報を前記ユーザ端末へ出力する出力機能と、を実現させる。
本発明によれば、検索ミスを低減することができ、ユーザの経験によらず一定水準の検索をすることが可能であって、検索時間を短縮させることができる技術調査支援装置および技術調査支援方法並びに技術調査支援プログラムを提供させることができる。
本発明の一実施形態に係る技術調査支援評価システムにおける、技術調査支援装置、およびユーザ端末の機能ブロック図の一例である。 本発明の一実施形態に係る技術調査支援装置(コンピュータ)のハードウェア構成の一例である。 本発明の一実施形態に係るユーザ端末の表示画面の一例を示す図である。 本発明の一実施形態に係る技術調査支援装置の動作例を示すフローチャートである。 本発明の一実施形態に係る技術調査支援装置における検索キーワードの類義語をユーザ端末の表示画面に出力する例を示す図である。 本発明の一実施形態に係る技術調査支援装置における検索キーワードに基づき生成した検索式をユーザ端末の表示画面に出力する例を示す図である。
以下、図面を参照して本発明の一実施形態における技術調査支援装置、技術調査支援方法及び技術調査支援プログラムについて詳細に説明する。
<システム構成>
図1は、本発明の一実施形態に係る技術調査支援システム500の概略図である。技術調査支援装置100は、ネットワークNWを介して互いに接続された、技術調査支援装置100、ユーザ端末200、文書情報データベース(DB)400を含む。なお、ユーザ端末200の数は、図示したものに限られるものではなく、複数のユーザ端末を含んでもよい。
技術調査支援装置100は、ユーザ端末200と接続し、当該ユーザ端末200に対して、検索キーワードを含む先行文書情報520それぞれを俯瞰化する技術俯瞰情報510を出力するためのシステムである。文書情報とは、文書に関する何らかの情報であって、文書に含まれる文章そのものであってもよいし、文書の格納場所を示すパス名やURL等であってもよい。また、文書情報は、例えば、文章データ(アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍(雑誌、週刊誌を含む)、レポートおよびホームページ)を含んでもよく、数値データ(実験データ、測定データ、統計データ、検査データ)を含んでもよい。その他、文書情報は、数式データ、図表データ、写真データおよび画像データ(静止画像、動画像を含む)を含んでもよい。なお本実施形態では、一例として、後述する先行文書情報520が、知的財産に関する情報である場合について説明する。
ここで、知的財産とは、人間の知的活動によって生み出されたアイデアや創作物等である。知的財産は、例えば、発明、考案、意匠、商標、著作物、回路配置または植物の新品種である。また、知的財産は、例えば、知的財産の内容を説明するための文書、知的財産の内容を説明するための図、表、グラフ、スケッチもしくは写真(図等)、または図等を説明する文書等であってもよい。本実施形態における知的財産に関する情報とは、上述したユーザが検索または分析したい内容を抽出するための情報である。知的財産に関する情報は、権利取得された情報のみならず、権利取得前の公開情報、未公開情報、出願前の発明情報を含む。権利取得された情報とは、例えば、特許権、実用新案権、意匠権、商標権、著作権、回路配置利用権または育成者権等が成立している情報である。例えば、知的財産が発明である場合、文書情報および先行文書情報520は、発明の内容を示す文章(特許請求の範囲の記載、発明の課題または発明の目的等)または図面等の情報である。また、知的財産が意匠である場合、文書情報および先行文書情報520は、形状、模様若しくは色彩又はこれらの結合に係る図面等の情報である。また、知的財産が商標である場合、先行文書情報520は、商品またはサービスの識別標識である。
なお、知的財産に関する情報には、上述したように権利取得前の情報を含んでいてもよい。権利取得前の情報とは、例えば、発明や意匠を創作するまでの過程を記憶した情報、実験のために準備した材料もしくは装置、実験結果、研究開発の表題、研究開発の目的、技術者の氏名、技術者の所属名、プロジェクト番号等の付随的な情報である。付随的な情報には、取得された知的財産に関する情報に対するアクセス権限の情報を含んでいてもよい。アクセス権限とは、情報に対する閲覧、編集、削除、認証処理等の処理を実行できる権限であり、例えば、知的財産に関する情報を記憶した技術者に対しては、全ての処理を実行できるアクセス権限を付与し、知的財産の創作に共同した技術者には、閲覧の処理を実行できるアクセス権限を付与し、または、知的財産に関する情報を認証する認証者には、認証処理を実行できるアクセス権限を付与する。
なお、以下の説明においては、知的財産が発明である場合を例示するが、知的財産は発明に限定されるものではない。すなわち、知的財産の創作には、商標における識別標識の選択等を含んでいてもよい。
文書情報DB400は、上述した知的財産に関する情報であって、既存の情報を格納する。文書情報DB400は、例えば特許庁のデータベースとすることができる。特許庁のデータベースは、1庁でも複数庁を含んでいてもよい。なお、米国、欧州、日本、中国、および韓国の5庁のデータベースを含むことで世界の特許の約90%を網羅することができるため、先行文書情報520の検索精度を上げるためには、これらの5庁のデータベースを含んでいるとよい。なお、データベースとしては、上述に限られるものでなく、インターネット上に存在する情報であってもよい。さらに、特許庁のデータベースに限られず、文書情報のうち既存の情報を格納する別個のデータベースであってよい。また、データベースは、図のようにネットワーク上に設けられるものに限られず、技術調査支援装置100に格納されていてもよい。
ユーザ端末200は、技術調査支援システム500によって提供される技術調査支援サービスを利用するユーザの通信端末である。図1において、ユーザ端末200はノートパソコンを示してあるが、ユーザ端末200としては、ネットワークNWを介して技術調査支援サービスを利用可能とするものであれば、その種類は問わない。ユーザ端末200は、例えば、デスクトップパソコン、スマートフォン、携帯電話(フィーチャーフォン)、ハンドヘルドコンピュータデバイス(例えば、PDA(Personal Digital Assistant)等)、ウェアラブル端末(例えば、メガネ型デバイス、時計型デバイス、ヘッドマウントディスプレイ(HMD:Head-Mounted Display等)、他種のコンピュータ、又はコミュニケーションプラットホームを含んでよい。ユーザ端末200は、ユーザからの入力操作を受け付けて、ネットワークNWを介して、検索条件を構成する検索キーワードを技術調査支援装置100へ送信する。
ネットワークNWは、無線ネットワークや有線ネットワークを含んでよい。具体的には、ネットワークNWは、ワイヤレスLAN(wireless LAN:WLAN)や広域ネットワーク(wide area network:WAN)、ISDNs(integrated service digital networks)、無線LANs、LTE(long term evolution)、LTE-Advanced、第4世代(4G)、第5世代(5G)、CDMA(code division multiple access)等である。なお、ネットワークNWは、これらの例に限られず、例えば、公衆交換電話網(Public Switched Telephone Network:PSTN)やブルートゥース(Bluetooth(登録商標))、光回線、ADSL(Asymmetric Digital Subscriber LINE)回線、衛星通信網等であってもよい。また、ネットワークNWは、これらの組み合わせであってもよい。
なお、ユーザ端末200と技術調査支援装置100との間の接続、および文書情報DB400と技術調査支援装置100との間の接続は、扱う情報が機密情報である場合、ネットワークNWの通信環境がセキュリティの面で優れている必要がある。この場合、これらの間の接続に専用の回線を用意し、キュリティを強化してもよい。
<ハードウェア構成>
まず、図2を用いて、本発明の一実施形態に係る技術調査支援装置(コンピュータ)100のハードウェア構成について説明する。技術調査支援装置100は、プロセッサ101と、メモリ102と、ストレージ103と、入出力インタフェース(I/F)104と、通信I/F105とを備え、これらの協働により、本実施形態に記載される機能や方法を実現する。例えば、本開示の機能又は方法は、メモリ102に読み込まれたプログラムに含まれる命令をプロセッサ101が実行することによって実現される。
プロセッサ101は、ストレージ103に記憶されるプログラムに含まれるコード又は命令によって実現する機能、および/又は、方法を実行する。プロセッサ101は、例えば、中央処理装置(CPU)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、マイクロプロセッサ(microprocessor)、プロセッサコア(processor core)、マルチプロセッサ(multiprocessor)、ASIC(Application-Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等を含み、集積回路(IC(Integrated Circuit)チップ、LSI(Large Scale Integration))等に形成された論理回路(ハードウェア)や専用回路によって各実施形態に開示される各処理を実現してもよい。また、これらの回路は、1又は複数の集積回路により実現されてよく、各実施形態に示す複数の処理を1つの集積回路により実現されることとしてもよい。また、LSIは、集積度の違いにより、VLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
メモリ102は、ストレージ103からロードしたプログラムを一時的に記憶し、プロセッサ101に対して作業領域を提供する。メモリ102には、プロセッサ101がプログラムを実行している間に生成される各種データも一時的に格納される。メモリ102は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)等を含む。
ストレージ103は、プログラムを記憶する。ストレージ103は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等を含む。
通信I/F105は、ネットワークアダプタ等のハードウェアや通信用ソフトウェア、およびこれらの組み合わせとして実装され、ネットワークNWを介して各種データの送受信を行う。当該通信は、有線、無線のいずれで実行されてもよく、互いの通信が実行できるのであれば、どのような通信プロトコルを用いてもよい。通信I/F105は、ネットワークNWを介して、例えばユーザ端末のような他の情報処理装置との通信を実行する。通信I/F105は、各種データをプロセッサ101からの指示に従って、他の情報処理装置に送信する。また、通信I/F105は、他の情報処理装置から送信された各種データを受信し、プロセッサ101に伝達する。
入出力I/F104は、技術調査支援装置100に対する各種操作を入力する入力装置、および技術調査支援装置100で処理された処理結果を出力する出力装置を含む。入出力I/F104は、入力装置と出力装置が一体化していてもよいし、入力装置と出力装置とに分離していてもよい。入力装置は、ユーザからの入力を受け付けて、当当該入力に係る情報をプロセッサ101に伝達できる全ての種類の装置のいずれか、又は、その組み合わせにより実現される。入力装置は、例えば、タッチパネル、タッチディスプレイ、キーボード等のハードウェアキーや、マウス等のポインティングデバイス、カメラ(画像を介した操作入力)、マイク(音声による操作入力)を含む。出力装置は、プロセッサ101で処理された処理結果を出力する。出力装置は、例えば、タッチパネル、スピーカ等を含む。
<機能構成>
次に、図1を用いて、各装置の機能構成について説明する。なお、図1に記載の各機能部が必須ではなく、また、これ以外の機能部を備えてもよい。また、各機能部の機能又は処理は、実現可能な範囲において、機械学習又はAI(Artificial Intelligence)により実現されてもよい。
(1)ユーザ端末200
本発明の一実施形態に係るユーザ端末200は、通信制御部210、表示制御部220、入力制御部230、および記憶制御部240を備える。通信制御部210は、ネットワークNWを介した、ユーザ端末200と外部装置(技術調査支援装置100)との間の各種情報の送受信を実行させる。表示制御部220は、ディスプレイやタッチパネルといった表示画面60へのデータの表示を制御する。入力制御部230は、キーボード、タッチパネル、またはマイクを介したユーザからの入力操作を受け付ける。入力制御部230は、入力部231を含む。入力部231は、ユーザから、調査対象に関連する知的財産に関する一以上の検索キーワードを、検索条件として入力を受け付ける。
記憶制御部240は、ユーザ端末200を技術調査支援システム500で動作させるためのプログラムやユーザ情報を格納する。また、記憶制御部240は、技術調査支援装置100を用いて検索した検索結果としての文書データをダウンロードしたデータを格納してもよい。
(2)技術調査支援装置
次に、技術調査支援装置100について説明する。本発明の一実施形態に係る技術調査支援装置100は、ネットワークNWを介してユーザ端末200と接続し、当該ユーザ端末200に対して技術調査支援システム500のサービスを提供するための装置である。技術調査支援装置100は、例えば、いわゆるサーバ装置やコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)であってよいが、これらに限定されない。また、技術調査支援装置100は、1つの筐体によって実現される装置であっても、ネットワーク等を介して接続された複数の装置から実現されるシステムであってもよい。例えば、技術調査支援装置100は、その機能の一部または全部をクラウドコンピューティングシステムによって提供されるクラウドサービス等、仮想的な装置によって実現するものであってもよい。すなわち、技術調査支援装置100は、以下に説明する各機能部のうち、少なくとも1以上の機能部を他の装置において実現するようにしてもよい。
技術調査支援装置100は、取得部110、検索実行部120、生成部130、出力部140、通信制御部150、および記憶制御部160の各機能部を有する。本実施形態における技術調査支援装置100の上記各機能部は、技術調査支援装置100を制御する情報処理プログラム(ソフトウェア)によって実現される機能モジュールであるものとして説明する。技術調査支援プログラムは、技術調査支援装置100で動作する。すなわち、技術調査支援装置100は、技術調査支援プログラムが動作する装置をいう。
通信制御部150は、ネットワークNWを介した、技術調査支援装置100と外部装置(ユーザ端末200)との間の各種情報の送受信を実行させる。記憶制御部160は、技術調査支援装置100を制御する情報処理プログラム(ソフトウェア)を格納する。また、記憶制御部160は、類義語データベース(DB)161を備えていてもよい。類義語DB161の詳細については、後述する。
取得部110は、ユーザ端末200で入力された検索キーワードをユーザ端末200から取得する。検索実行部120は、ユーザ端末200が受け付けた検索キーワードを取得部110が取得する毎に、当該検索キーワードを含む先行文書情報520の検索を繰り返し実行する。なお、ユーザが、自身の発明に類似する先行文書情報について検索をしたい場合、当該先行文書情報に関連するキーワードを検索キーワードとして、一以上の検索キーワードを列挙した検索キーワードを技術調査支援装置100へ送信することができる。
ここで、検索の実行について、図を用いて説明する。図3は、本発明の一実施形態に係る技術調査支援装置100を利用する、ユーザ端末200の表示画面60(検索条件入力画面61)の一例である。ユーザは、ユーザ端末200の検索条件入力画面61に、調査対象の技術を検索するため、当該技術に関連するキーワードとして検索キーワードを入力する。図3の例では、検索キーワードとして、「ロボット 2足歩行 人工筋肉 アクチュエータ」の単語単位のキーワードが、ユーザによって入力される。検索キーワードは1個のみでもよいし、複数個の検索キーワードを入力してもよい。また、上述の入力例では、単語間をスペースで区切っているがこれに限定されない。例えば、カンマ区切りで合ってもよいし、単語間を区切らずに続けて入力してもよい。検索キーワードの入力は、上述のように検索条件入力画面(テキストボックス)61に直接入力されるものであってもよい。ユーザによって、検索キーワードの入力を確定する意思表示として、例えば、キーボードの「ENTER」キーが押下されると、ユーザ端末200の入力部231は、検索条件入力画面61に入力された検索キーワードを受け付け、通信制御部210は、検索キーワードを技術調査支援装置100へ送信する。
検索実行部120は、ユーザが、ユーザ端末200を介して、検索条件入力画面61に、調査対象の技術に関連する検索キーワードを入力すると、入力する毎に、当該検索キーワードを含む先行文書情報520の検索を繰り返し実行する。具体的には、ユーザは、検索条件入力画面61に、調査対象の技術に関連する検索キーワードとして、例えば、「ロボット」を入力した場合は、「ロボット」を含む先行文書情報520の検索が実行され、「ロボット 2足歩行」を入力した場合は、「ロボット」および「2足歩行」を含む先行文書情報520の検索が実行される。また、「ロボット 2足歩行 人工筋肉」を入力した場合は、「ロボット」、「2足歩行」および「人工筋肉」を含む先行文書情報520の検索が実行され、「ロボット 2足歩行 人工筋肉 アクチュエータ」を入力した場合は、「ロボット」、「2足歩行」、「人工筋肉」および「アクチュエータ」を含む先行文書情報520の検索が実行される。上述の入力例では、単語間のスペース区切りをAND検索(論理積)として認識し検索を実行しているがこれに限定されない。例えば、単語間のスペース区切りをOR検索(論理和)として認識し検索を実行してもよいし、NOT検索(論理差)として認識し検索を実行してもよい。または、単語間のスペース区切りを近傍検索として認識し検索を実行してもよい。あるいは、これらの組み合わせにより検索を実行してもよい。単語間の検索方式(AND検索、OR検索、NOT検索、近傍検索)の選択は、例えば、検索方式の複数の項目を選択可能なチェックボックス62が、ユーザ端末200において表示され、チェックボックスを選択することにより選択方式を指定できるようにしてもよいし、プルダウン方式で検索方式の選択をできるように構成してもよい。ここで、近傍検索とは、複数の単語(キーワード)の間隔を指定して検索をすることをいう。
ユーザが、例えば、「ENTER」キーを押下したときに、検索キーワードの入力が確定し、入力部231は、当該検索キーワードの入力を受け付ける。入力が確定すると、取得部110は、ユーザ端末200で入力された検索キーワードをユーザ端末200から取得する。検索実行部120は、検索キーワードの入力を受け付け、当該検索キーワードをユーザ端末200から取得する毎に、繰り返し検索を実行する。すなわち、ユーザが、検索キーワードをテキストボックス(検索条件入力画面)61に入力するのと同時のタイミングで、検索キーワードを含む検索条件に合致した先行文書情報520の検索が繰り返し実行される。生成部130は、検索キーワードを含む検索条件に合致した先行文書情報520に対応する書誌情報530を上位概念で示す上位概念化情報に基づき、文書データそれぞれを俯瞰化する技術俯瞰情報510を生成する。
文書データは、書誌情報530と先行文書情報520とを有し、書誌情報530に対応付けて先行文書情報520が文書情報DB400に格納されている。
書誌情報530には、例えば、先行文書情報520が特許文献である場合は、特許文献に付与されている出願番号、出願日、特許番号、登録日、発明の名称、発明者、出願人/権利者、譲受人、技術分類IPC(International Patent Classification)のセクション/クラス/サブクラス/メイングループ/サブグループ、特許審査官、代理人などが含まれるが、これに限定されない。技術分類は、国際特許分類IPCに限らず、FI(File Index)のセクション/クラス/サブクラス/メイングループ/サブグループ/展開記号/分冊識別記号、Fターム(File Forming Term)のテーマコード/観点/数字、CPC(Cooperative Patent Classification)のセクション/クラス/サブクラス/メイングループ/サブグループなどであってもよい。また、先行文書情報520が非特許文献(論文、書籍、新聞雑誌など)である場合、書誌情報530は、例えば、タイトル、識別番号、著者名、出版者、出版年月日、発表年月日、所蔵館、巻、ページなどであってもよい。識別番号とは、公開済みの非特許文献を一意に特定するための識別子であり、例えば、ISBN(International Standard Book Number )、UUID(Universally Unique Identifier)、DOI(Digital Object Identifier)などをいう。
先行文書情報520には、特許請求の範囲の文言(または抄録)、明細書(または抄録)、図の画像などの図面の情報、要約書など、特許出願の実体的な部分が含まれている。明細書は、さらに、発明の名称、背景技術、発明が解決しようとする課題(以下、「課題」という)、[課題を解決するための手段](以下、「解決手段」という)、効果、実施例等の項目に細分化される。
技術調査支援装置100によれば、書誌情報530を上位概念で示す上位概念化情報として、例えば、IPCのクラスを縦軸にとり時間軸を年単位で横軸とする技術俯瞰情報510を、ユーザに提供することができる。なお、書誌情報530がIPCである場合、上述のように、上位概念化情報がIPCの上位の階層を示す情報のことをいう。例えば、IPCの上位概念化情報は、IPCのセクションであってもよいし、サブクラスまたはメイングループであってもよい。なお、書誌情報530をIPCとした場合、上位概念化情報は、IPCの上位の階層を示す情報に限定されず、筆頭IPCであってもよい。また、書誌情報530が出願日である場合、上位概念化情報は、上位概念を示す時間情報として上述のように年単位であってもよいし、四半期単位、月単位であってもよい。また、書誌情報530が出願人/権利者である場合、上位概念化情報は、上位概念を示す出願人/権利者情報として関連会社を含むグループ会社全体を同一出願人としてもよい。
あるいは、技術俯瞰情報510は、縦軸を解決手段とし、横軸を課題としてもよい。 [課題]を示すキーワードの特定は、まず、 明細書中[課題]項目に記載されている文書情報(以下、「課題文書」という)を要素毎に分割し、当該文書情報中に含まれる複数の単語を抽出する要素毎の分割は、具体的には、小用語解析を用いるとよい。すなわち、文書情報を複数の単語単位に分割して、どの単語がどの単語を修飾しているかの係り受け関係を抽出する。課題文書が英文などの場合には、ピリオド、コロン、セミコロン、カンマ、や関係代名詞の優先順位で分割をするデリミタ処理を行うとよい。そして、課題文書中に含まれる複数の単語の中から課題キーワードを抽出する。例えば、出現頻度の高い単語を課題キーワードとして抽出してもよく、単語の係り受け関係から重要な用語を課題キーワードとして抽出してもよい。すなわち、課題キーワードは、先行文書情報の課題を1単語で表すための用語である。なお、課題キーワードは、通常1つの単語であるが、課題キーワードを1つに絞込み辛い場合などは、複数の単語としてもよい。入力された課題文書から課題キーワードを抽出する技術は、一般的な技術を用いればよく、上記手法には限定されない。そして、先行文書情報中に含まれる複数の単語を抽出する。この抽出は、生成部130が実行してもよいし、技術調査支援装置100が別途備える抽出部170が実行してもよい。先行文書情報中に含まれる複数の単語を抽出は、上述の課題文書の場合と同様であるため、説明は省略する。
次いで、課題文書の係り受け関係(以下、「係り受け文書」という)の重要度を考慮して、課題文書が記載されている先行文書情報の明細書と照合を行う。例えば、生成部130は、TF-IDF、Okapi BM25などの手法を用いて、課題の係り受け文書が明細書においてどの程度の重要度があるかを評価する。そして、重要度が最も高いと評価された係り受け文書を、先行文書情報の課題と推定してもよい。ここでは、課題キーワードが1つの明細書全体において出現する先行文書情報は、重要度が低いと仮定し、1つの先行文書情報において特定の文章(例えば、課題)にしか出現しない場合は、重要度が高い仮定する。
なお、記憶制御部160に予め、課題キーワードを格納しておき、TF-IDF法などを用いて、当該課題キーワードの重要度を考慮して、先行文書情報と照合を行ってもよい。[解決手段]となり得るキーワードと先行文書情報の照合は、上述と同様の手法により行われるため、説明は省略する。
このように、抽出部170は、先行文書情報のうち[課題]文書および[解決手段]文書において、課題および解決手段となり得るキーワード(課題キーワード、解決手段キーワード)を先行文書情報の明細書全文から容易に抽出することができる。
以上の通り、本実施形態では、[課題]項目の係り受け文書と先行文書情報の明細書全文を照合し重要度を評価してもよいし、[課題]項目の係り受け文書と[効果」項目に記載されている文書情報を照合し重要度を評価してもよい。照合対象の文章が短い程、処理が軽くなるため、検索時間のさらなる短縮につながる。よりユーザビリティの高いシステムを提供することができる。
[解決手段]を示す解決手段キーワードの特定は、[課題]を示す課題キーワードの特定と同じであるため、説明を省略する。重要度の評価は、生成部130が実行してもよいし、技術調査支援装置100が別途備える評価部180が実行してもよい。
生成部130は、[課題]と[解決手段]の集計を行い、集計結果を技術俯瞰情報510として生成する。そして、出力部140によって、ユーザ端末200に当該技術俯瞰情報510が出力される。
生成部130は、検索実行部120の検索を繰り返し実行することで技術俯瞰情報510を更新する。具体的には、ユーザが、検索キーワードをテキストボックス(検索条件入力画面)61に入力する毎に、検索を実行し、検索の実行に連動して、生成部130は、都度、技術俯瞰情報510を更新する。そして、出力部140によって、ユーザ端末200の表示画面60に更新情報が連続して表示される。このため、ユーザは、検索の実行と技術俯瞰情報510の表示にタイムラグがなく、リアルタイムに認識することができる。すなわち、ユーザは、検索キーワードの入力操作を行いつつ、検索結果として、技術俯瞰情報510を確認しながら、検索キーワードの追加、削除、修正を行うことができる。よって、検索結果を視覚的に確認しながら検索を行うことができるため、検索ミスを低減することができ、ユーザの経験によらず一定水準の検索をすることが可能であって、検索時間を格段に短縮させることができる。
本実施形態では、出力部140は、ユーザ端末200の表示画面60に、技術俯瞰情報510を出力する構成について説明したが、これに限定されない。文書情報DB400には、書誌情報530に対応付けて先行文書情報520が、書誌情報530と分けて格納されている。そのため、出力部140は、ユーザ端末200の検索結果出力画面70に、検索結果として技術俯瞰情報510を出力してもよいし、先行文書情報520を出力してもよい。または、これらを組み合わせたものを出力するように構成してもよい。図3の例では、技術俯瞰情報510および先行文書情報520の明細書全文を出力している場合を示す。また、図3の例では、技術俯瞰情報510をヒートマップとして出力したが、本発明はこれに限定されない。技術俯瞰情報510は、膨大な情報から必要な情報のみを効率よく描画するため、図・グラフ・表等の方法で視覚化した情報であればよく、例えば、散布図、棒グラフ、折れ線グラフ、円グラフ、バブルチャート、レーダチャート、ヒストグラム、等高線などであってもよい。これにより、ユーザは、検索結果を即座に判断することができるため、より一層の検索時間の短縮につながる。よりユーザビリティの高いシステムを提供することができる。
なお、先行文書情報520の出力内容は、明細書本文の全文を出力しても良いし、明細書本文の一部(発明の概要、課題、解決手段、発明を実施するための形態)であってもよい。技術調査支援装置100は、先行文書情報520の文献数に応じて、出力内容を変更することができる。例えば、出力内容の変更は、所定の閾値を設け、当該閾値の範囲内である場合、出力部140が、先行文書情報520の出力内容を決定し出力するように構成してもよい。
(技術調査支援システム500による処理)
図4は、本発明の本実施形態にかかる技術調査支援装置100によるユーザによるユーザ端末200からの検索キーワードの入力に応じて、当該検索キーワードを含む検索条件に関連するs3ン高文書情報(先行文書データ)の検索を実行し、検索結果として技術俯瞰情報510をユーザのユーザ端末200に出力するまでの一連の流れの動作シーケンスの例を示すフローチャートである。
まず、入力部231は、ユーザ端末200で入力された検索キーワードをユーザ端末200から、検索条件として入力を受け付ける(ステップS11)。入力が受け付けられると、取得部110は、ユーザ端末200で入力された検索キーワードをユーザ端末200から取得する(ステップS12)。検索実行部120は、検索キーワードの入力を受け付け、当該検索キーワードをユーザ端末200から取得する毎に、繰り返し検索を実行する(ステップS13)。生成部130は、検索キーワードを含む検索条件に関連する先行文書情報に対応する書誌情報530を上位概念で示す上位概念化情報に基づき、文書データそれぞれを俯瞰化する技術俯瞰情報510として生成する(ステップS14)。書誌情報530を上位概念で示す上位概念化情報は、例えば図3の例では、検索条件入力画面61において、IPCのクラスを縦軸にとり時間軸を年単位で横軸とする技術俯瞰情報510を示している。検索結果は、検索キーワードを含む先行文書情報の検索が繰り返し実行されると、都度、生成部130に送信される。生成部130は、検索結果を集計する。集計は、生成部130が実行してもよいし、技術調査支援装置100が別途備える集計部190が実行してもよい。集計は、検索結果に基づき連動して算出される。生成部130は、検索を繰り返し実行することで算出された集計に基づき、技術俯瞰情報510を更新する。その後、出力部140は、技術俯瞰情報510をユーザ端末200へ出力する(ステップS15)。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各構成部、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。また、上記実施の形態に示す構成を適宜組み合わせることとしてもよい。例えば、技術調査支援装置100が備えるとして説明した各構成部は、物理的に複数のコンピュータによって分散されて実現されてもよいし、一のコンピュータとして実現されてもよい。
さらに、生成部130は、検索キーワードに関連するヒント情報を生成してもよい。ヒント情報は、ユーザが検索キーワードを入力する際に、入力をアドバイスするためのヒントを示す推奨(レコメンド)情報である。技術調査支援装置100が備える記憶制御部160には、検索条件の履歴情報が格納されている。記憶制御部160には、ユーザがユーザ端末200を介して検索条件入力画面61に入力した検索キーワードの履歴情報が、記憶制御部160に格納される。生成部130は、ユーザが入力した検索キーワードの履歴情報毎に、ユーザに最適な推奨情報やアドバイス情報を含むヒント情報を生成し、記憶制御部160に格納する。なお、記憶制御部160には、インターネットを介して取得した、検索キーワードに関連する技術分野のトレンドキーワードが、当該検索キーワードの履歴情報に対応付けてヒント情報として格納されてもよい。または、記憶制御部160には、ユーザに対応付けて履歴情報が格納されている。そして、入力部231に、一定の時間(例えば、30秒)、検索キーワードの入力の受付が行われない場合、生成部130により、ヒント情報を生成するように構成してもよい。記憶制御部160に格納された検索キーワードの履歴情報を生成部130にフィードバックし、フィードバックされた履歴情報を機械学習する。機械学習は、生成部130が実行してもよいし、技術調査支援装置100が別途備える学習部195が実行してもよい。また、記憶制御部160に、ユーザが入力する検索条件の傾向を、各ユーザ毎にヒント情報として格納してもよい。そして、学習部195は、当該検索条件の傾向を機械学習するように構成してもよい。ユーザに適切なヒント情報を提供することが可能になるため、よりユーザビリティの高いシステムを提供することができる。
検索キーワードのレコメンドは、例えば、ユーザ端末200にユーザにアドバイスするためのヒントを示す推奨情報(以下、適宜「ヒント情報」という)が出力されることで行われる。当該ユーザ端末200において、ヒント情報の出力が行われ、ユーザは、アドバイスされたヒント情報を認識することができる。ユーザは、提供(アドバイス)されたヒント情報に興味を持った場合、ユーザ端末200を操作して当該アドバイスされたヒント情報を取得して、検索条件に追加することができる。
また、記憶制御部160は、検索条件で追加したヒント情報を、当該検索条件の履歴情報に対応付けて格納してもよい。具体的には、入力部231が、当該ヒント情報を、検索条件として入力を受け付けた場合に、記憶制御部160に、ヒント情報が履歴情報に対応付けて格納されてもよい。そして、学習部195が、ヒント情報に対応付けられた検索条件に同一または類似する検索条件を入力するユーザに対して、当該ヒント情報をレコメンドするように構成してもよい。これにより、ユーザにより適切な情報をレコメンドできるため、よりユーザビリティの高いシステムを提供することができる。
また、学習部195は、他のユーザの検索履歴を機械学習し、生成部130は、類似の検索をしている他のユーザの検索キーワードをヒント情報として生成してもよい。例えば、学習部195は、ユーザの検索条件を入力、複数のユーザ(自分を含む)の検索履歴を出力とした、入力と出力をデータセットとする機械学習(教師あり学習)を行い、学習したデータセットをモデリングすることにより、ヒント情報をレコメンドすることができる。学習部195は、それぞれのモデリングにおいて学習された学習結果を用いることにより、ヒント情報のレコメンドについて精度を向上させることができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク(ディープラーニングを含む)、サポートベクターマシン、クラスタリング(例えば、課題、第1実施形態等)、又はベイジアンネットワーク等を用いてもよい。
さらに、技術調査支援装置100は、各検索キーワードに関する上位語、下位語、同義語及び類義語としての類義語辞書を格納する類義語DB161を備えてもよい。そして、出力部140は、類義語DB161から、各検索キーワードに対応付けて類義語をユーザ端末200に出力するように構成してもよい。
図5は、検索キーワードの類義語をユーザ端末200の表示画面60に出力する例を示す図である。
具体的には、類義語DB161には、ユーザが入力した複数の検索キーワード毎の上位語、下位語、同義語及び類義語に関する情報としての類義語辞書が格納されている。ユーザによって、検索条件入力画面61に検索条件を構成する検索キーワードが入力されると、当該検索キーワードに対応付けられて格納されている類義語辞書を類義語DB161から読み出し、類義語をユーザ端末200の表示画面60に出力してもよい。
例えば、類義語辞書には、「ロボット」、「人造人間」、「ヒューマノイド」「オートマシン」、「自律」、「自走」、「自律走行」などの類義語が対応付けて格納されているとよい。ユーザが、検索条件入力画面61に検索条件を構成する検索キーワードを入力し、当該入力が受け付けられると、当該検索キーワードに対応付けられた類義語を類義語辞書データベース(DB)161から読み出すことができる。
また、類義語は、ユーザが、適宜追加または削除することができるように構成してもよい。具体的には、図5に示すように、ユーザによって検索条件入力画面61に検索キーワードが入力されると、当該検索キーワードの類義語は、出力部140によって、類義語出力画面63に出力される。図5の例では、検索キーワードの類義語は、テキストボックス64にスペース区切りで自動的に出力されている例を示す。ユーザは、当該テキストボックス64に入力された類義語を適宜、追加、削除または修正することにより編集することができる。なお、類義語DB161には、ユーザ独自の「複数の検索キーワード毎の複数の類義語辞書を格納するように構成してもよい。
類義語は、上述のように、ユーザ端末200の表示画面60に直接出力することにより実行してもよいし、類義語辞書が、ユーザ端末200の表示画面60に直接出力することにより実行してもよい。また、CSV形式のファイルを、ユーザ端末200の表示画面60に出力することにより実行してもよいし、CSV形式のファイルを、クラウド上で保持し管理していてもよい。
そして、ユーザはCSV形式のファイルに出力された類義語辞書のうち削除したい類義語を選択して削除することができるように構成してもよい。また、ユーザはCSV形式のファイルに出力された類義語辞書に対して追加したい類義語を直接入力することができる。さらに、ユーザはCSV形式のファイルに出力された類義語辞書に対して修正したい類義語を直接修正することができる。CSV形式のファイルの情報と類義語出力画面63に出力された情報は対応付けられるように構成してもよい。そのため、CSV形式のファイルから編集(追加、削除または修正)された情報は、類義語出力画面63に出力された情報に反映することができる。また、類義語出力画面63から編集された情報は、CSV形式のファイルに出力された情報に反映することができる。
さらに、学習部195は、追加、削除または修正をした類義語辞書の編集情報を学習することができるように構成してもよい。記憶制御部160は、検索キーワードの類義語毎の編集情報を、当該検索キーワードに対応付けて更新して格納してもよい。そして、ユーザが検索キーワードを入力すると、学習部195による学習に基づき、当該検索キーワードに対応付けられた更新した類義語を出力するように構成してもよい。これにより、ユーザにより適切な類義語を提供することができるため、よりユーザビリティの高いシステムを提供することができる。
また、学習部195は、ユーザの検索キーワードを入力、当該検索キーワードに対応付けられた類義語辞書(類義語)を出力とした、入力と出力をデータセットとする機械学習(教師あり学習)を行い、学習したデータセットをモデリングすることにより、類義語辞書(類義語)を生成してもよい。学習部195は、それぞれのモデリングにおいて学習された学習結果を用いることにより、検索キーワードに対応付けられた類義語についての精度を向上させることができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク(ディープラーニングを含む)、サポートベクターマシン、クラスタリング(例えば、課題、第1実施形態等)、又はベイジアンネットワーク等を用いてもよい。
本実施形態によれば、技術調査の検索精度を向上させることが可能であって、ユーザの技術調査経験に関わらず、一定水準の技術調査をすることが可能となる。また、従来の技術調査では確認できなかった類義語辞書の情報を容易に確認することができ、検索の範囲を明確にすることが可能にするため、技術調査範囲の不透明性をなくし検索の信頼性を向上させることができる。
また、技術調査支援装置100は、検索式の生成をすることができるように構成してもよい。
図6は、ユーザにより入力された検索キーワードに基づき生成した検索式をユーザ端末200の表示画面60に出力する例を示す図である。
例えば、ユーザは、検索条件入力画面61に、検索対象の文書情報に関連する検索キーワード、図6の例では、「ロボット」「2足歩行」「人工筋肉」「アクチュエータ」との検索キーワードが、ユーザによって入力される。取得部110が、ユーザによる検索キーワードの入力を取得すると、ユーザ端末200の入力部231は、検索条件入力画面61に入力された検索キーワードを受け付け、通信制御部210は、検索キーワードを技術調査支援装置100へ送信する。
技術調査支援装置100の生成部130は、(i)「ロボット」、(ii)「2足歩行」、(iii)「人工筋肉」および(iv)「アクチュエータ」の、検索キーワード毎に、図6では、AND条件(論理積)の検索を行い検索式を生成する例を示す。なお、丸括弧(小括弧)内は、検索キーワードに含まれる類義語を指す。類義語は、類義語DB161から取得してもよいし、ネットワークNWを介して、図示しないコーパスから取得してもよい。
出力部140は、生成部130によって生成された検索式を、ユーザ端末200へ出力する。図6に示すように、生成された検索式は、ユーザ端末200の検索式生成画面65に出力される。なお、検索式の生成手法は、上述に限られるものではない。なお、本実施形態では、AND検索(論理積)として認識し検索式を生成する場合に限定されない。例えば、単語間のスペース区切りをOR検索(論理和)として認識し検索を実行してもよいし、NOT検索(論理差)として認識し検索を実行してもよい。または、単語間のスペース区切りを近傍検索として認識し検索を実行してもよい。あるいは、これらの組み合わせにより検索を実行してもよい。ユーザは、ユーザ端末200を介して検索式生成画面65を直接編集することができる。ここで、近傍検索とは、複数の単語(キーワード)の間隔を指定して検索をすることをいう。図6の例では、AND検索(論理積)を「*」、OR検索(論理和)を「+」で示している。また、ユーザは、ユーザ端末200を介してテキストボックス66に、検索結果に含まないキーワード入力することにより、NOT検索(論理差)として認識し検索を実行してもよい。
あるいは、単語間の検索方式(AND検索、OR検索、NOT検索、近傍検索)の選択は、例えば、検索方式の複数の項目を選択可能なチェックボックス(図示せず)が、ユーザ端末200において表示され、チェックボックスを選択することにより選択方式を指定できるようにしてもよいし、プルダウン方式で検索方式の選択をできるように構成してもよい。
なお、上述の実施形態では、検索条件入力画面61に検索キーワードを入力する例について説明したが、本発明はこれに限定されない。検索条件入力画面61に複数の検索キーワードを含む文書情報を入力してもよい。取得部110は、ユーザ端末200で入力された文書情報をユーザ端末200から取得する。生成部130は、ユーザ端末200から取得した文書情報を所定の構成単位(Element:エレメント)に分解し、検索クエリとして、構成単位に含まれる検索キーワードをユーザ端末200から取得する毎に、繰り返し検索を実行する。その後の処理は、上述の実施形態の処理と同様であるため、説明は省略する。
構成単位とは、文書情報を構成する各部分であって、文書情報が複数の文章から構成される場合、構成単位は、句読点ごと、一定長さごと、または述語ごとに分節された文章であってよい。あるいは、構成単位の分解は、文脈や文章構成に基づいて行われてもよい。あるいは、生成部130は、形態素解析、構文解析等によって、文書を構成する文節の係り受け関係から文書の並列構造を抽出し、構成単位を求めてもよい。構成単位に含まれる検索キーワードとは、構成単位としての文章に含まれる単語やその類義語を指す。
また、上述したユーザ端末200の表示画面60は一例であって、これに限られるものではない。例えば、検索条件入力画面61には、出願人についての情報や、特許分類(IPC)を入力または選択させる領域があってもよい。これにより、検索範囲を限定させ、ノイズを減らすことができる。
また、上述の実施形態では、検索条件入力画面61に技術俯瞰情報510および先行文書情報520を出力する例について説明したが、本発明はこれに限定されない。検索条件入力画面61に書誌情報530を出力するように構成してもよい。検索条件入力画面61には、例えば、先行文書情報520に代えて、発明の名称、図面などの書誌情報530を出力してもよい。または、検索条件入力画面61には、先行文書情報520に加えて、発明の名称、図面を出力してもよい。
本開示の各実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、例えば、ソフトウェアプログラムやコンピュータプログラムを含む。
記憶媒体は適切な場合、1つ又は複数の半導体ベースの、又は他の集積回路(IC)(例えば、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向けIC(ASIC)等)、ハード・ディスク・ドライブ(HDD)、ハイブリッド・ハード・ドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピィ・ディスケット、フロッピィ・ディスク・ドライブ(FDD)、磁気テープ、固体ドライブ(SSD)、RAMドライブ、セキュア・デジタル・カードもしくはドライブ、任意の他の適切な記憶媒体、又はこれらの2つ以上の適切な組合せを含むことができる。記憶媒体は、適切な場合、揮発性、不揮発性、又は揮発性と不揮発性の組合せでよい。
また、本開示のプログラムは、当該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して、情報処理装置に提供されてもよい。
また、本開示の各実施形態は、プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
なお、本開示のプログラムは、例えば、JavaScript(登録商標)、Python等のスクリプト言語、C言語、Go言語、Swift,Koltin、Java(登録商標)等を用いて実装される。
実施形態に記載された内容の一部を以下に記載する。
[付記1]
書誌情報と先行文書情報を備える文書データを複数記憶する文書情報データベースと、
ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力部と、
前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行部と、
前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行部の検索を繰り返し実行することで技術俯瞰情報を更新する生成部と、
前記技術俯瞰情報を前記ユーザ端末へ出力する出力部と、を備える、
技術調査支援装置。
[付記2]
前記生成部は、
前記ユーザ端末から送信された前記検索キーワードに関連するヒント情報を生成する、
ことを特徴とする請求項1に記載の技術調査支援装置。
[付記3]
前記検索条件の履歴情報をフィードバックする記憶部と、
前記フィードバックされた前記履歴情報を機械学習する、学習部を、さらに備え、
前記出力部は、
機械学習された前記履歴情報に基づき、前記検索キーワードに関連する推奨キーワードをヒント情報として出力する、
ことを特徴とする請求項1または2に記載の技術調査支援装置。
[付記4]
各検索キーワードに関する上位語、下位語、同義語及び類義語としての類義語辞書を格納する類義語データベースを備え、
前記出力部は、
前記類義語データベースから、各検索キーワードに対応付けて前記類義語を出力する、
ことを特徴とする請求項1から3いずれか一項に記載の技術調査支援装置。
[付記5]
前記入力部は、
複数の前記検索キーワードを含む文書情報を受け付けることが可能であって、
前記検索実行部は、
前記文書情報に基づいて、前記文書情報を含む先行文書情報の検索を繰り返し実行する、
ことを特徴とする請求項1から4いずれか一項に記載の技術調査支援装置。
[付記6]
前記生成部は、
入力された前記検索キーワードに基づき、検索式を生成する、
ことを特徴とする請求項1から5いずれか一項に記載の技術調査支援装置。
[付記7]
コンピュータに、
書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶するステップと、
ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力ステップと、
前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行ステップと、
前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行ステップの検索を繰り返し実行することで技術俯瞰情報を更新する生成ステップと、
前記技術俯瞰情報を前記ユーザ端末へ出力する出力ステップと、を実行させる、
技術調査支援方法。
[付記8]
コンピュータに、
書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶する機能と、
ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力機能と、
前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行機能と、
前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行機能の検索を繰り返し実行することで技術俯瞰情報を更新する生成機能と、
前記技術俯瞰情報を前記ユーザ端末へ出力する出力機能と、を実現させる、
技術調査支援プログラム。
100 技術調査支援装置
101 プロセッサ
102 メモリ
103 ストレージ
110 取得部
120 検索式実行部
130 生成部
140 出力部
150 通信制御部
160 記憶制御部
161 類義語データベース
170 抽出部
200 ユーザ端末
210 通信制御部
220 表示制御部
230 入力制御部
231 入力部
NW ネットワーク
400 文書情報データベース
500 技術調査支援システム
510 技術俯瞰情報
520 先行文書情報
520 書誌情報

Claims (8)

  1. 書誌情報と先行文書情報を備える文書データを複数記憶する文書情報データベースと、
    ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力部と、
    前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行部と、
    前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行部の検索を繰り返し実行することで技術俯瞰情報を更新する生成部と、
    前記技術俯瞰情報を前記ユーザ端末へ出力する出力部と、を備える、
    技術調査支援装置。
  2. 前記生成部は、
    前記ユーザ端末から送信された前記検索キーワードに関連するヒント情報を生成する、
    ことを特徴とする請求項1に記載の技術調査支援装置。
  3. 前記検索条件の履歴情報をフィードバックする記憶部と、
    前記フィードバックされた前記履歴情報を機械学習する、学習部を、さらに備え、
    前記出力部は、
    機械学習された前記履歴情報に基づき、前記検索キーワードに関連する推奨キーワードをヒント情報として出力する、
    ことを特徴とする請求項1または2に記載の技術調査支援装置。
  4. 各検索キーワードに関する上位語、下位語、同義語及び類義語としての類義語辞書を格納する類義語データベースを備え、
    前記出力部は、
    前記類義語データベースから、各検索キーワードに対応付けて前記類義語を出力する、
    ことを特徴とする請求項1から3いずれか一項に記載の技術調査支援装置。
  5. 前記入力部は、
    複数の前記検索キーワードを含む文書情報を受け付けることが可能であって、
    前記検索実行部は、
    前記文書情報に基づいて、前記文書情報を含む先行文書情報の検索を繰り返し実行する、
    ことを特徴とする請求項1から4いずれか一項に記載の技術調査支援装置。
  6. 前記生成部は、
    入力された前記検索キーワードに基づき、検索式を生成する、
    ことを特徴とする請求項1から5いずれか一項に記載の技術調査支援装置。
  7. コンピュータに、
    書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶するステップと、
    ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力ステップと、
    前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行ステップと、
    前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行ステップの検索を繰り返し実行することで技術俯瞰情報を更新する生成ステップと、
    前記技術俯瞰情報を前記ユーザ端末へ出力する出力ステップと、を実行させる、
    技術調査支援方法。
  8. コンピュータに、
    書誌情報と先行文書情報を備える文書データを文書情報データベースに複数記憶する機能と、
    ユーザが操作可能なユーザ端末から送信された一以上の検索キーワードを、検索条件として入力を受け付ける入力機能と、
    前記検索キーワードの入力を受け付ける毎に、前記検索キーワードを含む先行文書情報の検索を繰り返し実行する検索実行機能と、
    前記検索キーワードを含む先行文書情報に対応する書誌情報を上位概念で示す上位概念化情報に基づき、前記文書データそれぞれを俯瞰化する技術俯瞰情報を生成し、当該技術俯瞰情報は、前記検索実行機能の検索を繰り返し実行することで技術俯瞰情報を更新する生成機能と、
    前記技術俯瞰情報を前記ユーザ端末へ出力する出力機能と、を実現させる、
    技術調査支援プログラム。
JP2021095518A 2021-06-08 2021-06-08 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム Active JP7029204B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021095518A JP7029204B1 (ja) 2021-06-08 2021-06-08 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021095518A JP7029204B1 (ja) 2021-06-08 2021-06-08 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム

Publications (2)

Publication Number Publication Date
JP7029204B1 JP7029204B1 (ja) 2022-03-03
JP2022187507A true JP2022187507A (ja) 2022-12-20

Family

ID=81940836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021095518A Active JP7029204B1 (ja) 2021-06-08 2021-06-08 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム

Country Status (1)

Country Link
JP (1) JP7029204B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7495767B1 (ja) 2023-10-04 2024-06-05 インパテック株式会社 プログラム、特許情報処理装置、および特許情報処理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116431799B (zh) * 2023-06-14 2023-08-18 湖南科德信息咨询集团有限公司 基于技术创新研发的内容精准挖掘系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297636A (ja) * 2001-03-30 2002-10-11 A & D:Kk 特許情報検索サーバーシステム、特許情報検索・配信サーバーシステム、発明支援サーバーシステム、発明支援プログラム、並びに発明支援プログラムを記憶した情報記憶媒体
JP2005309666A (ja) * 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2009157620A (ja) * 2007-12-26 2009-07-16 Mitsubishi Electric Corp 情報検索支援装置
JP2012053516A (ja) * 2010-08-31 2012-03-15 Ird:Kk 特許検索式生成装置、特許検索式生成方法、およびプログラム
US20120209830A1 (en) * 2011-02-11 2012-08-16 Exb Asset Management Gmbh Compact visualisation of search strings for the selection of related information sources
JP2013041385A (ja) * 2011-08-15 2013-02-28 Hitachi Ltd 文献検索方法、文献検索装置及び文献検索プログラム
JP2021022359A (ja) * 2019-07-30 2021-02-18 特許庁長官 管理システム及び管理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297636A (ja) * 2001-03-30 2002-10-11 A & D:Kk 特許情報検索サーバーシステム、特許情報検索・配信サーバーシステム、発明支援サーバーシステム、発明支援プログラム、並びに発明支援プログラムを記憶した情報記憶媒体
JP2005309666A (ja) * 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2009157620A (ja) * 2007-12-26 2009-07-16 Mitsubishi Electric Corp 情報検索支援装置
JP2012053516A (ja) * 2010-08-31 2012-03-15 Ird:Kk 特許検索式生成装置、特許検索式生成方法、およびプログラム
US20120209830A1 (en) * 2011-02-11 2012-08-16 Exb Asset Management Gmbh Compact visualisation of search strings for the selection of related information sources
JP2013041385A (ja) * 2011-08-15 2013-02-28 Hitachi Ltd 文献検索方法、文献検索装置及び文献検索プログラム
JP2021022359A (ja) * 2019-07-30 2021-02-18 特許庁長官 管理システム及び管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡部 勇: "ビジュアルテキストマイニング技術−特許検索・分析支援への適用−", FUJITSU, vol. 56, no. 4, JPN6021042749, 8 July 2005 (2005-07-08), JP, pages 371 - 377, ISSN: 0004633049 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7495767B1 (ja) 2023-10-04 2024-06-05 インパテック株式会社 プログラム、特許情報処理装置、および特許情報処理方法

Also Published As

Publication number Publication date
JP7029204B1 (ja) 2022-03-03

Similar Documents

Publication Publication Date Title
US9037590B2 (en) Advanced summarization based on intents
CN110457439B (zh) 一站式智能写作辅助方法、装置和系统
US9904726B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
US9411790B2 (en) Systems, methods, and media for generating structured documents
US20140115439A1 (en) Methods and systems for annotating web pages and managing annotations and annotated web pages
CN112711937A (zh) 一种模板推荐方法、装置、设备及存储介质
US20110184960A1 (en) Methods and systems for content recommendation based on electronic document annotation
CN111753198A (zh) 信息推荐方法和装置、以及电子设备和可读存储介质
CN107787487A (zh) 将文档解构为成分块以用于在生产力应用中重新使用
CN106471497B (zh) 使用上下文的辅助浏览
Tito et al. Icdar 2021 competition on document visual question answering
JP7029204B1 (ja) 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム
US20180293215A1 (en) Method and Computer Program for Sharing Memo between Electronic Documents
KR102188564B1 (ko) 어체 변환이 가능한 기계 번역 방법 및 시스템
US20120179709A1 (en) Apparatus, method and program product for searching document
EP3079083A1 (en) Providing app store search results
JP6840597B2 (ja) 検索結果要約装置、プログラム及び方法
Duque et al. Can multilinguality improve biomedical word sense disambiguation?
WO2024087821A1 (zh) 信息处理方法、装置和电子设备
CN112632950A (zh) Ppt生成方法、装置、设备及计算机可读存储介质
Vo et al. Experimenting word embeddings in assisting legal review
US11954153B2 (en) Knowledge insight capturing system
Teixeira Lopes et al. Assisting health consumers while searching the web through medical annotations
WO2021245814A1 (ja) 文書情報評価装置、文書情報評価方法、および文書情報評価プログラム
JP7004951B1 (ja) 発明評価装置、発明評価方法、および発明評価プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210608

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220210

R150 Certificate of patent or registration of utility model

Ref document number: 7029204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150