JP2022528273A - 機械学習基盤のユーザーカスタマイズ型の特許文献自動分類方法、装置及びシステム - Google Patents

機械学習基盤のユーザーカスタマイズ型の特許文献自動分類方法、装置及びシステム Download PDF

Info

Publication number
JP2022528273A
JP2022528273A JP2021560356A JP2021560356A JP2022528273A JP 2022528273 A JP2022528273 A JP 2022528273A JP 2021560356 A JP2021560356 A JP 2021560356A JP 2021560356 A JP2021560356 A JP 2021560356A JP 2022528273 A JP2022528273 A JP 2022528273A
Authority
JP
Japan
Prior art keywords
classification
patent documents
user
classifying
patent document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021560356A
Other languages
English (en)
Inventor
ホ ユン,ジョン
フン シン,ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wert Intelligence Co Ltd
Original Assignee
Wert Intelligence Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wert Intelligence Co Ltd filed Critical Wert Intelligence Co Ltd
Publication of JP2022528273A publication Critical patent/JP2022528273A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【構成】特許データベースに保存されている特許文献を機械学習技術で学習し、前記特許文献間の類似度に基づいて、第1分類基準を確立し、前記第1分類基準に基づいて前記特許文献を分類する基本分類モデルを生成する段階と、ユーザーの検索及び/または選択入力に基づいて、複数の特許文献が含まれた特許プールを生成する段階と、前記ユーザーの分類入力を受信し、前記分類入力に応じて前記特許プールに含まれている複数の特許文献を分類する段階と、前記分類された特許文献間の類似度に基づいて、前記ユーザーが前記複数の特許文献を分類する第2分類基準を予測する段階、及び前記基本分類モデル及び前記第2分類基準に基づいて、前記特許プールでまだ分類されていない残りの特許文献を分類する段階を含むことができる。【選択図】図3

Description

本明細書は、ユーザーの特許文献の分類パターンを学習して分類モデルを構築し、構築された分類モデルを用いて、特許文献を自動分類するための方法及びそのためのシステム/装置を提案する。
最近になって、様々な分野に応用可能な機械学習(マシンラーニング、machine learning)が発達している。このような機械学習は、人工知能の一分野であって、その類型に応じて教師あり学習(Supervised learning)、教師なし学習(Unsupervised learning)、強化学習(Reinforcement learning)などに分けられ、人工ニューラルネットワーク(Artificial neural network)、ブースティング(Boosting)、決定木(Decision tree)、サポートベクターマシン(Support vector machine)、ランダムフォレスト(Random forests)などのような様々な方式のアルゴリズムが開発されている。
人工ニューラルネットワークは、入力層(input layer)、隠れ層(hidden layer)及び出力層(output layer)を含み、隠れ層を重ねる方法によって、浅いニューラルネットワーク(Shallow neural network)と深層ニューラルネットワーク(Deep neural network)に分けられる。また、深層ニューラルネットワークでより改善された人工ニューラルネットワークである畳み込みニューラルネットワーク(Convolutional neural network、「ConvNet」)、循環ニューラルネットワーク(Recurrent neural network)、深層信頼ニューラルネットワーク(Deep belief network)、深層Qニューラルネットワーク(Deep Q-network)などが開発されており、これらの人工ニューラルネットワーク(深層ニューラルネットワークを含む)の機械学習方式を通常深層学習(ディープラーニング、deep learning)という。すなわち、深層学習は、脳のニューロンのような情報入出力階層を活用してデータを学習するものであって、様々な非線形転換技法の組合により、高い水準の抽象化を試みる機械学習をいう。
最近は、特許に基盤とした様々な事業/プロジェクトが活性化するに伴って、特許を技術別に分類する作業が多く行われている。各国の特許庁では、特許文献別に技術分類コード(IPC、CPCなど)を指定することによって技術分類を行っているが、このような技術分類コードは、任意に指定されたものであるため、実際の特許文献に開示されている技術とマッチングしない場合が多く、実際の産業及び製品とのマッチング程度が落ちるだけでなく、ユーザーが分類しようとする基準に合わないため、実際の分類作業に多くは使用されていないのが実情である。その結果、ユーザーが直接分類対象の特許をすべて把握して分類作業を行わなければならないため、多くの時間と費用/人員が消耗されるという問題点が存在した。
さらに、特許所有者(個人/会社)は、自分だけの特許戦略により技術別に存続期間を異なるように設定する場合がある。この場合、特許所有者は、直接消滅した特許文献の技術別存続/消滅の平均期間を算出しなければならず、係属中の特許文献を技術別に分類した後、先に算出した技術別の存続期間を適用しなければならない。これは、多くの時間と費用/人員が所要されるだけでなく、所有中の特許が多い場合には、これらの存続期間管理が非常に難しいという問題点が存在した。
本発明の一実施形態によれば、特許データベースに保存されている特許文献を機械学習技術で学習し、前記特許文献間の類似度に基づいて第1分類基準を確立し、前記第1分類基準に基づいて前記特許文献を分類する基本分類モデルを生成する段階と、ユーザーの検索及び/または選択入力に基づいて、複数の特許文献が含まれた特許プールを生成する段階と、前記ユーザーの分類入力を受信し、前記分類入力に応じて前記特許プールに含まれている複数の特許文献を分類する段階と、前記分類された特許文献間の類似度に基づいて、前記ユーザーが前記複数の特許文献を分類する第2分類基準を予測する段階、及び前記基本分類モデル及び前記第2分類基準に基づいて、前記特許プールでまだ分類されていない残りの特許文献を分類する段階を含むことができる。
本発明の一実施形態によれば、ユーザーの分類基準を学習して、ユーザーが望む分類基準を予測して自動的に特許文献を分類するため、ユーザーが特許文献を分類するのにかかる時間/努力/費用/不便さを確実に減らすという効果が発生する。
また、本発明の一実施形態によれば、ユーザーが保有していた特許権の消滅パターンを技術別に学習して、ユーザーが希望する技術別の存続期間を予測し、現在係属中の特許権に対する消滅期間を予測することによって、ユーザーがより簡単かつ効率的に、現在保有している特許の存続期間を管理することができるという効果が発生する。
これ以外にも、本発明の様々な実施形態に係る効果が存在し、これについては、以下で各図面を参照して詳細に後述する。
図1は、本発明の一実施形態に係る特許検索エンジンの特許文献の検索結果画面を例示した図である。 図2は、本発明の一実施形態に係るスライドビュー画面を例示した図である。 図3は、本発明の一実施形態に係る特許文献分類システムの特許文献の分類方法を例示したフローチャートである。 図4は、本発明の一実施形態によって、ユーザーの分類入力に応じた特許文献の分類方法を例示した図である。 図5は、本発明の一実施形態に係るフォルダの設定UIを例示した図である。 図6は、本発明の一実施形態によって、フォルダの設定に応じた特許文献の代表情報表示方法を例示した図である。 図7は、本発明の一実施形態に係るユーザーの分類入力に応じた特許文献の分類方法を例示した図である。 図8は、本発明の一実施形態に係る分類履歴ウィンドウを例示した図である。 図9は、本発明の一実施形態に係る多重フォルダ保存方式を例示した図である。 図10は、本発明の一実施形態によって、特許文献の消滅期間を予測する実施形態を例示したフローチャートである。 図11は、本発明の一実施形態に係る特許消滅推奨リストを例示した図である。 図12は、本発明の一実施形態に係る特許文献分類システムのブロック図を示した図である。 図13は、本発明の一実施形態に係る特許文献分類システムのブロック図を示した図である。
以下で説明する技術は、様々な変更を加えることができ、様々な実施形態を有することができるため、特定の実施形態を図面に例示して詳細に説明する。しかし、これは以下で説明する技術を特定の実施形態について限定するものではなく、以下で説明する技術の思想及び技術の範囲に含まれるすべての変更、均等物ないし代替物を含むものであると理解されなければならない。
第1、第2、A、Bなどの用語は、様々な構成要素を説明するのに使用されることができるが、その構成要素は、前記の用語によって限定されず、単に1つの構成要素を他の構成要素から区別する目的でのみ使用される。例えば、以下で説明する技術の権利範囲を逸脱せず、第1構成要素は第2構成要素と命名されることができ、同様に第2構成要素も第1構成要素と命名されることができる。及び/またはという用語は、複数の関連して記載された項目の組合または複数の関連して記載された項目のうちのいずれかの項目を含む。
本明細書で使用した用語において、単数の表現は、文脈上明らかに異なって解釈されない限り、複数の表現を含むものと理解されなければならず、「含む」などの用語は、記載された特徴、個数、段階、動作、構成要素、部分品またはこれらを組み合わせたものが存在することを意味するものであって、1つまたはそれ以上の他の特徴や個数、段階、動作、構成要素、部分品またはこれらを組み合わせたものなどの存在または付加可能性を排除しないものと理解されなければならない。
図面についての詳細な説明をする前に、本明細書での構成部に対する区分は、各構成部が担当する主機能別に区分したものに過ぎないことを明確にしておく。すなわち、以下で説明する2つ以上の構成部が1つの構成部に合わせられたり、または1つの構成部がより細分化された機能別に2つ以上に分化されて備えられることもできる。そして、以下で説明する構成部のそれぞれは、自身が担当する主機能以外にも、他の構成部が担当する機能のうち、一部または全部の機能を追加的に行うこともでき、構成部のそれぞれが担当する主機能のうち、一部機能が他の構成部によって専担されて行われることもできることはもちろんである。
また、方法または動作方法を行うにおいて、前記方法をなす各過程は文脈上明らかに特定順序を記載しない限り、明記された順序と異なって起きることもあり得る。すなわち、各過程は明記された順序と同一に起きることもあり得、実質的に同時に行われることもあり得、反対の順に行われることもあり得る。
本発明は、特許検索エンジンを提供するウェブサイト/サーバー(あるいはこれらのウェブサイト/サーバーを介した特許検索機能が具現されたコンピュータプログラム/アプリケーション)に基盤とする。したがって、本明細書で記述された実施形態は、ウェブサーバー、アプリケーションサーバー、及び/またはクライアント機器によって行われることができ、これらが含まれたシステムを「特許文献分類システム」と通称することができる。
以下では、説明の便宜のために、実施形態を行う主体を「特許検索エンジン」または「特許文献分類システム」と説明するが、ウェブサーバー、アプリケーションサーバー、及び/またはクライアント機器に代替されて説明されることができる。なお、以下では、説明の便宜のために、ウェブサイトを介して提供される特許検索エンジンに基盤に説明するが、これに限定されるものではなく、アプリケーションを介して提供される特許検索エンジンにも適用されることができるのはもちろんである。
まず、本発明の基盤となる特許検索エンジンの基本的な機能及びGUI(Graphic User Interface)を詳察した後、特許文献自動分類方法について詳細に詳察することにする。
図1は、本発明の一実施形態に係る特許検索エンジンの特許文献の検索結果画面を例示した図である。
本発明の特許検索エンジンは、ユーザーの検索入力に応じて検索された特許に関する様々な情報を1つの画面に提供することができる。
例えば、図1に示したように、特許検索エンジンは、特許文献の検索結果として、国別/状態別に検索された特許文献数130と全体または国別に検索された特許文献リスト140などを提供することができる。特に、特許検索エンジンは、特許文献リスト140提供時に、各特許文献に関する書誌情報(出願国、出願/登録番号、種類、出願日、現在状態(出願/公開/登録など)、発明の名称など)も共に提供することができる。
また、特許検索エンジンは、検索された特許文献に対し、ユーザーが様々な追加作業を指示するための実行ボタンタブ120を提供することができる。例えば、図1に示したように、特許検索エンジンは、スライドビュー110、work保存、グラフエンジン、ダウンロード及びリスト出力作業のための実行ボタンが含まれた実行ボタンタブ120を提供することができる。
ここで、スライドビュー110は、検索された特許文献をユーザーがより簡単に把握できるように、各特許文献を代表する情報(例えば、代表図面、要約情報、独立項など)を1つの画面に要約構成してリストアップする機能を提供し、ユーザーは、その機能によってより簡単に特許文献の把握が可能である。これについては、図2を参照してより詳細に後述する。
Work保存は、特許文献を特定フォルダに保存する機能を提供し、本明細書で提案する特許文献の分類作業に使用されることができる。グラフエンジンは、ユーザーが選択した特許文献を集めて、ユーザーが希望する基準によってグラフを生成するか、統計を算出する機能を提供する。ダウンロードは、特許文献をダウンロードする機能を提供し、リスト出力は、検索された特許文献のリスト、要約情報などを出力する機能を提供する。
これ以外にも、特許検索エンジンは、特許文献を利用した様々な追加作業を指示するための実行ボタンを提供することができ、前述した実施形態に限定されない。
図2は、本発明の一実施形態に係るスライドビュー画面を例示した図である。
図2を参照すると、スライドビュー画面は大きく、ハイライトウィンドウ210、プロジェクトウィンドウ220、代表図面ウィンドウ230、特許文献代表内容ウィンドウ250、特許リストウィンドウ240で構成されることができる。
ハイライトウィンドウ210は、ユーザーが入力する特定のキーワード/検索語を各特許文献で強調表示する機能を提供する。プロジェクトウィンドウ220は、ユーザーが生成した様々な上位/下位フォルダを管理(生成及び編集など)することができるプロジェクトウィンドウである。ユーザーは、特許文献を所望のフォルダに保存することによって、特許文献を分類することができ、フォルダ別に特許文献を管理することができる。
代表図面ウィンドウ230は、対象特許文献の代表図面を見せる機能を提供し、特許文献代表内容ウィンドウ250は、対象特許文献を把握するために必要な代表的な情報を要約提供する機能を行う。ユーザーは、このような代表図面ウィンドウ230及び特許文献代表内容ウィンドウ250を介して対象特許文献の特徴及び技術内容を一度に簡単に把握することができる。
特許リストウィンドウ240は、ユーザーがスライドビューでみようと選択した特許文献のリストを提供するウィンドウである。このような特許リストウィンドウ240によって、ユーザーは、現在のプールにどのような特許文献がどのくらい含まれているか知ることができ、このうち、現在のユーザーが見ている特許文献がどのような文献なのかも知ることが出来る。
以上で、本発明に基礎となる特許検索エンジンについて簡単に説明した。以下で後述する本発明の実施形態は、このような特許検索エンジンに基盤として実行/提供されることができ、特に特許分類システム及び方法は、スライドビュー画面内で1つの機能として提供されることができる。ただし、本発明が前述した特許検索エンジンに限定的に適用されるものではなく、様々な特許検索エンジン/サイトに同一/同様に適用できることはもちろんである。
図3は、本発明の一実施形態に係る特許文献分類システムの特許文献の分類方法を例示したフローチャートである。
図3を参照すると、まず、特許文献分類システムは、特許データベースに保存されている一部または全体の特許文献を機械学習(Machine learning)技術で学習することができる。さらに、特許文献分類システムは、機械学習技術に基盤として学習した特許文献間の類似度に基づいて第1分類基準を確立し、確立した第1分類基準によって、特許文献を分類する基本分類モデルを生成することができる(S301)。
特許文献分類システムは、様々な機械学習技術を用いて特許文献を学習することができる。機械学習技術の一実施形態として、RNNs(Recurrent Neural Networks)技術、DNNs(Deep Neural Networks)及び/またはCNNs(Convolutional Neural Networks)などが使用されることができる。RNNs(Recurrent Neural Networks)技術は、文、遺伝子、手書き文字、音声信号、センサーが感知したデータ、テキスト、株価など一定の配列(sequenceまたは時系列データ)の形態を有するデータからパターンを認識する人工ニューラルネットワークである。RNNs技術では、現在入力されたデータと過去に入力されたデータは同時に考慮され、配列の情報はRNNsの隠れ層に保存され、隠れ層に保存された情報は、一定時間後に保存された情報が必要な入力を受信すると、再び使用されることができる。DNNsは、このような隠れ層を2つ以上有している学習方法を意味する。DNNsでコンピュータは、自ら分類ラベルを作り出して空間を歪曲し、データを区分する過程を繰り返して、最適の区分線を導出することができる。CNNs技術は、このようなDNNsを応用したアルゴリズムであり、これについてはS306段階でより詳細に後述することにする。
特許文献分類システムは、特許文献を学習する前に、翻訳エンジンを用いて特許文献を共通した1つの言語(例えば、韓国語または英語)に翻訳することができ、統一された1つの言語で特許文献を学習することができる。ただし、これに限定されるものではなく、特許文献分類システムは、翻訳エンジンを用いて、最大2つの言語に翻訳して特許文献を学習することもできる。
特許文献分類システムは、特許文献間の類似度判断時に、各特許文献のファミリー特許文献、特許分類コード(例えば、IPC、CPCなど)、先行特許文献、審査段階で引用された特許文献、他特許文献の審査段階で被引用された特許文献、(テキストマイニングで抽出された)キーワード及び/またはテキストデータなどに基づいて判断することができる。このとき、テキストデータは、Word Emdedding、Word2vecのようなアルゴリズムを用いてベクトル化されることができる。
特許文献分類システムは、特許文献間の類似度算出のために、コサイン係数(Cosine coefficient)、ジャカード係数(Jaccard coefficient)、ダイス係数(Dice coefficient)、ユークリッド距離(Euclidean distance)、ベクトル内積(vector inner product)などを使用することができる。実施形態によっては、分類(またはクラスタリング)技法により、特定の類似度測定方法を用いなければならない場合があり、例えば、ユークリッド距離を用いて文献間の距離を測定するWard技法と内積の積で類似度を計算するグループ平均技法などがこれに該当し、類似度測定方法によって、各分類(またはクラスター)に属する特許文献(またはメンバー)が変わり得る。
次に、特許文献分類システムは、ユーザーの検索及び/または選択入力に基づいて、複数の特許文献が含まれた特許プール(Pool)を生成することができる(S302)。特許プールに含まれている複数の特許文献は、以下で後述するユーザーの分類対象文献となることができる。
次に、特許文献分類システムは、ユーザーの分類入力を受信し(S303)、分類入力に応じて特許プールに含まれている複数の特許文献を分類することができる(S304)。特許文献分類システムは、ユーザーのフォルダ生成入力に応じて、少なくとも1つのフォルダを生成することができ、ユーザーの分類入力に応じて、特許プールの特許文献を各フォルダに保存する(またはフォルダに移動させる)ことによって、分類作業を行うことができる。分類入力は、ユーザーが特許文献を分類するための様々なユーザー入力として様々な実施形態があり得るが、一実施形態として、ユーザーは特許文献をフォルダ側にドラッグアンドドロップするモーション/タッチ入力を行うことによって、簡単に分類作業を行うことができる。他の実施形態として、分類入力は、特許文献分類システムが提供する今すぐ保存ボタンに対するユーザー入力に該当することができる。ここで、今すぐ保存ボタンは、ユーザーが自分が所望するフォルダに特許文献をすぐ保存して分類することができるように、特許文献分類システムが提供するUIに該当することができる。今すぐ保存ボタンは、各特許文献ごとに提供されることができる。また他の実施形態として、分類入力は、対象特許文献をトグリング(toggling)方式で分類するための入力として、例えば、OまたはXに対するユーザー入力に該当することができる。ユーザーは、対象特許文献に対してOまたはXを選択/入力することによって、2つの分類(例えば、OまたはX)に分類することができる。分類項目(OまたはX)は、ユーザーが直接設定するか、ウェブ/アプリケーションサーバーで既に設定された項目で提供することができる。分類入力の実施形態については、図4及び7を参照して、以下でより詳細に後述する。
次に、特許文献分類システムは、分類された特許文献間の類似度に基づいて、ユーザーが特許文献を分類する第2分類基準を予測することができる(S305)。類似度に基づいた第2分類基準の予測方法は、類似度に基準として第1分類基準を確立する方式と同一/同様に行うことができる。
次に、特許文献分類システムは、基本分類モデル及び第2分類基準に基づいて、特許プールでまだ分類されていない残りの特許文献を分類することができる(S306)。
より詳細には、一実施形態として、特許文献分類システムは、予測した第2分類基準に基本分類モデルに結合して、ユーザーカスタマイズ型分類モデルを構築することができる。ユーザーカスタマイズ型分類モデルは、転移学習(Transfer Learning)に基盤に構築されることができる。転移学習は、主に事前学習されたモデル(pre-trained model)を用いることができ、事前学習されたモデルは、同様の課題解決の目的を持ちながら、サイズが大きいデータですでに学習が完了しているモデルを意味する。特に、本明細書は、転移学習に用いられている事前学習モデルは、畳み込みニューラルネットワーク(Convolutional Neural Networks;CNNs)構造を有している。このCNNは、次のような2つのパートで構成されている。
-Convolutional base:畳み込み層とプーリング層が何層も重なっている部分である。convolutional baseの目標は、データから特徴を効果的に抽出すること(feature extraction)である。
-Classifier:主に完全連結階層(fully connected layer)からなっている。完全連結階層とは、すべての階層のニューロンが以前層の出力ノードと1つももれなく全部連結されている層をいう。Classifierの最終目標は、抽出された特徴をよく学習して、データを適切なカテゴリーに分類すること(image classification)である。
特許文献分類システムは、この2つのパーツを用いて、ユーザーカスタマイズ型分類モデルを構築することができ、特に、Convolutional baseは固定させてclassifierのみを新しく学習する戦略を使用して、ユーザーカスタマイズ型分類モデルを構築することができる。このような戦略は、コンピュータ演算能力が不足するか、データセットが非常に小さいとき、そして/または自分が解こうとする問題が事前学習モデルがすでに学習したデータセットと非常に類似しているときに有利に適用可能である。
これを本実施形態に適用すると、特許文献分類システムは、基本分類モデルをconvolutional baseとして固定した後、第2分類基準をclassifierとして新しく学習して、ユーザーカスタマイズ型分類モデルを構築することができる。ここで、基本分類モデルを固定するとは、基本分類モデルの第1分類基準に基づいて、特許プールの特許文献をユーザーが生成したフォルダ数だけ仮分類した特徴/基準を固定するものと解釈されることができる。したがって、第1分類基準による仮分類の特徴/基準が固定され、第2分類基準による分類特徴/基準をclassifierで新しく学習することによって、ユーザーカスタマイズ型分類モデルが構築されることができる。
他の一実施形態として、特許文献分類システムは、前記実施形態のように、ユーザーが分類した特許文献を学習せず、基本モデルだけを用いて特許文献を分類することもできる。この場合、特許文献分類システムは、ユーザーが分類した特許文献間の技術的距離に基本分類モデルに基づいて算出し、算出した技術的距離に基づいて第2分類基準を予測することができる(すなわち、学習不要)。特許文献分類システムは、このように基本分類モデルに基づいて予測された前記第2分類基準に基づいて、残りの特許文献を分類することができる。例えば、ユーザーが特許プール中の一部特許文献を4つの分類に分類した場合、特許文献分類システムは、4つの分類に属する特許群の特徴に基本分類モデルに基盤として抽出することができ、このように抽出した基本分類モデルにおける特許群別特徴に応じて、残りの特許文献を自動に分類することができる。本実施形態によるとき、第2分類基準は、結局第1分類基準の分類をユーザー分類特徴によってグルーピングして、全体の分類種類/数を減らした形態と解釈されることができる。例えば、第1分類基準に基づいて分類することができる技術分類が1000個とすると、第2分類基準は、1000個をユーザー分類パターン/基準によって類似度が高い分類どうしクラスタリング/グルーピングして50個の技術分類を区分することができるように確立することができる。
さらに、特許文献分類システムは、残りの特許文献に対する自動分類を指示するための入力ボタン(例えば、分類開始ボタン)を出力することができる。入力ボタンに対するユーザーの入力を受信した場合、特許文献分類システムは、ユーザーカスタマイズ型分類モデルを用いて、残りの特許文献を分類することができる。より詳細には、特許文献分類システムは、入力ボタンに対するユーザーの入力受信時に、ユーザーカスタマイズ型分類モデルを用いて残りの特許文献を分類して分類特性に合った各フォルダに自動保存することによって、残りの特許文献を分類することができる。
すなわち、本フローチャートは、次の実施形態のように適用することができる。
ユーザーは、1000個の特許を検索して特許プールに設定し、4つのフォルダを生成することができる。特許文献分類システムは、1000個の特許に基本分類モデルを用いて4つのフォルダに仮分類することができる。ユーザーは、1000個のうち、まず100個の特許を4つのフォルダに分類保存することができ、特許文献分類システムは、このようなユーザーの分類情報からユーザーの分類基準/特徴を予測することができる。特許文献分類システムは、仮分類基準/特徴(すなわち、第1分類基準)にユーザーの分類基準/特徴を追加したモデルを生成し、残りの900個の特許を4つのフォルダに分類して保存することになる。
一方、本フローチャートには図示していないが、特許文献分類システムは、自動分類の正確度(第1正確度)をリアルタイムで算出し、第1正確度をリアルタイムで表示するインジケーターを出力することができる。
一実施形態として、第1正確度は、特許プールに含まれた特許文献の個数、ユーザーによって設定/指定された分類個数、及び/またはユーザーによって現在まで分類完了した特許文献の個数に基づいて算出することができる。より詳細には、特許文献分類システムは、基本分類モデルを学習して、分類対象特許文献の総個数(第1因子)、分類個数(第2因子)及び/または分類別含まれた特許文献の個数(第3因子)による第2正確度をあらかじめデータとして算出/導出する場合があり得る。例えば、特許文献分類システムは、基本分類モデルを学習した結果、分類対象特許文献が1000個であり、分類個数が3個、分類別含まれた特許文献の個数が100個である場合、80%の分類正確度を有するという統計データをあらかじめ算出/導出することができる。この場合、特許文献分類システムは、このような統計データにユーザーの分類パターン/基準を因子として代入することによって、第1正確度を導出することができる。すなわち、第1正確度は、ユーザーが特許プール内に含ませた複数の特許文献の個数、第2分類基準による分類の個数、及び/または分類別含まれた特許文献の個数を第1~第3因子として前記統計データに順次的に適用したとき、あらかじめ算出されている第2正確度に該当することができる。したがって、もし、ユーザーが特許プールに1000個の特許文献を含ませ、3つのフォルダにそれぞれ100個の特許文献を分類した場合、前述した例によると、ユーザーの分類正確度(すなわち、第1正確度)は、80%と導出されることになる。これに追加的に、特許文献分類システムは、ユーザーによって各分類別に含まれた特許文献間の距離がどのくらい近いかによる確率(ユーザーが分類別にちゃんと入れたのかを間接検証)も追加的に考慮して、第1正確度を導出/表示することができる。
前述した内容に基づくとき、最大正確度が導出されるための第1~第3因子は、基本分類モデルに基づいて導出された統計データ内で固定されていることができる。この場合、特許文献分類システムは、導出した第1正確度が最大正確度よりも低いと判断した場合、ユーザーに追加の分類をガイドするためのポップアップウインドウを出力することができる。例えば、1000個の分類対象特許文献が含まれた特許プールで3つの分類に特許文献を分類する場合、最大正確度80%が導出されるために、各フォルダ別に最小分類されなければならない特許文献の個数は、100個に定められていることがあり得る。したがって、ユーザーが最大正確度の80%に到達するために、各フォルダ別に少なくとも100個の特許文献を含ませることができるように、特許文献分類システムは、これをガイドするためのポップアップウインドウを出力することができる。例えば、特許文献分類システムは、「現在分類正確度が60%なので、もう少し多くの特許を分類して下さい。」または「XXフォルダの分類の正確度が低いので、XXフォルダにより多くの特許を分類して下さい。」などのようなポップアップウインドウを出力することができる。
他の実施形態として、第1正確度は、第1分類基準で分類した結果と第2分類基準で分類した結果との間のマッチング程度に該当することができる。
特許文献分類システムは、自動分類の正確度をフォルダ別及び/または特許プール別に算出することができ、正確度を表示するインジケーターをフォルダ別及び/または特許プール別に出力することができる。
図4は、本発明の一実施形態によって、ユーザーの分類入力に応じた特許文献の分類方法を例示した図である。
前述したように、ユーザーは、特許文献を分類しようとするフォルダにドラッグアンドドロップすることによって、簡単に分類作業を行うことができる。
スライドビュー画面構成に基づいて、例えば、図4に示したように、特許文献分類システムは、特許文献の代表内容ウィンドウに該当特許文献をフォルダにドラッグアンドドロップすることができるアイコン450を出力することができる。ユーザーが分類のために生成したフォルダ420は、スライドビューのプロジェクトウィンドウ410内に提供されることができ、ユーザーは、前記アイコン450を所望のフォルダ410側にドラッグアンドドロップ入力430することによって、該当フォルダ410への分類及び保存作業を行うことができる。
さらに、特許文献分類システムは、フォルダ410別にユーザーが直接等級及び/または技術テーマ/キーワードを設定することができるように設定UI440を提供することができ、これについては、図5及び6を参照して以下に後述する。
図5は、本発明の一実施形態に係るフォルダの設定UIを例示した図であり、図6は、本発明の一実施形態によって、フォルダの設定に応じた特許文献の代表情報表示方法を例示した図である。
特許文献分類システムは、フォルダ別にユーザーが直接追加情報を入力することができる設定UI520を提供することができる。例えば、図5に示したように、特許文献分類システムは、フォルダ別510等級設定及び/またはキーワード/テーマを設定することができる設定UI520を出力することができる。ユーザーは、設定しようとするフォルダ510を選択した後、選択したフォルダ510に対する重要等級及び/またはキーワード/テーマを直接設定することによって、より簡単に特許文献をフォルダ別510に管理することができる。
設定UI520を用いて、追加情報が入力/設定されたフォルダに所属された/保存された特許文献は、設定/入力された追加情報が代表情報として表示されてユーザーに提供されることができる。
例えば、図5及び6に示したように、Bフォルダに等級がA、キーワード/テーマが#カメラと設定された場合、Bフォルダに保存されている特許文献の等級は、すべてA、キーワード/テーマは、すべて#カメラと設定されて代表情報610として表示されることができる。したがって、ユーザーは、各特許文献別に等級/キーワード/テーマなどを個別的に設定する必要なく、フォルダの設定UI520を用いて、フォルダ単位で設定することができるので、ユーザーは、特許文献をフォルダ別に、より簡単に管理することができる。
図7は、本発明の一実施形態に係るユーザーの分類入力に応じた特許文献の分類方法を例示した図である。
前述したように、ユーザーは、特許文献と共に出力された今すぐ保存ボタン710に対してユーザー入力を行うことによって、簡単に分類作業を行うことができる。
スライドビュー画面構成に基づいて、例えば、図7に示したように、特許文献分類システムは、特許文献代表内容ウィンドウに該当特許文献をフォルダにすぐ保存できる機能を実行することができる今すぐ保存ボタン710を出力することができる。ユーザーは、今すぐ保存ボタンをタッチ/選択720することによって、該当特許文献をフォルダにすぐ保存することができる。もし、保存可能なフォルダが複数の場合、特許文献分類システムは、今すぐ保存ボタンに対するユーザー入力受信時に、保存可能なフォルダを選択できる選択UI730を提供することができる。ユーザーは、選択UI730に表示されたフォルダのうち、対象特許文献を保存しようとするフォルダを選択入力することによって、対象特許文献をすぐ該当フォルダに保存することができる。
図8は、本発明の一実施形態に係る分類履歴ウィンドウを例示した図である。
図8を参照すると、特許文献分類システムは、ユーザーの最近分類履歴を記録し、該当記録情報が表示されたウィンドウ(すなわち、分類履歴ウィンドウ)810をユーザーに提供することができる。
分類履歴ウィンドウ810には、ユーザーが最近分類した特許文献が分類された順にリストアップされることができ、各特許文献についての簡単な分類情報(例えば、分類された特許文献の出願/登録番号、保存されたフォルダなど)も共に提供されることができる。さらに、分類履歴ウィンドウ810は、分類された特許文献別に「実行取り消し」アイコン820を共に提供することができる。「実行取り消し」アイコン820は、対象特許文献の分類作業実行を取り消すためのアイコンに該当する。したがって、実行取り消しアイコン820に対するユーザー入力が受信されると、特許文献分類システムは、実行取り消し入力が受信された対象特許文献に対する分類作業の実行を取り消すことができ、対象特許文献は、該当フォルダに保存/所属する前(すなわち、分類前)の状態に戻ることになる。
図9は、本発明の一実施形態に係る多重フォルダ保存方式を例示した図である。
特許文献分類システムは、多重フォルダ保存方式を支援し、その結果、1つの特許文献が同時に複数のフォルダに保存されることができる。例えば、対象特許文献は、同時にA及びBフォルダに保存されることができる。
特許文献分類システムは、対象特許文献が保存/分類されたフォルダに関する情報を表示するためのアイコン910を提供することができる。例えば、図9に示したように、対象特許文献がA及びBフォルダに保存/分類されている場合、特許文献分類システムは、フォルダ数2を指示するフォルダアイコン910を提供することができ、ユーザーがフォルダアイコン910をタッチ/選択する場合、現在対象特許文献が保存されているフォルダのリスト情報(A及びBフォルダ)920を提供することができる。
特許文献分類システムが多重フォルダ保存方式を支援することによって、各特許文献には、最大現在生成されている全体フォルダ数だけ等級及び/またはキーワード/テーマが割り当てられることができる(フォルダ別に等級及び/またはキーワード/テーマ設定が可能であるため)。
本図面には示していないが、自動分類を完了した特許文献分類システムは、ユーザーが分類内容を直接チェック及び修正できるようにするための再分類UIを各フォルダ別に提供することができる。
再分類UIは、各フォルダに分類された特許文献をユーザーが、再び再分類するための再分類対象表示ボタン及び再分類対象特許文献に対する再分類を命令するための再分類ボタンなどを提供することができる。したがって、ユーザーは、「再分類対象表示ボタン」を用いて、該当フォルダへの分類が適切ではない対象特許文献を表示することができ、再分類対象表示ボタンによって表示された特許文献を該当フォルダから削除するか、他のフォルダに移すために「再分類ボタン」を用いることができる。再分類対象は、様々な実施形態で表示されることができ、例えば、ウェブ/アプリケーションサーバーで提供する(またはユーザーが直接設定した)タグや色を用いて表示されることができる。この場合、ユーザーは、各特許文献を対象にウェブ/アプリケーションサーバーが提供するタグや色を選択入力(例えば、タッチ/クリック入力)して再分類が必要な特許文献を指定することができる。
特許文献分類システムは、このようにユーザーが再分類した内容もデータ化して基本分類モデルに基づいて再分類データを学習することによって、自ら進化することができる。
以上で、機械学習(または深層学習)に基盤としてユーザーカスタマイズ型分類モデルを構築し、これを用いて特許文献を自動分類する方法について詳察した。このように、従来のモデルにユーザー分類パターン/習慣を新しい特徴/基準として結合することによって、新しいモデルを構築する方式は、様々なユーザーカスタマイズ型特許管理実施形態に適用されることができる。例えば、前記方式を用いて、特許権の消滅期間、特許別に維持する請求項の数、権利譲渡の可能性(ライセンス)、発明者別特許維持方法、特許評価による特許維持方法などの予測/推薦も可能である。
例えば、特許権の消滅期間予測に本発明の方式を適用する場合、特許文献分類システムは、ユーザーの保有特許を技術別に分類することができ(このとき、基本分類モデル使用可能)、分類された技術分野別に特許消滅パターンを学習して、ユーザーカスタマイズ型モデルを生成することができる。これにより、特許文献分類システムは、ユーザーの既存の特許管理(消滅など)のパターン/特徴に合わせて、特許消滅予測期間をユーザーが希望する周期に技術分野別に自動推薦することができる。
例えば、韓国生命研究院は、幹細胞関連特許は消滅せず、15年以上維持する特徴がある反面、化合物や製造工程特許は、5年以内に一括消滅させる特徴/パターンがある場合、特許文献分類システムは、このような消滅特徴/パターンを把握して、韓国生命研究院で現在維持中の幹細胞技術分野の特許は、15年以上維持するように推薦し、化合物や製造工程特許は、5年以内に消滅させるように案内/推薦することができる。
本実施形態については、図10を参照して、より詳細に後述することにする。
図10は、本発明の一実施形態によって、特許文献の消滅期間を予測する実施形態を例示したフローチャートである。
本実施形態は、説明の便宜のために、図3の実施形態に後行する実施形態で作成したが、これに限定されるものではなく、図3の実施形態と独立的な実施形態で行われることができることはもちろんである。
まず、特許文献分類システムは、特許データベース(Data base;DB)に含まれている特許文献に対して基本分類モデルを用いて第1分類基準で分類された特許文献の出願日または登録日から消滅日までの第1平均期間を分類別に算出することができる(S1001)。
次に、特許文献分類システムは、特許プールに含まれている複数の文献を第1または第2分類基準によって分類し(S1002)、複数の特許文献の出願日または登録日から消滅日までの第2平均期間を分類別に算出することができる(S1003)。ここで、特許プールに含まれている複数の文献は、ユーザーが現在保有中であるか、保有したが現在は消滅した特許に(を)該当(含む)することができる。本段階によって、特許文献分類システムは、ユーザーの技術別平均的な特許消滅期間/パターン/特徴を予測することができるようになる。
最後に、特許文献分類システムは、第1及び第2平均期間を考慮して、特定の特許文献の消滅期間を予測することができる(S1004)。ここで、特定の特許文献は、ユーザーが現在保有中でありながら消滅していない特許及び/またはユーザーの入力に応じて特定された特許に(を)該当(含む)することができる。
特許文献分類システムは、消滅期間予測のために、まず特定の特許文献を第1及び/または第2分類基準によって分類することができる。次に、特許文献分類システムは、特定の特許文献の第1及び/または第2分類基準による分類によって第1及び/または第2平均期間を既に設定された比率で結合して、特定の特許文献の消滅期間を算出することができる。例えば、第1特定の特許文献が第1分類基準によって「バイオ」分類に属し、「バイオ」分類の平均存続期間が全体特許データベースで5年である場合を仮定してみることができる。さらに、第1特定の特許文献が第2分類基準によって「生体リズム」分類に属し、「生体リズム」分類の平均存続期間がユーザー消滅特許内で10年である場合を仮定してみることができる。第1及び第2分類基準の間の既に設定された比率が3:7と設定されている場合、5×0.3+10×0.7=8.5という期間が評価指数として導出されることができる。すなわち、第1特定の特許文献の予想存続期間は、8年6ヶ月と予測されることができる。
既に設定された比率は、様々な実施形態によって自由に設定/変更されることができ、ユーザーカスタマイズ型モデルという側面では、第2分類基準の比率が第1分類基準よりも高く設定されることができる。
図11は、本発明の一実施形態に係る特許消滅推奨リストを例示した図である。
図11を参照すると、特許文献分類システムは、特定の特許文献別予測した消滅期間を評価指数1120としてリストアップして、特許消滅推奨リスト1110に含めて出力することができる。
特許消滅推奨リスト1110が出力される時点は、消滅予測時点から既に設定された時点以前(例えば、6ヶ月または1年前)に設定されることができ、ユーザーによって自由に設定可能である。
ユーザーは、このような特許消滅推奨リスト1110によって、現在保有している特許権の消滅期間を予測することができ、権利を維持させるか、または消滅させるかをあらかじめ判断して各特許権の存続期間を効率的に管理することができる。
図12は、本発明の一実施形態に係る特許文献分類システムのブロック図を示した図である。
図12を参照すると、特許文献分類システムは、大きくウェブサーバー(またはアプリケーションサーバー)及びクライアント機器で構成されることができる。
ウェブサーバー(またはアプリケーションサーバー)1200は、プロセッサ1210、メモリユニット1220及び/または通信ユニット1230を含むことができ、クライアント機器1300は、プロセッサ1240、センサーユニット1250、通信ユニット1260及び/またはディスプレイユニット1270を含むことができる。構成要素のうちの少なくとも1つは、実施形態によって除外されるか、新しい構成要素が含まれることができる。また、各ユニットは、以下で後述する機能を行うために、ハードウェア的な回路/装置などが備えられることができ、1つのチップまたは複数のチップで具現されることができる。
メモリユニット1220は、ビデオ、オーディオ、写真、動画、コンピュータプログラム、アプリケーションなど様々なデジタルデータを保存することができる。メモリユニット1220は、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)などの様々なデジタルデータ保存空間に該当することができる。特に、ウェブサーバー(またはアプリケーションサーバー)1200のメモリユニット1220は、特許データベースに該当することができ、全世界の様々な特許文献が保存されていることができる。
通信ユニット1230、1260は、少なくとも1つの通信プロトコルを使用して通信を行い、様々なデータを送信/受信することができる。特に、通信ユニット1230、1260を介して、クライアント機器1300に対するユーザー入力がウェブサーバー(またはアプリケーションサーバー)1200に転送されることができ、ウェブサーバー(またはアプリケーションサーバー)1200の様々な出力/フィードバックデータ/情報も通信ユニット1260を介してクライアント機器1300に転送されることができる。
センサーユニット1250は、前述した様々なセンシング手段を通称するものであって、ユーザーの様々な入力及び/またはクライアント機器1300の環境をセンシングすることができる。特に、センサーユニット1250は、ユーザーの様々な入力(例えば、タッチ/モーション/選択/検索入力など)をセンシングし、センシング結果をプロセッサに転送することができる。一実施形態として、センサーユニット1250は、重力(gravity)センサー、地磁気センサー、モーションセンサー、ジャイロスコープセンサー、加速度センサー、赤外線センサー、傾き(inclination)センサー、明るさセンサー、高度センサー、嗅覚センサー、温度センサー、デプスセンサー、圧力センサー、ベンディングセンサー、オーディオセンサー、ビデオセンサー、GPS(Global Positioning System)センサー、タッチセンサー及びグリップセンサーなどの様々なセンシング手段のうちのいずれか1つを含むことができる。前述したセンサーは、別途のエレメントでデバイスに含まれるか、少なくとも1つ以上のエレメントで統合されて含まれることができる。
ディスプレイユニット1270は、様々なイメージ/映像をディスプレイすることができる。特に、クライアント機器1300のディスプレイユニット1270は、ウェブサーバーが提供する様々なウェブページ/UI、アプリケーションサーバーが提供する様々なアプリケーション画面/UIなどをディスプレイすることができる。
プロセッサ1210、1240は、本明細書で提案された様々な実施形態を少なくとも1つの他の構成ユニットを制御して行うことができる。したがって、本明細書に開示された実施形態の実行主体は、プロセッサに代替されて説明されることができる。プロセッサ1210、1240は、メモリユニット1220に保存された様々なプログラム/アプリケーションを実行し、サーバー/機器内部のデータ/情報をプロセシングすることができる。プロセッサ1210、1240は、CPU(Central Processing Unit)、MPU(Micro Processor Unit)、MCU(Micro Controller Unit)、AP(Application Processor)、AP(Application Processor)または本発明の技術分野でよく知られている任意の形態のプロセッサを少なくとも1つ含んで構成されることができる。プロセッサは、本発明の実施形態に係る方法を実行するための少なくとも1つのアプリケーションまたはプログラムに対する演算を行うことができる。
図13は、本発明の一実施形態に係る特許文献分類システムのブロック図を示した図である。
本図面の構成要素は、図12に示された構成要素のうちの少なくとも1つを用いて具現されることができる。例えば、ロード部は、プロセッサとメモリユニット、フォルダ生成部、特許文献表示部及びフォルダ表示部は、プロセッサとディスプレイユニット、保存部は、メモリユニットによってそれぞれ具現されることができる。
ロード部1310は、ユーザーが要請した少なくとも1つの特許文献をロードする役割を行うことができる。ロード部1310は、各種データ、命令及び/または情報を保存する保存空間と連結され、本発明の実施形態に係る特許分類サービス提供方法が提供されるための1つ以上のアプリケーションを保存することができる。ロード部1310は、通信ユニットを介して受信されるか、ユーザー入力を介して入力される各種情報を保存することもできる。
保存部1350は、外部装置から転送されたデータなどを一時的にまたは非一時的に保存することができる。保存部1350は、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリなどのような不揮発性メモリ、ハードディスク、着脱型ディスク、または本発明が属する技術分野でよく知られた任意の形態のコンピュータで読み取り可能な記録媒体を含んで構成されることができる。
フォルダ生成部1320は、特許文献を保存するか、分類するためのフォルダを生成する役割をすることができる。
特許文献表示部1330は、特許文献内の区別項目のうちの少なくとも1つを情報領域にディスプレイする役割をし、フォルダ表示部1340は、フォルダをフォルダ領域にディスプレイする役割をする。情報領域とフォルダ領域は、分離した領域であることが好ましい。
また、保存部1350は、情報領域うちの少なくとも一部をドラッグ可能領域に設定し、フォルダ領域のうちの少なくとも一部をドロップ可能領域に設定して、ユーザーのドラッグアンドドロップ(drag and drop)入力に応じて、特許文献をフォルダに保存する役割をする。
本発明に係る実施形態は、様々な手段、例えば、ハードウェア、ファームウェア(firmware)、ソフトウェアまたはこれらの結合などによって具現されることができる。ハードウェアによる具現の場合、本発明の一実施形態は、1つまたはそれ以上のASICs(application specific integrated circuits)、DSPs(digital signal processors)、DSPDs(digital signal processing devices)、PLDs(programmable logic devices)、FPGAs(field programmable gate arrays)、プロセッサ、コントローラー、マイクロコントローラー、マイクロプロセッサなどによって具現されることができる。
また、ファームウェアやソフトウェアによる具現の場合、本発明の一実施形態は、以上で説明した機能または動作を行うモジュール、手続き、関数などの形態で具現されて、様々なコンピュータ手段によって読み取り可能な記録媒体に記録されることができる。ここで、記録媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。記録媒体に記録されるプログラム命令は、本発明のために特別に設計されて構成されたものであるか、コンピュータソフトウェア当業者に公知となり使用可能なものであり得る。例えば、記録媒体は、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体(Magnetic Media)、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Video Disk)のような光記録媒体(Optical Media)、フロプティカルディスク(Floptical Disk)のような磁気-光媒体(Magneto-Optical Media)、及びロム(ROM)、ラム(RAM)、フラッシュメモリのようなプログラム命令を保存して行うように特別に構成されたハードウェア装置を含む。プログラム命令の例には、コンパイラーによって作られるような機械語コードだけでなく、インタープリターなどを使用して、コンピュータによって実行されることができる高級言語コードを含むことができる。このようなハードウェア装置は、本発明の動作を行うために、1つ以上のソフトウェアによって作動するように構成されることができ、その逆も同様である。
また、本発明に係る装置や端末は、1つ以上のプロセッサによって、前述した機能とプロセスを行うようにする命令によって駆動されることができる。例えば、この命令としては、例えば、JavaScriptやECMAScript命令などのスクリプト命令のような解釈される命令や実行可能なコードあるいはコンピュータで読み取り可能な媒体に保存されるその他の命令が含まれることができる。さらに、本発明に係る装置は、サーバーファーム(Server Farm)のように、ネットワークにわたって分散型で具現されることができ、あるいは単一のコンピュータ装置で具現されることもできる。
また、本発明に係る装置に搭載され、本発明に係る方法を実行するコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプトあるいはコードとしても知られている)は、コンパイルされたか、解釈された言語や先験的または手続き的言語を含むプログラミング言語のいかなる形態にも作成されることができ、独立型プログラムやモジュール、コンポーネント、サブルーチン、またはコンピュータ環境で使用に適した他のユニットを含んでいかなる形態にも展開されることができる。コンピュータプログラムは、ファイルシステムのファイルに必ずしも対応するものではない。プログラムは、要請されたプログラムに提供される単一のファイル内に、または多重の相互作用するファイル(例えば、1つ以上のモジュール、下位プログラムまたはコードの一部を保存するファイル)内に、または、他のプログラムやデータを保有するファイルの一部(例えば、マークアップ言語文書内に保存される1つ以上のスクリプト)内に保存されることができる。コンピュータプログラムは、1つのサイトに位置するか、複数のサイトにわたって分散して通信ネットワークによって相互接続された多重コンピュータや1つのコンピュータ上で実行されるように展開されることができる。
説明の便宜のために、各図面を分けて説明したが、各図面に記述されている実施形態を併合して、新しい実施形態を具現するように設計することも可能である。また、本発明は、前述したように、説明された実施形態の構成と方法が限定されて適用されるものではなく、前述した実施形態は、様々な変形が可能となるように各実施形態の全部または一部が選択的に組み合わされて構成され得る。
また、以上では、好ましい実施形態について図示して説明したが、本明細書は、前述した特定の実施形態に限定されず、請求の範囲で請求する要旨を逸脱することなく、当該明細書の属する技術分野における通常の知識を有する者によって様々な変形実施が可能であることはもちろんであり、このような変形実施などは、本明細書の技術的思想や展望から個別的に理解されてはならないであろう。
110 スライドビュー
120 実行ボタンタブ
130 特許文献数
140 特許文献リスト
210 ハイライトウィンドウ
220 プロジェクトウィンドウ
230 代表図面ウィンドウ
240 特許リストウィンドウ
250 特許文献代表内容ウィンドウ
450 アイコン
410 プロジェクトウィンドウ
420 フォルダ
430 ドラッグアンドドロップ入力
440 設定UI
510 フォルダ
520 設定UI
610 代表情報
710 保存ボタン
720 タッチ/選択
730 選択UI
810 分類履歴ウィンドウ
820 実行取り消しアイコン
910 フォルダアイコン
920 リスト情報(A及びBフォルダ)
1110 特許消滅推奨リスト
1120 評価指数
1200 ウェブサーバー
1210 プロセッサ
1220 メモリユニット
1230 通信ユニット
1240 プロセッサ
1250 センサーユニット
1260 通信ユニット
1270 ディスプレイユニット
1300 クライアント機器

Claims (23)

  1. ユーザー分類入力に基づいた特許文献の分類方法において、
    特許データベースに保存されている特許文献を機械学習(Machine learning)技術で学習し、前記特許文献間の類似度に基づいて第1分類基準を確立し、前記第1分類基準に基づいて前記特許文献を分類する基本分類モデルを生成する段階と、
    ユーザーの検索及び/または選択入力に基づいて、複数の特許文献が含まれた特許プール(Pool)を生成する段階と、
    前記ユーザーの分類入力を受信し、前記分類入力に応じて前記特許プールに含まれている複数の特許文献を分類する段階と、
    前記分類された特許文献間の類似度に基づいて、前記ユーザーが前記複数の特許文献を分類する第2分類基準を予測する段階、及び
    前記基本分類モデル及び前記第2分類基準に基づいて、前記特許プールでまだ分類されていない残りの特許文献を分類する段階を含む特許文献の分類方法。
  2. 前記基本分類モデル及び前記第2分類基準に基づいて、前記残りの特許文献を分類する段階は、
    前記第2分類基準を前記基本分類モデルに結合して、ユーザーカスタマイズ型分類モデルを構築する段階、及び
    前記ユーザーカスタマイズ型分類モデルを用いて、前記特許プールでまだ分類されていない残りの特許文献を分類する段階を含む請求項1に記載の特許文献の分類方法。
  3. 前記特許文献間の類似度は、
    各特許文献のファミリー特許文献、特許分類コード、先行特許文献、引用特許文献、被引用特許文献、キーワード及び/またはテキストデータなどに基づいて判断される請求項2に記載の特許文献の分類方法。
  4. 前記機械学習技術は、RNNs(Recurrent Neural Networks)、DNNs(Deep Neural Networks)及び/またはCNNs(Convolutional Neural Networks)技術を含む請求項2に記載の特許文献の分類方法。
  5. 前記複数の特許文献を分類する段階は、
    少なくとも1つのフォルダを生成する段階、及び
    前記複数の特許文献のうちの少なくとも1つの特許文献が前記ユーザーの分類入力に応じて前記少なくとも1つのフォルダに保存されることによって分類される段階を含み、
    前記ユーザーの分類入力は、前記少なくとも1つの特許文献を前記フォルダにドラッグアンドドロップ(drag and drop)する入力である請求項2に記載の特許文献の分類方法。
  6. 前記残りの特許文献に対する自動分類を指示するための入力ボタンを出力する段階をさらに含み、
    前記入力ボタンに対する前記ユーザーの入力を受信した場合、前記ユーザーカスタマイズ型分類モデルを用いて、前記残りの特許文献を分類する段階を行う請求項5に記載の特許文献の分類方法。
  7. 前記残りの特許文献を分類する段階は、
    前記ユーザーカスタマイズ型分類モデルを用いて、前記残りの特許文献を分類し、前記少なくとも1つのフォルダに自動保存する段階を含む請求項6に記載の特許文献の分類方法。
  8. 前記自動分類の第1正確度をリアルタイムで導出し、前記第1正確度をリアルタイムで表示するインジケーターを出力する段階をさらに含み、
    前記第1正確度は、前記第2分類基準による分類の数及び/または前記ユーザーによって現在まで分類完了した前記分類別特許文献の数に基づいて算出される請求項2に記載の特許文献の分類方法。
  9. 前記第1分類基準に分類された特許文献の出願日または登録日から消滅日までの第1平均期間を分類別に算出する段階と、
    前記特許プールに含まれている複数の文献を前記第1または第2分類基準によって分類し、前記複数の特許文献の出願日または登録日から消滅日までの第2平均期間を分類別に算出する段階、及び
    前記第1及び第2平均期間を考慮して、特定の特許文献の消滅期間を予測する段階をさらに含む請求項8に記載の特許文献の分類方法。
  10. 前記特許プールに含まれている複数の文献は、前記ユーザーが保有中であるか、保有していたが現在は消滅した特許を含む請求項9に記載の特許文献の分類方法。
  11. 前記特定の特許文献の消滅期間を予測する段階は、
    前記特定の特許文献を前記第1及び/または第2分類基準によって分類する段階、及び
    前記特定の特許文献の前記第1及び/または第2分類基準による分類によって前記第1及び/または第2平均期間を既に設定された比率で結合して、前記特定の特許文献の消滅期間を算出する段階を含む請求項10に記載の特許文献の分類方法。
  12. 前記特定の特許文献は、前記ユーザーが現在保有中でありながら消滅していない特許及び/または前記ユーザーの入力に応じて特定された特許文献に該当する請求項11に記載の特許文献の分類方法。
  13. 前記特定の特許文献に対して予測された消滅期間を評価指数としてリストアップして出力する段階をさらに含む請求項12に記載の特許文献の分類方法。
  14. 前記特許文献を機械学習技術で学習する段階は、
    前記特許文献を翻訳エンジンを用いて1つの言語に翻訳し、統一された1つの言語で学習する段階を含む請求項2に記載の特許文献の分類方法。
  15. 前記少なくとも1つのフォルダが生成されている場合、
    前記ユーザーが各特許文献別に前記少なくとも1つのフォルダにすぐ保存して分類することができるようにするための今すぐ保存ボタンを出力する段階をさらに含み、
    前記ユーザーの分類入力は、前記今すぐ保存ボタンに対する入力である請求項5に記載の特許文献の分類方法。
  16. 前記基本分類モデルの学習によって、分類対象特許文献の総個数(第1因子)、分類個数(第2因子)及び/または前記分類別含まれた特許文献の個数(第3因子)による第2正確度があらかじめ算出されている場合、
    前記第1正確度は、
    前記ユーザーが前記特許プール内に含ませた前記複数の特許文献の個数、前記第2分類基準による分類の個数、及び/または前記分類別含まれた特許文献の個数を前記第1、第2及び/または第3因子に順次的に適用したとき、あらかじめ算出されている前記第2正確度に該当する請求項8に記載の特許文献の分類方法。
  17. 前記インジケーターを出力する段階は、
    前記第1正確度を前記フォルダ別及び/または前記特許プール別に算出し、前記インジケーターを前記フォルダ別に出力する段階を含む請求項16に記載の特許文献の分類方法。
  18. 前記基本分類モデルで最大正確度が導出されるための前記第1~第3因子が決められている場合、前記第1正確度が前記最大正確度よりも低い場合、前記ユーザーに追加分類をガイドするためのポップアップウインドウを出力する段階をさらに含む請求項17に記載の特許文献の分類方法。
  19. 前記ユーザーカスタマイズ型分類モデルは、転移学習(Transfer Learning)技法に基づいて構築される請求項2に記載の特許文献の分類方法。
  20. 前記ユーザーカスタマイズ型分類モデルは、
    前記転移学習(Transfer Learning)技法によって、前記基本分類モデルをconvolutional baseとして固定した後、前記第2分類基準をclassiferとして新しく学習して前記ユーザーカスタマイズ型分類モデルを構築する請求項19に記載の特許文献の分類方法。
  21. 前記フォルダ別ユーザー等級設定及び/またはキーワード設定のための設定UI(User Interface)を出力する段階をさらに含む請求項5に記載の特許文献の分類方法。
  22. 前記第2分類基準を予測する段階は、
    前記分類された特許文献間の技術的距離を前記基本分類モデルに基づいて算出し、前記技術的距離に基盤として前記第2分類基準を予測する段階を含み、
    前記残りの特許文献を分類する段階は、
    前記基本分類モデルに基づいて予測された前記第2分類基準に基づいて、前記残りの特許文献を分類する段階を含む請求項1に記載の特許文献の分類方法。
  23. ユーザー分類入力に基づいて特許文献を分類するウェブサーバーにおいて、
    データを保存する、メモリユニット、
    少なくとも1つの通信プロトコルを用いて通信を行う、通信ユニット、及び
    前記メモリユニット及び前記通信ユニットを制御する、プロセッサを含み、
    前記プロセッサは、
    特許データベースに保存されている特許文献を機械学習(Machine learning)技術で学習し、前記特許文献間の類似度に基づいて第1分類基準を確立し、前記第1分類基準に基づいて前記特許文献を分類する基本分類モデルを生成し、
    ユーザーの検索及び/または選択入力に基づいて、複数の特許文献が含まれた特許プール(Pool)を生成し、
    前記ユーザーの分類入力を受信し、前記分類入力に応じて前記特許プールに含まれている複数の特許文献を分類し、
    前記分類された特許文献間の類似度に基づいて、前記ユーザーが前記複数の特許文献を分類する第2分類基準を予測し、
    前記基本分類モデル及び前記第2分類基準に基づいて、前記特許プールでまだ分類されていない残りの特許文献を分類するウェブサーバー。
JP2021560356A 2019-03-29 2020-03-30 機械学習基盤のユーザーカスタマイズ型の特許文献自動分類方法、装置及びシステム Pending JP2022528273A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20190037299 2019-03-29
KR10-2019-0037300 2019-03-29
KR10-2019-0037299 2019-03-29
KR20190037300 2019-03-29
PCT/KR2020/004341 WO2020204535A1 (ko) 2019-03-29 2020-03-30 머신 러닝 기반의 사용자 맞춤형 특허 문헌 자동 분류 방법, 장치 및 시스템

Publications (1)

Publication Number Publication Date
JP2022528273A true JP2022528273A (ja) 2022-06-09

Family

ID=72666898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021560356A Pending JP2022528273A (ja) 2019-03-29 2020-03-30 機械学習基盤のユーザーカスタマイズ型の特許文献自動分類方法、装置及びシステム

Country Status (5)

Country Link
US (2) US11880400B2 (ja)
JP (1) JP2022528273A (ja)
KR (1) KR20210125588A (ja)
CN (1) CN113711206A (ja)
WO (1) WO2020204535A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7444930B2 (ja) 2022-07-25 2024-03-06 デロイトトーマツコンサルティング合同会社 指標算出装置、指標算出方法及びプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11809454B2 (en) * 2020-11-21 2023-11-07 International Business Machines Corporation Label-based document classification using artificial intelligence
US20220398273A1 (en) * 2021-06-11 2022-12-15 UnitedLex Corp. Software-aided consistent analysis of documents
KR20230081294A (ko) * 2021-11-30 2023-06-07 엘지이노텍 주식회사 신경망의 학습 방법, 인공지능 장치 및 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램
CN115563941B (zh) * 2022-09-29 2024-02-13 壹沓科技(上海)有限公司 复合文档处理方法、装置、存储介质及计算机设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3669016B2 (ja) * 1994-09-30 2005-07-06 株式会社日立製作所 文書情報分類装置
US20060248094A1 (en) * 2005-04-28 2006-11-02 Microsoft Corporation Analysis and comparison of portfolios by citation
KR20120058417A (ko) * 2010-11-29 2012-06-07 팔로 알토 리서치 센터 인코포레이티드 문서 유사도 산출의 맞춤화 및 최적화에 기초한 기계 학습 방법 및 시스템
US9235812B2 (en) * 2012-12-04 2016-01-12 Msc Intellectual Properties B.V. System and method for automatic document classification in ediscovery, compliance and legacy information clean-up
CN106682236A (zh) * 2017-01-19 2017-05-17 高域(北京)智能科技研究院有限公司 基于机器学习的专利数据处理方法及其处理系统
KR102023334B1 (ko) * 2017-02-28 2019-09-23 주식회사 워트인텔리전스 특허분류방법 및 시스템
KR102006646B1 (ko) * 2017-04-17 2019-08-02 한국항공대학교산학협력단 특허문서에 대한 ipc 분류 장치 및 방법
KR101983975B1 (ko) * 2017-04-19 2019-05-30 아시아나아이디티 주식회사 문장 분류에 기반하는 문서 자동분류 방법 및 그 장치
WO2020074787A1 (en) * 2018-10-13 2020-04-16 IPRally Technologies Oy Method of searching patent documents
KR20200091508A (ko) * 2018-12-12 2020-07-31 오종학 특허와 논문 데이터를 활용한 국가 및 기업들의 과학 기술력 진단 및 예측 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7444930B2 (ja) 2022-07-25 2024-03-06 デロイトトーマツコンサルティング合同会社 指標算出装置、指標算出方法及びプログラム

Also Published As

Publication number Publication date
CN113711206A (zh) 2021-11-26
KR20210125588A (ko) 2021-10-18
WO2020204535A1 (ko) 2020-10-08
US20240152539A1 (en) 2024-05-09
US20220092101A1 (en) 2022-03-24
US11880400B2 (en) 2024-01-23

Similar Documents

Publication Publication Date Title
JP2022528273A (ja) 機械学習基盤のユーザーカスタマイズ型の特許文献自動分類方法、装置及びシステム
Evermann et al. A deep learning approach for predicting process behaviour at runtime
EP3882814A1 (en) Utilizing machine learning models, position-based extraction, and automated data labeling to process image-based documents
US20170262433A1 (en) Language translation based on search results and user interaction data
CN106250385A (zh) 用于文档的自动化信息抽象处理的系统和方法
US11861514B2 (en) Using machine learning algorithms to prepare training datasets
da Cruz et al. TERL: classification of transposable elements by convolutional neural networks
RU2689818C1 (ru) Способ интерпретации искусственных нейронных сетей
Menshawy Deep Learning By Example: A hands-on guide to implementing advanced machine learning algorithms and neural networks
Ramamoorthy et al. An attentive sequence model for adverse drug event extraction from biomedical text
McCormack et al. Deep learning of individual aesthetics
CN105164672A (zh) 内容分类
Miller Hands-On Machine Learning with IBM Watson: Leverage IBM Watson to implement machine learning techniques and algorithms using Python
US20200174776A1 (en) Methods and systems for automated screen display generation and configuration
CN112424784A (zh) 用于使用神经网络的改进的表标识的系统、方法和计算机可读介质
Baruti Learning Alteryx: A beginner's guide to using Alteryx for self-service analytics and business intelligence
Geldard et al. Practical artificial intelligence with Swift: from fundamental theory to development of AI-driven apps
Doan et al. Algorithm selection using performance and run time behavior
CN115605885A (zh) 基于深度学习的文档拆分器
Saxena Tree-Based Machine Learning Methods in SAS Viya
Khaleel et al. Artificial Intelligence in Computer Science: https://doi. org/10.5281/zenodo. 10937515
US20210240892A1 (en) Tool for designing artificial intelligence systems
Taher Rule mining and prediction using the flek machine–a new machine learning engine
US20230093468A1 (en) Cognitive image searching based on personalized image components of a composite image
US11907885B1 (en) System and method for computational simulation and augmented/virtual reality in a construction environment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240402