JP6555704B1 - 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム - Google Patents

文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム Download PDF

Info

Publication number
JP6555704B1
JP6555704B1 JP2019526021A JP2019526021A JP6555704B1 JP 6555704 B1 JP6555704 B1 JP 6555704B1 JP 2019526021 A JP2019526021 A JP 2019526021A JP 2019526021 A JP2019526021 A JP 2019526021A JP 6555704 B1 JP6555704 B1 JP 6555704B1
Authority
JP
Japan
Prior art keywords
document information
information
input
unit
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019526021A
Other languages
English (en)
Other versions
JPWO2020208693A1 (ja
Inventor
崇志 三上
崇志 三上
祐貴 安達
祐貴 安達
白坂 一
一 白坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Samurai Inc
Original Assignee
AI Samurai Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Samurai Inc filed Critical AI Samurai Inc
Application granted granted Critical
Publication of JP6555704B1 publication Critical patent/JP6555704B1/ja
Publication of JPWO2020208693A1 publication Critical patent/JPWO2020208693A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

検索の精度を向上させることが可能であって、条件に近い内容の文書情報を検索するために必要な時間を低減し、検索の効率化を実現させることができる。利用者が操作可能な利用者端末から入力された入力情報を利用者端末から取得する情報取得部と、複数の文書情報を記憶する記憶部と、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに記憶部に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出部と、スコアに基づき、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、比較表に対して、利用者による文書情報の自己評価を入力する入力部とを備える。

Description

本発明は、文書情報評価装置および文書情報評価方法並びに文書情報評価プログラムに関するものである。
近年、膨大な文書情報のなかから、条件に近い内容の文書情報を検索するシステムが提案されている(例えば、特許文献1参照。)。特許文献1には、文書情報の各部分を構成するセグメント(構成単位)ごとにキーワードの出現頻度から各文書情報の重みを計算し、その重みに基づいて所定の基準で類似度をスコア化することが記載されている。特許文献1のシステムによれば、文書情報のセグメントごとに類似度をスコア化しているため、文書情報の一部にしか条件に近い内容が記載されない場合であっても確実に検索することができる。
特開2015−203961号公報
しかし、特許文献1のシステムに基づくと、文書情報の一部にしか条件に近い内容が記載されおらず、文書情報の全体としては類似度が低い文献情報が検索される場合が生じ得る。利用者が意図しない文献情報が検索された場合、検索条件に用いるキーワード、文節、文章等の選定を最初からやり直す必要が生じる。そして、条件に近い内容の文書情報が検索されるまで、検索条件の選定を何回も繰り返すことになる。これには多大な時間を要し、利用者にとっての負担が非常に大きい。
本発明の目的は、上記の課題に鑑み、検索の精度を向上させることが可能であって、条件に近い内容の文書情報を検索するために必要な時間の低減および効率化が可能な文書情報評価装置および文書情報評価方法並びに文書情報評価支援プログラムを提供することである。
本発明の一実施形態における文書情報評価装置は、利用者が操作可能な利用者端末から入力された入力情報を利用者端末から取得する情報取得部と、複数の文書情報を記憶する記憶部と、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに記憶部に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出部と、スコアに基づき、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、比較表に対して、利用者による文書情報の自己評価を入力する入力部とを備える、ことを特徴とする。
本発明の一実施形態における文書情報評価装置において、出力部は、入力部により入力された自己評価の結果に応じて、文書情報が良好であることを示す高評価と良好でないことを示す低評価に切り替えて出力する、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価装置において、出力部は、各文書情報を構成単位ごとに、高評価および低評価に切り替えて出力する、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価装置において、出力部は、入力情報の構成単位ごとに、該入力情報と複数の文書情報との差異の程度を比較表に出力することが可能であって、複数の文書情報の出力優先度は、構成単位ごとに算出されるスコアが所定の基準を満たすか否かで決定する、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価装置において、入力情報および複数の文書情報は知的財産に関する情報を含む、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価装置において、算出部は、自己評価を示す自己評価モード自己評価モードの切り替えを反映し、入力情報に対する文書情報の一致度ぐあいを再算出する、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価装置において、比較表に出力された複数の文書情報のうち、利用者が希望する所望の少なくとも一の文書情報をメイン文書情報として固定する文書情報固定部を、さらに備え、算出部は、文書情報固定部にて固定したメイン文書情報に基づき、入力情報に対する文書情報の一致度ぐあいを再算出する、ことを特徴としてもよい。
本発明の一実施形態における文書情報評価方法は、コンピュータが、利用者が操作可能な利用者端末から入力された入力情報を利用者端末から取得する情報取得ステップと、複数の文書情報を記憶する記憶ステップと、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに記憶ステップに記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出ステップと、スコアに基づき、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、比較表に対して、利用者による文書情報の自己評価を入力する入力ステップとを実行する、ことを特徴とする。
本発明の一実施形態における文書情報評価プログラムは、コンピュータに、利用者が操作可能な利用者端末から入力された入力情報を利用者端末から取得する情報取得機能と、複数の文書情報を記憶する記憶機能と、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに記憶機能に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出機能と、スコアに基づき、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、比較表に対して、利用者による文書情報の自己評価を入力する入力機能とを実行させる、ことを特徴とする。
本発明によれば、検索の精度を向上させることが可能であって、条件に近い内容の文書情報を検索するために必要な時間を低減し、検索の効率化を実現させることができる文書情報評価装置および文書情報評価方法並びに知的財産文書情報評価支援プログラムを提供させることができる。
本発明の一実施形態に係る文書情報評価装置のソフトウェア構成の一例を示すブロック図である。 本発明の一実施形態における情報処理装置1のハードウェア構成の一例を示すブロック図である。 本発明の一実施形態に係る出力画面の例を示す模式図である。 本発明の一実施形態に係る文書情報評価装置の動作例を示すフローチャートである。 本発明の第1の実施形態における、文書情報評価装置1のスコア算出処理の一例を示すフローチャートである。
以下、図面を参照して本発明の一実施形態における情報処理文書情報評価装置、文書情報評価方法及び文書情報評価プログラムについて詳細に説明する。
先ず、図1を用いて、文書情報評価装置1のソフトウェア構成を説明する。図1は、本発明の一実施形態における文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。
文書情報評価装置1は、情報取得部101と、記憶部102と、算出部103と、出力部104と、入力部105の各機能部を有する。本実施形態における文書情報評価装置1の上記各機能部は、文書情報評価装置1を制御する情報処理プログラム(ソフトウェア)によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置1で動作する。すなわち、文書情報評価装置1は、文書情報評価プログラムが動作する装置をいう。
出力部104は、利用者が検索したい内容に関係する入力情報に対し、該入力情報と複数の文書情報との一致度ぐあいをスコアとして算出した結果を比較表100(図3参照)として出力する。その出力結果に基づき、利用者は、比較表100に対して自己評価を入力することができる。これによって、文書情報評価装置1は、検索の精度を向上させることが可能であって、利用者が希望する条件に近い内容の文書情報を検索する場合に、検索に要する時間を低減させることができ、検索の効率化を実現することができる。
文書情報評価装置1は、ネットワーク(NW)を介して利用者端末2と接続し、該利用者端末2に対して文書情報評価システムのサービスを提供するための装置である。文書情報評価装置1は、例えば、いわゆるサーバ装置やコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)である。なお、本発明の一実施形態において、文書情報評価装置1は、これらに限定されない。
情報取得部101は、利用者端末2から入力されたこれら知的財産に関する情報を、利用者端末2から取得する。利用者端末2は、利用者が操作可能な端末装置であって、例えば、デスクトップPC、ノートPC、タブレットPCまたはスマートフォン等である。本実施形態では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。
ここで、知的財産とは、人間の知的活動によって生み出されたアイデアや創作物等である。知的財産は、例えば、発明、考案、意匠、商標、著作物、回路配置または植物の新品種である。また、知的財産は、例えば、知的財産の内容を説明するための文書、知的財産の内容を説明するための図、表、グラフ、スケッチもしくは写真(図等)、または図等を説明する文書等であってもよい。本実施形態における知的財産に関する情報とは、上述した利用者が検索したい内容を抽出するための情報である。知的財産に関する情報は、権利取得された情報のみならず、権利取得前の公開情報、未公開情報、出願前の発明情報を含む。権利取得された情報とは、例えば、特許権、実用新案権、意匠権、商標権、著作権、回路配置利用権または育成者権等が成立している情報である。例えば、知的財産が発明である場合、入力情報および文書情報は、発明の内容を示す文章(特許請求の範囲の記載、発明の課題または発明の目的等)または図面等の情報である。また、知的財産が意匠である場合、入力情報および文書情報は、形状、模様若しくは色彩又はこれらの結合に係る図面等の情報である。また、知的財産が商標である場合、入力情報および文書情報は、商品またはサービスの識別標識である。
記憶部102は、文書情報を保持する。文書情報は、NWを介して送受信される様々なデータを含み、例えば、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍(雑誌、週刊誌を含む)、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、文章情報は、数式データ、図表データ、写真データ及び画像データ(静止画像、動画像を含む)を含む。
なお、知的財産に関する情報には、上述したように権利取得前の情報を含んでいてもよい。権利取得前の情報とは、例えば、発明や意匠を創作するまでの過程を記憶した情報、実験のために準備した材料もしくは装置、実験結果、研究開発の表題、研究開発の目的、技術者の氏名、技術者の所属名、プロジェクト番号等の付随的な情報である。付随的な情報には、取得された知的財産に関する情報に対するアクセス権限の情報を含んでいてもよい。アクセス権限とは、情報に対する閲覧、編集、削除、認証処理等の処理を実行できる権限であり、例えば、知的財産に関する情報を記憶した技術者に対しては、全ての処理を実行できるアクセス権限を付与し、知的財産の創作に共同した技術者には、閲覧の処理を実行できるアクセス権限を付与し、または、知的財産に関する情報を認証する認証者(後述)には認証処理を実行できるアクセス権限を付与する。情報取得部101は、知的財産に関する情報として、これらの付随的な情報を取得するようにしてもよい。利用者が入力したこれら知的財産に関する情報を、利用者端末2から取得する。
また、以下の説明においては、知的財産が発明である場合を例示するが、知的財産は発明に限定されるものではない。すなわち、知的財産の創作には、商標における識別標識の選択等を含んでいてもよい。
算出部103は、記憶部102において記憶された文書情報に基づき、利用者端末2から入力された入力情報に対する一致度ぐあいを算出する。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部102に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。算出部103は、構成要件を認定すると、出力部104により類似情報を取得し、構成要件と類似情報の近似の程度を算出する。構成要件のキーワードと同一または、そのキーワードよりも類似情報のキーワードが下位概念であれば一致度ぐあいは高いと判断してもよい。算出部103は、記憶部102に、予め記憶された、単語のコーパス辞書により、その辞書により下位概念または上位概念の有無を算出できる。
算出部103は、構成要件と類似情報の一致度ぐあいをスコア算出し、一致するか否かを閾値処理により判定し、構成要件の一致点および相違点を算出する。閾値は予め定められていてもよいし、機械学習により算出されたスコアをもちいてもよい。
また、算出部103は、具体的には、一致度ぐあいをスコア算出するよう、記憶部102に記憶された知的財産に関する情報を用いて機械学習させたモデルを用いて、利用者端末2から受け付けた知的財産に関する情報に対する入力情報との内容の一致度ぐあいをスコア算出することができる。これにより、文書情報評価装置1は、知的財産に関する情報(例えば、過去の特許情報)に基づいた一致度ぐあいのスコア算出を、より素早く正確かつ容易に行うことができる。
機械学習において用いられる知的財産に関する情報は、該知的財産に関する情報について項目ごとに予め数値化された上で処理されており、利用者端末2から入力された知的財産に関する入力情報も、同様に数値化した上で一致度ぐあいのスコア算出が行われる。
予め数値化される知的財産に関する情報に関する項目とは、例えば、知的財産に関する公開公報に紐づく各種情報であってもよい。知的財産に関する公開公報に紐づく各種情報は、例えば、公開公報の発行日、該公開公報に係る出願書類の提出日(すなわち出願日)、該公開公報に係る出願において受領した拒絶理由通知書の回数、該拒絶理由通知書における内容、該拒絶理由通知書に対する応答の内容、該公開公報に係る出願において行われた補正の回数、該補正の内容、独立請求項の文字数、請求項の数などであってもよい。
算出部103は、一致度ぐあいのスコア算出のため、過去に文書情報評価装置1を使用して一致度ぐあいをスコア算出した知的財産に関する情報の実際の結果をフィードバックとして記憶部102が格納することによって、機械学習に使用することができる。これにより、文書情報評価装置1は、より精度の高い類似する先行技術文献の抽出を行うことができる。
算出部103は、利用者が利用者端末2から入力した知的財産に関する入力情報に対して一致度ぐあいのスコア算出を行った結果、相違点が高い(一致点が低い)場合、新たなキーワードを抽出し、構成要件ごとの一致度ぐあいを改めてスコア算出してもよい。例えば、算出部103は、利用者端末2から入力された知的財産に関する情報において使用されるキーワードに代えて又は加えて抽出した新たなキーワードを使用した場合について一致度ぐあいを改めて、スコア算出することができる。このとき、算出部103は、一致度ぐあいのスコアが高くなるまで、キーワードの抽出を繰り返すことができる。一致度ぐあいのスコアが高く算出された場合、このとき抽出したキーワードを出力部104より利用者端末2に出力することができる。キーワードの抽出は、記憶部102において記憶されている知的財産に関する文書情報からランダムに抽出してもよく、利用者端末2から入力された知的財産に関する入力情報から抽出するようにしてもよく、オズボーンのチェックリスト等を使用してキーワードの抽出の方法を予め定めておき、該方法に基づいて抽出してもよい。これにより、文書情報評価装置1は、利用者端末2から入力された知的財産に関する情報に対する一致度ぐあいのスコア算出だけでなく、該知的財産に関する情報に関してどうすれば一致度ぐあいが高くなるかの情報を利用者に提示することが可能となり、利用者が希望する内容を精度よく検索することができる。
キーワードとは、文章、語句、熟語、単語、記号、アルファベット、化学式、又は数字などである。
また、算出部103は、利用者端末2から入力された知的財産に関する情報に対して一致度ぐあいのスコア算出を行った結果、一致点が高い(相違点が低い)場合、記憶部102において記憶されている知的財産に関する文書情報からキーワードを抽出することができ、このとき、利用者端末2から入力された知的財産に関する入力情報において使用されるキーワードに代えて又は加えて抽出したキーワードを使用した場合の一致度ぐあいのスコアが高くなる分布のうち端に位置するようなキーワードを抽出することとしてもよい。キーワードの抽出の際、利用者端末2から受け付けた知的財産に関する情報において使用されるキーワードに代えて又は加えて該抽出したキーワードを使用した場合の一致度ぐあいのスコアが高くなる分布のうち、中央ではなく端に位置するようなキーワードを抽出することによって、文書情報評価装置1は、抽出するキーワードによる知的財産に関する情報についての限定に際し、より一致度ぐあいのスコアを低くすることが可能なキーワードを提示することができる。例えば、知的財産に関する情報が特許出願予定の発明の場合、文書情報評価装置1は、該発明に対し、権利取得可能性を肯定的にしつつ、該発明の限定がより少ないものとなるようにすることが可能なキーワードを抽出することができる。
算出部103は、具体的には、学習データ及び権利取得可能性の情報に基づいて、知的財産に関する情報に付加すべき新たなキーワードを、知的財産に関する入力情報から算出し、出力部104は、新たなキーワードを出力することができる。これにより、文書情報評価装置1は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報として、新たなキーワードを含めた発明の提案をすることができる。
また、算出部103は、相違性が認められた場合、その相違点の高い(一致点の低い)構成要件に対して、出力部104を介して、新たな類似特許を取得することとしてもよい。具体的には、算出部103は、一致点が低いと判断をし、出力部104に対して新たな類似情報を出力するように指令をし、出力部104は一致点の低い構成単位を埋めるための新たな類似情報を取得してもよい。算出部103による一致度ぐあいの算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。
出力部104は、文書情報の評価結果を利用者端末2に出力する。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報(以下、「類似情報」という)との差異の程度を対比(比較)した比較表である。ただし、文書情報の評価結果は、比較表に限定されない。例えば、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献であって、比較表100(図3参照)は、技術的な差異を示したいわゆるクレームチャートである。
入力部105には、利用者の自己評価を示す自己評価モードが入力される。利用者は利用者の自己評価を示す自己評価モードの選択をすることができる。自己評価モードは、自己評価モード切り替えスイッチ115(図3参照)により選択できるように構成されている。出力部104は、比較表100に対し、自己評価モード切り替えスイッチ115を表示出力する。詳細は、後述する。
以上説明した、文書情報評価装置1が有する、情報取得部101、記憶部102、算出部103、出力部104、入力部105の各機能部は、文書情報評価装置1の機能の一例を示したものであり、文書情報評価装置1が有する機能を限定したものではない。例えば、文書情報評価装置1は、上記全ての機能を有している必要はなく、一部の機能を有するものであってもよい。また、文書情報評価装置1は、上記以外の他の機能を有していてもよい。例えば、文書情報評価装置1は、機能の設定を行うための入力機能や、装置の稼働状態をLEDランプ等により報知する出力機能を有していてもよい。
また、文書情報評価装置1が有する上記各機能部は、上述の通り、ソフトウェアによって実現されるものとして説明した。しかし、文書情報評価装置1が有する上記機能部の中で少なくとも1つ以上の機能部は、ハードウェアによって実現されるものであってもよい。
また、文書情報評価装置1が有する上記何れかの機能部は、1つの機能部を複数の機能部に分割して実施してもよい。また、文書情報評価装置1が有する上記何れか2つ以上の機能部を1つの機能に集約して実施してもよい。すなわち、図1は、文書情報評価装置1が有する機能を機能ブロックで表現したものであり、例えば、各機能部がそれぞれ別個のプログラムファイル等で構成されていることを示すものではない。
また、文書情報評価装置1は、1つの筐体によって実現される装置であっても、ネットワーク等を介して接続された複数の装置から実現されるシステムであってもよい。例えば、文書情報評価装置1は、その機能の一部または全部をクラウドコンピューティングシステムによって提供されるクラウドサービス等、仮想的な装置によって実現するものであってもよい。すなわち、文書情報評価装置1は、上記各機能部のうち、少なくとも1以上の機能部を他の装置において実現するようにしてもよい。また、文書情報評価装置1は、サーバ装置等の汎用的なコンピュータであってもよく、機能が限定された専用の装置であってもよい。
次に、図2を用いて、文書情報評価装置1のハードウェア構成を説明する。図2は、本発明の一実施形態における文書情報評価装置1のハードウェア構成の一例を示すブロック図である。
文書情報評価装置1は、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、タッチパネル14および通信I/F(Interface)15を有する。文書情報評価装置1は、図1で説明した情報処理プログラムを実行する装置である。
CPU11は、RAM12またはROM13に記憶された情報処理プログラムを実行することにより、文書情報評価装置1の制御を行う。文書情報評価プログラムは、例えば、文書情報評価プログラムを記憶した記憶媒体、または、ネットワークを介したプログラム配信サーバ等から取得されて、ROM13にインストールされ、CPU11から読出されて実行される。
タッチパネル14は、操作入力機能と表示機能(操作表示機能)を有する。タッチパネル14は、文書情報評価装置1の利用者に対して指先又はタッチペン等を用いた操作入力を可能にする。本実施形態における文書情報評価装置1は操作表示機能を有するタッチパネル14を用いる場合を説明するが、文書情報評価装置1は、表示機能を有する表示装置と操作入力機能を有する操作入力装置とを別個有するものであってもよい。その場合、タッチパネル14の表示画面は表示装置の表示画面、タッチパネル14の操作は操作入力装置の操作として実施することができる。なお、タッチパネル14は、ヘッドマウント型、メガネ型、腕時計型のディスプレイ等の種々の形態によって実現されてもよい。
通信I/F15は、通信用のI/Fである。通信I/F15は、例えば、無線LAN、有線LAN、または赤外線等の近距離無線通信等を実行する。通信I/F15は、例えば、NWを介して利用者端末2との通信を実現する。通信I/F15は、他の文書情報評価装置1との通信を実現するものであってもよい。なお、図2において通信用のI/Fは通信I/F15のみを図示するが、文書情報評価装置1は複数の通信方式においてそれぞれの通信用のI/Fを有するものであってもよい。
次に、図3を用いて、文書情報評価装置1の出力画面の出力例を説明する。図3は、本発明の一実施形態に係る出力画面の例を示す模式図である。
入力部105には、利用者の自己評価を示す自己評価モードが入力される。比較表100に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ115を押すことにより、自己評価指令信号が入力部105に入力される。出力部104は、比較表100に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ115を表示出力する。この自己評価モード切り替えスイッチ115に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部105に入力される。自己評価モード切り替えスイッチ115をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部104は、比較表100に対し自己評価を出力することができる。
より詳細には、出力部104は、自己評価モード切り替えスイッチ115を比較表100に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ115を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部104は、自己評価モード切り替えスイッチ115の選択操作に基づき、例えば、模式的に図案化した図形(画像)を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ115を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部105が受け付ける。
利用者は、マウスにより、自己評価モード切り替えスイッチ115をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部105からの自己評価指令信号に基づき、出力部104は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ115は、例えば、ボタン、アイコン等であってもよい。
図3に示すように、高評価モードとは、例えば、利用者の評価に対して「いいね!」といった評価が高いことを示す「いいね!」機能115aと、「よくないね!」といった評価が低いことを示す「ダメだね!」機能115bとを切り替えて出力することができる。出力部104は、「いいね!」機能115aと「ダメだね!」機能115bの表示態様を変更して出力することができる。視覚的に分かるように、例えば、「いいね!」機能115aの表示態様は、肯定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を上方向に向ける態様の図形を出力することができる。また、表情が笑顔の図形や万歳をしている態様の図形を出力してもよい。その他、「いいね!」機能115aの表示態様は、「○」の図形を出力するように構成してもよい。
また、図3に示すように、「ダメだね!」機能115bの表示態様は、否定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を下方向に向ける態様の図形を出力することができる。また、表情が悲観的な顔の図形や残念モードを表現する首を横に振っている態様の図形を出力してもよい。その他、「ダメだね!」機能115bの表示態様は、「×」の図形を出力するように構成してもよい。
「いいね!」機能115aと「ダメだね!」機能115bの表示態様はスイッチの図形を変更して表示する場合に限定されない。例えば、出力部104は、「いいね!」機能115aと「ダメだね!」機能115bとで、スイッチの色を変更して表示するように構成してもよい。また、上記の自己評価モード(「いいね!」機能115aまたは「ダメだね!」機能115b)の切り替えは、文書情報ごとに行うこともできるし、入力情報の構成単位(Element)ごとに行うこともできる。このように自己評価モードを該構成単位ごとに切り替えることができるため、構成単位の高いスコアと、構成単位の低いスコアを視覚的に一目で把握することができる。
また、出力部104は、新たな類似情報に基づいて、キャラクター3の態様を選択してもよいすることができる。具体的には、自己評価モード(「いいね!」機能115aまたは「ダメだね!」機能115b)の内容によってキャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。例えば、自己評価モードが「いいね!」機能115aの場合は、例えば、「喜」または「楽」の出力態様で表示出力されるように構成してもよい。また、自己評価モードが「ダメだね!」機能115bの場合は、例えば、「怒」または「哀」の出力態様で表示出力されるように構成してもよい。この表示出力は、出力部104が実行する。
以上のように、出力部104は、算出部103により算出された一致度ぐあいのスコア結果に基づいて、キャラクター3の態様を出力制御することができる。算出部103により算出された知的財産に関するデータに基づいて、キャラクター3の態様を出力制御することにより、文書情報評価装置1は、キャラクター3を使用した知的財産に関する情報の表現が可能となり、知的財産法の知識に乏しいユーザ利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
図3に示すように、出力部104は、比較表100に出力される類似特許として複数の文書情報を出力することができる。そして、出力部104は、入力情報と複数の文書情報との差異の程度(一致度ぐあい)を構成単位(Element)ごとに比較表100に出力する。図3では、5件の文書情報を出力する例が示されているが、文書情報の件数は限定されない。5件の文書情報の出力優先度は、構成単位ごとに算出される一致度ぐあいを示すスコアが所定の基準を満たすか否かで決定する。所定の基準は、例えば、各構成単位のスコアを合算した値が高い順に上位5件の文献情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、各構成単位のスコアの平均値が高い順に上位5件の文書情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、複数に分割した全ての構成単位のうち、いくつかの任意の構成単位のスコアの平均値が所定値以上の、上位5件の文献情報を左列から右列に向かって、高い順に出力するように構成してもよい。任意の構成単位の特定は、利用者が利用者端末2から入力された任意の構成単位を取得するように構成してもよい。任意の構成単位の取得は、情報取得部101が実行する。また、任意の構成単位が、記憶部102に予め記憶されていてもよい。
また、左側から見て第2列目に出力される文書情報は、発明の各構成単位の一致度ぐあいのスコアの平均値が一番高い文書情報を主引例として選定してもよい。発明と主引例との一致点と相違点の認定は、発明の各構成単位の一致度ぐあいのスコアが、それぞれ所定値以上であるか否かで判断することとしてもよい。そして、主引例以外の文書情報は、主引例で一致度ぐあいのスコアが低い構成単位について、一致度ぐあいのスコアが高い類似先行技術文献を副引例として選定するように構成してもよい。比較表100には、先行技術文献における主引例と副引例の表示、ならびに主引例に係る構成単位および副引例に係る構成単位の表示を含んでいてもよい。
このように、図3に示すように、比較表100には、発明の構成単位ごとの一致度ぐあいのスコアが表示画面200に出力される。ここで、一致度ぐあいとは、例えば、抽出された発明の特徴量が類似する文書情報(先行技術文献)にどれくらい含まれているかを示す数値(%)であり、数値が高いほど構成単位が先行技術文献に開示されていることを示している。構成単位ごとの一致度ぐあいは、文書情報としての先行技術文献ごとに比較されて比較表100に出力される。この出力は、出力部104が実行する。比較表100の左側から見て第1列目には、分解された発明(入力情報)の構成単位が出力される。5件の文書情報を左側から見て第2列目〜第6列目は、それぞれの先行技術文献に対する一致度ぐあいのスコアが構成単位ごとに出力される。
そして、算出部103により算出された一致度ぐあいのスコアに基づいて、出力部104は、入力情報と文書情報の一致度ぐあいをスコアとして出力をすることができる。スコア結果は、例えば、比較表100とともに出力部104によって表示画面200に出力される。一致度ぐあいのスコアは、例えば、〜〜%(例えば、80%)といった形式で表現することができる。算出部103による一致度ぐあいの算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。
また、出力部104は、新たな類似情報に基づいて、キャラクター3の態様を選択することができ、具体的には、新たな類似情報と構成要件のスコアの高低によってキャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。
以上のように、出力部104は、算出部103により算出された一致度ぐあいのスコア結果に基づいて、キャラクター3の態様を出力制御することができる。算出部103により算出された知的財産に関するデータに基づいて、キャラクター3の態様を出力制御することにより、文書情報評価装置1は、キャラクター3を使用した知的財産に関する情報の表現が可能となり、知的財産法の知識に乏しいユーザ利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
そして、出力部104は、新たに出力した類似情報に基づいて、キャラクター3の態様を選択することができる。新たな類似情報に基づいて、キャラクター3の態様を新たに選択可能とすることで、文書情報評価装置1は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
そして、出力部104は、具体的には、キャラクター3を介して、算出部103による一致度ぐあいのスコア結果を示すことができる。キャラクター3を介して、算出部103によるスコア結果を示すことで、文書情報評価装置1は、スコア結果を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産の登録の有無に関する情報を理解させることができる。
さらに、算出部103は、利用者により選択された自己評価モードの切り替えを反映し、入力された発明情報に対する類似先行技術文献の一致度ぐあいを再算出することができる。具体的には、出力部104が出力した、入力情報に類似する文書情報(類似先行技術文献)との差異の程度を対比(比較)した比較表において、「いいね!」機能115aと「ダメだね!」機能115bが出力表示された構成単位の重みづけを行い、一致度ぐあいを再算出することができる。
次に、図4を用いて、文書情報評価装置1の動作処理の一例を説明する。図4は、本発明の一実施形態に係る文書情報評価装置1の動作例を示すフローチャートである。
<文書情報評価装置1の動作処理>
図4において、文書情報評価装置1は、利用者端末2からの知的財産に関する情報を取得したか否かを判断する(S11)。知的財産に関する情報を取得したか否かは、情報取得部101が利用者端末2から入力された知的財産に関する情報を取得したか否かで判断することができる。知的財産に関する情報を取得していないと判断した場合(ステップS11:NO)、文書情報評価装置1は、S11の処理を繰り返し、知的財産に関する情報の取得を待機する。
一方、知的財産に関する情報を取得したと判断した場合(S11:YES)、算出部103は、記憶部102において記憶された文書情報に基づき、利用者端末2から入力された入力情報に対する一致度ぐあいを算出する(S12)。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部102に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。
S12の処理を実行した後、スコアの算出結果に基づき、出力部104は、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する(S13)。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報(以下、「類似情報」という)との差異の程度を対比(比較)した比較表である。ただし、文書情報の評価結果は、比較表100に限定されない。例えば、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献であって、比較表100は、技術的な差異を示したいわゆるクレームチャートである。一致度ぐあいのスコアは、例えば、「0%」〜「100%」の数値として算出することができる。
S13の処理を実行した後、入力部105は、比較表に対して、利用者による文書情報の自己評価を入力する(S14)。入力部105には、利用者の自己評価を示す自己評価モードが入力される。比較表100に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ115を押すことにより、自己評価指令信号が入力部105に入力される。出力部104は、比較表100に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ115を表示出力する。この自己評価モード切り替えスイッチ115に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部105に入力される。自己評価モード切り替えスイッチ115をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部104は、比較表100に対し自己評価を出力することができる。より詳細には、出力部104は、自己評価モード切り替えスイッチ115を比較表100に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ115を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部104は、自己評価モード切り替えスイッチ115の選択操作に基づき、例えば、模式的に図案化した図形(画像)を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ115を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部105が受け付ける。自己評価の選択指示を受け付けは、出力部104が行う。
利用者は、マウスにより、自己評価モード切り替えスイッチ115をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部105からの自己評価指令信号に基づき、出力部104は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ115は、例えば、ボタン、アイコン等であってもよい。S14の処理を実行した後、文書情報評価装置1は、図示する動作を終了する。
ここで、一致度ぐあいのスコア算出は、例えば、以下の処理で行うことができる。
図5は、本発明の第1の実施形態における、文書情報評価装置1のスコア算出処理の一例を示すフローチャートである。
<一致度ぐあいのスコア算出処理>
算出部103は、情報取得部101が評価対象を表す入力情報を取得すると、まずkNNグラフを作成する(S101)。kNNグラフは、以下の手順で作成される。まず、情報取得部101が利用者端末2を介して取得した知的財産に関する技術情報に付随する技術情報、先行技術情報としての入力情報、記憶部102に記憶された入力情報に類似する類似技術情報に含まれる文章を全てベクトル化する。ベクトル化は、Word2Vec、Doc2Vec(Paragraph2vec)、LDA(Latent Dirichlet Allocation)またはNTSG(Neural ensor Skip Gram)等の従来技術によって行われてよい。ベクトル化は算出部103が実行する。ベクトルから文章間の距離行列を作成する。各文章を頂点として、それぞれの文字データからそれと距離が短いものk個の文章へと辺を張る。以上の手順により、kNNグラフを作成する。上記にて文章として説明したが、複数の文節の組み合わせ、文節、または単語であってもよい。
続いて、算出部103は、情報取得部101から取得された技術情報としての入力情報に対する出力対象としての類似文書情報を、記憶部102に記憶された入力情報に類似する類似技術情報、および知的財産情報に含まれる文章全てに設定し(S102)、情報取得部101から取得した入力情報(技術情報)に含まれる技術文言をクエリと設定し、出力部104は、該クリエで該出力対象としての類似文書情報を出力する(S103)。ここで、出力はElastic Search(登録商標)等の従来技術によって行われてよい。
出力部104は、出力の結果、最もスコアが高い文章を始点として設定し(S104)、始点を最終出力結果へ追加し(S105)、最終出力結果がn件以上となるまで繰り返す(S106)。n件に満たない場合S107に進み、n件以上となった場合S110へ進む。
最終出力結果がn件に満たない場合、算出部103は、クエリ変換ルールの候補を抽出する(S107)。クエリ変換ルールの候補は、以下の手順で抽出される。まず、作成したkNNグラフに基づき、始点として設定された文章と類似する文章を抽出する。続いて、始点として設定された文章と抽出された類似する文章とにおいて、重要度が高いと認定される単語を抽出する。重要度の認定は、TF−IDF法等の従来技術によって行われてよい。抽出された単語に対し、始点として設定された文章、および、抽出された類似する文章において、隣接する単語を取得する。例えば、抽出された単語が「分散」であって、文章が「分散ファイルシステムにおける分散処理」であった場合の、「ファイル」および「処理」などである。
算出部103は、スコアが高い変換ルールをクエリに適用する(S108)。変換ルールは1つでも複数であってもよく、その数が算出部103によって制御されてもよい。また、変換ルールにより算出される新たなクリエの数は、情報取得部101によって取得した、評価対象を表す技術情報(入力情報)の評価の結果に対する利用者の評価情報に基づき、算出部103によって制御されてもよい。スコアは以下の式によって算出することができる。
Figure 0006555704

式中、始点として設定された文章をA、始点として設定された文章において取得された隣接する単語をw1、抽出された類似する文章をB、抽出された類似する文章において取得された隣接する単語をw2とおき、P(w,X)を文章X中での単語wの出現確率とおく。similarityは、単語の意味的な近さの指標であって、この値が大きいほど2つの単語は意味的に似ていることを意味する。similarityは、PythonのパッケージであるnltkがWordNetのパス長に基づいて算出する値とすることができる。
算出部103は、始点と隣接する文章を次の出力対象に設定し(S109)、S108によって新たに算出されたクエリを用いて、再度出力を行う(S103に戻る)。
最終出力結果がn件以上となった場合、結果を出力する(S110)。このとき、出力部104は、最終出力結果とされる始点となる文章を含む文書情報または文書情報を出力してもよい。
次に、文書情報評価装置1の再算出処理の一例を説明する
<再算出の算出処理>
一致度ぐあいのスコアの再算出は、例えば、以下の手順で行う。(1)まず、適合文書情報および非適合文書情報のベクトル化を行う(以下、それぞれ「適合文書ベクトル」および「非適合文書ベクトル」という)。算出部103は、適合文書ベクトルおよび非適合文書ベクトルを算出する。文書ベクトルの算出は、例えば、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。ここで、適合文書ベクトルとは、「いいね!」機能115aが出力された構成単位の文書情報をベクトル化したものをいう。また、非適合文書ベクトルとは、「ダメだね!」機能115bが出力された構成単位の文書情報をベクトル化したものをいう。
(2)次いで、算出部103は、利用者が操作可能な利用者端末2から入力された入力情報の文書ベクトル(以下、「入力文書ベクトル」という)を算出する。文書ベクトルの算出は、例えば、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
(3)次いで、算出部103は、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みを考慮した重心を算出する。本実施形態において、文書情報評価装置1は、一致度ぐあいのスコアの再算出が可能に構成されている。ここで、該重心とは、検索を行う前の、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みのことをいう。具体的には、2回目の一致度ぐあいのスコアの再算出を行う場合は、該2回目の一致度ぐあいのスコア算出する前の,1回目の一致度ぐあいのスコア算出の際に算出された重みを考慮して、重心を算出する。1回目の一致度ぐあいのスコア算出の場合には、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルについて重みに差はないため、例えば、(入力文書ベクトルの重み、適合文書ベクトルの重み、非適合文書ベクトルの重み)=(1、1、1)として、重心が算出される。
(4)重みおよび重心の算出は、算出部103が実行する。一致度ぐあいのスコアの再算出を行う都度、入力文書ベクトル、合文書ベクトルおよび非適合文書ベクトルの各重みを再計算し直し、重心の再算出が実行され、これに伴い、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの修正処理が行われる。この修正処理は、算出部103が実行する。具体的には、算出部103にて修正処理を実行した入力文書ベクトル、適合文書ベクトル、および(3)にて算出した重心の重心ベクトルの内積を算出する。
(5)算出部103は、(4)にて算出した内積に基づき、再度、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの修正処理(再算出)を実行する。文書ベクトルの修正処理に基づく重みの調整は、例えば、SCDV(Sparse Composite Document Vectors using Soft clustering over distributional reprensentations)で行うことができる。なお、文書ベクトルの算出は、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
(6)次いで、(4)、(5)にて新たに算出した入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みに基づき、算出部103は、入力情報に対する文書情報の一致度ぐあいのスコアの再算出を実行する。
(7)一致度ぐあいの再算出は、例えば、出力部104は、所望の文書情報を出力するまで、何回でも一致度ぐあいのスコアの再算出処理を実行でき、都度、出力結果としての比較表100を表示することができるユーザインタフェースを備える。
(8)利用者が入力情報を入力し、検索ボタン109を押すと、検索結果として比較表100が出力される。比較表には、一致度ぐあいのスコア結果が、構成単位ごとに出力される。一致度ぐあいの再算出の出力は、再算出の都度、検索ボタン109を押すことにより実行される。ユーザインタフェースは、検索ボタン109が短時間に連続押しをすることができるように生成してもよい。
この再算出は、利用者が所望する文献情報が出力するまで、何回でも繰り返すことができる。一致度ぐあいの再算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。これにより、検索の精度を向上させることが可能であって、利用者は、条件に近い内容の文書情報(類似文書情報)を検索するために必要な時間を低減し、検索の効率化を実現させることができる。
<重心の算出方法>
続いて、重心の算出方法について詳細に説明する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定する。(1)まず、適合文書ベクトルに重みを掛ける。適合文書ベクトルが複数ある場合は、それぞれの適合文書ベクトルに対し、該適合文書ベクトルに応じた各重みを掛けて重心を算出する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定されるように重みの算出(調整)が行われ、該重みを考慮して重心の算出が行われる。この重みおよび重心の算出は、算出部103が実行する。
(2)重みの調整は、(1)にて算出した重心の重心ベクトル、および適合文書ベクトル、非適合文書ベクトルに基づいて決定されたパラメータにより算出することができる。パラメータは、下記の式に基づいて算出される。パラメータの算出は、算出部103が実行する。
パラメータ=(非適合文書ベクトルと重心ベクトル間の距離)/(適合文書ベクトルと重心ベクトル間の距離)
(3)(2)にて算出したパラメータを用いて、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの調整を行い、調整した重みに基づいて、各々のベクトルについて、新たなベクトルを算出する。この新たなベクトルの算出は、算出部103が実行する。
ここで、重みの調整は、例えば、SCDV(Sparse Composite Document Vectors using Soft clustering over distributional reprensentations)で行うことができる。なお、文書ベクトルの算出は、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
次に、文書情報評価装置1の文書情報の再算出の方法の別の実施形態について説明する。
図4に示すように、比較表100に出力された複数の文書情報のうち、利用者が入力情報に最も類似すると判断する所望の少なくとも一の文書情報をメイン文書情報として固定することができる。メイン文書情報の固定は、文書情報固定部(図示せず)が実行する。
より詳細には、出力部104は、メイン文書情報の固定を示すメイン文書情報固定スイッチ106の図形(画像)を比較表100に対して出力し、利用者がこのスイッチを選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、文書情報固定部(図示せず)に、メイン文書情報固定指令信号が入力される。利用者は、メイン文書情報固定スイッチ106を操作することによりメイン情報固定モードの選択を行い、メイン文書情報固定指令信号に基づき、利用者からの複数の文書情報の固定指示を受け付けるように構成する。
利用者は、マウスにより、メイン文書情報固定スイッチ106をクリックすることによって、メイン情報固定モードを選択することができる。なお、メイン情報固定モードを選択することができればよく、メイン文書情報固定スイッチ106は、例えば、ボタン、アイコン等であってもよい。
なお、メイン情報固定モードの選択は、利用者が自由に選択可能であり、出力部104が、比較表100に出力した複数の類似文書情報のうち、何れの文書情報をメイン文書情報として選択してもよい。また、メイン文書情報の選択は1件に限らず2件以上の文書情報をメイン文書情報として選択してもよい。
さらに、利用者がメイン文書情報を指定することも可能である。図4に示すように入力ボックス107に利用者が文書情報を入力することにより、メイン文書情報を固定することもできる。この場合に入力できる文書情報も1件に限定されない。利用者は、2件以上の文書情報を入力することが可能である。そして、利用者がメイン文書情報を入力ボックス107に入力し特定スイッチ108を押すことにより、一致度ぐあいの再算出を実行する。ここで、入力ボックス107に入力する文書情報は、例えば、拒絶理由通知書、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献が含まれる。なお、入力ボックス107に入力する文書情報は、先行する特許文献番号に限定されない。入力ボックス107に入力する文書情報は、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍(雑誌、週刊誌を含む)、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、入力ボックス107に入力する文書情報は、数式データ、図表データ、写真データ及び画像データ(静止画像、動画像を含む)を含む。その場合は、入力ボックス107に、例えば、PDF電子データをドロップアンドドロップすることにより、該PDF電子データを取り込むことができる。なお、先行する特許文献のPDF電子データをドロップアンドドロップすることにより取り込むことができる。
ここで、出力部104は、入力情報を分解した複数の構成単位のうち、少なくとも一以上の構成単位を指定して、この指定した構成単位が含まれる複数の文書情報を出力(抽出)することができる。構成単位の指定は、自己評価モード切り替えスイッチ115において、「いいね!」機能115aに切り替えることによって行うことができる。そして、特定の構成単位が含まれる複数の文書情報(類似先行技術文献)について一致度ぐあいをスコア算出し、比較表100に該文書情報を表示出力する。これにより、入力情報に、より類似する先行技術文献を出力することができる。特定の構成単位が含まれる複数の文書情報の算出は、上述した再算出の算出処理と同様の方法により行われる。そして、出力部104が出力した該文書情報のうち、特定の文書情報をメイン文書情報として、利用者がメイン文書情報固定スイッチ106を押すことにより固定することができる。
再算出は、メイン文書情報に基づき、入力文書情報の重みを調整することにより行う。再算出の方法は、上述した自己評価モードに基づく再算出の方法と同様の方法により行われる。
メイン文書情報としては、例えば、各国の特許庁において過去に審査された結果引用された引用情報、参考情報の他、利用者自身が過去に調査した特許文献、書籍、雑誌等の非特許文献であってもよい。
なお、本実施形態に係る文書情報評価装置1は、権利取得の可能性を判定する判定部(図示せず)を備えていてもよい。判定部(図示せず)は、認定した発明と類似する類似先行技術文献を検索し、類似した発明の有無によって、例えば、権利取得の可能性を判定する処理を実行できる。発明が類似するか否かの判断は、例えば、認定された発明の意味(含意)を認識し、含意が類似した引用発明が検索できたか否かで判断することができる。ここで、引用発明は、公開されている特許文献または非特許文献である。特許文献は、例えば、各国特許庁により公開されている特許公報等の文献を利用することができる。また、非特許文献は、学術雑誌、新聞、またはWebサイト等に掲載された文献を利用することができる。特許文献または非特許文献は、例えば、図示しない専用のデータベースに保存しておき、判定部(図示せず)から検索可能にしておくことができる。発明の意味の類似は、例えば、認定された発明に含まれる単語の中からキーワードを抽出し、同義語、類義語または派生語(同義語等)を記憶した図示しないデータベースからキーワードに対する同義語等を検索した上で、同義語等によって構成される文章の意味内容が類似しているか否かで判断することができる。判定部(図示せず)は、文章の類似の度合いを類似度として算出してもよい。判定部(図示せず)は、算出した文章の類似度が小さい場合、権利取得の可能性が高いと判定してもよい。一方、判定部(図示せず)は、算出した文章の類似度が大きい場合、権利取得の可能性が低いと判定してもよい。判定部(図示せず)は、権利取得の可能性の高低に応じて、例えば、「Sランク(可能性が極めて高い)」、「Aランク(可能性が高い)」、「Bランク(可能性あり)」、および「Cランク(可能性が低い)」等、ランクによる判定をしてもよい。また、判定は、SランクからCランクの表示に限定されない。判定は、例えば、可能性が高い順に◎から×の表示であってもよい。
判定部(図示せず)は、各国の特許庁において過去に審査された権利取得の審査結果に基づき、権利取得の可能性を判定することができる。権利取得の審査結果とは、出願に係る発明、引用された引用文献、およびその両者の対比における審査結果(引用文献に基づき拒絶されたか否か)である。判定部(図示せず)は、出願に係る発明と引用された引用文献の文章の類似度を算出し、算出した類似度と審査結果との対比を学習して、権利取得の可能を判定してもよい。判定部(図示せず)は、算出した類似度と過去の審査結果との対比を学習することにより、過去の特許庁における判断を判定基準とすることができるので、権利取得の可能性についての判定精度を向上させることができる。記憶部102に、予め、審査結果が格納されるように構成してもよい。審査結果は、例えば、各国の特許庁が公開している審査情報から取得することができる。判定部(図示せず)は、審査結果に基づき、権利取得の可能を判定してもよい。
出力部104は、算出部103により算出された知的財産に関するデータ、または、類似情報に基づいて、利用者端末2に出力される情報を制御する。具体的には、出力部104は、算出部103により算出された権利取得可能性の情報に基づいて、キャラクター3の態様を出力制御することができる。例えば、出力部104は、上述した権利取得可能性の情報が拒絶すべきと判定部(図示せず)が判定した場合、記憶部102に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示画面200に表示するように出力部104に出力指示をだす。また、出力部104は、上述した権利取得可能性の情報が拒絶すべきと判定部(図示せず)が判定した場合、上記スコアまたは権利取得可能性の情報に基づいて、記憶部102に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示するように出力部104に出力指示をだしてもよい。
また、出力部104は、算出部103により算出されたキーワードを、キャラクター3を介して出力してもよい。算出部103が、記憶部102に記憶された知的財産に関する情報からキーワードを抽出する。具体的には、判定部(図示せず)が、権利取得可能性の情報が拒絶すべきと判定した際、どのような新たなキーワードを付加すれば、権利取得可能性の情報が拒絶すべきではないと判定するかというロジックで、新たなキーワードを算出する。算出部103は、新たなキーワードを無数に列挙してもよいが、煩雑となるため、算出に際しては、同一または類似技術の公報のクレーム記載のキーワードを算出してもよい。
また、判定部(図示せず)は、過去の審査結果を機械学習し、権利取得の可能性を判定してもよい。例えば、審査結果は情報取得部101が取得する。例えば、判定部(図示せず)は、出願に係る発明と引用された引用文献を入力、審査結果を出力とした、入力と出力をデータセットとする機械学習(教師あり学習)を行い、学習したデータセットをモデリングすることにより、権利取得の可能性を判定することができる。データセットは、例えば、国、適用法(法改正を含む)、発明の分野等によってそれぞれ異なるモデルとしてモデリングすることができる。判定部(図示せず)は、それぞれのモデリングにおいて学習された学習結果を用いることにより、権利取得の可能性についての判定精度を向上させることができる。また、判定部(図示せず)は、情報取得部101において取得された新たな審査結果を機械学習していくことにより、特許庁における審査の傾向に変化があった場合においても、その傾向の変化に対応して権利取得の可能性についての判定することができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク(ディープラーニングを含む)、サポートベクターマシン、クラスタリング(例えば、課題、第1実施形態等)、またはベイジアンネットワーク等を用いてもよい
また、上述した本実施形態においては、知的財産が発明である場合について主に説明したが、例えば、一致度ぐあいのスコアおよび類似度において、意匠登録または商標登録について判定するものであってもよい。
なお、本実施形態で説明した装置を構成する機能を実現するためのプログラムを、コンピュータ読み取り可能な記憶媒体に記憶して、当該記憶媒体に記憶されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本実施形態の上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記憶媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記憶媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記憶されているプログラムとの組合せで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、本発明の実施形態について、図面を参照して説明してきたが、具体的な構成はこの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲においての種々の変更も含まれる。
1 文書情報評価装置
2 利用者端末
101 情報取得部
102 記憶部
103 算出部
104 出力部
105 入力部
115 自己評価モード切り替えスイッチ
115a 「いいね!」機能
115b 「ダメだね!」機能
106 固定スイッチ
107 入力ボックス
108 特定スイッチ
109 検索イッチ
100 比較表
200 表示画面
NW ネットワーク
11 CPU
12 RAM
13 ROM
14 タッチパネル
15 通信I/F

Claims (9)

  1. 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得部と、
    複数の文書情報を記憶する記憶部と、
    前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶部に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出部と、
    前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力部と、
    前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力部とを備える、
    文書情報評価装置。
  2. 前記出力部は、
    前記入力部により入力された自己評価の結果に応じて、前記文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力する、
    ことを特徴とする請求項1に記載の文書情報評価装置。
  3. 前記出力部は、
    各文書情報を前記構成単位ごとに、前記高評価モードおよび前記低評価モードに切り替えて出力する、
    ことを特徴とする請求項2に記載の文書情報評価装置。
  4. 前記出力部は、
    前記入力情報の構成単位ごとに、該入力情報と複数の前記文書情報との差異の程度を前記比較表に出力することが可能であって、
    複数の前記文書情報の出力優先度は、前記構成単位ごとに算出される前記スコアが所定の基準を満たすか否かで決定する、
    ことを特徴とする請求項1乃至3のいずれか一項に記載の文書情報評価装置。
  5. 前記入力情報および複数の前記文書情報は知的財産に関する情報を含む、
    ことを特徴とする請求項1乃至4のいずれか一項に記載の文書情報評価装置。
  6. 前記算出部は、
    前記自己評価を示す自己評価モードの切り替えを反映し、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
    ことを特徴とする請求項5に記載の文書情報評価装置。
  7. 前記比較表に出力された前記複数の文書情報のうち、前記利用者が希望する所望の少なくとも一の文書情報をメイン文書情報として固定する文書情報固定部を、さらに備え、
    前記算出部は、
    前記文書情報固定部にて固定した前記メイン文書情報に基づき、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
    ことを特徴とする請求項5または6に記載の文書情報評価装置。
  8. コンピュータが、
    利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得ステップと、
    複数の文書情報を記憶する記憶ステップと、
    前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶ステップに記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出ステップと、
    前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力ステップと、
    前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力ステップとを実行する
    文書情報評価方法。
  9. コンピュータに、
    利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得機能と、
    複数の文書情報を記憶する記憶機能と、
    前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶機能に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出機能と、
    前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力機能と、
    前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力機能とを実行させる、
    文書情報評価プログラム。
JP2019526021A 2019-04-08 2019-04-08 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム Active JP6555704B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/015368 WO2020208693A1 (ja) 2019-04-08 2019-04-08 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019124068A Division JP2020173759A (ja) 2019-07-02 2019-07-02 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Publications (2)

Publication Number Publication Date
JP6555704B1 true JP6555704B1 (ja) 2019-08-07
JPWO2020208693A1 JPWO2020208693A1 (ja) 2021-04-30

Family

ID=67539790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019526021A Active JP6555704B1 (ja) 2019-04-08 2019-04-08 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Country Status (5)

Country Link
US (1) US11023721B2 (ja)
EP (1) EP3955125A4 (ja)
JP (1) JP6555704B1 (ja)
CN (1) CN112352229A (ja)
WO (1) WO2020208693A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021152809A1 (ja) * 2020-01-30 2021-08-05 株式会社 AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11263646B1 (en) * 2014-03-31 2022-03-01 Groupon, Inc. Systems, apparatus, and methods of programmatically determining unique contacts
JPWO2021009886A1 (ja) * 2019-07-17 2021-01-21
JP6983368B1 (ja) * 2021-02-10 2021-12-17 三菱電機株式会社 画面データ作成プログラム、画面データ作成装置および画面データ作成方法
JP7421740B1 (ja) 2023-09-12 2024-01-25 Patentfield株式会社 分析プログラム、情報処理装置、および分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JP2001117937A (ja) * 1999-10-20 2001-04-27 Hitachi Ltd 文書検索方法および装置
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009294993A (ja) * 2008-06-06 2009-12-17 Konica Minolta Holdings Inc 関連文書抽出方法、関連文書抽出システム、及び関連文書抽出プログラム
JP2017138931A (ja) * 2016-02-05 2017-08-10 雲拓科技有限公司 特許検索方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4038717B2 (ja) * 2002-09-13 2008-01-30 富士ゼロックス株式会社 テキスト文比較装置
US20050210042A1 (en) * 2004-03-22 2005-09-22 Goedken James F Methods and apparatus to search and analyze prior art
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
US20100131513A1 (en) * 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
CN103348380B (zh) * 2011-02-10 2016-08-10 日本电气株式会社 差异区域检测系统和差异区域检测方法
US9230061B2 (en) * 2011-08-15 2016-01-05 Medcpu, Inc. System and method for text extraction and contextual decision support
JP2015203961A (ja) 2014-04-14 2015-11-16 株式会社toor 文書抽出システム
US20180018564A1 (en) * 2016-07-13 2018-01-18 Palantir Technologies Inc. Artificial intelligence-based prior art document identification system
WO2018051233A1 (en) * 2016-09-14 2018-03-22 FileFacets Corp. Electronic document management using classification taxonomy
US20180189909A1 (en) * 2016-12-30 2018-07-05 At&T Intellectual Property I, L.P. Patentability search and analysis
US11010393B2 (en) * 2017-04-06 2021-05-18 Hitachi, Ltd. Library search apparatus, library search system, and library search method
US11308320B2 (en) * 2018-12-17 2022-04-19 Cognition IP Technology Inc. Multi-segment text search using machine learning model for text similarity

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JP2001117937A (ja) * 1999-10-20 2001-04-27 Hitachi Ltd 文書検索方法および装置
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009294993A (ja) * 2008-06-06 2009-12-17 Konica Minolta Holdings Inc 関連文書抽出方法、関連文書抽出システム、及び関連文書抽出プログラム
JP2017138931A (ja) * 2016-02-05 2017-08-10 雲拓科技有限公司 特許検索方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021152809A1 (ja) * 2020-01-30 2021-08-05 株式会社 AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JPWO2021152809A1 (ja) * 2020-01-30 2021-08-05
JP7193890B2 (ja) 2020-01-30 2022-12-21 株式会社AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Also Published As

Publication number Publication date
CN112352229A (zh) 2021-02-09
US20210056304A1 (en) 2021-02-25
JPWO2020208693A1 (ja) 2021-04-30
US11023721B2 (en) 2021-06-01
EP3955125A1 (en) 2022-02-16
EP3955125A4 (en) 2022-04-27
WO2020208693A1 (ja) 2020-10-15

Similar Documents

Publication Publication Date Title
JP6555704B1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
US20160306800A1 (en) Reply recommendation apparatus and system and method for text construction
CN107025217B (zh) 同义转换文生成方法、装置、记录介质以及机器翻译系统
Zhao et al. CAPER: Context-aware personalized emoji recommendation
EP3203383A1 (en) Text generation system
US20130036076A1 (en) Method for keyword extraction
AU2018205185A1 (en) Scalable font pairing with asymmetric metric learning
JP6653833B1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
Rezaeian et al. Persian text classification using naive bayes algorithms and support vector machine algorithm
Murfi et al. Topic features for machine learning-based sentiment analysis in Indonesian tweets
KR20200053334A (ko) 융합 연구 촉진을 위한 연구원 맵 구축 방법 및 시스템
JP2021086592A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP7029204B1 (ja) 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム
WO2021152809A1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
Avasthi et al. Automatic label curation from large-scale text corpus
JP2021128620A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP2020173759A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP4567025B2 (ja) テキスト分類装置、テキスト分類方法及びテキスト分類プログラム並びにそのプログラムを記録した記録媒体
JP6916476B2 (ja) 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
TW202044101A (zh) 集群分析方法、集群分析系統、及集群分析程式
WO2021245814A1 (ja) 文書情報評価装置、文書情報評価方法、および文書情報評価プログラム
Izo et al. Named entities as a metadata resource for indexing and searching information
JP2019211884A (ja) 情報検索システム
Solomi et al. Priority Queue-based Extractive Text Summarizer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190515

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190702

R150 Certificate of patent or registration of utility model

Ref document number: 6555704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250