JP7161255B2 - 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム - Google Patents

文書作成支援装置、文書作成支援方法、及び、文書作成プログラム Download PDF

Info

Publication number
JP7161255B2
JP7161255B2 JP2021573678A JP2021573678A JP7161255B2 JP 7161255 B2 JP7161255 B2 JP 7161255B2 JP 2021573678 A JP2021573678 A JP 2021573678A JP 2021573678 A JP2021573678 A JP 2021573678A JP 7161255 B2 JP7161255 B2 JP 7161255B2
Authority
JP
Japan
Prior art keywords
document
user
sentence
information
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021573678A
Other languages
English (en)
Other versions
JPWO2021152712A1 (ja
JPWO2021152712A5 (ja
Inventor
びわ 三浦
崇志 三上
一 白坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Samurai Inc
Original Assignee
AI Samurai Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Samurai Inc filed Critical AI Samurai Inc
Publication of JPWO2021152712A1 publication Critical patent/JPWO2021152712A1/ja
Publication of JPWO2021152712A5 publication Critical patent/JPWO2021152712A5/ja
Application granted granted Critical
Publication of JP7161255B2 publication Critical patent/JP7161255B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、文書作成支援装置、文書作成支援方法、文書作成支援プログラム、及び、文書作成支援システムに関し、特に、ユーザによる発明に関する文書の作成を支援することで、ユーザによる発明の創出を支援する文書作成支援装置等に関する。
近年、ユーザによる発明に関する文書として、特許明細書を自動的に生成するシステムが提案されている。例えば、特許文献1には、特許明細書の作成システムであって、構成要件の一致性が最も高く、最新の先願をベースに自動的に特許明細書を作成するシステムが開示されている。
特開2007-257668号公報
ここで、出願前の発明に対しては、新規性・進歩性といった登録の実体的要件を満足するか否かを判定するための先行技術調査や、侵害の有無等を判定するためのクリアランス調査を行うことが望ましい。発明者らは、これら先行技術文献調査やクリアランス調査等を、ユーザの手間をかけずに行うサービス(知的財産創出支援サービス)を提供している。具体的には、ユーザの端末から送信された、ユーザによる発明に関する情報に基づいて、先行技術調査を行い、特許性の判定結果を提供するものである。
上記のようなサービスを活用しつつ、さらに、ユーザによる発明に関する文書が作成できれば、ユーザにとって利便性が高い。なお、特許文献1に記載の技術を用いることも考えられるが、特許文献1に記載のシステムでは、ユーザによって入力された特許請求の範囲の構成要件との一致度(類似性)が高い構成要件を有する先願を抽出し、抽出した先願の明細書をベースとして、その一部を、ユーザによって入力された特許請求の範囲と差し替えることが行われている。すなわち、ベースとした先願の明細書の文言が流用されており、好ましくなかった。
本発明は上記に鑑みてなされたものであり、既存の発明に関する文書を用いて、ユーザによる発明に関する文書を適切に作成する文書作成支援装置等を提供する。
本発明の一実施形態による、発明に関する文書の作成を支援する文書作成支援装置は、
第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成部と、ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付部と、既存の発明に関する文書である先行文書に含まれる発明と、ユーザによる発明との間の類似度を求める類似度算出部と、複数の先行文書のうち、類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力部と、類似文書に含まれる文章を言い換え生成部に入力して得られる言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成する作成部とを備える。
本発明の一実施形態による文書作成支援装置において、言い換え生成部は、先行文書に含まれる一の文章を折り返し翻訳した結果としての結果文章を第1文章とし、先行文書に含まれる一の文章を第2文章として、複数の先行文書を学習して学習モデルを生成してもよい。
本発明の一実施形態による文書作成支援装置において、類似文書に含まれる用語と、ユーザ発明情報に含まれる用語との対応関係に基づき、言い換え生成部によって出力された言い換え文章を補正する補正部をさらに備え、作成部は、補正部によって補正された言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成してもよい。
本発明の一実施形態による文書作成支援装置において、作成部は、類似度が所定値以上の発明を含む先行文書が複数存在する場合、当該複数の先行文書を類似文書として、複数の類似文書とユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成してもよい。
本発明の一実施形態による文書作成支援装置において、作成部は、複数の類似文書に含まれる発明とユーザによる発明との類似度に応じて、複数の類似文書の間で、ユーザによる発明に関する文書の作成に寄与する度合いを設定してもよい。
本発明の一実施形態による文書作成支援装置において、類似文書出力部は、複数の類似文書に関する情報を、ユーザが操作可能なユーザ端末に表示させるための表示情報を出力し、受付部は、複数の類似文書のうち、ユーザによる発明に関する文書の作成に用いる類似文書の選択をユーザからさらに受け付け、作成部は、ユーザから選択された類似文書と、ユーザ発明情報とに基づいて、ユーザによる発明に関する文書を作成してもよい。
本発明の一実施形態による文書作成支援装置において、発明に関する文書は、特許出願に用いる文書であり、既存の発明に関する文書は、特許文献であって、受付部は、ユーザ発明情報として、少なくとも、特許出願に用いる文書における請求項についての情報を受け付けてもよい。
本発明の一実施形態による、発明に関する文書の作成を支援する文書作成支援方法は、コンピュータが、第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成ステップと、ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付ステップと、既存の発明に関する文書である先行文書に含まれる発明と、ユーザによる発明との間の類似度を求める類似度算出ステップと、複数の先行文書のうち、類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力ステップと、類似文書に含まれる文章を言い換え生成ステップにて入力して得られる言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成する作成ステップとを実行する。
本発明の一実施形態による、発明に関する文書の作成を支援する文書作成支援プログラムは、コンピュータに、第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成機能と、ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付機能と、既存の発明に関する文書である先行文書に含まれる発明と、ユーザによる発明との間の類似度を求める類似度算出機能と、複数の先行文書のうち、類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力機能と、類似文書に含まれる文章を言い換え生成機能に入力して得られる言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成する作成機能とを実現させる。
本発明の一実施形態によれば、既存の発明に関する文書を用いて、ユーザによる発明に関する文書を適切に作成する文書作成支援装置等を提供することができる。
本発明の一実施形態に係る文書作成支援システム構成の概略図である。 本発明の一実施形態に係るサーバ(文書作成支援装置)のハードウェア構成の一例である。 本発明の一実施形態に係る文書作成支援装置の機能ブロック図の一例である。 本発明の一実施形態に係る文書作成支援装置における、言い換え生成部の機能ブロック図の一例である。 本発明の一実施形態に係る文書作成処理の概要を説明する図である。 本発明の一実施形態に係る検索処理のフロー図である。 本発明の一実施形態に係る文書作成支援装置の機能ブロック図の一例である。 本発明の一実施形態に係る文書作成支援システムにおける、ユーザ端末の表示画面例である。 本発明の一実施形態に係る文書作成支援システムにおける、ユーザ端末の表示画面例である。 本発明の一実施形態に係るサーバ(文書作成支援装置)のハードウェア構成の一例である。
以降、諸図面を参照しながら、本発明の一実施形態を詳細に説明する。
<システム構成>
図1は、本発明の一実施形態に係る文書作成支援システムの構成例を示す図である。図1に示すように、文書作成支援システム500は、ネットワーク300を介して互いに接続された、文書作成支援装置100と、ユーザ端末400(400A~400D)と、先行文書データベース(DB)200とを含む。なお、ユーザ端末400A~400Dや先行文書データベース200の数は、図示したものに限られるものではない。
文書作成支援装置100は、ネットワーク300を介してユーザ端末400A~400Dと接続し、該ユーザ端末400A~400Dに対して文書作成支援サービスを提供するための装置(情報処理装置)である。文書作成支援装置100は、例えば、いわゆるサーバ装置やコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)である。なお、本発明の一実施形態において、文書作成支援装置100は、これらに限定されず、また、サーバ装置とは、物理的なサーバに限らず、仮想サーバや、サーバの機能を実現するプログラムを指してもよいことに留意されたい。
ユーザ端末400A~400Dは、文書作成支援システム500によって提供される文書作成支援サービスを利用するユーザのユーザ端末である。なお、図において、ユーザ端末400A~400Dはノートパソコン、デスクトップパソコン、スマートフォンを示してあるが、ユーザ端末400A~400Dとしては、ネットワーク300を介して、文書作成支援システム500による文書作成支援サービスを利用可能とするものであれば、その種類は問わない。なお、これ以降、特に区別する必要がない場合、ユーザ端末400A~400Dをユーザ端末400と総称する。ユーザ端末400は、例えば、携帯電話(フィーチャーフォン)、ハンドヘルドコンピュータデバイス(例えば、PDA(Personal Digital Assistant)等)、ウェアラブル端末(例えば、メガネ型デバイス、時計型デバイス、ヘッドマウントディスプレイ(HMD:Head-Mounted Display等)、他種のコンピュータ、又はコミュニケーションプラットホームを含んでよい。
ユーザ端末400は、ユーザからの入力操作を受け付けて、ネットワーク300を介して、ユーザによる発明に関する情報を文書作成支援装置100へ送信する。ここで、「ユーザによる発明に関する情報」とは、ユーザの創出した発明に関する情報であって、例えば、発明の内容を記述した文章、アイデアメモ、キーワード(単語)、図面等の情報であってよい。また、発明の内容を記述した文章としては、特許請求の範囲の形式にて記述された文章や、発明の課題又は発明の目的等を記述する文章であってよい。なおこれ以降、「ユーザによる発明に関する情報」を「ユーザ発明情報」と称する。
文書作成支援装置100は、ユーザ端末400から送信された、ユーザ発明情報と、先行文書データベース200に記憶された先行文書とに基づき、ユーザによる発明に関する文書を作成する。ここで、「発明に関する文書」とは、発明の内容を記述する、所定の様式で作成された文書であって、例えば、特許出願に係る文書(明細書、特許請求の範囲、要約等)、論文、アイデアシート、書籍、企業や教育機関等で用いられる発明申請文書等であってよい。従って、「ユーザによる発明に関する文書」とは、ユーザによる発明について作成された、上記発明に関する文書を指す。また、「先行文書」とは、既存の上記発明に関する文書であって、ネットワーク300を介して送受信可能なデータである。
先行文書データベース200は、上記の先行文書を記憶するデータベースである。発明に関する文書が例えば特許出願に係る文書であった場合、先行文書としては、公開特許公報、特許公報を用いることができる。この場合、先行文書データベース200は、例えば特許庁のデータベースとしてよい。特許庁のデータベースは、1庁でも複数庁を含んでいてもよく、例えば、米国、欧州、日本、中国、及び韓国の5庁のデータベースを含むことで、世界の特許の約90%を網羅することができる。なお、データベースとしては、上述のものに限られるものでなく、インターネット上に存在する情報であってもよい。
ネットワーク300は、無線ネットワークや有線ネットワークを含んでよい。具体的には、ネットワーク300は、ワイヤレスLAN(wireless LAN:WLAN)や広域ネットワーク(wide area network:WAN)、ISDNs(integrated service digital networks)、無線LANs、LTE(long term evolution)、LTE-Advanced、第4世代(4G)、第5世代(5G)、CDMA(code division multiple access)等である。なお、ネットワーク300は、これらの例に限られず、例えば、公衆交換電話網(Public Switched Telephone Network:PSTN)やブルートゥース(Bluetooth(登録商標))、光回線、ADSL(Asymmetric Digital Subscriber LINE)回線、衛星通信網等であってもよい。また、ネットワーク300は、これらの組み合わせであってもよい。
なお、図1では、文書作成支援装置100、先行文書データベース200、ユーザ端末400が、ネットワーク300を介して接続された態様を示してあるが、文書作成支援システム500において、ネットワーク300とは別個のローカルでセキュアなネットワークが一部又は全部で構築され、それにより各装置、端末間でのデータの送受信が行われてもよい。
<ハードウェア構成>
まず、図2を用いて、文書作成支援装置100、及び、ユーザ端末400のハードウェア構成について説明する。本発明の一実施形態において、文書作成支援装置100及びユーザ端末400の基本的なハードウェア構成は情報処理装置として同様であるため、図2では、情報処理装置100として説明する。情報処理装置100は、プロセッサ101と、メモリ102と、ストレージ103と、入出力インタフェース(I/F)104と、通信I/F105とを備え、これらの協働により、これ以降に記載される機能や方法を実現する。例えば、本開示の機能又は方法は、メモリ102に読み込まれたプログラムに含まれる命令をプロセッサ101が実行することによって実現される。
プロセッサ101は、ストレージ103に記憶されるプログラムに含まれるコード又は命令によって実現する機能、及び/又は、方法を実行する。プロセッサ101は、例えば、中央処理装置(CPU)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、マイクロプロセッサ(microprocessor)、プロセッサコア(processor core)、マルチプロセッサ(multiprocessor)、ASIC(Application-Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等を含み、集積回路(IC(Integrated Circuit)チップ、LSI(Large Scale Integration))等に形成された論理回路(ハードウェア)や専用回路によって各実施形態に開示される各処理を実現してもよい。また、これらの回路は、1又は複数の集積回路により実現されてよく、各実施形態に示す複数の処理を1つの集積回路により実現されることとしてもよい。また、LSIは、集積度の違いにより、VLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
メモリ102は、ストレージ103からロードしたプログラムを一時的に記憶し、プロセッサ101に対して作業領域を提供する。メモリ102には、プロセッサ101がプログラムを実行している間に作成される各種データも一時的に格納される。メモリ102は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)等を含む。
ストレージ103は、プログラムを記憶する。ストレージ103は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等を含む。
通信I/F105は、ネットワークアダプタ等のハードウェアや通信用ソフトウェア、及びこれらの組み合わせとして実装され、ネットワーク300を介して各種データの送受信を行う。当該通信は、有線、無線のいずれで実行されてもよく、互いの通信が実行できるのであれば、どのような通信プロトコルを用いてもよい。通信I/F105は、ネットワーク300を介して、例えばユーザ端末のような他の情報処理装置との通信を実行する。通信I/F105は、各種データをプロセッサ101からの指示に従って、他の情報処理装置に送信する。また、通信I/F105は、他の情報処理装置から送信された各種データを受信し、プロセッサ101に伝達する。
入出力I/F104は、情報処理装置100に対する各種操作を入力する入力装置、及び、情報処理装置100で処理された処理結果を出力する出力装置を含む。入出力I/F104は、入力装置と出力装置が一体化していてもよいし、入力装置と出力装置とに分離していてもよい。入力装置は、ユーザからの入力を受け付けて、当該入力に係る情報をプロセッサ101に伝達できる全ての種類の装置のいずれか、又は、その組み合わせにより実現される。入力装置は、例えば、タッチパネル、タッチディスプレイ、キーボード等のハードウェアキーや、マウス等のポインティングデバイス、カメラ(画像を介した操作入力)、マイク(音声による操作入力)を含む。出力装置は、プロセッサ101で処理された処理結果を出力する。出力装置は、例えば、タッチパネル、スピーカ等を含む。
<機能構成>
<第1実施形態>
次に、図3を用いて、本発明の一実施形態に係る文書作成支援装置100の機能構成について説明する。なお、図3に記載の各機能部が必須ではなく、また、これ以外の機能部を備えてもよい。また、各機能部の機能又は処理は、実現可能な範囲において、機械学習又はAI(Artificial Intelligence)により実現されてもよい。
文書作成支援装置100は、発明に関する文書の作成を支援する装置であって、受付部110、類似度算出部120、類似文書出力部130、記憶部140、言い換え生成部150及び作成部160を少なくとも備える。なお、これ以降、発明に関する文書として、特許出願に係る文書(明細書、請求の範囲、要約等)を例に説明するが、上述のように、発明に関する文書とは、これに限られるものではない。
受付部110は、ユーザ発明情報を受け付ける。ユーザ発明情報は、ユーザ端末400で入力され、ネットワーク300を介して文書作成支援装置100に送信される。ユーザ発明情報は、ユーザの創作した発明を記述する文章であってよく、例えば、特許請求の範囲の形式で記述された文章である。
類似度算出部120は、既存の発明に関する文書である先行文書に含まれる発明(先行発明)と、ユーザによる発明との間の類似度を求める。先行文書は、本実施形態の場合、出願済みの特許公開公報、特許公報といった特許文献であって、先行文書データベース200は、特許庁のデータベースであってよい。発明が類似するか否かの判断は、例えば、ユーザによる発明の意味(含意)を認識し、含意が類似した先行発明が検索できたか否かで判断することができる。類似度算出部120は、ユーザ端末400から送信されたユーザ発明情報に含まれる文章を所定の構成単位に分節し、該分節された構成単位ごとに、特許文献に含まれる文章との一致度を、類似度として算出する。構成単位としては、一定の長さの文章、述語、単語としてよい。なお、類似度算出部120は、記憶部140に予め記憶された、単語のコーパス辞書により、構成単位に含まれる単語について、ユーザ端末400から送信された文章と、特許文献に含まれる文章との間で下位概念又は上位概念を判定し、類似度を算出してもよい。例えば、ユーザ発明情報に含まれる文章に含まれる単語が、特許文献に含まれる単語と同一であるか、又は、下位概念であれば、その特許文献とユーザ端末400から送信された文章との類似度を高く算出してもよい。なお、類似度の算出方法は上述したものに限られるものではなく、既存のクラスタリング手法を用いることができる。
類似文書出力部130は、複数の先行文書のうち、類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する。類似度に関する所定値は、ユーザによって予め設定されてもよいし、出力すべき類似文書の数に応じて設定されてもよい。また、類似文書出力部130は、ユーザ端末400において類似文書に関する情報を表示させるために、類似文書に関する情報をユーザ端末400に送信する。
言い換え生成部150は、第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する。このことを、図4を用いて詳細に説明する。
図4は、言い換え生成部150の詳細な機能ブロック図である。図に示すように、言い換え生成部150は、第2言語変換部152と、第1言語変換部153と、学習部151とを備える。第2言語変換部152は、入力された第1言語(例えば、日本語)の文章を、第2言語(例えば、英語)の文章に変換する変換器(翻訳器)である。第1言語変換部153は、入力された第2言語の文章を、第1言語に変換する変換器(翻訳器)である。第2言語変換部152と第1言語変換部153としては、既存の翻訳システムを用いてよい。また、第2言語としては英語に限られるものではなく、ドイツ語、フランス語、ロシア語等であってよい。
言い換え生成部150は、先行文書に含まれる一の文章を折り返し翻訳した結果としての結果文章を第1文章とし、先行文書に含まれる一の文章を第2文章として、複数の先行文書を学習して学習モデルを生成する。すなわち、言い換え生成部150において、先行文書データベース200に含まれる第1言語による先行文書10は、第2言語変換部152に入力され、第2言語に変換された第2言語先行文書11が出力される。第2言語先行文書11は第1言語変換部153に入力され、第1言語変換文書30が出力される。学習部151は、第1言語変換文書30を入力、先行文書情報10を出力とする対応関係を学習した学習モデルを生成する。言い換え生成部150は、先行文書データベース200に含まれる先行技術文献について上記による学習処理を行い、一の文章の意味内容(文意)を変更せずに表現を変更した、言い換え文章を生成する。
なお、言語変換部は2つに限られるものではなく、複数あってもよい。例えば、第1言語から第2言語、第2言語から第3言語、第3言語から第1言語に変換されてもよい。また、変換の結果文意が異なる文章が生成された場合は、変換文書を学習させなくてもよい。また、変換の結果ほとんど同じ文章が生成された場合は、変換文書を学習させなくてもよい。あるいは、負例として学習させることで、文意の異なる文章が生成された場合またはほとんど同じ文章が生成された場合に、言い換え文章として出力させないようにすることもできる。
図3に戻り説明を続ける。言い換え生成部150は、類似文書出力部130によって出力された類似文書に含まれる文章を入力され、当該文章を言い換えた言い換え文章を、上述した学習処理によって生成した学習モデルを用いて生成する。作成部160は、言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成する。具体的には、作成部160は、類似文書としての特許出願に係る文書のうち、ユーザ発明情報に相当する項目(ここでは、特許請求の範囲、発明の課題)をユーザ発明情報のものと置換し、それ以外の項目(ここでは、技術分野、背景技術、発明を実施するための形態等)を、類似文書のものを用いて、新たに文書を作成する。このとき、言い換え生成部150によって、類似文書の文章は言い換えられた新たな文章となる。
図5を用いて、作成部160によって作成される文書を、特許出願に係る文書を例として説明する。ユーザ端末400において入力されたユーザ発明情報40は、発明の課題と、特許請求の範囲の形式で記述された文章とを含む。文書作成支援装置100の類似度算出部120及び類似文書出力部130は、先行文書データベース200を参照し、ユーザによる発明に類似する特許文献を、類似文書50として抽出する。作成部160は、類似文書50及びユーザ発明情報40に基づき、新規文書20を作成する。図に示すように、新規文書20のうち、発明の名称、発明が解決しようとする課題、課題を解決するための手段、特許請求の範囲の記載は、ユーザ発明情報40が用いられる。そして、発明を実施するための形態は、類似文書50の文章を言い換えた文章が用いられる。
<文書作成処理>
次に、文書作成支援装置100による文書作成処理について、図6のフロー図を用いて説明する。
まず、学習部151は、第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して学習モデルを生成する(ステップS11)。受付部110は、ユーザによる発明についての情報を受け付ける(ステップS12)。類似度算出部120は、既存の発明に関する文書である先行文書に含まれる発明と、ユーザによる発明との間の類似度を求める(ステップS13)。類似文書出力部130は、複数の先行文書のうち、類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する(ステップS14)。作成部160は、類似文書に含まれる文章を前記言い換え生成部に入力して得られる言い換え文章と、前記ユーザによる発明についての情報とに基づき、ユーザによる発明に関する文書を作成する(ステップS15)。
上述のように、本発明の一実施形態によれば、既存の発明に関する文書のうち、ユーザによる発明に類似する発明を含む文書の文章を言い換えた文章が用いられるため、ユーザによる発明に関する文書を適切に作成することができる。また、文章の言い換えには、先行文書を折り返し翻訳した結果の文章から該先行文書に含まれる入力された文章とへの対応関係を学習した学習モデルが用いられるため、自然な文章を作成することができる。
<第2実施形態>
図7に、本発明の第2実施形態による文書作成支援装置100の機能ブロック図の一例を示す。第2実施形態による文書作成支援装置100のうち、第1実施形態と同様の機能部については同一の符号を付し、説明を省略する。第2実施形態による文書作成支援装置100は、補正部170をさらに備える。補正部170は、類似文書に含まれる用語と、ユーザ発明情報に含まれる用語との対応関係に基づき、言い換え生成部150によって出力された言い換え文章を補正する。補正部170は、例えば、所定の辞書を参照して、類似文書に含まれる用語のうち、ユーザ発明情報に含まれる用語に対応する用語を、当該ユーザ発明情報に含まれる用語に置き換える。なお、辞書は、一般的な知識として予め生成された汎用的なもの(一般的な語の意味や概念の階層関係が定義されているオントロジやシソーラス)であってよいし、ユーザが定義して、記憶部140に記憶させておいてもよい。作成部160は、補正部170によって補正された言い換え文章と、ユーザ発明情報とに基づき、ユーザによる発明に関する文書を作成する。
上述のように、本発明の一実施形態によれば、類似文書に含まれる文章を言い換えた文章を、さらに、ユーザ発明情報に含まれる用語で補正するので、ユーザによる発明をより正確に記述することが可能となる。
<変形例>
なお、作成部160は、類似度が所定値以上の発明を含む先行文書が複数存在する場合、当該複数の先行文書を全て類似文書として抽出し、複数の類似文書と発明情報とに基づき、ユーザによる発明に関する情報を作成してもよい。このことを、図8を用いて説明する。例えば、類似文書が3つ抽出された場合、作成部160は、新規文書20のうち発明を実施するための形態の内容を、第1類似文書、第2類似文書、第3類似文書の全てを用いて、それぞれ、第1実施形態、第2実施形態、第3実施形態として作成してもよい。なお、各類似文書の文章は、言い換え生成部150によって言い換えられた文章が生成される。
上述のように、本発明の一実施形態によれば、ユーザによる発明と類似する発明を含む複数の類似文書を用いて特許出願に係る文書が作成されるため、特許出願の内容を充実化することができる。また、それにより、ユーザによる発明の特許性を高めることが可能となる。
また、類似文書出力部130は、複数の類似文書に関する情報を、ユーザ端末400に表示させるための表示情報を出力してもよい。図9に、複数の類似文書に関する情報のユーザ端末400における表示画面例を示す。類似文書表示画面60は、ユーザ発明情報に含まれる構成要件表示領域62、先行技術及び類似度表示領域61、ユーザによる発明の特許性を判定した判定結果表示領域64を含む。図の例では、先行技術及び類似度表示領域61は、類似文献61A~61Cを含む。ユーザは、先行技術及び類似度表示領域61から、ユーザ発明文書の作成に用いる類似文書を選択することができる。なお、先行技術及び類似度表示領域61は、ユーザの選択に応じて先行技術を閲覧可能に構成されてもよい。
受付部110は、複数の類似文書のうち、ユーザによる発明に関する文書の作成に用いる類似文書の選択をユーザからさらに受け付ける。作成部160は、ユーザから選択された類似文書と、ユーザ発明情報とに基づいて、ユーザ発明文書を作成する。
このように、本実施形態によれば、類似文書についての情報がユーザに提供され、特許出願に係る文書の作成に用いる類似文書をユーザが選択できる。従って、よりユーザビリティの高いシステムを提供することができる。
また、図10に、ユーザ発明情報の入力を受け付ける、ユーザ端末400における表示画面例を示す。図の例では、入力受付画面70は、発明の名称入力領域71、請求項入力領域72、類似文書(引用文献)選択領域73、発明の効果入力領域74、図面入力領域75を含む。なお、ユーザ発明情報の入力に応じて類似文書が抽出されているため、請求項入力領域72には、ユーザ発明情報がすでに記入されていてよい。ユーザは、入力受付画面70で不足する情報や、すでに入力されている情報の修正を行い、ユーザ作成文書の作成を指示することができる。
なお、本実施形態に係る文書作成支援装置100は、権利取得の可能性を判定する判定部(図示せず)を備えていてもよい。判定部(図示せず)は、ユーザによる発明と類似する類似発明を検索し、類似発明の有無によって、例えば、権利取得の可能性を判定する処理を実行できる。発明の類似は、例えば、発明に含まれる単語の中からキーワードを抽出し、同義語、類義語又は派生語(同義語等)を記憶した図示しないデータベースからキーワードに対する同義語等を検索した上で、同義語等によって構成される文章の意味内容が類似しているか否かで判断することができる。判定部(図示せず)は、類似度算出部120が算出した類似度が小さい場合、権利取得の可能性が高いと判定し、類似度が大きい場合、権利取得の可能性が低いと判定してもよい。判定部(図示せず)は、権利取得の可能性の高低に応じて、例えば、「Sランク(可能性が極めて高い)」、「Aランク(可能性が高い)」、「Bランク(可能性あり)」、および「Cランク(可能性が低い)」等、ランクによる判定をしてもよい。また、判定は、SランクからCランクの表示に限定されない。判定は、例えば、可能性が高い順に◎から×の表示であってもよい。
また、判定部(図示せず)は、各国の特許庁において過去に審査された権利取得の審査結果に基づき、権利取得の可能性を判定することができる。権利取得の審査結果とは、出願に係る発明、引用された引用文献、およびその両者の対比における審査結果(引用文献に基づき拒絶されたか否か)である。判定部(図示せず)は、出願に係る発明と引用された引用文献の文章の類似度を算出し、算出した類似度と審査結果との対比を学習して、権利取得の可能を判定してもよい。判定部(図示せず)は、算出した類似度と過去の審査結果との対比を学習することにより、過去の特許庁における判断を判定基準とすることができるので、権利取得の可能性についての判定精度を向上させることができる。記憶部140に、予め、審査結果が格納されるように構成してもよい。審査結果は、例えば、各国の特許庁が公開している審査情報から取得することができる。判定部(図示せず)は、審査結果に基づき、権利取得の可能を判定してもよい。
また、判定部(図示せず)は、過去の審査結果を機械学習し、権利取得の可能性を判定してもよい。例えば、判定部(図示せず)は、出願に係る発明と引用された引用文献を入力、審査結果を出力とした、入力と出力をデータセットとする機械学習(教師あり学習)を行い、学習したデータセットをモデリングすることにより、権利取得の可能性を判定することができる。データセットは、例えば、国、適用法(法改正を含む)、発明の分野等によってそれぞれ異なるモデルとしてモデリングすることができる。判定部(図示せず)は、それぞれのモデリングにおいて学習された学習結果を用いることにより、権利取得の可能性についての判定精度を向上させることができる。また、判定部(図示せず)は、新たな審査結果を機械学習していくことにより、特許庁における審査の傾向に変化があった場合においても、その傾向の変化に対応して権利取得の可能性についての判定することができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク(ディープラーニングを含む)、サポートベクターマシン、クラスタリング(例えば、課題、第1実施形態等)、又はベイジアンネットワーク等を用いてもよい。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各構成部、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。また、上記実施の形態に示す構成を適宜組み合わせることとしてもよい。例えば、文書作成支援装置100が備えるとして説明した各構成部は、物理的に複数のコンピュータによって分散されて実現されてもよいし、一のコンピュータとして実現されてもよい。
例えば、上述では、発明に関する書類について説明した。しかしながら、文書作成支援装置100は、発明に限らず、知的財産全般について適用することができる。知的財産とは、発明のほか、意匠、商標、考案等を指し、「知的財産に関する書類」とは、それら発明、意匠、商標、考案等の内容を示す書類であってよい。例えば、知的財産が「商標」や「意匠」であった場合は、それらの出願書類や説明文等であってよい。
本開示の各実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、例えば、ソフトウェアプログラムやコンピュータプログラムを含む。
記憶媒体は適切な場合、1つ又は複数の半導体ベースの、又は他の集積回路(IC)(例えば、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向けIC(ASIC)等)、ハード・ディスク・ドライブ(HDD)、ハイブリッド・ハード・ドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピィ・ディスケット、フロッピィ・ディスク・ドライブ(FDD)、磁気テープ、固体ドライブ(SSD)、RAMドライブ、セキュア・デジタル・カードもしくはドライブ、任意の他の適切な記憶媒体、又はこれらの2つ以上の適切な組合せを含むことができる。記憶媒体は、適切な場合、揮発性、不揮発性、又は揮発性と不揮発性の組合せでよい。
また、本開示のプログラムは、当該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して、情報処理装置に提供されてもよい。
また、本開示の各実施形態は、プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
なお、本開示のプログラムは、例えば、JavaScript(登録商標)、Python等のスクリプト言語、C言語、Go言語、Swift,Koltin、Java(登録商標)等を用いて実装される。
100 文書作成支援装置
101 プロセッサ
102 メモリ
103 ストレージ
110 受付部
120 類似度算出部
130 類似文書出力部
140 記憶部
150 言い換え生成部
151 学習部
152 第2言語変換部
153 第1言語変換部
160 作成部
170 補正部
200 先行文書データベース
300 ネットワーク
400 ユーザ端末
500 文書作成支援システム
60 類似文書表示画面
61 類似度表示領域
62 構成要件表示領域
64 判定結果表示領域
70 入力受付画面
71 名称入力領域
72 請求項入力領域
73 選択領域
74 効果入力領域
75 図面入力領域

Claims (7)

  1. 発明に関する文書の作成を支援する文書作成支援装置であって、
    第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成部と、
    ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付部と、
    既存の前記発明に関する文書である先行文書に含まれる発明と、前記ユーザによる発明との間の類似度を求める類似度算出部と、
    複数の前記先行文書のうち、前記類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力部と、
    前記類似文書に含まれる文章を前記言い換え生成部に入力して得られる言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する作成部と、
    所定の辞書を参照して、前記類似文書に含まれる用語のうち前記ユーザ発明情報に含まれる用語に対応する用語を、当該ユーザ発明情報に含まれる用語に置き換えることにより、前記言い換え生成部によって出力された前記言い換え文章を補正する補正部と、
    を備え、
    前記作成部は、前記補正部によって補正された言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する、
    文書作成支援装置。
  2. 前記言い換え生成部は、前記先行文書に含まれる一の文章を折り返し翻訳した結果としての結果文章を前記第1文章とし、前記先行文書に含まれる一の文章を前記第2文章として、複数の前記先行文書を学習して前記学習モデルを生成する、
    ことを特徴とする請求項1に記載の文書作成支援装置。
  3. 前記作成部は、前記類似度が所定値以上の発明を含む先行文書が複数存在する場合、当該複数の先行文書を前記類似文書として、複数の前記類似文書と前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する、
    ことを特徴とする請求項1又は2に記載の文書作成支援装置。
  4. 前記類似文書出力部は、複数の前記類似文書に関する情報を、前記ユーザが操作可能なユーザ端末に表示させるための表示情報を出力し、
    前記受付部は、複数の前記類似文書のうち、前記ユーザによる前記発明に関する文書の作成に用いる類似文書の選択を前記ユーザからさらに受け付け、
    前記作成部は、前記ユーザから選択された前記類似文書と、前記ユーザ発明情報とに基づいて、前記ユーザによる前記発明に関する文書を作成する、
    ことを特徴とする請求項3に記載の文書作成支援装置。
  5. 前記発明に関する文書は、特許出願に用いる文書であり、
    既存の前記発明に関する文書は、特許文献であって、
    前記受付部は、前記ユーザ発明情報として、少なくとも、前記特許出願に用いる文書における請求項についての情報を受け付ける、
    ことを特徴とする請求項1~のいずれか一項に記載の文書作成支援装置。
  6. 発明に関する文書の作成を支援する文書作成支援方法であって、
    コンピュータが、
    第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成ステップと、
    ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付ステップと、
    既存の前記発明に関する文書である先行文書に含まれる発明と、前記ユーザによる発明との間の類似度を求める類似度算出ステップと、
    複数の前記先行文書のうち、前記類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力ステップと、
    前記類似文書に含まれる文章を前記言い換え生成ステップにて入力して得られる言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する作成ステップと、
    所定の辞書を参照して、前記類似文書に含まれる用語のうち前記ユーザ発明情報に含まれる用語に対応する用語を、当該ユーザ発明情報に含まれる用語に置き換えることにより、前記言い換え生成ステップによって出力された前記言い換え文章を補正する補正ステップと、
    を実行し、
    前記作成ステップは、前記補正ステップによって補正された言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する、
    文書作成支援方法。
  7. 発明に関する文書の作成を支援する文書作成支援プログラムであって、
    コンピュータに、
    第1文章を入力、当該第1文章を言い換えた文章である第2文章を出力とする対応関係を学習して生成した学習モデルに基づき、入力された一の文章を言い換えた言い換え文章を出力する言い換え生成機能と、
    ユーザによる発明に関する情報であるユーザ発明情報を受け付ける受付機能と、
    既存の前記発明に関する文書である先行文書に含まれる発明と、前記ユーザによる発明との間の類似度を求める類似度算出機能と、
    複数の前記先行文書のうち、前記類似度が所定値以上の発明を含む先行文書である類似文書に関する情報を出力する類似文書出力機能と、
    前記類似文書に含まれる文章を前記言い換え生成機能に入力して得られる言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する作成機能と、
    所定の辞書を参照して、前記類似文書に含まれる用語のうち、前記ユーザ発明情報に含まれる用語に対応する用語を、当該ユーザ発明情報に含まれる用語に置き換えることにより、前記言い換え生成機能によって出力された前記言い換え文章を補正する補正機能と、
    を実現させ、
    前記作成機能は、前記補正機能によって補正された言い換え文章と、前記ユーザ発明情報とに基づき、前記ユーザによる前記発明に関する文書を作成する、
    文書作成支援プログラム。
JP2021573678A 2020-01-28 2020-01-28 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム Active JP7161255B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/003054 WO2021152712A1 (ja) 2020-01-28 2020-01-28 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム

Publications (3)

Publication Number Publication Date
JPWO2021152712A1 JPWO2021152712A1 (ja) 2021-08-05
JPWO2021152712A5 JPWO2021152712A5 (ja) 2022-07-12
JP7161255B2 true JP7161255B2 (ja) 2022-10-26

Family

ID=77078725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021573678A Active JP7161255B2 (ja) 2020-01-28 2020-01-28 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム

Country Status (2)

Country Link
JP (1) JP7161255B2 (ja)
WO (1) WO2021152712A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003022264A (ja) 2001-07-06 2003-01-24 Communication Research Laboratory 言語変換処理統一システム
JP2004118768A (ja) 2002-09-30 2004-04-15 Mitsui Chemicals Inc 特許明細書の作成方法
US20190042663A1 (en) 2017-08-02 2019-02-07 Yahoo Holdings, Inc. Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003022264A (ja) 2001-07-06 2003-01-24 Communication Research Laboratory 言語変換処理統一システム
JP2004118768A (ja) 2002-09-30 2004-04-15 Mitsui Chemicals Inc 特許明細書の作成方法
US20190042663A1 (en) 2017-08-02 2019-02-07 Yahoo Holdings, Inc. Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation

Also Published As

Publication number Publication date
JPWO2021152712A1 (ja) 2021-08-05
WO2021152712A1 (ja) 2021-08-05

Similar Documents

Publication Publication Date Title
US10592607B2 (en) Iterative alternating neural attention for machine reading
da Silva et al. Using unsupervised information to improve semi-supervised tweet sentiment classification
Bhargava et al. Sentiment analysis for mixed script indic sentences
US20180004730A1 (en) Corpus generation device and method, human-machine interaction system
US9514098B1 (en) Iteratively learning coreference embeddings of noun phrases using feature representations that include distributed word representations of the noun phrases
EP3958145A1 (en) Method and apparatus for semantic retrieval, device and storage medium
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
JP2022006173A (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
CN112528681A (zh) 跨语言检索及模型训练方法、装置、设备和存储介质
JP2019197366A (ja) コンテンツ評価装置、コンテンツ評価方法、プログラム、および記録媒体
CN104881397A (zh) 缩写词扩展方法和装置
Sazzed Development of sentiment lexicon in bengali utilizing corpus and cross-lingual resources
CN110889295B (zh) 机器翻译模型、伪专业平行语料的确定方法、系统及设备
Duque et al. Can multilinguality improve biomedical word sense disambiguation?
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
KR20210125449A (ko) 업계 텍스트를 증분하는 방법, 관련 장치 및 매체에 저장된 컴퓨터 프로그램
JP6095487B2 (ja) 質問応答装置、及び質問応答方法
US20210263915A1 (en) Search Text Generation System and Search Text Generation Method
JP7161255B2 (ja) 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム
Reddy et al. Indic language machine translation tool: English to Kannada/Telugu
KR20200057277A (ko) 자동 번역 오류를 자동으로 진단 및 교정하는 장치 및 방법
US20210312144A1 (en) Translation device, translation method, and program
JP7029204B1 (ja) 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム
JP2022017173A (ja) 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
JP5398638B2 (ja) 記号入力支援装置、記号入力支援方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220513

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220513

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221006

R150 Certificate of patent or registration of utility model

Ref document number: 7161255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150