JP7333533B1 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7333533B1
JP7333533B1 JP2022144310A JP2022144310A JP7333533B1 JP 7333533 B1 JP7333533 B1 JP 7333533B1 JP 2022144310 A JP2022144310 A JP 2022144310A JP 2022144310 A JP2022144310 A JP 2022144310A JP 7333533 B1 JP7333533 B1 JP 7333533B1
Authority
JP
Japan
Prior art keywords
sentence
document
information processing
processing system
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022144310A
Other languages
English (en)
Other versions
JP2023152281A (ja
Inventor
光平 奥村
聡 川嶋
Original Assignee
弁理士法人Ipx
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弁理士法人Ipx filed Critical 弁理士法人Ipx
Priority to JP2023035915A priority Critical patent/JP2023152789A/ja
Application granted granted Critical
Publication of JP7333533B1 publication Critical patent/JP7333533B1/ja
Publication of JP2023152281A publication Critical patent/JP2023152281A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

【課題】書類上で発明等をサポートしている箇所を把握しやすくする情報処理システム等を提供すること。【解決手段】本発明の一態様によれば、手続書面の作成を支援する情報処理システムが提供される。この情報処理システムは、制御部を備える。制御部は、次の各ステップを実行するように構成される。受付ステップでは、手続書面に含まれるテキスト情報を受け付ける。手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類である。抽出ステップでは、第2の書類を構成する複数の文から、所定の基準を満足し、かつ、第1の書類で特定される発明又は考案に関する構成に関連性の高い文を第1の文として抽出する。表示制御ステップでは、抽出ステップで抽出された第1の文をユーザが把握可能に表示させる。【選択図】図1

Description

本発明は、情報処理システム、情報処理方法及びプログラムに関する。
特許庁に対する手続書面を作成するにあたって、書面中に不備があることは許されず、以前より書面作成を支援する技術が開発されてきた。関連するものとして、特許文献1には、容易に特許出願等の出願明細書を作成することが可能なシステムが示されている。
特開2013-80279号公報
ところで、特許法第36条第6項第1号は、請求項に係る発明が発明の詳細な説明に記載した範囲を超えるものであってはならない旨を規定している。このことから、特許庁に対する手続書面を作成するにあたっては、請求項に係る発明が、発明の詳細な説明部分に確実に記載されていることを十分に確認する必要がある。
この点について、従来技術においては、請求項に係る発明が、明細書等のどこにサポートされているかを瞬時に把握するのは困難であった。
本発明では上記事情に鑑み、書類上で発明等をサポートしている箇所を把握しやすくする情報処理システム等を提供することとした。
本発明の一態様によれば、手続書面の作成を支援する情報処理システムが提供される。この情報処理システムは、制御部を備える。制御部は、次の各ステップを実行するように構成される。受付ステップでは、手続書面に含まれるテキスト情報を受け付ける。手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類である。抽出ステップでは、第2の書類を構成する複数の文から、所定の基準を満足し、かつ、第1の書類で特定される発明又は考案に関する構成に関連性の高い文を第1の文として抽出する。表示制御ステップでは、抽出ステップで抽出された第1の文をユーザが把握可能に表示させる。
上記態様によれば、書類上で発明等をサポートしている箇所を把握しやすくすることができる。
本実施形態に係る情報処理装置1(情報処理システム)のハードウェア構成を示すブロック図である。 情報処理装置1における制御部11等によって実現される機能を示すブロック図である。 本実施形態の情報処理の流れを表すアクティビティ図である。 出願Xにかかる第1の書類の態様を表す図である。 出願Xにかかる第2の書類の態様を表す図である。 生成部112が作成するモデル文の例を表す図である。 抽出部113が抽出した第1の文の内容を表す図である。 第1の書類の各請求項上にサポート度合を表示させる態様を説明するための図である。 ユーザに表示される警告画面の一例である。
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
ところで、本実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
また、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
1.ハードウェア構成
本節では、本実施形態のハードウェア構成について説明する。本実施形態において、情報処理システムとは、1つ又はそれ以上の装置又は構成要素からなるものである。したがって、例えば情報処理装置1単体であっても情報処理システムの一例となる。以下、情報処理システムの一例である情報処理装置1のハードウェア構成について説明する。
図1は、本実施形態に係る情報処理装置1(情報処理システム)のハードウェア構成を示すブロック図である。情報処理装置1は、制御部11と、記憶部12と、入力部13と、表示部14と、通信部15とを有し、これらの構成要素が情報処理装置1の内部において通信バス10を介して電気的に接続されている。各構成要素についてさらに説明する。
制御部11(プロセッサ)は、情報処理装置1に関連する全体動作の処理・制御を行う。制御部11は、例えば不図示の中央処理装置(Central Processing Unit:CPU)である。制御部11は、記憶部12に記憶された所定のプログラムを読み出すことによって、情報処理装置1に係る種々の機能を実現する。すなわち、記憶部12に記憶されているソフトウェアによる情報処理が、ハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部として実行されうる。これらについては、次節においてさらに詳述する。なお、制御部11は単一であることに限定されず、機能ごとに複数の制御部11を有するように実施してもよい。またそれらの組合せであってもよい。
記憶部12は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部11によって実行される情報処理装置1に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。記憶部12は、制御部11によって実行される情報処理装置1に係る種々のプログラムや変数等を記憶している。
入力部13は、情報処理装置1の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部13は、表示部14と一体となってタッチパネルとして実施されてもよい。タッチパネルであれば、ユーザは、タップ操作、スワイプ操作等を入力することができる。もちろん、タッチパネルに代えて、スイッチボタン、マウス、QWERTYキーボード等を採用してもよい。すなわち、入力部13がユーザによってなされた操作入力を受け付ける。当該入力が命令信号として、通信バス10を介して制御部11に転送され、制御部11が必要に応じて所定の制御や演算を実行しうる。
表示部14は、例えば、情報処理装置1の筐体に含まれるものであってもよいし、外付けされるものであってもよい。表示部14は、ユーザが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面を表示する。これは例えば、CRTディスプレイ、液晶ディスプレイ、有機ELディスプレイ及びプラズマディスプレイ等の表示デバイスを使い分けて実施することが好ましい。
通信部15は、USB、IEEE1394、Thunderbolt(登録商標)、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、LTE/5G等のモバイル通信、BLUETOOTH(登録商標)通信等を必要に応じて含めてもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。すなわち、情報処理装置1は、通信部15及びネットワークを介して、外部から種々の情報を通信してもよい。
2.機能構成
本節では、本実施形態の機能構成について説明する。前述の通り、記憶部12に記憶されているソフトウェアによる情報処理がハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部が実行されうる。換言すると、情報処理システムの一例である情報処理装置1は、制御部11(プロセッサ)を備える。制御部11は、各機能部のステップを実行させるプログラムを実行するように構成される。
図2は、情報処理装置1における制御部11等によって実現される機能を示すブロック図である。具体的には、情報処理装置1は、受付部111と、生成部112と、抽出部113と、表示制御部114とを備える。
受付部111は、手続書面に含まれるテキスト情報を受け付ける。ここで、手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類である。
生成部112は、受付部111で受け付けたテキスト情報の中から第1の書類で特定される発明又は考案に関する構成を表現する1以上のモデル文を生成する。この具体的な処理は追って説明することにする。
抽出部113は、第2の書類を構成する複数の文から、所定の基準を満足し、かつ、第1の書類で特定される発明又は考案に関する構成に関連性の高い文を第1の文として抽出する。この具体的な処理は追って説明することにする。
表示制御部114は、記憶部12に記憶された種々の情報又はこれらを含む画面等を視認可能な態様で表示させる。具体的には、表示制御部114は、画面、画像、アイコン、メッセージ等の視覚情報を、情報処理装置1の表示部14に表示させるように制御する。表示制御部114は、視覚情報を情報処理装置1に表示させるためのレンダリング情報だけを生成してもよい。本実施形態において、表示制御部114、抽出部113で抽出された第1の文をユーザが把握可能に表示させる。
3.情報処理方法
本節では、前述した情報処理装置1の情報処理方法について説明する。本実施形態に係る情報処理方法は、前述の、情報処理システムの一例である情報処理装置1の各ステップを備える。以下、本実施形態の情報処理の流れについて、アクティビティ図を交えながら説明する。
ところで、本実施形態の情報処理装置1は手続書面の作成を支援するものであるが、典型的には、特許出願手続又は実用新案登録出願手続の際の書面を作成する際に有用である。以下、これらの手続を「特許出願手続等」を称することもある。
なお、本節では、情報処理方法の流れについて本出願人の行った特許出願手続(特願2019-211333(特許第6709924号);以下「出願X」と称する。)を例に挙げて説明を行っていくこととする。
図3は、本実施形態の情報処理の流れを表すアクティビティ図である。
まず、このアクティビティを実行するに先立って、特許出願手続等を行おうとするユーザ(適法に手続書面の準備を行うことのできるユーザである以上、代理権の有無は問わない)は、手続書面を準備する。ここで、この手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類(典型的には「特許請求の範囲」)であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類(典型的には「明細書」)である。
なお、この手続書面は、たとえば1又は2以上の文書ファイル(Microsoft(登録商標) Wordによるワード形式等)で準備される。
情報処理装置1に対峙するユーザは、上述の手続書面をテキスト情報として受付部111に受け付けさせる(アクティビティA101)。この受付手法は種々の方法が採用できるが、たとえば、文書ファイル中に有効なマクロを設け、当該マクロの開始ボタンが押下されたことを契機に、受付部111に手続書面を受け付けさせるよう構成すればよい。
図4は、出願Xにかかる第1の書類の態様を表す図である。図5は、出願Xにかかる第2の書類の態様を表す図である。すなわち、図4の書類D1においては出願Xにおける特許請求の範囲の内容がテキスト形式で含まれており、図5の書類D2においては出願Xにおける明細書の内容がテキスト形式で含まれている。なお、書類D1における各請求項においては、請求項のそれぞれを識別しやすくするために、隅付き括弧部分に色が付されていてもよい。
なお、これらの図は簡略化のために、書類の一部の内容しか示していないものである。
また、これら書類D1および書類D2について、図4および図5ではそれぞれ別個に示したが、この書類の内容を連結したファイルが受付部111の受け付ける書類であってもよい。
このようにして制御部11が手続書面を受け付けると、生成部112は、受付部111が受け付けたテキスト情報の中から第1の書類で特定される発明又は考案に関する構成を表現する1以上のモデル文を生成する(アクティビティA102)。
図6は、生成部112が作成するモデル文の例を表す図である。この図6においては先述の出願Xの請求項1から請求項4の内容に関する構成を表現するモデル文が、それぞれモデル文MS1~モデル文MS4として示されている。なお、本実施形態において、各モデル文は、発明の構成の一部を表す文の集合体であってもよい。図6で示した例で説明すれば、モデル文MS1は、モデル文MS1a、MS1bおよびMS1cの集合体であるといってもよい。
通常、特許請求の範囲の記載は、物の発明や方法の発明を規定するために用いられ、結果として、各請求項で特定される内容は、末尾が動詞や助動詞(「である。」「です。」「ます。」など)とはならず、名詞により終結することが多い。
一方、生成部112は、このような名詞により終結する内容であっても、末尾が動詞である文としてモデル文を生成する。なお、後に行われる抽出の精度を向上させるために、このモデル文は単文であることが好ましい。
ここで、モデル文は、図6に示されるように、典型的には少なくとも動詞と、動詞とは異なる品詞とを含む。より具体的には、生成部112の作成するモデル文は、文末に動詞を含み、動詞より前に複数の品詞を配列させたモデル文である。モデル文MS1aを例に挙げると、このモデル文MS1aの中には「有する」という動詞の前に、その目的語である「表示制御部」と「色付け部」を含み、さらにこの目的語の前には主語である「情報処理装置」が配置される。
換言すれば、モデル文に含まれる動詞はモデル文における述語を構成する。また、モデル文に含まれる品詞のひとつはモデル文における文頭の主語を構成する。そして、モデル文に含まれる品詞のうち主語を構成しない品詞は、述語と主語との間の品詞として配される(図6等参照)。ここで、生成部112は、主語と述語との対応関係及び/又は述語と主語との間の品詞と述語との対応関係と、文法に関する参照情報と、に基づきこのモデル文を生成する構成を採用することができる。
すなわち、生成部112は、特許請求の範囲に記載のある構成について、その内容を認識した上で、単語の係り受けや文章としての主述関係等を考慮し、モデル文を生成する。典型的には、生成部112は、第1の書類で特定される発明又は考案に関する構成の文章としての主述関係と、文法に関する参照情報と、に基づきモデル文を生成する。この生成は文章の規則性等を蓄積したデータベースなどを参照情報として用いて実行されてもよいし、過去の特許出願手続等で用いられた表現を学習させた学習済みモデルを参照情報として用いて実行されてもよい。
続いて、抽出部113は、第2の書類の中からモデル文に関連する文を、第1の文として抽出する(アクティビティA103)。
ここで、「関連する文」とは、典型的には類似性の高い文であってもよく、抽出部113は、複数の品詞の配列を根拠に第1の文を抽出する。すなわち、図6に示したように、モデル文は動詞より前に品詞が配列されているが、本実施形態の抽出部113はこの品詞の配列を根拠に第1の文を類似性の高い文として抽出する。
具体的に、モデル文MS1aにおいては、「有する」という動詞の前に、「情報処理装置」「表示制御部」「色付け部」という名詞が配列されており、これらの名詞の間に「は」や「と」といった助詞が介在している。抽出部113は第2の書類(すなわち、明細書)の中から、この品詞の配列に類似する箇所を特定し、その特定した文を第1の文として抽出する。
たとえば、出願Xにおいては、[0014]に「図3に示されるように、情報処理装置100は、機能構成として、表示制御部301と、色付け部302と、変更部303と、抽出部304と、削除部305と、を含む。」という文章があるが、本実施形態の情報処理装置1は、各名詞の配列等を根拠に、この文章を第1の文として抽出する。
なお、この抽出の処理を行うにあたり、根拠となる品詞そのものが第2の書面になくとも、抽出部113は、品詞同士の類似性等を考慮の上、第1の文を抽出することができる。たとえば、モデル文が「Aは、Bステップよりも早くCステップを行う。」というものである場合、この「早く」部分について「早期に」「先立って」「より前に」といった意味の近い品詞を抽出し、これを抽出部113が第1の文の抽出の根拠としてもよい。なお、このように意味の近い品詞である場合は、相対的に関連性(類似性)の低い文であるものとして抽出操作が行われてもよい。
また、この抽出部113が処理を行うにあたり、末尾の動詞も抽出の根拠の一部としてもよい。この際、抽出部113は、根拠とすべき動詞の類似性を参酌することもできる。たとえば、モデル文が「Dは、Eを有する。」というものである場合、この「有する」部分について「備える」「含む」「具備する」といった近い意味の動詞を抽出し、これを抽出部113が第1の文の抽出の根拠としてもよい。このように意味の近い動詞を根拠に第1の文を抽出する場合は、相対的に関連性(類似性)の低い文であるものとして抽出操作が行われてもよい。
また、抽出部113は、第2の書類(明細書)を構成する複数の文の一部の範囲については抽出を実行する範囲から除外し、残された範囲から第1の文を抽出する態様とすることができる。
すなわち、出願Xには[0006]や[0023]など特許請求の範囲をそのまま引き写した記載(いわゆるリクレームと呼ばれる記載)がある。文書のチェックなどを行うに際して、このような引き写し部分について、発明等の構成に対応する記載があるのは当然であるので、抽出部113の抽出を行う範囲を制限することも可能である。この制限は自動で行われるものであっても、手動で行わるものであってもよい。典型的には、抽出部113が抽出を行う範囲を、出願Xの[発明を実施するための形態]という記載の後から、[0024]のリクレームを行う記載の前まで、と予め設定することができる。なお、このような抽出の制限は、明細書に用いる所定の文言を事前に設定しておき、その間での抽出操作が行われるように事前制御することで実現可能である。
また、抽出部113が抽出を行うのは第1の文のみ(ひとつの文のみ)でなくてもよい。すなわち、抽出部113は、第2の書類の中から第1の文以外のモデル文に関連する第2の文をさらに抽出するように構成されていてもよい。ここで、このように抽出される文が複数ある場合は、それぞれの文の、モデル文に対しての関連性(類似性)について、順序付けを行った上で抽出操作が行われていてもよい。
たとえば、出願Xの[0014]には、「情報処理装置100が表示制御部301と色付け部302とを有することによって、オートボタンが選択された場合、書類(例えば、特許請求の範囲)に含まれる設定された言葉(例えば、請求項1、請求項2、・・・)にそれぞれ異なる色が付けられるので、書類を見慣れない人であっても、視覚的に書類に設定された言葉がいくつあるか把握することができ、読みやすい書類の作成を支援する技術を提供することができる。」との文があるが、この文においても「情報処理装置」「表示制御部」「色付け部」という各種品詞があることから、第1の文の候補として挙がりうる。本実施形態の抽出部113は、このようなモデル文に関連性(類似性)のある文章を第2の文として抽出することができる。
図7は、抽出部113が抽出した第1の文の内容を表す図である。この図7のように抽出部113の抽出した第1の文の候補は、その文の存在する段落や、具体的な記載、またキーワードの充足度と紐付けられた上で抽出される。なお、ここでのキーワードの充足度とは、前述の品詞の配列が類似する箇所について、その類似性を数値化したものであり、典型的には、文中の品詞(キーワード)が、第1の文の候補の中にどれだけ充足されているかを数値化したものである。
なお、第1の文について、発明等の構成に対する第1の文の充足度が所定の閾値を超過することを条件として、抽出部113が第1の文を抽出するように構成することが好ましい。
すなわち、前述のように生成部112は、受付部111で受け付けたテキスト情報の中から第1の書類で特定される発明又は考案に関する構成を表現する1以上のモデル文を生成することができ、このモデル文は、少なくとも文末に動詞、および、動詞より前に動詞とは異なる品詞を複数含むことができる。
これに対し、抽出部113は、モデル文における動詞および複数の品詞の配列の類似性を根拠に、第2の書類を構成する複数の文から、所定の閾値を超過した、第1の書類で特定すされる発明又は考案に関する構成に類似性の高い文を第1の文として抽出することができる。
この類似性の判断は、一例として、モデル文の主語、述語および主語と述語との間の品詞のそれぞれの内容と、配列(文章としての係り受け)等に基づいて行われる。
また、図7に示されるように、抽出部113は、第1の書類で特定しようとする発明又は考案が複数存在する場合に、複数存在する発明又は考案のそれぞれについて第1の文を抽出するよう構成することもできる。すなわち、第1の書類における請求項が2以上ある場合は、各請求項に対応する構成について、第1の文を抽出することができる。図7においては、請求項2、3・・・についての第1の文を抽出した結果が示されている。
以上のようにして第1の文を抽出できた場合は、その第1の文をユーザが把握可能に表示させる(アクティビティA104)。
この表示の態様は適宜選択することができるが、たとえば表示制御部114が、手続書面のファイル上で第1の文をユーザが把握可能に表示させる態様をとることができる。すなわち、第2の書面をテキスト形式で表示する文書ファイルの中で、この第1の文に種々のマーキング等がされ、これをもって、ユーザが第1の文を把握するように構成されてもよい。ここで、表示制御部114は、抽出部113で抽出された第1の文と、第1の書類で特定される発明又は考案に関する構成との対応関係をユーザが把握可能に表示させることが好ましい。たとえば、文書ファイルの第1の文に相当する箇所に、「請求項1・構成1」などの注釈がコメント機能などにより示される態様とすることができる。
なお、第1の文となる候補が複数ある場合、すなわち、第1の文のほか、第2の文が存在する場合は、表示制御部114は、抽出部で抽出された第1の文と第2の文とを、ともにユーザが把握可能に表示させるように構成することもできる。
ここで表示制御部114は、第1の文と第2の文とを、ユーザが識別可能に表示させることが好ましい。たとえば、図7に示した請求項1の構成1に対しては、候補1と候補2とで充足度が異なるものであったが、表示制御部114は、第1の文(候補1の文)を表示する箇所と第2の文(候補2の文)を表示する箇所とが互いに色彩が異なるように表示させる態様とすることができる。典型的には、図4の第1の書類D1においては請求項毎に色分けがされているが、この請求項に対応する色について濃淡を変更させることによって、類似の度合(充足度)の違いを示すように構成することも可能である。
また、このように第1の文と第2の文とが存在する場合には、表示制御部114は、第1の文の関連性と第2の文の関連性とを、各々スコアにより表示させるように構成することもできる。典型的な例としては、文書ファイルの第1の文に相当する箇所に、「請求項1・構成1」などのマーキングをコメント機能で行うに加えて、このコメント中にスコア(類似の度合や充足度を数値化したもの)を追記するような構成とすることも可能である。
また、第1の書類に請求項が複数ある場合、表示制御部114は、複数存在する発明又は考案のそれぞれに対応する第1の文を、複数存在する発明又は考案の内容に応じてユーザが識別可能に表示するように構成することも可能である。すなわち、第2の書類(明細書)中の請求項1の構成に対応する文と、請求項2の構成に対応する文とを、それぞれユーザが識別可能となるように表示することができる。典型的には、図4の第1の書類D1においては請求項毎に色分けがされているが、この請求項に対応する色(類似色を含む)を、第1の文の箇所に示すように構成することも可能である。
さらに、表示制御部114は、第1の書類の各請求項を示す箇所に、第1の文の類似の度合や充足度を考慮し、サポート度合を表示させてもよい。図8は、第1の書類の各請求項上にサポート度合を表示させる態様を説明するための図である。この図8に示されるように、各請求項についての明細書での充足の度合が第1の書類(書類D1)上に示され、これを確認したユーザは、この充足度の低い請求項について重点的にチェックを行うなどの対応をとることができる。
なお、以上は、第1の文を抽出できた場合の表示制御にかかる説明であるが、本実施形態の情報処理装置1は、抽出部113が、第2の書類を構成する複数の文の中に所定の基準を満足する第1の文が抽出できない場合、表示制御部114は、第1の文が存在しないことをユーザが把握可能に表示させるように構成されてもよい。すなわち、第2の書類中に第1の文が存在しないと示唆される場合は、表示制御部114は、第1の文が不存在である旨を表示するように制御する(アクティビティA105)。
図9は、ユーザに表示される警告画面の一例である。すなわち、抽出部113が、ある請求項について第1の文を抽出できない場合は、その請求項についてサポート漏れの懸念があることとなる。これに対し、表示制御部114はこのようなサポート漏れの懸念や、ユーザに対する確認依頼を求めるよう、警告画面を表示部14に表示させることができる。なお、この所定の基準に満たないかどうかの判断は前述の通り、発明等の構成に対する第1の文の充足度が所定の閾値を超過していないことを根拠に行われる。
以上のようにして、本実施形態の情報処理システム1は、書類上で発明等をサポートしている箇所を把握しやすくすることができる。
4.その他
前述した情報処理装置システムに関して、以下のような態様を採用してもよい。
前述の実施形態では、情報処理装置1の構成として種々の機能を説明したが、コンピュータに、情報処理システムの一例である情報処理装置1の各ステップを実行させるプログラムが提供されてもよい。
前述の実施形態では、第2の書面をテキスト形式で表示する文書ファイルの中で、この第1の文に種々のマーキング等がされ、これをもって、ユーザが第1の文を把握させる態様を示したが、たとえば、前述した図7のように、請求項の構成と、第1の文の候補とをリスト化し、これを表示制御部114がユーザに表示させる態様をとることができる。ここでリストを表示させる箇所は文書ファイルであっても、他のファイル(CSVファイル等)であってもよい。
前述の実施形態では、受付部111、生成部112、抽出部113および表示制御部114を、情報処理装置1の制御部11によって実現される機能部として説明しているが、この少なくとも一部を、他の装置において実施することで、情報処理システムを実現してもよい。すなわち、情報処理システムは、オンプレミス形態であってもよく、クラウド形態であってもよい。クラウド形態の情報処理システムとしては、例えば、SaaS(Software as a Service)、クラウドコンピューティングという形態で、上記の機能や処理を提供してもよい。
前述の実施形態において説明した、関連する文を特定するアルゴリズムは例示であり、これに限定されるものではない。例えば、既存の自然言語処理分野における、形態素解析、文書ベクトル等が用いられてもよい。
さらに、次に記載の各態様で提供されてもよい。
(1)手続書面の作成を支援する情報処理システムであって、制御部を備え、前記制御部は、次の各ステップを実行するように構成され、受付ステップでは、前記手続書面に含まれるテキスト情報を受け付け、ここで前記手続書面は、第1の書類と第2の書類とを含み、前記第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、前記第2の書類は前記発明又は前記考案を複数の文によって説明しようとする書類であり、抽出ステップでは、前記第2の書類を構成する複数の前記文から、所定の基準を満足し、かつ、前記第1の書類で特定される前記発明又は前記考案に関する構成に関連性の高い文を第1の文として抽出し、表示制御ステップでは、前記抽出ステップで抽出された前記第1の文をユーザが把握可能に表示させる、もの。
(2)上記(1)に記載の情報処理システムにおいて、さらに、生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を生成し、前記抽出ステップでは、前記第2の書類の中から前記モデル文に関連する文を、前記第1の文として抽出する、もの。
(3)上記(2)に記載の情報処理システムにおいて、前記モデル文は、少なくとも動詞と、動詞とは異なる品詞とを含む、もの。
(4)上記(3)に記載の情報処理システムにおいて、前記生成ステップでは、前記モデル文として、文末に前記動詞を含み、前記動詞より前に複数の品詞を配列させたモデル文を生成する、もの。
(5)上記(4)に記載の情報処理システムにおいて、前記抽出ステップでは、前記複数の品詞の配列を根拠に前記第1の文を抽出する、もの。
(6)上記(2)ないし(5)のいずれかに記載の情報処理システムにおいて、前記抽出ステップでは、前記第2の書類の中から前記第1の文以外の前記モデル文に関連する第2の文をさらに抽出し、前記表示制御ステップでは、前記抽出ステップで抽出された前記第2の文を前記ユーザが把握可能に表示させる、もの。
(7)上記(6)に記載の情報処理システムにおいて、前記表示制御ステップでは、前記第1の文と前記第2の文とを、前記ユーザが識別可能に表示させる、もの。
(8)上記(7)に記載の情報処理システムにおいて、前記表示制御ステップでは、前記第1の文を表示する箇所と前記第2の文を表示する箇所とが互いに色彩が異なるように表示させる、もの。
(9)上記(7)に記載の情報処理システムにおいて、前記表示制御ステップでは、前記第1の文の関連性と前記第2の文の関連性とを、各々スコアにより表示させる、もの。
(10)上記(1)ないし(9)のいずれか1つに記載の情報処理システムにおいて、前記表示制御ステップでは、前記抽出ステップで抽出された前記第1の文と、前記第1の書類で特定される前記発明又は前記考案に関する前記構成との対応関係を前記ユーザが把握可能に表示させる、もの。
(11)上記(1)ないし(10)のいずれか1つに記載の情報処理システムにおいて、前記表示制御ステップでは、前記手続書面のファイル上で前記第1の文を前記ユーザが把握可能に表示させる、もの。
(12)上記(1)ないし(11)のいずれか1つに記載の情報処理システムにおいて、前記抽出ステップでは、前記第1の書類で特定しようとする前記発明又は前記考案が複数存在する場合に、複数存在する前記発明又は前記考案のそれぞれについて前記第1の文を抽出する、もの。
(13)上記(12)に記載の情報処理システムにおいて、前記表示制御ステップでは、前記複数存在する前記発明又は前記考案のそれぞれに対応する前記第1の文を、複数存在する前記発明又は前記考案の内容に応じて前記ユーザが識別可能に表示する、もの。
(14)上記(1)ないし(13)のいずれか1つに記載の情報処理システムにおいて、前記抽出ステップで、前記第2の書類を構成する複数の前記文の中に前記所定の基準を満足する前記第1の文が抽出されない場合、前記表示制御ステップでは、前記第1の文が存在しないことを前記ユーザが把握可能に表示させる、もの。
(15)上記(1)ないし(14)のいずれか1つに記載の情報処理システムにおいて、前記抽出ステップでは、前記第2の書類を構成する複数の前記文の一部の範囲については前記抽出ステップを実行する範囲から除外し、残された範囲から前記第1の文を抽出する、もの。
(16)上記(1)に記載の情報処理システムにおいて、さらに、生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を生成し、ここで、前記モデル文は、少なくとも文末に動詞、および、前記動詞より前に前記動詞とは異なる品詞を複数含み、前記抽出ステップでは、前記モデル文における前記動詞および複数の前記品詞の配列の類似性を根拠に、前記第2の書類を構成する複数の前記文から、所定の閾値を超過した、前記第1の書類で特定すされる前記発明又は前記考案に関する構成に類似性の高い文を前記第1の文として抽出する、もの。
(17)上記(16)に記載の情報処理システムにおいて、前記生成ステップでは、前記第1の書類で特定される前記発明又は考案に関する構成の文章としての主述関係と、文法に関する参照情報と、に基づき前記モデル文を生成する、もの。
(18)上記(17)に記載の情報処理システムにおいて、前記参照情報は、文章の規則性を蓄積したデータベース及び文法表現を学習させた学習済みモデルからなる群から選択されるものである、もの。
(19)上記(16)に記載の情報処理システムにおいて、前記モデル文に含まれる前記動詞は前記モデル文における述語を構成し、前記モデル文に含まれる前記品詞のひとつは前記モデル文における文頭の主語を構成し、前記モデル文に含まれる前記品詞のうち前記主語を構成しない品詞は、前記述語と前記主語との間の品詞として配され、前記生成ステップでは、前記主語と前記述語との対応関係及び/又は前記述語と前記主語との間の前記品詞と前記述語との対応関係と、文法に関する参照情報と、に基づき前記モデル文を生成する、もの。
(20)情報処理方法であって、上記(1)ないし(19)のいずれか1つに記載の情報処理システムの各ステップを備える、方法。
(21)プログラムであって、コンピュータに上記(1)ないし(19)のいずれか1つに記載の情報処理システムの各ステップを実行させる、もの。
もちろん、この限りではない。
最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1 :情報処理装置
10 :通信バス
11 :制御部
12 :記憶部
13 :入力部
14 :表示部
15 :通信部
100 :情報処理装置
111 :受付部
112 :生成部
113 :抽出部
114 :表示制御部
301 :表示制御部
302 :色付け部
303 :変更部
304 :抽出部
305 :削除部
D1、D2 :書類
MS1、MS1a、MS1b、MS1c、MS2、MS2a、MS2b、MS2c、MS3、MS3a、MS3b、MS3c、MS4 :モデル文

Claims (12)

  1. 手続書面の作成を支援する情報処理システムであって、
    制御部を備え、
    前記制御部は、次の各ステップを実行するように構成され、
    受付ステップでは、前記手続書面に含まれるテキスト情報を受け付け、ここで、前記手続書面は、第1の書類と第2の書類とを含み、前記第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、前記第2の書類は前記発明又は前記考案を複数の文によって説明しようとする書類であり、
    生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を、前記第1の書類で特定される前記発明又は前記考案に関する構成の文章としての主述関係および前記発明又は前記考案を表現する複数種の単語における係り受けと、文法に関する参照情報と、に基づき生成し、
    ここで、前記モデル文は、少なくとも文末に動詞、および、前記動詞より前に前記動詞とは異なる品詞を複数含み、
    前記モデル文に含まれる前記動詞は前記モデル文における述語を構成し、
    前記モデル文に含まれる前記品詞のひとつは前記モデル文における文頭の主語を構成し、
    前記モデル文に含まれる前記品詞のうち前記主語を構成しない品詞は、前記述語と前記主語との間の品詞として配され、
    前記参照情報は、文章の規則性を蓄積したデータベース及び文法表現を学習させた学習済みモデルからなる群から選択されるものであり
    抽出ステップでは、前記モデル文における前記動詞および複数の前記品詞の配列の類似性を根拠に、前記第2の書類を構成する複数の前記文から、所定の閾値を超過した、前記第1の書類で特定される前記発明又は前記考案に関する構成に類似性の高い文を第1の文として抽出し、
    表示制御ステップでは、前記抽出ステップで抽出された前記第1の文をユーザが把握可能に表示させる、もの。
  2. 請求項1に記載の情報処理システムにおいて、
    前記抽出ステップでは、前記第2の書類の中から前記第1の文以外の前記モデル文に類似する第2の文をさらに抽出し、
    前記表示制御ステップでは、前記抽出ステップで抽出された前記第2の文を前記ユーザが把握可能に表示させる、もの。
  3. 請求項2に記載の情報処理システムにおいて、
    前記表示制御ステップでは、前記第1の文と前記第2の文とを、前記ユーザが識別可能に表示させる、もの。
  4. 請求項3に記載の情報処理システムにおいて、
    前記表示制御ステップでは、前記第1の文を表示する箇所と前記第2の文を表示する箇所とが互いに色彩が異なるように表示させる、もの。
  5. 請求項3に記載の情報処理システムにおいて、
    前記表示制御ステップでは、前記第1の文の類似性と前記第2の文の類似性とを、各々スコアにより表示させる、もの。
  6. 請求項1に記載の情報処理システムにおいて、
    前記表示制御ステップでは、前記手続書面のファイル上で前記第1の文を前記ユーザが把握可能に表示させる、もの。
  7. 請求項1に記載の情報処理システムにおいて、
    前記抽出ステップでは、前記第1の書類で特定しようとする前記発明又は前記考案が複数存在する場合に、複数存在する前記発明又は前記考案のそれぞれについて前記第1の文を抽出する、もの。
  8. 請求項7に記載の情報処理システムにおいて、
    前記表示制御ステップでは、前記複数存在する前記発明又は前記考案のそれぞれに対応する前記第1の文を、複数存在する前記発明又は前記考案の内容に応じて前記ユーザが識別可能に表示する、もの。
  9. 請求項1に記載の情報処理システムにおいて、
    前記抽出ステップで、前記第2の書類を構成する複数の前記文の中に前記所定の基準を満足する前記第1の文が抽出されない場合、
    前記表示制御ステップでは、前記第1の文が存在しないことを前記ユーザが把握可能に表示させる、もの。
  10. 請求項1に記載の情報処理システムにおいて、
    前記抽出ステップでは、前記第2の書類を構成する複数の前記文の一部の範囲については前記抽出ステップを実行する範囲から除外し、残された範囲から前記第1の文を抽出する、もの。
  11. 情報処理方法であって、
    請求項1ないし請求項10のいずれか1項に記載の情報処理システムの各ステップを備える、方法。
  12. プログラムであって、
    コンピュータに請求項1ないし請求項10のいずれか1項に記載の情報処理システムの各ステップを実行させる、もの。
JP2022144310A 2022-03-31 2022-09-12 情報処理システム、情報処理方法及びプログラム Active JP7333533B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023035915A JP2023152789A (ja) 2022-03-31 2023-03-08 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022059294 2022-03-31
JP2022059294 2022-03-31

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023035915A Division JP2023152789A (ja) 2022-03-31 2023-03-08 情報処理システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP7333533B1 true JP7333533B1 (ja) 2023-08-25
JP2023152281A JP2023152281A (ja) 2023-10-16

Family

ID=87654354

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022144310A Active JP7333533B1 (ja) 2022-03-31 2022-09-12 情報処理システム、情報処理方法及びプログラム
JP2023035915A Pending JP2023152789A (ja) 2022-03-31 2023-03-08 情報処理システム、情報処理方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023035915A Pending JP2023152789A (ja) 2022-03-31 2023-03-08 情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (2) JP7333533B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003186870A (ja) 2001-12-18 2003-07-04 Seiko Epson Corp 文書表示方法、文書表示装置、プログラムおよび記録媒体
JP2004133896A (ja) 2002-08-14 2004-04-30 Masatoshi Shibuya 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム
JP2004246559A (ja) 2003-02-13 2004-09-02 System Japan:Kk 請求の範囲についての補助資料作成方法
JP2017211993A (ja) 2016-05-27 2017-11-30 雲拓科技有限公司 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003186870A (ja) 2001-12-18 2003-07-04 Seiko Epson Corp 文書表示方法、文書表示装置、プログラムおよび記録媒体
JP2004133896A (ja) 2002-08-14 2004-04-30 Masatoshi Shibuya 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム
JP2004246559A (ja) 2003-02-13 2004-09-02 System Japan:Kk 請求の範囲についての補助資料作成方法
JP2017211993A (ja) 2016-05-27 2017-11-30 雲拓科技有限公司 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法

Also Published As

Publication number Publication date
JP2023152789A (ja) 2023-10-17
JP2023152281A (ja) 2023-10-16

Similar Documents

Publication Publication Date Title
EP4113354A2 (en) Method and apparatus for generating pre-trained language model, electronic device and storage medium
CN103678704A (zh) 一种基于图片信息的识图方法、系统、设备及装置
KR20110059551A (ko) 프로그램 생성 장치, 프로그램 생성 방법, 및 컴퓨터로 판독 가능한 기억 매체
US20180018315A1 (en) Information processing device, program, and information processing method
JP7309811B2 (ja) データ注釈方法、装置、電子機器および記憶媒体
JP6885506B2 (ja) 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
JP2010079447A (ja) バグ検出支援プログラム、類似構文識別情報一覧出力プログラム、バグ検出支援装置およびバグ検出支援方法
JP7333533B1 (ja) 情報処理システム、情報処理方法及びプログラム
JP7433068B2 (ja) 文書におけるタイトル及びセクションの推測
US11328236B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20180144309A1 (en) System and Method for Determining Valid Request and Commitment Patterns in Electronic Messages
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2021105919A (ja) 情報処理装置、及びコンピュータプログラム
JP7362160B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN113656034B (zh) 信息处理方法、装置、电子设备以及存储介质
JP6260160B2 (ja) 重複出力制御装置、重複出力制御方法、重複出力制御プログラムおよび記録媒体
US20230306190A1 (en) Information processing system, non-transitory computer readable medium storing program, and information processing method
JP7095376B2 (ja) 情報処理装置及び情報処理プログラム
JP7095377B2 (ja) 情報処理装置及び情報処理プログラム
JP7442896B1 (ja) プログラム、情報処理システム及び情報処理方法
JP2007004429A (ja) 文書処理装置
JP2024055308A (ja) 情報処理システム、情報処理方法及びプログラム
JP5924073B2 (ja) 制御プログラム、制御方法および制御装置
CN104932710A (zh) 外挂输入法及外挂输入系统
JP5840269B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220912

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230802

R150 Certificate of patent or registration of utility model

Ref document number: 7333533

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150