JP7333533B1 - 情報処理システム、情報処理方法及びプログラム - Google Patents
情報処理システム、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP7333533B1 JP7333533B1 JP2022144310A JP2022144310A JP7333533B1 JP 7333533 B1 JP7333533 B1 JP 7333533B1 JP 2022144310 A JP2022144310 A JP 2022144310A JP 2022144310 A JP2022144310 A JP 2022144310A JP 7333533 B1 JP7333533 B1 JP 7333533B1
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- information processing
- processing system
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
Description
この点について、従来技術においては、請求項に係る発明が、明細書等のどこにサポートされているかを瞬時に把握するのは困難であった。
本節では、本実施形態のハードウェア構成について説明する。本実施形態において、情報処理システムとは、1つ又はそれ以上の装置又は構成要素からなるものである。したがって、例えば情報処理装置1単体であっても情報処理システムの一例となる。以下、情報処理システムの一例である情報処理装置1のハードウェア構成について説明する。
本節では、本実施形態の機能構成について説明する。前述の通り、記憶部12に記憶されているソフトウェアによる情報処理がハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部が実行されうる。換言すると、情報処理システムの一例である情報処理装置1は、制御部11(プロセッサ)を備える。制御部11は、各機能部のステップを実行させるプログラムを実行するように構成される。
本節では、前述した情報処理装置1の情報処理方法について説明する。本実施形態に係る情報処理方法は、前述の、情報処理システムの一例である情報処理装置1の各ステップを備える。以下、本実施形態の情報処理の流れについて、アクティビティ図を交えながら説明する。
なお、本節では、情報処理方法の流れについて本出願人の行った特許出願手続(特願2019-211333(特許第6709924号);以下「出願X」と称する。)を例に挙げて説明を行っていくこととする。
まず、このアクティビティを実行するに先立って、特許出願手続等を行おうとするユーザ(適法に手続書面の準備を行うことのできるユーザである以上、代理権の有無は問わない)は、手続書面を準備する。ここで、この手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類(典型的には「特許請求の範囲」)であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類(典型的には「明細書」)である。
なお、この手続書面は、たとえば1又は2以上の文書ファイル(Microsoft(登録商標) Wordによるワード形式等)で準備される。
なお、これらの図は簡略化のために、書類の一部の内容しか示していないものである。
また、これら書類D1および書類D2について、図4および図5ではそれぞれ別個に示したが、この書類の内容を連結したファイルが受付部111の受け付ける書類であってもよい。
一方、生成部112は、このような名詞により終結する内容であっても、末尾が動詞である文としてモデル文を生成する。なお、後に行われる抽出の精度を向上させるために、このモデル文は単文であることが好ましい。
換言すれば、モデル文に含まれる動詞はモデル文における述語を構成する。また、モデル文に含まれる品詞のひとつはモデル文における文頭の主語を構成する。そして、モデル文に含まれる品詞のうち主語を構成しない品詞は、述語と主語との間の品詞として配される(図6等参照)。ここで、生成部112は、主語と述語との対応関係及び/又は述語と主語との間の品詞と述語との対応関係と、文法に関する参照情報と、に基づきこのモデル文を生成する構成を採用することができる。
すなわち、生成部112は、特許請求の範囲に記載のある構成について、その内容を認識した上で、単語の係り受けや文章としての主述関係等を考慮し、モデル文を生成する。典型的には、生成部112は、第1の書類で特定される発明又は考案に関する構成の文章としての主述関係と、文法に関する参照情報と、に基づきモデル文を生成する。この生成は文章の規則性等を蓄積したデータベースなどを参照情報として用いて実行されてもよいし、過去の特許出願手続等で用いられた表現を学習させた学習済みモデルを参照情報として用いて実行されてもよい。
ここで、「関連する文」とは、典型的には類似性の高い文であってもよく、抽出部113は、複数の品詞の配列を根拠に第1の文を抽出する。すなわち、図6に示したように、モデル文は動詞より前に品詞が配列されているが、本実施形態の抽出部113はこの品詞の配列を根拠に第1の文を類似性の高い文として抽出する。
たとえば、出願Xにおいては、[0014]に「図3に示されるように、情報処理装置100は、機能構成として、表示制御部301と、色付け部302と、変更部303と、抽出部304と、削除部305と、を含む。」という文章があるが、本実施形態の情報処理装置1は、各名詞の配列等を根拠に、この文章を第1の文として抽出する。
すなわち、出願Xには[0006]や[0023]など特許請求の範囲をそのまま引き写した記載(いわゆるリクレームと呼ばれる記載)がある。文書のチェックなどを行うに際して、このような引き写し部分について、発明等の構成に対応する記載があるのは当然であるので、抽出部113の抽出を行う範囲を制限することも可能である。この制限は自動で行われるものであっても、手動で行わるものであってもよい。典型的には、抽出部113が抽出を行う範囲を、出願Xの[発明を実施するための形態]という記載の後から、[0024]のリクレームを行う記載の前まで、と予め設定することができる。なお、このような抽出の制限は、明細書に用いる所定の文言を事前に設定しておき、その間での抽出操作が行われるように事前制御することで実現可能である。
たとえば、出願Xの[0014]には、「情報処理装置100が表示制御部301と色付け部302とを有することによって、オートボタンが選択された場合、書類(例えば、特許請求の範囲)に含まれる設定された言葉(例えば、請求項1、請求項2、・・・)にそれぞれ異なる色が付けられるので、書類を見慣れない人であっても、視覚的に書類に設定された言葉がいくつあるか把握することができ、読みやすい書類の作成を支援する技術を提供することができる。」との文があるが、この文においても「情報処理装置」「表示制御部」「色付け部」という各種品詞があることから、第1の文の候補として挙がりうる。本実施形態の抽出部113は、このようなモデル文に関連性(類似性)のある文章を第2の文として抽出することができる。
なお、第1の文について、発明等の構成に対する第1の文の充足度が所定の閾値を超過することを条件として、抽出部113が第1の文を抽出するように構成することが好ましい。
すなわち、前述のように生成部112は、受付部111で受け付けたテキスト情報の中から第1の書類で特定される発明又は考案に関する構成を表現する1以上のモデル文を生成することができ、このモデル文は、少なくとも文末に動詞、および、動詞より前に動詞とは異なる品詞を複数含むことができる。
これに対し、抽出部113は、モデル文における動詞および複数の品詞の配列の類似性を根拠に、第2の書類を構成する複数の文から、所定の閾値を超過した、第1の書類で特定すされる発明又は考案に関する構成に類似性の高い文を第1の文として抽出することができる。
この類似性の判断は、一例として、モデル文の主語、述語および主語と述語との間の品詞のそれぞれの内容と、配列(文章としての係り受け)等に基づいて行われる。
ここで表示制御部114は、第1の文と第2の文とを、ユーザが識別可能に表示させることが好ましい。たとえば、図7に示した請求項1の構成1に対しては、候補1と候補2とで充足度が異なるものであったが、表示制御部114は、第1の文(候補1の文)を表示する箇所と第2の文(候補2の文)を表示する箇所とが互いに色彩が異なるように表示させる態様とすることができる。典型的には、図4の第1の書類D1においては請求項毎に色分けがされているが、この請求項に対応する色について濃淡を変更させることによって、類似の度合(充足度)の違いを示すように構成することも可能である。
前述した情報処理装置システムに関して、以下のような態様を採用してもよい。
もちろん、この限りではない。
10 :通信バス
11 :制御部
12 :記憶部
13 :入力部
14 :表示部
15 :通信部
100 :情報処理装置
111 :受付部
112 :生成部
113 :抽出部
114 :表示制御部
301 :表示制御部
302 :色付け部
303 :変更部
304 :抽出部
305 :削除部
D1、D2 :書類
MS1、MS1a、MS1b、MS1c、MS2、MS2a、MS2b、MS2c、MS3、MS3a、MS3b、MS3c、MS4 :モデル文
Claims (12)
- 手続書面の作成を支援する情報処理システムであって、
制御部を備え、
前記制御部は、次の各ステップを実行するように構成され、
受付ステップでは、前記手続書面に含まれるテキスト情報を受け付け、ここで、前記手続書面は、第1の書類と第2の書類とを含み、前記第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、前記第2の書類は前記発明又は前記考案を複数の文によって説明しようとする書類であり、
生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を、前記第1の書類で特定される前記発明又は前記考案に関する構成の文章としての主述関係および前記発明又は前記考案を表現する複数種の単語における係り受けと、文法に関する参照情報と、に基づき生成し、
ここで、前記モデル文は、少なくとも文末に動詞、および、前記動詞より前に前記動詞とは異なる品詞を複数含み、
前記モデル文に含まれる前記動詞は前記モデル文における述語を構成し、
前記モデル文に含まれる前記品詞のひとつは前記モデル文における文頭の主語を構成し、
前記モデル文に含まれる前記品詞のうち前記主語を構成しない品詞は、前記述語と前記主語との間の品詞として配され、
前記参照情報は、文章の規則性を蓄積したデータベース及び文法表現を学習させた学習済みモデルからなる群から選択されるものであり、
抽出ステップでは、前記モデル文における前記動詞および複数の前記品詞の配列の類似性を根拠に、前記第2の書類を構成する複数の前記文から、所定の閾値を超過した、前記第1の書類で特定される前記発明又は前記考案に関する構成に類似性の高い文を第1の文として抽出し、
表示制御ステップでは、前記抽出ステップで抽出された前記第1の文をユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第2の書類の中から前記第1の文以外の前記モデル文に類似する第2の文をさらに抽出し、
前記表示制御ステップでは、前記抽出ステップで抽出された前記第2の文を前記ユーザが把握可能に表示させる、もの。 - 請求項2に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文と前記第2の文とを、前記ユーザが識別可能に表示させる、もの。 - 請求項3に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文を表示する箇所と前記第2の文を表示する箇所とが互いに色彩が異なるように表示させる、もの。 - 請求項3に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文の類似性と前記第2の文の類似性とを、各々スコアにより表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記手続書面のファイル上で前記第1の文を前記ユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第1の書類で特定しようとする前記発明又は前記考案が複数存在する場合に、複数存在する前記発明又は前記考案のそれぞれについて前記第1の文を抽出する、もの。 - 請求項7に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記複数存在する前記発明又は前記考案のそれぞれに対応する前記第1の文を、複数存在する前記発明又は前記考案の内容に応じて前記ユーザが識別可能に表示する、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップで、前記第2の書類を構成する複数の前記文の中に前記所定の基準を満足する前記第1の文が抽出されない場合、
前記表示制御ステップでは、前記第1の文が存在しないことを前記ユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第2の書類を構成する複数の前記文の一部の範囲については前記抽出ステップを実行する範囲から除外し、残された範囲から前記第1の文を抽出する、もの。 - 情報処理方法であって、
請求項1ないし請求項10のいずれか1項に記載の情報処理システムの各ステップを備える、方法。 - プログラムであって、
コンピュータに請求項1ないし請求項10のいずれか1項に記載の情報処理システムの各ステップを実行させる、もの。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023035915A JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022059294 | 2022-03-31 | ||
JP2022059294 | 2022-03-31 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023035915A Division JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7333533B1 true JP7333533B1 (ja) | 2023-08-25 |
JP2023152281A JP2023152281A (ja) | 2023-10-16 |
Family
ID=87654354
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022144310A Active JP7333533B1 (ja) | 2022-03-31 | 2022-09-12 | 情報処理システム、情報処理方法及びプログラム |
JP2023035915A Pending JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023035915A Pending JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7333533B1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186870A (ja) | 2001-12-18 | 2003-07-04 | Seiko Epson Corp | 文書表示方法、文書表示装置、プログラムおよび記録媒体 |
JP2004133896A (ja) | 2002-08-14 | 2004-04-30 | Masatoshi Shibuya | 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム |
JP2004246559A (ja) | 2003-02-13 | 2004-09-02 | System Japan:Kk | 請求の範囲についての補助資料作成方法 |
JP2017211993A (ja) | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
-
2022
- 2022-09-12 JP JP2022144310A patent/JP7333533B1/ja active Active
-
2023
- 2023-03-08 JP JP2023035915A patent/JP2023152789A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186870A (ja) | 2001-12-18 | 2003-07-04 | Seiko Epson Corp | 文書表示方法、文書表示装置、プログラムおよび記録媒体 |
JP2004133896A (ja) | 2002-08-14 | 2004-04-30 | Masatoshi Shibuya | 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム |
JP2004246559A (ja) | 2003-02-13 | 2004-09-02 | System Japan:Kk | 請求の範囲についての補助資料作成方法 |
JP2017211993A (ja) | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2023152789A (ja) | 2023-10-17 |
JP2023152281A (ja) | 2023-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4113354A2 (en) | Method and apparatus for generating pre-trained language model, electronic device and storage medium | |
CN103678704A (zh) | 一种基于图片信息的识图方法、系统、设备及装置 | |
KR20110059551A (ko) | 프로그램 생성 장치, 프로그램 생성 방법, 및 컴퓨터로 판독 가능한 기억 매체 | |
US20180018315A1 (en) | Information processing device, program, and information processing method | |
JP7309811B2 (ja) | データ注釈方法、装置、電子機器および記憶媒体 | |
JP6885506B2 (ja) | 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム | |
JP2010079447A (ja) | バグ検出支援プログラム、類似構文識別情報一覧出力プログラム、バグ検出支援装置およびバグ検出支援方法 | |
JP7333533B1 (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP7433068B2 (ja) | 文書におけるタイトル及びセクションの推測 | |
US11328236B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US20180144309A1 (en) | System and Method for Determining Valid Request and Commitment Patterns in Electronic Messages | |
JP6114090B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP2021105919A (ja) | 情報処理装置、及びコンピュータプログラム | |
JP7362160B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113656034B (zh) | 信息处理方法、装置、电子设备以及存储介质 | |
JP6260160B2 (ja) | 重複出力制御装置、重複出力制御方法、重複出力制御プログラムおよび記録媒体 | |
US20230306190A1 (en) | Information processing system, non-transitory computer readable medium storing program, and information processing method | |
JP7095376B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP7095377B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP7442896B1 (ja) | プログラム、情報処理システム及び情報処理方法 | |
JP2007004429A (ja) | 文書処理装置 | |
JP2024055308A (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP5924073B2 (ja) | 制御プログラム、制御方法および制御装置 | |
CN104932710A (zh) | 外挂输入法及外挂输入系统 | |
JP5840269B2 (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220912 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7333533 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |