JP2023152281A - 情報処理システム、情報処理方法及びプログラム - Google Patents
情報処理システム、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2023152281A JP2023152281A JP2022144310A JP2022144310A JP2023152281A JP 2023152281 A JP2023152281 A JP 2023152281A JP 2022144310 A JP2022144310 A JP 2022144310A JP 2022144310 A JP2022144310 A JP 2022144310A JP 2023152281 A JP2023152281 A JP 2023152281A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- information processing
- processing system
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 108
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000000605 extraction Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 claims description 16
- 239000003086 colorant Substances 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 4
- 238000004040 coloring Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
この点について、従来技術においては、請求項に係る発明が、明細書等のどこにサポートされているかを瞬時に把握するのは困難であった。
本節では、本実施形態のハードウェア構成について説明する。本実施形態において、情報処理システムとは、1つ又はそれ以上の装置又は構成要素からなるものである。したがって、例えば情報処理装置1単体であっても情報処理システムの一例となる。以下、情報処理システムの一例である情報処理装置1のハードウェア構成について説明する。
本節では、本実施形態の機能構成について説明する。前述の通り、記憶部12に記憶されているソフトウェアによる情報処理がハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部が実行されうる。換言すると、情報処理システムの一例である情報処理装置1は、制御部11(プロセッサ)を備える。制御部11は、各機能部のステップを実行させるプログラムを実行するように構成される。
本節では、前述した情報処理装置1の情報処理方法について説明する。本実施形態に係る情報処理方法は、前述の、情報処理システムの一例である情報処理装置1の各ステップを備える。以下、本実施形態の情報処理の流れについて、アクティビティ図を交えながら説明する。
なお、本節では、情報処理方法の流れについて本出願人の行った特許出願手続(特願2019-211333(特許第6709924号);以下「出願X」と称する。)を例に挙げて説明を行っていくこととする。
まず、このアクティビティを実行するに先立って、特許出願手続等を行おうとするユーザ(適法に手続書面の準備を行うことのできるユーザである以上、代理権の有無は問わない)は、手続書面を準備する。ここで、この手続書面は、第1の書類と第2の書類とを含み、第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類(典型的には「特許請求の範囲」)であり、第2の書類は発明又は考案を複数の文によって説明しようとする書類(典型的には「明細書」)である。
なお、この手続書面は、たとえば1又は2以上の文書ファイル(Microsoft(登録商標) Wordによるワード形式等)で準備される。
なお、これらの図は簡略化のために、書類の一部の内容しか示していないものである。
また、これら書類D1および書類D2について、図4および図5ではそれぞれ別個に示したが、この書類の内容を連結したファイルが受付部111の受け付ける書類であってもよい。
一方、生成部112は、このような名詞により終結する内容であっても、末尾が動詞である文としてモデル文を生成する。なお、後に行われる抽出の精度を向上させるために、このモデル文は単文であることが好ましい。
換言すれば、モデル文に含まれる動詞はモデル文における述語を構成する。また、モデル文に含まれる品詞のひとつはモデル文における文頭の主語を構成する。そして、モデル文に含まれる品詞のうち主語を構成しない品詞は、述語と主語との間の品詞として配される(図6等参照)。ここで、生成部112は、主語と述語との対応関係及び/又は述語と主語との間の品詞と述語との対応関係と、文法に関する参照情報と、に基づきこのモデル文を生成する構成を採用することができる。
すなわち、生成部112は、特許請求の範囲に記載のある構成について、その内容を認識した上で、単語の係り受けや文章としての主述関係等を考慮し、モデル文を生成する。典型的には、生成部112は、第1の書類で特定される発明又は考案に関する構成の文章としての主述関係と、文法に関する参照情報と、に基づきモデル文を生成する。この生成は文章の規則性等を蓄積したデータベースなどを参照情報として用いて実行されてもよいし、過去の特許出願手続等で用いられた表現を学習させた学習済みモデルを参照情報として用いて実行されてもよい。
ここで、「関連する文」とは、典型的には類似性の高い文であってもよく、抽出部113は、複数の品詞の配列を根拠に第1の文を抽出する。すなわち、図6に示したように、モデル文は動詞より前に品詞が配列されているが、本実施形態の抽出部113はこの品詞の配列を根拠に第1の文を類似性の高い文として抽出する。
たとえば、出願Xにおいては、[0014]に「図3に示されるように、情報処理装置100は、機能構成として、表示制御部301と、色付け部302と、変更部303と、抽出部304と、削除部305と、を含む。」という文章があるが、本実施形態の情報処理装置1は、各名詞の配列等を根拠に、この文章を第1の文として抽出する。
すなわち、出願Xには[0006]や[0023]など特許請求の範囲をそのまま引き写した記載(いわゆるリクレームと呼ばれる記載)がある。文書のチェックなどを行うに際して、このような引き写し部分について、発明等の構成に対応する記載があるのは当然であるので、抽出部113の抽出を行う範囲を制限することも可能である。この制限は自動で行われるものであっても、手動で行わるものであってもよい。典型的には、抽出部113が抽出を行う範囲を、出願Xの[発明を実施するための形態]という記載の後から、[0024]のリクレームを行う記載の前まで、と予め設定することができる。なお、このような抽出の制限は、明細書に用いる所定の文言を事前に設定しておき、その間での抽出操作が行われるように事前制御することで実現可能である。
たとえば、出願Xの[0014]には、「情報処理装置100が表示制御部301と色付け部302とを有することによって、オートボタンが選択された場合、書類(例えば、特許請求の範囲)に含まれる設定された言葉(例えば、請求項1、請求項2、・・・)にそれぞれ異なる色が付けられるので、書類を見慣れない人であっても、視覚的に書類に設定された言葉がいくつあるか把握することができ、読みやすい書類の作成を支援する技術を提供することができる。」との文があるが、この文においても「情報処理装置」「表示制御部」「色付け部」という各種品詞があることから、第1の文の候補として挙がりうる。本実施形態の抽出部113は、このようなモデル文に関連性(類似性)のある文章を第2の文として抽出することができる。
なお、第1の文について、発明等の構成に対する第1の文の充足度が所定の閾値を超過することを条件として、抽出部113が第1の文を抽出するように構成することが好ましい。
すなわち、前述のように生成部112は、受付部111で受け付けたテキスト情報の中から第1の書類で特定される発明又は考案に関する構成を表現する1以上のモデル文を生成することができ、このモデル文は、少なくとも文末に動詞、および、動詞より前に動詞とは異なる品詞を複数含むことができる。
これに対し、抽出部113は、モデル文における動詞および複数の品詞の配列の類似性を根拠に、第2の書類を構成する複数の文から、所定の閾値を超過した、第1の書類で特定すされる発明又は考案に関する構成に類似性の高い文を第1の文として抽出することができる。
この類似性の判断は、一例として、モデル文の主語、述語および主語と述語との間の品詞のそれぞれの内容と、配列(文章としての係り受け)等に基づいて行われる。
ここで表示制御部114は、第1の文と第2の文とを、ユーザが識別可能に表示させることが好ましい。たとえば、図7に示した請求項1の構成1に対しては、候補1と候補2とで充足度が異なるものであったが、表示制御部114は、第1の文(候補1の文)を表示する箇所と第2の文(候補2の文)を表示する箇所とが互いに色彩が異なるように表示させる態様とすることができる。典型的には、図4の第1の書類D1においては請求項毎に色分けがされているが、この請求項に対応する色について濃淡を変更させることによって、類似の度合(充足度)の違いを示すように構成することも可能である。
前述した情報処理装置システムに関して、以下のような態様を採用してもよい。
もちろん、この限りではない。
10 :通信バス
11 :制御部
12 :記憶部
13 :入力部
14 :表示部
15 :通信部
100 :情報処理装置
111 :受付部
112 :生成部
113 :抽出部
114 :表示制御部
301 :表示制御部
302 :色付け部
303 :変更部
304 :抽出部
305 :削除部
D1、D2 :書類
MS1、MS1a、MS1b、MS1c、MS2、MS2a、MS2b、MS2c、MS3、MS3a、MS3b、MS3c、MS4 :モデル文
Claims (21)
- 手続書面の作成を支援する情報処理システムであって、
制御部を備え、
前記制御部は、次の各ステップを実行するように構成され、
受付ステップでは、前記手続書面に含まれるテキスト情報を受け付け、ここで前記手続書面は、第1の書類と第2の書類とを含み、前記第1の書類は特許庁からの処分を受けようとする発明又は考案を特定しようとする書類であり、前記第2の書類は前記発明又は前記考案を複数の文によって説明しようとする書類であり、
抽出ステップでは、前記第2の書類を構成する複数の前記文から、所定の基準を満足し、かつ、前記第1の書類で特定される前記発明又は前記考案に関する構成に関連性の高い文を第1の文として抽出し、
表示制御ステップでは、前記抽出ステップで抽出された前記第1の文をユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
さらに、生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を生成し、
前記抽出ステップでは、前記第2の書類の中から前記モデル文に関連する文を、前記第1の文として抽出する、もの。 - 請求項2に記載の情報処理システムにおいて、
前記モデル文は、少なくとも動詞と、動詞とは異なる品詞とを含む、もの。 - 請求項3に記載の情報処理システムにおいて、
前記生成ステップでは、前記モデル文として、文末に前記動詞を含み、前記動詞より前に複数の品詞を配列させたモデル文を生成する、もの。 - 請求項4に記載の情報処理システムにおいて、
前記抽出ステップでは、前記複数の品詞の配列を根拠に前記第1の文を抽出する、もの。 - 請求項2に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第2の書類の中から前記第1の文以外の前記モデル文に関連する第2の文をさらに抽出し、
前記表示制御ステップでは、前記抽出ステップで抽出された前記第2の文を前記ユーザが把握可能に表示させる、もの。 - 請求項6に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文と前記第2の文とを、前記ユーザが識別可能に表示させる、もの。 - 請求項7に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文を表示する箇所と前記第2の文を表示する箇所とが互いに色彩が異なるように表示させる、もの。 - 請求項7に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記第1の文の関連性と前記第2の文の関連性とを、各々スコアにより表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記抽出ステップで抽出された前記第1の文と、前記第1の書類で特定される前記発明又は前記考案に関する前記構成との対応関係を前記ユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記手続書面のファイル上で前記第1の文を前記ユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第1の書類で特定しようとする前記発明又は前記考案が複数存在する場合に、複数存在する前記発明又は前記考案のそれぞれについて前記第1の文を抽出する、もの。 - 請求項12に記載の情報処理システムにおいて、
前記表示制御ステップでは、前記複数存在する前記発明又は前記考案のそれぞれに対応する前記第1の文を、複数存在する前記発明又は前記考案の内容に応じて前記ユーザが識別可能に表示する、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップで、前記第2の書類を構成する複数の前記文の中に前記所定の基準を満足する前記第1の文が抽出されない場合、
前記表示制御ステップでは、前記第1の文が存在しないことを前記ユーザが把握可能に表示させる、もの。 - 請求項1に記載の情報処理システムにおいて、
前記抽出ステップでは、前記第2の書類を構成する複数の前記文の一部の範囲については前記抽出ステップを実行する範囲から除外し、残された範囲から前記第1の文を抽出する、もの。 - 請求項1に記載の情報処理システムにおいて、
さらに、生成ステップでは、前記受付ステップで受け付けた前記テキスト情報の中から前記第1の書類で特定される前記発明又は前記考案に関する構成を表現する1以上のモデル文を生成し、ここで、前記モデル文は、少なくとも文末に動詞、および、前記動詞より前に前記動詞とは異なる品詞を複数含み、
前記抽出ステップでは、前記モデル文における前記動詞および複数の前記品詞の配列の類似性を根拠に、前記第2の書類を構成する複数の前記文から、所定の閾値を超過した、前記第1の書類で特定すされる前記発明又は前記考案に関する構成に類似性の高い文を前記第1の文として抽出する、もの。 - 請求項16に記載の情報処理システムにおいて、
前記生成ステップでは、前記第1の書類で特定される前記発明又は考案に関する構成の文章としての主述関係と、文法に関する参照情報と、に基づき前記モデル文を生成する、もの。 - 請求項17に記載の情報処理システムにおいて、
前記参照情報は、文章の規則性を蓄積したデータベース及び文法表現を学習させた学習済みモデルからなる群から選択されるものである、もの。 - 請求項16に記載の情報処理システムにおいて、
前記モデル文に含まれる前記動詞は前記モデル文における述語を構成し、
前記モデル文に含まれる前記品詞のひとつは前記モデル文における文頭の主語を構成し、
前記モデル文に含まれる前記品詞のうち前記主語を構成しない品詞は、前記述語と前記主語との間の品詞として配され、
前記生成ステップでは、前記主語と前記述語との対応関係及び/又は前記述語と前記主語との間の前記品詞と前記述語との対応関係と、文法に関する参照情報と、に基づき前記モデル文を生成する、もの。 - 情報処理方法であって、
請求項1ないし請求項19のいずれか1項に記載の情報処理システムの各ステップを備える、方法。 - プログラムであって、
コンピュータに請求項1ないし請求項19のいずれか1項に記載の情報処理システムの各ステップを実行させる、もの。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023035915A JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022059294 | 2022-03-31 | ||
JP2022059294 | 2022-03-31 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023035915A Division JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7333533B1 JP7333533B1 (ja) | 2023-08-25 |
JP2023152281A true JP2023152281A (ja) | 2023-10-16 |
Family
ID=87654354
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022144310A Active JP7333533B1 (ja) | 2022-03-31 | 2022-09-12 | 情報処理システム、情報処理方法及びプログラム |
JP2023035915A Pending JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023035915A Pending JP2023152789A (ja) | 2022-03-31 | 2023-03-08 | 情報処理システム、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7333533B1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186870A (ja) * | 2001-12-18 | 2003-07-04 | Seiko Epson Corp | 文書表示方法、文書表示装置、プログラムおよび記録媒体 |
JP2017211993A (ja) * | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
JP2020068011A (ja) * | 2018-10-23 | 2020-04-30 | 雲拓科技有限公司Integral Search International Ltd. | 特許書類図面資料ガイド内容自動獲得表示設備 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4102897B2 (ja) | 2002-08-14 | 2008-06-18 | 正敏 渋谷 | 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム |
JP2004246559A (ja) | 2003-02-13 | 2004-09-02 | System Japan:Kk | 請求の範囲についての補助資料作成方法 |
-
2022
- 2022-09-12 JP JP2022144310A patent/JP7333533B1/ja active Active
-
2023
- 2023-03-08 JP JP2023035915A patent/JP2023152789A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186870A (ja) * | 2001-12-18 | 2003-07-04 | Seiko Epson Corp | 文書表示方法、文書表示装置、プログラムおよび記録媒体 |
JP2017211993A (ja) * | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
JP2020068011A (ja) * | 2018-10-23 | 2020-04-30 | 雲拓科技有限公司Integral Search International Ltd. | 特許書類図面資料ガイド内容自動獲得表示設備 |
Also Published As
Publication number | Publication date |
---|---|
JP7333533B1 (ja) | 2023-08-25 |
JP2023152789A (ja) | 2023-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4113354A2 (en) | Method and apparatus for generating pre-trained language model, electronic device and storage medium | |
US10540438B2 (en) | Cognitive framework to detect adverse events in free-form text | |
JP2017215931A (ja) | 会議支援システム、会議支援装置、会議支援方法及びプログラム | |
JP6856709B2 (ja) | 訓練データ生成方法、訓練データ生成装置、電子機器およびコンピュータ読み取り可能な記憶媒体 | |
CN107710191A (zh) | 与单个词语音输入的翻译相关的方法和计算装置 | |
JP2009145992A (ja) | 複数単語を使用する検索式の作成を支援する方法、装置およびプログラム | |
US20170147546A1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6885506B2 (ja) | 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム | |
JP2018205945A (ja) | 対話応答文書自動作成人工知能装置 | |
US8788257B1 (en) | Unified cross platform input method framework | |
WO2021200200A1 (ja) | 情報処理装置及び情報処理方法 | |
JP2023152789A (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP2022549065A (ja) | 自然言語で書かれたテキスト記述からの実行可能プロセスの作成方法、システム、プログラム | |
JP7095377B2 (ja) | 情報処理装置及び情報処理プログラム | |
CN107908792B (zh) | 信息推送方法和装置 | |
KR101985491B1 (ko) | 다이어그램 방식의 시각화 수식 작성을 통한 결과 생성 및 모니터링 장치 | |
JP6723726B2 (ja) | 入力支援装置 | |
WO2017122872A1 (ko) | 전자 출판물에 대한 정보를 생성하는 장치 및 방법 | |
JP2017068435A (ja) | 文章データ処理装置、文章データ処理方法およびプログラム | |
Naseem et al. | Tagging Urdu sentences from English pos taggers | |
KR101953019B1 (ko) | 딥러닝 인공지능 번역 소프트웨어를 이용하여 번역을 수행하고 컨텐츠를 제공하는 방법 | |
JP7273442B1 (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP6260160B2 (ja) | 重複出力制御装置、重複出力制御方法、重複出力制御プログラムおよび記録媒体 | |
JP2004102554A (ja) | 文章画像変換ツール | |
Dissanayake et al. | Enhancing conversational ai model performance and explainability for sinhala-english bilingual speakers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220912 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7333533 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |