JP7286291B2 - 固有表現抽出装置、方法およびプログラム - Google Patents
固有表現抽出装置、方法およびプログラム Download PDFInfo
- Publication number
- JP7286291B2 JP7286291B2 JP2018183861A JP2018183861A JP7286291B2 JP 7286291 B2 JP7286291 B2 JP 7286291B2 JP 2018183861 A JP2018183861 A JP 2018183861A JP 2018183861 A JP2018183861 A JP 2018183861A JP 7286291 B2 JP7286291 B2 JP 7286291B2
- Authority
- JP
- Japan
- Prior art keywords
- extraction
- learning
- extracted
- named
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
図1は、本発明の実施形態に係る固有表現抽出装置の機能構成例を示すブロック図である。
図1に示すように、実施形態に係る固有表現抽出装置10は、文書受付部11、文書DB(データベース)12、固有表現・関係の学習データ編集部13、オリジナル学習文書DB14、学習データへの関係抽出ルール登録部15、関係抽出ルールDB16、学習データへの関係抽出ルール適用部17、学習文書DB18、固有表現・関係抽出の学習部19、解析辞書DB20、固有表現・関係抽出部21、および固有表現・関係抽出結果の表示部22を有する。
図2に示した例では、文書DB12に格納される文書データは、(1)文書データに固有のコンテンツID、(2)タイトル、(3)本文などが関連付けられる。
固有表現・関係の学習データ編集部13は、固有表現として抽出させる文字列と、固有表現同士の関係として抽出させる固有表現の組とを指定する指定手段と呼ぶこともできる。
オリジナル学習文書DB14に格納される学習データは、固有表現に係る学習データと、固有表現同士の関係に係る学習データとに区分される。
図3に示した例では、オリジナル学習文書DB14に格納される、固有表現に係る学習データは、(1)固有表現に固有のタグID、(2)固有表現が記述される文書データのコンテンツID、(3)タグの種類、(4)タグの値などが関連付けられる。
タグの種類は、固有表現の分類名、例えば「人名」、「地名」などである。タグの値は、具体的な固有表現の記述、例えば具体的な人名、地名などである。
図4に示した例では、オリジナル学習文書DB14に格納される、固有表現同士の関係に係る学習データは、(1)固有表現同士の関係に固有の関係ID、(2)第1のタグID、(3)第1のタグの役割、(4)第2のタグID、(5)第2のタグの役割などが関連付けられる。
図4では、2種類の固有表現同士に存在する関係について定義された例について示したが、これに限らず3種類以上の固有表現同士に存在する関係について定義されてもよい。
図5に示した例では、関係抽出ルールDB16に格納される関係抽出ルールは、(1)関係抽出ルールに固有のルールID、(2)第1のタグの種類、(3)第2のタグの種類、(4)第1のタグの役割、(5)第2のタグの役割などが関連付けられる。関係抽出ルールDB16が設けられる不揮発性メモリは、関係抽出ルールを格納する格納手段と呼ぶこともできる。
学習文書DB18に格納される学習文書の各項目は、上記のオリジナル学習文書DB14に格納される各種の学習データ(図3、4参照)と同じである。
図6に示した例では、解析辞書DB20に格納される解析辞書(抽出用辞書)は、各行に固有の辞書ID、タグの種類、タグの特徴、タグの値、複数種類のタグ同士の関係などが関連付けられる。タグの特徴とは、タグの記述形式、例えばバイナリデータを示す。解析辞書DB20が設けられる不揮発性メモリは、解析辞書を格納する格納手段と呼ぶこともできる。
また、固有表現・関係抽出結果の表示部22は、固有表現の抽出結果と固有表現同士の関係の抽出結果とを重ねて表示装置に表示することもできる。これにより、ユーザは、固有表現の誤抽出および未検出を発見しやすくなる。
次に、固有表現抽出装置10の第1の処理について説明する。
図7は、実施形態に係る固有表現抽出装置10の第1の処理手順の一例を示すフローチャートである。
まず、ユーザからの入力操作に従って、文書受付部11は、学習用文書データの登録を受け付けて、登録した学習用文書データを文書DB12に格納する(S11)。
図8に示した例では、固有表現抽出装置10の表示装置に表示された画面G1上の文書データの本文中の各記述「搬送異常」、「ボルト」、「ボルトが緩んでいます。」、「アームに付いているネジを締めました。」への画面上のポインタによる指定などにより、各記述にタグをそれぞれ付与することができる。
上記の第1の処理によれば、学習データで示される、ある分類名に係るタグと、別の分類名に係るタグとの関係を一括で登録できる。
次に、固有表現抽出装置10の第2の処理について説明する。
図9は、実施形態に係る固有表現抽出装置10の第2の処理手順の一例を示すフローチャートである。
第2の処理では、まず、固有表現・関係抽出結果の表示部22は、固有表現・関係抽出部21により抽出用文書データから抽出したタグ、およびタグ同士の関係を分類名ごとにグループ化した抽出結果の表示画面G2を表示装置に表示する(S21)。固有表現・関係抽出部21による抽出結果と抽出元文書データとの関係を示す情報は、固有表現・関係抽出結果の表示部22に接続される内部メモリに格納されているとする。
図10に示した表示画面G2では、分類(分類名)A,B,C,Dなどに属する複数種類のタグが示され、ある分類に属するタグと異なる分類に属するタグとの間の関係を示す。
図10では、分類Aと分類Bとの間、分類Bと分類Cとの間、分類Cと分類Dとの間でのタグ同士の関係がそれぞれ設定される例を示すが、これに限らず、例えば分類Aと分類Cとの間、分類Bと分類Dとの間などでのタグ同士の関係が設定されてもよい。
図11に示した例では、分類Bに属する1つ目のタグと分類Cに属する1つ目のタグ同士の関係が編集対象として指定された例を示す。この画面G3では、ユーザからの入力操作に従って、固有表現・関係の学習データ編集部13は、指定された関係の変更、例えば分類Bに属する1つ目のタグと、分類Cに属する2つ目以降のタグ同士の関係への修正、または関係の削除などを行なうことができる。
また、上記のように、付与済みのタグ自体の修正または削除などを行なうこともできる。タグ自体の修正とは、例えば分類名の修正、対象となる記述の変更である。タグ自体の削除とは、対象となる記述に対する固有表現としての指定の解除である。
第2の処理によれば、タグ、およびタグとタグとの関係の抽出結果のうち、指定された抽出結果の抽出元文書を容易に表示することができる。また、タグとタグとの関係の確認、編集を容易に行うことができる。
次に、固有表現抽出装置10の第3の処理について説明する。
図12は、実施形態に係る固有表現抽出装置10の第3の処理手順の一例を示すフローチャートである。
まず、ユーザからの入力操作に従って、文書受付部11は、学習用文書データの登録を受け付けて、登録した学習用文書データを文書DB12に格納する(S31)。ここでは抽出用文書データは文書DB12に格納済みであるとする。
ここでは、学習用文書データの記述へのタグの付与時の表示画面は図8に示した表示画面G1であるとする。
図13では、表示装置に表示された画面G4上の文書データの本文中の第1の記述「ボルトが緩んでいます。」に付与された、分類名「原因」に係るタグと、本文中の第2の記述「アームに付いているネジを締めました。」に付与された、分類名「対処」に係るタグとの関係を示す線L1が付与された例を示す。
上記の、学習文書として生成されたが、抽出用文書データから抽出されなかったタグ、およびタグとタグの関係は、例えば、固有表現・関係抽出の学習部19による解析辞書への学習の不具合、ここでは解析辞書に反映させる定義の欠落などに起因して生ずる。
図14に示した例では、点線で囲まれる、分類Bに属する1つ目のタグ、分類Cに属する1つ目および3つ目のタグは、学習文書に含まれていたが抽出用文書データから抽出されなかったタグとして示される。
第3の処理により、タグ、およびタグとタグの関係の抽出結果の抽出漏れを容易に確認することができる。
次に、固有表現抽出装置10の第4の処理について説明する。
図15は、実施形態に係る固有表現抽出装置10の第4の処理手順の一例を示すフローチャートである。
第4の処理では、第3の処理で説明したS31~S35までの処理がなされる(S41~S45)。
上記の、学習文書として生成されなかったが、抽出用文書データから抽出されたタグ、およびタグとタグの関係は、例えば、固有表現・関係抽出の学習部19による解析辞書への学習の不具合、ここでは解析辞書に対する不必要な定義の追加などに起因して生ずる。
図16に示した例では、二重線で囲まれる、分類Cに属する1つ目のタグは、学習文書には含まれなかったが抽出用文書データから抽出されたタグとして示される。
第4の処理により、タグ、およびタグとタグの関係の抽出結果の誤抽出を容易に確認することができる。
Claims (6)
- 文書データから当該文書データの固有表現として抽出させる文字列および固有表現同士の関係として抽出させる固有表現の組を抽出する抽出ルールを定めた抽出用辞書を格納する第1の格納手段と、
前記固有表現に対応する文字列および前記固有表現の組の抽出対象である抽出用文書データならびに前記抽出用辞書の学習に用いられる学習用文書データの入力を受け付ける文書受付手段と、
入力操作に従い、前記文書受付手段により受け付けた学習用文書データにおける文字列のうち、前記抽出用文書データから抽出させる固有表現に対応する文字列を指定し、前記学習用文書データ中の、前記抽出用文書データから固有表現同士の関係として抽出させる固有表現の組を指定することで、前記抽出用辞書の学習に用いられ、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる固有表現の組をそれぞれ定めた学習データを生成する第1の生成手段と、
前記抽出用文書データから抽出させる、固有表現の分類同士の関係を定めた関係抽出ルールを格納する第2の格納手段と、
前記生成された学習データに、前記第2の格納手段に格納された関係抽出ルールを適用することで、前記生成された学習データにおける前記固有表現の組のうち前記関係抽出ルールで定められた分類に属する固有表現の組が登録された学習文書を生成する第2の生成手段と、
前記第2の生成手段により生成された学習文書に含まれる、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる前記固有表現の組を前記抽出用辞書に反映することで、前記抽出用辞書を学習する学習手段と、
前記学習手段により学習された前記抽出用辞書を用いて、前記文書受付手段により受け付けた抽出用文書データから前記固有表現に対応する文字列および前記固有表現の組をそれぞれ抽出する抽出手段と、
を備えた固有表現抽出装置。 - 前記抽出手段により抽出された前記固有表現に対応する文字列および前記固有表現の組をそれぞれ出力する第1の出力手段と、
前記第1の出力手段により出力された、前記固有表現に対応する文字列および前記固有表現の組のうち入力操作で指定された、前記固有表現に対応する文字列および前記固有表現の組の少なくとも一方の抽出元の文書データを出力する第2の出力手段と、
入力操作に従い、前記第2の出力手段により出力された、抽出元の文書データの前記固有表現に対応する文字列および前記固有表現の組の少なくとも一方を編集する編集手段と、
をさらに備えた請求項1に記載の固有表現抽出装置。 - 文書データから当該文書データの固有表現および固有表現同士の関係を抽出する抽出ルールを定めた抽出用辞書を格納する格納手段と、
前記固有表現および前記固有表現同士の関係の抽出対象である抽出用文書データならびに前記抽出用辞書の学習に用いられる学習用文書データの入力を受け付ける文書受付手段と、
前記抽出用辞書を用いて、前記文書受付手段により受け付けた抽出用文書データから固有表現および固有表現同士の関係をそれぞれ抽出する抽出手段と、
入力操作に従い、前記文書受付手段により受け付けた学習用文書データにおける文字列のうち前記抽出手段により抽出させる固有表現に対応する文字列および固有表現同士の関係をそれぞれ指定する指定手段と、
前記指定手段により指定された固有表現に対応する文字列および固有表現同士の関係を前記抽出用辞書に反映することで、前記抽出用辞書を学習する学習手段と、
前記指定手段により指定された固有表現に対応する文字列および固有表現同士の関係のうち、前記抽出手段により抽出されなかった、固有表現に対応する文字列および固有表現同士の関係を出力する出力手段と、を備えた固有表現抽出装置。 - 文書データから当該文書データの固有表現および固有表現同士の関係を抽出する抽出ルールを定めた抽出用辞書を格納する格納手段と、
前記固有表現および前記固有表現同士の関係の抽出対象である抽出用文書データならびに前記抽出用辞書の学習に用いられる学習用文書データの入力を受け付ける文書受付手段と、
前記抽出用辞書を用いて、前記文書受付手段により受け付けた抽出用文書データから固有表現および固有表現同士の関係をそれぞれ抽出する抽出手段と、
入力操作に従い、前記文書受付手段により受け付けた学習用文書データにおける文字列のうち前記抽出手段により抽出させる固有表現に対応する文字列および固有表現同士の関係をそれぞれ指定する指定手段と、
前記指定手段により指定された固有表現に対応する文字列および固有表現同士の関係を前記抽出用辞書に反映することで、前記抽出用辞書を学習する学習手段と、
前記指定手段により指定されない固有表現に対応する文字列および固有表現同士の関係のうち、前記抽出手段により抽出された、固有表現に対応する文字列および固有表現同士の関係を出力する出力手段と、を備えた固有表現抽出装置。 - 文書データから当該文書データの固有表現として抽出させる文字列および固有表現同士の関係として抽出させる固有表現の組を抽出する抽出ルールを定めた抽出用辞書を記憶する第1の記憶装置ならびに前記固有表現に対応する文字列および前記固有表現の組の抽出対象である抽出用文書データから抽出させる、固有表現の分類同士の関係を定めた関係抽出ルールを記憶する第2の記憶装置と、を有する固有表現抽出装置に適用する方法であって、
前記固有表現に対応する文字列および前記固有表現の組の抽出対象である抽出用文書データならびに前記抽出用辞書の学習に用いられる学習用文書データの入力を受け付ける処理と、
入力操作に従い、前記受け付けた学習用文書データにおける文字列のうち、前記抽出用文書データから抽出させる固有表現に対応する文字列を指定し、前記学習用文書データ中の、前記抽出用文書データから固有表現同士の関係として抽出させる固有表現の組を指定することで、前記抽出用辞書の学習に用いられ、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる固有表現の組をそれぞれ定めた学習データを生成する処理と、
前記生成された学習データに、前記第2の記憶装置に記憶された関係抽出ルールを適用することで、前記生成された学習データにおける前記固有表現の組のうち前記関係抽出ルールで定められた分類に属する固有表現の組が登録された学習文書を生成する処理と、
前記生成された学習文書に含まれる、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる前記固有表現の組を前記抽出用辞書に反映することで、前記抽出用辞書を学習する処理と、
前記学習された前記抽出用辞書を用いて、前記受け付けた抽出用文書データから前記固有表現に対応する文字列および前記固有表現の組をそれぞれ抽出する処理と、
を実行する固有表現抽出方法。 - コンピュータを、
文書データから当該文書データの固有表現として抽出させる文字列および固有表現同士の関係として抽出させる固有表現の組を抽出する抽出ルールを定めた抽出用辞書を格納する第1の格納手段、
前記固有表現に対応する文字列および前記固有表現の組の抽出対象である抽出用文書データならびに前記抽出用辞書の学習に用いられる学習用文書データの入力を受け付ける文書受付手段、
入力操作に従い、前記文書受付手段により受け付けた学習用文書データにおける文字列のうち、前記抽出用文書データから抽出させる固有表現に対応する文字列を指定し、前記学習用文書データ中の、前記抽出用文書データから固有表現同士の関係として抽出させる固有表現の組を指定することで、前記抽出用辞書の学習に用いられ、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる固有表現の組をそれぞれ定めた学習データを生成する第1の生成手段、
前記抽出用文書データから抽出させる、固有表現の分類同士の関係を定めた関係抽出ルールを格納する第2の格納手段、
前記生成された学習データに、前記第2の格納手段に格納された関係抽出ルールを適用することで、前記生成された学習データにおける前記固有表現の組のうち前記関係抽出ルールで定められた分類に属する固有表現の組が登録された学習文書を生成する第2の生成手段、
前記第2の生成手段により生成された学習文書に含まれる、前記固有表現として抽出させる文字列および前記固有表現同士の関係として抽出させる前記固有表現の組を前記抽出用辞書に反映することで、前記抽出用辞書を学習する学習手段、および
前記学習手段により学習された前記抽出用辞書を用いて、前記文書受付手段により受け付けた抽出用文書データから前記固有表現に対応する文字列および前記固有表現の組をそれぞれ抽出する抽出手段、
として機能させる固有表現抽出処理プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018183861A JP7286291B2 (ja) | 2018-09-28 | 2018-09-28 | 固有表現抽出装置、方法およびプログラム |
PCT/JP2019/037915 WO2020067313A1 (ja) | 2018-09-28 | 2019-09-26 | 固有表現抽出装置、方法および記憶媒体 |
CN201980054951.8A CN112585611A (zh) | 2018-09-28 | 2019-09-26 | 固有表达提取装置、方法以及存储介质 |
US17/202,752 US11868726B2 (en) | 2018-09-28 | 2021-03-16 | Named-entity extraction apparatus, method, and non-transitory computer readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018183861A JP7286291B2 (ja) | 2018-09-28 | 2018-09-28 | 固有表現抽出装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020052902A JP2020052902A (ja) | 2020-04-02 |
JP7286291B2 true JP7286291B2 (ja) | 2023-06-05 |
Family
ID=69950713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018183861A Active JP7286291B2 (ja) | 2018-09-28 | 2018-09-28 | 固有表現抽出装置、方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11868726B2 (ja) |
JP (1) | JP7286291B2 (ja) |
CN (1) | CN112585611A (ja) |
WO (1) | WO2020067313A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006137516A1 (ja) | 2005-06-23 | 2006-12-28 | National Institute Of Information And Communications Technology | 二項関係抽出装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62212830A (ja) * | 1986-03-14 | 1987-09-18 | Nec Corp | 推論装置 |
JP4074316B2 (ja) | 2005-11-28 | 2008-04-09 | 株式会社東芝 | 固有表現抽出装置および方法 |
CN101305366B (zh) * | 2005-11-29 | 2013-02-06 | 国际商业机器公司 | 从非结构化文本提取和显现图表结构化关系的方法和系统 |
JP5604475B2 (ja) * | 2012-06-08 | 2014-10-08 | 日本電信電話株式会社 | 固有表現タイプ推定装置、方法、及びプログラム |
CN104933164B (zh) * | 2015-06-26 | 2018-10-09 | 华南理工大学 | 互联网海量数据中命名实体间关系提取方法及其系统 |
US20180130019A1 (en) * | 2016-06-21 | 2018-05-10 | 0934781 B.C. Ltd | System and method for Managing user and project nodes in a graph database |
US10713432B2 (en) * | 2017-03-31 | 2020-07-14 | Adobe Inc. | Classifying and ranking changes between document versions |
-
2018
- 2018-09-28 JP JP2018183861A patent/JP7286291B2/ja active Active
-
2019
- 2019-09-26 WO PCT/JP2019/037915 patent/WO2020067313A1/ja active Application Filing
- 2019-09-26 CN CN201980054951.8A patent/CN112585611A/zh active Pending
-
2021
- 2021-03-16 US US17/202,752 patent/US11868726B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006137516A1 (ja) | 2005-06-23 | 2006-12-28 | National Institute Of Information And Communications Technology | 二項関係抽出装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112585611A (zh) | 2021-03-30 |
US11868726B2 (en) | 2024-01-09 |
JP2020052902A (ja) | 2020-04-02 |
WO2020067313A1 (ja) | 2020-04-02 |
US20210200953A1 (en) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8112401B2 (en) | Analyzing externally generated documents in document management system | |
CN103098051B (zh) | 搜索引擎优化助理 | |
JP2017224184A (ja) | 機械学習装置 | |
US9495424B1 (en) | Recognition of characters and their significance within written works | |
CN108496190B (zh) | 用于从电子数据结构中提取属性的注释系统 | |
CN103246690A (zh) | 标签继承 | |
US20150379166A1 (en) | Model compilation for feature selection in statistical models | |
US11934781B2 (en) | Systems and methods for controllable text summarization | |
CN105446986A (zh) | 用于处理web页面的方法和装置 | |
JP2019032704A (ja) | 表データ構造化システムおよび表データ構造化方法 | |
Machanavajjhala et al. | Collective extraction from heterogeneous web lists | |
Adamu et al. | Similarity Assessment of UML Sequence Diagrams Using Dynamic Programming | |
JP6768738B2 (ja) | 学習データ生成装置、方法、およびプログラム | |
JP7286291B2 (ja) | 固有表現抽出装置、方法およびプログラム | |
CN113033178B (zh) | 用于商业计划书的文本评估方法、装置及计算机 | |
JP2020047229A (ja) | 記事解析装置、および、記事解析方法 | |
JP5550959B2 (ja) | 文書処理システム、及びプログラム | |
US20110313993A1 (en) | Grammar compression | |
JP7157245B2 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP6768750B2 (ja) | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム | |
US11074517B2 (en) | Predicting keywords in an application | |
Hänig et al. | NLP-based Decision Support System for Examination of Eligibility Criteria from Securities Prospectuses at the German Central Bank | |
Choi et al. | Building an annotated corpus for automatic metadata extraction from multilingual journal article references | |
Alreshedy et al. | Predicting the programming language of questions and snippets of StackOverflow using natural language processing | |
WO2015030016A1 (ja) | 非構造化データ処理システム、非構造化データ処理方法および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220524 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220722 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221213 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7286291 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |