JP6357912B2 - 用語集作成支援システムおよび方法、プログラム - Google Patents
用語集作成支援システムおよび方法、プログラム Download PDFInfo
- Publication number
- JP6357912B2 JP6357912B2 JP2014130935A JP2014130935A JP6357912B2 JP 6357912 B2 JP6357912 B2 JP 6357912B2 JP 2014130935 A JP2014130935 A JP 2014130935A JP 2014130935 A JP2014130935 A JP 2014130935A JP 6357912 B2 JP6357912 B2 JP 6357912B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- term
- document
- risk
- glossary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
用語判定部で判定した、用語集に登録すべき用語について、用語集への登録を促すために、用語を出力する出力部とを有することを特徴としている。
(実施形態)
図1を用いて、本発明の実施形態における用語集作成支援システムの構成を説明する。
ない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されてよい
。また、各構成要素は、1つの構成要素が複数のモジュールで実現されてもよい。また、
各構成要素は、ある構成要素が他の構成要素の一部であるような構成であってよい。また
、各構成要素は、ある構成要素の一部と他の構成要素の一部とが重複するような構成であ
ってもよい。
必要に応じ、可能であれば、ハードウェア的に実現されてよい。また、各構成要素及び各
構成要素を実現するモジュールは、コンピュータ及びプログラムで実現されてよい。また
、各構成要素及び各構成要素を実現するモジュールは、ハードウェア的なモジュールとコ
ンピュータ及びプログラムとの混在により実現されてもよい。
タ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに
読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御すること
により、そのコンピュータを前述した各実施形態における構成要素として機能させる。
してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。この
ため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障のない範囲
で変更することができる。
れることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作
と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよ
い。
いるが、その記載はある動作と他の動作との全ての関係を限定するものではない。このた
め、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で
変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作
を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施
する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更してもよ
い。
(付記1)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付ける文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測する複合語推測部と、
前記複合語推測部で推測された各複合語を構成する複数の構成語が入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、前記複合語が異なる解釈を引き起こすリスクの有無を推定する用語リスク推定部と、
前記用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。
(付記2)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付ける文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測する複合語推測部と、
前記文書群において、固有の定義があり、その定義を関係者に共有する必要がある用語を収集して蓄積し、任意の文字列が用語に該当するかどうかに関する問い合わせに対し、問い合わせ対象の文字列が用語に含まれるか検索し、応答する用語データベースと、
前記複合語推測部で推定した前記複合語について、各複合語の文字列が用語として登録されているかどうかを前記用語データベースに問合せ、用語として登録されていない未登録語を検出する未登録語抽出部と、
前記文書解析部で抽出された単語の前記単語情報を用いて、入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、異なる解釈を引き起こすリスクの有無を推定する用語リスク推定部と、
前記用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。
(付記3)
前記所定のリスク推定ルールは、前記複合語または前記未登録語を構成する複数の構成語間が、省略しても単語の解釈に影響しない表現で結合された記載パターンの文がある場合はリスクが無いとする、文書の記載者の単語に対する想定が反映される記載パターンとの一致状況でリスクの有無を推定することを特徴とする付記1または2に記載の用語集作成支援システム。
(付記4)
前記所定のリスク推定ルールは、前記複合語または前記未登録語を構成する複数の前記構成語が共起する文で、2つの構成語の間に自立語が含まれ、その自立語がその複合語または未登録語を構成する構成語ではない、という記載パターンの文がある場合は、リスクが有るとすることを特徴とする付記1または2に記載の用語集作成支援システム。
(付記5)
前記所定のリスク推定ルールは、同一の前記複合語または前記未登録語に関して、省略しても単語の解釈に影響しない表現で構成語間を結合した記載パターンの文の種類数が多いほどリスクが低いとするリスク指標、または2つの前記構成語の間に含まれる前記構成語以外の前記自立語の数が多いほどリスクが高いとするリスク指標によって、相対的なリスクを定量的に推定することを特徴とする付記3または4に記載の用語集作成支援システム。
(付記6)
前記所定の用語判定ルールは、前記各未登録語のリスクの有無に関する情報を用いて、リスクが高いと考えられる前記未登録語ほど前記用語集に登録すべきと判定することを特徴とする付記1から4のうちの1に記載の用語集作成支援システム。
(付記7)
前記所定の用語判定ルールは、リスク指標が閾値以上の前記未登録語を用語と判定するルールであることを特徴とする付記1、2、または5に記載の用語集作成支援システム。
(付記8)
前記所定の用語判定ルールは、リスクが無いと推定させる記載パターンが一つでもあればその前記未登録語は前記用語集に登録する必要のない用語と判定し、それ以外の前記未登録語は全て前記用語集に登録すべき用語と判定することを特徴とする付記1から4のうちの1に記載の用語集作成支援システム。
(付記9)
前記所定の用語判定ルールは、前記各未登録語を構成する複数の前記構成語が入力文書内で共起する文の数に対するリスクが有ると推定させる記載パターンの文の数の割合を有リスクパターン出現率として指標化し、有リスクパターン出現率の値が所定の閾値以上の場合に前記用語集に登録すべき用語と判定することを特徴とする付記1から5のうちの1に記載の用語集作成支援システム。
(付記10)
前記所定の用語判定ルールは、前記各未登録語を構成する複数の前記構成語が入力文書内で共起する文の数に対するリスクが無いと推定させる記載パターンの文の数の割合を無リスクパターン出現率として指標化し、無リスクパターン出現率の値が所定の閾値以上の場合に前記用語集に登録する必要がない用語と判定することを特徴とする付記1から5のうちの1に記載の用語集作成支援システム。
(付記11)
前記所定の用語判定ルールは、同一の前記未登録語について、リスクが有ると推定させる記載パターンとリスクが無いと推定させる記載パターンが併存する場合は、それぞれの文の数の多寡で、リスクが有ると推定させる記載パターンの方が多ければ、前記用語集に登録すべき用語と判定することを特徴とする付記1から5のうちの1に記載の用語集作成支援システム。
(付記12)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付けるステップと、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行うステップと、
文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測するステップと、
複合語推測部で推測された各複合語を構成する複数の構成語が入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、前記複合語が異なる解釈を引き起こすリスクの有無を推定するステップと、
用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定するステップと、
用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力するステップと、
を有することを特徴とする文書の用語集作成支援方法。
(付記13)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付けるステップと、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行うステップと、
文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測するステップと、
前記文書群において、固有の定義があり、その定義を関係者に共有する必要がある用語を収集して蓄積し、任意の文字列が用語に該当するかどうかに関する問い合わせに対し、問い合わせ対象の文字列が用語に含まれるか検索し、応答するステップと、
複合語推測部で推定した前記複合語について、各複合語の文字列が用語として登録されているかどうかを前記用語データベースに問合せ、用語として登録されていない未登録語を検出するステップと、
未登録語抽出部で検出した各未登録語に関して、前記文書解析部で抽出した入力文書中の前記単語情報を利用して、前記未登録語を構成する複数の構成語が入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、前記未登録語が異なる解釈を引き起こすリスクの有無を推定するステップと、
用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定するステップと、
用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力するステップと、
を有することを特徴とする文書の用語集作成支援方法。
(付記14)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付ける処理と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う処理と、
文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測する処理と、
複合語推測部で推測された各複合語を構成する複数の構成語が入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、前記複合語が異なる解釈を引き起こすリスクの有無を推定する処理と、
用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定する処理と、
用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力する処理と、
をコンピュータに実行させることを特徴とするプログラム。
(付記15)
文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付ける処理と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う処理と、
文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていない未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知語を結合した単語を複合語として推測する処理と、
前記文書群において、固有の定義があり、その定義を関係者に共有する必要がある用語を収集して蓄積し、任意の文字列が用語に該当するかどうかに関する問い合わせに対し、問い合わせ対象の文字列が用語に含まれるか検索し、応答する処理と、
複合語推測部で推定した前記複合語について、各複合語の文字列が用語として登録されているかどうかを前記用語データベースに問合せ、用語として登録されていない未登録語を検出する処理と、
未登録語抽出部で検出した各未登録語に関して、前記文書解析部で抽出した入力文書中の前記単語情報を利用して、前記未登録語を構成する複数の構成語が入力文書内で共起する文を解析し、所定のリスク推定ルールに基づき、前記未登録語が異なる解釈を引き起こすリスクの有無を推定する処理と、
用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、前記用語集に登録すべき用語を判定する処理と、
用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登録を促すために、前記用語を出力する処理と、
をコンピュータに実行させることを特徴とするプログラム。
20 文書解析部
30 複合語推測部
40 未登録語抽出部
50 用語リスク推定部
60 用語判定部
70 出力部
110 用語データベース
B PC端末
D 文書群
Y 文書解析システム
Z イントラネット・サーバ
Claims (10)
- 文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付け
る文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う
文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていな
い未知語が付属語を挟まずに直接隣接している文字列部分に関して、隣接する名詞または未知語を結合した単語を複合語として推測する複合語推測部と、
前記複合語推測部で推測された各複合語を構成する複数の構成語が入力文書内で共起す
る文を解析し、前記複合語を構成する複数の構成語間が、省略しても単語の解釈に影響しない表現で結合された記載パターンの文がある場合はリスクが無いとする、文書の記載者の単語に対する想定が反映される記載パターンとの一致状況でリスクの有無を推定するリスク推定ルールに基づき、前記複合語が異なる解釈を引き起こす
リスクの有無を推定する用語リスク推定部と、
前記異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、
前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登
録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。 - 文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付け
る文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う
文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていな
い未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知
語を結合した単語を複合語として推測する複合語推測部と、
前記文書群において、固有の定義があり、その定義を関係者に共有する必要がある用語
を収集して蓄積し、任意の文字列が用語に該当するかどうかに関する問い合わせに対し、問い合わせ対象の文字列が用語に含まれるか検索し、応答する用語データベースと、
前記複合語推測部で推定した前記複合語について、各複合語の文字列が用語として登録
されているかどうかを前記用語データベースに問合せ、用語として登録されていない未登
録語を検出する未登録語抽出部と、
未登録語抽出部で検出した各未登録語に関して、前記文書解析部で抽出した入力文書中
の前記単語情報を利用して、前記未登録語を構成する複数の構成語が入力文書内で共起す
る文を解析し、前記複合語または前記未登録語を構成する複数の構成語間が、省略しても単語の解釈に影響しない表現で結合された記載パターンの文がある場合はリスクが無いとする、文書の記載者の単語に対する想定が反映される記載パターンとの一致状況でリスクの有無を推定するリスク推定ルールに基づき、前記未登録語が異なる解釈を引き起こ
すリスクの有無を推定する用語リスク推定部と、
前記用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定
の用語判定ルールによって、前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登
録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。 - 文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付け
る文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う
文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていな
い未知語が付属語を挟まずに直接隣接している文字列部分に関して、隣接する名詞ま
たは未知語を結合した単語を複合語として推測する複合語推測部と、
前記複合語推測部で推測された各複合語を構成する複数の構成語が入力文書内で共起す
る文を解析し、前記複合語を構成する複数の前記構成語が共起する文で、2つの構成語の間に自立語が含まれ、その自立語がその複合語を構成する構成語ではない、という記載パターンの文がある場合は、リスクが有るとするリスク推定ルールに基づき、前記複合語が異なる解釈を引き起こす
リスクの有無を推定する用語リスク推定部と、
前記異なる解釈を引き起こすリスクの有無に基づき、所定の用語判定ルールによって、
前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登
録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。 - 文書に固有の用語について用語集への登録を行う、文書または文書群の入力を受け付け
る文書入力部と、
前記文書または文書群を構成する各文章に使用されている単語の単語情報の抽出を行う
文書解析部と、
前記文書解析部で抽出された前記単語情報を用いて、名詞または辞書に登録されていな
い未知語が付属語を挟まずに隣接している文字列部分に関して、隣接する名詞および未知
語を結合した単語を複合語として推測する複合語推測部と、
前記文書群において、固有の定義があり、その定義を関係者に共有する必要がある用語
を収集して蓄積し、任意の文字列が用語に該当するかどうかに関する問い合わせに対し、
問い合わせ対象の文字列が用語に含まれるか検索し、応答する用語データベースと、
前記複合語推測部で推定した前記複合語について、各複合語の文字列が用語として登録
されているかどうかを前記用語データベースに問合せ、用語として登録されていない未登
録語を検出する未登録語抽出部と、
未登録語抽出部で検出した各未登録語に関して、前記文書解析部で抽出した入力文書中
の前記単語情報を利用して、前記未登録語を構成する複数の構成語が入力文書内で共起す
る文を解析し、前記複合語または前記未登録語を構成する複数の前記構成語が共起する文で、2つの構成語の間に自立語が含まれ、その自立語がその複合語または未登録語を構成する構成語ではない、という記載パターンの文がある場合は、リスクが有るとするリスク推定ルールに基づき、前記未登録語が異なる解釈を引き起こすリスクの有無を推定する用語リスク推定部と、
前記用語リスク推定部で推定した異なる解釈を引き起こすリスクの有無に基づき、所定
の用語判定ルールによって、前記用語集に登録すべき用語を判定する用語判定部と、
前記用語判定部で判定した、前記用語集に登録すべき用語について、前記用語集への登
録を促すために、前記用語を出力する出力部と、
を有することを特徴とする文書の用語集作成支援システム。
- 前記所定のリスク推定ルールは、同一の前記未登録語に関して、省略しても単語の解釈に影響しない表現で構成語間を結合した記載パターンの文の種類数が多いほどリスクが低いとするリスク指標、または2つの前記構成語の間に含まれる前記構成語以外の前記自立語の数が多いほどリスクが高いとするリスク指標によって、相対的なリスクを定量的に推定することを特徴とする請求項2または4に記載の用語集作成支援システム。
- 前記所定の用語判定ルールは、前記各未登録語のリスクの有無に関する情報を用いて、リスクが高いと考えられる前記未登録語ほど前記用語集に登録すべきと判定することを特徴とする請求項2または4に記載の用語集作成支援システム。
- 前記所定の用語判定ルールは、リスク指標が閾値以上の前記未登録語を登録すべきと判定するルールであることを特徴とする請求項5に記載の用語集作成支援システム。
- 前記所定の用語判定ルールは、リスクが無いと推定させる記載パターンが一つでもあればその前記未登録語は前記用語集に登録する必要のない用語と判定し、それ以外の前記未登録語は全て前記用語集に登録すべき用語と判定することを特徴とする請求項2または4に記載の用語集作成支援システム。
- 前記所定の用語判定ルールは、前記各未登録語を構成する複数の前記構成語が入力文書
内で共起する文の数に対するリスクが有ると推定させる記載パターンの文の数の割合を有
リスクパターン出現率として指標化し、有リスクパターン出現率の値が所定の閾値以上の
場合に前記用語集に登録すべき用語と判定することを特徴とする請求項2,4または5のうちの1項に記載の用語集作成支援システム。 - 前記所定の用語判定ルールは、前記各未登録語を構成する複数の前記構成語が入力文書
内で共起する文全体の数に対する、リスクが無いと推定させる記載パターンの文の数の割
合を無リスクパターン出現率として指標化し、無リスクパターン出現率の値が所定の閾値
以上の場合に前記用語集に登録する必要がない用語と判定することを特徴とする請求項2,4または5のうちの1項に記載の用語集作成支援システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014130935A JP6357912B2 (ja) | 2014-06-26 | 2014-06-26 | 用語集作成支援システムおよび方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014130935A JP6357912B2 (ja) | 2014-06-26 | 2014-06-26 | 用語集作成支援システムおよび方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016009415A JP2016009415A (ja) | 2016-01-18 |
JP6357912B2 true JP6357912B2 (ja) | 2018-07-18 |
Family
ID=55226909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014130935A Active JP6357912B2 (ja) | 2014-06-26 | 2014-06-26 | 用語集作成支援システムおよび方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6357912B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020123227A (ja) * | 2019-01-31 | 2020-08-13 | 富士通株式会社 | 単語出力方法、単語出力プログラム及び情報処理装置 |
CN117555995B (zh) * | 2024-01-11 | 2024-04-12 | 北京领初医药科技有限公司 | 一种分级式缩略语句匹配确认方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001067354A (ja) * | 1999-08-27 | 2001-03-16 | Matsushita Electric Ind Co Ltd | 新語性判定装置及び新語性判定方法 |
JP2007079652A (ja) * | 2005-09-12 | 2007-03-29 | Advanced Telecommunication Research Institute International | 用語抽出装置、およびプログラム |
JP2009123067A (ja) * | 2007-11-16 | 2009-06-04 | Hitachi Systems & Services Ltd | 用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体 |
-
2014
- 2014-06-26 JP JP2014130935A patent/JP6357912B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016009415A (ja) | 2016-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sadvilkar et al. | PySBD: Pragmatic sentence boundary disambiguation | |
US20210294974A1 (en) | Systems and methods for deviation detection, information extraction and obligation deviation detection | |
Briscoe et al. | Robust Accurate Statistical Annotation of General Text. | |
Dickinson et al. | Detecting inconsistencies in treebanks | |
Bhatia et al. | Towards an information type lexicon for privacy policies | |
US20100070261A1 (en) | Method and apparatus for detecting errors in machine translation using parallel corpus | |
US20170323170A1 (en) | Method and system for data extraction from images of semi-structured documents | |
EP1941399A2 (en) | Method and apparatus for automatic entity disambiguation | |
US11386269B2 (en) | Fault-tolerant information extraction | |
JP6404511B2 (ja) | 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム | |
US20130282598A1 (en) | Patent assessment system and method | |
US20200372215A1 (en) | Document processing device, document processing method, and document processing program | |
WO2014002774A1 (ja) | 同義語抽出システム、方法および記録媒体 | |
Cucerzan | MSR System for Entity Linking at TAC 2012. | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
US20100094615A1 (en) | Document translation apparatus and method | |
Radoev et al. | A language adaptive method for question answering on French and English | |
Dootio et al. | Syntactic parsing and supervised analysis of Sindhi text | |
Wong et al. | iSentenizer‐μ: Multilingual Sentence Boundary Detection Model | |
JP6108212B2 (ja) | 同義語抽出システム、方法およびプログラム | |
JP6357912B2 (ja) | 用語集作成支援システムおよび方法、プログラム | |
JP5703629B2 (ja) | 同義語辞書生成装置、データ解析装置、データ検出装置、同義語辞書生成方法及び同義語辞書生成プログラム | |
JP6837604B2 (ja) | 入力ミス検知装置、入力ミス検知方法および入力ミス検知プログラム | |
Kawahara et al. | Automatically acquired lexical knowledge improves Japanese joint morphological and dependency analysis | |
Nastase et al. | Combining collocations, lexical and encyclopedic knowledge for metonymy resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180320 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6357912 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |