JP2010152785A - 専門用語の置換編集方法、システム、プログラム、記録媒体 - Google Patents

専門用語の置換編集方法、システム、プログラム、記録媒体 Download PDF

Info

Publication number
JP2010152785A
JP2010152785A JP2008332124A JP2008332124A JP2010152785A JP 2010152785 A JP2010152785 A JP 2010152785A JP 2008332124 A JP2008332124 A JP 2008332124A JP 2008332124 A JP2008332124 A JP 2008332124A JP 2010152785 A JP2010152785 A JP 2010152785A
Authority
JP
Japan
Prior art keywords
expression
synonym
dictionary
plain
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008332124A
Other languages
English (en)
Inventor
Shigeo Tabata
茂雄 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2008332124A priority Critical patent/JP2010152785A/ja
Publication of JP2010152785A publication Critical patent/JP2010152785A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】本発明の課題は、専門知識が無いと意味を把握しにくい専門用語データ記述された約款を、平易な表現に置換した約款に編集する方法を提供することである。
【解決手段】改訂前後の約款を比較して、改訂版にのみ存在する形態素を新語として、専門用語辞書を参照して、新語と一致する専門用語と、その専門用語の同義語を読み取る同義語抽出ステップと、表現変換辞書を参照して、専門用語や同義語に対応付けられた平易な表現を得て、あるいは、得られなければ、平易な表現の入力を受け付けて、平易な表現を当該新語に対応付けて、表現変換辞書に登録する辞書登録ステップと、改訂版約款の形態素を用いて、約款変換辞書の対象語を参照して、平易な表現を読み取って、改訂版約款の形態素を平易な表現に変換する改定版約款変換ステップと、を含んだ手順でなされることを特徴とする約款編集方法である。
【選択図】図2

Description

本発明は、専門用語を平易な表現に置換編集する方法、システム、プログラム、記録媒体に関するものである。本発明は特に、理解が難しい保険約款を理解促進させるために、専門用語を平易な表現に置換した保険約款を編集する場合に有用である。
保険会社による保険金不払い問題が増加している。その原因として、契約者が、保険契約内容を十分に理解しておらず、保険会社の契約の意図との間に食い違いが生じていることが挙げられる。
このような背景の元で、保険の契約に当たっては、契約者は保険契約の約款を正確に理解することが益々重要となっている。
そこで、保険契約とその問題点を説明する。
《1.適切な保険の選択》
保険各社からは、多種多様な保険が販売されているので、自分にとってふさわしい保険を選ぶ必要がある。保険内容は、事細かに定められており、契約書に約款として詳細に記載されている。保険契約の記載量は、必然的に膨大である。更に、保険契約の記載方法は、金融庁などが指摘しているように、二重否定や二重括弧などにより読みにくいと言われている。
従って、自分にとってふさわしい保険を選ぶために、保険契約を読み、理解するためには、膨大な時間を要することになる。
《2.保険の専門用語》
保険契約には、専門用語が多用されている。
しかも、約款の文言自体は変わらなくても、裁判の判決により、それまでの解釈が覆されて、新たな解釈が必要なことがある。
また、専門用語は、約款の種類によって、保険会社が意図する意味が微妙に変化する。
このように、保険の専門用語は、解釈が難解で骨が折れ、正確に理解することに苦労する。たとえば、特許文献1では、対象とする文章に対して専門語リストを適用して、専門語を選択して、専門語の同義語、類義語、上位概念語、下位概念語を関連付けたシソーラスデータベースを検索して、専門語に関連付けられた語を得て、この語の中から汎用語リストに掲載されていて所定の優先順位の高い語を置換語とし決定して、専門語と置換する技術が開示されている。
特開2005−338970号公報(段落0020−段落0022、図2)
しかしながら、特許文献1の技術では、シソーラスを構成する語は、専門語の同義語、類義語、上位概念語、下位概念語などの単語であって、平易な表現では無いので、専門用語の理解を深めることはできない。
また、特許文献1の技術では、専門用語の同義語や類義語が混在する文章では、ある専門用語に統一されるだけで、文章が読みやすく、理解しやすくなるわけでは無い。
本発明は以上のような点を解決するためになされたものであって、本発明の課題は、専門知識が無いと意味を把握しにくい専門用語で記述された約款を、平易な表現に置換した約款に編集する方法、システム、プログラム、記録媒体を提供することである。
本発明は、以下の各態様に記載の手段により、前記課題を解決する。
すなわち、本願発明の第1の発明は、専門用語の同義語を管理する専門用語辞書と、対象語と平易な表現とを対応付けた表現変換辞書と、を用いる約款編集方法であって、
(1)改訂版約款と改訂前の版約款とを形態素解析して切り出した形態素を比較して、改訂版にのみ存在する形態素を新語として、専門用語辞書を参照して、新語と一致する専門用語と、その専門用語の同義語を読み取る同義語抽出ステップと、
(2)読み取った専門用語あるいは同義語が対象語として表現変換辞書に登録されているか否かを判定する判定ステップと、
(3)判定した結果が、読み取った専門用語あるいは同義語の少なくとも1つが対象語として表現変換辞書に登録されていれば、その対象語に対応付けられた平易な表現を読み取って、これを当該新語に対応付けて、表現変換辞書に登録する辞書自動登録ステップと、
(4)判定した結果が、読み取った専門用語あるいは同義語が対象語として表現変換辞書に登録されていなければ、平易な表現の入力を促して、これを受け付けて当該新語に対応付けて、表現変換辞書に登録する辞書入力受付登録ステップと、
(5)改訂版約款の形態素を用いて、約款変換辞書の対象語を参照して、両者が一致する対象語に対応付けられた平易な表現を読み取って、改訂版約款の形態素を平易な表現に変換する改訂版約款変換ステップと、
を含んだ手順でなされることを特徴とする約款編集方法である。
このように、改訂された約款に新たに追加された専門用語を見つけて、この専門用語に対して、「平易な表現」に置換することが可能である。
このとき、新たに追加された専門用語が表現変換辞書に登録されていないときには、「平易な表現」の入力を受け付けて、登録することが可能である。
本願発明の第2の発明は、約款編集装置と、辞書サーバー装置と、がネットワーク接続されて構成される約款文書処理システムにおいて、
前記約款編集装置は、
専門用語で記述された約款データと平易な表現で記述された約款データを格納する約定格納領域を有する記憶部と、
改訂した専門用語で記述された約款データと改訂前の専門用語で記述された約款データとを形態素解析して切り出した形態素を比較して、改訂版にのみ存在する形態素を新語として、特定する新旧約款比較手段と、
特定した新語を含んで構成された同義語検索クエリーを作成して辞書サーバー装置に送信する同義語要求手段と、
辞書サーバー装置が返信した同義語検索結果を受信する同義語検索結果受信手段と、
同義語検索結果に含まれる同義語を含んで構成された平易表現検索クエリーを作成して辞書サーバー装置に送信する同義語平易表現要求手段と、
辞書サーバー装置が返信した平易表現検索結果を受信する平易表現検索結果受信手段と、
平易表現検索結果に含まれる同義語と平易な表現とを読み出して、前記新語と読み出した平易な表現を対応付けた追加語句データを作成して、辞書サーバー装置に送信する追加用語登録要求手段と、
を備える編集装置であって、
前記辞書サーバー装置は、
保険用語テーブルと追加語句テーブルとを含んで構成される表現変換辞書と、同義語テーブルを含んで構成される専門用語辞書と、を含んで構成される辞書データベースを格納するデータベース格納領域を有する記憶部と、
形態素の同義語要求を受け付けて、専門用語辞書の同義語テーブルを検索して、形態素の同義語を含む同義語検索結果を約款編集装置に返信する同義語特定手段と、
同義語の平易表現要求を受け付けて、表現変換辞書を検索して、同義語の平易表現もしくは同義語未登録報告を有する平易表現検索結果を約款編集装置に返信する同義語平易表現返信手段と、
約款編集装置が送信する追加語句データを受信して表現変換辞書に登録する追加用語登録手段と、
を備えることを特徴とする約款文書処理システムである。
本願発明の第3の発明は、前記約款編集装置において、
前記追加用語登録要求手段は、さらに、
平易表現検索結果に同義語未登録報告が含まれていれば、平易な表現の入力を要求して、入力された平易な表現と当該新語とを対応付けた保険用語データを作成する保険用語送信手段と、
を含んで、
前記辞書サーバー装置において、
前記追加用語登録手段は、さらに、
約款編集装置が送信する保険用語データを受信して表現変換辞書に登録する追加用語登録手段、
を含んで構成されることを特徴とする請求項2に記載の約款文書処理システムである。
本願発明の第4の発明は、コンピュータに組込むことによって、コンピュータを請求項2または3に記載の約款文書処理システムとして動作させるコンピュータプログラムである。
本願発明の第5の発明は、請求項4に記載のコンピュータプログラムを記録したコンピュータ読取り可能な記録媒体である。
本願発明によれば、
(1)改訂された約款に専門用語が新たに追加された場合に、この専門用語の同義語が表現変換辞書に登録されているときには、この専門用語の平易な表現を表現変換辞書に自動的に登録することが可能である。
(2)改訂された約款に新たに追加された専門用語の同義語が表現変換辞書に未登録のときには、編集者にこの専門用語の「平易な表現」の入力を促して、確実に表現変換辞書に登録することが可能である。
従って、本発明によれば、改訂された保険約款において、新たに追加された専門用語で説明された内容を、一般の人にとって分かりやすい表現記述に確実に置換することが可能で、誤解を与えることなく、明確に伝えることができるという効果がある。
以下、図面等を参照しながら、本発明の実施の形態について、更に詳しく説明する。
図1は、本発明の実施の形態による約款文書処理システム1の概要を説明する図である。
約款文書処理システム1は、約款編集装置100と、辞書サーバー装置300と、がネットワーク900で接続されて構成される。
約款文書処理システム1は、専門用語で記述された保険約款を「平易な表現」で記述された保険約款に変換して編集するシステムである。
約款編集装置100は、既存の文書編集プログラムを備えたパーソナルコンピューターに、後述する専用プログラムを搭載したものである。
辞書サーバー装置300は、データベース管理プログラムを備えたサーバーコンピューターに、後述する専用プログラムを搭載したものである。
辞書サーバー装置300が備える記憶部は、専門用語辞書と表現変換辞書を記憶する。
図2は、約款文書処理システム1における大まかな作業手順を説明する。
《1.契約書約款の平易変換処理》
約款編集装置100を操作する編集者は、約款編集装置100に、約款に記載される専門用語をキーにして、辞書サーバー装置300の表現変換辞書を検索させて、「平易な表現」を抽出して、約款の専門用語を「平易な表現」に置換して、顧客が読み易い約款を編集する(図2(1))。
次に、約款が改訂されたときに、改訂された約款から新たに使用された専門用語もしくはその同義語を抽出して、新たに使用された専門用語もしくはその同義語を、表現変換辞書に、登録する。
《2.表現変換辞書の更新》
約款編集装置100を操作する編集者は、約款編集装置100に、改訂版約款と改訂前の約款とを対比させて、改訂版に追加された用語を新語とし得て、新語をキーにして、辞書サーバー装置300に専門用語辞書を検索させて、キーとした新語の同義語を抽出する(同(2))。
約款編集装置100を操作する編集者は、抽出された同義語をキーにして、辞書サーバー装置300に表現変換辞書を検索させる。
検索した結果、「平易な表現」を抽出できれば、約款編集装置100を用いて、この「平易な表現」を、キーとした新語に対応付けさせて、表現変換辞書に登録する。
検索した結果、「平易な表現」が抽出できなければ、キーとした新語が表現変換辞書に未登録であるので、約款編集装置100を操作する編集者は、キーとした新語に用語の説明(=平易な表現)を対応付けて、表現変換辞書に登録して更新する(同(3))。
編集者は、約款編集装置100で更新した表現変換辞書を用いて、改訂版約款を顧客が読み易い約款に編集するために、(1)の処理に移る。
なお、表現変換辞書は、保険会社ごとに異なる辞書を用いるようにしても良い。
さらに、表現変換辞書には、新規契約用や、契約更新用や、変更手続き用などの契約の種別ごとに異なる辞書を用意して、編集者が選択して使用しても良い。
また、専門用語辞書は、業界ごとに異なる辞書を用いるようにしても良い。
図9は、約款の例である。
図9の(a)には、専門用語で記述された約款197が例示されている。
専門用語で記述された約款197として、「・・・ (2) 前条(当会社の支払責任)の事故が発生した場合において、損害賠償責任がないことが判明した場合、被保険者が被害者のために支出した応急手当、護送、その他緊急措置に要した費用、および支出についてあらかじめ当会社の書面による承認を得た費用 Q&A ・承認書の受け取るには? ・担保保険に加入したいのが・・・ ・免責金額はいくらか? 」を割付編集した例が示されている。ここで、説明のために、専門用語には、便宜的に下線を付してある。
図9の(b)には、「平易な表現」で記述された約款198が例示されている。
「平易な表現」で記述された約款198として、「・・・ (2) 前条(当会社の支払責任)の事故が発生した場合において、器物・または人間に損害を与えた場合に金銭で賠償する責任を負うことがないことが判明した場合、被保険者が被害者のために支出した応急手当、護送、その他緊急措置に要した費用、および支出についてあらかじめ当会社の書面による承認を得た費用 Q&A ・契約内容の変更手続き完了のお知らせの受け取るには? ・補償される事故に加入したいのが・・・ ・自己負担額はいくらか? 」を割付編集した例が示されている。ここで、説明のために、「平易な表現」には、便宜的に下線を付してある。
図3は、表現変換辞書391を説明する図である。
表現変換辞書391は、専門用語やその同義語を主キーとして検索して、その語に対する「平易な表現」を得るデータベースである。
図3の(a)は、表現変換辞書391の形式を説明する図である。
表現変換辞書391は、保険用語テーブル911と、追加語句テーブル912と、を含んで構成される。
保険用語テーブル911は、対象語913(=専門用語)を主キーとして、対象語と平易な表現914を対応付けた表形式の保険用語データで構成される。
対象語913は、専門用語の文字列である。
追加語句テーブル912は、対象語915(=同義語)を主キーとして、対象語と平易な表現916を対応付けた表形式の追加語句データで構成される。
対象語915は、対象語913の同義語の文字列である。
なお、同義語の中のどの語を保険邦語テーブル911の対象語913(=専門用語)とし登録してもよく、追加語句テーブル912の対象語915を便宜的に同義語と称しているに過ぎなく、専門用語の平易な表現914とその同義語の平易な表現916とは、同一である。
図3の(b)は、表現変換辞書391の例である。
図3の(b1)には、保険用語テーブル911が例示されている。
たとえば、保険用語テーブル911の例として、「(承認書、契約内容の変更手続き完了のお知らせ)、(損害賠償金、弁済によって代位取得するものがあるときは、その価額を控除したもの)、(損害賠償責任、 器物・または人間に損害を与えた場合に金銭で賠償する責任を負うこと)、(担保保険、補償される事故)、(免責金額、自己負担額)」が示されている。
この例の意味は、対象語913「損害賠償金」に対応付けられた平易な表現914は、「契約内容の変更手続き完了のお知らせ」であるということである。
または、対象語913「承認書」に対応付けられた平易な表現914は、「弁済によって代位取得するものがあるときは、その価額を控除したもの」であるということである。
または、対象語913「損害賠償任責」に対応付けられた平易な表現914は、「器物・または人間に損害を与えた場合に金銭で賠償する責任を負うこと」であるということである。
または、対象語913「担保保険」に対応付けられた平易な表現914は、「補償される事故」であるということである。
または、対象語913「免責金額」に対応付けられた平易な表現914は、「自己負担額」であるということである。
図3の(b2)は、追加語句テーブル912の例である。
図3の(b2)には、追加語句テーブル912が例示されている。
たとえば、追加語句テーブル91の例として、「(受諾書、契約内容の変更手続き完了のお知らせ)、(承諾書、契約内容の変更手続き完了のお知らせ)」が示されている。
この例の意味は、対象語915「受諾書」に対応付けられた平易な表現916は、「契約内容の変更手続き完了のお知らせ」であるということである。
または、対象語915「承諾書」に対応付けられた平易な表現916は、「契約内容の変更手続き完了のお知らせ」であるということである。
図4は、専門用語辞書397を説明する図である。
専門用語辞書397は、専門用語を主キーとして検索して、その同義語を得るデータベースである。
図4の(a)は、専門用語辞書397の形式を説明する図である。
専門用語辞書397は、同義語テーブル971を含んで構成される。
同義語テーブル971は、同義語特定情報975を主キーとして、専門用語ID973と、専門用語974と、が対応付けられた表データである。
専門用語ID973は、専門用語を識別するユニークな数字列である。
専門用語974は、文字列である。
同義語特定情報975は、同義語を特定する数字列である。
なお、同じ値の同義語特定情報975が対応付けられた専門用語974は、互いに相手の同義語である。
図4の(b)は、同義語テーブル971の例である。
たとえば、同義語テーブル971の例として、「(00001、承認書、00001)、(00002、受諾書、00001)、(00003、承諾書、00001)」が示されている。
この例の意味は、専門用語974「承認書」(専門用語ID973「00001」)と、専門用語974「承認書」(専門用語ID973「00002」)と、専門用語974「承諾書」(専門用語ID973「00003」)とは、同一の同義語特定情報975「00001」を有する同義語である。
また、同義語テーブル971の例として、「(00004、損害賠償責任、00002)」が示されている。
この例の意味は、専門用語974「損害賠償責任」(専門用語ID973「00004」)は、同義語特定情報975「00002」を有する語である。
また、同義語テーブル971の例として、「(00005、担保保険、00003)」が示されている。この例の意味は、専門用語974「担保保険」(専門用語ID973「00005」)は、同義語特定情報975「00003」を有する語である。
また、同義語テーブル971の例として、「(00006、免責金額、00004)」が示されている。この例の意味は、専門用語974「免責金額」(専門用語ID973「00006」)は、同義語特定情報975「00004」を有する語である。
次に、図5と図6とを用いて、約款文書処理の詳細な流れを説明する。
図5は、契約書約款を平易な表現に変換する処理手順を説明する図である。
《1.契約書約款の平易変換処理》
約款編集装置100は、専門用語で記述された約款の文197を形態素解析して形態素(=新語)を切り出す(図5(1−1))。
約款編集装置100は、改訂後の契約書約款に追加された用語である新語を含んで構成される平易表現検索クエリーを作成して、辞書サーバー装置300に問い合わせる(同(1−2))。
辞書サーバー装置300は、平易表現検索クエリーを受け付けて、指定された表現変換辞書391の保険用語テーブル911と追加語句テーブル912を検索して、新語と一致する専門用語(=対象語)に対応付けられた平易な表現914/916を読み出す(同(1−3))。
辞書サーバー装置300は、読み出した平易な表現914/916を、約款編集装置100に返信する(同(1−4))。
約款編集装置100は、返信された平易な表現914/916を受信して、該当する新語を「平易な表現」に置き換えて平易な表現で記述された約款198を編集する(同(1−5))。
ここで、新語(=形態素)が専門用語でない場合には、辞書サーバー装置300の表現変換辞書391を検索しても平易な表現を得られないので、新語のままで約款を編集する。
なお、約款の文を形態素解析するアルゴリズムは、公知の技術を用いればよい。形態素解析ソフトウエアとしては、パーソナルコンピューターで使用可能なパッケージプログラムを使用することができる。
図6は、表現変換辞書に未登録の専門用語や同義語を登録する処理手順を説明する図である。
《2.表現変換辞書の更新》
約款編集装置100は、改訂した約款197と改訂前の約款197との形態素を比較して、改訂した約款197に追加された形態素を新語として抽出して、この新語を含んで構成された同義語検索クエリーを作成して辞書サーバー装置300に送信する(図6(2−1))。
辞書サーバー装置300は、同義語検索クエリーを受信して、専門用語辞書397の同義語テーブルを検索して、新語と一致する専門用語およびその同義語が読み出せれば、専門用語および同義語を含む同義語検索結果を作成して、また、新語に対する専門用語よびその同義語が読み出せなければ(つまり専門用語でなければ)、同義語特定不成功報告を有する同義語検索結果を作成して、これを約款編集装置100に返信する(同(2−2))。
約款編集装置100は、受信した同義語検索結果の専門用語を含む平易表現検索クエリーを作成して辞書サーバー装置300に送信する。なお、同義語検索結果が同義語特定不成功報告を含む場合には、ステップ(2−1)に戻る(同(2−3))。
辞書サーバー装置300は、平易表現検索クエリーを受信して、表現変換辞書391を検索して、「平易な表現」が読み出せれば、「平易な表現」を含む平易表現検索結果を作成して、「平易な表現」が読み出せなければ、同義語未登録報告を有する平易表現検索結果を作成して、約款編集装置100に返信する(同(2−4))。
約款編集装置100は、返信された平易表現検索結果を受信する(同(2−5))。
平易表現検索結果に「平易な表現」が含まれる場合には、約款編集装置100は、この「平易な表現」を当該新語と対応付けて、追加語句登録クエリー(=追加語句データ)を作成して、辞書サーバー装置300に発行する。
・検索結果が「用語未登録報告」の場合には、約款編集装置100は、編集者に「平易な表現」の入力を要求して、編集者が入力した用語の説明を「平易な表現」として受け付けて、当該新語に対応付けて、保険用語登録クエリー(=保険用語データ)を作成して、辞書サーバー装置300に発行する(同(2−6))。
このように、編集者に「平易な表現」の入力を要求することによって、未登録の専門用語を確実に登録することができる。
辞書サーバー装置300は、追加語句登録クエリーを受信した場合には、「平易な表現」を対応付けた新語(=対象語)を追加語句テーブル912に登録する。あるいは、保険用語登録クエリーを受信した場合には、「平易な表現」を対応付けた新語(=対象語)を保険用語テーブル911に登録する(同(2−7))。
図7は、約款編集装置100の詳細な構成図である。
約款編集装置100は、CPU101と、入力部102と、表示部103と、ネットワーク通信部107と、記憶部109と専用プログラムとを備える。
CPU101と、入力部102と、表示部103と、ネットワーク通信部107と、記憶部109とは、BUS108で接続される。
CPU101は、中央演算装置である。
表示部103は、液晶表示装置や有機EL表示装置である。
入力部102は、マウスやキーボードである。
ネットワーク通信部107は、LANアダプターである。
記憶部109は、半導体メモリーや磁気メモリーである。
記憶部109は、約定格納領域1091と、専用プログラムとを記憶する。
約定格納領域1091は、専門用語で記述された約款データ197(テキストデータ)と平易な表現で記述された約款データ198(テキストデータ)を格納する。
このほかに、新旧約款比較手段140と、同義語要求手段150と、同義語検索結果受信手段160と、同義語平易表現要求手段164と、平易表現検索結果受信手段166と、追加用語登録要求手段170と、変換表現要求手段120と、約款表現編集手段130と、を備える。これらの各手段は、それぞれの専用プログラムによって実現され、専用プログラムがCPU101に解釈・実行されることによって機能する。
新旧約款比較手段140は、改訂した専門用語で記述された約款197と改訂前の専門用語で記述された約款197とを形態素解析して切り出した形態素を比較して、改訂版にのみ存在する形態素を新語として、特定する。
同義語要求手段150は、新旧約款比較手段140が特定した新語を含んで構成された同義語検索クエリーを作成して辞書サーバー装置300に送信する。
同義語検索結果受信手段160は、辞書サーバー装置300が返信した同義語検索結果を受信する。
同義語検索結果が同義語を含む場合には、同義語平易表現要求手段164は、この同義語を含んで構成された平易表現検索クエリーを作成して辞書サーバー装置300に送信する。
平易表現検索結果受信手段166は、辞書サーバー装置300が返信した平易表現検索結果を受信する。
追加用語登録要求手段170は、追加語句データ(たとえば追加語句登録クエリー)を辞書サーバー装置300に送信する。
追加用語登録要求手段170は、さらに、保険用語データ(たとえば保険用語登録クエリー)を辞書サーバー装置300に送信する。
追加用語登録要求手段170は、追加語句作成手段173と、保険用語作成手段175と、を含んで構成される。
追加語句作成手段173は、平易表現検索結果に対象語(=同義語)と平易な表現が含まれていれば、対象語と平易な表現とを対応付けた追加語句データを作成する
保険用語作成手段175は、平易表現検索結果に同義語未登録報告が含まれていれば、平易な表現の入力を要求して、入力された平易な表現と当該新語(=対象語)とを対応付けた保険用語データを作成する。
変換表現要求手段120は、改訂した約款の形態素(=新語)を含んで構成された変換表現検索クエリーを作成して辞書サーバー装置300に送信する。
約款表現編集手段130は、辞書サーバー装置300が返信する変換表現検索結果を受信して、変換表現検索結果に含まれる平易な表現を、改訂した約款197の当該形態素と入れ替えて、平易な表現で記述した約款198に変換する。
図8は、辞書サーバー装置300の詳細な構成図である。
辞書サーバー装置300は、CPU301と、ネットワーク通信部307と、記憶部309と専用プログラムとを備える。CPU301と、ネットワーク通信部307と、記憶部309とは、BUS308で接続される。
CPU301は、中央演算装置である。
ネットワーク通信部307は、LANアダプターである。
記憶部309は、半導体メモリーや磁気メモリーである。
記憶部309は、データベース格納領域3091と、専用プログラムとを記憶する。
データベース格納領域3091は、表現変換辞書391と専門用語辞書397とを含んで構成される辞書データベースを格納する。
このほかに、同義語特定手段330と、同義語平易表現返信手段340と、追加用語登録手段350と、変換表現返信手段310と、を備える。これらの各手段は、それぞれの専用プログラムによって実現され、専用プログラムがCPU301に解釈・実行されることによって機能する。
同義語返信手段330は、新語(=形態素)の同義語要求を受け付けて、専門用語辞書397の同義語テーブル971を検索して同義語を取得して、取得した同義語を含む同義語検索結果を約款編集装置100に返信する。
同義語返信手段330は、同義語特定手段334と、同義語抽出手段336と、を含んで構成される。
同義語特定手段334は、約款編集装置100が送信する同義語検索クエリーを受信して、専門用語辞書397の同義語テーブル971を検索して、同義語検索クエリーを構成する新語と一致する専門用語の同義語特定情報を読み出す。
同義語抽出手段336は、同義語特定手段334が読み出した同義語テーブル971の同義語特定情報975を参照して、同一の同義語特定情報を有する専門用語974を同義語として読み出して、同義語を含む同義語検索結果を作成する。
なお、同義語特定手段334は、同義語テーブル971を検索して、同義語特定情報を読み出せない場合(つまり同義語検索クエリーを構成する新語が専門用語でない場合)には、同義語特定不成功報告を作成する。このとき、同義語抽出手段336は、同義語特定不成功報告を含む同義語検索結果を作成する。
同義語平易表現返信手段340は、同義語の平易表現要求を受け付けて、表現変換辞書を検索して、同義語の平易表現もしくは同義語未登録報告を有する平易表現検索結果を約款編集装置100に返信する。
同義語平易表現返信手段340は、平易表現要求受付手段342と、平易表現検索手段344と、を含んで構成される。
平易表現要求受付手段342は約款編集装置100が送信する平易表現検索クエリーを受け付ける。
平易表現検索手段344は、平易表現検索クエリーを用いて、約款編集装置100が送信する平易表現検索クエリーを受け付けて、表現変換辞書の保険用語テーブルと追加語句テーブルを検索して、平易表現検索クエリーを構成する同義語と一致する対象語に対応付けられた平易な表現914/916が読み出せれば、「平易な表現」を含む平易表現検索結果を作成して、「平易な表現」が読み出せなければ、同義語未登録報告を有する平易表現検索結果を作成する。
追加用語登録手段350は、約款編集装置100が送信する追加語句データまたは保険用語データを受信して表現変換辞書に登録する。
用語登録手段350は、追加語句登録手段352と、保険用語登録手段354と、を含んで構成される。
追加語句登録手段352は、約款編集装置100が送信する追加語句登録クエリー(=追加語句データ)を受信して、追加語句テーブルに登録する。
保険用語登録手段354は、約款編集装置100が送信する保険用語登録クエリー(=保険用語データ)を受信して、保険用語テーブルに登録する。
変換表現返信手段310は、約款編集装置100が送信する約款の形態素を含む変換表現要求を受け付けて、表現変換辞書を検索して、平易な表現914/916を含む変換表現結果を作成して約款編集装置100に返信する。
変換表現返信手段310は、変換表現要求受付手段312と検索手段314と、を含んで構成される。
変換表現要求受付手段312は、約款編集装置100が送信する約款の形態素を含んで構成された変換表現検索クエリーを受信する。
検索手段314は、変換表現検索クエリーを用いて、表現変換辞書の保険用語テーブルと追加語句テーブルを検索して、変換表現検索クエリーを構成する形態素と一致する対象語に対応付けられた平易な表現914/916が読み出して、平易な表現914/916を含む変換表現結果を作成する。
本発明の実施の形態による約款文書処理システム1の概要を説明する図 約款文書処理システム1における大まかな作業手順を説明する図 表現変換辞書391を説明する図 専門用語辞書397を説明する図 契約書約款を平易な表現に変換する処理手順を説明する図。 表現変換辞書に未登録の専門用語や同義語を登録する処理手順を説明する図 約款編集装置100の詳細な構成図 辞書サーバー装置300の詳細な構成図 約款の例
符号の説明
1 約款文書処理システム
100 約款編集装置
120 変換表現要求手段
130 約款表現編集手段
140 新旧約款比較手段
150 同義語要求手段
160 同義語検索結果受信手段
164 同義語平易表現要求手段
166 平易表現検索結果受信手段
170 追加用語登録要求手段
197 専門用語で記述された約款データ
198 平易な表現で記述された約款データ
300 辞書サーバー装置
310 変換表現返信手段
330 同義語特定手段
340 同義語平易表現返信手段
350 追加用語登録手段
391 表現変換辞書
397 専門用語辞書
911 保険用語テーブル
912 追加語句テーブル
971 同義語テーブル

Claims (5)

  1. 専門用語の同義語を管理する専門用語辞書と、変換語と平易な表現とを対応付けた表現変換辞書と、を用いる約款編集方法であって、
    改訂版約款と改訂前の版約款とを形態素解析して切り出した形態素を比較して、改訂版にのみ存在する形態素を新語として、専門用語辞書を参照して、新語と一致する専門用語と、読み取った専門用語あるいは同義語が変換語として表現変換辞書に登録されているか否かを判定する判定ステップと、
    判定した結果が、読み取った専門用語あるいは同義語の少なくとも1つが変換語として表現変換辞書に登録されていれば、その変換語に対応付けられた平易な表現を読み取って、これを当該新語に対応付けて、表現変換辞書に登録する辞書自動登録ステップと、
    判定した結果が、読み取った専門用語あるいは同義語が対象語として表現変換辞書に登録されていなければ、平易な表現の入力を促して、これを受け付けて当該新語に対応付けて、表現変換辞書に登録する辞書入力受付登録ステップと、
    改訂版約款の形態素を用いて、約款変換辞書の変換語を参照して、両者が一致する変換語に対応付けられた平易な表現を読み取って、改訂版約款の形態素を平易な表現に変換する改訂版約款変換ステップと、
    を含んだ手順でなされることを特徴とする約款編集方法。
  2. 約款編集装置と、辞書サーバー装置と、がネットワーク接続されて構成される約款文書処理システムにおいて、
    前記約款編集装置は、
    専門用語で記述された約款データと平易な表現で記述された約款データを格納する約定格納領域を有する記憶部と、
    改訂した専門用語で記述された約款データと改訂前の専門用語で記述された約款データとを形態素解析して切り出した形態素を比較して、改訂版にのみ存在する形態素を新語として、特定する新旧約款比較手段と、
    特定した新語を含んで構成された同義語検索クエリーを作成して辞書サーバー装置に送信する同義語要求手段と、
    辞書サーバー装置が返信した同義語検索結果を受信する同義語検索結果受信手段と、
    同義語検索結果に含まれる同義語を含んで構成された平易表現検索クエリーを作成して辞書サーバー装置に送信する同義語平易表現要求手段と、
    辞書サーバー装置が返信した平易表現検索結果を受信する平易表現検索結果受信手段と、
    平易表現検索結果に含まれる同義語と平易な表現とを読み出して、前記新語と読み出した平易な表現を対応付けた追加語句データを作成して、辞書サーバー装置に送信する追加用語登録要求手段と、
    を備える編集装置であって、
    前記辞書サーバー装置は、
    保険用語テーブルと追加語句テーブルとを含んで構成される表現変換辞書と、同義語テーブルを含んで構成される専門用語辞書と、を含んで構成される辞書データベースを格納するデータベース格納領域を有する記憶部と、
    形態素の同義語要求を受け付けて、専門用語辞書の同義語テーブルを検索して、形態素の同義語を含む同義語検索結果を約款編集装置に返信する同義語特定手段と、
    同義語の平易表現要求を受け付けて、表現変換辞書を検索して、同義語の平易表現もしくは同義語未登録報告を有する平易表現検索結果を約款編集装置に返信する同義語平易表現返信手段と、
    約款編集装置が送信する追加語句データを受信して表現変換辞書に登録する追加用語登録手段と、
    を備えることを特徴とする約款文書処理システム。
  3. 前記約款編集装置において、
    前記追加用語登録要求手段は、さらに、
    平易表現検索結果に同義語未登録報告が含まれていれば、平易な表現の入力を要求して、入力された平易な表現と当該新語とを対応付けた保険用語データを作成する保険用語送信手段と、
    を含んで、
    前記辞書サーバー装置において、
    前記追加用語登録手段は、さらに、
    約款編集装置が送信する保険用語データを受信して表現変換辞書に登録する追加用語登録手段、
    を含んで構成されることを特徴とする請求項2に記載の約款文書処理システム。
  4. コンピュータに組込むことによって、コンピュータを請求項2または3に記載の約款文書処理システムとして動作させるコンピュータプログラム。
  5. 請求項4に記載のコンピュータプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2008332124A 2008-12-26 2008-12-26 専門用語の置換編集方法、システム、プログラム、記録媒体 Pending JP2010152785A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008332124A JP2010152785A (ja) 2008-12-26 2008-12-26 専門用語の置換編集方法、システム、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008332124A JP2010152785A (ja) 2008-12-26 2008-12-26 専門用語の置換編集方法、システム、プログラム、記録媒体

Publications (1)

Publication Number Publication Date
JP2010152785A true JP2010152785A (ja) 2010-07-08

Family

ID=42571771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008332124A Pending JP2010152785A (ja) 2008-12-26 2008-12-26 専門用語の置換編集方法、システム、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP2010152785A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097885A (ja) * 2013-06-03 2018-06-21 マシーン・ゾーン・インコーポレイテッドMachine Zone, Inc. マルチユーザ多言語通信のためのシステムおよび方法
US10614171B2 (en) 2013-02-08 2020-04-07 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10657333B2 (en) 2013-02-08 2020-05-19 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10685190B2 (en) 2013-02-08 2020-06-16 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025350A (ja) * 2003-06-30 2005-01-27 Toppan Printing Co Ltd 文書編集システム、文書編集方法、文書編集プログラム
JP2005338970A (ja) * 2004-05-24 2005-12-08 Fuji Xerox Co Ltd 文章処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025350A (ja) * 2003-06-30 2005-01-27 Toppan Printing Co Ltd 文書編集システム、文書編集方法、文書編集プログラム
JP2005338970A (ja) * 2004-05-24 2005-12-08 Fuji Xerox Co Ltd 文章処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10614171B2 (en) 2013-02-08 2020-04-07 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10657333B2 (en) 2013-02-08 2020-05-19 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
US10685190B2 (en) 2013-02-08 2020-06-16 Mz Ip Holdings, Llc Systems and methods for multi-user multi-lingual communications
JP2018097885A (ja) * 2013-06-03 2018-06-21 マシーン・ゾーン・インコーポレイテッドMachine Zone, Inc. マルチユーザ多言語通信のためのシステムおよび方法
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages

Similar Documents

Publication Publication Date Title
Shaalan et al. NERA: Named entity recognition for Arabic
US9405532B1 (en) Integrated cloud platform translation system
JP2010152785A (ja) 専門用語の置換編集方法、システム、プログラム、記録媒体
US6947947B2 (en) Method for adding metadata to data
US20090019358A1 (en) Extensible business reporting language (xbrl) enabler for business documents
CN104657402B (zh) 用于语言标签管理的方法和系统
US20060074987A1 (en) Term database extension for label system
US20080235227A1 (en) Systems and methods to extract data automatically from a composite electronic document
US20050071324A1 (en) Label system-translation of text and multi-language support at runtime and design
Sautter et al. Semi-automated XML markup of biosystematic legacy literature with the GoldenGATE editor
US20170154029A1 (en) System, method, and apparatus to normalize grammar of textual data
CN114692628A (zh) 样本生成方法、模型训练方法、文本抽取方法和装置
JP5400496B2 (ja) 決算書の分析結果に基づく記事を作成するシステム
Jahan et al. A pronoun replacement-based special tagging system for bengali language processing (blp)
CN115115353B (zh) 基于文件内容的审批、审批内容生成方法及装置
US10896227B2 (en) Data processing system, data processing method, and data structure
US10755047B2 (en) Automatic application of reviewer feedback in data files
US7065484B2 (en) Method and systems for screening Chinese address data
Spijkmanb et al. Concept extraction in requirements elicitation sessions: Prototype and experimentation
CN111611779A (zh) 辅助文本标注方法、装置、设备及其存储介质
Ehrlinger et al. A schema readability metric for automated data quality measurement
Rabbani et al. PVBMT: A Principal Verb based Approach for English to Bangla Machine Translation
Alosaimy et al. A review of morphosyntactic analysers and tag-sets for Arabic corpus linguistics
US20090132913A1 (en) Systems, methods and computer program products for automatic dissemination of spelling rules within working groups
Varadarajan et al. Text-mining: Application development challenges

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130528