JP2011233164A - 文章対応付けシステムおよび文章対応付けプログラム - Google Patents
文章対応付けシステムおよび文章対応付けプログラム Download PDFInfo
- Publication number
- JP2011233164A JP2011233164A JP2011159799A JP2011159799A JP2011233164A JP 2011233164 A JP2011233164 A JP 2011233164A JP 2011159799 A JP2011159799 A JP 2011159799A JP 2011159799 A JP2011159799 A JP 2011159799A JP 2011233164 A JP2011233164 A JP 2011233164A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- basic
- actual business
- word
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000000877 morphologic effect Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 description 31
- 230000008569 process Effects 0.000 description 15
- 230000008520 organization Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 7
- 238000005400 testing for adjacent nuclei with gyration operator Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】文章対応付けシステム100は、実業務文章DB22に含まれる実業務文章を、基軸文章DB21に含まれる基軸文章と対応付ける。この際、基軸文章に含まれる単語と、実業務文章に含まれる単語とが一致する度合いとして、文章類似度を算出する。さらに、各実業務文章を、それぞれ最大の文章類似度を与える基軸文章に対して対応付ける。その後、対応付けが完了した実業務文章を、基軸文章の一部として集積し、これによって学習する。
【選択図】図20
Description
たとえば自治体の業務については、取り纏め組織である総務省が業務統一のベースとして自治体EAの参照モデルを作成し、これを自治体に提示して業務改善するよう指導を行っている。自治体はこの参照モデルを雛型にEA分析を実施し、業務フローの統一を目指している。この参照モデルの様式は、インターネット上で非特許文献1に開示される。
また、文章でなく一般的な知識を表すデータを分類するとともに、分類の結果を学習する技術の例として、特許文献2に記載される知識処理システムが挙げられる。
たとえば、特許文献1には複数の例題文書を扱うことは明記されていない。
また、特許文献2の技術では、段落番号[0054]等に記載されるように、適したフォーマットのデータを入力する必要がある。すなわち、業務内容を記述した、自然言語による文章を、曖昧性を排除したフォーマットに変換するために、高度な知識を有する管理者の作業が必要となる。このため、特許文献2の技術を、業務の内容を表す文章の処理に応用することは困難である。
演算手段は、実業務文字列および基軸文字列のそれぞれについて、形態素解析を行って実業務単語および基軸単語を取得し、演算手段は、実業務文字列と基軸文字列との組み合わせのそれぞれについて、実業務単語と、基軸単語またはその同義語とが一致する回数を算出し、演算手段は、組み合わせのそれぞれについて、一致する回数と、一致した基軸単語について定義された重みとを乗算して、各実業務単語の一致度を算出し、演算手段は、組み合わせのそれぞれについて、すべての実業務単語の一致度の総和を算出し、総和に基づいて、その組み合わせにおける一致する度合いを文章類似度として算出し、演算手段は、実業務文字列のそれぞれを、最も大きい文章類似度を与える基軸文章に対して、または、文章類似度が閾値以上となる基軸文章すべてに対して、対応付けてもよい。
演算手段は、基軸単語が名詞である場合にはその基軸単語の重みを1とし、それ以外の場合にはその基軸単語の重みを0とし、記憶手段は、複数の基軸単語について同義語を定義した辞書ファイルを記憶してもよい。
演算手段は、業務の入力または出力となる情報の名称を表す文字列と、業務に関連する法令の箇条番号とに基づいて対応付けを行ってもよい。
記憶手段は、1つの基軸文章と、対応付けにおいてその基軸文章に対応付けられたすべての実業務文章とを、1つの基軸文章に集積して記憶してもよい。
実業務文章は自治体の業務の内容を表すものであってもよい。
また、この発明に係る文章対応付けプログラムは、コンピュータを、上述の文章対応付けシステムとして機能させるので、組織の業務に関連する文章の対応付けを、複数の文章間で実行することができる。
実施の形態1.
図1に、本発明に係る文章対応付けシステム100の構成を示す。文章対応付けシステム100は、外部から入力される複数の文章に基づいて、文章間の対応付けを行うシステムである。
文章対応付けシステム100は周知のコンピュータとしての構成を有し、演算を行う演算手段10と、情報を格納する記憶手段20とを備える。また、図示しないが、文章対応付けシステム100は、外部からのデータの入力を受け取る入力部と、外部に対してデータを出力する出力部とを有する。演算手段10はCPU(中央処理装置)を含み、記憶手段20はメモリおよびHDD(ハードディスクドライブ)を含み、入力部はキーボードおよびマウスを含み、出力部はディスプレイおよびプリンタを含む。また、文章対応付けシステム100は、通信ネットワークに対する入力装置と出力装置とを兼ねるネットワークインタフェース(図示せず)を備える。
また、図示しないが、記憶手段20には、文章対応付けシステム100の動作を規定する文章対応付けプログラムが格納されている。コンピュータである文章対応付けシステム100は、この文章対応付けプログラムを実行することによって、本明細書に記載する機能を実現する。
基軸文章DB21は、各基軸文章について、項目名L1,L2,L3,SA1,SA2,SA3,NAIYOU,INPUT,OUTPUT,REF,METHOD,J1,J2,K1,K2,G1,G2で表される情報を記憶する。
SA1,SA2,SA3は、作業概要すなわちその基軸文章の要点を表す項目である。これらはたとえばそれぞれ大項目、中項目、小項目として、EA番号に対応する項目を表す。
INPUTおよびOUTPUTは、その作業を行う際の入力および出力となる資料を特定する情報を表す項目である。これらは、たとえば資料の名称を表す文字列を含む。図2の例では、基軸文章(1−1−0)は、自治体の担当者が、「課税対象者情報」と名付けられた資料に基づいて、たとえば「総括表」と名付けられた資料を作成するという作業内容を表す。
METHODは、その作業の実施方法を表し、手作業を含むか否か、コンピュータシステムによる処理を含むか否か、および、外部委託を含むか否か、を表す項目である。
J1,J2,K1,K2,G1,G2は、作業に関係する法令の箇条番号(関係法令箇条番号)を表す項目であり、この順に、条番、条附番、項番、項附番、号番、号附番に対応する。たとえば第317条の6第1項の場合、J1=317であり、J2=6であり、K1=1となる。なお、この例では基軸文章DB21に含まれる基軸文章すべてが同一の法令(たとえば地方税法)のみに関連するものであるため法令名は記憶されないが、法令名を表す項目が追加で設けられてもよい。
このデータをDBに入力した後、図2の項目名をそれぞれ所定の列に割り振ることで、基軸文章DB21を作成することができる。項目名の割り振りは、たとえば専門の担当者が行うが、あらかじめ決められた規則に従って文章対応付けシステム100が自動的に行ってもよい。
なお、実業務文章DB22は、図4に示される項目に加え、基軸文章DB21と同様のINPUT,OUTPUT,REF,METHODの項目を含んでもよい。
L1,L2,L3は、基軸文章DB21と同様である。FUBANは、同一の基軸文章に含まれる基軸単語(すなわちEA番号のL1,L2,L3がすべて一致する基軸単語)のそれぞれを互いに識別するために付される数字としての単語附番を表す項目である。TANGOはその基軸単語に対応する文字列を表す項目である。HINSIはその基軸単語の品詞を表す項目である。
基軸単語拡張DB26は、各基軸単語について、基軸単語DB25と同様に、項目名L1,L2,L3,FUBAN,TANGO,HINSIで表される情報を記憶する。さらに、基軸単語拡張DB26は、各基軸単語について、項目名OMOMIおよびDOUGIGOで表される情報を関連付けて記憶する。OMOMIは、文章対応付けシステム100が文章の対応付けを決定する際にその基軸単語がいかなる重みを持つかを表す項目である。DOUGIGOは、その基軸単語と同一の意味または類似した意味を持つ単語(またはそのような単語のリスト)を表す項目である。
なお、図7の例では、品詞(項目名HINSI)が名詞である単語のみに0でない重み(項目名OMOMI)の値が設定され、それ以外の単語については重みがすべて0となっている。
実業務単語DB27は、各実業務単語について、上述の基軸単語DB25と同様に、項目名L1,L2,L3,FUBAN,TANGO,HINSIで表される情報を関連付ける。
この突合の結果は、文章の組み合わせを単位として記憶される。例として、
‐図9は実業務文章(1−1−0)を基軸文章(1−1−0)と突合した結果であり、
‐図10は実業務文章(1−1−0)を基軸文章(1−2−0)と突合した結果であり、
‐図11は実業務文章(1−2−0)を基軸文章(1−1−0)と突合した結果であり、
‐図12は実業務文章(1−2−0)を基軸文章(1−2−0)と突合した結果である。
ITTIDOおよびITTIDO2は、基軸文章に含まれる単語と、実業務文章に含まれる単語とが一致する度合いを表す項目である。このうち、ITTIDOは、その実業務単語と一致する基軸単語の重みOMOMIの合計を表す。ITTIDO2は、その実業務単語が基軸単語の同義語と一致する場合、すなわち基軸単語拡張DB26の項目DOUGIGOに含まれる単語と一致する場合の、その基軸単語の重みOMOMIの合計を表す。GATTIは、その実業務単語と合致した基軸単語、すなわちITTIDOおよびITTIDO2に関連する基軸単語の単語附番FUBAN(複数ある場合はそのリスト)を表す。
このようにして定義される一致度の総合計、すなわちITTIDOの合計とITTIDO2の合計との和が、実業務文章と基軸文章とが一致する度合いを表す文章類似度となる。
このようにして、一致度の総合計、すなわち文章類似度は2+2=4となる。
この例では、たとえば基軸文章(1−1−0)に対しては複数の実業務文章(1−1−0)および(1−2−0)が対応付けられており、また基軸文章(1−5−0)に対してはいずれの実業務文章も対応付けられていない。さらに、基軸文章(1−3−0)および基軸文章(1−4−0)のように、基軸文章DB21における前後関係と、それぞれ対応する業務文章の実業務文章DB22における前後関係とが逆転する対応付けも含まれる。
図16は、文章対応付けシステム100が基軸文章DB21に基づいて基軸単語DB25および基軸単語拡張DB26を作成する際の処理の流れを表す。この処理は、たとえば基軸文章DB21が作成または変更されるたびに実行される。
まず、文章対応付けシステム100の演算手段10は基軸文章DB21を読み込み、これによって基軸文章をすべて入力する(ステップS1)。
ここで、管理者は、突合の妥当性を向上させるため、より重要な単語にはより大きな重みを付加しておく。たとえば、管理者は、図7に示すように、基軸文章(1−1−0)の単語附番22の単語「発送」に対して重み5を付与する。また、「て」、「に」、「を」、「は」等の、組織の業務とは直接関係がない単語が対応付けに影響を与えないようにするために、文章間の対応付けに利用すべき品詞(たとえば名詞)以外については、重みを0にする。このようにして管理者は、形態素解析で出力された品詞のうち、実業務文章との突合および対応付けの際に利用する品詞を指定するパラメータを入力することができる。
また、管理者は、突合の妥当性を向上させるため、重要な単語には同義語を関連付ける。たとえば、管理者は、図7に示すように、基軸文章(1−1−0)の単語附番22の単語「発送」に対して同義語「送付」を関連付ける。
まず、文章対応付けシステム100の演算手段10は実業務文章DB22を読み込み、これによって実業務文章をすべて入力する(ステップS11)。次に、演算手段10は、各実業務文章の項目「NAIYOU」に含まれる文字列に対して形態素解析を行い、その結果に基づいて実業務単語DB27を作成する(ステップS12)。この処理は図16のステップS2と同様にしてなされる。
演算手段10は、すべての基軸文章とすべての実業務文章との組み合わせに対して、この突合処理を繰り返す。この際、組み合わせのそれぞれについて、図9〜図12に示すように、単語自体の一致度であるITTIDOの合計と、同義語に対する一致度であるITTIDO2の合計とを算出する。また、これらの合計の和として、その組み合わせに対する文章類似度を算出する。
図7の基軸単語拡張DB26の例では名詞のみに0でない重みが与えられているので、演算手段10は、基軸文章に含まれる名詞と、実業務文章に含まれる名詞とが一致する度合いとして、文章類似度を算出することになる。
このように、すべての突合結果について、その結果(文章類似度)を集計して、集計DB29を作成する。
たとえば図13において、破線で囲んだ値が各列の最大値であるとすると、実業務文章(1−1−0)および実業務文章(1−2−0)はともに基軸文章(1−1−0)に対応付けられ、実業務文章(1−3−0)は基軸文章(1−2−0)に対応付けられることになる。このようにして、演算手段10は文章類似度に基づいて対応付けを行い、これによって対応付け結果DB30を作成する。
なお、この対応付けは、文章類似度の最大値に基づいてなされるのではなく、文章類似度が所定の閾値以上かどうかに基づいて行われてもよい。すなわち、ある実業務文章を、文章類似度が閾値以上となる基軸文章すべてに対応付けるものであってもよく、また、文章類似度が閾値以上となる基軸文章が存在しない場合には、いずれの基軸文章にも対応付けないものであってもよい。
なお、出力用のデータの形式は、たとえば関係型データベースアプリケーションが使用するファイル形式であるが、これは他の形式であってもよく、たとえばCSV形式、HTML形式、XML形式、PDF形式等であってもよい。
ここで、演算手段10は、各実業務文章を、その実業務文章が対応付けられた基軸文章に追加して、基軸文章DB21に格納する。すなわち、文章対応付けシステム100の記憶手段20は、各基軸文章と、対応付けにおいてその基軸文章に対応付けられたすべての実業務文章とを、それぞれの基軸文章に集積して記憶することになる。
なお、これ以外の項目において新たな情報が追加されてもよい。また、情報の追加に応じて、基軸文章DB21に新たな項目名が追加されてもよい。
さらに、演算手段10は、基軸単語拡張DB26に追加された単語について、ステップS3(図16)と同様の処理を行い、重みおよび同義語を追加して基軸単語拡張DB26を更新する(ステップS19)。
このようにして、図17の処理が実行されるたびに、文章対応付けシステム100は実業務文章DB22から新たな実業務文章を学習して取り込み、基軸単語拡張DB26に新たな基軸単語を追加する。これによって基軸単語拡張DB26における基軸文章と実際の業務との関係は現実をよりよく反映するものとなり、次回の対応付け処理においてより精度の高い結果を出すことができる。
まず、文章対応付けシステム100の管理者は、総務省のEA資料(図3)をRDB化し、基軸文章DB21を作成する(この処理は文章対応付けシステム100によって自動的になされてもよい)。文章対応付けシステム100は、形態素解析によって基軸単語DB25を作成する(ステップS1,S2)。さらに、重みおよび同義語の入力を受け付け、基軸単語拡張DB26を作成する(ステップS3)。
文章対応付けシステム100は、基軸文章と実業務文章との組み合わせのそれぞれについて、突合を行い文章類似度を算出し(ステップS13)、文章類似度を集計し(ステップS14)、文章類似度の大きさから突合の結果を判断して対応付けを行うとともに対応付け結果DBを格納する(ステップS15)。さらに対応付けの結果をEA資料対応表(図18)として出力し(ステップS16)、実業務文章をそれぞれ対応付けられた基軸文章に集積して学習する(ステップS17)。そして集積された単語について基軸単語DB25および基軸単語拡張DB26を更新する(ステップS18,S19)。
図2の基軸文章DB21において、基軸文章(1−2−0)の作業内容を表す項目(NAIYOU)には、「給報」という用語が含まれている。この用語は「給与支払報告書」の略語であるが、コンピュータによる一般的な形態素解析では、このような略語は必ずしも適切には処理されない。たとえば図6の基軸単語DB25では、この用語は、EA番号(1−2−0)の単語附番4の「給」という動詞と、単語附番5の「報」という接尾辞の組み合わせとして誤って解析されている。
また、図4の実業務文章DB22において、実業務文章(1−4−0)の作業内容を表す項目(NAIYOU)には、「給与支払報告書」という用語が含まれている。この用語は複合語として一つの文書を示すものであり、一まとまりの用語として扱うべきであるが、コンピュータによる一般的な形態素解析では、このような複合語は必ずしも適切には処理されない。たとえば図8の実業務単語DB27では、この用語は、業務番号(1−4−0)の単語附番5〜7の「給与」「支払」「報告書」という3つの名詞に分割されている。
このように、基軸文章(1−2−0)および実業務文章(1−4−0)は、実質的にはいずれも「給与支払報告書」という同一の文書に関する処理を含むものであり、これが文章類似度の算出において考慮されるべきであるにもかかわらず、それぞれ形態素解析において適切な処理がなされず、結果としてこの用語は突合の際に一致しないものとなる。このように、学習されない状態では、文章類似度の値は必ずしも最適なものとはならない。
このように、文章対応付けシステム100は、学習を行うことによって、また学習を繰り返すことによって、文章類似度をより適切に算出することができる。
また、文章対応付けシステム100は、ステップS3およびステップS19において基軸単語拡張DB26を作成または更新する際に、管理者からの入力を必要とする。変形例として、文章対応付けシステム100は基軸単語拡張DB26を自動的に作成または更新するものであってもよい。
この場合、たとえば文章対応付けシステム100は、名詞には重み「1」を付与し、その他の品詞には重みを付与しないものであってもよい。また、同義語を一切付与しないものであってもよい。このようにすると、外部からの入力を必要としないので、作業手順を簡素化することができる。
また、文章対応付けシステム100の記憶手段20は、単語ごとに付与されるべき重みと同義語とを定義した辞書ファイルを、あらかじめ格納していてもよい。この場合、文章対応付けシステム100は、この辞書ファイルに基づき、自動的に基軸単語拡張DB26を作成または更新することができる。
実施の形態2は、実施の形態1において、基軸文章DB21および実業務文章DB22の項目NAIYOUだけでなく、その他の項目に含まれる情報も使用して文章の対応付けを行う構成としたものである。以下、実施の形態1との相違点を説明する。
図21は、実業務法令DBの構成の例を示す。実業務法令単語DBは、実業務文章のそれぞれに関連する法令箇条番号を表すものである。この例では、たとえば実業務文章(1−1−0)に対して第317条の6第1項が関連付けられている。なお、基軸法令DBも同様の構成を有する。
図22は、基軸入力DBの構成の例を示す。基軸入力DBは、図2の基軸文章DB21の項目INPUTから所定の規則により抽出される文字列に基づいて作成される。たとえば、基軸文章(1−2−0)に対応する入力情報を表す項目(INPUT)からは、「・」という記号と改行を表す情報とで囲まれた「給与支払報告書」という文字列と、「住民税申告書」という文字列と、「委任状」という文字列に基づいて、図22のEA番号(1−2−0)で示される3行が作成される。なお、実業務入力DB、基軸出力DB、および、実業務出力DBも同様の構成を有する。
さらに、実施の形態1では、基軸単語DBに対して基軸単語拡張DBが作成されるように、実施の形態2では、基軸入力DBに対して基軸入力拡張DBが作成され、基軸出力DBに対して基軸出力拡張DBが作成される。基軸入力拡張DBは、基軸入力DBの各文字列について、項目名OMOMIおよびDOUGIGOで表される情報を関連付けて記憶する。OMOMIは、文章対応付けシステムが文章の対応付けを決定する際にその文字列がいかなる重みを持つかを表す項目である。DOUGIGOは、その文字列と同一の意味または類似した意味を持つ文字列(またはそのような文字列のリスト)を表す項目である。基軸出力拡張DBも、同様の構成を有する。実施の形態2に係る演算手段は、ステップS3において、さらに基軸入力拡張DBおよび基軸出力拡張DBの、重みおよび同義語に関する情報の入力を受け付けて設定する。または、演算手段は、基軸入力拡張DBおよび基軸出力拡張DBの、すべての重みに所定の値を設定し、すべての同義語を設定しなくてもよい。
このように、実施の形態2に係る演算手段は、業務の処理内容を表す文字列だけでなく、業務の入力または出力となる情報の名称を表す文字列と、業務に関連する法令の箇条番号とにも基づいて対応付けを行う。
また、実施の形態2では、組織の性質または業務の性質に応じて項目ごとに重みを変化させることで、対応付けの精度をより向上させることができる。たとえば、自治体のように法律に関係の深い組織の業務に対しては、関係法令箇条番号を表す項目(J1,J2,K1,K2,G1,G2)に含まれる単語(すなわち箇条番号)に対して、他の項目に含まれる単語より大きい重みを付与することで、精度をより向上させることが可能である。
なお、箇条番号は単なる数値であり、文章表現が一般に含むような曖昧性を持たないので、さらに精度が向上する可能性がある。
また、実施の形態2において、実施の形態1と同様の変形を施すことができる。
Claims (8)
- 文章間の対応付けを行う、文章対応付けシステムであって、
前記対応付けの基軸となる複数の基軸文章と、前記基軸文章に対して対応付けを行なう対象となる複数の実業務文章とを記憶する、記憶手段と、
前記実業務文章のそれぞれについて、前記基軸文章のいずれかへの対応付けを行う、演算手段と
を備え、
前記実業務文章はそれぞれ、その実業務文章を特定するための業務番号と、その実業務文章に対応する作業の処理内容を表す実業務文字列とを含み、
前記基軸文章はそれぞれ、その基軸文章を特定するための番号と、その基軸文章に対応する作業の処理内容を表す基軸文字列とを含み、
前記演算手段は、前記基軸文字列および前記実業務文字列のそれぞれに含まれる単語を識別し、
前記演算手段は、前記基軸文字列に含まれる基軸単語と、前記実業務文字列に含まれる実業務単語とが一致する度合いに基づいて、基軸文章を特定するための前記番号と前記業務番号とを用いて前記対応付けを行い、
前記演算手段は、出力用のデータを作成し、
前記出力用のデータは、前記基軸文章と、その基軸文章に対応付けられた実業務文章とを、左右に並列して出力することを示す、文章対応付けシステム。 - 前記演算手段は、前記基軸単語のそれぞれについて定義される重みに基づいて前記対応付けを行う、請求項1に記載の文章対応付けシステム。
- 前記演算手段は、前記実業務文字列および前記基軸文字列のそれぞれについて、形態素解析を行って前記実業務単語および前記基軸単語を取得し、
前記演算手段は、前記実業務文字列と前記基軸文字列との組み合わせのそれぞれについて、前記実業務単語と、前記基軸単語またはその同義語とが一致する回数を算出し、
前記演算手段は、前記組み合わせのそれぞれについて、前記一致する回数と、一致した基軸単語について定義された前記重みとを乗算して、各実業務単語の一致度を算出し、
前記演算手段は、前記組み合わせのそれぞれについて、すべての実業務単語の前記一致度の総和を算出し、前記総和に基づいて、その組み合わせにおける前記一致する度合いを文章類似度として算出し、
前記演算手段は、前記実業務文字列のそれぞれを、最も大きい前記文章類似度を与える前記基軸文章に対して、または、前記文章類似度が閾値以上となる前記基軸文章すべてに対して、対応付ける、請求項2に記載の文章対応付けシステム。 - 前記演算手段は、前記基軸単語が名詞である場合にはその基軸単語の前記重みを1とし、それ以外の場合にはその基軸単語の前記重みを0とし、
前記記憶手段は、複数の基軸単語について同義語を定義した辞書ファイルを記憶する、請求項2または3に記載の文章対応付けシステム。 - 前記演算手段は、
前記業務の入力または出力となる情報の名称を表す文字列と、
前記業務に関連する法令の箇条番号と
に基づいて前記対応付けを行う、請求項1〜4のいずれか一項に記載の文章対応付けシステム。 - 前記記憶手段は、1つの基軸文章と、前記対応付けにおいてその基軸文章に対応付けられたすべての実業務文章とを、前記1つの基軸文章に集積して記憶する、請求項1〜5のいずれか一項に記載の文章対応付けシステム。
- 前記実業務文章は自治体の業務の内容を表すものである、請求項1〜6のいずれか一項に記載の文章対応付けシステム。
- コンピュータを、請求項1〜7のいずれか一項に記載の文章対応付けシステムとして機能させるための文章対応付けプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011159799A JP5312531B2 (ja) | 2011-07-21 | 2011-07-21 | 文章対応付けシステムおよび文章対応付けプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011159799A JP5312531B2 (ja) | 2011-07-21 | 2011-07-21 | 文章対応付けシステムおよび文章対応付けプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008105936A Division JP4791503B2 (ja) | 2008-04-15 | 2008-04-15 | 文章対応付けシステムおよび文章対応付けプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011233164A true JP2011233164A (ja) | 2011-11-17 |
JP5312531B2 JP5312531B2 (ja) | 2013-10-09 |
Family
ID=45322358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011159799A Expired - Fee Related JP5312531B2 (ja) | 2011-07-21 | 2011-07-21 | 文章対応付けシステムおよび文章対応付けプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5312531B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021240832A1 (ja) * | 2020-05-27 | 2021-12-02 | 日本電信電話株式会社 | 処理装置、処理方法および処理プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003296363A (ja) * | 2002-03-29 | 2003-10-17 | Fujitsu Ltd | 文書検索方法 |
JP2004127196A (ja) * | 2002-10-07 | 2004-04-22 | Fuji Research Institute Corp | コミュニティ形成支援システム、その端末、サーバ及びプログラム |
JP2004280266A (ja) * | 2003-03-13 | 2004-10-07 | Mitsubishi Electric Corp | 事業策定システム |
JP2006277413A (ja) * | 2005-03-29 | 2006-10-12 | Toshiba Corp | 文書分類装置および文書分類方法 |
JP2006344118A (ja) * | 2005-06-10 | 2006-12-21 | Fuji Xerox Co Ltd | 利用状況通知システム |
JP2007041721A (ja) * | 2005-08-01 | 2007-02-15 | Ntt Resonant Inc | 情報分類方法およびプログラム、装置および記録媒体 |
JP2007233474A (ja) * | 2006-02-27 | 2007-09-13 | Fuji Xerox Co Ltd | 案件情報作成支援システム及びプログラム |
JP2007323454A (ja) * | 2006-06-02 | 2007-12-13 | National Institute Of Information & Communication Technology | 文書分類装置及びプログラム |
-
2011
- 2011-07-21 JP JP2011159799A patent/JP5312531B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003296363A (ja) * | 2002-03-29 | 2003-10-17 | Fujitsu Ltd | 文書検索方法 |
JP2004127196A (ja) * | 2002-10-07 | 2004-04-22 | Fuji Research Institute Corp | コミュニティ形成支援システム、その端末、サーバ及びプログラム |
JP2004280266A (ja) * | 2003-03-13 | 2004-10-07 | Mitsubishi Electric Corp | 事業策定システム |
JP2006277413A (ja) * | 2005-03-29 | 2006-10-12 | Toshiba Corp | 文書分類装置および文書分類方法 |
JP2006344118A (ja) * | 2005-06-10 | 2006-12-21 | Fuji Xerox Co Ltd | 利用状況通知システム |
JP2007041721A (ja) * | 2005-08-01 | 2007-02-15 | Ntt Resonant Inc | 情報分類方法およびプログラム、装置および記録媒体 |
JP2007233474A (ja) * | 2006-02-27 | 2007-09-13 | Fuji Xerox Co Ltd | 案件情報作成支援システム及びプログラム |
JP2007323454A (ja) * | 2006-06-02 | 2007-12-13 | National Institute Of Information & Communication Technology | 文書分類装置及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021240832A1 (ja) * | 2020-05-27 | 2021-12-02 | 日本電信電話株式会社 | 処理装置、処理方法および処理プログラム |
JP7477791B2 (ja) | 2020-05-27 | 2024-05-02 | 日本電信電話株式会社 | 処理装置、処理方法および処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5312531B2 (ja) | 2013-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106020950B (zh) | 基于复杂网络分析的函数调用图关键节点识别和标识方法 | |
CN106407211B (zh) | 对实体词的语义关系进行分类的方法和装置 | |
Koehler et al. | Data context informed data wrangling | |
WO2019169858A1 (zh) | 一种基于搜索引擎技术的数据分析方法及系统 | |
CN113678118A (zh) | 数据提取系统 | |
US20190317953A1 (en) | System and method for computerized semantic indexing and searching | |
Gregory | Challenges and opportunities for digital history | |
Ali Zaidi et al. | A multiapproach generalized framework for automated solution suggestion of support tickets | |
Solanki et al. | A system to transform natural language queries into SQL queries | |
Xiong et al. | Extended HMM and ranking models for Chinese spelling correction | |
Berdyugina et al. | Setting up context-sensitive real-time contradiction matrix of a given field using unstructured texts of patent contents and natural language processing | |
RU2571405C1 (ru) | Способ предварительного преобразования структурированного массива данных | |
JP2012113459A (ja) | 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム | |
JP2011233163A (ja) | 文章対応付けシステムおよび文章対応付けプログラム | |
JP5312531B2 (ja) | 文章対応付けシステムおよび文章対応付けプログラム | |
JP4791503B2 (ja) | 文章対応付けシステムおよび文章対応付けプログラム | |
Revanth et al. | Nl2sql: Natural language to sql query translator | |
Bloodgood et al. | Data cleaning for xml electronic dictionaries via statistical anomaly detection | |
JP2019200582A (ja) | 検索装置、検索方法及び検索プログラム | |
Yasmin et al. | Potential candidate selection using information extraction and skyline queries | |
JP4477587B2 (ja) | テキストデータのコンピュータ処理用操作ボタン生成方法 | |
CN116028620B (zh) | 一种基于多任务特征协同的生成专利摘要的方法及系统 | |
JP7312841B2 (ja) | 法律分析装置、及び法律分析方法 | |
JP5811795B2 (ja) | 文書分析システム、文書分析方法およびプログラム | |
Bertalan et al. | Using Transformer Models and Textual Analysis for Log Parsing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130702 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5312531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |