WO2022123716A1

WO2022123716A1 - 述語項構造修正プログラム、述語項構造修正方法、および情報処理装置

Info

Publication number: WO2022123716A1
Application number: PCT/JP2020/045985
Authority: WO
Inventors: ユニスサンティ
Original assignee: 富士通株式会社
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2022-06-16

Abstract

項の範囲の推定誤りを修正できるようにする。　情報処理装置（１０）は、解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報（１）を取得する。次に情報処理装置（１０）は、文章の構文解析を行うことで、文章の構文解析結果を構文木で表す構文木情報（２）を生成する。さらに情報処理装置（１０）は、構文木情報に示される構文木の部分木ごとに、部分木に含まれる単語の文章内での範囲を示す正解範囲候補を、述語項構造情報に示される項の範囲（４）と比較する。そして情報処理装置（１０）は、部分木ごとの正解範囲候補のいずれも項の範囲と一致しない場合、部分木ごとの正解範囲候補に基づいて、述語項構造情報（１）における項の範囲を修正する。

Description

述語項構造修正プログラム、述語項構造修正方法、および情報処理装置

　本発明は、述語項構造修正プログラム、述語項構造修正方法、および情報処理装置に関する。

　自然言語の文章の構造の表し方の１つに述語項構造がある。述語項構造は、文章内の述語（ｐｒｅｄｉｃａｔｅ）とその項（ａｒｇｕｍｅｎｔ）との間の関係を表現する構造である。述語の項は、その述語の動作主体または動作の対象を示す１以上の単語である。

　文章の述語項構造の解析には、機械学習の技術を利用することができる。例えば文章の述語項構造を機械学習によってコンピュータに学習させることで、述語項構造解析モデルを生成する。生成した述語項構造解析モデルを用いることで、コンピュータにより文章の述語項構造の解析が可能となる。文章の述語項構造の解析結果は、例えば質問応答（ＱＡ：Ｑｕｅｓｔｉｏｎ　Ａｎｓｗｅｒｉｎｇ）システムに用いる検索エンジン、自動要約、機械翻訳などで利用される。

　述語項構造解析モデルとしては、例えばスパンｂａｓｅｄの述語項構造解析モデルがある。スパンｂａｓｅｄの述語項構造解析モデルを用いた機械学習では、文中の述語に対して、その述語の項の範囲（スパン）が推定され、その範囲内の要素と述語との関係が述語項構造で表される。

　述語項構造解析に関連する技術としては、例えば計算コストの増大を抑制しつつ、高精度な分類精度を得られる解析モデルを学習する解析モデル学習装置が提案されている。また意味表現言語を用いてテキストから述語と少なくとも一つの項を抽出する述語項構造解析ユニットを有する知識表現拡張装置も提案されている。また文章の構文木を述語項構造解析などに利用可能なベクトルに変換する技術も提案されている。

特開２０１３－１１９８５号公報米国特許出願公開第２０１８／０１４４０４９号明細書

Qingrong Xia, Zhenghua Li, Min Zhang, Meishan Zhang, Guohong Fu, Rui Wang, Luo Si, "Syntax-aware Neural Semantic Role Labeling", Proceedings of the AAAI Conference on Artificial Intelligence, 2019-07-17, vol.33, No.01, pp7305-7313.

　スパンｂａｓｅｄの述語項構造解析モデルを利用した述語項構造解において、項の範囲の推定を誤る場合がある。項の範囲の推定誤りが発生すると、述語項構造解析の結果が不正確となる。しかし、従来技術では述語項構造解析において項の範囲の推定誤りがあっても、それを正しく修正することができない。

　１つの側面では、本発明は、項の範囲の推定誤りを修正できるようにすることを目的とする。

　１つの案では、以下に示す処理をコンピュータに実行させる述語項構造修正プログラムが提供される。
　コンピュータは、解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報を取得する。次にコンピュータは、文章の構文解析を行うことで、文章の構文解析結果を構文木で表す構文木情報を生成する。さらにコンピュータは、構文木情報に示される構文木の部分木ごとに、部分木に含まれる単語の文章内での範囲を示す正解範囲候補を、述語項構造情報に示される項の範囲と比較する。そしてコンピュータは、部分木ごとの正解範囲候補のいずれも項の範囲と一致しない場合、部分木ごとの正解範囲候補に基づいて、述語項構造情報における項の範囲を修正する。

　１態様によれば、項の範囲の推定誤りを修正できる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態に係る述語項構造修正方法の一例を示す図である。システムの構成の一例を示す図である。サーバのハードウェアの一例を示す図である。述語項構造解析の一例を示す図である。文章に対応する構文木の一例を示す図である。ベクトル化の一例を示す図である。スパンの推定誤りの一例を示す図である。修正機能付きの述語項構造解析機能の一例を示すブロック図である。スパン修正に用いる構文木の一例を示す図である。スパン修正の一例を示す図である。正解スパン候補リストの一例を示す図である。ルールベースによる正解スパン候補の抽出例を示す図である。単語スコアの計算例を示す図である。パススコアの計算例を示す図である。正解スパン候補の選択例を示す図である。オリジナルスパンが短すぎる場合の正解スパン候補の選択例を示す図である。修正機能付き述語項構造解析処理の手順の一例を示すフローチャートである。スパン修正処理の手順の一例を示すフローチャートである。

　以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
　〔第１の実施の形態〕
　まず第１の実施の形態について説明する。第１の実施の形態は、述語項構造の解析結果に示される項の範囲の誤りを修正することができる述語項構造修正方法である。

　図１は、述語項構造修正方法の一例を示す図である。図１には、情報処理装置１０を用いて述語項構造修正方法を実施した場合の例を示している。情報処理装置１０は、例えば述語項構造修正プログラムを実行することにより、述語項構造修正方法を実施することができる。

　情報処理装置１０は、記憶部１１と処理部１２とを有する。記憶部１１は、例えば情報処理装置１０が有するメモリ、またはストレージ装置である。処理部１２は、例えば情報処理装置１０が有するプロセッサ、または演算回路である。

　記憶部１１は、解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報１を記憶する。述語項構造情報１には、文章内の述語と、その述語の項の範囲の推定結果が示されている。項は１以上の単語を含む。述語項構造情報１において、各項の述語に対する役割が示されている。図１の例では述語「ｐｒｅｐａｒｅｄ」に動作主体としての役割を有する項が「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」と推定され、動作の対象を示す項が「ＡＢＣ」と推定されている。

　処理部１２は、述語項構造情報１に示される項の誤りを修正する。例えば「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」の項を修正する場合を想定する。

　まず処理部１２は、記憶部１１から述語項構造情報１を取得する。次に処理部１２は、文章の構文解析を行うことで、文章の構文解析結果を構文木で表す構文木情報２を生成する。構文解析では、例えば文章が単語ごとに分割され、単語または複数の単語を含む句の品詞が判断される。そして構文解析では、単語または句の間の修飾関係が構文木で表される。

　処理部１２は、構文木情報２に示される構文木の部分木ごとに、部分木に含まれる単語の文章内での範囲を示す正解範囲候補を、述語項構造情報に示される項の範囲４と比較する。図１に示す構文木情報２では、括弧で囲まれた範囲が、構文木における部分木に相当する。構文木情報２に示される構文木には、項の範囲４である「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」と一致する範囲の単語を含む部分木は存在しない。

　処理部１２は、部分木ごとの正解範囲候補のいずれも項の範囲４と一致しない場合、部分木ごとの正解範囲候補に基づいて、述語項構造情報１における項の範囲を修正する。例えば処理部１２は、構文木情報２に基づいて、構文木の部分木を抽出する。処理部１２は、部分木ごとの正解範囲候補が登録された正解範囲候補リスト３を生成する。図１の例では、述語「ｐｒｅｐａｒｅｄ」の下位の構造の部分木に対応する正解範囲候補が正解範囲候補リスト３に登録されている。

　処理部１２は、構文木の部分木ごとに、正解範囲候補と述語項構造情報１に示される項の範囲４との類似性に基づくスコアを計算する。例えば処理部１２は、正解範囲候補に含まれる単語と、述語項構造情報１に示される項の範囲４に含まれる単語との共通性が高いほどスコアの値を高くする。また処理部１２は、正解範囲候補と述語との構文木上での距離が近いほどスコアの値を高くしてもよい。

　次に処理部１２は、正解範囲候補それぞれのスコアに基づいて、１つの正解範囲候補を選択する。例えば処理部１２は、スコアが最も高い正解範囲候補を選択する。そして処理部１２は、述語項構造情報１における項の範囲４を、選択した正解範囲候補に示される範囲に修正する。

　このような述語項構造修正方法によれば、述語項構造解析によって生成された述語項構造情報１において項の範囲４に誤りがあっても、構文木に表された構文構造に合うように、項の範囲４を修正することができる。その結果、述語項構造情報１の正確性が向上する。

　また正解範囲候補と述語項構造情報１に示される項の範囲４との類似性に基づくスコアに基づいて、項の範囲４を修正することで、述語項構造解析における解析結果からの変更を最小限に留めることができる。これにより述語項構造解析結果を生かして適切に修正することができ、修正後の述語項構造情報に示される述語項構造の正確性が向上する。

　なお処理部１２は、例えば正解範囲候補に含まれる単語と述語項構造情報に示される項の範囲４に含まれる単語との共通性が高いほどスコアの値を高くする。これにより、スコアを容易に計算することができる。

　また処理部１２は、正解範囲候補と述語との構文木上での距離が近いほどスコアの値を高くすることもできる。これにより、構文木の構造における述語と正解範囲候補との距離をスコアに反映させることができ、項の範囲４を適切に修正することができる。

　〔第２の実施の形態〕
　次に第２の実施の形態について説明する。第２の実施の形態は、文章の述語項構造の解析結果を活用してサービスを提供するシステムの一例である。なお以下の説明では、述語の項の範囲をスパンと呼ぶこととする。

　図２は、システムの構成の一例を示す図である。図２の例では、ネットワーク２０にサーバ１００と端末装置３０が接続されている。サーバ１００は、端末装置３０からの要求に応じて、自然言語の文章の解析を伴うサービスを提供する。例えばサーバ１００は、検索サービス、機械翻訳サービス、自動要約サービスなどを行うことができる。

　図３は、サーバのハードウェアの一例を示す図である。サーバ１００は、プロセッサ１０１によって装置全体が制御されている。プロセッサ１０１には、バス１０９を介してメモリ１０２と複数の周辺機器が接続されている。プロセッサ１０１は、マルチプロセッサであってもよい。プロセッサ１０１は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、またはＤＳＰ（Digital Signal Processor）である。プロセッサ１０１がプログラムを実行することで実現する機能の少なくとも一部を、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）などの電子回路で実現してもよい。

　メモリ１０２は、サーバ１００の主記憶装置として使用される。メモリ１０２には、プロセッサ１０１に実行させるＯＳ（Operating System）のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ１０２には、プロセッサ１０１による処理に利用する各種データが格納される。メモリ１０２としては、例えばＲＡＭ（Random Access Memory）などの揮発性の半導体記憶装置が使用される。

　バス１０９に接続されている周辺機器としては、ストレージ装置１０３、グラフィック処理装置１０４、入力インタフェース１０５、光学ドライブ装置１０６、機器接続インタフェース１０７およびネットワークインタフェース１０８がある。

　ストレージ装置１０３は、内蔵した記録媒体に対して、電気的または磁気的にデータの書き込みおよび読み出しを行う。ストレージ装置１０３は、コンピュータの補助記憶装置として使用される。ストレージ装置１０３には、ＯＳのプログラム、アプリケーションプログラム、および各種データが格納される。なお、ストレージ装置１０３としては、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）を使用することができる。

　グラフィック処理装置１０４には、モニタ２１が接続されている。グラフィック処理装置１０４は、プロセッサ１０１からの命令に従って、画像をモニタ２１の画面に表示させる。モニタ２１としては、有機ＥＬ（Electro Luminescence）を用いた表示装置や液晶表示装置などがある。

　入力インタフェース１０５には、キーボード２２とマウス２３とが接続されている。入力インタフェース１０５は、キーボード２２やマウス２３から送られてくる信号をプロセッサ１０１に送信する。なお、マウス２３は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。

　光学ドライブ装置１０６は、レーザ光などを利用して、光ディスク２４に記録されたデータの読み取り、または光ディスク２４へのデータの書き込みを行う。光ディスク２４は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク２４には、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）などがある。

　機器接続インタフェース１０７は、サーバ１００に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース１０７には、メモリ装置２５やメモリリーダライタ２６を接続することができる。メモリ装置２５は、機器接続インタフェース１０７との通信機能を搭載した記録媒体である。メモリリーダライタ２６は、メモリカード２７へのデータの書き込み、またはメモリカード２７からのデータの読み出しを行う装置である。メモリカード２７は、カード型の記録媒体である。

　ネットワークインタフェース１０８は、ネットワーク２０に接続されている。ネットワークインタフェース１０８は、ネットワーク２０を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。ネットワークインタフェース１０８は、例えばスイッチやルータなどの有線通信装置にケーブルで接続される有線通信インタフェースである。またネットワークインタフェース１０８は、基地局やアクセスポイントなどの無線通信装置に電波によって通信接続される無線通信インタフェースであってもよい。

　サーバ１００は、以上のようなハードウェアによって、第２の実施の形態の処理機能を実現することができる。なお、第１の実施の形態に示した情報処理装置１０も、図２に示したサーバ１００と同様のハードウェアにより実現することができる。

　サーバ１００は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第２の実施の形態の処理機能を実現する。サーバ１００に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、サーバ１００に実行させるプログラムをストレージ装置１０３に格納しておくことができる。プロセッサ１０１は、ストレージ装置１０３内のプログラムの少なくとも一部をメモリ１０２にロードし、プログラムを実行する。またサーバ１００に実行させるプログラムを、光ディスク２４、メモリ装置２５、メモリカード２７などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１０１からの制御により、ストレージ装置１０３にインストールされた後、実行可能となる。またプロセッサ１０１が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。

　サーバ１００は、サービスの提供に当たり、自然言語で記述された文章を解釈するために述語項構造解析を行う。例えばサーバ１００がウェブサイトの検索エンジンを用いて文書検索を行う場合、ウェブサイト内の文章の述語項構造解析を行い、文章内の述語とその項との間の関係（Ｗｈｏ　ｄｉｄ　ｗｈａｔ　ｔｏ　ｗｈｏｍ？）を判断する。

　図４は、述語項構造解析の一例を示す図である。例えば解析対象の文章が入力データ３１としてサーバ１００に入力される。サーバ１００は、文章の形態素解析を行うことで、文章を単語ごとの要素に分割する。そしてサーバ１００は、述語となる要素と、その述語の項との関係を解析して、述語項構造を表す出力データ３２を生成する。

　例えば「Ｔｏｎｙ　ｓａｗ　ａ　ｂｌｕｅ　ｃａｔ　ａｎｄ　Ｍａｒｉａ　ｓｈｏｔ　ａ　ｂｉｒｄ」という文章には、「ｓａｗ」と「ｓｈｏｔ」との２つの述語が含まれる。出力データ３２には、述語ごとの述語項構造情報３２ａ，３２ｂが含まれる。

　述語項構造情報３２ａ，３２ｂにおいて述語は「Ｐ」で表されている。「ｓａｗ」に対する項は「Ｔｏｎｙ」と「ａ　ｂｌｕｅ　ｃａｔ」であり、「ｓｈｏｔ」に対する項は「Ｍａｒｉａ」と「ａ　ｂｉｒｄ」である。図４の例では、動作主体（ｗｈｏ）に当たる項は、役割（ｒｏｌｅ）として「ＡＲＧ０」が設定される。「ＡＲＧ０」の項に含めることができるのは不可算の名詞（ＮＮ）または名詞句（ＮＰ）である。動作の対象（ｗｈａｔ）に当たる項は、役割として「ＡＲＧ１」が設定される。「ＡＲＧ１」の項に含めることができるのは、不可算の名詞、名詞句などの名詞である。

　各要素にはＩＯＢ（Ｉｎｓｉｄｅ，Ｏｕｔｓｉｄｅ，Ｂｅｇｉｎ）のタグが付与される。例えば「ａ　ｂｌｕｅ　ｃａｔ」の最初の要素「ａ」には「Ｂ－」のタグが付与され、他の要素「ｂｌｕｅ」、「ｃａｔ」それぞれには「Ｉ－」のタグが付与される。

　述語の項の範囲がスパンである。「ｓａｗ」のスパンは「ａ　ｂｌｕｅ　ｃａｔ」であり、「ｓｈｏｔ」のスパンは「ａ　ｂｉｒｄ」である。
　サーバ１００は、このような述語項構造解析を行うことで、自然言語の文章を用いた高度なサービスが可能となる。例えばサーバ１００は、ＱＡシステムを用いたウェブ検索サービスを提供することができる。この場合、サーバ１００は、例えば「Ｗｈｏ　ｂｕｉｌｔ　ｔｈｅ　ｃｏｌｌｏｓｅｕｍ？」という質問が入力されると、「ｃｏｌｌｏｓｅｕｍ」に関するウェブページ内の文章の述語項構造解析を行う。サーバ１００は、述語項構造の解析結果に基づいて、述語が「ｂｕｉｌｔ」またはその類語であり、かつ対象が「ｃｏｌｌｏｓｅｕｍ」である文章の動作主を特定する。これによりサーバ１００は、例えば「Ｒｏｍａｎ　Ｆｏｒｕｍ？　Ｅｍｐｅｒｏｒ　Ｖｅｓｐａｓｉａｎ？　Ｆｌａｖｉａｎ　Ｄｙｎａｓｔｙ？　Ｒｏｍａｎ　Ｐｅｏｐｌｅ？」のような回答を出力することができる。

　述語項構造解析には、例えば機械学習により学習済みの述語項構造解析モデルを利用することができる。述語項構造解析モデルへの入力データとしては、例えば文章の構文を木構造で表した構文木に基づくベクトルデータが用いられる。

　図５は、文章に対応する構文木の一例を示す図である。サーバ１００は、例えば構文解析モデル３４を用いて入力データ３３の構文解析を行う。構文解析モデル３４は、機械学習による学習済のモデルである。サーバ１００は、構文解析の結果として構文木情報３５を生成する。構文木情報３５は、入力データ３３の文章の構文を木構造で表す構文木３６を示す情報である。

　構文木３６において子を持たないノード（葉ノード）には単語が対応付けられており、ルート以外の子を持つノード（内部ノード）は品詞（ＰＯＳ：part-of-speech）が対応付けられている。品詞はアルファベットの記号で表されている。例えば「ＮＰ」は名詞句である。「ＶＰ」は動詞句である。「Ｖ」は動詞である。「Ｎ」は名詞である。「ＰＰ」は前置詞句である。「Ｐ」は前置詞である。「Ｄｅｔ」は限定詞である。

　サーバ１００は、構文木３６を利用することで各要素をベクトル化する。そしてサーバ１００は、要素ごとのベクトルを述語項構造解析モデルへの入力とする。
　図６は、ベクトル化の一例を示す図である。サーバ１００は、構文木３６の葉ノードに割り当てられた要素それぞれに対応するベクトルｈ₁，ｈ₂，・・・を生成する。構文木３６のベクトル化方法の詳細は、前述の非特許文献１に開示されている。

　サーバ１００は、生成されたベクトルを述語項構造解析モデル３７への入力として、述語項構造解析モデル３７の出力を計算する。述語項構造解析モデル３７の出力は、構文木３６で表された文章の述語項構造情報である。

　このように述語項構造解析モデル３７を用いることで、述語項構造情報を得ることができる。しかし、実際に述語項構造解析モデル３７を用いた推論処理によって述語項構造を得るとき、項のスパンの推定を誤る可能性がある。例えば構文木３６をベクトル化する際、構文木３６に含まれるすべての情報がベクトルデータに有効に利用されない場合、項のスパンの推定誤りが発生しやすくなる。

　図７は、スパンの推定誤りの一例を示す図である。例えば「ＡＢＣ　ｗａｓ　ｐｒｅｐａｒｅｄ　ｂｙ　ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ　ｗａｓ　ａｄｄｅｄ　ｔｏ　ｔｈｅ　ｒｅｓｕｌｔ」の文章が入力データ４１として入力されたものとする。サーバ１００は、入力データ４１に対して述語項構造解析モデル３７を用いて述語項構造解析を行い、解析結果として述語項構造情報４２を生成する。述語項構造情報４２では、述語「ｐｒｅｐａｒｅｄ」の項「ＡＲＧ０」のスパンが「Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」と判断される可能性がある。上記文章の正解スパンは「Ａ，Ｂ　ａｎｄ　Ｃ」であり、余計な語「ａｎｄ　Ｘ」が含まれる「Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」は誤ったスパンである。述語項構造解析でスパンを誤ると、その後の処理（検索、機械翻訳、自動要約など）における精度が低下する。

　そこでサーバ１００では、元の文章の構文木情報を用いて、述語項構造の解析結果の誤り修正を行う。誤り修正を行うことで、正しい述語項構造情報を生成することができる。
　図８は、修正機能付きの述語項構造解析機能の一例を示すブロック図である。サーバ１００は、サービス提供部１１０と修正機能付き述語項構造解析部１２０とを有する。サービス提供部１１０は、端末装置３０からの要求に応じて、ウェブサイトの検索などのサービスを提供する。サービス提供部１１０は、文章の述語項構造を用いた処理が発生すると、修正機能付き述語項構造解析部１２０にその文章を入力する。

　修正機能付き述語項構造解析部１２０は、入力された文章の修正機能付き述語項構造解析を行う。修正機能付き述語項構造解析部１２０は、解析結果をサービス提供部１１０に送信する。

　修正機能付き述語項構造解析部１２０は、構文解析モデル記憶部１２１、述語項構造解析モデル記憶部１２２、入力データ取得部１２３、構文解析部１２４、述語項構造解析部１２５、スパンチェック部１２６、スパン修正部１２７、および結果出力部１２８を有する。

　構文解析モデル記憶部１２１は、機械学習によって生成された構文解析モデルを記憶する。構文解析モデルは、自然言語の文章に基づいて、その文章の構文を木構造で表す構文木情報を生成するための規則を定義した学習済みのモデルである。構文解析モデルは、例えばニューラルネットワークで表される。

　述語項構造解析モデル記憶部１２２は、機械学習によって生成された述語項構造解析モデルを記憶する。述語項構造解析モデルは、自然言語の文章に基づいて、その文章の述語項構造を表す述語項構造情報を生成するための規則を定義した学習済みのモデルである。述語項構造解析モデルは、例えばニューラルネットワークで表される。

　入力データ取得部１２３は、サービス提供部１１０から、述語項構造の解析対象となる文章の入力を受け付ける。入力データ取得部１２３は、入力された文章を構文解析部１２４と述語項構造解析部１２５とに送信する。

　構文解析部１２４は、構文解析モデル記憶部１２１に格納されている構文解析モデルを用いて、入力された文章の構文解析を行う。そして構文解析部１２４は、構文解析結果を表す構文木情報を生成する。構文解析部１２４は、生成した構文木情報をスパンチェック部１２６に送信する。

　述語項構造解析部１２５は、述語項構造解析モデル記憶部１２２に格納されている述語項構造解析モデルを用いて、入力された文章の述語項構造の解析を行う。そして述語項構造解析部１２５は、述語項構造解析結果を表す述語項構造情報を生成する。述語項構造解析部１２５は、生成した述語項構造情報をスパンチェック部１２６に送信する。

　スパンチェック部１２６は、構文木情報と述語項構造情報とに基づいて、述語項構造情報に示される項のスパンが正しいか否かを判断する。スパンチェック部１２６は、判断結果をスパン修正部１２７に送信する。

　スパン修正部１２７は、述語項構造情報に示される項のスパンが誤っている場合に、構文木情報と述語項構造情報とに基づいて、述語項構造のスパンを修正する。スパン修正部１２７は、修正結果を結果出力部１２８に送信する。

　結果出力部１２８は、修正処理によって正しいスパンとなった述語項構造情報を、入力された文章の述語項構造解析結果として出力する。
　なお、図８に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また、図８に示した各要素の機能は、例えば、その要素に対応するプログラムモジュールをコンピュータに実行させることで実現することができる。

　このような構成の機能を有するサーバ１００により、例えば図７に示した入力データ４１についても、正解スパンに基づく述語項構造情報を生成することが可能となる。すなわちサーバ１００は、入力データ４１に基づいて生成された述語項構造情報４２のスパンの誤りを、入力データ４１の構文解析結果として得られた構文木に基づいて修正する。

　図９は、スパン修正に用いる構文木の一例を示す図である。構文解析部１２４は、入力データ取得部１２３を介して入力データ４１を取得する。構文解析部１２４は、構文解析モデル記憶部１２１に格納されている構文解析モデル３４を用いて、入力データ４１の構文解析を行う。構文解析部１２４は、構文解析結果として構文木情報４３を出力する。構文木情報４３には、入力データ４１の構文木４４が表されている。

　構文解析によって生成された構文木情報４３は、スパンチェック部１２６に送信される。スパンチェック部１２６は、構文木情報４３を用いて、述語項構造解析部１２５により生成された述語項構造情報４２に示されるスパンが正しいか否かをチェックする。以下、修正前の述語項構造情報４２に示されるスパンをオリジナルスパンと呼ぶこととする。オリジナルスパンが誤っている場合、スパン修正部１２７がスパンを修正する。

　図１０は、スパン修正の一例を示す図である。述語項構造解析部１２５が生成した述語項構造情報４２に示される述語項構造では、「Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」がオリジナルスパンである。スパンチェック部１２６は、オリジナルスパンと構文木情報４３とを比較し、オリジナルスパンと構文木４４のいずれかの構文木要素とが一致するか否かを判断する。オリジナルスパンと構文木要素とが一致するとは、オリジナルスパンと構文木要素それぞれに含まれる単語が一致することである。

　構文木要素は、構文木４４の部分木であり、それ自身も木構造となっている。構文木情報４３では、括弧で囲まれた範囲内のすべての要素を含む木構造が構文木要素である。構文木要素のルートノードには、その構文木要素に含まれる単語または句の品詞が設定されている。構文木要素の葉ノードには、その構文木要素に含まれる単語が設定されている。

　スパンチェック部１２６は、オリジナルスパンが構文木４４の構文木要素と一致しなければ、オリジナルスパンが誤っていると判定する。図９に示す構文木４４には「Ａ，Ｂ　ａｎｄ　Ｃ」に一致する構文木要素は存在するが、「Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」に一致する構文木要素は存在しない。そのためオリジナルスパンが誤っていると判定される。

　オリジナルスパンが誤っていると判定されると、スパン修正部１２７が、構文木４４の構文木要素と一致するようにスパンを修正する。修正の結果、スパン修正部１２７は、正解スパンを示す述語項構造情報４２ａを出力する。以下、図１１～図１６を参照し、スパンの修正方法を詳細に説明する。

　スパン修正部１２７は、まず構文木情報４３に基づいて正解スパン候補リストを生成する。
　図１１は、正解スパン候補リストの一例を示す図である。スパン修正部１２７は、構文木情報４３に基づいて、述語「ＶＰ　ｐｒｅｐａｒｅｄ」の下位構造から生成可能な構文木要素に対応する正解スパン候補を生成する。述語「ＶＰ　ｐｒｅｐａｒｅｄ」の下位構造とは、図９に示す構文木４４であれば、「ｐｒｅｐａｒｅｄ」の親のノード「ＶＰ」に対する「ｐｒｅｐａｒｅｄ」とは別の子のノード「ＰＰ」をルートとする構文木要素である。この構文木要素、およびこの構文木要素に含まれる他の構文木要素に対応するスパンが、正解スパン候補として正解スパン候補リスト４５に登録される。

　図１１の例では、正解スパン候補リスト４５には、「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」、「ｔｈｅ　ｒｅａｃｔｉｏｎ」、「Ａ，Ｂ　ａｎｄ　Ｃ」、「Ａ」、「Ｂ」、および「Ｃ」が正解スパン候補として登録されている。各正解スパン候補に対応する構文木要素は、構文木情報４３で示される構文木４４の一部である。

　他方、オリジナルスパン「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」を含む部分木は、構文木４４に含まれていない。従って「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ」は正解スパン候補とはならない。

　なお「ＡＢＣ　ｗａｓ　ｐｒｅｐａｒｅｄ　ｂｙ　ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ　ａｎｄ　Ｘ　ｗａｓ　ａｄｄｅｄ　ｔｏ　ｔｈｅ　ｒｅｓｕｌｔ」のような重文は複数の述語を有する。このように述語が複数ある場合、オリジナルスパンに対応する述語の下位構造からのみ正解スパン候補の抽出を行うことで、オリジナルスパンとは別の述語の項が正解スパン候補として抽出されることを抑止できる。

　スパン修正部１２７は、正解スパン候補の抽出を、例えばルールベースで行う。その場合、スパン修正部１２７には、項の役割ごとに、その役割の項の正解スパン候補として抽出する構文木要素に関するルールが設定される。

　図１２は、ルールベースによる正解スパン候補の抽出例を示す図である。例えばスパン修正部１２７には、正解スパン候補抽出のためのルール４６が定義されている。ルール４６には、役割（ｒｏｌｅ）に対応付けて、その役割の正解スパン候補とすることができる構文木要素の品詞が設定されている。例えば役割「ＡＲＧ０」の正解スパン候補の抽出対象は、不可算の名詞（ＮＮ）または名詞句（ＮＰ）である（前置詞句（ＰＰ）を含まない）。また「ＡＲＧ１」の正解スパン候補の抽出対象も、不可算の名詞（ＮＮ）または名詞句（ＮＰ）である。

　スパン修正部１２７は、構文木情報４３において述語「ｐｒｅｐａｒｅｄ」の下位に列挙されているすべての構文木要素のうち、ルール４６に従った構文木要素を正解スパン候補として抽出する。図１２の例では、「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」、「ｔｈｅ　ｒｅａｃｔｉｏｎ」、「Ａ，Ｂ　ａｎｄ　Ｃ」、「Ａ」、「Ｂ」、および「Ｃ」は名詞句（ＮＰ）であるため、正解スパン候補として抽出される。「ｂｙ　ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」と「ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」は前置詞句（ＰＰ）であるため、正解スパン候補の抽出対象外となる。

　正解スパン候補の抽出が終了すると、スパン修正部１２７は各正解スパン候補のスコアを計算する。正解スパン候補のスコアは、例えば単語スコアとパススコアの合計である。単語スコアは、オリジナルスパンと正解スパン候補との項の類似性を示す値である。パススコアは、構文木４４における述語との距離の近さを示す値である。

　図１３は、単語スコアの計算例を示す図である。スパン修正部１２７は、正解スパン候補リスト４５から単語スコアの計算対象の正解スパン候補を１つ選択する。次にスパン修正部１２７は、選択した正解スパン候補とオリジナルスパンとで重複する単語数（ｎ　ｏｆ　ｏｖｅｒｌａｐｐｉｎｇ　ｗｏｒｄｓ）を計数する。そしてスパン修正部１２７は、重複する単語数をオリジナルスパンの単語数（ｔｏｔａｌ　ｗｏｒｄｓ　ｉｎ　ｏｒｉｇｉｎａｌ　ｓｐａｎ）で除算した結果をＲとする。またスパン修正部１２７は、重複する単語数を正解スパン候補の単語数（ｔｏｔａｌ　ｗｏｒｄｓ　ｉｎ　ｓｐａｎ　ｃａｎｄｉｄａｔｅ）で除算した結果をＰとする。

　スパン修正部１２７は、（２×Ｐ×Ｒ）／（Ｐ＋Ｒ）を単語スコアとする。このような計算により単語スコアは「０」～「１」の間の実数となる。例えば正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」の場合、Ｒ＝７／９、Ｐ＝７／７＝１である。そのため単語スコアは、「｛２×１×（７／９）｝／（１＋７／９）＝０．８７５」となる。同様に、正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ」の単語スコアは「０．３６３」、正解スパン候補「Ａ，Ｂ　ａｎｄ　Ｃ」の単語スコアは「０．６１４」となる。正解スパン候補「Ａ」、「Ｂ」、および「Ｃ」それぞれの単語スコアは共に「０．２００」となる。

　スパン修正部１２７は、例えば正解スパン候補それぞれに識別番号（Ｎｏ．）を付与し、その識別番号に対応付けて単語スコアを管理する。図１３の例では、正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」の識別番号は「１」である。正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ」の識別番号は「２」である。正解スパン候補「Ａ，Ｂ　ａｎｄ　Ｃ」の識別番号は「３」である。正解スパン候補「Ａ」の識別番号は「４」である。正解スパン候補「Ｂ」の識別番号は「５」である。正解スパン候補「Ｃ」の識別番号は「６」である。

　このようにして算出される単語スコアは、オリジナルスパンと正解スパン候補とに含まれる単語が類似するほど高い値となる。オリジナルスパンは述語項構造解析モデルに基づいて推定された結果であるため、単語スコアが高い正解スパン候補ほど、述語項構造解析モデルに基づく推定結果が反映されていることを意味する。オリジナルスパンが誤りであったとしても、述語項構造解析結果を有効に利用するためには、オリジナルスパンに類似するスパンに修正するのが適切であると考えられる。

　図１４は、パススコアの計算例を示す図である。スパン修正部１２７は、各正解スパン候補について、対応する構文木要素（構文木４４の部分木）のルートノードを特定する。図１４において、構文木４４のノードの横に示す番号は、そのノードをルートノードとする正解スパン候補の識別番号である。

　スパン修正部１２７は、特定したルートノードから述語のノードまでエッジを辿った場合に経由するエッジ（ノード間を結ぶ線）の数を計数し、その値を正解スパン候補と述語との距離とする。そしてスパン修正部１２７は、各正解スパン候補について、述語との距離の逆数をパススコアとする。距離の逆数とすることで、述語からの距離が近い正解スパン候補ほどパススコアが高い値となる。

　例えば正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ」の構文木要素のルートノードは、「ｔｈｅ　ｒｅａｃｔｉｏｎ」のノードの親ノード「ＮＰ」である。このノードから構文木４４のエッジを辿って述語「ｐｒｅｐａｒｅｄ」のノードに到達するには、４つのエッジを経由することとなる。従って正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ」から述語までの距離は「４」となり、パススコアは「１／４」となる。同様に、正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」のパススコアは「１／３」、正解スパン候補「Ａ，Ｂ　ａｎｄ　Ｃ」のパススコアは「１／５」となる。正解スパン候補「Ａ」、「Ｂ」、および「Ｃ」それぞれのパススコアは共に「１／６」となる。

　述語との間の距離が近い正解スパン候補ほど、その述語の正しい項である可能性が高い。そのためオリジナルスパンをパススコアが高い正解スパン候補に修正することで、スパンの修正精度が向上する。

　スパン修正部１２７は、単語スコアとパススコアとの合計を最終スコアとし、正解スパン候補を最終スコアでランキングする。そしてスパン修正部１２７は、最終スコアが最も高い正解スパン候補を選択し、選択した正解スパン候補に示されるスパンとなるように項のスパンを修正する。

　図１５は、正解スパン候補の選択例を示す図である。図１５に示す例では、正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」の最終スコア「１．２１」が最も高い。従って正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」が選択される。選択された正解スパン候補は、述語「ｐｒｅｐａｒｅｄ」の正解スパンである（図７参照）。

　なお図１５に示すオリジナルスパン５１は、正解スパンに余計な語（ａｎｄ　Ｘ）が含まれている場合の例である。述語項構造解析では、正解スパンよりも短い（語が不足している）オリジナルスパンとなる場合もある。このような場合であっても、スパン修正部１２７は正しくスパンを修正することができる。

　図１６は、オリジナルスパンが短すぎる場合の正解スパン候補の選択例を示す図である。図１６の例では、オリジナルスパン５２は「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ」である。図１５の例と比較すると、各正解スパン候補のパススコアは同じであるが、単語スコアが異なる。例えば正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」の場合、Ｒ＝４／４＝１、Ｐ＝４／７である。そのため単語スコアは「｛２×（４／７）×１｝／（４／７＋１）＝０．７２７」となる。同様に、正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ」の単語スコアは「０．６６７」、正解スパン候補「Ａ，Ｂ　ａｎｄ　Ｃ」の単語スコアは「０．２５０」となる。正解スパン候補「Ａ」、「Ｂ」、および「Ｃ」それぞれの単語スコアは共に「０．４００」となる。

　この場合でも正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」の最終スコア「１．０６」が最も高い。従って正解スパン候補「ｔｈｅ　ｒｅａｃｔｉｏｎ　ｏｆ　Ａ，Ｂ　ａｎｄ　Ｃ」が選択される。すなわちオリジナルスパンが短すぎる場合であっても、正しい正解スパン候補を選択することができる。

　次に、修正機能付き述語項構造解析処理の手順について詳細に説明する。
　図１７は、修正機能付き述語項構造解析処理の手順の一例を示すフローチャートである。以下、図１７に示す処理をステップ番号に沿って説明する。

　［ステップＳ１０１］入力データ取得部１２３は、サービス提供部１１０から入力データを取得する。入力データ取得部１２３は、取得した入力データを構文解析部１２４と述語項構造解析部１２５とに送信する。

　［ステップＳ１０２］述語項構造解析部１２５は、述語項構造解析モデル記憶部１２２に格納されている述語項構造解析モデルを用いて、入力データに示される文章の述語項構造解析を行う。例えば述語項構造解析部１２５は、入力データに示される文章の構文木を生成し、構文木のベクトル化を行う。述語項構造解析部１２５は、ベクトル化によって生成された単語ごとのベクトルを述語項構造解析モデルへの入力とし、述語項構造解析モデルを用いた推論を行い、述語項構造情報を生成する。述語項構造解析部１２５は、生成した述語項構造情報をスパンチェック部１２６に送信する。

　［ステップＳ１０３］構文解析部１２４は、入力データに示される文章の構文解析を行い、構文木情報を生成する。構文解析部１２４は、構文木情報をスパンチェック部１２６に送信する。

　［ステップＳ１０４］スパンチェック部１２６は、構文木情報を用いて、述語項構造情報のオリジナルスパンが構文木の構文木要素のいずれか１つと一致するか否かを判断する。スパンチェック部１２６は、オリジナルスパンがいずれか１つの構文木要素と一致した場合、述語項構造解析部１２５が生成した述語項構造情報を結果出力部１２８に送信し、処理をステップＳ１０６に進める。またスパンチェック部１２６は、オリジナルスパンがいずれの構文木要素とも一致しない場合、構文木情報と述語項構造情報とをスパン修正部１２７に送信し、処理をステップＳ１０５に進める。

　［ステップＳ１０５］スパン修正部１２７は、述語項構造情報のスパン修正処理を行う。スパン修正部１２７は、スパン修正後の述語項構造情報を結果出力部１２８に送信する。スパン修正処理の詳細は後述する（図１８参照）。

　［ステップＳ１０６］結果出力部１２８は、スパンチェック部１２６またはスパン修正部１２７から送信された述語項構造情報を、入力データの述語項構造解析結果としてサービス提供部１１０に送信する。

　次に、スパン修正処理について詳細に説明する。
　図１８は、スパン修正処理の手順の一例を示すフローチャートである。以下、図１８に示す処理をステップ番号に沿って説明する。

　［ステップＳ１２１］スパン修正部１２７は、予め設定されたルール４６から、オリジナルスパンの項としてのｒｏｌｅに対応する構文木要素の品詞を抽出する。例えばスパン修正部１２７は、述語項情報におけるオリジナルスパンに含まれる要素のｒｏｌｅを判断する。例えば図１０に示した述語項構造情報４２のオリジナルスパンであれば、ｒｏｌｅが「ＡＲＧ０」であると判断される。スパン修正部１２７は、ルール４６から、そのｒｏｌｅに対応する構文木要素の品詞を抽出する。例えばｒｏｌｅ「ＡＲＧ０」の場合、品詞「ＮＮ」、「ＮＰ」が抽出される。

　［ステップＳ１２２］スパン修正部１２７は、抽出した品詞と修正対象のオリジナルスパンに対応する述語とに基づいて、構文解析部１２４から取得した構文木情報から構文木要素を抽出する。例えばスパン修正部１２７は、構文木情報において、修正対象のオリジナルスパンに対応する述語より下位の構造から、抽出した品詞に該当する構文木要素をすべて抽出する。スパン修正部１２７は、抽出した構文木要素を、正解スパン候補として正解スパン候補リストに登録する。

　［ステップＳ１２３］スパン修正部１２７は、正解スパン候補それぞれについて、正価スパン候補とオリジナルスパンとを比較し、単語スコアを計算する。
　［ステップＳ１２４］スパン修正部１２７は、正解スパン候補それぞれについて、構文木上での正解スパン候補とオリジナルスパンに対応する述語との距離に基づいてパススコアを計算する。

　［ステップＳ１２５］スパン修正部１２７は、正解スパン候補それぞれについて、単語スコアとパススコアを合計することで最終スコアを計算する。
　［ステップＳ１２６］スパン修正部１２７は、最終スコアが最大の正解スパン候補に基づいて述語項構造情報におけるスパンを修正し、修正後の述語項構造情報を出力する。

　以上のようにして、述語項構造解析においてスパンを誤った場合でも、正しいスパンに修正することができる。その結果、述語項構造解析の正確性が向上する。
　しかもオリジナルスパンと単語の類似度が高い正解スパン候補ほど最終スコアを高くしているため、述語項構造解析の結果を有効に利用して、正確なスパンに修正することができる。また述語との距離が近い正解スパン候補ほど最終スコアを高くしているため、述語から遠く離れたスパンに修正されることが抑止され、修正の後のスパンの正確性が向上する。

　〔その他の実施の形態〕
　第２の実施の形態では英文についての述語項構造解析の例を用いているが、日本語などの他の言語の文章についても、同様に修正機能付き述語項構造解析を行うことができる。

　上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１　述語項構造情報
　２　構文木情報
　３　正解範囲候補リスト
　４　項の範囲
　１０　情報処理装置
　１１　記憶部
　１２　処理部

Claims

　コンピュータに、
　解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報を取得し、
　前記文章の構文解析を行うことで、前記文章の構文解析結果を構文木で表す構文木情報を生成し、
　前記構文木情報に示される前記構文木の部分木ごとに、前記部分木に含まれる単語の前記文章内での範囲を示す正解範囲候補を、前記述語項構造情報に示される前記項の範囲と比較し、
　前記部分木ごとの前記正解範囲候補のいずれも前記項の範囲と一致しない場合、前記部分木ごとの前記正解範囲候補に基づいて、前記述語項構造情報における前記項の範囲を修正する、
　処理を実行させる述語項構造修正プログラム。
　前記項の範囲の修正では、
　前記正解範囲候補ごとに、前記述語項構造情報に示される前記項の範囲との類似性に基づくスコアを計算し、
　前記正解範囲候補それぞれのスコアに基づいて、１つの前記正解範囲候補を選択し、
　前記述語項構造情報における前記項の範囲を、選択した前記正解範囲候補に示される範囲に修正する、
　請求項１記載の述語項構造修正プログラム。
　前記スコアの計算では、前記正解範囲候補に含まれる単語と前記述語項構造情報に示される前記項の範囲に含まれる単語との共通性が高いほど前記スコアの値を高くする、
　請求項２記載の述語項構造修正プログラム。
　前記スコアの計算では、前記正解範囲候補と前記述語との前記構文木上での距離が近いほど前記スコアの値を高くする、
　請求項２または３のいずれかに記載の述語項構造修正プログラム。
　コンピュータが、
　解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報を取得し、
　前記文章の構文解析を行うことで、前記文章の構文解析結果を構文木で表す構文木情報を生成し、
　前記構文木情報に示される前記構文木の部分木ごとに、前記部分木に含まれる単語の前記文章内での範囲を示す正解範囲候補を、前記述語項構造情報に示される前記項の範囲と比較し、
　前記部分木ごとの前記正解範囲候補のいずれも前記項の範囲と一致しない場合、前記部分木ごとの前記正解範囲候補に基づいて、前記述語項構造情報における前記項の範囲を修正する、
　述語項構造修正方法。
　解析対象の文章の述語と項の関係を解析する述語項構造解析の結果を示す述語項構造情報を取得し、前記文章の構文解析を行うことで、前記文章の構文解析結果を構文木で表す構文木情報を生成し、前記構文木情報に示される前記構文木の部分木ごとに、前記部分木に含まれる単語の前記文章内での範囲を示す正解範囲候補を、前記述語項構造情報に示される前記項の範囲と比較し、前記部分木ごとの前記正解範囲候補のいずれも前記項の範囲と一致しない場合、前記部分木ごとの前記正解範囲候補に基づいて、前記述語項構造情報における前記項の範囲を修正する処理部、
　を有する情報処理装置。