JP6075042B2 - 言語処理装置、言語処理方法、及びプログラム - Google Patents

言語処理装置、言語処理方法、及びプログラム Download PDF

Info

Publication number
JP6075042B2
JP6075042B2 JP2012265710A JP2012265710A JP6075042B2 JP 6075042 B2 JP6075042 B2 JP 6075042B2 JP 2012265710 A JP2012265710 A JP 2012265710A JP 2012265710 A JP2012265710 A JP 2012265710A JP 6075042 B2 JP6075042 B2 JP 6075042B2
Authority
JP
Japan
Prior art keywords
phrase
node
word
sentence
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012265710A
Other languages
English (en)
Other versions
JP2014110026A (ja
Inventor
清司 大倉
清司 大倉
明 潮田
明 潮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012265710A priority Critical patent/JP6075042B2/ja
Publication of JP2014110026A publication Critical patent/JP2014110026A/ja
Application granted granted Critical
Publication of JP6075042B2 publication Critical patent/JP6075042B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Description

本発明は、言語処理装置、言語処理方法、及びプログラムに関する。
文の読解支援に関し、文の構造をわかりやすく表示し、意味の理解を助ける言語処理方法が知られている。例えば、母国語以外の言語を読んで理解する場合、単語はわかっても文の構造がわからないと、意味がつかめないことが多い。このような場合においても、文の構造をわかりやすく表示することにより、理解を助けることができる。
例えば、構文木の解析対象となるノードに付随する、句の細分類である種別の情報から、解析対象区分分類知識を参照して、該解析対象が、動詞を主辞とする動詞句類であるか、主に名詞を主辞とする非動詞句類であるか、品詞であるかを判定する例が知られている。このとき、解析対象が動詞句類であれば、動詞と、該動詞の深層格との関係を解析し、解析対象が非動詞句類であれば、名詞句と形容詞句間を含む修飾関係を解析する。また、解析対象が品詞であれば、意味解析を終了する。このように、後のキーワード抽出に必要な深層格を指定し、それ以外の不必要な深層格内部の意味解析を実行することなく、必要最小の範囲の意味構造を生成することによって解析の実行時間の短縮を実現することを目指している。また、解析全体の流れを明示的にすることによって、処理方式の保守の負担の軽減を実現することを目的としている。
また、対象物に関する知識の分類を行う知識分類支援装置で、検索母集団設定データの設定に応じて、機能モデルデータから検索母集団データを生成する例が知られている。この知識分類支援装置は、機能ノードに関する知識データを入力され、知識データと類似する機能ノードを検索し、類似する機能ノードの情報が格納される検索結果データを生成する。これにより、機能ツリーを構成する機能ノードに対する知識分類の割り当てを容易にすることを目的としている。この知識分類支援装置は、検索結果データの任意の情報が選択されると、任意の情報に関連する機能ノードを、分類先候補ノードとして表示部に強調表示させる。
さらに、行動をノードおよび当該行動の遷移をアークで表現するグラフを表示する行動データ表示方法が知られている。この行動データ表示方法では、行動データ表示装置が、行動主体の行動履歴をもとに各行動の初期確率および行動間の遷移確率を算出する。行動データ表示装置は、算出した各行動の初期確率および行動間の遷移確率をもとに、行動あるいは行動から他の行動への遷移を取り除いたときの単純性を算出し、算出した単純性の最小のものを取り除く。行動データ表示装置は、単純化した後の各行動および行動間の遷移確率をもとに当該行動をノードおよび行動間の遷移をアークで表現したグラフを生成する。このとき、行動履歴中の遷移確率が類似した複数の行動をまとめて1つの行動としてグループ化すること、グループ化の際に、予め定義された行動の階層に従ってまとめることが知られている。これにより、特徴的な部分を見つけ出しやすくすることを目指している。
さらにまた、仮想入力装置において、指示部から制御部に対して画面上の座標が入力され、座標に対応するボタンが代表仮想ボタンであった場合は、制御部が代表仮想ボタンを選択状態にする例が知られている。この例では、仮想入力装置は、表示状態切り換え部に対して、代表仮想ボタンに属する仮想ボタンを表示状態にする命令を送信し、表示状態切り換え部は、仮想ボタンを表示状態にする。座標に対応するボタンが仮想ボタンであった場合、制御部は指示部に付属するボタンの押状態をチェックし、仮想ボタンが押されたときは、制御部は、仮想ボタンに割り当てられた処理を実行する。座標に対応するボタンが存在しなかった場合は、選択状態の代表仮想ボタンが存在するかをチェックする。存在する場合は、制御部は、代表仮想ボタンを非選択状態にし、表示状態切り換え部に対して、代表仮想ボタンに属する仮想ボタンを非表示状態にする。これにより、少ない表示面積でも一覧性のある習得が容易なソフトウエアキーボードを提供することを目的としている。
特開2000−148755号公報 特開2007−115139号公報 特開2004−102681号公報 特開2000−181608号公報
ところで、長文の解析には、どの単語がどの単語に係るか、どの表現がどの表現にかかるのか、理解に時間がかかることが多い。しかし、上記のような従来の意味解析や表示方法は、大局的にフレーズを捉えるためには利用できるかもしれないが、個々の単語レベルの係り受けなどに関しての表示はできない。よって、解析結果として意味のある単語が解読に必要な単語か否か判断ができず、適切な解読支援の為の表示が行なえないことがある。
そこで、長文であっても、解析結果を簡易に表示することが可能な言語処理装置、言語処理方法、及びプログラムを提供することを目的とする。
ひとつの態様である言語処理装置は、句判定部と、解析部と、拡張部と、表示処理部と、表示部とを有する。句判定部は、入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成す句があるか否かを判定し、ある場合には前記句を出力する。解析部は、前記文の形態素解析を行い、前記形態素解析に基づき、前記文の形態素同士の関係から前記文の構文解析を行い、前記構文解析の結果に基づき、複数の前記単語のうちの互いに関係する2つの単語同士の意味上の関係、及び、複数の前記単語の夫々と前記句判定部より出力された句において主たる意味を保持する単語との意味上の関係を示す関係情報を生成する。拡張部は、前記関係情報に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を、前記関係情報と前記別の句として表示させることの可否との関係が予め定義されている拡張情報に従って行う。表示処理部は、前記別の句として表示させると判別された前記単語または句を一つの句としてまとめる。表示部は、前記文の意味を解析した前記解析結果及び前記表示処理部での処理の結果に基づき、前記文の中心概念として解析された語句、前記表示処理部によってまとめられた句、及び、該語句と該句との意味上の関係を表す前記関係情報を表示する。
別の態様である言語処理方法は、言語処理装置が、入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成すがあるか否かを判定し、ある場合には前記句を出力する。また、言語処理装置は、前記文の形態素解析を行う。さらに、言語処理装置は、前記形態素解析に基づき、前記文の形態素同士の関係から前記文の構文解析を行う。また、言語処理装置は、前記構文解析の結果に基づき、複数の前記単語のうちの互いに関係する2つの単語同士の意味上の関係、及び、複数の前記単語の夫々と前記出力された句において主たる意味を保持する単語との意味上の関係を示す関係情報を生成する。さらに、言語処理装置は、前記関係情報に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を、前記関係情報と前記別の句として表示させることの可否との関係が予め定義されている拡張情報に従って行う。また、言語処理装置は、前記別の句として表示させると判別された前記単語または句を一つの句としてまとめる。さらに、言語処理装置は、前記文の意味を解析した前記解析結果及び前記一つの句としてまとめる処理の結果に基づき、前記文の中心概念として解析された語句、前記まとめられた句、及び、該語句と該句との意味上の関係を表す前記関係情報を表示する。
なお、上述した態様に係る方法をコンピュータに行わせるためのプログラムであっても、このプログラムを当該コンピュータによって実行させることにより、上述した態様に係る方法と同様の作用効果を奏するので、前述した課題が解決される。
上述した態様によれば、長文であっても、解析結果を簡易に表示することが可能な言語処理装置、言語処理方法、及びプログラムを提供することができる。
言語処理装置の機能の一例を示すブロック図である。 グラフ表現の一例を示す図である。 グラフ表現における読解支援の一例を示す図である。 グラフ表現の別の例を示す図である。 ノードの縮退を示す図である。 入力文の表示例を示す図である。 形態素解析情報の一例を示す図である。 品詞記号情報の一例を示す図である。 構文解析情報の一例を示す図である。 意味解析情報の一例を示す図である。 拡張情報の一例を示す図である。 解析結果の初期表示の一例を示す図である。 解析結果の初期表示の別の例を示す図である。 グラフの展開例を示す図である。 グラフの別の展開例を示す図である。 グラフの別の展開例を示す図である。 入力文文字列とノードとの対応を計算する処理を示す図である。 名詞句及び動詞句の判定処理の一例を示す図である。 特定の文字列を含む名詞句の大きさの判定を示す図である。 ノードを名詞句に拡張した場合の表示例を示す図である。 入力文において、ユーザが特定の文字列を選択した場合の表示例を示す図である。 入力文において、ユーザが特定の文字列を選択した場合の別の表示例を示す図である。 ノードの拡張の一例を示す図である。 ノードの拡張の一例を示す図である。 グラフ表現の表示例をノードの拡張により簡略化した例を示す図である。 グラフ表現の一例を示す図である。 言語処理装置の動作を示すメインフローチャートである。 ノード展開及び縮退処理を示すフローチャートである。 ノード拡張処理を示すフローチャートである。 ノード拡張判定処理を示すフローチャートである。 表示方法の変形例を示す図である。 表示方法の変形例を示す図である。 文字列選択時の表示例を示す図である。 文字列選択時の表示例を示す図である。 標準的なコンピュータのハードウエア構成を示す図である。
(第1の実施の形態)
以下、図面を参照しながら、第1の実施の形態による言語処理装置1について説明する。図1は、言語処理装置1の機能の一例を示すブロック図である。言語処理装置1は、入力された文を解析し、文の意味及び構成を簡易な表現で表示する装置である。
図1に示すように、言語処理装置1は、入力部3、解析部5、名詞句判定部13、動詞句判定部15、ノード拡張部17、句表示最適化部19、対応計算部21、表示制御部23、解析結果記憶部25、および表示部27を有している。解析部5は、形態素解析部7、構文解析部9、及び意味解析部11を有している。
入力部3は、例えば、キーボードやタッチパネルなどの入力装置である。解析部5は、入力された文を解析し、解析結果を出力する。解析部5において、形態素解析部7は、入力された文の形態素解析を行い、形態素解析情報150を出力する。構文解析部9は、形態素解析情報150に基づき構文解析を行い、構文解析情報180を出力する。意味解析部11は、形態素解析情報150、構文解析情報180に基づき意味解析を行い、意味解析情報200を出力する。
名詞句判定部13は、構文解析情報180に基づき、名詞句を構成する語句を判定する。動詞句判定部15は、構文解析情報180に基づき、動詞句を構成する語句を判定する。ノード拡張部17は、名詞句判定部13、動詞句判定部15の判定結果に基づき、まとめて表示する語句を判定する。句表示最適化部19は、ノード拡張部17でまとめて表示すると判定された語句を、一つの語句にまとめる処理を行う。対応計算部21は、入力部3、名詞句判定部13、動詞句判定部15、ノード拡張部17、句表示最適化部19からの出力に応じて、後述する入力文のグラフ表現のための計算処理、入力文の文字列とグラフ表現におけるノードとの対応付けのための計算処理等を行う。
表示制御部23は、解析部5、名詞句判定部13、動詞句判定部15、ノード拡張部17、句表示最適化部19等の出力に基づき、表示部27の制御を行う。表示部27は、例えば、液晶表示装置などの表示装置である。解析結果記憶部25は、形態素解析情報150、構文解析情報180、意味解析情報200等を記憶する記憶装置である。
図2から図5を参照しながら、本実施の形態において用いる単語間の関係のグラフ表現を説明する。図2は、グラフ表現の一例を示す図である。図2に示すように、表現例30は「太郎は明日学校へ行く」という文をグラフ表現した例である。ここでグラフ表現とは、文を構成する単語の概念を「ノード」で示し、単語と単語との関係を、矢印の方向とその関係の内容を示す「アーク」で表すものである。ノードで示される概念は本来は単語に相当する意味記号で示されるが、本発明においてはユーザへわかりやすく表示させるという目的から、概念ではなく単語(またはその単語を主辞とする文節あるいは句)そのもので示すものとする。
「太郎は明日学校へ行く」という文には、「太郎」「明日」「学校」「行」という概念があり、対応するノード32〜38が設定される。例えば、表現例30において、ノード32の「行」に着目すると、ノード38の「学校」に向かって「目標」というアーク44で、単語間の関係が表されている。アーク44は、「学校」は「行」の目標(行き先)を表すということを示している。ノード32の「行」からノード36の「明日」に出ている「時間」というアーク42は、「明日」が「行」の時間を表すことを示している。同様に、ノード32の「行」からノード34の「太郎」に出ているアーク40の「動作主」は、「太郎」が「行」の動作の主体であることを表す。以下、ノードが表す概念を、ノードの内容といい、アークが示す単語間の関係を、アークの内容という。
図3は、グラフ表現における読解支援の一例を示す図である。図3に示すように、例えば、文52において、選択部54の「学校」が、ユーザにより矢印56のように入力部3を介して選択された場合、ノード38は、選択ノード37のように、例えばハイライト表示にすることにより、読解支援を行う。このとき、選択は、表現例30のノード38が、タッチパネルなどにより選択58のように選択された場合に、ハイライト表示を行うようにしてもよい。
図4は、グラフ表現の別の例を示す図である。表現例60は、「太郎は花子が行く学校へ明日行く」の構造をグラフ表現した例である。このように、修飾語句などがある場合、グラフが複雑になっていく。表現例60では、「行」「太郎」「明日」「学校」「行」「花子」を内容とするノード32〜34、ノード62、64、およびそれらの関係を示すアーク40〜44、66、68が示されている。
しかし、表現例60のように、全てのノードを展開して表示すると、表現が複雑になり、読解を支援するという目的は達成できない。このため、情報が多いノードに関しては縮退することができる。なお、ノードを展開するとは、そのノードに繋がった複数のノードを別々に表示することをいい、ノードを縮退するとは、ある一つのノードとそのノードに繋がった少なくとも一つのノードとを、その一つのノードで代表して表示させることをいう。このとき、代表して表示されたノードを縮退ノードという。
図5は、ノードの縮退を示す図である。表現例70は、「花子が行く学校」を表す構造を、「学校」に縮退した例である。「学校」は、例えば、ハッチングや色などを変えた縮退ノード39で表示され、縮退されたノードであることを表している。ここで「学校」を内容とする縮退ノード39を、例えばタッチパネルや、クリック操作などによりユーザが選択すれば、「学校」の縮退ノード39が展開され、例えば、ノード62(「行」)が展開されて表示される。このように、ユーザが深く読みたいノードを選択して展開していけば、読解支援をすることが可能となる。
次に、図6から図29を参照しながら、別の入力文を例として、第1の実施の形態による言語処理方法についてさらに説明する。図6は、入力文80の表示例を示す図である。入力文80は、図2から図5を参照しながら説明した例より、少し複雑な文となっている。
図6に示すように、入力文80は、以下の文である。「本技術は、校正前文書を所定の単位で区切った各要素が校正前文書において共に出現する関係である共起関係と、校正後文書を所定の単位で区切った各要素が校正後文書において共に出現する関係である共起関係とを格納した共起記憶部に基づいて、校正前文書における各要素の共起関係の出現頻度及び校正後文書における各要素の共起関係の出現頻度をそれぞれ算出する。」以下、この入力文80を解析する場合について説明する。
図7Aは、形態素解析情報150の一例を示す図である。形態素解析とは、予め解析結果記憶部25などに備えられた辞書等を参考にして、文を構成する形態素を解析する処理である。形態素解析情報150は、入力文80の形態素解析結果の一部を示す例であり、例えば、形態素解析部7で生成される。形態素解析情報150は、形態素番号152、形態素154、開始位置156、文字長158、品詞情報160、意味記号162を示している。形態素番号152は、形態素の識別番号であり、形態素154は、形態素の文字列である。開始位置156は、入力文における形態素の開始位置までの文字数であり、文字長158は、形態素の文字列の文字数である。品詞情報160は、形態素の品詞を示す記号であり、意味記号162は、形態素の意味を示す記号である。
例えば、形態素番号152=「1」は、形態素154=「本」である。この形態素の開始位置156=「0」であり、入力文80の先頭が開始位置であることを示している。文字長158=「1」、品詞情報160=「DET」、意味記号162=「THIS」である。
図7Bは、品詞記号情報170の一例を示す図である。品詞記号情報170は、形態素の品詞を表す記号を示す情報であり、例えばあらかじめ解析結果記憶部25に記憶されている。図7Bに示すように、例えば、品詞記号172=「DET」は、冠詞を表し、「N」は、名詞を表し、「J」は、助詞を表す。よって、図7Aの「本」は、「冠詞」と判別されたということである。
図8は、構文解析情報180の一例を示す図である。構文解析とは、予め解析結果記憶部25などに備えられた辞書等を参考にして、文を構成する形態素同士を、意味を成す句にまとめることにより互いの関係を解析する処理である。図8に示すように、構文解析情報180は、構文解析の結果の一例を示す情報であり、構文解析部9で生成される。構文解析情報180は、構成要素182、品詞184、ラベル186、主辞188を有している。構成要素182は、形態素解析情報150で解析された形態素番号152、および、ラベル186を示す。品詞184は、構成要素182の品詞を示す。ラベル186は、構成要素182に付された名称である。主辞188は、構成要素182の中での主たる意味を保持する単語を示す形態素番号152である。
図9は、意味解析情報200の一例を示す図である。意味解析とは、予め解析結果記憶部25などに備えられた辞書等を参考にして、構文解析結果から、単語の意味記号同士の関係を解析する処理である。図9に示すように、意味解析情報200は、意味解析の結果の一例を示す情報であり、意味解析部11で生成される。意味解析情報200は、出発ノード202、到達ノード204、アーク206を有している。また、出発ノード202には、形態素番号208、意味記号210、形態素212が示され、到達ノード204には、形態素番号214、意味記号216、形態素218が示されている。出発ノード202は、アークが出るノード、到達ノード204は、アークが向かうノードである。形態素番号208は、ノードの内容に対応する形態素の識別番号である。意味記号210は、形態素の意味を示す記号である。形態素212は、出発ノード202の内容に対応する形態素である。到達ノード204の形態素番号214、意味記号216、形態素218についても同様である。
意味解析情報200は、入力文80の一部である「格納した共起記憶部に基づいて」という文字列を解析した例である。意味解析情報200において、例えば、出発ノード202の形態素番号208=「65」は、意味記号210=「BASED」であり、形態素212=「基づく」である。これに対して、到達ノード204の形態素番号214=「64」は、意味記号216=「PART」であり、形態素218=「部」である。このときのアーク206=「修飾」であり、「部」は、「基づく」を「修飾」していることを示している。この解析結果により、例えば、「基づく」を内容とするノードから、「部」を内容とするノードに向かう「修飾」を内容とするアークが出るグラフが作成される。他の語句についても同様にして、入力文80を示すグラフが作成される。
図10は、拡張情報230の一例を示す図である。拡張情報230は、アークの内容と、そのアークで接続された2つのノードをひとまとめにする(以下、ノードをひとまとめにすることを、ノードを拡張するという)か否かの関係を示す情報であり、予め例えば解析結果記憶部25に記憶される。
拡張情報230は、アーク232、及び種類234を有している。アーク232は、アークの内容を示し、種類234は、アークに繋がるノード同士が拡張可能であるか否かの種類を示している。図10に示すように、例えば、アーク232(「修飾」)は、種類234=「拡張」であり、「修飾」の関係にある2つのノードは、拡張可能であることを示している。
次に、図11〜図15を参照しながら、入力文80の解析結果の表示例について説明する。図11は、解析結果の初期表示の一例を示す図である。図11に示すように、この例では、表示例82が示されている。表示例82は、表示例86とグラフ83とを含んでいる。グラフ83は、入力文80のグラフ表現であり、一つの縮退ノード84が表示されている。表示例86は、入力文80の文章表示であり、「算出する」が強調表示88されている。「算出する」は、入力文80に関して解析部5により解析を行うことにより、この入力文80の中心概念として解析された語句である。
図12は、解析結果の初期表示の別の例を示す図である。図12に示すように、この例では、表示例90が示されている。表示例90は、表示例91とグラフ92とを含んでいる。グラフ92は、入力文80のグラフ表現であり、縮退ノード84が展開された例を示している。グラフ92では、縮退ノード84が展開されて、ノード85の表示に変わっている。ノード85には、縮退ノード92がアーク100で接続され、縮退ノード94が、アーク102で接続され、縮退ノード96が、アーク104で接続され、縮退ノード98が、アーク106で接続されている。
グラフ92において、縮退ノード92の内容は「技術」であり、縮退ノード94の内容は「基づく」であり、縮退ノード98の内容は「出現頻度」であり、縮退ノード98の内容は「それぞれ」である。アーク100の内容は「動作主」、アーク102の内容は「修飾」、アーク104の内容は「対象」、アーク106の内容は「方法」である。グラフ92におけるノード及びアークの内容、及び後述する他のノード及びアークの内容は、形態素解析情報150、構文解析情報180、意味解析情報200により解析されたものである。
表示例91は、文章表現であり、強調表示88に加え、強調表示93として「本技術は」、強調表示95として「に基づいて」、強調表示97として「出現頻度をそれぞれ」という語句が表示されている。これらの強調表示93〜97は、ノード92〜98に対応している。
なお、グラフ92において、ノード85のような、アークが出ているノードを選択すると、ノードが縮退され、縮退ノードの表示に戻る。この例では、ノード85が、縮退ノード84の表示に戻り、接続されたアーク100〜106及びノード92〜98は表示されなくなる。また、逆に、縮退ノードが選択された場合には、例えば、縮退ノードから直接出ているアークとそれにつながるノードが表示される。
図13は、グラフの展開例を示す図である。図13に示すように、グラフ110は、グラフ92において、縮退ノード96(「出現頻度」)を選択した状態である。グラフ110では、縮退ノード96が展開されてノード97の表示になり、直接出ているアーク120及びそれにつながる縮退ノード114、アーク118及び、それにつながるノード112が示されている。グラフ110では、ノード112から出るアーク122および縮退ノード116が示されている。このように、縮退ノード96は、例えば展開例126のように展開される。このとき、グラフ110では図示していないが、入力文80において、例えば、図11の表示例86などのように、展開例126に対応する箇所を強調表示することが好ましい。
なお、グラフ110において、ノード112の内容は「出現頻度」であり、縮退ノード114、116の内容は「共起関係」である。アーク118の内容は「列挙」であり、アーク120、122の内容は「修飾」である。
図14は、グラフの別の展開例を示す図である。図14に示すように、グラフ130は、グラフ110において、縮退ノード94(「基づく」)を選択した状態である。グラフ130では、縮退ノード94が展開されてノード95の表示になり、直接出ているアーク134及びそれにつながる縮退ノード132が示されている。このように、縮退ノード94は、例えば展開例136のように展開される。なお、グラフ130において、ノード132の内容は「部」であり、アーク134の内容は「修飾」である。
またこのとき、図13のグラフ110で展開されていた展開例126は、縮退例138のように縮退ノード96に戻っている。これにより、注目したい箇所のみを詳細に表示させ、より簡易な表示としている。
図15は、グラフの別の展開例を示す図である。図15のグラフ220は、図14のグラフ130をさらに展開したグラフ表現の例である。図15に示すように、グラフ220は、グラフ130において、縮退ノード132(「部」)を展開したグラフ表現である。
グラフ220では、縮退ノード132が展開されてノード133の表示になり、直接出ているアーク225及びそれにつながる縮退ノード221が示されている。また、アーク226及びそれにつながる縮退ノード222、さらにそこから出るアーク227及びそれにつながるノード223が示されている。このように、縮退ノード94は、例えば展開例228のように展開される。
なお、グラフ220において、ノード222の内容は「記憶」であり、ノード223の内容は「共起」であり、縮退ノード221の内容は「格納」である。アーク225の内容は「動作主」であり、アーク226の内容は「修飾」であり、アーク227の内容は「対象」である。
続いて、図16から図23を参照しながら、第1の実施の形態による言語処理についてさらに説明する。図16は、入力文文字列とノードとの対応を計算する処理を示す図である。図16においては、入力文として文240「これはペンです。」が与えられた場合について説明する。文240は、解析部5により、「これ」「は」「ペン」「です」「。」という形態素242〜250に解析される。
これらの形態素242〜250の中で、例えば、形態素242の「これ」と、形態素246の「ペン」とが、ノード243、247に対応付けられ、それらのノードの関係は、「<ISA>」で表される。このとき、形態素242は、開始位置(オフセット)が「0」、文字数が「2」である。形態素246は、開始位置(オフセット)が「3」、文字数が「2」である。このようにして、入力された文の解析結果の各ノードについて、入力部3により受け付けられた文字列との対応が、対応計算部21により計算される。
図17は、名詞句及び動詞句の判定処理の一例を示す図である。図17に示すように、句判定例250においては、文字列252「〜と・・・とを格納した共起記憶部に」について名詞句判定部13及び動詞句判定部15が判定処理を行う。文字列252の形態素毎の品詞は、品詞情報254で表される。この品詞情報254は、形態素解析部7による解析結果から得られる。
例えば、文字列252の一部の「共起記憶部」という文字列は、品詞情報254に示すように、「共起」「記憶」「部」という3つの名詞(N)で表される。このとき、句情報256に示すように、名詞句判定部13により、「共起」と「記憶」は、ひとつの名詞句(NP)「共起記憶」を構成すると判定される。さらに、「共起記憶」と「部」とは、一つの名詞句を構成すると判定される。図17に示す最小名詞句270は、「部」を含む最小名詞句である。
同様に、句情報256に示すように、「〜と」と「・・・と」とは、ともに名詞句である。さらに、句情報258に示すように、「〜と・・・と」は名詞句であると判定される。句情報260に示すように、「〜と・・・とを」も名詞句であると判定される。
「格納した」は、品詞情報254に示すように、動詞(V)である。「〜と・・・とを格納した」は、句情報262に示すように、動詞句判定部15により、動詞句(VP)であると判定される。
さらに、句情報264に示すように、「〜と・・・とを格納した共起記憶部」は、名詞句であると判定される。同様に、句情報266にしめすように、文字列252「〜と・・・とを格納した共起記憶部に」は、名詞句であると判定される。
図18は、特定の文字列を含む名詞句の大きさの判定を示す図である。句判定例280は、「部」を含む名詞句の大きさの判定例を示している。「部」は、文字列252「〜と・・・とを格納した共起記憶部に」の「主辞」である。
図18に示すように、「部」が含まれる名詞句は、「部」を含む文字列の句情報を図18の下方から上方に向かって矢印282のように参照し、句情報に「NP」が現われたところに対応する文字列となる。矢印282によれば、「部」を含む最小の文字列は、最小名詞句270(「共起記憶部」)である。2番目に小さい名詞句は、同様に図18の上方に向かって矢印284のように句情報を参照する。これにより、2番目に小さい名詞句は名詞句272(「〜と・・・とを格納した共起記憶部」)である。
図19は、ノードを名詞句に拡張した場合の表示例を示す図である。図19に示すように、表示例290は、表示例292、グラフ296を含んでいる。表示例292は、入力文80において、ユーザにより選択された選択文字列294が、下線により強調表示されている例である。
グラフ296は、選択された選択文字列294に対応した解析結果のグラフ表現を示す例である。例えば図14のグラフ130において、縮退ノード132で表されていた「部」に代えて、「部」を含む最小の名詞句に対応した簡略ノード298(「共起記憶部」)が示されている。簡略ノードとは、拡張された句に対応して表示されるノードをいう。
図20、図21は、入力文80において、ユーザが特定の文字列を選択した場合の別の表示例を示す図である。図20に示すように、表示例310において、文字列「頻度及び校正」という部分がユーザにより選択されているとする。選択された選択文字列312は、例えばハイライト表示される。
ところで、この文字列「頻度及び校正」をグラフ表現にすることを考えてみる。「頻度及び校正」は、入力文80において直接繋がっているため、表示例310のように選択することができる。しかし、グラフ表現においては、「頻度」と「校正」は直接つながっていない。しかも、「頻度」は名詞句「出現頻度」の中の単語であり、「校正」は名詞句「校正後文書」の中の単語である。そこで、このような場合、選択された部分を自動的に拡張する。
図21は、解析結果の表示例を示す図である。図21において、表示例320は、表示例322、およびグラフ340を含んでいる。表示例322は、入力文80において、図20においてユーザに選択された選択文字列312の読解支援を行なった場合に注目すべき文字列を強調表示により示した例である。グラフ340は、図13のグラフ110をさらに展開したグラフ表現の一例を示す図である。
グラフ340においては、グラフ110における縮退ノード116が展開されてノード117となり、アーク350及びそれに繋がるノード344、アーク352及びそれに繋がるノード348が表示されている。ノード344の内容は「校正後文書」であり、ノード348の内容は、「各要素」である。アーク350の内容は「範囲」であり、アーク352の内容は「関連」である。このグラフ340において、拡張対象354、356、358が設定されている。
図22、図23は、ノードの拡張の一例を示す図である。図22は、例えば、図21に示した拡張対象356におけるノードの拡張について示している。図22に示すように、拡張対象356において、ノード112の「出現頻度」と、縮退ノード116の「共起関係」とが別々に表示されているが、これらをまとめて一つの簡略ノード372とする。簡略ノード372の内容は、「共起関係の出現頻度」となる。
図23は、拡張対象358におけるノードの拡張について示している。図23に示すように、拡張対象358において、ノード344の「校正後文書」とノード348の「各要素」とが別々に表示されているが、これらをまとめて一つの簡略ノード377とする。簡略ノード377の内容は、「校正後文書における各要素の」となる。
図24は、図21におけるグラフ表現のグラフ340を、ノードの拡張により簡略化した例を示す図である。図24に示すように、表示例380は、表示例382及びグラフ390を有している。表示例382は、入力文80において、ユーザが選択した「頻度及び校正」の読解支援となる部分を強調表示した例である。表示例382において、強調表示384、328、386、388が示されている。
グラフ390においては、拡張ノード372、379、392が表示されている。これらの表示により、名詞句がまとめて表示され、表示場所も狭くてよく、簡易な表示となっている。
図25は、グラフ表現の一例を示す図である。図25に示すように、表示例490は、文字列492及びグラフ500を含んでいる。文字列492は、「校正後文書における各要素の共起関係の出現頻度」であり、グラフ500は、文字列492の解析結果をグラフ表現で示したものである。グラフ500においては、図23のノード344が、ノード502(「要素」)、ノード504(「各」)に展開され、ノード348が、ノード494(「文書」)、ノード496(「後」)、ノード498(「校正」)に展開されている。
次に、図26から図29を参照しながら、第1の実施の形態による言語処理装置1の動作について説明する。図26は、言語処理装置の動作を示すメインフローチャート、図27は、ノード展開及び縮退処理を示すフローチャート、図28は、ノード拡張処理を示すフローチャート、図29は、ノード拡張判定を示すフローチャートである。なお、言語処理装置1の動作については、図1を参照しながら説明した各機能が処理を行うものとして説明する。
はじめに、図26を参照しながら、言語処理装置1の処理の全体の流れを説明する。図26に示すように、解析部5は、例えば、ユーザにより入力部3を介して入力文が入力されたことを検知する。または、解析部5は、例えば解析結果記憶部25を含む記憶装置等から、解析対象の入力文を読み込む。解析部5は、入力された入力文を解析する(S401)。このとき、形態素解析部7は、形態素解析を行い、例えば形態素解析情報150を生成する(S411)。構文解析部9は、形態素解析情報150に基づき構文解析を行い、構文解析情報180を生成し(S412)、解析結果記憶部25に記憶する(S413)。このとき、解析部5は、形態素解析情報150を解析結果記憶部25に記憶するようにしてもよい。
意味解析部11は、形態素解析情報150及び構文解析情報180に基づき意味解析を行い、意味解析情報200を生成し(S414)、解析結果記憶部25に記憶する(S415)。
対応計算部21は、意味解析情報200に基づきグラフ表現のための情報を生成するとともに、ノードと文字列との対応を計算する。表示制御部23は、対応計算部21での計算結果に基づき、表示部27に解析結果の初期表示を行わせる(S402)。初期表示は、例えば、図11の表示例82、図12の表示例90などであり、一部がハイライト表示された入力文や、グラフ表現の表示である。ノードと文字列との対応は、例えば図16を参照しながら説明したように、形態素解析部7等の解析結果に基づき計算される。
対応計算部21は、入力部3を介してユーザが処理の終了を選択したことが検知されたか否かを判別し(S403)、選択したと検知されると(S403:YES)、処理を終了する。
終了を選択したと検知されない場合には(S403:NO)、対応計算部21は、例えば、表示例82、表示例90などの入力文の表示において、文字列またはノードが選択されるまで判別を繰り返す(S404:NO)。このとき、選択されたノードをハイライト表示など、強調表示を行うことにより、選択されたことを示すようにしてもよい。対応計算部21が、文字列またはノードが検知されたことを判別すると(S404:YES)、ノード拡張部17は、図27に示すノードの展開及び縮退処理を行う(S405)。
このとき例えば、文字列が選択された場合には、対応計算部21は、文字列とノードとの対応を計算することにより、選択されたノードを特定する。例えば、図20の例のように文字列「頻度及び校正」が選択されると、対応計算部21が、「頻度」が縮退ノード96の「出現頻度」に対応し、「校正」が、ノード344の「校正後文書」に対応することを特定する。
次に、図27を参照しながら、ノード展開縮退処理について説明する。図27に示すように、ノード拡張部17は、選択されたノードから直接繋がるノードの集合を取得し、それぞれにラベルを付す(S421)。ラベルは、例えば、拡張対象ノードN1〜Nn(nは、1以上の整数)とすることができる。ノードの拡張を行なう場合、ノード拡張部17は、S421で取得された全ての拡張対象ノードN1〜Nnについて、図28に示すノード拡張処理を行う(S422)。
以下、図26のS404において、図12の表示例90における縮退ノード94の「基づく」が選択された場合を例にして説明する。図12の例では、選択された縮退ノード94に縮退されている全てのノードを取得する。例えば、図15に示すように、縮退ノード94には、ノード133、221、222、223が縮退されている。しかし、直接アークで繋がるノードはノード133のみである。よって、ノード133を拡張対象ノードN1とする。すなわち、取得するノードの集合は、ノード133(「部」)である。
図27に戻って、句表示最適化部19は、ノード拡張処理で拡張された名詞句、動詞句をひとまとめにする処理を行う(S423)。すなわち、図18を参照しながら説明したように、拡張対象ノードN1=ノード133(「部」)に対して、名詞句判定部13により最小の名詞句「共起記憶部」が抽出された場合、句表示最適化部19は、「共起記憶部」を一つのノードとする処理を行う。このとき、句表示最適化部19は、ノード拡張部17による拡張処理に基づき、ノードをどこまで展開するかを決定する。表示制御部23は、句表示最適化部19、対応計算部21の処理結果に基づき拡張された「共起記憶部」のノード等を表示し、例えばハイライト表示など選択されたことを示す表示とする(S424)。
続いて、図28を参照しながら、ノード拡張処理について説明する。図28に示すように、ノード拡張部17は、ノード拡張処理において、処理対象ノードNを設定する(S431)。上述のように、処理対象ノードNは、拡張対象ノードN1=ノード133(「部」)である。
名詞句判定部13、動詞句判定部15は、処理対象ノードNが名詞句または動詞句に含まれるか否か判別する(S432)。対象処理ノードNが、名詞句または動詞句に含まれる場合には(S432:YES)、名詞句判定部13または動詞句判定部15は、処理対象ノードNを含む名詞句または動詞句の主辞のノード(以下、主辞ノードNAという)を、自動選択する(S433)。対象処理ノードNが、名詞句または動詞句に含まれない場合には(S432:NO)、ノード拡張部17は、図27のS423に処理を進める。
例えば、図18を参照しながら説明したように、「部」は、「共起記憶部」という名詞句に含まれることが判別される。この判別は、例えば、構文解析情報180を参照することにより取得される。ノード拡張部17は、「共起記憶部」という名詞句の主辞ノードNA=「部」を選択する。
次に、ノード拡張部17は、選択された主辞ノードNAから出るアークを列挙し、それぞれ識別番号(ID)=1、2、・・・、k(kは、1以上の整数)を割り振るとともに、カウンタ値ac=0とする(S434)。
図15に示すように、主辞ノードNA=「部」から出るアークは、アーク225(「動作主」)およびアーク226(「修飾」)である。よって、例えば、アーク225(「動作主」)にID=1、アーク226(「修飾」)にID=2と割り振られる。
図28に戻って、ノード拡張部17は、処理対象ノードを、処理対象ノードN及び主辞ノードNAを含む最小の名詞句に拡張する(S435)。例えば、処理対象ノードN=「部」の場合には、最小の名詞句は、「共起記憶部」となる。
つづいて、ノード拡張部17は、図29に示すノード拡張判定を行う(S436)。この判定の結果、さらに拡張を行うと判定される場合には(S437:YES)、図29の処理において出力されたアークに繋がるノードについて、さらに、図27に示したノード展開縮退処理を行う(S438)。S437で、さらに拡張を行わないと判定された場合には(S437:NO)、ノード拡張部17は、処理を図27のS423に進める。
さらに、図29を参照しながら、ノード拡張判定処理について説明する。図29に示すように、ノード拡張部17は、S434で列挙した全てのアークについて処理が終了したか否かを判別する(S441)。ノード拡張部17は、処理が終了した場合には(S441:YES)、図28のS437の判定に対し「NO」を返す(S447)。
処理が終了していない場合には(S441:NO)、ノード拡張部17は、カウンタ値ac=ac+1とし(S442)、ID=acのアークが処理対象アークであるか否か判別する(S443)。ここで、処理対象アークとは、図28のノード拡張処理において判定された最小の名詞句に含まれないアークである。
例えば、最小の名詞句が「共起記憶部」である場合、ID=1のアークであるアーク225(「動作主」)は、「共起記憶部」に含まれないので、処理対象アークである。ID=2のアークは、アーク226(「修飾」)であるが、これは、「部」と「記憶」とを繋ぐものであり、「共起記憶部」に含まれている。よって、処理対象アークとはならない。
ID=acのアークが処理対象アークでない場合(S443:NO)、ノード拡張部17は、図28のS437の判定に対し「YES」を返す(S446)。処理対象アークである場合(S443:YES)、ノード拡張部17は、対象のアーク(ID=acのアーク)の種類が「拡張」であるか否か判別する(S444)。対象のアークの種類が、「拡張」でない場合には(S444:NO)、ノード拡張部17は、処理をS446に進める。対象のアークの種類が「拡張」である場合には(S444:YES)、ノード拡張部17は、対象のアークを出力し、S446に進み、図28のS437の処理に対し「YES」を返す。
例えば、対象のアークが、図28においてID=1とされたアーク225(「動作主」)である場合、拡張情報230を参照すると、「動作主」は、「非拡張」のアークであるので、ノード拡張部17は、そのまま処理をS446に進める。図28のS437の処理において、「YES」が取得されたとき、すなわち、対象のアークの種類が「拡張」である場合には、ノード拡張部17は、対象のアークを出力する(S445)。ノード拡張部17は、出力された対象のアークに直接繋がるノードについて、再び、図27に示したノード展開縮退処理を行う(S438)。このようにして、全てのIDのアークについて処理が終了すると、ノード拡張部17は、図26のS403に処理を戻す。以上の処理により、例えば図19に示したように、縮退ノード132(「部」)に代えて、簡略ノード298(「共起記憶部」)が表示され、例えばハイライト表示される。
同様の処理を、図20に示した例で説明する。図20の例では、入力文80が解析され(S401、S402)、表示例310のように、選択文字列312=「頻度及び校正」が選択されていることを示している(S403:NO、S404:YES)。すなわち、入力部3を介して、選択文字列312が選択されると、対応計算部21が、選択された文字列とノードとの関係を計算することにより、選択された文字列からノードを特定するとともに、表示制御部23により表示部27に表示を行わせる。
上述したように、「頻度」は名詞句「出現頻度」の中の単語である。また、「及び」に対応するノードは存在しない。そこで、このような場合、図26のS404において選択されるノードは、縮退ノード96(「出現頻度」)(図21参照)と、ノード498(「校正」)(図25参照)ということになる。
続いて、ノード拡張部17は、縮退ノード96(「出現頻度」)と、ノード498(「校正」)に直接つながるノードの集合を取得する(S421)。まず縮退ノード96(「出現頻度」)について説明する。
図21に示すように、縮退ノード96から直接繋がるノードは、縮退ノード114(「共起関係」)とノード112(「出現頻度」)とになる。それらを拡張対象ノードN1、N2として、図28のノード拡張処理を行う(S422)。
はじめに、ノード拡張部17は、処理対象のノード=拡張対象ノードN1=縮退ノード114(「共起関係」)とする(S431)。「共起関係」は、名詞句判定部13により、名詞句「共起関係の出現頻度」に含まれると判断される(S432:YES)。この名詞句の主辞は、ノード97(「出現頻度」)であると判定される(S433)。このとき、主辞ノードから直接出るアークは、アーク120(「修飾」)、及びアーク118(「列挙」)である(S434)。よって、これらのアークにIDが割り振られる。縮退ノード114は、この主辞を含む最小の名詞句「共起関係の出現頻度」に拡張される(S435)。
図29の処理については、アーク120(例えば、ID=1)に繋がる「共起関係」は、拡張された名詞句「共起関係の出現頻度」の中に入っているため、拡張の処理対象とはならない(S441〜S443:NO)。よって、アーク120に関する拡張は、図24に示す簡略ノード392(「共起関係の出現頻度」)で完了する。
次に、アーク118(「列挙」)(例えば、ID=2)について図29の処理が行われる。「列挙」は、図10によれば、「拡張」のアークである(S444:YES)。よって、ノード拡張部17は、アーク「列挙」を出力し(S445)、図28のS437処理に「YES」を返す(S446)。ノード拡張部17は、アーク118に繋がるノード112(「出現頻度」)について、図27の処理を行う(S438)。
ノード拡張部17は、選択されたノードに直接繋がるノードとして、ノード112を取得する(S421)。ノード拡張部17は、ノード112を処理対象のノードとして、図28の処理を行う(S422、S431)。
ノード112(「出現頻度」)は、名詞句「共起関係の出現頻度」に含まれる(S432:YES)。また、その主辞は、ノード112(「出現頻度」)である(S433)。ノード112から出るアーク122を、ID=1とする(S434)。
図29の処理において、ノード拡張部17は、ノード112から出るアーク122を取得する(S441〜S443)。ノード拡張部17は、アーク122は処理対象のアークでないと判別し(S443:NO)、ノード112に関する拡張処理は、図24に示す簡略ノード372(「共起関係の出現頻度」)に確定して終了する。以上で、「頻度」に関する処理が完了したことになる。
次に、選択されたノード=ノード498(「校正」)とする。ノード498から直接繋がるノードは、図25に示すように、ノード496(「後」)である。よって、ノード拡張部17は、ノード496を処理対象のノードとして、図28の処理を行う(S431)。「後」は、名詞句「校正後文書」に含まれる(S432:YES)。このとき、主辞ノードNA=「文書」である(S433)。図25に示すように、「文書」から出るアークは、アーク506(「時間」)である。また、ノード496(「後」)は、「校正後文書」に拡張される(S435)。
図29の処理において、アーク506(「時間」)は、処理対象アークではない(S443:NO)。よって、ノード496(「後」)は、主辞を含む最小の名詞句「校正後文書」に拡張される。
なお上記の説明では、ノード498(「校正」)について「校正後文書」にノードを拡張する例を説明したが、例えば、図21において、縮退ノード334(「校正後文書」)について、それ以上拡張されないことを判別する処理を行うこともできる。
さらに、図25に示すように、「校正後文書」に繋がるノード117(「共起関係」)にはノード502(「要素」)もつながっている。ノードを展開する場合、上述のように、繋がる全てのノードを表示する例では、ノード502(「要素」)に関しても名詞句の拡張を行い、「各要素」を得、図21の簡略ノード348のように表示する。
また、入力文80では、「校正後文書における」「各要素の」は文字列としてもつながっている。よって、図23のように、簡略ノード379(「校正後文書における各要素の」)のようにまとめて表示させることもできる。この結果、図24のグラフ390のような表示結果を得る。
このように、ユーザが「頻度および校正」を選択した場合において、本実施の形態においては、言語処理装置1が自動的に、例えば図24の表示例382のように、「共起関係の出現頻度及び…共起関係の出現頻度」を選択する。また、図24のグラフ390のように、該当する部分のグラフを例えば、簡略ノード372、379、392を用いて表示する。
以上詳細に説明したように、第1の実施の形態による言語処理装置1においては、解析部5が、入力文を解析し、形態素解析情報150、構文解析情報180、意味解析情報200を生成する。対応計算部21は、解析結果に基づき、文字列とノードを関連付ける計算を行う。表示制御部23は、表示部27を制御して、例えばグラフ表現を行う。
ユーザが、入力文において文字列、またはグラフにおいてノードを選択すると、言語処理装置1は、入力部3を介して選択を取得する。対応計算部21は、選択された文字列に対応するノードを特定する。名詞句判定部13、動詞句判定部15は、特定されたノードに関して、名詞句または動詞句に含まれるか否かを判定する。ノードの内容が名詞句または動詞句に含まれている場合には、ノード拡張部17は、その句の主辞から、その句に含まれないアークが出ているか否か、その句に含まれないアークは「拡張」の種類の「アーク」か否か、に基づき、さらなる拡張の有無を判定する。
以上説明したように、本実施の形態による言語処理装置1によれば、文の解析結果を表示する際に、単語を名詞句または動詞句に拡張して表示することができる。これにより、文字列が意味解析において意味をなすか否かを判断し、まとめて表示する単位を、文字列の読解支援という観点で意味をなす最小単位に拡張することができる。
また、言語処理装置1では、拡張された名詞句または動詞句の主辞から出るアークが、その名詞句または動詞句に含まれるか否かに基づき、更なる拡張を行うか否かを判別することができる。また、言語処理装置1では、単語間の関係を示すアークの内容を「拡張」「非拡張」に種類分けした種類に応じて、更なる拡張を行うか否かを判別することができる。解析結果は、更なる拡張は行わないと判別された文字列の単位で表示することができる。よって、より読解支援に適した文字列を表示する単位とすることができる。
このとき、例えばグラフ表現においては、句表示最適化部19が拡張対象となった複数のノードをひとまとめにするなど、ノード及びアークの構造を適宜変更する。これにより、単語間、フレーズ間の係り受けに関する表示を、読解支援のためにより適した単位とすることができる。よって、表示される意味を容易に判断することが可能となり、より読解しやすい表示とすることができる。
言語処理装置1では、文の解読のための品詞情報や類似文の表示、文の解析結果としての単語に基づくグラフ表現、グラフ表現における縮退表示のみでは対応が困難であった複雑な文の解析結果を、簡易に表示することができる。よって、大局的に捉えて表示することしかできなかった長文の読解支援をより適切に行なうことができる。また、複雑な文の構造を視覚的に捉えることができる。
また、展開する必要のない部分については、指示を入力することにより縮退させた表示が可能である。拡張の必要ない部分については、拡張させない表示も可能である。これらは、任意に組み合わせることもできるため、ユーザの必要性に合致した形態で表示が可能である。選択する範囲が意味解析の点から適切でない場合にも、選択された部分を自動的に拡張して、理解しやすい形式に表示が可能である。このような簡易な表示により、言語的な専門知識が乏しいユーザに対しても適切に読解支援を行うことが可能となる。
(変形例)
以下、表示方法、選択方法に関する変形例について説明する。本変形例において、言語処理装置1の構成及び動作について、第1の実施の形態と同様の部分については重複説明を省略する。図30、31は、表示方法の変形例を示す図である。図30に示すように、入力文522の表示例としては、出力結果524、526でもよい。文522=「太郎は学校に行く。」の解析結果は、出力結果524、526のように、グラフ表現でなく、2つのノードと、そのアークを並列表示するようにしてもよい。
図31は、図30と同様に、グラフ表現でなく、2つのノードとそのアークを並列表示する別の例を示している。図31に示すように、入力文80の表示例は、出力結果534、536でもよい。
図32、33は、文字列選択時の表示例を示す図である。図32に示すように、表示例550は、入力文552及び初期表示556、選択後表示558を示している。この例では、入力文552において選択された文字列554=「基づいて」について、選択前の初期表示556と、選択後表示558が示されている。これら初期表示556と選択後表示558は、同時に表示してもよいし、文字列の選択の前後で表示を切り替えるようにしてもよい。
図33に示すように、表示例580は、入力文552及び初期表示592、選択後表示594を示している。この例では、入力文552において選択された文字列554=「基づいて」について、文字列選択前の初期表示592と、選択後表示594が示されている。これら初期表示592と選択後表示594は、同時に表示してもよいし、文字列の選択の前後で表示を切り替えるようにしてもよい。
以上のように、上記変形例によれば、第1の実施の形態による効果に加え、さらにユーザの必要性に合致した表示を行うことが可能となる。
なお、本発明は、以上に述べた実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の構成または実施形態を採ることができる。例えば、形態素解析情報150、構文解析情報180、意味解析情報200、拡張情報230の構成は上記の例に限定されない。同様の内容を示すものであれば、適用が可能である。
入力文における文字列の選択は、表示されている意味構造のノードを直接選択してもよい。そのとき、名詞句判定部13、動詞句判定部15は、ノードの品詞に応じて名詞句判定、動詞句判定を行う。これら句の判定は、構文解析情報180を使わずに、例えば、Nグラムモデルなど、統計処理や、従来の他の手法に基づいて行ってもよい。
上記実施の形態及び変形例においては、解析部5が入力文の解析を行う場合を例にして説明したが、既に解析された結果に基づいてノードの拡張処理を行い、表示を最適化する処理を行うようにしてもよい。このとき、解析部は、入力文の解析結果である、形態素解析情報150、構文解析情報180、意味解析情報200等を、例えば外部記憶装置や送受信装置などを介して取得するようにしてもよい。また、例えば、解析結果記憶部25に解析を行うための辞書を予め記憶しておくことが好ましい。
上記実施の形態及び変形例において、名詞句判定部13、動詞句判定部15は、句判定部の一例であり、ノード拡張部17は、拡張部の一例であり、句表示最適化部19は、表示処理部の一例である。表示制御部23、表示部27は、表示部の一例である。解析結果記憶部25は、記憶部の一例であり、入力部3は、選択取得部の一例である。
ここで、上記第1の実施の形態及び変形例による言語処理方法の動作をコンピュータに行わせるために共通に適用されるコンピュータの例について説明する。図34は、標準的なコンピュータのハードウエア構成の一例を示すブロック図である。図34に示すように、コンピュータ600は、Central Processing Unit(CPU)602、メモリ604、入力装置606、出力装置608、外部記憶装置612、媒体駆動装置614、ネットワーク接続装置等がバス610を介して接続されている。
CPU602は、コンピュータ600全体の動作を制御する演算処理装置である。メモリ604は、コンピュータ600の動作を制御するプログラムを予め記憶したり、プログラムを実行する際に必要に応じて作業領域として使用したりするための記憶部である。メモリ604は、例えばRandom Access Memory(RAM)、Read Only Memory(ROM)等である。入力装置606は、コンピュータの使用者により操作されると、その操作内容に対応付けられている使用者からの各種情報の入力を取得し、取得した入力情報をCPU602に送付する装置であり、例えばキーボード装置、マウス装置などである。出力装置608は、コンピュータ600による処理結果を出力する装置であり、表示装置などが含まれる。例えば表示装置は、CPU602により送付される表示データに応じてテキストや画像を表示する。
外部記憶装置612は、例えば、ハードディスクなどの記憶装置であり、CPU602により実行される各種制御プログラムや、取得したデータ等を記憶しておく装置である。媒体駆動装置614は、可搬記録媒体616に書き込みおよび読み出しを行うための装置である。CPU602は、可搬記録媒体616に記録されている所定の制御プログラムを、記録媒体駆動装置614を介して読み出して実行することによって、各種の制御処理を行うようにすることもできる。可搬記録媒体616は、例えばCompact Disc(CD)−ROM、Digital Versatile Disc(DVD)、Universal Serial Bus(USB)メモリ等である。ネットワーク接続装置618は、有線または無線により外部との間で行われる各種データの授受の管理を行うインタフェース装置である。バス610は、上記各装置等を互いに接続し、データのやり取りを行う通信経路である。
上記第1の実施の形態及びその変形例による言語処理方法をコンピュータに実行させるプログラムは、例えば外部記憶装置612に記憶させる。CPU602は、外部記憶装置612からプログラムを読み出し、コンピュータ600に言語処理の動作を行なわせる。このとき、まず、言語処理をCPU602に行わせるための制御プログラムを作成して外部記憶装置612に記憶させておく。そして、入力装置606から所定の指示をCPU602に与えて、この制御プログラムを外部記憶装置612から読み出させて実行させるようにする。また、このプログラムは、可搬記録媒体616に記憶するようにしてもよい。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成す句があるか否かを判定し、ある場合には前記句を出力する句判定部と、
複数の前記単語のうちの互いに関係する2つの単語同士の関係を示す前記関係情報及び前記句判定部の判定結果に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を行う拡張部と、
前記文を表示させる際に、前記別の句として表示させると判別された前記単語または句を一つの句として表示させる処理を行う表示処理部と、
前記解析結果及び前記表示処理部での処理の結果に基づき、前記文を表示する表示部と、
を有することを特徴とする言語処理装置。
(付記2)
前記関係情報と、前記単語または前記句同士を前記別の句として表示させるべきか否かにより分類される種類とを関連付けた拡張情報を記憶する記憶部をさらに有し、
前記拡張部は、前記拡張情報に応じて判別を行うことを特徴とする付記1に記載の言語処理装置。
(付記3)
前記文中の文字列が選択されたことを取得する選択取得部、
前記文字列と前記文字列に含まれる前記単語または前記句との関係を計算することにより、選択された前記単語または前記句を特定する対応計算部、
をさらに有し、
前記拡張部は、前記対応計算部により特定された前記単語または前記句に基づき前記判別を行うことを特徴とする付記1または付記2に記載の言語処理装置。
(付記4)
前記文の形態素解析を行い、前記形態素解析に基づき、前記形態素同士の関係から前記文の構文解析を行い、前記構文解析の結果に基づき前記関係情報を生成する解析部、
をさらに有し、
前記拡張部は、前記関係情報として前記解析部により生成された前記関係情報に基づき判別を行う
ことを特徴とする付記1から付記3のいずれかに記載の言語処理装置。
(付記5)
前記句判定部は、前記解析部による前記構文解析の結果に基づき前記単語を、前記単語を含む名詞句または動詞句に分類する
ことを特徴とする付記4に記載の言語処理装置。
(付記6)
前記表示部は、
前記文を前記単語または前記句と前記関係情報とを含んで表示する際に、縮退させて表示可能な複数の前記単語または前記句を決定し、前記縮退させて表示可能な複数の前記単語または前記句の中で、縮退させない状態に同時に展開する前記複数の単語または前記句の組合せを前記関係情報に基づき決定し、前記縮退させた表示と、前記縮退させない状態の表示とを切り換える指示を取得すると、前記指示及び前記組合せに基づき前記表示を切換える表示制御部
をさらに有することを特徴とする付記1から付記5のいずれかに記載の言語処理装置。
(付記7)
言語処理装置が、
入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、前記単語を、前記単語を含み一つの意味を成す最小単位の句があるか否かを判定し、ある場合には前記句を出力し、
複数の前記単語のうちの互いに関係する2つの単語同士の関係を示す関係情報及び前記句判定部の判定結果に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を行い、
前記文を表示させる際に、前記別の句として表示させると判別された前記単語または句を一つの句として表示させる処理を行い、
前記解析結果及び前記表示させる処理の結果に基づき、前記文を表示する
ことを特徴とする言語処理方法。
(付記8)
前記関係情報と、前記単語または前記句同士を前記別の句として表示させるべきか否かにより分類される種類とを関連付けた拡張情報に応じて前記判別を行うことを特徴とする付記7に記載の言語処理方法。
(付記9)
さらに、
前記文中の文字列が選択されたことを取得して、前記文字列と前記文字列に含まれる前記単語または前記句との関係を計算することにより、選択された前記単語または前記句を特定し、
特定された前記単語または前記句に基づき前記判別を行うことを特徴とする付記7または付記8に記載の言語処理方法。
(付記10)
さらに
前記文の形態素解析を行い、
前記形態素解析に基づき、前記形態素同士の関係から前記文の構造を解析する構文解析を行い、
前記構文解析の解析結果に基づき前記関係情報を生成する意味解析を行い、
前記意味解析により生成された前記関係情報及び前記拡張情報に基づき、前記判別を行う
ことを特徴とする付記7から付記9のいずれかに記載の言語処理方法。
(付記11)
前記句の分類は、前記構文解析による解析結果に基づき前記単語を、前記単語を含む名詞句または動詞句に分類する
ことを特徴とする付記10に記載の言語処理方法。
(付記12)
前記表示する処理は、
前記文を前記単語または前記句と前記関係情報とを含んで表示する際に、縮退させて表示可能な複数の前記単語または前記句を決定し、前記縮退させて表示可能な複数の前記単語または前記句の中で、縮退させない状態に同時に展開する前記複数の単語または前記句の組合せを前記関係情報に基づき決定し、前記縮退させた表示と、前記縮退させない状態の表示とを切り換える指示を取得すると、前記指示及び前記組合せに基づき前記表示を切換える
ことを特徴とする付記7から付記11のいずれかに記載の言語処理方法。
(付記13)
入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、前記単語を、前記単語を含み一つの意味を成す最小単位の句があるか否かを判定し、ある場合には前記句を出力し、
複数の前記単語のうちの互いに関係する2つの単語同士の関係を示す関係情報及び前記句判定部の判定結果に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を行い、
前記文を表示させる際に、前記別の句として表示させると判別された前記単語または句を一つの句として表示させる処理を行い、
前記解析結果及び前記表示させる処理の結果に基づき、前記文を表示する
処理をコンピュータに実行させるプログラム。
(付記14)
前記関係情報と、前記単語または前記句同士を前記別の句として表示させるべきか否かにより分類される種類とを関連付けた拡張情報に応じて前記判別を行う
ことを特徴とする付記13に記載のプログラム。
(付記15)
さらに、
前記文中の文字列が選択されたことを取得して、前記文字列と前記文字列に含まれる前記単語または前記句との関係を計算することにより、選択された前記単語または前記句を特定し、
特定された前記単語または前記句に基づき前記判別を行う
ことを特徴とする付記13または付記14に記載のプログラム。
1 言語処理装置
3 入力部
5 解析部
7 形態素解析部
9 構文解析部
11 意味解析部
13 名詞句判定部
15 動詞句判定部
17 ノード拡張部
19 句表示最適化部
21 対応計算部
23 表示制御部
25 解析結果記憶部
27 表示部
92〜98 縮退ノード
100〜106 アーク
150 形態素解析情報
152 形態素番号
154 形態素
156 開始位置
158 文字長
160 品詞情報
162 意味記号
170 品詞記号情報
172 品詞記号
174 意味
180 構文解析情報
182 構成要素
184 品詞
186 ラベル
188 主辞
200 意味解析情報
202 出発ノード
204 到達ノード
206 アーク
208 形態素番号
210 意味記号
212 形態素
214 形態素番号
216 意味記号
218 形態素
372 簡略ノード
379 簡略ノード
380 表示例
382 表示例
390 表示例
392 簡略ノード

Claims (6)

  1. 入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成す句があるか否かを判定し、ある場合には前記句を出力する句判定部と、
    前記文の形態素解析を行い、前記形態素解析に基づき、前記文の形態素同士の関係から前記文の構文解析を行い、前記構文解析の結果に基づき、複数の前記単語のうちの互いに関係する2つの単語同士の意味上の関係、及び、複数の前記単語の夫々と前記句判定部より出力された句において主たる意味を保持する単語との意味上の関係を示す関係情報を生成する解析部と、
    前記関係情報に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を、前記関係情報と前記別の句として表示させることの可否との関係が予め定義されている拡張情報に従って行う拡張部と、
    前記別の句として表示させると判別された前記単語または句を一つの句としてまとめる表示処理部と、
    前記文の意味を解析した前記解析結果及び前記表示処理部での処理の結果に基づき、前記文の中心概念として解析された語句、前記表示処理部によってまとめられた句、及び、該語句と該句との意味上の関係を表す前記関係情報を表示する表示部と、
    を有することを特徴とする言語処理装置。
  2. 前記文中の文字列が選択されたことを取得する選択取得部、
    前記文字列と前記文字列に含まれる前記単語または前記句との関係を計算することにより、選択された前記単語または前記句を特定する対応計算部、
    をさらに有し、
    前記拡張部は、前記対応計算部により特定された前記単語または前記句を対象として前記判別を行うことを特徴とする請求項に記載の言語処理装置。
  3. 前記句判定部は、前記解析部による前記構文解析の結果に基づき前記単語を、前記単語を含む名詞句または動詞句に分類する
    ことを特徴とする請求項1または請求項2に記載の言語処理装置。
  4. 前記表示部は、
    前記表示処理部によってまとめられた句の表示を切り換える指示を取得すると、該まとめられた句の表示に代えて、該まとめられた句において主たる意味を保持する単語、該まとめられた句において主たる意味を保持する単語以外の単語または句、及び、該主たる意味を保持する単語と該主たる意味を保持する単語以外の単語または句との意味上の関係を表す前記関係情報を、前記解析部での処理の結果に基づき表示させる表示制御部
    をさらに有することを特徴とする請求項1から請求項のいずれかに記載の言語処理装置。
  5. 言語処理装置が、
    入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成すがあるか否かを判定し、ある場合には前記句を出力し、
    前記文の形態素解析を行い、
    前記形態素解析に基づき、前記文の形態素同士の関係から前記文の構文解析を行い、
    前記構文解析の結果に基づき、複数の前記単語のうちの互いに関係する2つの単語同士の意味上の関係、及び、複数の前記単語の夫々と前記出力された句において主たる意味を保持する単語との意味上の関係を示す関係情報を生成し、
    前記関係情報に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を、前記関係情報と前記別の句として表示させることの可否との関係が予め定義されている拡張情報に従って行い、
    前記別の句として表示させると判別された前記単語または句を一つの句としてまとめ
    前記文の意味を解析した前記解析結果及び前記一つの句としてまとめる処理の結果に基づき、前記文の中心概念として解析された語句、前記まとめられた句、及び、該語句と該句との意味上の関係を表す前記関係情報を表示する
    ことを特徴とする言語処理方法。
  6. 入力された文に含まれる複数の単語を抽出して前記文の意味を解析した解析結果に基づき、複数の前記単語の夫々について、前記単語を含み一つの意味を成すがあるか否かを判定し、ある場合には前記句を出力し、
    前記文の形態素解析を行い、
    前記形態素解析に基づき、前記文の形態素同士の関係から前記文の構文解析を行い、
    前記構文解析の結果に基づき、複数の前記単語のうちの互いに関係する2つの単語同士の意味上の関係、及び、複数の前記単語の夫々と前記出力された句において主たる意味を保持する単語との意味上の関係を示す関係情報を生成し、
    前記関係情報に基づき、前記単語または前記句を前後の単語または句とつなげた別の句として表示させるか否かの判別を、前記関係情報と前記別の句として表示させることの可否との関係が予め定義されている拡張情報に従って行い、
    前記別の句として表示させると判別された前記単語または句を一つの句としてまとめ
    前記文の意味を解析した前記解析結果及び前記一つの句としてまとめる処理の結果に基づき、前記文の中心概念として解析された語句、前記まとめられた句、及び、該語句と該句との意味上の関係を表す前記関係情報を表示する
    処理をコンピュータに実行させるプログラム。
JP2012265710A 2012-12-04 2012-12-04 言語処理装置、言語処理方法、及びプログラム Expired - Fee Related JP6075042B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012265710A JP6075042B2 (ja) 2012-12-04 2012-12-04 言語処理装置、言語処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012265710A JP6075042B2 (ja) 2012-12-04 2012-12-04 言語処理装置、言語処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014110026A JP2014110026A (ja) 2014-06-12
JP6075042B2 true JP6075042B2 (ja) 2017-02-08

Family

ID=51030593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012265710A Expired - Fee Related JP6075042B2 (ja) 2012-12-04 2012-12-04 言語処理装置、言語処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6075042B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7413214B2 (ja) * 2020-09-09 2024-01-15 株式会社東芝 情報処理装置、情報処理方法及び情報処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3506058B2 (ja) * 1998-09-02 2004-03-15 日本電信電話株式会社 意味解析方法及び装置及び意味解析プログラムを記録した記録媒体
JP2002297585A (ja) * 2001-03-30 2002-10-11 Ricoh Co Ltd 英文名詞句の区分方法,英文構文情報生成方法および装置
JP2005063030A (ja) * 2003-08-08 2005-03-10 Ricoh Co Ltd 概念表現方法、概念表現生成方法及び概念表現生成装置並びに該方法を実現するプログラム及び該プログラムが記録された記録媒体
JP4039635B2 (ja) * 2004-06-10 2008-01-30 富士通株式会社 言語情報処理装置
JP5112116B2 (ja) * 2008-03-07 2013-01-09 株式会社東芝 機械翻訳する装置、方法およびプログラム

Also Published As

Publication number Publication date
JP2014110026A (ja) 2014-06-12

Similar Documents

Publication Publication Date Title
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US7913191B2 (en) Common input/output interface for application programs
JP2009205579A (ja) 音声翻訳装置およびプログラム
JP2002215617A (ja) 品詞タグ付けをする方法
JP6075042B2 (ja) 言語処理装置、言語処理方法、及びプログラム
JP5928344B2 (ja) UI(UserInterface)作成支援装置、UI作成支援方法及びプログラム
JP6933395B2 (ja) 自動翻訳装置及び自動翻訳プログラム
JP5398638B2 (ja) 記号入力支援装置、記号入力支援方法、及びプログラム
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP5259764B2 (ja) 拾い読み支援システム、拾い読み支援方法及びプログラム
JP2008171164A (ja) 分類付与支援装置及び方法及びプログラム
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
JP6221339B2 (ja) 翻訳装置及び翻訳方法
JP2014199476A (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2014146076A (ja) 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム
JP7115187B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP4043176B2 (ja) 自然言語処理装置
JPH04174069A (ja) 言語理解支援装置
KR20110072496A (ko) 특정기능어를 이용한 전자사전 검색 장치 및 검색 방법
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3969689B2 (ja) 文書作成支援装置、文書作成支援方法及び文書作成支援プログラムを記憶した記憶媒体
JP5338482B2 (ja) 漢文例文検索装置およびプログラム
JP2017033387A (ja) 入力支援装置、プログラムおよび入力支援方法
JP2012221285A (ja) 文書生成支援方法、文書生成支援装置および文書生成支援プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6075042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees