JP2017097451A - 情報処理方法、情報処理プログラムおよび情報処理装置 - Google Patents

情報処理方法、情報処理プログラムおよび情報処理装置 Download PDF

Info

Publication number
JP2017097451A
JP2017097451A JP2015226077A JP2015226077A JP2017097451A JP 2017097451 A JP2017097451 A JP 2017097451A JP 2015226077 A JP2015226077 A JP 2015226077A JP 2015226077 A JP2015226077 A JP 2015226077A JP 2017097451 A JP2017097451 A JP 2017097451A
Authority
JP
Japan
Prior art keywords
meaning
word
information processing
candidate
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015226077A
Other languages
English (en)
Inventor
英紀 伊藤
Hidenori Ito
英紀 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015226077A priority Critical patent/JP2017097451A/ja
Publication of JP2017097451A publication Critical patent/JP2017097451A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】語義曖昧性解決の計算量および計算時間を削減できる情報処理方法、情報処理プログラムおよび情報処理装置を提供する。【解決手段】情報処理方法は、文中から複数の語義がある述語について格補語候補を抽出する処理をコンピュータが実行する。また、情報処理方法は、述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された格補語候補ごとに各語義との組み合わせ点数を算出する処理をコンピュータが実行する。また、情報処理方法は、各格補語候補について組み合わせ点数に基づいて、語義を選別する処理をコンピュータが実行する。また、情報処理方法は、選別された語義を用いて述語と格補語候補との関係性を探索して述語の語義を選択する処理をコンピュータが実行する。【選択図】図1

Description

本発明は、情報処理方法、情報処理プログラムおよび情報処理装置に関する。
近年、コンピュータに自然言語処理を行わせる需要が増加している。自然言語処理では、一つの単語に複数の意味がある場合に、文中における単語がどの意味で用いられているかを判別するために、語義曖昧性解決が行われる。語義曖昧性解決の方法としては、周辺の単語を素性に機械学習する方法と、主語および目的語と述語との選好性を利用する述語項解析結果を用いる方法とがある。
特開2001−331515号公報 特開2008−233964号公報
しかしながら、述語項解析結果を用いる場合には、全幅検索になるので計算時間が増大することがある。また、解析精度を上げるために照応解析等の他の処理を含めると、選択肢の数が増大し、複数の語義があると計算量が指数関数的に増大する。
一つの側面では、本発明は、語義曖昧性解決の計算量および計算時間を削減できる情報処理方法、情報処理プログラムおよび情報処理装置を提供することにある。
一つの態様では、情報処理方法は、文中から複数の語義がある述語について格補語候補を抽出する処理をコンピュータが実行する。また、情報処理方法は、前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出する処理をコンピュータが実行する。また、情報処理方法は、前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別する処理をコンピュータが実行する。また、情報処理方法は、選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する処理をコンピュータが実行する。
語義曖昧性解決の計算量および計算時間を削減できる。
図1は、実施例の情報処理装置の構成の一例を示すブロック図である。 図2は、名詞辞書記憶部の一例を示す図である。 図3は、動詞辞書記憶部の一例を示す図である。 図4は、語義マスク記憶部の一例を示す図である。 図5は、実施例の語義選択処理の一例を示すフローチャートである。 図6は、情報処理プログラムを実行するコンピュータの一例を示す図である。
以下、図面に基づいて、本願の開示する情報処理方法、情報処理プログラムおよび情報処理装置の実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組みあわせてもよい。
図1は、実施例の情報処理装置の構成の一例を示すブロック図である。図1に示す情報処理装置100は、入力された文について、文中から複数の語義がある述語について格補語候補を抽出する。情報処理装置100は、述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された格補語候補ごとに各語義との組み合わせ点数を算出する。情報処理装置100は、各格補語候補について組み合わせ点数に基づいて、語義を選別する。情報処理装置100は、選別された語義を用いて述語と格補語候補との関係性を探索して述語の語義を選択する。これにより、情報処理装置100は、語義曖昧性解決の計算量および計算時間を削減できる。なお、探索にかかる述語項解析結果を用いる語義曖昧性解決については、参考文献(Roberto Navigli.Word sense disambiguation:A survey.ACM Computing Surveys,41(2):10:1-10:69(2009))に詳しく記載されている。
図1に示す情報処理装置100は、入力部110と、表示部111と、操作部112と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、図1に示す機能部以外にも既知のコンピュータが有する各種の機能部、例えば各種の通信デバイス、入力デバイスや音声出力デバイス等の機能部を有することとしてもかまわない。情報処理装置100の一例としては、タブレット端末を採用できる。情報処理装置100には、上記のタブレット端末等の可搬型の端末のみならず、据置型のパーソナルコンピュータを情報処理装置100として採用することもできる。また、情報処理装置100は、可搬型の端末としては、上記のタブレット端末の他にも、例えば、可搬型のパーソナルコンピュータや、スマートフォン、携帯電話機等の移動体通信端末等を採用することもできる。
入力部110は、例えば、光学ディスク、USB(Universal Serial Bus)メモリ、SDメモリカード等の外部記憶媒体に対する媒体アクセス装置等によって実現される。入力部110は、外部記憶媒体に記憶された解析対象の文を読み取って、読み取った文を制御部130に出力する。また、入力部110は、音声認識装置であってもよい。この場合に、入力部110は、マイク等から入力された音声を音声認識して文を生成し、生成した文を制御部130に出力する。
表示部111は、各種情報を表示するための表示デバイスである。表示部111は、例えば、表示デバイスとして液晶ディスプレイ等によって実現される。表示部111は、制御部130から入力された出力画面等の各種画面を表示する。
操作部112は、情報処理装置100のユーザから各種操作を受け付ける入力デバイスである。操作部112は、例えば、入力デバイスとして、キーボードやマウス等によって実現される。操作部112は、ユーザによって入力された操作を操作情報として制御部130に出力する。なお、操作部112は、入力デバイスとして、タッチパネル等によって実現されるようにしてもよく、表示部111の表示デバイスと、操作部112の入力デバイスとは、一体化されるようにしてもよい。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、ハードディスクや光ディスク等の記憶装置によって実現される。記憶部120は、名詞辞書記憶部121と、動詞辞書記憶部122と、語義マスク記憶部123とを有する。また、記憶部120は、制御部130での処理に用いられる情報を記憶する。
名詞辞書記憶部121は、名詞と、当該名詞が属するクラス情報を示すクラスとを対応付けて記憶する。図2は、名詞辞書記憶部の一例を示す図である。図2に示すように、名詞辞書記憶部121は、「名詞」、「クラス」といった項目を有する。名詞辞書記憶部121は、例えば、名詞ごとに1レコードとして記憶する。
「名詞」は、例えば、「彼」、「顧客」、「ソフト」といった具体名詞や抽象名詞を示す情報である。「名詞」は、述語に対する格補語候補となる語の一例である。「クラス」は、名詞を分類した場合における当該名詞が属するクラスを示す情報である。「クラス」は、例えば、「人」、「物」、「ソフト」等といった情報であり、1つの名詞に対して複数のクラスを持つようにしてもよい。
図1の説明に戻って、動詞辞書記憶部122は、動詞ごとに語義とクラスと点数とを対応付けて記憶する。図3は、動詞辞書記憶部の一例を示す図である。図3に示すように、動詞辞書記憶部122は、「動詞」、「語義」、「クラス」、「点数」といった項目を有する。動詞辞書記憶部122は、例えば、動詞ごとに1つ以上の語義、クラスおよび点数を対応付けて記憶する。
「動詞」は、例えば、「走る」、「立つ」というように動作や状態を表す動詞を示す情報である。なお、「動詞」は、活用形を含むようにしてもよい。「語義」は、文中で動詞がどの様な意味として用いられているか、すなわち具体的な意味であるか抽象的な意味であるかを示す情報である。「クラス」は、例えば、「人」、「物」、「ソフト」等といった情報であり、名詞辞書記憶部121の名詞のクラスに対応する。「点数」は、動詞の語義と、名詞のクラスとの組み合わせに応じた評価情報である。すなわち、動詞辞書記憶部122は、例えば、「格XにクラスYに属する名詞が来たらZ点」といった評価情報を記憶する。なお、「点数」は、日本語としてもっともらしい場合に高い値となるように値が決定される。
図3の例では、動詞「走った」が、語義「具体的」と「抽象的」とを有し、語義「具体的」について、クラス「人」および「その他」の場合における点数が、それぞれ「+5」点および「0」点であることを示す。また、図3の例では、語義「抽象的」について、クラス「ソフト」、「計画」および「その他」の場合における点数が、それぞれ「+4」点、「+3」点および「0」点であることを示す。
図1の説明に戻って、語義マスク記憶部123は、動詞の複数の語義のうち、マスクされる語義とクラス、つまり選出されない語義とクラスとを、動詞に対応付けて記憶する。図4は、語義マスク記憶部の一例を示す図である。図4に示すように、語義マスク記憶部123は、「動詞」、「語義」、「クラス」といった項目を有する。
「動詞」は、複数の語義を有し、1つ以上の語義またはクラスがマスクされる動詞を示す情報である。「語義」は、選出されない語義、または、選出されないクラスが属する語義を示す情報である。「クラス」は、選出されないクラスを示す情報である。図4の例では、複数の語義を有する動詞「走った」のうち、語義「抽象的」に属するクラス「計画」をマスクすることを示す。
図1の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。制御部130は、抽出部131と、算出部132と、選別部133と、選択部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図1に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
抽出部131は、入力部110から文が入力されると、入力された文に対して形態素解析および文節分割を実行する。抽出部131は、形態素解析および文節分割の実行結果に基づいて、文中から複数の語義がある述語について、述語に対する格補語候補を抽出する。抽出部131は、抽出した格補語候補を述語に対応付けて算出部132に出力する。なお、以下の説明では、述語が動詞である場合について説明する。
算出部132は、抽出部131から対応付けられた述語および格補語候補が入力された場合、または、選別部133から判定指示が入力された場合には、述語ごとに未選択の格補語候補があるか否かを判定する。算出部132は、入力された全ての述語について未選択の格補語候補がない場合には、マスク記憶指示を選別部133に出力する。
算出部132は、入力された述語について未選択の格補語候補がある場合には、当該述語にかかる未選択の格補語候補を1つ選択する。算出部132は、格補語候補が1つ選択されると、当該述語の語義のうち、未選択の語義があるか否かを判定する。算出部132は、未選択の語義がある場合には、未選択の語義を1つ選択する。算出部132は、名詞辞書記憶部121および動詞辞書記憶部122を参照し、選択された格補語候補と語義の各クラスとの組み合わせ点数を算出する。算出部132は、未選択の語義がない場合には、算出された組み合わせ点数と格補語候補と語義のクラスとを選別部133に出力する。
選別部133は、算出部132から組み合わせ点数と格補語候補と語義のクラスとが入力されると、選択された格補語候補について、当該格補語候補のうち組み合わせ点数が最高点となる語義のクラスを選出する。選別部133は、組み合わせ点数が最高点となる語義のクラスを選出すると、算出部132に未選択の格補語候補の有無を判定する判定指示を出力する。
また、選別部133は、算出部132からマスク記憶指示が入力されると、どの格補語候補についても組み合わせ点数が最高点とならない語義のクラスを、語義マスクとして語義マスク記憶部123に記憶する。すなわち、選別部133は、述語の複数の語義におけるクラスのうち、選出されない語義のクラスを探索対象から除く語義マスクを語義マスク記憶部123に登録することで語義のクラスを選別する。なお、上述の語義のクラスは、語義が1つのクラスを有する場合、または、クラスを有さない場合には、語義のクラスに代えて語義を用いてもよい。選別部133は、語義マスクを語義マスク記憶部123に記憶すると、探索指示を選択部134に出力する。
選択部134は、選別部133から探索指示が入力されると、語義マスク記憶部123を参照し、語義マスクを用いて述語と格補語候補との関係性を探索して述語の語義を選択する。すなわち、選択部134は、選別された語義を用いて述語と格補語候補との関係性を探索して述語の語義を選択する。なお、探索については、参考文献(伊藤英紀.オブジェクト指向的アプローチによる係り受け/語義曖昧性解決/照応解析/述語項解析システム.研究報告自然言語処理(NL),2014-NL-218(1),1-7(2014).)の技術を用いることができる。選択部134は、述語と選択された語義とを出力する。選択部134は、例えば出力先として、モバイルコンシェルジュ、カスタマサポートおよび翻訳ソフトウェア等の自然言語処理を用いるプログラムやソフトウェア等に対して、述語と選択された語義とを出力する。また、選択部134は、述語と選択された語義とを含む出力画面を生成し、表示部111に出力して表示させてもよい。
次に、実施例の情報処理装置100の動作について説明する。図5は、実施例の語義選択処理の一例を示すフローチャートである。
入力部110は、外部記憶媒体に記憶された対象の文を読み取って、読み取った文を制御部130に出力する。制御部130の抽出部131は、入力部110から文が入力されると、入力された文に対して形態素解析および文節分割を実行する(ステップS1)。抽出部131は、形態素解析および文節分割の実行結果に基づいて、文中から複数の語義がある述語について、述語に対する格補語候補を抽出する(ステップS2)。抽出部131は、抽出した格補語候補を述語に対応付けて算出部132に出力する。
算出部132は、抽出部131から対応付けられた述語および格補語候補が入力された場合、または、選別部133から判定指示が入力された場合には、述語ごとに未選択の格補語候補があるか否かを判定する(ステップS3)。算出部132は、入力された述語について未選択の格補語候補がある場合には(ステップS3:肯定)、当該述語にかかる未選択の格補語候補を1つ選択する(ステップS4)。
算出部132は、格補語候補が1つ選択されると、当該述語の語義のうち、未選択の語義があるか否かを判定する(ステップS5)。算出部132は、未選択の語義がある場合には(ステップS5:肯定)、未選択の語義を1つ選択する(ステップS6)。算出部132は、名詞辞書記憶部121および動詞辞書記憶部122を参照し、選択された格補語候補と語義の各クラスとの組み合わせ点数を算出し(ステップS7)、ステップS5に戻る。算出部132は、未選択の語義がない場合には(ステップS5:否定)、算出された組み合わせ点数と格補語候補と語義のクラスとを選別部133に出力する。
選別部133は、算出部132から組み合わせ点数と格補語候補と語義のクラスとが入力されると、選択された格補語候補について、組み合わせ点数が最高点となる語義のクラスを選出する(ステップS8)。選別部133は、組み合わせ点数が最高点となる語義のクラスを選出すると、算出部132に未選択の格補語候補の有無を判定する判定指示を出力し、ステップS3に戻る。
算出部132は、入力された全ての述語について未選択の格補語候補がない場合には(ステップS3:否定)、マスク記憶指示を選別部133に出力する。選別部133は、算出部132からマスク記憶指示が入力されると、どの格補語候補についても組み合わせ点数が最高点とならない語義のクラスを、語義マスクとして語義マスク記憶部123に記憶する(ステップS9)。選別部133は、語義マスクを語義マスク記憶部123に記憶すると、探索指示を選択部134に出力する。
選択部134は、選別部133から探索指示が入力されると、語義マスク記憶部123を参照し、語義マスクを用いて述語と格補語候補との関係性を探索して述語の語義を選択する(ステップS10)。選択部134は、述語と選択された語義とを出力する(ステップS11)。これにより、情報処理装置100は、語義曖昧性解決の計算量および計算時間を削減できる。
ここで、情報処理装置100で行われる語義選択処理について具体例を挙げて説明する。
まず、入力部110は、外部記憶媒体に記憶された対象の文「ソフトが届いたので、彼は店へ走った」を読み取って、読み取った文を制御部130に出力する。制御部130の抽出部131は、入力部110から文が入力されると、入力された文に対して形態素解析および文節分割を実行する。抽出部131は、述語「走った」について、格補語候補「ソフト」と「彼」とを抽出する。なお、「店」は、同時に行われる述語項解析に基づいて、どの語義でも候補外となる。抽出部131は、格補語候補「ソフト」と「彼」とを述語「走った」に対応付けて算出部132に出力する。
算出部132は、抽出部131から述語「走った」、格補語候補「ソフト」および「彼」が入力されると、1つ目の格補語候補として「ソフト」を選択する。算出部132は、名詞辞書記憶部121を検索し、格補語候補、つまり名詞である「ソフト」のクラス「ソフト」を取得する。また、算出部132は、動詞辞書記憶部122を検索し、名詞のクラス「ソフト」に対応する、述語、つまり動詞である「走った」の語義の組み合わせ点数を算出する。算出部132は、語義「具体的」のクラスに「ソフト」がないため、クラス「その他」の点数「0」を取得する。つまり、算出部132は、動詞「走った」の語義「具体的」は、組み合わせ点数が「0」点であると算出する。
次に、算出部132は、語義「抽象的」のクラス「ソフト」について、クラス「ソフト」の点数「+4」を取得する。つまり、算出部132は、動詞「走った」の語義「具体的」クラス「ソフト」は、組み合わせ点数が「+4」点であると算出する。また、算出部132は、語義「抽象的」のクラス「計画」について、クラス「計画」の点数「+3」を取得する。つまり、算出部132は、動詞「走った」の語義「具体的」クラス「計画」は、組み合わせ点数が「+3」点であると算出する。算出部132は、動詞「走った」について、格補語候補「ソフト」は、語義「具体的」が「0」点、語義「抽象的」クラス「ソフト」が「+4」点、および、語義「抽象的」クラス「計画」が「+3」点であることを示す情報を選別部133に出力する。
選別部133には、算出部132から動詞「走った」について、格補語候補「ソフト」は、語義「具体的」が「0」点、語義「抽象的」クラス「ソフト」が「+4」点、および、語義「抽象的」クラス「計画」が「+3」点であることを示す情報が入力される。選別部133は、格補語候補「ソフト」について、組み合わせ点数が最高点である語義「抽象的」クラス「ソフト」を選出するとともに、算出部132に判定指示を出力する。
算出部132は、選別部133から判定指示が入力されると、2つ目の格補語候補として「彼」を選択する。算出部132は、名詞辞書記憶部121を検索し、格補語候補、つまり名詞である「彼」のクラス「人」を取得する。また、算出部132は、動詞辞書記憶部122を検索し、名詞のクラス「人」に対応する、述語、つまり動詞である「走った」の語義の組み合わせ点数を算出する。算出部132は、語義「具体的」のクラスについて、クラス「人」の点数「+5」を取得する。つまり、算出部132は、動詞「走った」の語義「具体的」クラス「人」は、組み合わせ点数が「+5」点であると算出する。
次に、算出部132は、語義「抽象的」のクラスに「人」がないため、クラス「その他」の点数「0」を取得する。つまり、算出部132は、動詞「走った」の語義「抽象的」は、組み合わせ点数が「0」点であると算出する。算出部132は、動詞「走った」について、格補語候補「彼」は、語義「具体的」クラス「人」が「+5」点、語義「抽象的」が「0」点であることを示す情報を選別部133に出力する。
選別部133には、算出部132から動詞「走った」について、格補語候補「彼」は、語義「具体的」クラス「人」が「+5」点、語義「抽象的」が「0」点であることを示す情報が入力される。選別部133は、格補語候補「彼」について、組み合わせ点数が最高点である語義「具体的」クラス「人」を選出するとともに、算出部132に判定指示を出力する。
算出部132は、選別部133から判定指示が入力されると、述語である動詞「走った」の未選択の格補語候補がないため、マスク記憶指示を選別部133に出力する。
選別部133には、算出部132からマスク記憶指示が入力される。選別部133は、動詞「走った」について、どの格補語候補についても組み合わせ点数が最高点とならない語義のクラスである、語義「抽象的」クラス「計画」を語義マスクとして語義マスク記憶部123に記憶する。選別部133は、語義マスクを語義マスク記憶部123に記憶すると、探索指示を選択部134に出力する。
選択部134は、選別部133から探索指示が入力されると、語義マスク記憶部123を参照し、語義マスクを用いて述語「走った」について、格補語候補「ソフト」および「彼」と、語義「具体的(人)」および「抽象的(ソフト)」との関係性を探索する。なお、ここでは、クラスは語義に含めて表現する。すなわち、選択部134は、格補語候補2つ×語義2つ=4通り探索する。なお、従来では、語義「走った」の「抽象的(計画)」がマスクされていないので、格補語候補2つ×語義3つ=6通り探索することになる。従って、本具体例では、6−4=2通り分の計算量および計算時間が削減できることになる。
選択部134は、探索の結果、述語「走った」と選択された語義「具体的」とを出力する。選択部134は、例えば、出力画面に「「走った」は「具体的」です。」といったメッセージを出力する。
なお、上記実施例では、各格補語候補について、組み合わせ点数が最高点となる語義を選出したが、これに限定されない。例えば、最高点が所定の点数、例えば2点以下となる語義を探索対象から除くことで語義を選別するようにしてもよい。すなわち、組み合わせ点数が所定の点数以下の語義を語義マスクに登録するようにしてもよい。
このように、情報処理装置100は、文中から複数の語義がある述語について格補語候補を抽出する。また、情報処理装置100は、述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された格補語候補ごとに各語義との組み合わせ点数を算出する。また、情報処理装置100は、各格補語候補について組み合わせ点数に基づいて、語義を選別する。また、情報処理装置100は、選別された語義を用いて述語と格補語候補との関係性を探索して述語の語義を選択する。その結果、語義曖昧性解決の計算量および計算時間を削減できる。
また、情報処理装置100は、各格補語候補について、該各格補語候補のうち組み合わせ点数が最高点となる語義を選出し、複数の語義のうち選出されない語義を探索対象から除くことで語義を選別する。その結果、語義曖昧性解決の計算量および計算時間を削減できる。
また、情報処理装置100は、選出されない語義を語義マスクに登録する。また、情報処理装置100は、語義マスクを用いて述語と格補語候補との関係性を探索して述語の語義を選択する。その結果、語義曖昧性解決の計算量および計算時間を削減できる。
また、情報処理装置100は、さらに、最高点が所定の点数以下となる語義を探索対象から除くことで語義を選別する。その結果、より適切に語義を選別できるので、語義曖昧性解決の計算量および計算時間を削減できる。
なお、上記実施例では、情報処理装置100の一例として、タブレット端末やパーソナルコンピュータ等を挙げたが、これに限定されない。例えば、クライアント−サーバ型システムとしてもよく、クライアント端末で入力された文がサーバに送信され、サーバ側で実行された語義選択処理の結果がクライアント端末に送信されるようにしてもよい。
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、算出部132と選別部133とを統合してもよい。また、図示した各処理は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウェア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。
ところで、上記の実施例で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図6は、情報処理プログラムを実行するコンピュータの一例を示す図である。
図6に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、データ入力を受け付ける入力装置202と、モニタ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置204と、各種装置と接続するためのインタフェース装置205と、他の情報処理装置等と有線または無線により接続するための通信装置206とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM207と、ハードディスク装置208とを有する。また、各装置201〜208は、バス209に接続される。
ハードディスク装置208には、図1に示した抽出部131、算出部132、選別部133および選択部134の各処理部と同様の機能を有する情報処理プログラムが記憶される。また、ハードディスク装置208には、名詞辞書記憶部121、動詞辞書記憶部122、語義マスク記憶部123、および、情報処理プログラムを実現するための各種データが記憶される。入力装置202は、例えば、コンピュータ200のユーザから操作情報等の各種情報の入力を受け付ける。モニタ203は、例えば、コンピュータ200のユーザに対して出力画面等の各種画面を表示する。媒体読取装置204は、記憶媒体から文を読み取る。インタフェース装置205は、例えば印刷装置等が接続される。通信装置206は、例えば、図示しないネットワークと接続され、他の情報処理装置と各種情報をやりとりする。
CPU201は、ハードディスク装置208に記憶された各プログラムを読み出して、RAM207に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ200を図1に示した抽出部131、算出部132、選別部133および選択部134として機能させることができる。
なお、上記の情報処理プログラムは、必ずしもハードディスク装置208に記憶されている必要はない。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ200が読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこの情報処理プログラムを記憶させておき、コンピュータ200がこれらから情報処理プログラムを読み出して実行するようにしてもよい。
以上、本実施例を含む実施の形態に関し、さらに以下の付記を開示する。
(付記1)文中から複数の語義がある述語について格補語候補を抽出し、
前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出し、
前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別し、
選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
処理をコンピュータが実行することを特徴とする情報処理方法。
(付記2)前記選別する処理は、前記各格補語候補について、該各格補語候補のうち前記組み合わせ点数が最高点となる前記語義を選出し、前記複数の語義のうち選出されない前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記1に記載の情報処理方法。
(付記3)前記選別する処理は、前記選出されない前記語義を語義マスクに登録し、
前記選択する処理は、前記語義マスクを用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
ことを特徴とする付記2に記載の情報処理方法。
(付記4)前記選別する処理は、さらに、前記最高点が所定の点数以下となる前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記2または3に記載の情報処理方法。
(付記5)文中から複数の語義がある述語について格補語候補を抽出し、
前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出し、
前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別し、
選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
(付記6)前記選別する処理は、前記各格補語候補について、該各格補語候補のうち前記組み合わせ点数が最高点となる前記語義を選出し、前記複数の語義のうち選出されない前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記5に記載の情報処理プログラム。
(付記7)前記選別する処理は、前記選出されない前記語義を語義マスクに登録し、
前記選択する処理は、前記語義マスクを用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
ことを特徴とする付記6に記載の情報処理プログラム。
(付記8)前記選別する処理は、さらに、前記最高点が所定の点数以下となる前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記6または7に記載の情報処理プログラム。
(付記9)文中から複数の語義がある述語について格補語候補を抽出する抽出部と、
前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出する算出部と、
前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別する選別部と、
選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する選択部と、
を有することを特徴とする情報処理装置。
(付記10)前記選別部は、前記各格補語候補について、該各格補語候補のうち前記組み合わせ点数が最高点となる前記語義を選出し、前記複数の語義のうち選出されない前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記9に記載の情報処理装置。
(付記11)前記選別部は、前記選出されない前記語義を語義マスクに登録し、
前記選択部は、前記語義マスクを用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
ことを特徴とする付記10に記載の情報処理装置。
(付記12)前記選別部は、さらに、前記最高点が所定の点数以下となる前記語義を探索対象から除くことで前記語義を選別する、
ことを特徴とする付記10または11に記載の情報処理装置。
100 情報処理装置
110 入力部
111 表示部
112 操作部
120 記憶部
121 名詞辞書記憶部
122 動詞辞書記憶部
123 語義マスク記憶部
130 制御部
131 抽出部
132 算出部
133 選別部
134 選択部

Claims (6)

  1. 文中から複数の語義がある述語について格補語候補を抽出し、
    前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出し、
    前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別し、
    選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
    処理をコンピュータが実行することを特徴とする情報処理方法。
  2. 前記選別する処理は、前記各格補語候補について、該各格補語候補のうち前記組み合わせ点数が最高点となる前記語義を選出し、前記複数の語義のうち選出されない前記語義を探索対象から除くことで前記語義を選別する、
    ことを特徴とする請求項1に記載の情報処理方法。
  3. 前記選別する処理は、前記選出されない前記語義を語義マスクに登録し、
    前記選択する処理は、前記語義マスクを用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
    ことを特徴とする請求項2に記載の情報処理方法。
  4. 前記選別する処理は、さらに、前記最高点が所定の点数以下となる前記語義を探索対象から除くことで前記語義を選別する、
    ことを特徴とする請求項2または3に記載の情報処理方法。
  5. 文中から複数の語義がある述語について格補語候補を抽出し、
    前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出し、
    前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別し、
    選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する、
    処理をコンピュータに実行させることを特徴とする情報処理プログラム。
  6. 文中から複数の語義がある述語について格補語候補を抽出する抽出部と、
    前記述語の語義ごとに名詞との組み合わせ点数を記した辞書に基づいて、抽出された前記格補語候補ごとに前記各語義との組み合わせ点数を算出する算出部と、
    前記各格補語候補について前記組み合わせ点数に基づいて、前記語義を選別する選別部と、
    選別された前記語義を用いて前記述語と前記格補語候補との関係性を探索して前記述語の前記語義を選択する選択部と、
    を有することを特徴とする情報処理装置。
JP2015226077A 2015-11-18 2015-11-18 情報処理方法、情報処理プログラムおよび情報処理装置 Pending JP2017097451A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015226077A JP2017097451A (ja) 2015-11-18 2015-11-18 情報処理方法、情報処理プログラムおよび情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015226077A JP2017097451A (ja) 2015-11-18 2015-11-18 情報処理方法、情報処理プログラムおよび情報処理装置

Publications (1)

Publication Number Publication Date
JP2017097451A true JP2017097451A (ja) 2017-06-01

Family

ID=58816928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015226077A Pending JP2017097451A (ja) 2015-11-18 2015-11-18 情報処理方法、情報処理プログラムおよび情報処理装置

Country Status (1)

Country Link
JP (1) JP2017097451A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002310A (zh) * 2020-07-13 2020-11-27 苏宁云计算有限公司 领域语言模型构建方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002310A (zh) * 2020-07-13 2020-11-27 苏宁云计算有限公司 领域语言模型构建方法、装置、计算机设备及存储介质
CN112002310B (zh) * 2020-07-13 2024-03-26 苏宁云计算有限公司 领域语言模型构建方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
EP3549069B1 (en) Neural network data entry system
WO2016202101A1 (zh) 一种基于输入法的展示候选项的方法和装置
JP5703331B2 (ja) ユーザがユーザデバイスに異なる複数の言語でエンティティの名前をテキスト入力するのを支援するための技術
US20150186362A1 (en) Personal language model for input method editor
CN106774975B (zh) 输入方法和装置
US10325018B2 (en) Techniques for scheduling language models and character recognition models for handwriting inputs
WO2016095689A1 (zh) 基于终端界面多次触控操作进行识别搜索的方法及系统
CN108932320B (zh) 文章搜索方法、装置及电子设备
US10528649B2 (en) Recognizing unseen fonts based on visual similarity
JP2008198132A (ja) 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置
EP3367256A1 (en) Analysis method and analysis device
JP6275840B2 (ja) 手書き文字の識別方法
CN109241238B (zh) 文章搜索方法、装置及电子设备
CN106919593B (zh) 一种搜索的方法和装置
US11803796B2 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
JP2017097451A (ja) 情報処理方法、情報処理プログラムおよび情報処理装置
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
KR20220024251A (ko) 이벤트 라이브러리를 구축하는 방법 및 장치, 전자 기기, 및 컴퓨터 판독가능 매체
CN112817996A (zh) 一种违法关键词库的更新方法、装置、设备及存储介质
JP2018163586A (ja) 学習プログラム、学習方法および学習装置
KR20180015491A (ko) 키워드를 기초로 접속 기록을 저장하는 방법 및 장치
US10546061B2 (en) Predicting terms by using model chunks
US20210200796A1 (en) Search word suggestion device, method for generating unique expression informaton, and program for generating unique expression information
JP6496025B2 (ja) 文書処理システム及び文書処理方法
WO2018054127A1 (zh) 一种手写输入方法及装置